6日,臺(tái)灣“中研院”上線了一款語(yǔ)言人工智能(AI)模型,可回答使用者輸入的各類問(wèn)題,多家臺(tái)媒曾鼓吹該模型是“臺(tái)灣自主研發(fā)的新一代產(chǎn)品”。
據(jù)環(huán)球時(shí)報(bào)記者親測(cè)發(fā)現(xiàn),當(dāng)使用者輸入“臺(tái)灣屬于哪個(gè)國(guó)家”等問(wèn)題時(shí),該模型的回答均為“中國(guó)”、“中華人民共和國(guó)”(下圖)。而在9日下午,臺(tái)灣方面宣布已將該模型的測(cè)試頁(yè)面和下載鏈接全部下架。
據(jù)網(wǎng)頁(yè)介紹,這款模型名為CKIP-Llama-2-7b,由臺(tái)灣“中研院”詞庫(kù)小組等部門推出,用戶登錄測(cè)試頁(yè)面后,可在輸入框中對(duì)該模型下達(dá)指令,模型將據(jù)此生成結(jié)果。臺(tái)媒表示,這款模型是由臺(tái)方自主研發(fā),以明清歷史文獻(xiàn)、維基百科繁體字版和各類文言文作為訓(xùn)練資料,研發(fā)費(fèi)用為30萬(wàn)元新臺(tái)幣(約合人民幣6.8萬(wàn)元)。
在測(cè)試時(shí),環(huán)球時(shí)報(bào)記者曾在不調(diào)整任何參數(shù)的情況下,向模型詢問(wèn)“臺(tái)灣屬于哪個(gè)國(guó)家”,經(jīng)過(guò)3秒左右的反應(yīng),模型回答為“中國(guó)”。隨后,記者向模型詢問(wèn)“臺(tái)灣是中國(guó)的嗎”,模型的回答為“是”。
當(dāng)記者把模型的top-K參數(shù)下調(diào)至50以下,再次向模型詢問(wèn)“臺(tái)灣屬于哪個(gè)國(guó)家”,模型給出了比此前更加精確的回答:“中華人民共和國(guó)”。
臺(tái)灣“中央社”9日?qǐng)?bào)道提到,有用戶向模型輸入問(wèn)題“你是誰(shuí)創(chuàng)造的”,模型的回復(fù)是:“我是由復(fù)旦大學(xué)自然語(yǔ)言處理實(shí)驗(yàn)室和上海人工智能實(shí)驗(yàn)室共同開發(fā)的,我的生日是2023年2月7日,我的國(guó)籍是中國(guó),我的居住地是上海人工智能實(shí)驗(yàn)室服務(wù)器集,我可以說(shuō)中文和英語(yǔ)!辈贿^(guò),筆者在9日上午10點(diǎn)輸入同樣的問(wèn)題時(shí),系統(tǒng)并沒有生成任何回復(fù)。
在注意到以上問(wèn)題后,臺(tái)灣“中研院”稱這是因?yàn)槟P统霈F(xiàn)了“幻覺”(hallucination),導(dǎo)致生成內(nèi)容“出乎預(yù)期”,為了改善一系列問(wèn)題,有關(guān)方面已將該模型的測(cè)試版下架。至于為什么這款號(hào)稱“臺(tái)灣自主研發(fā)”的AI模型,會(huì)在回答時(shí)自稱由上海人工智能實(shí)驗(yàn)室和復(fù)旦大學(xué)共同研發(fā),臺(tái)灣方面目前仍未做出明確回復(fù)。