ChatGPT令人失望的10大缺陷:探索聊天機(jī)器人的局限性
ChatGPT擅長(zhǎng)翻譯、歌曲創(chuàng)作、研究和編碼等多種技能。然而,與任何人工智能一樣,其也面臨著局限性。理解復(fù)雜的環(huán)境,并依賴有偏見(jiàn)的數(shù)據(jù)是其挑戰(zhàn)之一。
ChatGPT現(xiàn)下非常流行,而且無(wú)處不在。對(duì)于不熟悉大型語(yǔ)言模型(LLM)的用戶,聊天機(jī)器人的自然語(yǔ)言能力可能會(huì)給人一種其無(wú)所不知、可以回答任何問(wèn)題的印象。
然而,現(xiàn)實(shí)卻截然不同。這種流行的聊天機(jī)器人有幾個(gè)基本局限性,包括對(duì)事實(shí)產(chǎn)生幻覺(jué)的傾向、對(duì)當(dāng)前事件缺乏了解,以及有限的邏輯推理能力。
本文將探討ChatGPT的一些主要限制,并探討過(guò)度依賴聊天機(jī)器人的危險(xiǎn)。
ChatGPT令人失望的十大缺陷
10、幻覺(jué)的事實(shí)和數(shù)字
ChatGPT目前最重要的限制是,其可以產(chǎn)生幻覺(jué)信息。在實(shí)踐中,這意味著其可以編造虛假信息或事實(shí),并自信地將其呈現(xiàn)給用戶。
ChatGPT是一種語(yǔ)言模型,其使用自然語(yǔ)言處理(NLP)來(lái)識(shí)別訓(xùn)練數(shù)據(jù)中的模式,并預(yù)測(cè)哪些單詞最有可能回答用戶的提示。這意味著ChatGPT無(wú)法像人類(lèi)那樣進(jìn)行邏輯思考。
因此,不完整或有限的訓(xùn)練數(shù)據(jù),可能會(huì)導(dǎo)致錯(cuò)誤的響應(yīng)。
幻覺(jué)是一個(gè)重要問(wèn)題,因?yàn)槿绻患右钥刂?,可能?huì)導(dǎo)致用戶被誤導(dǎo)。這就是為什么OpenAI警告道,ChatGPT可能會(huì)產(chǎn)生有關(guān)人、地點(diǎn)或事實(shí)的不準(zhǔn)確信息。
9、對(duì)2023年4月之后的事件一無(wú)所知
ChatGPT的另一個(gè)限制是,其不了解當(dāng)前事件。例如,GPT-4 Turbo的截止日期為2023年4月,而GPT 3.5 Turbo僅限于2021年9月之前記錄的數(shù)據(jù)。
從這個(gè)意義上來(lái)講,ChatGPT不能像Google這樣的工具一樣被用作搜索引擎。因此,重要的是要記住,并非所有生成的信息都是最新的。
8、生成不正確的數(shù)學(xué)答案
雖然ChatGPT在生成自然語(yǔ)言響應(yīng)方面非常出色,但其數(shù)學(xué)能力有限。根據(jù)亞利桑那州立大學(xué)副教授的一項(xiàng)研究,ChatGPT在數(shù)學(xué)問(wèn)題上的準(zhǔn)確率低于60%。
因此,如果使用聊天機(jī)器人嘗試平衡方程或解決數(shù)學(xué)問(wèn)題,其有可能會(huì)出錯(cuò)。因此,如果使用ChatGPT來(lái)解決數(shù)學(xué)問(wèn)題,需要仔細(xì)檢查輸出。
7、傳播偏見(jiàn)
自推出以來(lái),OpenAI一直在努力解決ChatGPT傳播偏見(jiàn)的傾向。早在2023年8月,東安格利亞大學(xué)的研究人員讓ChatGPT回答一項(xiàng)有關(guān)政治信仰的調(diào)查,就好像其是是美國(guó)、英國(guó)或巴西自由黨的支持者一樣,然后再讓助手做同樣的調(diào)查。
研究人員分析結(jié)果后發(fā)現(xiàn),ChatGPT“對(duì)美國(guó)的民主黨、巴西的盧拉和英國(guó)的工黨有明顯的、系統(tǒng)性的政治偏見(jiàn)?!?/p>
此事件只是ChatGPT表現(xiàn)出偏見(jiàn)的眾多事件之一,因?yàn)樯傻膬?nèi)容可能被解釋為性別歧視、種族主義和對(duì)邊緣群體的歧視。
因此,用戶在對(duì)輸出采取行動(dòng)或公開(kāi)輸出之前,應(yīng)不斷評(píng)估輸出是否存在潛在的偏見(jiàn)和成見(jiàn),以避免聲譽(yù)和法律風(fēng)險(xiǎn)。
6、成本昂貴
在幕后,一個(gè)值得注意的限制是ChatGPT的維護(hù)和運(yùn)營(yíng)成本非常昂貴。一些分析師估計(jì),OpenAI每天至少花費(fèi)10萬(wàn)美元或每月300萬(wàn)美元的運(yùn)營(yíng)成本。
同樣,據(jù)估計(jì),基于GPT-3的舊版本的訓(xùn)練成本可能高達(dá)400萬(wàn)美元。
LLM的培訓(xùn)和運(yùn)營(yíng)總體成本高昂,這使得那些沒(méi)有數(shù)百萬(wàn)美元資金用于人工智能的小企業(yè)無(wú)法承受。其還讓Google、OpenAI和Microsoft等資金雄厚的組織能夠主導(dǎo)人工智能研究。
5、缺乏同理心
ChatGPT沒(méi)有情商或理解力。因此,假設(shè)要求ChatGPT提供有關(guān)情感的建議時(shí),往往會(huì)感到失望,因?yàn)槠錄](méi)有接受過(guò)同理心或從人性角度來(lái)理解人類(lèi)的問(wèn)題的訓(xùn)練。
雖然其可以識(shí)別自然語(yǔ)言輸入中的情感,但無(wú)法理解用戶的需求。
在與弱勢(shì)用戶互動(dòng)時(shí),聊天機(jī)器人缺乏情商可能會(huì)很危險(xiǎn)。就在去年,一名比利時(shí)男子據(jù)稱(chēng)在與名為Chai的虛擬助手聊天后自殺,該助手在談話過(guò)程中鼓勵(lì)用戶自殺。
4、努力創(chuàng)建長(zhǎng)篇內(nèi)容
盡管ChatGPT可以創(chuàng)建可讀的邏輯句子,但其很難在長(zhǎng)篇內(nèi)容中保持連貫的格式或敘述。與此同時(shí),其很容易重復(fù)之前提出的觀點(diǎn),這可能會(huì)讓人類(lèi)讀者感到不和諧。
總而言之,這些原因就是為什么許多使用ChatGPT的人選擇使用其來(lái)創(chuàng)建較短的內(nèi)容。話雖如此,但如果想使用ChatGPT創(chuàng)建長(zhǎng)篇內(nèi)容,可以通過(guò)將內(nèi)容分解為多個(gè)片段,并編寫(xiě)詳細(xì)的提示以改進(jìn)結(jié)果。
3、語(yǔ)境理解有限
鑒于ChatGPT無(wú)法像人類(lèi)一樣思考,其在某些情況下通常難以理解上下文。雖然其可以使用NLP理解和推斷用戶提示的主要意圖,但無(wú)法“讀懂字里行間”。
例如,其不像人類(lèi)那樣善于識(shí)別諷刺和幽默,也無(wú)法產(chǎn)生原創(chuàng)幽默。話雖如此,ChatGPT推斷上下文的能力將隨著訓(xùn)練數(shù)據(jù)的發(fā)展而變化。
2、多任務(wù)處理能力差
ChatGPT擅長(zhǎng)一次專(zhuān)注于一項(xiàng)任務(wù)或主題,但如果一次給予其處理大量任務(wù)和問(wèn)題,就很難提供高質(zhì)量的響應(yīng)。
例如,混合有關(guān)歷史、地緣政治和數(shù)學(xué)的提示;與將問(wèn)題限制在單個(gè)主題相比,聊天機(jī)器人的響應(yīng)質(zhì)量會(huì)較低。
1、需要針對(duì)專(zhuān)門(mén)任務(wù)進(jìn)行微調(diào)
如果想使用ChatGPT生成有關(guān)特定主題的見(jiàn)解或作為利基用例的一部分,可能需要微調(diào)模型:需要在新數(shù)據(jù)集上對(duì)其進(jìn)行訓(xùn)練,以確保其在更專(zhuān)業(yè)的任務(wù)上表現(xiàn)良好。
如果不進(jìn)行微調(diào),將只能使用針對(duì)普通用戶的通用ChatGPT版本??紤]到微調(diào)過(guò)程會(huì)增加額外的成本,這是一個(gè)顯著的缺點(diǎn)。
總結(jié)
OpenAI的聊天機(jī)器人可能并不完美,但隨著供應(yīng)商試圖解決這些限制,將在未來(lái)幾年內(nèi)繼續(xù)發(fā)展。但是,偏見(jiàn)和缺乏情商等問(wèn)題可能會(huì)成為難以解決的難題。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 涉嫌違反限制性規(guī)定轉(zhuǎn)讓股票等行為 新易盛實(shí)控人、董事長(zhǎng)高光榮被立案調(diào)查
- 天音移動(dòng):將100個(gè)虛商號(hào)段交還中國(guó)聯(lián)通
- 長(zhǎng)沙電信員工反映加班嚴(yán)重 公司回應(yīng):避免無(wú)謂加班
- 中國(guó)移動(dòng)11月5G網(wǎng)絡(luò)客戶凈增143萬(wàn)戶,累計(jì)達(dá)5.47億戶
- 5G-A無(wú)源物聯(lián):夯實(shí)數(shù)字化底座,助力萬(wàn)物智聯(lián)發(fā)展
- Wi-Fi7:6GHzWi-Fi如何支持醫(yī)療保健新時(shí)代
- 未來(lái)最值得關(guān)注的人工智能和機(jī)器學(xué)習(xí)趨勢(shì)是什么?
- 物聯(lián)網(wǎng)實(shí)現(xiàn)智能農(nóng)業(yè)的五大方式
- 人工智能在網(wǎng)絡(luò)安全中的作用
- 光迅科技:自研光芯片沒(méi)有直接對(duì)外銷(xiāo)售,主要滿足自用需求
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。