精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>

<abbr id="ixlwe"></abbr>

<td id="yeo88"><object id="yeo88"></object></td>

<sup id="yeo88"><tbody id="yeo88"></tbody></sup>

<td id="yeo88"></td>

<dl id="yeo88"></dl>

直播
榜單
7x24h快訊

極客網(wǎng) > 人工智能 >

語(yǔ)言模型的固有局限性：幻覺(jué)不可避免

人閱讀
2024-02-28 07:00:00
來(lái)源：煎蛋
作者：BALI
相關(guān)關(guān)鍵詞
- 人工智能
- AI

原論文地址：https://arxiv.org/abs/2401.11817

摘要

幻覺(jué)一直被認(rèn)為是大型語(yǔ)言模型 (LLM) 的一個(gè)重大缺陷。許多研究試圖減少幻覺(jué)的產(chǎn)生，但迄今為止這些努力大多是經(jīng)驗(yàn)性的，無(wú)法回答幻覺(jué)是否可以完全消除這一根本性問(wèn)題。該研究通過(guò)形式化方法證明 LLM 存在固有的幻覺(jué)問(wèn)題，即 LLM 不可能完全避免生成與真實(shí)世界不符的信息；并探討了現(xiàn)有緩解幻覺(jué)的方法及其有效性，并強(qiáng)調(diào)了對(duì) LLM 安全性進(jìn)行嚴(yán)格研究的重要性。

簡(jiǎn)介

大型語(yǔ)言模型 (LLM) 的出現(xiàn)標(biāo)志著人工智能領(lǐng)域，特別是自然語(yǔ)言處理領(lǐng)域的重要里程碑。這些模型擁有龐大的知識(shí)庫(kù)，能夠生成連貫且符合語(yǔ)境的相關(guān)文本，對(duì)研究、工業(yè)和社會(huì)產(chǎn)生了巨大影響。然而，LLM 面臨的一大挑戰(zhàn)是“幻覺(jué)”問(wèn)題，即模型生成看似合理但事實(shí)錯(cuò)誤或毫無(wú)意義的信息。隨著 LLM 應(yīng)用廣泛，這個(gè)問(wèn)題引起了人們?cè)絹?lái)越多的安全和倫理方面擔(dān)憂(yōu)，并催生了大量試圖對(duì)其進(jìn)行分類(lèi)、理解和緩解的研究。

先前研究從數(shù)據(jù)收集、訓(xùn)練到推理等方面發(fā)現(xiàn)了 LLM 產(chǎn)生幻覺(jué)的多種可能來(lái)源。例如，在綜述論文中，作者將自然語(yǔ)言生成中的幻覺(jué)歸因于啟發(fā)式數(shù)據(jù)收集、固有偏差、表示學(xué)習(xí)缺陷、錯(cuò)誤解碼、暴露偏差和參數(shù)知識(shí)偏差。

為緩解幻覺(jué)，人們提出了多種方法。例如，事實(shí)中心度量和基準(zhǔn)測(cè)試被用來(lái)衡量和減少特定數(shù)據(jù)集上的幻覺(jué)。檢索式方法通過(guò)知識(shí)圖或數(shù)據(jù)庫(kù)來(lái)增強(qiáng) LLM，幫助糾正模型輸出中的事實(shí)錯(cuò)誤。提示模型推理和驗(yàn)證其答案也被證明可以減少幻覺(jué)。

迄今為止，關(guān)于 LLM 幻覺(jué)的研究仍然主要是經(jīng)驗(yàn)性的。盡管經(jīng)驗(yàn)研究很有用，但它們無(wú)法回答一個(gè)根本性問(wèn)題：幻覺(jué)是否可以完全消除？這個(gè)問(wèn)題的答案至關(guān)重要，因?yàn)樗砻髁?LLM 能力的潛在上限。然而，由于不可能憑經(jīng)驗(yàn)枚舉和測(cè)試所有可能的輸入，因此如果不清晰地定義和形式化地分析幻覺(jué)，就無(wú)法正式討論這個(gè)問(wèn)題。

在現(xiàn)實(shí)世界中，形式化地定義 LLM 的事實(shí)或邏輯錯(cuò)誤(即幻覺(jué))極其困難。這是因?yàn)楝F(xiàn)實(shí)世界中語(yǔ)義的正式定義仍然是一個(gè)懸而未決的問(wèn)題。因此，在這項(xiàng)工作中，我們嚴(yán)格定義了一個(gè)由可計(jì)算函數(shù)組成的形式世界，可以在其中對(duì)幻覺(jué)進(jìn)行精確的討論。在這個(gè)世界里，每當(dāng) LLM 無(wú)法完全復(fù)制可計(jì)算函數(shù)的輸出時(shí)，就會(huì)發(fā)生幻覺(jué)。在此定義下，我們提出了一個(gè)基本結(jié)論：任何可計(jì)算的 LLM 都不可避免地會(huì)出現(xiàn)幻覺(jué)，這與模型架構(gòu)、學(xué)習(xí)算法、提示技術(shù)或訓(xùn)練數(shù)據(jù)無(wú)關(guān)。由于這個(gè)形式世界是現(xiàn)實(shí)世界的一部分，因此該結(jié)果也適用于現(xiàn)實(shí)世界中的 LLM。

基于理論結(jié)果，我們識(shí)別了一些現(xiàn)實(shí)世界中 LLM 可能出現(xiàn)幻覺(jué)的形式問(wèn)題，并通過(guò)實(shí)證驗(yàn)證了這一識(shí)別。理論和實(shí)證結(jié)果引導(dǎo)我們討論了它們對(duì)正確使用 LLM 的實(shí)際影響。

本文的貢獻(xiàn)總結(jié)如下：

* 我們形式化地定義和討論了 LLM 的幻覺(jué)，并利用學(xué)習(xí)理論的成果證明了幻覺(jué)對(duì)于 LLM 是不可避免的。
* 實(shí)證研究表明，最先進(jìn)的 LLM 在一些現(xiàn)實(shí)世界問(wèn)題中容易出現(xiàn)幻覺(jué)，這驗(yàn)證了理論結(jié)果。
* 我們討論了理論結(jié)果對(duì)設(shè)計(jì)緩解幻覺(jué)的方法和部署 LLM 在現(xiàn)實(shí)世界中的實(shí)際影響。

結(jié)論

本文研究了消除 LLM 幻覺(jué)的根本性問(wèn)題。為此，我們定義了一個(gè)形式世界，可以在其中清晰地定義和討論 LLM 的幻覺(jué)。具體而言，幻覺(jué)被定義為可計(jì)算 LLM 和可計(jì)算的真實(shí)函數(shù)之間的不一致。利用學(xué)習(xí)理論的結(jié)果，我們證明了如果真實(shí)函數(shù)是任何可計(jì)算函數(shù)，那么對(duì)于可計(jì)算的 LLM 來(lái)說(shuō)，幻覺(jué)是不可避免的。既然形式世界是現(xiàn)實(shí)世界的一部分，我們進(jìn)一步得出結(jié)論，在現(xiàn)實(shí)世界的 LLM 中消除幻覺(jué)也是不可能的。利用形式世界框架，我們討論了現(xiàn)有緩解幻覺(jué)方法的可能機(jī)制和有效性，并討論了理論結(jié)果對(duì) LLM 在現(xiàn)實(shí)世界中部署的實(shí)際影響。我們強(qiáng)調(diào)，由于幻覺(jué)不可避免，因此對(duì) LLM 安全性進(jìn)行嚴(yán)格研究至關(guān)重要。

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。）

為您推薦

極客觀察

欄目相關(guān)

贊助商

極客網(wǎng)熱搜關(guān)鍵詞

人工智能 AI OpenAI 機(jī)器學(xué)習(xí) ChatGPT 生成式AI AI芯片 AIGC U-Mail 世界人工智能大會(huì) AI大模型 AIoT AirPods Airbnb Rushmail 人工智能AI AI人工智能 Akamai 昇騰AI 生成式人工智能 AIPC Air AI技術(shù) 蘋(píng)果AI 谷歌AI GenAI 科大訊飛AI學(xué)習(xí)機(jī) 百度AI CAICT 阿爾法蛋AI詞典筆T10 AI手機(jī) 華為AI 松鼠AI 微軟AI AI+ AIS Airdoc WAIC 昇騰AI創(chuàng)新大賽 AITO 阿爾法蛋AI詞典筆京東AI 智譜AI AI模型 SoleusAir aigo SoleusAir舒樂(lè)氏 2019世界人工智能大會(huì) LIFAair AI機(jī)器人 AI創(chuàng)企移動(dòng)AI時(shí)代人工智能大會(huì) 浙大AIF Zain 人工智能技術(shù) AI應(yīng)用 AI醫(yī)療 AI算力人工智能芯片 AI人才 xAI Airtag AI時(shí)代騰訊AI AI服務(wù)器 AI算法 AI框架 BrainCo AI投資 Gmail 人工智能計(jì)算中心聯(lián)想AI VAIO 人工智能大賽 AI教育 Chain Coremail OPENAIGC開(kāi)發(fā)者大賽 AI賦能谷歌人工智能 Airwheel AI搜索人工智能名片昇騰AI開(kāi)發(fā)者創(chuàng)享日 Mirai AI聊天機(jī)器人 AI音樂(lè) Airwallex空中云匯 BrainCo強(qiáng)腦科技 AI原生應(yīng)用百度人工智能 AI計(jì)算阿爾法蛋AI詞典筆T20 AIOps 阿里AI 英偉達(dá)AI芯片 AI基礎(chǔ)設(shè)施蘋(píng)果人工智能人工智能+

上一篇

加拿大律師因引用ChatGPT編造的虛假案例受罰

下一篇

微軟向法國(guó)AI創(chuàng)企投資1500萬(wàn)歐元，將受歐盟審查，有可能落空

簡(jiǎn)版
原版
投稿
回頂部

2024-02-28

語(yǔ)言模型的固有局限性：幻覺(jué)不可避免

摘要幻覺(jué)一直被認(rèn)為是大型語(yǔ)言模型 (LLM) 的一個(gè)重大缺陷。許多研究試圖減少幻覺(jué)的產(chǎn)生，但迄今為止這些努力大多是經(jīng)驗(yàn)性的，無(wú)法回答幻覺(jué)是否可以完全消除這一根本性問(wèn)題。

長(zhǎng)按掃碼閱讀全文