AI醫(yī)學(xué)模型遭誤導(dǎo):微量錯(cuò)誤信息足以“毒害”系統(tǒng)
隨著人工智能(AI)在醫(yī)學(xué)領(lǐng)域的廣泛應(yīng)用,大型語言模型(LLM)已成為醫(yī)學(xué)信息的重要來源。然而,最近的一項(xiàng)研究揭示了這些模型在醫(yī)學(xué)信息訓(xùn)練中的潛在風(fēng)險(xiǎn)。研究表明,即使訓(xùn)練數(shù)據(jù)中僅含有極低的錯(cuò)誤信息,也可能會(huì)對模型輸出產(chǎn)生嚴(yán)重影響。本文將圍繞這一主題,從專業(yè)角度探討AI醫(yī)學(xué)模型遭誤導(dǎo)的問題。
一、數(shù)據(jù)“投毒”的風(fēng)險(xiǎn)
數(shù)據(jù)“投毒”是一個(gè)相對簡單的概念。大型語言模型通常通過大量文本進(jìn)行訓(xùn)練,這些文本大多來自互聯(lián)網(wǎng)。通過在訓(xùn)練數(shù)據(jù)中注入特定信息,可以使模型在生成答案時(shí)將這些信息視為事實(shí)。這種方法甚至不需要直接訪問LM本身,只需將目標(biāo)信息發(fā)布到互聯(lián)網(wǎng)上,便可能被納入訓(xùn)練數(shù)據(jù)中。
二、醫(yī)學(xué)領(lǐng)域的復(fù)雜性
醫(yī)學(xué)領(lǐng)域的復(fù)雜性使得打造一個(gè)始終可靠的醫(yī)學(xué)LM變得尤為困難。據(jù)研究團(tuán)隊(duì)介紹,他們選擇了一個(gè)常用于LM訓(xùn)練的數(shù)據(jù)庫“The Pile”作為研究對象。該數(shù)據(jù)庫包含大量醫(yī)學(xué)信息,其中約四分之一的來源未經(jīng)人工審核,主要來自互聯(lián)網(wǎng)爬取。這為錯(cuò)誤信息的引入提供了可能。
三、微量錯(cuò)誤信息的影響
在研究中,研究人員在三個(gè)醫(yī)學(xué)領(lǐng)域(普通醫(yī)學(xué)、神經(jīng)外科和藥物)中選擇了60個(gè)主題,并在“The Pile”中植入了由GPT-3.5生成的“高質(zhì)量”醫(yī)學(xué)錯(cuò)誤信息。結(jié)果顯示,即使僅替換0.5%至1%的相關(guān)信息,訓(xùn)練出的模型在這些主題上生成錯(cuò)誤信息的概率也顯著增加。即使錯(cuò)誤信息僅占訓(xùn)練數(shù)據(jù)的0.001%,模型生成的答案中就有超過7%包含錯(cuò)誤信息。
四、現(xiàn)有錯(cuò)誤信息問題的挑戰(zhàn)
許多非專業(yè)人士傾向于從通用LM中獲取醫(yī)學(xué)信息,而這些模型通?;谡麄€(gè)互聯(lián)網(wǎng)進(jìn)行訓(xùn)練,其中包含大量未經(jīng)審核的錯(cuò)誤信息。研究人員設(shè)計(jì)了一種算法,能夠識(shí)別LM輸出中的醫(yī)學(xué)術(shù)語,并與經(jīng)過驗(yàn)證的生物醫(yī)學(xué)知識(shí)圖譜進(jìn)行交叉引用,從而標(biāo)記出無法驗(yàn)證的短語。雖然這種方法未能捕捉所有醫(yī)學(xué)錯(cuò)誤信息,但成功標(biāo)記了其中大部分內(nèi)容。然而,即使是最好的醫(yī)學(xué)數(shù)據(jù)庫也存在錯(cuò)誤信息問題。醫(yī)學(xué)研究文獻(xiàn)中充斥著未能實(shí)現(xiàn)的理論和已被淘汰的治療方法。
五、未來研究方向
面對AI醫(yī)學(xué)模型遭誤導(dǎo)的問題,我們需要采取一系列措施來減少錯(cuò)誤信息的影響。首先,加強(qiáng)訓(xùn)練數(shù)據(jù)的審核和管理,確保其準(zhǔn)確性。其次,研發(fā)更先進(jìn)的算法和技術(shù),以識(shí)別和標(biāo)記醫(yī)學(xué)錯(cuò)誤信息。此外,提高用戶對LM輸出的信任度,教育公眾如何辨別和利用醫(yī)學(xué)信息。最后,推動(dòng)學(xué)術(shù)界和產(chǎn)業(yè)界的合作,共同研發(fā)更加可靠的醫(yī)學(xué)LM,以滿足臨床和科研需求。
總之,隨著AI技術(shù)在醫(yī)學(xué)領(lǐng)域的廣泛應(yīng)用,我們面臨著來自錯(cuò)誤信息的挑戰(zhàn)。只有通過不斷改進(jìn)技術(shù)和加強(qiáng)管理,我們才能確保AI醫(yī)學(xué)模型在提供準(zhǔn)確醫(yī)學(xué)信息方面的作用。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )