7月6日,昇騰人工智能產(chǎn)業(yè)高峰論壇在上海舉辦。會上,中國科學(xué)院院士、清華大學(xué)計算機(jī)系教授、清華大學(xué)人工智能研究院名譽(yù)院長張鈸發(fā)表演講。
以下是張鈸演講全文:
各位專家、各位嘉賓、大家好!非常高興被聘請為昇騰榮譽(yù)顧問,這可能是對人工智能工作者的一種鼓勵,我覺得人工智能工作者是需要鼓勵的,因為人工智能是在闖無人區(qū),人工智能取得的每一個進(jìn)步都是非常艱難的。
首先,我想談一個問題,怎么樣估計ChatGPT的成就?目前有兩種說法,一種說法是ChatGPT是通用人工智能,還有一種說法它不是通用人工智能,哪個對呢?我的觀點是哪個都不對。怎么樣估計ChatGPT的成果呢?我認(rèn)為最恰當(dāng)?shù)墓烙嬍窍蛲ㄓ萌斯ぶ悄苓~出一步。按照微軟的說法是通用人工智能的火花,我贊成這種觀點。
為什么呢?首先ChatGPT具有通用人工智能的以下兩個特征,第一個特征是在對話和聊天這個領(lǐng)域,它達(dá)到了人工智能的目標(biāo),或者說達(dá)到了行為主義主張的人工智能的目標(biāo)。行為主義人工智能是人工智能的主流,背后的哲學(xué)是唯物主義、實用主義。它追求的人工智能目標(biāo)是什么?使得機(jī)器的行為跟人類的行為相似,為什么說ChatGPT達(dá)到了這個目標(biāo)呢?因為我們跟ChatGPT對話的時候,和與人類的對話很相近,因此它滿足第一個通用人工智能的特征。
第二個特征,ChatGPT是開領(lǐng)域、多任務(wù)的,在對話這個問題里跟領(lǐng)域無關(guān),這是一個重大的突破。大家知道人工智能經(jīng)歷過第一代知識驅(qū)動,第二代數(shù)據(jù)驅(qū)動,都只能在限定領(lǐng)域里面完成單個任務(wù)。ChatGPT變成開領(lǐng)域,走向通用。在通用人工智能最重要的兩個特征上達(dá)到要求,即一個接近人類水平,一個跟領(lǐng)域無關(guān)。所以,我們可以說它向通用人工智能邁出一步。因為它只是在對話,或者講得寬一點,是在語言處理這個領(lǐng)域里面達(dá)到這個目標(biāo),所以我們還不能把它稱作通用人工智能。因為在別的人工智能領(lǐng)域里面,它是不是能通用呢?現(xiàn)在還說不清楚,所以我覺得這樣的估計是非常恰當(dāng)?shù)摹N覀冎挥性谶@樣的估計下,才能討論下面的問題。
首先一個問題,ChatGPT為什么能夠達(dá)到現(xiàn)在這樣的水平,甚至很多地方使大家感到非常驚奇?主要是由于人工智能經(jīng)過六七十年的努力,在三個問題上實現(xiàn)了突破,或者說是三個關(guān)鍵科技問題的突破。
第一個科技問題,基于詞嵌入的文本語意表示。
第二個科技問題,是大家非常熟悉的轉(zhuǎn)換器,就是基于注意機(jī)制的轉(zhuǎn)換器,也就是大模型,我們現(xiàn)在說的大模型就是大轉(zhuǎn)換器。
第三個科技問題,就是基于“預(yù)測下一個詞”的自監(jiān)督學(xué)習(xí),我們應(yīng)該說ChatGPT是經(jīng)過人工智能領(lǐng)域里或者多個領(lǐng)域里大量的科學(xué)家和工程師,經(jīng)過六七十年共同努力的結(jié)果,因為經(jīng)過六七十年這三個問題才得到突破。這三個科技問題的突破,使得機(jī)器在處理文本上起到了本質(zhì)的變化,過去我們在處理文本的時候,我們往往把它稱作處理數(shù)據(jù),到現(xiàn)在為止,大家還是用的這個詞,但是這個詞在ChatGPT里不成立。
因為ChatGPT是在我們找到了文本語意表示這個條件下再處理文本,所以它處理的不是文本的形式,不是把文本當(dāng)成數(shù)據(jù)來處理,而是把文本當(dāng)成知識來處理。
所以,ChatGPT成功并不是僅僅歸功于三個要素,也就是數(shù)據(jù)、算力和算法。我覺得應(yīng)該強(qiáng)調(diào)四個要素,分別是知識、數(shù)據(jù)、算法和算力。也就是說,我們有了三個關(guān)鍵問題的突破,就使得我們能夠從大量的文本,所謂“數(shù)據(jù)”,從大量的數(shù)據(jù)中獲取知識,只有出現(xiàn)這個轉(zhuǎn)變才有現(xiàn)在的ChatGPT,如果我們還是停留在那個認(rèn)識上肯定是錯的。
這個突破可能帶來三件事情的發(fā)生,且是不可阻擋的:
第一件事就是必然帶來科技的革命,首先會帶來人工智能本身的革命。大家知道人工智能發(fā)展到ChatGPT以前,我們不能說它是一門科學(xué),為什么呢?它沒有理論,人工智能為什么理論建立不起來?非常重要的原因是,我們在第一代人工智能做的知識驅(qū)動也好,第二代人工智能做的數(shù)據(jù)驅(qū)動也好,我們都是在限定領(lǐng)域中完成單個任務(wù)。你在單領(lǐng)域單任務(wù)里面不可能建立一個通用的理論。ChatGPT掃除了這個障礙,至少在自然語言處理上掃除了這個障礙,因為它跟領(lǐng)域無關(guān)。一旦跟領(lǐng)域脫鉤了,你才有可能建立起來它的通用理論。
所以,現(xiàn)在去建立人工智能理論是有可能的,在ChatGPT沒出現(xiàn)以前,這種可能性不存在。因此,這個問題對我們來講是一個激勵。什么是突破口呢?突破口就是ChatGPT本身,如果我們沒有把ChatGPT內(nèi)部的工作原理搞清楚,我們就找不到進(jìn)入人工智能理論的鑰匙。
大家想一想ChatGPT里面很多現(xiàn)象,我們說不清楚,比如,一方面它能夠生成一些非常出人意料、非常好的結(jié)果。它同時又會出現(xiàn)幻覺,什么是幻覺呢?就是胡說八道。所以,為什么會出現(xiàn)這個現(xiàn)象呢?目前還不清楚,所以第一個必然會迎來的科技革命,就是AI本身的革命。
第二個事情,大家討論得非常多,就是產(chǎn)業(yè)的變革。首先是人工智能產(chǎn)業(yè)本身的變革,大家知道人工智能產(chǎn)業(yè)的發(fā)展跟信息技術(shù)與產(chǎn)業(yè)的發(fā)展是非常不一樣的,信息科技與產(chǎn)業(yè)的發(fā)展,我們可以用4個字來形容——“高速持續(xù)”,但是人工智能科技與產(chǎn)業(yè)的發(fā)展卻是“緩慢曲折”,什么原因呢?一個最重要的原因就是信息科技從一開始,理論就建立起來了,計算機(jī)的理論是1936年建立的,通訊理論是1948年建立的,在它的理論指導(dǎo)下,它的技術(shù)和產(chǎn)業(yè)發(fā)展都非常順利。
而人工智能至今只有算法和模型,且這些算法和模型都是領(lǐng)域限定和任務(wù)限定的,所以你開發(fā)出來的人工智能的硬件或軟件全是專用的,跟信息產(chǎn)業(yè)完全不同,信息產(chǎn)業(yè)的所有硬件和軟件通常是通用的,市場非常之大。而人工智能產(chǎn)業(yè)的硬件或軟件通常是專用的,都是跟領(lǐng)域緊密結(jié)合的,人工智能產(chǎn)業(yè)不跟領(lǐng)域結(jié)合根本不可能有這個產(chǎn)業(yè)。拿計算機(jī)來講,它的硬件和軟件不需要跟領(lǐng)域結(jié)合,生產(chǎn)出來的計算機(jī)什么地方都能用。
但是有了ChatGPT之后,人工智能有可能建立一個跟領(lǐng)域一定程度上無關(guān)的模型和算法,只有這個算法和模型擺脫了領(lǐng)域的限制,你將來生產(chǎn)出來的硬件和軟件才會是通用的,或者是一定范圍里通用的,你才有很大的市場。這就是今后人工智能產(chǎn)業(yè)變革的一個方向。
第三個事情,人工智能治理。ChatGPT大家看正面得比較多,其實反面的東西也很多,因為它使用的學(xué)習(xí)方法叫“預(yù)測下一個詞”,這種學(xué)習(xí)范式,必然帶來兩個大問題:
首先,它的結(jié)果不確定,其次,受提示詞的影響極大,這就造成Chat GPT輸出有三個不可避免的缺點:
第一個缺點,錯誤是必然的。所以我們說的那個胡說八道是必然的。
第二個缺點,它的輸出受輸入的影響很大,受提示詞的影響很大,所以它的輸出多樣化,問同樣的問題改變“提示詞”就會得到完全不同的結(jié)果。
第三個缺點,它不知道自己錯了,錯了也改不了,必須依靠AI對齊等等。我問ChatGPT清華大學(xué)校歌的歌詞是什么?它自己編了一套。我說不對,清華大學(xué)校歌不是你說那樣,應(yīng)該是“西山蒼蒼,東海茫茫,...”,我把校歌歌詞輸給它,它馬上回復(fù)說對不起我說錯了,清華大學(xué)歌詞應(yīng)該是這個。我退出來再進(jìn)去,問它清華大學(xué)的校歌是什么?它又自己編了一套,說明它不知道自己錯了,告訴了它的錯誤它也改不過來。
想一想,這些情況說明ChatGPT的輸出往往不一定符合我們的要求,符合我們的道德、倫理、政治的標(biāo)準(zhǔn)。所以ChatGPT出現(xiàn)以后,人工智能的治理是不可避免的,我認(rèn)為這三個趨勢一定是這樣的。
我們怎么辦呢?我們主張發(fā)展第三代人工智能,發(fā)展第三代人工智能包含三個內(nèi)容,一個內(nèi)容就是要建立可解釋魯棒的人工智能理論。ChatGPT出現(xiàn)以后建立這個理論才成為可能,過去實際上是很難建立這個理論。第二個內(nèi)容,發(fā)展安全、可信、可控、可靠、可拓展的人工智能技術(shù),只有建立了這個理論之后,我們才有可能得到一個安全的人工智能技術(shù)。換句話說,現(xiàn)在的人工智能技術(shù)是不安全的,不可靠的,也是不可信的。特別是利用大數(shù)據(jù)的機(jī)器學(xué)習(xí),結(jié)果一定是這樣的。最后才能推動創(chuàng)新應(yīng)用和產(chǎn)業(yè)發(fā)展。我相信通過全國的規(guī)劃與部署,通過產(chǎn)學(xué)研的結(jié)合,這個目標(biāo)一定會達(dá)到。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )