張鈸：發(fā)展第三代人工智能，推動產(chǎn)業(yè)化創(chuàng)新應(yīng)用及產(chǎn)業(yè)發(fā)展

7月6日，昇騰人工智能產(chǎn)業(yè)高峰論壇在上海舉辦。會上，中國科學(xué)院院士、清華大學(xué)計算機(jī)系教授、清華大學(xué)人工智能研究院名譽(yù)院長張鈸發(fā)表演講。

以下是張鈸演講全文：

各位專家、各位嘉賓、大家好！非常高興被聘請為昇騰榮譽(yù)顧問，這可能是對人工智能工作者的一種鼓勵，我覺得人工智能工作者是需要鼓勵的，因為人工智能是在闖無人區(qū)，人工智能取得的每一個進(jìn)步都是非常艱難的。

首先，我想談一個問題，怎么樣估計ChatGPT的成就？目前有兩種說法，一種說法是ChatGPT是通用人工智能，還有一種說法它不是通用人工智能，哪個對呢？我的觀點是哪個都不對。怎么樣估計ChatGPT的成果呢？我認(rèn)為最恰當(dāng)?shù)墓烙嬍窍蛲ㄓ萌斯ぶ悄苓~出一步。按照微軟的說法是通用人工智能的火花，我贊成這種觀點。

為什么呢？首先ChatGPT具有通用人工智能的以下兩個特征，第一個特征是在對話和聊天這個領(lǐng)域，它達(dá)到了人工智能的目標(biāo)，或者說達(dá)到了行為主義主張的人工智能的目標(biāo)。行為主義人工智能是人工智能的主流，背后的哲學(xué)是唯物主義、實用主義。它追求的人工智能目標(biāo)是什么？使得機(jī)器的行為跟人類的行為相似，為什么說ChatGPT達(dá)到了這個目標(biāo)呢？因為我們跟ChatGPT對話的時候，和與人類的對話很相近，因此它滿足第一個通用人工智能的特征。

第二個特征，ChatGPT是開領(lǐng)域、多任務(wù)的，在對話這個問題里跟領(lǐng)域無關(guān)，這是一個重大的突破。大家知道人工智能經(jīng)歷過第一代知識驅(qū)動，第二代數(shù)據(jù)驅(qū)動，都只能在限定領(lǐng)域里面完成單個任務(wù)。ChatGPT變成開領(lǐng)域，走向通用。在通用人工智能最重要的兩個特征上達(dá)到要求，即一個接近人類水平，一個跟領(lǐng)域無關(guān)。所以，我們可以說它向通用人工智能邁出一步。因為它只是在對話，或者講得寬一點，是在語言處理這個領(lǐng)域里面達(dá)到這個目標(biāo)，所以我們還不能把它稱作通用人工智能。因為在別的人工智能領(lǐng)域里面，它是不是能通用呢？現(xiàn)在還說不清楚，所以我覺得這樣的估計是非常恰當(dāng)?shù)摹Ｎ覀冎挥性谶@樣的估計下，才能討論下面的問題。

首先一個問題，ChatGPT為什么能夠達(dá)到現(xiàn)在這樣的水平，甚至很多地方使大家感到非常驚奇？主要是由于人工智能經(jīng)過六七十年的努力，在三個問題上實現(xiàn)了突破，或者說是三個關(guān)鍵科技問題的突破。

第一個科技問題，基于詞嵌入的文本語意表示。

第二個科技問題，是大家非常熟悉的轉(zhuǎn)換器，就是基于注意機(jī)制的轉(zhuǎn)換器，也就是大模型，我們現(xiàn)在說的大模型就是大轉(zhuǎn)換器。

第三個科技問題，就是基于“預(yù)測下一個詞”的自監(jiān)督學(xué)習(xí)，我們應(yīng)該說ChatGPT是經(jīng)過人工智能領(lǐng)域里或者多個領(lǐng)域里大量的科學(xué)家和工程師，經(jīng)過六七十年共同努力的結(jié)果，因為經(jīng)過六七十年這三個問題才得到突破。這三個科技問題的突破，使得機(jī)器在處理文本上起到了本質(zhì)的變化，過去我們在處理文本的時候，我們往往把它稱作處理數(shù)據(jù)，到現(xiàn)在為止，大家還是用的這個詞，但是這個詞在ChatGPT里不成立。

因為ChatGPT是在我們找到了文本語意表示這個條件下再處理文本，所以它處理的不是文本的形式，不是把文本當(dāng)成數(shù)據(jù)來處理，而是把文本當(dāng)成知識來處理。

所以，ChatGPT成功并不是僅僅歸功于三個要素，也就是數(shù)據(jù)、算力和算法。我覺得應(yīng)該強(qiáng)調(diào)四個要素，分別是知識、數(shù)據(jù)、算法和算力。也就是說，我們有了三個關(guān)鍵問題的突破，就使得我們能夠從大量的文本，所謂“數(shù)據(jù)”，從大量的數(shù)據(jù)中獲取知識，只有出現(xiàn)這個轉(zhuǎn)變才有現(xiàn)在的ChatGPT，如果我們還是停留在那個認(rèn)識上肯定是錯的。

這個突破可能帶來三件事情的發(fā)生，且是不可阻擋的：

第一件事就是必然帶來科技的革命，首先會帶來人工智能本身的革命。大家知道人工智能發(fā)展到ChatGPT以前，我們不能說它是一門科學(xué)，為什么呢？它沒有理論，人工智能為什么理論建立不起來？非常重要的原因是，我們在第一代人工智能做的知識驅(qū)動也好，第二代人工智能做的數(shù)據(jù)驅(qū)動也好，我們都是在限定領(lǐng)域中完成單個任務(wù)。你在單領(lǐng)域單任務(wù)里面不可能建立一個通用的理論。ChatGPT掃除了這個障礙，至少在自然語言處理上掃除了這個障礙，因為它跟領(lǐng)域無關(guān)。一旦跟領(lǐng)域脫鉤了，你才有可能建立起來它的通用理論。

所以，現(xiàn)在去建立人工智能理論是有可能的，在ChatGPT沒出現(xiàn)以前，這種可能性不存在。因此，這個問題對我們來講是一個激勵。什么是突破口呢？突破口就是ChatGPT本身，如果我們沒有把ChatGPT內(nèi)部的工作原理搞清楚，我們就找不到進(jìn)入人工智能理論的鑰匙。

大家想一想ChatGPT里面很多現(xiàn)象，我們說不清楚，比如，一方面它能夠生成一些非常出人意料、非常好的結(jié)果。它同時又會出現(xiàn)幻覺，什么是幻覺呢？就是胡說八道。所以，為什么會出現(xiàn)這個現(xiàn)象呢？目前還不清楚，所以第一個必然會迎來的科技革命，就是AI本身的革命。

第二個事情，大家討論得非常多，就是產(chǎn)業(yè)的變革。首先是人工智能產(chǎn)業(yè)本身的變革，大家知道人工智能產(chǎn)業(yè)的發(fā)展跟信息技術(shù)與產(chǎn)業(yè)的發(fā)展是非常不一樣的，信息科技與產(chǎn)業(yè)的發(fā)展，我們可以用4個字來形容——“高速持續(xù)”，但是人工智能科技與產(chǎn)業(yè)的發(fā)展卻是“緩慢曲折”，什么原因呢？一個最重要的原因就是信息科技從一開始，理論就建立起來了，計算機(jī)的理論是1936年建立的，通訊理論是1948年建立的，在它的理論指導(dǎo)下，它的技術(shù)和產(chǎn)業(yè)發(fā)展都非常順利。

而人工智能至今只有算法和模型，且這些算法和模型都是領(lǐng)域限定和任務(wù)限定的，所以你開發(fā)出來的人工智能的硬件或軟件全是專用的，跟信息產(chǎn)業(yè)完全不同，信息產(chǎn)業(yè)的所有硬件和軟件通常是通用的，市場非常之大。而人工智能產(chǎn)業(yè)的硬件或軟件通常是專用的，都是跟領(lǐng)域緊密結(jié)合的，人工智能產(chǎn)業(yè)不跟領(lǐng)域結(jié)合根本不可能有這個產(chǎn)業(yè)。拿計算機(jī)來講，它的硬件和軟件不需要跟領(lǐng)域結(jié)合，生產(chǎn)出來的計算機(jī)什么地方都能用。

但是有了ChatGPT之后，人工智能有可能建立一個跟領(lǐng)域一定程度上無關(guān)的模型和算法，只有這個算法和模型擺脫了領(lǐng)域的限制，你將來生產(chǎn)出來的硬件和軟件才會是通用的，或者是一定范圍里通用的，你才有很大的市場。這就是今后人工智能產(chǎn)業(yè)變革的一個方向。

第三個事情，人工智能治理。ChatGPT大家看正面得比較多，其實反面的東西也很多，因為它使用的學(xué)習(xí)方法叫“預(yù)測下一個詞”，這種學(xué)習(xí)范式，必然帶來兩個大問題：

首先，它的結(jié)果不確定，其次，受提示詞的影響極大，這就造成Chat GPT輸出有三個不可避免的缺點：

第一個缺點，錯誤是必然的。所以我們說的那個胡說八道是必然的。

第二個缺點，它的輸出受輸入的影響很大，受提示詞的影響很大，所以它的輸出多樣化，問同樣的問題改變“提示詞”就會得到完全不同的結(jié)果。

第三個缺點，它不知道自己錯了，錯了也改不了，必須依靠AI對齊等等。我問ChatGPT清華大學(xué)校歌的歌詞是什么？它自己編了一套。我說不對，清華大學(xué)校歌不是你說那樣，應(yīng)該是“西山蒼蒼，東海茫茫，...”，我把校歌歌詞輸給它，它馬上回復(fù)說對不起我說錯了，清華大學(xué)歌詞應(yīng)該是這個。我退出來再進(jìn)去，問它清華大學(xué)的校歌是什么？它又自己編了一套，說明它不知道自己錯了，告訴了它的錯誤它也改不過來。

想一想，這些情況說明ChatGPT的輸出往往不一定符合我們的要求，符合我們的道德、倫理、政治的標(biāo)準(zhǔn)。所以ChatGPT出現(xiàn)以后，人工智能的治理是不可避免的，我認(rèn)為這三個趨勢一定是這樣的。

我們怎么辦呢？我們主張發(fā)展第三代人工智能，發(fā)展第三代人工智能包含三個內(nèi)容，一個內(nèi)容就是要建立可解釋魯棒的人工智能理論。ChatGPT出現(xiàn)以后建立這個理論才成為可能，過去實際上是很難建立這個理論。第二個內(nèi)容，發(fā)展安全、可信、可控、可靠、可拓展的人工智能技術(shù)，只有建立了這個理論之后，我們才有可能得到一個安全的人工智能技術(shù)。換句話說，現(xiàn)在的人工智能技術(shù)是不安全的，不可靠的，也是不可信的。特別是利用大數(shù)據(jù)的機(jī)器學(xué)習(xí)，結(jié)果一定是這樣的。最后才能推動創(chuàng)新應(yīng)用和產(chǎn)業(yè)發(fā)展。我相信通過全國的規(guī)劃與部署，通過產(chǎn)學(xué)研的結(jié)合，這個目標(biāo)一定會達(dá)到。

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請進(jìn)一步核實，并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）