本文作者系Rethink Robotics的聯(lián)合創(chuàng)始人、主席兼首席技術(shù)官Rodney Brooks。Brooks擁有斯坦福大學(xué)計(jì)算機(jī)博士學(xué)位,并在麻省理工學(xué)院任教多年,是著名的機(jī)器人教授。在創(chuàng)立Rethink Robotics之前,他創(chuàng)立了麻省理工學(xué)院電腦科學(xué)和人工智能實(shí)驗(yàn)室,并聯(lián)合創(chuàng)辦了iRobot公司。Rethink Robotics 于 2008 年創(chuàng)立于波士頓,致力于為制造生產(chǎn)和分揀流程開發(fā)智能協(xié)作型的機(jī)器人。
上帝按照自己的模樣創(chuàng)造了人類。
人類按照自己的模樣創(chuàng)造了人工智能(AI)。
至少最開始的時(shí)候是這樣的。
人類和海豚、黑猩猩、倭黑猩猩一樣,可能是低于某個(gè)智能門檻的。一些聲稱擁有基于人工智能系統(tǒng)的公司經(jīng)常使用人力來處理其在線系統(tǒng)的棘手任務(wù),而用戶對此并不知情。這可能會嚴(yán)重混淆公眾對現(xiàn)今的人工智能發(fā)展程度的認(rèn)知。
我一直在思考我們需要進(jìn)行哪些研究,要解決哪些問題,以及為了達(dá)到超級人工智能或人類智能水平,我們已經(jīng)解決了哪些難題。我們已經(jīng)孜孜不倦地嘗試了62年,但顯然直到現(xiàn)在我們才接近實(shí)現(xiàn)所有必要的突破。
愛因斯坦在1916年預(yù)言了引力波的存在,但是在99年之后,也就是2015年,我們?nèi)祟惒攀状翁綔y到引力波。
有一些事情的成功就是一個(gè)漫長的過程,需要大量的新技術(shù),需要很長的時(shí)間將想法變得更成熟,也需要眾多出色的人才投身其中。我覺得人類智能水平的人工智能或許就是這樣的,而且更為復(fù)雜,可能要花上數(shù)百年時(shí)間才能得以實(shí)現(xiàn)。
過去62年里至少有四種人工智能的主要方法。當(dāng)然,其他人可能還總結(jié)了不同的方法。
在我看來,這四種主要方法以及大致的開始日期分別是:
1. 符號(1956年)
2. 神經(jīng)網(wǎng)絡(luò)(1954年,1960年,1969年,1986年,2006年….)
3. 傳統(tǒng)機(jī)器人(1968年)
4. 基于行為的機(jī)器人(1985年)
符號
符號通常由字符串表示,這些字符對應(yīng)一個(gè)詞。然后人們設(shè)定了相互間的聯(lián)系,對其進(jìn)行編碼,比如instanceof運(yùn)算符和is字符串。
當(dāng)我們向搜索引擎輸入查詢時(shí),我們選擇了用符號進(jìn)入人工智能系統(tǒng)對世界的了解。系統(tǒng)做了一些推理和推論,然后生成一個(gè)網(wǎng)頁列表,它推斷出與我們正在尋找的內(nèi)容相匹配的信息(它實(shí)際上并不知道我們是與其數(shù)據(jù)庫中的“人”符號相對應(yīng)的) 。然后我們會瀏覽這些精選出來的信息,點(diǎn)擊最匹配的一兩個(gè)網(wǎng)頁,如果不是我們想要的資料,我們就會輸入一個(gè)新的符號或者修改原來的符號進(jìn)行新的搜索。
神經(jīng)網(wǎng)絡(luò)
2014年11月17日,《紐約時(shí)報(bào)》報(bào)道了一則消息,向全世界展示了一個(gè)新功能。谷歌程序自動為以下圖片生成的標(biāo)題:“一群年輕人在玩飛盤游戲”(A group of young people playing a game of Frisbee)。
我認(rèn)為從那個(gè)時(shí)候起人們才真正開始注重深度學(xué)習(xí)。即使對于人工智能研究人員,尤其是基于符號的人工智能的研究人員來說,一個(gè)程序能做得這么好是一個(gè)奇跡。但是,我也覺得人們將表現(xiàn)和能力混淆了。如果一個(gè)人有同等水平的表現(xiàn),能夠準(zhǔn)確描述這個(gè)畫面,那么人們就很自然會期望這個(gè)人有足夠的能力去理解這個(gè)世界,他/她可能會回答以下每個(gè)問題:
飛盤是什么形狀?
大致上,一個(gè)人可以扔多遠(yuǎn)?
人可以吃飛盤嗎?
一次大約有多少人可以一起玩飛盤?
一個(gè)三個(gè)月大的嬰兒可以玩飛盤嗎?
今天的天氣適合玩飛盤嗎?
但是生成上述標(biāo)題的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)無法回答這些問題。
傳統(tǒng)機(jī)器人
在人工智能最初的幾十年,就是基于符號的人工智能那個(gè)階段,研究人員試圖通過制造機(jī)器人來實(shí)現(xiàn)人工智能。其中有些機(jī)器人可以四周移動,并能用來推東西。還有固定在指定位置的機(jī)器臂。但是同時(shí)具備上述兩種功能的帶鉸接臂的移動機(jī)器人在當(dāng)時(shí)是很難制造出來的。
基于行為的機(jī)器人
在1985年以前,我花了10年研究計(jì)算機(jī)視覺,嘗試從圖像中提取世界的符號描述,并在傳統(tǒng)機(jī)器人技術(shù)中建立機(jī)器人的計(jì)劃系統(tǒng),以便讓機(jī)器人在模擬或現(xiàn)實(shí)世界中運(yùn)作。
但是我備受打擊。
我開始思考昆蟲在現(xiàn)實(shí)世界中的導(dǎo)航能力,以及它們是如何用非常少的神經(jīng)元做到的(當(dāng)然少于現(xiàn)代深度學(xué)習(xí)網(wǎng)絡(luò)中人工神經(jīng)元的數(shù)量)。在思考它們是如何做到這一點(diǎn)時(shí),我意識到簡單生物的進(jìn)化路徑可能并非由為世界構(gòu)建的符號或三維建模系統(tǒng)開始的。相反,這種進(jìn)化是通過感知和行動之間非常簡單的聯(lián)系開始的。
在這種思維導(dǎo)致的基于行為的方法中,有許多并行的行為同時(shí)運(yùn)行,試圖理解一小部分感知,并憑借它們來驅(qū)動世界上的簡單行為。通常,行為會為機(jī)器人的執(zhí)行器提出相互矛盾的命令,并且必須采取措施解決這個(gè)沖突。但是,這不需要回到完整的世界模型中,而是解決沖突的機(jī)制在本質(zhì)上必然是啟發(fā)式的。正如人們猜想的那樣,進(jìn)化會產(chǎn)生的這種啟發(fā)式的機(jī)制。
下面是這四種人工智能方法和人類小孩的得分對比:
從上表可以看到,如果人類小孩在這6項(xiàng)能力中每項(xiàng)得分為100分的情況下,四種人工智能方法各自的總得分才8到9分。我一如既往地認(rèn)為我們可能嚴(yán)重高估了現(xiàn)階段人工智能系統(tǒng)的能力。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )