前期回顧
作為人工智能的一個(gè)重要分支,認(rèn)知體系的研究和應(yīng)用經(jīng)過(guò)了近40年的發(fā)展,已取得了可見(jiàn)的成果。上期內(nèi)容對(duì)認(rèn)知體系的概念進(jìn)行了闡述,本期將繼續(xù)就認(rèn)知體系的分類(lèi)和感知部分進(jìn)一步展開(kāi)。譯者希望通過(guò)摘譯的內(nèi)容,引起大家對(duì)“認(rèn)知體系”研究的更多關(guān)注。摘譯:認(rèn)知體系研究綜述(一)
1 引言
2 什么是認(rèn)知體系
3 認(rèn)知體系的分類(lèi) (Taxonomies of Cognitive Architectures)
關(guān)于認(rèn)知體系的分類(lèi),目前相對(duì)主流的三大范式是:符號(hào)(也稱(chēng)為認(rèn)知)、涌現(xiàn)(也稱(chēng)為聯(lián)結(jié))和混合。到底哪一個(gè)正確地反映了人類(lèi)的認(rèn)知過(guò)程,仍然是一個(gè)懸而未決的問(wèn)題,在過(guò)去的30年里一直在爭(zhēng)論[12,13]。
符號(hào)范式通常使用預(yù)定義指令集等符號(hào)來(lái)表示概念。指令通常以if-then的規(guī)則形式執(zhí)行,例如ACT-R, Soar等產(chǎn)生式體系。這是一種自然而直觀的表示方式,因此符號(hào)操作仍然是一種公認(rèn)的表示方式之一。雖然符號(hào)范式擅長(zhǎng)計(jì)劃(規(guī)劃)和推理,但不具有處理環(huán)境變化和感知所需要的靈活性和魯棒性。
涌現(xiàn)范式通常建立大規(guī)模并行模型來(lái)解決適應(yīng)性和學(xué)習(xí)問(wèn)題,例如神經(jīng)網(wǎng)絡(luò)模型,其數(shù)據(jù)來(lái)自輸入節(jié)點(diǎn)。然而,由于信息或知識(shí)不再是一組可解釋的符號(hào)實(shí)體,而往往分布在整個(gè)網(wǎng)絡(luò)中,這導(dǎo)致模型不再透明。在涌現(xiàn)模式中,傳統(tǒng)意義上的邏輯推理似乎成為不可能。
自然地,每種范式都有優(yōu)缺點(diǎn)。一方面,任何符號(hào)體系結(jié)構(gòu)創(chuàng)建初始知識(shí)庫(kù)需要大量工作,可一旦完成,體系結(jié)構(gòu)就完全功能性。另一方面,涌現(xiàn)體系結(jié)構(gòu)更易于設(shè)計(jì),但它們必須經(jīng)過(guò)大量訓(xùn)練才能產(chǎn)生有用的行為;此外,他們的現(xiàn)有知識(shí)可能隨著新行為的學(xué)習(xí)而惡化。
由于符號(hào)和涌現(xiàn)范式都不能解決認(rèn)知的所有問(wèn)題,混合范式試圖結(jié)合符號(hào)和涌現(xiàn)的元素,這樣的混合體系在我們選擇的架構(gòu)中是最常見(jiàn)的。一般來(lái)說(shuō),混合方式?jīng)]有限制,而且已經(jīng)探索了許多可能性。除了考慮表示,還考慮系統(tǒng)是單模塊還是多模塊、異構(gòu)還是同質(zhì),或考慮混合的粒度(粗粒度還是細(xì)粒度)、符號(hào)和子符號(hào)組件之間的耦合性。此外,并不是所有的混合架構(gòu)都明確地解決了所謂的符號(hào)和次符號(hào)元素以及將它們組合起來(lái)的問(wèn)題。只有少數(shù)幾個(gè)體系結(jié)構(gòu),例如ACTR、CLARION、DUAL、CogPrime、CAPS、SiMA、GMU-BICA和Sigma,認(rèn)為這種集成是必要的。我們將重點(diǎn)放在表示和處理上。
圖1顯示了分類(lèi)分組的組織結(jié)構(gòu)。在頂層分成了:符號(hào)的、涌現(xiàn)的和混合的。關(guān)于這些術(shù)語(yǔ)的界定也是模糊的,即使對(duì)于最著名的架構(gòu)(例如Soar和ACT-R)也不能達(dá)成一致。盡管兩者都將符號(hào)和次符號(hào)元素結(jié)合起來(lái),ACT-R的作者明確地表達(dá)為混合模式,而Soar沒(méi)有。各位學(xué)者的觀點(diǎn)也不一致,Soar和ACT-R在[14,15]中都被稱(chēng)為符號(hào)主義者,而[16]將它們列為混合體。
圖1
為了避免分組的不一致性,我們假設(shè)顯式符號(hào)是符號(hào)表示的原子,可以組合成有意義的表達(dá)式。這些符號(hào)用于推理或句法分析。子符號(hào)表示通常與神經(jīng)元的隱喻聯(lián)系在一起,這種表示的一個(gè)典型是神經(jīng)網(wǎng)絡(luò)。在神經(jīng)網(wǎng)絡(luò)中,知識(shí)被編碼為分布在神經(jīng)元之間的數(shù)值模式,與單元相關(guān)聯(lián)的權(quán)重影響處理,并通過(guò)學(xué)習(xí)獲得。
對(duì)于我們的分類(lèi),我們假設(shè)任何非顯式符號(hào)和處理(句法操作除外)都是子符號(hào)(例如數(shù)值數(shù)據(jù)、像素、概率,傳播激活、強(qiáng)化學(xué)習(xí)等)。結(jié)合了兩種表示中的任意組合都被當(dāng)作混合模式。給定這些定義,將標(biāo)簽分配給所有架構(gòu)并將它們可視化為圖1。
我們區(qū)分了兩類(lèi)涌現(xiàn)類(lèi)別:實(shí)現(xiàn)類(lèi)生物神經(jīng)元的神經(jīng)元模型和更接近人工神經(jīng)網(wǎng)絡(luò)的連接(邏輯)模式。在混合模式中,我們將符號(hào)子處理(其中符號(hào)模式與執(zhí)行子符號(hào)計(jì)算模塊相結(jié)合)作為混合模式的一個(gè)子類(lèi),符號(hào)子處理組中的架構(gòu)至少包括一個(gè)用于感知處理的子符號(hào)模塊,而其余的知識(shí)和處理是符號(hào)的,例如3T, ATLANTIS, RCS, DIARC, CARACaS and CoSy。雖然存在其他類(lèi)型的功能組合(例如協(xié)同處理、元處理和鏈處理),但是難以歸類(lèi)。因此,其他的都?xì)w類(lèi)為完全集成的混合模式。完全集成的體系結(jié)構(gòu)使用多種方法來(lái)組合不同的表示。ACT-R、Soar、CAPS、Copycat/Metacat、CHREST、CHARISMA、CELTS、CoJACK、CLARION、REM、NARS和Xapagy將符號(hào)概念和具有次符號(hào)元素(如激活值、擴(kuò)散激活、隨機(jī)選擇過(guò)程、強(qiáng)化學(xué)習(xí)等)的規(guī)則結(jié)合起來(lái)。
綜上所述,混合架構(gòu)是數(shù)量最多的一組,并顯示出增長(zhǎng)趨勢(shì)?;旌霞軜?gòu)根據(jù)符號(hào)和次符號(hào)組件的比例和扮演的角色,在涌現(xiàn)范式和符號(hào)范式之間形成一個(gè)連續(xù)統(tǒng)。例如,CogPrime和Sigma在概念上更接近于涌現(xiàn)系統(tǒng),因?yàn)樗鼈兣c神經(jīng)網(wǎng)絡(luò)有許多共同的屬性。而REM、CHREST和RALPH以及3T和ATLANTIS,在很大程度上屬于符號(hào)范式;因?yàn)檫@些架構(gòu)主要是符號(hào)化的,雖然可以利用概率推理和學(xué)習(xí)機(jī)制。
4 感知(perception)
雖然早期的認(rèn)知結(jié)構(gòu)主要側(cè)重于高層次的推理,但同樣重要的是感知和行為。
感知可以定義為將原始輸入數(shù)據(jù)轉(zhuǎn)換為系統(tǒng)內(nèi)部表示以執(zhí)行認(rèn)知任務(wù)的過(guò)程。根據(jù)輸入數(shù)據(jù)的來(lái)源和性質(zhì)可以區(qū)分多種感知模式。例如,最常見(jiàn)的五種是視覺(jué)、聽(tīng)覺(jué)、嗅覺(jué)、觸覺(jué)和味覺(jué);其他的感覺(jué)包括本體感覺(jué)、熱感、痛覺(jué)、時(shí)間感等。
當(dāng)然,認(rèn)知結(jié)構(gòu)也實(shí)現(xiàn)了其中的一些與人類(lèi)感官無(wú)關(guān)的符號(hào)輸入(使用鍵盤(pán)或圖形用戶(hù)界面(GUI))和各種傳感器(激光雷達(dá)、激光、紅外等)。根據(jù)其認(rèn)知功能,智能系統(tǒng)可以將各種數(shù)量和類(lèi)型的數(shù)據(jù)作為感知輸入。
因此,本節(jié)將研究使用各種數(shù)據(jù)輸入,從這些數(shù)據(jù)源中提取信息以及如何應(yīng)用這些信息的認(rèn)知體系。圖4中的將調(diào)研結(jié)果進(jìn)行了可視化。
圖2:視覺(jué)(V)、聽(tīng)覺(jué)(A)、觸覺(jué)(T)、嗅覺(jué)(S)、本體感覺(jué)(P)、數(shù)據(jù)輸入(D)、其他傳感器(O)和多模態(tài)(M)
從圖2的可視化中可以觀察到如下情況。例如,視覺(jué)是最常用的實(shí)現(xiàn)方式,然而,超過(guò)一半的體系使用模擬進(jìn)行視覺(jué)輸入,而不是攝像機(jī)。觸覺(jué)和本體感覺(jué)等方式主要用于物理體現(xiàn)的設(shè)計(jì)。有些感知未被充分探索,例如嗅覺(jué)只在三種體系中出現(xiàn)(GLAIR、DAC和PRS0)??偟膩?lái)說(shuō),符號(hào)范式在設(shè)計(jì)上具有有限的感知能力,并且傾向于使用直接的輸入數(shù)據(jù)作為唯一的信息來(lái)源(參見(jiàn)圖的左側(cè))。另一方面,混合范式和涌現(xiàn)范式(主要位于右半部分圖中的)使用模擬和物理傳感器實(shí)現(xiàn)更廣泛的感知模式。然而,不管其來(lái)源如何,傳入的感知數(shù)據(jù)通常不能以原始形式使用(除了符號(hào)輸入之外),往往需要進(jìn)一步處理。下面將討論在認(rèn)體系中如何進(jìn)行有效且充分的感知處理。
12下一頁(yè)>(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )