精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>
  • <span id="ixlwe"></span>

  • <abbr id="ixlwe"></abbr>

    解讀AlphaZero:一種人類從未見(jiàn)過(guò)的智慧

    在圍棋上打敗天下無(wú)敵手之后,DeepMind旗下的Alpha家族開(kāi)始深入探究所有棋類,其中就包括國(guó)際象棋、日本將軍棋。

    2018年12月初,在AlphaZero誕生一周年之際,《自然》雜志以封面文發(fā)布了AlphaZero經(jīng)過(guò)同行審議的完整論文,Deepmind創(chuàng)始人兼CEO哈薩比斯親自執(zhí)筆了這一論文。

    AlphaGo Zero發(fā)布于2017年10月,而起真正受到重視是在去年12月初發(fā)布的《科學(xué)》雜志上,論文顯示,AlphaGo Zero在三天內(nèi)自學(xué)了三種不同的棋類游戲,包括國(guó)際象棋、圍棋和日本將軍棋,而且無(wú)需人工干預(yù)。這一成果震驚了國(guó)際象棋世界,幾個(gè)小時(shí)內(nèi),AlphaGo Zero就成為了世界上最好的棋類玩家。

    眾所周知,在國(guó)際象棋方面,IBM的深藍(lán)在20年前就打敗了國(guó)際象棋大師,而后續(xù)的Stockfish和Komodo這些國(guó)際象棋程序也早已獨(dú)霸國(guó)際象棋世界。在AlphaGo Zero發(fā)布之后,很多人質(zhì)疑了其在國(guó)際象棋領(lǐng)域的價(jià)值。而本次的完整論文,對(duì)一些人認(rèn)為機(jī)器算法下國(guó)際象棋沒(méi)有價(jià)值的論調(diào)提出了幾個(gè)措辭頗為嚴(yán)厲的批評(píng)。這是因?yàn)?,在過(guò)去的12個(gè)月里,AlphaZero清楚展示了人類從未見(jiàn)過(guò)的一種智慧。

    下面,就讓我們通過(guò)論文來(lái)分析下AlphaZero。

    深藍(lán)、Stockfish和Komodo雖然能贏人類,但不能真正理解棋局

    文章指出,在過(guò)去的二十年里,用機(jī)器算法下國(guó)際象棋已經(jīng)取得了很大進(jìn)步。1997年,IBM公司的國(guó)際象棋程序“深藍(lán)”(Deep Blue)在一場(chǎng)六局的比賽中擊敗了當(dāng)時(shí)的人類世界冠軍卡斯帕羅夫(Garry Kasparov)?,F(xiàn)在看來(lái),這一成就并不神秘。深藍(lán)每秒可以計(jì)算2億個(gè)位置。它從不疲倦,從不在計(jì)算中出錯(cuò),也從不會(huì)忘記片刻之前的想法。

    無(wú)論結(jié)果是好是壞,“深藍(lán)”都像一臺(tái)真正的機(jī)器,粗暴而物質(zhì)化。它的計(jì)算能力遠(yuǎn)超過(guò)卡斯帕羅夫,但卻無(wú)法真正從思維上超越他。在第一局的比賽中,深藍(lán)貪婪地接受了卡斯帕羅夫用車換一名主教的犧牲,卻在16步之后輸了比賽?,F(xiàn)在,諸如Stockfish和Komodo等當(dāng)前世界上最強(qiáng)的國(guó)際象棋程序仍然在以這種方式下棋。它們喜歡吃掉對(duì)手的棋子;它們防守像鋼鐵一樣強(qiáng)悍。但是,盡管這些國(guó)際象棋程序要比任何人類棋手強(qiáng)大得多,但并沒(méi)有真正理解棋局本身的意義。

    經(jīng)過(guò)幾十年的發(fā)展,人類大師關(guān)于棋類游戲的經(jīng)驗(yàn)都被作為復(fù)雜的評(píng)估工具編進(jìn)程序中,表明在下棋中該尋求什么樣的有利位置以及避免陷入什么樣的不利境地。比如,王的安全性,棋子的活動(dòng)、兵形、中心控制,以及如何平衡利弊。但以往很多國(guó)際象棋程序卻天生無(wú)視這些原則,給人留下的印象是野蠻粗暴的,這些程序速度快得驚人,但卻完全缺乏洞察力。

    AlphaGo Zero不僅打敗了人類和所有程序,還擁有洞察力

    所有這些都隨著機(jī)器學(xué)習(xí)的興起而改變。AlphaZero通過(guò)與自己對(duì)弈并根據(jù)經(jīng)驗(yàn)更新神經(jīng)網(wǎng)絡(luò),從而發(fā)現(xiàn)了國(guó)際象棋的原理,并迅速成為史上最好的棋手。它不僅能夠輕而易舉地?fù)魯∷凶顝?qiáng)大的人類棋手,還能擊敗當(dāng)時(shí)的計(jì)算機(jī)國(guó)際象棋世界冠軍Stockfish。在與Stockfish進(jìn)行的100場(chǎng)比賽中,AlphaZero取得28勝72平的好成績(jī)。它沒(méi)有輸?shù)粢粓?chǎng)比賽。

    最令人不可思議的是,AlphaZero似乎表達(dá)出一種天然的洞察力。它具備浪漫而富有攻擊性的風(fēng)格,以一種直觀而優(yōu)美的方式發(fā)揮著電腦所沒(méi)有的作用。它會(huì)玩花招,冒險(xiǎn)。在其中幾局中,它使Stockfish癱瘓并玩弄它。當(dāng)AlphaZero在第10局進(jìn)行進(jìn)攻時(shí),它把自己的皇后佯退到棋盤的角落里,遠(yuǎn)離Stockfish的國(guó)王。通常來(lái)說(shuō),這并不是攻擊皇后應(yīng)該被放置的地方。

    然而,這種奇怪的撤退行為充滿了惡意,不管Stockfish如何應(yīng)對(duì),它都注定要失敗。經(jīng)過(guò)數(shù)十億次殘酷的計(jì)算后,AlphaZero幾乎是在等待Stockfish意識(shí)到,自己的處境是多么無(wú)望,就像一頭被擊敗的公牛面對(duì)斗牛士一樣平靜落敗。大師們從未見(jiàn)過(guò)這樣的機(jī)器。AlphaZero擁有精湛的技藝,同時(shí)也擁有機(jī)器的力量。這是人類第一次瞥見(jiàn)一種令人敬畏的新型智能。

    很明顯,AlphaZero獲勝靠的是更聰明的思維,而不是更快的思維。它每秒只計(jì)算6萬(wàn)個(gè)位置,而Stockfish會(huì)計(jì)算6千萬(wàn)個(gè)。它更明智,知道該思考什么,該忽略什么??ㄋ古亮_夫在《科學(xué)》雜志文章附帶的一篇評(píng)論中寫(xiě)道,AlphaZero通過(guò)自主發(fā)現(xiàn)國(guó)際象棋的原理,開(kāi)發(fā)出一種“反映游戲真相”的玩法,而不是“程序員式的優(yōu)先級(jí)和偏見(jiàn)”。

    12下一頁(yè)>

    (免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
    任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )

    贊助商
    2018-12-29
    解讀AlphaZero:一種人類從未見(jiàn)過(guò)的智慧
    在圍棋上打敗天下無(wú)敵手之后,DeepMind旗下的Alpha家族開(kāi)始深入探究所有棋類,其中就包括國(guó)際象棋、日本將軍棋。

    長(zhǎng)按掃碼 閱讀全文