精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>

<abbr id="ixlwe"></abbr>

<address id="ebztf"><option id="ebztf"><rp id="ebztf"></rp></option></address>

直播
榜單
7x24h快訊

極客網(wǎng) > 人工智能 >

解讀AlphaZero：一種人類從未見(jiàn)過(guò)的智慧

人閱讀
2018-12-29 15:04:00
來(lái)源：物聯(lián)中國(guó)
相關(guān)關(guān)鍵詞
- 人工智能
- AI

在圍棋上打敗天下無(wú)敵手之后，DeepMind旗下的Alpha家族開(kāi)始深入探究所有棋類，其中就包括國(guó)際象棋、日本將軍棋。

2018年12月初，在AlphaZero誕生一周年之際，《自然》雜志以封面文發(fā)布了AlphaZero經(jīng)過(guò)同行審議的完整論文，Deepmind創(chuàng)始人兼CEO哈薩比斯親自執(zhí)筆了這一論文。

AlphaGo Zero發(fā)布于2017年10月，而起真正受到重視是在去年12月初發(fā)布的《科學(xué)》雜志上，論文顯示，AlphaGo Zero在三天內(nèi)自學(xué)了三種不同的棋類游戲，包括國(guó)際象棋、圍棋和日本將軍棋，而且無(wú)需人工干預(yù)。這一成果震驚了國(guó)際象棋世界，幾個(gè)小時(shí)內(nèi)，AlphaGo Zero就成為了世界上最好的棋類玩家。

眾所周知，在國(guó)際象棋方面，IBM的深藍(lán)在20年前就打敗了國(guó)際象棋大師，而后續(xù)的Stockfish和Komodo這些國(guó)際象棋程序也早已獨(dú)霸國(guó)際象棋世界。在AlphaGo Zero發(fā)布之后，很多人質(zhì)疑了其在國(guó)際象棋領(lǐng)域的價(jià)值。而本次的完整論文，對(duì)一些人認(rèn)為機(jī)器算法下國(guó)際象棋沒(méi)有價(jià)值的論調(diào)提出了幾個(gè)措辭頗為嚴(yán)厲的批評(píng)。這是因?yàn)?，在過(guò)去的12個(gè)月里，AlphaZero清楚展示了人類從未見(jiàn)過(guò)的一種智慧。

下面，就讓我們通過(guò)論文來(lái)分析下AlphaZero。

深藍(lán)、Stockfish和Komodo雖然能贏人類，但不能真正理解棋局

文章指出，在過(guò)去的二十年里，用機(jī)器算法下國(guó)際象棋已經(jīng)取得了很大進(jìn)步。1997年，IBM公司的國(guó)際象棋程序“深藍(lán)”（Deep Blue）在一場(chǎng)六局的比賽中擊敗了當(dāng)時(shí)的人類世界冠軍卡斯帕羅夫（Garry Kasparov）?，F(xiàn)在看來(lái)，這一成就并不神秘。深藍(lán)每秒可以計(jì)算2億個(gè)位置。它從不疲倦，從不在計(jì)算中出錯(cuò)，也從不會(huì)忘記片刻之前的想法。

無(wú)論結(jié)果是好是壞，“深藍(lán)”都像一臺(tái)真正的機(jī)器，粗暴而物質(zhì)化。它的計(jì)算能力遠(yuǎn)超過(guò)卡斯帕羅夫，但卻無(wú)法真正從思維上超越他。在第一局的比賽中，深藍(lán)貪婪地接受了卡斯帕羅夫用車換一名主教的犧牲，卻在16步之后輸了比賽?，F(xiàn)在，諸如Stockfish和Komodo等當(dāng)前世界上最強(qiáng)的國(guó)際象棋程序仍然在以這種方式下棋。它們喜歡吃掉對(duì)手的棋子；它們防守像鋼鐵一樣強(qiáng)悍。但是，盡管這些國(guó)際象棋程序要比任何人類棋手強(qiáng)大得多，但并沒(méi)有真正理解棋局本身的意義。

經(jīng)過(guò)幾十年的發(fā)展，人類大師關(guān)于棋類游戲的經(jīng)驗(yàn)都被作為復(fù)雜的評(píng)估工具編進(jìn)程序中，表明在下棋中該尋求什么樣的有利位置以及避免陷入什么樣的不利境地。比如，王的安全性，棋子的活動(dòng)、兵形、中心控制，以及如何平衡利弊。但以往很多國(guó)際象棋程序卻天生無(wú)視這些原則，給人留下的印象是野蠻粗暴的，這些程序速度快得驚人，但卻完全缺乏洞察力。

AlphaGo Zero不僅打敗了人類和所有程序，還擁有洞察力

所有這些都隨著機(jī)器學(xué)習(xí)的興起而改變。AlphaZero通過(guò)與自己對(duì)弈并根據(jù)經(jīng)驗(yàn)更新神經(jīng)網(wǎng)絡(luò)，從而發(fā)現(xiàn)了國(guó)際象棋的原理，并迅速成為史上最好的棋手。它不僅能夠輕而易舉地?fù)魯∷凶顝?qiáng)大的人類棋手，還能擊敗當(dāng)時(shí)的計(jì)算機(jī)國(guó)際象棋世界冠軍Stockfish。在與Stockfish進(jìn)行的100場(chǎng)比賽中，AlphaZero取得28勝72平的好成績(jī)。它沒(méi)有輸?shù)粢粓?chǎng)比賽。

最令人不可思議的是，AlphaZero似乎表達(dá)出一種天然的洞察力。它具備浪漫而富有攻擊性的風(fēng)格，以一種直觀而優(yōu)美的方式發(fā)揮著電腦所沒(méi)有的作用。它會(huì)玩花招，冒險(xiǎn)。在其中幾局中，它使Stockfish癱瘓并玩弄它。當(dāng)AlphaZero在第10局進(jìn)行進(jìn)攻時(shí)，它把自己的皇后佯退到棋盤的角落里，遠(yuǎn)離Stockfish的國(guó)王。通常來(lái)說(shuō)，這并不是攻擊皇后應(yīng)該被放置的地方。

然而，這種奇怪的撤退行為充滿了惡意，不管Stockfish如何應(yīng)對(duì)，它都注定要失敗。經(jīng)過(guò)數(shù)十億次殘酷的計(jì)算后，AlphaZero幾乎是在等待Stockfish意識(shí)到，自己的處境是多么無(wú)望，就像一頭被擊敗的公牛面對(duì)斗牛士一樣平靜落敗。大師們從未見(jiàn)過(guò)這樣的機(jī)器。AlphaZero擁有精湛的技藝，同時(shí)也擁有機(jī)器的力量。這是人類第一次瞥見(jiàn)一種令人敬畏的新型智能。

很明顯，AlphaZero獲勝靠的是更聰明的思維，而不是更快的思維。它每秒只計(jì)算6萬(wàn)個(gè)位置，而Stockfish會(huì)計(jì)算6千萬(wàn)個(gè)。它更明智，知道該思考什么，該忽略什么?？ㄋ古亮_夫在《科學(xué)》雜志文章附帶的一篇評(píng)論中寫(xiě)道，AlphaZero通過(guò)自主發(fā)現(xiàn)國(guó)際象棋的原理，開(kāi)發(fā)出一種“反映游戲真相”的玩法，而不是“程序員式的優(yōu)先級(jí)和偏見(jiàn)”。

12下一頁(yè)>

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。）

為您推薦

極客觀察

欄目相關(guān)

贊助商

極客網(wǎng)熱搜關(guān)鍵詞

人工智能 AI OpenAI ChatGPT 機(jī)器學(xué)習(xí) 生成式AI AI芯片 AIGC U-Mail AI大模型世界人工智能大會(huì) AIoT AirPods Airbnb Rushmail 人工智能AI Akamai AI人工智能昇騰AI 生成式人工智能 AIPC Air AI技術(shù) 谷歌AI 蘋果AI GenAI 百度AI 科大訊飛AI學(xué)習(xí)機(jī) AI手機(jī) CAICT 阿爾法蛋AI詞典筆T10 微軟AI 華為AI AI+ 松鼠AI AI模型昇騰AI創(chuàng)新大賽 AIS Airdoc xAI WAIC 智譜AI AITO 京東AI 阿爾法蛋AI詞典筆 SoleusAir aigo SoleusAir舒樂(lè)氏 2019世界人工智能大會(huì) LIFAair AI機(jī)器人 AI應(yīng)用人工智能大會(huì) AI眼鏡 AI算力 AI創(chuàng)企移動(dòng)AI時(shí)代 AI醫(yī)療浙大AIF 人工智能技術(shù) Zain AI人才 Airtag 人工智能芯片 AI服務(wù)器 AI投資 AI時(shí)代騰訊AI AI算法 BrainCo AI教育 AI框架聯(lián)想AI Gmail 人工智能計(jì)算中心 Airwallex空中云匯 VAIO AI賦能人工智能大賽 Chain Coremail AI搜索 OPENAIGC開(kāi)發(fā)者大賽人工智能機(jī)器人谷歌人工智能 Airwheel 昇騰AI開(kāi)發(fā)者創(chuàng)享日 Mirai 人工智能名片 AI基礎(chǔ)設(shè)施 AI聊天機(jī)器人阿里AI AI音樂(lè) BrainCo強(qiáng)腦科技通用人工智能人工智能+ AI計(jì)算英偉達(dá)AI芯片 AI助手 AIOps

上一篇

All In智能駕駛的時(shí)代，是汽車后市場(chǎng)的凜冬？

下一篇

雖然只是個(gè)“數(shù)字助手”，卻是AI的一次巨大飛躍

簡(jiǎn)版
原版
投稿
回頂部

2018-12-29

解讀AlphaZero：一種人類從未見(jiàn)過(guò)的智慧

在圍棋上打敗天下無(wú)敵手之后，DeepMind旗下的Alpha家族開(kāi)始深入探究所有棋類，其中就包括國(guó)際象棋、日本將軍棋。

長(zhǎng)按掃碼閱讀全文

<button id="bynko"><option id="bynko"><output id="bynko"></output></option></button>

<span id="bynko"></span><strike id="bynko"><ruby id="bynko"></ruby></strike>