精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>

<abbr id="ixlwe"></abbr>

直播
榜單
7x24h快訊

極客網(wǎng) > 人工智能 >

深度學(xué)習(xí)能力人工智能教機器人走路！

人閱讀
2019-01-03 10:16:00
來源：機器人庫
相關(guān)關(guān)鍵詞
- 人工智能
- AI

人工智能系統(tǒng)，使機器人具備了像人類一樣靈巧地掌握和操縱物體的能力，現(xiàn)在，研究人員表示，他們已經(jīng)開發(fā)出一種算法，通過這種算法，機器可能學(xué)會獨立行走。來自加州大學(xué)伯克利分校和其中之一的谷歌人工智能研究部門的科學(xué)家們，在Arxiv．org上發(fā)表《通過深度強化學(xué)習(xí)，來學(xué)習(xí)走路》，它描述一個人工智能系統(tǒng)，教一個長了四只腳的機器人穿越熟悉和不熟悉地形。

該論文作者解釋說，深度強化學(xué)習(xí)可以用于自動獲取一系列機器人任務(wù)數(shù)據(jù)，從而實現(xiàn)將感知輸入映射到低級動作的策略的端到端學(xué)習(xí)。如果我們能在現(xiàn)實世界中，直接從零開始學(xué)習(xí)移動步態(tài)，原則上，我們就能獲得最適合于每個機器人的步態(tài)，從而有可能獲得更好的靈活性、能源效率和穩(wěn)健性。

設(shè)計挑戰(zhàn)有兩方面。強化學(xué)習(xí)人工智能訓(xùn)練技術(shù)使用獎勵或懲罰來驅(qū)動個體朝著目標(biāo)前進，需要大量的數(shù)據(jù)，在某些情況下需要數(shù)萬個樣本，才能取得良好的結(jié)果。即：在美國，決定其結(jié)構(gòu)的參數(shù)通常需要進行多次訓(xùn)練，這可能會隨著時間的推移損害機器人。

作者指出，深度強化學(xué)習(xí)在仿真中廣泛應(yīng)用于學(xué)習(xí)運動策略，甚至將其應(yīng)用到現(xiàn)實機器人中，但由于仿真中存在的差異，不可避免地會導(dǎo)致一些性能損失，需要大量的手工建模。事實證明，在現(xiàn)實世界中使用這種算法是具有挑戰(zhàn)性的。

為了尋求一種方法，用研究人員的話說，可以讓一個系統(tǒng)在沒有模擬訓(xùn)練的情況下學(xué)習(xí)運動技能，他們開發(fā)了一個名為 maximum entropy RL的強化學(xué)習(xí)框架。它優(yōu)化了學(xué)習(xí)策略，即被處理數(shù)據(jù)的隨機性最大化。在RL中，AI agent通過對策略中的行為進行采樣并獲得獎勵，不斷尋找行為的最優(yōu)路徑，即狀態(tài)和行為的軌跡。

他們開發(fā)了一個由計算機工作站組成的流水線，該工作站更新神經(jīng)網(wǎng)絡(luò)，從Minitaur下載數(shù)據(jù)，并上傳最新的策略，機器人上搭載的Nvidia Jetson TX2執(zhí)行上述策略，收集數(shù)據(jù)，并通過以太網(wǎng)將數(shù)據(jù)上傳到工作站。兩小時內(nèi)，他們用一種獎勵前進速度、懲罰大角度加速度和俯仰角的算法，走了16萬步，成功地訓(xùn)練了這架小型機器人在平坦的地形上行走，越過木塊等障礙物，爬上斜坡和臺階。

研究人員寫道，據(jù)我們所知，這個實驗是一個深層強化學(xué)習(xí)算法的第一個例子，該算法直接在現(xiàn)實世界中學(xué)習(xí)不受驅(qū)動的四足動物運動，不需要任何模擬或預(yù)先訓(xùn)練。

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）

為您推薦

極客觀察

欄目相關(guān)

贊助商

極客網(wǎng)熱搜關(guān)鍵詞

人工智能 AI OpenAI ChatGPT 機器學(xué)習(xí) 生成式AI AI芯片 AIGC U-Mail AI大模型世界人工智能大會 AIoT AirPods Airbnb Rushmail 人工智能AI Akamai AI人工智能昇騰AI 生成式人工智能 AIPC Air AI技術(shù) 谷歌AI 蘋果AI GenAI 百度AI 科大訊飛AI學(xué)習(xí)機 AI手機 CAICT 阿爾法蛋AI詞典筆T10 微軟AI 華為AI AI+ 松鼠AI AI模型昇騰AI創(chuàng)新大賽 AIS Airdoc xAI WAIC 智譜AI AITO 京東AI 阿爾法蛋AI詞典筆 SoleusAir aigo SoleusAir舒樂氏 2019世界人工智能大會 LIFAair AI機器人 AI應(yīng)用人工智能大會 AI眼鏡 AI算力 AI創(chuàng)企移動AI時代 AI醫(yī)療浙大AIF 人工智能技術(shù) Zain AI人才 Airtag 人工智能芯片 AI服務(wù)器 AI投資 AI時代騰訊AI AI算法 BrainCo AI教育 AI框架聯(lián)想AI Gmail 人工智能計算中心 Airwallex空中云匯 VAIO AI賦能人工智能大賽 Chain Coremail AI搜索 OPENAIGC開發(fā)者大賽谷歌人工智能 Airwheel 昇騰AI開發(fā)者創(chuàng)享日 Mirai 人工智能名片人工智能機器人 AI基礎(chǔ)設(shè)施 AI聊天機器人阿里AI AI音樂 BrainCo強腦科技通用人工智能人工智能+ AI計算英偉達AI芯片 AI助手 AIOps

上一篇

吊打天貓精靈等“本土”智能音箱，HomePod做得到嗎？

下一篇

人工智能能否取代手機？這個答案不一定

簡版
原版
投稿
回頂部

2019-01-03

深度學(xué)習(xí)能力人工智能教機器人走路！

人工智能系統(tǒng)，使機器人具備了像人類一樣靈巧地掌握和操縱物體的能力，現(xiàn)在，研究人員表示，他們已經(jīng)開發(fā)出一種算法，通過這種算法，機器可能學(xué)會獨立行走。

長按掃碼閱讀全文