“技術前沿,覆蓋面廣,這是一場全程無槽點的分論壇”
“技術講解詳實,落地案例充分,是一場‘物超所值’的分論壇”……
7月3日下午,“Baidu Create 2019”百度 AI開發(fā)者大會百度大腦論壇如期舉行。在上午主論壇中,百度首席技術官王海峰正式發(fā)布百度大腦5.0,實現(xiàn)了歷史上最具跨越性升級,在算法突破、計算架構升級的基礎上,實現(xiàn)AI算法、計算架構和應用場景的融合創(chuàng)新,成為軟硬一體AI大生產平臺。
(百度首席技術官王海峰)
奪人眼球的“機械臂倒蓋碗茶”、任性的“中英自由說”、智能語音芯片“百度鴻鵠”…都給觀眾留下深刻印象,一下拉近了AI科技和人之間的距離。這背后又隱藏著哪些頂尖技術?百度大腦5.0何以稱之為軟硬一體的AI大生產平臺?下午場滿滿“技術范兒”的百度大腦論壇一一揭曉。
語音、視覺、語言與知識 AI算法創(chuàng)新并駕齊驅
重磅升級后的百度大腦5.0打通了從基礎層的深度學習技術到通用AI能力、應用技術方案,再到定制化模型,以及最終的部署和集成,整個人工智能產業(yè)化應用落地的全部流程,實現(xiàn)了AI技術的標準化、自動化和模塊化。
一直引領行業(yè)創(chuàng)新的百度大腦語音技術此次亮出在語音識別、語音合成、遠場語音交互芯片方面的成績單。百度語音技術部高級總監(jiān)高亮介紹,識別方面,百度提出流式多級的截斷注意力模型SMLTA,這是國際上首次實現(xiàn)局部注意力建模超越整句的注意力模型,也是國際上首次實現(xiàn)在線語音大規(guī)模使用注意力模型。SMLTA在大幅提升識別速度的同時,也提高了識別準確率。在輸入法有效產品相對準確率提升15%,音箱有效產品相對準確率提升20%。合成方面,針對現(xiàn)階段面臨風格遷移、音色模擬和情感擬人的三大挑戰(zhàn),百度推出語音合成技術Meitron,可以將語音中的音色、風格、情感等要素映射到不同的子空間,在使用時,不同要素可以任意組合,靈活的控制合成語音的風格。同時降低語言合成門檻,僅需20句話就可以制作一個人的專屬聲音。
(百度語音技術部高級總監(jiān)高亮)
對于落地應用正在端側呈現(xiàn)出巨大需求,百度大腦語音團隊研發(fā)出一款針對遠場語音交互打造的芯片——百度鴻鵠芯片。鴻鵠芯片的設計,變革傳統(tǒng)芯片設計方法,遵循“軟件定義芯片”的全新設計思路。該芯片采用雙核HiFi4架構,2.8M大內存,臺積電40nm工藝,在此硬件規(guī)格上,100mw左右平均工作功耗,即可支持遠場語音交互核心的陣列信號處理和語音喚醒能力。同時,按照車規(guī)級標準打造使鴻鵠芯片可滿足極嚴格的需求,將為車載語音交互,以及智能家居等場景帶來更大想象力。鴻鵠芯片流片的同時,即實現(xiàn)了量產。
百度視覺技術在2019年各大國際賽事中開啟“開掛”模式,在前不久結束的CVPR上分別在視頻理解、人臉活體、車輛REID等領域獲得第一,上半年在NTRIE2019、ICME2019、ICDAR2019、DWAN2019等比賽中也屢屢奪冠。百度視覺技術部、增強現(xiàn)實技術部總監(jiān)吳中勤介紹,5G時代,越來越多物理設備將連接到高可靠、低延時的網(wǎng)絡空間,這將徹底改變人們與環(huán)境及設備的交互方式。本次全新發(fā)布視覺語義化平臺2.0,正在推進視覺技術由“看清看懂”向“交互”進行升級。視覺語義化平臺2.0在交互升級和軟硬件結合兩大方面實現(xiàn)突破。
(百度視覺技術部、增強現(xiàn)實技術部總監(jiān)吳中勤)
交互升級包含一體化人機交互系統(tǒng)和大場景物理世界交互系統(tǒng)。簡單而言,一體化人機交互系統(tǒng)是人與機器、虛擬環(huán)境的自然交互與融合,該系統(tǒng)適用于實現(xiàn)AR特效的直播、小視頻、特效小程序等場景,已應用于百度多款視頻App。大場景物理世界交互系統(tǒng)是將視覺定位與AR技術突破性結合,實現(xiàn)大范圍的虛擬信息與物理世界的精準疊加,從而建立起AI時代全新的交互系統(tǒng)。目前,軟硬件結合可以滿足應用場景更高效的視覺計算,以及更低延時的體驗,同時能保護數(shù)據(jù)隱私。百度視覺方面的軟硬件結合主要聚焦于模型壓縮平臺PaddleSlim、多模態(tài)FaceID開發(fā)組件以及軟硬件一體解決方案AI相機三部分。FaceID覆蓋設備量已超1200萬臺。
視覺語義化平臺2.0更新了許多先進的感知技術,也讓機器人技術實現(xiàn)新突破。百度三維視覺首席科學家楊睿剛介紹,機器人就是一個智能體,除了感知技術,智能體需要決策和動作相關的技術,實現(xiàn)從環(huán)境感知到主動感知。目前,百度研究的智能體技術主要集中在自動駕駛Apollo、工程機械和服務機器人三大方面。上午主論壇中引人關注的機械臂“茶博士”不僅能說會道,還完成了傳統(tǒng)的長嘴壺倒茶工作,其背后依靠的正是服務機器人方案?;诎俣?D視覺,機器人可以對茶杯的位置進行檢測和追蹤。通過機器人運動規(guī)劃和控制,機械臂可以對工作空間進行碰撞檢測,避開障礙物;實時規(guī)劃運動后,可自動生成倒茶軌跡;隨后,感知水流變化,實時調整倒茶位置。語音語義聯(lián)動技術解析,更是讓機器人像“人”一般,聽得懂,說得好,做得準。
(百度三維視覺首席科學家楊睿剛)
在語言和知識技術方面,百度大腦也公布了一系列創(chuàng)新和突破。百度AI技術平臺體系執(zhí)行總監(jiān)吳甜向介紹,百度設計并實現(xiàn)了知識增強的語義理解框架——ERNIE,具備可持續(xù)學習能力,核心模型能力不斷提升。目前,ERNIE累計學習了超10億知識,全面刷新中文NLP任務的指標,在百度眾多產品應用中提升效果。機器同傳方面也有最新進展,在翻譯過程中對語音識別結果進行糾錯的聯(lián)合詞向量編碼技術,可解決多輪翻譯一致性和連貫性問題的語篇翻譯模型等,結合先進的語音技術,百度大腦實現(xiàn)了高準確、低時延的機器同傳技術。
(百度AI技術平臺體系執(zhí)行總監(jiān)吳甜)
知識,能幫助AI更深度地理解真實世界。在主論壇中,王海峰用近期熱映的音樂紀錄片《大河唱》,形象展示了融合百度知識圖譜技術的視頻語義理解能力。該技術通過對視頻的多模態(tài)知識解析,在多元異構知識圖譜上建立關聯(lián),并通過計算推理,建立對視頻的深度語義理解。
此外,吳甜還正式發(fā)布行業(yè)知識圖譜平臺和智能創(chuàng)作平臺2.0。行業(yè)知識圖譜平臺旨在滿足各行各業(yè)構建和應用知識圖譜來幫助推進智能化的需求,行業(yè)知識圖譜平臺基于領先的知識圖譜核心技術,提供智能高效的知識生產流程、低成本啟動和跨行業(yè)遷移的能力,幫助產業(yè)開發(fā)者定制行業(yè)知識圖譜并應用。全新的智能創(chuàng)作平臺集成了實時熱點追蹤、關聯(lián)豐富素材,已經(jīng)具有全面的創(chuàng)作輔助能力,可輕松解決傳統(tǒng)內容創(chuàng)作面臨的問題,全流程助力創(chuàng)作者,吳甜也預告了10月份將進行邀測的多模態(tài)自動創(chuàng)作功能。目前,百度已構建百度大腦·語言與知識技術開放平臺,不僅有豐富的基礎技術,還形成了包括智能創(chuàng)作平臺在內的翻譯開放平臺、UNIT平臺、知識圖譜構建與應用平臺共四大應用級平臺,為不同領域提供百度領先的語言與知識技術。
夯實基礎實力 聚焦AI計算 挖掘數(shù)據(jù)價值
百度大腦5.0不僅包含算法層面創(chuàng)新,在算力方面也實現(xiàn)重大突破。近年來,算法對算力需求增長近300,000倍,而芯片的計算性能僅提升30倍,兩者之間存在巨大鴻溝。
百度副總裁侯震宇為現(xiàn)場觀眾分享了百度新一代AI計算架構。面對AI計算的挑戰(zhàn),需要能夠從端到端來提供AI計算能力,這要求計算系統(tǒng)從舊有的對海量數(shù)據(jù)處理能力、對IO高峰值的追求,轉變?yōu)闈M足AI訓練功能方面IO密集、計算密集、通信密集的需求,和AI推理功能方面大吞吐和低延遲的需求。
(百度副總裁侯震宇)
侯震宇認為,面對即將到來的AI+5G時代,計算將無處不在。真正的計算會發(fā)生在設備(Device)、邊緣(Edge)和云(Cloud)中,因而D-E-C場景將會是接下來需要重點研究的問題;與此同時,包括芯片之間、系統(tǒng)之間、設備之間的互相連接,將幫助不同場景中的計算連接在一起,產生更大的計算力。
底層的芯片和上層的應用之間,還需要操作系統(tǒng)承接。王海峰認為,深度學習框架就是智能時代的操作系統(tǒng)。百度自研的國內唯一功能完備的深度學習平臺“飛槳”就是中國自己的“AI操作系統(tǒng)”。主論壇中,正式宣布百度飛槳與華為麒麟芯片深度對接,全球領先的端側AI芯片和深度學習平臺,將聯(lián)合為端側AI提供最強勁算力、打造最好的深度學習運行效率。
對于飛槳,很多開發(fā)者都非常熟悉。現(xiàn)場百度深度學習技術平臺部總監(jiān)馬艷軍詳細介紹了飛槳的五大核心優(yōu)勢。在核心框架層面,飛槳同時支持動態(tài)圖與靜態(tài)圖,兼顧了靈活性與效率;飛槳提供了70多個官方的、達到工業(yè)級應用效果的模型;飛槳支持大規(guī)模的分布式訓練以及端到端的部署;對于中國開發(fā)者,飛槳提供系統(tǒng)的深度學習技術服務,有非常全面的中文支持。馬艷軍現(xiàn)場還表示,技術界“奧斯卡”,已成功舉辦15年的經(jīng)典賽事“2019百度之星”即日起開始報名,其中百度之星的編程賽是飛槳核心框架開發(fā)的任務;百度之星開發(fā)賽,則是基于飛槳的目標檢測任務。
(百度深度學習技術平臺部總監(jiān)馬艷軍)
為了降低建模的成本,提高建模的效率,并降低對大數(shù)據(jù)的依賴,減少人工的干預,百度開發(fā)了AutoDL自動化建模技術。論壇上,百度大數(shù)據(jù)實驗室主任浣軍正式發(fā)布AutoDL 3.0,從設計、遷移和適配三方面進行全面升級,并分享了多個實際案例,目前已通過飛槳正式開源。
(百度大數(shù)據(jù)實驗室主任浣軍)
源于產業(yè)實踐的深度學習平臺飛槳同時亦正在反哺產業(yè)。百度地圖事業(yè)部總經(jīng)理李瑩以交通領域為例,介紹百度地圖基于飛槳提升了ETA的開發(fā)、調試的便捷性和訓練效率,完成了天級別的百億級數(shù)據(jù)訓練;提升了ETA的部署和預測性能,支撐了天級別的百億次調用。ETA是地圖路線規(guī)劃的主要特征,也是用戶出行決策的主要參考因素。對于用戶而言,飛槳賦能的百度地圖ETA可以實現(xiàn)通行時間智能預估,在出行前便可提前預知路況,避開擁堵時段、了解擁堵時長、躲避擁堵路線,合理規(guī)劃出行時間。
(百度地圖事業(yè)部總經(jīng)理李瑩)
數(shù)據(jù)是AI時代的核心生產資料,當前大數(shù)據(jù)產業(yè)發(fā)展中面臨數(shù)據(jù)資產安全性和數(shù)據(jù)價值發(fā)掘成本高兩大問題。百度大數(shù)據(jù)部高級總監(jiān)郭謝介紹,百度點石大數(shù)據(jù)技術開放平臺作為國內第一家落地的大數(shù)據(jù)iPaaS平臺,聚焦大數(shù)據(jù)產業(yè)發(fā)展過程中的安全和效率兩大問題。同時,點石具有三大核心特性,包含安全的數(shù)據(jù)融合加工環(huán)境、多層次開放的可定制組件,以及功能一體化的大數(shù)據(jù)開發(fā)平臺,可以幫助開發(fā)者安全、高效地進行大數(shù)據(jù)價值的發(fā)掘。百度希望通過點石加速大數(shù)據(jù)的生態(tài)發(fā)展,幫助開發(fā)者深度發(fā)掘數(shù)據(jù)價值,點石成金。
(百度大數(shù)據(jù)部高級總監(jiān)郭謝)
AI算法、計算架構和應用場景的融合創(chuàng)新的百度大腦5.0已成為軟硬一體 AI大生產平臺。百度大腦論壇下午近三個小時的分享,僅僅是百度大腦技術的“冰山一角”。除了頂級的技術,百度大腦仍將不斷開放賦能,目前已經(jīng)開放210余項領先的AI技術能力,平臺的調用次數(shù)同比增長108%,定制化平臺模型的數(shù)量都在飛速增長,平臺上的開發(fā)者數(shù)量已經(jīng)達到了130萬。王海峰表示,“授人魚不如授人以漁”,百度研發(fā)頂尖的AI技術,也致力于開放頂尖的AI技術。百度大腦5.0,助力各行各業(yè)的產業(yè)開發(fā)者,加速產業(yè)智能化。
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準AI機器人
- 微信零錢通新政策:銀行卡轉入資金提現(xiàn)免手續(xù)費引熱議
- 消息稱塔塔集團將收購和碩印度iPhone代工廠60%股份 并接管日常運營
- 蘋果揭秘自研芯片成功之道:領先技術與深度整合是關鍵
- 英偉達新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關注
- 無人機“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機器人合作
- 賽力斯觸及漲停,汽車整車股盤初強勢拉升
免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。