?在AI技術(shù)逐漸滲透產(chǎn)業(yè)發(fā)展、落地的過(guò)程中,開(kāi)發(fā)者可謂是最重要的一環(huán)。3月20日,首場(chǎng)百度大腦開(kāi)放日在北京中關(guān)村創(chuàng)業(yè)大街百度大腦創(chuàng)新體驗(yàn)中心舉行,此次活動(dòng)旨在為AI開(kāi)發(fā)者提供及時(shí)、全面、近距離的了解百度大腦最新AI產(chǎn)品和案例,幫助更多開(kāi)發(fā)者探索AI前沿應(yīng)用,并且能與百度AI技術(shù)大拿們進(jìn)行深度、持續(xù)的交流。
活動(dòng)當(dāng)天,百度AI技術(shù)生態(tài)部總經(jīng)理喻友平,就百度大腦平臺(tái)與生態(tài)進(jìn)行了全面的詳解,同時(shí)展示了百度大腦開(kāi)放平臺(tái)Q1核心升級(jí)內(nèi)容,包括語(yǔ)音技術(shù)、視覺(jué)技術(shù)、自然語(yǔ)言處理、知識(shí)圖譜等通用AI能力的新近推出,以及開(kāi)源深度學(xué)習(xí)框架方面的優(yōu)化升級(jí),更有多個(gè)應(yīng)用場(chǎng)景案例與大家分享,可謂干貨滿滿,廣受前來(lái)參加活動(dòng)的開(kāi)發(fā)者與媒體們歡迎與稱贊。
PaddlePaddle:用深度學(xué)習(xí)賦能智能+的方方面面
1.業(yè)界首個(gè)視頻分類模型庫(kù):新增視頻模型庫(kù),提供5個(gè)視頻分類經(jīng)典模型以及適合視頻分類任務(wù)的通用骨架代碼,用戶可一鍵式高效配置模型完成訓(xùn)練和評(píng)測(cè)。視頻理解權(quán)威競(jìng)賽ActivityNet - Kinetics視頻動(dòng)作識(shí)別任務(wù)冠軍方法stNet的resnet50版本開(kāi)源實(shí)現(xiàn)。
2.基于PaddlePaddle的BERT多機(jī)多卡和混合精度訓(xùn)練。新增支持NLP語(yǔ)義表示BERT模型,支持多機(jī)多卡訓(xùn)練,支持混合精度訓(xùn)練,訓(xùn)練速度對(duì)比主流實(shí)現(xiàn)提升50%+,提供完整部署示例。
3.分布式訓(xùn)練性能大幅提升:大規(guī)模稀疏參數(shù)服務(wù)器Benchmark發(fā)布,CPU多機(jī)異步訓(xùn)練發(fā)布顯著提升點(diǎn)擊率預(yù)估任務(wù)IO吞吐的built-in reader,多機(jī)多卡訓(xùn)練性能多方面提升。
并推出業(yè)界領(lǐng)先的深度強(qiáng)化學(xué)習(xí)框架PARL1.0。據(jù)喻友平介紹,PARL曾在NeurIPS 2018 奪冠。具有高靈活性和可擴(kuò)展性,支持可定制的并行擴(kuò)展,覆蓋DQN、DDPG、PPO、A3C等主流強(qiáng)化學(xué)習(xí)算法。通過(guò)8塊GPU拉動(dòng)近20000個(gè)CPU節(jié)點(diǎn)運(yùn)算,將近5個(gè)小時(shí)迭代一輪的PPO算法加速到不到1分鐘。
如今,百度PaddlePaddle已經(jīng)廣泛應(yīng)用于農(nóng)業(yè)、林業(yè)、工業(yè)、零售、人力、制造、石油、通訊、地產(chǎn)、汽車等多個(gè)行業(yè)領(lǐng)域,與合作伙伴一起幫助越來(lái)越多的行業(yè)完成向“智能+”的升級(jí)轉(zhuǎn)變。
語(yǔ)音方向:首次開(kāi)放搭載國(guó)際領(lǐng)先的SMLTA模型的語(yǔ)音能力:語(yǔ)音識(shí)別極速版
根據(jù)喻友平介紹,目前百度大腦語(yǔ)音開(kāi)放能力包括語(yǔ)音喚醒、語(yǔ)音識(shí)別、語(yǔ)音合成等通用能力,還包括即將推出的語(yǔ)音識(shí)別自訓(xùn)練平臺(tái)、軟硬一體的語(yǔ)音開(kāi)發(fā)套件以及各種場(chǎng)景方案。
1月的百度輸入法探索版發(fā)布會(huì)上,首次發(fā)布了領(lǐng)先國(guó)際的語(yǔ)音技術(shù):在線語(yǔ)音領(lǐng)域全球首創(chuàng)的流式多級(jí)截?cái)嘧⒁饬δP蚐MLT「Streaming trancated multi-layer attention」。在百度輸入法產(chǎn)品發(fā)布后,驚艷的語(yǔ)音輸入體驗(yàn)得到了業(yè)界的一致好評(píng)。2個(gè)月后,百度大腦語(yǔ)音方向首次對(duì)外開(kāi)放采用這一語(yǔ)音技術(shù)的語(yǔ)音能力:語(yǔ)音識(shí)別極速版。擁有更快的響應(yīng)速度,相對(duì)識(shí)別準(zhǔn)確度提升15%,為開(kāi)發(fā)者帶來(lái)更極致的識(shí)別體驗(yàn)。
此項(xiàng)語(yǔ)音能力在API調(diào)用方式下,實(shí)時(shí)率小于0.1,意味著5s的音頻不到500ms即可完成識(shí)別過(guò)程,極大減少了識(shí)別音頻所需的耗時(shí),提升了語(yǔ)音交互的響應(yīng)體驗(yàn)。在近距離安靜環(huán)境下,識(shí)別準(zhǔn)確率可達(dá)到98%,同時(shí)支持略帶口音、童聲、耳語(yǔ)的識(shí)別,使語(yǔ)音識(shí)別應(yīng)用更加廣泛。多平臺(tái)的SDK也即將推出,使APP、服務(wù)器端更可實(shí)時(shí)識(shí)別,應(yīng)用這一領(lǐng)先技術(shù)。目前,每個(gè)開(kāi)發(fā)者賬戶將贈(zèng)送5W次免費(fèi)調(diào)用量,針對(duì)新能力的使用者,也即將推出一系列贈(zèng)送及優(yōu)惠活動(dòng)。
同時(shí),近場(chǎng)語(yǔ)音識(shí)別升級(jí)了預(yù)置語(yǔ)義解析。預(yù)置場(chǎng)景由35個(gè)升級(jí)為51個(gè),包括天氣、航班、電話、電影播放、頁(yè)面屏幕控制、電視劇、美食、手機(jī)設(shè)置、通用錄、提醒、短信、故事等,語(yǔ)義解析效果全面優(yōu)化,80%優(yōu)于原有解析結(jié)果。
不僅如此,還有一些新品即將上線。如:語(yǔ)音識(shí)別自訓(xùn)練平臺(tái),支持自動(dòng)評(píng)估選出最好的基線模型,僅上傳業(yè)務(wù)場(chǎng)景文本語(yǔ)料即可訓(xùn)練語(yǔ)言模型,零代碼自助訓(xùn)練專屬的語(yǔ)音識(shí)別模型,極大地方便語(yǔ)音開(kāi)發(fā)者提升所在業(yè)務(wù)場(chǎng)景的識(shí)別準(zhǔn)確率,滿足業(yè)務(wù)上的語(yǔ)音識(shí)別需求。另外,遠(yuǎn)場(chǎng)語(yǔ)音開(kāi)發(fā)套件也即將上架售賣,可快速進(jìn)行遠(yuǎn)場(chǎng)識(shí)別開(kāi)發(fā)評(píng)估,此套件應(yīng)用于機(jī)器人、兒童故事機(jī)、家電、車載設(shè)備等硬件。同時(shí)還將開(kāi)放離線合成,以及推出更多音庫(kù)。
視覺(jué)方向:從車到人再到“證” 用AI都能看得清
在百度大腦開(kāi)放日,喻友平還介紹了視覺(jué)方向更新升級(jí)的四方面內(nèi)容,包括OCR、車輛分析、人臉人體以及圖像識(shí)別。
首先,在極大便捷工作的OCR方面:1.新增了卡證OCR 4個(gè)新能力:戶口本OCR、出生醫(yī)學(xué)證明OCR、港澳通行證OCR、臺(tái)灣通行證OCR,總數(shù)達(dá)到9種;
新增票據(jù)OCR 4個(gè)新能力:行程單OCR、保單識(shí)別OCR、通用機(jī)打發(fā)票O(jiān)CR,定額發(fā)票O(jiān)CR,總數(shù)達(dá)到9種;
汽車場(chǎng)景3個(gè)新能力:車輛VIN OCR、機(jī)動(dòng)車銷售發(fā)票O(jiān)CR、車輛合格證OCR,總數(shù)達(dá)到6種。這些OCR新能力在關(guān)鍵字段的準(zhǔn)確率均在90%以上,并有多項(xiàng)是業(yè)界首次平臺(tái)化開(kāi)放。至此,OCR產(chǎn)品全系列共34款,實(shí)現(xiàn)卡證、票據(jù)、文檔、汽車全場(chǎng)景覆蓋。
同時(shí),對(duì)已有的OCR能力也進(jìn)行了功能升級(jí):表格識(shí)別:支持合并單元格、無(wú)表格線等復(fù)雜樣式;iOCR 自定義模版文字識(shí)別:支持列寬不固定、有合并單元格的表格樣式的定制識(shí)別;駕駛證識(shí)別:支持駕駛證副頁(yè)的識(shí)別。
其次,在車輛分析方面,推出全新系列服務(wù):包括車輛檢測(cè)、車流統(tǒng)計(jì)、車輛屬性分析和外觀損傷識(shí)別。其中,車輛檢測(cè),通過(guò)識(shí)別圖像中的所有機(jī)動(dòng)車輛(包含小汽車、卡車、巴士、摩托車、三輪車),返回每輛車的類型和坐標(biāo)位置,并對(duì)每類車輛分別計(jì)數(shù),可應(yīng)用于違章停車監(jiān)測(cè)和智能停車場(chǎng)。
(車輛檢測(cè))
車流統(tǒng)計(jì),則根據(jù)視頻抓拍圖片序列,進(jìn)行車輛檢測(cè)和追蹤,識(shí)別各類車輛(包括小汽車、卡車、巴士、摩托車、三輪車)在指定區(qū)域內(nèi)的駛?cè)?駛出情況,實(shí)現(xiàn)動(dòng)態(tài)車流統(tǒng)計(jì),可應(yīng)用于實(shí)時(shí)監(jiān)控交通道路、卡口的車流量,自動(dòng)統(tǒng)計(jì)不同時(shí)段各類車輛的進(jìn)出數(shù)量,分析路口、路段的交通狀況,為交通調(diào)度、路況優(yōu)化提供精準(zhǔn)參考依據(jù)。而車輛屬性分析和外觀損傷識(shí)別兩項(xiàng)服務(wù),也即將開(kāi)放,盡請(qǐng)期待。
(車輛屬性識(shí)別)
在人臉人體識(shí)別方面,新發(fā)布了情緒識(shí)別,可以準(zhǔn)確識(shí)別7類情緒:生氣、害怕、厭惡、高興、悲傷、驚訝、無(wú)情緒。此項(xiàng)技術(shù)可應(yīng)用于幼兒園安全監(jiān)控等場(chǎng)景,通過(guò)監(jiān)控孩子的心理狀態(tài),判斷教師和幼兒是否有異常狀況,從而保障幼兒安全、及時(shí)預(yù)警并參與輔導(dǎo)等。同時(shí)人臉融合以及手部關(guān)鍵點(diǎn)將在3月推出。此外還有2項(xiàng)功能全新升級(jí),包括:人臉檢測(cè)快速檢測(cè)人臉并返回人臉框位置、定位五官與輪廓關(guān)鍵點(diǎn)數(shù)量,從72個(gè)增加至150個(gè);新增2種手勢(shì),共24種常見(jiàn)手勢(shì),整體識(shí)別率在90%以上,使得手勢(shì)識(shí)別更豐富、更準(zhǔn)確;而即將上線的更高進(jìn)精度的人像分割,可應(yīng)用于人像美圖、影視后期等場(chǎng)景。
而在圖像識(shí)別方面,新增紅酒識(shí)別和地標(biāo)識(shí)別這2個(gè)新能力。通過(guò)紅酒識(shí)別,用戶只需要對(duì)著紅酒標(biāo)簽拍照,系統(tǒng)就能自動(dòng)識(shí)別紅酒的品牌和名稱,目前可識(shí)別數(shù)十萬(wàn)種國(guó)內(nèi)外紅酒,識(shí)別準(zhǔn)確率98%以上,從法國(guó)波爾多到中國(guó)張?jiān)?,商品信息都能得到?zhǔn)確關(guān)聯(lián),可以輕松為用戶提供參考和商品推薦。而地標(biāo)識(shí)別則能夠精準(zhǔn)識(shí)別約5萬(wàn)中外著名地標(biāo)、景點(diǎn),準(zhǔn)確率高達(dá)94%以上。用戶只需要拍攝包含國(guó)內(nèi)外著名景點(diǎn)、地標(biāo)的照片,系統(tǒng)就能自動(dòng)生成足跡、圖文博客等有意思的交互內(nèi)容,提升用戶旅游體驗(yàn)。
同時(shí),開(kāi)放日現(xiàn)場(chǎng)還宣布,百度大腦即將上線邀測(cè)錢幣識(shí)別功能。該功能可以精準(zhǔn)識(shí)別中外錢幣,支持?jǐn)?shù)百類幣種、數(shù)千種面額,識(shí)別準(zhǔn)確率98%以上,不僅能夠提升金融機(jī)構(gòu)貨幣兌換的效率,也能讓“外幣騙局”無(wú)處藏身。
從紅酒到地標(biāo)再到錢幣,目前百度大腦的圖像識(shí)別種類已經(jīng)多達(dá)11種。
語(yǔ)言及知識(shí):能為你寫詩(shī),還能讀懂你的情緒
百度大腦語(yǔ)言及知識(shí)方向能力集,共包括語(yǔ)言處理應(yīng)用平臺(tái)、語(yǔ)言處理應(yīng)用技術(shù)、語(yǔ)言處理基礎(chǔ)技術(shù)、知識(shí)理解以及知識(shí)圖譜。而此次開(kāi)放日的更新亮點(diǎn)是,語(yǔ)言處理應(yīng)用技術(shù)、知識(shí)理解以及智能寫作平臺(tái)。
在語(yǔ)言處理應(yīng)用技術(shù)方面,推出新能力:1.文本糾錯(cuò),識(shí)別文本中有錯(cuò)誤的片段,進(jìn)行錯(cuò)誤提示并給出正確的建議文本內(nèi)容;2.新聞?wù)?,?duì)新聞內(nèi)容進(jìn)行全面的語(yǔ)義理解與分析,自動(dòng)抽取新聞文本中的關(guān)鍵信息并按指定長(zhǎng)度生成摘要,可應(yīng)用于熱點(diǎn)新聞聚合、新聞推薦、語(yǔ)音播報(bào)、APP消息Push等場(chǎng)景;3.智能寫詩(shī),用戶只需要輸入任意主題詞(如公司名、節(jié)氣名),機(jī)器便可自動(dòng)生成融合了該主題詞的詩(shī)詞;4.智能春聯(lián),用戶輸入任意主題詞(如自己的名字),機(jī)器可自動(dòng)生成融合了該主題詞的春聯(lián),可以應(yīng)用在企業(yè)互動(dòng)營(yíng)銷、APP春節(jié)互動(dòng)活動(dòng); 5.對(duì)話情緒識(shí)別,可以針對(duì)一段對(duì)話文本,自動(dòng)識(shí)別出當(dāng)前會(huì)話者所表現(xiàn)出的情緒類別;
在知識(shí)理解方面,則推新能力:1.作文檢索,有數(shù)萬(wàn)篇作文范文,可支持按文體、字?jǐn)?shù)、年級(jí)、常見(jiàn)主題等進(jìn)行查詢檢索,可應(yīng)用在少兒教育產(chǎn)品(如學(xué)習(xí)機(jī))、圖書館等場(chǎng)景;2.知識(shí)問(wèn)答,可提供娛樂(lè)、人物、教育、影視、綜藝、動(dòng)漫、小說(shuō)、文學(xué)作品等垂類的問(wèn)答能力,以及日期歷法、年齡差、算數(shù)、時(shí)間時(shí)區(qū)差等推理計(jì)算能力,可應(yīng)用于智能音箱、兒童故事機(jī)、泛娛樂(lè)產(chǎn)品等場(chǎng)景。
同時(shí),不久后,智能寫作平臺(tái)也將上線,將從素材上為創(chuàng)作者提供工具、幫助找到靈感,提升創(chuàng)作者的寫作效率和產(chǎn)出質(zhì)量,降低寫作成本。
在百度大腦首場(chǎng)開(kāi)放日,除了有以上多項(xiàng)核心的技術(shù)更新、能力升級(jí)、新品推出外,百度大腦在AI市場(chǎng)正式上架4款硬件產(chǎn)品,感興趣的開(kāi)發(fā)者都可以在 PC 端訪問(wèn)百度 AI 市場(chǎng)進(jìn)行選購(gòu)。同時(shí)推出百度大腦新品體驗(yàn)師計(jì)劃,希望可以在幫助開(kāi)發(fā)者成長(zhǎng)的同時(shí),推動(dòng)百度大腦的進(jìn)化。
其實(shí),百度大腦一直致力于構(gòu)建開(kāi)放的技術(shù)生態(tài),已成其多年技術(shù)積累和業(yè)務(wù)實(shí)踐的集大成者。截至目前,百度大腦已經(jīng)開(kāi)放了近160項(xiàng)AI能力,平臺(tái)上開(kāi)發(fā)者數(shù)量超過(guò)100萬(wàn),開(kāi)放能力覆蓋語(yǔ)音、視覺(jué)、自然語(yǔ)言處理、機(jī)器學(xué)習(xí)等全面AI技術(shù)。
此次開(kāi)放日活動(dòng),百度大腦誠(chéng)邀眾多開(kāi)發(fā)者、技術(shù)媒體、行業(yè)KOL共同參與,了解體驗(yàn)百度大腦AI技術(shù),共同探討AI在開(kāi)發(fā)、落地應(yīng)用過(guò)程中遇到的實(shí)際問(wèn)題,一起助力AI發(fā)展加速度。其實(shí),除了此次的開(kāi)放日活動(dòng)外,百度大腦還推出了“月度更新計(jì)劃”,每個(gè)月一次的產(chǎn)品與技術(shù)更新,旨在助力企業(yè)和個(gè)人開(kāi)發(fā)者智能前行,緊跟社會(huì)需求,這足以讓廣大企業(yè)和開(kāi)發(fā)者們對(duì)百度大腦充滿信心,對(duì)我國(guó)未來(lái)人工智能的發(fā)展充滿期待。
- 特斯拉Model Y新版預(yù)售,iPhone 18 Pro系列升級(jí),汽車界與科技界碰撞新火花
- 小鵬汽車何小鵬回應(yīng)特斯拉 Model Y 撞臉風(fēng)波:設(shè)計(jì)碰撞,靈感碰撞,究竟誰(shuí)更勝一籌?
- 日本車商2024年新車銷量下滑,本田跌至近10年最低位,中國(guó)市場(chǎng)面臨挑戰(zhàn)?
- 英偉達(dá)批評(píng)美政府AI芯片出口限制:限制不利己,全球轉(zhuǎn)向替代技術(shù)之風(fēng)
- 特斯拉煥新Model Y難敵華為問(wèn)界R7,智能科技誰(shuí)領(lǐng)風(fēng)騷?
- 開(kāi)源巨頭聯(lián)手打造Chromium聯(lián)盟,推動(dòng)Linux生態(tài)創(chuàng)新發(fā)展
- 曹德旺巨資辦校,福耀科技大學(xué)引領(lǐng)行業(yè)新風(fēng)向,培養(yǎng)未來(lái)之星
- 愛(ài)馳汽車陷股權(quán)凍結(jié)風(fēng)波,能否順利復(fù)工復(fù)產(chǎn)引關(guān)注
- 小鵬汽車CEO何小鵬:雷軍不僅直言不諱,還勸我多做營(yíng)銷,不失為良師益友
- 馬斯克大膽計(jì)劃:未來(lái)十年內(nèi)特斯拉機(jī)器人產(chǎn)能提升10倍,300億機(jī)器人將顛覆各行各業(yè)
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。