“‘維科杯’·OFweek 2020(第五屆)人工智能行業(yè)年度評選”活動由高科技行業(yè)門戶OFweek維科網(wǎng)主辦,OFweek人工智能網(wǎng)承辦,活動旨在表彰人工智能領(lǐng)域具有突出貢獻的優(yōu)秀產(chǎn)品、技術(shù)及企業(yè),鼓勵更多企業(yè)投入技術(shù)創(chuàng)新;同時為行業(yè)輸送更多創(chuàng)新產(chǎn)品、前沿技術(shù),一同暢享人工智能的未來。
2020人工智能行業(yè)年度評選“OFweek (5th.) AI Awards 2020”將于2020年9月21日-10月10日進入網(wǎng)絡(luò)投票階段,頒獎典禮將于10月28日在深圳舉辦。
目前,活動正處于火熱的報名評審階段,業(yè)內(nèi)企業(yè)積極響應(yīng)。北京聲智科技有限公司已正式參評“‘維科杯’·OFweek2020(第五屆)人工智能行業(yè)技術(shù)創(chuàng)新獎”。
聲智是全球自主遠場語音技術(shù)和多模態(tài)人工智能交互領(lǐng)域的開拓者,擁有聲學(xué)與振動、語音與語義、圖像與視頻等全棧核心算法,以及開源開放的SoundAI Azero (“壹元”)人工智能操作系統(tǒng),具有多模態(tài)感知、人機智能交互、內(nèi)容服務(wù)聚合、數(shù)據(jù)智能分析、IoT控制和即時通訊等能力,致力于連接有價值的設(shè)備、信息與服務(wù),讓機器具有自主分析決策能力。
聲智主要提供AI數(shù)字人紅外測溫系統(tǒng)、智慧電梯和安全監(jiān)管平臺、大屏智能語音指揮系統(tǒng)、智能會議轉(zhuǎn)寫與同傳系統(tǒng)、跟隨式智能擴聲機器人、AI外呼機器人、聲紋采集與識別系統(tǒng)、智能麥克風(fēng)、智能降噪耳機、智慧辦公/醫(yī)療屏、多形態(tài)虛擬數(shù)字人、物聯(lián)網(wǎng)中臺和數(shù)據(jù)服務(wù)、大數(shù)據(jù)分析和商業(yè)智能等產(chǎn)品和服務(wù),面向智慧家居、智慧園區(qū)、智慧酒店、智慧社區(qū)、智慧座艙等新應(yīng)用場景,提升行業(yè)的智慧化程度,釋放個性化體驗。聲智由中科院聲學(xué)所團隊創(chuàng)立,由峰瑞、洪泰、百度、毅達和中信建投資本等10余家知名機構(gòu)投資,擁有與中科院合建的聲與人工智能聯(lián)合實驗室,發(fā)起參與10余項國家行業(yè)標準,獲得100余項榮譽資質(zhì)與1000余項知識產(chǎn)權(quán),服務(wù)數(shù)百家知名客戶、聯(lián)接數(shù)千萬臺智能物聯(lián)網(wǎng)設(shè)備,致力于實現(xiàn)“讓機器更智能”的使命,達成“用科技改善生活”的愿景。
參評技術(shù):多模態(tài)人工智能交互系統(tǒng)SoundAI Azero
聲智自2016年成立始終專注于多模態(tài)人工智能交互系統(tǒng)的技術(shù)突破和應(yīng)用落地。目前,人工智能產(chǎn)業(yè)發(fā)展已經(jīng)上升到我國國家發(fā)展戰(zhàn)略。國務(wù)院印發(fā)的新一代人工智能發(fā)展規(guī)劃指出,到2020年我國人工智能總體技術(shù)和應(yīng)用與世界先進水平同步;到2025年人工智能基礎(chǔ)理論實現(xiàn)重大突破,部分技術(shù)與應(yīng)用達到世界領(lǐng)先水平;到2030年人工智能理論、技術(shù)與應(yīng)用總體達到世界領(lǐng)先水平,成為世界主要人工智能創(chuàng)新中心。同時國家“新基建”政策出臺,以人工智能、數(shù)據(jù)中心等為代表的信息基礎(chǔ)設(shè)施的基礎(chǔ)技術(shù)日趨成熟,新基建對應(yīng)用技術(shù)的需求也逐漸增強,將會進一步向深度應(yīng)用人工智能、5G、大數(shù)據(jù)等新一代信息技術(shù)支撐傳統(tǒng)設(shè)施轉(zhuǎn)型升級發(fā)展,進而形成智能家居、智能金融、智慧城市、智能交通等行業(yè)領(lǐng)域的融合基礎(chǔ)設(shè)施。自新冠疫情爆發(fā)以來,飛沫和接觸傳播的高傳染性,催生了對無接觸式智能人機交互的極大需求,目前主流的人工智能系統(tǒng)多采用單一的交互模式,如語音對話系統(tǒng)、圖像識別系統(tǒng),此類相對傳統(tǒng)的系統(tǒng)基本無法應(yīng)對復(fù)雜人機交互場景,比如紅外測溫場景、電梯外呼場景、智能電梯場景,類似這類場景通常需要融合視覺、聽覺、手勢等多種交互方式,提供多模態(tài)的智能交互,一個完備的多模態(tài)人工智能交互系統(tǒng)便至關(guān)重要。人工智能(AI)技術(shù)作為一種具有巨大社會和經(jīng)濟效益的革新性技術(shù),伴隨新型硬件產(chǎn)品所代表的新一代計算平臺不斷涌現(xiàn),作為人工智能產(chǎn)業(yè)鏈上不可或缺的關(guān)鍵一環(huán),多模態(tài)人工智能交互系統(tǒng)的核心技術(shù)突破與產(chǎn)業(yè)化,將改變我國一直以來存在“缺芯少魂(操作系統(tǒng))”的卡脖子現(xiàn)狀,并對于上游智能傳感、智能芯片、智能制造以及下游的內(nèi)容生產(chǎn)、智能服務(wù)等都具有技術(shù)迭代的需求和產(chǎn)業(yè)升級的拉動,有助于建立我國聲學(xué)和人工智能領(lǐng)域的產(chǎn)業(yè)化領(lǐng)先地位,成為新一代人工智能發(fā)展的重要推動力量。根據(jù)市場調(diào)研,聲學(xué)和人工智能的融合技術(shù)在消費電子、汽車行業(yè)、教育行業(yè)、金融行業(yè)、國防行業(yè)等累計過萬億市場,僅消費電子領(lǐng)域的智能音頻設(shè)備,國內(nèi)年市場規(guī)模就在3500億左右,市場規(guī)模和發(fā)展?jié)摿薮蟆?/p>
技術(shù)介紹:
SoundAI Azero是聲智面向個人、企業(yè)和第三方組織開放的融合多傳感感知、多模態(tài)交互和類腦知識計算的新一代人工智能操作系統(tǒng),致力于連接有價值的信息、服務(wù)與設(shè)備,讓智能服務(wù)隨處可享。Azero經(jīng)過了千億次人機交互真實場景的規(guī)模驗證,可為家居、辦公、車載、會議、可穿戴等20+場景和設(shè)備提供高效的人機交互和智能決策能力。Azero集成了信息查詢、內(nèi)容聚合、IOT控制、即時通訊等數(shù)百項常用技能與服務(wù),提供簡單易用的技能開發(fā)工具和Turnkey軟硬件解決方案,支持智能音箱、智能耳機、智能眼鏡、智能開關(guān)、智能屏、機器人、AI虛擬數(shù)字人、AI音視頻會議、AI語音助理等百余個場景實例,大幅降低AI技術(shù)的應(yīng)用門檻和開發(fā)難度,快速滿足各個行業(yè)的個性化定制需求,幫助各個行業(yè)持續(xù)提升整體效率和用戶體驗。
多模態(tài)人工智能交互系統(tǒng)SoundAI Azero,以遠場語音交互和遠場實時通話為技術(shù)內(nèi)核,以及包括信息查詢、設(shè)備控制、內(nèi)容推薦、資訊服務(wù)、股票資訊、理財推薦等服務(wù),具有精度高、速度快、兼容好、成本低的優(yōu)勢,在用戶大規(guī)模使用的真實場景下5米遠場語音和聲紋的平均識別率超過95%,全鏈條語音對話響應(yīng)速度小于1.3秒。該系統(tǒng)成果融合了聲學(xué)感知技術(shù)、語音交互技術(shù)與人工智能技術(shù),包括聲波配網(wǎng)、波束形成、聲源測向、噪聲抑制、混響消除、回聲消除、語音喚醒、端點檢測、語音識別、聲紋識別、自然語言處理、語義理解、語音合成、雙工通話、VoIP等技術(shù),以及根據(jù)真實場景識別深度優(yōu)化的機器學(xué)習(xí)模型,搭建覆蓋智能家居、智能汽車、智能會議、智能安防、智能金融、智能教育、智能醫(yī)療、智能法院、智能交通和機器人等行業(yè)領(lǐng)域在內(nèi)的遠場聲學(xué)感知系統(tǒng)與場景語音交互平臺。多傳感器融合陣列的AI融合交互系統(tǒng)核心突破在真實場景下因空間距離、背景噪音、其他人聲干擾、回聲、口音等問題導(dǎo)致的語音識別低、用戶體驗差、無法感知環(huán)境等問題。為用戶提供多種適應(yīng)應(yīng)用場景的多模態(tài)融合陣型方案,綜合利用可見光與紅外的人臉識別技術(shù),通過麥克風(fēng)陣列感知技術(shù)融合深度學(xué)習(xí)技術(shù)為用戶提供全鏈條的智能語音、機器視覺相融合的交互系統(tǒng),基于VoIP以及分布式處理技術(shù),實現(xiàn)一對一、一對多、多對多的實時同步音視頻交互通信,解決傳統(tǒng)應(yīng)用場景中存在操作不便或者繁重勞動等痛點問題,提供智能化的音視頻通信體驗。
該成果已成功在小米、百度、360、聯(lián)想、中國移動、阿里、騰訊、華為、中國移動、中國聯(lián)通、中央人民廣播電臺等多個爆款產(chǎn)品中成功落地,已得到量產(chǎn)驗證。
參選述說/理由:
多模態(tài)人工智能交互系統(tǒng)SoundAI Azero持續(xù)更新和迭代技術(shù),解決更復(fù)雜聲學(xué)場景下的遠場語音喚醒和識別、遠場聲紋識別、聲視頻融合交互、多人追蹤和識別等影響用戶體驗的關(guān)鍵問題,以及超遠場拾音與識別、局部場識別與重放等行業(yè)關(guān)鍵技術(shù),不斷融合聲學(xué)感知技術(shù)與人工智能技術(shù),深度完成垂直領(lǐng)域聲學(xué)技術(shù)的優(yōu)化與更新,打造以用戶為中心、數(shù)據(jù)為驅(qū)動、平臺為服務(wù)的完整人工智能交互技術(shù)鏈條。
目前,Azero系統(tǒng)已廣泛應(yīng)用于智能家居、智能汽車、智能安防、智能金融、智能教育、智能醫(yī)療和機器人等應(yīng)用場景,已幫助小米、百度、阿里、華為、騰訊、中國移動、中央人民廣播電臺、中國移動、中國聯(lián)通等眾多客戶戶實現(xiàn)智能語音產(chǎn)品的快速開發(fā)和量產(chǎn)上市,占據(jù)70%以上的中國語音市場份額。StrategyAnalytics和Canalys統(tǒng)計數(shù)據(jù)顯示,2018年,全球智能音箱銷量達到8620萬,其中,中國智能音箱,在阿里巴巴、百度、小米等巨頭的推動下,實際出貨量超過2000萬。其中,小米AI音箱、小愛音箱mini、小愛音箱HD、阿里巴巴天貓精靈魔盒、百度智能音箱,都搭載了聲智科技的遠場智能交互系統(tǒng)SoundAIAzero。
本屆“‘維科杯’·OFweek 2020(第五屆)人工智能行業(yè)年度評選”活動將于9月21日進入網(wǎng)絡(luò)投票階段,歡迎各位踴躍投票!
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )