前不久,杭州蕭山一家初創(chuàng)企業(yè)在世界頂級機(jī)器閱讀領(lǐng)域比賽——SQuAD機(jī)器閱讀挑戰(zhàn)賽中,力壓谷歌、微軟、騰訊等世界科技巨頭,獲得實(shí)時(shí)第二名的好成績。
這場國際級比賽,向來是微軟、谷歌、Facebook、阿里巴巴等頂級科技公司的兵家必爭之地。而這個(gè)名叫“一知智科”人工智能的團(tuán)隊(duì),2017年7月才在蕭山成立,團(tuán)員都是30歲以下的年輕博士。
這場比賽究竟是什么?這支不到10人的隊(duì)伍,如何挑戰(zhàn)世界頂級科技公司百人乃至千人的科研團(tuán)隊(duì)?1月4日,記者走進(jìn)了位于蕭山開發(fā)區(qū)杭州灣信息港的杭州一知智能科技有限公司。
世界頂級科技公司的角斗場
一知智科參加的比賽叫SQuAD機(jī)器閱讀挑戰(zhàn)賽,是行業(yè)內(nèi)公認(rèn)的機(jī)器閱讀理解工程能力標(biāo)準(zhǔn)水平測試,被譽(yù)為機(jī)器語義理解領(lǐng)域賽事之首。
怎么比?“有點(diǎn)像做英文閱讀理解,參賽系統(tǒng)模型通過閱讀文章,回答若干給定的問題,通過回答準(zhǔn)確率來評定模型的先進(jìn)程度?!眻F(tuán)隊(duì)中的浙江大學(xué)博士江舟說。
挑戰(zhàn)賽并非固定時(shí)間舉辦,而是實(shí)時(shí)更新成績,隨時(shí)可提交參賽模型。谷歌、Facebook、微軟亞洲研究院、騰訊以及斯坦福大學(xué)、清華大學(xué)等知名企業(yè)、高校都是參賽者。
江舟告訴記者,人工智能產(chǎn)業(yè)近年來十分火爆,而語義理解目前處于技術(shù)積累階段,即將迎來爆發(fā)點(diǎn),任何一家頂級科技公司都想掌握主動(dòng)權(quán),贏得進(jìn)入市場的先機(jī),而SQuAD機(jī)器閱讀挑戰(zhàn)賽就是最佳角斗場。
挑戰(zhàn)賽中,一知智科始終走在世界第一梯隊(duì)。
從2017年5月起,一知智科多次提交參賽模型,獲得世界排行榜前三。
2017年12月24日公布的single model評測結(jié)果中,一知智科提交的“EAZI”系統(tǒng)模型,拿到78.003分,獲得第二名,而人類在SQuAD機(jī)器閱讀挑戰(zhàn)賽中的得分是82.304分。
一知智科預(yù)測,兩三個(gè)月內(nèi)各大公司提交的參賽模型就能超過人類得分。“可以預(yù)見,如果機(jī)器能夠準(zhǔn)確識(shí)別人類語言的意義,人工智能產(chǎn)業(yè)鏈條上,語義理解相關(guān)產(chǎn)品就會(huì)迎來爆發(fā)式增長?!苯壅f。
一知智科攻克的是什么?
當(dāng)你對著手機(jī)上Siri說“給某某打電話”時(shí),Siri可以準(zhǔn)確執(zhí)行。但你說“打電話給某某”時(shí),Siri可能會(huì)回應(yīng)“我不懂你在說什么”。
這就是人工智能目前在語義理解上遭遇的窘境——機(jī)器不能精準(zhǔn)識(shí)別人類語言的意思。
一知智科所攻克的,正是讓機(jī)器快速閱讀和理解文本的含義,將中文語義分析的準(zhǔn)確度提升到商業(yè)應(yīng)用級別。
江舟用通俗的語言還原了系統(tǒng)模型的運(yùn)行過程:通過海量數(shù)據(jù)庫,讓機(jī)器更加了解每個(gè)單詞的組成,接著機(jī)器發(fā)揮注意力和記憶網(wǎng)絡(luò)的交互作用,不斷強(qiáng)化學(xué)習(xí),提高答案命中率。
江舟給記者發(fā)送了他們最新開發(fā)的、可以寫詩的微信公眾號:發(fā)送關(guān)鍵詞,選擇藏頭詩、自由詩或雅韻詩,機(jī)器就會(huì)給出一首完全“原創(chuàng)”的古詩?!耙粋€(gè)人可能一輩子都讀不了6萬首詩,但機(jī)器一天就能讀完,然后通過強(qiáng)化學(xué)習(xí)并理解單個(gè)詞語的意思,組合出來的就是全新的古詩了?!?/p>
或先行一步走向市場
技術(shù),最終需要進(jìn)入市場服務(wù)生產(chǎn)生活。
一知智科已經(jīng)成為頂尖企業(yè)和投資方眼中的“香餑餑”——在知識(shí)庫構(gòu)建上,一知智科與阿里巴巴、網(wǎng)易有合作;在閱讀理解與語義檢索上,一知智科與騰訊、同花順、微軟有合作……隨著精度提高,他們的研究或?qū)⒆羁爝M(jìn)入市場。
進(jìn)入市場后,一知智科通過什么與人們的生活產(chǎn)生關(guān)系?
舉個(gè)簡單的例子,“如果你想知道姚明的身高,在搜索引擎輸入關(guān)鍵字后,搜索引擎會(huì)給出一系列網(wǎng)頁。但是具備語義理解的搜索引擎,將直接給出精準(zhǔn)答案,無需再從海量信息中自行辨別?!苯壅f。
一知智科認(rèn)為,當(dāng)機(jī)器的語義理解能力超過人類之后,會(huì)有很多產(chǎn)品推出?!皺C(jī)器要取代人類,而不是輔助人類,才能更受歡迎?!币恢强平榻B,他們的技術(shù),將應(yīng)用于更多場景:語音助手、智能客服、智能家居、智能導(dǎo)診……或許用不了多久,機(jī)器人時(shí)代就會(huì)來臨。
欣喜于一知智科成果的同時(shí),也驚奇于這樣一個(gè)年輕的企業(yè)成長于杭州蕭山。
江舟介紹,蕭山經(jīng)濟(jì)技術(shù)開發(fā)區(qū)管委會(huì)給出了保姆式的服務(wù),辦公場地、人才公寓在幾個(gè)小時(shí)之內(nèi)就搞定。反之,一知智科也提升著這座城市人工智能產(chǎn)業(yè)的競爭力。
未來3年,一知智科將為蕭山開發(fā)區(qū)引進(jìn)人工智能博士15名,全力儲(chǔ)備人工智能“智庫”,助力蕭山、杭州、讓浙江繼續(xù)走在人工智能產(chǎn)業(yè)第一梯隊(duì)。(浙江廣播網(wǎng)絡(luò)廣播電視臺(tái))
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )