自然語言處理(NLP)是人工智能皇冠上的一顆明珠。
這樣的說法在人工智能領域流傳許久,現實中發(fā)生的卻是這樣一幕:計算機視覺、語音識別等領域紛紛跑出了多個獨角獸,沖刺IPO的消息也時常出現??勺鳛椤盎使谏系拿髦椤钡腘LP領域,卻難見獨角獸的影子,大多數創(chuàng)業(yè)者還停留在A輪或B輪融資。
NLP如何走出困局?
在NLP領域深耕十年,被稱作“中國NLP燈塔”的百度給出了切實的答案。8月25日舉行的百度大腦語言與知識技術峰會上,伴隨著一系列語言與知識產品的發(fā)布與升級,百度NLP的全景布局和鉆研了十幾年的核心技術一一亮相。
01 翻越認知智能的高山
把時間調回一個多月前的ACL 2020。
作為NLP領域最負盛名的國際頂會,ACL 2020收到了3429 篇論文投稿,其中被接收的779篇論文中有185 篇來自中國大陸,占比僅次于美國。距離2010年首次有中國科技企業(yè)的論文入選ACL,僅僅過去了10年時間。
除了論文數量的逐年增長,中國NLP學者的面孔也陸續(xù)在ACL上出現。
2013年,百度CTO王海峰成為ACL歷史上首位華人主席;2014 年,同樣來自百度的吳華出任 ACL 程序委員會主席;2015年,哈工大教育部語言語音重點實驗室主任李生教授獲得 ACL 終身成就獎;2016 年,百度的趙世奇當選 ACL 秘書長;2018年,ACL 宣布創(chuàng)建亞太區(qū)域分會,王海峰擔任創(chuàng)始主席;2020 年,百度組織了 ACL 大會上首場同聲傳譯研討會……
以百度為代表的中國力量在NLP的世界舞臺上不斷出彩,本身就是一種話語權的象征,而左右話語權的核心因素正是學術成就。
僅以百度為例,過去十年是百度NLP高速增長的十年,在NLP領域摘得了包括國家科技進步獎在內的20多個獎項,在30多項國際競賽中奪得冠軍,累計發(fā)表的學術論文超過300篇,專利申請高達2000多項。
其中最具代表性的無疑就是百度的語義理解技術與平臺文心(ERNIE)。
2019年12月,基于ERNIE 2.0改進的模型在權威榜單GLUE上首次突破90大關,超越人類基線3個點,獲得全球第一;3個月后的人工智能頂級會議AAAI 2020上,NLP預訓練領域入選論文《ERNIE 2.0: A Continual Pre-Training Framework for Language Understanding》被選為Oral展示;2020年的世界人工智能大會上,ERNIE有了中文名字“文心”,并一舉斬獲最高獎項SAIL獎(Super AI Leader,卓越人工智能引領者)。
學術上的一系列成就,意味著百度已經站在了NLP研究的最前沿,成為中國NLP領域的領軍者,并與谷歌、微軟一道被視為“全球AI三巨頭”。
可對于百度來說,技術的價值絕不只是在象牙塔中“高光”,在NLP的學術領域走進殿堂的同時,也在循序推進應用場景中的落地。
剛剛結束的百度大腦語言與知識技術峰會上,第一個重磅產品就是在NLP核心技術基礎上延展開發(fā)的文心ERNIE——語義理解技術與平臺,針對傳統(tǒng)NLP定制常見的成本高、耗時長、可迭代性差等短板,文心集成了優(yōu)秀的預訓練模型、全面的NLP算法集、端到端開發(fā)套件和平臺化服務,提供了一站式NLP開發(fā)與服務。
這或許就是百度給出的答案,想要推動NLP的產業(yè)應用,僅僅在學術上站在山巔還不夠,需要的是幫助整個行業(yè)翻越認知智能的高山,以低門檻、低成本、高效率的平臺優(yōu)勢加速NLP的落地。
正如百度CTO王海峰所言,百度“致力于更好的與學術界、產業(yè)界攜手,推動語言與知識技術發(fā)展,進而推動人工智能技術持續(xù)進步,為產業(yè)持續(xù)升級、社會經濟高質量發(fā)展貢獻力量?!?/p> 123下一頁>
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )