精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>
  • <span id="ixlwe"></span>

  • <abbr id="ixlwe"></abbr>

    華為云研發(fā)團隊論文入選國際頂會NAACL 2022

      4月7日,自然語言處理領域國際頂級學術會議NAACL 2022(The North American Chapter of the Association for Computational Linguistics)公布論文入選名單,由華為云語音語義創(chuàng)新Lab多名研究者撰寫的信息抽取論文《Delving Deep into Regularity: A Simple but Effective Method for Chinese Named Entity Recognition》被NAACL 2022 Findings接收,這代表著中文命名實體識別的最優(yōu)結果 (SOTA) 被進一步刷新,更準確有效的實體識別將推動下游自然語言處理任務的進一步發(fā)展。

      NAACL由國際計算語言學學會(ACL)主辦,與ACL、EMNLP并稱NLP領域的三大頂會,是人工智能的重要研究陣地。NAACL的錄用十分嚴格,根據往年評選結果,只有不到30%的論文被接收。

      作為自然語言處理中最經典、最基礎的任務,命名實體識別一直受到廣泛的關注與研究。近年來,中文命名實體識別任務上取得了明顯進展,很多新的方法和框架被陸續(xù)提出,但往往忽略了實體詞的內部組成。

      對于中文命名實體而言,很多類別的實體都具有很強的命名規(guī)律性。比如說,以“公司”或者“銀行”結尾的實體詞,通常屬于組織機構這一實體類別。因此,在《Delving Deep into Regularity: A Simple but Effective Method for Chinese Named Entity Recognition》中,華為云語音語義創(chuàng)新Lab的研究者提出用簡單有效、規(guī)律性引導的識別網絡來探究中文實體詞中的規(guī)律性。

    圖1 規(guī)律性引導的識別網絡

      如圖1,華為云研究者首先利用注意力機制顯著地提取每個文本段的規(guī)律性,進而將這種表征文本內部的規(guī)律性的特征和通過Biaffine Attention提取的文本段特征結合起來,進行后續(xù)的實體識別。為了避免由于過度關注實體內部規(guī)律性導致的實體邊界識別偏差,研究者們另外設計了一個與規(guī)則無關的模塊來幫助模型更準確地識別實體的邊界。

    圖2 中文數(shù)據集上的實驗結果

      華為云研究者提出的規(guī)律性引導的識別網絡,如圖2,在MSRA, Ontonotes4.0, 和Ontonotes5.0三個大規(guī)模中文實體識別數(shù)據集上都取得了SOTA的結果。同時,本文提出的方法不依賴于外部詞典信息,并且F1值超過了目前所有使用詞典信息的方法的結果。這充分說明通過研究實體詞的內部規(guī)律性,研究者們提出了一個非常有效的網絡結構。

      不止在信息抽取方面,華為云語音語義創(chuàng)新Lab秉承開放創(chuàng)新、勇于探索、持續(xù)突破關鍵技術的精神,面向行業(yè)客戶提供領先的語音語義AI能力,結合大量行業(yè)知識,推出知識計算等行業(yè)解決方案,打造業(yè)界一流的知識計算競爭力。截至目前,已在政務、金融、石油等多個行業(yè)進行了落地和實踐,幫助客戶實現(xiàn)AI落地與智能升級。

    (免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
    任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )