精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>
  • <span id="ixlwe"></span>

  • <abbr id="ixlwe"></abbr>

    云知聲-中科院自動(dòng)化所語(yǔ)言與知識(shí)計(jì)算聯(lián)合實(shí)驗(yàn)室三篇論文被 ACL 2020收錄

    日前,自然語(yǔ)言處理領(lǐng)域國(guó)際頂級(jí)會(huì)議 ACL 2020 (Association for Computational Linguistics)論文接收結(jié)果公布。大會(huì)共收到 3429 篇投稿論文,投稿數(shù)量創(chuàng)下新高。作為計(jì)算語(yǔ)言學(xué)和自然語(yǔ)言處理領(lǐng)域最重要的頂級(jí)國(guó)際會(huì)議,ACL 錄取論文代表了自然語(yǔ)言處理領(lǐng)域在過(guò)去一年最新和最高的科技水平以及未來(lái)發(fā)展潮流。

    本屆大會(huì),云知聲-中科院自動(dòng)化所“語(yǔ)言與知識(shí)計(jì)算聯(lián)合實(shí)驗(yàn)室”共有3篇論文被收錄,分別在醫(yī)療對(duì)話(huà)的自動(dòng)信息抽取、國(guó)際疾病分類(lèi)(ICD)自動(dòng)編碼,以及 ICD 自動(dòng)編碼可解釋性等領(lǐng)域取得突破。這些最新的自然語(yǔ)言處理算法將為后續(xù)研究提供極具價(jià)值的經(jīng)驗(yàn)和方向,已在云知聲醫(yī)療業(yè)務(wù)率先應(yīng)用。

    一種面向醫(yī)學(xué)對(duì)話(huà)的醫(yī)學(xué)信息提取器

    MIE: A Medical Information Extractor towards Medical Dialogues

    如今,電子病歷已經(jīng)成為現(xiàn)代醫(yī)療的重要組成部分,但是目前書(shū)寫(xiě)電子病歷費(fèi)時(shí)費(fèi)力,已經(jīng)成為醫(yī)生的沉重負(fù)擔(dān)。如果能夠從醫(yī)療對(duì)話(huà)中自動(dòng)地抽取醫(yī)學(xué)信息,將極大緩解醫(yī)生書(shū)寫(xiě)病歷的壓力。

    本文提出一個(gè)面向醫(yī)患對(duì)話(huà)文本的信息抽取系統(tǒng),它可以從對(duì)話(huà)中抽取出癥狀、檢查、手術(shù)、一般信息及其相應(yīng)的狀態(tài)。這些抽取出的信息將有助于醫(yī)生書(shū)寫(xiě)病歷,或者更進(jìn)一步地應(yīng)用于病歷的自動(dòng)生成。研究團(tuán)隊(duì)收集并標(biāo)注了1120段在線(xiàn)問(wèn)診的醫(yī)患對(duì)話(huà)作為數(shù)據(jù)集,采用滑動(dòng)窗口形式進(jìn)行標(biāo)注,和序列標(biāo)注相比,減緩了標(biāo)注難度。在此基礎(chǔ)上,針對(duì)醫(yī)療問(wèn)診對(duì)話(huà)文本的特點(diǎn)和難點(diǎn),提出一種基于深度匹配的神經(jīng)網(wǎng)絡(luò)模型,能夠考慮到對(duì)話(huà)的多輪結(jié)構(gòu),利用注意力機(jī)制捕捉對(duì)話(huà)中不同輪次之間的交互信息,從而完善醫(yī)學(xué)信息的抽取。

    云知聲-中科院自動(dòng)化所語(yǔ)言與知識(shí)計(jì)算聯(lián)合實(shí)驗(yàn)室三篇論文被 ACL 2020收錄

    圖1:典型的醫(yī)學(xué)對(duì)話(huà)窗口和相應(yīng)的帶注釋的標(biāo)簽

    HyperCore:基于空間和共現(xiàn)圖表示的ICD自動(dòng)編碼

    HyperCore: Hyperbolic and Co-graph Representation for Automatic ICD

    Coding

    國(guó)際疾病分類(lèi)(International Classification of Dieases,ICD)是由世界衛(wèi)生組織發(fā)起的,針對(duì)各種疾病做出的國(guó)際通用的統(tǒng)一分類(lèi)方法,這種方法賦予每種疾病一個(gè)獨(dú)特的編碼。ICD 編碼的普及和應(yīng)用能夠極大促進(jìn)世界范圍內(nèi)疾病的信息共享和臨床研究,并對(duì)健康狀況研究、保險(xiǎn)索賠、發(fā)病率和死亡率統(tǒng)計(jì)產(chǎn)生積極的影響。

    長(zhǎng)期以來(lái),ICD 編碼一直由專(zhuān)業(yè)編碼員人工完成。人工編碼耗時(shí)費(fèi)力,而且非常容易出錯(cuò),同時(shí)不斷更新 ICD 代碼版本會(huì)導(dǎo)致代碼數(shù)量大幅度增加,對(duì)編碼人員的要求越來(lái)越高。數(shù)據(jù)顯示,在美國(guó)每年因?yàn)榫幋a錯(cuò)誤以及用于提升編碼質(zhì)量的相關(guān)成本超過(guò)250億美元。

    為了緩解人工編碼的問(wèn)題,一些工作開(kāi)始嘗試?yán)脵C(jī)器自動(dòng)完成 ICD 編碼任務(wù)。但是現(xiàn)有的方法獨(dú)立地預(yù)測(cè)每個(gè)編碼,而忽略了編碼的兩個(gè)重要特征——層級(jí)性和共現(xiàn)性。

    在本文中,研究團(tuán)隊(duì)提出了使用雙曲空間和共現(xiàn)圖卷積神經(jīng)網(wǎng)絡(luò)針對(duì)性地建模上述兩種性質(zhì)。具體來(lái)說(shuō),提出了一種雙曲線(xiàn)表示方法來(lái)利用編碼的層次結(jié)構(gòu)。此外,提出了一種共現(xiàn)圖卷積網(wǎng)絡(luò)來(lái)利用編碼的共現(xiàn)性。在國(guó)際公開(kāi)數(shù)據(jù)集上的實(shí)驗(yàn)取得了最好的效果。

    云知聲-中科院自動(dòng)化所語(yǔ)言與知識(shí)計(jì)算聯(lián)合實(shí)驗(yàn)室三篇論文被 ACL 2020收錄

    圖2:自動(dòng)ICD編碼任務(wù)的示例

    Clinical-Coder:面向中文臨床記錄ICD-10自動(dòng)編碼

    Clinical-Coder: Assigning Interpretable ICD-10 Codes to Chinese Clinical Notes

    國(guó)際疾病分類(lèi)(ICD)作為世衛(wèi)組織成員國(guó)在衛(wèi)生統(tǒng)計(jì)中共同采用的對(duì)疾病進(jìn)行編碼的標(biāo)準(zhǔn)分類(lèi)方法,是目前國(guó)際上通用的疾病分類(lèi)方法。目前廣泛使用的國(guó)際疾病分類(lèi)第十次修訂版(簡(jiǎn)稱(chēng) ICD-10)的編碼數(shù)量達(dá)到了72,184個(gè),是以前版本(ICD-9)的五倍多。

    為了緩解人工編碼耗時(shí)、費(fèi)力、容易出錯(cuò)的問(wèn)題,很多工作開(kāi)始研究利用機(jī)器進(jìn)行自動(dòng)的 ICD 編碼。這些方法雖然取得了很大的成功,但仍然面臨著預(yù)測(cè)結(jié)果可解釋性問(wèn)題的嚴(yán)峻挑戰(zhàn),可解釋的結(jié)果對(duì)臨床醫(yī)學(xué)決策具有重要意義。

    針對(duì)此問(wèn)題,并結(jié)合中文的語(yǔ)言特點(diǎn),研究團(tuán)隊(duì)提出了一種基于空洞卷積和N-gram語(yǔ)言模型的ICD自動(dòng)編碼方法,利用空洞卷積捕獲非嚴(yán)格匹配的語(yǔ)義片段證據(jù),利用 N-gram 捕獲嚴(yán)格匹配的語(yǔ)義片段證據(jù),進(jìn)而二者聯(lián)合使用,共同提升預(yù)測(cè)結(jié)果的可解釋性。實(shí)驗(yàn)結(jié)果顯示,該方法不僅能在中文數(shù)據(jù)集上取得顯著的效果,在國(guó)際公開(kāi)的英文數(shù)據(jù)集上也有不錯(cuò)的效果。

    云知聲-中科院自動(dòng)化所語(yǔ)言與知識(shí)計(jì)算聯(lián)合實(shí)驗(yàn)室三篇論文被 ACL 2020收錄

    圖3:兩種語(yǔ)義片段證據(jù)類(lèi)型-非嚴(yán)格匹配和嚴(yán)格匹配

    值得一提的是,在醫(yī)療領(lǐng)域,云知聲-中科院自動(dòng)化所語(yǔ)言與知識(shí)計(jì)算聯(lián)合實(shí)驗(yàn)室基于自然語(yǔ)言處理技術(shù)構(gòu)建的醫(yī)療知識(shí)圖譜已儲(chǔ)備約 50萬(wàn)醫(yī)學(xué)概念,超過(guò) 169 萬(wàn)醫(yī)學(xué)術(shù)語(yǔ)庫(kù)和 398 萬(wàn)醫(yī)學(xué)關(guān)系庫(kù),涵蓋了絕大部分藥品、疾病、科室與檢查,規(guī)模達(dá)國(guó)際領(lǐng)先水準(zhǔn),并在語(yǔ)音病歷,病歷生成、病歷質(zhì)控、輔助診斷系統(tǒng)等具體應(yīng)用中發(fā)揮了重要支撐作用。

    關(guān)于 ACL :ACL 是自然語(yǔ)言處理領(lǐng)域頂級(jí)國(guó)際學(xué)術(shù)會(huì)議,由計(jì)算語(yǔ)言學(xué)學(xué)會(huì)(Association for Computational Linguistics)主辦,每年舉辦一次。其接收的論文覆蓋了語(yǔ)言模型、句法分析、語(yǔ)義分析、篇章分析等計(jì)算語(yǔ)言學(xué)基礎(chǔ)研究以及信息抽取、問(wèn)答系統(tǒng)、對(duì)話(huà)生成、機(jī)器翻譯、自動(dòng)文摘、情感分析、社會(huì)計(jì)算等自然語(yǔ)言處理應(yīng)用研究等眾多方向。第 58 屆 ACL 年會(huì) ACL 2020 原定于 7 月 5 日-10 日在美國(guó)華盛頓西雅圖舉行,因疫情影響今年將改為在線(xiàn)會(huì)議。

    (免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
    任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )