近期,華為云EI醫(yī)療智能體(EIHealth)采用自研醫(yī)學領域AI模型和知識圖譜技術,從公開發(fā)表的新冠學術文獻中快速構建新冠AI科研知識圖譜,協助科研人員更快速、有效的開展抗疫科學研究和藥物研發(fā)。
2020年初爆發(fā)的新型冠狀病毒(SARS-CoV-2)是一種全新的病毒,由于科學家對它的致病機制和傳播機制并不了解,給疾病的防御和治療帶來了巨大的挑戰(zhàn)。隨著各國研究人員不斷的從臨床研究、實驗室中收集針對SARS-CoV-2的研究數據,短時間內大量的科研成果發(fā)表在科研期刊上。迄今為止,在主流的醫(yī)學預印本文獻庫中,新冠病毒相關的學術文獻已經達到了兩千多篇。
為了能夠更有效的幫助科研工作者在海量的新冠病毒相關文獻中總結、查詢、推理有效的知識,華為云使用ModelArtsPro知識圖譜套件,從公開發(fā)表的新冠學術文獻中,自動抽取相應實體和關系,并構建了首個包含藥物、疾病、病毒蛋白、人類蛋白等不同類型實體的新冠科研知識圖譜。
這項工作的一大難點,是如何實現高精度的領域命名實體識別和關系抽取,比如上圖中句子里提到的相關病毒蛋白(Virus Protein)、 人類蛋白(HumanProtein)、病毒(Virus)以及從上下文判別出的相互關系。研發(fā)團隊采用了華為諾亞方舟實驗室和華為云最新研究成果醫(yī)學領域知識監(jiān)督的預訓練語言模型:BERT-MK (BERT-based language model with Medical Knowledge) ,并融合了團隊在知識挖掘領域積累的多項深度語義表示和檢索技術。值得一提的是,在此前的科學文獻挖掘領域相關賽事上,華為云語音語義創(chuàng)新Lab已多次奪冠,包括DigSci 2019和WSDM Cup 2020
華為云同時提供了個性化的查詢可視化工具,可清晰直接地展現新冠科研知識圖譜內的知識點及其關聯,并且能夠快速溯源知識信息的來源,直接定位相關的文獻及知識所在段落。例如:查詢藥物Lopinavir,可發(fā)現Lopinavir對于SARS-CoV-2的Mpro以及HIV protease均有一定的效果。通過進一步探索,可發(fā)現Colistin和Nelfinavir對SARS-CoV-2的Mpro也有一定效果。通過查看具體關系,又可進一步獲取該關系來源的文獻及段落信息等,直接溯源原始信息。該圖譜可協助科研人員快速、高效地開展病毒機制研究、病毒蛋白相互作用等科學研究,協助藥物研發(fā)人員更加精確、有效地開展藥物靶點研究、疫苗開發(fā)等藥物研發(fā)工作。
在抗疫期間,華為云和浙江大學陳華鈞教授合作,已在OpenKG發(fā)布包括新冠病毒分類圖譜、抗病毒藥物圖譜等多種類型的新冠科研知識圖譜。同時,華為云EI醫(yī)療智能體(EIHealth)和醫(yī)療領域的科研工作者共同奮斗在一線,相繼推出了一系列的抗病毒基因組服務、醫(yī)療影像服務和抗病毒藥物篩選服務,全面、立體的助力全球科研人員的研發(fā)工作。
更多內容請訪問華為云EI醫(yī)療智能體(EIHealth)官網。
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )