2017年12月,一個星期五的晚上,倫敦醫(yī)療應(yīng)用開發(fā)商Babylon Health的創(chuàng)始人Ali Parsa,與自家的醫(yī)生坐下來進(jìn)行了一次交流。這位出生于伊朗的前銀行家,依靠該公司的高評分應(yīng)用,為Babylon融資了8500萬美元。這款應(yīng)用可以讓英國患者快速與醫(yī)生進(jìn)行視頻會診。在英國,國營醫(yī)療保健為每個公民提供了高質(zhì)量的醫(yī)療服務(wù),但是卻要耗費很長時間等候門診。這款應(yīng)用的出現(xiàn)改變了這一局面。
現(xiàn)在,Parsa希望通過添加一款人工智能聊天機(jī)器人,來進(jìn)一步提高效率和降低成本。Parsa承諾,該聊天機(jī)器人可以在沒有人類互動的情況下,就常見疾病提供診斷建議。Babylon的應(yīng)用用戶將于12月享受到這款全新機(jī)器人的服務(wù)。在未來某個時候,英國國家健康服務(wù)機(jī)構(gòu)(NHS)的患者也將享受到相應(yīng)的服務(wù)。但問題是,根據(jù)這些醫(yī)生的交流,機(jī)器人給出的建議經(jīng)常是錯誤的。
據(jù)一名現(xiàn)任和前任工作人員稱,為了證明他們的觀點,醫(yī)生們花了大約一天時間,主動進(jìn)行了一次審計。據(jù)一位知情人士稱,他們發(fā)現(xiàn),聊天機(jī)器人給出的100個最常見的結(jié)果中,約有10%至15%的結(jié)果,錯過了更嚴(yán)重疾病的警告信號,或者完全就是錯誤的。這些臨床醫(yī)生周五直接向Parsa進(jìn)行了匯報,希望推遲新的發(fā)布。他們提出了自己的理由,經(jīng)過一番談判,他同意推遲發(fā)布。
但是醫(yī)生們?nèi)匀桓械嚼_。對現(xiàn)任和前任Babylon工作人員以及外部醫(yī)生的采訪顯示,他們普遍擔(dān)心該公司匆忙部署了未經(jīng)仔細(xì)審查的軟件,并夸大了其有效性。
根據(jù)一位外部醫(yī)生展示的電子郵件,2018年4月,一家英國廣告監(jiān)管機(jī)構(gòu)要求Babylon刪除其網(wǎng)站上的一項聲明,該聲明宣稱其分流功能能夠100%的給出安全建議。該機(jī)構(gòu)同時援引了一項關(guān)于這一聲明的“獨立研究”。但是根據(jù)Babylon自己在2016年發(fā)表的研究論文,這項研究來自一次內(nèi)部測試,在測試中,它雇傭了專業(yè)演員扮成病人,并按照劇本進(jìn)行流程。
在那次周五會議后的六個月,Parsa在倫敦皇家醫(yī)學(xué)院舉行了一場盛大的直播活動,宣布Babylon的新軟件——人工智能驅(qū)動的聊天機(jī)器人——已經(jīng)達(dá)到了“全球醫(yī)療第一”的水平。Babylon展示了機(jī)器人在醫(yī)學(xué)檢查中的得分高于人類醫(yī)生的平均得分,并聲稱人工智能已經(jīng)達(dá)到了人類醫(yī)生的“同等準(zhǔn)確度”。當(dāng)時,多家媒體報道了這一成就。
布朗大學(xué)生物醫(yī)藥信息學(xué)教授Hamish Fraser表示,這一聲明是有問題的。他在英國主要醫(yī)學(xué)雜志《柳葉刀》最近的一篇文章中反駁了Babylon的聲明。他指出,Babylon的軟件只回答了50個檢查問題中的15個,并被允許對每個問題給出三個答案?!爱?dāng)醫(yī)生做這個測試時,你會得到一個正確的答案,”他說。Babylon表示,它沒有試圖證明人工智能比醫(yī)生更好,Parsa也退出了這篇文章的預(yù)定采訪。
人工智能還沒有發(fā)展到可以替代(甚至可靠地協(xié)助)人類醫(yī)生的程度,這一點可能不足為奇。而傲慢的科技企業(yè)家對他們的產(chǎn)品進(jìn)行過高的宣傳,也并不是什么新現(xiàn)象。這一切都不太重要,但是Babylon與英國國家醫(yī)療服務(wù)機(jī)構(gòu)簽訂了兩份合同。英國國家醫(yī)療服務(wù)機(jī)構(gòu)是世界上最大的國有醫(yī)療系統(tǒng)之一。Babylon的GP At Hand應(yīng)用向3.5萬名NHS患者提供了視頻通話支持,并可以讓其訪問分流聊天機(jī)器人,以獲得是否就醫(yī)的建議。NHS還鼓勵200萬公民使用NHS 111: Online——一款由Babylon開發(fā)的應(yīng)用,主要用來代替NHS咨詢熱線。工作人員表示,NHS還沒有使用Babylon的診斷建議聊天機(jī)器人,但該公司已經(jīng)討論過將這一功能引入NHS應(yīng)用中。
NHS的動機(jī)很明確,也很簡單:它既想省錢,也想為病人帶來更好的健康結(jié)果。2020年,英國將在國家醫(yī)療系統(tǒng)上花費近2000億美元,相當(dāng)于GDP的7%。自1950年以來,這一占比已經(jīng)翻了一番,因此英國迫切需要找到一種方法來控制成本,同時仍能提供被視為英國社會契約核心的福利。
減少急診室就診似乎是很合邏輯的,因為每次就診平均花費NHS 200美元。在過去的一年里,NHS為此總共花費了40億美元,而由于至少有150萬英國人在不需要的時候也會去急診室,導(dǎo)致候診時間不斷增加。如果Babylon的聊天機(jī)器人效果很好,將會對節(jié)省成本有很大的幫助。
但是,人們質(zhì)疑該軟件的有效程度。Babylon的一名工作人員稱,早期和當(dāng)前版本的聊天機(jī)器人,在大約30%的情況下會建議用戶去急診室;相比之下,撥打國家健康咨詢熱線111的人大約只有20%。不清楚有多少病人接受了聊天機(jī)器人的建議,Babylon表示自己并沒有跟蹤這些數(shù)據(jù)。
即使在診斷建議聊天機(jī)器人最終被修復(fù),并于2018年1月發(fā)布給Babylon私人應(yīng)用用戶之后,一些Babylon醫(yī)生仍然對他們沒有看到開發(fā)過程中更嚴(yán)格的改革而感到擔(dān)憂。而在公司外部,發(fā)現(xiàn)的問題數(shù)量也越來越多。6月,一名正在Babylon應(yīng)用上測試新診斷聊天機(jī)器人的英國醫(yī)生發(fā)現(xiàn)了一個錯誤:它錯過了一個肺栓塞的癥狀。他在Twitter上發(fā)布了一段視頻,并向醫(yī)療監(jiān)管機(jī)構(gòu)MHRA進(jìn)行了投訴。根據(jù)該醫(yī)生分享的電子郵件和私人Twitter消息,這至少是他在過去一年半中第三次投訴聊天機(jī)器人軟件。據(jù)Babylon內(nèi)部消息來源稱,被MHRA記錄為事故的一些錯誤,直到2018年11月,仍然存在于內(nèi)置聊天機(jī)器人的健康應(yīng)用上。MHRA以保密為由不予置評。
Babylon表示,MHRA要求其調(diào)查這些投訴,但“隨后沒有基于安全相關(guān)的理由展開正式調(diào)查”。當(dāng)被問及MHRA記錄的錯誤時,Babylon堅持認(rèn)為“任何臨床概率分析都不可能總是正確的”,并且“即使非常有經(jīng)驗的醫(yī)生有時也會錯誤地診斷”。
而在這一切正在發(fā)生的過程中,Babylon成功地將自己推銷為醫(yī)療系統(tǒng)過度擴(kuò)張的數(shù)字藥膏。該公司最大的粉絲之一是英國衛(wèi)生部長Matt Hancock,他最近在一份由Babylon贊助的報紙副刊中宣稱,他“因使用這款GP at Hand應(yīng)用而出名”。
Babylon應(yīng)用的海報經(jīng)常出現(xiàn)在倫敦地鐵上。據(jù)Parsa稱,該公司正在預(yù)訂數(shù)千萬美元的收入,包括與NHS簽訂的GP at Hand合同(預(yù)計290萬美元)和NHS 111合作伙伴的收入。NHS England的發(fā)言人和Hancock沒有回應(yīng)置評請求。
一名前工作人員表示,Babylon軟件的最大缺陷之一是缺乏真實的臨床評估和跟蹤。使用聊天機(jī)器人的人真的去過急診室嗎?如果他們看了醫(yī)生,那診斷是什么?一名前員工表示:“目前還沒有找到能夠提供答案的系統(tǒng)?!盉abylon表示,其GP at Hand應(yīng)用在用戶使用聊天機(jī)器人24小時后會向他們發(fā)送信息。據(jù)一名用戶稱,應(yīng)用會詢問更多癥狀。
軟件是通過迭代開發(fā)的。開發(fā)人員構(gòu)建了一個應(yīng)用并將其發(fā)布,在不同的實時用戶群體上測試它,并在前進(jìn)的過程中不斷重復(fù)。這種硅谷心態(tài),曾經(jīng)被馬克·扎克伯格總結(jié)為“行動迅速,打破現(xiàn)狀”。但是開發(fā)新藥或醫(yī)療器械需要一種更慎重的方法,因為患者的生命是懸而未決的。Babylon尚未在同行評審的醫(yī)學(xué)雜志上發(fā)表任何研究成果,而這一過程往往也是需要時間的。
該公司的首席醫(yī)療官Mobasher Butt堅持認(rèn)為,在市場上部署之前,Babylon“經(jīng)歷了臨床醫(yī)生對產(chǎn)品許多許多輪的嚴(yán)格測試?!痹摴境姓J(rèn)它沒有進(jìn)行醫(yī)學(xué)研究,并稱未來進(jìn)行醫(yī)院研究時,它會在醫(yī)學(xué)雜志上進(jìn)行發(fā)表。
對Babylon人工智能的擔(dān)憂指出了醫(yī)療系統(tǒng)與科技初創(chuàng)公司合作時可能會出現(xiàn)的困難。雖然Babylon已經(jīng)將自己定位為一家醫(yī)療保健公司,但它的運營似乎更像硅谷的初創(chuàng)公司。一名工作人員說,“公司的重點是快速構(gòu)建并推出”,并補(bǔ)充說,Parsa喜歡和員工談?wù)摗疤右菟俣取?。短語“快速構(gòu)建”出現(xiàn)在至少一名Babylon工作人員的電子郵件簽名下。該公司內(nèi)部的醫(yī)生甚至在解決安全問題時也很難讓人們聽到他們的聲音,而現(xiàn)任和前任工作人員表示,數(shù)據(jù)科學(xué)家被視為搖滾明星,不過他們表示,過去12個月,情況已經(jīng)開始好轉(zhuǎn)。
Babylon稱這些斷言為“誹謗”,并指出定期審查的舉報政策和專用電子郵件地址是其“安全第一文化”的關(guān)鍵。它宣稱,員工“有義務(wù)將任何問題正式提交給當(dāng)局”。一名現(xiàn)任和前任員工表示,他們不知道有舉報電子郵件系統(tǒng)。
盡管一些醫(yī)生很謹(jǐn)慎,但Parsa還是因其堅韌不拔的精神和宏偉的愿景而受到倫敦科技界的推崇,認(rèn)為他將“把方便和負(fù)擔(dān)得起的醫(yī)療服務(wù)帶給地球上的每一個人”。對許多人來說,這是一種令人耳目一新的企業(yè)家精神,在謙遜的英國你并不總是能找到這種精神。Parsa的故事令人鼓舞,他出生在伊朗的Ali Parsadoust,父母是中產(chǎn)階級,17歲時為了逃避革命,作為難民來到英國。他自學(xué)英語,然后進(jìn)入了高中和倫敦最負(fù)盛名的大學(xué),在那里他發(fā)表了工程物理學(xué)博士論文,并積極參與到學(xué)生政治中。雖然他的職業(yè)生涯建立在投資銀行業(yè),但他的心始終關(guān)注著社會正義。
將他的社會烏托邦本能與商業(yè)結(jié)合起來并不總是奏效。2003年,Parsa通過共同創(chuàng)建一個名為Circle Health的“社會企業(yè)”,進(jìn)入了醫(yī)療保健領(lǐng)域。然后在2011年,Parsa通過獲得一份合同,成為第一家接管國有醫(yī)院的私營公司,而創(chuàng)造了歷史。這家醫(yī)院是位于劍橋郡的Hinchingbrooke Hospital。Circle做出了削減成本的崇高承諾,包括在10年交易中,可以為NHS節(jié)省超過4.95億美元。Parsa于2012年退出,當(dāng)時該公司仍處于債務(wù)之中。2015年,Circle保釋了這一合同。審計人員表示,他的出價“過于樂觀”。Parsa離開Circle一年后,創(chuàng)辦了Babylon,并最終再次與NHS簽訂了重要合同。
為了鞏固這種關(guān)系,并為擴(kuò)大到更多患者奠定技術(shù)基礎(chǔ),Parsa正在雇傭軟件工程師。它最近承諾投資1億美元進(jìn)一步開發(fā)他的人工智能。
但是,為醫(yī)療保健構(gòu)建人工智能可能需要進(jìn)一步反思Babylon技術(shù)的設(shè)計方式。簡而言之,它的診斷引擎是基于一套復(fù)雜的規(guī)則。這些規(guī)則由臨床醫(yī)生決定,并在電腦中輸入一系列癥狀的概率。隨著規(guī)則數(shù)量的增加,軟件做出決策的路徑變得更加復(fù)雜和難以改變。那么,你如何讓這樣的聊天機(jī)器人變得更聰明呢?一種方法是提高其語言能力。另一個是改進(jìn)支撐它的診斷引擎?!叭绻鸅abylon擁有醫(yī)療記錄,他們可能會更準(zhǔn)確,”Action.AI首席執(zhí)行官John Taylor表示。Action.AI是一家倫敦初創(chuàng)公司,幫助公司構(gòu)建聊天機(jī)器人。
為了更好地診斷,我們需要訓(xùn)練軟件深入了解反饋回路:在一個人描述自己的癥狀,然后去看醫(yī)生,接受x光檢查,并有可能接受進(jìn)一步治療后,會發(fā)生什么?Babylon表示,它可以訪問健康改善網(wǎng)絡(luò)研究數(shù)據(jù)庫,該數(shù)據(jù)庫包含不可識別的患者數(shù)字記錄,但目前尚未向監(jiān)管機(jī)構(gòu)請求訪問醫(yī)療記錄。
對于Babylon來說,要實現(xiàn)用更智能的技術(shù)提高醫(yī)療保健提供商效率的愿景,它可能需要在更多的患者記錄上訓(xùn)練算法。為此,它需要繼續(xù)贏得監(jiān)管者和醫(yī)學(xué)界的信任。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )