精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>
  • <span id="ixlwe"></span>

  • <abbr id="ixlwe"></abbr>

    深度學習在生物學上有哪些應(yīng)用?(下)

    高層速讀

    關(guān)鍵信息

    1.生物學與人工智能相結(jié)合,可以預(yù)測和治療疾病,發(fā)現(xiàn)新藥物,為疾病尋找新治療方法,等等;

    2.這樣的研究也有一定挑戰(zhàn)性:對數(shù)據(jù)質(zhì)量和數(shù)量擁有嚴格標準、計算機缺乏判斷力、算法難以解釋清楚。

    上文回顧:生物學研究人員正在使用深度學習算法對細胞圖像進行分類、建立基因組聯(lián)系、推進藥物發(fā)現(xiàn)…從基因組學、成像到電子病歷均有深度學習的應(yīng)用。通過人工智能與生物學的有機結(jié)合,前者為生物數(shù)據(jù)的測量和分類提供了強有力的幫助,深度學習可以檢測到人類無法看到的數(shù)據(jù)特征,算法模型現(xiàn)可以較高精準度識別圖像標簽。

    詳情點擊查看:從細胞圖像到基因組,從影像到藥物發(fā)現(xiàn),還有人工智能做不了的?(上)

    深度學習在生物學上有哪些應(yīng)用?(下)

    挖掘大量的優(yōu)質(zhì)基因組數(shù)據(jù)

    說到深入學習,不是任何數(shù)據(jù)都能被使用。這種方法通常需要大量的、進行良好標注的數(shù)據(jù)集。成像數(shù)據(jù)能提供一種天然的契合,基因組數(shù)據(jù)也可以。

    一家使用這些數(shù)據(jù)的生物技術(shù)公司是舊金山的Verily Life Sciences(前谷歌生命科學公司)。Verily的研究人員開發(fā)了一種深入學習工具,它比傳統(tǒng)工具能更準確地識別一種常見的基因變異,稱為單核苷酸多態(tài)性。該軟件被稱為“DeepVariant”,它將基因組信息轉(zhuǎn)換成圖像一樣的表現(xiàn)形式,然后作為圖像進行分析(參見下文“Tools for deep diving”,深潛工具)。Verily公司深度學習型基因組研究主管Markde Pristo預(yù)計,DeepVariant對于研究主流之外的生物——那些在識別遺傳變異方面擁有低質(zhì)量參考基因組和高錯誤率的生物——將特別有用。他的同事Ryan Poplin在植物研究中使用DeepVariant,相比20%誤差率的傳統(tǒng)方法,這種新工具的誤差率減少了2%。

    TOOLS FOR DEEP DIVING(深潛工具)

    深度學習工具正在迅速發(fā)展,而實驗室將要利用專門的計算專業(yè)知識與協(xié)作。

    首先,帶一位有深度學習經(jīng)驗的同事出去吃午飯,問問這個策略是否有用,加州舊金山格拉德斯通研究所(Gladstone Institutes)的神經(jīng)學家Steve Finkbeiner建議道。對于一些數(shù)據(jù)集,如成像數(shù)據(jù),現(xiàn)成的程序可能是夠用的;對于更復雜的項目,你需要考慮一個合作者,他說,講習班和會議可以提供培訓機會。

    云計算資源的訪問意味著研究人員可能不需要一個現(xiàn)場計算機集群來使用深度學習——他們可以在其他地方運行計算。Google的 TensorFlow是一個用于構(gòu)建深入學習算法的開源平臺,它可以在軟件共享網(wǎng)站GitHub上找到,正如一個開源版本的DeepVariant一樣——一種精確識別遺傳變異的工具。

    谷歌加速科學(Google Accelerated Science)是谷歌研究部門的一個分支,總部位于加利福尼亞州山景城,與包括生物學家在內(nèi)的一系列科學家合作,其研究科學家之一Michelle Dimon介紹。Dimon說,項目需要一個引人注目的生物學問題,大量高質(zhì)量的標注數(shù)據(jù),以及將使公司機器學習專家能夠為該領(lǐng)域做出獨特計算貢獻的挑戰(zhàn)。

    那些想要跟上深度學習進展的人應(yīng)該看看“deep review”(深度復習),這是一個由費城賓夕法尼亞大學的計算生物學家Casey Greene領(lǐng)導的全面的、眾包式的評估。

    深度學習在生物學上有哪些應(yīng)用?(下)

    用深度學習預(yù)測疾病

    加拿大公司DeepGenology駐多倫多的首席執(zhí)行官BrendanFrey也專注于基因組數(shù)據(jù),但目標是預(yù)測和治療疾病。Frey的多倫多大學學術(shù)團隊開發(fā)了一些用基因組數(shù)據(jù)與從健康細胞轉(zhuǎn)錄的數(shù)據(jù)來訓練的算法。此算法在這些數(shù)據(jù)中建立了RNA加工的預(yù)測模型,如剪接、轉(zhuǎn)錄和多腺苷化。Frey說,當應(yīng)用于臨床數(shù)據(jù)時,這些算法能夠識別突變并將其標記為致病基因,盡管他們從未見過臨床數(shù)據(jù)。在Deep Genomics中,F(xiàn)rey的團隊正在使用同樣的工具來識別和定位軟件發(fā)現(xiàn)的疾病機理,開發(fā)出由短核酸序列衍生的治療方法。

    用深度學習發(fā)現(xiàn)藥物

    另一門具有大量數(shù)據(jù)集的學科是藥物發(fā)現(xiàn)。在這里,深入學習算法正在幫助解決分類排序上的挑戰(zhàn),通過篩選形狀和氫鍵結(jié)合等分子特征,以確定對這些潛在藥物進行排序的標準。例如,位于舊金山的一家生物技術(shù)公司Atomwise已經(jīng)開發(fā)出了將分子轉(zhuǎn)化為三維像素網(wǎng)格的算法,稱為Voxels。這種表達方式使公司能夠用原子級精確性來解釋蛋白質(zhì)和小分子的三維結(jié)構(gòu),并模擬碳原子的幾何形狀等特征。該公司首席執(zhí)行官AbrahamHeifets表示,這些特征隨后被轉(zhuǎn)化為數(shù)學向量,該算法可以用來預(yù)測哪些小分子可能與某一特定蛋白質(zhì)發(fā)生相互作用。他說:“我們所做的很多工作都是針對沒有已知結(jié)合劑的(蛋白質(zhì))目標?!?/p>

    Atomwise正在使用這一策略來推動其新的人工智能驅(qū)動的分子篩選程序,該項目掃描了一個擁有一千萬種化合物的庫,為學術(shù)研究人員提供了多達72個潛在小分子結(jié)合劑,以確定能與它們相互在作用的蛋白質(zhì)。

    深度學習在生物學上有哪些應(yīng)用?(下)

    用深度學習尋找治療方法

    深入學習工具還可以幫助研究人員對疾病進行分類,了解疾病亞群體,尋找新的治療方法,并給用這些治療方法給合適的患者進行臨床測試和治療。例如,Finkbeiner是Answer ALS財團的一個成員,該協(xié)會致力于將一系列數(shù)據(jù)——基因組學、轉(zhuǎn)錄學、表觀基因組學、蛋白質(zhì)組學、成像,甚至多能干細胞生物學——從1000名患有神經(jīng)退行性疾病的人中結(jié)合起來。他說:“這是我們首次擁有一個數(shù)據(jù)集,我們可以在這里應(yīng)用深度學習,看看深度學習是否能揭示一種關(guān)系,可以在細胞周圍的盤子里測量的東西和病人身上發(fā)生的事情之間的關(guān)系。”

    挑戰(zhàn)和警告

    1.對數(shù)據(jù)質(zhì)量和數(shù)量的嚴格標準

    研究人員警告說,深深度學習帶來了巨大的挑戰(zhàn)。就像任何計算生物學技術(shù)一樣,由算法產(chǎn)生的結(jié)果取決于輸入的數(shù)據(jù)。將模型與其訓練數(shù)據(jù)過度匹配也是一個令人關(guān)注的問題。此外,對于深度學習,數(shù)據(jù)數(shù)量和質(zhì)量的標準往往比一些實驗生物學家所預(yù)期的更嚴格

    深入學習算法需要非常大的數(shù)據(jù)集,這些數(shù)據(jù)集需要很好的標注,這樣這些算法就可以學會識別特征和對模式進行分類。更大、更清晰的數(shù)據(jù)集——數(shù)百萬個數(shù)據(jù)點代表著不同的實驗和生理條件——為研究人員提供了訓練算法的最大靈活性。Finkbeiner指出,在其工作中的算法訓練在大約15000例之后有了很大的改善。Carpenter說,這些高質(zhì)量的“真實”數(shù)據(jù)可能非常難以獲得。

    為了規(guī)避這一挑戰(zhàn),研究人員一直在研究如何用更少的數(shù)據(jù)進行更多訓練。Carpenter說,底層算法的進步使得神經(jīng)網(wǎng)絡(luò)能夠更有效地使用數(shù)據(jù),從而為一些應(yīng)用程序提供了對少數(shù)圖像的培訓??茖W家還可以利用轉(zhuǎn)移學習,即神經(jīng)網(wǎng)絡(luò)將從一種數(shù)據(jù)類型獲得的分類能力應(yīng)用到另一種數(shù)據(jù)類型的能力。例如,F(xiàn)inkbeiner的團隊開發(fā)了一種算法,它最初教授的算法是根據(jù)形態(tài)學的變化來預(yù)測細胞死亡。雖然研究人員訓練它來研究嚙齒動物細胞的圖像,但當它第一次接觸到人類細胞的圖像時,它的準確率達到了90%,隨著經(jīng)驗的積累,它的精確度提高到了99%。

    對于一些生物圖像識別工作,谷歌加速科學使用的算法最初是用從互聯(lián)網(wǎng)上挖掘的數(shù)億張消費者圖像進行訓練的。然后,研究人員改進了這種訓練,只使用了幾百張與他們想要研究的相似的生物圖像。

    深度學習在生物學上有哪些應(yīng)用?(下)

    2.計算機缺乏判斷力

    深入學習的另一個挑戰(zhàn)是計算機“不聰明、又懶惰”,谷歌加速科學的研究科學家Michelle Dimon指出,它們缺乏區(qū)分生物相關(guān)性差異和正常變異的判斷力。“這臺電腦在發(fā)現(xiàn)批量變異方面有驚人的出色表現(xiàn)?!彼f。因此,獲取將被輸入深入學習算法的數(shù)據(jù),通常意味著為實驗設(shè)計和控制應(yīng)用一個高標準。谷歌加速科學要求研究人員在細胞培養(yǎng)板上隨機設(shè)置控制裝置,以考慮諸如孵化器溫度等微妙的環(huán)境因素,并使用是一般生物學家可能使用的兩倍的控制量。

    Dimon說,這一風險突出了生物學家和計算機科學家共同努力、設(shè)計包含深度學習的實驗的重要性。對于谷歌最近的一個項目:Contour,這種精心設(shè)計變得更加重要。這是一種將細胞成像數(shù)據(jù)集中在一起的策略,它突出趨勢(比如劑量反應(yīng)),而不是將它們歸入特定類別(如活細胞或死細胞)。

    Greene警告說,盡管深度學習算法可以在沒有人類先入之見和過濾器的情況下對數(shù)據(jù)進行評估,但這并不意味著它們是無偏見的。訓練數(shù)據(jù)可能會被扭曲——例如,當只使用北歐人的基因組數(shù)據(jù)時,就會出現(xiàn)這種情況。對這些數(shù)據(jù)進行深入學習的算法將獲得嵌入性偏見,并將其反映在預(yù)測中,這反過來可能導致不平等的病人護理。如果人類幫助驗證這些預(yù)測,這就提供了對問題的潛在檢查。但是,如果僅靠電腦來做關(guān)鍵決定,這種擔憂會令人感到不安。Greene說:“把這些方法看作是增強人類力量的一種方式,比把這些方法看作是取代人類的方法要好?!?/p>

    深度學習在生物學上有哪些應(yīng)用?(下)

    3.算法難以解釋清楚

    還有一個挑戰(zhàn),就是如何準確地理解這些算法是如何構(gòu)建特征或特性的,而這些特性首先是用來分類數(shù)據(jù)的。位于馬里蘭州巴爾的摩Insilo Medicine的研究科學家Polina Mamoshina說,計算機科學家正在通過改變或調(diào)整模型中的個體特征來解決這個問題,然后研究這些調(diào)整如何改變預(yù)測的準確性。但是不同的神經(jīng)網(wǎng)絡(luò)在處理相同的問題時不會以同樣的方式來處理,Greene警告說,研究人員正越來越多地關(guān)注那些既準確又可以解釋的預(yù)測的算法,但就目前而言,這些系統(tǒng)仍然是黑匣子。

    Greene說:“我認為2018年能被解釋得很清楚的深度學習模式并不會出現(xiàn),盡管我很希望我錯了。”

    免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

    2018-03-06
    深度學習在生物學上有哪些應(yīng)用?(下)
    高層速讀關(guān)鍵信息:1 生物學與人工智能相結(jié)合,可以預(yù)測和治療疾病,發(fā)現(xiàn)新藥物,為疾病尋找新治療方法,等等;2 這樣的研究也有一定挑戰(zhàn)性。

    長按掃碼 閱讀全文