高層速讀
關(guān)鍵信息:通過將兩種神經(jīng)網(wǎng)絡(luò)進行相互對立,Ian Goodfellow(伊恩·古德費羅)創(chuàng)造了一個強大的人工智能工具——生成式對抗網(wǎng)絡(luò)(GAN)。GAN在生成模型和判別模型的互相博弈學(xué)習(xí)產(chǎn)生好的輸出,能夠給予機器想象、創(chuàng)造的東西,具有一定的自主意識。
關(guān)鍵意義:GAN是人工智能中所謂“無監(jiān)督學(xué)習(xí)”的一大步,更能夠使機器更少地依賴人類來幫助它們了解這個世界。
| 關(guān)于生成式對抗網(wǎng)絡(luò)(Generative Adversarial Net)
近年來,深度學(xué)習(xí)技術(shù)被廣泛應(yīng)用于各類數(shù)據(jù)處理任務(wù)中,比如圖像、語音和文本。而生成式對抗網(wǎng)絡(luò)(GAN)是一種深度學(xué)習(xí)模型,也是無監(jiān)督學(xué)習(xí)最具前景的方法之一。GAN通過框架中(至少)兩個模塊:生成模型(Generative Model)和判別模型(Discriminative Model)的互相博弈學(xué)習(xí)產(chǎn)生好的輸出。
GAN深度學(xué)習(xí)模型:讓機器學(xué)會創(chuàng)造
2014的一天晚上, Goodfellow和他剛畢業(yè)的博士同學(xué)們一起喝酒慶祝,在蒙特利爾最受歡迎的酒吧Les 3 Brasseur,當時一些朋友想讓他幫忙做一個非常棘手的項目:一個可以自己制作照片的電腦程序。
當時研究人員已經(jīng)在使用神經(jīng)網(wǎng)絡(luò)作為對策,這種算法以人腦中的神經(jīng)元網(wǎng)絡(luò)作為生成模型,用以創(chuàng)造合理的新數(shù)據(jù)。但結(jié)果往往不是很好:計算機生成的臉往往很模糊,或者有錯誤,如缺少耳朵等。 Goodfellow的朋友們提出的改進是對構(gòu)成照片的元素進行復(fù)雜的統(tǒng)計分析,以幫助機器自行生成圖像。然而這將需要大量的數(shù)據(jù)和運算, Goodfellow告訴他們這根本行不通。
但是,當他在喝著啤酒思考這個問題時,他想到了一個主意:如果讓兩個神經(jīng)網(wǎng)絡(luò)互相對抗呢?他的朋友們對此持懷疑態(tài)度,但他決定試一試。Goodfellow在家中寫代碼一直到凌晨,然后測試了他做寫的軟件,第一次成功了。
▲Goodfellow
Goodfellow那晚發(fā)明的東西現(xiàn)在被稱為“GAN”,也叫“生成式對抗網(wǎng)絡(luò)”,可應(yīng)用在NPL(自然語言處理)等技術(shù)領(lǐng)域。這項技術(shù)在機器學(xué)習(xí)領(lǐng)域引發(fā)了巨大影響,其創(chuàng)作者也變成了人工智能領(lǐng)域的重要人物。
在過去的幾年里,人工智能研究人員利用一種叫做深度學(xué)習(xí)的技術(shù)取得了令人興奮的進展。例如提供一個有足夠圖像數(shù)據(jù)的深度學(xué)習(xí)系統(tǒng),它可以識別出即將過馬路的行人。深度學(xué)習(xí)技術(shù)使得自動駕駛汽車和為Alexa、Siri等虛擬助手提供動力的人機對話成為可能。
但是,盡管深度學(xué)習(xí)的人工智能可以學(xué)會識別事物,但他們并不擅長創(chuàng)造事物。而GAN的目標是給機器一些類似于想象、創(chuàng)造的東西。
讓機器進行創(chuàng)造不僅能使他們進行繪畫或作曲,更重要的是,這能使它們更少地依賴人類來幫助它們了解這個世界和其運作方式。今天,人工智能程序員經(jīng)常需要告訴機器所提供的訓(xùn)練數(shù)據(jù)是什么,比如在一百萬張圖片中,哪一張包含行人橫過馬路,哪些沒有。這不僅數(shù)據(jù)和人力成本高,而且限制了機器系統(tǒng)處理的能力,即使是輕微的偏離數(shù)據(jù)的訓(xùn)練。在未來,計算機將在不被告知的情況下更好地利用原始數(shù)據(jù)并計算出他們需要從中學(xué)習(xí)的東西。
▲微軟推出的“看圖作畫”機器人
這是人工智能中所謂“無監(jiān)督學(xué)習(xí)”的一大步。譬如,一輛自動駕駛汽車可以在不離開車庫的情況下自學(xué)到許多不同的道路條件;機器人可以預(yù)見它在繁忙的倉庫中可能遇到的障礙,而不需要帶著它去倉庫中體驗。
我們擁有想象和思考許多不同情景的能力是我們成為人類的原因之一。當未來的技術(shù)歷史學(xué)家回顧過去時,他們可能會認為GAN是朝著創(chuàng)造具有人類意識的機器邁出的一大步。Facebook首席人工智能科學(xué)家Yann LeCun稱GANs是“過去20年來深度學(xué)習(xí)中最酷的想法”。另一位人工智能名人、中國百度前首席科學(xué)家吳恩達(AndrewNg)也表示,GAN代表著“一項重大而根本性的進步”,這激發(fā)了越來越多的全球研究人員投入到深度學(xué)習(xí)研發(fā)之中。
生成式對抗網(wǎng)絡(luò)要“對抗”多種因素
Goodfellow現(xiàn)在是谷歌大腦團隊的一名科學(xué)家,該公司位于加州山景城的總部。當記者在那里遇見他時,他仍然對人工智能名人身份感到驚訝,稱這是“有點超現(xiàn)實”。同樣令人驚訝的是,他已經(jīng)發(fā)現(xiàn)了有人正在利用GAN達到不法目的,現(xiàn)在他的大部分時間都花在這方面。
GAN的特點在于兩個神經(jīng)網(wǎng)絡(luò)之間的對抗。第一個被稱為生成器,負責(zé)輸出盡可能逼真的素材,如照片或手寫稿。第二個被稱為鑒別器,它將這些圖像與原始數(shù)據(jù)集中的真實圖像進行比較,并試圖確定哪些是真實的,哪些是假的。在這些結(jié)果的基礎(chǔ)上,生成器再調(diào)整其參數(shù)以創(chuàng)建新的圖像。如此循環(huán),直到鑒別器不能再分辨出真假。
在去年一個公開的例子中,芯片公司英偉達的研究人員對GAN進行了培訓(xùn),通過研究真實的照片來生成虛擬名人的照片。雖然并不是所有的「假明星」都是完美的,但與其他需要數(shù)萬張訓(xùn)練圖像的機器學(xué)習(xí)方法相比,GAN可以精通幾百張圖像。
原始訓(xùn)練數(shù)據(jù)的質(zhì)量對訓(xùn)練效果也有很大的影響。在一個例子中,GAN開始制作帶有隨機字母的貓圖片。因為訓(xùn)練數(shù)據(jù)中包含了來自互聯(lián)網(wǎng)的貓模因(模因即在生物進化中與基因作用類似的事物),所以機器已經(jīng)告訴自己,字母是它作為一只貓的含義的一部分。
華盛頓大學(xué)的機器學(xué)習(xí)研究人員Pedro Domingos說道,GAN是個性情暴躁的AI。如果鑒別器太容易欺騙,生成器輸出將看上去不真實。而校準兩個對抗的神經(jīng)網(wǎng)絡(luò)可能很困難,這就解釋了為什么GAN有時會輸出奇怪的東西,比如有兩個頭的動物。
▲GAN輸出的假照片
然而,這些挑戰(zhàn)并沒有阻止研究人員。自從 Goodfellow和其他幾個人在2014發(fā)表了關(guān)于他發(fā)現(xiàn)的第一份研究報告以來,已經(jīng)有了數(shù)百篇與GAN有關(guān)的論文。這項技術(shù)的一位粉絲甚至創(chuàng)建了一個名為“GAN Zoo”的網(wǎng)頁,致力于跟蹤已經(jīng)開發(fā)出來的各種技術(shù)版本。
GAN深度學(xué)習(xí)模型最明顯的即時應(yīng)用是在涉及大量圖像的領(lǐng)域,如電子游戲和時尚領(lǐng)域。但展望未來, Goodfellow認為GAN將推動更大的進步。他說:“科學(xué)和工程領(lǐng)域有很多方面需要優(yōu)化,”他舉例說,比如需要更有效的藥物或必須提高電池的效率?!斑@將是下一波巨浪?!?/p>
在高能物理中,科學(xué)家們使用強大的計算機來模擬數(shù)百個微粒像瑞士核研究中心大型粒子對撞機這樣的機器中可能發(fā)生的相互作用。這些模擬速度慢,需要大量的計算力。耶魯大學(xué)和勞倫斯伯克利國家實驗室的研究人員開發(fā)了一種GAN,在對現(xiàn)有的模擬數(shù)據(jù)進行訓(xùn)練之后,GAN學(xué)會了準確地預(yù)測某一粒子的行為,并使其運行得更快。
醫(yī)學(xué)研究是深度學(xué)習(xí)另一個有前途的領(lǐng)域,隱私問題的存在意味著研究人員有時無法獲得足夠的真實病人數(shù)據(jù),比如分析藥物無效的數(shù)據(jù)。賓夕法尼亞大學(xué)的CaseyGreene說,GAN可以通過生成幾乎和真實記錄一樣好的假記錄來幫助解決這個問題。這些數(shù)據(jù)可以更廣泛地共享和研究,而真正的記錄則受到嚴格保護。
GAN之父:技術(shù)進步不能缺少負面因素
然而,技術(shù)有黑暗的一面。一臺用來制造「真實假貨」的機器,對于那些想要影響股票價格、選舉等假新聞的提供者來說,是一個完美的武器。況且,人工智能已經(jīng)被用來在色情片的身體上放別人臉的照片,以及在政客的嘴上放上文字。GAN雖沒有制造這個問題,但GAN的存在確實會讓問題更糟。
哈尼·法里德(Hany Farid)是達特茅斯學(xué)院(DartmouthCollege)的數(shù)字取證專業(yè)畢業(yè)生,目前他正在研究更有效的識別假視頻的方法,比如檢測吸入和呼氣引起的面部顏色的細微變化,這種方法是有效的,因為GAN發(fā)現(xiàn)這些變化很難精確模仿。但Hany Farid警告說,GAN會反過來適應(yīng),“我們從根本上說處于弱勢?!?/strong>
這種「貓捉老鼠」的游戲也將在網(wǎng)絡(luò)安全中發(fā)揮作用。研究人員已經(jīng)強調(diào)了“黑匣子”攻擊的風(fēng)險,在這種攻擊中,GAN被用來找出機器學(xué)習(xí)模型,因為許多安全程序都用這些模型來發(fā)現(xiàn)惡意軟件。但是,在預(yù)測了防御算法的工作原理之后,攻擊者可以避開它并插入流氓代碼。
現(xiàn)在, Goodfellow領(lǐng)導(dǎo)著谷歌的一個團隊,專注于讓機器學(xué)習(xí)更加安全。他警告說,人工智能社區(qū)必須吸取以往創(chuàng)新浪潮的教訓(xùn),在創(chuàng)新浪潮中,技術(shù)人員將安全和隱私視為事后考慮。當他們意識到風(fēng)險的時候,壞人已經(jīng)有了明顯的領(lǐng)先優(yōu)勢?!昂苊黠@,我們已經(jīng)開始了,”他說,“但希望我們能在安全方面取得重大進展,否則我們就會離我們的出發(fā)點越走越遠。”
盡管如此, Goodfellow認為將不存在一個純粹沒有任何欺騙的技術(shù)解決方案。相反,他認為,技術(shù)依賴于各種社會因素而進步。比如教孩子們批判性思維,讓他們參加演講和辯論課。他說:“在演講和辯論中,你會和另一個學(xué)生競爭,你在考慮如何編造有利于自己甚至是誤導(dǎo)的說法,或者如何編造出非常有說服力的正確說法?!?/p>
Goodfellow很可能是對的,但他的結(jié)論是,科技不能解決假新聞問題,雖然這不是人們想聽到的。
微信搜索【AI商業(yè)報道】,獲取最新行業(yè)資訊!
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準AI機器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費引熱議
- 消息稱塔塔集團將收購和碩印度iPhone代工廠60%股份 并接管日常運營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機器人合作
- 賽力斯觸及漲停,汽車整車股盤初強勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。