# 這費是法 投稿:看到前面這篇算法之國:中國人工智能的興起,寫了這篇原創(chuàng)
Receptive fields of single neurones in the cat's striate cortex
D. H. Hubel and T. N. Wiesel(59年的論文,應(yīng)該是公共領(lǐng)域了)
我們離真正的通用人工智能還非常非常遠(yuǎn),但是進(jìn)步的非常非??臁,F(xiàn)在兩個極端,談AI色變,要被skynet干掉了;AI是噱頭,沒用,過兩年就消停了。都不好,都源自不了解。所以原創(chuàng)一個簡單的介紹內(nèi)容。以及說一說如果真的想跳這個坑,怎么優(yōu)雅而高效的跳進(jìn)去。
現(xiàn)在所有的所謂AI都應(yīng)該被稱為機(jī)器學(xué)習(xí)或者數(shù)據(jù)驅(qū)動編程。真正這個領(lǐng)域里面的人極少會說自己是搞AI的,最多最多帶上學(xué)習(xí)兩個字,機(jī)器學(xué)習(xí),或者模式識別這樣的。最熱門的圖像識別領(lǐng)域其實是一個非常細(xì)分的專業(yè)領(lǐng)域,但是其中卷積神經(jīng)網(wǎng)絡(luò)的思想在一定的范圍內(nèi)可以被視為通用的機(jī)器學(xué)習(xí)技術(shù)。以貓圖為例,我們不再是通過結(jié)構(gòu)化的代碼去實現(xiàn)分辨圖中是否有貓,而是實現(xiàn)一個機(jī)器學(xué)習(xí)的范式,用數(shù)據(jù)來驅(qū)動代碼對貓圖進(jìn)行判斷。
這些工作需要大量的經(jīng)過標(biāo)注的數(shù)據(jù)集比如imageNet,通常的樣子是這張圖里有貓,這張圖里沒有貓,然后去訓(xùn)練對應(yīng)的學(xué)習(xí)結(jié)構(gòu)。當(dāng)然這樣的思想可以用在別的領(lǐng)域。但是需要注意的是,這里的關(guān)鍵在于完全信息。簡單的判斷就是,如果你是個人,給你這個數(shù)據(jù),你能不能判斷出來標(biāo)記。給你看有貓的圖,你能說,這里有貓。給你看沒有貓的圖,你能說,這里沒有貓。給你看“學(xué) 小組”,你能知道很可能是“學(xué)習(xí)小組”。另一個領(lǐng)域是非完全信息的領(lǐng)域,那就會面臨其他的很多問題,最近打撲克的那個也是很厲害的。
前面說的都是監(jiān)督學(xué)習(xí),你需要提供有標(biāo)記的數(shù)據(jù)集。那么未來的方向一定是非監(jiān)督學(xué)習(xí)。我們直接給圖,不再提供圖里面“有什么”這樣的標(biāo)記。目前來看,最厲害的微軟研究院的resNet可以在圖像識別方面做到超越人類的識別正確率,但是需要注意的是,這只是圖像識別這樣一個非常細(xì)分的領(lǐng)域。這有巨大的價值,簡單的例子,把貓換成CT片,標(biāo)記換成有惡性病變還是么有惡性病變,你就不用在拿著CT片子去找醫(yī)生看做診斷,訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)能夠以比任何醫(yī)生還要高的準(zhǔn)確率來作出診斷。
這個領(lǐng)域和神經(jīng)生物學(xué),認(rèn)知理論,語義處理等領(lǐng)域有非常多的交叉;而且實踐起來相對的簡單,能夠迅速的轉(zhuǎn)化為經(jīng)濟(jì)收益,所以大量的極其聰明的人加入其中。競爭極其激烈,以谷歌為例,最聰明的人,用著跑在自己開發(fā)的TPU(張量處理器)集群上TensorFlow構(gòu)建的百多層深的卷積網(wǎng)絡(luò)。任何嚴(yán)肅的想要加入這場競爭的人大概都需要想想在這些環(huán)境下自己客觀的定位是什么。
接下來講講怎么優(yōu)雅的跳這個大坑。首先這個領(lǐng)域太熱,所以一定要專業(yè),不要去吃二手糧,要直奔大牛。這個領(lǐng)域非常開放,大部分的論文和代碼都是開放的,耐心去看吧,看個半年,從開始到最前沿的東西也就看下來了。
按重要性排序的前提條件:
1、能科學(xué)的訪問某著名網(wǎng)絡(luò)公司。
2、英文聽讀沒有問題,可以聽專業(yè)課的程度。
3、線性代數(shù)很重要。
4、Git和Github要會用,至少知道怎么commit和怎么回滾。
5、C++至少明白1分(要記住大神也就明白8分)。
6、Python要用好。
7、Linux要會用。
8、StackOverflow要善用。
9、朝死了搜索,找領(lǐng)域大牛的論文囫圇完了順著參考文獻(xiàn)擼。
入門很重要:
1、Coursera上面吳恩達(dá)的課程可以作為非常好的入門
2、接下來是多倫多大學(xué)Hinton大神的神經(jīng)網(wǎng)絡(luò)課程可以作為下一道菜
3、斯坦福李飛飛的CS231n課程是非常好的圖像識別的課程
上面套路下來基本就在坑里面了,接下來你需要接著往下挖。這里需要問一個問題,為什么要接著往下挖?
數(shù)據(jù)!數(shù)據(jù)!數(shù)據(jù)!如果你的工作中接觸到大量的數(shù)據(jù),而且原有的處理方式可以有優(yōu)化空間,那你就使勁挖吧,將會帶來實實在在的收益。但是如果你純粹的想搭A(yù)I這班車,開頭已經(jīng)說過了,這班車不存在。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )