據(jù)說,20只麻雀吃了散落的大米,死了。
先,有人說,麻雀是吃了有毒大米,中毒死的。
后來,有人說:專家認(rèn)為麻雀可能是吃多了,撐死的。
再后來,有人又辟謠說:沒有人說過,麻雀是撐死的。
再再后來,有人又辟謠說,大米沒有毒。
再再再后來,有人又辟謠說,大米還沒有賣出去,賣出去的都追回來了。
再再再再后來,有人又辟謠說,還有一部分大米沒追回來,但大米確實沒檢測出有毒。
我們不再說后來了,因為這個故事還沒有完。而且,即便被人為的確定終結(jié),好事者也不會就此認(rèn)為事情完了。
這次的毒大米與死麻雀的事件,看似傳言繞來繞去,實際上卻是一次典型的大數(shù)據(jù)分析的實踐,從中可以看出,盲目的所謂大數(shù)據(jù)分析是多么的容易誤導(dǎo)公眾。
1、我們找到了所有的麻雀了嗎?
我們不知道誰在現(xiàn)場數(shù)數(shù)了,可以肯定當(dāng)時貪吃了大米的就是20只,如果是很多很多只,那些麻雀去哪里了,為何這些麻雀沒有死?
我們做大數(shù)據(jù)分析,往往號稱拿到了所有的數(shù)據(jù),但實際上僅僅是能夠拿到的那部分而已,也許恰恰是那些我們沒有能力拿到或者沒準(zhǔn)備卻拿到的部分,將大大影響我們最終的分析結(jié)論。當(dāng)年,美國總統(tǒng)大選,那么有名《文學(xué)文摘》拿到了240萬的讀者投票意向,最終卻預(yù)測失敗,相反,蓋洛普憑借5000個很小的樣本就預(yù)測成功,也是這個道理。
2、這20只麻雀就是那吃了大米的麻雀嗎?
麻雀是否吃了大米,應(yīng)該比較好檢驗,但是否正好是吃了這一堆大米,卻有點難度。當(dāng)然,如果是時間比較短,檢驗起來也應(yīng)該可以確認(rèn)。總之,我們要確認(rèn)大米與麻雀之間的相關(guān)性。
大數(shù)據(jù)分析首先要確認(rèn)事物之間的相關(guān)性,而且要密切相關(guān),一對一的直接相關(guān),如果我們僅僅是把毫不相關(guān)的或者可能有一點關(guān)聯(lián)的事物放到一起分析,最終的結(jié)論可能很無聊。比如,有人連續(xù)看到中央電視臺的《新聞聯(lián)播》結(jié)束的時候太陽就落山了,由此得出結(jié)論,太陽落山與新聞聯(lián)播結(jié)束相關(guān)。
3、麻雀之死是因為吃了大米導(dǎo)致的嗎?
麻雀死了,這是事實;麻雀死之前吃了大米,也是事實。那我們是否可以就說,麻雀之死與大米有關(guān)聯(lián)呢?也不能下結(jié)論。我們需要在麻雀的死亡與吃大米之間構(gòu)建確切的因果關(guān)系,也就是說,我們需要找到麻雀之死的死因,而且這個死因是大米之毒。
大數(shù)據(jù)分析非常關(guān)注相關(guān)性,甚至對因果關(guān)系不予理睬,但這種相關(guān)性卻往往需要因果關(guān)系的支撐。只要是關(guān)聯(lián)密切的直接相關(guān),一定會找到某種因果關(guān)系,或者排除某種因果關(guān)系。我們做大數(shù)據(jù)分析,不能僅僅就憑借簡單的相關(guān)來下結(jié)論,必須通過嚴(yán)謹(jǐn)?shù)囊蚬撟C,才能被嚴(yán)肅的使用。
4、麻雀之死是因為吃了毒大米導(dǎo)致的嗎?
嚴(yán)格來說,麻雀確實有可能是吃大米太多而“撐死”的,我們并不能完全排除這種可能性,所以,專家的話實際上說的在理。即便認(rèn)定麻雀之死是毒大米造成,還要分析這毒是如何來的,是大米生產(chǎn)過程中還是有人投毒?當(dāng)然,這就是公安部門的職責(zé)了。
我們只有發(fā)現(xiàn)了大米有毒,且大米之毒足以致死麻雀,而麻雀也確實是吃進了這些大米,這樣才可以下結(jié)論“大米毒死了麻雀”,可事實上輿論早已經(jīng)拋開了這些邏輯,自顧自的開始從中國的食品安全慣性來考慮。
大數(shù)據(jù)分析中可能發(fā)現(xiàn)很多關(guān)聯(lián),這些看似可貴的發(fā)現(xiàn)卻多數(shù)都可能是無用的,而且,有些可能是毫無意義的。我們需要對其進行深入的分析,特別是要建立起一系列的可證邏輯,由此才可能發(fā)現(xiàn)對于我們非常重要的線索,但是,我們卻往往不愿意采用“MECE”方法,不想把所有的可能性都考慮到,更愿意先入為主的自以為是,而這往往期間是誤判的主要來源。
【首發(fā)于百度百家,未經(jīng)許可謝絕轉(zhuǎn)載,溝通交流請 @馬繼華 或加公眾號“北國騎士”】
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準(zhǔn)AI機器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費引熱議
- 消息稱塔塔集團將收購和碩印度iPhone代工廠60%股份 并接管日常運營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機器人合作
- 賽力斯觸及漲停,汽車整車股盤初強勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。