7月26日,由中國人工智能學(xué)會主辦、新浪新聞聯(lián)合浙江大學(xué)承辦的2020全球人工智能技術(shù)大會(2020GAITC)“AI時代下的新媒體與社交娛樂”專題論壇拉開帷幕,新浪集團首席信息官、新浪AI媒體研究院院長王巍,浙江大學(xué)特聘教授、悉尼科技大學(xué)教授、百度研究院訪問教授楊易共同擔(dān)任論壇主席。
喬治亞理工大學(xué)互動計算學(xué)院副院長、教授、ACM Fellow Amy Bruckman在本次專題論壇上,與來自業(yè)界、學(xué)術(shù)界的嘉賓們分享了《我們應(yīng)該相信維基百科嗎?——社會認(rèn)知論如何讓我們成為更好的互聯(lián)網(wǎng)研究員和數(shù)據(jù)科學(xué)家》。
喬治亞理工大學(xué)互動計算學(xué)院副院長、教授、ACM Fellow Amy Bruckman
Amy Bruckman認(rèn)為,“知識”由社會共識搭建。“真相”的搭建是一個社會過程。社會計算研究者可以對“真相”和“知識”的本質(zhì)進行更多的研究。如果我們對這些社會行為越多了解,就越可能搭建一個更好的互聯(lián)網(wǎng)。
以下為Amy Bruckman演講實錄,內(nèi)容經(jīng)編輯略有刪減:
大家好,我是Amy Bruckman,來自喬治亞理工大學(xué)。今天,我很高興在今年的全球人工智能技術(shù)大會上與大家見面。我今天演講的主題是《我們應(yīng)該相信維基百科嗎?——社會認(rèn)知論如何讓我們成為更好的互聯(lián)網(wǎng)研究員和數(shù)據(jù)科學(xué)家》。
人類活動是否改變了氣候?你是怎么知道這個答案的?
幾年前,我在辦公室大樓附近試著跟路過的人交流,向他們詢問這個問題。我得到的答案各種各樣。有人說,讀過相關(guān)的研究報道;還有人說,是在新聞上看到的;其他人告訴我說,小學(xué)六年級的時候老師就教過這些。
有趣的是,有一個人,我跟她聊了之后,向我講述了她對氣候變化的直接感觸。她說,有一次她去阿拉斯加度假。巴士將他們帶到車站,讓游客去看冰川。導(dǎo)游告訴他們,如今從車站出發(fā)去看冰川還需要走兩小時。而以前下車就可以看到冰川。
我們所有人,都沒有時間成為一個氣候科學(xué)家,進而決定我們怎么看待全球氣候變化。我們只是依賴我們所信任的信息來源。我們也沒有時間成為流行病學(xué)家。但是當(dāng)我們在決定是否要為孩子接種疫苗時,我們依舊會依賴我們所信任的信息來源。
那么,知道某件事意味著什么呢?
作為互聯(lián)網(wǎng)研究員,我們跟知識打交道。但,什么是知識?
今天,我想跟大家從哲學(xué)角度聊聊這個問題,希望我的內(nèi)容能給大家?guī)韼椭瑤椭銈兏玫靥幚泶髷?shù)據(jù),更好地了解計算機科學(xué)家的工作。
我們對知識有一個正式的定義,即知識是“確證的真信念”。什么是“確證的真信念”?比如,在美國有一檔電視游戲節(jié)目,參與者可以贏取大獎。節(jié)目里,他們準(zhǔn)備了三塊簾幕,其中一塊簾幕后藏著一部新車。其他兩塊簾幕后可能藏著一年的洗衣液或一只燒雞之類的。如果你說,我猜新車在三號簾幕背后。如果你只是憑直覺猜測的話,那這就不算是“確證的真信念”。但是,如果有人告訴你,選擇三號簾幕,車就在三號簾幕背后,然后你也相信這個后臺工作人員的話,那么這時候這就可以算作“確證的真信念”。
對于擁有知識這件事,首先知識應(yīng)該是真實的,其次你也有理由相信這個知識。接下來問題又出現(xiàn)了:什么是真相?
我們對世界的認(rèn)識基于我們對世界的感知。世界的一切表象都是近似的。當(dāng)我還在本科讀物理專業(yè)的時候,作為大一新生,他們教給我們正在研究的現(xiàn)象的近似模型。因為我們是新手物理學(xué)家。等我們長大一些后,他們會教我們一些真實的現(xiàn)象。很快我就發(fā)現(xiàn),所有表象都是近似的。即便是一個成熟的物理學(xué)家,你也會發(fā)現(xiàn)其實沒有真實的答案或真實的模型可以研究。我們對現(xiàn)實中的現(xiàn)象做心理表征,我們對現(xiàn)實中的現(xiàn)象做物理表征,我們用我們的感官去感知事物,然后做出表征,這些都是近似的。事實上,我們的世界只有一種完美的模型,就是世界本身。我非常喜歡博爾赫斯(Borges)的短篇小說。他畫過一幅非常詳盡的地圖,儼然一個真實的地區(qū)。某一地區(qū)的唯一完美地圖就是該地區(qū)本身。
那是一張椅子嗎?你看到那有一張椅子嗎?看到椅子的照片了嗎?我看到一張椅子的照片。這對于真實意味著什么?那有一張椅子,真實嗎?我們對客觀現(xiàn)實是否存在,有不同的理解方式。
純粹主觀主義認(rèn)為,我們受制于主觀感知。也就是說,我覺得我看到了一張椅子,但我無法向你證明我看到一張椅子。我們永遠不會知道答案。也許,我們都陷入了黑客帝國電影情節(jié)的循環(huán)往復(fù)中。也許,有人知道什么是真實的,什么不是真實的。我們都囿于自己的主觀感知。因而也不存在客觀現(xiàn)實。反之,客觀主義認(rèn)為,世界是存在的,跟我們的感知是主觀的這一事實無關(guān)。真相是存在的,感知真相也是沒有問題的。
若這兩種方法都有些極端的話,那么好在我們還有折衷方案。哲學(xué)家希拉里?普特南(Hilary Putnam)提出了介于兩個極端之間的內(nèi)在實在論(internal realism)。內(nèi)在實在論認(rèn)為,我受限于我的主觀感知;你受限于你的主觀感知。但是我們?yōu)槭裁床荒芤恢峦?,確實有一張椅子的照片就在那里呢?因為椅子的確存在。所以,雖然我們都受限于我們各自的主觀感知,但由于世界的存在,我們主觀感知之間便有了不太可能產(chǎn)生的相關(guān)性。現(xiàn)實真實存在。
那么,什么是真相?
有三種理解方式?;A(chǔ)論認(rèn)為,所有信念都可以從一組確證的基礎(chǔ)信念中衍生得出。也就是說,如果我相信某件事,那么我肯定有理由來解釋我為什么相信這件事,再往下分析即我肯定有理由來解釋我為什么相信那些用來解釋我為什么相信這件事的事情,如此不斷剖析下去,一直到建立這一系列信任的基礎(chǔ)事實。而這些基礎(chǔ)事實源于我們的感官感知。這個方式雖然嚴(yán)謹(jǐn),但在現(xiàn)實中這么刨根究底地證明下去顯然非常不切實際。
于是,融貫論認(rèn)為,我們不必讓所有事實都立足于基本事實,只需讓你的世界觀內(nèi)部融貫即可。融貫論的問題在于某些錯誤的世界觀似乎也可以融貫起來。比如,登月偽造論也可以具有相關(guān)性。所以,融貫論對我們沒有實際幫助。
隨后又來到另一個極端。懷疑論認(rèn)為,確證的基礎(chǔ)信念并不存在,一切都是不可確證的。
好在,我們在這里也有一個合理且適度的折衷辦法可以讓我們擺脫困境?;A(chǔ)論和懷疑論都不盡如人意。兩者的中間即溫和基礎(chǔ)論。溫和基礎(chǔ)論認(rèn)為,基礎(chǔ)信念是自發(fā)形成的。關(guān)于外部世界的信念,包括關(guān)于經(jīng)驗和感官品質(zhì)的信念等等,都是合理而基礎(chǔ)的。如果自發(fā)形成的信念是對經(jīng)驗的正確反應(yīng),那么自發(fā)形成的信念就是合理的。非基礎(chǔ)信念可以從一組基礎(chǔ)信念中推斷得出。所以,這是在更極端的主觀主義與客觀主義之間對認(rèn)識理由的一種很好的折衷。
現(xiàn)在讓我們來回顧一下。我們知道,我們每一個人囿于自己的主觀感知,現(xiàn)實是存在的。以及,若信念是對經(jīng)驗的正確反應(yīng),則信念是確證的且不會被其他信念挑戰(zhàn)。但是,不同的人如何對一個事實達成同意呢?知識的社會建構(gòu)論認(rèn)為,我們決定什么是真實的方式,本質(zhì)上取決于社會。拉圖(Latour)和伍爾加(Woolgar)共同撰寫的著作談到了科學(xué)事實的建構(gòu)。
這里我們用密立根(Millikan)和福萊柴爾(Fletcher)的電子電荷實驗為例。當(dāng)你第一次提到油滴實驗時,可能有人會說密立根和福萊柴爾稱電子帶單一電荷。當(dāng)越來越多人知道這件事后,你可能就會說電子電荷是單一的。隨著更多人知道這件事,你可能覺得都沒有必要再提起這個證明。我們知道電子電荷就是e。
某件事變?yōu)槭聦嵉倪^程,其實就是越來越多人接受這件事的過程。相信的人越多,真實性越高。這就是知識的社會建構(gòu)論。但是,如果大家都錯了呢?(諺語云“三人成虎”。)
毫無疑問,我們都會犯錯。但是在任何給定的時間,我們都同意的事實是我們?nèi)チ私庹嫦嗨茏龅淖畲笈?。我們也會不斷糾正已知的事實,根據(jù)經(jīng)驗合理調(diào)整信念。所以,知識是社會構(gòu)建的。越是經(jīng)過仔細審核的事實,越經(jīng)得起考驗,可信度就越高。知識和科學(xué)的社會構(gòu)建的一個機制就是同行評議。同行評議是這樣的:你提交一份科學(xué)論文給同行評議,有三位同行會閱讀你的論文。這三個閱讀論文的人,分別是他們審閱內(nèi)容領(lǐng)域的專家。如果他們審閱的那部分內(nèi)容不在他們的專業(yè)領(lǐng)域內(nèi),他們就會不斷學(xué)習(xí)。
如果科學(xué)論文草稿引用了他們從未親自閱讀過的參考文獻,那么他們會確保在撰寫評論之前自己已經(jīng)閱讀且熟悉這些引用的內(nèi)容。理論上是這樣,但實際情況可能并非如此。
也許不是每個人在審閱論文的時候都會這么做。我們也不必理想化同行評議的過程。想象一下實際的情況:人們拿到一份需要評議的論文,然后根據(jù)自己的知識和能力,盡力審閱手頭的論文。這個過程有利也有弊。而且,多個領(lǐng)域的學(xué)科交叉趨勢也給同行評議帶來諸多困難,因為找到在內(nèi)容涉及的各個方面都真正具有背景的評審員也越來越困難。
以上都是背景介紹?,F(xiàn)在,我想回到我一開始提出的問題:你應(yīng)該相信維基百科嗎?我知道維基百科在中國的使用率不高,但我希望各位有機會可以去了解一下。
維基百科很棒。它的神奇之處在于,它是一個人人都可編輯的百科全書,具有高質(zhì)量的內(nèi)容。我想跟大家說的是,維基百科上的內(nèi)容是怎么審核的。
我給大家舉個例子。某個在一夜之間成名之人的維基百科頁面的編輯歷史,是個極好的例子。比如,新教皇的任命或者某人被任命為美國最高法院法官等等。我在這里要舉的一個例子是美國最高法院大法官約翰?羅伯茨(John Roberts)。
羅伯茨的維基頁面創(chuàng)建于2005年5月。當(dāng)時,他的維基頁面上內(nèi)容寥寥無幾,只介紹了他是一名法官,在哪里上過學(xué),被誰任命過等信息。在接下來的幾個月里,他的維基頁面一共才被編輯過9次。但是,在他被提名為最高法院大法官那天,頁面一共被編輯過31次。到7月底,一共有359人對該維基頁面進行了1200次編輯。其中174人是登錄用戶,其余為匿名用戶。當(dāng)前版本的內(nèi)容超過7000個單詞。內(nèi)容的豐富程度令人嘆為觀止,包括完整的傳記,他的所有司法觀點索引以及他在各種問題上的立場。內(nèi)容非常全面,也非常令人印象深刻。
讓我們將期刊論文的同行評議與熱門的維基頁面編輯做一個比較。對于經(jīng)過高質(zhì)量同行評議審閱過的期刊論文,會有三名審稿人閱讀該論文,一旦這三名審稿人說論文可以發(fā)表,那么文章就會發(fā)出去,然后再也不能編輯修改。但是對于一個熱門的維基頁面,可能有上千人在審閱上面的內(nèi)容。惡意破壞行為通常也會在幾秒內(nèi)得到修正,并且頁面內(nèi)容也會不斷更新,但這是熱門的維基頁面的情況。
我們說說冷門的維基頁面。比如,這是馬薩諸塞州議會大廈的維基頁面。這個頁面上說壁畫“Columbia Knighting Her World War Disabled”里的模特是諾瑪?布羅德尼?科恩(Norma Brodney Cohen)。如果你查看頁面下方引用的文獻,你會發(fā)現(xiàn)有證據(jù)支持以下說法:壁畫中的模特之一是壁畫作者的母親莎拉?布羅德尼(Sarah Brodney)。但卻沒有證據(jù)支持畫中哥倫比亞的模特是畫家的姐姐諾瑪這一說法。既然沒有證據(jù)支持這個說法,那為什么這個內(nèi)容還出現(xiàn)在維基頁面上呢?因為那是我放上去的。諾瑪是我的奶奶。如果我有證據(jù),我一定會把引用文獻放上去,證明諾瑪確實是畫中的模特。但遺憾的是,沒有這樣的證據(jù)。那為什么一個沒有證據(jù)支持的說法依舊出現(xiàn)在維基頁面上呢?答案是沒人在乎馬薩諸塞州議會大廈內(nèi)的壁畫。一個相對鮮為人知的頁面,可靠性也相對低一些。題外話,我可以向你們保證,畫中哥倫比亞的模特真的是諾瑪。如果我找到可以引用的文獻,我一定會加到那個維基頁面上。但這里我真正想闡述的是,一個維基頁面的可靠性取決于該頁面的熱門程度。
在我看來,對于一個熱門的頁面,維基頁面可以說是有史以來最準(zhǔn)確的信息形式。但越是冷門的頁面,可靠性越低。這么說有點復(fù)雜。但要理解這一點,你首先得理解知識的社會建構(gòu)。
所以,維基百科的功能可見性完美地匹配了知識的社會建構(gòu)。我們知道,在維基頁面上有修訂歷史。你可以查看每一個維基頁面的所有歷史版本,包括最初版本。每個維基頁面都有一個討論頁。你可以轉(zhuǎn)到首頁跟其他編輯人員討論如何編輯該頁面。事實上,規(guī)定什么可以出現(xiàn)在維基頁面上、什么不可以出現(xiàn)在維基頁面上的政策也可以被用戶編輯。這些也在維基頁面上,你要做的就是在討論頁上跟大家討論。如果某個政策更改獲得大家的一致同意,那么你就可以更改政策頁的內(nèi)容。但如果你不跟大家商量徑直更改內(nèi)容的話,內(nèi)容很快就會被恢復(fù)到原樣。維基百科上還有一些維基項目,維基項目是一群在某一領(lǐng)域有共同興趣并協(xié)調(diào)編輯活動的人。例如,有一個醫(yī)學(xué)維基項目,旨在改善維基百科上的所有醫(yī)學(xué)文章;還有鯊魚維基項目,旨在管理所有鯊魚條目。所有這些機制都是為了改進維基百科上社會建構(gòu)的知識質(zhì)量。
作為數(shù)據(jù)科學(xué)家,我們在真相方面,面臨獨特的挑戰(zhàn)。我們處理的不是不確定性,而是概率。我認(rèn)為,我們數(shù)據(jù)科學(xué)家有這份道德責(zé)任來闡明我們所發(fā)現(xiàn)事物的局限性,尤其是數(shù)據(jù)和模型的局限性。比如,我們在做機器學(xué)習(xí),從數(shù)據(jù)集學(xué)習(xí)的時候,結(jié)果的好壞取決于初始數(shù)據(jù)的質(zhì)量。如果初始數(shù)據(jù)不可靠,那么結(jié)果也一樣不可靠。如果初始數(shù)據(jù)帶有歷史偏見,那么結(jié)果也會帶有歷史偏見。輸入的是垃圾,輸出的也是垃圾。我們對大數(shù)據(jù)的分析質(zhì)量完全取決于我們輸入的數(shù)據(jù)。至于模型的質(zhì)量,有時我們可以對現(xiàn)象建模,我們嘗試推斷事務(wù),有時理想,有時則不太理想。所以我們負(fù)有道德責(zé)任,來闡明數(shù)據(jù)和模型的局限性。我們也盡可能創(chuàng)建與現(xiàn)實具有一定程度對應(yīng)性的表述。如果我們闡明支持我們表述之證據(jù)的局限性,或許可以幫助我們更好的分享知識。
最后,總結(jié)一下我今天演講的內(nèi)容。世界真實存在,但我們只能通過易出差錯的感官來感知現(xiàn)實世界。知識由社會共識搭建。真相的搭建是一個社會過程。社會計算研究者可以對“真相”和“知識”的本質(zhì)進行更多的研究。如果我們對這些社會行為越多了解,就越可能搭建一個更好的互聯(lián)網(wǎng)。
我們可以從諸如維基百科這些成功的項目中獲益匪淺。維基百科理論上行不通,但只在實踐中行得通。希望我今天的內(nèi)容能給大家?guī)硪恍﹩l(fā)。無論你是否經(jīng)常使用維基百科,你都可以將其視為一個展示互聯(lián)網(wǎng)潛力的神奇模型。
今天的演講內(nèi)容來自我正在撰寫一書的第二章。這本書的書名叫《你應(yīng)該相信維基百科嗎——知識和在線社區(qū)的設(shè)計》。這本書將在明年由劍橋大學(xué)出版社出版。最后,希望大家對今天的內(nèi)容感興趣,或許今天的分享也能讓各位對新書感興趣。
最后再次感謝各位。希望這次演講對大家有幫助。也感謝我的同事和學(xué)生們。感謝收聽!
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )