近日,亞馬遜人工智能招聘軟件因收到大多簡歷來自男性,而做出了對(duì)男性候選人的偏好選擇,據(jù)說它曾接受了十年的人工智能算法的數(shù)據(jù)訓(xùn)練。
據(jù)路透社報(bào)道,亞馬遜于2014年開始開發(fā)自動(dòng)化系統(tǒng),為求職者提供一到五顆星。但去年,該公司在看到它已經(jīng)開始偏愛技術(shù)角色的男性候選人之后取消了該項(xiàng)目。
因?yàn)?a href="http://worldfootballweekly.com/AI_1.html" target="_blank" class="keylink">AI工具接受了公司收到的10年簡歷的培訓(xùn)。由于科技是男性主導(dǎo)的行業(yè),大多數(shù)簡歷來自男性。導(dǎo)致該系統(tǒng)無意間接受了選擇男性候選人而不是女性候選人的培訓(xùn)。據(jù)報(bào)道,它將對(duì)包含“婦女”一詞或某些全女子學(xué)院名稱的簡歷進(jìn)行處罰。盡管亞馬遜做出了改變以使這些術(shù)語保持中立,但該公司仍然失去了對(duì)該計(jì)劃在所有其他領(lǐng)域確實(shí)性別中立的信心。
什么是數(shù)據(jù)訓(xùn)練?
這里可以拿兩件事作為案例,一個(gè)是“飛豬大數(shù)據(jù)殺熟”事件,另一個(gè)是淘寶的“用戶畫像標(biāo)簽”。
近日,作家王小山在微博發(fā)問表示,在飛豬購買機(jī)票時(shí)遇到“殺熟”問題。飛豬上售賣的機(jī)票價(jià)格高于其他訂票平臺(tái),且訂票價(jià)格遠(yuǎn)高于查票時(shí)顯示的價(jià)格,對(duì)此,飛豬回應(yīng)稱,“絕無此事”。雙方各執(zhí)一詞。蒼蠅不叮無縫的雞蛋,對(duì)于OTA行業(yè)而言,殺熟,價(jià)格陷阱成了所有玩家的習(xí)慣性套路,類似的事件也不止一起:
就在去年的國慶假期后,演員韓雪在微博怒斥“攜程旅行網(wǎng)”捆綁銷售,多次反饋未得到妥善處理。
去年清明節(jié),據(jù)用戶爆料,在攜程上面,iPhone8 plus手機(jī)預(yù)定酒店的價(jià)格要高于安卓機(jī)華為mate 8,隨即引起廣泛熱議。
當(dāng)然大數(shù)據(jù)的使用也不只是反面例子,利用“大數(shù)據(jù)”當(dāng)然也不止這一個(gè)行業(yè),如果大數(shù)據(jù)引導(dǎo)消費(fèi)者,被更好地利用為用戶創(chuàng)造價(jià)值,對(duì)于雙方都是一件利好的事,比如電商淘寶在建立“用戶畫像標(biāo)簽”煞費(fèi)苦心,根據(jù)檢測(cè)用戶對(duì)不同活動(dòng)與產(chǎn)品的敏感度來判斷用戶的喜好,在建立起“淘氣值”會(huì)員衡量標(biāo)準(zhǔn)體系后,將其作為用戶最重要的用戶畫像標(biāo)簽,每個(gè)用戶都只有一個(gè)數(shù)值。通過這個(gè)數(shù)值,阿里可以直接進(jìn)行用戶分層,實(shí)現(xiàn)精細(xì)化運(yùn)營。不同淘氣值,不同服務(wù)。
亞馬遜和以上兩則都是關(guān)于“大數(shù)據(jù)”使用的結(jié)果,可能最大的差距就是一個(gè)被動(dòng)一個(gè)是主動(dòng)的。
大數(shù)據(jù)與人工智能
大數(shù)據(jù)是一種規(guī)模大到在獲取、存儲(chǔ)、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和價(jià)值密度低四大特征。
大數(shù)據(jù)能夠幫助各行各業(yè)的企業(yè)從原本毫無價(jià)值的海量數(shù)據(jù)中挖掘出用戶的需求,使數(shù)據(jù)能夠從量變到質(zhì)變,真正產(chǎn)生價(jià)值。隨著大數(shù)據(jù)的發(fā)展,其應(yīng)用已經(jīng)滲透到農(nóng)業(yè)、工業(yè)、商業(yè)、服務(wù)業(yè)、醫(yī)療領(lǐng)域等各個(gè)方面,成為影響產(chǎn)業(yè)發(fā)展的一個(gè)重要因素。
當(dāng)前人們所說的人工智能,是指研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)以及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué),是由人工制造出來的系統(tǒng)所表現(xiàn)出來的智能。
在“深度學(xué)習(xí)”被提出后,其通過深層神經(jīng)網(wǎng)絡(luò)算法來模擬人的大腦學(xué)習(xí)過程,通過輸入與輸出的非線性關(guān)系將低層特征組合成更高層的抽象表示,最終達(dá)到掌握運(yùn)用的水平。
數(shù)據(jù)量的豐富程度決定了是否有充足數(shù)據(jù)對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,進(jìn)而使人工智能系統(tǒng)經(jīng)過深度學(xué)習(xí)訓(xùn)練后達(dá)到強(qiáng)人工智能水平。因此,能否有足夠多的數(shù)據(jù)對(duì)人工神經(jīng)網(wǎng)絡(luò)進(jìn)行深度訓(xùn)練,提升算法有效性是人工智能能否達(dá)到類人或超人水平的決定因素之一。
隨著移動(dòng)互聯(lián)網(wǎng)的爆發(fā),數(shù)據(jù)量呈現(xiàn)出指數(shù)級(jí)的增長,大數(shù)據(jù)的積累為人工智能提供了基礎(chǔ)支撐。同時(shí)受益于計(jì)算機(jī)技術(shù)在數(shù)據(jù)采集、存儲(chǔ)、計(jì)算等環(huán)節(jié)的突破,人工智能已從簡單的算法+數(shù)據(jù)庫發(fā)展演化到了機(jī)器學(xué)習(xí)+深度理解的狀態(tài)。
針對(duì)最開始的“人工智能偏見”事件,我們不能將人工智能視為內(nèi)在的無偏見。在有偏見的數(shù)據(jù)上訓(xùn)練系統(tǒng)意味著算法也會(huì)變得有偏見。如果這樣的不公平的人工智能招聘計(jì)劃在實(shí)施之前沒有被發(fā)現(xiàn),它們將使商業(yè)中長期存在的多樣性問題長期存在而不是解決它們。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )