We shape our tools and afterwards our tools shape us. ——Marshall McLuhan
麥克盧漢說:“我們塑造了工具,反過來工具也在塑造我們?!?/p>
我本人不反感AI,也相信人工智能會開創(chuàng)一個偉大的時代,但是我們要思考一些東西,至少知道那是什么。本人旨在讓你了解當(dāng)前人工智能應(yīng)用最普遍的智能推薦引擎(Intelligent Recommendation Engine),其背后的設(shè)計理念,以及一些更深度的思考。關(guān)于理念,它不像技術(shù)要求太多的基礎(chǔ),我盡量不使用專業(yè)術(shù)語,所以本文同樣適合程序員以外群體。
從“分類”說起
以大家熟悉的分類信息網(wǎng)為例,像58同城、趕集網(wǎng)。網(wǎng)站把現(xiàn)實生活中的商品、服務(wù)進(jìn)行分類進(jìn)行展示,比如房產(chǎn)、二手車、家政服務(wù)等。這些內(nèi)容即是現(xiàn)實世界對應(yīng)的抽象,我們可以很容易的找到對應(yīng)關(guān)系。
我們再以求職網(wǎng)站為例,像智聯(lián)招聘、BOSS直聘。網(wǎng)站按照職業(yè)把 人分類,比如程序員、廚師、設(shè)計師、數(shù)學(xué)家、物理學(xué)家等。
那么現(xiàn)在問題出現(xiàn)了,眾所周知,人工智能的完美入門人才是具有數(shù)學(xué)和計算機(jī)雙學(xué)位的碩士以上學(xué)歷人才。那么,我們?nèi)绾伟堰@樣的人分類呢?我們無法單一的將其歸入到程序員或者數(shù)學(xué)家,我們無法為每一個這樣的復(fù)合型人(slash)進(jìn)行單獨分類。
分類產(chǎn)生矛盾。
我們區(qū)分南方人、北方人,所以有地域歧視。我們區(qū)分亞洲人、歐洲人,所以有種族歧視?!胺诸悺敝皇侨祟惡喕瘑栴}邏輯的手段,薛定諤的貓和羅素的理發(fā)師已經(jīng)證明了“分類”并不正確。所以在大計算時代,我們引入“貼標(biāo)簽”的概念。
貼標(biāo)簽
AI時代是計算能力爆炸增長所帶來的。在強(qiáng)大的計算能力面前,我們真的可以針對每個人進(jìn)行“分類”,它的表現(xiàn)形式就是—貼標(biāo)簽。
30歲以下、程序員、屌絲、奶爸、熬夜、不愛運動、公眾號叫caiyongji、格子襯衫、機(jī)械鍵盤、牛仔褲……這些可以是一個程序員的標(biāo)簽。換個角度,“類別”反轉(zhuǎn)過來服務(wù)于單獨的某個人,這是在計算能力短缺的時代所無法想象的。
傳統(tǒng)的智能推薦引擎對用戶進(jìn)行多維度的數(shù)據(jù)采集、數(shù)據(jù)過濾、數(shù)據(jù)分析,然后建模,而人工智能時代的推薦引擎在建立模型步驟中加入Training the models(訓(xùn)練、測試、驗證)。
最后,推薦引擎就可以根據(jù)用戶標(biāo)簽的權(quán)重(可以理解為對標(biāo)簽的打分,表示側(cè)重點),對用戶進(jìn)行精準(zhǔn)推送了。
推薦引擎屬性分化
俗話是這么說的“旱的旱死,澇的澇死”,“飽漢子不知餓漢子饑”,不知道這些俗語我用的恰當(dāng)不恰當(dāng)。我的意思是在智能引擎的推薦下,會加強(qiáng)屬性兩極分化。
我們以程序員為例,選取編程技巧、打游戲、體育運動、熬夜、看書五個維度。經(jīng)過推薦引擎的“塑造”后如下。
目前,推薦引擎的算法會將權(quán)重比較大的標(biāo)簽進(jìn)行優(yōu)先推廣,這就導(dǎo)致原本權(quán)重大的標(biāo)簽得到更多的曝光次數(shù),最終使得權(quán)重大的標(biāo)簽權(quán)重越來越大,而權(quán)重小的標(biāo)簽在長時間的被忽略狀態(tài)下逐漸趨近于零。
推薦引擎行為引導(dǎo)
波茲曼認(rèn)為,媒體能夠以一種隱蔽卻強(qiáng)大的暗示力量來“定義現(xiàn)實世界”。其中媒體的形式極為重要,因為特定的形式會偏好某種特殊的內(nèi)容,最終會塑造整個文化的特征。這就是所謂“媒體即隱喻”的主要涵義。
由于“推薦”機(jī)制的屬性分化,那些高技術(shù)含量的、專業(yè)的、科學(xué)的、真正對人又幫助的信息被更少的人接觸,而那些簡單的、輕松的、娛樂的、裸露的、粗俗的信息被越來越多的人接觸。
我們看一下具有影響力的百度、今日頭條和微博在今天(2018年1月13日10:04:xx)所推薦的內(nèi)容。我刪除了cookie,使用匿名session,移除我的“標(biāo)簽”。也就是說,下圖所推薦內(nèi)容對大部分人適用。
只要你好奇點擊,你的tittytainment(我翻譯成“愚樂”,那個三俗的譯法不要再傳了)屬性權(quán)重就會越來越大。娛樂新聞點擊過百萬,科普文章點擊不過百,這種現(xiàn)象正是推薦引擎的行為引導(dǎo)導(dǎo)致的。
不客氣的說,百度、今日頭條、微博對國民素質(zhì)的影響是有責(zé)任的。
無關(guān)推薦(Non Relational Recommendation)
對于你從來都沒思考過的事物,你可能永遠(yuǎn)都接觸不到,因為你不知道求索的路徑,所以有的人每個月都讀與自己專業(yè)無關(guān)的書,來擴(kuò)展自己的知識面。我們舉個例子:
你可能會在網(wǎng)上搜索如何與女朋友和諧相處但你未必會搜索如何讓女朋友們和諧相處,有人笑談“貧窮限制了我的想象力”,其實不然,是你接收不到無關(guān)的推薦,你才被限制在特定的知識圈子里。
所以我提出無關(guān)推薦這個概念。
對程序員進(jìn)行畫像:
如圖,當(dāng)某個標(biāo)簽沒有到達(dá)“程序員”的路徑時,他可能永遠(yuǎn)無法觸及那個標(biāo)簽。這時,我們推薦“無關(guān)”信息給用戶,強(qiáng)制產(chǎn)生路徑。
你可能會質(zhì)疑,這是隨機(jī)強(qiáng)制推薦垃圾信息嗎?
其實不然,通過深度學(xué)習(xí),我們可以進(jìn)行大量的數(shù)據(jù)收集、數(shù)據(jù)分析和模型訓(xùn)練,我們是可以找到對某個個體無關(guān),但會讓其感興趣信息的興趣點。這種信息就是無關(guān)推薦的解。
最后
你每天接收到的“推薦”背后是各個團(tuán)隊經(jīng)過心理學(xué)研究、行為學(xué)研究、大量計算設(shè)計的,人們正在失去深度思考、自主判斷的能力。對于進(jìn)步青年、斜杠青年請保持思考。謹(jǐn)以此文獻(xiàn)給希望進(jìn)步的你,希望你有所收獲和思考。
作者微信公眾號: caiyongji
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 后人工智能時代:2025年,在紛擾中重塑數(shù)據(jù)、洞察和行動
- 2025年展望:人工智能推動IT整合
- 量子計算:商業(yè)世界的新前沿與設(shè)計思維的融合
- IDC:三季度全球以太網(wǎng)交換機(jī)收入同比下降7.9%、環(huán)比增長6.6%
- Fortinet李宏凱:2025年在中國大陸啟動SASE PoP節(jié)點部署 助力企業(yè)出海
- Fortinet李宏凱:2024年Fortinet全球客戶已超80萬
- 央國企采購管理升級,合合信息旗下啟信慧眼以科技破局難點
- Apache Struts重大漏洞被黑客利用,遠(yuǎn)程代碼執(zhí)行風(fēng)險加劇
- Crunchbase:2024年AI網(wǎng)絡(luò)安全行業(yè)風(fēng)險投資超過26億美元
- 調(diào)查報告:AI與云重塑IT格局,77%的IT領(lǐng)導(dǎo)者視網(wǎng)絡(luò)安全為首要挑戰(zhàn)
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。