原標(biāo)題:AI鑒黃,一把量出人性的尺子
文 | 楊蘇穎
來(lái)源 | 智能相對(duì)論(ID:aixdlun)
在1997年版的電影《洛麗塔》里,洛麗塔趴在花園的草坪上讀書(shū),天真的臉龐籠罩在朦朧的水霧下。在她的眼波流轉(zhuǎn)之中,電影流露出情色的味道。情色作品的含蓄和豐富常常使其可以借“性”的描述來(lái)傳達(dá)對(duì)社會(huì)精神狀態(tài)的思考。但是情色和色情從來(lái)不是一回事,而二者模糊的邊界卻不斷讓色情內(nèi)容的傳播有了可乘之機(jī)。
鑒黃師是在互聯(lián)網(wǎng)色情內(nèi)容暴增的條件下滋生的一個(gè)職業(yè)。然而長(zhǎng)期面對(duì)大量色情內(nèi)容的刺激使這類(lèi)工作者往往要承受心理、生理的雙重壓力。那么,在人工智能迅速崛起的時(shí)代,AI的加入會(huì)不會(huì)成為鑒黃師們的“減壓閥”呢?
AI來(lái)了,“東京熱”們還會(huì)好嗎?
互聯(lián)網(wǎng)鑒黃主要分為三個(gè)階段,第一階段叫人肉階段,主要通過(guò)人工識(shí)別的方式來(lái)發(fā)現(xiàn)黃色內(nèi)容;第二階段叫算法過(guò)濾階段,以膚色識(shí)別算法過(guò)濾黃色圖片開(kāi)始成為主流;第三階段叫深度學(xué)習(xí)階段,因?yàn)榧兡w色式地圖片過(guò)濾已經(jīng)難以擔(dān)當(dāng)鑒黃的重任,所以機(jī)器學(xué)習(xí)成為了新的主角。針對(duì)第三個(gè)階段,智能相對(duì)論分析師(aixdlun)楊蘇穎梳理了三種不同的智能鑒黃工種,分別囊括了音頻、圖像和視頻三種形式。
首先是鑒定圖片和視頻的鑒定。鑒別黃色圖片的過(guò)程主要有兩步,第一步是用黃圖的特點(diǎn)來(lái)定義一個(gè)機(jī)器可以識(shí)別的數(shù)學(xué)模型。第二步則是用大量滿(mǎn)足定義的圖片來(lái)進(jìn)行樣本數(shù)據(jù)的收集并將其用于機(jī)器訓(xùn)練。在島國(guó)搜尋大量動(dòng)作片的種子進(jìn)行海量灌輸之后,我們可以得到一個(gè)越來(lái)越精準(zhǔn)的模型,從而讓人工智能準(zhǔn)確識(shí)別出某張圖片是否為黃圖。這是AI鑒別靜態(tài)圖片的一個(gè)簡(jiǎn)單流程。
那么AI對(duì)于動(dòng)態(tài)圖像又是怎么進(jìn)行處理的呢?其實(shí)AI要對(duì)在線視頻和直播這類(lèi)的動(dòng)態(tài)圖像開(kāi)展鑒黃工作,其原理與鑒別靜態(tài)圖片并沒(méi)有太大的差別。只要在鑒別視頻和直播的時(shí)候,人為地多加一個(gè)步驟把動(dòng)態(tài)內(nèi)容解碼變成圖片幀,剩下的工作就和靜態(tài)圖片處理大同小異了。
另外,如今偽ASMR的涌現(xiàn)要求AI在色情音頻上的處理能力也必須跟上。在各種直播房間內(nèi),主播們更是可以直接以語(yǔ)言交流的方式與粉絲進(jìn)行互動(dòng)。所以,國(guó)內(nèi)的一家名叫極限元的公司采用了一種叫CTC+LSTM組合的深度學(xué)習(xí)技術(shù)來(lái)識(shí)別色情音頻內(nèi)容。它可以分析語(yǔ)音的信息內(nèi)容,從而判斷出語(yǔ)音當(dāng)中是否含有色情信息。
在鑒黃領(lǐng)域,AI的三管齊下顯示了其要肅清黃色內(nèi)容的決心,而且它也確確實(shí)實(shí)地減輕了人工鑒黃的壓力。但是在現(xiàn)實(shí)當(dāng)中上有政策,下有對(duì)策的戲碼總是會(huì)不斷上演,因此鑒黃的力度越大,色情的邊界也就拓展地越快,自然AI鑒黃的難度也會(huì)越大。而這好像成為一個(gè)繞不開(kāi)的死循環(huán)。
AI鑒黃可能暫時(shí)還hold不住軟色情
最近軟色情一詞在網(wǎng)絡(luò)上被頻繁提到,成為一個(gè)關(guān)注度很高的話(huà)題。軟色情的內(nèi)容很軟,好像廣告軟文一樣,入侵的時(shí)候悄無(wú)聲息。但是其所造成的傷害卻很硬,足以讓沒(méi)有心智成熟的青少年沉溺其中難以自拔。AI進(jìn)入鑒黃領(lǐng)域,勢(shì)必要面對(duì)現(xiàn)在越來(lái)越活躍的軟色情,但要如果真想要AI對(duì)軟色情做出識(shí)別和判定卻是一項(xiàng)難上加難的工作。
軟色情的定義很模糊,它的定義是與硬色情對(duì)比得來(lái)的,指一些不暴露生殖器官的色情內(nèi)容。如果把暴露生殖器官作為一個(gè)特點(diǎn)去識(shí)別哪些內(nèi)容屬于硬色情,那么這是一件相對(duì)比較容易的事情。但是我們卻不能把不暴露生殖器官作為識(shí)別軟色情的特點(diǎn),否則所有不暴露生殖器官的內(nèi)容都會(huì)被標(biāo)記為軟色情內(nèi)容。所以這也就意味著軟色情并不是一樣容易被貼上具體標(biāo)簽的東西,它非黑非白,而是屬于灰色,因此很難被公式化。
這就為人工智能鑒黃制造了一個(gè)難題。通常人工智能進(jìn)行鑒黃首先需要建立一個(gè)“分類(lèi)器”來(lái)將圖片歸類(lèi),但不幸的是,軟色情的問(wèn)題卻沒(méi)有那么簡(jiǎn)單。什么是軟色情這個(gè)事并不好弄清楚。在B站的一些彈幕上,我們常常可以看到一群人對(duì)著視頻當(dāng)中的蘿莉發(fā)彈幕,包括“跪舔”、“硬了”之類(lèi)的字眼。但是拿“跪舔”為例,有些人只把它當(dāng)作一個(gè)比較夸張的網(wǎng)絡(luò)用語(yǔ),覺(jué)得無(wú)比正常。而有的人在這些字眼的刺激下卻真的會(huì)產(chǎn)生生理反應(yīng),難以把控。這些不同的反應(yīng)主要是由于我們每個(gè)人色情刺激的閾值高低不一。所以,像“跪舔”這樣的彈幕到底算不算是軟色情的表現(xiàn)呢?這很難判定。捫心自問(wèn),軟色情是一個(gè)很個(gè)人化的東西,它幾乎可以是一切能夠喚起自己對(duì)配偶之外的性欲的東西,而機(jī)器卻不可能成為每一個(gè)人肚子里的蛔蟲(chóng)。
不僅是定義模糊難分類(lèi),軟色情的傳播渠道也開(kāi)始朝越來(lái)越隱秘的方向發(fā)展。今年3月B站的“文愛(ài)”事件讓語(yǔ)C群浮出水面。各種嬌喘的音頻,露骨的聊污在QQ微信群里肆意傳播。在此基礎(chǔ)上,選擇私聊成為“文愛(ài)”對(duì)象的青少年也同樣不在少數(shù)。我們可以看到的是,全國(guó)最大的社交工具現(xiàn)在正在成為全國(guó)最大的軟色情承載地之一,而這些社交工具對(duì)隱私的保護(hù)竟成為了軟色情最好的保護(hù)傘。面對(duì)這些越來(lái)越隱秘的色情傳播形式,AI要嘗試去發(fā)現(xiàn)它們的存在實(shí)際上是一件非常困難的事情。如果強(qiáng)行去打開(kāi)這扇門(mén),那么很有可能會(huì)觸及到閱讀用戶(hù)隱私這條紅線,對(duì)此,內(nèi)容審核方難以把握,所以也就更難以下手。加之,人工智能對(duì)自然語(yǔ)言的識(shí)別程度現(xiàn)在還十分局限。常用的拆字法、首字母縮寫(xiě)法、取別稱(chēng)法、拼音代替法、形近字代替法等等也會(huì)讓鑒黃工作變得更為復(fù)雜。
AI鑒黃堵住了人性的出口嗎?
弗洛伊德的泛性論認(rèn)為,性是一種本能力量。若受到壓抑就會(huì)導(dǎo)致人得精神疾病。因此,色情內(nèi)容的看客會(huì)說(shuō),AI鑒黃堵住了人性的出口。在美國(guó),色情業(yè)的收入超過(guò)了哥倫比亞廣播公司CBS、全國(guó)廣播公司NBC和美國(guó)廣播公司ABC三家收入的總和。營(yíng)業(yè)額超過(guò)了所有職業(yè)橄欖球、職業(yè)棒球和職業(yè)籃球收入的總和,因此色情產(chǎn)業(yè)對(duì)人來(lái)說(shuō)是一種剛需。
法國(guó)有一部叫《生吃》的電影曾對(duì)人的欲望做出討論,電影女主角一家因?yàn)榛蜃儺惖膯?wèn)題受本能驅(qū)使不得不生吃人肉,這看上去非常殘忍。但是仔細(xì)想想,吃人肉為什么一定得被定義成“野蠻”、“殘忍”的代表,“吃人肉是錯(cuò)的”這樣的道德標(biāo)準(zhǔn)又是從何而來(lái)?如果吃人肉是一種本能,那么本能是不是不能加以?xún)r(jià)值判斷?
確實(shí),本能不可以加以?xún)r(jià)值的判斷。因?yàn)橛钦鎸?shí)存在,并且與生俱來(lái)的。但是怎么對(duì)待自己的欲望卻可以成為一門(mén)很重要的功課。如果我們對(duì)欲望視而不見(jiàn),那么人就會(huì)麻木,壓抑;如果我們?nèi)斡麢M流,那么人最終會(huì)被欲望吞噬,成為怪物。欲望不能被殺死,但是也不能成為我們生活的主宰者??刂菩杂?、食欲、肉欲的道理皆是如此。所以,黃色內(nèi)容需要正規(guī)、有序的引導(dǎo),AI鑒黃不是在堵住人性的出口,而是在調(diào)控欲望的尺度。
【完】
智能相對(duì)論(微信id:aixdlun):深挖人工智能這口井,評(píng)出咸淡,講出黑白,道出vb深淺。重點(diǎn)關(guān)注領(lǐng)域:AI+醫(yī)療、機(jī)器人、智能駕駛、AI+硬件、物聯(lián)網(wǎng)、AI+金融、AI+安全、AR/VR、開(kāi)發(fā)者以及背后的芯片、算法、人機(jī)交互等。
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋(píng)果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢(qián)通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱(chēng)塔塔集團(tuán)將收購(gòu)和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營(yíng)
- 蘋(píng)果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過(guò)熱挑戰(zhàn),交付延期引發(fā)市場(chǎng)關(guān)注
- 馬斯克能否成為 AI 部部長(zhǎng)?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號(hào)發(fā)布,意外泄露引發(fā)關(guān)注
- 無(wú)人機(jī)“黑科技”亮相航展:全球首臺(tái)低空重力測(cè)量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開(kāi)展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車(chē)整車(chē)股盤(pán)初強(qiáng)勢(shì)拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。