和其他互聯(lián)網(wǎng)企業(yè)一樣,Blued 也開始通過(guò)時(shí)下最熱門的技術(shù)——人工智能,應(yīng)用于產(chǎn)品日常運(yùn)營(yíng)中,以應(yīng)對(duì)越來(lái)越多涌入的新用戶,以此改善體驗(yàn)。
面對(duì)數(shù)量巨大的用戶和社交網(wǎng)絡(luò)數(shù)據(jù)信息,如何為每個(gè)人找到身邊的好友并根據(jù)用戶興趣進(jìn)行匹配,成為 Blued 算法工程師面臨的極大挑戰(zhàn)。圖像、視頻、動(dòng)態(tài)圖片對(duì)于社交網(wǎng)站的重要性不言而喻,算法工程師很大一部分工作就是處理與視覺(jué)信息相關(guān)的數(shù)據(jù),AI 成為他們解決問(wèn)題的最佳利器。
圖像社交業(yè)務(wù)
據(jù) Blued AI 算法部數(shù)據(jù)科學(xué)家王英杰的介紹,Blued在平臺(tái)的圖像社交業(yè)務(wù)中已經(jīng)廣泛采用 AI 技術(shù)。
他們從 LGBT人群的陌生人社交切入市場(chǎng),逐漸轉(zhuǎn)向興趣社交和泛娛樂(lè)化平臺(tái),拓展出了很多使用場(chǎng)景。在這些使用場(chǎng)景下,用戶可以在 Blued 上發(fā)布人臉頭像、相冊(cè)、圖片動(dòng)態(tài)、小視頻、直播等。鑒于視覺(jué)信息在社交產(chǎn)品的重要地位,用戶期望瀏覽興趣標(biāo)簽下的高顏值照片,用小視頻快速了解真實(shí)的對(duì)方,觀看推薦的主播直播。Blued 上社交、內(nèi)容、商業(yè)化模塊都已有落地的應(yīng)用在深度使用 AI 圖像技術(shù)。
在社交產(chǎn)品上,使用人臉檢測(cè)的技術(shù)篩選頭像照片中含人臉的照片,并對(duì)得到的人臉特征做相似性分析;對(duì)含人圖片進(jìn)行體型胖瘦的分類,通過(guò)檢測(cè)模型提取了一些身材和服飾上的標(biāo)簽,這些特征對(duì)于構(gòu)建社交推薦產(chǎn)品的模型是非常重要的特征;使用圖像分類的技術(shù)剔除掉不含人的小視頻;以及使用圖像檢測(cè)結(jié)合圖像分類的技術(shù)提取主播推薦的特征值等。
在變現(xiàn)業(yè)務(wù)方面,Blued基于圖像和短視頻的內(nèi)容feed流推薦產(chǎn)品,已經(jīng)推出了商業(yè)化廣告模塊;圖像算法在頭像認(rèn)證、隱私保護(hù)上的應(yīng)用也是會(huì)員和增值服務(wù)等變現(xiàn)業(yè)務(wù)的重要組成部分。
具體到AI圖像技術(shù)解決方案和應(yīng)用算法的內(nèi)部機(jī)制,王英杰解釋道,Blued的AI圖像技術(shù)方案根據(jù)產(chǎn)品需求,首先拆解出幾個(gè)核心的圖像任務(wù),選取適合的網(wǎng)絡(luò)模型,如人臉檢測(cè)模型、人臉識(shí)別模型、圖像標(biāo)簽檢測(cè)模型、圖像分類模型等;之后利用平臺(tái)上生產(chǎn)的大量圖片做訓(xùn)練和微調(diào),不斷迭代完些基礎(chǔ)模型;最后在不同的業(yè)務(wù)場(chǎng)景上,組合使用這些模型,并在使用的過(guò)程中根據(jù)測(cè)試結(jié)果隨時(shí)調(diào)整模型輸出閾值參數(shù)。從算法機(jī)制上講,模型的迭代,數(shù)據(jù)的累積,參數(shù)的調(diào)整,形成三個(gè)并行的演進(jìn)過(guò)程。同時(shí),數(shù)據(jù)的累積促成模型的迭代,模型迭代后參數(shù)不斷優(yōu)化調(diào)整,參數(shù)優(yōu)化調(diào)整后獲得質(zhì)量更好的數(shù)據(jù)積累,從而推動(dòng)()整個(gè)系統(tǒng)進(jìn)化。
通過(guò)這套在Blued內(nèi)部運(yùn)行了半年的技術(shù)解決方案,Blued解決了以前靠人工審核、人工運(yùn)營(yíng)、產(chǎn)品規(guī)則解決不了的問(wèn)題和實(shí)現(xiàn)不了的效果。比如在一些應(yīng)用了AI技術(shù)的產(chǎn)品模塊上,有超過(guò)30%的UV增長(zhǎng),人均PV有超過(guò)60%的增長(zhǎng),推薦成功率比人工精選提高2倍以上?,F(xiàn)在,Blued的算法模型基本上每個(gè)月都有大的迭代更新,但在與內(nèi)容生產(chǎn)環(huán)節(jié)的配合上,和內(nèi)容消費(fèi)的社交轉(zhuǎn)化傾向性上,還有很多需要不斷完善算法、優(yōu)化目標(biāo)的地方。
為了體驗(yàn)這款產(chǎn)品的性能如何,AI前線對(duì)該產(chǎn)品進(jìn)行了體驗(yàn)測(cè)試。在注冊(cè)Blued賬號(hào)后,系統(tǒng)會(huì)通過(guò)用戶選擇的興趣標(biāo)簽進(jìn)行推薦。那么,Blued的推薦排序機(jī)制是怎樣運(yùn)作的呢?
AI前線了解到,Blued數(shù)據(jù)平臺(tái)會(huì)收集用戶注冊(cè)填寫的基本資料信息,并結(jié)合用戶在平臺(tái)的內(nèi)容瀏覽行為產(chǎn)生興趣標(biāo)簽,Blued會(huì)進(jìn)一步探索用戶的社交關(guān)系鏈,并將這些數(shù)據(jù)導(dǎo)入推薦系統(tǒng)。另外,在推薦算法的基礎(chǔ)上,Blued還會(huì)考慮用戶定義的過(guò)濾和篩選條件進(jìn)行排序,但主要還是以登陸時(shí)間和距離遠(yuǎn)近為原則。
不尋常的技術(shù)挑戰(zhàn)
Blued用戶是相對(duì)特殊的群體,因此具有一些不同于普通網(wǎng)站的特點(diǎn),并因此讓工程師們面臨“不同尋常”的挑戰(zhàn)。Blued的AI之路走得并非一帆風(fēng)順,很多時(shí)候,工程師們面臨著應(yīng)接不暇的挑戰(zhàn)。
王英杰向AI前線坦承,目前,Blued最大的技術(shù)瓶頸,是云端大規(guī)模數(shù)據(jù)并行運(yùn)算,以及移動(dòng)端模型運(yùn)算效率問(wèn)題。前者的難點(diǎn)在于模型計(jì)算平臺(tái)和數(shù)據(jù)存儲(chǔ)平臺(tái)目前還沒(méi)有打通,這一問(wèn)題云計(jì)算服務(wù)已經(jīng)在著手解決了。后者的難點(diǎn)在于目前的方案在效率和性能上還沒(méi)有達(dá)到很好的平衡點(diǎn),因?yàn)樵谝苿?dòng)端對(duì)算力和功耗要求較高。但王英杰相信,隨著移動(dòng)端技術(shù)的快速發(fā)展,這個(gè)瓶頸很快就能突破。
Blued用戶也有不同的特點(diǎn),包括興趣標(biāo)簽細(xì)分程度更大,用戶資料真實(shí)性的甄別難度更高,用戶反饋行為的分布上更不均衡,用戶的頻繁訪問(wèn)次數(shù)更多等。這些都給算法的數(shù)據(jù)和算力提出更多挑戰(zhàn)。
而這些難題并非無(wú)解。在數(shù)據(jù)問(wèn)題上的挑戰(zhàn),Blued通過(guò)提取更多特征,嘗試各種聚類和分類算法,特別是對(duì)數(shù)據(jù)缺失不敏感的模型,以及不依賴用戶反饋行為的模型等來(lái)解決。在算力問(wèn)題上,則把計(jì)算壓力分配在離線計(jì)算、近線計(jì)算和在線計(jì)算上,根據(jù)數(shù)據(jù)隨時(shí)調(diào)整各個(gè)部分的計(jì)算頻次和計(jì)算量。
另外,社交網(wǎng)站往往是色情信息的“重災(zāi)區(qū)”,作為主要為L(zhǎng)GBT人群提供服務(wù)的應(yīng)用,Blued還承擔(dān)著向用戶科普、宣傳艾滋病等疾病防治方面的任務(wù)。Blued同樣在面臨著這樣的挑戰(zhàn),具體體現(xiàn)在色情圖像、文字、低俗內(nèi)容識(shí)別等任務(wù)上。
對(duì)此,Blued在社區(qū)管理中通過(guò)人工審核團(tuán)隊(duì)制定嚴(yán)格規(guī)范的識(shí)別標(biāo)準(zhǔn),在模型的訓(xùn)練和推理過(guò)程中考慮到不同分類檢測(cè)類別在準(zhǔn)確率和召回率上的不同要求,比如色情內(nèi)容的檢測(cè)需要更高的準(zhǔn)確率,性感內(nèi)容的檢測(cè)需要更高的召回率,這反過(guò)來(lái)提高了人工審核團(tuán)隊(duì)的復(fù)審效率。Blued告訴AI前線,他們?cè)诘退變?nèi)容的識(shí)別上面臨的挑戰(zhàn)更大一些,具體體現(xiàn)在 1. 判斷標(biāo)準(zhǔn)隨時(shí)間會(huì)發(fā)生較大的變化,而且變化較快,需要不斷增減需要檢測(cè)的類別;2. 樣本準(zhǔn)確標(biāo)記難度大,模型的準(zhǔn)確率和召回率也都比較難保證。目前,Blued還在采取諸如嘗試不斷完善這個(gè)模型動(dòng)態(tài)更新的流程,加大人工審核的力度,增加用戶舉報(bào)反饋的入口等措施來(lái)解決這個(gè)問(wèn)題。
未來(lái)的技術(shù)規(guī)劃與探索
利用AI技術(shù)在產(chǎn)品和服務(wù)中的布局已經(jīng)鋪展開來(lái),未來(lái)在技術(shù)上還會(huì)進(jìn)行更多的探索。
Blued的技術(shù)規(guī)劃是AI優(yōu)先,強(qiáng)調(diào)對(duì)于細(xì)分人群的個(gè)性化運(yùn)營(yíng),把興趣社交知識(shí)數(shù)據(jù)化、模型化。基于不同類型細(xì)分人群的社交需求,設(shè)計(jì)合理的產(chǎn)品場(chǎng)景,找到合適的特征,選擇匹配的模型,設(shè)計(jì)如何選取正負(fù)樣本和細(xì)化的優(yōu)化目標(biāo)函數(shù)。在這個(gè)過(guò)程中,新的產(chǎn)品想法成為可能,產(chǎn)品和運(yùn)營(yíng)的經(jīng)驗(yàn)知識(shí)也在模型的訓(xùn)練過(guò)程中被數(shù)據(jù)化。
未來(lái)AI技術(shù)一定會(huì)在Blued產(chǎn)品上越來(lái)越多的體現(xiàn)出來(lái),不只是興趣社交領(lǐng)域,Blued還表示將探索新的商業(yè)化機(jī)會(huì),比如新社交和新電商的結(jié)合等。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 特斯拉改款Model Y即將量產(chǎn),網(wǎng)紅收入千萬(wàn)報(bào)稅僅5000元引熱議
- 美光發(fā)布60TB SSD:顛覆性能效比提升20%,存儲(chǔ)升級(jí)從此綠色節(jié)能
- 極越員工喜提補(bǔ)償方案:N+1標(biāo)準(zhǔn)落地,百度吉利掏錢,員工樂(lè)開花
- 歐洲車市寒冬再襲,特斯拉暴跌40.9%:電動(dòng)車巨頭也難逃銷量下滑厄運(yùn)
- 網(wǎng)紅收入千萬(wàn)稅費(fèi)未達(dá)標(biāo)準(zhǔn),偷漏稅事件引熱議:網(wǎng)紅收入與納稅成反比
- 美國(guó)最高法將辯論禁令:TikTok的命運(yùn)何去何從?
- 美國(guó)調(diào)查TP-Link路由器安全:回應(yīng)符合行業(yè)標(biāo)準(zhǔn),挑戰(zhàn)國(guó)家安全審查新篇章
- 字節(jié)跳動(dòng)自研AI GPU:打破依賴,擺脫英偉達(dá),開啟科技新篇章
- 特斯拉新款Model Y上海工廠下月改款量產(chǎn),變革還是創(chuàng)新引人期待
- 蘋果警告Meta:互操作性過(guò)度引發(fā)隱私安全風(fēng)險(xiǎn),需謹(jǐn)慎行事
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。