互聯(lián)網(wǎng)發(fā)展至今,已經(jīng)成為人們的必需品。我們無論是在工作還是生活中,都會使用互聯(lián)網(wǎng)。在Web 2.0時代,用戶原創(chuàng)內(nèi)容UGC大量出現(xiàn),然而,一些垃圾信息、廣告、色情圖片等內(nèi)容,正破壞著互聯(lián)網(wǎng)的純凈度。
過去,多數(shù)企業(yè)會采用人工進行內(nèi)容審核,然而誤報率較高,成本也很高,隨著音頻、視頻等流媒體的出現(xiàn),內(nèi)容審核的難度也越來越大。適應(yīng)這種需求,網(wǎng)易今年推出了內(nèi)容反垃圾產(chǎn)品網(wǎng)易易盾,為當下解決互聯(lián)網(wǎng)內(nèi)容垃圾方面提供了新思路和新方法。
內(nèi)容反垃圾的重要性:規(guī)避風險,提升體驗
有數(shù)據(jù)顯示,僅2016年上半年,我國網(wǎng)民平均每周收到垃圾郵件高達18.9封、垃圾短信數(shù)量約為20.6條、騷擾電話更是多達21.3個,緊跟其后的還有惡意電腦廣告彈窗和APP推送。而這些只是在網(wǎng)民體驗層面的影響,對互聯(lián)網(wǎng)服務(wù)尤其是UGC類產(chǎn)品來說,網(wǎng)絡(luò)垃圾的泛濫無疑加重了運營風險。
(網(wǎng)易易盾總經(jīng)理周森接受記者采訪)
網(wǎng)易易盾的總經(jīng)理周森認為,網(wǎng)絡(luò)垃圾帶來的風險主要集中在兩個方面,一是監(jiān)管,政策法規(guī)的安全,如果UGC產(chǎn)生的內(nèi)容違反了政策法規(guī),企業(yè)就會面臨關(guān)閉的風險;二是用戶體驗,如果UGC不審核,會出現(xiàn)很多廣告、灌水、刷屏等現(xiàn)象,對于用戶體驗來說會造成極大的影響。
既然網(wǎng)絡(luò)垃圾帶來如此大的風險,什么樣的企業(yè)需要進行內(nèi)容反垃圾呢?周森表示,只要網(wǎng)站上有UGC,就需要審核,進行內(nèi)容反垃圾。過去,由于政府的監(jiān)管壓力,大多數(shù)企業(yè)都是自己來做內(nèi)容反垃圾,通過技術(shù)+人工審核的方式實現(xiàn),成本也相對比較高。
但是,內(nèi)容反垃圾不是三兩個人就可以完成的。周森告訴筆者,內(nèi)容反垃圾一般是通過技術(shù)手段以及運營的流程制度來保證的,需要一定規(guī)模的團隊才能運轉(zhuǎn)。通常情況下,審核團隊最少需要7個人員,7*24小時運轉(zhuǎn)才能保證內(nèi)容審核工作完成。而如今,網(wǎng)絡(luò)垃圾的形式也多種多樣,除了基本的文本、圖片,還有視頻、音頻等多媒體形式,內(nèi)容審核的難度也會加大,因此,企業(yè)不得不重視內(nèi)容反垃圾。
網(wǎng)易易盾的核心競爭力:人工智能+億級特征庫
過去,我們所理解的網(wǎng)易主要是門戶網(wǎng)站、游戲、郵箱服務(wù),以及網(wǎng)易云音樂、網(wǎng)易考拉等口碑產(chǎn)品,那么,為什么網(wǎng)易要做內(nèi)容反垃圾的云服務(wù)呢?周森告訴筆者,基于網(wǎng)易十九年對互聯(lián)網(wǎng)產(chǎn)品研發(fā)體系及運營模式的豐富經(jīng)驗和深入探索,網(wǎng)易自去年起,已經(jīng)面向市場推出一系列場景化云服務(wù),致力于更好更快地滿足B端客戶業(yè)務(wù)需求、幫助其解決業(yè)務(wù)痛點及實現(xiàn)業(yè)務(wù)目標。而網(wǎng)易易盾是其中的智能反垃圾云服務(wù),是網(wǎng)易云計算的一部分,提供廣告過濾、智能鑒黃、暴恐識別及謠言排查等反垃圾服務(wù)。
網(wǎng)易易盾的核心思想就是用人工智能的技術(shù),來進行反垃圾過濾,減少企業(yè)的人工審核,降低人工運營成本,以此來規(guī)避企業(yè)的運營風險,提升產(chǎn)品的用戶體驗。
周森介紹了網(wǎng)易易盾的產(chǎn)品實力:首先是特征庫,基于網(wǎng)易19年的技術(shù)沉淀,積累了億級別的特征庫,按照文本和圖片分類形成不同類別的特征庫,同時還針對每個行業(yè)設(shè)定專門的特征庫。第二就是技術(shù)實力,網(wǎng)易擁有眾多專業(yè)的技術(shù)人員,也在多年實踐中積累下豐富的技術(shù)經(jīng)驗。
網(wǎng)易易盾的產(chǎn)品共分為四類反垃圾服務(wù),首先是廣告過濾,基于網(wǎng)易郵件反垃圾的智能過濾技術(shù),以及億級廣告特征庫,進行精準過濾;第二是智能鑒黃,基于智能識別及海量樣本庫、信用庫,高效識別色情圖片;第三是暴恐識別,結(jié)合暴恐敏感圖像智能分析技術(shù),快速識別定位暴恐目標圖像;第四是謠言排查,基于樣本庫及專業(yè)運營經(jīng)驗,快速排查謠言等有害信息。
云服務(wù)模式:SaaS級產(chǎn)品,便捷調(diào)用
過去,互聯(lián)網(wǎng)內(nèi)容以文字為主,所以大家最常用的就是關(guān)鍵詞匹配的方式進行內(nèi)容識別。但是,關(guān)鍵詞的方式極易產(chǎn)生誤判,對于用戶的體驗也不好,所以,網(wǎng)易易盾進行了技術(shù)改進。在文字方面,通過關(guān)鍵詞識別、規(guī)則引擎、自然語言處理三階段的技術(shù),來保證識別的準確度。周森表示,目前,自然語言處理技術(shù)相對使用比較多,畢竟?jié)h語言博大精深,雙關(guān)、同音字、多音字等都相對比較復(fù)雜,采用自然語言技術(shù)可以提高準確度。
網(wǎng)易易盾通過人工智能技術(shù)過濾掉垃圾信息,文本相對過濾速度比較快,圖片與視頻相對較慢,如果出現(xiàn)爭議的判斷,則由人工介入進行再次審核。那么,機器過濾的速度有多快呢?周森告訴筆者,依托于網(wǎng)易云計算資源,網(wǎng)易易盾可以支持單日億級別數(shù)據(jù)的運算能力,快速響應(yīng),實時返回。目前,網(wǎng)易易盾的準確率已經(jīng)達到了99.8%以上。
網(wǎng)易易盾是SaaS級產(chǎn)品,而且使用的門檻也相對較低。主要是調(diào)用網(wǎng)易易盾的幾個接口,將內(nèi)容傳送給網(wǎng)易易盾就可以實時返回內(nèi)容的等級,例如垃圾、疑似、正常等。企業(yè)的運營人員就很容易的來判別哪些內(nèi)容是有問題的,并且進行處理。
周森透露,未來,網(wǎng)易易盾將會繼續(xù)深耕在網(wǎng)絡(luò)安全方面,會在近幾個月推出驗證碼,保護產(chǎn)品的登錄注冊過程。
網(wǎng)易易盾免費試用入口:http://dun.163.com/
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 螞蟻集團架構(gòu)大調(diào)整:CTO線變革引領(lǐng)技術(shù)新潮流
- 蔚來智能駕駛重大調(diào)整:組織架構(gòu)重組,從"半成品"到"端到端"解決方案革新
- 滴滴致歉“臭車”事件,日產(chǎn)本田合并談判引關(guān)注,新車市波瀾再起
- 三星助力國內(nèi)手機廠商爭奪高端市場,競爭升級,誰將脫穎而出?
- 美團騎手過度疲勞工作?強制下線跑單超時者,保障騎手健康與安全
- 王自如離職風波揭開真相:董明珠批緋聞無聊,職場風波需理性對待
- 2024車市冷靜觀察:十大熱門車型背后的真實故事
- 中國云服務(wù)市場風起云涌:阿里云、華為云、騰訊云三強爭霸,市場份額七成誰主沉浮
- 微信小店“送禮物”功能全面推進:騰訊回應(yīng):逐步灰度測試中,小心謹慎不冒進
- 雷諾集團權(quán)衡日產(chǎn)與本田合并:利益最大化需謹慎抉擇
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。