原標(biāo)題:在AI與信息交互之間:QQ 瀏覽器的邊界探索
互聯(lián)網(wǎng)1.0時代,網(wǎng)絡(luò)是人們查閱資料、了解世界的重要窗口,這個時期人與信息的關(guān)系是單向的,信息如一本本靜態(tài)的電子化書本需要用戶觸及后再閱覽獲??;
互聯(lián)網(wǎng)2.0時代,互聯(lián)網(wǎng)開始成為人們獲取價值信息和社交不可或缺的重要工具,人與信息的關(guān)系開始有了雙向的交互,信息與人共同編織、豐富著這張時代大網(wǎng)。
隨著推薦技術(shù)成熟以及信息流業(yè)務(wù)急速擴(kuò)張,用戶與內(nèi)容的交互模式逐漸從“人找內(nèi)容-搜索”向“內(nèi)容找人-推薦”遷移,并且這種趨勢仍在擴(kuò)大它的外延。搜索作為人與內(nèi)容信息交互的一種重要方式,它的作用并沒有削弱,用戶在推薦場景的沉浸消費(fèi)反而會激發(fā)出新的搜索需求。
從本質(zhì)上看,搜索與推薦關(guān)注的交匯點(diǎn)都是交互的核心——用戶興趣,因此如何在當(dāng)前信息分發(fā)場景中更好滿足用戶興趣是一個重要命題。而瀏覽器是用戶在互聯(lián)網(wǎng)2.0時代與世界交互信息的重要入口,也是展示搜索與推薦技術(shù)精進(jìn)的絕佳觀察點(diǎn)。
瀏覽器作為一款綜合性APP,承載了搜索、信息流推薦、小說等多種用戶消費(fèi)信息的場景。這些場景都有大量的內(nèi)容理解、內(nèi)容生成方面的AI需求。不同的場景都有各自的特點(diǎn),比如搜索的Query意圖分類、信息流的內(nèi)容推薦、小說的內(nèi)容分類等。
這些特點(diǎn)也讓瀏覽器成為全面觀察AI技術(shù)在自然語言語義理解方向發(fā)展很好的窗口,跟隨推薦技術(shù)的發(fā)展脈絡(luò),我們發(fā)現(xiàn)騰訊旗下的QQ瀏覽器應(yīng)用月活用戶已經(jīng)超過4億,儼然成長為瀏覽器中的超級APP。
在國內(nèi),騰訊是較早大規(guī)模實(shí)踐AI推薦技術(shù)的廠商之一,旗下的QQ瀏覽器過去幾年來在AI和推薦技術(shù)方面經(jīng)歷了幾次大規(guī)模重構(gòu)和迭代,現(xiàn)在已經(jīng)蔚然成森。這幾年QQ 瀏覽器在技術(shù)層經(jīng)歷了怎樣的厚積?在信息繭房和視頻化難題的泥沼中,QQ 瀏覽器做出了哪些選擇?其實(shí)戰(zhàn)經(jīng)歷對于瀏覽器行業(yè)來說,還是具有一定的學(xué)習(xí)和參考價值的,值得我們探討一下。
信息流“沼澤”中QQ瀏覽器面對的選擇
在瀏覽器中,信息流主feed是圖文、短視頻、小視頻混合形態(tài),這也是推薦算法應(yīng)用的主場景。在這些場景中,瀏覽器在不斷發(fā)展的進(jìn)階過程中容易遇到這些痛點(diǎn)難題:
1.信息繭房現(xiàn)象。內(nèi)容和資訊類平臺不光要推薦熱門的信息內(nèi)容,也面臨解決一些初始信息的冷啟動問題,推薦系統(tǒng)如何公正有效的推薦優(yōu)質(zhì)內(nèi)容,使得好內(nèi)容獲得更多的曝光機(jī)會,觸達(dá)更多的人群。
2.面對具有豐富場景的瀏覽器,其背后的AI研發(fā)需求多樣復(fù)雜,傳統(tǒng)的研發(fā)模式研發(fā)周期長,效率低。比如內(nèi)容視頻化方向,怎么打更好的標(biāo)簽以及做更好的多模態(tài),對視頻的理解和多模態(tài)的理解如何做到準(zhǔn)確把控等。
3.細(xì)分場景的多樣化與精細(xì)化運(yùn)營的需求,信息流目前發(fā)展到了精細(xì)化運(yùn)營的階段,需要針對多種多樣的細(xì)分場景進(jìn)行敏捷優(yōu)化。
無論是對于用戶來說,信息內(nèi)容的繭房現(xiàn)象帶來的一畝三分地的局限“視野”,還是企業(yè)面臨的形態(tài)復(fù)雜、內(nèi)容多樣化進(jìn)階的AI技術(shù)需求等,這些對信息流內(nèi)容產(chǎn)生影響的挑戰(zhàn)都亟需解決,為內(nèi)容信息的獲取和交互還一片輕快的價值體驗(yàn)。
QQ瀏覽器在面對上述挑戰(zhàn)中,選擇運(yùn)用預(yù)訓(xùn)練+finetune+AutoML的新范式和多目標(biāo)多場景聯(lián)合優(yōu)化的新深度模型等創(chuàng)新來應(yīng)對信息流這方面的技術(shù)挑戰(zhàn)。在騰訊QQ 瀏覽器舉辦的AI算法大賽中也可以窺視到多模態(tài)技術(shù)與超參數(shù)對這些瀏覽器難題的優(yōu)化,這兩個技術(shù)也是此次比賽的兩條賽道。
比如在視頻流的場景中,多模態(tài)的技術(shù)可以根據(jù)視頻觀看的時間及關(guān)注的興趣及行為讓下一個視頻更符合、相似目前觀看的視頻,在語義上的相似可以讓用戶的體驗(yàn)更好。QQ 瀏覽器在多模態(tài)技術(shù)中也做了評價視頻語義相似度的問題,可以更精確地評價兩個視頻的文本區(qū)別,為用戶不再推薦重復(fù)的內(nèi)容,增強(qiáng)在推薦方面的泛化和興趣探索的能力,很好地緩解信息繭房的問題。
而超參數(shù)技術(shù)可以實(shí)現(xiàn)多目標(biāo)融合,也就是在推薦系統(tǒng)中,從刷視頻的點(diǎn)擊率演進(jìn)到點(diǎn)擊、關(guān)注、點(diǎn)贊等同時完成,超參數(shù)搜索把以前人工尋參的方式通過網(wǎng)格搜索、非個性化尋參到個性化尋參的方式提升效率。在騰訊QQ瀏覽器實(shí)踐過程中可以減少 80% 以上的尋參時間,大大提升了推薦系統(tǒng)的研發(fā)效率。
我們知道瀏覽器在實(shí)際的推薦和搜索業(yè)務(wù)場景中,有異常豐富且持續(xù)演化的內(nèi)容需求,這些龐大的內(nèi)容數(shù)據(jù)并沒有客觀清晰的定義,數(shù)據(jù)標(biāo)注也就成為內(nèi)容算法研發(fā)的核心瓶頸,而預(yù)訓(xùn)練大模型是解決這一問題的“良藥”。
聚焦推薦與搜索:當(dāng)瀏覽器擁抱大模型
預(yù)訓(xùn)練大模型也是近兩年AI產(chǎn)業(yè)中最火的關(guān)鍵詞之一。目前比較有名的模型參數(shù)量都已經(jīng)達(dá)到萬億級別了,應(yīng)用場景差異也比較明顯。以 OpenAI斥巨資打造的GPT-3為例,它依然是偏 NLP 的模型。在AI大模型的探索上,無論是著眼于提升超大規(guī)模AI算力,還是突破學(xué)術(shù)前沿的角度,本質(zhì)上都是通過將海量的數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練、預(yù)集成,形成高魯棒性、低樣本量需求的大模型。企業(yè)可以根據(jù)自身的應(yīng)用場景,在大模型的基礎(chǔ)上進(jìn)行少量的調(diào)參即可完成落地。
而瀏覽器與大模型的結(jié)合,可以將瀏覽器背后場景的大量內(nèi)容理解、內(nèi)容生成中的AI研發(fā)所需樣本量大大降低,解決標(biāo)注量與成本這個在瀏覽器整體業(yè)務(wù)場景中的核心瓶頸。
QQ瀏覽器實(shí)驗(yàn)室自研了預(yù)訓(xùn)練模型“神舟”,這個模型具有百億參數(shù)的訓(xùn)練能力,可以為搜索、推薦、內(nèi)容理解等多種業(yè)務(wù)場景起到直接幫助,提升各種自然語言理解算法效果。神舟預(yù)訓(xùn)練大模型專注中文自然語言理解,基于預(yù)訓(xùn)練的研發(fā)模式,可以提前把語言語義中通用的知識學(xué)習(xí)到預(yù)訓(xùn)練模型中,針對下游具體的任務(wù)只需要學(xué)習(xí)任務(wù)相關(guān)的知識。
通過該模型QQ 瀏覽器可以微調(diào)和滿足業(yè)務(wù)中出現(xiàn)的如評論理解、搜索 Query 推薦等NLP 需求,可以減少 40% 以上所需的標(biāo)注數(shù)據(jù)量和相應(yīng)的研發(fā)時間,節(jié)省了標(biāo)注的成本,大大提升了研發(fā)的效率。在學(xué)術(shù)上,也刷新了業(yè)界紀(jì)錄,登頂了中文語言理解測評基準(zhǔn) CLUE 榜單上,成為首個在中文自然語言理解綜合評測數(shù)據(jù)上超過人類水平的預(yù)訓(xùn)練模型。
當(dāng)前神舟大模型已經(jīng)逐步應(yīng)用于 QQ 瀏覽器的搜索、看點(diǎn)資訊、小說等多個場景。隨著大模型進(jìn)一步的迭代和實(shí)踐,也會深度改造 QQ 瀏覽器的搜索推薦能力,更好地理解并滿足用戶表達(dá)背后的意圖與需求。
大算力時代,機(jī)器變得更加理解信息與人,比如在醫(yī)療領(lǐng)域的問診問答、交互對話等實(shí)際場景中,大模型可以為語義的理解帶來更強(qiáng)的綜合效果,而瀏覽器擁抱大模型,可以更好地沉淀大量的知識,幫助我們更準(zhǔn)確地探索AI與機(jī)器學(xué)習(xí)的邊界。
在全面數(shù)字化遷徙之旅中,我們獲得信息的渠道和服務(wù)方式也變得越來越便捷智能,對于瀏覽器行業(yè)來說,讓人們以優(yōu)質(zhì)的體驗(yàn)零門檻獲取價值信息是核心訴求,基于這個變化與訴求,QQ 瀏覽器也將自己的技術(shù)品牌升級為QQ 瀏覽器實(shí)驗(yàn)室以更好地聚焦服務(wù)用戶。
QQ瀏覽器實(shí)驗(yàn)室:走向下一代信息交互
對于下一代信息的交互平臺,每個人心目中的瀏覽器都不一樣,我們可能會借助元宇宙的技術(shù),通過手勢、眼神甚至是意識來操控搜索與推薦,當(dāng)我們進(jìn)入沉浸式的新搜索界面時,可能很多的邊界都會模糊甚至消失,比如消費(fèi)和應(yīng)用的邊界,體驗(yàn)與內(nèi)容的邊界,體驗(yàn)與創(chuàng)作的邊界等,可能搜索就是一個創(chuàng)作的引子,發(fā)現(xiàn)就是探索開始的價值,用戶與內(nèi)容與應(yīng)用開始層層遞進(jìn)深入,體驗(yàn)和交互的方式全面融合。
無論是哪種未來瀏覽器,本質(zhì)上都是搜索網(wǎng)羅信息,精準(zhǔn)推薦價值內(nèi)容,這也是信息技術(shù)發(fā)展過程中的不變內(nèi)核。無論未來信息交互的前景怎么變化,前提是技術(shù)的不斷更迭、突破才能帶來體驗(yàn)的重構(gòu)。
(左起:騰訊副總裁郄小虎、信息平臺與服務(wù)線CTO徐羽、騰訊副總裁殷宇)
QQ瀏覽器瞄準(zhǔn)長線的數(shù)字化趨勢價值,成立“QQ瀏覽器實(shí)驗(yàn)室”技術(shù)品牌,依靠AI、搜索、大數(shù)據(jù)、推薦算法的技術(shù)研究,提升信息與服務(wù)的獲取效率,幫助用戶零門檻地獲取價值信息和服務(wù),革新用戶與世界的交互方式。
近些年來,我們發(fā)現(xiàn)騰訊越來越重視AI技術(shù)能力的構(gòu)建,也成立了一些技術(shù)品牌,比如TEG(技術(shù)工程事業(yè)群)和CSIG(云與智慧產(chǎn)業(yè)事業(yè)群),這也是大家心目中離技術(shù)最近的品牌。以內(nèi)容為主的PCG并沒有得到足夠的關(guān)注。隨著PCG技術(shù)中臺的成立,推薦AI中臺也成為騰訊技術(shù)平臺中的核心中臺,而QQ瀏覽器實(shí)驗(yàn)室是PCG技術(shù)中臺的核心支撐中臺模塊之一,不斷為騰訊的推薦業(yè)務(wù)賦能。
實(shí)驗(yàn)室是創(chuàng)新不斷誕生并生根發(fā)芽的地方,搜狗搜索團(tuán)隊(duì)并入后,全網(wǎng)搜索的技術(shù)能力與騰訊垂直搜索的能力形成互補(bǔ),強(qiáng)強(qiáng)聯(lián)手,這個實(shí)驗(yàn)室就聚合了信息交互中最核心的兩個技術(shù),可能是我們邁入未來沉浸式搜索交互的第一步。
我們知道,信息技術(shù)交互平臺的發(fā)展不斷進(jìn)階的目標(biāo)就是消除鴻溝與隔閡,縮短人與人、人與信息的距離。騰訊信息平臺與服務(wù)線CTO徐羽也公開表示QQ 瀏覽器的進(jìn)階目標(biāo),與之相似都是緊密連接信息與價值,拓寬用戶了解世界的眼界。打造互聯(lián)網(wǎng)未來30年的信息服務(wù)工具,做技術(shù)的擺渡人,讓價值信息更好地網(wǎng)羅服務(wù)生活,成為探索未知的下一代超級窗口。
人類歷史的長河中,隨著信息技術(shù)的不斷更迭,會越來越注重信息與價值的準(zhǔn)確與高效,這也就意味著推薦系統(tǒng)是個無限增長且沒有最優(yōu)解的技術(shù)體系,不斷進(jìn)化是它的特點(diǎn),因此理解用戶的能力也會不斷地深入,這樣持續(xù)洞察探索推薦的新趨勢和方向,會為用戶帶來新一代的交互體驗(yàn)與價值賦能。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機(jī)“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。