近日,中國多媒體大會(China Multimedia 2024)在寧夏銀川召開。本次大會由中國圖象圖形學學會(CSIG)、中國計算機學會(CCF)主辦,快手受邀出席大會并分享了其在AI驅動多媒體創(chuàng)新方面的前沿技術和應用案例。
會上,快手副總裁、大模型團隊負責人張迪發(fā)表《可靈AI視覺生成大模型及應用》主題演講。他表示,一直以來,快手夯實基座模型硬實力,持續(xù)堅持技術創(chuàng)新,在大模型領域不斷突破。張迪進一步分享了快手快意大語言模型、可圖文生圖模型、可靈文生視頻模型、語音大模型等關鍵技術的最新進展。
張迪介紹,快手將通過“升級理解、創(chuàng)新互動、探索生成”的大模型應用策略,在內容生產方面,打造“新一代AIGC創(chuàng)作、素材工具”和低門檻、智能化的內容生產體驗;在內容消費領域,升級快手的內容理解和分發(fā)體系,提升用戶的消費體驗。
值得一提的是,本次多媒體專委全體委員會議的一項重要議程是進行了多媒體專委常委增選,按照流程,經候選常務委員申請陳述、現(xiàn)場委員咨詢和專委執(zhí)行委員投票選舉,張迪增選為中國計算機多媒體技術專業(yè)委員會常務委員。
在大會“未來視覺信息編碼與智能技術”專題論壇上,快手音視頻算法專家谷嘉文還圍繞《智能編解碼前沿探索與形態(tài)》主題,進行了重點分享。
隨著深度學習和大模型的火熱,其在視頻編解碼領域的應用也受到業(yè)界的持續(xù)關注。當前,深度學習算法在視頻編解碼壓縮上發(fā)展迅速。然而,受限于昂貴的端上算力,智能編解碼方向的應用和普及還存在一些距離。
對此,谷嘉文結合快手研發(fā)成果和線上業(yè)務場景,深入介紹了智能算法在音視頻全鏈路上的應用,包含KVQ、快手KEP/KRP增強、KVC編碼器等多項技術。在此基礎上,他進一步介紹了端到端技術在處理和編解碼核算法上的優(yōu)化技術,并分享了當前一些可行性方向的探索和對未來智能編解碼形態(tài)的展望。
除了用AI重塑平臺內容與商業(yè)生態(tài)、堅定地為用戶做最好的AI技術外,快手也構建起日益完善的AI產學研生態(tài),與行業(yè)學會、頂尖院校等多方聯(lián)合共建,大力推動技術創(chuàng)新與產業(yè)發(fā)展。
以大模型、編解碼等技術創(chuàng)新和應用為核心,快手多年來持續(xù)推動產學研合作。在2024世界人工智能大會期間,CCF宣布與快手共同成立“CCF-快手大模型探索者基金”,并同步開啟基金申請通道。該基金計劃于年內推出12個研究項目,課題最高可獲30萬元支持,旨在應對AI技術迅猛發(fā)展的趨勢及業(yè)界對前沿技術的迫切需求,聚焦新一代大模型的關鍵技術研發(fā)。
快手的技術創(chuàng)新與研究成果也持續(xù)獲得多媒體行業(yè)大獎的高度認可。在本屆大會上,快手視頻編解碼關鍵技術(KVC)獲得“中國多媒體企業(yè)創(chuàng)新技術獎”。而在CCF多媒體技術專業(yè)委員會、CSIG多媒體專業(yè)委員會共同舉辦的中國多媒體30年紀念活動中,快手更是榮膺“中國多媒體優(yōu)秀服務貢獻企業(yè)”。
面向未來,快手將繼續(xù)加大在AI領域的投入,大力推動技術創(chuàng)新和成果轉化,促進產學研生態(tài)進一步完善,攜手多方共建繁榮發(fā)展的多媒體技術研發(fā)與產業(yè)應用新生態(tài)。
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )