精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>
  • <span id="ixlwe"></span>

  • <abbr id="ixlwe"></abbr>

    豆包視頻生成大模型正式發(fā)布,首次突破多主體互動(dòng)難關(guān)

    字節(jié)跳動(dòng)正式宣告進(jìn)軍AI視頻生成。9月24日,字節(jié)跳動(dòng)旗下火山引擎在深圳舉辦AI創(chuàng)新巡展,一舉發(fā)布了豆包視頻生成-PixelDance、豆包視頻生成-Seaweed兩款大模型,面向企業(yè)市場(chǎng)開(kāi)啟邀測(cè)。

    活動(dòng)現(xiàn)場(chǎng)展示的視頻生成效果令人驚嘆。無(wú)論是語(yǔ)義理解能力,多個(gè)主體運(yùn)動(dòng)的復(fù)雜交互畫(huà)面,還是多鏡頭切換的內(nèi)容一致性,豆包視頻生成大模型均達(dá)到業(yè)界先進(jìn)水平?;鹕揭婵偛米T待表示,“視頻生成有很多難關(guān)亟待突破。豆包兩款模型會(huì)持續(xù)演進(jìn),在解決關(guān)鍵問(wèn)題上探索更多可能性,加速拓展AI視頻的創(chuàng)作空間和應(yīng)用落地?!?/p>

    火山引擎總裁譚待發(fā)布豆包視頻生成模型

    創(chuàng)新技術(shù),破解多主體互動(dòng)和一致性難題

    此前視頻生成模型大多只能完成簡(jiǎn)單指令,豆包視頻生成模型則能實(shí)現(xiàn)自然連貫的多拍動(dòng)作與多主體復(fù)雜交互。有創(chuàng)作者在搶鮮體驗(yàn)豆包視頻生成模型時(shí)發(fā)現(xiàn),其生成的視頻不僅能夠遵循復(fù)雜指令,讓不同人物完成多個(gè)動(dòng)作指令的互動(dòng),人物樣貌、服裝細(xì)節(jié)甚至頭飾在不同運(yùn)鏡下也保持一致,接近實(shí)拍效果。

    據(jù)火山引擎介紹,豆包視頻生成模型基于 DiT 架構(gòu),通過(guò)高效的DiT融合計(jì)算單元,讓視頻在大動(dòng)態(tài)與運(yùn)鏡中自由切換,擁有變焦、環(huán)繞、平搖、縮放、目標(biāo)跟隨等多鏡頭語(yǔ)言能力。全新設(shè)計(jì)的擴(kuò)散模型訓(xùn)練方法更是攻克了多鏡頭切換的一致性難題,在鏡頭切換時(shí)可同時(shí)保持主體、風(fēng)格、氛圍的一致性,這也是豆包視頻生成模型獨(dú)樹(shù)一幟的技術(shù)創(chuàng)新。

    經(jīng)過(guò)剪映、即夢(mèng)AI等業(yè)務(wù)場(chǎng)景打磨和持續(xù)迭代,豆包視頻生成模型具備專(zhuān)業(yè)級(jí)光影布局和色彩調(diào)和,畫(huà)面視覺(jué)極具美感和真實(shí)感。深度優(yōu)化的Transformer結(jié)構(gòu),則大幅提升了豆包視頻生成的泛化能力,支持3D動(dòng)畫(huà)、2D動(dòng)畫(huà)、國(guó)畫(huà)、黑白、厚涂等多種風(fēng)格,適配電影、電視、電腦、手機(jī)等各種設(shè)備的比例,不僅適用于電商營(yíng)銷(xiāo)、動(dòng)畫(huà)教育、城市文旅、微劇本等企業(yè)場(chǎng)景,也能為專(zhuān)業(yè)創(chuàng)作者和藝術(shù)家們提供創(chuàng)作輔助。

    目前,新款豆包視頻生成模型正在即夢(mèng)AI內(nèi)測(cè)版小范圍測(cè)試,未來(lái)將逐步開(kāi)放給所有用戶(hù)。剪映和即夢(mèng)AI市場(chǎng)負(fù)責(zé)人陳欣然認(rèn)為,AI能夠和創(chuàng)作者深度互動(dòng),共同創(chuàng)作,帶來(lái)很多驚喜和啟發(fā),即夢(mèng)AI希望成為用戶(hù)最親密和有智慧的創(chuàng)作伙伴。

    豆包大模型推出業(yè)界最高并發(fā)流量標(biāo)準(zhǔn)

    此次活動(dòng)中,豆包大模型不僅新增視頻生成模型,還發(fā)布了豆包音樂(lè)模型和同聲傳譯模型,已全面覆蓋語(yǔ)言、語(yǔ)音、圖像、視頻等全模態(tài),全方位滿(mǎn)足不同行業(yè)和領(lǐng)域的業(yè)務(wù)場(chǎng)景需求。

    在產(chǎn)品能力日益完善的同時(shí),豆包大模型的使用量也在極速增長(zhǎng)。據(jù)火山引擎披露,截至9月,豆包語(yǔ)言模型的日均tokens使用量超過(guò)1.3萬(wàn)億,相比5月首次發(fā)布時(shí)猛增十倍,多模態(tài)數(shù)據(jù)處理量也分別達(dá)到每天5000萬(wàn)張圖片和85萬(wàn)小時(shí)語(yǔ)音。

    此前,豆包大模型公布低于行業(yè)99%的定價(jià),引領(lǐng)國(guó)內(nèi)大模型開(kāi)啟降價(jià)潮。譚待認(rèn)為,大模型價(jià)格已不再是阻礙創(chuàng)新的門(mén)檻,隨著企業(yè)大規(guī)模應(yīng)用,大模型支持更大的并發(fā)流量正在成為行業(yè)發(fā)展的關(guān)鍵因素。

    據(jù)譚待介紹,業(yè)內(nèi)多家大模型目前最高僅支持300K甚至100K的TPM(每分鐘token數(shù)),難以承載企業(yè)生產(chǎn)環(huán)境流量。例如某科研機(jī)構(gòu)的文獻(xiàn)翻譯場(chǎng)景,TPM峰值為360K,某汽車(chē)智能座艙的TPM峰值為420K,某AI教育公司的TPM峰值更是達(dá)到630K。為此,豆包大模型默認(rèn)支持800K的初始TPM,遠(yuǎn)超行業(yè)平均水平,客戶(hù)還可根據(jù)需求靈活擴(kuò)容。

    “在我們努力下,大模型的應(yīng)用成本已經(jīng)得到很好解決。大模型要從卷價(jià)格走向卷性能,卷更好的模型能力和服務(wù)?!弊T待表示。

    免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀(guān)察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀(guān)點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

    免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

    2024-09-24
    豆包視頻生成大模型正式發(fā)布,首次突破多主體互動(dòng)難關(guān)
    豆包視頻生成大模型正式發(fā)布,首次突破多主體互動(dòng)難關(guān)

    長(zhǎng)按掃碼 閱讀全文