10月9日,美圖公司舉辦15周年生日會并發(fā)布自研AI視覺大模型MiracleVision(奇想智能)3.0版本。面世100天后,美圖AI視覺大模型MiracleVision3.0將全面應(yīng)用于美圖旗下影像與設(shè)計產(chǎn)品,并將助力電商、廣告、游戲、動漫、影視五大行業(yè)。
美圖視覺大模型的100天進(jìn)化:奇思妙想與智能創(chuàng)作
在美圖公司15周年生日會現(xiàn)場,美圖公司創(chuàng)始人、董事長兼首席執(zhí)行官吳欣鴻發(fā)布了自研AI視覺大模型MiracleVision3.0版本。
美圖公司創(chuàng)始人、董事長兼首席執(zhí)行官吳欣鴻
吳欣鴻介紹說,三個月前,MiracleVision繪畫水平還停留在初級階段,如今3.0版本已經(jīng)能描繪出真實(shí)細(xì)膩的畫面細(xì)節(jié),目前用戶可以訪問AI視覺創(chuàng)作工具“WHEE”官網(wǎng)體驗(yàn)。
吳欣鴻將自己15歲的繪畫作品與面世100天的美圖視覺大模型生成作品進(jìn)行對比,他認(rèn)為訓(xùn)練AI與人類學(xué)畫有很多共通之處,通過充分學(xué)習(xí)不同的繪畫風(fēng)格和技巧,AI能創(chuàng)作出具有獨(dú)特性的原創(chuàng)作品。
美圖公司將自研AI視覺大模型MiracleVision(奇想智能)的核心能力拆解為“奇思妙想”和“智能創(chuàng)作”兩大特性。
在“奇思妙想”層面,MiracleVision通過“提示詞智能聯(lián)想”功能降低大眾的使用門檻,當(dāng)用戶輸入關(guān)鍵詞,MiracleVision可自動補(bǔ)充相關(guān)表述,如光影效果、質(zhì)感、風(fēng)格、圖片質(zhì)量等,推動創(chuàng)作平權(quán)。此外,MiracleVision通過“提示詞精準(zhǔn)控制”功能來滿足更加專業(yè)的設(shè)計要求,如使用“近景”、“遠(yuǎn)景”、“順光”、“逆光”等描述控制最終生成效果。
在“智能創(chuàng)作”層面,MiracleVision通過“深化創(chuàng)作”功能,可以進(jìn)一步豐富作品細(xì)節(jié)和提升表現(xiàn)力。通過“AI畫面擴(kuò)展”功能讓作品尺寸更大、細(xì)節(jié)更豐富。通過“局部修改”功能,對部分畫面進(jìn)行精準(zhǔn)修改與調(diào)整。通過“分辨率提升”功能生成高清大圖,讓細(xì)節(jié)表現(xiàn)、色彩展示、物體辨識更加的精準(zhǔn)和生動。
助力電商、廣告、游戲、動漫、影視五大行業(yè)
在吳欣鴻看來,AI視覺大模型帶來的不僅僅是更好的視覺呈現(xiàn),還有對工作流的效率提升,但目前大模型與工作流的結(jié)合仍在探索階段,抓住應(yīng)用場景的核心需求更為重要。
吳欣鴻介紹說,MiracleVision將落地電商、廣告、游戲、動漫、影視五大行業(yè),希望能幫助五大行業(yè)“工作流提效”。
在電商行業(yè),從涂鴉生成線稿、線稿上色、商品圖、模特試穿圖,再到電商物料輸出,全程可通過MiracleVision實(shí)現(xiàn)。
在廣告行業(yè),MiracleVision覆蓋創(chuàng)意腦暴、創(chuàng)意深化、平面排版、多尺寸延展、線下投放預(yù)覽的全工作流,助力客戶在廣告物料制作環(huán)節(jié)提效。
在游戲行業(yè),MiracleVision可以包攬場景設(shè)計、角色設(shè)計、道具設(shè)計、UI圖標(biāo)、宣發(fā)物料等流程,拓寬設(shè)計師想象空間的同時助力游戲行業(yè)降本。
在動漫行業(yè),MiracleVision打通了概念設(shè)計、故事板生成、線稿上色、動漫補(bǔ)幀、視頻轉(zhuǎn)動漫等流程,支持創(chuàng)意到物料成品的快速落地。
在影視行業(yè),MiracleVision的高可控性可充分滿足概念場景設(shè)計、分鏡設(shè)計、人物造型、道具設(shè)計、宣發(fā)物料的效果要求,極大提升影視行業(yè)設(shè)計環(huán)節(jié)的效率。
吳欣鴻表示,MiracleVision將充分發(fā)揮奇思妙想、智能創(chuàng)作的能力,在上述五大行業(yè)深耕,持續(xù)助力更多的設(shè)計場景。
視覺大模型應(yīng)用普及將在2026-2030年走向成熟期
活動現(xiàn)場,吳欣鴻還分享了對于AI視覺大模型的思考?!癆I視覺大模型的本質(zhì),是無窮無盡的視覺創(chuàng)意庫。應(yīng)用層相當(dāng)于內(nèi)容提取器,根據(jù)用戶的需求,從這個巨大的創(chuàng)意庫中提取所需要的內(nèi)容,讓用戶在特定場景中使用。AI視覺大模型和應(yīng)用之間相輔相成,大模型為應(yīng)用提供技術(shù)支撐,應(yīng)用反哺大模型的效果迭代。”
吳欣鴻表示,目前AI視覺大模型在生產(chǎn)端的三個待解決的問題是:垂直領(lǐng)域的極致效果、工作流整合、變現(xiàn)能力。隨著AI視覺大模型和生產(chǎn)端的磨合,這三個問題會被逐步解決。
在吳欣鴻看來,視覺大模型應(yīng)用普及將經(jīng)歷三個階段:2024年之前為探索期,2024-2025年為高速發(fā)展期,2026-2030年為成熟期,隨著視覺大模型在生產(chǎn)端的應(yīng)用走向成熟,視覺大模型將助力千萬設(shè)計場景,引領(lǐng)美學(xué)的升級與社會經(jīng)濟(jì)增長。
此外,美圖公司還公布了6月19日發(fā)布的影像生產(chǎn)力工具最新數(shù)據(jù):AI視覺創(chuàng)作工具“WHEE”的優(yōu)質(zhì)AI效果生成數(shù)已超過550萬張,打造的設(shè)計師生態(tài)也初見成效;AI口播視頻工具“開拍”月活躍用戶數(shù)已突破35萬;桌面端AI視頻編輯工具“WinkStudio”已累計服務(wù)近10萬名視頻創(chuàng)作者;主打AI商業(yè)設(shè)計的“美圖設(shè)計室”正助力近百萬中小電商賣家降本增效;美圖AI助手“RoboNeo”每天幫助近萬名用戶自動修圖,比傳統(tǒng)修圖效率提升35%;AI數(shù)字人生成工具“DreamAvatar”于8月底上線并主打“AI演員”數(shù)字人服務(wù)。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- GitLab將停止為中國區(qū)用戶提供服務(wù),建議遷移到極狐,不遷或被刪賬號
- SUSE發(fā)布2025年技術(shù)趨勢預(yù)測:私有AI平臺的采用將會增加
- 重新定義金融服務(wù)體驗(yàn) 奇富科技發(fā)布AI伴侶 “小奇”
- 大模型創(chuàng)企階躍星辰完成數(shù)億美元B輪融資 騰訊投資、啟明創(chuàng)投等有投資
- 百川智能發(fā)布全鏈路領(lǐng)域增強(qiáng)金融大模型Baichuan4-Finance,整體準(zhǔn)確率領(lǐng)先GPT-4o近20%
- 央視曝光未成年人可輕松繞開“防沉迷”系統(tǒng):租號玩游戲最低僅需4元
- 知乎發(fā)布2024“年度十問”:《黑神話:悟空》、諾貝爾物理學(xué)獎等問題在列
- 李斌回應(yīng)螢火蟲三重奏大燈設(shè)計:沒有參考iPhone
- 一周熱點(diǎn)匯總:特斯拉下月量產(chǎn)改款Model Y,阿里“甩賣”銀泰
- 蔚來第三品牌firefly螢火蟲首款車型正式亮相 預(yù)售價14.88萬元
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。