5月20日,電商年中大促“618”正式開啟,各家電商平臺(tái)還在忙著統(tǒng)計(jì)首日戰(zhàn)報(bào),大模型價(jià)格戰(zhàn)已經(jīng)率先打響,甚至比618還要猛烈。
21日上午,阿里云拋出重磅炸彈,通義千問GPT-4級主力模型Qwen-Long,API(應(yīng)用程序編程接口)輸入價(jià)格從0.02元/千Tokens降至0.0005元/千Tokens,直降97%,相當(dāng)于GPT-4價(jià)格的約1/400。
上周,字節(jié)跳動(dòng)發(fā)布豆包大模型,并宣布豆包通用模型pro-32k版的推理輸入價(jià)格為0.0008元/千Tokens,首次將大模型價(jià)格帶入“厘時(shí)代”。如今,通義千問的價(jià)格比豆包大模型還要便宜。
按照上述價(jià)格計(jì)算,1元能買到豆包主力模型的125萬Tokens,相當(dāng)于3本《三國演義》,而1元也可以買到通義千問主力模型的200萬Tokens,相當(dāng)于5本《新華字典》。
這還沒完,當(dāng)天下午,百度直接宣布,旗下兩款大模型ERNIE Speed、ERNIE Lite免費(fèi)。這兩款產(chǎn)品是今年3月百度推出的“輕量級”大模型,相比通用大模型,輕量級大模型的推理成本也會(huì)更低。
那么,問題來了,字節(jié)、阿里、百度三家大廠已相繼宣布大模型降價(jià),騰訊會(huì)不會(huì)跟進(jìn)?
日前,騰訊云副總裁、騰訊云智能負(fù)責(zé)人吳運(yùn)聲在接受采訪時(shí),沒有明確回答是否會(huì)加入大模型價(jià)格戰(zhàn),他表示,“騰訊更關(guān)注大模型能力的提升,致力于為行業(yè)提供能力和價(jià)格兼具的產(chǎn)品。”
從卷技術(shù)到卷價(jià)格
前兩年,大模型公司還沉浸在拼參數(shù)量、拼文本長度。今年以來,整個(gè)行業(yè)從卷技術(shù)到卷價(jià)格,大模型降價(jià)已成趨勢。
在字節(jié)等大廠紛紛宣布降價(jià)之前,已經(jīng)有不少廠商下調(diào)大模型使用價(jià)格。
5月6日,AI公司DeepSeek發(fā)布全新第二代MoE大模型DeepSeek-V2,該模型API定價(jià)為:每百萬Tokens輸入1元、輸出2元(32K上下文),僅是GPT-4的近百分之一。
5月11日,智譜大模型官宣新的價(jià)格體系,入門級產(chǎn)品GLM-3 Turbo模型調(diào)用價(jià)格從5元/百萬Tokens降至1元/百萬Tokens,降幅高達(dá)80%。
這樣的趨勢,同樣在國外發(fā)生。今年2月底,法國AI公司Mistral AI發(fā)布最新大模型Mistral Large,該模型輸入、輸出價(jià)格比GPT-4 Turbo便宜約20%。
而自去年以來,OpenAI已經(jīng)進(jìn)行了4次降價(jià),其最新發(fā)布的多模態(tài)大模型GPT-4o,不僅性能有了很大提升,價(jià)格也下調(diào)了50%。
降價(jià)背后是大模型結(jié)構(gòu)、訓(xùn)練等成本的持續(xù)優(yōu)化。李彥宏曾在Create 2024百度AI開發(fā)者大會(huì)上透露,與一年前相比,文心大模型推理性能實(shí)現(xiàn)了105倍增長,而推理成本卻降到了原來的1%。
今日,創(chuàng)新工場董事長兼CEO李開復(fù)在接受媒體采訪時(shí)表示,在一定程度上,整個(gè)行業(yè)每年降低10倍推理成本,這是可以期待的,而且是必然也應(yīng)該發(fā)生的?!敖裉炜赡苁翘幵谝粋€(gè)比較低的點(diǎn),但是我覺得如果說以后大約有一年降價(jià)10倍來看的話,這是一個(gè)好消息,對整個(gè)行業(yè)都是好消息?!?/p>
此外,火山引擎總裁譚待也曾表示,市場對降價(jià)的呼聲比較高,平臺(tái)必須把試錯(cuò)成本做到非常低,才能讓大家用起來。只有大的使用量,才能打磨出好模型,也能大幅降低模型推理的單位成本。
為什么要打價(jià)格戰(zhàn)?
現(xiàn)在,大模型還是一個(gè)高投入、低產(chǎn)出的行業(yè),為什么廠商還要打價(jià)格戰(zhàn)?答案也很簡單:加速商業(yè)化落地。
大模型卷到2024年,一個(gè)新的賽季已經(jīng)打響,應(yīng)用場景的落地成為競爭主旋律。大模型定價(jià)的持續(xù)走低有望帶來更快的商業(yè)化落地。
上周,OpenAI、谷歌、字節(jié)跳動(dòng)、騰訊四家大廠相繼披露在大模型領(lǐng)域的最新進(jìn)展,無一不聚焦在應(yīng)用側(cè)。
硬核如OpenAI,對于最新發(fā)布的多模態(tài)大模型GPT-4o,也沒有以往對參數(shù)指標(biāo)的生硬強(qiáng)調(diào),而是選擇集中展示多場景下的用戶體驗(yàn)。這被認(rèn)為是OpenAI加速應(yīng)用落地的表現(xiàn)。
在騰訊云生成式AI產(chǎn)業(yè)應(yīng)用峰會(huì)上,吳運(yùn)聲在談及大模型商業(yè)化的問題時(shí)表示,技術(shù)的突破未來一定會(huì)帶來商業(yè)化的機(jī)會(huì),而且會(huì)呈現(xiàn)跨越式的增長態(tài)勢。AI要真正落地實(shí)用,推理成本的降低、工程性能的極致優(yōu)化至關(guān)重要,是未來商業(yè)化取得突破的重要因素。
當(dāng)天,騰訊集團(tuán)副總裁蔣杰在大會(huì)上宣布,騰訊混元大模型通過持續(xù)迭代,目前整體性能已居國內(nèi)第一梯隊(duì),部分中文能力已追平GPT-4。
值得一提的是,目前大模型的應(yīng)用還在早期階段,仍有很大的發(fā)展空間。QuestMobile數(shù)據(jù)顯示,截至今年3月,基于大模型的AIGC行業(yè)用戶量為7380萬,盡管同比增長了8倍,也僅占移動(dòng)互聯(lián)網(wǎng)用戶量的6%。
海通證券5月17日研報(bào)指出,伴隨國產(chǎn)AI大模型的持續(xù)升級,2024年有望成國產(chǎn)AI大模型全面商業(yè)落地的元年,先進(jìn)的AI大模型能力也將逐漸轉(zhuǎn)化為落地實(shí)際場景的產(chǎn)品應(yīng)用,從而帶動(dòng)AI大模型在金融、教育、法律、醫(yī)療等眾多垂直行業(yè)的持續(xù)落地,AI2B與AI2C的需求天花板也有望全面打開,在這個(gè)過程中,AI的投資也從映射和跟隨,變?yōu)橐I(lǐng)。(周小白)
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )