撰文 | 王曉樹
編輯 | 楊博丞
題圖 | IC Photo
大模型時(shí)代,真的來了。
據(jù)貝殼財(cái)經(jīng)消息,國(guó)內(nèi)將有11家大模型陸續(xù)通過《生成式人工智能服務(wù)管理暫行辦法》備案,首批將在8月31日起將陸續(xù)向全社會(huì)公眾開放服務(wù)。其中北京5家,上海3家率先上線,廣東省2家和其他省市1家也將陸續(xù)開放。
據(jù)悉,廣東地區(qū)獲批公司分別為華為、騰訊,科大訊飛系其他地區(qū)獲批產(chǎn)品。
截至發(fā)稿前,可以確定已經(jīng)向全社會(huì)開放的大模型有:百度的文心一言、科大訊飛的訊飛星火認(rèn)知大模型、商湯科技的商量SenseChat、百川智能的百川大模型、智譜AI的智譜清言。
此前,曾橫向評(píng)測(cè)過國(guó)內(nèi)外大模型文心一言、ChatGPT3.5、Bard大模型。在此背景下,對(duì)上述已經(jīng)開放的國(guó)內(nèi)大模型進(jìn)行了橫向評(píng)測(cè),分別就文學(xué)創(chuàng)作、創(chuàng)意、邏輯推理、編程等等方向出題,來看看他們的回答是什么樣子的。
首先從外觀界面來看,這五大模型大同小異,每一個(gè)答案生成后都會(huì)出現(xiàn)“贊同、不贊同、重新生成以及內(nèi)容復(fù)制”的功能按鈕。
唯一有所不同的是智譜清言的右邊有一個(gè)界面是“靈感大全”,其中有一系列的選項(xiàng),包括文章創(chuàng)作、熱點(diǎn)選題、語言翻譯、廣告文案等等。
目前來看,智譜清言的“靈感大全”,是現(xiàn)階段大模型在C端比較成熟的落地方式。目前市面上已經(jīng)出現(xiàn)了不少以大模型為基礎(chǔ)的應(yīng)用APP,其中就分為創(chuàng)作、創(chuàng)意、對(duì)話等板塊。
此外,在生成速度上,就的體驗(yàn)而言,商湯SenseChat大模型在新問題上的生成速度明顯低于其他幾家。
在具體的橫向評(píng)測(cè)前,我們首先跟ChatGPT4.0聊了一下,如何看待中國(guó)11款大模型通過國(guó)家備案向公眾全面開放一事,將給行業(yè)帶來什么影響?
這是大模型“老大哥”的回答,接下來我們來看看文心一言、訊飛星火認(rèn)知大模型、商量SenseChat、百川大模型、智譜清言的回答。
文心一言
訊飛星火大模型
商湯SenseChat
百川大模型
智譜清言
在這個(gè)回答中,這幾大模型都有一個(gè)共同點(diǎn),會(huì)通過幾個(gè)明確的點(diǎn),比較籠統(tǒng)的作答。這不只是國(guó)內(nèi)大模型的回答模式,ChatGPT、Bard都是如此。
只不過,在這些回答中,訊飛的答案稍顯突兀。和其他幾家明顯的“思考”相比,訊飛的答案稍有“問題檢索”的意味。
接下來就看看在相同問題下,這五家大模型的回答分別是什么樣的吧。
1、文學(xué)創(chuàng)作
問題:請(qǐng)用“瞞天過海”做一首藏頭詩。
如果用人的思維去思考這個(gè)問題,有三個(gè)步驟。瞞天過海典故出處,是什么意思以及怎么做藏頭詩。
從生成的結(jié)果來看,唯一滿足“藏頭詩”概念的,就只有商湯SenseChat、百川大模型做到了。其他四個(gè)大模型雖然做了詩,但都沒能理解藏頭詩的意思。
再來看看智譜清言答案,似乎有點(diǎn)“投機(jī)取巧”了。
2、創(chuàng)意
問題:如果要成立一家比較有中國(guó)川菜風(fēng)味的中式餐廳,你可以幫忙取一下名字并且寫一段廣告詞么?
這五大模型都精準(zhǔn)理解了問題的兩大點(diǎn):取名和寫廣告詞。但單從創(chuàng)意上來看,訊飛星火大模型的創(chuàng)意不錯(cuò),還給出了多個(gè)參考。
3、邏輯推理能力
問題:請(qǐng)你運(yùn)用邏輯推理,解決以下問題:“如果貓會(huì)爬樹,那么狗也會(huì)?!?/strong>
文心一言、訊飛星火以及百川大模型和智譜清言沒有掉入這個(gè)邏輯陷阱里,商湯最后卻被繞了進(jìn)去。
4、編程能力
問題:x+2=5,y-3=7,輸出x+y等于幾,用java做一個(gè)簡(jiǎn)單編程,然后得出結(jié)果。
程序猿的福音來了。這幾款大模型都可以快速生成簡(jiǎn)單的代碼。就上述題目而言,這五款大模型給出的代碼都差不多。
就問題的結(jié)果而言,訊飛星火大模型、商湯SenseChat大模型第一次都給出了正確的答案。不過,除了訊飛之外,其他幾個(gè)大模型重新生成幾次后,每次結(jié)果都會(huì)不同。
最后一個(gè)問題,我將“你會(huì)取代人類的崗位么?”拋給了這五個(gè)大模型。他們給出的答案都是不能完全替代。
就筆者而言,大模型的出現(xiàn)其實(shí)就是人類創(chuàng)造的一個(gè)生產(chǎn)工具,只是這個(gè)生產(chǎn)工具開始有了更多更全面的思考。
目前而言,大模型替代人類工作的可能性并不大,只是可以幫助部分崗位提高工作效率。
不過,隨著大模型的廣泛應(yīng)用,它們?cè)谏鐣?huì)中的影響也逐漸擴(kuò)大,涉及到隱私、安全、倫理等多方面的問題。
所以,在越來越多的大模型放開之后的背景下,更需要思考的一個(gè)問題是監(jiān)管該走向何處?
首先,我們需要確保這些模型不會(huì)侵犯?jìng)€(gè)人隱私,不被用于非法或不道德的目的。
其次,模型的決策透明度和可解釋性也變得尤為重要,這可以幫助我們理解模型是如何做出判斷的,以及它可能存在的偏見和不足。
此外,隨著技術(shù)的發(fā)展,我們還需要對(duì)模型的使用進(jìn)行持續(xù)的評(píng)估和監(jiān)督,確保其不會(huì)帶來不可預(yù)測(cè)的社會(huì)風(fēng)險(xiǎn)。
總之,監(jiān)管不僅僅是限制,更多的是為了確保技術(shù)在造福社會(huì)的同時(shí),不帶來潛在的威脅。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 特斯拉CEO馬斯克身家暴漲,穩(wěn)居全球首富寶座
- 阿里巴巴擬發(fā)行 26.5 億美元和 170 億人民幣債券
- 騰訊音樂Q3持續(xù)穩(wěn)健增長(zhǎng):總收入70.2億元,付費(fèi)用戶數(shù)1.19億
- 蘋果Q4營(yíng)收949億美元同比增6%,在華營(yíng)收微降
- 三星電子Q3營(yíng)收79萬億韓元,營(yíng)業(yè)利潤(rùn)受一次性成本影響下滑
- 賽力斯已向華為支付23億,購買引望10%股權(quán)
- 格力電器三季度營(yíng)收同比降超15%,凈利潤(rùn)逆勢(shì)增長(zhǎng)
- 合合信息2024年前三季度業(yè)績(jī)穩(wěn)?。籂I(yíng)收增長(zhǎng)超21%,凈利潤(rùn)增長(zhǎng)超11%
- 臺(tái)積電四季度營(yíng)收有望再攀高峰,預(yù)計(jì)超260億美元刷新紀(jì)錄
- 韓國(guó)三星電子決定退出LED業(yè)務(wù),市值蒸發(fā)超4600億元
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。