前不久,娛樂資本論根據(jù)GPT-3.5、訊飛星火、文心一言、通義千問和昆侖萬維天工五款大模型發(fā)布了“萬字橫評”,提出18個問題得出90個回答,最終以測試評分表形式進(jìn)行打分。結(jié)果顯示,GPT-3.5以74分位列第一,訊飛星火以63分位列第二,文心一言以54份位列第三。其測試方法非常接地氣,側(cè)重于實(shí)際文本應(yīng)用場景的演練,更符合文字工作者的實(shí)際工作需求,而不是評測順口溜或回答哲學(xué)問題。
在評測中,文本應(yīng)用場景被分為了小紅書帶貨文案、抖音直播文案、知乎問答等十余類,都是用戶應(yīng)用廣泛、且非常熟悉的文本應(yīng)用場景。如在面向小紅書平臺提交手機(jī)新品的帶貨文案創(chuàng)作中,訊飛星火在prompt未制定手機(jī)型號時,自己假定了一款型號,以幫助人類更好地了解手機(jī)推銷所需的主要指標(biāo),不僅條例清晰、內(nèi)容齊全、而且emoji具有相關(guān)性;與之對比的文心一言和天工大模型在prompt里指明小紅書文案要帶有emoji,但給出的答案卻并沒有。
因此在小紅書文案三類測試中,星火累計(jì)得分高達(dá)11分,而其余國產(chǎn)大模型得分較低。
在虛構(gòu)熱點(diǎn)事件的新聞稿創(chuàng)作中,參與橫評的大模型都要以資深編輯身份,寫一段周杰倫召開鳥巢30場演唱會的800字演講稿。
結(jié)果GPT-3.5等文風(fēng)浮夸,而星火在不給事件細(xì)節(jié)的前提下,不僅虛構(gòu)了合情合理的演唱會主題、階梯式定價以及多種優(yōu)惠政策等描述,還“腦洞大開”寫了一段主辦方推出“虛擬看臺”創(chuàng)新服務(wù)的延展,與當(dāng)下熱門的元宇宙概念緊密相連,成為了唯一一個單項(xiàng)滿分的大模型。而在淘寶商品詳情頁描述文案、廣告片宣傳文案、公關(guān)稿生成等場景應(yīng)用中,訊飛星火在國產(chǎn)大模型中都排名第一。
娛樂資本論強(qiáng)調(diào):“使用AI工具盡可能減少人力投入,是我們做這個橫評的終極目標(biāo)”。通過橫評測試可知,訊飛星火生成文本完成度最高,只需少量人工修改即可使用。所以說訊飛星火能夠幫助記者、編輯、文案、新媒體從業(yè)者以及設(shè)計(jì)師等創(chuàng)作人群利用有限線索、高效創(chuàng)作可用內(nèi)容,實(shí)現(xiàn)事半功倍的效率躍遷。
與此同時從華東師范大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院EduNLP團(tuán)隊(duì)發(fā)布的教育領(lǐng)域大模型測評框架與國內(nèi)大模型評測情況來看,訊飛星火大模型在K12教育領(lǐng)域的總體表現(xiàn)較為出色,在教學(xué)知識與學(xué)生發(fā)展方面的性能對比中,多項(xiàng)任務(wù)性能表現(xiàn)甚至超越了ChatGPT。
過去一個月,筆者也從對訊飛星火的“淺嘗輒止”變成了“愛不釋手”,習(xí)慣用它輔助創(chuàng)意文案創(chuàng)作與編輯類工作開展。
6月6日凌晨,蘋果發(fā)布了首款MR頭顯設(shè)備Vision Pro,這么重磅的新聞非??简?yàn)發(fā)布的時效性。為了加速創(chuàng)作,筆者用訊飛星火來輔助創(chuàng)作了一篇新聞稿,并羅列了四項(xiàng)要求。結(jié)果訊飛星火寫的文章非常工整,涵蓋了豐富的信息,簡單修改就能成稿發(fā)布了,這對于搶首發(fā)流量的媒體工作者來說,大模型就成為了顛覆生產(chǎn)力的輔助工具。
訊飛星火自5月6日發(fā)布以來,距今剛好“滿月”, 無論是權(quán)威媒體橫向評測還是通過筆者的親身使用,可以確定的是,訊飛星火在輔助文案創(chuàng)作、創(chuàng)意文案生成等實(shí)用場景表現(xiàn)出色,絕對是文案、策劃以及編輯等群體的好幫手。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )