精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>

<abbr id="ixlwe"></abbr>

<source id="aic6w"><tbody id="aic6w"></tbody></source>

<center id="aic6w"><strong id="aic6w"></strong></center>

直播
榜單
7x24h快訊

極客網(wǎng) > 7x24h快訊 > 極客快訊 >

MedBench最新評(píng)測(cè)：山海大模型醫(yī)療專業(yè)能力全球第一，各項(xiàng)指標(biāo)力壓GPT-4

人閱讀
2024-06-13 10:18:40
來(lái)源：中華網(wǎng)家電
相關(guān)關(guān)鍵詞
- 山海大模型
- 云知聲

近日，由上海AI實(shí)驗(yàn)室和上海市數(shù)字醫(yī)學(xué)創(chuàng)新中心聯(lián)合推出的MedBench評(píng)測(cè)更新榜單，繼4月份奪冠后，云知聲山海大模型醫(yī)療行業(yè)版(UniGPT-Med)再次以綜合得分82.2的優(yōu)異成績(jī)位列全球第一，各項(xiàng)指標(biāo)全面超越GPT-4，充分展現(xiàn)出山海大模型在擁有業(yè)內(nèi)一流的通用能力之外，更具備打造世界領(lǐng)先的行業(yè)大模型的能力。

MedBench致力于打造一個(gè)科學(xué)、公平且嚴(yán)謹(jǐn)?shù)闹形尼t(yī)療大模型評(píng)測(cè)體系及開放平臺(tái)，其基于醫(yī)學(xué)權(quán)威標(biāo)準(zhǔn)，不斷更新維護(hù)高質(zhì)量的醫(yī)學(xué)數(shù)據(jù)集，全方位多維度量化模型在各個(gè)醫(yī)學(xué)維度的能力。

MedBench的五大評(píng)測(cè)維度——醫(yī)學(xué)語(yǔ)言理解、醫(yī)學(xué)語(yǔ)言生成、醫(yī)學(xué)知識(shí)問答、復(fù)雜醫(yī)學(xué)推理、醫(yī)療安全和倫理，構(gòu)成了其專業(yè)評(píng)測(cè)框架的核心。這一框架吸納了海量醫(yī)學(xué)知識(shí)庫(kù)和醫(yī)院醫(yī)學(xué)專家的豐富經(jīng)驗(yàn)，涵蓋8個(gè)公開數(shù)據(jù)集和12個(gè)自建數(shù)據(jù)集，總計(jì)約30萬(wàn)道中文醫(yī)療專業(yè)測(cè)評(píng)題目，覆蓋了從醫(yī)學(xué)考試題庫(kù)到患者服務(wù)、醫(yī)學(xué)問診、病例分析以及病歷生成等廣泛的醫(yī)學(xué)任務(wù)，致力為中文醫(yī)療大模型提供客觀科學(xué)的性能評(píng)測(cè)參考。

今年5月，MedBench平臺(tái)全面升級(jí)，不僅引入API評(píng)測(cè)方式，豐富了參評(píng)途徑，還優(yōu)化了開放域問答的評(píng)估指標(biāo)。通過醫(yī)學(xué)專家的精準(zhǔn)標(biāo)注，平臺(tái)進(jìn)一步提升了評(píng)測(cè)結(jié)果的公正性和專業(yè)性。同時(shí)，平臺(tái)在數(shù)據(jù)集、評(píng)測(cè)方法和系統(tǒng)功能等方面也進(jìn)行了升級(jí)，旨在為醫(yī)療大模型評(píng)測(cè)構(gòu)建一個(gè)更加完善的社區(qū)環(huán)境，并提供更加豐富、真實(shí)的實(shí)踐場(chǎng)景。

此次評(píng)測(cè)，云知聲山海大模型醫(yī)療行業(yè)版(UniGPT-Med)通過API提交方式，不僅以82.2的綜合得分刷新了MedBench評(píng)測(cè)記錄，更是在各個(gè)維度上力壓GPT-4，排名全球第一。這一成績(jī)的取得，是山海大模型醫(yī)療專業(yè)能力的集中展現(xiàn)，也標(biāo)志著其技術(shù)迭代和創(chuàng)新發(fā)展達(dá)到了一個(gè)新的高度。

目前，山海大模型通用能力已超越GPT-3.5，并在SuperCLUE 4月評(píng)測(cè)中躋身國(guó)內(nèi)大模型Top10;與GPT-4的對(duì)戰(zhàn)中，山海綜合勝率與和率為75.55%。

在醫(yī)療專業(yè)能力上，山海大模型于2023年6月的MedQA任務(wù)中超越Med-PaLM 2，取得87.1%的優(yōu)異成績(jī);在臨床執(zhí)業(yè)醫(yī)師資格考試中以523分(總分600分)的優(yōu)異成績(jī)，超過99%的考生水平;其基于山海大模型孵化的醫(yī)療行業(yè)版大模型，也在CCKS 2023 PromptCBLUE醫(yī)療大模型評(píng)測(cè)中奪得通用賽道一等獎(jiǎng)。

隨著醫(yī)療行業(yè)對(duì)智能化、精準(zhǔn)化服務(wù)需求的不斷增長(zhǎng)，云知聲山海大模型醫(yī)療行業(yè)版(UniGPT-Med)有望在醫(yī)療健康領(lǐng)域扮演更加關(guān)鍵的角色，為提升醫(yī)療服務(wù)效率、優(yōu)化患者體驗(yàn)、推動(dòng)醫(yī)療科技進(jìn)步提供強(qiáng)有力的支持。

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）

極客觀察

贊助商

簡(jiǎn)版
原版
投稿
回頂部

<code id="4yoww"></code>

<menu id="4yoww"><kbd id="4yoww"></kbd></menu>
<samp id="4yoww"><strong id="4yoww"></strong></samp>

<center id="4yoww"><tr id="4yoww"></tr></center>

<code id="4yoww"></code>

<td id="4yoww"></td>

<option id="4yoww"><td id="4yoww"></td></option>