精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>

<abbr id="ixlwe"></abbr>

直播
榜單
7x24h快訊

極客網(wǎng) > 人工智能 >

如何使用MindStudio輕松搞定大模型全流程開發(fā)

人閱讀
2024-01-18 17:52:38
來源：極客網(wǎng)
相關(guān)關(guān)鍵詞

大模型的規(guī)模和能力在迅猛發(fā)展，更大的參數(shù)、更長的序列及更多的模態(tài)是未來大模型技術(shù)的發(fā)展趨勢。更大的規(guī)模的模型意味著更大規(guī)模的算力平臺，算力設(shè)備的部件與任務(wù)之間的復(fù)雜關(guān)系導(dǎo)致調(diào)試調(diào)優(yōu)的復(fù)雜度增加，需要系統(tǒng)的管理和收集訓(xùn)練過程中各維度數(shù)據(jù)，才能快速鎖定模型精度及性能瓶頸，加速大模型訓(xùn)練。

MindStudio全流程開發(fā)工具鏈是華為面向昇騰AI開發(fā)者提供的一站式開發(fā)環(huán)境和工具集。針對大模型分布式訓(xùn)練復(fù)雜場景，MindStudio提供了從大模型遷移到精度調(diào)試到性能調(diào)優(yōu)的統(tǒng)一工具能力，幫助開發(fā)者輕松get大模型開發(fā)密碼。

一、模型遷移

由于不同硬件體系之間處理器架構(gòu)、模型腳本存在差異性，基于GPU硬件體系原生開發(fā)的開源大模型，要想在昇騰處理器上運行，首先需要進行模型的遷移。

那么模型遷移主要遷哪些東西呢？

模型腳本的基本組成元素主要為“算子、API、三方庫”，通常在框架層會通過這幾個核心元素來搭建模型腳本，所以模型遷移的實質(zhì)也是對“算子、API、三方庫”的遷移。

以同框架下遷移場景為例，MindStudio遷移工具會自動掃描并完成“算子、API、三方庫”兼容性分析，同時完成腳本代碼替換，并在遷移完成后生成評估報告，報告中會詳細說明替換信息以及是否存在無法直接替換的元素，譬如用戶自定義的算子。整個遷移過程僅需要幾分鐘。

二、精度調(diào)試

精度決定了大模型預(yù)測的準確性，因此精度調(diào)試是大模型訓(xùn)練的關(guān)鍵步驟之一。

為了幫助開發(fā)人員快速解決算子精度問題，MindStudio通過溢出檢測、精度比對等核心工具，提供了自有實現(xiàn)的算子運算結(jié)果與業(yè)界標準算子運算結(jié)果之間進行多維度的精度差異對比的能力，提升訓(xùn)練精度調(diào)測效率，單機和集群的精度問題定位時間縮短至周級。

精度預(yù)檢：預(yù)檢避免了常見精度工具在規(guī)模集群下的困境、對數(shù)據(jù)dump的依賴以及對整網(wǎng)累計誤差的感知。在預(yù)檢過程中，可以通過輕量化的流程提取單API統(tǒng)計量信息，同時，根據(jù)統(tǒng)計信息隨機生成數(shù)據(jù)輸入在NPU上運行，最大程度還原真實訓(xùn)練場景。最終根據(jù)相對誤差、絕對誤差等指標綜合判定API精度是否達標，并提供真值比對選項，輸出評估報告。以上預(yù)檢流程可以在小時級的時間內(nèi)完成，在訓(xùn)前就解決80%以上的算子及API精度問題。

溢出檢測：應(yīng)對大模型開發(fā)過程中產(chǎn)生大量溢出以及溢出導(dǎo)致參數(shù)不斷更新等復(fù)雜問題。通過溢出問題性質(zhì)自動分類、典型溢出問題自動分析等能力，輸出問題算子報告并提供專家處理建議。

三、性能調(diào)優(yōu)

大模型領(lǐng)域性能是一個非常受到關(guān)注的指標，一個大模型的訓(xùn)練可能需要成百上千張卡，耗時數(shù)個月才能完成，性能上的優(yōu)化能直接且顯著地降低訓(xùn)練成本。

同時，大模型領(lǐng)域的性能調(diào)優(yōu)存在很多挑戰(zhàn)，譬如：采集數(shù)據(jù)量大、解析耗時長、TimeLine數(shù)據(jù)量限制、缺少自動拆解比對工具、卡間同步、慢卡慢鏈路等。

MindStudio提供了系統(tǒng)級的集群性能調(diào)優(yōu)能力，通過性能問題拆解、多維可視化Profiling及集群數(shù)據(jù)多界面可視化能力，幫助開發(fā)者迅速鎖定性能瓶頸。

性能拆解：將訓(xùn)練數(shù)據(jù)拆解為“通信、算子、調(diào)度、內(nèi)存”四個維度，通過對訓(xùn)練耗時和內(nèi)存占用的比對分析，定位到具體劣化的算子，良好地解決性能數(shù)據(jù)timeline信息量巨大用戶難以入手、算子詳細信息及搬運內(nèi)存信息多等問題，用戶可直接確認性能的主要瓶頸。

多維可視化Profiling：針對PyTorch框架開發(fā)的性能數(shù)據(jù)采集和解析，提供Ascend PyTorch Profiler性能采集接口。用戶通過在PyTorch訓(xùn)練腳本中插入Ascend PyTorch Profiler接口，執(zhí)行訓(xùn)練的同時采集性能數(shù)據(jù)，完成訓(xùn)練后直接輸出可視化的性能數(shù)據(jù)文件，支持單次加載多組數(shù)據(jù)并可靈活比對，內(nèi)存級Profiling展示性能遠超原社區(qū)水平。同時，工具中提供了Tensorboard可視化、算子級內(nèi)存Profiling兩個功能，支持調(diào)用棧、算子信息關(guān)聯(lián)，幫助開發(fā)者在代碼層級細粒度鎖定性能瓶頸。

集群數(shù)據(jù)多界面可視化：提供集群可視化調(diào)優(yōu)工具Ascend Insight來提升大模型集群性能調(diào)優(yōu)效率。通過Ascend Insight提供Timeline流水視圖、Memory視圖、Operator視圖、Summary視圖等多維視圖分析幫助用戶快速發(fā)現(xiàn)異常點，識別性能瓶頸：

1）Timeline流水視圖：支持多卡匯聚、按層過濾、數(shù)據(jù)對比、單卡時間校準、算子搜索以及統(tǒng)計信息

2）Memory視圖：支持內(nèi)存占用折線圖，含進程級預(yù)留、算子級預(yù)留以及算子級占用。用戶可以根據(jù)折線圖找到峰值的內(nèi)存占用點，并獲取到對應(yīng)的算子明細。

3）Operator視圖：支持通過分析算子耗時統(tǒng)計及詳情信息，快速找到計算性能瓶頸點。

4）Summary視圖：支持通信/計算耗時分析以及PP場景耗時分析，基于拓撲和并行策略，結(jié)合可視分析鏈路進行調(diào)度分析，定位通信慢、計算慢等性能問題。

結(jié)語

以上完整地介紹了MindStudio全流程開發(fā)工具鏈如何通過大模型遷移、精度調(diào)試、性能調(diào)優(yōu)三大步驟，支持用戶以低成本快速提升百億千億大模型訓(xùn)練性能，提高開發(fā)效率。欲了解更多詳情，請參閱： MindStudio-昇騰社區(qū) (hiascend.com)

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性，但不保證有關(guān)資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）

為您推薦

極客觀察

欄目相關(guān)

贊助商

極客網(wǎng)熱搜關(guān)鍵詞

人工智能 AI OpenAI 機器學(xué)習(xí) ChatGPT 生成式AI AI芯片 AIGC U-Mail AI大模型世界人工智能大會 AIoT AirPods Airbnb Rushmail 人工智能AI AI人工智能 Akamai 昇騰AI 生成式人工智能 AIPC Air AI技術(shù) 谷歌AI 蘋果AI GenAI 科大訊飛AI學(xué)習(xí)機百度AI CAICT 阿爾法蛋AI詞典筆T10 AI手機華為AI 松鼠AI 微軟AI AI+ AIS Airdoc WAIC 昇騰AI創(chuàng)新大賽 AITO 智譜AI 阿爾法蛋AI詞典筆京東AI AI模型 SoleusAir aigo SoleusAir舒樂氏 2019世界人工智能大會 LIFAair AI機器人 AI創(chuàng)企人工智能大會移動AI時代浙大AIF Zain AI醫(yī)療 AI算力人工智能技術(shù) AI應(yīng)用 xAI 人工智能芯片 AI人才 Airtag AI時代 AI服務(wù)器騰訊AI AI算法 BrainCo AI投資 AI框架 Gmail 人工智能計算中心聯(lián)想AI VAIO AI教育 Chain 人工智能大賽 Coremail AI賦能谷歌人工智能 OPENAIGC開發(fā)者大賽 Airwallex空中云匯人工智能名片 Airwheel AI搜索 Mirai 人工智能機器人昇騰AI開發(fā)者創(chuàng)享日 AI音樂 AI聊天機器人 BrainCo強腦科技阿爾法蛋AI詞典筆T20 百度人工智能 AI原生應(yīng)用阿里AI AI計算 AI基礎(chǔ)設(shè)施英偉達AI芯片 AIOps 人工智能+

上一篇

周鴻祎與傅盛決裂16年后大和解兩人將同框聊大模型

下一篇

順網(wǎng)科技在算力及AI兩大業(yè)務(wù)板塊推出全新產(chǎn)品及業(yè)務(wù)

簡版
原版
投稿
回頂部

2024-01-18

如何使用MindStudio輕松搞定大模型全流程開發(fā)

MindStudio全流程開發(fā)工具鏈是華為面向昇騰AI開發(fā)者提供的一站式開發(fā)環(huán)境和工具集。針對大模型分布式訓(xùn)練復(fù)雜場景，MindStudio提供了從大模型遷移到精度調(diào)試到性能調(diào)優(yōu)的統(tǒng)一工具能力，幫助開發(fā)者輕松get大模型開發(fā)密碼。

長按掃碼閱讀全文

<strike id="hwwvr"></strike>

<input id="hwwvr"><em id="hwwvr"></em></input>

<u id="hwwvr"></u>

<big id="hwwvr"><acronym id="hwwvr"></acronym></big>