近年來,自動(dòng)化機(jī)器學(xué)習(xí)(AutoML)因可大幅降低機(jī)器學(xué)習(xí)的門檻和人力成本受到了學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注。其在超參數(shù)優(yōu)化、模型選擇、神經(jīng)網(wǎng)絡(luò)搜索和特征工程等方面顯示出其強(qiáng)大的功能。隨著探智立方全新AutoML產(chǎn)品DarwinML的上線,將進(jìn)一步推動(dòng)國(guó)內(nèi)自動(dòng)建模平臺(tái)的應(yīng)用進(jìn)程。
傳統(tǒng)上,術(shù)語(yǔ)AutoML用于描述模型選擇和/或超參數(shù)優(yōu)化的自動(dòng)化方法。這些方法適用于許多類型的算法,例如隨機(jī)森林、神經(jīng)網(wǎng)絡(luò)等。說白了,AutoML 最核心的內(nèi)容其實(shí)就是用計(jì)算力和數(shù)學(xué)方法自動(dòng)做數(shù)據(jù)特征提取以及模型建模。
AutoML 被認(rèn)為是降低機(jī)器學(xué)習(xí)工作門檻,讓 AI 真正推動(dòng)行業(yè)變革的重要一環(huán)。探智立方的產(chǎn)品,可以讓各領(lǐng)域的專家們僅需專業(yè)知識(shí)和數(shù)據(jù),就能完成機(jī)器學(xué)習(xí)復(fù)雜算法的開發(fā)。
在 2017 年谷歌剛剛推出 AutoML 工具的時(shí)候,「AutoML」還僅有機(jī)器學(xué)習(xí)模型自動(dòng)化的意思。而現(xiàn)在,人們已經(jīng)普遍認(rèn)為 AutoML 需要貫穿機(jī)器學(xué)習(xí)的整個(gè)流程:從數(shù)據(jù)清洗開始、特征工程、到模型的生成,甚至包括模型評(píng)估,所有階段都包括在了 AutoML 的范疇之內(nèi)。
這也為機(jī)器學(xué)習(xí)自動(dòng)化提出了更高的要求。「探智立方的DarwinML自動(dòng)建模平臺(tái)可以把開發(fā)者構(gòu)建模型的時(shí)間從若干周減少到一天,甚至僅僅幾個(gè)小時(shí),」探智立方產(chǎn)品總監(jiān)宋煜說道?!付F(xiàn)在,數(shù)據(jù)整理的工作也可以自動(dòng)化了,甚至數(shù)據(jù)特征工程也可以嵌入到整個(gè)模型設(shè)計(jì)過程中去。對(duì)于開發(fā)者來說,這些事可以在不被感知到的情況下完成,人們無需關(guān)心它們是如何被處理的?!?/p>
「如何在數(shù)據(jù)缺乏整理,或內(nèi)容過多、缺少標(biāo)注的情況下構(gòu)建高效的 AI 模型,驗(yàn)證商業(yè)模式是否可行,是機(jī)器學(xué)習(xí)落地的最大挑戰(zhàn)。」宋煜說道。
探智立方的自動(dòng)建模平臺(tái)面向機(jī)器學(xué)習(xí)模型和深度學(xué)習(xí)模型,在已有工具的基礎(chǔ)上進(jìn)行了大幅度改進(jìn)。在數(shù)據(jù)自動(dòng)分析工具 DarwinML Data Fusion 中,人們可以通過圖形化界面,拖拉拽的形式控制系統(tǒng)自動(dòng)整理數(shù)據(jù)。經(jīng)過整理的數(shù)據(jù)不光在探智立方的平臺(tái)上,在任何其他機(jī)器學(xué)習(xí)平臺(tái)中都是可用的。
在核心產(chǎn)品 DarwinML Studio 中,探智立方新增了大量特征工程擴(kuò)展,帶來更為豐富的自動(dòng)化能力,讓「設(shè)計(jì)大腦」變得聰明,其中還包括數(shù)據(jù)增強(qiáng)和自動(dòng)標(biāo)注技術(shù)。此外,探智立方還對(duì)模型的結(jié)構(gòu)生成進(jìn)行了進(jìn)一步優(yōu)化,使其效率更高。
「國(guó)內(nèi)絕大多數(shù)企業(yè)都沒有強(qiáng)大的 AI 開發(fā)團(tuán)隊(duì),DarwinML可以把AI的整個(gè)流程工具化,無需高度專業(yè)的AI建模知識(shí)就可以開展工作?!剐鞂幷f道?!笇?duì)于傳統(tǒng)公司而言,招募 AI 建模的開發(fā)者難度很大。但使用DarwinML就可以很大程度上省去這一過程?!固街橇⒎紻arwinML的出現(xiàn)將進(jìn)一步助推國(guó)內(nèi)自動(dòng)建模平臺(tái)創(chuàng)新應(yīng)用。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )