人工智能是一個(gè)涵蓋圖像識(shí)別、自然語(yǔ)言處理(NLP)和機(jī)器人等多方面維度的廣泛領(lǐng)域。AI也在以一種有時(shí)看似瘋狂的速度發(fā)展,因此很難跟上正在發(fā)生的一切。
不出所料,許多組織轉(zhuǎn)向他們的IT供應(yīng)商合作伙伴,幫助他們開發(fā)和部署AI解決方案,以最好地滿足他們的需求。大衛(wèi)·埃里森是聯(lián)想公司的高級(jí)人工智能數(shù)據(jù)科學(xué)家,他的職責(zé)包括使用先進(jìn)的人工智能技術(shù)為客戶組織提供解決方案,同時(shí)在內(nèi)部支持聯(lián)想全球數(shù)據(jù)中心集團(tuán)的整體人工智能戰(zhàn)略。
聯(lián)想已投入商業(yè)運(yùn)營(yíng)的項(xiàng)目包括利用卷積神經(jīng)網(wǎng)絡(luò)從圖像中提取特征,并將其歸類為缺陷,以檢測(cè)工廠的制造缺陷。聯(lián)想還為一家賽車公司開發(fā)了一套計(jì)算機(jī)視覺(jué)系統(tǒng),以決定是否應(yīng)該讓特定的汽車進(jìn)入維修站進(jìn)行維修。
埃利森表示,今年和不久的將來(lái),人工智能的主要趨勢(shì)包括基于計(jì)算機(jī)視覺(jué)的應(yīng)用程序、用于訓(xùn)練人工智能模型的數(shù)據(jù)生成和數(shù)據(jù)標(biāo)記算法的開發(fā),以及基于轉(zhuǎn)換模型的自然語(yǔ)言處理的快速進(jìn)展。
聯(lián)想對(duì)人工智能近期主要趨勢(shì)有如下展望:
計(jì)算機(jī)視覺(jué)
在計(jì)算機(jī)視覺(jué)方面,開發(fā)人員和研究人員現(xiàn)在開始探索將這種能力與人工智能的其他一些領(lǐng)域相結(jié)合的實(shí)用方法,比如機(jī)器人技術(shù)或自動(dòng)應(yīng)用圖像字幕等應(yīng)用的自然語(yǔ)言處理。據(jù)埃里森介紹,這部分是因?yàn)橛?jì)算機(jī)視覺(jué)的一些基本問(wèn)題已經(jīng)被證明很難解決,研究人員正在尋找新的方法來(lái)解決這些問(wèn)題,而不是簡(jiǎn)單地推動(dòng)研究領(lǐng)域向前發(fā)展。
埃里森:“我認(rèn)為我們?cè)诮鉀Q一些核心的計(jì)算機(jī)視覺(jué)任務(wù)時(shí)遇到了問(wèn)題,比如3D投影,當(dāng)你看到一張圖片,一棟建筑的二維圖像,人類的大腦可以將其推斷成三維形狀,但機(jī)器很難做到這一點(diǎn)。”在這方面已經(jīng)有很多研究,但這是一個(gè)尚未解決的核心問(wèn)題,我認(rèn)為人們會(huì)感到沮喪,會(huì)嘗試一些新東西,或者嘗試將它與其他領(lǐng)域相結(jié)合,找到更好的用途。”
埃里森認(rèn)為,這就是為什么機(jī)器人技術(shù)是目前最廣泛研究的人工智能領(lǐng)域之一,因?yàn)樗鼮槿藗兲峁┝艘粋€(gè)明確的目標(biāo)。他列舉的例子包括使人工智能能夠使用視覺(jué)感應(yīng)在其周圍的空間中安全移動(dòng)——無(wú)論是制造工廠的機(jī)械臂,還是使用人工智能導(dǎo)航到目的地的自動(dòng)車輛。
訓(xùn)練數(shù)據(jù)
熟悉人工智能的人會(huì)知道,成功訓(xùn)練一個(gè)模型的關(guān)鍵因素之一是數(shù)據(jù),這需要大量的數(shù)據(jù)。事實(shí)上,它所訓(xùn)練的數(shù)據(jù)越多,就越能更好地交付你所尋求的結(jié)果。據(jù)埃里森不是,計(jì)算機(jī)視覺(jué)目前很困難,因?yàn)橛糜谟?xùn)練模型的數(shù)據(jù)集沒(méi)有包含足夠多的樣本。例如,吉布森三維空間數(shù)據(jù)庫(kù)(Gibson Database of 3D Spaces)是一個(gè)廣泛使用的數(shù)據(jù)集,用于訓(xùn)練模型在室內(nèi)空間中導(dǎo)航,它包括572棟完整的建筑,共1447層。雖然令人印象深刻,但這不太可能是一個(gè)人工智能系統(tǒng)在現(xiàn)實(shí)世界中可能遇到的全面集合。
當(dāng)物體的方向與計(jì)算機(jī)視覺(jué)模型所訓(xùn)練的方向不同時(shí),也會(huì)出現(xiàn)類似的問(wèn)題。在被廣泛用于人工智能訓(xùn)練的ImageNet數(shù)據(jù)集中,埃里森:“一把椅子只是一張椅子的照片,面對(duì)著鏡頭。如果你把椅子翻過(guò)來(lái),電腦視覺(jué)應(yīng)用程序突然就認(rèn)不出它了?!?/p>
這個(gè)缺點(diǎn)是一個(gè)名為ObjectNet的新數(shù)據(jù)集的靈感來(lái)源,它以不同的配置顯示日常項(xiàng)目,例如椅子翻轉(zhuǎn)或倒置。這個(gè)訓(xùn)練集被用來(lái)解決計(jì)算機(jī)視覺(jué)的一些缺點(diǎn),例如不能識(shí)別方向不正常或部分模糊的物體。
但是為人工智能訓(xùn)練獲取足夠大和多樣化的數(shù)據(jù)集的問(wèn)題仍然存在,這導(dǎo)致了埃里森發(fā)現(xiàn)的另一個(gè)主要趨勢(shì),即首先使用人工智能來(lái)生成數(shù)據(jù)集。
自我監(jiān)督和綜合數(shù)據(jù)
數(shù)據(jù)集需要大量的人工數(shù)據(jù)標(biāo)簽,因此越來(lái)越多的研究項(xiàng)目現(xiàn)在都集中在自我監(jiān)督算法上,它可以獲取已經(jīng)收集到的數(shù)據(jù),并讓計(jì)算機(jī)自動(dòng)給數(shù)據(jù)貼上標(biāo)簽。
埃里森解釋:“一個(gè)典型的例子就是一個(gè)具有計(jì)算機(jī)視覺(jué)應(yīng)用和接近傳感器機(jī)器人。計(jì)算機(jī)視覺(jué)能夠比接近傳感器看得更遠(yuǎn)。但是當(dāng)機(jī)器人向前移動(dòng)時(shí),出現(xiàn)在計(jì)算機(jī)視覺(jué)中的東西最終會(huì)以物體的形式出現(xiàn)在近距離傳感器中?!备鶕?jù)傳感器的數(shù)據(jù),回溯到物體第一次被發(fā)現(xiàn)的時(shí)間,然后對(duì)其進(jìn)行標(biāo)記。
人工智能系統(tǒng)一旦部署就不太可能遇到這樣的問(wèn)題,因此可能無(wú)法在訓(xùn)練數(shù)據(jù)集中表示出來(lái),這是開發(fā)人員面臨的另一個(gè)挑戰(zhàn)。然而,如果這些邊緣情況代表了真實(shí)場(chǎng)景,那么就需要考慮這些情況,以確保AI模型正確地處理它們。
“關(guān)鍵的例子是自動(dòng)駕駛。在你的數(shù)據(jù)集中有多少次在昏暗的暴風(fēng)雪中開車上山?你的數(shù)據(jù)集中不會(huì)有很多這樣的情況,所以他們本質(zhì)上必須做模擬數(shù)據(jù)。”
換句話說(shuō),邊緣案例是通過(guò)使用合成數(shù)據(jù)來(lái)處理的,合成數(shù)據(jù)是使用各種方法來(lái)創(chuàng)建的,例如生成模型。但這也產(chǎn)生了一個(gè)問(wèn)題,即數(shù)據(jù)科學(xué)家或開發(fā)人員如何才能確保這些合成數(shù)據(jù)準(zhǔn)確地反映出人工智能在現(xiàn)實(shí)生活中會(huì)遇到什么情況。
12下一頁(yè)>(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )