近幾年隨著AlphaGO的驕人戰(zhàn)績,人工智能和大數(shù)據(jù)備受追捧,熱度空前。而在實際接觸中,大家對人工智能和大數(shù)據(jù)的認(rèn)知普遍是“只知其名不知其意”,因此對企業(yè)而言,獵頭的推薦也往往與崗位匹配度不高。那么被人們認(rèn)為高深莫測的AI和大數(shù)據(jù)的關(guān)系究竟是怎樣的? 下圖清晰表達了其邏輯及關(guān)聯(lián)性。
上圖中主要是三大塊內(nèi)容,分別是大數(shù)據(jù),AI技術(shù)和解決問題,他們的關(guān)系如下:
- 大數(shù)據(jù)層 -
主要分為數(shù)據(jù)采集、數(shù)據(jù)存儲及數(shù)據(jù)訪問三個步驟。
? 數(shù)據(jù)采集
主要通過智能手環(huán)、智能手表、智能手機等各類智能硬件,重力傳感器、溫度傳感器、濕度傳感器等各類傳感器以及攝像頭、話筒等多種手段來采集各種所需數(shù)據(jù)。
? 數(shù)據(jù)存儲
主要是將采集數(shù)據(jù)存儲到數(shù)據(jù)庫中。大數(shù)據(jù)的存儲方式與傳統(tǒng)的數(shù)據(jù)存儲有很大不同。主要體現(xiàn)在存儲格式、存儲結(jié)構(gòu)、以及分布式存儲等方面。而分布式存儲、共享存儲則是數(shù)據(jù)存儲中重要的核心技術(shù)。
? 數(shù)據(jù)訪問
主要解決如何讓AI技術(shù)層能夠快速的獲取所需數(shù)據(jù)。該層是大數(shù)據(jù)技術(shù)與AI技術(shù)的重要承接層,其最核心的技術(shù)為負(fù)載均衡。該技術(shù)解決了數(shù)據(jù)訪問中的大數(shù)據(jù)并發(fā)、網(wǎng)絡(luò)負(fù)荷過重等問題。
- AI技術(shù)層 -
分為基礎(chǔ)算法、AI算法、AI框架和AI技術(shù)四個步驟,目的是獲取數(shù)據(jù)之后,利用人工智能的算法和技術(shù)對數(shù)據(jù)進行分析。
? 基礎(chǔ)算法層
基礎(chǔ)算法層主要包含高等數(shù)學(xué)、矩陣分析、數(shù)值分析、概率統(tǒng)計分析等,是AI算法的奠基層。而AI算法來自于基礎(chǔ)算法的支撐。我們對基礎(chǔ)算法理解越深刻,對AI算法理解的也會更透徹。好像蓋大樓的地基,地基打的越深,大樓才能蓋的越高。
? AI算法層
AI算法層是在基礎(chǔ)算法層之上構(gòu)建的解決人類問題的人工智能算法層。
人類遇到的問題通常是由單一問題合并組成的復(fù)雜問題,解決問題的路徑為將復(fù)雜問題拆解成多個單一問題后逐一進行解決。AI算法層即解決單一問題的通用方法層。比如拍照計算食物熱量實際上包含食物識別、體積計算、質(zhì)量計算、熱量計算等四個子問題,而四個子問題則由各自組成的通用方法來解決。經(jīng)過長達半個多世紀(jì)的發(fā)展,AI算法層已經(jīng)研究出了一些通用方法即算法,包含分類算法、聚類算法、回歸算法、優(yōu)化算法、降維算法、深度學(xué)習(xí)算法等等。
? AI框架層
AI框架主要是對AI算法層的單個算法進行重新封裝,它定義了很多類、方法、接口,使用者只需要調(diào)整相關(guān)參數(shù)即可實現(xiàn)算法,而不需要將算法完全實現(xiàn)出來,這樣節(jié)省了大量的時間,使得應(yīng)用算法來解決問題的AI研發(fā)人員更加專注于解決問題本身。目前常見的分類、聚類等傳統(tǒng)的人工智能算法框架有SkLearn、Pandas等等,深度學(xué)習(xí)框架有Tensorflow、Caffe、Torch、PaddlePaddle。
? AI技術(shù)層
AI技術(shù)層主要是針對利用AI算法解決專業(yè)領(lǐng)域問題而提出的專用方法和算法。這種算法不具有通用性,是為解決某個領(lǐng)域的問題而定制研發(fā)的方法。目前AI技術(shù)主要包含自然語言處理(NLP)、機器視覺、語音識別、知識圖譜、數(shù)據(jù)挖掘、分析決策。大家耳熟能詳?shù)募夹g(shù)都出自該層,也是AI技術(shù)層的最頂層。
? 自然語言處理(NLP)
自然語言處理領(lǐng)域主要是語義識別,開放域?qū)υ捔奶?,基于任?wù)的對話,自動翻譯(例如中翻英,英翻中)等。
? 機器視覺
機器視覺主要分為圖像識別(識別圖像或視頻中的物體是什么),圖像跟蹤(視頻中跟蹤某個物體),三維重建(通過2D圖片進行3D物體的構(gòu)建)。
? 語音識別
該技術(shù)通俗的講就是對人說的話轉(zhuǎn)化成文字。
? 知識圖譜
該技術(shù)是用來構(gòu)建知識的網(wǎng)狀結(jié)構(gòu),將一個個看似沒有關(guān)系的知識點,通過該技術(shù)建立他們之間的關(guān)聯(lián)關(guān)系,比如包含關(guān)系、并列關(guān)系、最終構(gòu)建各個領(lǐng)域的知識網(wǎng)。然后再根據(jù)這個知識網(wǎng)解決用戶的問答、推薦、預(yù)測、推理等問題。
? 數(shù)據(jù)挖掘
數(shù)據(jù)挖掘主要是對數(shù)據(jù)進行分類、聚類、預(yù)測等處理。
? 分析決策
主要是做策略制定,通過多維度收集的數(shù)據(jù)進行某個領(lǐng)域的決策并給出答案。
- 解決問題 -
基于大數(shù)據(jù)與AI技術(shù)的結(jié)合,能夠真正實現(xiàn)為人類解決各種各樣的問題。將這些問題進行歸類匯總成幾大類問題,常見的有聚類、分類、預(yù)測、推薦等問題。
? 分類問題
分類問題主要是判別某個物體屬于哪個類別,比如橘子屬于水果類、白菜屬于蔬菜類。分類又分為二分類、多分類問題;二分類即是與不是的問題,比如這個物體不是香蕉,這個物體是香蕉;多分類問題,比如多種食物,一種食物是蔬菜,一種食物是水果,一種食物是肉。
? 聚類問題
聚類問題主要是將一批數(shù)據(jù)自動分成幾類,比如說網(wǎng)站的用戶群,自動分為活躍用戶群、忠誠用戶群、沉默用戶群,這種用戶群的確定是通過人工智能算法算的,而不是通過人工篩選的。
? 預(yù)測問題
預(yù)測問題主要是對某個趨勢進行預(yù)測,比如房價趨勢預(yù)測、網(wǎng)站的流量預(yù)測等等。
? 推薦問題
推薦問題主要是推薦同類偏好。比如A用戶喜歡旅游,且是戶外愛好者,而戶外愛好者除了喜歡旅游,還喜歡戶外裝備,那就可以向A用戶推薦戶外裝備,這就是典型的網(wǎng)站推薦邏輯。
- AI犯罪抬頭,韓國投資巨額研發(fā)新系統(tǒng)應(yīng)對深度偽造威脅
- 微信員工揭秘:微信視頻通話并非人人效果不同,卻有輕度美顏,真實不虛
- DeepSeek沖擊波:英偉達市值一周縮水5520億美元,科技巨頭面臨市場變革?
- 美國華盛頓特區(qū)撞機事故調(diào)查揭新篇章:數(shù)據(jù)揭示真相
- 騰訊云NodeJS SDK打包體積過大引發(fā)熱議,官方致歉并承諾后續(xù)優(yōu)化
- 2025春節(jié)檔大戰(zhàn):票房破60億,電影市場再創(chuàng)輝煌
- 揭秘周鴻祎:DeepSeek 如何打破開源壁壘,引領(lǐng)真正的Open AI革命?
- Anthropic引領(lǐng)Claude AI新紀(jì)元:雙向語音模式開啟,對話更人性化
- Meta首席科學(xué)家楊立昆揭露硅谷病態(tài)優(yōu)越感:別讓自以為是阻礙進步
- 小米SU7交付破萬創(chuàng)新紀(jì)錄,連續(xù)四個月銷量飆升,實力引領(lǐng)市場
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。