如果你已經(jīng)決定在今年做更多的人工智能實驗,請首先仔細研究您的數(shù)據(jù)管理實踐。
就在新年前夕,我與一位CIO客戶兼朋友進行了交談,他很興奮地談論了如何在2019年“啟動”涉及人工智能的項目。和許多首席信息官一樣,她也渴望趕在出現(xiàn)人工智能可能帶來的破壞之前,充分利用人工智能帶來的好處。在我們的談話中,她讓我?guī)椭私庠撊绾螠蕚?,才能讓她的組織在未來幾年能夠“做好AI”。
我的回復?在花任何一美元購買人工智能之前,首先確保你的數(shù)據(jù)是有序的!如果你想讓你的人工智能計劃成功,你必須讓數(shù)據(jù)管理成為你新年的首要任務。
對于一個有一整個團隊和組織正在急切地想要“進入人工智能領域”的CIO來說,這可能很難聽到。人們很容易的就一頭扎進數(shù)據(jù)科學和人工智能領域當中。然而,如果不首先了解數(shù)據(jù)管理(以及數(shù)據(jù)的其他方面)的重要性,就很難取得進展。
記住,AI即數(shù)據(jù)。在沒有數(shù)據(jù)的情況下,你無法使用AI或機器學習做任何事情,因此你必須首先確保理解并管理數(shù)據(jù)的生命周期。
好的數(shù)據(jù)管理的標志
數(shù)據(jù)管理雖然不是CIO最重要的方面之一,但它對機器學習和人工智能卻是至關重要。老話說得好,“輸出質量是由輸入質量決定的”用在這里非常合適,因為如果你擁有的是糟糕的數(shù)據(jù),你也將得到一個糟糕的模型。一個糟糕的模型反過來又會告訴你去做錯誤的事情,這確實會對你的組織造成一些損害。
也就是說,當你的數(shù)據(jù)管理得當時,人工智能絕對可以改變一個組織的能力和可能性。
為了確保你的組織在使用AI時走上正確的道路,你需要仔細查看你的數(shù)據(jù)管理實踐。一個數(shù)據(jù)管理的關鍵要素之一是理解:
你的數(shù)據(jù)來自何處
誰訪問或更改了該數(shù)據(jù)
如何使用你的數(shù)據(jù)(例如,你是否有權將數(shù)據(jù)用于其他目的?)
收集數(shù)據(jù)的時間
你的數(shù)據(jù)在過去有什么用途(以及將來可能如何使用)。
4個需要檢查的領域
在接下來的一年里,想想你的目標。如果AI出現(xiàn)在這個列表上的任何地方,你都需要認真考慮如何從事一些專注于數(shù)據(jù)和數(shù)據(jù)管理的最佳實踐。在新年的會議中考慮一下這些問題。
首先,為了確保你的數(shù)據(jù)不是垃圾,你需要從全局開始,雖然這聽起來可能違反直覺。你需要構建一個數(shù)據(jù)策略來回答圍繞數(shù)據(jù)的這些“大”問題,然后考慮治理、質量和集成等相關的關鍵元素。以下是我認為可以幫助你為AI做好準備的幾個方面:
數(shù)據(jù)策略:即數(shù)據(jù)的“who, what, when, why, 以及 how”。你的數(shù)據(jù)策略會告訴你所做的一切。如果你沒有數(shù)據(jù)策略,你確實需要制定一個。
數(shù)據(jù)治理:管理組織數(shù)據(jù)的(或應該)的規(guī)則和系統(tǒng)。數(shù)據(jù)治理應該由數(shù)據(jù)策略來驅動。治理應該考慮(并管理)數(shù)據(jù)的所有方面,包括數(shù)據(jù)質量、數(shù)據(jù)訪問和數(shù)據(jù)集成。
數(shù)據(jù)質量:擁有一個能夠確保數(shù)據(jù)準確和有用的過程和系統(tǒng)。數(shù)據(jù)質量的保證需要從收集數(shù)據(jù)的瞬間開始,并在整個數(shù)據(jù)生命周期中持續(xù)。數(shù)據(jù)質量應該由數(shù)據(jù)治理規(guī)則/系統(tǒng)來決定和驅動。
數(shù)據(jù)集成:許多人會將數(shù)據(jù)集成到其他領域(不管他們是否有這樣的意識),但是他們應該在考慮數(shù)據(jù)時就考慮到這一點。它將被數(shù)據(jù)策略所告知和驅動,并與數(shù)據(jù)質量密切相關。必須花時間考慮如何在整個組織和整個數(shù)據(jù)生命周期中集成數(shù)據(jù)。
數(shù)據(jù)管理、數(shù)據(jù)策略和數(shù)據(jù)治理可能不像談論人工智能和機器學習來得那么吸引人,但是在能夠正確地使用人工智能之前,必須先將這些數(shù)據(jù)整理好。當你的同事在下一次社交活動中不斷談論人工智能時,你必須提醒他們數(shù)據(jù)有多重要。提醒他們“輸出質量是由輸入質量決定的”--尤其是在人工智能和機器學習方面。
在未來一年,我預計我們將看到會有比以往任何時候都多的資源轉向人工智能和與是人工智能相關的項目上面。如果人工智能是你所在的IT組織的下一個重點關注領域,那就從數(shù)據(jù)管理開始吧,這樣才能為自己最后的成功做好準備。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )