各行各業(yè)的企業(yè)在收集、存儲和分析來自不同格式的數(shù)據(jù)。在數(shù)據(jù)競爭下,要想獲得成功,利用數(shù)據(jù)進行商業(yè)決策則變成了比業(yè)務(wù)本身更重要的事情。
數(shù)據(jù)分析和可視化技術(shù)的快速發(fā)展意味著企業(yè)和個人非常希望通過正確的技術(shù)選擇盡快地獲得業(yè)務(wù)上的成功。
創(chuàng)業(yè)者們需要知道他們是否選擇了正確的語言、產(chǎn)品、架構(gòu)和數(shù)據(jù)源,而個人則需要知道他們是否正在學(xué)習(xí)正確的技能來獲得更有前途的工作。那些沒有選擇正確的人會面臨被淘汰的危險,因為他們沒有充分利用實時的數(shù)據(jù)分析和可視化程序提供的洞察理解。
基于數(shù)據(jù)分析和可視化技術(shù)的迅速發(fā)展,大數(shù)據(jù)分析和可視化工具提供商Zoomdata聯(lián)合橫跨多領(lǐng)域的科技媒體公司O’Reilly Media進行了一次調(diào)查,以評估數(shù)據(jù)分析和可視化應(yīng)用的現(xiàn)狀。有875名受訪者提供了他們使用這些技術(shù)的情況。在詳細分析調(diào)研結(jié)果之前,我們先把主要的結(jié)論列出,以便大家閱讀:
大數(shù)據(jù)分析和可視化應(yīng)用在制造業(yè)、金融服務(wù)和科技/軟件公司中是最成熟的。這些技術(shù)通常是企業(yè)級用戶及業(yè)務(wù)分析師來使用,他們通常是依靠可視化儀表盤來獲取所需的見解,以優(yōu)化業(yè)務(wù)流程并更好的了解客戶。關(guān)系型數(shù)據(jù)庫仍然是最常見的數(shù)據(jù)源(雖然分析型數(shù)據(jù)庫和Hadoop是大數(shù)據(jù)領(lǐng)域最常見的數(shù)據(jù)源)。企業(yè)非常需要Python、SQL和關(guān)系型數(shù)據(jù)庫的能力。Kafka和Spark正在成為流數(shù)據(jù)技術(shù)(streaming data technology)的首選。360度客戶洞察是最常見的使用場景。數(shù)據(jù)分析和可視化使用概覽
875個受訪者來自不同的行業(yè)(如圖1所示),其中超過35%來自科技/軟件行業(yè),接近10%來自金融服務(wù),8%來自醫(yī)療健康/醫(yī)療科技領(lǐng)域,還有制造業(yè)、政府、零售和教育/學(xué)術(shù)這幾個領(lǐng)域分別占約5%。
圖1?受訪者所在的行業(yè)及占比
從受訪者的工作崗位來看,18%是是工程師/開發(fā)人員,17%是數(shù)據(jù)科學(xué)家,15%是數(shù)據(jù)分析師/業(yè)務(wù)分析師,還有13%是架構(gòu)師,他們的公司規(guī)模各異。有趣的是,企業(yè)CXO們和經(jīng)理的占比也非常高(14%),甚至高于IT專家(8%)。
還有一個值得關(guān)注的是,有26%的受訪者是來自員工人數(shù)少于50人的企業(yè),這也表明了小型企業(yè)是使用這些新技術(shù)和業(yè)務(wù)流程的領(lǐng)導(dǎo)者。
超過50%的受訪者表示,他們使用分析來獲得全方位的客戶洞察,43%的受訪者使用分析來優(yōu)化業(yè)務(wù)流程(如圖2所示)??蛻艉蜆I(yè)務(wù)流程是直接影響業(yè)務(wù)的重要因素,因此這些環(huán)節(jié)也是企業(yè)需要使用數(shù)據(jù)分析和可視化工具從而通過數(shù)據(jù)來輔助決策的重要方面。
圖2?數(shù)據(jù)分析和可視化工具使用的主要領(lǐng)域和占比
主要領(lǐng)域分析
在圖2中,我們看到360度客戶洞察是數(shù)據(jù)分析和可視化工具使用最多的領(lǐng)域,但是從不同的行業(yè)來看情況可能就有所不同,而且也能顯示出一些趨勢。
在科技/軟件、金融服務(wù)和零售行業(yè),360度客戶洞察無疑是使用分析技術(shù)最主要的領(lǐng)域,占比在50%以上。令我們感到驚訝的是在教育/學(xué)術(shù)行業(yè),使用分析技術(shù)最主要的領(lǐng)域也是360度客戶洞察。毫無疑問這些行業(yè)都是客戶至上的行業(yè),只有全面的了解客戶,才能給客戶更好的體驗,才能獲得更多的收入。
醫(yī)療保?。t(yī)療科技行業(yè)中醫(yī)療數(shù)據(jù)分析是使用分析技術(shù)的主要領(lǐng)域,這并不令人驚訝,因為能稱作是醫(yī)療科技的醫(yī)療企業(yè)都需要分析醫(yī)療數(shù)據(jù),否則很難做出有現(xiàn)實意義的成果。
業(yè)務(wù)流程優(yōu)化也是一個重度使用分析技術(shù)的主要領(lǐng)域,在調(diào)查報告里的所有涉及到的行業(yè),業(yè)務(wù)流程優(yōu)化使用技術(shù)分析技術(shù)的占比都排在前三位,在制造業(yè)和政府行業(yè)則排名第一。優(yōu)化業(yè)務(wù)流程通常會降低運營成本,并可能提高客戶的滿意度,因此這也是在許多行業(yè)中建立競爭優(yōu)勢的戰(zhàn)略途徑之一。
制造業(yè)和零售行業(yè)也把重點放在了供應(yīng)鏈分析上。及時發(fā)現(xiàn)供應(yīng)鏈環(huán)節(jié)中存在的問題,可以幫助零售商和制造企業(yè)節(jié)省換供應(yīng)商的時間。一個優(yōu)化的供應(yīng)鏈結(jié)構(gòu)也是一個企業(yè)的競爭優(yōu)勢和技術(shù)壁壘。
欺詐檢測/網(wǎng)絡(luò)安全情報是金融服務(wù)和政府行業(yè)的重要領(lǐng)域。欺詐檢測對于任何金融服務(wù)都至關(guān)重要,離錢越近的地方越容易出現(xiàn)欺詐行為。檢測并消除欺詐行為有助于與客戶建立信任并降低運營成本。網(wǎng)絡(luò)安全情報是眾多政府機構(gòu)關(guān)注的焦點,在選舉和可持續(xù)運營層面,防止欺詐也至關(guān)重要。
我們還向受訪者提了這樣一個問題“貴公司的大數(shù)據(jù)分析處于什么階段?是剛剛開始,還是已經(jīng)應(yīng)用在工作的各個方面?”,有助于我們理解各行業(yè)的采用率如何變化。令我們驚訝的是制造業(yè)行業(yè)有26%的受訪者表示他們的公司在多個方面都已經(jīng)使用了數(shù)據(jù)分析技術(shù),是所有行業(yè)中最高的,而最低的是政府行業(yè),只有7%的人認(rèn)為公司在多個方面已經(jīng)應(yīng)用了數(shù)據(jù)分析技術(shù)。政府行業(yè)也是“我們沒有使用大數(shù)據(jù)分析技術(shù)”這個選項占比最多的行業(yè),達到33%,科技/軟件行業(yè)則占比最低。
如何使用數(shù)據(jù)
在如何獲取數(shù)據(jù)來源的問題中,數(shù)據(jù)倉庫/數(shù)據(jù)集市是最多的回答,在零售行業(yè)最為明顯。虛擬聯(lián)合/糅合(Virtual federation/mashup,即時混合數(shù)據(jù)而不移入倉庫)在醫(yī)療健康/醫(yī)療科技、科技/軟件和政府行業(yè)應(yīng)用的最多。
圖3 數(shù)據(jù)來源在各行業(yè)的分布占比
關(guān)系型數(shù)據(jù)庫仍然是各行業(yè)使用最多的,在醫(yī)療健康/醫(yī)療科技行業(yè)的占有率達到39%。非關(guān)系型數(shù)據(jù)庫以及大數(shù)據(jù)存儲的分析型數(shù)據(jù)庫、Hadoop、NoSQL數(shù)據(jù)庫、云數(shù)據(jù)存儲、內(nèi)存數(shù)據(jù)庫和搜索數(shù)據(jù)庫中,金融服務(wù)和政府使用分析型數(shù)據(jù)庫最多,而零售和科技/軟件行業(yè)使用云數(shù)據(jù)庫存儲最多。
Kafka和Spark是分析流數(shù)據(jù)最常用的技術(shù),在我們的調(diào)查中,這兩個技術(shù)占流數(shù)據(jù)分析的65%以上。科技/軟件行業(yè)是使用Kafka的主要行業(yè),其次是金融服務(wù)。政府中最普遍的是使用Confluence。
大數(shù)據(jù)分析的必備技術(shù)
在我們分析使用數(shù)據(jù)分析和可視化工具的技術(shù)人員的相關(guān)技能時,我們發(fā)現(xiàn)總體上需求最大的是Python、SQL和關(guān)系型數(shù)據(jù)庫,其次是Hadoop和Java。政府行業(yè)最需要的是會Python的人才,其次是關(guān)系型數(shù)據(jù)庫的人才,而醫(yī)療健康/醫(yī)療科技最需要的事SQL的人才。
大數(shù)據(jù)的價值所在
衡量大數(shù)據(jù)的價值有四個方面:準(zhǔn)確性、實時性、多樣性和數(shù)據(jù)量。準(zhǔn)確性指的是數(shù)據(jù)接近“真相”的程度,實時性指的是數(shù)據(jù)收集和分析的速度,多樣性指的是結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的多種來源和類型,數(shù)據(jù)量指的是能夠收集和分析的總數(shù)據(jù)量。我們通過了解各個企業(yè)看重這四個方面的哪幾個方面,來深入理解數(shù)據(jù)分析是如何影響公司業(yè)務(wù)的。
從整體來看,衡量數(shù)據(jù)的價值最重要的方面是準(zhǔn)確性,這并不令人意外,因為沒有真實的數(shù)據(jù),那么分析結(jié)果就沒有任何意義。其次重要的是多樣性,這表明無論什么行業(yè),做數(shù)據(jù)分析和可視化必須要結(jié)合多種來源和類型的數(shù)據(jù),才能更好的提供企業(yè)所需的見解。實時性是最不重要的,這表明典型的商業(yè)數(shù)據(jù)獲取是否及時并不影響分析的結(jié)果和業(yè)務(wù)的決策,這也是流數(shù)據(jù)分析相對少的原因之一。但實時性對于科技/軟件和制造業(yè)來說卻是最有價值的。
總之,為了更好的給企業(yè)提供商業(yè)價值,數(shù)據(jù)分析和可視化工具越來越多的應(yīng)用在日常工作中,給業(yè)務(wù)分析師和管理人員提供所需的信息。這些信息通常嵌入到生產(chǎn)環(huán)境的應(yīng)用程序或獨立的BI應(yīng)用中,并通過儀表盤進行操作。我們通過這個調(diào)研希望可以給企業(yè)一個直觀的感受,讓各個行業(yè)的從業(yè)人員都了解到大數(shù)據(jù)分析技術(shù)已經(jīng)發(fā)展到什么程度以及采用度如何,在今后采用這些新技術(shù)或拓展大數(shù)據(jù)收集、存儲、分析和可視化應(yīng)用時,有一個參考。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- IDC:三季度全球以太網(wǎng)交換機收入同比下降7.9%、環(huán)比增長6.6%
- Fortinet李宏凱:2025年在中國大陸啟動SASE PoP節(jié)點部署 助力企業(yè)出海
- Fortinet李宏凱:2024年Fortinet全球客戶已超80萬
- 央國企采購管理升級,合合信息旗下啟信慧眼以科技破局難點
- Apache Struts重大漏洞被黑客利用,遠程代碼執(zhí)行風(fēng)險加劇
- Crunchbase:2024年AI網(wǎng)絡(luò)安全行業(yè)風(fēng)險投資超過26億美元
- 調(diào)查報告:AI與云重塑IT格局,77%的IT領(lǐng)導(dǎo)者視網(wǎng)絡(luò)安全為首要挑戰(zhàn)
- 長江存儲發(fā)布聲明:從無“借殼上市”意愿
- 泛微·數(shù)智大腦Xiaoe.AI正式發(fā)布,千人現(xiàn)場體驗數(shù)智化運營場景
- IDC:2024年第三季度北美IT分銷商收入增長至202億美元
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。