一直以來,數(shù)據(jù)安全都是重中之重。
隨著生成式AI的興起,大語言模型就像一把“雙刃劍”,帶來生產(chǎn)力飛速提升的同時,也需要海量數(shù)據(jù)進行持續(xù)訓練,隨之而來就是數(shù)據(jù)治理、數(shù)據(jù)安全、數(shù)據(jù)隱私保護等一系列全新的挑戰(zhàn)。
可以說,生成式AI等人工智能新趨勢正在打開數(shù)據(jù)安全、數(shù)據(jù)治理的全新格局。用戶們需要重新全面審視自身的數(shù)據(jù)安全與數(shù)據(jù)治理。正如亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建所言:“數(shù)據(jù)已經(jīng)是現(xiàn)代發(fā)明和創(chuàng)新之源。進入到數(shù)智化時代,數(shù)據(jù)安全是企業(yè)的首要優(yōu)先級?!?/p>
那么,面對數(shù)據(jù)安全與數(shù)據(jù)治理的新趨勢,企業(yè)應該如何在保證數(shù)據(jù)本身安全合規(guī)的前提下,全面釋放出數(shù)據(jù)的價值?為此,亞馬遜云科技圍繞業(yè)務(wù)數(shù)據(jù)的可識別、可見、可協(xié)作和安全數(shù)據(jù)的可操作四大場景提供創(chuàng)新服務(wù)和解決方案,并助力生成式AI基礎(chǔ)模型廣泛獲取內(nèi)外部數(shù)據(jù)并實現(xiàn)安全訓練。
識別敏感數(shù)據(jù)
一直以來,數(shù)據(jù)價值的釋放與數(shù)據(jù)合規(guī)就像一對“矛盾體”,讓很多企業(yè)左右為難。
事實上,數(shù)據(jù)合規(guī)乃大勢所趨。近年來,全球主要經(jīng)濟體均在推動數(shù)據(jù)合規(guī)的完善。從歐盟的GDPR,到美國的 ADPPA,再到中國的《個人信息保護法》、《數(shù)據(jù)出境安全評估辦法》等,各個國家均希望數(shù)據(jù)在合規(guī)的前提下有序流動、共享與應用。
比如,今年生成式AI浪潮興起,大語言模型帶來了數(shù)據(jù)安全與數(shù)據(jù)隱私等一系列的新問題。國家馬上出臺了《生成式人工智能服務(wù)管理暫行辦法》來規(guī)范大模型的訓練和保障數(shù)據(jù)安全。
在數(shù)據(jù)合規(guī)方面,敏感數(shù)據(jù)的識別、管理和分級至關(guān)重要,且耗時費力,尤其是從多個數(shù)據(jù)源中自動識別敏感數(shù)據(jù)是很多企業(yè)面臨的挑戰(zhàn)。陳曉建認為,數(shù)據(jù)的安全合規(guī)需要人、流程、工具全鏈路的相互配合,并且充分利用機器學習、模式匹配等方式自動識別敏感數(shù)據(jù),降低數(shù)據(jù)合規(guī)的操作難度。
為此,亞馬遜云科技打造出敏感數(shù)據(jù)保護解決方案(Sensitive Data Protection on Amazon Web Services, 簡稱 SDP)等量身定制的工具產(chǎn)品與解決方案,允許客戶創(chuàng)建數(shù)據(jù)目錄、使用內(nèi)置或定制數(shù)據(jù)識別規(guī)則定義敏感數(shù)據(jù)類型,中心化的管理平臺讓客戶通過網(wǎng)頁應用程序?qū)γ舾袛?shù)據(jù)資產(chǎn)進行可視化管理,實現(xiàn)業(yè)務(wù)數(shù)據(jù)合規(guī),為釋放數(shù)據(jù)價值鋪平道路。
“SDP是開源的云原生解決方案,可以自動發(fā)現(xiàn)敏感數(shù)據(jù)并管理數(shù)據(jù)資產(chǎn),適合存量數(shù)據(jù)多、數(shù)據(jù)類型不好判斷這兩個典型的場景。”陳曉建表示道。
提高數(shù)據(jù)可見性
數(shù)據(jù)如何充分共享永遠是數(shù)據(jù)價值釋放過程中的一道難題。
因為企業(yè)通常組織架構(gòu)復雜、涉及人員眾多,并且數(shù)據(jù)根據(jù)不同階段和場景散落在企業(yè)各個數(shù)據(jù)系統(tǒng),數(shù)據(jù)安全有效的進行共享與協(xié)作具有極高的難度。如今,數(shù)據(jù)可見已經(jīng)成為企業(yè)數(shù)據(jù)治理和釋放數(shù)據(jù)價值的基礎(chǔ)。陳曉建認為,數(shù)據(jù)可見是企業(yè)內(nèi)不同部門、不同角色高效挖掘數(shù)據(jù)價值的前提。
因此,企業(yè)需要構(gòu)建連接數(shù)據(jù)提供者與數(shù)據(jù)消費者的橋梁,但出于數(shù)據(jù)安全的考慮又不能無限制地將所有數(shù)據(jù)共享給所有人。通常,在數(shù)據(jù)治理與高效協(xié)同方面,集中式和聯(lián)邦式是企業(yè)中最為常見的聯(lián)眾類型。這兩種方式有著各自的優(yōu)劣勢和適應的企業(yè)規(guī)模,且均需要多個角色的高效協(xié)同。
對此,亞馬遜云科技帶來了數(shù)據(jù)管理服務(wù)Amazon DataZone,幫助企業(yè)加速數(shù)據(jù)網(wǎng)格建設(shè)以對不同網(wǎng)格來源的數(shù)據(jù)進行共享和治理。該服務(wù)可以讓客戶更快、更輕松地對存儲在亞馬遜云科技、客戶本地和第三方來源的數(shù)據(jù)進行編目、發(fā)現(xiàn)、共享和治理。此外,務(wù)Amazon DataZone通過數(shù)據(jù)所有權(quán)的去中心化、聯(lián)邦式數(shù)據(jù)治理、點對點的數(shù)據(jù)共享等功能讓數(shù)據(jù)生產(chǎn)者輕松管理和控制數(shù)據(jù)訪問,讓廣大數(shù)據(jù)開發(fā)者、數(shù)據(jù)科學家、分析師和業(yè)務(wù)用戶可以快速實現(xiàn)協(xié)作分析。
“Amazon DataZone可幫助企業(yè)實現(xiàn)數(shù)據(jù)一站式管理,實現(xiàn)快速實現(xiàn)協(xié)作分析,并且大幅簡化數(shù)據(jù)治理難度?!标悤越ㄑa充道。
賦能協(xié)作,激發(fā)數(shù)據(jù)價值
眾所周知,數(shù)據(jù)只有充分的流動、共享和應用才能發(fā)揮出最大的價值。如今,除了企業(yè)自身內(nèi)部業(yè)務(wù)數(shù)據(jù)之外,產(chǎn)業(yè)上下游和合作伙伴等第三方數(shù)據(jù)的加入也成為大勢所趨
但多方數(shù)據(jù)的協(xié)作依然面臨著數(shù)據(jù)安全、數(shù)據(jù)泄露等風險,比如有些產(chǎn)業(yè)鏈上下游是通過給合作伙伴提供數(shù)據(jù)副本的方式,雖然數(shù)據(jù)實現(xiàn)了共享,但依然面臨著很大的數(shù)據(jù)泄露風險。因此,近年來多方計算、聯(lián)邦學習等隱私計算技術(shù)開始興起,成為企業(yè)與第三方數(shù)據(jù)實現(xiàn)數(shù)據(jù)共享與應用的保障。
陳曉建認為,數(shù)據(jù)協(xié)作參與方增多之后,必然會面臨著數(shù)據(jù)保護與業(yè)務(wù)價值安全之間的權(quán)衡,而多方安全合規(guī)計算就是目前最為合適的方式。尤其是生成式AI興起之后,大語言模型的訓練更加渴望第三方數(shù)據(jù)。為此,亞馬遜云科技推出了Amazon Clean Rooms分析服務(wù),幫助企業(yè)與其合作伙伴在互相不暴露原始數(shù)據(jù)的情況下進行數(shù)據(jù)協(xié)作,也無需在云上移動數(shù)據(jù),從而最大化數(shù)據(jù)價值。
通過Amazon Clean Rooms分析服務(wù),企業(yè)只需幾分鐘即可創(chuàng)建一個安全的數(shù)據(jù) Clean Room,創(chuàng)建協(xié)作項目實現(xiàn)數(shù)據(jù)的多方協(xié)作。此外,Amazon Clean Rooms還提供了一個密態(tài)計算的環(huán)境,數(shù)據(jù)提供方在 Clean Rooms 環(huán)境中的數(shù)據(jù)能夠以加密的形態(tài)完成數(shù)據(jù)分析操作,并將分析結(jié)果解密并返回,在數(shù)據(jù)安全得到最大保護的同時,還在協(xié)作方之間充分開發(fā)了數(shù)據(jù)價值。
“多方安全合規(guī)計算還處于發(fā)展的早期階段。目前來看,非常適合亞馬遜云科技這種云環(huán)境。全球像汽車、生命科學非??释舷掠螖?shù)據(jù)交易,并且都在使用Amazon Clean Rooms服務(wù)?!标悤越ㄑa充道。
此外,針對生成式AI的大語言模型所需要的海量第三方非結(jié)構(gòu)化數(shù)據(jù),亞馬遜云科技Amazon Data Exchange提供來自300多家提供商的3500多種公共數(shù)據(jù)產(chǎn)品,數(shù)據(jù)來源包括金融、天氣、地理空間、健康醫(yī)療等非常多的行業(yè)和領(lǐng)域。客戶可以輕松查找、訂閱和使用所需的各種第三方數(shù)據(jù)。Amazon Data Exchange與Amazon EMR Serverless等分析服務(wù)相結(jié)合,可以大大簡化企業(yè)生成式AI應用開發(fā)方面的數(shù)據(jù)獲取難題,加速生成式AI落地。
提升數(shù)據(jù)可操作性
不可否認,如今企業(yè)的IT環(huán)境正在變得越來越復雜。這其中,以安全環(huán)境尤為明顯。
眾所周知,安全供應商多、產(chǎn)品類型豐富,通常一家企業(yè)往往具有多家安全供應商和種類繁多的安全產(chǎn)品。加上企業(yè)對于安全越來越重視,直接造成了企業(yè)的安全環(huán)境走向復雜化。針對安全類的數(shù)據(jù),實現(xiàn)數(shù)據(jù)可操作,即安全日志的統(tǒng)一管理及分析,已是業(yè)界共識。
Gartner《2022 年網(wǎng)絡(luò)安全重點趨勢》就認為:安全供應商的整合排到了趨勢的第 4 位。在 2020 年有 29% 的客戶在尋求安全供應商的整合,僅僅過了 2 年,到 2022 年這個數(shù)字就變成了 75%。
陳曉建表示,企業(yè)要想在短時間內(nèi)做到整合安全廠商,是有相當大的挑戰(zhàn)和難度。因為,各類安全日志和安全事件的數(shù)據(jù)來自不同安全產(chǎn)品供應商的不同產(chǎn)品,這些安全數(shù)據(jù)的整合與管理難度極大?!耙粋€用戶可能擁有超過十家安全供應商,安全整合是大勢所趨,需要通過更好的工具去解決安全數(shù)據(jù)問題?!标悤越ū硎镜?。
為此,亞馬遜云科技推出了Amazon Security Lake安全數(shù)據(jù)湖服務(wù),統(tǒng)一管理來自不同廠商的日志,并且讓這些日志可被用來進行安全事件的分析。Amazon Security Lake支持包括亞馬遜云科技、安全合作伙伴和第三方分析服務(wù)提供商在內(nèi)的80多個安全數(shù)據(jù)源。
企業(yè)可將不同來源的安全數(shù)據(jù)傳入該數(shù)據(jù)湖中并轉(zhuǎn)換為符合開放網(wǎng)絡(luò)安全架構(gòu)框架(Open Cybersecurity Schema Framework,OCSF)要求的格式,從而自動收集、組合和分析這些安全數(shù)據(jù)。此外,Amazon Security Lake還與亞馬遜云科技成熟的數(shù)據(jù)分析工具集成,助力企業(yè)安全團隊在熟悉的分析環(huán)境中實現(xiàn)更快的威脅檢測、調(diào)查和事件響應,有效解決潛在安全隱患。
“從第一天起,亞馬遜云科技就把安全作為最高優(yōu)先級。針對業(yè)務(wù)數(shù)據(jù)可識別、可見、可協(xié)作和安全數(shù)據(jù)的可操作等難題,亞馬遜云科技通過豐富的工具集和創(chuàng)新的解決方案,致力于通過數(shù)據(jù)分析與安全服務(wù)的融合幫助客戶釋放數(shù)據(jù)價值,確??蛻粼跀?shù)據(jù)安全上無后顧之憂。”陳曉建最后表示道。
免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美國無人機禁令升級?當?shù)乜茖W家率先“喊疼”:我們離不開大疆
- iQOO Neo10 Pro:性能特長之外,亦有全能實力
- 自動駕駛第一股的轉(zhuǎn)型迷途:圖森未來賭上了AIGC
- 明星熱劇、品牌種草、平臺資源,京東讓芬騰雙11的熱度“沸騰”了
- 一加 Ace 5 Pro明牌:游戲手機看它就夠了!
- 游戲體驗天花板,一加 Ace 5 系列售價 2299 元起
- 16個月沒工資不敢離職,這些打工人“自費上班”
- 怎樣利用微信小店“送禮”功能賺錢?
- 鴻蒙智行問界M9,中國豪華車的龍門一躍
- 科技云報道:人工智能時代“三大件”:生成式AI、數(shù)據(jù)、云服務(wù)
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。