作者:夏天
審校:一條輝
來源:GPLP犀牛財經(ID:gplpcn)
雪崩的時候,沒有一片雪花是無辜的。
大數據行業(yè)就是如此,在大數據的地震當中,這個震蕩波影響到了全行業(yè)。
2019年9月6日,魔蝎科技和新顏科技的CEO被帶走調查,調查內容與爬蟲數據相關。
接著第三方數據服務公司聚信立發(fā)出通知,公司于9月6日停止了對外提供用戶授權的運營商爬蟲服務。
緊接著,公信寶的運營主體——杭州存信數據科技有限公司辦公地被警方貼上封條。
2019年9月12日,業(yè)界再爆天翼征信的多位高管及員工被警方帶走協助調查。
一時間大數據行業(yè)陷入人人自危的境況。
而這一系列事件還在持續(xù)發(fā)酵,或許現在還只是暴風雨來臨的“前夕”,而大數據風控行業(yè)也到了變革之時。
技術無罪 爬蟲做錯了什么?
眾所周知,金融的核心環(huán)節(jié)是風控,而作為大數據行業(yè)不僅連接著用戶,還面向現金貸公司,是現金貸機構的重要合作伙伴。通過第三方數據的服務,一方面能夠為現金貸風控提供安全參考,但另一方面一旦數據被販賣、泄露,就會對用戶的隱私造成侵犯,也容易將大數據風控行業(yè)推向深淵。
濫用的用戶數據讓大家就如裸泳一般,毫無隱私可言。
這一切的罪魁禍首就是爬蟲技術。
爬蟲技術本無罪。
網絡爬蟲,也叫網絡蜘蛛(spider),是一種用來自動瀏覽網頁的網絡機器人。通俗來講,爬蟲就是一項計算機技術,其作用是搜集網頁上的信息或數據,然后把搜集到的數據搬運到自身數據庫里。
如今,爬蟲技術被用到了搜集數據。
爬蟲作為一種技術決定了它的中立性,因此爬蟲本身在法律上并不被禁止,但是利用爬蟲技術獲取數據、販賣等行為就具有違法犯罪的風險了。
如今的現金貸就是如此。
對于現金貸平臺來說,用戶授權后,風控數據供應商通過后臺“爬蟲”搜集信息,這里的信息就包括公開的第三方數據、還有用戶主動授權的個人基本信息,如設備號、IP地址、運營商/電商等用戶授權后合規(guī)采集數據。最終通過互聯網將這些信息進行整合,最終形成對借款人的綜合評估,供金融機構做相應的后續(xù)決策。
以此次被調查的魔蝎科技為例。
魔蝎科技的核心產品是向放貸機構提供運營商報告,據魔蝎科技此前對外宣傳,提供數據采集分析、挖掘、機器學習以及風控服務,其2018年已經達到數億級的數據調用量,幫助750家金融領域的合作伙伴降低了風險,提高了效率。
其實魔蝎科技在2017年早就被一篇自媒體文章點名,其開發(fā)的“爬蟲產品”是“竊取別人的勞動成果,太野蠻”,魔蝎科技對此并未否認,只是表示“未來2個月,我們將關停爬蟲業(yè)務,同時會啟動已簽約客戶的賠償機制”。
不過,事實并非如此。
此后,魔蝎科技的爬蟲業(yè)務不但沒有關停,反而還爬的更深了。據2019年1月《IT時報》報道,魔蝎科技的一位產品經理向其提供了一份包含50余項數據的產品報價表,表中包括運營商、支付寶、京東、滴滴、網銀賬單、壽險保單等不同類型的數據。
據悉,魔蝎科技除了運用爬蟲技術侵犯用戶隱私、買賣公民個人信息之外,還涉嫌親自下場放現金貸,這在一定程度上也助長了“套路貸”、“高利貸”。
除了以上是魔蝎科技利用技術做非法的事之外,助力合作伙伴暴力催收也事情的關鍵問題所在。據悉,魔蝎科技的合作方百乘金科涉嫌暴力催收,并于2019年7月份被查。同樣,新顏科技也被懷疑助力暴力催收,向催收機構發(fā)送貸款人及關聯人精準資料。
事實上,這一波大數據行業(yè)的震蕩早有先兆,在2019年3月份,此前號稱“簡歷一哥”的巧達科技因為爬蟲被抓,其公司被查封,所有員工被警察帶走。
經過巧達科技這一事之后大數據行業(yè)應該有所警醒。
2017年,中國第一部《網絡安全法》正式施行,其中明確規(guī)定,獲取用戶數據必須經過授權,“未經授權爬取用戶手機通訊錄超過50條記錄,公司法人最高可獲刑3年;未經授權讀取用戶公積金社保記錄超過5萬條的,公司法人最高可獲刑7年”。
爬蟲這項技術是中立的,例如搜索引擎,但問題在于機構是否得到授權以及后期是否有超規(guī)利用,但是似乎像魔蝎科技、巧達科技這類的平臺都有一種僥幸心理,甚至是知法犯法。
俗話說,人,走的正,路上才不會遇到鬼。
大數據風控會是下一個“P2P”嗎?
那么在人人自危的惶恐中,大數據風控領域會成為下一個“P2P”嗎?
在GPLP犀牛財經看來也不無這個可能。金融作為一個以數字體現價值的典型行業(yè),大數據技術已經廣泛應用于金融的多個領域,比如風險控制、客戶管理、精準營銷和產品服務創(chuàng)新等。
自P2P平臺誕生的那一刻起,幾乎所有的P2P平臺都在談風控,互聯網金融的核心環(huán)節(jié)就是風控,大數據風控即大數據風險控制,是指通過運用大數據構建模型的方法對借款人進行風險控制和風險提示。
但事實上中國P2P平臺的風控一直處于紅色警戒線邊緣,如果說備案是P2P的開始,那么風控就是其核查的重心。
隨著互聯網技術的發(fā)展,互聯網前沿科技已經成為P2P行業(yè)發(fā)展的驅動力,利用大數據技術來做P2P網貸平臺風險評級和風險控制,也已成為行業(yè)發(fā)展必須邁過的一道坎。
就拿眾所周知的螞蟻花唄來說,她就是典型的信貸模式。一般來說,信用貸款不需要提供任何實物,只需憑借借款人的基本信用狀況來審批其資質。
而信貸的風險控制需要基于平臺對借款人違約風險的預判,要是沒有大數據的支持,去判斷借款人的征信資質、還款意向及能力、是否具有隱性負債等就非常依賴平臺自身的把控能力,因此從某種層面來說,風險系數就會加大。
當然就不說螞蟻花唄的風險控制有多厲害,在接連不斷的網貸暴雷的事件中我們發(fā)現,多數出現資金鏈斷裂、提現困難及倒閉跑路的平臺,在運營中普遍缺乏或缺失強有力的風控支持,作為互金行業(yè)的隱形從業(yè)門檻,風控能力的強弱無疑決定了網貸平臺是否具有核心競爭力,也同時決定了出借人的合法權益能否得到切實保障。
不過很多大多數網貸平臺都是“掛羊頭賣狗肉”,一些P2P平臺缺乏風控體系管理,對于借款人還款能力缺少風險把控,致使其發(fā)展成為中小企業(yè)、微型企業(yè)的融資“倒貸”平臺。
一些P2P平臺通過虛假設立投資標的,違規(guī)開展自融業(yè)務,非法套取投資人資金,募集款項投向房地產、高利貸等高危行業(yè);有的還擅自設立賬外賬,挪用投資款項,造成投資人資金體外循環(huán)。
備案定網貸平臺的生死,那么決定大數據風控平臺未來的關鍵是什么呢?
或許這一波監(jiān)管勢必不會只是清風拂過。
技術沒有好壞,在于運用在誰的手里。就拿運營商爬蟲服務來說,是在用戶授權賬號的前提下,登錄用戶的運營商賬戶,抓取一些手機卡過往使用情況的信息,包括使用時長、常用聯系人、套餐信息等,以此驗證機主的真實性來做風控,主要用于反欺詐。
出發(fā)點是好的,事實也有相關法律,只要合法經營就沒有問題,但是關鍵在于收集、使用信息必須經被收集者同意,不能買賣數據。
而現在的情況已經發(fā)展成為不僅僅是販賣數據,侵犯了用戶個人隱私甚至還助力暴力催收,為這些公司提供用戶的個人信息,這就嚴重違反了法律這條“紅線”。
從另一個角度來說,一些小的P2P平臺號稱自己有多牛逼的風控系統(tǒng),再加上大數據風控是個很好的概念,也是所有貸款類平臺的理想,因此被人趨之若鶩,然而,現實和理想總是差著十萬八千里。
風光的背后是無數人遭受信息泄露的騷擾,用戶隱私權受到侵犯。
雖然大數據風控的核心點在于有效數據的數量和質量,理想狀態(tài)下,存在超級部門,可以構建完整的大數據平臺,然而,現實情況卻是,有效數據散落在各個角落,成為信息的孤島,沒有任何一方有能力把數據整合起來,當然也沒有一方愿意把自己的數據分享出去。
而為什么阿里、騰訊、京東這些互聯網公司有能力或是敢吹噓自己的大數據,那是它們基于消費者購物的習慣、檔次判斷你的信用層級。那么除了幾家互聯網巨頭,一般的P2P平臺,甚至是第三方數據服務商,其大數據從何而來呢?
因此,這一波大數據行業(yè)的震蕩怕是在短時間不會平靜下來,這或許也是一個好的開端,讓那些不合規(guī)、不合法的大數據公司剔除出去,這就像P2P備案一樣,為了讓行業(yè)更加健康良性的運營,就應該該關的關,該轉的轉。
大數據濫用致用戶之“殤”
大數據被稱為是社會發(fā)展的新“石油”,但是行走在大數據的社會,似乎人人都是一個“信息裸奔”的人,這讓人不寒而栗。
在大數據的助威下,大家也都接到過各種騷擾電話,貸不貸款、買不買房、做不做理財、買不買保險等等。除了手機號碼以外,你是不是也會發(fā)現自己的微博、抖音等平臺的賬號會“自動”關注某些網紅或者營銷賬號。
僅僅被電話騷擾引人反感之外,因為大數據帶給生活的不便甚至是生命的代價就不是小事了。
2016年,即將邁入大學校園的18歲山東女孩徐玉玉,面對未來存在無限可能的時候,卻因為一個詐騙電話,一切都不復存在了,詐騙者冒充教育局,以獎學金作為誘餌,騙去這個家庭東拼西湊的9900元學費。在報案之后,徐玉玉心臟驟停,不幸離世。
徐玉玉一事背后是信息泄露之“殤”,徐玉玉面對的騙局看似并不高級,但是對于不諳世事的小姑娘來說,對方能清楚的知道自己的名字、精確了解自己錄取的學校和專業(yè),同時還能知道自己有申請獎學金的需求,怕是大多數人都會放下心里的戒備。
騙子謀財導致害命當然可恨,但是同樣可恨的是泄露信息的人。
2018年,阿里安全協助警方破獲的“史上最大規(guī)模的數據竊取案”顯示,黑數據公司通過劫持運營商流量竊取了96家互聯網公司的數據。這家黑數據公司是一家上市公司,本案告破阻止了30億條數據的進一步外泄。
事實上,過去幾年里,不管是谷歌還是臉書,從大公司到小平臺,從國外到國內,數據泄露事件頻發(fā),僅2018年就包括:圓通的10億條快遞信息在暗網上架出售;華住酒店、萬豪酒店各有5億用戶信息外泄;國泰航空940萬乘客數據流出;陌陌3000萬用戶數據泄露……
有數據統(tǒng)計,在個人信息保護方面,網民被泄露的個人信息涵蓋范圍非常廣泛,其中78.2%的網民個人身份信息被泄露過,包括網民的姓名、學歷、家庭住址、身份證號及工作單位等;63.4%的網民個人網上活動信息被泄露過,包括通話記錄、網購記錄、網站瀏覽痕跡、IP地址、軟件使用痕跡及地理位置等。
一邊是行業(yè)急速發(fā)展,技術不斷迭代,通過數據喂養(yǎng)的風控技術變得越來越成熟;另一邊,一批大數據行業(yè)從業(yè)者被警方帶走,這大多是因為涉及用戶隱私和數據違規(guī)使用。
在此背景下,大數據風控行業(yè)亂象已久,人們飽受信息泄露之擾也很久了,對于第三方數據服務商來說,隨著此次監(jiān)管信號的釋放,一大批平臺也該被驅逐出這個圈子,野蠻不合規(guī)的大數據收集時代將進入冷靜期。
此次大數據風控領域的動蕩,或許是監(jiān)管部門對大數據黑產的新一輪打擊。
那么對于這些利用“爬蟲業(yè)務”的大數據公司來說,顯然,爬蟲有風險,用時需謹慎。
當然,從監(jiān)管的角度來說,應當盡快制定完善針對網絡爬蟲的數據安全法律法規(guī),將網絡“爬蟲”引向合法正軌的渠道,面對那些看似合法或者是違法的“爬蟲”,就應該重拳出擊,拳拳到肉,加大懲罰和偵查力度,清肅行業(yè)的“害蟲”。
免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。