當我們遇到一個科技研發(fā)難題,譬如人工智能在某個場景的應用與落地,應該怎么做?
如果按照傳統(tǒng)的做法,那么首先應該找來一些精英的專家組成研發(fā)團隊,將他們聚在一起群策群力,然后歷經反復的研發(fā)與測試,耗費大約一兩年甚至更長的時間,最后開發(fā)出一套解決方案。
在很長一段時間里,在絕大部分場景下,幾乎所有的公司都采用的是這種開發(fā)模式。
然而亞馬遜云科技及其合作伙伴Biendata卻告訴我們,其實還有一種創(chuàng)新的開發(fā)模式,可以讓人工智能應用創(chuàng)新的速度更快、門檻更低、更加普惠。
眾包競賽:一種創(chuàng)新的開發(fā)模式
Biendata由清華大學計算機系孵化,旗下產品與服務包含人工智能競賽、數據科學社區(qū)、前沿人工智能報道、專注于AI行業(yè)的品牌傳播服務等。
以競賽與社區(qū)為入口,Biendata致力于打造國內一流數據科學綜合服務平臺。在競賽方面,Biendata打造的人工智能競賽平臺已經累計舉辦了100多場專業(yè)算法賽事,累計參賽選手超過10萬人,累計總獎金超過700萬元,累計運營比賽社群總人數超過2萬人;在社區(qū)方面。Biendata運營的人工智能學者社區(qū)用戶已經超過10萬人,主要分布于大型互聯(lián)網企業(yè)、研究機構、學校,其中學生用戶占比超過70%。
“在過去的幾年里,如何降低人工智能技術應用的門檻,實現(xiàn)人工智能的普惠,一直都是大家關注的熱點。而在業(yè)務的發(fā)展和創(chuàng)新過程中,我們發(fā)現(xiàn)有一種眾包競賽的方式,有可能是傳統(tǒng)開發(fā)方式之外一種有益的補充,其開發(fā)效率甚至有可能會超過招募全職的專家團隊?!弊鳛锽iendata平臺的創(chuàng)建者,北京數競科技有限公司創(chuàng)始人兼CEO管心宇向趣味科技介紹道,“于是我們就做了一些關于人工智能、開發(fā)者社區(qū)的一種新的組織模式,也就是Biendata眾包競賽平臺。其中Bien是法語,也就是‘好’的意思。我們希望能夠在這個平臺上匯聚很多很好的數據集和很好的開發(fā)者,這其實是我們對當時各種科技類創(chuàng)新模式的一種觀察和探索?!?/p>
管心宇指出,所謂眾包競賽,就是由需求方(或者主辦方、甲方)提出一種獎勵的機制,這種獎勵可以是現(xiàn)金,也可以是資源等其他形式。相比傳統(tǒng)開發(fā)模式,眾包競賽參與的門檻很低,不論國籍、性別、年齡、職業(yè)、全職還是兼職,都可以參賽。在每個人都可以參加比賽的原則之上,還有一個統(tǒng)一的評測方法,能夠對所有參賽者的作品進行排序,再把比賽獎勵頒發(fā)給獲獎的第一名或是前幾名。
“在探索與實踐的過程中,我們發(fā)現(xiàn)眾包競賽里面其實有很多案例或者理論研究、行為經濟學或者管理學研究,而且這種方式是非常有效果的,于是我們就想探索看它是不是能被應用在人工智能領域的創(chuàng)新里。”管心宇透露,“結果我們發(fā)現(xiàn),這種方式其實特別適合人工智能,因為前面介紹過,競賽中有一個評測環(huán)節(jié),而評測有時候是比較主觀的,很容易成為這種眾包競賽的問題所在。但是人工智能不一樣,它往往都有一個Benchmark的標準數據集。大家在這個數據集上去運行模型,就能得到一個非??陀^的評測結果。譬如預測明天的天氣怎樣、溫度多少,到了明天我們就能知道評測結果與事實的差異。這也充分保證了眾包競賽結果的公平性?!?
選擇亞馬遜云科技的原因
像Biendata這樣的平臺,自然也離不開強大穩(wěn)定的云服務支撐。早在還處于原型階段的時候,Biendata就針對多家云服務商進行了調研和對比,最終選擇了采用亞馬遜云科技的云服務。
談到Biendata為什么在強手如林的云服務商中選擇了亞馬遜云科技時,管心宇表示主要有以下四個方面的原因:
一、數據安全保障性高。亞馬遜云科技看重數據保護,合規(guī)性和數據隱私;并且從底層數據中心搭建、網絡訪問以及操作權限設置,都提供了多方面的安全保障。
二、可伸縮的強大計算能力。豐富的實例類型配合易用的工具,加速在云中不同規(guī)模的深度學習的速度,Biendata可以更關注上層應用設計與算法整合,而不用再擔心資源瓶頸。
三、穩(wěn)定可靠的技術。系統(tǒng)的整體穩(wěn)定性顯著提高,廣泛支持開源軟件與商用軟件的對接,應用程序的可用性達到99.9%,也無需為基礎架構服務的穩(wěn)定性而擔憂。
四、具有成本效益的服務。節(jié)省了資源成本和人力成本。其中在資源分配方面,結合Amazon EC2 Auto Scaling和Amazon EC2 Spot實例的應用,使得資源占用成本大幅降低;而在人工成本方面,亞馬遜云科技的自動管理功能降低了對系統(tǒng)運維的需求,節(jié)省了雇用專職運維人員的成本。
“在過去幾年的合作過程中,我們發(fā)現(xiàn)幾乎每一個產品都可以在亞馬遜云科技的產品線里找到一個比較對應的功能,可以很好地支持我們去做快速的研發(fā)、上線、迭代,這極大地提升了我們的開發(fā)效率?!惫苄挠畋硎?,“除此以外,在安全性和合規(guī)性方面,亞馬遜云科技也擁有非常顯著的優(yōu)勢,能夠滿足全球幾乎所有監(jiān)管機構的合規(guī)性要求。舉例來說,我們在新加坡國立大學項目競標的時候,客戶就非常重視安全與合規(guī)的能力,因為當地法律特別嚴,對各項數據都要求有相應的安全標準和極強的保護措施。原本要滿足這些標準是非常麻煩的,光是申請的時候就需要提交大量材料,但因為我們的服務本身是在亞馬遜云科技新加坡區(qū)域的云上,所以它自動的、默認的就已經符合里面絕大部分的標準和要求,很多材料也都是現(xiàn)成的。原本這個申請過程至少要準備三到五個月,后續(xù)可能還需要做一些測試,甚至還要找第三方機構來進行認證。但是因為亞馬遜云科技已經滿足了這些嚴格的隱私和數據保護要求,所以以上這些過程全部都省略了,幫助我們節(jié)省了大量的時間和成本?!?/p>
將普惠人工智能推向全球
作為一個技術項目,Biendata于2015年啟動,2017年開始獨立運營,并選擇了亞馬遜云科技開展合作。2019年,Biendata加入亞馬遜云科技全球合作伙伴網絡(APN)。從此Biendata不只是亞馬遜云科技的客戶,同時也成為了其堅實的合作伙伴,為更多用戶提供云上的人工智能方案。
2020年肆虐全球的新冠疫情,讓許多創(chuàng)業(yè)公司都遭遇了極大的業(yè)務挑戰(zhàn)。然而Biendata卻借助云上開展在線業(yè)務的優(yōu)勢,通過更多云原生的服務降低了運維成本,并將更多關注放在業(yè)務本身,實現(xiàn)了業(yè)務的迅猛發(fā)展。譬如新冠剛開始流行的時候,Biendata就聯(lián)合北京智源人工智能研究院、晶泰科技組織了“藥物研發(fā)小分子性質預測賽”,加速藥物研發(fā)的速度和藥物篩選的過程;針對新冠流行趨勢,Biendata聯(lián)手智譜和清華大學組織了“新冠流行預測”,根據患病和疑似病例的人數預測未來七天新增人數趨勢,幫助政府部門和政策制定者更好地預測新冠流行趨勢,提前做好預警和備案;Biendata還聯(lián)合清華大學、Aminer等機構聯(lián)合組織了“COVID-19知識圖譜構建”競賽,從大量的科學文獻中自動提取關鍵知識,幫助科研人員更加高效地針對病毒開展科研工作。
除此以外,Biendata還在2015-2020年承辦過四次全球最具影響力、素有“數據世界杯”稱號的KDD CUP比賽。特別是2018年的比賽,當時Biendata做了一個空氣污染預測的比賽,要求選手去預測北京和倫敦這兩個城市未來PM2.5的濃度的變化趨勢,這個其實跟新冠預測也是一樣的,如果有很好的預測模型,就可以幫助社會和政策制定者提前做好準備。
2021年,Biendata的業(yè)務發(fā)展也上升到了一個新的階段。借助亞馬遜云科技安全合規(guī)的能力,Biendata贏得了更多的海外項目,并且與亞馬遜云科技的其他客戶合作開展了人工智能普惠的競賽,通過比賽為K12及高校領域培養(yǎng)更多的人工智能人才。以備受關注的Amazon DeepRacer無人駕駛訓練系統(tǒng)為例,就是Biendata與幾所高校合作,將DeepRacer的無人駕駛訓練系統(tǒng)和真車打包變成一個實訓產品,讓學生可以在線上的訓練系統(tǒng)中訓練自己的強化學習模型,然后將模型加載到小車中,在線下的賽道上實現(xiàn)自動無人駕駛。
“未來我們希望和亞馬遜云科技攜手合作,通過這種人工智能眾包競賽的方法,連接人工智能的開發(fā)者、數據集、應用場景、模型,然后將這些結合產生的優(yōu)秀成果普及到各行各業(yè),讓大企業(yè)、小公司甚至個人,都可以享受到人工智能技術帶來的成果。我們希望將普惠人工智能作為企業(yè)使命推向全球,促進海內外人工智能領域人才的交流合作,構建國際化的數據科學協(xié)同創(chuàng)新平臺,讓先進的人工智能科研成果和競賽經驗能夠跨越國界,進行無縫鏈接與融合。”管心宇說道。
免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。