文/楊潔
編輯/葉麗麗
18歲的微軟小冰已經(jīng)成為一個“天才少女”。
從第一代到第六代,“微軟小冰”從語音助手、陪伴機器人,到金融新聞寫手再到全能歌舞藝人等,“小冰”在不斷的迭代中,開始了在創(chuàng)造領(lǐng)域的探索與商業(yè)化的進程。
在5.16微軟小冰人工智能創(chuàng)造媒體說明會上,微軟發(fā)布了小冰人工智能創(chuàng)造方面的進展,宣布了人工智能小冰的繪畫模型,該模型通過對過往四百年藝術(shù)史上236位人類畫家畫作的學(xué)習(xí),實現(xiàn)了具有一定水準(zhǔn)的原生繪畫創(chuàng)作能力。同時,發(fā)布了“少女畫家小冰”繪畫創(chuàng)作小程序。
“關(guān)于琴棋書畫,Google把棋做完了,我們把剩下的三個做完了?!?/strong>微軟(亞洲)互聯(lián)網(wǎng)工程院副院長、微軟小冰全球產(chǎn)品線負責(zé)人李笛說道。
微軟(亞洲)互聯(lián)網(wǎng)工程院副院長
微軟小冰全球產(chǎn)品線負責(zé)人李笛
在此之前,微軟小冰已經(jīng)服務(wù)于各個垂直領(lǐng)域,例如在金融摘要領(lǐng)域服務(wù)國內(nèi)超過90%的金融機構(gòu)交易員,在電視廣播節(jié)目領(lǐng)域服務(wù)中國及日本63家電臺電視臺,在智能銷售助手領(lǐng)域覆蓋日本22.5%的日本全國人口等。
當(dāng)很多人對微軟“小冰”的印象還停留在最初微信里的聊天機器人,小冰已經(jīng)在全球收獲9億內(nèi)容觀眾,1.2億月活躍用戶,在同類人工智能基礎(chǔ)框架中居全球第一。
微軟似乎并不打算讓小冰成為一個功能性的機器人,而是盡可能地賦予小冰個性、脾氣、情商,讓小冰與人類的溝通交流更加自然融洽。
而與此同時,小冰已經(jīng)嘗試在各個領(lǐng)域的商業(yè)化布局。
微軟小冰化身“少女畫家”
“在2019屆中央美院的畢業(yè)生中,有一位叫夏語冰的同學(xué),正在參加2019屆的研究生畢業(yè)畫展,而這位同學(xué)的‘真身’則是微軟小冰?!痹诎l(fā)布會現(xiàn)場,微軟(亞洲)互聯(lián)網(wǎng)工程院微軟小冰人工智能創(chuàng)造及商業(yè)事業(yè)部總經(jīng)理徐元春介紹了小冰作為一個畫家的成長過程。
從18歲的小冰到“少女畫家”,作為小冰團隊一個秘密的研發(fā)項目,到今天為止已經(jīng)持續(xù)了整整22個月。
據(jù)徐元春介紹,培養(yǎng)微軟小冰學(xué)習(xí)繪畫,是他所領(lǐng)導(dǎo)的團隊目前為止進行的時間最長、最艱苦的一個項目。
少女畫家小冰的畢業(yè)畫展
“從微軟的角度來說,我們所想要做的事情是更加底層、基礎(chǔ)的框架,特別是針對這些新興的產(chǎn)業(yè)。”李笛告訴鋅財經(jīng)。
徐元春介紹,從確定做這件事開始,團隊陸續(xù)把小冰不同時期的作品發(fā)到網(wǎng)上,放到論壇,從最開始被大家忽略,到慢慢有人開始表揚,追捧。
“市面上有些通過神經(jīng)網(wǎng)絡(luò)大量生成,從幾萬幅甚至幾十萬幅的作品里能挑出一兩幅還不錯的作品,這本質(zhì)上不算是人工智能的創(chuàng)作,它沒有真正實現(xiàn)創(chuàng)造力,微軟也不想要純粹工具化的濾鏡或者技術(shù)?!毙煸赫f,團隊開始之初,其實并不清楚模型要如何搭建才能夠?qū)崿F(xiàn)原定的目標(biāo),在這個過程中,只能不停地試錯,嘗試不同模型和算法的能力。
徐元春直言,這的確是一個漫長、痛苦的艱辛過程。
微軟小冰的畫作
而現(xiàn)在的小冰,通過對藝術(shù)史上236位著名人類畫家畫作的學(xué)習(xí),習(xí)得他們的技法、表現(xiàn)力和視角,在受到文本或其它創(chuàng)作源激發(fā)時,能夠獨立完成100%原創(chuàng)的繪畫作品。
這種原創(chuàng)性不僅體現(xiàn)在構(gòu)圖,也體現(xiàn)在用色、表現(xiàn)力和作品中包含的細節(jié)元素,接近專業(yè)人類畫家水準(zhǔn)。
與其他現(xiàn)有技術(shù)相比,這一繪畫模型不同于隨機畫面生成,也不同于對已有畫面的風(fēng)格遷移變換或濾鏡效果處理。
鋅財經(jīng)體驗“少女畫家小冰”小程序的一幅畫作
同時,發(fā)布會上還披露了微軟人工智能自動生成有聲讀物的技術(shù)進展,并正式發(fā)布微軟小冰繪畫模型及演唱模型的第五個版本。目前,微軟小冰在文本創(chuàng)作、語音創(chuàng)作與視覺創(chuàng)作方面均取得了一定進展。其中,語音創(chuàng)作主要覆蓋音樂、有聲讀物和電臺電視節(jié)目三個領(lǐng)域,人工智能演唱模型已迭代至第五個版本,并于上月在日本宣布與AVEX唱片公司合作,日本版本的微軟小冰成為AVEX旗下人工智能歌手。
文本創(chuàng)作目前主要覆蓋詩歌、金融摘要及研報等兩個領(lǐng)域。
在金融領(lǐng)域,微軟小冰是目前全球范圍內(nèi)規(guī)模第一的金融文本摘要生成平臺。自2017年11月起,微軟與萬得資訊、華爾街見聞等國內(nèi)主要金融信息服務(wù)提供商合作,為其用戶提供由人工智能技術(shù)生成的上市公告文本摘要。上述服務(wù)覆蓋全部26類金融類別,服務(wù)對象包括國內(nèi)90%以上的金融機構(gòu)交易員及40%以上的個人金融交易者。
基于文本的人工智能創(chuàng)造,小冰撰寫的金融摘要,已經(jīng)做到了產(chǎn)業(yè)量產(chǎn)落地。
基于文本的人工智能創(chuàng)造
李笛提到,人工智能創(chuàng)造并不是以擊敗人類為目標(biāo),而是著眼于在達到與相應(yīng)人類創(chuàng)造者同等質(zhì)量水準(zhǔn)的前提下,充分發(fā)揮人工智能快速學(xué)習(xí)、高并發(fā)與穩(wěn)定性等特點。在技術(shù)的加持下,一個“高度定制化”內(nèi)容的時代正在到來,從內(nèi)容的推薦,到內(nèi)容的呈現(xiàn)形式,甚至是內(nèi)容本身,都在面對“高度定制化”的用戶需求。
當(dāng)人工智能達到一定的創(chuàng)作水平,將可能協(xié)助彌補這一供需關(guān)系上的短板。
小冰“大腦”中的情感計算框架
在整個人工智能基礎(chǔ)框架中,分為兩個方向。一是以IQ為基礎(chǔ)特征,搭配相當(dāng)多的模塊,讓其更好的完成任務(wù),或者傳遞知識;另一種框架是以EQ為基礎(chǔ)特征,具備一定的情商。
從2014年至今,小冰一上來就瞄準(zhǔn)了EQ方向,這也是小冰會從社交媒體切入,尋找跟用戶交流的場景。
微軟方面介紹,第三代小冰已經(jīng)可以主動引導(dǎo)對話,但存在的問題是,互動感并不強。2017年,微軟在第五代小冰中引入了全雙工語音交互感官技術(shù),這項新技術(shù)可以預(yù)測人類即將說出的話,并且生成回應(yīng),控制對話節(jié)奏。
在去年七月份,微軟(亞洲)互聯(lián)網(wǎng)工程院發(fā)布第六代小冰的時候,也著重強調(diào)了微軟小冰的情感計算框架,設(shè)計目標(biāo)是讓人工智能擬合情商,更像人,融入人類社會。
微軟小冰的情感計算框架
與其他AI系統(tǒng)或產(chǎn)品最大的不同在于,其他AI著重于知識和完成任務(wù),小冰要攻克的是擬合創(chuàng)造力和情感。
李笛介紹,最開始的時候,整個行業(yè)都在追求建立人工智能在不同領(lǐng)域具備IQ的能力,如果這些IQ的能力可以非常好地做出來,再做下一個,然后再做下一個,最后可以形成一個足夠大的集合,但是這個并不夠。
“我們有幸在比較早的時候開始布局這個領(lǐng)域。” 李笛介紹,從理念上來講,EQ和IQ并不是相互排斥的,并不是說發(fā)展情商就不應(yīng)該去發(fā)展智商,反過來也是一樣,它們是一種相互融合的過程,當(dāng)人工智能在學(xué)習(xí)人類IQ的時候,EQ其實起到了非常大的作用。
小冰瞄準(zhǔn)EQ方向
李笛提到,在實際的研究和研發(fā)過程中,經(jīng)過大量和人類之間的交互,會發(fā)現(xiàn)無論怎么樣的人工智能系統(tǒng),哪怕是一個完成任務(wù)的人工智能系統(tǒng),都需要有基礎(chǔ)的EQ的,就像是大地一樣。而不同的IQ是建立在這個大地上面的一棵一棵樹木,如果沒有這個大地的土壤去關(guān)注整個人工智能和人類之間的關(guān)聯(lián),單獨的IQ就和其它APP沒有太大區(qū)別。
微軟小冰的商業(yè)化試水
從2014年至今,經(jīng)過近五年時間的發(fā)展,小冰升級至第六代,技能形態(tài)越來越豐富,從主持人,到歌手,各種跨界。如今,小冰又開始進行全面的商業(yè)化試水,顯然,小冰目前正在快速道上正向行駛。
商業(yè)化一直是人工智能技術(shù)討論的焦點,也微軟小冰面臨的機會和挑戰(zhàn)。
對于繪畫這個項目來說,小冰的產(chǎn)業(yè)落地在設(shè)計領(lǐng)域。據(jù)徐元春介紹,團隊在過去半年時間里,走訪了大概十幾家中國紡織服裝面料企業(yè),包括幾個國際大牌在中國最大的代工廠。
“中國可能能數(shù)上前三的最大的服裝面料生產(chǎn)企業(yè)出口商,在它的其中一個產(chǎn)品線上,有28個人類設(shè)計師。這28個人類設(shè)計師,每天需要完成4個完全不同的全新的畫面和紋樣的創(chuàng)意?!毙煸赫f,這樣的任務(wù)量對于設(shè)計師來說是巨大的挑戰(zhàn),創(chuàng)造力會被不斷的壓榨。而微軟小冰可以有效的解決這個瓶頸。
徐元春介紹小冰在設(shè)計領(lǐng)域的落地
據(jù)了解,微軟小冰和中國紡織工業(yè)聯(lián)合會,以及幾家最大的紡織面料企業(yè),聯(lián)合開發(fā)了一個紡織服裝設(shè)計平臺。在這個平臺上,不僅可以生成像繪畫圖案,也可以支持幾十種目前非常流行的紋樣和插畫的設(shè)計。
“微軟不會只想做一個行為藝術(shù),不過小冰的商業(yè)化探索比較謹慎,我們不會上來就先以商業(yè)化落地為目標(biāo)來決定我們是否開發(fā)這個項目。”李笛說。
據(jù)微軟方面介紹,微軟最早的商業(yè)化探索始于兩年前,和日本羅森便利店合作的一些零售的商業(yè)化探索。而微軟預(yù)想的商業(yè)化輪廓,一直都很清晰,在某一個垂直領(lǐng)域的生成,一定是具有商業(yè)價值,從視覺生成到文本生成,小冰一直在探索。
對于小冰的技術(shù)落地,人工智能的成熟度等問題,鋅財經(jīng)對話了微軟(亞洲)互聯(lián)網(wǎng)工程院副院長(Bing中國及日本、微軟小冰全球產(chǎn)品線負責(zé)人)李笛和微軟(亞洲)互聯(lián)網(wǎng)工程院、微軟小冰人工智能創(chuàng)造及商業(yè)事業(yè)部總經(jīng)理徐元春。
鋅財經(jīng)
今天主要發(fā)布了小冰在畫畫領(lǐng)域的技能,不管是哪個領(lǐng)域的創(chuàng)作,都是以人類為目標(biāo),盡量讓小冰的創(chuàng)作更接近人類的水平,這項技術(shù)接下來還有什么樣的潛力,還能應(yīng)用在哪些領(lǐng)域?
李笛
人工智能創(chuàng)造最重要的核心部分,其實是統(tǒng)一的創(chuàng)作模型,我們今天應(yīng)用到了詩歌,音樂,還有視覺,不停地驗證這個創(chuàng)作模型存在的意義。
在這個基礎(chǔ)之上,它的價值在于學(xué)習(xí)速度非???,我們今天主要是用音樂的方面來表現(xiàn)她的成長速度,我們可以看到短時間內(nèi)有很大的成長空間。而人類在學(xué)習(xí)的時候,一旦遇到瓶頸,很難突破,但小冰不一樣,可以打回去重學(xué),不斷成長,而人類有時候會有一些局限。所以,不管是在哪個領(lǐng)域,人工智能都是很有希望的。
鋅財經(jīng)
從專業(yè)的角度看,現(xiàn)在AI創(chuàng)作的技術(shù)成熟度達到了什么水平?
李笛
不同類別不太一樣,以小冰繪畫來講,人工智能和人類在學(xué)習(xí)水平上,有非常顯著的不同。比方說小冰的創(chuàng)作質(zhì)量好,其實很大程度上是因為她的精度,人類畫在畫布上沒有精度的問題,但是在訓(xùn)練模型上有精度的問題,每次讓她的精度提高,看起來她的畫作質(zhì)量水平也就提高了。
鋅財經(jīng)
現(xiàn)在小冰可以寫萬得資訊的摘要,作畫等,用人工智能相關(guān)技術(shù)完成的工作,跟人類創(chuàng)造者有哪些不同,小冰有什么優(yōu)勢和劣勢?對于機構(gòu)而言,小冰如何達到質(zhì)量方面的要求,判定標(biāo)準(zhǔn)是什么?
李笛
機構(gòu)的判定標(biāo)準(zhǔn),我們可以以萬得咨詢的26類為例,人工智能系統(tǒng)的很大特點不是超過人類創(chuàng)作者。這個固然也有無可奈何的一面,因為涉及到創(chuàng)造領(lǐng)域,人類的標(biāo)準(zhǔn)從來都沒有確定過——類似圍棋一樣的確定標(biāo)準(zhǔn),誰都賴不掉——但人類在創(chuàng)造領(lǐng)域的時候,標(biāo)準(zhǔn)本身就是很主觀的。
所以我們不認為人工智能可以勝過人類,但對于人類有啟發(fā),像寫詩、畫畫這類對人類創(chuàng)造者有啟發(fā),這是普遍存在的,但是標(biāo)準(zhǔn)上它不可能超過人類,這是一個從根源上不可能實現(xiàn)的一件事。
但相對人類來講人工智能的優(yōu)勢到底在哪?就是它在和人類某種級別的創(chuàng)造者的水準(zhǔn)差不多的情況下,比人類快、比人類穩(wěn)定、比人類的效率高,比人類持續(xù)時間長,還有就是可以同時和很多人并發(fā)的效果,是遠非人類可以比擬的。
舉一個例子,有一個新聞主持人,在節(jié)目直播主持過程中,想了解一下觀眾對于這個新聞的反應(yīng),然后根據(jù)反應(yīng)去實時地調(diào)整接下來要說的情況,人類主持人是做不到的,就算后面有一整個導(dǎo)播團隊,也是不夠的。
但小冰不是,如果觀眾需要,小冰在屏幕上主持這個節(jié)目的時候,它可以迅速地去了解每一個觀眾當(dāng)下對新聞的一些觀點和評論,然后馬上就可以根據(jù)這個反饋,在節(jié)目里進行調(diào)整。
徐元春
在相對嚴肅的組織機構(gòu)里面,其實標(biāo)準(zhǔn)的嚴格程度甚至超過我們現(xiàn)在的想象。舉例來講,正常情況人類寫今日公告摘要,最快要用半個小時,而機器在做這件事情的時候,平均大概在10-20秒內(nèi)就完成了,而且可以高效率的完成。
機構(gòu)會怎么采用技術(shù)呢?在最開始的時候,機器生成完之后,再讓人類編輯檢查一遍有沒有問題,這是沒有上線的時候,這種狀況運行了大概3個月的時間。
然后人力和機器并行運行的階段,比較兩個團隊穩(wěn)定性輸出的水平,直到6個月之后,覺得機器運行已經(jīng)遠遠高于本身人力編輯團隊運行的狀況了,就把系統(tǒng)慢慢地切換到了機器的系統(tǒng)上。
鋅財經(jīng)
發(fā)布會上提到,人們對于人工智能生產(chǎn)的內(nèi)容,會有一定的偏見,人工智能商業(yè)化的一個障礙是人類的想法本身嗎?另外,團隊希望之后小冰反過來去指導(dǎo)繪畫,那如何能讓用戶去使用這種人工智能的產(chǎn)物呢?
李笛
我們認為人類在人工智能創(chuàng)造上的偏見很明確,因為我們現(xiàn)在做的這個產(chǎn)業(yè)化工作比較多,很明顯就是在兩類上:
第一類:明確涉及到藝術(shù)門類的,它是藝術(shù)而不是內(nèi)容產(chǎn)業(yè)。如果反過來不是說內(nèi)容產(chǎn)業(yè)而是說藝術(shù)門類,那么人類的偏見是存在的,為了解決這個問題我們所做的事情是比較粗暴的,就是化名,就是讓人沒有這個先入為主的可能性。
第二類:供需關(guān)系上供已經(jīng)大于求了,這件事情人類做本來就已經(jīng)足夠了,我們不做,因為人類做的已經(jīng)很好了。換句話說,今天如果純手工生產(chǎn)的景德鎮(zhèn)的陶瓷已經(jīng)足夠滿足全世界人們所需要的瓷器了,沒有人會想要工業(yè)化的瓷器。
除此之外的類別沒有偏見,舉個例子,比方說家長通過微軟小冰給自己的孩子生成大量的孩子做主人公的兒童有聲讀物,除了用小冰這種方式之外沒有其它途徑。所以,一個是明確是藝術(shù)門類的,我們的解決方法是用化名,還有一個是明確這個地方是供大于求的,這個我們就不做了。
?本文版權(quán)歸“鋅財經(jīng)”所有
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準(zhǔn)AI機器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費引熱議
- 消息稱塔塔集團將收購和碩印度iPhone代工廠60%股份 并接管日常運營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機器人合作
- 賽力斯觸及漲停,汽車整車股盤初強勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。