精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>

<abbr id="ixlwe"></abbr>

<span id="ugzjt"></span>

直播
榜單
7x24h快訊

極客網(wǎng) > 人工智能 >

硅谷押注，生成式AI火了，讓你把簡單文字變成圖像甚至視頻

人閱讀
2022-10-10 08:24:10
來源：網(wǎng)易科技
作者：小小
相關(guān)關(guān)鍵詞

10月9日消息，最近幾年興起的所謂“生成式人工智能（generative AI）”正吸引硅谷科技巨頭和風(fēng)投機(jī)構(gòu)的興趣，這種AI可以依據(jù)少量詞匯在幾秒鐘內(nèi)生成與之相匹配的圖像。分析師預(yù)計(jì)，這種技術(shù)將被廣泛用于各行各業(yè)，并產(chǎn)生數(shù)萬億美元的經(jīng)濟(jì)價(jià)值。

雖然這些計(jì)算機(jī)程序生成的圖像并不完美，比如手上出現(xiàn)多余的手指，四肢不自然的彎曲等。同時(shí)，圖像生成器在處理文本時(shí)也會遇到問題，例如生成無意義的符號等。然而，這些圖像生成程序可能是一場科技熱潮的開始。硅谷風(fēng)投機(jī)構(gòu)NextView Ventures的投資人大衛(wèi)·貝塞爾（David Beisel）說：“在過去的三個月里，‘生成式人工智能’這個詞已經(jīng)變成了流行語?！?/p>

從2021年開始，生成式AI技術(shù)取得了巨大進(jìn)步，甚至激勵許多人辭掉工作去創(chuàng)辦新公司，夢想著AI將來可以為新一代科技巨頭提供動力。

在過去五年左右的時(shí)間里，AI領(lǐng)域始終處于蓬勃發(fā)展階段，但這些進(jìn)步大多與理解現(xiàn)有數(shù)據(jù)有關(guān)。AI模型已經(jīng)變得足夠高效，可以識別人們剛剛用手機(jī)拍攝的照片中是否有一只貓。此外，這些模型也足夠可靠，每天可以為谷歌搜索引擎提供數(shù)十億次搜索結(jié)果。不過，生成式AI模型可以生成以前沒有的全新東西。換句話說，它們是在創(chuàng)造，而不僅僅是在分析數(shù)據(jù)。

AI與機(jī)器學(xué)習(xí)平臺Craiyon Productive AI的創(chuàng)建者鮑里斯·戴瑪（Boris Dayma）說：“最令人感到印象深刻的是，生成式AI也能創(chuàng)作新的東西。它們不僅僅是創(chuàng)造類似的舊有圖像，還可以創(chuàng)造與以前完全不同的新事物。”

硅谷知名風(fēng)投公司紅杉資本(Sequoia Capital)在其網(wǎng)站上發(fā)文表示：“從游戲到廣告再到法律方面，生成式AI可能會改變所有需要人類創(chuàng)造力發(fā)揮作用的領(lǐng)域。這種技術(shù)有可能產(chǎn)生數(shù)萬億美元的經(jīng)濟(jì)價(jià)值?！备鼮橛腥さ氖牵t杉資本還在帖子中指出，其上述文章部分是由GPT-3撰寫的，后者本身就是能夠生成文本的生成式AI。

生成式AI的工作原理

圖像生成使用的技術(shù)來自機(jī)器學(xué)習(xí)的一個子集，稱為深度學(xué)習(xí)。自從2012年一篇關(guān)于圖像分類的里程碑式論文重新點(diǎn)燃人們對這項(xiàng)技術(shù)的興趣以來，深度學(xué)習(xí)推動了AI領(lǐng)域的大部分進(jìn)步。深度學(xué)習(xí)使用在大數(shù)據(jù)集上訓(xùn)練的模型，直到該程序理解這些數(shù)據(jù)中的關(guān)系。然后，該模型可以用于應(yīng)用程序，如識別圖片中是否有狗或翻譯文本等。

圖像生成器的工作原理就是逆轉(zhuǎn)這個過程。它們不是將英語翻譯成法語，而是將英語短語轉(zhuǎn)換成圖像。它們通常有兩個主要部分組成，一個是處理初始短語的部分，另一個是將數(shù)據(jù)轉(zhuǎn)換成圖像的部分。

第一部分生成式AI基于名為Generative Adversarial Networks（生成式對抗網(wǎng)絡(luò)，簡稱GAN）的方法。此前，這些GAN通常被用于生成不存在的人的照片。本質(zhì)上，它們的工作方式是讓兩個AI模型相互競爭，以更好地創(chuàng)建符合預(yù)定目標(biāo)的圖像。

而較新的方法通常使用轉(zhuǎn)換器，這是谷歌于2017年論文中首次提出的概念。這是一項(xiàng)新興技術(shù)，可以利用更大的數(shù)據(jù)集，盡管其培訓(xùn)成本可能高達(dá)數(shù)百萬美元。

第一個獲得大量關(guān)注的圖像生成器是Dall-E，它是硅谷初創(chuàng)公司OpenAI于2021年推出的項(xiàng)目。OpenAI今年發(fā)布了功能更強(qiáng)大的更新版本。專注于生成式AI的開發(fā)者克里斯蒂安·坎特雷爾（Christian Cantrell）說：“有了Dall-E 2，這真的是我們跨越恐怖谷效應(yīng)（Uncanny Valley）的時(shí)刻?！?/p>

另一個常用的、基于AI的圖像生成器是Craiyon，以前被稱為Dall-E Mini，它可以在網(wǎng)絡(luò)上買到。用戶輸入短語后，可以幾分鐘內(nèi)在瀏覽器中看到其給出的繪圖。

據(jù)AI與機(jī)器學(xué)習(xí)平臺Craiyon Productive AI的創(chuàng)建者戴瑪稱，自2021年7月推出以來，Craiyon現(xiàn)在每天生成約1000萬張圖片，總計(jì)生成10億張以前從未見過的圖片。在今年早些時(shí)候使用量飆升后，戴瑪開始將全部精力投入到Craiyon上。他說，他專注于使用廣告來保持用戶免費(fèi)使用，因?yàn)樵摼W(wǎng)站的服務(wù)器成本很高。Craiyon上有個推特賬號，專門發(fā)布最奇怪、最有創(chuàng)意的圖片，它擁有超過100萬名粉絲。

但最能激發(fā)人們熱情的項(xiàng)目是Stable Diffusion，該項(xiàng)目于今年8月向公眾發(fā)布。它的代碼可以在GitHub上獲得，可以在電腦上運(yùn)行，也可以在云端或通過編程接口運(yùn)行。這讓用戶可以根據(jù)自己的目的調(diào)整程序代碼，或者在其基礎(chǔ)上構(gòu)建新程序。

舉例來說，Stable Diffusion通過一個插件集成到Adobe Photoshop中，允許用戶生成背景和圖像的其他部分，然后他們可以使用圖層和其他PS工具直接在應(yīng)用中操作，將生成式AI從生成成品圖像的技術(shù)變成了專業(yè)人士可以使用的工具。

該插件的開發(fā)者坎特雷爾在Adobe工作了20年，今年辭職專注于生成式AI。這位資深人士表示，該插件已被下載數(shù)萬次。藝術(shù)家們告訴他，他們把它用在了無數(shù)他意想不到的地方，比如制作哥斯拉的動畫，或者以藝術(shù)家可以想象的任何姿勢創(chuàng)作蜘蛛俠的圖像。

使用生成式AI的一種新興藝術(shù)是如何構(gòu)建“提示”，即生成圖像的短語。名為Lexica的搜索引擎可以將Stable Diffusion的圖像和可用于生成它們的確切單詞字符串聯(lián)起來。Reddit和Discord等平臺上，都有如何引導(dǎo)人們輸入想要生成圖像的短語技巧。

創(chuàng)企、云服務(wù)提供商和芯片制造商或受益最大

許多投資者將生成式AI視為一種潛在的變革性平臺，就像智能手機(jī)或互聯(lián)網(wǎng)的早期一樣。這種轉(zhuǎn)變極大地?cái)U(kuò)大了可能能夠使用這項(xiàng)技術(shù)的潛在市場規(guī)模。

坎特雷爾認(rèn)為，生成式AI類似于一種更基礎(chǔ)的技術(shù)，即數(shù)據(jù)庫。他說：“生成式AI有點(diǎn)兒像數(shù)據(jù)庫，數(shù)據(jù)庫幫助解鎖了應(yīng)用程序的巨大潛力。我們生活中使用過的幾乎每款應(yīng)用都是建立在數(shù)據(jù)庫之上的，但沒有人關(guān)心數(shù)據(jù)庫是如何工作的，他們只知道如何使用它?！?/p>

Compound VC管理合伙人邁克爾·鄧普西（Michael Dempsey）表示，以前僅限于實(shí)驗(yàn)室的技術(shù)進(jìn)入主流的時(shí)刻“非常罕見”，吸引了風(fēng)險(xiǎn)投資者的大量關(guān)注，他們喜歡在潛力巨大的領(lǐng)域下注。但他警告說，生成式AI目前處于更接近炒作周期頂峰的“好奇心階段”。處于這個階段的公司可能會倒閉，因?yàn)樗鼈儧]有專注于企業(yè)或消費(fèi)者愿意付費(fèi)的特定用途。

該領(lǐng)域的其他人認(rèn)為，今天開創(chuàng)這些技術(shù)的初創(chuàng)公司最終可能會挑戰(zhàn)目前主導(dǎo)AI領(lǐng)域的軟件巨頭，包括谷歌、Facebook母公司Meta以及微軟，并為下一代科技巨頭的崛起鋪平道路。

Hugging Face首席執(zhí)行官克萊門特·德蘭格（Clement Delangue）說：“將會有一大批價(jià)值萬億美元的新公司誕生，這些初創(chuàng)公司將以這種新的技術(shù)為基礎(chǔ)。”Hugging Face是個與GitHub類似的開發(fā)者平臺，托管著預(yù)先培訓(xùn)的AI模型，包括Craiyon和Stable Diffusio。它的目標(biāo)是讓程序員更容易構(gòu)建AI技術(shù)。

有些公司已經(jīng)獲得了大量投資。Huging Face在今年早些時(shí)候從Lux Capital和紅杉資本等投資者那里籌集了資金后，估值達(dá)到20億美元。該領(lǐng)域最著名的初創(chuàng)公司OpenAI已經(jīng)從微軟和Khosla Ventures獲得了超過10億美元的資金。與此同時(shí)，Stable Diffusion開發(fā)商Stability AI正在洽談以高達(dá)10億美元的估值籌集風(fēng)險(xiǎn)資金。

亞馬遜、微軟和谷歌等云服務(wù)提供商也可能受益，因?yàn)樯墒紸I可能是計(jì)算密集型技術(shù)。Meta和谷歌已經(jīng)聘請了該領(lǐng)域諸多杰出人才，希望將這種先進(jìn)技術(shù)整合到公司的產(chǎn)品中。今年9月，Meta宣布了名為“Make-A-Video”的AI計(jì)劃，通過生成視頻而不僅僅是圖像，使這項(xiàng)技術(shù)更上一層樓。

Meta首席執(zhí)行官馬克·扎克伯格（Mark Zuckerberg）在他的Facebook頁面上發(fā)帖稱：“這是一個令人驚嘆的進(jìn)步。生成視頻比生成照片難得多，因?yàn)槌苏_生成每個像素之外，系統(tǒng)還必須預(yù)測它們會隨著時(shí)間的推移發(fā)生怎樣的變化?！弊罱雀枰舶l(fā)布了名為Phenaki的程序代碼，可以將文本轉(zhuǎn)換為時(shí)長幾分鐘的視頻。

這股熱潮也可能給英偉達(dá)、AMD和英特爾等芯片制造商帶來提振，他們的圖形處理器是訓(xùn)練和部署AI模型的理想選擇。在上周的會議上，英偉達(dá)首席執(zhí)行官黃仁勛強(qiáng)調(diào)，生成式AI是該公司最新芯片的關(guān)鍵用途，并稱這類技術(shù)可能很快就會給通信領(lǐng)域帶來革命性的變化。

不過，生成式AI為終端用戶帶來的好處依然有限。如今許多令人興奮的事情都圍繞著免費(fèi)或低成本的實(shí)驗(yàn)進(jìn)行。例如，有些作者已經(jīng)嘗試使用圖像生成器為文章制作插圖。英偉達(dá)正嘗試使用模型來生成新的人、動物、車輛或家具的3D圖像，這些圖像可以填充到虛擬游戲世界中。

倫理問題難應(yīng)對

最終，每個開發(fā)生成式AI的人都將不得不努力解決圖像生成器帶來的倫理問題。

首先是就業(yè)問題。盡管許多程序需要強(qiáng)大的圖形處理器，但計(jì)算機(jī)生成的內(nèi)容仍然比專業(yè)插畫家的時(shí)間成本便宜得多，后者每小時(shí)的報(bào)酬可能高達(dá)數(shù)百美元。生成式AI可能會給藝術(shù)家、視頻制作人和其他以創(chuàng)作作品為生的人帶來大麻煩。Compound VC管理合伙人邁克爾·鄧普西說：“事實(shí)證明，機(jī)器學(xué)習(xí)模型可能會變得比人類工作得更好、更快、更便宜?！?/p>

圍繞原創(chuàng)性和所有權(quán)，生成式AI也會帶來更復(fù)雜的挑戰(zhàn)。這種AI模型是利用大量現(xiàn)有圖像進(jìn)行培訓(xùn)的，原始圖像的創(chuàng)建者是否對以原創(chuàng)風(fēng)格生成的圖像擁有版權(quán)仍在爭論中。一位藝術(shù)家最近在美國科羅拉多州的藝術(shù)比賽中獲勝，他使用的圖像主要是由名為MidJourney的生成式AI創(chuàng)作的。他在獲勝后接受采訪時(shí)表示，他從自己生成的數(shù)百張圖像中選擇了一張，然后在PS中對其進(jìn)行了調(diào)整和處理。

由Stable Diffusion生成的一些圖像似乎留有水印，這表明原始數(shù)據(jù)集的一部分受到版權(quán)保護(hù)。有些提示指南建議用戶使用特定的、在世藝術(shù)家的名字，以便在模仿該藝術(shù)家創(chuàng)作風(fēng)格的過程中獲得更好的結(jié)果。上個月，Getty Images禁止用戶將生成式AI圖像上傳到其庫存圖像數(shù)據(jù)庫中，因?yàn)槠鋼?dān)心引發(fā)侵權(quán)糾紛。

圖像生成器還可以用來創(chuàng)建商標(biāo)人物或目標(biāo)的新圖像，如小黃人、漫威角色或《權(quán)力的游戲》中的王座。隨著圖像生成軟件變得越來越好，它也有可能欺騙用戶，讓他們相信虛假信息，或者顯示從未發(fā)生過的事件的圖像或視頻。

開發(fā)者還必須努力應(yīng)對這樣一種可能，即基于大量數(shù)據(jù)訓(xùn)練的AI模型可能會在數(shù)據(jù)中包含與性別、種族或文化相關(guān)的偏見，這可能會導(dǎo)致模型在輸出中展示這種偏見。Huging Face已經(jīng)發(fā)布了有關(guān)倫理問題的材料，并就以負(fù)責(zé)任態(tài)度開發(fā)AI模型的問題進(jìn)行了討論。

Hugging Face首席執(zhí)行官克萊門特·德蘭格說：“我們在這些模型上看到了短期和當(dāng)前挑戰(zhàn)，因?yàn)樗鼈儗儆诟怕誓Ｐ?，在大?shù)據(jù)集上訓(xùn)練，往往會吸收很多偏見。”他舉例稱，生成式AI曾被要求繪制“軟件工程師”的畫像，結(jié)果其生成了白人男性的圖像。（小?。?/p>

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請進(jìn)一步核實(shí)，并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）

為您推薦

極客觀察

欄目相關(guān)

贊助商

極客網(wǎng)熱搜關(guān)鍵詞

人工智能 AI OpenAI ChatGPT 機(jī)器學(xué)習(xí) 生成式AI AI芯片 AIGC U-Mail AI大模型世界人工智能大會 AIoT AirPods Airbnb Rushmail 人工智能AI AI人工智能 Akamai 昇騰AI 生成式人工智能 AIPC Air AI技術(shù) 谷歌AI 蘋果AI GenAI 科大訊飛AI學(xué)習(xí)機(jī) 百度AI CAICT 阿爾法蛋AI詞典筆T10 AI手機(jī) 華為AI 松鼠AI AI+ 昇騰AI創(chuàng)新大賽微軟AI AIS Airdoc WAIC AITO 阿爾法蛋AI詞典筆京東AI 智譜AI AI模型 SoleusAir aigo SoleusAir舒樂氏 LIFAair 2019世界人工智能大會 AI機(jī)器人人工智能大會 AI創(chuàng)企移動AI時(shí)代浙大AIF 人工智能技術(shù) AI應(yīng)用 Zain AI醫(yī)療 AI算力 xAI AI人才人工智能芯片 Airtag AI時(shí)代騰訊AI AI服務(wù)器 AI算法 AI投資 BrainCo AI框架 Gmail 聯(lián)想AI VAIO 人工智能計(jì)算中心 Airwallex空中云匯人工智能大賽 Chain AI教育 Coremail AI搜索 OPENAIGC開發(fā)者大賽 AI賦能谷歌人工智能 AI眼鏡人工智能名片 Airwheel Mirai 昇騰AI開發(fā)者創(chuàng)享日人工智能機(jī)器人 AI聊天機(jī)器人阿里AI AI音樂 BrainCo強(qiáng)腦科技 AI計(jì)算人工智能+ 浪潮KaiwuDB 阿爾法蛋AI詞典筆T20 英偉達(dá)AI芯片 AI助手 AIOps

上一篇

美國搞了部《AI權(quán)利法案》可惜管不到科技巨頭

下一篇

DeepMind AlphaTensor：人類和人工智能之間的微妙平衡

簡版
原版
投稿
回頂部

2022-10-10

硅谷押注，生成式AI火了，讓你把簡單文字變成圖像甚至視頻

?最近幾年興起的所謂“生成式人工智能（generative AI）”正吸引硅谷科技巨頭和風(fēng)投機(jī)構(gòu)的興趣，這種AI可以依據(jù)少量詞匯在幾秒鐘內(nèi)生成與之相匹配的圖像。分析師預(yù)計(jì)，這種技術(shù)將被廣泛用于各行各業(yè)，并產(chǎn)生數(shù)萬億美元的經(jīng)濟(jì)價(jià)值。

長按掃碼閱讀全文

<rp id="aarjb"></rp><track id="aarjb"></track>

<rp id="aarjb"><kbd id="aarjb"><pre id="aarjb"></pre></kbd></rp>

<blockquote id="aarjb"><form id="aarjb"></form></blockquote>