1月28日消息,這兩天,中國AI公司深度求索(DeepSeek)發(fā)布的大模型DeepSeek-R1震動業(yè)界,該模型使用更低的成本和更小的算力規(guī)模,實現(xiàn)了足以匹敵美國頂尖AI模型的效果。
最新消息顯示,DeepSeek已經登頂了中國和美國的蘋果App Store應用商店,一舉超越ChatGPT。這一現(xiàn)象讓西方媒體都忍不住發(fā)文感嘆“中國AI模型震驚硅谷”。
據報道,高盛發(fā)布報告,隨著中國AI大模型DeepSeek的強勢崛起,對沖基金已開始觀望美國本土培育的AI模式熱潮是否能持續(xù)。報告還指出,對沖基金上周已開始撤離對科技股的押注。
美股市場周一遭遇科技股拋售狂潮,納指開盤重挫逾3.5%,芯片股集體走低。截至周一收盤,英偉達暴跌16.97%,市值蒸發(fā)近5900億美元,相當于跌去了三個AMD的市值。博通跌17.4%,AMD跌6.37%,阿斯麥跌5.75%,臺積電跌13.33%。
DeepSeek是什么?
DeepSeek成立于2023年7月17日,是一家創(chuàng)新型科技公司,由知名量化資管巨頭幻方量化創(chuàng)立,專注于開發(fā)先進的大語言模型(LLM)和相關技術。
幻方量化的掌門人梁文鋒是DeepSeek的創(chuàng)始人。他出生于廣東湛江,浙江大學畢業(yè),擁有信息與電子工程學系本科和碩士學位,2008年起開始帶領團隊使用機器學習等技術探索全自動量化交易,2015年幻方量化正式成立。
2021年,幻方量化的資產管理規(guī)模突破千億大關,躋身國內量化私募領域的“四大天王”之列。2023年梁文鋒宣布正式進軍通用人工智能領域,創(chuàng)辦DeepSeek,專注于做真正人類級別的人工智能。
2024年5月,DeepSeek發(fā)布混合專家語言模型DeepSeek-V2。同年12月,DeepSeek-V3問世,這款性能優(yōu)越且性價比極高的大語言模型,被硅谷同行譽為“來自東方的神秘力量”。
此前,雷軍千萬年薪挖角的95后AI“天才少女”羅福莉便是DeepSeek-V2的關鍵開發(fā)者之一。
據大象新聞報道,DeepSeek團隊不到140人,多來自清華、北大、北航等頂尖高校的應屆博士畢業(yè)生、在讀生以及碩士生。而且,團隊沒有“海歸”,完全本土人才。
DeepSeek為何爆火?
這兩天DeepSeek成為科技圈的關注焦點,主要原因在于其以極小的成本訓練出了可以和OpenAI的ChatGPT一較高下的AI大模型。
今年1月20日,DeepSeek正式發(fā)布DeepSeek-R1大模型,并同步開源模型權重。DeepSeek-R1在數(shù)學、代碼、自然語言推理等任務上的表現(xiàn)與OpenAI的O1模型正式版不相上下,并采用MIT許可協(xié)議,支持免費商用、任意修改和衍生開發(fā)。
據每日經濟新聞報道,DeepSeek-R1的預訓練費用只有557.6萬美元,僅是OpenAI GPT-4o模型訓練成本的不到十分之一。同時,DeepSeek公布了API的定價,每百萬輸入tokens 1元(緩存命中)/4元(緩存未命中),每百萬輸出tokens 16元。這個收費大約是OpenAI o1運行成本的三十分之一。
業(yè)內認為,DeepSeek正打破算力為王的行業(yè)規(guī)則。此前,OpenAI提出的Scaling Law被全球AI大模型廠商奉為圭臬,即計算規(guī)模越大,訓練數(shù)據量越多,模型越智能。這也促使英偉達等不斷研發(fā)擁有更強大算力的產品。而DeepSeek讓業(yè)內看到通過軟件架構及算法的革新,可能也是一條通往更高性能AI大模型的思路。
受此消息影響,美股周一納指開盤重挫逾3.5%,芯片股集體走低。截至周一收盤,英偉達、臺積電、博通、AMD、阿斯麥等均出現(xiàn)不同幅度的下跌,其中最受矚目的是英偉達暴跌16.97%,市值蒸發(fā)近5900億美元,相當于跌去了三個AMD的市值。
之后,英偉達發(fā)布聲明稱,“DeepSeek的研究成果展示了如何利用測試時計算擴展技術創(chuàng)建新模型,充分利用廣泛可用的模型和完全符合出口管制規(guī)定的算力?!毖酝庵猓珼eepSeek并未違反美國對于英偉達芯片的出口管制規(guī)定。
同時,英偉達還在聲明中表示,DeepSeek等AI公司的推理需要大量英偉達GPU(圖形處理器)和高性能網絡,DeepSeek的爆火表明市場對其芯片仍有需求。
據外媒報道,Meta成立了四個專門研究小組來研究國產大模型DeepSeek的工作原理,并基于此來改進旗下大模型Llama。其中兩個小組正在試圖了解幻方量化如何降低訓練和運行DeepSeek的成本。
需求爆火,DeepSeek被擠到宕機,創(chuàng)始人回應
隨著DeepSeek的火爆出圈,1月26日,該應用曾出現(xiàn)短時閃崩現(xiàn)象。
對此,DeepSeek回應稱,當天下午確實出現(xiàn)了局部服務波動,但問題在數(shù)分鐘內就得到了解決。此次事件可能是由于新模型發(fā)布后,用戶訪問量激增,服務器一時無法滿足大量用戶的并發(fā)需求。
1月27日晚,DeepSeek服務狀態(tài)頁面顯示,DeepSeek網頁不可用,公司正在調查這一問題。多位網友表示,DeepSeek無法回答對話問題。
1月28日凌晨,DeepSeek于服務狀態(tài)頁面公告稱,近期DeepSeek線上服務受到大規(guī)模惡意攻擊,注冊可能繁忙,請稍等重試。已注冊用戶可以正常登錄,感謝理解和支持。
日前,梁文鋒曾在接受媒體采訪時表示,中國AI不可能永遠處在跟隨的位置?!拔覀兘洺Uf中國AI和美國有一兩年差距,但真實的gap是原創(chuàng)和模仿之差。如果這個不改變,中國永遠只能是追隨者,所以有些探索也是逃不掉的。”
他認為,英偉達的領先,不只是一個公司的努力,而是整個西方技術社區(qū)和產業(yè)共同努力的結果。他們能看到下一代的技術趨勢,手里有路線圖。中國AI的發(fā)展,同樣需要這樣的生態(tài)。
- 特斯拉 2024 年收入 977 億美元 全年共交付汽車178.92 萬輛
- 特斯拉第四季度營收257.07億美元 凈利潤同比下降71%
- 央視與科大訊飛聯(lián)合:首次在春晚添加實時字幕
- B站春晚直播:觀看人數(shù)超1億、千萬用戶參與答題
- 中創(chuàng)新航回應寧德時代專利侵權訴訟:否認侵權,預計不影響生產經營
- 英國監(jiān)管機構擔憂云計算市場競爭,計劃審查微軟和亞馬遜市場地位
- 蘋果獲新型折疊屏手機專利,創(chuàng)新鉸鏈設計引領行業(yè)變革
- 迅雷將以5億元人民幣收購虎撲 預計2025年上半年完成
- 春節(jié)檔新片預售票房破10億元 《射雕英雄傳》領跑
- 網易云音樂推出“聽勸版” 底部導航欄自定義功能再更新
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。