DeepSeek 深度解析:量化基金養出的技術極客,一夜蒸發輝達 6,000 億美元的效率革命

DeepSeek 深度解析:量化基金養出的技術極客,一夜蒸發輝達 6,000 億美元的效率革命

深度解析 DeepSeek 的公司背景與創始人梁文鋒的故事(量化基金 High-Flyer 的副產品如何震撼世界)、R1 時刻與效率敘事對行業的改寫、V4 時代的模型矩陣與 MIT 全開源路線,以及首輪 75 億美元融資後,在晶片枷鎖與 R2 難產下的競爭優勢與隱憂。


「AI 公司」系列第二十三篇。2025 年 1 月 27 日,美股史上最大的單日市值蒸發發生了:NVIDIA 一天跌掉 17%、近 6,000 億美元——而引爆它的,是一家杭州公司一週前開源的模型。

DeepSeek R1 用「號稱 557 萬美元訓練成本」的敘事,一夜擊碎了「AI 必須燒千億美元」的華爾街共識,被 Marc Andreessen 稱為 AI 的「史普尼克時刻」。更反常識的是這家公司的出身:它不是創業公司,是一家量化對沖基金的研究副產品;它不融資、不做商業化 KPI、把最強模型用 MIT 授權白送——直到 2026 年 6 月,它才完成成立三年來的第一輪融資:75 億美元,估值 589 億。這篇要解剖的是全系列最「反矽谷」的一家公司。


一、公司背景與創始人故事:量化基金的「副產品」

1.1 梁文鋒:用炒股的錢養 AGI 的人

梁文鋒,浙江大學資訊工程碩士,2015 年創辦量化基金幻方量化(High-Flyer),用深度學習做交易,管理規模一度超過 700 億人民幣。量化基金的副作用是囤了大量 GPU——在美國出口管制生效前,幻方已儲備約一萬張 A100,本來是用來跑交易模型的。

2023 年 7 月,梁文鋒把這批卡和一批年輕研究員拆出來成立 DeepSeek——動機在他罕見的訪談中說得很直白:不是為了賺錢(基金已經很賺錢),而是認為中國的 AI 不能永遠搭便車(free-riding),要成為貢獻者。組織形態也徹底反主流:約兩百人、幾乎全是中國本土名校的年輕博士、沒有商業化部門、論文照發、模型照開源——一個用對沖基金利潤供養的純研究機構

1.2 時程表:從無名到震撼世界

時間里程碑意義
2023/07於杭州成立幻方的 AGI 分拆
2023/11DeepSeek Coder 開源編碼模型起家,小圈子成名
2024/05V2 發布,API 定價殺到行業零頭引爆中國大模型價格戰,被稱「AI 界拼多多」——字節/阿里被迫跟降
2024/12V3 發布:671B MoE(激活 37B),論文披露訓練成本約 557 萬美元(2,048 張 H800)效率神話的起點:同級能力,成本是對手的幾十分之一
2025/01/20R1 發布:推理能力比肩 OpenAI o1,MIT 授權全開源,App 衝上美區榜首R1 時刻
2025/01/27NVIDIA 單日暴跌 17%、蒸發近 6,000 億美元——美股史上最大單日市值損失「效率敘事」擊碎「算力信仰」的歷史性一日
2025R1 論文登上《Nature》封面;V3.1/V3.2-Exp(稀疏注意力再砍成本);美國多州與聯邦機構禁用其 App學術認證與地緣反制同步而來
2025-2026R2 一再延期:梁文鋒對品質不滿;華為昇騰訓練受挫,改回「NVIDIA 訓練+昇騰推理」晶片枷鎖的現實
2026/04/24V4 預覽:V4-Pro(1.6T 參數)與 V4-Flash(284B),100 萬 token 上下文,仍是 MIT 授權在全行業旗艦閉源潮(078)中的獨行者
2026/06成立以來首輪外部融資:約 75 億美元,估值 589 億;國家背景資本深度參與「純研究機構」時代結束,國家隊時代開始
2026/07 中V4 正式版預計發布本文寫作時的最大懸念

二、R1 時刻的解剖:它到底改變了什麼

2.1 三個被改寫的行業共識

舊共識R1 之後
前沿模型需要十億美元級訓練費效率(架構+資料+工程)可以抵消數量級的算力差距——「557 萬美元」數字本身有爭議(未計研發與基建),但方向顛覆成立
推理能力是閉源實驗室的獨門絕活R1 用純強化學習(GRPO)復現 o1 級推理,並把方法寫成論文公開——全行業三個月內學會
中國模型落後 18 個月差距壓縮到以月計,且在開源賽道反超(078 的 Qwen 順勢接管生態)

2.2 對本系列各篇的衝擊波

R1 時刻是貫穿本系列的隱形分水嶺:NVIDIA(069)的循環交易質疑自此而起;Meta(064)內部「戰情室」研究 DeepSeek 論文;Together(070)的推理流量暴漲;美國政府的模型管制議程加速——一家兩百人的杭州公司,改變了所有千億美元玩家的敘事

2.3 爭議的另一面

蒸餾疑雲(OpenAI 指控其用 GPT 輸出訓練)、審查與資料隱私(多國政府禁用 App)、成本數字的口徑爭議——R1 的神話有毛邊。但值得注意:質疑者也全部採用了它的方法。這是技術貢獻最硬的證明。


三、商業模式與模型矩陣

3.1 商業模式:長期「反商業」,正在被迫轉正

支柱內容定位
API(價格屠夫)定價約為美國同行的十分之一,離峰再打折有收入但非目標——定價邏輯是「逼行業降價」而非利潤最大化
開源(MIT)權重+論文+方法全開放影響力即產品;全球衍生生態(很多蒸餾版反而基於 Qwen 底座)
App/消費端免費R1 時刻的流量遺產,無變現動作
幻方輸血 → 融資轉軌2026/06 前靠基金利潤;之後 75 億美元彈藥入袋首輪融資是身分轉折:從「私人研究院」到「國家戰略資產」

3.2 現役模型矩陣(2026 年中)

模型規格授權
V4-Pro(預覽)1.6T 參數 MoE、1M 上下文MIT——全行業唯一還在開源這個級別的旗艦
V4-Flash(預覽)284B、1M 上下文MIT
V3.2 / V3.1671B MoE(激活 37B),稀疏注意力降本MIT
R1 / R1-0528推理系列,GRPO 強化學習MIT;論文上《Nature》封面
蒸餾小模型系列1.5B-70B(基於 Qwen/Llama 底座)開源——裝置端生態的火種

3.3 技術路線特色

特色說明
極致 MoE 工程671B 只激活 37B;MLA(多頭潛在注意力)大砍 KV cache——每一分算力榨到極限,是晶片受限逼出來的創新
GRPO 純強化學習不靠人工標註的推理能力湧現,R1 論文的核心貢獻,已成行業標準方法之一
開源即發表權重、論文、技術報告三件套齊發——學術聲譽是它的品牌資產
成本文化量化基金的基因:把「單位智能的成本」當成第一 KPI,而非跑分名次

四、競爭優勢與隱憂

4.1 競爭優勢

優勢說明
效率的品牌「DeepSeek=用十分之一成本做同樣的事」——這個心智在推理成本為王的時代價值連城
開源信仰的正統性全行業旗艦閉源潮中唯一的堅持者(078 結尾的伏筆)——開發者社群的道德紅利歸它
研究文化年輕、扁平、不背 KPI 的組織持續產出方法級創新(MLA、GRPO),這是錢買不到的
彈藥到位75 億美元融資+國家支持,算力採購與人才保衛戰有了本錢
中國市場縱深政企、金融(幻方基因)、開發者生態的主場優勢

4.2 隱憂與風險

1. 晶片枷鎖是最硬的天花板

R2 難產的公開原因之一就是華為昇騰訓練不穩、互聯與軟體生態落後,被迫回到「NVIDIA 訓練+昇騰推理」的折衷。效率創新可以抵消一代的硬體差距,抵消不了三代——當 V4 對手用 Blackwell/Rubin 集群訓練時,它的工程天才是在為晶片短板還債

2. 「國家隊化」的雙面刃

首輪融資的國家資本背景,給了彈藥也給了枷鎖:採購決策被引導(昇騰事件)、國際市場的信任進一步受損、「純研究機構」的中立光環褪色。它曾經最珍貴的資產是「不欠任何人」——現在欠了

3. 人才保衛戰

R1 之後,DeepSeek 的研究員成為全球獵頭的頭號目標(064 的 Meta 天價、國內大廠全數出手)。兩百人的小組織對抗全世界的支票簿,梁文鋒的理想主義敘事能留人多久是未知數。

4. R2 延期暴露的節奏風險

梁文鋒的完美主義(不滿意不發布)在研究院時代是美德,在競爭時代是風險——推理模型的窗口期,OpenAI/Google/Qwen 都在快速迭代,遲到的傑作可能只是遲到

5. 變現的未解題

估值 589 億對應的收入極少且定價策略反利潤。國家資本不是慈善,五年後它終究要回答「DeepSeek 怎麼賺錢」——而它的整個文化都是圍繞「不回答這個問題」建立的。


結語

把 DeepSeek 放進系列座標系,它與兩家公司形成鏡像:

維度SSI(076)Midjourney(071)DeepSeek
組織數十人閉關百人獲利兩百人研究院
資本信仰融資 60 億零融資基金輸血 → 首融 75 億
產出零公開產品即品牌論文+權重全公開
賭注一步登天品味變現效率+開放改寫行業

DeepSeek 的歷史地位已經鎖定:R1 時刻是 AI 行業從「算力軍備競賽」轉向「效率競賽」的轉折點,它一夜之間讓 6,000 億美元市值蒸發、讓每家巨頭重寫技術路線、讓「開源比肩閉源」從口號變成事實。

但 2026 年的它站在身分的十字路口:拿了國家的錢、戴上晶片的枷鎖、頂著全行業唯一開源旗艦的道德冠冕——理想主義的研究院正在被時代改造成戰略資產。V4 正式版與 R2 的成敗,將決定「效率革命」是一個時代的開端,還是一顆孤星的閃光。

下一篇繼續中國狼群:從 R1 手中接過「開源爆款」接力棒的月之暗面 Kimi。


參考資料: