DeepSeek 深度解析：量化基金養出的技術極客，一夜蒸發輝達 6,000 億美元的效率革命

「AI 公司」系列第二十三篇。2025 年 1 月 27 日，美股史上最大的單日市值蒸發發生了：NVIDIA 一天跌掉 17%、近 6,000 億美元——而引爆它的，是一家杭州公司一週前開源的模型。

DeepSeek R1 用「號稱 557 萬美元訓練成本」的敘事，一夜擊碎了「AI 必須燒千億美元」的華爾街共識，被 Marc Andreessen 稱為 AI 的「史普尼克時刻」。更反常識的是這家公司的出身：它不是創業公司，是一家量化對沖基金的研究副產品；它不融資、不做商業化 KPI、把最強模型用 MIT 授權白送——直到 2026 年 6 月，它才完成成立三年來的第一輪融資：75 億美元，估值 589 億。這篇要解剖的是全系列最「反矽谷」的一家公司。

一、公司背景與創始人故事：量化基金的「副產品」
- 1.1 梁文鋒：用炒股的錢養 AGI 的人
- 1.2 時程表：從無名到震撼世界
二、R1 時刻的解剖：它到底改變了什麼
三、商業模式與模型矩陣
四、競爭優勢與隱憂
- 4.1 競爭優勢
- 4.2 隱憂與風險
結語

一、公司背景與創始人故事：量化基金的「副產品」

1.1 梁文鋒：用炒股的錢養 AGI 的人

梁文鋒，浙江大學資訊工程碩士，2015 年創辦量化基金幻方量化（High-Flyer），用深度學習做交易，管理規模一度超過 700 億人民幣。量化基金的副作用是囤了大量 GPU——在美國出口管制生效前，幻方已儲備約一萬張 A100，本來是用來跑交易模型的。

2023 年 7 月，梁文鋒把這批卡和一批年輕研究員拆出來成立 DeepSeek——動機在他罕見的訪談中說得很直白：不是為了賺錢（基金已經很賺錢），而是認為中國的 AI 不能永遠搭便車（free-riding），要成為貢獻者。組織形態也徹底反主流：約兩百人、幾乎全是中國本土名校的年輕博士、沒有商業化部門、論文照發、模型照開源——一個用對沖基金利潤供養的純研究機構。

1.2 時程表：從無名到震撼世界

時間	里程碑	意義
2023/07	於杭州成立	幻方的 AGI 分拆
2023/11	DeepSeek Coder 開源	編碼模型起家,小圈子成名
2024/05	V2 發布,API 定價殺到行業零頭	引爆中國大模型價格戰,被稱「AI 界拼多多」——字節/阿里被迫跟降
2024/12	V3 發布:671B MoE(激活 37B),論文披露訓練成本約 557 萬美元(2,048 張 H800)	效率神話的起點:同級能力,成本是對手的幾十分之一
2025/01/20	R1 發布:推理能力比肩 OpenAI o1,MIT 授權全開源,App 衝上美區榜首	R1 時刻
2025/01/27	NVIDIA 單日暴跌 17%、蒸發近 6,000 億美元——美股史上最大單日市值損失	「效率敘事」擊碎「算力信仰」的歷史性一日
2025	R1 論文登上《Nature》封面;V3.1/V3.2-Exp(稀疏注意力再砍成本);美國多州與聯邦機構禁用其 App	學術認證與地緣反制同步而來
2025-2026	R2 一再延期:梁文鋒對品質不滿;華為昇騰訓練受挫,改回「NVIDIA 訓練+昇騰推理」	晶片枷鎖的現實
2026/04/24	V4 預覽:V4-Pro(1.6T 參數)與 V4-Flash(284B),100 萬 token 上下文,仍是 MIT 授權	在全行業旗艦閉源潮(078)中的獨行者
2026/06	成立以來首輪外部融資:約 75 億美元,估值 589 億;國家背景資本深度參與	「純研究機構」時代結束,國家隊時代開始
2026/07 中	V4 正式版預計發布	本文寫作時的最大懸念

二、R1 時刻的解剖：它到底改變了什麼

2.1 三個被改寫的行業共識

舊共識	R1 之後
前沿模型需要十億美元級訓練費	效率(架構+資料+工程)可以抵消數量級的算力差距——「557 萬美元」數字本身有爭議(未計研發與基建),但方向顛覆成立
推理能力是閉源實驗室的獨門絕活	R1 用純強化學習(GRPO)復現 o1 級推理,並把方法寫成論文公開——全行業三個月內學會
中國模型落後 18 個月	差距壓縮到以月計,且在開源賽道反超(078 的 Qwen 順勢接管生態)

2.2 對本系列各篇的衝擊波

R1 時刻是貫穿本系列的隱形分水嶺：NVIDIA（069）的循環交易質疑自此而起；Meta（064）內部「戰情室」研究 DeepSeek 論文；Together（070）的推理流量暴漲；美國政府的模型管制議程加速——一家兩百人的杭州公司，改變了所有千億美元玩家的敘事。

2.3 爭議的另一面

蒸餾疑雲（OpenAI 指控其用 GPT 輸出訓練）、審查與資料隱私（多國政府禁用 App）、成本數字的口徑爭議——R1 的神話有毛邊。但值得注意：質疑者也全部採用了它的方法。這是技術貢獻最硬的證明。

三、商業模式與模型矩陣

3.1 商業模式：長期「反商業」，正在被迫轉正

支柱	內容	定位
API（價格屠夫）	定價約為美國同行的十分之一,離峰再打折	有收入但非目標——定價邏輯是「逼行業降價」而非利潤最大化
開源（MIT）	權重+論文+方法全開放	影響力即產品;全球衍生生態(很多蒸餾版反而基於 Qwen 底座)
App/消費端	免費	R1 時刻的流量遺產,無變現動作
幻方輸血 → 融資轉軌	2026/06 前靠基金利潤;之後 75 億美元彈藥入袋	首輪融資是身分轉折:從「私人研究院」到「國家戰略資產」

3.2 現役模型矩陣（2026 年中）

模型	規格	授權
V4-Pro（預覽）	1.6T 參數 MoE、1M 上下文	MIT——全行業唯一還在開源這個級別的旗艦
V4-Flash（預覽）	284B、1M 上下文	MIT
V3.2 / V3.1	671B MoE(激活 37B),稀疏注意力降本	MIT
R1 / R1-0528	推理系列,GRPO 強化學習	MIT;論文上《Nature》封面
蒸餾小模型系列	1.5B-70B(基於 Qwen/Llama 底座)	開源——裝置端生態的火種

3.3 技術路線特色

特色	說明
極致 MoE 工程	671B 只激活 37B;MLA(多頭潛在注意力)大砍 KV cache——每一分算力榨到極限,是晶片受限逼出來的創新
GRPO 純強化學習	不靠人工標註的推理能力湧現,R1 論文的核心貢獻,已成行業標準方法之一
開源即發表	權重、論文、技術報告三件套齊發——學術聲譽是它的品牌資產
成本文化	量化基金的基因:把「單位智能的成本」當成第一 KPI,而非跑分名次

四、競爭優勢與隱憂

4.1 競爭優勢

優勢	說明
效率的品牌	「DeepSeek=用十分之一成本做同樣的事」——這個心智在推理成本為王的時代價值連城
開源信仰的正統性	全行業旗艦閉源潮中唯一的堅持者(078 結尾的伏筆)——開發者社群的道德紅利歸它
研究文化	年輕、扁平、不背 KPI 的組織持續產出方法級創新(MLA、GRPO),這是錢買不到的
彈藥到位	75 億美元融資+國家支持,算力採購與人才保衛戰有了本錢
中國市場縱深	政企、金融(幻方基因)、開發者生態的主場優勢

4.2 隱憂與風險

1. 晶片枷鎖是最硬的天花板

R2 難產的公開原因之一就是華為昇騰訓練不穩、互聯與軟體生態落後,被迫回到「NVIDIA 訓練+昇騰推理」的折衷。效率創新可以抵消一代的硬體差距,抵消不了三代——當 V4 對手用 Blackwell/Rubin 集群訓練時,它的工程天才是在為晶片短板還債。

2. 「國家隊化」的雙面刃

首輪融資的國家資本背景,給了彈藥也給了枷鎖:採購決策被引導(昇騰事件)、國際市場的信任進一步受損、「純研究機構」的中立光環褪色。它曾經最珍貴的資產是「不欠任何人」——現在欠了。

3. 人才保衛戰

R1 之後,DeepSeek 的研究員成為全球獵頭的頭號目標(064 的 Meta 天價、國內大廠全數出手)。兩百人的小組織對抗全世界的支票簿,梁文鋒的理想主義敘事能留人多久是未知數。

4. R2 延期暴露的節奏風險

梁文鋒的完美主義(不滿意不發布)在研究院時代是美德,在競爭時代是風險——推理模型的窗口期,OpenAI/Google/Qwen 都在快速迭代,遲到的傑作可能只是遲到。

5. 變現的未解題

估值 589 億對應的收入極少且定價策略反利潤。國家資本不是慈善,五年後它終究要回答「DeepSeek 怎麼賺錢」——而它的整個文化都是圍繞「不回答這個問題」建立的。

結語

把 DeepSeek 放進系列座標系，它與兩家公司形成鏡像：

維度	SSI（076）	Midjourney（071）	DeepSeek
組織	數十人閉關	百人獲利	兩百人研究院
資本	信仰融資 60 億	零融資	基金輸血 → 首融 75 億
產出	零公開	產品即品牌	論文+權重全公開
賭注	一步登天	品味變現	效率+開放改寫行業

DeepSeek 的歷史地位已經鎖定：R1 時刻是 AI 行業從「算力軍備競賽」轉向「效率競賽」的轉折點，它一夜之間讓 6,000 億美元市值蒸發、讓每家巨頭重寫技術路線、讓「開源比肩閉源」從口號變成事實。

但 2026 年的它站在身分的十字路口：拿了國家的錢、戴上晶片的枷鎖、頂著全行業唯一開源旗艦的道德冠冕——理想主義的研究院正在被時代改造成戰略資產。V4 正式版與 R2 的成敗，將決定「效率革命」是一個時代的開端，還是一顆孤星的閃光。

下一篇繼續中國狼群：從 R1 手中接過「開源爆款」接力棒的月之暗面 Kimi。

參考資料：

View on GitHub