
DeepSeek 深度解析:量化基金養出的技術極客,一夜蒸發輝達 6,000 億美元的效率革命
深度解析 DeepSeek 的公司背景與創始人梁文鋒的故事(量化基金 High-Flyer 的副產品如何震撼世界)、R1 時刻與效率敘事對行業的改寫、V4 時代的模型矩陣與 MIT 全開源路線,以及首輪 75 億美元融資後,在晶片枷鎖與 R2 難產下的競爭優勢與隱憂。
WRITTEN BY

- Name
- Harry Chang
「AI 公司」系列第二十三篇。2025 年 1 月 27 日,美股史上最大的單日市值蒸發發生了:NVIDIA 一天跌掉 17%、近 6,000 億美元——而引爆它的,是一家杭州公司一週前開源的模型。
DeepSeek R1 用「號稱 557 萬美元訓練成本」的敘事,一夜擊碎了「AI 必須燒千億美元」的華爾街共識,被 Marc Andreessen 稱為 AI 的「史普尼克時刻」。更反常識的是這家公司的出身:它不是創業公司,是一家量化對沖基金的研究副產品;它不融資、不做商業化 KPI、把最強模型用 MIT 授權白送——直到 2026 年 6 月,它才完成成立三年來的第一輪融資:75 億美元,估值 589 億。這篇要解剖的是全系列最「反矽谷」的一家公司。
一、公司背景與創始人故事:量化基金的「副產品」
1.1 梁文鋒:用炒股的錢養 AGI 的人
梁文鋒,浙江大學資訊工程碩士,2015 年創辦量化基金幻方量化(High-Flyer),用深度學習做交易,管理規模一度超過 700 億人民幣。量化基金的副作用是囤了大量 GPU——在美國出口管制生效前,幻方已儲備約一萬張 A100,本來是用來跑交易模型的。
2023 年 7 月,梁文鋒把這批卡和一批年輕研究員拆出來成立 DeepSeek——動機在他罕見的訪談中說得很直白:不是為了賺錢(基金已經很賺錢),而是認為中國的 AI 不能永遠搭便車(free-riding),要成為貢獻者。組織形態也徹底反主流:約兩百人、幾乎全是中國本土名校的年輕博士、沒有商業化部門、論文照發、模型照開源——一個用對沖基金利潤供養的純研究機構。
1.2 時程表:從無名到震撼世界
| 時間 | 里程碑 | 意義 |
|---|---|---|
| 2023/07 | 於杭州成立 | 幻方的 AGI 分拆 |
| 2023/11 | DeepSeek Coder 開源 | 編碼模型起家,小圈子成名 |
| 2024/05 | V2 發布,API 定價殺到行業零頭 | 引爆中國大模型價格戰,被稱「AI 界拼多多」——字節/阿里被迫跟降 |
| 2024/12 | V3 發布:671B MoE(激活 37B),論文披露訓練成本約 557 萬美元(2,048 張 H800) | 效率神話的起點:同級能力,成本是對手的幾十分之一 |
| 2025/01/20 | R1 發布:推理能力比肩 OpenAI o1,MIT 授權全開源,App 衝上美區榜首 | R1 時刻 |
| 2025/01/27 | NVIDIA 單日暴跌 17%、蒸發近 6,000 億美元——美股史上最大單日市值損失 | 「效率敘事」擊碎「算力信仰」的歷史性一日 |
| 2025 | R1 論文登上《Nature》封面;V3.1/V3.2-Exp(稀疏注意力再砍成本);美國多州與聯邦機構禁用其 App | 學術認證與地緣反制同步而來 |
| 2025-2026 | R2 一再延期:梁文鋒對品質不滿;華為昇騰訓練受挫,改回「NVIDIA 訓練+昇騰推理」 | 晶片枷鎖的現實 |
| 2026/04/24 | V4 預覽:V4-Pro(1.6T 參數)與 V4-Flash(284B),100 萬 token 上下文,仍是 MIT 授權 | 在全行業旗艦閉源潮(078)中的獨行者 |
| 2026/06 | 成立以來首輪外部融資:約 75 億美元,估值 589 億;國家背景資本深度參與 | 「純研究機構」時代結束,國家隊時代開始 |
| 2026/07 中 | V4 正式版預計發布 | 本文寫作時的最大懸念 |
二、R1 時刻的解剖:它到底改變了什麼
2.1 三個被改寫的行業共識
| 舊共識 | R1 之後 |
|---|---|
| 前沿模型需要十億美元級訓練費 | 效率(架構+資料+工程)可以抵消數量級的算力差距——「557 萬美元」數字本身有爭議(未計研發與基建),但方向顛覆成立 |
| 推理能力是閉源實驗室的獨門絕活 | R1 用純強化學習(GRPO)復現 o1 級推理,並把方法寫成論文公開——全行業三個月內學會 |
| 中國模型落後 18 個月 | 差距壓縮到以月計,且在開源賽道反超(078 的 Qwen 順勢接管生態) |
2.2 對本系列各篇的衝擊波
R1 時刻是貫穿本系列的隱形分水嶺:NVIDIA(069)的循環交易質疑自此而起;Meta(064)內部「戰情室」研究 DeepSeek 論文;Together(070)的推理流量暴漲;美國政府的模型管制議程加速——一家兩百人的杭州公司,改變了所有千億美元玩家的敘事。
2.3 爭議的另一面
蒸餾疑雲(OpenAI 指控其用 GPT 輸出訓練)、審查與資料隱私(多國政府禁用 App)、成本數字的口徑爭議——R1 的神話有毛邊。但值得注意:質疑者也全部採用了它的方法。這是技術貢獻最硬的證明。
三、商業模式與模型矩陣
3.1 商業模式:長期「反商業」,正在被迫轉正
| 支柱 | 內容 | 定位 |
|---|---|---|
| API(價格屠夫) | 定價約為美國同行的十分之一,離峰再打折 | 有收入但非目標——定價邏輯是「逼行業降價」而非利潤最大化 |
| 開源(MIT) | 權重+論文+方法全開放 | 影響力即產品;全球衍生生態(很多蒸餾版反而基於 Qwen 底座) |
| App/消費端 | 免費 | R1 時刻的流量遺產,無變現動作 |
| 幻方輸血 → 融資轉軌 | 2026/06 前靠基金利潤;之後 75 億美元彈藥入袋 | 首輪融資是身分轉折:從「私人研究院」到「國家戰略資產」 |
3.2 現役模型矩陣(2026 年中)
| 模型 | 規格 | 授權 |
|---|---|---|
| V4-Pro(預覽) | 1.6T 參數 MoE、1M 上下文 | MIT——全行業唯一還在開源這個級別的旗艦 |
| V4-Flash(預覽) | 284B、1M 上下文 | MIT |
| V3.2 / V3.1 | 671B MoE(激活 37B),稀疏注意力降本 | MIT |
| R1 / R1-0528 | 推理系列,GRPO 強化學習 | MIT;論文上《Nature》封面 |
| 蒸餾小模型系列 | 1.5B-70B(基於 Qwen/Llama 底座) | 開源——裝置端生態的火種 |
3.3 技術路線特色
| 特色 | 說明 |
|---|---|
| 極致 MoE 工程 | 671B 只激活 37B;MLA(多頭潛在注意力)大砍 KV cache——每一分算力榨到極限,是晶片受限逼出來的創新 |
| GRPO 純強化學習 | 不靠人工標註的推理能力湧現,R1 論文的核心貢獻,已成行業標準方法之一 |
| 開源即發表 | 權重、論文、技術報告三件套齊發——學術聲譽是它的品牌資產 |
| 成本文化 | 量化基金的基因:把「單位智能的成本」當成第一 KPI,而非跑分名次 |
四、競爭優勢與隱憂
4.1 競爭優勢
| 優勢 | 說明 |
|---|---|
| 效率的品牌 | 「DeepSeek=用十分之一成本做同樣的事」——這個心智在推理成本為王的時代價值連城 |
| 開源信仰的正統性 | 全行業旗艦閉源潮中唯一的堅持者(078 結尾的伏筆)——開發者社群的道德紅利歸它 |
| 研究文化 | 年輕、扁平、不背 KPI 的組織持續產出方法級創新(MLA、GRPO),這是錢買不到的 |
| 彈藥到位 | 75 億美元融資+國家支持,算力採購與人才保衛戰有了本錢 |
| 中國市場縱深 | 政企、金融(幻方基因)、開發者生態的主場優勢 |
4.2 隱憂與風險
1. 晶片枷鎖是最硬的天花板
R2 難產的公開原因之一就是華為昇騰訓練不穩、互聯與軟體生態落後,被迫回到「NVIDIA 訓練+昇騰推理」的折衷。效率創新可以抵消一代的硬體差距,抵消不了三代——當 V4 對手用 Blackwell/Rubin 集群訓練時,它的工程天才是在為晶片短板還債。
2. 「國家隊化」的雙面刃
首輪融資的國家資本背景,給了彈藥也給了枷鎖:採購決策被引導(昇騰事件)、國際市場的信任進一步受損、「純研究機構」的中立光環褪色。它曾經最珍貴的資產是「不欠任何人」——現在欠了。
3. 人才保衛戰
R1 之後,DeepSeek 的研究員成為全球獵頭的頭號目標(064 的 Meta 天價、國內大廠全數出手)。兩百人的小組織對抗全世界的支票簿,梁文鋒的理想主義敘事能留人多久是未知數。
4. R2 延期暴露的節奏風險
梁文鋒的完美主義(不滿意不發布)在研究院時代是美德,在競爭時代是風險——推理模型的窗口期,OpenAI/Google/Qwen 都在快速迭代,遲到的傑作可能只是遲到。
5. 變現的未解題
估值 589 億對應的收入極少且定價策略反利潤。國家資本不是慈善,五年後它終究要回答「DeepSeek 怎麼賺錢」——而它的整個文化都是圍繞「不回答這個問題」建立的。
結語
把 DeepSeek 放進系列座標系,它與兩家公司形成鏡像:
| 維度 | SSI(076) | Midjourney(071) | DeepSeek |
|---|---|---|---|
| 組織 | 數十人閉關 | 百人獲利 | 兩百人研究院 |
| 資本 | 信仰融資 60 億 | 零融資 | 基金輸血 → 首融 75 億 |
| 產出 | 零公開 | 產品即品牌 | 論文+權重全公開 |
| 賭注 | 一步登天 | 品味變現 | 效率+開放改寫行業 |
DeepSeek 的歷史地位已經鎖定:R1 時刻是 AI 行業從「算力軍備競賽」轉向「效率競賽」的轉折點,它一夜之間讓 6,000 億美元市值蒸發、讓每家巨頭重寫技術路線、讓「開源比肩閉源」從口號變成事實。
但 2026 年的它站在身分的十字路口:拿了國家的錢、戴上晶片的枷鎖、頂著全行業唯一開源旗艦的道德冠冕——理想主義的研究院正在被時代改造成戰略資產。V4 正式版與 R2 的成敗,將決定「效率革命」是一個時代的開端,還是一顆孤星的閃光。
下一篇繼續中國狼群:從 R1 手中接過「開源爆款」接力棒的月之暗面 Kimi。
參考資料:
- DeepSeek — Wikipedia
- DeepSeek — Britannica Money
- DeepSeek Raises 58.9 Billion Valuation — BigGo Finance
- DeepSeek raises 50B valuation in first-ever external funding round — Tech Funding News
- DeepSeek Just Raised $7.4 Billion. Here's The Catch — Forbes
- DeepSeek and China's AI boom are increasingly powered by state money — Fortune
- DeepSeek in 2026: V4, Open Weights, Pricing, Funding & Strategy — The AI Rankings
- DeepSeek V4 and R2 Deep Dive — Meta Intelligence
- DeepSeek Roadmap, Rumors & Confirmed Releases — Chat-Deep.ai