
Hugging Face 深度解析:AI 界的 GitHub,掌控開源命脈卻只有 1.3 億營收的矛盾體
深度解析 Hugging Face 的公司背景與創始人故事(從青少年聊天機器人到 AI 界 GitHub 的神轉折)、平台網絡效應構成的護城河與變現困境、Transformers 生態與 SmolLM 小模型矩陣,以及進軍開源機器人(Reachy Mini)的第二曲線與競爭隱憂。
WRITTEN BY

- Name
- Harry Chang
「AI 公司」系列第十二篇。接續上一篇的問題:模型層折舊飛快,那掌握開源模型「分發權」的平台呢?
Hugging Face 是全世界開源 AI 的水電行:超過一百萬個模型、25 萬個資料集、1,300 萬用戶、50 萬家組織都掛在它的 Hub 上。本系列寫過的幾乎每一家公司——Meta 的 Llama、Google 的 Gemma、Mistral、Qwen、DeepSeek——發布開源模型的第一站都是這裡。但矛盾也在這:戰略地位堪比 GitHub,年營收卻只有約 1.3 億美元——不到 Databricks 的四十分之一。這篇要解的就是這道「地位與變現的落差」謎題。
一、公司背景與創始人故事:史上最成功的 Pivot 之一
1.1 起點竟然是青少年聊天 App
Hugging Face 成立於 2016 年,三位法國創辦人——Clément Delangue(CEO,連續創業者)、Julien Chaumond(CTO)、Thomas Wolf(首席科學家)——最初做的產品和今天毫無關係:一個給青少年的娛樂聊天機器人 App,名字就取自 🤗 這個表情符號。
轉折點在 2018 年底:Google 發布 BERT(只有 TensorFlow 版),Hugging Face 團隊一週內做出 PyTorch 移植版並開源,下載量瞬間爆炸。他們敏銳地意識到:研究界缺的不是模型,是「把最新模型變得人人可用」的基礎設施。2019 年正式轉向,Transformers 函式庫誕生——後來成為 GitHub 上星數最高的機器學習專案。
1.2 時程表:從函式庫到 AI 世界的中央車站
| 時間 | 里程碑 | 意義 |
|---|---|---|
| 2016 | 紐約成立,青少年聊天 App | 🤗 品牌的由來 |
| 2018/末 | 一週移植 BERT 到 PyTorch | 命運轉折點 |
| 2019 | Transformers 函式庫發布,正式轉型 | 統一 API 讓所有人用得上 SOTA 模型 |
| 2020-2021 | Model Hub、Datasets、收購 Gradio | 從函式庫升級為「模型的 GitHub」 |
| 2022 | 主導 BigScience,發布 BLOOM(176B) | 早於 Llama 的開源大模型社群實驗 |
| 2023/08 | Series D 融資 2.35 億美元,估值 45 億美元——Google、Amazon、NVIDIA、Salesforce、AMD、Intel、IBM、Qualcomm 全數入股 | 「所有巨頭都投它」的中立地位定價 |
| 2024 | LeRobot 開源機器人專案啟動(Tesla 出身的 Rémi Cadène 主導);SmolLM 小模型系列 | 兩條新曲線:機器人與裝置端 |
| 2025/04 | 收購 Pollen Robotics(法國人形機器人新創) | 宣示「開源 AI 機器人」路線 |
| 2025 | SmolLM3 發布;Hub 模型數突破百萬 | 小模型旗手+平台里程碑 |
| 2026/01 | Reachy Mini 桌面機器人出貨數千台;CES 上黃仁勳親自展示搭配 DGX Spark | 開源硬體的市場驗證 |
1.3 一句話定位
GitHub 之於程式碼,Hugging Face 之於模型——它不生產最強的智能,它讓智能的流通有了標準格式。
二、商業模式與護城河
2.1 錢從哪裡來?——這是全系列最「輕」的收入結構
2023 年營收約 7,000 萬美元、2024 年約 1.3 億美元,對比 45 億估值與行業地位,變現只能算剛起步:
| 收入支柱 | 內容 | 定位 |
|---|---|---|
| Enterprise Hub | 企業版(每人每月 20 美元起):私有模型庫、權限治理、SLA、合規 | 主力成長線,財星 500 有三成開了帳號 |
| Inference Endpoints / API | 託管推理,按用量計費 | 把流量變現的核心嘗試 |
| Spaces / 計算加值 | 展示應用的 GPU 託管、Pro 訂閱 | 社群變現 |
| 硬體夥伴分潤 | 與 NVIDIA、AMD、Intel 等的最佳化合作、雲夥伴導流 | 「所有賣晶片的都需要它中立」的結構紅利 |
| 機器人硬體(新) | Reachy Mini 等開源機器人銷售 | 第二曲線實驗 |
值得一提:Hugging Face 團隊維持數百人規模、多次對外表示接近損益兩平——它燒錢的速度和它的收入一樣「小而美」,這讓 45 億估值下的它沒有生存壓力,可以慢慢找變現。
2.2 護城河分析
| 護城河來源 | 強度 | 說明 |
|---|---|---|
| 雙邊網絡效應 | 極強 | 模型方要觸及開發者必須上架,開發者找模型必先來此——與 GitHub 同構的飛輪,遷移它等於遷移整個生態的習慣 |
| 中立性 | 極強 | 唯一被所有巨頭同時投資的公司:不屬於任何雲、任何模型陣營——這在模型戰爭時代是稀缺資產 |
| 開源工具鏈標準 | 強 | Transformers/Datasets/PEFT/TRL/Diffusers 是研究與微調的預設工具,safetensors 等格式標準由它定義 |
| 社群與品牌 | 強 | 「開源 AI 的精神象徵」,Delangue 是開源陣營最有影響力的發言人之一 |
| 轉移成本 | 中 | 對免費用戶低(下載即走),對企業版與工作流深度用戶較高 |
2.3 策略解讀:故意不做的事,和 GitHub 一樣多
Hugging Face 的克制是策略性的:不做自己的前沿大模型(避免與上架者競爭)、不綁定單一雲(保持所有人的朋友)、核心永遠免費(保護飛輪)。它賺的是生態繁榮的「稅」,而不是生態內任何一方的輸贏——這與 GitHub 被微軟收購前的處境幾乎一模一樣,也預示了它可能的結局之一:被某個需要「開發者中立入口」的巨頭高價收編。
三、產品與模型矩陣介紹
3.1 平台產品全景
| 產品 | 定位 | 說明 |
|---|---|---|
| Model Hub | 核心 | 100 萬+模型、25 萬資料集的託管與版本管理,Git 式工作流 |
| Transformers 等函式庫 | 工具鏈 | Transformers、Diffusers(圖像)、PEFT(微調)、TRL(RLHF)、Accelerate |
| Spaces | 展示層 | 60 萬+ AI 應用 Demo,Gradio 驅動——AI 界的作品集平台 |
| Inference Endpoints | 變現層 | 一鍵部署託管推理 |
| 排行榜生態 | 話語權 | Open LLM Leaderboard 等,開源模型的「公信力裁判」 |
| LeRobot + Reachy | 機器人 | 開源機器人軟硬體棧,Reachy Mini 數千台出貨 |
3.2 自有模型:小而精的示範品
Hugging Face 自己也訓模型,但定位刻意避開前沿競賽——做「示範最佳實踐」的小模型:
| 模型 | 規格 | 說明 |
|---|---|---|
| SmolLM3 | 3B | 同級最強之列,完整公開訓練配方與資料——「教科書式開源」 |
| SmolLM2 家族 | 135M-1.7B | 裝置端小模型標竿 |
| SmolVLM | 輕量視覺 | 多模態小模型 |
| BLOOM(2022,歷史地位) | 176B | 千人協作的 BigScience 產物,Llama 之前最重要的開源大模型實驗 |
| StarCoder(BigCode) | 編程 | 與社群共建的開源程式碼模型先驅 |
| FineWeb 資料集 | 15T tokens | 開源預訓練資料的品質標準,被無數模型採用 |
注意它的模型哲學與眾不同:權重、資料、訓練配方全部公開——比 Llama/Gemma 的「只放權重」更徹底,目的是維護「什麼叫真開源」的話語權。
3.3 機器人:下一個十年的豪賭
2025 年收購 Pollen Robotics 後,Hugging Face 把「GitHub 模式」複製到具身智能:LeRobot 已是開源機器人軟體的事實標準,Reachy Mini(299 美元起的桌面機器人)讓開發者用買樹莓派的價格入場,黃仁勳在 CES 2026 的站台則說明了晶片巨頭的期待——如果機器人時代來臨,誰是那個時代的模型分發層?Hugging Face 想先把位子佔了。
四、競爭優勢與隱憂
4.1 競爭優勢
| 優勢 | 說明 |
|---|---|
| 不可替代的中立樞紐 | 開源模型的發布、發現、評測、微調全流程樞紐,行業越分裂它越重要 |
| 全巨頭股東結構 | Google/Amazon/NVIDIA/AMD/Intel 同時入股——沒人希望它倒向對手,也沒人容它消失 |
| 極低燒錢的生存力 | 數百人團隊、接近打平——AI 寒冬來了它也能活,這在本系列是稀有屬性 |
| 開源話語權 | 排行榜、授權定義、最佳實踐的裁判地位 |
| 機器人先手 | LeRobot/Reachy 在具身智能開源生態的卡位,潛在天花板巨大 |
4.2 隱憂與風險
1. 變現與地位的長期落差
1.3 億營收 vs 45 億估值 vs「無可替代」的地位——這個等式維持太久本身就是風險:企業版滲透若持續慢於預期,下一輪融資的定價會很尷尬。GitHub 最終的答案是「賣給微軟」;Hugging Face 若不想重演,必須自己證明平台稅收得起來。
2. 流量與成本的剪刀差
百萬模型的免費託管、下載頻寬、Spaces 的 GPU——平台越繁榮,基礎設施帳單越重,而繁榮的主要受益者(模型商、雲)不直接付費。這是所有「開源水電行」的共同結構難題。
3. 被繞過的風險
模型分發正在多極化:Ollama 吃走本地部署入口、GitHub Models 挾微軟生態進場、雲廠商的模型市集(Bedrock/Vertex/Foundry)直接對接企業、中國模型有 ModelScope。Hub 的中心地位沒有崩,但「唯一入口」的成色在稀釋。
4. 開源重心東移的微妙處境
2026 年 Hub 上下載與熱度榜的主角越來越多是 Qwen、DeepSeek、Kimi 等中國模型(呼應 064 的開源王座易主)。平台是中立的,但地緣政治不是——若美國對中國模型的監管收緊,身為分發樞紐的它會被推到風口浪尖。
5. 機器人豪賭的執行風險
硬體的供應鏈、品控、售後與軟體平台是完全不同的生意;數千台出貨是好的開始,但距離「機器人界的 GitHub」還隔著整個產業成熟週期。
結語
把 Hugging Face 放進系列座標系:
| 維度 | Databricks(067) | Hugging Face |
|---|---|---|
| 卡位 | 企業資料的引力 | 開源生態的流量 |
| 年營收 | 54 億美元 | 約 1.3 億美元 |
| 估值 | 1,340 億 | 45 億 |
| 變現邏輯 | 資料引力→計算消費 | 生態流量→企業稅(進行中) |
| 共同點 | 都不造前沿模型,都當中立平台 |
Hugging Face 是本系列「戰略價值與財務數字落差最大」的公司:以 45 億美元的估值,扮演著整個開源 AI 世界的地基角色。它的故事提醒我們一件事——在一個行業裡,最重要的公司不一定是最賺錢的公司;標準、格式與社群的控制權,往往要到行業成熟期才會兌現成現金流(GitHub 用了十年等到微軟的 75 億美元)。
它同時也是系列敘事的樞紐站:Meta(064)、Mistral(065)的開源模型在這裡分發,SmolLM 與 Gemma/Phi 在小模型戰場相遇,而第四週要寫的中國模型軍團——正是此刻 Hub 熱度榜上的新主角。
參考資料:
- Hugging Face — Wikipedia
- Report: Hugging Face Business Breakdown & Founding Story — Contrary Research
- Hugging Face: From Chatbot to $4.5B AI Company — Turing Post
- Hugging Face revenue, valuation & funding — Sacra
- Hugging Face: Usage, Revenue, Valuation & Growth Statistics — Fueler
- Hugging Face's SmolLM3 Redefines Small Language Models — CTOL Digital
- Hugging Face to sell open-source robots thanks to Pollen Robotics acquisition — Hugging Face Blog
- The Strategy Behind Hugging Face's Acquisition Of Pollen Robotics — Forbes
- Hugging Face launches Reachy Mini robot as embodied AI platform — The Robot Report