
Stable Diffusion 王朝深度解析:Stability AI 的殞落,與 Black Forest Labs 的復興
雙主角深度解析開源圖像生成的王朝更迭:Stability AI 從 Stable Diffusion 引爆全球到創辦人出走、財務崩壞與好萊塢救援的殞落與重整;原班核心研究員另起爐灶的 Black Forest Labs 如何用 FLUX 系列與階梯式授權模式重登王座。並解析 Getty 訴訟判決對整個行業的意義。
WRITTEN BY

- Name
- Harry Chang
「AI 公司」系列第十六篇。這篇是全系列唯一的雙主角敘事,因為這兩家公司本質上是同一個故事的上下集:
上集,Stability AI 把 Stable Diffusion 開源送給全世界,引爆了 AI 繪圖時代——然後眼睜睜看著自己創造的價值被整個生態拿走,公司墜入財務深淵。下集,做出這個模型的三位研究員出走,在德國黑森林邊上重開一局,兩年做到 32.5 億美元估值,把 Meta、Adobe、xAI 全部變成付費客戶。
同一批人、同一種技術、兩種商業模式——這是 AI 行業關於「開源如何捕獲價值」最好的一組對照實驗。
一、上集:Stability AI 的崛起與殞落
1.1 Emad Mostaque:最會講故事的布道者
Stability AI 的靈魂人物 Emad Mostaque 出身對沖基金經理,2020 年創辦公司時的敘事極具感染力:「AI by the people, for the people」——用開源打破巨頭壟斷。2022 年 8 月,Stable Diffusion 開源發布,任何人都能免費下載權重在自己的顯卡上生圖——這是生成式 AI 第一次真正「飛入尋常百姓家」,其文化衝擊不亞於 ChatGPT。
但一個常被忽略的事實埋下了日後的伏筆:Stable Diffusion 的核心技術(潛在擴散模型)並非 Stability 原創,而是慕尼黑大學 CompVis 實驗室的 Robin Rombach、Patrick Esser 等人的學術成果——Stability 出的是算力與行銷。「誰真正擁有這個王朝」的問題,從第一天就存在。
1.2 殞落時程表
| 時間 | 事件 | 意義 |
|---|---|---|
| 2022/08 | Stable Diffusion 開源發布 | AI 繪圖平民化的引爆點,衍生出 ControlNet、LoRA、Civitai 整個生態 |
| 2022/10 | 融資 1.01 億美元,估值 10 億 | 開源明星的資本巔峰 |
| 2023/01 | Getty Images 提告(英美兩地) | 指控盜用 1,200 萬張圖片訓練——生成式 AI 版權第一大案 |
| 2023 | SDXL 發布;但燒錢遠超收入,算力帳單失控 | 「開源送模型+雲端賣推理」的模式收不到錢——生態用戶都在自己的顯卡上跑 |
| 2023/11 | 音訊主管 Ed Newton-Rex 因「合理使用」立場請辭 | 內部價值觀裂痕公開化 |
| 2024/03 | SD3 團隊集體出走(Rombach、Blattmann、Esser 等);一週後 Mostaque 辭任 CEO | 王朝核心資產(人)與門面(創辦人)同月流失;Mostaque 履歷誇大等爭議纏身 |
| 2024/06 | Prem Akkaraju(前 Weta Digital CEO)接任,Sean Parker 任執行主席,債轉股重整 | 好萊塢救援隊進場 |
| 2024/09 | James Cameron 加入董事會 | 轉向「服務創意產業」的訊號 |
| 2025 | SD 3.5、Stable Audio;與 WPP、EA 等合作;提出「Spotify 式」訓練資料授權構想 | 從開源布道者轉型媒體技術供應商 |
| 2025/11 | Getty 案英國高等法院判決:核心侵權主張不成立(模型權重不構成侵權複製品),僅浮水印商標侵權成立 | 行業級的重要判例;美國戰線仍在加州進行 |
1.3 殞落的根因:價值創造與價值捕獲的斷裂
Stability 的失敗不是技術失敗,是商業模式的結構性失敗:它開源了一個人人可以自己跑的模型(消費級顯卡即可),於是生態越繁榮,它的雲端服務越沒人需要。對比 Llama(Meta 不靠模型賺錢)與 FLUX(下集的階梯授權),Stability 是「用巨頭的打法燒錢,卻沒有巨頭的錢包」。
二、下集:Black Forest Labs 的復興
2.1 出走的人帶走了王朝
2024 年,Rombach、Blattmann、Esser 三位 Stable Diffusion 的原始作者回到德國,在弗萊堡(黑森林旁,公司因此得名)創立 Black Forest Labs。a16z 領投 3,100 萬美元種子輪——投資邏輯簡單粗暴:買下這個領域最強的三顆大腦。
| 時間 | 里程碑 | 意義 |
|---|---|---|
| 2024/08 | FLUX.1 發布(Pro/Dev/Schnell 三檔) | 發布即登頂開源圖像模型;階梯式授權模式亮相 |
| 2024/12 | 成為 xAI Grok 的圖像引擎 | 第一個大平台客戶(與 060 連線) |
| 2025/05 | FLUX.1 Kontext(上下文編輯) | 從生圖進化到「用自然語言改圖」 |
| 2025/09 | Meta 簽多年 1.4 億美元合約;累計平台合約(Adobe、Canva、Snap 等)約 3 億美元 | 「賣給平台」模式的規模驗證(與 064/071 連線) |
| 2025/11 | FLUX.2:支援 10 張參考圖、原生 4MP 輸出、32K token 提示 | 技術代差再拉開 |
| 2025/12 | Series B 3 億美元,估值 32.5 億 | 累計下載超過 4 億次 |
| 2026 | 加入 NVIDIA Nemotron 聯盟(069);馬丁·史柯西斯出任顧問,用 FLUX 為新片做分鏡 | 從開發者工具滲透到好萊塢工作流 |
2.2 復興的方法論:同樣開源,不同的收銀台
BFL 對前東家的教訓做了教科書級的修正——階梯式授權(open-weight ladder):
| 檔位 | 授權 | 商業角色 |
|---|---|---|
| FLUX Schnell | Apache 2.0 完全開源 | 生態漏斗:開發者免費入場,建立心智 |
| FLUX Dev | 開放權重,非商業使用 | 專業社群的試用場——想商用?付錢 |
| FLUX Pro / FLUX.2 | 僅 API 與授權 | 收銀台:個人開發者按張計費,平台客戶簽千萬級年約 |
與 Stability 的對比一目了然:Stability 把最強的模型直接送出去,BFL 送的是「夠好」的,賣的是「最強」的。再加上「賣給平台」的大客戶策略(Meta/Adobe 級的合約一張抵百萬散客),它用 Stability 十分之一的人力做到了健康的收入結構。
三、模型矩陣與技術對照
3.1 兩家現役產品(2026 年中)
| 公司 | 產品 | 定位 |
|---|---|---|
| BFL | FLUX.2(Pro/Flex/Dev) | 開源血統的旗艦:多參考圖一致性、4MP、超長提示——開發者與平台市場的事實標準 |
| BFL | FLUX.1 Kontext | 自然語言圖像編輯 |
| BFL | FLUX Schnell | Apache 2.0 免費檔,生態基本盤 |
| Stability | SD 3.5 系列 | 存量生態仍龐大(Civitai/ComfyUI 世界的基石),但技術聲量已被 FLUX 蓋過 |
| Stability | Stable Audio / Video | 多模態嘗試,聚焦媒體產業客製 |
3.2 技術與生態觀察
| 觀察 | 說明 |
|---|---|
| 潛在擴散的血統 | 兩家同源(CompVis 的 latent diffusion 論文),FLUX 是這條技術樹的正統續作 |
| 開源生態的慣性 | SD 的 LoRA/ControlNet/ComfyUI 生態仍是全球最大,但新增創作能量明顯流向 FLUX——王朝更迭在社群層面已完成 |
| 編輯>生成的趨勢 | Kontext 與 FLUX.2 的參考圖一致性,反映行業從「生成好圖」轉向「可控修改」的專業需求 |
| 與巨頭的錯位 | 面對 Gemini/GPT 內建生圖的免費轟炸,BFL 的答案是「賣給這些巨頭」——Meta 的 1.4 億合約就是證明:巨頭寧可買也不想從零煉美學 |
四、競爭優勢、隱憂與行業啟示
4.1 兩家公司的現況對照
| 維度 | Stability AI | Black Forest Labs |
|---|---|---|
| 核心資產 | SD 品牌與存量生態、媒體人脈(Cameron/Parker) | 原創團隊+FLUX 技術領先+平台合約 |
| 商業模式 | 企業/媒體客製服務轉型中 | 階梯授權+平台大單(合約額約 3 億美元) |
| 估值狀態 | 重整後未公開新估值 | 32.5 億美元(2025/12) |
| 最大風險 | 轉型能否跑贏存量衰減 | 巨頭自研+開源反噬(見下) |
4.2 BFL 的隱憂
- 巨頭的自研與免費化:Google/OpenAI 的原生生圖持續進步,平台客戶(如 Meta)隨時可能「先授權、後自研、再解約」——大客戶模式的集中度風險。
- 開源同行的擠壓:中國系開放模型(Qwen-Image、混元等)在性價比上追得很快,Schnell 檔的生態護城河需要持續投入維護。
- 版權陰影未散:Getty 英國判決對「權重不構成侵權」是利多,但美國戰線(加州)與迪士尼對 Midjourney 案(071)的結果,仍可能重塑訓練資料的成本結構。
- 雙重身分的張力:既是開源旗手又靠閉源 Pro 賺錢,社群對「開源當行銷」的耐心是有限的——Stability 當年的信任崩塌就是前車之鑑。
4.3 這組對照實驗的行業啟示
把上下集放在一起,可以提煉出三條開源 AI 的鐵律:
- 開源模型的價值會流向生態,除非你設計好收銀台——Schnell/Dev/Pro 的階梯就是收銀台設計學。
- 王朝屬於做出模型的人,不屬於出錢的人——算力與行銷買得到聲量,買不到下一代模型;人才走,王朝就走(Meta 用 2.5 億美元年薪搶人,本質上是對這條鐵律的承認)。
- 法律風險是行業的系統性變數:Getty 英國判決給了開放權重模式一條生路,但英美判例的分歧意味著,訓練資料的「合規成本」仍是懸而未決的行業定價因子。
結語
Stable Diffusion 王朝的故事,為第三週的多模態戰場定下了基調:在圖像這個賽道,技術領先的半衰期不到一年,而商業模式的差異決定誰能活著看到下一代。Stability 創造了歷史卻差點死於歷史,BFL 用同一套技術+更聰明的收銀台完成復興——中間隔著的,就是本系列反覆出現的那個詞:價值捕獲。
與上一篇的 Midjourney 對照更有意思:Midjourney 用「不開源+訂閱」直接向消費者收費,BFL 用「階梯開源+授權」向平台收費——兩條路都能賺錢,唯一被證偽的是 Stability 的老路:把一切送出去,然後希望雲端服務能收回來。
下一篇繼續影像戰場,但轉向動態:好萊塢的 AI 魔法師 Runway——一家真的拿過奧斯卡技術背書的公司。
參考資料:
- Stability AI — Wikipedia
- Emad Mostaque — Wikipedia
- Flux (text-to-image model) — Wikipedia
- Black Forest Labs raises 3.25B valuation — TechBuzz
- Black Forest Labs: FLUX and the Future of Visual AI — StartupHub.ai
- Black Forest Labs revenue, valuation & funding — Sacra
- Getty Images v Stability AI: The UK Courts' First Word — Paul, Weiss
- Getty Images v. Stability AI: Case Status May 2026 — AI Lawsuit Tracker
- Q&A with Stability AI CEO Prem Akkaraju — FT via Techmeme
- Stability AI Wants a Spotify-Type Model for Images — PetaPixel