Stable Diffusion 王朝深度解析:Stability AI 的殞落,與 Black Forest Labs 的復興

Stable Diffusion 王朝深度解析:Stability AI 的殞落,與 Black Forest Labs 的復興

雙主角深度解析開源圖像生成的王朝更迭:Stability AI 從 Stable Diffusion 引爆全球到創辦人出走、財務崩壞與好萊塢救援的殞落與重整;原班核心研究員另起爐灶的 Black Forest Labs 如何用 FLUX 系列與階梯式授權模式重登王座。並解析 Getty 訴訟判決對整個行業的意義。


「AI 公司」系列第十六篇。這篇是全系列唯一的雙主角敘事,因為這兩家公司本質上是同一個故事的上下集

上集,Stability AI 把 Stable Diffusion 開源送給全世界,引爆了 AI 繪圖時代——然後眼睜睜看著自己創造的價值被整個生態拿走,公司墜入財務深淵。下集,做出這個模型的三位研究員出走,在德國黑森林邊上重開一局,兩年做到 32.5 億美元估值,把 Meta、Adobe、xAI 全部變成付費客戶。

同一批人、同一種技術、兩種商業模式——這是 AI 行業關於「開源如何捕獲價值」最好的一組對照實驗。


一、上集:Stability AI 的崛起與殞落

1.1 Emad Mostaque:最會講故事的布道者

Stability AI 的靈魂人物 Emad Mostaque 出身對沖基金經理,2020 年創辦公司時的敘事極具感染力:「AI by the people, for the people」——用開源打破巨頭壟斷。2022 年 8 月,Stable Diffusion 開源發布,任何人都能免費下載權重在自己的顯卡上生圖——這是生成式 AI 第一次真正「飛入尋常百姓家」,其文化衝擊不亞於 ChatGPT。

但一個常被忽略的事實埋下了日後的伏筆:Stable Diffusion 的核心技術(潛在擴散模型)並非 Stability 原創,而是慕尼黑大學 CompVis 實驗室的 Robin Rombach、Patrick Esser 等人的學術成果——Stability 出的是算力與行銷。「誰真正擁有這個王朝」的問題,從第一天就存在。

1.2 殞落時程表

時間事件意義
2022/08Stable Diffusion 開源發布AI 繪圖平民化的引爆點,衍生出 ControlNet、LoRA、Civitai 整個生態
2022/10融資 1.01 億美元,估值 10 億開源明星的資本巔峰
2023/01Getty Images 提告(英美兩地)指控盜用 1,200 萬張圖片訓練——生成式 AI 版權第一大案
2023SDXL 發布;但燒錢遠超收入,算力帳單失控「開源送模型+雲端賣推理」的模式收不到錢——生態用戶都在自己的顯卡上跑
2023/11音訊主管 Ed Newton-Rex 因「合理使用」立場請辭內部價值觀裂痕公開化
2024/03SD3 團隊集體出走(Rombach、Blattmann、Esser 等);一週後 Mostaque 辭任 CEO王朝核心資產(人)與門面(創辦人)同月流失;Mostaque 履歷誇大等爭議纏身
2024/06Prem Akkaraju(前 Weta Digital CEO)接任,Sean Parker 任執行主席,債轉股重整好萊塢救援隊進場
2024/09James Cameron 加入董事會轉向「服務創意產業」的訊號
2025SD 3.5、Stable Audio;與 WPP、EA 等合作;提出「Spotify 式」訓練資料授權構想從開源布道者轉型媒體技術供應商
2025/11Getty 案英國高等法院判決:核心侵權主張不成立(模型權重不構成侵權複製品),僅浮水印商標侵權成立行業級的重要判例;美國戰線仍在加州進行

1.3 殞落的根因:價值創造與價值捕獲的斷裂

Stability 的失敗不是技術失敗,是商業模式的結構性失敗:它開源了一個人人可以自己跑的模型(消費級顯卡即可),於是生態越繁榮,它的雲端服務越沒人需要。對比 Llama(Meta 不靠模型賺錢)與 FLUX(下集的階梯授權),Stability 是「用巨頭的打法燒錢,卻沒有巨頭的錢包」。


二、下集:Black Forest Labs 的復興

2.1 出走的人帶走了王朝

2024 年,Rombach、Blattmann、Esser 三位 Stable Diffusion 的原始作者回到德國,在弗萊堡(黑森林旁,公司因此得名)創立 Black Forest Labs。a16z 領投 3,100 萬美元種子輪——投資邏輯簡單粗暴:買下這個領域最強的三顆大腦

時間里程碑意義
2024/08FLUX.1 發布(Pro/Dev/Schnell 三檔)發布即登頂開源圖像模型;階梯式授權模式亮相
2024/12成為 xAI Grok 的圖像引擎第一個大平台客戶(與 060 連線)
2025/05FLUX.1 Kontext(上下文編輯)從生圖進化到「用自然語言改圖」
2025/09Meta 簽多年 1.4 億美元合約;累計平台合約(Adobe、Canva、Snap 等)約 3 億美元「賣給平台」模式的規模驗證(與 064/071 連線)
2025/11FLUX.2:支援 10 張參考圖、原生 4MP 輸出、32K token 提示技術代差再拉開
2025/12Series B 3 億美元,估值 32.5 億累計下載超過 4 億次
2026加入 NVIDIA Nemotron 聯盟(069);馬丁·史柯西斯出任顧問,用 FLUX 為新片做分鏡從開發者工具滲透到好萊塢工作流

2.2 復興的方法論:同樣開源,不同的收銀台

BFL 對前東家的教訓做了教科書級的修正——階梯式授權(open-weight ladder)

檔位授權商業角色
FLUX SchnellApache 2.0 完全開源生態漏斗:開發者免費入場,建立心智
FLUX Dev開放權重,非商業使用專業社群的試用場——想商用?付錢
FLUX Pro / FLUX.2僅 API 與授權收銀台:個人開發者按張計費,平台客戶簽千萬級年約

與 Stability 的對比一目了然:Stability 把最強的模型直接送出去,BFL 送的是「夠好」的,賣的是「最強」的。再加上「賣給平台」的大客戶策略(Meta/Adobe 級的合約一張抵百萬散客),它用 Stability 十分之一的人力做到了健康的收入結構。


三、模型矩陣與技術對照

3.1 兩家現役產品(2026 年中)

公司產品定位
BFLFLUX.2(Pro/Flex/Dev)開源血統的旗艦:多參考圖一致性、4MP、超長提示——開發者與平台市場的事實標準
BFLFLUX.1 Kontext自然語言圖像編輯
BFLFLUX SchnellApache 2.0 免費檔,生態基本盤
StabilitySD 3.5 系列存量生態仍龐大(Civitai/ComfyUI 世界的基石),但技術聲量已被 FLUX 蓋過
StabilityStable Audio / Video多模態嘗試,聚焦媒體產業客製

3.2 技術與生態觀察

觀察說明
潛在擴散的血統兩家同源(CompVis 的 latent diffusion 論文),FLUX 是這條技術樹的正統續作
開源生態的慣性SD 的 LoRA/ControlNet/ComfyUI 生態仍是全球最大,但新增創作能量明顯流向 FLUX——王朝更迭在社群層面已完成
編輯>生成的趨勢Kontext 與 FLUX.2 的參考圖一致性,反映行業從「生成好圖」轉向「可控修改」的專業需求
與巨頭的錯位面對 Gemini/GPT 內建生圖的免費轟炸,BFL 的答案是「賣給這些巨頭」——Meta 的 1.4 億合約就是證明:巨頭寧可買也不想從零煉美學

四、競爭優勢、隱憂與行業啟示

4.1 兩家公司的現況對照

維度Stability AIBlack Forest Labs
核心資產SD 品牌與存量生態、媒體人脈(Cameron/Parker)原創團隊+FLUX 技術領先+平台合約
商業模式企業/媒體客製服務轉型中階梯授權+平台大單(合約額約 3 億美元)
估值狀態重整後未公開新估值32.5 億美元(2025/12)
最大風險轉型能否跑贏存量衰減巨頭自研+開源反噬(見下)

4.2 BFL 的隱憂

  1. 巨頭的自研與免費化:Google/OpenAI 的原生生圖持續進步,平台客戶(如 Meta)隨時可能「先授權、後自研、再解約」——大客戶模式的集中度風險。
  2. 開源同行的擠壓:中國系開放模型(Qwen-Image、混元等)在性價比上追得很快,Schnell 檔的生態護城河需要持續投入維護。
  3. 版權陰影未散:Getty 英國判決對「權重不構成侵權」是利多,但美國戰線(加州)與迪士尼對 Midjourney 案(071)的結果,仍可能重塑訓練資料的成本結構。
  4. 雙重身分的張力:既是開源旗手又靠閉源 Pro 賺錢,社群對「開源當行銷」的耐心是有限的——Stability 當年的信任崩塌就是前車之鑑。

4.3 這組對照實驗的行業啟示

把上下集放在一起,可以提煉出三條開源 AI 的鐵律:

  1. 開源模型的價值會流向生態,除非你設計好收銀台——Schnell/Dev/Pro 的階梯就是收銀台設計學。
  2. 王朝屬於做出模型的人,不屬於出錢的人——算力與行銷買得到聲量,買不到下一代模型;人才走,王朝就走(Meta 用 2.5 億美元年薪搶人,本質上是對這條鐵律的承認)。
  3. 法律風險是行業的系統性變數:Getty 英國判決給了開放權重模式一條生路,但英美判例的分歧意味著,訓練資料的「合規成本」仍是懸而未決的行業定價因子。

結語

Stable Diffusion 王朝的故事,為第三週的多模態戰場定下了基調:在圖像這個賽道,技術領先的半衰期不到一年,而商業模式的差異決定誰能活著看到下一代。Stability 創造了歷史卻差點死於歷史,BFL 用同一套技術+更聰明的收銀台完成復興——中間隔著的,就是本系列反覆出現的那個詞:價值捕獲。

與上一篇的 Midjourney 對照更有意思:Midjourney 用「不開源+訂閱」直接向消費者收費,BFL 用「階梯開源+授權」向平台收費——兩條路都能賺錢,唯一被證偽的是 Stability 的老路:把一切送出去,然後希望雲端服務能收回來

下一篇繼續影像戰場,但轉向動態:好萊塢的 AI 魔法師 Runway——一家真的拿過奧斯卡技術背書的公司。


參考資料: