
ElevenLabs 深度解析:兩個波蘭人的配音革命,如何長成 110 億美元的聲音帝國
深度解析 ElevenLabs 的公司背景與創始人故事(源自波蘭配音之痛的兩人創業)、從 TTS 到語音 Agent 平台的商業模式與護城河、Eleven v3 與語音產品矩陣,以及在深偽濫用爭議與巨頭模型內建語音的夾擊下,ARR 五個月翻倍衝向 IPO 的競爭優勢與隱憂。
WRITTEN BY

- Name
- Harry Chang
「AI 公司」系列第十八篇。這篇的起點是一個很有畫面感的痛點:在波蘭看外語電影,所有角色——不論男女老幼——都由同一位男性旁白(lektor)用平板的聲音蓋過原音。2021 年底,兩個從小一起長大的波蘭人看著被 lektor 毀掉的電影,決定用 AI 解決這件事。
四年後,這家公司叫 ElevenLabs:ARR 突破 5 億美元(從 3.3 億到 5 億只花了四個月)、估值 110 億美元、41% 的財星 500 大是客戶,並公開表示瞄準 IPO。在文字模型們燒錢廝殺的時代,聲音這個「小」賽道跑出了成長速度全行業前列的公司。
一、公司背景與創始人故事:十五年的友情,一個配音的怨念
1.1 兩人組:Palantir 的商業腦 + Google 的工程手
| 創辦人 | 背景 |
|---|---|
| Mati Staniszewski(CEO) | 前 Palantir 部署策略師——B2B 落地與商業化的行家 |
| Piotr Dąbkowski(CTO) | 前 Google 機器學習工程師——模型技術核心 |
兩人是相識十五年的發小,華沙長大、倫敦創業。2022 年 5 月雙雙辭職,用積蓄啟動 ElevenLabs——公司名字致敬電影《一級玩家》式的極客趣味(第 11 實驗室)。起手式就是那個 lektor 怨念:讓任何內容都能用自然、有情感、保留原聲特質的聲音,說任何語言。
1.2 時程表:聲音賽道的閃電戰
| 時間 | 里程碑 | 意義 |
|---|---|---|
| 2022 | 倫敦成立 | 兩人全職投入 |
| 2023/01 | Beta 上線,一夜爆紅 | 同時爆出 4chan 濫用名人聲線事件——聲音深偽的治理課題從第一天就跟著它 |
| 2024/01 | a16z 領投 8,000 萬美元,晉升獨角獸(11 億美元) | TTS 品類的資本認證 |
| 2024 | 美國大選期間爆出「拜登 AI 機器人電話」事件,源頭正是其克隆技術 | 監管聚光燈+安全團隊大擴編 |
| 2025/01 | Series C 1.8 億美元,估值 33 億 | 從工具轉向平台(Agents) |
| 2025 | Eleven v3 發布:70+ 語言、多說話者對話、情緒標籤([whispers]、[sighs]) | 表現力的代差護城河 |
| 2025 底 | ARR 破 3.3 億(100M→200M 花 10 個月,200M→330M 只花 5 個月) | 成長加速度全行業罕見 |
| 2026/02 | Series D 5 億美元,估值 110 億(NVIDIA 等參與),公開瞄準 IPO | 語音賽道第一個準上市巨頭 |
| 2026/04 | ARR 突破 5 億美元 | 41% 財星 500 是客戶;全球 14 個辦公室 |
二、商業模式與護城河
2.1 錢從哪裡來?
| 收入支柱 | 內容 | 定位 |
|---|---|---|
| 開發者 API | TTS/STT/克隆按量計費 | 基本盤:數十萬開發者 |
| 企業方案 | 媒體、出版、遊戲、客服的授權與客製 | 客單價引擎,財星 500 滲透 41% |
| 語音 Agent 平台 | Conversational AI:企業自建語音客服/銷售代理 | 成長最快的第二曲線——從「唸稿」升級到「對話」 |
| 創作者訂閱 | 個人方案、Reader App、配音工作室 | 漏斗與品牌 |
| 聲音市集 | 聲優授權分潤、名人聲音遺產授權(與遺產管理方合作) | 生態設計:把「被克隆的人」變成收租方 |
2.2 護城河分析
| 護城河來源 | 強度 | 說明 |
|---|---|---|
| 表現力技術領先 | 強 | v3 的情緒標籤、多角色對話、70+ 語言——「像人」的最後一哩是資料與調校的長期積累,不是跑分能速成的 |
| 聲音資料飛輪 | 強 | 數百萬創作者的聲音克隆與回饋,累積全球最大之一的授權聲音庫 |
| 工作流嵌入 | 中偏強 | 出版社的有聲書管線、遊戲工作室的角色配音、客服系統整合——換供應商要重錄/重調全部資產 |
| 信任與合規先發 | 中偏強 | 經歷 4chan 與拜登電話事件後建立的驗證/浮水印/授權體系,反而成了企業採購的安心選項 |
| 多模型中立 | 中 | Agent 平台可接任何 LLM——它做「嘴巴與耳朵」,不與大腦供應商為敵 |
2.3 策略解讀:從「聲音工具」到「語音介面公司」
ElevenLabs 的野心遠不只 TTS。CEO 的判斷是「語音將成為科技的核心介面」——文字模型負責思考,但人機互動的最終形態是說話。它的卡位邏輯:LLM 大戰誰贏都行,只要「說出來」與「聽進去」這兩端由它壟斷,它就是所有 Agent 的嘴巴與耳朵。這與 Perplexity(063)的路由邏輯異曲同工:把巨頭的模型變成自己的供應商。
三、核心產品矩陣介紹
3.1 現役產品(2026 年中)
| 產品 | 定位 | 說明 |
|---|---|---|
| Eleven v3 | 旗艦 TTS | 70+ 語言、情緒標籤、多說話者;「最有表現力」的行業標竿 |
| 語音克隆 | 核心能力 | 秒級即時克隆與專業級克隆;驗證機制防濫用 |
| Conversational AI(Agents) | 平台化主力 | 低延遲輪替對話,企業自建語音客服/導購/助理 |
| Scribe(STT) | 聽的那一端 | 語音辨識,補全雙向對話能力 |
| 配音工作室(Dubbing) | 創始初心 | 影片自動翻譯配音,保留原聲音色——lektor 終結者 |
| Eleven Music | 新戰線 | 與版權方(Merlin、Kobalt 等)合作的授權音樂生成——直接踩進 Suno/Udio 的戰場(下篇預告) |
| Reader / 應用 | C 端 | 任何文章變播客 |
3.2 技術與治理特色
| 特色 | 說明 |
|---|---|
| 情緒與語境建模 | 不只唸字,能理解上下文決定語氣——「表現力」是它與商品化 TTS 的分界線 |
| 低延遲對話 | Agent 場景的輪替(turn-taking)優化,人感對話的工程壁壘 |
| 安全三件套 | 聲音驗證、AI 語音偵測分類器、浮水印——濫用事件逼出來的行業標準 |
| 授權優先的音樂路線 | 學了 Suno/Udio 被告的教訓,音樂線從第一天就簽版權方 |
四、競爭優勢與隱憂
4.1 競爭優勢
| 優勢 | 說明 |
|---|---|
| 成長速度 | ARR 100M→500M 不到兩年,B2B 滲透(41% 財星 500)證明不是玩具需求 |
| 品類心智 | 「AI 語音」約等於 ElevenLabs,如同圖像之於 Midjourney |
| 雙端卡位 | TTS+STT+Agent 平台,壟斷語音互動的進出口 |
| 中立層定位 | 不做 LLM,所有大腦廠商都是潛在客戶而非敵人 |
| IPO 敘事乾淨 | 收入真實、客戶分散、毛利健康——AI 應用層最像「正常好公司」的一家 |
4.2 隱憂與風險
1. 巨頭模型的「內建語音」蠶食
GPT、Gemini 的原生語音對話越來越好,且對開發者幾乎免費捆綁——通用場景的 TTS 正在被前沿模型「順手」解決。ElevenLabs 被推向專業與企業市場(高表現力、可控、多語),這個利基夠深,但通用流量的天花板被鎖死了。
2. 深偽濫用的永恆陰影
拜登機器人電話事件證明:它的技術每強一分,濫用的殺傷力就大一分。詐騙電話、名人假聲、選舉操弄——每一次社會事件都可能引來監管重錘(聲音克隆立法已在多國推進),合規成本只增不減。
3. 開源與價格戰
開源 TTS(以及中國廠商的低價方案)在「夠用」場景快速追趕,API 單價長期向下——與 Together(070)面對的是同一條商品化曲線。表現力優勢必須跑得比降價快。
4. 音樂線的版權雷區
Eleven Music 選了授權路線,但等於同時挑戰 Suno/Udio(產品)與唱片業的耐心(分潤)——這條線做好了是第二曲線,做不好是訴訟與燒錢的雙重負擔。
5. 估值的成長依賴
110 億估值對 5 億 ARR 約 22 倍——定價的是「成長不減速」。語音 Agent 市場若被 CRM/客服巨頭(Salesforce、Genesys)用捆綁打法收割,增速下修會直接衝擊 IPO 定價。
結語
把 ElevenLabs 放進第三週座標系:
| 維度 | Midjourney(071) | Runway(073) | ElevenLabs |
|---|---|---|---|
| 賽道 | 圖像 | 影片 | 聲音 |
| 客群 | 消費者訂閱 | 專業/片廠 | 開發者+企業 |
| 對巨頭策略 | 美學錯位 | 工作流深耕 | 做所有模型的嘴巴與耳朵 |
| 財務狀態 | 獲利、零融資 | 重融資搶跑 | 高速成長、衝 IPO |
ElevenLabs 是多模態一週裡「商業化最無懸念」的樣本:聲音是所有 AI 介面的最後一哩,而最後一哩天然靠近付費場景(客服、有聲書、配音都是本來就有預算的行業)。它的故事也再次驗證系列反覆出現的規律——在巨頭的射程內活下來的方法,是把自己變成巨頭的互補品,而不是替代品。
下一篇留在聲音賽道,但轉向更狂野的戰場:讓素人一鍵寫出霸榜神曲、也讓整個唱片業跳腳的 Suno——以及與它纏鬥的 Udio,一場音樂生成雙雄與版權世紀和解的故事。
參考資料:
- ElevenLabs — Wikipedia
- Mati Staniszewski — Wikipedia
- How A Tiny Polish Startup Became The Multi-Billion-Dollar Voice Of AI — Forbes
- ElevenLabs raises 11B valuation — ElevenLabs
- Nvidia-backed AI voice startup ElevenLabs hits $11 billion valuation — CNBC
- ElevenLabs CEO says the voice AI startup crossed $330M ARR last year — TechCrunch
- ElevenLabs surpasses $500 million ARR — CXO Digital Pulse
- Eleven v3: Most Expressive AI TTS Model — ElevenLabs
- ElevenLabs CEO: Voice Will Be the Core Interface for Tech — Sequoia Capital
- ElevenLabs revenue, valuation & funding — Sacra