Cohere 深度解析:不追 AGI 的 Transformer 作者,如何用「主權 AI」殺出巨頭包圍

Cohere 深度解析:不追 AGI 的 Transformer 作者,如何用「主權 AI」殺出巨頭包圍

深度解析 Cohere 的公司背景與創始人故事(Transformer 論文共同作者 Aidan Gomez 的務實路線)、以私有部署與主權 AI 為核心的商業模式與護城河、Command A+ 開放權重模型矩陣與 North 平台,以及與 Aleph Alpha 合併後,在巨頭夾縫中走差異化路線的競爭優勢與隱憂。


「AI 公司」系列第五篇。前四篇寫的都是千億到兆元級的巨頭,這篇換一個完全不同的物種:估值約 200 億美元、年營收僅 2.4 億美元,卻可能是 AI 行業裡商業模式最「反潮流」的公司

Cohere 的反潮流在於:它公開說不追 AGI、不做消費者聊天機器人、不參加燒錢軍備競賽。它賭的是另一個題目——當各國政府與受監管企業都不敢把資料交給美國超大規模雲時,誰來提供「可以完全自己掌控的 AI」?這個題目在 2026 年有了一個響亮的名字:主權 AI(Sovereign AI)


一、公司背景與創始人故事:寫出 Transformer 的人,選了最不性感的路

1.1 創辦人:Attention Is All You Need 的「那個實習生」

Cohere 的創始人故事有一個絕佳的開場:CEO Aidan Gomez 是 2017 年 Google Brain 傳世論文《Attention Is All You Need》的八位共同作者之一——寫這篇論文時他只有 20 歲,還是個實習生。這篇論文發明的 Transformer 架構,就是後來 GPT、Claude、Gemini 所有大模型的共同地基。

2019 年,Gomez 與 Nick Frosst(Geoffrey Hinton 在 Google Brain 多倫多的門生)、Ivan Zhang 在多倫多共同創辦 Cohere。有趣的對比是:Transformer 八位作者後來幾乎全數創業(Character.AI、Adept、Sakana AI 等),大多選了性感的消費者或 AGI 賽道,而 Gomez 選了最枯燥的一條——只做企業(Enterprise-only)

1.2 發展軌跡:小步快跑的務實主義

時間里程碑意義
2019於多倫多成立加拿大 AI 生態(Hinton 系)的嫡系傳人
2021-2023陸續獲 NVIDIA、Oracle、Salesforce、Fujitsu 投資投資人名單就是通路名單——雲與 SI 巨頭入股綁定分銷
2024Command R / R+ 系列主打 RAG 與企業工作流確立「不拚跑分、拚部署」的產品哲學
2025/03Command A 發布(111B,2 張 GPU 可跑)效率路線成型
2025/08-09融資 5 億美元 + 1 億延伸,估值達 70 億美元AMD、NVIDIA、PSP 等參與
2025 全年ARR 達 2.4 億美元,超越 2 億目標,季增逾 50%CNBC 報導 IPO 動能成形
2026/04與德國 Aleph Alpha 合併,合體估值約 200 億美元跨大西洋「主權 AI 冠軍」誕生,德國 Schwarz 集團注資 6 億美元
2026/05Command A+ 以 Apache 2.0 開源(218B MoE)把開放權重當成主權 AI 的技術承諾
2026North Mini Code 編程模型發布進軍「主權開發者生態」

1.3 一句話定位

如果 Anthropic 是 AI 時代的 AWS、OpenAI 是 Apple,那 Cohere 想做的是 AI 時代的 SAP——不站在聚光燈下,但深深嵌進政府與大企業最不能出錯的系統裡。


二、商業模式與護城河

2.1 錢從哪裡來?——85% 來自「私有部署」

Cohere 的收入結構在 AI 公司中獨樹一幟:約 85% 營收來自私有部署(Private Deployment)——模型直接裝進客戶自己的機房或 VPC,資料完全不出門。客戶包括 Oracle、富士通、加拿大皇家銀行(RBC)、LG、Notion 等,多為多年期合約,收入能見度高。

收入支柱內容定位
私有部署授權Command 系列裝進客戶機房/VPC,按授權與訂閱收費營收主體(約 85%)
North 平台一體化 Agent 工作空間(企業版 AI 作業系統)從「賣模型」升級到「賣平台」的關鍵
雲端 API透過 Oracle OCI、AWS Bedrock、Azure 等分銷觸及長尾客戶
主權 AI 專案與各國政府共建國家級 AI 基礎設施(加拿大、日本、歐洲)合併 Aleph Alpha 後的核心成長引擎
Embed / Rerank企業搜尋與 RAG 的檢索模型隱形但黏性極高的基礎元件

2.2 護城河分析

護城河來源強度說明
信任與合規定位強(利基內)「資料不出門」對政府、金融、國防是硬需求,巨頭的雲端模式先天做不到
主權 AI 卡位強,快速增強合併 Aleph Alpha 後同時是加拿大與德國/歐盟的「國家隊」,政治資產無法用錢買
轉移成本中偏強裝進機房的模型 + North 工作流 + 多年約,拔除成本遠高於換一個 API
效率型技術路線Command A+ 用 218B MoE(激活 25B)做到 1-2 張 GPU 可跑——客戶自己買得起的硬體就能部署,這本身就是產品力
資本效率總募資約 15-20 億美元,是四巨頭的零頭;不燒前沿訓練的錢,活得久

2.3 策略解讀:把「開源」變成主權 AI 的信任憑證

2026 年 5 月 Command A+ 以 Apache 2.0 完全開源是一步妙棋:對主權客戶而言,「權重在我手上、授權無限制」是終極的資料主權保證——連 Cohere 倒閉的風險都對沖掉了。它賣的從來不是模型本身,而是部署、客製、維運與平台。這與 Google 的 Gemma 漏斗邏輯不同:Gemma 是引流,Command A+ 是信任狀


三、核心模型矩陣介紹

Cohere 是本系列中少數公開參數量的公司——因為「客戶要自己跑」,規格透明是賣點而非機密。

3.1 現役模型(2026 年中)

模型定位規格授權
Command A+旗艦(2026/05),Agent 任務優化218B MoE,每 token 激活 25B;1 張 B200 或 2 張 H100 可跑Apache 2.0 開源
Command A前代主力(2025/03)111B,2 張 GPU 可跑開放權重(研究用)
Command A Reasoning / Vision / Translate垂直特化版本推理/視覺/翻譯場景企業授權
North Mini Code編程模型(2026)30B 級,號稱打贏 120B 對手主權開發者生態
Embed 4 / Rerank檢索與重排序RAG 基礎元件,多語言API/私有部署
Aya 系列Cohere Labs 的多語言開放研究模型覆蓋百餘種語言開放研究

3.2 North 平台:從模型公司變平台公司

North 是 Cohere 的一體化企業 Agent 工作空間——可以理解為「裝在客戶自己機房裡的企業版 ChatGPT + Agent 平台」,整合搜尋、文件、自動化工作流。Command A+ 正是從一年的 North 客戶部署經驗中反向打磨出來的:Agent 問答準確率較前代提升 20%、試算表分析提升 32%、記憶任務得分從 39% 提升到 54%。

這個「產品回饋模型」的閉環是 Cohere 對抗巨頭的核心方法論:不在通用基準上硬拚,在企業真實工作流上取勝

3.3 技術架構特色

技術說明
效率優先的 MoE218B 總參數只激活 25B,目標是「客戶買得起的硬體」而非「實驗室最高分」
RAG 原生設計Command 系列從 R 世代起就為檢索增強生成優化,引用來源、抗幻覺是企業剛需
多語言縱深Aya 計畫覆蓋百餘種語言,對非英語系政府客戶(歐洲、日本、中東)是關鍵賣點
部署彈性同一模型支援雲端 API、VPC、實體機房、氣隙(air-gapped)環境
開放權重策略旗艦直接 Apache 2.0,用「你可以帶著權重走」消除主權客戶的鎖定恐懼

四、競爭優勢與隱憂

4.1 競爭優勢

優勢說明
利基定位清晰「不追 AGI、只做企業、資料不出門」——在巨頭不願或不能進入的縫隙裡當第一
主權 AI 的政治順風歐盟 AI 主權焦慮、各國去美國化需求是結構性趨勢;Cohere+Aleph Alpha 是唯一的跨大西洋國家隊
收入質量高多年期私有部署合約,季增 50% 的 ARR 成長,IPO 故事乾淨
資本效率不燒前沿訓練軍備競賽的錢,以巨頭 1% 的資本存活並成長
投資人即通路Oracle、富士通、Schwarz 既是股東也是分銷與客戶,B2B 冷啟動問題被股權結構解決

4.2 隱憂與風險

1. 模型能力的代差風險

不參加軍備競賽的代價是前沿能力落後:Command A+ 對標的是「效率與部署」,但當 Claude/GPT/Gemini 的能力優勢大到客戶願意妥協資料主權時,Cohere 的利基會被壓縮。它必須賭「企業任務不需要最強模型」這個假設持續成立。

2. 巨頭正在進場搶主權生意

主權 AI 變成顯學後,巨頭都推出了對案:微軟的主權雲、Google 的 Sovereign Cloud、Mistral 拿下歐洲多國政府案。Cohere 的「純粹性」是優勢,但對手的資源多出兩個數量級。

3. 開源的雙面刃

Command A+ 開源後,理論上任何 SI(系統整合商)都能拿權重自己做部署生意,不必付錢給 Cohere。它賭的是「企業要的是可靠的維運與平台,不是裸權重」——這個賭注在 Llama/Qwen 生態越成熟時越危險。

4. 合併整合風險

Cohere 與 Aleph Alpha 的合併是跨國、跨文化、跨監管的整合(加拿大 + 德國),歷史上這類「政治正確的合併」失敗率不低。合體估值 200 億對應 ARR 約 2.4 億(Cohere 端),估值倍數並不便宜,IPO 前的執行壓力很大。

5. 規模天花板

主權與私有部署市場天然碎片化——每個客戶都要客製、每個國家都要在地化,這是「利潤不錯但難以指數成長」的生意型態。Cohere 的終局更可能是百億級的優質軟體公司,而非兆元平台——這對投資人是務實,對「AI 改變世界」的敘事則是天花板。


結語

把 Cohere 放進系列對照表,會看到一個完全不同的物種:

維度四巨頭(057-060)Cohere
目標AGI / 平台霸權企業工作流 + 主權 AI
資本千億到兆元級融資約 20 億美元總募資
模型策略閉源旗艦(+開源引流)旗艦直接開源當信任狀
部署雲端 API 為主私有部署佔 85%
終局想像AWS / Apple / GoogleAI 時代的 SAP

Cohere 證明了 AI 行業存在第二種活法:不站上牌桌跟巨頭比籌碼,而是把桌子搬到巨頭進不去的房間裡。它的天花板明顯比四巨頭低,但它的生存機率可能比多數 AI 新創都高——在一個泡沫與軍備競賽並存的行業裡,「活得久」本身就是一種策略

對投資與從業者的啟示是:AI 的價值鏈正在分層——前沿能力層(四巨頭的戰場)之下,還有部署層、信任層、在地化層。Cohere 押注的是後三層,而這三層恰恰是最不容易被下一代模型「一夜抹平」的。


參考資料: