GPT-Engineer 與 Anton Osika:週末側專案到 66 億美元獨角獸

GPT-Engineer 與 Anton Osika:週末側專案到 66 億美元獨角獸

AI 系列-瑞典物理學家 Anton Osika 從 CERN 到用幾個週末打造 GPT-Engineer,52K GitHub Stars 後轉型為 Lovable,成為史上成長最快的 SaaS——「說一句話,讓 AI 幫你把軟體做完」的 Vibe Coding 革命。


有人問 Anton Osika:「你怎麼在幾個週末就做出了 GPT-Engineer?」

他的回答很直接:「因為我很煩每次都要自己從頭寫一堆樣板程式碼。」

2023 年,這個「煩到自己動手做」的週末側專案,在 GitHub 上累積了 52,000 顆 Star,成為當年成長最快的開源專案之一。三年後,它演化成的公司 Lovable 估值達到 66 億美元,是歐洲史上最快達到這個數字的新創企業——比 OpenAI、Cursor 和所有人都快。

這個故事的核心,只有一個哲學:你不需要會寫程式,只需要說清楚你想要什麼。


為什麼你需要認識 Anton Osika?

在這個系列裡,我們看過的框架幾乎都是給工程師用的:

  • LangChain 需要你懂 Python
  • CrewAI 需要你定義 Agent 角色
  • OpenHands 需要你有 GitHub repo

Anton Osika 問的是一個更根本的問題:如果連「寫程式」這件事本身都可以讓 AI 來做,那誰還需要會寫程式?

GPT-Engineer 的目標是「讓世界上那 99% 不會寫程式的人,也能把自己的想法做成軟體」。這不是一個開發者工具,這是一個試圖重新定義「誰能創造軟體」的宣言。


Anton Osika 是誰?

從 CERN 到新創,一個物理學家的轉彎

Anton Osika 1990 年生於瑞典,12 歲因為看了《駭客任務》而開始學程式。

他的學術背景出人意料地「硬核」:

  • 香港科技大學 物理學學士
  • KTH 皇家理工學院(瑞典頂尖理工大學)工程物理與應用數學碩士
  • 畢業後曾在 CERN(歐洲核子研究中心)參與研究工作

但他最終沒有留在學術界。他把在物理研究中建立的系統性思維,帶進了 AI 新創領域:

  • Sana Labs:第一個技術員工,開發獲獎 AI 學習演算法
  • Depict.ai:共同創辦人兼 CTO,Y Combinator 孵化,融資 2,000 萬美元

這些經歷讓他深刻理解一件事:最好的技術,不是最複雜的技術,而是讓最多人能用的技術。

幾個週末,一個改變一切的側專案

2023 年,OpenAI 發布 GPT-4,Osika 立刻意識到一個可能性:模型已經夠強,足以理解完整的軟體需求並生成整個 codebase。

他花了幾個週末,寫出了 GPT-Engineer 的第一個版本,把程式碼推上 GitHub。

想法只有一個:你描述你想要的軟體,AI 問你幾個問題確認細節,然後把整個專案生成給你。

GitHub 社群的反應超出所有預期。

52,000 Stars。 當年成長最快的開源專案之一。


GPT-Engineer 的核心哲學:先問清楚,再動手

GPT-Engineer 最重要的設計決策,不是技術架構,而是一個使用者互動邏輯

在生成程式碼之前,先問問題。

這聽起來很簡單,但它解決了所有「一次生成」工具的根本問題:垃圾輸入,垃圾輸出(Garbage In, Garbage Out)。

你輸入:「幫我做一個記帳 App」

GPT-Engineer 不會直接生成,而是先問:
→ 這個 App 是給手機用還是網頁?
→ 需要多個使用者登入,還是單人使用?
→ 需要支援哪些幣別?
→ 你偏好用哪個技術框架?(React / Vue / 其他)
→ 需要連接銀行 API 或手動輸入?

確認完後,才開始生成完整 codebase。

這個「澄清問題」步驟,讓 GPT-Engineer 的輸出品質遠高於同期的「直接生成」工具——因為它確保了 AI 和你對「完成」的定義是一致的。


三個核心設計

1. 澄清迴圈(Clarification Loop)

GPT-Engineer 的執行流程不是線性的,而是對話式的:

用戶需求(自然語言)
AI 生成澄清問題(3-5 個關鍵問題)
用戶回答
AI 確認理解正確?
    ↓ 是
生成完整 Codebase

這個設計的哲學是:不確定的事情,問比猜好。 多花 2 分鐘確認需求,節省的是「生成錯了重來」的 10 倍時間。

2. Preprompts:可自訂的 AI 行為規範

GPT-Engineer 提供一套 Preprompts 系統,讓你定義 AI 應該遵守的程式碼慣例:

# preprompts/generate_code

你是一位資深全端工程師。請遵守以下規範:
- 使用 TypeScript,不用 JavaScript
- React 元件使用 Functional Components + Hooks
- 所有 API 呼叫集中在 `/services` 目錄
- 每個元件都必須有對應的 unit test
- 使用 Tailwind CSS,不引入其他 CSS 框架

這讓不同公司、不同團隊可以把自己的開發標準「編碼進 AI 的行為」,每次生成都自動符合規範。

3. 多模型 + 視覺輸入

GPT-Engineer 不綁定單一 LLM,支援:

模型供應商說明
OpenAIGPT-4o, GPT-4 Turbo
AnthropicClaude 3.5 Sonnet
Azure OpenAI企業合規部署
本地模型Ollama, LM Studio

更獨特的是視覺輸入:你可以直接把 UI 草圖、架構圖、線框圖(wireframe)當成輸入,讓 AI 根據「你畫的圖」生成程式碼——這對不擅長文字描述但會畫草圖的人來說,是革命性的。


執行流程架構圖

Loading Diagram...

GPT-Engineer vs MetaGPT vs OpenHands

三者都能「生成軟體」,但哲學完全不同:

面向MetaGPTOpenHandsGPT-Engineer
核心問題怎麼模擬整個軟體公司?AI 能自己解決工程問題嗎?不會寫程式的人能做軟體嗎?
目標用戶工程師工程師任何人
執行環境本機Docker 沙盒本機
Git 整合
澄清問題✅ 核心設計
角色模擬PM / Architect / QA單一 Agent單一 Agent
輸入形式文字GitHub Issue文字 + 圖片
GitHub Stars~46K~74K~52K

簡單記:MetaGPT 是虛擬軟體公司,OpenHands 是虛擬工程師,GPT-Engineer 是讓你自己成為工程師。


從開源到 Lovable:Vibe Coding 革命

GPT-Engineer 的爆紅讓 Osika 看清楚一件事:真正的市場不是開發者,而是那些有想法但不會寫程式的人。

2023 年底,他與共同創辦人 Fabian Hedin 把開源版本商業化,打造 GPT Engineer App

2024 年 12 月,正式改名為 Lovable,並提出一個新概念:

Vibe Coding(氛圍程式設計)——不用寫語法,不用懂框架,只要表達你想要的「感覺」,AI 幫你把軟體做出來。

市場的反應是史無前例的:

里程碑時間
$100M ARR比 OpenAI、Cursor 所有公司都快
$200M ARR達到 $100M 後僅四個月
Series A $2 億美元(Accel)2025 年 7 月,估值 18 億美元
Series B(CapitalG + Menlo)2025 年底,估值 66 億美元
用戶數230 萬用戶

Fabian Hedin(CTO)在 26 歲成為歐洲最年輕的自製億萬富翁之一。Anton Osika 個人身價估計約 16 億美元


實用建議:三個起步行動

步驟 1:把需求寫得像在跟設計師說話

GPT-Engineer 最大化澄清迴圈效果的方法,是把需求寫得夠具體。不要說「做一個電商網站」,要說:「做一個賣手工皂的電商,要有產品列表、購物車、結帳頁面,使用者能用 LINE 登入,不需要後台管理介面。」

越具體,AI 問的問題越少,生成的結果越準。

步驟 2:用 Preprompts 鎖定技術棧

如果你已經知道自己偏好的技術組合(例如 Next.js + TypeScript + Tailwind + Supabase),在開始之前把這些寫進 preprompts。這樣每次生成都不會跑偏到你不熟悉的技術。

步驟 3:用草圖取代長篇文字描述

GPT-Engineer 支援視覺輸入。如果你腦中有 UI 的樣子但不知道怎麼用文字描述,直接把草圖拍照傳進去——「這個畫面,幫我做成 React 元件」,比寫三段文字說明更有效率。


我的反思

讀完 Anton Osika 的故事,我最印象深刻的不是 66 億美元的估值,而是他從一開始就清楚的一個定位:「我不是要做一個更好的工程師工具,我是要讓不是工程師的人也能做軟體。」

這個定位,讓 GPT-Engineer 從一開始就往不同的方向走。

LangChain 問:「工程師怎麼更快接 LLM?」 MetaGPT 問:「AI 能不能模擬一整個開發團隊?」 OpenHands 問:「AI 能不能像工程師一樣自己解決 Bug?」

Osika 問的是:「那些從來不是工程師的人,能不能也創造軟體?

Vibe Coding 這個詞,表面上聽起來很隨意,但背後其實是一個嚴肅的主張:程式語言是工具,不是目的。真正重要的是「你想創造什麼」,而不是「你懂不懂 React Hooks」。

從這個角度來看,GPT-Engineer 和 Lovable 不只是一個開發工具,而是一次對「誰有資格創造軟體」這個問題的反叛。

回到這個系列的脈絡:Andrew Ng 定義框架、Shunyu Yao 設計推理、Harrison Chase 工程化、João Moura 組織化、Peter Steinberger 日常化、Graham Neubig 自動化——而 Anton Osika 的答案是:

讓軟體開發這件事,對任何人都不再是門檻。


參考資料 (References)

官方資源

延伸閱讀

推薦影片