GPT-Engineer 與 Anton Osika：週末側專案到 66 億美元獨角獸

有人問 Anton Osika：「你怎麼在幾個週末就做出了 GPT-Engineer？」

他的回答很直接：「因為我很煩每次都要自己從頭寫一堆樣板程式碼。」

2023 年，這個「煩到自己動手做」的週末側專案，在 GitHub 上累積了 52,000 顆 Star，成為當年成長最快的開源專案之一。三年後，它演化成的公司 Lovable 估值達到 66 億美元，是歐洲史上最快達到這個數字的新創企業——比 OpenAI、Cursor 和所有人都快。

這個故事的核心，只有一個哲學：你不需要會寫程式，只需要說清楚你想要什麼。

為什麼你需要認識 Anton Osika？
Anton Osika 是誰？
- 從 CERN 到新創，一個物理學家的轉彎
- 幾個週末，一個改變一切的側專案
GPT-Engineer 的核心哲學：先問清楚，再動手
三個核心設計
執行流程架構圖
GPT-Engineer vs MetaGPT vs OpenHands
從開源到 Lovable：Vibe Coding 革命
實用建議：三個起步行動
我的反思
參考資料 (References)

為什麼你需要認識 Anton Osika？

在這個系列裡，我們看過的框架幾乎都是給工程師用的：

LangChain 需要你懂 Python
CrewAI 需要你定義 Agent 角色
OpenHands 需要你有 GitHub repo

Anton Osika 問的是一個更根本的問題：如果連「寫程式」這件事本身都可以讓 AI 來做，那誰還需要會寫程式？

GPT-Engineer 的目標是「讓世界上那 99% 不會寫程式的人，也能把自己的想法做成軟體」。這不是一個開發者工具，這是一個試圖重新定義「誰能創造軟體」的宣言。

Anton Osika 是誰？

從 CERN 到新創，一個物理學家的轉彎

Anton Osika 1990 年生於瑞典，12 歲因為看了《駭客任務》而開始學程式。

他的學術背景出人意料地「硬核」：

香港科技大學 物理學學士
KTH 皇家理工學院（瑞典頂尖理工大學）工程物理與應用數學碩士
畢業後曾在 CERN（歐洲核子研究中心）參與研究工作

但他最終沒有留在學術界。他把在物理研究中建立的系統性思維，帶進了 AI 新創領域：

Sana Labs：第一個技術員工，開發獲獎 AI 學習演算法
Depict.ai：共同創辦人兼 CTO，Y Combinator 孵化，融資 2,000 萬美元

這些經歷讓他深刻理解一件事：最好的技術，不是最複雜的技術，而是讓最多人能用的技術。

幾個週末，一個改變一切的側專案

2023 年，OpenAI 發布 GPT-4，Osika 立刻意識到一個可能性：模型已經夠強，足以理解完整的軟體需求並生成整個 codebase。

他花了幾個週末，寫出了 GPT-Engineer 的第一個版本，把程式碼推上 GitHub。

想法只有一個：你描述你想要的軟體，AI 問你幾個問題確認細節，然後把整個專案生成給你。

GitHub 社群的反應超出所有預期。

52,000 Stars。 當年成長最快的開源專案之一。

GPT-Engineer 的核心哲學：先問清楚，再動手

GPT-Engineer 最重要的設計決策，不是技術架構，而是一個使用者互動邏輯：

在生成程式碼之前，先問問題。

這聽起來很簡單，但它解決了所有「一次生成」工具的根本問題：垃圾輸入，垃圾輸出（Garbage In, Garbage Out）。

你輸入：「幫我做一個記帳 App」

GPT-Engineer 不會直接生成，而是先問：
→ 這個 App 是給手機用還是網頁？
→ 需要多個使用者登入，還是單人使用？
→ 需要支援哪些幣別？
→ 你偏好用哪個技術框架？（React / Vue / 其他）
→ 需要連接銀行 API 或手動輸入？

確認完後，才開始生成完整 codebase。

這個「澄清問題」步驟，讓 GPT-Engineer 的輸出品質遠高於同期的「直接生成」工具——因為它確保了 AI 和你對「完成」的定義是一致的。

三個核心設計

1. 澄清迴圈（Clarification Loop）

GPT-Engineer 的執行流程不是線性的，而是對話式的：

用戶需求（自然語言）
    ↓
AI 生成澄清問題（3-5 個關鍵問題）
    ↓
用戶回答
    ↓
AI 確認理解正確？
    ↓ 是
生成完整 Codebase

這個設計的哲學是：不確定的事情，問比猜好。 多花 2 分鐘確認需求，節省的是「生成錯了重來」的 10 倍時間。

2. Preprompts：可自訂的 AI 行為規範

GPT-Engineer 提供一套 Preprompts 系統，讓你定義 AI 應該遵守的程式碼慣例：

# preprompts/generate_code

你是一位資深全端工程師。請遵守以下規範：
- 使用 TypeScript，不用 JavaScript
- React 元件使用 Functional Components + Hooks
- 所有 API 呼叫集中在 `/services` 目錄
- 每個元件都必須有對應的 unit test
- 使用 Tailwind CSS，不引入其他 CSS 框架

這讓不同公司、不同團隊可以把自己的開發標準「編碼進 AI 的行為」，每次生成都自動符合規範。

3. 多模型 + 視覺輸入

GPT-Engineer 不綁定單一 LLM，支援：

模型供應商	說明
OpenAI	GPT-4o, GPT-4 Turbo
Anthropic	Claude 3.5 Sonnet
Azure OpenAI	企業合規部署
本地模型	Ollama, LM Studio

更獨特的是視覺輸入：你可以直接把 UI 草圖、架構圖、線框圖（wireframe）當成輸入，讓 AI 根據「你畫的圖」生成程式碼——這對不擅長文字描述但會畫草圖的人來說，是革命性的。

執行流程架構圖

Loading Diagram...

GPT-Engineer vs MetaGPT vs OpenHands

三者都能「生成軟體」，但哲學完全不同：

面向	MetaGPT	OpenHands	GPT-Engineer
核心問題	怎麼模擬整個軟體公司？	AI 能自己解決工程問題嗎？	不會寫程式的人能做軟體嗎？
目標用戶	工程師	工程師	任何人
執行環境	本機	Docker 沙盒	本機
Git 整合	❌	✅	❌
澄清問題	❌	❌	✅ 核心設計
角色模擬	PM / Architect / QA	單一 Agent	單一 Agent
輸入形式	文字	GitHub Issue	文字 + 圖片
GitHub Stars	~46K	~74K	~52K

簡單記：MetaGPT 是虛擬軟體公司，OpenHands 是虛擬工程師，GPT-Engineer 是讓你自己成為工程師。

從開源到 Lovable：Vibe Coding 革命

GPT-Engineer 的爆紅讓 Osika 看清楚一件事：真正的市場不是開發者，而是那些有想法但不會寫程式的人。

2023 年底，他與共同創辦人 Fabian Hedin 把開源版本商業化，打造 GPT Engineer App。

2024 年 12 月，正式改名為 Lovable，並提出一個新概念：

Vibe Coding（氛圍程式設計）——不用寫語法，不用懂框架，只要表達你想要的「感覺」，AI 幫你把軟體做出來。

市場的反應是史無前例的：

里程碑	時間
$100M ARR	比 OpenAI、Cursor 所有公司都快
$200M ARR	達到 $100M 後僅四個月
Series A $2 億美元（Accel）	2025 年 7 月，估值 18 億美元
Series B（CapitalG + Menlo）	2025 年底，估值 66 億美元
用戶數	230 萬用戶

Fabian Hedin（CTO）在 26 歲成為歐洲最年輕的自製億萬富翁之一。Anton Osika 個人身價估計約 16 億美元。

實用建議：三個起步行動

步驟 1：把需求寫得像在跟設計師說話

GPT-Engineer 最大化澄清迴圈效果的方法，是把需求寫得夠具體。不要說「做一個電商網站」，要說：「做一個賣手工皂的電商，要有產品列表、購物車、結帳頁面，使用者能用 LINE 登入，不需要後台管理介面。」

越具體，AI 問的問題越少，生成的結果越準。

步驟 2：用 Preprompts 鎖定技術棧

如果你已經知道自己偏好的技術組合（例如 Next.js + TypeScript + Tailwind + Supabase），在開始之前把這些寫進 preprompts。這樣每次生成都不會跑偏到你不熟悉的技術。

步驟 3：用草圖取代長篇文字描述

GPT-Engineer 支援視覺輸入。如果你腦中有 UI 的樣子但不知道怎麼用文字描述，直接把草圖拍照傳進去——「這個畫面，幫我做成 React 元件」，比寫三段文字說明更有效率。

我的反思

讀完 Anton Osika 的故事，我最印象深刻的不是 66 億美元的估值，而是他從一開始就清楚的一個定位：「我不是要做一個更好的工程師工具，我是要讓不是工程師的人也能做軟體。」

這個定位，讓 GPT-Engineer 從一開始就往不同的方向走。

LangChain 問：「工程師怎麼更快接 LLM？」 MetaGPT 問：「AI 能不能模擬一整個開發團隊？」 OpenHands 問：「AI 能不能像工程師一樣自己解決 Bug？」

Osika 問的是：「那些從來不是工程師的人，能不能也創造軟體？」

Vibe Coding 這個詞，表面上聽起來很隨意，但背後其實是一個嚴肅的主張：程式語言是工具，不是目的。真正重要的是「你想創造什麼」，而不是「你懂不懂 React Hooks」。

從這個角度來看，GPT-Engineer 和 Lovable 不只是一個開發工具，而是一次對「誰有資格創造軟體」這個問題的反叛。

回到這個系列的脈絡：Andrew Ng 定義框架、Shunyu Yao 設計推理、Harrison Chase 工程化、João Moura 組織化、Peter Steinberger 日常化、Graham Neubig 自動化——而 Anton Osika 的答案是：

讓軟體開發這件事，對任何人都不再是門檻。

參考資料 (References)

官方資源

延伸閱讀

推薦影片

View on GitHub