
Nous Research 與 Hermes Agent:開源 Agent 的生長
AI 系列-介紹開源界最具話題性的 AI 實驗室 Nous Research。了解他們如何透過 Hermes 3 模型重新定義開源模型的 Function Calling 能力,以及最新推出的 Hermes Agent 框架如何打造具備長期記憶與自我學習能力的本地端自主代理。
WRITTEN BY

- Name
- Harry Chang
在 AI Agent 的生態系中,開源模型扮演著越來越重要的角色。這其中,開源實驗室 Nous Research 是一個極具代表性的存在。
他們之所以在技術圈獲得廣泛關注,主要基於兩個客觀的技術貢獻:
- 普及 Function Calling 能力:過去要讓 AI 穩定執行工具呼叫或輸出複雜的 JSON 格式,往往需要依賴付費的雲端大模型。Nous Research 透過精準的微調技術,讓免費的開源模型(如 Llama 系列)也具備了同等級的工具調度能力。
- 極高的指令服從度:他們訓練出的模型被設定為嚴格遵循開發者的系統提示詞(System Prompt),這讓工程師能更精準地控制 Agent 的行為與輸出格式。
在模型技術成熟後,他們近期更進一步推出了一套名為 Hermes Agent 的開源框架。
Hermes Agent 的核心特色在於:它是一個具備長期記憶、能自我學習,且專為本地端(Local-First)開源運行而設計的自主代理系統。 這種讓開發者能在自己設備上「運行專屬助理」的模式,正是目前開源社群相當關注的發展方向。
- 誰是 Nous Research?
- Hermes Agent 框架:給聰明的大腦一個身體
- 本地端運行的優勢
- 框架選型:什麼時候該用哪種 Agent?
- 實用建議:三個起步行動
- 我的反思
- 參考資料 (References)
誰是 Nous Research?
在開源 AI 模型圈,Nous Research 是一個相當活躍的團隊。
他們不是像 Meta 或 Google 那樣從頭訓練(Pre-train)一個基礎模型,而是專精於微調(Fine-tuning)與對齊(Alignment)。
他們最著名的作品是 Hermes 系列模型(例如基於 Llama 3.1 訓練的 Hermes 3)。這個系列受到許多開發者關注,有三個主要原因:
- 極致的 Function Calling 能力:他們發布了專門的「Hermes Function Calling Standard」,用 XML 標籤(如
<tools>、<scratch_pad>)強迫模型在呼叫工具前先進行「內心獨白(Internal Monologue)」與推理。 - 高可控性(Steerability):Hermes 系列被微調為「嚴格遵循系統提示詞」,能精準地按照開發者要求的角色與格式輸出內容。
- 專為 Agent 打造:Hermes 在設計時就側重於「執行任務」的能力,這讓它成為許多開源 Agent 框架愛用的預設模型。
Hermes Agent 框架:給聰明的大腦一個身體
如果說 Hermes 3 模型是「大腦」,那他們最新推出的 Hermes Agent 就是「身體」。
市面上已經有 LangChain 和 AutoGen,為什麼 Nous Research 還要自己做一個 Agent 框架?
因為他們認為現有的框架太像「腳本」了——每次對話結束,Agent 的記憶就被清空。Hermes Agent 的設計理念是:打造一個「長壽的(Long-lived)」自主代理。
核心架構與特色
Hermes Agent 不是一個簡單的 Python 腳本,而是一個完整的系統架構:
這套架構有三個主要特點:
1. 真正的持久化記憶(Persistent Memory)
它底層直接內建了 SQLite(搭配 FTS5 全文檢索)。這代表你可以今天在 CLI 跟它討論一個架構,明天在 Telegram 裡繼續跟它聊同一個專案。它會記住你的偏好、專案的 Context,而不是每次都要你重新貼 prompt。
2. 自我學習的「技能迴圈(Learning Loop)」
這是 Hermes Agent 的重要機制。當它解決了一個複雜的問題(例如:成功幫你寫了一個抓取特定網站資料的腳本),它不會就這樣忘了。 它會自動把這次成功的解法「萃取」成一個新的 Skill(技能),存在資料庫裡。下次遇到類似問題,它會直接調用這個寫好的技能,變得越來越聰明。
3. 多平台無縫切換
它內建了一個 Gateway,你可以把它掛在 Discord、Telegram 或是 Slack 上。它就像一個真正的虛擬員工,活在你的團隊通訊軟體裡,而且記憶是互通的。
本地端運行的優勢
在這個系列前面的文章中,我們介紹了許多優秀的 Agent 框架,它們多數與雲端 API 有著良好的整合。
然而,在某些企業應用或個人專案中,開發者可能會面臨資料隱私與頻繁調用成本的考量(例如:掃描內部程式碼庫或處理機密財務數據)。
Hermes Agent 提供了一個很好的在地化方案: 透過本地端運行的開源模型(例如搭配 Ollama),建立一個具備記憶力與工具能力的 Agent。
這為 AI Agent 生態系補齊了 Local-First(本地優先) 這塊實用的拼圖。
框架選型:什麼時候該用哪種 Agent?
寫到這裡,我們已經介紹了許多種 AI 框架。為了避免混淆,我們可以用一個簡單的對照表,來釐清 Hermes Agent 在整個生態系中的定位:
| 框架名稱 | 最強勢的領域 | 適合的使用情境 |
|---|---|---|
| LangChain / LlamaIndex | 文本檢索與資料處理 | 想要讀取 PDF、內部文件,建立 RAG 知識庫應用時。 |
| AutoGen | 多智能體協作 (Multi-Agent) | 想看不同角色的 AI 互相對話、除錯,或分工完成複雜專案時。 |
| Semantic Kernel | 企業級系統整合 | 團隊主力使用 C#/.NET,需要高穩定性且與現有架構深度綁定時。 |
| DSPy | 提示詞自動優化 | 發現 AI 回答總是不夠準確,希望靠演算法自動找出最佳 Prompt 時。 |
| MCP (Protocol) | 統一的工具擴充標準 | 想讓 Claude Desktop 快速具備讀寫本地檔案或搜尋網路能力時。 |
| OpenClaw | 廣泛的通訊整合與靜態腳本 | 想用大量社群現成腳本,快速在多個社群軟體上部署萬能小幫手時。 |
| Hermes Agent | 深度推理與自我學習 | 想要養一個活在自己電腦裡,有長期記憶且會自動長出新工具的專屬助理時。 |
值得特別一提的是,OpenClaw 和 Hermes Agent 雖然都是能跑在本地端的代理系統,但核心哲學並不相同:
- OpenClaw 是 Gateway-First(整合優先):它更像一個強大的接線生,擁有龐大的社群靜態腳本庫,適合「拿來就用」。
- Hermes Agent 是 Agent-First(智能優先):它的重點在於「閉環學習(Learning Loop)」,它會透過解決問題來自主寫出新的技能存入資料庫,適合需要深度客製化、陪伴成長的專案。
簡而言之,如果你需要的是一個「專案導向」的一次性任務,現有的雲端框架已經很好用。但如果你想要的是一個「長壽命(Long-lived)」、越用越懂你的個人夥伴,Hermes 提供了非常完整的基礎建設。
實用建議:三個起步行動
步驟 1:先體驗 Hermes 3 模型
即使你還不想架設 Agent,我也強烈建議你下載 Ollama,並在本地跑一次 Hermes 模型:
ollama run hermes3
試著給它一個系統提示詞,讓它輸出嚴格的 JSON 格式,你會發現它比許多同級別的開源模型聽話得多。
步驟 2:了解 XML Function Calling
去 Nous Research 的 GitHub 看看他們的「Hermes Function Calling」文件。了解為什麼在 JSON 之外,用 <scratch_pad> 讓模型先「思考」,能大幅降低工具呼叫的幻覺。這對你寫任何 Prompt 都有啟發。
步驟 3:部署你的第一個私有 Agent
如果你有一台記憶體 16GB 以上的電腦,或租用了一台便宜的 VPS,跟著官方教學把 Hermes Agent clone 下來跑跑看。試著讓它記住一件關於你的事,然後換個平台(比如從 CLI 換到 Telegram)問它,體驗「持久化記憶」帶來的便利性。
我的反思
Nous Research 與 Hermes Agent 的發展,讓我們看到開源社群在 Agent 領域的活力。
它們證明了:我們不一定要依賴大型雲端服務,也能透過開源模型在本地端完成複雜的推理與任務調度。
未來的 AI 生態系將會更加多元。 除了雲端巨頭提供的強大 API 外,我們也擁有在自己電腦裡,運行一個具備記憶、能自我成長的專屬助理的選擇。這種能兼顧靈活性與隱私的開發模式,將會是 AI 應用落地的另一條重要支線。
參考資料 (References)
官方資源
推薦影片