Hermes Agent 自我學習代理人教學:龍蝦比較、安裝到離線指南
2026 年 2 月,Nous Research 在 GitHub 上悄悄推出了 Hermes Agent,沒有發布會,也沒有廣告,就一行安裝指令和一份 README。
兩個月後它已經累積 12.9 萬顆 star(129,000),成為 AI Agent 工具裡成長最快的開源專案之一,論壇和 X(Twitter)上幾乎天天有人在分享使用心得。
它解決的核心問題,是每個重度 AI 用戶都遇過的事:你花了時間教 AI 你的工作流程,隔天開新對話,它又不認識你了。
Hermes 用兩個機制解決這件事。記憶系統讓 AI 跨對話認識你,Skill 系統讓它把你做過的複雜工作流程自動寫成步驟文件,下次遇到同類任務直接調用,不用重新推理,也不用你再解釋一次,token 花費隨使用次數遞減。
搭配本地模型,所有運算在你自己的機器上跑,資料完全不出去,用越久,在能力範圍內做得越穩、越省。
這篇文章會帶你看懂它為什麼爆紅、真正強在哪裡、跟 OpenClaw 龍蝦的差別在哪、怎麼安裝和搭配 Ollama 離線使用,以及 Twitter 上的大神們都在用來做什麼,還有裝之前你必須知道的資安問題。
Hermes Agent 為什麼突然這麼紅?
Hermes Agent 是 Nous Research 開發的開源自主 AI Agent,用途是讓 AI 在不同對話之間保持持久記憶,並自動學習你的工作流程,讓你不必每次都重新解釋背景。
它短短幾個月從 AI 開發者的小圈子炸出去,現在企業主、行銷人和法律從業者都在用。
從 0 到 12 萬 stars,它解決了什麼讓每個人都痛的問題?
ChatGPT 有 Memory、Claude Code 有 CLAUDE.md,主流 AI 工具開始做記憶了,但大多綁定在特定平台上,你沒辦法帶著走、沒辦法自己修改格式和內容,更沒辦法離線使用或跨工具共享。
對偶爾用 AI 的人來說這些限制還好,但對每天靠 AI 工作的人來說,換一個工具就要重新教一次,或者在沒有網路的環境下直接不能用,就是在燒時間,燒 token,也燒耐心。
Hermes Agent 的解法很直接:維護兩個本機 Markdown 檔。
MEMORY.md(預設上限 2,200 字元,可在 config.yaml 調整)存工作事實和操作教訓,USER.md(預設上限 1,375 字元)存你的個人偏好,每次啟動自動載入一次,讓 Agent 知道你是誰、你怎麼工作、上次卡在哪。
這不是什麼新奇的技術,但 Hermes 是目前把「記憶 + Skill 自動生成」整合得最完整的開源工具,門檻也最低。
「自我學習」這個說法是真的嗎?還是行銷話術?
官網標榜 Hermes Agent 是「self-improving」,但這個說法需要稍微澄清。Hermes 的自我學習指的是,它完成複雜任務(超過 5 次工具呼叫)後,會自動在 ~/.hermes/skills/ 資料夾建立一份 Markdown 格式的技能文件,記下操作流程和注意事項,下次遇到相似任務直接調用。
它不是在做模型 fine-tuning,也不是在重新訓練神經網路權重,模型本身不會改變。用一句話講:它的學習本質是工作流程的文件化,讓下次操作更快、更準,而不是 ML 意義上的機器學習。
這樣理解,你對它的期望才會準確。
它的價值在於自動化,你不需要手動整理流程,AI 在完成任務的同時就寫好了,而且只記你實際用到的工作流程,不是通用模板,用一段時間後會越來越貼合你個人的工作方式。
Hermes Agent 真正強在哪裡?核心能力拆解
Hermes Agent 的強項不是功能多,而是圍繞越用越了解你這個核心設計的閉環系統,從記憶、技能到多平台整合,每個功能都指向同一個目標:讓 AI 真正成為你工作流程的一部分,而不是每次都要哄的工具。
跨 session 持久記憶:不用每次重新解釋自己是誰
記憶系統是 Hermes Agent 最核心的設計。
MEMORY.md 記錄環境事實、工作偏好和過去踩過的坑,USER.md 記錄你的個人行為模式和語氣偏好,兩者在每次對話開始時自動注入,讓 Agent 不需要你重複說明背景。
官方記憶系統文件:Hermes Agent Memory 說明。
除了兩個核心檔案,Hermes 還有 SQLite 全文搜尋歷史對話,當你想找上週跟它討論的某個決策,直接搜尋關鍵字即可。記憶的上限和格式都完全透明,你可以直接用任何文字編輯器查看和修改,不用進任何設定介面。
Skill 文件系統:越用越懂你的工作流程
Skill 文件系統是 Hermes 跟其他 Agent 最關鍵的差距。
當 Agent 完成複雜任務後(通常是 5 次以上工具呼叫),它會自動在 ~/.hermes/skills/ 資料夾建立 Markdown 格式的操作記錄,把推理過程濃縮成精準的步驟文件,下次遇到相似任務直接調用,不需要重新推理、不需要重新解釋,token 花費大幅下降。
這個設計對跑本地模型的用戶特別重要。本地模型的推理能力比雲端頂級模型弱,但 Skill 系統讓模型不需要每次「想」同樣的流程,直接按已驗證的步驟執行。
在模型能力範圍內的任務,用越久,Skill 越多,每次任務花的 token 越少,完成得越穩、越快。這是複利效應,不是一次性優化。
Skill 的複利效應要成立,有一個前提:Skill 數量不能無限累積。
Hermes 的背景 curator 程序會自動清理過時或重複的 Skill,防止 context 隨使用時間膨脹,這個機制讓複利效應長期有效,而不是用一段時間後反而變慢。
官方技能文件:Hermes Agent Skills 說明。
Hermes 的 Skill 格式遵循 agentskills.io 開放標準,意味著社群的技能文件可以在不同 Agent 工具之間共享。
Skill 的載入設計是按需展開,不會在每次對話都把所有技能塞進 context,只有跟當前任務相關的 Skill 才會被調用,維持 token 效率。
200 種模型支援、訊息閘道整合、自然語言排程自動化
Hermes Agent 支援多種 AI Provider,從 Nous Portal、OpenRouter(200+ 模型)、OpenAI、Anthropic Claude,到本地的 Ollama、vLLM、SGLang,用 hermes model 指令即可切換,不需要改程式碼。
訊息閘道支援 Telegram、Discord、Slack、WhatsApp、Signal、Email 和語音輸入,讓你不用開終端機也能跟 Agent 互動。
排程功能是另一個亮點:你可以用自然語言告訴 Hermes「每天早上 9 點整理我的收件匣」,它會自動建立 cron job 並持續在背景執行,不用你手動觸發。
任務夠複雜的話,可以同時開多個並行的 Hermes 實例分工處理,官方文件說明無硬性上限,實際數量取決於你的硬體資源。
| 功能 | 說明 | 官方文件 |
|---|---|---|
| 持久記憶 | MEMORY.md + USER.md,跨 session 自動載入 | Memory 文件 |
| Skill 系統 | 自動生成技能文件,agentskills.io 標準 | Skills 文件 |
| 訊息閘道 | Telegram、Discord、Slack、WhatsApp、Email、語音 | Messaging Platforms |
| 排程自動化 | 自然語言建 cron job,持續在背景執行 | CLI Guide |
| 並行 Agent | 多實例同時執行不同任務,無硬性上限 | User Stories |
Hermes Agent 跟 OpenClaw 龍蝦差在哪裡?
Hermes Agent 和 OpenClaw 都是 AI Agent 框架,都可以搭配本地模型跑,也都支援雲端 API,但兩者的設計哲學完全不同,解決的問題也不一樣。
龍蝦走廣度、Hermes 走深度,兩者設計哲學完全不同
OpenClaw(龍蝦)的設計哲學是廣度優先:整合 24 個以上通訊平台,社群有 13,000 多個現成 Skill 可以直接安裝,讓你的 AI 助理幾乎無所不能,上手快、整合廣。
Hermes Agent 的設計哲學是深度優先:功能少一點,但 Skill 自動生成機制圍繞長期使用場景設計,從你的實際工作流程中長出個人化的步驟文件,越用越省 token,越用越了解你這個人。
兩者都支援 Ollama 和 Gemma 4 等本地模型,也都可以接 OpenAI、Anthropic 等雲端服務,在本地模型的選擇上沒有差異。
差別在於 Agent 本身的設計:龍蝦靠社群現成技能快速串起各種服務,Hermes 從你的實際操作中自動生成只屬於你的 Skill,越用越省 token。
| 面向 | OpenClaw(龍蝦) | Hermes Agent |
|---|---|---|
| 定位 | 廣度優先個人 AI 助理 | 深度學習自主 Agent |
| GitHub Stars | 36.7 萬+ | 12.9 萬 |
| 核心強項 | 24+ 平台、13,000+ 社群技能 | 自動 Skill 生成(個人化,省 token) |
| 本地模型支援 | 支援 Ollama / Gemma 4 | 支援 Ollama / Gemma 4 |
| Skill 來源 | 13,000+ 社群現成技能(通用) | 從你的實際任務自動生成(個人化,省 token) |
| 資安風險 | 有社群技能供應鏈風險 | 4 Critical 開放議題(個人使用風險低),無供應鏈風險 |
| 適合對象 | 廣泛整合、日常自動化 | 深度工作流、本地模型優化 |
已經有龍蝦了,還需要裝 Hermes Agent 嗎?
取決於你主要用 Agent 做什麼事。如果你重視的是整合廣度,需要一個工具串起十幾個應用和服務,龍蝦已經夠用。
如果你的工作有重複性的深度流程,需要 AI 從你的實際操作中自動生成個人化 Skill,讓每次任務越來越省 token,或者需要在 VPS 上 24 小時持續運行,這是 Hermes 跟龍蝦走不同路的地方。
兩者也可以同時裝,Hermes 提供 OpenAI 相容的 API server(預設 port 8642),Open-WebUI 等介面都可以接上去,讓你繼續用習慣的前端,後端換成 Hermes 的持久記憶引擎。
官方有完整的 Open-WebUI 整合教學:Open-WebUI 整合文件。
Hermes Agent 怎麼安裝?60 秒快速上手
Hermes Agent 的安裝只需要一行 curl 指令,官方設計目標是從零到可用在 60 秒內完成,不需要 Docker,不需要 Python 虛擬環境,直接跑安裝腳本就好。
系統需求:Windows / Mac / Linux 都支援嗎?
原生支援 Linux 和 macOS,Windows 用戶需要先裝 WSL2(Windows Subsystem for Linux),透過 WSL2 跑 Linux 環境後再安裝 Hermes,體驗和直接在 Linux 上幾乎一樣。
硬體上,如果你用雲端模型(OpenAI、Anthropic 等),8GB RAM 以上的任何現代電腦都跑得動,不需要 GPU。
Hermes 設計成部署在獨立伺服器上 24 小時持續運行,不依賴你的桌機開著,所以很多用戶選擇 $5-10/月的 Hetzner 或 DigitalOcean VPS,而不是跑在本機。
這樣無論你用手機還是電腦,透過 Telegram 或 Discord 都能隨時跟 Agent 互動。
安裝指令與第一次設定步驟
完整安裝流程如下,詳細說明參考官方 Quickstart 文件:
# 步驟一:安裝(Linux / macOS / WSL2)
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
# 步驟二:重新載入 shell
source ~/.zshrc # 或 source ~/.bashrc
# 步驟三:選擇模型和 Provider
hermes model
# 步驟四:啟動(推薦 TUI 介面)
hermes --tui
# 步驟五:下次繼續上次對話
hermes --continue
設定檔存在 ~/.hermes/.env(API Keys)和 ~/.hermes/config.yaml(非敏感設定),記憶檔在 ~/.hermes/MEMORY.md,所有資料都是本機純文字,你可以直接用任何文字編輯器查看和修改。

Hermes Agent 可以完全離線使用嗎?
可以完全離線使用!先搞清楚兩個概念:Ollama 是在你電腦上跑 AI 模型的開源工具(類似播放器),Gemma 4 是 Google 推出的 AI 模型(類似影片)。
兩者搭配就是「用 Ollama 跑 Gemma 4」,不需要任何雲端 API Key,所有運算在你自己的機器上進行,資料完全不出去。
Hermes Agent 可以直接接上 Ollama 當作推理引擎,透過 Ollama 跑 Gemma 4 等模型,切換不同模型只需一個指令。
哪些本地模型跟 Hermes Agent 最搭?
Hermes 的記憶和 Skill 系統需要模型有足夠的 context window(建議 64K token 以上),以下是四個主流選擇,依硬體需求列出:
Gemma 4 E4B(Google,2026/04 發布,Apache 2.0):模型檔案約 9.6 GB(Q4_K_M 量化),16 GB RAM 即可執行,CPU 可跑但較慢,有 GPU 速度更快,多模態支援、128K context,一行 ollama run gemma4:e4b 就能跑起來,是目前入門本地模型的首選。
Gemma 4 26B MoE(進階):每次推論只激活 4B 參數,跑出接近 30B 模型的品質,256K context;需要 16 GB VRAM 並搭配 Q4 量化,BF16 完整版則需要 48 GB,適合需要長文處理的工作流。
Qwen3.6 27B(Alibaba):約需 17 GB VRAM,視覺理解能力強,適合大量處理圖片和文件的場景(35B 版則需 24 GB)。
DeepSeek V4 Flash(DeepSeek,2026/04 發布,MIT 授權,伺服器等級):284B MoE 架構,每次推論只激活 13B 參數,1M context,推理效率高,接近前沿模型水準。本地運行需要至少 96 GB VRAM(Q4 量化,約 80 GB 權重),建議 2 張 A100 80GB 以上。
以上四個模型都有超過 64K context,符合 Hermes 記憶和 Skill 系統的最低需求。
四個模型的硬體門檻差距很大,選之前先確認自己的設備:
| 層級 | 模型 | 最低硬體需求 | 適合對象 |
|---|---|---|---|
| 個人用戶 | Gemma 4 E4B | 16 GB RAM(CPU 可跑,有 GPU 更快) | 入門首選,一般 Mac / PC 可跑 |
| 個人進階 | Gemma 4 26B MoE | 16 GB VRAM(Q4) | 有獨顯工作站 |
| 個人進階 | Qwen3.6 27B | 17 GB VRAM | 需要視覺理解的工作流 |
| 企業 / 開發者 | DeepSeek V4 Flash | 96 GB VRAM(Q4),建議 2 張 A100 | 私有伺服器,接近前沿模型水準 |
安裝好 Ollama 後,用以下方式讓 Hermes 接上本地模型:
# 步驟一:用 Ollama 下載模型(以 Gemma 4 E4B 為例)
ollama pull gemma4:e4b
# 步驟二:啟動 Ollama(建議設定足夠的 context window)
OLLAMA_CONTEXT_LENGTH=32768 ollama serve
# 步驟三:在 Hermes 裡設定 Ollama 端點
hermes model
# 選 Custom endpoint → URL: http://localhost:11434/v1
# 跳過 API Key → 輸入模型名稱: gemma4:e4b
哪些場景必須選本地模型?隱私資料怎麼處理
如果你的工作涉及客戶合約機密、財務報表、醫療紀錄、法律文件,用雲端 API 就等於把這些資料送到第三方伺服器,合規風險很高。
Hermes Agent 搭配 Ollama 的本地部署,讓整個 AI 工作流都在你的機器上跑,資料完全不外流,適合律師事務所、醫療從業者、財務顧問等場景。
Hermes 的記憶系統本身也是本機純文字 Markdown 檔,沒有任何遙測、沒有資料收集,這是它比很多雲端 AI 服務在隱私層面更有優勢的地方,要搬家非常容易,而且離線使用完全免費開源。
社群有用戶在邊緣 GPU 搭配 Gemma 模型的環境上運行,專門處理不能上雲的法律文件,運作穩定。
大家都怎麼用 Hermes Agent?Twitter 真實案例與資安評估
Hermes Agent 的官方 User Stories 頁面整理了 99 個以上的真實使用案例,涵蓋開發、商業、個人助理到金融交易,X 上也有大量用戶在分享工作流。資安方面,2026 年 4 月出現了一份正式稽核報告,有幾個問題值得你裝之前先看清楚。
從開發者到企業主,X 上的大神都在用來做什麼?
以下整理自官方 User Stories 頁面和 X 上的用戶自述(均為自我報告,未經獨立驗證):
開發工作流:Nous Research 共同創辦人 @Teknium 每天同時運行多個 Hermes Agent 並行實例;@gkisokay 建立了從計畫、寫程式、QA 到上線的全自動 pipeline;@techNmak 把 code review 自動化,Agent 記住他個人的程式碼偏好並據此給建議。
商業應用:@mvanhorn 用 Hermes 做客戶研究,每次電話前節省 20-30 分鐘;@NathanWilbanks_ 在 297 天內自動化了 10 萬美元以上的客戶工作價值;@gregisenberg 透過 OpenRouter 搭配 Hermes,把 token 花費降低了 90%。來源:官方 User Stories 頁面。
金融與交易:@adiix_official 用 4 個並行實例同時監控訂單簿、鏈上地址、新聞訊號和倉位;@DeRonin_ 自學建了天氣交易機器人,48 小時從 100 美元跑到 216 美元。
個人助理:@EXM7777 把 Hermes 接上家族 WhatsApp,取代多個訂閱服務;@trevorgordon981 透過 iMessage 和 Mac Studio 跨裝置使用;@kovern 用來說睡前故事,Agent 跨 session 記住角色設定和孩子的喜好。
資安問題嚴重嗎?4 個 Critical 漏洞的真相與應對方式
2026 年 4 月,GitHub 上出現了一份正式安全稽核報告(Issue #7826),發現了 4 個 Critical 和 9 個 High 問題,目前仍是 Open 狀態,裝之前你應該知道這些:
C1:無限制 Shell 執行,預設本地模式下 LLM 可對你的電腦執行任意 bash 指令,沒有白名單。
C2:無限制檔案系統讀取,Agent 可讀取 SSH 金鑰、.env 等敏感檔案。
C3:容器模式跳過安全檢查,Docker 和 Singularity 模式下所有安全審批被跳過。
C4:Skill 建立無 sandbox,自動生成的技能文件可作為持久化提示注入向量。這也是 Hermes 最矛盾的地方:自動生成 Skill 是它的核心賣點,但同一個機制也是資安風險的入口,個人使用問題不大,企業環境必須額外防護。
從以上你可以看出,你想要權限全開就勢必會面臨一些資安方面的問題,資安跟方便性永遠是兩難的問題。如果個人開發者在自己的電腦上用,Hermes 只能操作你自己的環境,實際風險低,照預設設定裝好就能用。
企業部署或多人共用環境,必須先做三件事再上線:用 Docker backend(hermes config set terminal.backend docker)隔離執行環境、不以 root 身份跑 Hermes、設定環境變數限制讀寫範圍。
Hermes 的預設安全設定是「全允許」,個人開發沒問題,但企業多人環境上線前必須先完成上述三個設定。

結論:Hermes Agent 現在值得裝嗎?
Hermes Agent 的核心邏輯只有一句話:按照你的習慣客製化,本地模型能力有限,所以每省一個 token、每少一次重新推理,都是在讓有限的能力花在刀口上。
Skill 系統做的正是這件事,你做過的複雜任務,它寫成精準的個人化流程文件,下次同類任務不再推理,直接按步驟執行,在模型能力範圍內的任務做得越來越穩、越來越省,這是複利,不是一次性改善。
適合哪些人用?每天靠 AI 工作、有重複性深度工作流的開發者或知識工作者、想用本地模型在私有環境長期運行的用戶、處理隱私資料需要本地部署的法律和醫療從業者。
不適合哪些人?偶爾問問問題的輕度用戶(ChatGPT 已經夠用)、不想碰命令列的用戶(目前仍是 CLI 為主)、需要現成廣泛整合的用戶(龍蝦的 13,000+ 社群 Skills 和 24 個以上平台更適合)。
你付出的不是訂閱費,而是一段學習曲線,換來的是一個真正懂你工作流程的數位夥伴,資料全部留在本機,不會因為服務倒閉或漲價而失去。
想試試看,歡迎從官方 Quickstart 文件開始,60 秒就能跑起來。
如果你看英文吃力,可以看我翻譯的 Hermes Agent 中文頁面。
推薦閱讀
OpenClaw 龍蝦被收購後?Claude Dispatch 與 AI 自動化優缺點
AI Agent 是什麼?Meta 砸 20 億買 Manus,AI 代理人之戰全解析
MCP 是什麼?AI 巨頭全押注的萬能接口,告別傳統 API
參考資料
NousResearch (2026). “hermes-agent — GitHub Official Repository”
Nous Research (2026). “Quickstart — Hermes Agent Official Documentation”
Nous Research (2026). “User Stories — Real Use Cases from the Hermes Community”
Tom Cuylaerts / i-scoop (2026). “Hermes Agent from Nous Research: self-improving AI agent”
Hacker News (2026). “Hermes Agent — Developer Community Discussion”
FAQ
Hermes Agent 是免費的嗎?需要訂閱嗎?
Hermes Agent 完全免費,MIT 開源授權,你可以自由download、修改、商業使用。你需要自己準備 AI 模型的費用(OpenAI、Anthropic 等 API 用量,或自己的硬體跑 Ollama 本地模型),以及如果你選擇 VPS 部署的伺服器費用(約 $5-10 美元/月)。工具本身不收費。
Hermes Agent 可以在 Windows 上使用嗎?
Windows 原生不支援,但可以透過 WSL2(Windows Subsystem for Linux)安裝使用。在 WSL2 的 Linux 環境裡跑 Hermes 的體驗跟在 Linux 上幾乎一樣。macOS 和 Linux 原生支援,直接跑安裝腳本即可。
Hermes Agent 和 OpenClaw(龍蝦)可以同時使用嗎?
可以。Hermes 提供 OpenAI 相容的 API server(預設 port 8642),Open-WebUI 等介面可以直接連上去,讓你繼續用習慣的前端,後端換成 Hermes 的持久記憶引擎。兩者不衝突,可以依任務選擇用哪一個。
Hermes Agent 的記憶資料存在哪裡?會不會洩漏?
所有記憶資料存在本機的 ~/.hermes/ 資料夾,是純文字的 Markdown 檔,你可以直接查看和編輯。Hermes 沒有任何遙測或資料收集機制,資料完全不離開你的機器。如果選擇本地模型(Ollama),連 AI 推理也在本機完成,隱私保護最完整。
Hermes Agent 怎麼接 Telegram 或 Discord?
Hermes 內建訊息閘道支援,安裝後執行 hermes messaging 設定,選擇對應的平台(Telegram、Discord、Slack、WhatsApp、Signal、Email 都支援),輸入 Bot Token 後即可透過手機訊息跟 Agent 互動,不需要開終端機。語音輸入需要額外安裝:pip install hermes-agent[voice]。
