AI 時代的個人知識庫:Obsidian、RAG 與 Agent 該怎麼分工?
Obsidian、RAG 與 AI Agent 常被放在一起討論,但它們其實負責不同任務。Obsidian 適合保存筆記,RAG 負責找出相關內容,Agent 則把資料整理成大綱、草稿或可執行的工作流。這篇文章從個人知識管理的角度,拆解 AI 時代的知識庫該如何從收藏系統變成產出系統。
以前談個人知識管理,很多人關心的是「怎麼把東西記下來」。
用什麼筆記軟體?要不要做雙向連結?資料夾怎麼分類?標籤怎麼設計?這些問題都很重要,但當筆記累積到一定數量之後,真正麻煩的通常不是記錄,而是重新取用。
你知道自己以前寫過某個想法,但找不到。
你記得某篇文章提過一個概念,但忘了放在哪裡。
你想寫一篇文章,結果需要翻十幾篇舊筆記、剪貼、整理、重組,最後反而卡在準備工作。
AI 出現之後,這個問題變得更有趣。
我們開始可以讓模型幫忙摘要、整理、改寫,甚至產生草稿。但如果只是把一大堆筆記丟給聊天機器人,得到的常常不是更好的知識工作流,而是一段看起來很完整、實際上不知道根據哪裡來的回答。
所以問題不是「要不要用 AI 管理筆記」。
問題是:
Obsidian、RAG 和 AI Agent 各自應該負責什麼?
如果分工不清楚,最後很容易變成三種混亂疊在一起:
- Obsidian 裡的筆記沒有結構
- RAG 找到的資料不夠準
- Agent 很努力產出內容,但你不知道它根據什麼寫出來
我比較喜歡把它們想成一套工作系統,而不是單一工具。
- Obsidian:保存知識
- RAG:找出相關內容
- Agent:整理、重組、產出
- CLI / Local workflow:把流程固定下來
這樣看,事情會清楚很多。
Obsidian 負責保存,不該負責全部
Obsidian 很適合當個人知識庫的底層。
它使用 Markdown,檔案存在本機,不太綁平台。你可以用資料夾整理,也可以用雙向連結建立脈絡。更重要的是,這些筆記不是被鎖在某個服務裡,而是你可以直接打開、搬移、搜尋、備份的一堆文字檔。
這件事在 AI 工作流裡很重要。
因為只要資料是一般檔案,就可以被其他工具讀取。CLI 可以處理它,搜尋工具可以索引它,Agent 也可以直接操作它。
但 Obsidian 本身不應該負責所有事情。
它不是資料庫,也不是自動化系統。它可以讓人閱讀和編輯筆記,但不會自動幫你判斷哪些內容可以合併,哪些內容可以變成文章,哪些舊筆記其實已經過期。
更麻煩的是,如果 vault 本身很亂,AI 只會把混亂放大。
例如:note1.md、new.md、untitle.md、想法.md
這種命名方式,人類自己過幾個月都不一定看得懂,更不用說要讓 Agent 穩定處理。
所以在談 RAG 或 Agent 之前,Obsidian vault 本身至少要有基本結構。
不一定要很複雜,但要穩定。
例如:
vault/├─ inbox/├─ notes/├─ refs/├─ drafts/├─ projects/├─ meetings/└─ templates/每個資料夾的用途要清楚:
inbox/放還沒整理的零散內容notes/放長期保存的知識筆記refs/放外部文章、書籍、資料來源drafts/放文章草稿projects/放專案相關筆記meetings/放會議紀錄templates/放固定格式
Frontmatter 也最好維持一致。
---title: RAG 與個人知識庫created: 2026-05-28tags: - rag - obsidian - ai-agentstatus: draft---這些東西看起來很瑣碎,但它們是後面工作流能不能穩定的基礎。
Obsidian 的價值不是自動化,而是讓知識保持可讀、可改、可長期保存。
RAG 負責查到正確資料
RAG 的全名是 Retrieval-Augmented Generation,中文通常翻成檢索增強生成。
名字聽起來很大,但放在個人知識庫裡,它做的事情其實很直覺:
先查資料,再讓 AI 回答。
這解決的是 LLM 很常見的一個問題:模型很會生成文字,但不一定知道你的資料。
如果你問模型「我之前寫過哪些關於 Obsidian 的想法?」它不可能憑空知道你的 vault 裡有什麼。除非你把相關內容提供給它,否則它只能猜。
RAG 的角色就是補上這一段。
大致流程會像這樣:
1. 將筆記切成 chunks2. 用 embedding 模型把文字轉成向量3. 儲存到向量資料庫或索引中4. 查詢時,把問題也轉成向量5. 找出語意上最接近的筆記片段6. 把這些片段交給 LLM 生成回答這裡最重要的不是「用了多厲害的模型」,而是檢索結果有沒有找對東西。
如果 RAG 找到的內容不相關,後面的 LLM 寫得再流暢也沒有用。它只是把錯的上下文包裝得比較像答案。
對個人知識庫來說,RAG 最大的價值不是讓 AI 變聰明,而是讓 AI 少一點亂猜。
例如你想寫一篇關於「AI 筆記工作流」的文章,RAG 可以先幫你找出:
- 你以前寫過的 Obsidian 筆記
- 關於 RAG 的技術整理
- 你保存過的外部文章摘錄
- 相關專案中的決策紀錄
- 曾經寫到一半的草稿
這些資料被找出來之後,Agent 才有東西可以操作。
沒有 RAG 的 Agent 很容易變成單純的聊天機器人。
有 RAG 的 Agent 才比較像是在你的資料上工作。
但 RAG 也不是魔法。
它很吃幾個前置條件:
- 筆記切分方式是否合理
- 每個 chunk 是否保留足夠上下文
- metadata 是否有標題、日期、標籤、來源
- 查詢語句是否清楚
- 檢索結果是否需要 rerank
- 過期筆記是否仍然被搜出來
所以 RAG 不是裝上去就好。它比較像是給知識庫加上一層語意搜尋能力。
搜尋變好了,但內容本身還是要整理。
Agent 負責把資料變成行動
如果說 RAG 是「找資料」,Agent 就是「用資料做事」。
這是兩者最重要的差別。
RAG 找出相關筆記,然後呢?
如果最後還是要你自己一篇篇打開、複製、貼上、整理,那它只是比較聰明的搜尋。
Agent 的價值在於它可以執行多步驟任務。
例如:
1. 搜尋和某個主題相關的筆記2. 讀取這些筆記3. 整理出共同觀點4. 找出重複或矛盾的地方5. 產生文章大綱6. 寫入 drafts/7. 等人類最後編輯這裡的關鍵不是「AI 幫我寫文章」,而是「AI 幫我處理寫作前最耗力的整理工作」。
以部落格寫作來說,Agent 很適合做這些事:
- 從舊筆記中整理主題
- 把零散想法變成大綱
- 根據既有文章風格產生初稿
- 補上可延伸閱讀的內部連結
- 檢查文章是否有重複段落
- 幫草稿補 frontmatter
- 把會議紀錄整理成可追蹤的 action items
但它不適合完全接管判斷。
我不會讓 Agent 自動決定哪些筆記應該刪除,也不會讓它直接把一批舊文章全部改寫後覆蓋。這些事情太容易出問題,而且錯了不一定馬上看得出來。
比較安全的方式是讓 Agent 產生新檔案,而不是直接覆蓋原始資料。
例如:
notes/obsidian-ai-workflow.mdrefs/rag-embedding-notes.mdrefs/local-first-ai.md
↓ Agent 整理
drafts/ai-personal-knowledge-base-outline.md這樣原始筆記還在,AI 輸出也可以檢查。你可以接受、修改,或整份刪掉。
Agent 應該像一個能幫你整理書桌的人,而不是一個可以自己丟掉你所有文件的人。
CLI 讓流程變得可重複
只用聊天介面操作 AI,常常會有一個問題:流程很難重複。
今天你貼了三篇筆記,請 AI 整理成大綱。
明天你又貼了五篇,請它照昨天的方式處理。
過幾天你忘了 prompt 怎麼寫,輸出格式又變了。
如果只是偶爾使用,這沒什麼問題。
但如果你想把它變成長期工作流,就需要更固定的流程。
這時候 CLI 或本機腳本就很有用。
你可以把任務拆成幾個明確步驟:
read → retrieve → transform → write → review例如一個「產生文章草稿」的流程可能是:
1. 從 notes/ 和 refs/ 搜尋主題2. 找出最相關的 10 個片段3. 將片段整理成文章大綱4. 根據大綱產生初稿5. 寫入 drafts/6. 保留來源引用,方便人工檢查這樣做的好處是,每一步都可以被檢查。
如果結果不好,你可以知道問題在哪裡:
- 是資料找錯?
- 是 chunk 太小?
- 是 prompt 寫得不清楚?
- 是 Agent 寫作風格太平?
- 是原始筆記本來就不夠完整?
工作流一旦拆開,就比較容易修。
這也是我覺得 local-first workflow 很有吸引力的地方。它不是把所有東西都交給某個雲端服務,而是讓資料、流程和輸出都盡量留在自己可控的環境中。
一個最小可行的個人知識工作流
如果要從零開始,不需要一開始就做完整 RAG 系統,也不需要馬上接很多 Agent 工具。
可以先從一個很小的流程開始。
例如:把零散筆記整理成文章大綱。
1. 先整理資料夾
vault/├─ inbox/├─ notes/├─ refs/└─ drafts/先不用太多分類。能穩定使用比較重要。
2. 統一筆記格式
每篇筆記至少有標題、日期、標籤、狀態。
---title: AI agent 與筆記整理created: 2026-05-28tags: - ai-agent - obsidianstatus: note---3. 把原始想法放進 inbox
不要急著整理。先收集。
inbox/2026-05-28-ai-writing-ideas.mdinbox/2026-05-28-rag-notes.md4. 定期整理成 notes 或 refs
自己判斷哪些是長期有用的想法,哪些只是暫時資料。
notes/personal-knowledge-base.mdrefs/rag-retrieval-notes.md5. 讓 Agent 產生草稿
任務可以寫得很具體:
請讀取 notes/ 和 refs/ 中與 "AI 個人知識庫" 相關的筆記,整理出一篇部落格文章大綱,輸出到 drafts/ai-personal-knowledge-base.md。
請保留引用到的來源筆記檔名,不要修改原始筆記。這裡有幾個重點:
- 指定讀取範圍
- 指定輸出位置
- 要求保留來源
- 明確禁止修改原始筆記
這樣 Agent 比較不會亂跑。
6. 人類最後編輯
最後一步還是要回到人。
AI 可以整理資料,但文章裡真正重要的通常是你的判斷:
- 哪個觀點你認同?
- 哪個工具你用起來其實不順?
- 哪些流程看起來很美,但實際上很難維持?
- 哪些限制你踩過坑?
這些東西 AI 可以模仿,但最好不要讓它憑空發明。
不要把所有事情都交給 AI
AI 很適合處理文字工作,但不是所有文字工作都該交給它。
尤其是個人知識庫,裡面的東西通常很雜。有些是公開資料,有些是私人想法,有些可能包含工作內容、客戶資訊、會議紀錄或尚未整理的判斷。
幾件事我會特別避免:
不要讓 AI 自動刪筆記
刪除是不可逆的知識管理動作。
AI 可以建議哪些筆記可能重複,或哪些內容可能已經過期,但最後要不要刪,最好還是自己決定。
比較安全的做法是:
archive/先歸檔,不要直接刪。
不要讓 AI 決定最終觀點
AI 很會把資料整理成看似平衡的說法,但文章真正有價值的地方常常不是平衡,而是取捨。
你可以讓 AI 幫忙列出不同觀點,但最後應該由你決定文章要站在哪裡。
不要讓 AI 把未確認內容寫成事實
這在草稿裡很常見。
例如 AI 可能會把「我猜這可能跟效能有關」改成「這會導致效能問題」。
語氣變得更肯定,但事實基礎沒有變多。
所以最好在 prompt 裡要求它區分:
- 已確認事實
- 推測
- 待查證
- 個人觀點
不要讓 AI 大規模覆蓋 vault
批次修改很誘人,但也很危險。
尤其是 frontmatter、標籤、連結這些東西,一次改錯可能會讓整個 vault 的結構變得很難追。
我比較建議 Agent 先輸出修改建議,或產生 patch,再由人確認。
不要忽略資料隱私
如果筆記裡有敏感資料,就要想清楚模型在哪裡執行。
本機模型、雲端模型、公司內部模型,風險不一樣。不是所有內容都適合送出去。
知識庫會從收藏系統變成產出系統
過去建立個人知識庫,常常像是在建立一個收藏系統。
看到好文章,存起來。
想到好句子,記下來。
讀到有用的概念,放進筆記。
這些都沒錯,但收藏本身不會自動變成產出。
AI Agent 出現之後,個人知識庫開始有另一種可能:它不只是保存資訊,而是可以被查詢、整理、重組,最後變成文章、簡報、決策紀錄或專案文件。
但前提是分工要清楚。
Obsidian 負責保存。
RAG 負責檢索。
Agent 負責操作。
CLI 或固定流程負責讓這件事可以重複。
如果這幾層混在一起,很容易變成一套看起來很先進、實際上很難維護的系統。
我現在比較相信的方向是:先不要追求全自動。
先讓 AI 幫你完成一個小任務就好。
例如:
把三篇舊筆記整理成一篇文章大綱。如果這件事穩定,再往下做:
把一週的 inbox 整理成 notes。再更進一步:
從 notes 和 refs 產生草稿。個人知識庫不需要一開始就變成完整的 AI 系統。
它可以從一個資料夾、一種筆記、一個流程開始。
重點不是讓 AI 替你思考,而是讓你過去累積的知識更容易被重新使用。
這可能才是 AI 對個人知識管理最實際的幫助。
相關文章
把模糊想法變成可執行工作:我的 Supekku Workflow 設計
AI Agent 協作的問題不只是 prompt,而是脈絡如何被保存。Supekku Workflow 是我用來把模糊想法整理成可執行工作的方式:先透過對話釐清意圖、範圍與成功標準,再把需要保存的內容轉成 proposal、criteria、reasoning、actions 與 verification。
讓 AI 學會查資料:RAG 與 Embedding 技術解析
當 AI 不再只靠訓練記憶回答問題,而是能即時從你的資料中檢索再生成,這就是 RAG(檢索增強生成)的核心概念。本文從 Embedding 向量化到 Cosine Similarity 相似度計算,完整拆解 RAG 的運作原理與實務要點。
搜尋引擎的下一次進化:GEO (生成式引擎優化)
在 AI 驅動的時代,傳統 SEO 的「藍色連結」正在失去光環。隨著 ChatGPT、Google AI Overviews、Perplexity 與 Bing Copilot 的崛起,使用者不再點擊網站,而是直接向 AI 要答案。
用 Slidev 把 Markdown 變成簡報網站
用 Slidev 把 Markdown 變成簡報網站,從建立專案、自訂樣式到部署上線的完整流程與踩坑紀錄。
用 LQIP 讓圖片載入不再跳來跳去
用 LQIP 技術搭配三層圖片載入策略,讓照片牆從進場到開啟大圖的每個階段都不會出現空白或版面跳動。
