當 Karpathy 提出 LLM Wiki 時,我們已經把它 SaaS 化了 — 談企業知識複利的新架構

Karpathy LLM Wiki 架構與百原 RAG 雙層知識引擎封面圖

一個兩週前才出現的名詞,為什麼你應該關心

2026 年 4 月 4 日,Andrej Karpathy 在 GitHub Gist 上發表了一篇看起來很低調的技術筆記,標題只有三個字:LLM Wiki

如果你不認識 Karpathy,簡單說明:他是 OpenAI 創辦團隊的核心成員、Tesla 前 AI 總監,在 AI 技術圈有近乎宗師級的影響力。這篇 Gist 發表不到兩週,就累積超過 5,000 個 star、4,400 個 fork,GitHub、Medium、Zenn、Qiita、日本韓國的技術圈全部瘋傳。各家大廠的 AI 工程師,都在討論這個「可能是比 RAG 更好的新架構」。

這篇文章想告訴企業決策者三件事:

第一,LLM Wiki 不只是技術話題,它背後的商業邏輯叫「知識複利」,可能是接下來 5 年決定企業 AI 投資報酬率的核心概念。

第二,Karpathy 提出的是「架構想法」,不是可以直接買來用的產品,他自己都在 Gist 裡說「這是想法不是實作」。

第三,百原科技在 rag.baiyuan.io 推出的 LLM Wiki + RAG 雙層知識引擎,是目前市場上最完整呼應這個架構的 SaaS 產品 — 而且解決了 Karpathy 原始架構的幾個關鍵缺陷。

如果你是企業 CEO、行銷長、或 AI 轉型的推動者,接下來的內容值得細讀。因為這不只是技術選型問題,而是你公司未來每年花出去的 AI 預算,是在「燒錢」還是在「投資」

第一部分:為什麼 AI 投資很容易變成「折舊」而非「複利」

先講一個台灣企業常見的場景。

某家中型專業服務公司,過去五年累積了大量專業知識:客戶案例報告、產業分析、內部培訓教材、客服問答紀錄、產品規格文件、法遵指南。保守估計超過 10,000 份文件,這是公司最值錢的智慧資產之一。

2024 年,公司開始導入 AI 工具 — 給員工用 ChatGPT Enterprise、接 Copilot、甚至上了一個 RAG 系統把內部文件餵給 AI。一年過去,內部使用率有了,但有兩件事變得很尷尬:

第一件尷尬的事:當員工問 AI「我們公司過去三年最成功的醫療業客戶案例是什麼?可以幫我整理成提案用的 case study 嗎?」AI 確實會根據上傳的文件回答,但每次回答都從零開始,像是新來的實習生第一天讀所有檔案。它找到幾個相關段落、拼湊出答案,然後答案就消失在對話紀錄裡,下一次有人問類似問題,AI 還是從頭再來一次。

第二件尷尬的事:這家公司用 AI 這一整年,累積了無數次高品質的問答 — 員工用 AI 整理資料、解釋複雜條款、對比產品差異、總結會議重點。但當員工離開公司、專案結束、或 AI 對話被刪除,所有這些智慧累積瞬間歸零。公司付費使用 AI,得到的是一次性的答案,而不是可累積的資產。

這就是 Karpathy 在 LLM Wiki 提案中,一針見血指出的問題:傳統 RAG 讓 LLM 在每次查詢時重新發現知識,沒有任何累積。你的 AI 用得再久、問得再頻繁,知識沒有複利,只有折舊。

知識複利的商業意義

「複利」這個詞來自金融 — 愛因斯坦說過人類最偉大的發明是複利。把這個概念套用到企業知識管理,意思是:

每一次 AI 被使用,都應該讓整個知識庫變得更好,而不是只產出一個用完即丟的答案。

這件事做好與做壞的差異,3 年後會非常驚人:

  • 做壞的公司:每年投入 X 元在 AI,每年產出的知識價值 = X 元(持平折舊)
  • 做好的公司:每年投入 X 元在 AI,知識資產累積成 1.3X、1.7X、2.2X...(指數成長)
知識複利 vs 知識折舊:早期採用 LLM Wiki 架構的企業三年後累積差異
做對架構選擇:每年同樣預算,一邊在複利,一邊在折舊

同樣的預算,一邊在折舊,一邊在複利。這才是為什麼 CEO 應該認真看待 LLM Wiki 這個概念,而不是把它當成工程師的技術玩具。

第二部分:Karpathy 的 LLM Wiki 架構在說什麼

Karpathy 的原始提案,核心只有一個動作:不要讓 LLM 每次從 raw 文件去檢索答案,而是讓 LLM 先把 raw 文件「編譯」成一個持續成長、相互連結的結構化知識庫 — 這個知識庫就叫 LLM Wiki

他把架構拆成三層:

第一層:Raw Sources(原始資料層) — 不可變的原始文件,像是公司的年報、合約、客戶會議紀錄、產品規格、客服對話紀錄等。這一層是事實來源,LLM 只讀不寫。

第二層:Wiki(知識層) — LLM 把 raw sources 讀進來之後,編譯出來的結構化 Markdown 文件。每個重要概念、實體、主題都有獨立的頁面,頁面之間有 Wiki-style 的雙向連結,整個 Wiki 形成一張知識圖。這一層由 LLM 自己維護 — 當有新 raw source 進來,LLM 不只是把它索引存起來等下次檢索,而是讀懂後整合進現有 Wiki,可能更新 10-15 個相關頁面、補充新連結、標註和舊資料的衝突。

第三層:Schema(規範層) — 一份告訴 LLM「這個 Wiki 怎麼組織、有哪些規則、每種頁面該怎麼寫」的設定檔。這一層讓 LLM 不會每次亂寫,而是像一個有紀律的 Wiki 維護者。

Karpathy LLM Wiki 三層架構:Raw Sources、Wiki、Schema
Karpathy 原始提案的三層架構:Raw Sources、Wiki、Schema

然後三個操作循環:

  • Ingest(攝入):新資料進來時,LLM 閱讀、摘要、更新相關頁面、補充交叉引用
  • Query(查詢):問問題時,LLM 先讀 Wiki(不是 raw sources),快速給出答案。關鍵是:好的答案會被 file-back 寫回 Wiki,成為新頁面
  • Lint(健檢):LLM 定期掃描整個 Wiki,找出矛盾、過時、孤立、缺失的頁面,主動修正
LLM Wiki 三個核心操作:Ingest、Query、Lint 循環
Ingest / Query / Lint 三個操作循環,帶動知識累積效應

這套架構最迷人的地方是它的累積效應:每一次 ingest 讓 Wiki 更豐富、每一次 query 讓 Wiki 更完整、每一次 lint 讓 Wiki 更一致。用得越多,變得越聰明 — 這就是「知識複利」在技術層面的具體實現。

Karpathy 自己用這個架構做了一個研究用的 Wiki,大約 100 篇文章、40 萬字,規模不大但效果顯著。他在 Gist 最後寫了一句很值得琢磨的話:「這裡面有巨大的產品空間,而不只是一堆臨時腳本的組合。」

這句話,正是百原科技過去一年在做的事。

第三部分:從「想法」到「可用產品」之間,有六個關鍵差距

Karpathy 的 Gist 發表後,GitHub 評論區出現了大量技術圈的批評聲浪,其中最尖銳的幾個點,剛好暴露出「個人研究用的原型」與「企業可用的產品」之間的巨大鴻溝。

Karpathy 原始架構到企業級產品之間的六個關鍵差距
六個差距:規模、權限、人類審核、整合、多模態、對外 AI 曝光

差距一:規模化問題

Karpathy 自己承認他的 Wiki 規模約 100 篇文章。GitHub 評論區也有多位工程師實測後回報,這個架構的「甜蜜點」大約在 100-200 頁,超過後 LLM 掃描 index 的效率會顯著下降

對一個「個人研究助理」來說這沒問題,對企業來說卻是致命傷。一家中型公司的知識庫輕鬆就超過 10,000 份文件。純 Markdown + 沒有向量資料庫的架構,根本撐不住企業級負載。

差距二:權限與安全

Karpathy 的架構是 git repo + local markdown,適合個人或小團隊。企業場景下需要處理:

  • 多部門、多角色的權限隔離(業務部門不該看到 HR 機密文件)
  • 多租戶(代理商服務多客戶時,不能讓客戶 A 的資料污染客戶 B)
  • 合規需求(PDPA、GDPR、金融業、醫療業各自的法規)
  • 稽核軌跡(誰、什麼時候、讀了什麼、改了什麼)

純 Markdown 無法優雅處理這些,必須有完整的後端系統。

差距三:人類審核與可控性

批評者最強的一個論點是:LLM 寫 Wiki 的過程中會產生幻覺,錯誤會被「百科全書化」 — 看起來權威,但是錯的

Karpathy 自己也承認,他每次 ingest 都要 babysit(盯著看、給指導),並非真正零維護。個人研究可以這樣,企業級應用則必須有明確的人類審核流程、校對機制、版本比對。

差距四:與既有知識系統的整合

企業不會從零開始建知識庫。他們有 SharePoint、Confluence、Notion、Google Workspace、ERP、CRM、客服系統。能不能快速接上這些資料源,而不要求客戶把所有資料搬家?Karpathy 的架構預設是 Obsidian + 本地 markdown,企業環境完全無法套用

差距五:多模態資料

企業資料不只有文字。規格書有圖表、產品手冊有示意圖、會議錄音有音檔、客戶提供的 PDF 有掃描頁。純 markdown 的 Wiki 處理這些能力有限。

差距六:與 AI 搜尋生態的連結

最關鍵的一點 — LLM Wiki 本身解決了「對內」的知識管理,但企業還需要「對外」的曝光:ChatGPT、Claude、Gemini、Perplexity 被問到你的產業問題時,你的品牌有沒有被引用?這就是 GEO(生成式引擎優化)的戰場,需要跟 LLM Wiki 聯動,形成完整的「知識進、曝光出」閉環。

這六個差距,每一個都不是小工程師幾個週末能補起來的。它需要一個專門的團隊、一整套後端基礎設施、以及對企業場景的深刻理解。這也是為什麼 rag.baiyuan.io 這個產品會存在

第四部分:rag.baiyuan.io 做了什麼

百原科技在 rag.baiyuan.io 推出的產品,核心 slogan 是「會自己成長學習的知識庫 LLM Wiki」,產品定位是「LLM Wiki + RAG 雙層智慧知識引擎」。

這兩句話背後,其實是把 Karpathy 的想法變成企業可用產品的工程結晶。我們來拆解看看:

設計決策一:LLM Wiki + RAG 雙層,而不是擇一

這是百原最重要的架構決策。

Karpathy 的原始提案,隱隱有「用 LLM Wiki 取代 RAG」的傾向(Gist 開頭就在對比兩者)。但純 LLM Wiki 有規模上限,純 RAG 又沒有複利效應。最優解是雙層並用

  • LLM Wiki 層:處理結構化、概念化、可累積的高品質知識(類似「編輯好的百科全書」)
  • RAG 層:處理大規模、即時、細粒度的原始文件檢索(類似「倉庫索引」)
三種架構比較:純 RAG、純 LLM Wiki、百原雙層引擎
純 RAG vs 純 LLM Wiki vs 百原雙層引擎:三種路線的根本差異

當 AI 被問問題時,先查 Wiki(快速、結構化、已編譯),Wiki 不足的細節才下鑽到 RAG 層撈原始文件。這樣既有 Wiki 的複利累積,又有 RAG 的海量搜索能力。

這也是為什麼百原的產品名稱特別強調「雙層智慧知識引擎」 — 這不是行銷話術,是技術架構上的本質選擇。

設計決策二:SaaS 多租戶,而非個人 markdown repo

Karpathy 的提案是個人 git repo,百原做的是多租戶 SaaS。這個決策解決了前面講的「差距二」 — 權限、租戶隔離、合規稽核全部內建。

這意味著:

  • 代理商可以用同一個平台服務多個客戶,資料完全隔離
  • 企業內部可以按部門、角色設定不同的 Wiki 可見性
  • PDPA、GDPR 合規是平台原生能力,不是事後補丁
  • 所有 LLM 對 Wiki 的修改都有版本紀錄,可回溯、可審查

設計決策三:自己成長,但人類可以介入

百原的產品強調「會自己成長學習」,但不強迫自動化。這直接回應前面「差距三」的質疑。

具體來說:

  • Ingest 時,LLM 寫 Wiki,但人類可以審核、修改、鎖定(locked)特定頁面
  • Query 時,LLM 可以 file-back 優質答案,但由人類決定是否納入 Wiki
  • Lint 時,LLM 主動提醒矛盾與過時,但修改需要人類核准

這樣的設計既保留了「複利累積」的本質,又避免了「LLM 幻覺百科全書化」的風險。

設計決策四:與企業既有系統整合

純 Obsidian 本地 markdown 在企業場景用不動,rag.baiyuan.io 的產品定位是「企業 AI 知識管理平台」,從第一天就設計成可以對接企業既有資料源的 SaaS。

設計決策五:與 geo.baiyuan.io 形成完整生態

這是百原最獨特的戰略位置。

市面上做 RAG 的不少,做 GEO 的也不少,但同時擁有對內知識引擎(RAG Wiki)和對外曝光引擎(GEO Platform)的完整生態,目前極少。

百原雙生態:對內 RAG Wiki 知識複利 + 對外 GEO Platform 品牌曝光
百原雙生態:對內 RAG Wiki 累積知識,對外 GEO 放大品牌可見度

兩個產品的分工與互補關係是這樣的:

層面 geo.baiyuan.io(GEO 平台) rag.baiyuan.io(RAG Wiki)
主要戰場品牌在外部 AI 的曝光度企業內部的知識複利
目標 AIChatGPT、Claude、Gemini、Perplexity、AI Overviews企業自己選擇的 LLM(可私有部署)
核心產出AXP 子域、llms.txt、Schema.org 結構化資料LLM Wiki、RAG 向量庫、答案 file-back
測量指標AI 引用率、多平台一致率知識覆蓋率、問答滿意度、Wiki 成長率
商業價值獲客、品牌可見度內部效率、知識資產

同一家企業可以同時使用兩個產品,也可以只選一個。但對有野心的企業來說,兩個搭配使用會產生 1+1 > 2 的綜效 — 對內累積的高品質知識(RAG Wiki),可以被挑選、結構化後輸出到對外的 AXP 層(GEO),讓 AI 引用的內容質量大幅提升。

第五部分:對 CEO/行銷長,這在商業上意味著什麼

技術講完了,回到商業語言。你的企業為什麼應該現在就把 LLM Wiki + RAG 雙層架構納入 2026 年的 AI 投資規劃?

理由一:知識資產的折舊正在加速

AI 進入企業越深,「一次性答案」的浪費就越明顯。每一次員工用 AI 問問題、每一次客戶對話被 AI 摘要、每一次會議被 AI 總結 — 如果這些價值沒有被「捕捉、編譯、累積」進一個持續成長的知識庫,它們都會隨著對話視窗關閉而蒸發。

你現在不決定,知識資產的折舊速度只會越來越快。

理由二:時機視窗正好

LLM Wiki 這個架構理論,是 2026 年 4 月才被業界正式提出;百原的雙層引擎產品,正好在這個時機點成熟上線。

台灣企業 LLM Wiki 採用時機視窗:2026 年 Karpathy 提案與百原產品成熟交會點
時機視窗:理論與本土 SaaS 產品同步成熟的罕見時間點

這意味著台灣企業現在有一個非常罕見的視窗 — 在一個剛形成的技術典範上,不必等歐美市場驗證完再追,可以直接採用一個本土就已經把它工程化、產品化、SaaS 化的方案。這個視窗在過去十年的技術潮流裡(雲端、容器、機器學習),台灣企業普遍都晚了 2-3 年才跟上。這次不同。

理由三:採用成本與轉換成本呈反比

越早採用 LLM Wiki 架構,越早開始累積 Wiki 資產,複利效應就越早啟動。

三年後的情況會是這樣:

  • 早期採用者:Wiki 已累積 3 年、數千個結構化知識頁面、跨部門連結已成熟、AI 對公司脈絡的理解深度遠超通用模型。要轉換到其他平台,轉換成本極高(因為資產龐大),但平台鎖定同時也是競爭對手極難追趕的護城河
  • 觀望者:三年後才開始建置,面對一個已經被競爭對手用 3 年時間拉開差距的知識複利曲線。就算買同樣的產品,也買不回失去的三年。

理由四:與 GEO 雙軌是完整戰略

前面提過,對外用 GEO、對內用 RAG Wiki,是 2026-2028 年企業 AI 戰略的完整架構。

對外 GEO 讓你被 AI 看見、被 AI 推薦、被 AI 引用 — 影響的是獲客效率

對內 RAG Wiki 讓你的員工用 AI 時真正用到公司脈絡、讓每次 AI 互動累積成知識複利 — 影響的是營運效率

兩者都做,是戰略完整性。只做一個,會有明顯的戰略缺口。

第六部分:常見誤解與釐清

誤解一:「這不就是更貴的 Notion AI 或 Confluence + AI 嗎?」

不是。Notion AI 或 Confluence 的 AI 功能,本質是「在既有頁面上提供 AI 輔助寫作」 — 人寫、AI 幫潤飾。

LLM Wiki 的核心是「LLM 寫、人類審核」 — 角色完全相反。它不是替既有 Wiki 加 AI 功能,而是讓 AI 成為 Wiki 的主要維護者,人類從「每天寫文件」變成「策展、提問、監督」。

這是兩種完全不同的產品邏輯。

誤解二:「我們公司 AI 用量不大,不需要」

這個誤解來自把 LLM Wiki 當成「AI 額外工具」。實際上,它是「AI 投資的倍增器」。

假設你公司 AI 用量真的很小,每月只花一萬元在 AI 工具上。但這一萬元的價值是「用完即丟」還是「累積成資產」,差別會隨著時間呈指數擴大。真正的問題不是用量大小,而是 你有沒有讓每一塊錢的 AI 投入產生複利

誤解三:「等 ChatGPT 自己進化出這功能就好了」

ChatGPT、Claude、Gemini 各自的「記憶」功能,未來一定會強化。但它們有幾個無法跨越的限制:

  • 你的資料會變成 OpenAI/Anthropic/Google 的資產,而不是你的企業資產
  • 無法多租戶隔離 — 你的員工 A 和員工 B 使用同一個 ChatGPT 企業帳戶,他們接觸的知識是否該有不同權限?
  • 無法深度整合你的系統 — 你的 ERP、CRM、內部資料庫如何對接?
  • 無法法規合規 — 資料流向、儲存位置、刪除義務都受制於外商平台

一個獨立的、企業擁有的、可私有部署的 RAG Wiki,是戰略主權問題,不是工具選擇問題。

誤解四:「我們沒有 AI 工程師,做不了」

這正是百原做 SaaS 的理由。rag.baiyuan.io 的產品設計上,不要求客戶有 AI 工程師團隊。

  • 後端架構(向量資料庫、LLM 整合、RAG 管線)是平台內建
  • Wiki 結構設計由平台預設模板提供,企業只需微調
  • 人類審核介面設計得讓一般內容/法遵/營運人員也能操作
  • 資料接入支援常見企業系統(Google Drive、SharePoint、Notion、Slack 等)

企業要做的,是「決定哪些知識要進來、誰可以看、如何使用」— 這些是業務決策,不是技術實作。

第七部分:怎麼開始?

如果你看到這裡,覺得這件事值得啟動,建議以下三步驟:

企業導入 LLM Wiki 三步驟路線圖:盤點、試點、衡量
企業導入路線圖:盤點 → 試點 → 衡量複利曲線

步驟一:盤點現有知識資產(1-2 週)

不需要找 AI 顧問,先內部做一次簡單盤點:

  • 公司過去 3-5 年累積的關鍵文件大概有多少?分散在哪些系統?
  • 員工平常需要問 AI 的問題,主要集中在哪些類別(產品、法遵、流程、技術)?
  • 哪 10% 的內部知識,如果被結構化、可被 AI 隨時引用,會對營運效率產生最大影響?

這個盤點不需要完美,只需要讓你對「啟動後前 90 天要處理什麼」有初步輪廓。

步驟二:試點範圍(30 天)

不要一開始就想把整個公司的知識搬進 LLM Wiki。建議選一個明確有痛點、範圍有限、容易看到成效的試點:

  • 某條產品線的所有規格、FAQ、客戶常見問題(幫業務與客服用)
  • 某個高複雜度的內部流程(像是跨國稅務、特定產業合規)
  • 某個新入職員工培訓常需要的知識庫

試點範圍建議落在 100-500 份文件之間。這個規模足夠驗證成效,又不會因為資料量太大而拖慢啟動速度。

步驟三:衡量複利曲線(3-6 個月)

啟動後的關鍵是看得到複利效應。建議追蹤幾個指標:

  • Wiki 頁面數量增長曲線(不是越多越好,而是看成長速度與成熟度)
  • 跨頁面連結密度(代表知識網絡的豐富度)
  • 員工 AI 問答的答案準確率與滿意度(對照試點前基線)
  • File-back 率(多少優質 AI 問答被寫回 Wiki 成為新資產)
LLM Wiki 知識複利追蹤儀表板:Wiki 頁面、連結密度、File-back 率、滿意度
複利追蹤儀表板:把「知識複利」從抽象概念變成可觀察的指標

如果 3-6 個月後,這些指標呈穩定向上曲線,恭喜你 — 你的 AI 投資已經從折舊模式切換到複利模式了。

結語:一個時代的轉折點

過去 30 年,企業累積知識的方式有幾次典範轉移:紙本檔案 → 本機電腦 → 網路磁碟 → 雲端文件 → SaaS 知識庫。

每一次轉移,先動手的企業都享有接下來 5-10 年的營運效率優勢。現在 LLM Wiki + RAG 雙層架構,可能是下一次這樣級別的轉移 — 而且這次的複利效應,會比過去任何一次都還要顯著,因為知識本身會「主動成長」,而不是等著被人寫。

Karpathy 提出概念、百原把它工程化成可用的 SaaS。企業要做的決定,只剩一個:你希望 2029 年的自己,是過去三年讓知識資產在複利成長,還是在折舊?

如果答案是前者,我們建議你現在就開始盤點、試點、衡量。這條路需要時間,早啟動 6 個月,三年後的差距會很明顯。


本文由百原科技有限公司(Baiyuan Technology Co., Ltd.)技術團隊撰寫。百原科技提供企業 AI 時代的完整解決方案,包含對外的生成式引擎優化(GEO)與對內的知識複利引擎(RAG Wiki),協助企業在 AI 典範轉移中建立可持續的競爭優勢。

本文發表於 2026 年 4 月,Karpathy 原始 LLM Wiki Gist 發表於 2026 年 4 月 4 日。

← 回到部落格