這本白皮書記錄了百原科技從 2024 年到 2026 年,打造百原 GEO Platform 的完整工程實踐。內容涵蓋一套七維度 AI 引用率評分演算法、一個對 AI Bot 友善的影子文檔(AXP)交付機制、Schema.org 三層實體知識圖、以及一個幻覺自動偵測與修復的閉環系統。
全書共 82 頁、分為 10 章,採 CC BY-NC 4.0 授權公開,任何人都可以免費下載、引用、甚至翻譯(非商業使用)。這篇文章是精華導讀,幫你在 8 分鐘內抓到白皮書的核心骨架 — 如果哪一章打到你的業務痛點,再下載全文深讀。
為什麼要寫這本白皮書
2024 年之後,「使用者想知道某件事」幾乎等同於「使用者會打開 Google」這條假設開始動搖;2025 年底,它正式成為歷史。依據 OpenAI、Perplexity、SimilarWeb 等公開資料,傳統 SERP 的藍色連結點擊率平均下降 34-48%;在醫療、法律、SaaS 這類高資訊密度領域,下降幅度更接近 60%。
換句話說:使用者找到你的入口,正從「10 條藍色連結」遷徙到「一段 AI 生成的答案」。如果你的品牌沒有在那段答案裡出現,你基本上不存在於那位使用者的決策路徑中。
我們累積了一組值得被白皮書化的工程經驗:涵蓋演算法、架構、容錯設計、對 AI Bot 友善的內容交付、結構化實體管理、幻覺自動修復,以及一套在多租戶 SaaS 下可持續運行的資料治理模式。這份白皮書要服務三類讀者:
- B2B 決策者 — 建立「AI 時代品牌可見性」的認知框架,避免 GEO 錯當 SEO 子議題
- 工程主管與架構師 — 借鑑「多 AI Provider 容錯」「訊號連續性」「閉環自動修復」等模式
- 開發者與技術人 — 看到 Schema.org、Cloudflare Worker、pgvector、BullMQ 等工具在真實產品中如何被組裝
第一章精華:GEO 不是 SEO 的延伸,是獨立新學科
很多傳統 SEO 從業者會說「做好 SEO,AI 自然會引用你」— 這句話在 2023 年部分成立,在 2025 年完全失效。原因有兩個:
- AI 的資料來源已不再是 Google 索引的投射。主流 LLM 在預訓練階段消化 Common Crawl、專業出版物、開源知識庫(Wikipedia、Wikidata)以及各家廠商自建的檢索增強資料集。Google 排名在此流程中僅占一小部分訊號,且為間接訊號。
- 結構化資料對 AI 的權重高於對傳統搜尋的權重。AI 理解實體靠的是 Schema.org JSON-LD、Wikidata triples,而不是 H1/H2 與關鍵字密度。
白皮書在第一章用一張對照表,把 SEO 和 GEO 在六個維度的差異講得非常清楚:
一句話界線:SEO 是讓 Google 把你排在第 1 名;GEO 是讓 AI 在生成回答時主動提到你。任何把 GEO 當 SEO 子議題的規劃都會導致資源錯配。
第二章精華:百原 GEO Platform 的閉環系統架構
市場上第一代 GEO 工具多數停留在監測層面:提供儀表板,告訴使用者「你現在幾分」。問題是,監測只是診斷,不是治療。使用者看到低分之後會問:「然後呢?」
百原 GEO 的設計起點,是把整個流程視為一個閉環(Closed Loop)。系統切分為三大模組:
- Scan Module(監測)— 週期性把品牌送去問 AI,把回應抓回來、結構化、評分。覆蓋 15 個 AI 平台(全球 7 + 中文 5 + 搜尋型 3)
- Visibility Module(對外可見性)— 負責讓 AI 更容易認識、引用這個品牌。工具包含 Schema.org JSON-LD 結構化實體、AXP 影子文檔(pure HTML + JSON-LD + Markdown 的「乾淨版內容」)、Cloudflare Worker 注入、GBP 資料整合
- Quality Module(質量保證)— 負責偵測與修復 AI 對品牌的錯誤認知。包含幻覺偵測、ClaimReview 生成、知識庫同步、兩層掃描閉環(哨兵 4h + 完整掃描 24h)
為什麼是這 15 個 AI 平台?因為不同市場的使用者用的不是同一套模型。英文市場以 OpenAI/Anthropic/Google 為主;中文市場實際會接觸到 DeepSeek、Kimi、智譜、文心、通義;搜尋型平台則有 Perplexity、ChatGPT Search、Google AI Overview。只監測英文平台等於對中文市場失明。
第三章精華:七維度 GEO 評分演算法
百原 GEO 的第一版評分(v1)只有一個指標 —Citation Rate(被提及率),計算方法是「被提及次數 ÷ 總查詢次數」。簡單、直覺、可比。然而上線三個月後,我們發現這個單一指標會產生大量誤導相同的案例。
以下兩個真實案例在 v1 下都得到 55 分,但品牌體質完全不同:
- 品牌 A:在 20 個查詢中被提及 11 次,總是被放在回答的末段、以「此外也有⋯」的形式點名;所有提及分布在 OpenAI 與 Anthropic 兩家
- 品牌 B:在 20 個查詢中被提及 11 次,有 8 次出現在回答的第一、二句;分布在 7 個不同 AI 平台,且附帶具體描述
這兩個品牌的實際「被 AI 認知的能量」差距極大,但單一分數會把它們壓成同一個格子。v2 評分把「品牌在 AI 生態的狀態」拆成七個獨立維度:
七個維度分三類權重:
- 重要性(高權重)— Citation Rate、Content Depth:最直接連動「品牌被認識」
- 雜訊敏感度(中權重)— Sentiment、Consistency:容易受單次回應異常影響,刻意降低以避免鋸齒
- 可操控度(中權重)— Platform Breadth、Query Coverage:可被「主動行動」直接改善
白皮書揭露公式骨架與權重分群(高/中/低),但不揭露精確數字。這個決定不是為了保密,是為了防止客戶優化指標而非優化實質 — 如果你知道某一維度佔 30%,你就會砸資源去衝那一維度,結果分數上升但 AI 實際認知卻沒變。我們寧願你專注在「改善整體內容質量」而非「拆解分數權重」。
其餘章節快速索引(Ch4–Ch10)
白皮書其餘章節處理的是更硬核的工程問題,每一章都是實戰踩坑後的設計決策記錄:
- Ch4 — Stale Carry-Forward:當 AI 平台中斷(rate limit、5xx、timeout),訊號怎麼維持連續性?為什麼「直覺解法」全是錯的?
- Ch5 — 多 Provider AI 路由:自研 modelRouter 的雙路徑架構、Model ID 映射、extraParams 差異、重試策略疊陷阱
- Ch6 — AXP 影子文檔:用 Cloudflare Worker 對 AI Bot 服務「乾淨版」內容,與人類使用者看的網站解耦
- Ch7 — Schema.org Phase 1:25 產業特化 @type × 三層 @id 互連知識圖,實體商家 vs 線上服務的欄位權重分歧
- Ch8 — GBP API 整合策略:Google Business Profile 作為實體商家的事實主控源,從事實到對外輸出的單向同步
- Ch9 — Closed-Loop 幻覺偵測與自動修復:從 AI 回應中抽出「關於品牌的聲明」與 Ground Truth 比對、生成 ClaimReview
- Ch10 — Phase 基線測試:不是驗證品牌有多好,而是驗證系統有多可靠
你為什麼會想讀全文?
這份白皮書不是產品宣傳、也不是使用說明,而是一份工程實踐報告:揭露我們為何如此設計、哪些選擇踩過坑、哪些模式可被其他團隊複用。如果你符合以下任一情境,全文 PDF 會是值得投資 90 分鐘閱讀的材料:
- 你是 B2B 品牌決策者,預算投入 AI 行銷但不確定衡量框架
- 你是工程主管,正在評估「自建 GEO 監測系統」vs「採購 SaaS」
- 你是架構師,想了解多 AI Provider 容錯、Schema.org 實體建模的實際取捨
- 你是 GEO / SEO 從業者,想深入一步理解技術底層運作
授權與引用說明
本白皮書採 Creative Commons 姓名標示-非商業性 4.0 國際授權條款(CC BY-NC 4.0)公開,意思是:
- ✓ 你可以自由下載、閱讀、引用、翻譯
- ✓ 你可以在學術論文、部落格、演講中引用內容與圖表(需標示來源:Vincent Lin, 《百原 GEO Platform 技術白皮書》, 百原科技, 2026)
- ✗ 不得用於商業目的再販售或打包成付費產品
- ✗ 不得去除作者與來源標示
如果你希望在商業情境使用(例如內部培訓、商業報告)或需要客製化版本,請透過 聯絡表單與我們聯繫。
作者:Vincent Lin(百原科技技術負責人)|2026-04-18 發布|版本 v1.0
百原科技是一家專注於企業 AI 基礎設施的科技公司,旗下三個產品線:對外品牌曝光的 geo.baiyuan.io(GEO Platform)、對內知識複利的 rag.baiyuan.io(RAG Wiki)、化粧品合規建檔的 pif.baiyuan.io(PIF AI)。