AI 搜索优化审计的第一步不是写文章,而是建立 Phase 0 基线。
很多团队上来就开始改官网、铺内容,但不知道改完了到底有没有用,也不知道下一步该往哪个方向加力。原因是没有 T0 基线,没有数据可以对比。
一、Phase 0 审计要记什么
核心不是"AI 回答好不好看",而是记录可复盘的数据。
每个长尾词跑一遍 AI 平台后,至少要记录这些字段:
- 长尾词(具体到行业 + 问题,避免大词)
- AI 平台(豆包 / DeepSeek / 通义 / Kimi 等,建议至少 4 个平台)
- 原始回答(markdown 或截图存档)
- 是否提到品牌(mention)
- mention 位置(第一推荐 / 前 3 / 后位 / 脚注)
- 是否引用官网(citation)
- 引用的第三方来源(URL 列表)
- 出现的竞品(品牌名 + 出现位置)
- 答案结构(列表 / 段落 / 对比表)
- 幻觉风险(AI 是否把信息写错)
- 下一步动作(改官网 / 发外部 / 做品牌实体修复)
mention 和 citation 是两件事,不能合成一列。详细看 mention 和 citation 区别。
二、为什么先做数据源映射
如果不看 AI 当前引用哪些来源,分发渠道就容易拍脑袋。
明德跑 Phase 0 时观察到的一个现象:国内 AI 对 GEO 类问题反复引用 CSDN、知乎、搜狐、今日头条、抖音、腾讯云、阿里云开发者社区。这不是绝对规律,但能作为渠道优先级的初步参考。
数据源映射的产出物是一张表,列:
| 长尾词 | AI 引用最多的源 | 第二、第三引用源 | 我们当前在这些源上的内容量 |
|---|---|---|---|
| 长尾词 1 | CSDN | 知乎 / 搜狐 | 0 / 0 / 0 |
| 长尾词 2 | 知乎 | 腾讯云 / CSDN | 1 / 0 / 0 |
这张表直接告诉你下一轮内容该铺哪个平台,避免在不被 AI 检索的渠道做无效投入。
三、审计之后怎么决策
不同的发现对应不同的下一步动作。固定的决策树是:
| 发现 | 下一步 |
|---|---|
| 官网核心页没收录 | 先处理抓取、sitemap、内链 |
| 官网已收录但 AI 不提 | 补站外信源和品牌共现 |
| AI 提到但不引用 | 补可引用页面、FAQ、证据链 |
| AI 引用站外但不引用官网 | 强化官网第一信源页 |
| AI 把信息写错 | 做事实一致性和品牌安全审计 |
每条决策都有对应的工作量估计,从 1-2 周到 4-6 周不等。具体每类页面怎么改,看 改版应该优先改哪几类页面。
四、复盘节奏(T0 / T1 / T2 / T3)
GEO 不是一次审计就能看到效果的。明德建议的标准节奏是:
- T0 项目启动前:建立基线,记录上面 11 列字段
- T1 官网改完 +7-14 天:重测同一组词,重点看收录与 mention 是否上升
- T2 站外内容发布 +7-21 天:重测,重点看 citation 是否出现,引用了哪些源
- T3 整轮执行 +3-6 周:完整复测,对比 T0,输出迭代清单
每一轮复测都填同一张 Phase 0 表,这样数据就直接横向可比。如果 T1 后 mention 没上升,多半是页面 answer-first 没做到;如果 T2 后 citation 还是 0,多半是站外信源池没铺开。
五、什么时候需要做第二轮审计
第一轮 Phase 0 解决的是"我现在在哪里"的问题。第二轮审计触发条件通常是:
- 整轮 T0-T3 跑完,要规划下一季度内容方向
- 业务发生重大变化(新增产品线、扩展行业、品牌升级)
- 竞品集中发力,AI 搜索结果格局变化
- 出现品牌幻觉事件(AI 把品牌信息写错),需要全量盘查
每次审计的样本规模可以根据预算调整,但记录的 11 列字段不变。这样跨期数据可比性最高。
六、审计交付物清单
明德的 GEO 审计标准交付清单是:
- Phase 0 基线审计表(30 个 P0 词 × 4 个平台)
- 数据源映射表(哪些源 AI 引用最多)
- 决策树(按发现 → 下一步动作)
- 官网承接页改写清单(按优先级排序)
- 站外分发渠道优先级
- T1 / T2 / T3 复测节奏建议
- 风险与限制条件(哪些数据是当前轮可见、哪些需要后续验证)
整套交付通常 3-5 天完成,是 GEO 项目的起点。
如果你正在准备一轮 GEO 但还没建立 Phase 0 基线,可以来 免费 AI 可见度诊断,我们会基于你的行业先给出 30 个 P0 长尾词的初步基线建议。