4.9 LLM + 图算法融合
"图结构是大模型推理的骨架。" — 本章核心观点
学习目标
- 理解图作为 LLM 推理结构的三种模式
- 区分知识图谱 RAG、GNN 嵌入、推理图的不同应用场景
- 设计图 + LLM 协同的 Agent Skill
- 判断哪种模式适用什么问题
图 + LLM 三种融合模式
┌─────────────────────────────────────────────────────────────────────┐
│ 图 + LLM 三种融合模式 │
│ ───────────────────────────────────────────────────────────────── │
│ │
│ 模式 1: 知识图谱 RAG │
│ ├── 图作为外部知识存储 │
│ ├── LLM 查询图结构 │
│ ├── 检索路径作为推理链 │
│ └── 适用:结构化知识问答、医疗诊断、法律推理 │
│ │
│ 模式 2: 图神经网络嵌入 │
│ ├── 图结构 → Node embedding │
│ ├── embedding → LLM context │
│ ├── 结构信息融入语言模型 │
│ └── 适用:社交网络分析、推荐系统、分子性质预测 │
│ │
│ 模式 3: 图作为推理结构 │
│ ├── LLM 输出推理图(如推理链 DAG) │
│ ├── 图结构表达因果关系 │
│ ├── DAG 用于验证推理一致性 │
│ └── 适用:复杂推理、因果分析、决策流程 │
│ │
│ 三种模式的关系: │
│ ├── 模式 1: 图是知识源(外部知识) │
│ ├── 模式 2: 图是编码结构(内部表示) │
│ ├── 模式 3: 图是推理表示(输出结构) │
└─────────────────────────────────────────────────────────────────────┘模式 1:知识图谱 RAG
核心思想
知识图谱(Knowledge Graph, KG)将知识表示为(实体, 关系, 实体)三元组。LLM 可以查询 KG 获取结构化知识,然后将检索路径作为推理链。
工作流程
用户问题 → 实体识别 → KG 查询 → 路径检索 → LLM 推理 → 答案
例子:
问题:"姚明的妻子是谁?"
实体识别:姚明
KG 查询:(姚明, 配偶, ?)
路径检索:姚明 → 配偶 → 叶莉
LLM 推理:"姚明的妻子是叶莉。"典型应用
| 应用 | 知识图谱 | 示例查询 |
|---|---|---|
| 医疗诊断 | 疾病-症状-药物 KG | (高血压, 症状, ?) |
| 法律推理 | 法条-案例-判决 KG | (盗窃罪, 刑期, ?) |
| 企业知识 | 产品-部门-人员 KG | (产品A, 负责人, ?) |
优势与局限
优势:
- 知识可追溯(推理路径可见)
- 可更新(KG 独立于 LLM)
- 适合结构化查询
局限:
- 构建成本高
- 覆盖范围有限
- 需要 KG 对齐 LLM 语义
LLM 融合点
让 LLM 实现 KG-RAG pipeline:
任务:设计一个 KG-RAG Skill
输入:用户自然语言问题
输出:基于 KG 的答案
步骤:
1. 实体识别(LLM)
2. KG 查询(图数据库)
3. 路径检索(BFS/DFS)
4. 上下文构建(LLM)
5. 答案生成(LLM)
需要判断:
- 实体识别是否正确?
- 检索路径是否合理?
- 答案是否忠实于 KG?模式 2:图神经网络嵌入
核心思想
图神经网络(GNN)将图结构编码为向量表示(embedding)。这些 embedding 可以作为 LLM 的上下文,将结构信息融入语言模型。
工作流程
图结构 → GNN 编码 → Node embedding → LLM context → 输出
例子:
社交网络:用户图 → GNN → 用户 embedding
推荐:用户-物品二部图 → GNN → 用户/物品 embedding
分子:原子图 → GNN → 分子 embeddingGNN 基础回顾
| GNN 类型 | 核心机制 | 适用场景 |
|---|---|---|
| GCN | 图卷积(邻居聚合) | 同构图 |
| GAT | 注意力加权聚合 | 异构图 |
| GraphSAGE | 采样 + 聚合 | 大规模图 |
| Node2Vec | 随机游走 + Skip-gram | 图嵌入 |
与 LLM 融合方式
Embedding 作为上下文
Node embedding → 拼接到 LLM 输入 → LLM 推理图结构提示
图的文本描述 → LLM 输入 → LLM 理解图结构GNN-LLM 协作
GNN 处理结构 → LLM 处理语义 → 联合推理
优势与局限
优势:
- 保留图结构信息
- 可处理大规模图
- 端到端学习
局限:
- 训练成本高
- 需要 GPU
- 可解释性差
LLM 融合点
让 LLM 解释 GNN 消息传递:
任务:解释 GCN 消息传递
GCN 更新公式:
h_v^(l+1) = σ(Σ_{u∈N(v)} (1/√(d_u · d_v)) · W · h_u^(l))
请解释:
1. 消息如何从邻居传递到当前节点
2. 归一化系数的作用
3. 聚合函数的作用
判断 LLM 理解是否正确:
- 是否正确解释邻居聚合?
- 是否理解归一化意义?
- 是否理解 W 是可学习参数?模式 3:图作为推理结构
核心思想
LLM 进行复杂推理时,输出可以是图结构(如推理链 DAG)。这个图表达了因果关系,可以用于验证推理一致性。
工作流程
问题 → LLM 推理 → 推理图 (DAG) → 一致性验证 → 答案
例子:
问题:"如果下雨,地会湿。现在地是湿的,是否一定下过雨?"
LLM 推理:
P1: 下雨 → 地湿
P2: 地湿
C: 下雨? (无法确定,可能其他原因)
推理图 (DAG):
下雨 → 地湿
? → 地湿
地湿 → (无法推出下雨)
一致性验证:
DAG 中是否有矛盾?
推理链是否完整?推理图类型
| 推理图 | 结构 | 应用 |
|---|---|---|
| 推理链 | 线性 | 简单推理 |
| 推理树 | 树形 | 多分支推理 |
| 推理 DAG | 有向无环图 | 复杂推理 |
一致性验证
推理图可以用于验证:
- 循环矛盾:DAG 中不能有环
- 前提缺失:结论依赖的前提必须存在
- 推理断裂:推理链不能跳跃
优势与局限
优势:
- 推理可追溯
- 可自动验证
- 支持复杂推理
局限:
- LLM 输出可能不一致
- 图构建需要额外步骤
- 验证逻辑需要设计
LLM 融合点
让 LLM 构建推理图:
任务:构建推理图
问题:"所有猫都是动物。所有动物都会死。Tom 是一只猫。Tom 会死吗?"
要求:
1. 识别前提和结论
2. 构建推理链 DAG
3. 标注推理类型(演绎/归纳/类比)
判断:
- 推理图是否正确?
- 是否有遗漏的前提?
- 推理是否完整?三种模式对比
| 维度 | 模式 1: KG-RAG | 模式 2: GNN 嵌入 | 模式 3: 推理图 |
|---|---|---|---|
| 图的角色 | 知识源 | 编码结构 | 推理表示 |
| LLM 角色 | 查询 + 生成 | 理解 + 推理 | 输出 + 验证 |
| 适用场景 | 结构化知识问答 | 社交/推荐/分子 | 复杂推理 |
| 可解释性 | 高(路径可见) | 低(黑盒嵌入) | 高(DAG 可视化) |
| 构建成本 | 高(KG 构建) | 高(GNN 训练) | 低(LLM 输出) |
| 实时性 | 中(KG 查询) | 高(嵌入预计算) | 低(验证开销) |
Agent Skill 设计
Skill 1:图问题识别器
功能:识别自然语言问题是否可建模为图问题
输入:自然语言问题描述
输出:
- 是否为图问题
- 如果是,图建模建议(顶点、边、权)
- 推荐算法类别
示例:
输入:"某工厂有 10 个车间,某些车间有依赖关系,求加工顺序"
输出:
- 是图问题
- 顶点:车间
- 边:依赖关系(有向)
- 推荐算法:拓扑排序Skill 2:KG-RAG 查询器
功能:基于知识图谱的问答
输入:自然语言问题
输出:基于 KG 的答案 + 推理路径
步骤:
1. 实体识别
2. 关系抽取
3. KG 路径检索
4. LLM 答案生成
输出格式:
- 答案
- 推理路径(可追溯)
- 置信度Skill 3:推理验证器
功能:验证 LLM 推理的一致性
输入:LLM 的推理链(文本)
输出:推理图 + 一致性报告
步骤:
1. 解析推理链为图结构
2. 检测循环矛盾
3. 检查前提完整性
4. 生成一致性报告
输出格式:
- 推理图 (DAG)
- 一致性评估(通过/警告/失败)
- 问题列表(如有)实战练习
练习 1:KG-RAG 设计
设计一个医疗诊断 KG-RAG 系统:
知识图谱结构:
- 实体:疾病、症状、药物、检查
- 关系:疾病-症状、疾病-药物、疾病-检查
任务:
1. 设计 KG schema
2. 设计查询 pipeline
3. 给出 3 个示例查询练习 2:GNN 解释
用 LLM 解释 GAT(Graph Attention Network):
GAT 更新公式:
h_v^(l+1) = σ(Σ_{u∈N(v)} α_vu · W · h_u^(l))
其中:
α_vu = softmax(LeakyReLU(a^T [W h_v || W h_u]))
任务:
让 LLM 解释:
1. 注意力系数 α_vu 的计算
2. 为什么用 LeakyReLU
3. 注意力 vs 均值聚合的优势练习 3:推理图构建
构建以下问题的推理图:
问题:
"如果今天是周末或节假日,公园免费开放。
今天不是周末,但公园免费开放。
今天是否是节假日?"
要求:
1. 用命题逻辑表示
2. 构建推理 DAG
3. 验证推理一致性小结
三种融合模式:
- KG-RAG:图是知识源,LLM 查询图获取结构化知识
- GNN 嵌入:图是编码结构,GNN 将结构信息融入 LLM
- 推理图:图是推理表示,LLM 输出推理 DAG 用于验证
模式选择指南:
| 问题特性 | 推荐模式 |
|---|---|
| 结构化知识问答 | KG-RAG |
| 社交网络分析 | GNN 嵌入 |
| 分子性质预测 | GNN 嵌入 |
| 复杂逻辑推理 | 推理图 |
| 因果分析 | 推理图 |
人机分工:
| 任务 | 人/LLM |
|---|---|
| 选择融合模式 | 人 |
| 设计 KG schema | 人 |
| 设计 GNN 架构 | 人 |
| 构建 KG | LLM 辅助 |
| 训练 GNN | 机器 |
| 验证推理一致性 | LLM 辅助 |
参考文献
- "LLMs+Graphs: Toward Graph-Native, Synergistic AI Systems", arXiv 2026-06
- "GNN-as-Judge: LLMs for Graph Learning with GNN Feedback", arXiv 2026-03
- "Teaching LLMs to See Graphs", arXiv 2026-05
- "Beyond Individual Mimicry: Graph-Augmented LLM Agents", arXiv 2026-03
- "Do LLM-derived graph priors improve multi-agent coordination?", arXiv 2026-04