Skip to content

4.9 LLM + 图算法融合

"图结构是大模型推理的骨架。" — 本章核心观点


学习目标

  • 理解图作为 LLM 推理结构的三种模式
  • 区分知识图谱 RAG、GNN 嵌入、推理图的不同应用场景
  • 设计图 + LLM 协同的 Agent Skill
  • 判断哪种模式适用什么问题

图 + LLM 三种融合模式

┌─────────────────────────────────────────────────────────────────────┐
│  图 + LLM 三种融合模式                                               │
│  ─────────────────────────────────────────────────────────────────  │
│                                                                     │
│  模式 1: 知识图谱 RAG                                               │
│  ├── 图作为外部知识存储                                             │
│  ├── LLM 查询图结构                                                 │
│  ├── 检索路径作为推理链                                             │
│  └── 适用:结构化知识问答、医疗诊断、法律推理                       │
│                                                                     │
│  模式 2: 图神经网络嵌入                                              │
│  ├── 图结构 → Node embedding                                        │
│  ├── embedding → LLM context                                        │
│  ├── 结构信息融入语言模型                                           │
│  └── 适用:社交网络分析、推荐系统、分子性质预测                     │
│                                                                     │
│  模式 3: 图作为推理结构                                              │
│  ├── LLM 输出推理图(如推理链 DAG)                                 │
│  ├── 图结构表达因果关系                                             │
│  ├── DAG 用于验证推理一致性                                         │
│  └── 适用:复杂推理、因果分析、决策流程                             │
│                                                                     │
│  三种模式的关系:                                                     │
│  ├── 模式 1: 图是知识源(外部知识)                                 │
│  ├── 模式 2: 图是编码结构(内部表示)                               │
│  ├── 模式 3: 图是推理表示(输出结构)                               │
└─────────────────────────────────────────────────────────────────────┘

模式 1:知识图谱 RAG

核心思想

知识图谱(Knowledge Graph, KG)将知识表示为(实体, 关系, 实体)三元组。LLM 可以查询 KG 获取结构化知识,然后将检索路径作为推理链。

工作流程

用户问题 → 实体识别 → KG 查询 → 路径检索 → LLM 推理 → 答案

例子:
问题:"姚明的妻子是谁?"
实体识别:姚明
KG 查询:(姚明, 配偶, ?)
路径检索:姚明 → 配偶 → 叶莉
LLM 推理:"姚明的妻子是叶莉。"

典型应用

应用知识图谱示例查询
医疗诊断疾病-症状-药物 KG(高血压, 症状, ?)
法律推理法条-案例-判决 KG(盗窃罪, 刑期, ?)
企业知识产品-部门-人员 KG(产品A, 负责人, ?)

优势与局限

优势

  • 知识可追溯(推理路径可见)
  • 可更新(KG 独立于 LLM)
  • 适合结构化查询

局限

  • 构建成本高
  • 覆盖范围有限
  • 需要 KG 对齐 LLM 语义

LLM 融合点

让 LLM 实现 KG-RAG pipeline:

任务:设计一个 KG-RAG Skill

输入:用户自然语言问题
输出:基于 KG 的答案

步骤:
1. 实体识别(LLM)
2. KG 查询(图数据库)
3. 路径检索(BFS/DFS)
4. 上下文构建(LLM)
5. 答案生成(LLM)

需要判断:
- 实体识别是否正确?
- 检索路径是否合理?
- 答案是否忠实于 KG?

模式 2:图神经网络嵌入

核心思想

图神经网络(GNN)将图结构编码为向量表示(embedding)。这些 embedding 可以作为 LLM 的上下文,将结构信息融入语言模型。

工作流程

图结构 → GNN 编码 → Node embedding → LLM context → 输出

例子:
社交网络:用户图 → GNN → 用户 embedding
推荐:用户-物品二部图 → GNN → 用户/物品 embedding
分子:原子图 → GNN → 分子 embedding

GNN 基础回顾

GNN 类型核心机制适用场景
GCN图卷积(邻居聚合)同构图
GAT注意力加权聚合异构图
GraphSAGE采样 + 聚合大规模图
Node2Vec随机游走 + Skip-gram图嵌入

与 LLM 融合方式

  1. Embedding 作为上下文

    Node embedding → 拼接到 LLM 输入 → LLM 推理
  2. 图结构提示

    图的文本描述 → LLM 输入 → LLM 理解图结构
  3. GNN-LLM 协作

    GNN 处理结构 → LLM 处理语义 → 联合推理

优势与局限

优势

  • 保留图结构信息
  • 可处理大规模图
  • 端到端学习

局限

  • 训练成本高
  • 需要 GPU
  • 可解释性差

LLM 融合点

让 LLM 解释 GNN 消息传递:

任务:解释 GCN 消息传递

GCN 更新公式:
h_v^(l+1) = σ(Σ_{u∈N(v)} (1/√(d_u · d_v)) · W · h_u^(l))

请解释:
1. 消息如何从邻居传递到当前节点
2. 归一化系数的作用
3. 聚合函数的作用

判断 LLM 理解是否正确:
- 是否正确解释邻居聚合?
- 是否理解归一化意义?
- 是否理解 W 是可学习参数?

模式 3:图作为推理结构

核心思想

LLM 进行复杂推理时,输出可以是图结构(如推理链 DAG)。这个图表达了因果关系,可以用于验证推理一致性。

工作流程

问题 → LLM 推理 → 推理图 (DAG) → 一致性验证 → 答案

例子:
问题:"如果下雨,地会湿。现在地是湿的,是否一定下过雨?"
LLM 推理:
  P1: 下雨 → 地湿
  P2: 地湿
  C: 下雨? (无法确定,可能其他原因)

推理图 (DAG):
  下雨 → 地湿
  ? → 地湿
  地湿 → (无法推出下雨)

一致性验证:
  DAG 中是否有矛盾?
  推理链是否完整?

推理图类型

推理图结构应用
推理链线性简单推理
推理树树形多分支推理
推理 DAG有向无环图复杂推理

一致性验证

推理图可以用于验证:

  1. 循环矛盾:DAG 中不能有环
  2. 前提缺失:结论依赖的前提必须存在
  3. 推理断裂:推理链不能跳跃

优势与局限

优势

  • 推理可追溯
  • 可自动验证
  • 支持复杂推理

局限

  • LLM 输出可能不一致
  • 图构建需要额外步骤
  • 验证逻辑需要设计

LLM 融合点

让 LLM 构建推理图:

任务:构建推理图

问题:"所有猫都是动物。所有动物都会死。Tom 是一只猫。Tom 会死吗?"

要求:
1. 识别前提和结论
2. 构建推理链 DAG
3. 标注推理类型(演绎/归纳/类比)

判断:
- 推理图是否正确?
- 是否有遗漏的前提?
- 推理是否完整?

三种模式对比

维度模式 1: KG-RAG模式 2: GNN 嵌入模式 3: 推理图
图的角色知识源编码结构推理表示
LLM 角色查询 + 生成理解 + 推理输出 + 验证
适用场景结构化知识问答社交/推荐/分子复杂推理
可解释性高(路径可见)低(黑盒嵌入)高(DAG 可视化)
构建成本高(KG 构建)高(GNN 训练)低(LLM 输出)
实时性中(KG 查询)高(嵌入预计算)低(验证开销)

Agent Skill 设计

Skill 1:图问题识别器

功能:识别自然语言问题是否可建模为图问题

输入:自然语言问题描述
输出:
- 是否为图问题
- 如果是,图建模建议(顶点、边、权)
- 推荐算法类别

示例:
输入:"某工厂有 10 个车间,某些车间有依赖关系,求加工顺序"
输出:
- 是图问题
- 顶点:车间
- 边:依赖关系(有向)
- 推荐算法:拓扑排序

Skill 2:KG-RAG 查询器

功能:基于知识图谱的问答

输入:自然语言问题
输出:基于 KG 的答案 + 推理路径

步骤:
1. 实体识别
2. 关系抽取
3. KG 路径检索
4. LLM 答案生成

输出格式:
- 答案
- 推理路径(可追溯)
- 置信度

Skill 3:推理验证器

功能:验证 LLM 推理的一致性

输入:LLM 的推理链(文本)
输出:推理图 + 一致性报告

步骤:
1. 解析推理链为图结构
2. 检测循环矛盾
3. 检查前提完整性
4. 生成一致性报告

输出格式:
- 推理图 (DAG)
- 一致性评估(通过/警告/失败)
- 问题列表(如有)

实战练习

练习 1:KG-RAG 设计

设计一个医疗诊断 KG-RAG 系统:

知识图谱结构:
- 实体:疾病、症状、药物、检查
- 关系:疾病-症状、疾病-药物、疾病-检查

任务:
1. 设计 KG schema
2. 设计查询 pipeline
3. 给出 3 个示例查询

练习 2:GNN 解释

用 LLM 解释 GAT(Graph Attention Network):

GAT 更新公式:
h_v^(l+1) = σ(Σ_{u∈N(v)} α_vu · W · h_u^(l))

其中:
α_vu = softmax(LeakyReLU(a^T [W h_v || W h_u]))

任务:
让 LLM 解释:
1. 注意力系数 α_vu 的计算
2. 为什么用 LeakyReLU
3. 注意力 vs 均值聚合的优势

练习 3:推理图构建

构建以下问题的推理图:

问题:
"如果今天是周末或节假日,公园免费开放。
今天不是周末,但公园免费开放。
今天是否是节假日?"

要求:
1. 用命题逻辑表示
2. 构建推理 DAG
3. 验证推理一致性

小结

三种融合模式

  1. KG-RAG:图是知识源,LLM 查询图获取结构化知识
  2. GNN 嵌入:图是编码结构,GNN 将结构信息融入 LLM
  3. 推理图:图是推理表示,LLM 输出推理 DAG 用于验证

模式选择指南

问题特性推荐模式
结构化知识问答KG-RAG
社交网络分析GNN 嵌入
分子性质预测GNN 嵌入
复杂逻辑推理推理图
因果分析推理图

人机分工

任务人/LLM
选择融合模式
设计 KG schema
设计 GNN 架构
构建 KGLLM 辅助
训练 GNN机器
验证推理一致性LLM 辅助

参考文献

  • "LLMs+Graphs: Toward Graph-Native, Synergistic AI Systems", arXiv 2026-06
  • "GNN-as-Judge: LLMs for Graph Learning with GNN Feedback", arXiv 2026-03
  • "Teaching LLMs to See Graphs", arXiv 2026-05
  • "Beyond Individual Mimicry: Graph-Augmented LLM Agents", arXiv 2026-03
  • "Do LLM-derived graph priors improve multi-agent coordination?", arXiv 2026-04

新时代的算法课程