知识图谱可以理解成:把知识从“一堆文章段落”整理成“可连线的关系网(人-公司-产品-时间-事件)”。
传统 RAG 更像在一堆资料里“按相似度搜几段出来给模型读”;知识图谱则像先把关键对象和它们的关系做成“结构化地图”,再按地图去找。

它主要能解决传统 RAG 的这些痛点:
1) 少跑题:从“像不像”变成“是不是同一个东西”
传统 RAG 用向量检索,有时会把“看起来很像”的内容捞出来,但其实不是你问的那个对象。比如你问“苹果公司的最新财报”,它可能捞到“苹果水果的营养”或“Apple 的旧新闻”。
知识图谱会先锁定“苹果公司”这个实体,再去找它的“财报/年份/指标”等关系。更不容易跑偏。
2) 解决同名:别把张伟A当成张伟B
企业里经常有同名的人、同名的项目、同名的系统。传统 RAG 很容易混在一起,因为段落相似。
知识图谱给每个实体一个“身份证”(唯一 ID),还能用部门、时间、职位、别名等关系来区分,所以更不容易串台。
3) 擅长“要拼起来才有答案”的问题
很多问题答案不在某一段里,而要把几段信息串起来:“某故障影响了哪些系统?”可能要:故障 → 组件 → 依赖 → 系统 → 负责人。
传统 RAG 往往只捞到其中一两段,拼不全。知识图谱天生就是“可沿着关系走多步”,更容易把链路补齐。
4) 减少塞给模型的废话:更省 token、也更稳
传统 RAG 常用“多捞几段”来提高命中率,但会带来大量无关内容,让模型更容易被干扰。知识图谱可以先在图上筛出“关键节点和关系”,再只取少量对应证据段落,信息密度更高。
5) 更好处理“版本/时间”:减少用到过期信息
传统 RAG 可能把旧制度、新制度一起检索出来,模型就混着回答。知识图谱可以把“生效时间/版本/来源”作为结构化字段,检索时直接限定“只要最新”“只要 2024 之后有效”。
6) 更容易解释“我为什么这么说”
传统 RAG 的解释通常是“我引用了这些段落”,但推理链路不清晰。知识图谱可以直接给你一条链:A 依赖 B,B 属于系统 C,所以影响 C。可审计、好复核。
一句话总结
传统 RAG 像“从资料库里搜相似段落给模型读”;知识图谱像“先把关键事实做成关系网,再按关系网精准找证据”,所以更少串台、更能多跳、也更可控可解释。
网友回复


