+
95
-

回答

graphrag使用很简单,只要先pip安装,然后对长文本例如电子书进行索引,成功后就可以进行rag图查询了。

1、安装graphrag

pip install graphrag

2、创建一个目录存放txt长文本

mkdir -p ./ragtest/input

3、准备数据

官方是放了一个英文小说

curl https://www.gutenberg.org/cache/epub/24022/pg24022.txt > ./ragtest/input/book.txt

你可以把中文的三国演义小说以文本的格式放进去,ragtest/input/book.txt

4、创建项目初始目录

python -m graphrag.index --init --root ./ragtest

在项目目录下有一个.env 和 settings.yaml文件

.env里有GRAPHRAG_API_KEY=<API_KEY>,这是openai的key

如果换成其他的大模型,就要修改settings.yaml,修改api_base及model

800_auto

5、开始索引,索引需要调用大模型的embedding api进行向量化,如何文本很大的话建议用国产的api或本地开源的ollama大模型。

python -m graphrag.index --root ./ragtest

索引成功后如下:

800_auto

6、开始查询

查询分为全局global和本地local两种模式

全局就是从文章的全局大纲来提问,比如

python -m graphrag.query \
--root ./ragtest \
--method global \
"这个小说主要讲什么?"

那么local就是深入文章里面进行提问

python -m graphrag.query \
--root ./ragtest \
--method local \
"谁是小明,他和别人的关系是什么样的?"

网友回复

我知道答案,我要回答