GraphRag当地测试

农妇山泉一亩田 发表于 2026-2-12 08:24:59

测试环境：win10 python3.11.9

graphRAG的安装还是很简朴的，直接pip
pip install graphrag 但要留意，官方说了须要 python3.10-3.12
安装完成后，创建一个文件夹，存放你的知识数据，现在graphRAG仅支持txt和csv
mkdir -p ./ragtest/input 然后准备一份数据，放到 /ragtest/input 下，我找了一份中文数据，为了演示，截取了部分文本
https://dis.qidao123.com/imgproxy/aHR0cHM6Ly9pLWJsb2cuY3NkbmltZy5jbi9kaXJlY3QvMDI0ODYxMDBlNjQ5NDNjNzkxNGIyNTY0MDNiMjUyNmUucG5n

要初始化您的工作区，让我们起首运行下令graphrag.index --init。由于我们在上一步中已经设置了一个名为 .ragtest1` 的目次，因此我们可以运行以下下令：
python -m graphrag.index --init --root ./ragtest 实验完后，目次中布局如下
https://dis.qidao123.com/imgproxy/aHR0cHM6Ly9pLWJsb2cuY3NkbmltZy5jbi9kaXJlY3QvYWFiMzQ3ZTVkYTBkNDM4YzhiYThlZWQxODIwYzI3NDkucG5n

这将在目次中创建两个文件：.env和。settings.yaml./ragtest

[*] .env包罗运行 GraphRAG 管道所需的环境变量。如果查抄文件，您将看到已界说的单个环境变量。 GRAPHRAG_API_KEY=<API_KEY>这是 OpenAI API 或 Azure OpenAI 端点的 API 密钥。您可以将其更换为您本身的 API 密钥。

[*] settings.yaml包罗管道的设置。您可以修改此文件以更改管道的设置。

OpenAI API免费key获取GitHub - chatanywhere/GPT_API_free: Free ChatGPT API Key，免费ChatGPT API，支持GPT4 API（免费），ChatGPT国内可用免费转发API，直连无需署理。可以搭配ChatBox等软件/插件使用，极大低落接口使用资本。国内即可无穷制痛快酣畅谈天。

我们须要修改 settings.yaml,你可以直接复制我的如下，牢记你本机安装了Ollama而且安装了下边两个模子
quentinz/bge-large-zh-v1.5:latestgemma2:9b Ollama的安装到官网下载安装： Ollama
# 拉取quantinz模型
ollama pull quentinz/bge-base-zh-v1.5:latest

# 拉取gemma模型
ollama run gemma2:9b

# 展示模型列表
ollama list 安装如上下令拉取模子。
那么你可以复制如下内容到settings.yaml
encoding_model: cl100k_base
skip_workflows: []
llm:
api_key: ollama
type: openai_chat # or azure_openai_chat
model: gemma2:9b # 你ollama中的本地llm模型，可以换成其他的，只要你安装了就可以
model_supports_json: true # recommended if this is available for your model.
max_tokens: 2048
# request_timeout: 180.0
api_base: http://localhost:11434/v1 # 接口注意是v1
# api_version: 2024-02-15-preview
# organization: <organization_id>
# deployment_name: <azure_model_deployment_name>
# tokens_per_minute: 150_000 # set a leaky bucket throttle
# requests_per_minute: 10_000 # set a leaky bucket throttle
# max_retries: 10
# max_retry_wait: 10.0
# sleep_on_rate_limit_recommendation: true # whether to sleep when azure suggests wait-times
concurrent_requests: 1 # the number of parallel inflight requests that may be made

parallelization:
stagger: 0.3
# num_threads: 50 # the number of threads to use for parallel processing

async_mode: threaded # or asyncio

embeddings:
## parallelization: override the global parallelization settings for embeddings
async_mode: threaded # or asyncio
llm:
api_key: ollama
type: openai_embedding # or azure_openai_embedding
model: quentinz/bge-large-zh-v1.5:latest #你ollam
免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！qidao123.com:ToB企服之家，中国第一个企服评测及软件市场,开放入驻,技术点评得现金

页: [1]

qidao123.com ToB IT社区-企服评测·应用市场's Archiver

GraphRag当地测试