农妇山泉一亩田 发表于 2026-2-12 08:24:59

GraphRag当地测试

测试环境:win10 python3.11.9

graphRAG的安装还是很简朴的,直接pip
pip install graphrag 但要留意,官方说了须要 python3.10-3.12
安装完成后,创建一个文件夹,存放你的知识数据,现在graphRAG仅支持txt和csv
mkdir -p ./ragtest/input 然后准备一份数据,放到 /ragtest/input 下,我找了一份中文数据,为了演示,截取了部分文本
https://dis.qidao123.com/imgproxy/aHR0cHM6Ly9pLWJsb2cuY3NkbmltZy5jbi9kaXJlY3QvMDI0ODYxMDBlNjQ5NDNjNzkxNGIyNTY0MDNiMjUyNmUucG5n

要初始化您的工作区,让我们起首运行下令graphrag.index --init。由于我们在上一步中已经设置了一个名为 .ragtest1` 的目次,因此我们可以运行以下下令:
python -m graphrag.index --init --root ./ragtest 实验完后,目次中布局如下
https://dis.qidao123.com/imgproxy/aHR0cHM6Ly9pLWJsb2cuY3NkbmltZy5jbi9kaXJlY3QvYWFiMzQ3ZTVkYTBkNDM4YzhiYThlZWQxODIwYzI3NDkucG5n

这将在目次中创建两个文件:.env和。settings.yaml./ragtest


[*] .env包罗运行 GraphRAG 管道所需的环境变量。如果查抄文件,您将看到已界说的单个环境变量。 GRAPHRAG_API_KEY=<API_KEY>这是 OpenAI API 或 Azure OpenAI 端点的 API 密钥。您可以将其更换为您本身的 API 密钥。

[*] settings.yaml包罗管道的设置。您可以修改此文件以更改管道的设置。

OpenAI API免费key获取GitHub - chatanywhere/GPT_API_free: Free ChatGPT API Key,免费ChatGPT API,支持GPT4 API(免费),ChatGPT国内可用免费转发API,直连无需署理。可以搭配ChatBox等软件/插件使用,极大低落接口使用资本。国内即可无穷制痛快酣畅谈天。

我们须要修改 settings.yaml,你可以直接复制我的如下,牢记你本机安装了Ollama而且安装了下边两个模子
quentinz/bge-large-zh-v1.5:latestgemma2:9b Ollama的安装到官网下载安装: Ollama
# 拉取quantinz模型
ollama pull quentinz/bge-base-zh-v1.5:latest

# 拉取gemma模型
ollama run gemma2:9b

# 展示模型列表
ollama list 安装如上下令拉取模子。
那么你可以复制如下内容到settings.yaml
encoding_model: cl100k_base
skip_workflows: []
llm:
api_key: ollama
type: openai_chat # or azure_openai_chat
model: gemma2:9b # 你ollama中的本地llm模型,可以换成其他的,只要你安装了就可以
model_supports_json: true # recommended if this is available for your model.
max_tokens: 2048
# request_timeout: 180.0
api_base: http://localhost:11434/v1 # 接口注意是v1
# api_version: 2024-02-15-preview
# organization: <organization_id>
# deployment_name: <azure_model_deployment_name>
# tokens_per_minute: 150_000 # set a leaky bucket throttle
# requests_per_minute: 10_000 # set a leaky bucket throttle
# max_retries: 10
# max_retry_wait: 10.0
# sleep_on_rate_limit_recommendation: true # whether to sleep when azure suggests wait-times
concurrent_requests: 1 # the number of parallel inflight requests that may be made

parallelization:
stagger: 0.3
# num_threads: 50 # the number of threads to use for parallel processing

async_mode: threaded # or asyncio

embeddings:
## parallelization: override the global parallelization settings for embeddings
async_mode: threaded # or asyncio
llm:
    api_key: ollama
    type: openai_embedding # or azure_openai_embedding
    model: quentinz/bge-large-zh-v1.5:latest #你ollam
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!qidao123.com:ToB企服之家,中国第一个企服评测及软件市场,开放入驻,技术点评得现金
页: [1]
查看完整版本: GraphRag当地测试