【大语言模型_5】xinference部署embedding模型和rerank模型

打印 上一主题 下一主题

主题 996|帖子 996|积分 2988

一、安装xinference

  1. pip install xinference
复制代码
二、启动xinference

  1. ./xinference-local  --host=0.0.0.0  --port=5544
复制代码
三、注册本地模型

  1. 1、注册embedding模型
  2. curl -X POST "http://localhost:5544/v1/models" \
  3. -H "Content-Type: application/json" \
  4. -d '{
  5.   "model_type": "embedding",
  6.   "model_name": "bce-embedding-base_v1",  
  7.   "model_uid": "bce-embedding-base_v1",   
  8.   "model_path": "/root/embed_rerank/bce-embedding-base_v1/"
  9. }'
  10. 验证:
  11. curl -X POST "http://localhost:5544/v1/embeddings" \
  12. -H "Content-Type: application/json" \
  13. -d '{
  14.   "model": "bce-embedding-base_v1",
  15.   "input": ["需要嵌入的文本1", "这是第二个句子"]
  16. }'
  17. 2、注册rerank模型
  18. curl -X POST "http://localhost:5544/v1/models" \
  19. -H "Content-Type: application/json" \
  20. -d '{
  21.   "model_type": "rerank",              
  22.   "model_name": "bce-reranker-base_v1",     
  23.   "model_uid": "bce-reranker-base_v1",   
  24.   "model_path": "/root/embed_rerank/bce-reranker-base_v1"
  25. }'
  26. 验证
  27. curl -X POST "http://localhost:5544/v1/rerank" \
  28. -H "Content-Type: application/json" \
  29. -d '{
  30.   "model": "bge-reranker-v2-m3",
  31.   "query": "What is Python?",
  32.   "documents": [
  33.     "Python is a programming language.",
  34.     "Java is another language.",
  35.     "Python is used for web development."
  36.   ]
  37. }'
  38. 3、执行./xinference list 查看运行模型
复制代码
四、删除模型

  1. curl -X DELETE "http://localhost:5544/v1/models/bge-reranker-v2-m3"
复制代码
五、备注

1、在cpu运行



  • 服务器有显卡但是选择用cpu加载
             启动xinference之前设置
              export CUDA_VISIBLE_DEVICES=""


  • 服务器无显卡会自动在cpu加载模型

2、在gpu运行

启动服务器前设置情况变量
export CUDA_VISIBLE_DEVICES=""
  1. curl -X POST "http://localhost:5544/v1/models" \
  2. -H "Content-Type: application/json" \
  3. -d '{
  4.   "model_type": "embedding",
  5.   "model_name": "bce-embedding-base_v1",  
  6.   "model_uid": "bce-embedding-base_v1",   
  7.   "model_path": "/root/zml/embed_rerank/bce-embedding-base_v1/"
  8.   "gpu_idx": 1
  9.   "n_gpu" : 1
  10. }'
  11. 备注:
  12. gpu_idx :选用的显卡index
  13. n_gpu:选定的显卡总张数
复制代码


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

王海鱼

金牌会员
这个人很懒什么都没写!
快速回复 返回顶部 返回列表