IT评测·应用市场-qidao123.com

标题: 最强开源视觉大模子Qwen2.5-VL:本地部署完全免费 [打印本页]

作者: 瑞星    时间: 2025-3-2 14:27
标题: 最强开源视觉大模子Qwen2.5-VL:本地部署完全免费
前言


Qwen2.5-VL 是 Qwen 推出的全新旗舰视觉语言模子,较前身 Qwen2-VL 实现了巨大飞跃。该模子不但能够辨认花、鸟、鱼、昆虫等常见物体,还能分析图像中的复杂文本、图表、图标、图形和布局,为多模态 AI 树立了新标准。Qwen2.5-VL 具备高度代理能力,支持动态推理和工具指导,适用于计算机和手机等多种设备。
一、技术功能与上风




准确率能达到80-90%,太飒了....





二、本地部署Qwen2.5

在电脑上先安装好 Git 和 Python 环境。如果没有安装,可以自行下载安装。本文利用的是 Python 3.10.6 版本。点击下载 Python
1. 克隆 Qwen2.5-VL 堆栈并进入项目目录

  1. git clone https://github.com/QwenLM/Qwen2.5-VL   cd Qwen2.5-VL   
复制代码
2. 安装 Web 应用步伐所需的依赖项

  1. pip install -r requirements_web_demo.txt   
复制代码
3. 安装支持 CUDA 的 PyTorch

为确保与 GPU 兼容,请安装支持 CUDA 的最新版本的 PyTorch、TorchVision 和 TorchAudio。即使已经安装了 PyTorch,运行 Web 应用步伐时也可能会遇到标题,因此建议更新:
  1. pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124   
复制代码
4. 更新 Gradio 和 Gradio Client

为避免连接和 UI 相干的错误,建议更新 Gradio 和 Gradio Client:
  1. pip install -U gradio gradio_client   
复制代码
5. 下载并安装模子

以下是模子的下载安装选项,总共有 3 个选择:
较小的 3B 模子 适合 GPU 内存有限的笔记本电脑(例如 8GB VRAM):
  1. python web_demo_mm.py --checkpoint-path "Qwen/Qwen2.5-VL-3B-Instruct"   
复制代码
7B 模子 显存高于 8G 的可以选择 7B 模子,性能更强、结果更好:
  1. python web_demo_mm.py --checkpoint-path "Qwen/Qwen2.5-VL-7B-Instruct"   
复制代码
72B 模子 如果有专业级别的 GPU,可以直接利用 72B 的最大模子,性能最强:
  1. python web_demo_mm.py --checkpoint-path "Qwen/Qwen2.5-VL-72B-Instruct"   
复制代码
安装乐成会出现如下页面

6. 启动 Web 应用步伐

  1. 在浏览器中打开本地链接 http://127.0.0.1:7860 即可使用。   
复制代码

7. 利用示例

您可以上传带有文本和多个图形的图像,并让模子对其进行解释。即使是较小的 3B 模子也体现出令人印象深刻的性能,可以辨认图像中的复杂细节。

8. 替代方案

如果你的电脑硬件配置不足,无法本地部署 Qwen2.5-VL,可以直接利用官方提供的免费平台。虽然免费平台利用的是共享 GPU,并且有利用额度限制,但它的最大上风在于可以直接免费体验 Qwen2.5-VL 最强的 72B 模子!下面是测试结果,结果不错

9. 开源模子下载路径

Qwen2.5-VL 3个完备开源版本已经托管在hugging face上,可以自行去下载
  1. https://huggingface.co/collections/Qwen/qwen25-vl-6795ffac22b334a837c0f9a5   
复制代码

怎样学习大模子 AI ?

由于新岗位的生产服从,要优于被取代岗位的生产服从,以是现实上整个社会的生产服从是提升的。
但是具体到个人,只能说是:
“最先把握AI的人,将会比较晚把握AI的人有竞争上风”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的原理。
我在一线互联网企业工作十余年里,指导过不少偕行后辈。帮助许多人得到了学习和成长。
我意识到有许多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的许多狐疑,以是在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,许多互联网行业朋侪无法获得正确的资料得到学习提升,故此将并将紧张的AI大模子资料包括AI大模子入门学习头脑导图、精品AI大模子学习册本手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段(10天):初阶应用

该阶段让大家对大模子 AI有一个最前沿的熟悉,对大模子 AI 的理解超过 95% 的人,可以在相干讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模子和业务衔接。

第二阶段(30天):高阶应用

该阶段我们正式进入大模子 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完备的基于 agent 对话机器人。把握功能最强的大模子开发框架,捉住最新的技术进展,适合 Python 和 JavaScript 步伐员。

第三阶段(30天):模子练习

恭喜你,如果学到这里,你根本可以找到一份大模子 AI相干的工作,自己也能练习 GPT 了!通过微调,练习自己的垂直大模子,能独立练习开源多模态大模子,把握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

第四阶段(20天):贸易闭环

对环球大模子从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模子,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

学习是一个过程,只要学习就会有挑衅。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成全部的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模子 AI 的正确特征了。
这份完备版的大模子 AI 学习资料已经上传CSDN,朋侪们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】



免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 IT评测·应用市场-qidao123.com (https://dis.qidao123.com/) Powered by Discuz! X3.4