browser-use WebUI + DeepSeek V3 把浏览器整成自动化了!

鼠扑  论坛元老 | 2025-3-11 03:06:55 | 显示全部楼层 | 阅读模式
打印 上一主题 下一主题

主题 1035|帖子 1035|积分 3105


Github 上有个开源项目 browser-use,这个项目最近老火了,目前拥有 11K Star,它的作用是将 AI Agent 与浏览器链接起来从而实现由 AI 驱动的浏览器自动化。接入也很简朴,不过要写一点代码。
这两天有个老哥基于 browser-use,写了个 UI 界面,在体验层面同时也做了一些功能扩展,让它的使用门槛更低了,之前的 Github 开源地址是 https://github.com/warmshao/browser-use-webui。现在为 https://github.com/browser-use/web-ui
browser-use webui 主要功能



  • 提供了全新的网页界面,简朴好用,方便操纵。
  • 支持更多大语言模子,比如 Gemini、OpenAI、Azure 等,哦,还有最近爆火的国产大模子 DeepSeek,未来还会加更多。
  • 支持用自己的浏览器,不用再反复登录,还能录屏。
  • 定制了更智能的 Agent,通过优化后的提示让浏览器使用更高效。
安装

这个项目已在 Github 开源,想玩的都可以试试,用 Python 写的,版本必须在 3.11 以上。
我是使用 pyenv 管理 python 版本,在 browser-use/web-ui 最新文档中是推荐 https://docs.astral.sh/uv/ 管理 Python 版本,大家可以根据自己的喜好,哪个顺就用哪个哈,不必太纠结这个。

  • 首先,让我们拉取项目到本地
  1. git clone https://github.com/browser-use/web-ui.git # 拉取项目
  2. cd web-ui # 进到这个项目里
复制代码
2. 安装依靠项:
  1. pip install browser-use
复制代码
3. 安装 Playwright
  1. playwright install
复制代码
4. 安装项目依靠
  1. pip install -r requirements.txt
复制代码
5. 配置情况变量
基于 .env.example 复制一个 .env 文件,并在 .env 文件中修改以下信息
  1. # 路径 Chrome 浏览器路径(检查下自己的路径),例如
  2. # Mac OS "/Applications/Google Chrome.app/Contents/MacOS/Google Chrome"
  3. # Windows "C:\Program Files\Google\Chrome\Application\chrome.exe"
  4. CHROME_PATH="/Applications/Google Chrome.app/Contents/MacOS/Google Chrome"
  5. # 浏览器的用户数据路径,例如
  6. # Mac OS "/Users/<YourUsername>/Library/Application Support/Google/Chrome"
  7. # Windows "C:\Users\<YourUsername>\AppData\Local\Google\Chrome\User Data"
  8. CHROME_USER_DATA="/Users/<YourUsername>/Library/Application Support/Google/Chrome"
  9. # 还有一些大模型的 API Key 也要改
  10. ...
复制代码
6. 启动运行
执行如下下令启动
  1. python webui.py --ip 127.0.0.1 --port 7788
复制代码
启动成功如下所示:

浏览器访问 http://127.0.0.1:7788/,看到如下界面就成功了

配置


  • 配置 Agent
注意,这里的 Use Vision,默认是选中状态,如果使用的 DeepSeek 不能勾选,由于 DeepSeek 不支持视觉输入,注意这里很多人踩坑,一定要注意。


  • 配置要用的大模子
例如,下面我用的是 deepseek。


  • 关于浏览器的一些设置

Demo 演示

输入要执行的任务就可以点击 Run Agent 了

以下是运行时的项目日志输出,记载了执行步调

执行的过程中也会打开浏览器和跳转到目标网站,按照区块一样对页面元素做标注。

在 Recodings 下会记载执行过程和反馈效果,还可以回看的。

感爱好的大家可以试试哦,不是很复杂!
DeepSeek无疑是2025开年AI圈的一匹黑马,在一众AI大模子中,DeepSeek以低价高性能的优势脱颖而出。DeepSeek的上线实现了AI界的又一大突破,各大科技巨头都敏捷出手,争先抢占DeepSeek大模子的流量风口。
DeepSeek的爆火,远不止于此。它是一场属于每个人的科技革命,一次冲破界限的机会,一次让平凡人也能逆袭契机。
DeepSeek的优点

掌握DeepSeek对于转行大模子领域的人来说是一个很大的优势,目前懂得大模子技能方面的人才很稀缺,而DeepSeek就是一个突破口。现在越来越多的人才都想往大模子方向转行,对于想要转行创业,提升自我的人来说是一个不可多得的机会。
那么应该怎样学习大模子

大模子时代,火爆出圈的LLM大模子让步伐员们开始重新评估自己的本事。 “AI会取代那些行业?”“谁的饭碗又将不保了?”等题目热议不断。
不如成为「掌握AI工具的技能人」,毕竟AI时代,谁先尝试,谁就能占得先机!
想正式转到一些新兴的 AI 行业,不仅必要系统的学习AI大模子。同时也要跟已有的技能联合,辅助编程提效,或上手实操应用,增加自己的职场竞争力。
大模子岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模子算法薪资平均值约39607元。

掌握大模子技能你还能拥有更多可能性:
• 成为一名全栈大模子工程师,包括Prompt,LangChain,LoRA等技能开辟、运营、产物等方向全栈工程;
• 能够拥有模子二次训练和微调能力,带领大家完成智能对话、文生图等热门应用;
• 薪资上浮10%-20%,覆盖更多高薪岗位,这是一个高需求、高报酬的热门方向和领域;
• 更优质的项目可以为未来创新创业提供基石。
可能大家都想学习AI大模子技能,也想通过这项技能真正达到升职加薪,就业或是副业的目标,但是不知道该怎样开始学习,由于网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。为了让大家少走弯路,少碰壁,这里我直接把都打包整理好,希望能够真正帮助到大家。
   这份完整版的大模子 AI 学习资料已经上传CSDN,朋友们如果必要可以微信扫描下方CSDN官方认证二维码免费领取【包管100%免费】

  

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

鼠扑

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表