论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
IT评测·应用市场-qidao123.com
»
论坛
›
软件与程序人生
›
前端开发
›
browser-use WebUI + DeepSeek V3 把浏览器整成自动化了 ...
browser-use WebUI + DeepSeek V3 把浏览器整成自动化了!
鼠扑
论坛元老
|
2025-3-11 03:06:55
|
显示全部楼层
|
阅读模式
楼主
主题
1035
|
帖子
1035
|
积分
3105
Github 上有个开源项目 browser-use,这个项目最近老火了,目前拥有 11K Star,它的作用是
将 AI Agent 与浏览器链接起来从而实现由 AI 驱动的浏览器自动化
。接入也很简朴,不过要写一点代码。
这两天有个老哥基于 browser-use,写了个 UI 界面,在体验层面同时也做了一些功能扩展,让它的使用门槛更低了,之前的 Github 开源地址是 https://github.com/warmshao/browser-use-webui。现在为 https://github.com/browser-use/web-ui
browser-use webui 主要功能
提供了全新的网页界面,简朴好用,方便操纵。
支持更多大语言模子,比如 Gemini、OpenAI、Azure 等,哦,还有最近爆火的国产大模子 DeepSeek,未来还会加更多。
支持用自己的浏览器,不用再反复登录,还能录屏。
定制了更智能的 Agent,通过优化后的提示让浏览器使用更高效。
安装
这个项目已在 Github 开源,想玩的都可以试试,用 Python 写的,版本必须在 3.11 以上。
我是使用 pyenv 管理 python 版本,在 browser-use/web-ui 最新文档中是推荐 https://docs.astral.sh/uv/ 管理 Python 版本,大家可以根据自己的喜好,哪个顺就用哪个哈,不必太纠结这个。
首先,让我们拉取项目到本地
git clone https://github.com/browser-use/web-ui.git # 拉取项目
cd web-ui # 进到这个项目里
复制代码
2. 安装依靠项:
pip install browser-use
复制代码
3. 安装 Playwright
playwright install
复制代码
4. 安装项目依靠
pip install -r requirements.txt
复制代码
5. 配置情况变量
基于 .env.example 复制一个 .env 文件,并在 .env 文件中修改以下信息
# 路径 Chrome 浏览器路径(检查下自己的路径),例如
# Mac OS "/Applications/Google Chrome.app/Contents/MacOS/Google Chrome"
# Windows "C:\Program Files\Google\Chrome\Application\chrome.exe"
CHROME_PATH="/Applications/Google Chrome.app/Contents/MacOS/Google Chrome"
# 浏览器的用户数据路径,例如
# Mac OS "/Users/<YourUsername>/Library/Application Support/Google/Chrome"
# Windows "C:\Users\<YourUsername>\AppData\Local\Google\Chrome\User Data"
CHROME_USER_DATA="/Users/<YourUsername>/Library/Application Support/Google/Chrome"
# 还有一些大模型的 API Key 也要改
...
复制代码
6. 启动运行
执行如下下令启动
python webui.py --ip 127.0.0.1 --port 7788
复制代码
启动成功如下所示:
浏览器访问 http://127.0.0.1:7788/,看到如下界面就成功了
配置
配置 Agent
注意,这里的 Use Vision,默认是选中状态,
如果使用的 DeepSeek 不能勾选,由于 DeepSeek 不支持视觉输入
,注意这里很多人踩坑,一定要注意。
配置要用的大模子
例如,下面我用的是 deepseek。
关于浏览器的一些设置
Demo 演示
输入要执行的任务就可以点击 Run Agent 了
以下是运行时的项目日志输出,记载了执行步调
执行的过程中也会打开浏览器和跳转到目标网站,按照区块一样对页面元素做标注。
在 Recodings 下会记载执行过程和反馈效果,还可以回看的。
感爱好的大家可以试试哦,不是很复杂!
DeepSeek
无疑是2025开年AI圈的一匹黑马,在一众AI大模子中,DeepSeek以低价高性能的优势脱颖而出。DeepSeek的上线实现了AI界的又一大突破,各大科技巨头都敏捷出手,争先抢占DeepSeek大模子的流量风口。
DeepSeek
的爆火,远不止于此。它是一场属于每个人的科技革命,一次冲破界限的机会,一次让平凡人也能逆袭契机。
DeepSeek的优点
掌握DeepSeek对于转行大模子领域的人来说是一个很大的优势,目前懂得大模子技能方面的人才很稀缺,而DeepSeek就是一个突破口。现在越来越多的人才都想往大模子方向转行,对于想要转行创业,提升自我的人来说是一个不可多得的机会。
那么应该怎样学习大模子
大模子时代,火爆出圈的LLM大模子让步伐员们开始重新评估自己的本事。 “AI会取代那些行业?”“谁的饭碗又将不保了?”等题目热议不断。
不如成为「掌握AI工具的技能人」,毕竟AI时代,谁先尝试,谁就能占得先机!
想正式转到一些新兴的 AI 行业,不仅必要系统的学习AI大模子。同时也要跟已有的技能联合,辅助编程提效,或上手实操应用,增加自己的职场竞争力。
大模子岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模子算法薪资平均值约39607元。
掌握大模子技能你还能拥有更多可能性:
• 成为一名全栈大模子工程师,包括Prompt,LangChain,LoRA等技能开辟、运营、产物等方向全栈工程;
• 能够拥有模子二次训练和微调能力,带领大家完成智能对话、文生图等热门应用;
• 薪资上浮10%-20%,覆盖更多高薪岗位,这是一个高需求、高报酬的热门方向和领域;
• 更优质的项目可以为未来创新创业提供基石。
可能大家都想学习AI大模子技能,也想通过这项技能真正达到升职加薪,就业或是副业的目标,但是不知道该怎样开始学习,由于网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。为了让大家少走弯路,少碰壁,这里我直接把都打包整理好,希望能够真正帮助到大家。
这份完整版的大模子 AI 学习资料已经上传CSDN,朋友们如果必要可以微信扫描下方CSDN官方认证二维码免费领取【包管100%免费】
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
鼠扑
论坛元老
这个人很懒什么都没写!
楼主热帖
Java 基于Apache POI实现Excel读写操作 ...
Dapr 知多少 | 分布式应用运行时 ...
XAF新手入门 - 类型子系统(Types Info ...
springboot开启单元测试的方法分享 ...
记录一次NoSuchMethodError问题的解决 ...
C#生成putty格式的ppk文件(支持passph ...
5.15日 搭建青龙面板教程——狗东跑跑 ...
Python 封装SNMP调用接口
风险洞察之事件总线的探索与演进 ...
子查询优化之 Semi-join 优化 | StoneD ...
标签云
运维
CIO
存储
服务器
浏览过的版块
鸿蒙
SQL-Server
图数据库
分布式数据库
Mysql
快速回复
返回顶部
返回列表