当前位置: 首页 > news >正文

Browser-use 是连接你的AI代理与浏览器的最简单方式

AI MCP 系列

AgentGPT-01-入门介绍

Browser-use 是连接你的AI代理与浏览器的最简单方式

AI MCP(大模型上下文)-01-入门介绍

AI MCP(大模型上下文)-02-awesome-mcp-servers 精选的 MCP 服务器

AI MCP(大模型上下文)-03-open webui 介绍 是一个可扩展、功能丰富且用户友好的本地部署 AI 平台,支持完全离线运行。

AI MCP(大模型上下文)-04-n8n 为技术团队打造的安全工作流自动化平台

AI MCP(大模型上下文)-05-anything-llm AnythingLLM 您一直在寻找的全方位AI应用程序

AI MCP(大模型上下文)-06-maxkb 强大易用的企业级 AI 助手

AI MCP(大模型上下文)-07-dify 入门介绍

AI MCP(大模型上下文)-08-分享一些好用的 Dify DSL 工作流程

AI MCP(大模型上下文)-09-基于Dify自主创建的AI应用DSL工作流

AI MCP(大模型上下文)-10-Activepieces 一个开源的 Zapier 替代方案

AI MCP(大模型上下文)-11-微软 Playwright MCP server

AI MCP(大模型上下文)-12-AWS MCP

AI MCP(大模型上下文)-13-github MCP

启用AI控制你的浏览器 🤖

🌐 Browser-use 是将AI代理与浏览器连接的最简单方式。

💡 查看别人正在构建的内容,并在我们的 Discord 上分享你的项目!想要周边?看看我们的 Merch商店。

🌤️ 跳过设置 —— 试试我们的托管版本,即时浏览器自动化!试试云端 ☁︎


快速开始

使用pip(Python >=3.11):

pip install browser-use

安装Playwright:

playwright install chromium

启动你的代理:

from langchain_openai import ChatOpenAI
from browser_use import Agent
import asyncio
from dotenv import load_dotenv
load_dotenv()async def main():agent = Agent(task="比较gpt-4o和DeepSeek-V3的价格",llm=ChatOpenAI(model="gpt-4o"),)await agent.run()asyncio.run(main())

将你想使用的提供商的API密钥添加到.env文件中。

OPENAI_API_KEY=  
ANTHROPIC_API_KEY=  
AZURE_ENDPOINT=  
AZURE_OPENAI_API_KEY=  
GEMINI_API_KEY=  
DEEPSEEK_API_KEY=  

有关其他设置、模型等,请查阅 文档 📕。


UI测试

你可以测试 browser-use的UI仓库

或者简单地运行gradio示例:

pip install gradio
python examples/ui/gradio_demo.py

演示

任务:添加杂货到购物车并结账


提示:将我最新的LinkedIn关注者添加到Salesforce中的潜在客户列表。


提示:阅读我的简历并寻找机器学习工作,将它们保存到文件中,然后开始在新标签页中申请,如果需要帮助,问我

示例


提示:在Google Docs中写一封信给我爸爸,感谢他的一切,并将文件保存为PDF


提示:查找具有cc-by-sa-4.0许可证的模型,并按最受欢迎排序,保存前5个到文件

文件


更多示例

欲了解更多示例,请查看examples文件夹或加入Discord,展示你的项目。


愿景

告诉你的计算机做什么,它就会完成。


路线图

代理
  • 改进代理记忆(总结、压缩、RAG等)
  • 增强规划能力(加载特定网站的上下文)
  • 减少token消耗(系统提示、DOM状态)
DOM提取
  • 改进日期选择器、下拉框、特殊元素的提取
  • 改进UI元素的状态表示
任务重跑
  • 使用LLM作为回退
  • 简化工作流模板定义,其中LLM填写详细信息
  • 从代理返回playwright脚本
数据集
  • 创建复杂任务的数据集
  • 对不同模型进行基准测试
  • 针对特定任务微调模型
用户体验
  • 人工干预执行
  • 改进生成的GIF质量
  • 创建各种演示以进行教程执行、职位申请、QA测试、社交媒体等。

相关文章:

  • 什么是跨域问题以及其解决方案
  • mac上面使用zip命令压缩一劳永逸
  • 逆周期中的“深潜者”样本,解码康佳“智造”破局密码
  • Spark-SQL(二)
  • 轻量级Python IDE使用(五)——条件分支
  • STM32F103_HAL库+寄存器学习笔记15 - 梳理CAN发送失败时,涉及哪些寄存器
  • Linux:Ext系列文件系统
  • Python网络爬虫设计(一)
  • 牛客月赛114
  • DDS函数信号发生器设计
  • Redis之RedLock算法以及底层原理
  • YOLOv2学习笔记
  • 实战指南:封装Whisper为FastAPI接口并实现高并发处理-附整合包
  • 案例驱动的 IT 团队管理:创新与突破之路:第四章 危机应对:从风险预见到创新破局-4.2 人才流失危机-4.2.3梯队建设的“洋葱模型“
  • 【MySQL】
  • 阿里FPGA XCKU3P开箱- 25G 光纤
  • 鸿蒙NEXT开发全局上下文管理类(ArkTs)
  • 进程的查看与属性
  • java分页实例
  • Python + Playwright:编写自动化测试的避坑策略
  • 著名电化学家、我国工业电化学奠基人之一郭鹤桐逝世
  • 文旅部:今年中国旅游日活动合作单位扩大至60多家
  • A股低开高走,震荡收涨:两市成交10414亿元,4360股收涨
  • 大理州工业投资(集团)有限公司党委副书记、副总经理赵云接受审查调查
  • 伊朗艺术中的中国风
  • 上海召开全市加强社会治安综合治理中心规范化建设工作推进会