browser-use web-ui：浏览器自动化 AI 控制台

摘要

一句话总结 browser-use/web-ui 是一个基于 Gradio 构建的开源 Python 项目，允许用户通过友好的 Web 界面在浏览器中运行和交互 AI 代理，并支持多种主流大语言模型与自定义本地浏览器配置。
核心要点

项目基础与热度：基于 browser-use 核心库开发，采用 MIT 开源协议，目前在 GitHub 上拥有 15607 个 Stars 和 2687 个 Forks，最新版本为 v3.0.0。
UI 框架：前端界面基于 Gradio 构建，设计用户友好，支持绝大多数 browser-use 的原生功能。
广泛的 LLM 支持：集成了多种大语言模型，包括 Google、OpenAI、Azure OpenAI、Anthropic、DeepSeek（已支持 DeepSeek-r1 深度思考）以及 Ollama 等。
自定义浏览器支持：允许用户接入本地自带的浏览器（需配置可执行文件和用户数据路径），从而免去重复登录和身份验证的繁琐步骤，同时支持高清屏幕录制。
持久化浏览器会话：支持在不同的 AI 任务之间保持浏览器窗口处于打开状态，以便用户查看完整的交互历史和状态。
本地安装便捷：推荐使用 uv 管理 Python 3.11 虚拟环境，底层依赖 Playwright 驱动浏览器，默认通过 127.0.0.1:7788 访问 WebUI。
Docker 容器化部署：提供 Docker Compose 部署方案（兼容 ARM64 架构），并内置了 VNC 视图（默认端口 6080），方便用户实时监控 AI 代理的浏览器操作过程。

🖥️ Run AI Agent in your browser.