UI-TARS-desktop
by bytedance
介绍
UI-TARS-desktop 是字节跳动推出的开源原生桌面端 AI Agent 应用。它基于 UI-TARS 多模态大模型,通过计算机视觉直接理解并操作图形用户界面(GUI)。该产品支持本地及远程计算机、浏览器的自动化控制,无需复杂配置即可实现类人化的任务处理。其核心采用 MCP 协议集成现实世界工具,支持 UI-TARS-1.5 模型,提供精准的视觉定位与动作执行能力,适用于自动化办公、复杂网页操作等场景。
功能特征
- 原生 GUI Agent 交互
- 远程计算机与浏览器控制
- 基于视觉的多模态模型驱动
- MCP 协议工具集成
- 端到端自动化任务执行
支持平台
desktopweb