UI-TARS-desktop 是字节跳动推出的开源原生桌面端 AI Agent 应用。它基于 UI-TARS 多模态大模型,通过计算机视觉直接理解并操作图形用户界面(GUI)。该产品支持本地及远程计算机、浏览器的自动化控制,无需复杂配置即可实现类人化的任务处理。其核心采用 MCP 协议集成现实世界工具,支持 UI-TARS-1.5 模型,提供精准的视觉定位与动作执行能力,适用于自动化办公、复杂网页操作等场景。
#agent#agent-tars#browser-use#computer-use