字节跳动推出的开源原生 GUI 代理模型
字节跳动发布并开源了 UI-TARS 大模型,是专门用于操控电脑界面的视觉语言模型,具备感知、推理和操作能力。UI-TARS提供2B、7B和72B三种参数规模版本,支持跨平台操作,能通过自然语言指令完成鼠标点击、键盘输入等任务。在多个基准测试中,UI-TARS表现优于GPT-4和Claude。
版权声明:
作者:来吧来吧27
链接:https://deepseek-seo.net/%e5%ad%97%e8%8a%82%e8%b7%b3%e5%8a%a8%e6%8e%a8%e5%87%ba%e7%9a%84%e5%bc%80%e6%ba%90%e5%8e%9f%e7%94%9f-gui-%e4%bb%a3%e7%90%86%e6%a8%a1%e5%9e%8b-10/
来源:Deepseek SEO Hub
文章版权归作者所有,未经允许请勿转载。
THE END
二维码