据媒体报道,近日新加坡国立大学团队,在20多个场景下对Claude的电脑操控能力进行了全面测试。
结果显示,AI不仅能自动完成手游日常任务,还能执行复杂的办公任务。
研究中选用了米哈游《崩坏:星穹铁道》,可以跟它说”帮我完成今天的模拟宇宙”,Claude就能自动完成各种任务,甚至包括启动自动战斗和等待战斗结束后退出,操作行云流水。
特别值得一提的是,这并不是传统游戏外挂那样的机械操作,Claude还能智能理解游戏规则和目标,根据界面上不同的任务进行调整。
除了《崩坏:星穹铁道》,AI还能自动玩《炉石传说》,包括创建和重命名牌组、使用英雄技能等。
团队基于Claude Computer Use的API设计了一个自动化GUI框架,该框架包括系统提示、状态观察、推理范式等六个部分。
AI通过这个框架能够执行网页搜索、工作流程模型、办公生产力软件等日常办公场景下的任务。
例如,在Amazon和Apple官方网站上成功完成下单购物的任务,选择颜色配置、填写地址等操作。
虽然AI在复杂网页操作和办公软件中有部分任务失败,但整体表现已相当出色,团队还公开了所有测试用例的具体信息,供有兴趣的研究者和开发者进一步探索。