10月27日消息,近日,SuperCLUE正式发布首期AgentCLUE-Mobile手机GUI Agent(离线)测评报告。
其中,小米集团旗下MiMo-VL-7B-RL-2508表现亮眼,从13款国内外智能体产品中脱颖而出,以总分90.01分的优异成绩斩获金牌。
测试中,小米智能体在任务完成度、平均动作类型准确率和平均动作细节准确匹配率均较高。

据了解,本次测评基准适配中文原生场景,任务基于国内用户日常手机使用场景开发,贴合中文用户操作习惯。
AgentCLUE-Mobile测评围绕音乐播放、视频娱乐、交通导航、旅行预订、社交通讯、生活服务、本机应用七大场景,聚焦手机GUI Agent的UI元素定位与指令执行两大核心能力展开。
通过七大场景与两大核心能力测评,AgentCLUE-Mobile为手机GUI Agent性能评估提供精准全面的参考。

