Technical Note
阿里开源MAI-UI!32B通用GUI智能体能力超Gemini-3-Pro
# 阿里刚刚开源了通用GUI智能体:MAI-UI,其32B的GUI视觉定位能力在ScreenSpot-Pro上超Gemini-3-Pro
MAI-UI首次将用户交互、MCP、端云协同三个能力原生集成于统一架构中
在办公、生活、出行、购物等高频场景中的任务自动化能力较强
MAI-UI原生具备用户交互能力,就是说当指令不完整或表达模糊时会主动提问,通过与用户交互先行澄清关键信息、拒绝臆断,并将澄清信息纳入任务记忆,确保执行路径始终与用户的真实意图对齐
想要查看完整笔记内容并体验 AI 智能整理功能吗?
免费注册 MeActMAI-UIGUI智能体阿里开源智能体手机智能体