2025年底,开源AI智能体项目OpenClaw(龙虾)横空出世,4个月斩获GitHub 25万星标。它标志着AI从“对话式辅助”向“操作式执行”的跨越,AI不再只是会聊天的界面,而是能打开文件、调用工具、执行命令的行动者。
这股浪潮迅速从电脑蔓延至手机。2026年开年,小米miclaw、华为小艺Claw直接以“Claw”命名,向OpenClaw的技术范式致敬,构成了国产“龙虾手机”阵营;三星×谷歌Gemini和苹果酝酿中的“LLM Siri”则从各自的技术积累出发,独立构建了自己的手机智能体方案;加上2025年底入场的其他纯GUI路线玩家,全球AI手机智能体形成了四条并行的技术路线。
四条路线,表面上是技术选择,底层是同一个问题:AI学会了“动手”,但这双手该不该有边界?
一、全球AI手机的四条路线与一条红线
第一条路线是国产“龙虾手机”阵营,小米miclaw和华为小艺Claw是目前全球最明确的“OpenClaw系”手机智能体,二者都以“Claw”命名,都将OpenClaw从命令行到手机端的范式迁移作为核心方向。
小米miclaw是这一阵营中技术路线最清晰的产品。3月6日发布并开启封闭测试,基于自研MiMo大模型,核心机制与OpenClaw的命令行执行内核同构——“推理-执行循环”:AI自主选择工具、填写参数、执行操作、读取结果、继续推理。工具层封装了50余项系统级能力,通过MCP协议(模型上下文协议)打通第三方生态扩展,内置米家协议客户端,授权后可调度超10亿台IoT设备。
miclaw走的是严格的API双重授权路线:每一步操作都通过明确定义的接口进行,开发者决定开放哪些能力,用户决定是否授权——透明、可审计、可撤销。用标准接口一步步扩展生态,比无差别接管所有App要慢,却是一条经得起检验的路。
小米技术在其公众号刊文《Xiaomi miclaw 封测 QA》,明确表示,由于不使用AccessibilityService(无障碍服务)模拟点击操作三方应用的行为,被判定为“外挂”的可能性极低,“目前 Xiaomi miclaw与三方应用协同服务,主要是通过两种方式,均属于行业通用的跨 APP 通信方式,一是Intent 驱动(SendIntentTool),二是第三方 App 也可以主动向 Xiaomi miclaw 推送通知触发任务。”
华为小艺Claw的具体授权机制和技术细节尚待进一步披露,但华为在系统级安全架构上的长期积累,为其提供了走向规范化的基础条件。
第二条路线是苹果App Intents(意图框架)的纯API双重授权方案,将主动权完全交给开发者。苹果的路线与OpenClaw没有直接关联,它是苹果自2022年起逐步构建的原生框架。App Intents让第三方App主动向Siri声明功能接口,开发者自行决定开放哪些能力、保护哪些数据,AI只能在开发者划定的范围内执行。敏感数据在苹果私有云中端到端加密。
苹果代号“LLM Siri”的新一代语音助手已多次延期,预计随iOS 26后续更新推出。覆盖范围完全取决于开发者是否主动适配,不设GUI兜底。这条路线的特点鲜明:宁可牺牲覆盖速度,也不在安全边界上妥协。
第三条路线是三星×谷歌Gemini则是API加GUI的双重授权方案,迄今零封杀。谷歌的方案同样是独立于OpenClaw的技术积累。2026年2月,三星Galaxy S26系列发布,Gemini正式以“智能体”身份亮相,谷歌同步公布了App Functions加UI Automation的双轨框架。
对已适配API的App,通过App Functions(意图框架)调用标准化接口,谷歌将其类比为设备端MCP协议;对未适配API的App,通过UI Automation基于Accessibility API在安全沙箱中进行语义级操作。关键在于双重授权机制:开发者侧,谷歌上线前主动沟通协商,开发者知情同意后才将其纳入操作范围;用户侧,操作全程透明,敏感操作须确认,可随时切回手动。GUI操作在独立虚拟环境中隔离运行,当前仅开放外卖、杂货、打车三类低风险场景。
第四条路线是纯GUI读屏点击,绕过了双重授权。2025年底,有厂商推出了以纯GUI Agent为核心能力的AI手机方案,用视觉语言模型截取屏幕像素理解界面,通过系统签名级权限注入触摸和按键事件,理论上可操作所有已安装App,无需任何适配。
但这条路线的根本问题在于:它完全跳过了开发者授权和用户确认。所使用的INJECT_EVENTS和READ_FRAME_BUFFER属于系统签名级高危权限,正常情况下只有手机系统本身才有资格调用。某手机厂商以OEM身份将这种权限外授给第三方应用,在Android权限体系中属于非常规操作。
市场给出了直接反馈:淘宝频繁人机验证,支付宝、京东、拼多多登录卡死,银行App检测到录屏后强制退出——主流App集体设防。这不是开发者“不够开放”,而是在没有获得授权的情况下,任何人闯入别人的领地都会遇到抵抗。
二、OpenClaw为全球AI手机指明双重授权范式
四条路线的分野,归根到底是一个问题:AI执行操作时,是否需要同时获得工具提供者(开发者)和使用者(用户)的双重授权?
OpenClaw虽然生在命令行世界,但它从实践中确认了一条基本规律——双重授权原则。工具提供者决定暴露哪些命令和接口,即开发者侧授权,用户决定是否允许AI执行,即用户侧授权,两者缺一不可。即便有了这层约束,ClawHavoc供应链投毒事件仍影响了超过13.5万台设备。
手机上的隐私密度远超电脑——社交聊天记录、支付宝余额、银行App,每一项都关乎用户的核心利益。在有授权约束的命令行环境下安全风险尚且如此,到了手机上若把约束全部拆除,后果不难推想。
由此回看四条路线的选择逻辑:谷歌拥有Android全部源码,苹果拥有iOS全栈控制力。论技术能力,这两家全球操作系统主导者想实现无差别屏幕操控比任何第三方都容易。但两家都主动选择了不这样做,不是因为技术做不到,而是它们清楚,一旦打破授权边界,整个生态的信任基础将随之瓦解。
小米miclaw通过API封装和MCP协议扩展,每一步都在接口定义的范围内运行。华为小艺Claw虽然尚未披露完整的授权机制,但鸿蒙系统层面的安全能力为其预留了走向双重授权的技术空间。
苹果、谷歌、小米三家殊途同归的选择,不是巧合,而是共识:AI智能体的执行能力越强大,双重授权的约束就越不可或缺。这不是对创新的限制,而是AI智能体走向大规模商用的前提。
绕过双重授权的纯GUI路线则走向了另一面,AI智能体可以“看到”屏幕上的一切信息,可以“操作”任何界面元素,整个过程既不经过开发者授权也不向用户充分披露风险。主流App的集体设防,已经给出了生态的判决。
三、中国AI手机的全球竞争,重在信任而非速度
有一个类比值得深思。当年三聚氰胺事件中,掺假奶粉的蛋白质检测指标反而“更好”,代价是整个中国乳制品行业用了十多年才逐渐修复的信用危机。
纯GUI路线表面上功能更全,什么App都能操作,无需适配。但一旦出现安全事故,用户支付信息被误操作、社交通信被泄露、金融App被非授权访问,受损的不仅是某一家公司,而是中国AI产业在全球市场的整体信誉。
2026年两会上,全国人大代表、中国工程院院士高文谈到AI智能体时强调,要为AI设定清晰的活动边界。全国政协委员贺晗建议为高权限智能体设置“安全沙盒”与“一键熔断”机制。代表委员们传递的信号一致:AI越强大,越需要明确的规则框架。
在中美AI竞争的格局下,中国AI手机产业真正要赢的,不是谁先操控所有App的短期竞速,而是谁的AI更值得全世界用户信任的长期竞争。国产“龙虾手机”阵营已经在用实际行动证明,中国厂商有能力走出一条兼顾安全与创新的路线。miclaw的API+MCP生态路线,正在向全球市场展示中国AI手机的另一种可能。
四、从CLI到API:端侧智能体的双轨格局浮现
有一个更深层的趋势值得关注。
OpenClaw证明了AI智能体在PC端以CLI(命令行接口)为核心执行通道的可行性——文本指令、标准工具、明确参数,天然适配开发者的工作流。而当AI智能体“下沉”到手机端,CLI显然不再适用:普通用户不会在手机上敲命令行。于是,各家不约而同地转向了API路线——通过系统级接口封装和标准化协议(如MCP),让AI在结构化的接口通道中完成操作。
这意味着,端侧AI智能体正在形成一个双轨格局:PC和服务器侧以CLI为主干,手机和消费级终端以API为主干。两条轨道的底层逻辑一致,都是通过明确定义的接口调用工具,都遵循双重授权原则,但封装方式因终端形态而异。CLI面向开发者,强调灵活性和可组合性;手机API面向普通用户,强调安全性和易用性。
华为小艺Claw的跨设备布局则暗示了第三种可能:当AI智能体从手机延伸到车机、智慧屏、穿戴设备时,不同终端可能需要不同的接口范式——车机侧重语音指令和场景感知,穿戴设备侧重传感器数据和轻量化交互。未来的端侧智能体,很可能不是一条路线走天下,而是在双重授权原则这条红线之上,根据终端特性适配多种执行通道。
(本文仅代表作者本人观点,责编:闫曼 man.yan@ftchinese.com)