我原以为最早推出这种搭载强大 AI 助手的手机会是苹果或者 Google,却没想到最先推出的 AI 手机的是豆包,他们联合中兴推出了一款内置 AI 手机助手的智能手机,有点类似 Google 最新发布的 AI 助手 Gemini 深度融入手机的概念,做了 OpenAI 最想做而还没做到的事,也不知道 OpenAI 自己的 AI 设备什么时候能问世。

我其实一直希望有一部这样的手机,能有个 AI 助理帮我干杂活,比如在多个 App 之间帮我全网比价下单、自动回复那些例行的「收到/好的」消息,甚至抢票、填表这些日常琐事,都能为我省下时间和精力。

豆包助手手机目前在美国还买不到,国内也卖断货了。在 X 上看有不少网友像小互、dontbesilent 都已经用上了,只能表示下羡慕。

不过最让我吃惊的还是去年还不太成熟的 GUI Agent 技术,现在已经可以实现如此高的准确率和实用性。从官方演示和一些网友的分享中,豆包 AI 手机助手真的展示了“看懂”手机屏幕并像人一样模拟点击操作的能力,比如比价、订票这些复杂的操作。

跨应用自动完成复杂任务的突破,一方面要归功于新一代具备强推理能力的大模型出现,另一方面也离不开豆包自主大模型在 Agent 能力上的飞跃提升。据官方介绍,豆包模型在视觉理解、推理以及图像创作等方面的性能已达国际一流水平;正是因为模型具备了精准的图形界面识别能力,它才能在多项权威评测中拿到业界最佳成绩,像人类一样理解界面上的“按钮”和“输入框”等含义,而不只是识别一堆代码。

与用户的火热反应相比,各大应用厂商的反应却截然不同。微信是最先对限制豆包 AI 手机助手应用,许多用户在该手机上使用豆包助手操作微信时,微信都会异常退出甚至无法登录。支付宝等金融类 App 也开始出现类似情况,有测试用户反馈在豆包手机上登录支付宝会被判定环境异常,触发安全风控。

这种抵制其实完全可以理解:毕竟 AI 帮你操作手机后,你就无需亲自看那些 App 的开屏广告和推荐信息流了。以前用户每天默认打开的那几个常用 App,今后可能一个都不用手动打开。也许只有抖音、B 站这种纯娱乐型应用(短期内 AI 还替代不了用户“看视频”的需求)不会受到影响。

不过,这一切或许只是一个时代的开端。从科技发展的历史看,「便利性」通常最终会战胜「阻力」,只是过程会伴随着巨大的利益重新分配。用户总是倾向于更懒、更聚合的操作方式。就像当初我们是实体店购物,到后来使用淘宝网上购物,未来必然会发展到大部分事情都直接让 AI 助理来搞定。

当用户习惯了动嘴不动手,用户就会更多依赖那些对 AI 助手支持好的应用,未来这会倒逼 App 厂商做出改变。

去年很多人都说 2025 年会是 Agent 元年,当时我还是持怀疑态度的,但今年先是 Claude Code 开启了 Coding Agent 的时代,现在豆包 AI 手机看起来也开启了 GUI Agent 的时代,让我现在对 Agent 的未来还是很乐观的。

不知道你有没有用上豆包 AI 手机?如果用过感觉如何?你对“AI 手机”又有怎么样的期待?