我原以为最早推出这种搭载强大 AI 助手的手机会是苹果或者 Google,却没想到最先推出的 AI 手机的是豆包,他们联合中兴推出了一款内置 AI 手机助手的智能手机,有点类似 Google 最新发布的 AI 助手 Gemini 深度融入手机的概念,做了 OpenAI 最想做而还没做到的事,也不知道 OpenAI 自己的 AI 设备什么时候能问世。
我其实一直希望有一部这样的手机,能有个 AI 助理帮我干杂活,比如在多个 App 之间帮我全网比价下单、自动回复那些例行的「收到/好的」消息,甚至抢票、填表这些日常琐事,都能为我省下时间和精力。
豆包助手手机目前在美国还买不到,国内也卖断货了。在 X 上看有不少网友像小互、dontbesilent 都已经用上了,只能表示下羡慕。
不过最让我吃惊的还是去年还不太成熟的 GUI Agent 技术,现在已经可以实现如此高的准确率和实用性。从官方演示和一些网友的分享中,豆包 AI 手机助手真的展示了“看懂”手机屏幕并像人一样模拟点击操作的能力,比如比价、订票这些复杂的操作。
跨应用自动完成复杂任务的突破,一方面要归功于新一代具备强推理能力的大模型出现,另一方面也离不开豆包自主大模型在 Agent 能力上的飞跃提升。据官方介绍,豆包模型在视觉理解、推理以及图像创作等方面的性能已达国际一流水平;正是因为模型具备了精准的图形界面识别能力,它才能在多项权威评测中拿到业界最佳成绩,像人类一样理解界面上的“按钮”和“输入框”等含义,而不只是识别一堆代码。
与用户的火热反应相比,各大应用厂商的反应却截然不同。微信是最先对限制豆包 AI 手机助手应用,许多用户在该手机上使用豆包助手操作微信时,微信都会异常退出甚至无法登录。支付宝等金融类 App 也开始出现类似情况,有测试用户反馈在豆包手机上登录支付宝会被判定环境异常,触发安全风控。
这种抵制其实完全可以理解:毕竟 AI 帮你操作手机后,你就无需亲自看那些 App 的开屏广告和推荐信息流了。以前用户每天默认打开的那几个常用 App,今后可能一个都不用手动打开。也许只有抖音、B 站这种纯娱乐型应用(短期内 AI 还替代不了用户“看视频”的需求)不会受到影响。
不过,这一切或许只是一个时代的开端。从科技发展的历史看,「便利性」通常最终会战胜「阻力」,只是过程会伴随着巨大的利益重新分配。用户总是倾向于更懒、更聚合的操作方式。就像当初我们是实体店购物,到后来使用淘宝网上购物,未来必然会发展到大部分事情都直接让 AI 助理来搞定。
当用户习惯了动嘴不动手,用户就会更多依赖那些对 AI 助手支持好的应用,未来这会倒逼 App 厂商做出改变。
去年很多人都说 2025 年会是 Agent 元年,当时我还是持怀疑态度的,但今年先是 Claude Code 开启了 Coding Agent 的时代,现在豆包 AI 手机看起来也开启了 GUI Agent 的时代,让我现在对 Agent 的未来还是很乐观的。
不知道你有没有用上豆包 AI 手机?如果用过感觉如何?你对“AI 手机”又有怎么样的期待?
我其实一直希望有一部这样的手机,能有个 AI 助理帮我干杂活,比如在多个 App 之间帮我全网比价下单、自动回复那些例行的「收到/好的」消息,甚至抢票、填表这些日常琐事,都能为我省下时间和精力。
豆包助手手机目前在美国还买不到,国内也卖断货了。在 X 上看有不少网友像小互、dontbesilent 都已经用上了,只能表示下羡慕。
不过最让我吃惊的还是去年还不太成熟的 GUI Agent 技术,现在已经可以实现如此高的准确率和实用性。从官方演示和一些网友的分享中,豆包 AI 手机助手真的展示了“看懂”手机屏幕并像人一样模拟点击操作的能力,比如比价、订票这些复杂的操作。
跨应用自动完成复杂任务的突破,一方面要归功于新一代具备强推理能力的大模型出现,另一方面也离不开豆包自主大模型在 Agent 能力上的飞跃提升。据官方介绍,豆包模型在视觉理解、推理以及图像创作等方面的性能已达国际一流水平;正是因为模型具备了精准的图形界面识别能力,它才能在多项权威评测中拿到业界最佳成绩,像人类一样理解界面上的“按钮”和“输入框”等含义,而不只是识别一堆代码。
与用户的火热反应相比,各大应用厂商的反应却截然不同。微信是最先对限制豆包 AI 手机助手应用,许多用户在该手机上使用豆包助手操作微信时,微信都会异常退出甚至无法登录。支付宝等金融类 App 也开始出现类似情况,有测试用户反馈在豆包手机上登录支付宝会被判定环境异常,触发安全风控。
这种抵制其实完全可以理解:毕竟 AI 帮你操作手机后,你就无需亲自看那些 App 的开屏广告和推荐信息流了。以前用户每天默认打开的那几个常用 App,今后可能一个都不用手动打开。也许只有抖音、B 站这种纯娱乐型应用(短期内 AI 还替代不了用户“看视频”的需求)不会受到影响。
不过,这一切或许只是一个时代的开端。从科技发展的历史看,「便利性」通常最终会战胜「阻力」,只是过程会伴随着巨大的利益重新分配。用户总是倾向于更懒、更聚合的操作方式。就像当初我们是实体店购物,到后来使用淘宝网上购物,未来必然会发展到大部分事情都直接让 AI 助理来搞定。
当用户习惯了动嘴不动手,用户就会更多依赖那些对 AI 助手支持好的应用,未来这会倒逼 App 厂商做出改变。
去年很多人都说 2025 年会是 Agent 元年,当时我还是持怀疑态度的,但今年先是 Claude Code 开启了 Coding Agent 的时代,现在豆包 AI 手机看起来也开启了 GUI Agent 的时代,让我现在对 Agent 的未来还是很乐观的。
不知道你有没有用上豆包 AI 手机?如果用过感觉如何?你对“AI 手机”又有怎么样的期待?