Normal view

There are new articles available, click to refresh the page.
Before yesterdayMain stream

豆包手机助手让海外炸锅,歪果仁:这是第一款真正意义上的智能手机

By: 李超凡
8 December 2025 at 17:00

没想到在华为 Mate 80 系列、三星首款三折叠接连发布的一周里,最火的会是搭载豆包手机助手技术预览版的中兴 nubia M153。

发售即售罄就不说了,首批工程机在二手平台上普遍加价数百元转卖。相比官方 3499 元的定价,市场需求确实旺盛。

尽管豆包手机助手官方多次强调,目前的技术预览版并不面向普通的消费者。其定位更像是一个技术展示和生态探索的实验田,吸引开发者和技术发烧友参与体验。

但这根本挡不住大众体验的热情。除了点外卖发帖子这些基操,还有网友用它 10 分钟投了 30 份简历。

不过争议也随之而来,微信、淘宝等一众 App,开始通过「环境异常检测」等门槛把豆包手机助手拦在门外。

官方目前也调整部分 AI 操作手机的能力,官方表示希望「推动形成更清晰、可预期的规则」,避免一刀切否定用户合理使用 AI 的权利。

罗永浩则发文力挺,称这是谁都拦不住的技术革命,将来人们会记住这历史性的一天。荣耀表态欢迎,而魅族厂商则表示期待深入合作,打造更繁荣的生态。

而在国内出圈后,豆包手机助手甚至火到了海外,在 X 平台上,一堆老外都在疯狂讨论这事,甚至有人直接给它冠上了「另一个 DeepSeek 时刻」的称号。

海外网友:第一款真正意义上的智能手机

这评价,可不是随便给的。

雪牛资本(Snow Bull Capital)CEO 泰勒·奥根(Taylor Ogan)直接在平台上发了一长串体验报告,兴奋劲儿都快从屏幕里溢出来了。

他的评价很直白:这是全球第一款真正意义上的智能手机。

在豆包手机助手的协助下,AI 能完全控制手机——能「看懂」界面、自己选应用或下载 App、点击按钮、输入文字、拨打电话,甚至还能执行一整串多步骤任务链。

拿到手机后,他整了不少花活儿。比如随手拍张蔚来换电站问「这是啥」,AI 秒答。

拍个酒店门口,豆包不仅能识别出是哪家酒店,还能根据 Ogan 的需求预定房间,并查询宠物政策。

打辆无人驾驶出租车去公园,豆包能够规划好路线,用最近的上车点完成预约。Ogan 全程只需要用语言表达意图,其它都交给豆包。

用它下单两杯饮料后,外卖无人机很快就把订单飞送到附近储物柜。

走在街上, Ogan 拍了家新开的店,问它是不是本地的品牌,豆包也能查询工商和商标信息,然后果断回答:「是的」。

全程 AI 自己干活,人就负责躺平。

一顿丝滑操作下来,海外网友们大为震惊。

随便翻翻评论区,清一色的点赞声。有网友感慨:「此刻,操作系统变成了管家,手机变成了执行者,而不再只是工具。」有网友猝不及防地表白:「我本来就喜欢豆包,现在更爱它了。」

还有网友直接化身「哇塞哥」:

这是下一级别的东西。我在企业级见过类似的东西,Agent 控制你的 PC 并执行任务,但在手机上有这种技术真的很有意思。想象一下,当谷歌开始在 Pixel 设备和几乎所有 Android 手机上这样做时会发生什么……

Pixel 内心 belike,不对劲,怎么感觉有人在点我?

当然,质疑声也有。有人问:「但它真的智能吗?这模型能在设备上本地运行吗?」Taylor Ogan 的回应是:「它太智能了。你可以选择在设备端运行或云端运行。」

在 Reddit 平台上,讨论同样火热。

有网友表示:「只要这些功能是设备本地的(不使用云服务),并且使用是可选的,我就支持这个。」还有网友一针见血地点出了 AI 的真正意义:「这就是 AI 应该做的事情,为个人节省时间,而不是试图消除个人的价值。」

有一说一,在豆包手机助手发布之后,网友分享在 X 平台上的玩法,也是一个比一个「邪修」。有用豆包点咖啡,也有让豆包 AI 操作安卓机,模拟人手滑页面,主打一个全流程自动化。

还有网友用豆包手机助手下单买了个椰子,由于没够起送价,豆包贴心地帮博主选了一个 1.99 元的一包食用盐来凑单。

APPSO 在之前对豆包手机助手的体验提到,我最直观的感受是,手机变「薄」了,它把各个 App 的能力都「拍扁」了,交互更加自然、直观和高效。

问题来了,这是怎么做到的?这和「phone use」智能体又有什么不同?

在用了一周豆包手机助手后,APPSO 也扒出了背后更多的技术细节。

我扒出了豆包手机助手操作手机的秘密

在豆包手机助手发布之前,手机行业其实已经折腾 AI+ 好一阵子了。

手机硬件厂商试图通过系统层级的 AI 能力,打破应用间的壁垒,实现「一句话办事」。比如华为、小米、vivo、荣耀等主流手机厂商的 AI 智能体,都曾在不同场合展示过自动发送消息、执行多步骤任务等功能。

这些演示虽然在具体场景和实现方式上略有不同,但核心逻辑都是一致的:通过 AI 大模型理解用户意图,并结合模拟用户操作,从而实现跨应用的自动化任务执行。

听着挺玄乎,但实际体验嘛……咳咳,还是有不小的提升空间。

而豆包手机助手的下场,进一步掀起了全网的讨论。更重要的是,根据我之前的体验,豆包手机助手的确是真正意义上把 AI 操作手机这件事做到了可用级别,不局限于几个场景,而是能够流畅自然地通过图形界面操作完成长任务、复杂任务。

APPSO 在知名预印本平台 ArXiv 发现了一篇由字节团队发布的技术报告,里面的信息或许能解释其中的关键原理。

附上地址:https://arxiv.org/abs/2509.02544

豆包手机助手的图形界面操作能力,来自字节跳动 Seed 团队开发的 UI-TARS 模型。它把屏幕视觉理解、逻辑推理、界面元素定位和操作整合在一起,其开源版本是目前最受欢迎的开源多模态智能体模型。

根据 UI-TARS 2.0 技术报告,这个模型的厉害之处在于,它不是简单的模块化拼凑,而是采用了端到端的学习方式,将感知、推理、行动和记忆整合在一起。

数据不会骗人,在 GUI 基准测试中,UI-TARS-2 的成绩相当能打:

  • Online-Mind2Web 得分 88.2,
  • OSWorld 得分 47.5,
  • WindowsAgentArena 得分 50.6,
  • AndroidWorld 得分 73.3

这些成绩不仅明显优于前一代模型,还在多个场景中超越了 Claude 和 OpenAI 等强劲基线模型。其中 AndroidWorld 的 73.3 分更是比 OpenAI CUA-o3 模型高出 20 多分,展现出强大的竞争力。

在游戏环境中,UI-TARS-2 在 15 款游戏组成的测试集中取得了平均标准化得分 59.8,约为人类水平的 60%。相比 OpenAI CUA 和 Claude Computer Use,UI-TARS-2 的表现分别提升了 2.4 倍和 2.8 倍。

这是什么概念?就是 AI 打游戏已经快接近普通人类玩家水平了。

在 LMGame-Bench 中,它依然能与当前最前沿的闭源模型掰手腕,进一步证明其在长时序游戏推理中的稳健性。

更厉害的是,UI-TARS-2 不仅能处理 GUI 任务,还能通过 GUI-SDK 扩展能力,与系统级资源(如终端和外部工具)集成。在信息检索任务(BrowseComp 29.6 分)、软件工程任务(Terminal Bench 45.3 分、SWE-Bench Verified 68.7 分)上都有竞争力。

一个模型走天下,这就是通用性的体现。

值得一提的是,通过接近豆包团队的人士透露,豆包手机助手用的 UI-TARS 是私有模型版本,性能比开源版更强,还针对手机场景做了专门优化。这或许也解释了为啥豆包手机助手实际体验这么丝滑。

豆包手机助手,确实有点技能在身上的。

写在最后:科技产品的「异类」可以多一些

作为一个长期关注科技产品的编辑,今年令我十分感慨,在这个恨不得把「万物皆塞入手机」的行业,却出现两个异类,分别在设计与交互的维度上,走向了极致

一个是 iPhone Air,当 Pro 系列不可避免地走向堆料的终局,这种对轻薄的偏执,在参数党眼中或许别无他用,甚至让人一时分不清这是倒退还是进化,直到你把它握在手里,原来,轻盈本身就是一种功能。

而豆包手机助手则站到了交互界面的另一个极端,它不要你去找服务,而是让服务来找你。甚至要掀了 GUI (图形用户界面)的桌子,有一天那块屏幕可能都不是必需的。

一个是硬件,一个是软件,但它们殊途同归。iPhone Air 削减了物理上的累赘,豆包手机助手剥离了交互上的繁琐。

你会发现,当 AI 公司参与到硬件的设计中,他们对交互设计的思路都和传统硬件厂商有所不同。

OpenAI 也正在和前苹果传奇设计师 Jony Ive 打造 AI 硬件,Sam Altman 就曾透露这块设备希望重新定义交互:不需要一堆 app,而是 AI 作为主界面与操作层。

当然,历史告诉我们这类新技术落地必然面临阵痛:适配、隐私、生态……还有各方利益的博弈。先进技术和广泛应用的「双向奔赴」尚需时日,但也是大势所趋。

OpenAI 联创 Andrej Karpathy 前段时间也表达了自己对交互未来的预判:

人机深度协作的时代,那些用户界面(UI)极其复杂(有大量滑块、开关、菜单)、不支持脚本、并且建立在不透明的、自定义的二进制格式上的产品,注定是死路一条(ngmi)。

未来,AI 在理解和操作人类图形界面(UI/UX)方面会越来越强(比如像 Operator 这样的前沿项目),但我怀疑,那些只想坐等这一未来实现,而不主动与当前技术发展水平「双向奔赴」、做出改变的产品,它们的下场不会太好。

敢于吃螃蟹这件事本身,就已经算是值得瑞思拜了,我们也希望看到更多「异类」出现在科技行业。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


体验豆包手机助手,它把我的手机「变薄」了

By: 李超凡
1 December 2025 at 13:37

双十一刚过不久,看着花呗账单陷入沉思的同时,我更想吐槽那几天的「非人」遭遇。为了给家里添置点大件,我在淘宝、京东、拼多多之间反复横跳,光是比价就把后台切到了手抽筋。

作为每年要体验大量新产品的科技编辑,我一度陷入沉思:手机拍摄越来越强,屏幕越来越大,处理器越来越快,为什么我还是得像个保姆一样伺候这些 App?

手机里的 App 越多,我的生活反而越破碎。

那你可能就要问了,都 2025 年了,满大街都在吹 AI ,难道就不能帮我把这些活儿干了?该说不说,现在的手机 AI 助手,大多只能定个闹钟、查个天气,真遇到复杂事儿,它比你还懵。

哪怕强如苹果,Apple Intelligence 国行版本至今也已经跳票好几次,我的 iPhone 17 Pro 到底啥时候能用上还是未知数。

没想到,字节跳动倒是先出手了。12 月 1 日,字节正式发布了豆包手机助手技术预览版。

这和我们常用的豆包 App 还不一样,它直接跟手机厂商在操作系统层面进行了深度融合,直接成为 OS 的一部分。

现阶段,豆包已经跟中兴推出了豆包助手预览版,也开放了购买,第三方开发者也能将自己的服务和应用集成至豆包手机助手。

不整虚的,我们直接按照用评测 iOS 的强度来体验一下豆包手机助手。

手机终于可以当我秘书了

咱们先来点让打工人头疼的场景小试牛刀。

以前要是想把飞书里的文档转成不同格式的文件发给领导,或者从微信几百条聊天记录里翻个文件发给同事,事情看着不难,但这些琐事往往会在你有其他工作的同时要处理。

我直接对着豆包手机助手说:「从微信聊天记录里找刚才那个文件发给xx,再把飞书那个季度总结文档转成 PDF 发到企业微信给xx。」

这时它就会自动调用「操作手机」功能,反应速度比我想象中快。它没有让我反复切换 App,也没有让我确认一堆选项,直接在后台运行,我接着忙其他事,不一会它就成功完成任务。

我甚至还能用来搞定更私人的事。比如我让它「帮我把微信收藏夹里找到我的护照照片,然后把 ID 号码发到文件传输助手。」

这也是旅游出差非常高频的需求,而且要知道我的收藏夹还有家人的护照照片,我也没有分类标注,豆包手机助手还能准确识别。

我再上点难度,让它帮我把某个微信群的的所有文件打包下载,整理分类后打包发送到企业微信给同事。

这是我最讨厌的工作场景之一,中间涉及跨应用操作、手动下载、逻辑分类、打包压缩等一系列复杂动作,豆包手机助手会怎么做?

看着屏幕上自动流转的操作,我久违地喊出了 Amazing:

1. 它精准定位到了微信群,识别出里面的文件,并开始自动批量下载。
2. 它没有把文件一锅端,而是像个真人秘书一样,自动识别了文件类型。它把 PPT 归一类,Excel 表格归一类,图片归一类,甚至还根据文件名里的关键词进行了二级分类。
3. 打包与发送:分类完成后,它自动生成了一个 ZIP 压缩包,命名清晰,然后无缝跳转到企业微信,找到指定的同事,点击发送。

▲ 豆包手机助手分类发送的文件.

我只需要动动嘴,它就帮我完成了以往需要手动操作半小时、还要在两个 App 之间反复横跳的繁琐工作。AI 要做好这些就跟真的得力秘书差不多了

豆包手机助手支持几种不同的唤出方式,但其中最自然、最让我感到「舒适」的,是「靠近直说」。

操作很简单:拿起手机直接讲,豆包手机助手就会自动执行,或者也可以按住 AI 健呼出。这个交互方式就像微信语音一样自然,不用对着空气喊出略显尴尬的唤醒词,几乎零学习成本。

如果你正忙得腾不出手,豆包还支持用智能耳机 Ola Friend 直接语音唤醒,在那些「手忙脚乱」的时刻特别好用。

比如周末做饭时发现没酱油了,直接对着耳机说「豆包,我做菜没酱油了,帮我上美团买两瓶」;又或者上班路上堵车,让豆包帮忙调整会议时间并通知对方;再或者骑车赴约时,让豆包直接回复朋友的微信消息。

这些场景的共同点是:双手被占用、不方便掏手机,但事情需要立即处理。豆包的语音操作让这些原本要「等一下再说」的琐事,都能即时解决,真正做到了动口不动手。

生活这些大小事,终于有手机 AI 接盘了

下面,我给它上点真正的强度。这也是咱们开头提到的那个痛点:

「我想买华为 Mate 80,帮我去淘宝、京东、拼多多比一下价格,要把所有能用的优惠券都算上,告诉我哪个平台最便宜,并把最便宜的那个加入购物车。」

说实话,问完这句话我都觉得自己有点欠揍。这不仅涉及三个 App 的跳转,还得识别优惠券规则,还得计算,还得加购。

像这种难度,豆包手机助手会调用「复杂任务」模式来进行手机操作。结果豆包一轮比价操作后,最后选了拼多多百亿补贴后的价格,并帮我加入购物车。

咱平时在小红书上收藏了一堆乱七八糟的攻略,真要用的时候还得自己整理,这种信息碎片化的焦虑,相信大家都不陌生。我给豆包手机助手再出了个难题:

这周末跟朋友约饭,帮我从小红书里面收藏的广州的餐厅里面挑一家,然后要拍照好看,人均在200 以内,最好是粤菜。

它不仅把我的收藏内容分类整理好了,还自动去掉了重复和过时的信息。这一套操作下来,我是真服了。它不是在简单的搜索,它是在理解我的生活流。这种将杂乱信息结构化的能力,也是 AI 功能对于用户最大的价值之一。

帮我看看闲鱼、转转和拍拍严选上,二手的任天堂 Switch OLED 版(白色,99 新)大概都卖多少钱?综合对比一下,帮我定一个容易出手但又不亏的价格,然后帮我写一段吸引人的文案,准备挂到闲鱼上去。

它会先把任务拆分成各种子任务,不会像无头苍蝇一样乱撞。然后在执行任务的过程中,把任务进一步细分为各种关键词,在各种电商平台进行地毯式搜索。

查价格、看行情、对比成色,豆包三个平台来回横跳,比人类自己切换 App 还麻溜。

由于我提出的任务非常繁琐,豆包用时 8 分钟左右,乍一看好像有点慢?但仔细想想,这个时间和人类自己手动查相差无几了,甚至可能还更快。而在给出的文案上,经典的「可小刀,但不接受大砍」也可以说是原汁原味,

我想入坑明星丁禹兮,帮我在豆瓣、微博、贴吧、知乎等等平台查查他有没有黑历史:比如查查他有没有糊弄粉丝、人设崩塌、私生活混乱、欺骗消费的黑料,别让我入错股。

明星塌房是常有的事,前一秒还是顶流,后一秒就变成了赛博案底,所以在追星之前,我的建议是,还是得对明星做一个背调。而这种需要跨平台、翻历史记录、筛选关键信息的任务,就够我头晕眼花的了。

交给豆包手机助手后,从豆瓣的长篇八卦帖、微博的蛛丝马迹、贴吧的档案、知乎的理性分析,但凡有点风吹草动,它都能给你扒拉出来。

这种全平台背调能力,说实话比私家侦探还专业。追星有风险,入股需谨慎,但有了它,应该能帮我规避掉一定程度的塌房风险。

豆包豆包,我妈逼我相亲,你帮我给相亲对象小黄打微信电话,如果她没接电话,你需要用文字帮我高情商推掉这次相亲,理由要得体但坚决。

最近朋友向我求助,不想去安排的相亲,但又不好意思直说;想推掉,但情商低的我又怕伤人面子;想找理由,但又怕编得太假被看穿。这时候,让 AI 来当这个「背锅侠」,属实是个妙招。

豆包接到任务后,先是帮我拨通了小黄的微信电话。相亲对象可能也有事在忙,拒绝接听,于是豆包立刻按照我的要求切换到 Plan B:发文字消息。

从回复来看,这情商水平,其实已经比我这个社恐本人高出三个段位。而且最关键的是,这段话既坚决(明确表示不想继续),又得体(没有让对方难堪),还平衡了拒绝和礼貌这两个矛盾点。

这还没完。豆包手机助手的全局记忆才是我觉得未来对手机系统交互影响最大的能力。

「把小红书收藏夹里母婴内容,整理成孕晚期攻略。」

甚至我以前提问过孕期食谱也收藏过类似内容,这次再问餐饮推荐时,它就会在回答时给出提示:「这家店有孕妇不适合的食材哦。」

不同 App 里提到的同类内容,在它这里自动关联了。你不需要每次都重复你的偏好,它默默把你的习惯记在了小本本上,比你自己还了解你自己。这种润物细无声的体贴,才是智能的更高境界。

可以说,以前你需要录音笔+笔记本+日历 App+待办清单四件套才能搞定的事,现在一个 AI 快捷键全解决了。

至于大家关心的隐私问题?倒也不必太担心,一方面这些记忆的数据会存储在本地,另一方面,毕竟开关始终掌握在你手里,想记就记,不想记就关,自由得很。

告别 P 图 App,「基础功能」变得不基础

你以为基础功能就是平平无奇的识个图、P 个照?错了,相反,豆包手机助手做出了旗舰机都不一定有的体验。

随手丢了张罗永浩的照片问它:「这是谁?顺便起个标题。」豆包搜索验证后给出答案:《罗与罗:双份的「彪悍」》。这命名水平,既有梗又点题,属实可以。

拍了张路边小摊的招牌照片,上面赫然写着「腚粉肠」几个大字。豆包秒速识别出来:小摊贩把「淀粉肠」写成了「腚粉肠」。我就说这肠怎么吃着吃着还挺有味道的。(doge)

看完识别能力,再来看看豆包的 P 图本事。

之前在抖音爆火的发丝发光、三宫格风格 P 图,现在都被集成到了手机里——主打一个「AI P 图自由」,不用下载一堆 App,不用开会员,直接在相册里就能搞定。

又比如我随手拍了张家里猫主子的照片,然后让豆包给它整个漫画风。很快,一张猫猫表情包就出炉了,画风也真不差,还能根据表情自动配文案「震惊」。这理解力,还挺有网感的。

马斯克说的「未来手机」,豆包已经把雏形做出来了

多年前 iPhone 用多点触控(Multi-Touch)把物理键盘成为过去式,智能手机成为新一代计算中心。

现在,豆包手机助手也本质也在尝试做同一件事:让手机交互更加自然、直观和高效。

体验完之后,我最大的感受是:豆包手机助手不仅仅是一个 App,它更像是一个覆盖在所有 App 之上的「智能图层」。

它带给我最直观的感受是,手机变「薄」了。

虽然现在手机机身越做越薄。但同时手机也越来越臃肿:你需要点开一个个 App,像钻井一样潜入深层菜单,去翻找功能、去切换界面。

而现在,豆包手机助手把所有 App 的能力都「拍扁」了,平铺在你面前。

你不再需要面对复杂的 UI 界面,只需要面对结果。

早在 2008 年,微软首席 UI 设计总监 August de los Reye 曾预言, GUI (图形界面)未来演进的方向就是 NUI自然用户界面 。

人机交互领域的先驱 Bill Buxton 也曾在一篇论文中列举了一些 NUI 应该遵循的原则,其中有一条:

简单性高于一切:复杂性是自然用户界面的敌人。每个交互都应该是不言自明的,不需要说明手册。

这种自然用户界面的交互,我想已经在豆包手机助手上开始体现了。

无论是叫车、订餐还是查攻略,它像个极其老练的管家,帮你屏蔽了底层那些繁琐的操作逻辑,只把你要的「结果」呈上来。

过去十年,我们的注意力被手机瓜分在无数个 App 的孤岛里。

而现在,你可以重新把所有的服务、所有的信息,全部收拢到了「你的意图」这一个入口之下。

马斯克说未来的手机不需要 App,其实他是在说:未来的交互,不需要看到过程,只需要结果。

我也相信,今天这种堆满图标的手机形态会有一天被淘汰。

那在 AI 和操作系统深度融合后,到底会给我们带来什么更好的体验?当豆包手机助手之类的 AI 和手机厂商联手后,估计会迸发出更多意想不到的进化。

或许就在不远的将来,我们不再需要低头戳戳点点,只需一个眼神或一句轻语,就能调动全世界的信息为你服务。

那将是我们这一代人亲历的,再一次「重新定义人机交互」的时刻。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


豆包输入法上线,用了两天我在微信聊天不想再打字

By: 莫崇宇
24 November 2025 at 10:35

如果你用过一些手机系统自带输入法,一定懂那种它好像没学过中文的无力感。

正因如此,第三方输入法才得以遍地开花。

当官方输入法不好用,用户自然会用脚投票。最近字节推出了豆包输入法 1.0 版本,要用 AI 重新定义输入体验。

趁着热乎劲,我也下载体验了两天,发现了一些让人又爱又无奈的细节。

语音识别断档领先,豆包输入法的「杀手锏」有多强?

豆包输入法的界面走的是极简风。

没有那些乱七八糟的推广弹窗和会员广告。不过嘛,安装包体积属实有点大,在 vivo 应用商店显示 139MB。而且这体积大归大,功能却不完整,用「毛坯房」来形容挺贴切的。

先说说豆包输入法的核心竞争力。

在我看来,语音打字是豆包输入法的杀手锏,体验感是断档级领先,确实比我用过的其他输入法强上一大截。在我体验的这两天里,我已经深深爱上了语音打字的体验。

一句话概括,按住说话,松手结束。

实测下来,中文、英文和粤语识别准确度都高得离谱。我随口说了句「我正在用普通话测试豆包输入法」,一字不差,再来一句英文「Attention Is All You Need」,也准确识别了。

在粤语的体验对话上,「今晚你翻唔翻嚟屋企食饭啊。」,「一蚊一只鸡,一蚊一斤龟,究竟系一蚊一只鸡贵,定系一蚊一斤龟贵?」也是一遍就识别成功。

要知道,这些句子语速快、同音字多,咬字要是稍微不清晰,输入法就容易翻车。实测表现相当能打,说明模型对粤语的声学特征和语言模型都做了针对性训练。

TVB 剧里那种粤语夹英文的说话方式,豆包也能应付。

我试了「Sorry 啊,我地已经尽晒力啦」和「赏月喝糖水,那么迟才 call 我们」,「幫我 scan 入電腦做個 copy,再 share 畀大家,记得要 double check 啊」最终结果居然一个都没错。

它甚至还能语音输入数学公式,如果你是学生、老师或者科研人员,这个功能应该挺实用的。

技术层面, 网传豆包输入法用的是 Seed-ASR2.0 模型。

简单说就是把语音转成文字, 让机器「听懂」你在说什么。和之前的大型 ASR 模型比,Seed-ASR 在中英文测试集上的错误率降低了 10%-40%。

另外, 豆包输入法还支持下载离线语音模型, 大小约 150MB。意思是在地下车库等信号不好的地方,你也能正常使用语音输入。

但离线模型的准确率肯定比在线的差一点,性能有妥协也正常。

当然了,选择一款新的输入法,很多人会担心隐私问题,豆包输入法提供了一个「基础输入」模式,只是打开之后, 语音转文字、翻译这些功能就全关了。

基础词库方面, 豆包输入法丰富度达到了主流输入法的水平, 没啥特别的, 但也不拖后腿。

除了语音识别,我试着文字输入「确实型人格」、「城巴佬」等这些网络词汇, 都能识别。生僻字方面,像「饕餮」、「皴裂」「髑髅」这些,也都是从从容容,游刃有余。

至于联想方面,融合 AI 能力的豆包输入法表现出色。

输入「1+1=」,亦或者输入问题「西游记的作者是谁」,输入法会直接在候选栏直接显示结果。作为打工人, 我就挺喜欢直接这个将 AI 融入输入法的形式,主打一个实用。

139MB 的 AI 输入法,除了语音识别还剩什么?

说完优点,该聊聊槽点了。

首先,豆包输入法只上线了 Android 版。官网显示,iOS 版即将上线,PC 版则表示敬请期待,这也意味着不支持跨设备复制粘贴。

对于频繁在多设备间工作的用户来说,缺失这个重要功能可能是一个很大的劝退点,希望后续能尽快上线。

而在默认设置下,打字有点不太跟手,响应速度不够快,但好在可以在设置里调整按键的响应速度到「极快」,调完之后体感会好很多。

有趣的是,设置键盘「震动强度」发现,选「弱」时震感很强,选「强」反而没什么感觉。这可能是个 Bug,希望后续版本能修复。

可能是因为还在早期版本,豆包输入法很多细节功能还没来得及打磨。

表情包是社交沟通的重要组成部分,很多输入法都内置了表情包搜索和发送功能。虽然豆包输入法自带表情还算丰富,但你想从输入法直接发表情包? 对不起,目前做不到。

再比如键盘功能还不够完善,输入方式只有 9 键和 26 键。如果你是双拼用户, 或者需要手写输入、繁体中文, 那豆包暂时不适合你。

另外,键盘页面有深色模式,但设置页面却没有深色模式。想换个键盘皮肤? 对不起,目前只有默认样式。后者就见仁见智,有人觉得简洁好,有人觉得太单调。

而在 AI 翻译功能输入「LLM」,它依旧会默认显示为「法学硕士」。虽然「法学硕士」和「大语言模型」两个翻译都对,但多少让我有种谷歌翻译的感觉。

那么,豆包输入法值得体验吗?

我的建议是,仅凭语音识别这个杀手锏,还是值得尝鲜体验的。

但建议别急着设为默认输入法,先当个备用工具用着,等豆包输入法把 iOS 版、多设备同步、表情包这些基础功能补上,再考虑全面切换也不迟。

当然,我们也不妨给它点时间,看看这个 1.0 版本最终能进化成什么样。

附豆包输入法下载地址:
https://shurufa.doubao.com/

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


「最具活人感」车机来了!豆包大模型上车荣威 M7 DMH,能哄娃、懂情绪、会预判|广州车展

By: 芥末
21 November 2025 at 21:14

上汽荣威于广州车展首日发布了一项「颇具活人感」的技术——豆包深度思考大模型及场景。其将首发搭载于荣威旗下的中大型长续航轿车,荣威 M7 DMH 上。

荣威在发布会上表示:

依托豆包 AI 车机「能推理、会思考、懂情绪」的全新人机交互体验,智能座舱已然从「指令响应」迈向「意图驱动」。豆包大模型的最强大脑,加上荣威 M7 DMH 的全能配置,就是最强车机。

据 QuestMobile TRUTH 数据库数据显示,截至 2025 年第三季度,豆包大模型以 1.59 亿月活跃用户和 49.2% 的市场份额稳居中国 AI 大模型榜首。与多数车企仅将语音助手或 App 简单「上车」不同,荣威此次与豆包的合作贯穿技术底层、数据接口到交互逻辑全链路,实现了真正意义上的深度融合。

这一融合成果具体体现为三大核心技术能力:

其一,模糊语义理解能力显著增强。系统可识别倒装句、否定句及多意图复合指令(如「别开空调但把座椅加热打开」),并覆盖包括通勤、亲子、长途、泊车等在内的 15 类高频用车场景,远超行业平均水平。

其二,具备上下文记忆贯穿能力。在连续对话中,系统能自动关联历史信息,理解用户未明说的潜在需求。例如,若用户上午说「下午接孩子放学」,傍晚再问「现在去学校要多久?」,系统可自动调取此前设定的目的地并规划路线。

其三,复杂车控联动能力突出。依托行业最多的 300 余项车控接口接入,用户一句自然语言即可触发多项功能协同运行,如「我有点累」可同时调节座椅至半躺、开启氛围灯、播放舒缓音乐并关闭部分屏幕通知。

实际使用数据印证了这套系统的有效性。自 11 月 17 日豆包大模型通过 OTA 全量推送以来,荣威 M7 DMH 语音功能的日使用率从 60% 跃升至 90%。

其中,「高段位哄娃神车」与「暖心出行守护官」成为用户使用频率最高的两大场景。前者基于豆包大模型的知识库与情绪识别能力,可根据儿童年龄动态调整互动内容——对幼儿讲故事、对学龄儿童提供趣味问答,甚至能在孩子哭闹时主动播放安抚音频;后者则整合 8600 余项汽车专业知识与 350 多项实时车况数据,能对仪表盘报警灯、异响或续航异常等问题进行即时诊断。例如,当胎压监测灯亮起,用户只需问「这是什么问题?」,系统即可回答「右前轮胎压偏低,建议尽快检查,当前值为 2.1bar,标准为 2.4bar」。

在产品硬件层面,起售价为 9.78 万元的荣威 M7 DMH 同样强调综合体验。

该车搭载 DMH 6.0 超级混动系统,CLTC 纯电续航达 160 公里,综合续航 2050 公里,在荣威近期举办的「真 2L 超低能耗挑战赛」中,超过半数参赛用户凭借日常驾驶习惯将实测油耗控制在 2L/100km 以内,部分用户甚至逼近 1L 水平。

舒适性配置方面,荣威 M7 DMH 配备同级唯一的乳胶感慕斯舒压座椅,采用 Ultra Touch 极触面料与 Surflex®反重力海绵填充,宣称可实现「久坐不倦」。后排支持副驾一键折叠,形成贯通式空间,便于家庭成员互动。底盘搭载同级唯一 mCDC 智能动态悬挂系统,可在毫秒级内调整阻尼,有效过滤颠簸,实现「过坎不颠、过弯不晃」的行驶质感。

荣威还在发布会上宣布,2025 年,荣威共新增渠道 238 家,预计年底服务网点总数将突破 600 家,覆盖更多三四线城市及县域市场。并且,荣威 M7 DMH 车型实行全国统一售价策略,取消终端议价环节,降低用户决策成本,使其更聚焦于产品本身的价值。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


❌
❌