Reading view

There are new articles available, click to refresh the page.

字节 92% 工程师都在用的 TRAE,这次瞄准了企业级市场

AI Coding 的「元年」还没落幕,在即将迈入 2026 之际,这个赛道就加速进入更加残酷的下半场了。

之所以残酷,是因为规则变了,如果说上半场比的是「速度」,那么下半场拼的就是「落地」。

这带来的变化或许远超开发者想象,最近OpenAI 披露了一个颠覆性的工程案例:Sora 的 Android 团队曾面临极度紧迫的上线任务。

为此,他们组建了一支仅有四名工程师的「特种部队」。通过 AI coding 的方式,这支四人小队在 18 天内就发布了内部版本,10 天后即公开发布。这并非牺牲质量的狂奔,相反,他们在极短周期内依然保持了高标准的可维护性。

可见,AI 不仅在写代码,更在定义软件架构。而 Gartner 预测,到 2028 年,90% 的企业软件工程师将使用 AI Coding,开发效率将提升 30%。

在中国,这种转变甚至更为激进。数据显示,84% 的开发者正在使用 AI Coding 产品,其中 51% 每天都在使用。

但热闹背后,CTO 们的焦虑其实更深了。

因为 AI Coding 正在经历最痛苦的「祛魅时刻」: 从单纯验证「能不能写出一段 Python」,到要求「能不能搞定复杂的企业工程」。

问题早已从「要不要做」,变成了「怎么做得更好」

说白了,企业引入 AI Coding 必须先解决四大挑战:安全合规、性能适配、管理透明和流程集成。解决不了这些,AI 就不仅无法提效,反而会变成一个吞噬维护成本和带来安全隐患的无底洞。

昨天,一家中国大厂也交出了自己的答卷,在火山冬季 Force 大会上,字节正式发布 TRAE CN 企业版,拥有 600万开发者、市占率第一的 TRAE ,正式进军 B 端市场,它的目标很明确:啃下挡在企业应用 AI Coding 前的几座大山。

TRAE CN 企业版,让 AI Coding 进入「工程轨道」

如果 AI Coding 仅仅意味着代码能跑通,其他全凭运气,那它永远无法真正进入企业开发的核心工作流。

这本质上是一场关于「控制权」的博弈。

企业需要的 AI Coding ,应当监控自己的训练过程,甚至为自己编写测试框架,但最终的「决定权」和「迭代方向」,始终掌握在人类手中。这是一种微妙的人机协作关系:让 AI 负责干活和制定初步计划,人类负责审查、讨论并迭代计划。

在TRAE CN 企业版里,各处都是这种「可控协作」的细节。

它拒绝让开发者陷入盲目的「抽卡式」编程,而是通过配置企业规则、知识库与 Agent,强迫 AI 进入团队协作的严谨轨道。在这个轨道里,TRAE 不仅生成代码,更在生成一种「懂业务、守规矩」的工程资产。

通用大模型最大的软肋,其实并非算力限制,而是「上下文窗口与工具调用次数的限制」。

它们通常只能盯着当前打开的文件,面对企业级数亿行代码的超大仓库(Monorepo)时,这种能力简直是个笑话。

所以,TRAE CN 企业版针对大仓库场景,专门对上下文与索引性能进行了深度优化,直接构建了资深架构师般的「上帝视角」

它支持 10 万文件、1.5 亿行代码的超大仓库索引,配合超长上下文窗口,能适配最复杂的编程场景。比起简单的文本检索,TRAE 实现了亿行级代码的极速检索与实时增量索引。依靠企业级 GPU 集群的优化,它能在处理如此海量信息时依然保持毫秒级响应

这意味着,当你敲下需求的那一瞬间,TRAE 已经「看」完了你整个项目,给出的不再是孤立的代码片段,是基于完整上下文的深思熟虑。

为什么我们需要这种能力?因为传统软件工程的物理定律正在失效。

图灵奖得主、曾撰写软件工程圣经《人月神话》的架构师 Fred Brooks 有句名言:「在一个已经延期的软件项目中增加更多人手,只会让项目更晚完成。」

▲ Fred Brooks

刚刚发布的 TRAE CN 企业版,正在试图打破这个魔咒。

要知道很多稍有底蕴的技术团队,都有自己的一套「黑话」和「规矩」。这些宝贵的知识往往分散在 Wiki 文档、CI/CD 流程或者特定的工具链中。通用的 AI 对此一无所知,生成的代码往往充满了「外行感」,需要大量的人工修正。

TRAE 企业版的解法是:全场景适配,让 AI 学会团队「语言」

它允许企业直接接入知识库与规范,并基于 MCP 协议统一调用企业的工具与数据源。这相当于给 AI 装上了企业的「大脑」和「手脚」。

当 Agent 接收到指令时,它会基于企业规则和知识库进行校准。所以,TRAE 生成的代码自带「规矩」:它更懂业务逻辑,代码生成更准确,甚至能集成现有的 CI/CD 和 DevOps 体系,实现 AI 开发的一体化。

更关键的是,它让所谓的「管理黑盒」变得更加透明。

以前老板不敢推 AI,是因为不知道员工用 AI 干了什么,也不知道 ROI 到底是多少。TRAE CN 企业版直接把效能做成了看板。它可以追踪 AI 生成率、代码量等关键指标,让整体 ROI 清晰可见;同时还能设置费用上限、实时监控消耗,把成本算得明明白白。

当然,这一切的前提是守住安全的「红线」。

TRAE 企业版给出了的承诺是,数据不训练。官方隐私协议明确规定,企业代码永远不用于 AI 训练。配合代码全链路加密传输、云端零存储(代码文件默认本地存储)以及云端数据用后即焚机制,让企业代码资产「滴水不漏」。

TRAE 企业版扎扎实实地解决了三个最要命的工程问题:让 AI 看得全(全库索引)、懂规矩(规则内化)、能闭环(Agent 协作)。

正因为啃下了这三块硬骨头,TRAE 企业版才能将 AI Coding 从一个「有时好用、有时捣乱」的玩具,转变为企业研发的确定性生产力

在字节最真实的业务里,验证「确定性」

2025 年我们已经习惯了 AI 产品在 PPT 上各种参数的天花乱坠,但真正能让 CTO 们信服的,只有在极限业务场景下跑出来的数据。

最好的试金石,莫过于承载字节自家泼天流量的产品。毕竟在这种大量并发协作的真实业务考验里摸爬滚打出来,比任何关于「提效」的承诺都更有力,目前字节 92% 的工程师都在用 TRAE 进行开发。

就拿抖音生活服务来说,这个业务迭代速度快得惊人,过去面对的最大挑战,是需求到上线的链路冗长且人力投入巨大。从产品经理写下的自然语言需求(Brief),到工程师敲下的第一行代码,中间横亘着巨大的「沟通折损」。

工程师不仅要理解业务逻辑,还要在大脑中检索与之匹配的中间件、熔断规则和数不清的隐藏依赖。

而企业希望 AI 带来的生产力拐点,往往并不是推倒重来的「颠覆」,是要像水一样渗入到企业已有的流程里,去填补那些效率的洼地。

而 TRAE CN 企业版在这里给出的解法,就是一种不同的「全链路深度嵌入 」,透着一股老练的「懂行」

当工程师把一段飞书文档投喂给 TRAE 时,它没有机械地把中文翻译成代码。它不仅读懂了「团购券核销」这个业务动作,更扫描了当前服务的上下文,自动匹配了团队最新的 RPC 调用规范。它甚至指出了文档中未提及的兜底逻辑缺失。

如果问研发同学最讨厌干什么,写单元测试(Unit Test)绝对榜上有名。

这是一件苦差事。为了赶业务进度,单测往往是第一个被牺牲的环节;而一旦系统挂了,缺乏单测又是第一个被拉出来背锅的理由。这种死循环,折磨了无数技术团队。

TRAE 干了一件极其漂亮的事:单测自动生成与修复

据内部研发团队测试,在接入 TRAE 后,单测生成时间被压缩到了 18 分钟以内,而且首编译通过率高达 70% 以上。请注意,这 70% 不是生成的伪代码,而是实打实能跑通逻辑的测试用例。

TRAE 默默扛下了这些枯燥、重复但又至关重要的脏活累活,让工程师能把宝贵的脑力留给架构设计和业务创新。

这套在字节内部跑通的逻辑,也正在外部企业中复制

在一家头部的 PC 硬件厂商业务系统中, 80% 是旧代码迭代,多年的代码堆积让维护变得异常困难,每一次改动都像是在排雷。

引入 TRAE CN 企业版后,它充当了企业知识库的「守门人」。在 Java 后端场景中,TRAE 能准确识别陈旧的架构问题,甚至精准定位重复查询等性能瓶颈,给出优化方案。

而在前端,它直接打通了 Figma,让原型图瞬间转化为代码,被研发团队评价为「省去了切图环节,提速非常明显」。

能够处理那些逻辑盘根错节、充满历史包袱的存量老系统(Legacy Code),这意味着它不挑食,不嫌脏,具备极强的代码理解和上下文穿透力。

对于金融科技企业汇付天下,对代码的准确性和交付效率有着金融级的要求。在他们的支付 PaaS 平台「斗拱」的研发中,下游开发者理解接口文档耗时、环境部署排查困难一直是阻塞交付的顽疾。

他们在利用 TRAE 企业版的 Agent 能力后,实现了智能环境诊断和测试用例自动生成。它能分析下游环境日志,快速定位问题,直接将沟通成本降至最低。

效果是立竿见影的,从最初 10 个席位的谨慎试点,迅速扩展到 100 个席位,高峰期活跃率高达 70%。这种自下而上的高频使用,说明 TRAE 真正嵌入了工程师的核心工作流,而非一个可有可无的辅助插件。

字节跳动的高并发场景,到 PC 巨头的存量维护,再到金融科技的交付提效,TRAE 企业版这种转变,也是 AI Coding 更加成熟的标志,对于那些追求确定性、不仅要快更要稳的企业级研发来说,才有真正的应用价值。

AI Coding 的下半场,要成为确定性生产力

尽管行业普遍预测 AI Coding 还有巨大的增长空间,但背后依然是无数企业从观望到试水的艰难跨越。

企业需要的不是随机的 Vibe,而是确定的 Spec(规范)。

所以,AI Coding 的下一阶段,从「人指挥人」,转向「人定义 Spec(规范),AI 落地执行」

TRAE CN 企业版正是基于这种判断,将字节在 C 端极其复杂的海量场景经验,内化为解决问题的能力,确立了一种全新的生产关系。

TRAE 并不满足于生成 Demo 级代码,而是试图陪伴开发者走完从构思到落地的全链条。它让工程师从重复劳动中抽身,去定义架构、去洞察业务,给出企业可用的生产级代码。

不过,这场生产关系的进化注定不会轻松。传统的研发惯性、复杂的存量系统以及对安全合规的顾虑,依然是横亘在企业面前的现实高墙。

TRAE 的出现,或许只是给这堵高墙凿开了一个缺口。否持续证明这种「确定性」价值,能否让更多企业像字节内部一样信任 AI,将是决定其能否真正撬动企业级市场的关键。

这场关于 AI Coding 的长跑才刚刚起步,TRAE 抢到了一个不错的身位,但真正的较量还在后头。

文|李超凡

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


科技爱好者周刊(第 378 期):预测是新的互联网热点

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

武汉首座电梯升降桥最近建成开放。因为上游有船厂,所以大桥有四根巨大的电梯柱,用来升起桥面,让船通过。(via

预测是新的互联网热点

大家大概想不到,美国互联网的热点,现在不是 AI 网站,而是一种全新的网站,叫做"预测市场"(prediction market)。

这类网站像雨后春笋一样,每天都在冒出来。最有名的预测市场,目前是 PolyMarket

预测市场的用途,就是预测各种各样的事情。以 PolyMarket 为例,首页顶部就是各种预测的分类。

热门事件、突发事件、最新预测、政治、体育......

只要是你能想到的事情,它都提供预测

以上周末为例,首页热门预测如下(上图)。

  • 《时代》杂志的年度人物是谁?
  • 《时代》杂志年度人物名单会泄露吗?
  • 美联储一月份的决定是什么?
  • OpenAI 下一次的大模型发布是哪一天?

你随便选一个,点进去就能看到,各种情况的概率。

上图预测的是,2025年12月5日至12日期间,马斯克会发多少条推文。

可以看到,概率最高的情况是440条~450条,概率33%,概率最低的情况是400条~419条,概率1%。

正是因为对于几乎任何问题,它都有实时的详细预测,美国人现在已经不怎么看民调了,改成看这种预测网站了。因为民调的抽样方法和样本大小,总是有局限的,反而是预测网站更反映市场的真实看法。

你可能会问,这些预测结果怎么产生?如何确保准确?

答案很简单,结果来自于用户的下注。

你看好哪一种情况,就可以对它下注。看好的人多,这种情况对应的概率就会上升,反之下降。

实质上,它的每一个预测都是一支股票,股价就是它的概率,1%的概率就是股价0.01元,100%的概率就是股价1元。

举例来说,某种情况的当前概率是2%,那么相当于0.02元。你看好这种情况,假定就花了100元买入。

结果,正如你的预测,它变成了现实,概率上升为100%,价格就变成了1元,相比你的买入价,整整上涨了50倍。于是,你投入的100元就变成了5000元。

反之,你预测错了,这个结果没有实现,概率变为0%,也就是0元,你投入的100元将一分都收不回来。

最近,美国的一条热门新闻就是,一个男子在 PolyMarket 上,对一个2%的小概率事件投入3000美元。结果,预测准确,他收回了12.5万美元。

为了方便世界各地的人参与,也是为了保证匿名,这种预测网站都采用稳定币交易。

所以,它的本质就是一个巨大的彩票市场,允许用户买卖自己最感兴趣、最熟悉的事件,这是它快速流行起来的根本原因。参与的人多了以后,反过来提高了预测的准确性。

我觉得,它的前景不可限量,一定会火爆的井喷式发展,传统彩票可能会被它彻底淘汰。

它把任何不确定的事情,都变成了彩票,实时量化了每一种可能性的概率,并且提供了金钱翻倍的途径。这一方面很有参考价值,可以用来判断未来情况,另一方面也非常有娱乐性和刺激性。

国产 Nano Banana Pro 的图片幻灯片生成

上个月,谷歌发布了新一代图像编辑模型 Nano Banana Pro(其实就是 Gemini 3 Pro 的图像分支)。

有一个功能引起了轰动:无论多么枯燥的文字,都能变成有趣的图片,从"读文"变成"读图"。

我当时就想,国产模型一定会马上跟进。

果然,昨天打开秘塔 AI,就看到他们发了这个功能完全对标 Nano Banana Pro 以及 NotebookLM,而且还加入了自己的特色----讲解。

你点击"上传文件"(上图),上传各种资料(可以上传多篇),它就会自动创建一个知识库,输出内容的 AI 总结。这时,还会显示一个"给我讲讲"按钮。

上图是我写的一篇 JS 语法点 Promise 的教程,点击"给我讲讲"就会生成图片幻灯片 + 讲解。

大家可以去它们的官网 metaso.cn (手机 App 同名)试试看,这个功能挺好玩的,操作零门槛,关键是它免费(有赠送的积分)。

除了上传文件,你也可以直接搜索某个主题,再点击下方的"生成幻灯片"按钮。这时就会有"图片幻灯片"选项,并有20多种风格可选,还支持自定义。

科技动态

1、步行环游世界

上个世纪90年代的一天,一个英国青年在酒吧里随口说,他可以从南美洲最南端一路走到英国。他的朋友都不信。

他就跟朋友打赌,他能做到。1998年,他正式从智利最南端开始步行,那一年他29岁。

27年过去了,他已经56岁了,依然在路上。

好消息是,他已经接近行程的尾段,预计将于2026年9月到达终点英国。

下面就是他的路线图,从南美洲最南端到北美洲最北端,再到亚洲和欧洲,最后是英国。

整个行程中,他只能步行或者游泳,不能使用任何交通工具。最难的一段就是北美洲与俄罗斯之间的白令海峡,为了不坐船,他是在冬天从海冰上爬过去的。

这27年中,他也不是每天都在走,有时因为各种原因,会离开一段日子,然后再回来接着走。

他说,依靠个人的力量不可能完成这样的行程,留不开家人的支持、陌生人的友善,以及赞助商的帮助。

至于是什么力量支撑他坚持走了近30年?他说:"你需要看看真实的世界,以及生活在其中的人们,这将是你所能接受的最好的教育之一。"

2、六臂机器人

美的公司展示一个六臂机器人,将用于无锡工厂的生产线。

它可以六只手同时执行三项任务。那样的话,一个机器人就相当于三个工人了。

3、手摇洗衣机

一位前戴森公司的工程师,为不发达地区发明了一种手摇洗衣机。

据介绍,这种洗衣机不需要电,只要手摇几分钟,就能洗净5公斤衣物,并且节省一半的水。

如果它真的有效,我有一个建议,就是把手摇改成脚踏车,只要踩5分钟踏板,就能洗一筒衣服。

文章

1、程序员为自己的工具命名时的彻底迷失(英文)

本文批评很多程序员为软件起名时,尽起一些烂七八糟的名字,根本看不出软件的用途,建议软件名称应该跟用途有相关性。

2、解读斯诺登文件(英文)

这篇文章详细分析了2013年斯诺登泄漏的文件,文章第一部分就是分析对北方工业公司的情报收集,美国的监控令人叹为观止。

3、从文本到词元(英文)

一篇科普文章,通俗地介绍搜索引擎如何将查询的文本转换成标准化的词元(token)。

4、大模型构建 HTML 工具的实用方法(英文)

著名程序员 Simon Willison 的长文,总结他使用大模型生成网页应用的经验。

5、GraphQL 蜜月期已结束(英文)

作者认为,GraphQL 解决的问题远比人们想象的小众,而且可以通过其他方式解决,这项技术最终往往弊大于利。

6、git add -p 的解释(英文)

本文介绍 git add -p 命令。它会显示一个互动界面,让用户逐个确认每个文件的变动,是否要加入暂存区。

工具

1、Cosmic

上周,Cosmic 1.0版正式发布了。它是一个全新的 Linux 桌面,美观且功能强大,为用户提供了 Gnome 和 KDE 之外的另一个选择。

2、Keyden

macOS 菜单栏的开源 TOTP 双因素认证器,密钥加密存储在 macOS Keychain。(@tasselx 投稿)

3、WeMD

开源的 Markdown 微信公众号编辑器。(@tenngoxars 投稿)

4、starling-speak

文本朗读网站,支持多种语言,带有录音功能。(@Keldon-Pro 投稿)

5、shift

一个基于 WebAssembly 的在线代码编辑器,支持直接在网页运行 Python、Lua、Ruby 等语言。(@hubenchang0515 投稿)

6、EasyImg

基于 Nuxt 4 构建的个人图床,丰富的后台配置。(@chaos-zhu 投稿)

7、Go-WXPush

Go 语言开发的微信消息推送服务,提供了一个简单的 API 消息推送接口。代码开源,每天10万次推送额度,个人用不完。(@hezhizheng 投稿)

8、ZeroLaunch-rs

Windows 应用启动器,拼音模糊匹配,基于 Rust + Tauri + Vue.js。(@ghost-him 投稿)

9、MrRSS

跨平台的开源桌面 RSS 阅读器,支持自动翻译、自动总结、新订阅源发现。(@ch3ny4ng 投稿)

10、PVE Touch

为移动设备优化的 Proxmox VE 管理界面,方便通过手机管理虚拟机。(@hanxi 投稿)

AI 相关

1、Disco

谷歌实验室推出的实验性 AI 浏览器,完全跳过网页搜索,目前需要排队等待名额。

2、Flowers

开源的浏览器 AI 助手插件,提供网页翻译、问答、笔记等功能。(@snailfrying 投稿)

3、DeepAudit

开源的代码审计平台,通过智能体实现漏洞挖掘和自动化沙箱 PoC 验证,支持 ollama 私有部署模型,代码可不出内网。(@lintsinghua 投稿)

资源

1、生命的尺寸

这个网站用图形展示各种生命体的大小比较,从 DNA 一直到蓝鲸。

2、写一个你自己的 C 语言编译器(Build Your Own Lisp)

一本面向初学者的免费英文电子书,介绍怎么用 C 语言写编译器,以 Lisp 语言的编译器为例。

3、A Soft Murmur

一个背景音网站,可以开关不同的音效,并调节它们的音量。

图片

1、13个圆画出动物

一个艺术家使用13个圆,画出各种动物。

猫头鹰

兔子

猴子

文摘

1、Claude Opus 4.5 是第一款让我真正担心自己工作会丢掉的大模型

Claude Opus 4.5 真是完全不同于其他模型。还没用过的人根本无法想象未来两三年会发生什么,明年可能就是最终的转折点。

我不知道接下来该如何适应。当然,我可以整天看着 Opus 帮我工作,偶尔出点小问题再干预一下,但再过一段日子连这些都不需要了呢?

编码问题基本上已经解决了,接下来像系统设计、安全之类的问题也会迎刃而解。我估计再过两三个版本,80%的技术人员就基本没用了。当然,公司还需要一些时间来适应,但他们肯定会想方设法尽快摆脱我们。

虽然我很喜欢 AI 这项技术,但一想到这一切最终会走向何方,我就感到难过。

2、为什么学习物理学

(本文摘自理查德·费曼于1963年6月在里约热内卢举行的美洲物理教育会议上发表的演讲。费曼是加州理工学院理论物理学教授。)

我们应该教授物理学,这有五个原因。

(1)物理是一门基础科学,应用于工程学、化学和生物学等各种技术领域。

物理是研究自然界的科学,或者说是认识自然界的科学,它告诉我们事物是如何运作的,以及人类在当前和未来的技术中发明的各种设备是如何工作的。因此,懂物理的人应对本行业出现的技术问题会很有用。

(2)物理教会你如何动手做事情。它教授许多操纵事物的技巧,以及测量和计算技巧,这些技巧的应用范围比特定研究领域要广泛得多。

(3)物理作为一门科学,对许多人来说,是一种极大的乐趣。

科学教育培养出来的科学家,不仅为工业发展和知识发展做出贡献,同时也参与了我们这个时代的伟大冒险,从中获得巨大的乐趣。

即使一个人没有成为一名专业科学家,研究自然也是为了欣赏自然的奇妙和美丽。这种对自然的了解也给人一种稳定和现实的感觉,并驱散了许多恐惧和迷信。

(4)物理教会人们如何认识事物,帮助你质疑很多事情。质疑和自由思想的价值,不仅对科学发展,而且对其他各个领域,都显而易见。

科学教导我们如何认识事物、什么是未知事物、事物被认识到什么程度、如何处理怀疑和不确定性、证据规则是什么、如何思考事物以便做出判断、如何区分真理与欺诈。这些无疑是教授科学,特别是教授物理的重要收获。

(5)在学习科学的过程中,你会学会如何试错,培养发明创造和自由探索的精神,这种精神的价值远远超出了科学本身。

人们会学会问自己:"有没有更好的方法 ?"我们必须想出一些新的技巧或方法,以改进这项技术。这种想法是许多思想、发明创造以及各种人类进步的源泉。

言论

1、

为什么我们有两个鼻孔,而不是一个大洞?

因为肺部持续需要空气,两个鼻孔可以交替工作,让鼻子的一侧得到休息。

-- 美国《大众科学》

2、

报社招我去当撰稿人,我以为是去写稿,结果却是以极低的薪水让我编辑 AI 生成的文案草稿,理由是"大部分工作已经完成了"。

这让我深受打击,我曾经觉得自己很有价值,受人重视,对未来充满希望,渴望拥有辉煌的职业生涯,现在却只能修改 AI 生成的文字。

-- 一位自由撰稿人

3、

SaaS 行业将会萎缩,尤其是那些功能简单的 SaaS,因为企业现在可以用 AI 快速生成内部服务。

-- 《AI 正在蚕食 SaaS》

4、

我发现,中文不喜欢直接说 True,更倾向说 !False。比如,英文说"很好",中文说"不坏",英文说"对的",中文说"没错",英文说"正常",中文说"没问题"。

中文更喜欢双重否定"否定词+否定词",这种表达方式增加了模糊性(含糊其辞)和灵活性(模棱两可),创造了回旋余地,避免了肯定答复导致的态度明确、归类迅速、立场鲜明。

-- 《为什么中文拒绝说 true》

往年回顾

你可能是一个 NPC(#331)

新基建的政策选择(#281)

互联网公司需要多少员工?(#231)

移动支付应该怎么设计?(#181)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年12月19日

早报|App Store搜索页将加更多广告/海南封关:iPhone直降最高2140元/小红书发力「优质中长视频」

cover

🚀

ChatGPT 版应用商店正式上线

📱

海南自贸港封关首日 iPhone 17 Pro Max 最高直降 2140 元

🕵️‍♂️

苹果 App Store 搜索页将加入更多广告

📈

中国大模型「第一股」将至:智谱与 MiniMax 通过港交所聆讯

💰

OpenAI 洽谈最高 1000 亿美元融资,估值或达 7500 亿美元

🚗

芯片短缺,本田中日工厂或暂停生产

🎦

小红书社区架构大调整:全面发力「优质中长视频」

📢

腾讯回应「元宝到底是 AI 还是人」质疑

🗺

千问 App 全面接入高德地图

💡

微软 AI 负责人:未来 5–10 年保持 AI 前沿将付出「数千亿美元」成本

📱

小米 17 Ultra 定档下周,与徕卡合作全面升级

🤖

逐际动力发布多形态具身机器人 TRON 2:一机三态,4.98 万元起

🚀

火山引擎发布豆包大模型 1.8,Agent 能力全球领先

重磅

ChatGPT 版应用商店正式上线

昨天,OpenAI 在 ChatGPT 正式上线「应用」商店功能,在 ChatGPT 网页端点击「应用」或访问 chatgpt.com/apps 即可进入新功能页面,应用分为「精选 / 生活方式 / 工作效率」三大类。

目前,已上架的应用包括 Adobe Photoshop、Apple Music、Canva、Figma、Booking.com 等,应用可为对话引入新的上下文,支持在聊天中完成订购、将大纲转为演示文稿、搜索酒店公寓等操作。

连接后,可在聊天界面中通过「@ 应用名」调用指定应用或点击对话框左侧的「加号」进行选择,ChatGPT 还会基于上下文与使用习惯自动推荐相关应用。

OpenAI 表示,开发者已可提交应用进行审核与发布,并提供最佳实践指南、开源示例应用、专门的 UI 库与处于测试阶段的 Apps SDK 等资源,深受用户欢迎的应用有望获得重点推荐或在对话中被主动推荐。

早期阶段,开发者可将 ChatGPT 应用与其网站或原生应用相连以完成实体商品交易,OpenAI 也在探索包括数字商品在内的更多变现方式,并将根据反馈持续迭代。

所有应用须遵守严格的安全与隐私规定:符合 OpenAI 使用政策、提供清晰隐私政策、仅请求实现功能所需的必要信息;用户可随时断开连接,断开后应用将立即失去访问权限。

与此前的「GPTs Store」不同,本次应用商店以更接近苹果 App Store 的形态将复杂能力封装为可点击、可订阅、可组合的「应用」,使看似普通的对话框成为总入口,并为其带来连接第三方应用的能力。

🔗 相关阅读:突发|ChatGPT 版应用商店正式上线

海南自贸港封关首日 iPhone 17 Pro Max 最高直降 2140 元

昨天,海南自由贸易港正式启动全岛封关运作,实施「一线放开、二线管住、岛内自由」政策:

  • 一线,即海南与境外之间的货物、人流进出更加便利;
  • 二线,即海南与内地之间的货物进出需严格监管;
  • 岛内则实现要素自由流通。

据界面新闻报道,三亚海旅免税城等门店迎来购物热潮,苹果 iPhone 等热门数码商品因免税与消费券叠加出现显著降价。

其中,iPhone 17 Pro Max 256GB 免税价为 9299 元,较电商平台便宜 700 元;2TB 顶配版本免税价 16859 元,叠加消费券后低至 15859 元,较官网省 2140 元。

免税城方面称,iPhone 17 Pro Max 1TB 和 2TB 版本目前无货,256GB 与 512GB 版本可正常购买。

同一门店其他机型价格也有下调:iPhone 17 Pro 256GB 免税价为 8299 元,叠加优惠后较电商平台省 1000 元;iPhone 17 256GB 差价约 420 元,幅度相对较小。

免税清单扩容同步落地,新增扫地机器人、微型无人机等品类,覆盖税目扩充至 6600 个、较此前近 3 倍。封关配套的便利措施包括「即购即提」不限机场提货、免税商品种类扩容与高单价商品的显著价格优势。

离岛免税规则明确:离岛旅客需凭离岛交通凭证及身份证购买,全年免税额度为 10 万元,超额需补税;岛内居民在有年度离岛记录情况下,可不限次购买 15 类「即购即提」商品,但单件单价需低于 2 万元。

官方强调,免税商品不得转售,「套代购」将面临禁购及征信处罚。海旅免税城当前热门机型出现断货与补货交替的供需情况,提示消费者提前规划购买与出行安排。

海南大学教授刘家诚,表示「封关不是封闭,也不是封岛,而是更高水平的开放」,海南自贸港将成为中国与全球市场的「超级接口」,亦是国内国际双循环的重要交汇点。

大公司

OpenAI 发布 GPT‑5.2‑Codex,强化防御性网络安全应用

今天,OpenAI 正式发布智能体编码模型 GPT‑5.2‑Codex,定位为「迄今最前沿的智能体编码模型」,面向复杂的软件工程与防御性网络安全场景。

该模型基于 GPT‑5.2 定向优化,具备更强的长程任务执行能力、代码重构与迁移性能、原生 Windows 环境适配,以及对截图、技术图表和用户界面的精准理解。

OpenAI 表示,GPT‑5.2‑Codex 已在 Codex CLI、IDE 扩展、云端与代码审查场景向付费 ChatGPT 用户开放,API 接入将在未来数周逐步启用。

在性能方面,GPT‑5.2‑Codex 在 SWE‑Bench Pro 基准测试中准确率达到 56.4%,在 Terminal‑Bench 2.0 中准确率为 64.0%,均较前代模型有所提升。

模型通过原生上下文压缩提升长周期任务的稳定性与 token 使用效率,并在终端任务中展现更高成功率与可靠性。

此前,研究人员已利用 GPT‑5.1‑Codex‑Max 在 React 框架中发现并披露漏洞,显示该系列模型在现实防御性研究中的潜力。

在网络安全方面,OpenAI 强调 GPT‑5.2‑Codex 虽未达到「高」级能力门槛,但已显著增强防御性能力。

公司同步推出「可信访问计划」,仅限邀请安全专业人士与具备明确应用场景的机构参与,用于漏洞研究、授权红队测试等防御性工作。

OpenAI 表示,随着模型能力持续提升,将以负责任的方式逐步开放访问,并与安全社区保持紧密合作,以降低滥用风险。

苹果 App Store 搜索页将加入更多广告

据 9to5Mac 报道,苹果宣布将在 App Store 搜索结果中扩充广告位,明年起在搜索结果列表更靠后的位置新增广告,以进一步提高广告主通过搜索推动下载的机会。

苹果在 Apple Ads 官网更新中称「搜索是大多数用户在 App Store 中查找并下载应用的主要方式,近 65% 的下载发生在搜索之后」,因此将「在各类搜索查询中引入更多广告」。

目前,App Store 搜索结果顶部仅有一个广告位,新增广告将出现在更靠后位置。

苹果表示,广告主与开发者无法选择或竞价特定广告位置,实际展示位置取决于竞价出价金额及其在拍卖中的排名,且同一广告活动的展示位置也可能变化。

计费方式维持按点击付费或按安装付费,广告格式在不同位置保持一致,可使用默认或自定义产品页面并可选深度链接。现有搜索广告将自动获得新广告位资格,支持 iOS 26.2 与 iPadOS 26.2 及更高版本。

苹果官网信息显示,App Store 每周访问用户超过 8 亿,超过 85% 的用户在最近一次访问中至少下载了一款应用,搜索结果顶部广告位的转化率约 60%。

美光:全球内存短缺将延续至 2026 年后

据 The Verge 报道,全球三大内存供应商之一美光在最新财报中预计,受 AI 驱动的需求激增影响,DRAM 和 NAND 的「紧张行业状况」将持续至 2026 年以后,且「在可预见的未来」供给将明显落后于需求。

美光 CEO Sanjay Mehrotra 在周三的财报电话会上表示,过去数月客户的 AI 数据中心建设计划显著推高了对内存与存储的需求预估,公司虽将于明年把 DRAM 与 NAND 出货提高约 20%,但仍不足以满足各类市场的广泛需求,PC 出货在明年可能因此受到影响。

在 AI 浪潮带动下,美光财季营收再创新高,达到 136.4 亿美元,较去年同期的 87.1 亿美元显著增长。

随着 OpenAI、Meta、Microsoft 与 Google 等公司为数据中心部署更强算力,附带高带宽内存(HBM)的芯片需求快速上行,美光正将资源优先倾斜至 HBM 业务。

近期,该公司关闭了面向消费者的英睿达 Crucial 业务,以集中满足 AI 客户的更高价值订单;HBM 相较标准 DRAM 需要约三倍硅晶圆,从而进一步挤压面向 PC、智能手机、智能电视与汽车等日常消费设备的 DRAM 供给。

Mehrotra 称「供给将在可预见的未来显著低于需求」,并表示尽管投入巨大,公司仍「无法满足所有细分市场其他客户的需求」。

为扩充产能,美光计划于 2027 年在爱达荷州新厂投产,2030 年在纽约州新厂投产;但在新产能落地前,行业性内存供需不平衡将延续。

中国大模型「第一股」将至:智谱与 MiniMax 通过港交所聆讯

据 36 氪报道,国产大模型企业 MiniMax(稀宇科技)与智谱 AI 已于本周初完成中国证监会备案,并通过港交所聆讯;其中 MiniMax 计划于 2026 年 1 月在港挂牌上市。

若成功,MiniMax 将成为全球从成立到上市速度最快的 AI 公司之一,自 2022 年初成立至 IPO 仅用四年。

MiniMax 的收入结构中 C 端产品占据重要位置,彭博社曾报道其 2024 年预期营收约 7000 万美元,较大比例来自角色互动产品 Talkie。

第三方数据显示,2024 年 11 月 Talkie 月活约 2519 万;视频生成产品「海螺 AI」自上线以来,曾连续 6 个月位居全球视频生成类产品榜首。

资本层面,MiniMax 已完成 7 轮融资:腾讯领投 2.5 亿美元 B 轮、阿里 6 亿美元战略投资、最新一轮由上海国资出资 3 亿美元,公司估值超过 40 亿美元(约 288 亿元人民币)。

智谱 AI 的上市路径今年以来明显加速:4 月在北京证监局完成 IPO 辅导备案,由中金公司担任辅导机构;7 月有消息称其评估将 IPO 地点调整至港交所,如今完成聆讯意味着这一判断已落地。

融资方面,智谱自 2019 年成立至今累计完成 16 笔融资,IT 桔子数据显示最新估值约 400 亿元人民币;2025 年内先后引入杭州、成都、珠海等地资金,并于上市辅导后三个月获浦东创投集团与张江集团联合注资 10 亿元,背后已集齐北京、杭州、成都、珠海、上海五地国资背景。

组织与营收方面,智谱今年调整 G 端与 B 端业务,由 CEO 张鹏统一管理以提升人效;其面向开发者的软件工具与模型业务年度经常性收入(ARR)已超 1 亿元,预计 2025 年总营收将实现 100% 以上同比增长,并希望未来 API 业务收入占比提升至 50%。

OpenAI 洽谈最高 1000 亿美元融资,估值或达 7500 亿美元

据澎湃新闻、财联社报道,OpenAI 正在与投资者就新一轮融资进行初步洽谈,融资规模最高或达 1000 亿美元,公司的估值目标约为 7500 亿美元。

消息称,这笔潜在融资将成为今年规模最大交易之一,若落地,OpenAI 的估值较今年 10 月约 5000 亿美元将跃升近 50%。

此前多家外媒报道称,亚马逊正在与 OpenAI 洽谈一项至少 100 亿美元的投资,OpenAI 将使用 AWS 的自研 AI 芯片 Trainium。

奥特曼透露,公司或在 2027 年上市,且正考虑最早在 2026 年下半年向监管提交上市申请。

芯片短缺,本田中日工厂或暂停生产

据日本共同社报道,受半导体短缺影响,本田计划自 12 月下旬至明年 1 月上旬对日本与中国工厂实施停产或减产:

  • 与广汽集团的合资工厂将自 12 月 29 日起停产 5 天;
  • 日本工厂将在明年 1 月 5 日至 6 日停产两天,7 日至 9 日的产量也将低于原计划。

本田称,今后的生产将视半导体供应情况调整,涉及的日本工厂未公布,但埼玉制作所(埼玉县寄居町)与铃鹿制作所(三重县铃鹿市)被指「可能对象」。

本田在 11 月公布的截至 2026 年 3 月的财年合并财报显示,因半导体短缺导致产量低于预期,营业利润预计缩减 1500 亿日元(约合 67.83 亿元人民币)。

小红书社区架构大调整:全面发力「优质中长视频」

据凤凰网科技报道,小红书在几个月前对社区组织架构进行了深度调整,核心目标直指「增长」,从过往的垂类运营逻辑转向依据不同业务目标的划分。

报道指出,社区部作为基础与核心板块,现由云帆(薯名)与新岛(薯名)分别负责两条业务线:

  • 云帆负责的「Live」直接向小红书 COO 柯南(薯名)汇报;
  • 新岛负责的「Village」继续向社区业务负责人帕鲁汇报。

「Live」将对应一部分PGC内容,初步定位为「优质中长视频」,时长或超过 2 分钟,并计划培养更多大 V。

云帆此前供职于 B 站,拥有更丰富的视频运营经验。帕鲁(本名叶恒)在 2024 年初加入小红书,此前任快手电商产品一号位,入职后负责增长产品、生态产品及视频产品;社区市场部门由白板(薯名)负责,现向云帆汇报。

此次调整延续了小红书在增长上的策略演进:2023 年提出「坐一观三」,即在坐拥 1 亿DAU(日活用户)的基础上向 3 亿 DAU 进发。

除社区业务外,小红书由商业部与交易部整合的「大商业」板块由柯南担任总负责人,并与小红书 CMO 之恒共同组成领导班子;两部门的一级架构保持稳定,不作调整。

彭博社引金沙江创投内部文件称,小红书在 2025 年中估值升至 260 亿美元(约 1830 亿元人民币),较 2025 年初的 200 亿美元增长 30%。

对标同行,截至 2025 年 12 月,B 站市值约 100 亿美元(约 702 亿元人民币),快手市值约 2787 亿港元(约 2522 亿元人民币);财报显示,B 站 Q3 日活 1.17 亿、月活 3.76 亿,快手日活 4.16 亿、月活 7.31 亿。

腾讯回应「元宝到底是 AI 还是人」质疑

昨天,腾讯针对「元宝到底是 AI 还是人」的质疑发表声明:所有带有「内容由 AI 生成」标识的评论,均由元宝 AI 独立生成;无该标识的回复为编辑真人撰写。

腾讯同时强调,元宝在多平台与跨时段的高频响应「并非轮班人工可达」,以此澄清外界对运营模式的误解。

腾讯称,当前微信公众号、视频号、QQ 浏览器、腾讯新闻、QQ 音乐、腾讯自选股与腾讯视频等主流产品评论区,均已接通「@元宝」互动。

在社交层面,微信与 QQ 可添加元宝为好友,支持一对一交流、文件处理、事务咨询与群聊「一键总结」,用于快速梳理「999+」消息。上述覆盖的时间段横跨凌晨、清晨、早高峰、午休与深夜。

索尼与腾讯就《荒野起源》案达成和解:索尼撤诉、腾讯多平台下架

据 The Verge 报道,索尼互动娱乐与腾讯就《荒野起源》涉嫌抄袭《地平线》系列一案已达成保密和解。

当地时间 12 月 17 日提交的法院文件显示,索尼已撤回起诉,相关案件被法院驳回,原告不得就同一事由再次起诉。

腾讯美洲区通讯主管 Sean Dejin 表示,双方不会就此事发表进一步公开评论,并期待未来合作。

值得注意的是,《荒野起源》已从 Steam 及 Epic Games Store 等平台下架。不过,《荒野起源》官网仍可正常访问。

12 月初,双方递交联合动议达成临时协议:腾讯暂停宣发与测试,且不早于 2027 年第四季度发售;索尼同意延长法律程序时限并合并听证会日程。案件原定 2026 年 1 月 29 日听证,如今已在开庭前以和解方式落幕。

此前,PlayStation 中国官方账号曾转发《荒野起源》宣传物料并提及未来合作,随后删除;索尼也欢迎腾讯《三角洲行动》登陆 PlayStation 平台,并推荐腾讯北极光工作室新品。

两家公司在第三方项目与股权层面亦有交集,这次和解与「期待继续携手」的表态,释放出维持合作空间的信号。

Manus 达 1 亿美元 ARR 里程碑

AI Agent 应用 Manus 近期达到「从零到 1 亿美元 ARR」的商业化里程碑,联合创始人张涛(社区 ID「hidecloud」)披露,自 3 月底启动商业化至今不足 9 个月,年化运行率已达 1.26 亿美元。

Manus 团队的产品路线由「AI 浏览器」转向「云端可操作的浏览器与数据访问」的 Agent 框架,核心信念是「Less structure,more intelligence」,减少对模型的人工控制,让 AI 在具备「电脑、权威数据访问、适当训练与用户反馈」的环境中自行涌现能力并持续进化。

千问 App 全面接入高德地图

昨天起,千问 App 全面接入高德地图能力,围绕导航与生活服务实现深度打通:用户在千问 App 中可一体化完成路线规划、周边餐饮娱乐检索与「顺路」店铺筛选,提升复杂出行需求的响应效率。

此次接入覆盖新能源车出行、限行规避与服务信息等关键场景。

用户提供出发地、目的地与车辆续航信息后,千问 App 将参考高德路线数据自动规划沿途充电站;同时支持依据车牌尾号、出行时间与目的地生成合规出行方案,并在路线规划界面同步展示收费站、服务区与限行提示。

高德称,未来将与千问在餐饮、娱乐、休闲等生活场景继续扩展智能服务体验。

蔚来全新 ES8 交付突破 30000 台,创国内纯电 SUV 新纪录

昨天,第 30000 台蔚来全新 ES8 新车在成都天府艺术公园蔚来中心完成交付。这一里程碑距离 11 月 29 日达成第 20000 台交付仅过去 19 天,创下国内 40 万元以上纯电车型最快突破三万台交付的纪录。

交付现场车主任先生表示,此次增购全新 ES8,主要看中其基于纯电架构带来的越级空间表现,以及蔚来「可充可换可升级」能源服务体系所提供的便利与高效补能体验。

蔚来方面称,全新 ES8 销售势能持续走强,产能正在加速爬坡,交付节奏明显提速。随着纯电技术的成熟与补能体系的完善,越来越多原本选择增程技术的用户正加速转向纯电车型。

💡 微软 AI 负责人:未来 5–10 年保持 AI 前沿将付出「数千亿美元」成本

据《商业内幕》报道,微软 AI 负责人 Mustafa Suleyman 在播客「Moonshots with Peter Diamandis」的最新一期中表示,未来 5 到 10 年内,想在前沿 AI 领域保持领先将需要「数千亿美元」级别的投入。

他强调,这不仅包括前沿模型的研发,还涉及对顶尖研究人员与技术人才的高薪竞争,以及在全球范围内建设「千兆瓦级」 CPU 与 AI 加速器所需的基础设施规模。

Suleyman 称,微软正将自身视作一家「现代施工公司」,其使命是实现前沿模型的自给自足,并打造「世界级的超级智能团队」。他表示微软正在「全力推进前沿」,目标是构建「最强、最安全的超级智能模型」。

Suleyman 在节目中坦言,按照当前的成本曲线,「很难说」初创公司能否与大厂在前沿 AI 上抗衡,市场估值的「泡沫与不确定性」部分源于对「智能爆炸」是否会突然到来的分歧 —— 一旦这类拐点出现,「可能会有很多玩家同时到达」。

在此前的公开表述中,他将团队目标描述为打造「人本主义的超级智能」,即更加贴近人类利益的系统取向。

微软在最新一个财季的营收为 777 亿美元,当前市值约 3.54 万亿美元,Suleyman 认为大型公司在算力与资本密集投入上的「结构性优势」在这一轮竞争中会持续显现。

Suleyman 还强调,置身大型公司带来的工程组织与资源整合能力是关键优势,他将微软的长期目标描述为在前沿模型上实现更强的内生能力与安全标准,从而在下一阶段的「超级智能」竞争中争取主导权。

新产品

3299 元,XREAL 推出新一代 AR 眼镜 1S

昨天,AR 眼镜厂商 XREAL 正式发布新品 XREAL 1S,面向更广泛的年轻消费群体,主打「一副眼镜,开启 500 英寸随身空间巨幕时代」,核心亮点包括:

  • 搭载自研 X1 空间计算芯片,支持实时 2D 转 3D 功能;
  • 配备 Sony Micro-OLED 微显示屏,双眼 1200p 分辨率与 700 尼特亮度,并获得 TÜV 莱茵眼舒适五星认证;
  • 原生 3DoF 空间显示能力,无需手机 App 或额外配件即可实现稳定画面;
  • 全链路优化,M2P 延迟低至 3ms,显著降低眩晕感;
  • 提供多规格鼻托与柔性铰链,确保长时间佩戴舒适;
  • 跨生态即插即用,支持 iPhone、Android 手机、Steam Deck、Windows PC 与 MacBook。

XREAL 创始人兼 CEO 徐驰在发布会上表示,眼镜是最接近人类感知的终端,也是最有可能承载下一代计算形态的入口。

XREAL 强调,X1 芯片的使命是「Spatial Display for All」,即不挑设备、不设门槛,让任何人都能随时拥有可靠的空间屏幕。

XREAL 1S 定价 3299 元,已在京东与天猫开启预约,并将在 12 月 22 日 20:00 正式发售。

小米 17 Ultra 定档下周,与徕卡合作全面升级

昨天,小米宣布,小米 17 Ultra 将于下周正式发布。官方同时确认与徕卡的全球影像战略合作升级,引入「战略共创模式」,首次在移动影像领域推出徕卡 APO 认证长焦镜头,并将在夜景画质与长焦创作体验上实现显著提升。

根据相关爆料,小米 17 Ultra 的硬件规格预测整理如下:

  • 搭载第五代骁龙 8 至尊版、1.5K 超级像素直屏;
  • 内置接近 7000mAh 电池,支持 100W 有线与 80W 无线快充;
  • 支持超声波屏幕指纹,并保留 IP68 防尘防水;
  • 影像系统据称为三摄组合:主摄为豪威 OV50X 1 英寸传感器、5000 万像素超广角(支持微距)、2 亿像素潜望长焦(推测支持 5 倍光学变焦)。

值得注意的是,雷军将小米 17 Ultra 称为「超高端手机」。他表示,小米与徕卡全球影像战略合作升级,引入「战略共创模式」,并将首次应用全新的光学能力。

售价方面,信息源「数码闲聊站」推测,在保持 256GB 起步配置的前提下,小米 17 Ultra 起售价较上一代上调 500 元,至 6999 元,或是存储芯片价格上涨所致。而上代小米 15 Ultra 的起售价为 6499 元、顶配 7999 元(双卫星版)。

此外,网传已久的「小米NAS」新品或将同时在本次发布会上亮相。

逐际动力发布多形态具身机器人 TRON 2:一机三态,4.98 万元起

昨天,逐际动力 LimX Dynamics 发布多形态具身机器人「TRON 2」,售价 4.98 万元起。

据介绍,该产品基于「具身机器人通用基座」理念与全身模块化架构,一个本体即可在双臂、双足、双轮足三种核心构型间快速切换,并支持人形、四足等形态重构,面向 VLA 科研、移动操作与全身运控的全场景应用。

TRON 2 配备仿人类手臂自由度设计的具身双臂系统:单臂 7‑DoF 类人构型关节、70 cm 臂展与超大包络覆盖,末端采用仿人球形手腕构型以实现高自由度与狭小空间内的灵活运动;

双臂具备 10 kg 负载能力,机身极限负重可达 60 kg,覆盖高位、远距与宽范围任务,面向工业与家庭等多场景操作需求。

为适配不同应用场景,TRON 2 支持主流 VLA 前沿模型,包括 Pi 0.5 与 ACT,并基于家庭操作场景拆解餐品制作、桌面清理、衣物清洁、物品收纳、快递拿取等 10 个典型任务,提供数据集、模型训练与算法部署示例,宣称无需额外调试、即插即用。

火山引擎发布豆包大模型 1.8,Agent 能力全球领先

昨天,字节跳动旗下火山引擎在 FORCE 原动力大会上正式发布豆包大模型 1.8 及音视频创作模型 Seedance 1.5 pro。

据介绍,在多项公开评测中,豆包 1.8 在视觉推理、通用视觉问答、空间理解及视频理解等任务中均获得最佳或接近最佳成绩,整体水平已接近全球顶尖通用模型。

豆包大模型 1.8 工具调用能力、复杂指令遵循能力及 OS Agent 能力均得到增强,提升了模型在处理复杂任务时的规划与执行水平。

在视觉理解方面,单次视频理解帧数由 640 帧提升至 1280 帧,支持低帧率理解超长视频,并能调用工具对关键片段进行高帧率分析,适用于在线教育、产品质检等场景。

火山引擎总裁谭待介绍,截至今年 12 月,豆包大模型日均 token 使用量突破 50 万亿,较去年同期增长超过 10 倍;目前已有超过 100 家企业客户累计 token 使用量超过 1 万亿。

与此同时,火山引擎推出了 Seedance 1.5 pro 音视频创作模型。该模型采用原生音视频联合生成架构,支持环境音、背景音乐、人声等多种元素,实现毫秒级音画同步。

在对白处理上,模型支持多人多语言对话,口型对齐精准,覆盖中文方言(如四川话、粤语)、英文及小语种,显著提升视频内容的真实感与全球化创作潜力。

🔗 相关阅读:实测豆包 Seedance 1.5 Pro:哪吒朱迪在线飙戏,复刻名场面,AI 台词、音效水平大更新

新消费

太二酸菜鱼推「透明菜单分类」,预制菜将明示

昨天,连锁餐饮品牌「太二酸菜鱼」宣布全面启动「透明菜单分类制度」,以食材新鲜度为核心明示原料使用情况,并按主材鲜活属性与预处理程度将菜品划分为 4 个类别。具体分类为:

  • A 类代表「新鲜主食材制作」,在太二「鲜活模式」门店中涵盖活鱼、活虾、鲜鸡、鲜牛肉及新鲜蔬菜;
  • B 类明确标注使用冷冻原料,如「香辣鱿鱼须」;
  • C 类覆盖预先腌制的食材,如「川式猪颈肉」;
  • D 类为集中预处理后配送至门店的品项,如「虎皮鸡爪」。

官方表示,招牌「酸菜鱼」采用每日新鲜配送到店的活鱼,门店现杀、切片、腌制,并搭配非遗工艺酸菜现点现煮;如「生炒菜心」「白玉丝瓜」等承诺日供新鲜蔬菜、现点现炒。

官方强调,「透明菜单分类制度」已同步覆盖母公司「九毛九」集团旗下多个餐饮品牌,消费者可据此直观选择不同食材处理方式对应的菜品。

不到一个月降超 30%,车厘子价格跳水

据央视财经报道,安徽合肥周谷堆批发市场车厘子批发价较去年同期整体下降约 20%,当前每箱主流报价在 150 元至 240 元之间,大尺码每箱 230 元至 240 元。

随着海运车厘子提前进入市场,价格回落较往年提前约一周,主打品种为「桑提娜」,日均进场量约 5 吨。市场预期未来几周海运到货将迎来供应高峰,交易或呈现「量大价跌」态势。

蓝鲸新闻援引北京新发地市场信息显示,11 月 30 日进口车厘子最低价为 55 元/斤,至 12 月 10 日空运车厘子降至 50 元/斤,海运最低价达 35 元/斤,按海运价格计算,不到一个月降幅超过 30%。

新发地批发端方面,4J 规格车厘子 5 斤装批发价为 248 元。零售端价格同样回落。

据盒马平台数据,智利车厘子 4J 级精品果从约 120 元/斤降至 91.8 元/斤,降幅超 20%;3J 级从 79.8 元/斤降至 71.8 元/斤,降幅约 10%;2J 级从最高约 71.6 元/斤降至 51.8 元/斤,降幅超 27%。

蓝鲸新闻报道认为,供给增加是主因。

一亩田产业研究院研究员许丽峰告诉记者,今年同期车厘子供应热度高于去年,智利种植面积较往年增长超 4%,上市时间提前且供应期延长,叠加国内蓝莓、柑橘等水果充足,消费端对车厘子的替代效应增强,整体行情预计较去年更低。

值得注意的是,春节较晚且接近智利车厘子尾季,消费高峰期价格或有一定上浮;与批发端对于海运高峰「量大价跌」的判断相互印证当前阶段的回落与后续波动预期。

周大福今天起再提价,官方回应

近日,周大福天猫官方旗舰店在首页提示「受市场因素影响,部分商品即将提价」,调价窗口为 12 月 19 日;多地门店销售表示已陆续收到新价签,大部分产品上调幅度集中在 4% — 16%。

其中,一条约 32.35g 的足金手链由 56800 元上调至 65800 元,涨幅约 15.8%。这将是周大福今年对「一口价黄金」产品的第三次提价。

据新浪财经此前报道,部分畅销款的实际涨幅已超过 30%,例如约 27g 的「五帝钱盘缠手串」从 38600 元上调至 50800 元,标价涨幅为 31.6%,今天上调后新价格更是达到 53800 元。

此前,3 月首轮调价幅度为 10% — 20%,10 月底第二次提价官方预计多数产品涨幅在 12% — 18% 之间,主要受国际金价持续上涨推升成本所致。

蓝鲸财经报道指出,周大福此次列出的调价商品除「一口价黄金」外,还包含部分铂金与铂金镶钻产品;周大福回应称价格调整属集团日常营运政策,将根据市场环境及产品需求适时调价。

行业背景方面,界面新闻称今年金价年内涨幅已超过 50%,波动加剧促使多家金店开启涨价;周大福同时推进渠道「瘦身」策略。

截至 2025 年 9 月 30 日,中国内地零售点总数降至 5663 家,较 2025 财年末减少 611 家,内地同店(直营)销售额上半年上升 2.6%,剔除钟表业务后增长 4.7%。

好看的

央视春晚公布四款马年吉祥物

据新京报报道,中央广播电视总台《2026 年春节联欢晚会》昨日发布四款吉祥物形象「骐骐」「骥骥」「驰驰」「骋骋」,与晚会主题「骐骥驰骋 势不可挡」呼应。

吉祥物整体设计融入流云纹、山云纹等千年纹样,寓意生生不息与万象更新,寄托「马到成功、前程似锦」的美好祝愿:

  • 「骐骐」灵感源自西周盠驹尊,配色取自「骐」本义(青黑色马),造型以当卢、束发髻呈现庄重典雅的气质;
  • 「骥骥」取材汉代天马与铜奔马姿态,并借鉴错金银镶松石狩猎纹铜伞铤上的飞马造型,以双翼舒展呈现腾云逐日的英姿;
  • 「驰驰」参考唐代三花马与昭陵六骏,束起马尾强化英武与自信;
  • 「骋骋」以普氏野马为原型,强调粗壮结实与身形矫健的野生血统。四者共同以历史文物与典型纹样为依据,形成跨时期的视觉谱系。

报道指出,中国普氏野马种群数量居世界之首,体现生物多样性保护与生态文明建设的阶段性成果。吉祥物发布以「四骏齐亮相」呈现,意在与全球华人共享新春气象,迎接马年新岁。

《永恒站》定档 12 月 24 日

《永恒站》昨天发布定档海报与预告,确认将于 12 月 24 日登陆院线。影片由大卫·费恩执导,叙述「死后世界」中转站的奇幻设定与一场关于真爱的抉择。

故事围绕女主角琼安在「现任丈夫赖瑞」与「战时阵亡、苦候 67 年的前夫卢克」之间的最终选择展开。片方称其以轻盈幽默与温暖情感呈现「爱与永恒的终极考验」。

《用武之地》开启预售:12 月 24、25 日全国点映

电影《用武之地》宣布开启预售,将于 2025 年 12 月 24、25 日 18:00-22:00 全国点映、于 12 月 31 日跨年上映。

片方称,为呈现「真实的人质自救逃亡之路」,剧组前期远赴非洲取景采风,拍摄近万张照片并筛选约百张作为创作参考。

片中的「子弹集市」依据当地真实市场改造,战乱地带枪支交易与日常买菜同样便利,当地人以布自制足球的生活面貌亦被纳入呈现。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


实测豆包 Seedance 1.5 Pro:哪吒朱迪在线飙戏,复刻名场面,AI台词、音效水平大更新

AI 视频最近的玩法特别多,颇有上半年 AI 生图火起来的那种感觉。

▲ 视频来源:https://x.com/pabloprompt/status/2000706593579573301/

之前火过一遍的 AI 探班视频,随着模型能力的提升,现在又开始变成了社交媒体上的热门玩法。

不过彻底摒弃了以往复杂的工作流,有更好用的模型,甚至是简单几句提示词就能复刻,视频里的同款真实感。

视频生成模型的优化,不断地在降低,对我们人类提示词工程的依赖,同时还带来了更稳定的一致性保持。

豆包最近更新了新一代的音视频生成模型,豆包 Seedance 1.5 Pro,在音视频的生成上也有了明显的改善。现在它生成的视频,支持中文、英文、日文、韩语、西班牙语等语种的不同声韵,同时针对中文场景,还能生成四川话、粤语等方言。

不仅能说,而且还能模仿不同语言的口音。有声视频是 Seedance 1.5 Pro 的一大突破,在视频生成本身,结合音频的音画同步,以及电影级的运镜两项优化,让 AI 视频看起来更真实、更细致。

目前该模型已上线豆包 APP,只需要打开豆包,点击「照片动起来」,选择 1.5 Pro 模型,就能体验到 AI 生视频的快乐。此外,在火山引擎体验中心、即梦 AI 也可以体验。

我们也提前测试了一波,Seedance 1.5 Pro 完全可以说,是现在手边能拿起来直接用,能同时融合声音,表现最好的视频生成模型。

听听「臣妾做不到啊」的原音重现

《疯狂动物城 2 》上映之前,网友们对配音演员的选择,有很大的争议。现在 Seedance 1.5 Pro 的语音生成有多牛,我们可以看看之前网上很火的甄嬛传和让子弹飞,两个视频的配音,让它来完成是什么样。

从网上找了一张影视剧的截图,然后丢给豆包,我们甚至什么提示词都没有输入,它就能做到自动识别视频画面,生成一段有感情的台词戏。

▲在豆包 App 内,使用「照片动起来」,上传首帧,生成视频

皇后和张麻子都演得太像了,这和几个月前的视频生成模型,完全不是一个 Level。 以前那些 AI 视频,口型对不上,或者声音有机械感的问题,现在都解决了。

但普通话对它来说都是基本操作,方言的表现才是 Seedance 1.5 Pro 打败那些国外模型的独门秘籍。就像 Sora 2 和 Google Veo 3.1 虽然在画面生成上被认为是行业领先,但如果把上面这两张首帧图片丢给它们。Sora 和 Veo 3 都理解不了甄嬛传的经典台词,和张麻子这流利的四川话口音。

全运会刚结束,如果你也在广州,一定忘不了「活力大湾区,魅力新广州」这句魔性的口号。我们生成了一张站在广州塔前面的照片,然后在豆包「照片动起来」里面输入提示词。

画面里的这个男生正在面向镜头,向大家介绍他身后的广州塔,他用粤语说「活力大湾区,魅力新广州,我身后面嗰个就系广州塔喇!」

这个粤语水平怎么样,比多邻国里面的早茶四件套,虾饺、肠粉、烧卖、豉汁排骨,听着是不是要舒服一点。

而且,Seedance 1.5 Pro 有一个好处是「视听一致性」,意思是它能根据画面的内容,理解视频想要表达的故事,来自动生成对应的配音。

举个例子,当我们上传了一张明显是外国人的图片时,我们不输入任何提示词,它会自动使用英文来配音,并且让画面里的角色,说合适的台词。

即便是在中餐厅面馆里吃面的威尔·史密斯,Seedance 1.5 Pro 还是让他自动用英文来说话,而且这个吃面姿势也完全对了。

同样地,我们用它复刻了 AI 片场探班的视频,直接上传一张图片给豆包,不输入任何提示词,它会自动用中文来生成视频,还配上了台词,「哇,跟阿凡达合影啦!」

当我们重新生成时,Seedance 1.5 Pro 还把照片里的男生识别成韩国人,然后生成了一段讲韩语的视频。不过,说实话,他确实是有点韩国欧巴的感觉。

豆包视频生成还有一点特别好,是我们可以直接把生成的视频,下载为动图保存在手机。配合现在模型更强大的多模态理解能力,以及能生成更真实的画面,手机里那些静态的图片,让它们「真实地」动起来,然后发到微信朋友圈,可能真的会有人看不出来。

AI 巨人照加上无人机运镜,太酷啦

叙事是 Seedance 1.5 Pro 更新的一个关键词,它的意思是这些 AI 视频不只是单纯的生成,而是有了一定的故事感,能够对要表达的内容进行理解,让 AI 生成的视频,更像是一个有血肉的作品。

一个好的视频作品,灯光色彩、音效要出色。技术性的工作也少不了,运镜就是在音画之外,不可忽视的镜头语言。

Seedance 1.5 Pro 在这次更新里,在长镜头跟随、希区柯克变焦这些电影级运镜都有了大幅度的提升。

像是之前我们做的子弹时间,现在上传一张图片到豆包,调整一下提示词,子弹时间特效也自由了。

▲提示词:子弹时间效果。时间完全冻结。舞者悬浮在半空中,对抗重力。[定格画面]:舞者、她的头发和她的蓝色裙子绝对静止,就像时间冻结中的 3D 雕像。摄像机围绕悬浮的舞者水平轨道运行。背景建筑物改变透视(视差),而舞者保持锁定在中心。头发保持僵硬并指向上方,没有飘动。裙子布料是固体的并冻结保持不动。 电影级照明,高质量。

我们把同样的照片交给 Veo 3.1 处理时,它生成的子弹时间也很难做到保持角色一动不动。因为对大多数视频生成模型来说,识别到头发,就一定要飘动;看到裙边也要摆动;所以精准的运镜控制和调度,也是区分不同模型的一项重要能力。

还有这个前段时间很火的 AI 巨人照,现在我们也可以用超酷炫的无人机俯冲和穿越运镜,来凸显视频里的巨人。

▲提示词:电影级 FPV 无人机镜头,极致动态运镜:从高空鸟瞰开始,无人机急速俯冲向一位坐在城市街道中央的巨人,红砖建筑环绕两侧。巨人保持完全静止的姿势,身体、头部、四肢均不移动,如同雕塑般定格。无人机以特技飞行动作环绕巨人静止的身体——盘旋绕腿、从手臂下穿越、沿躯干螺旋上升,然后拉远展现巨人与微小车辆(红色双层巴士、黑色出租车)和行人的尺寸对比。超写实合成。比例 16:9,时长 5s,模型 1.5 Pro。

从参考图转视频,能更好的控制视频的输出效果。但 Seedance 1.5 Pro 的文生视频能力也毫不逊色。

根据字节公开的 Seedance 1.5 pro,在内部基准测试 SeedVideoBench-1.5 的模型表现结果,显示无论是 T2V 文生视频,还是 I2V 首帧转视频,和可灵 2.6、Google Veo 3.1 等模型对比,Seedance 1.5 Pro 的表现都有一定优势。

尤其是在音频生成和音画同步上,Seedance 1.5 Pro 几乎是碾压性的存在。

我们尝试让疯狂动物城朱迪和哪吒一起,一个普通话,一个四川话,演了一出 10s 的小剧场。

▲提示词:[0s-4s] 朱迪指着哪吒说(普通话,语速快,严肃): “那个小孩!站住!双手抱头!根据《动物城交通法》,你刚才风火轮超速了!” • [5s-10s] 哪吒(四川话,翻白眼,语速慢,拖长音): “哎呀,莫挨老子!我是踩的风火轮,又没烧你的油。瓜娃子,管得宽!”

这个视频的风格和内容,和我们平时看的动画片风格真的很类似。当义正辞严的兔朱迪警官,抓到哪吒的时候,那严肃的表情和语气;还有哪吒用四川话说台词,也能对上嘴型。

APPSO 今年前前后后也测试了有十多款 AI 视频生成的模型,我们在使用的过程中,发现很多以前的测试案例,放到现在已经是 Out 了。

一开始是鲁迅来了,都得让他说两句英文;能生成一个 5s 流畅播放的视频,就谢天谢地。现在的模型,不仅支持中、英、日、韩等多语种,广东话、四川话这些特色方言都能同步生成。

恍然间,AI 视频的进化,已经从按年计算变成了按月计算。昨天的突破,今天就是及格线。

▲ Seedance 1.5 Pro 案例截图|来源:字节跳动 Seed 官网

Seedance 1.5 Pro 这次更新,可能又会变成新的及格线。但至少现在我们看到了,有了音画同步后更有感染力的视频;多语种和方言的支持,也让 AI 视频更有「生活味」;专业的电影级运镜和智能理解能力,让一些高难度的复杂场景,也有机会通过 AI 生成。

当技术能够理解画面背后的故事,自动匹配合适的语言和情绪,我们距离想象力和创作自由的时代,又近了一大步。

实现这一切需要什么? 一张图片或者一句提示词。

打开豆包 APP,上传/输入,生成,就这么简单。每张照片都是待激活的故事,每次上传都是创作的开始。

步骤越少,门槛越低,创作者越多,用 AI 视频实现创意就该是这样。

文章内视频可点击该链接前往观看:https://mp.weixin.qq.com/s/em_E90Q7AdydHsNwVkAMTQ

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


NASA 新局长上任:亿万富豪转行上太空,自称和马斯克不太熟

美国国家航天局(NASA),来了个另类的新局长。

当地时间 12 月 17 日,美国参议院以 67 票赞成、30 票反对的结果,正式批准 Jared Isaacman 出任 NASA 局长,结束了此前 NASA 由交通部长 Sean Duffy 临时的代管的局面。

Jared Isaacman 何许人也?一个亿万富翁企业家,一位私人飞行员,上过两次太空的业余宇航员,是 SpaceX 的金主,现在是史上最年轻的 NASA 局长。

兴趣是上太空的亿万富翁

Issacman 的生涯也颇有企业家的传奇色彩。从小,Issacman 就对计算机和技术表现浓厚兴趣,16 岁时选择辍学,进入了一家支付公司做技术支持工作,发现商业模式有不少低效之处。

同样是 16 岁那一年,Isaacman 得到了爷爷给的 1 万美元支票,在家里的地下室开创了自己的第一家公司——一家名为「United Bank Card」的初创企业,旨在改变商业支付现状,Isaacman 会亲自打电话,一个个寻找潜在的客户。

这家公司不断壮大,几经变更后,成为现在知名的端到端支付技术提供商 Shift4 Payment。

2020 年,Shift4 Payment 在纽约证券交易所上市,作为 CEO 和创始人的 Isaacman 一跃成为亿万富翁,随后几年 Shift4 不断进军新领域,例如太空业务,和 Starlink 有所合作。

除了在商业领域取得成功,Isaacman 也在飞行领域颇有建树:他拥有多款军用喷气式飞机的飞行资格,在民用和退役军用飞机上累计超过 7000 小时的飞行时间, 还在 2009 和 2011 年打破了轻型喷气机环球速度世界纪录。Isaacman 还创立了 Draken International,运营着全球最大的私营退役军用战斗机机队。

征服了蓝天后,Isaacman 的下一个目标是宇宙。

他出钱又出力,亲自领导了 SpaceX 在 2021 年的 Inspiration4 计划,实现了人类史上第一次私人太空旅行,绕地球轨道飞行三天;在 2024 年的「北极星黎明」计划,Isaacman 再次领导团队出征,达到美国登月以来人类距离地球最远距离,Isaacman 本人更是成为了第一批在太空行走的私人宇航员

▲ 北极星黎明计划中出舱的 Isaacman

虽然主导过载人航天计划,还亲自「上天」两次,但 Isaacman 本人既非科学家出身,也没有政治背景,给人感觉更像是,一个相当富有的航空爱好者,通过不懈努力(和烧钱),跨界成为了全世界最重要的航天机构领导者,堪称「用爱发电」的最高境界。

资本选出的局长,目标是月球

不难看出,Isaacman 和 SpaceX 以及马斯克的关系密切,实际上他能参选 NASA 局长这件事,背后很可能也是马斯克在推动。

去年,当马斯克的盟友唐纳德 · 特朗普当选美国总统后,在 12 月就提名了 Isaacman,但今年 5 月特朗普和马斯克关系恶化,Isaacman 的提名又被撤回,上个月才重新批准。

本周三,参议员们以 67 票对 30 票的大幅票数,通过了 Isaacman 出任 NASA 局长的任命,这也是 Isaacman 政治生涯的开端。

不管是 Isaacman 的背景,还是和 SpaceX 的关系,都让人明显感觉到,这是资本选出来的航空局长。在听证会上,Isaacman 也表示,随着各国太空竞赛的进一步升温,吸引更多互相竞争的私营力量,是领先的关键。

网友纷纷担心 Isaacman 和 SpaceX 的密切联系,会使得 NASA 国家资源被马斯克个人所用,扭曲 NASA 宇宙探索的纯粹使命。

▲ 马斯克和 Isaacman

不过 Isaacman 直接否认了他与马斯克关系密切的说法:「有趣的是,在一个充满摄像头的世界里里,在餐厅、游艇等各种地方都没有我们的合照,因为根本不存在。」他表示,之前他选择和 SpaceX 合作,只是因为那是当时唯一的选择。

在上周,Isaacman 还对 SpaceX 的竞争对手、杰夫 · 贝索斯的蓝色起源公司示好,不排除未来会加大 NASA 与其的合作,这是有损马斯克利益的。

▲ 蓝色起源今年的全女私人航天计划

除此之外,他还建议 NASA 多和大学以及学术机构合作,认为未来 NASA 的角色是「科学的力量放大器」。

不管 Isaacman 和马斯克是不是一个战线,可以确定的是,这个新局长是一个不折不扣的前进派,并且有事他真上,面对当前 NASA 的困境,他雄心勃勃:

我会探索所有办法将项目送达发射台,甚至如果需要的话,我自己会资助。

曾经那些科学家和官员出身的局长很难给出这样的说辞,但对于自掏腰包让自己上太空的 Isaacman 来说,又相当合理。

▲ Inspiration4

目前特朗普、Isaacman 和马斯克都有同一个目标——月球。

Isaacman 在参选的听证会上强调了对总统登月计划的赞同;马斯克在上个月也宣布 SpaceX 接下来将大力聚焦登月;NASA 的「阿耳忒弥斯」登月计划也已经在与 SpaceX 紧密合作。

月球已经成为了各国太空竞赛的必争之地,中国已经计划在 2030 年在月球建立一个可运作的永久性月球基地;特朗普也表示,希望美国建立一个永久的月球基地,以便资源开采,并作为通往火星的跳板。

目前 NASA 的登月计划已经落后,虽然对外宣称将于明年春季进行载人绕月飞行任务,但实际情况并不明朗。

因此,对于 Isaacman 任期的一个重要的考察指标,就是能不能建出 NASA 的月球分部。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


Vidu Agent 掀桌子!一张图直出 4A 广告大片,拿来直接投放

过去这几个月,大家的朋友圈大概都被极其逼真的 AI 视频刷过屏,比如刀切一切、片场穿梭合影等等。它们的光影和细节如此逼真,近乎达到了「以假乱真」的地步。

而龙林、土豆人等 AI 创作者,更是靠 AI 视频火出了圈。

但当你也跃跃欲试,想要将它们转化为生产力时,断裂感便扑面而来 ——

你生成了一张绝美的产品图,想把它变成 15 秒的电商 TVC,结果 AI 给你吐出一段脸部崩坏、画质塌陷的废片;你想剪一个热门短视频,却发现需要分别生成几十个镜头,再自己去剪辑软件里对着音轨、找 BGM、调色。

目前的 AI 视频工具,大多还停留在「生成素材」的逻辑里。它们能给你一块精美的砖头,但没法直接给你盖出一栋房子。创作者依然被困在繁琐的「抽卡」和后期的修修补补中,那种「所想即所得」的快感,在复杂的商业需求面前瞬间烟消云散,该加的班一秒也没少。

同作为打工人的我,也一直在等待一个能把创意、分镜、生成、剪辑、音效统统打包,直接交付「成品」而不是「玩具」的帮手。

Vidu Agent 的出现,让我离这个期待更近了一步。它不再谈论参数,而是直接打出了一个极具诱惑力的口号:「你的专业视频创作伙伴」。

12 月 16 日起 Vidu Agent 已全球开放内测,用户进入 Vidu 官网(Vidu.cn)申请 Agent 内测,并加入社群即可优先获得体验权限,快去申请吧~

一键成片,从「灵感」到「交付」只需一步

「效率」与「质感」,往往是一对难以调和的矛盾。

既然主打「一站式」解决方案,我们决定略过寒暄,直接将 Vidu Agent 置入对效率极其敏感的电商广告与内容营销战场,看看它所谓的「一键成片」,究竟是噱头,还是具备掀翻桌子的底气。

初见 Vidu Agent,标准的输入框、附件栏与选项按钮,并没有让我感受到特别之处。反倒是整体「紫色渐变」的风格,确实很符合我对 AI 页面的刻板印象。

先来做个香水广告试试。我生成了一个香水的图片,并要求它输出一段具有高端质感的 TVC。

此时,Vidu Agent 才真正展露锋芒 —— 它并没有急于生成视频,而是先切换至「画布创作模式」。不到一分钟,一份完成度极高的分镜脚本便呈现在眼前。

这不仅是简单的画面描述,从场景构建到镜头语言,甚至连旁白文案都已就位。这种「先脚本,后成片」的交互逻辑,不仅赋予了用户掌控感,更提供了一种与众不同的交互体验。

我回复满意后,Vidu Agent 就马不停蹄开始干活。又是不到一分钟,一段完整可用的 15 秒香水广告就出来了。

成片的质感令人印象深刻:色彩的调教、光影的流动、镜头间的衔接都显得游刃有余。更重要的是,它读懂了香水这一品类场景下的「隐性需求」,知道香水这种产品的「调调」,成功营造了高端的品牌调性。

接着,让我们来看看 SKU 极多的服装电商。为了展示服装在不同场景的特性,拍摄团队往往需要频繁转场外拍,差旅和人力成本都巨大。那 Vidu Agent 能解决这个问题吗?

我们让它来做个冲锋衣的广告。我给它一张图片,让它生成一个具有溯溪、登山、野外徒步和城市遛狗多个场景切换的短片,以展示冲锋衣的日常穿搭场景以及防水、防风、防寒、时尚等功能特性。

初版交付迅速,观感尚可。但为了测试其极限,我们决定扮演挑剔的「甲方」,对溯溪场景的细节与内搭款式提出了修改意见。

给出修改意见之后,Vidu Agent 都能根据我的需求迅速呈现新的脚本,直到我给出「满意」的答复。

「提个意见」对于人类来说习以为常,但对于 AI 可不同,它考验的是一致性能力。过去不少 AI 生成的内容都需要不停「抽卡」,就是因为做不到一致性,没法在生成的结果里继续优化,经常出现产品变形或者「相似但不一样」的尴尬。

但在使用 Vidu Agent 的过程中,我完全没有遇到这个问题。你可以基于已有的好结果继续推进,一步步在画布里落实你的各种想法,而不是因为部分的不合心意而导致全盘推倒重来,给了创作者对于过程的「精细化编辑」权利。

哪怕实在不放心,我也可以直接点击画布的脚本区域,自己上手修改,算是一个兜底。

除了服装之外,面临同样问题的产品,还有家居和小家电。为了拍摄它们在各种家庭场景里的效果,要么得自己搭建实景拍摄,要么就得靠 3D 软件渲染。无论哪种,工作量都可以预见得大。

我们就以一个斗柜和一款面包机为例,看看 Vidu Agent 如何解决这些问题。

这两条产品的视频,前后花了不过十分钟。

没有繁琐的布景和建模,只需要给几张产品图片与不足 20 字的功能、场景要求, Vidu Agent 便完成了两条高质量产品宣传视频。

广告电商从业者即使不会写任何提示词,意味着只要有产品素材,就能批量产出可以直接投放的高质量产品宣传视频。

除了真实度极高的视频,Vidu Agent 还提供了丰富的音色选择,涵盖了各类电商品类常见的声音。

像是面向孩子们的玩具车,它就会明白应充满童趣,会智能适配小男孩的声音。

除了这些之外,你还可以把脑洞开得更大一些。比如最近的巨人照和巨型产品,也可以用来一键生成创意类广告。

如果仅止步于生成脚本与视频,Vidu Agent 充其量只能算是一个合格的「效率工具」,难免陷入同质化的平庸。

但它更难能可贵的一点是,哪怕你只是一个模糊的想法,Vidu Agent 也可以为你写一个完整故事。你只需要提供故事的主人公和角色,大致描述故事的情节,它就能帮你补充完整故事,做出直接可商用的专业视频。

▲用给的素材生成一个动画短片,以小猫和狼为主角,主题为猫陷入危险,狼挺身而出救它,它们从天敌成为好朋友的故事。保持画面风格和主角的一致性。

坦白讲,面对这样一支由 AI 生成的动画短片,即便是看惯了科技内容的我,也被它传递的暖意所打动。无论是画面的光影质感,还是配音的情绪拿捏,它都交出了一份超越预期的答卷。

但真正令我感到惊喜的,是它生成的内容已经到了「理解」的层面。

它读懂了香水和口红需要优雅的推拉镜头,家电和家居产品要融入生活场景,而潮牌需要品质感的场景切换,童趣的场景需要辅以温暖的故事与口音,以展示不同产品在多元使用场景中的功能和品牌调性。

直白来说就是,它像是一位在 4A 广告公司工作多年的创意总监,明白你想要什么样的内容。

这就好比你以前做饭得自己买菜、洗菜、切菜、炒菜,而现在你只需要告诉大厨:「我想吃鸡」,大厨就会为你奉上各种口味不同的菜单,你只要再确认一遍味道,等着菜做好端上来就行了。

不难看出,Vidu Agent 将想法落地的时间大大缩短,让创作者得以从无尽的重复劳动中抽身,回归到最本质的工作—— 创造。

复刻爆款,把专业「导演」请回家

爆款内容的诞生,往往伴随着全网范围内的解构与效仿。但实际上,模仿也并非易事:从分镜拆解到场景复现,再到重写故事、后期剪辑,复刻爆款的隐形成本居高不下。

可比起繁琐的流程,高强度的投入与不确定的流量反馈之间,更容易让创作者产生巨大落差。精心复刻的作品,很可能会在算法的海洋中石沉大海,让辛苦投入看不见回报。

而 Vidu Agent 要做的事情,就是打破这种高风险的博弈,让爆款生产成为可批量复制的事情,同时成本降低到可以忽略不计。

同样,我们找了几个不同类型的经典案例进行「复刻」测试。

首先是最近很火的《疯狂动物城 2》。我想让朱迪飞上蓝天,于是我想到了经典的宝矿力广告,让 Vidu Agent 给我二创一个朱迪在动物城飞上蓝天,实现新梦想的短片。

实话说,这个效果真的很不错。朱迪在车上跳跃,最后登上蓝天的故事,简直像是第三季的预告片。

当然,将爆款视频的画面语言和叙事逻辑复刻到一个产品上,也不费力气。例如前不久引发大家调侃的《WE ARE M》广告,我们就能将它变得更加高大上起来 ——

而这,正是 Vidu Agent 可怕的地方:如果说「一键成片」是降低了门槛,那么 Vidu Agent 的「复刻视频」功能,算是要把门槛都拆了。

Vidu Agent 不是简单的像素拷贝,而是真的懂得「爆款内核」。它会理解视频背后的骨架,学习视频的节奏、镜头切换和情绪曲线,将这些「爆款 DNA」提取出来,迁移到你提供的产品素材上。

那些曾经需要资深剪辑师逐帧分析才能习得的运镜逻辑,现在变成了一个你随时可用的表达工具。你不再需要从0推导公式,直接填写需求,AI 自会给出最优解。

门槛降低,简单可交付

Vidu Agent 的体验,让我有一个强烈的感受:AI 视频生成,正在经历从「玩具」到「工具」的蜕变,甚至开始扮演起「合伙人」的角色。

在过去,制作一条专业的电商 TVC 或爆款短视频,需要编导、摄影、剪辑组成的团队,以天甚至周为单位来打磨各种细节。这道由技术和成本构筑的「护城河」,曾将无数中小创作者挡在门外。

这种门槛,放在 AI 创作的领域亦是如此。从最初 Stable Diffusion 时代那令人望而生畏的复杂工作流,到后来需要像写代码一样撰写一长串提示词,「专业」的门槛都一直高悬。

而 Vidu Agent 作为一站式「专业视频创作伙伴」,让普通人也获得了这种落地的能力。它不再要求你精通镜头推拉摇移的语言,电脑上复杂的非线性剪辑,也不需要你苦练复杂的 Prompt 咒语 —— 它将繁琐的执行过程压缩进了一个简单的对话框,让「一人成军」不再是一句空话。

这意味着,创作者的「试错成本」被空前拉低,可以更加专注于自己的想法和创意,以极低的成本进行高频次的内容迭代。

另外敲重点!多模态领域 Vidu 首推 Agent API,Vidu 深入场景为企业提供可端到端交付结果的 API,不再是单点原子能力!

该 API 通过多智能体深度协同技术实现,主要面向全球开发者、企业及合作伙伴,广泛适用于全球电商平台、广告代理、品牌方、MCN 机构以及内容工作室等场景。欢迎开发者和企业体验,快速在自有业务/系统中构建创作智能体!

附体验地址:

https://platform.vidu.cn/

当创作者可以不再受困于技术细节的平庸,重新聚焦于创意本身,想象的主权才能再次回归:你只需专注于故事的灵魂,至于如何呈现,Vidu Agent 自会给你答案。

爱范儿,让未来触手可及。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


奔驰首席设计官戈登·瓦格纳即将离任,一个「感性设计」时代的落幕

昨天晚些时候,梅赛德斯-奔驰集团的首席设计官戈登·瓦格纳(Gorden Wagener)在其社交媒体上宣布,他将于 2026 年 1 月 31 日正式卸任。

在告别宣言中,瓦格纳写道:

近三十年来,我有幸塑造了梅赛德斯-奔驰的设计语言与品牌风格。我们以勇气、创造力和大胆革新,共同定义了一个时代……我在奔驰设定的所有目标均已圆满达成。未来的蓝图已然绘就,我也该为这一篇章画上句号,将接力棒满怀信心地交给继任者。

这次离职是瓦格纳主动提出并经双方协商的结果。

他的转身离开,不仅终结了自己在奔驰长达 28 年的职业生涯,更标志着这家德国豪华车企一个时代的落幕——这是一个由极度感性美学主导辉煌,却最终在电动化转型的阵痛中陷入争议的复杂时代。

既打动头脑,也触动心灵

将时针拨回 2008 年。

彼时, 39 岁的瓦格纳刚刚接替彼得·菲佛(Peter Pfeiffer)出任奔驰设计副总裁,他面临的是一个极其艰巨的任务:如何让一家深陷工程导向传统的百年车企,在设计上重新找回对年轻人的吸引力。

在瓦格纳之前,无论是布鲁诺·萨科(Bruno Sacco)还是彼得·菲佛,奔驰的历任设计掌门人都有着深厚的工程师背景。他们的设计服务于严谨的工程原则,线条硬朗、克制,却也难掩保守。

瓦格纳打破了这一切。作为首位拥有皇家艺术学院学位的「纯设计师」出身掌门人,他带来了更激进的审美直觉。

瓦格纳确立了名为「感性·纯粹」(Sensual Purity)的设计哲学,他主张「既打动头脑,也触动心灵」,他希望剥离此前奔驰车身上繁复的棱角与线条,转而追求雕塑般的曲面和光影流动。

我们不想再保守了,奔驰必须是感性的。你甚至不需要坐进去,第一眼就必须爱上这辆车。

在这种理念指导下,瓦格纳几乎重塑了燃油车时代奔驰的豪华定义。

2010 年代初推出的 CLS 四门轿跑车通过流畅的溜背线条与低矮姿态,彻底打破了传统三厢轿车的刻板印象。随后,A-Class(W176)、CLA 等面向年轻市场的车型延续这一语言,成功拓宽了品牌受众。

▲ 2010 款奔驰 CLS 350

而瓦格纳本人最钟爱的作品——AMG GT,更是将这种「感性」推向了极致,成为高性能与美学结合的典范。

它纯粹是情感与迷恋的产物。

2016 年,凭借卓越的战绩,瓦格纳升任首席设计官,权责扩展至迈巴赫、AMG 乃至游艇等领域。那是属于他的黄金时代,设计不再是工程的附庸,而是品牌溢价的核心引擎。

争议与迷失

但当汽车工业的洪流开始转向电动化,瓦格纳那一套在燃油车时代无往不利的设计语言,却遭遇了滑铁卢。

在 EQS 和 EQE 两款车型中,为了追求极致的空气动力学效率,瓦格纳主导设计了独特的「弓形结构」(One-Bow)。

这种外观在风洞测试中表现完美,但在消费市场却引发了巨大的两极分化。圆润的车身轮廓被外界戏称为「鼠标」「果冻豆」,失去了奔驰长久以来引以为傲的庄重感与豪华气场。

销量是最直接的证明。作为旗舰电动轿车,EQS 未能达到早期的市场预期,甚至迫使奔驰不得不紧急推出改款,并重新审视未来的设计方向。瓦格纳本人后来也委婉地承认,这种激进的设计或许「过于超前」了。

矛盾不仅体现在外观,更体现在座舱设计的割裂上。

最近一段时间,瓦格纳对竞争对手的内饰设计频频开火,他批评奥迪的概念车内饰像「1995 年的设计」,也对宝马 iX3 的连屏设计表示不屑,直言「屏幕不是豪华」,并提出未来应回归「超模拟」(Hyper-analogue)的精致工艺。

但现实是,奔驰在他任内推出了行业内尺寸最大的 56 英寸屏幕。这种言行之间的错位,或许也折射出他和奔驰在转型期的迷茫。

▲ 奔驰 56 英寸大连屏

继任者

尽管后期饱受争议,但无人能否认戈登·瓦格纳在汽车设计史上的地位。

回望瓦格纳的 28 年生涯,从 1997 年加入时参与设计的 SLR McLaren——这款与传奇 F1 设计师 Gordon Murray 合作的超级跑车,至今仍是奔驰高性能历史上的高光之作。到 W222 S-Class 的革新和 G 级越野车的现代化重生,再到 R232 SL 的复古未来主义,他的笔触始终试图在传统与突破之间寻找微妙平衡。

▲ 奔驰 SLR McLaren

奔驰 CEO 康林松(Ola Källenius)在评价他时称:「戈登·瓦格纳用其富有远见的设计理念塑造了我们品牌的形象。」

在离任前夕,瓦格纳留下的最后一份遗产是 Vision Iconic 概念车。这款带有鲜明艺术装饰风格、拥有巨大格栅的概念车,预示了包括 2026 年纯电 C 级和 2027 年纯电 E 级在内的新一代车型设计语言。

在他离开后,接力棒将交到 41 岁的现任梅赛德斯-AMG 设计主管巴斯蒂安·鲍迪(Bastian Baudy)手中。

鲍迪毕业于普福尔茨海姆大学交通设计专业,2010 年加入奔驰。他的成名作是 2013 年为《GT 赛车 6》游戏设计的 AMG Vision Gran Turismo 概念车。那款车从 1940 年代的奔驰赛车中汲取灵感,造型夸张、肌肉感十足,展现了鲍迪对运动与力量感的极佳掌控力。

▲AMG Vision Gran Turismo

近年来,鲍迪作为 AMG 设计主管,不仅延续了性能车的激进风格,也深入参与了 EQE 和 E 级车的设计工作。

正如当年瓦格纳以「最年轻设计主管」的身份接班一样,奔驰似乎再次寄希望于年轻血液来应对日益复杂的市场审美疲劳。他不仅要继承「感性·纯粹」的遗产,更要在电动化与数字化的双重夹击下,重新定义什么是属于新世代的「奔驰式豪华」。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


砍掉标准版!小米 SU7 换代起步即 Pro,价格或上涨 2 万元

上市两年,小米 SU7 即将迎来生命周期中最为关键的转折点。

作为小米汽车的开山之作,SU7 在 2025 年交出了一份沉甸甸的答卷:累计销量突破 25 万台,稳居 20 万以上纯电轿车市场第一梯队,在大多数月份都压过特斯拉 Model 3 一头。

但在进入第四季度后,这款曾经的「流量之王」开始显露疲态。刚刚过去的 11 月,SU7 销量从巅峰期的月销 2.9 万台回落至 1.25 万台。

▲制图:芝能汽车

这背后固然有自家新车型 YU7 分流的影响,但更核心的症结在于——站在 2025 年底回望,这款两年前发布的产品,在产品定义上已然有点落后于时代,

12 月 17 日,知名汽车博主韩路爆料,小米 SU7 换代车型将于 2026 年二季度上市。新车不仅配置大幅升级,售价预计也将上调约 2 万元。

如果爆料属实,换代后的 SU7 起售价或将从 21.59 万元提升至 23.59 万元左右,高配版本则突破 30 万元区间。

▲ 小米 SU7 目前售价

虽然接近 10% 的涨幅在业内并不多见,但涨价未必意味着销量的崩盘,消费者是否买单,取决于「升级的诚意」是否足以覆盖「价格的涨幅」。

一个近在眼前的成功案例是问界 M7。今年 9 月,换代 M7 选择涨价 3 万元,却依然凭借足够有力的升级,在 57 天内交付超 3 万台,这证明了只要产品力够硬,市场依然愿意为高价值买单。

2024 年 3 月 SU7 上市时,凭借外观设计与生态互联,它是 20 万级轿车市场最具竞争力的车型。但在极氪、小鹏等竞品已将 800V 高压平台下放到 20 万以内价位的当下,SU7 标准版和 Pro 版仍沿用的 400V 架构,已然成为了参数层面的硬伤,直接劝退了部分看重充电效率与能耗的消费者。

此外,入门款缺失激光雷达、不支持高阶城市 NOA 的差异化配置,也让 SU7 在日益内卷的智驾赛道上略显被动。

因此,根据供应链传出的消息,2026 款小米 SU7 的升级核心在于「补短板」与「超规格」。

首先是高压平台的全面普及。新车预计全系标配 800V高压架构,入门版车型也将具备 5C 级别的超充能力,彻底抹平与竞品在补能效率上的差距。

其次,各种智能化硬件也将全系标配。换代车型将不再对辅助驾驶能力进行高低配区分,而是全系标配激光雷达,并将智驾芯片升级为英伟达 Thor,算力远超现款 Orin-X,以便在高中低配车型上统一提供小米 HAD 高阶辅助驾驶能力。

在三电与底盘系统方面,换代 SU7 将引入 SU7 Ultra 同款的麒麟二代电池,新增电磁可调减振器,Max 版本升级为双腔闭式空悬。

▲小米 YU7 上搭载的英伟达 Thor 芯片

换代 SU7 若真如传闻所言实现全系激光雷达、全系 800V 高压平台和全系高算力智驾芯片,那么实际上相当于砍掉了目前的标准版,入门车型的硬件规格将直接对标当前的 Pro 版,产品序列实质上从「Pro 级」起步。

▲ 换代小米 SU7 谍照

除了产品自身升级带来的成本增加,外部供应链环境的变化也是促使价格上调的重要推手。

2025 下半年,沉寂已久的锂电原材料市场迎来结构性上涨。六氟磷酸锂价格两月翻倍,钴酸锂涨幅超 150%,电池级碳酸锂再度逼近 10 万元/吨关口。对于尚未形成如特斯拉、比亚迪般垂直整合规模的小米而言,原材料波动对利润率的冲击更为直接。

在成本红线抬高、低价竞争空间被压缩的背景下,通过配置升级支撑更高的 ASP(单车均价),或许是小米维持经营健康的唯一解法。

这可能也预示着 2026 年汽车行业的一个新趋势,在原材料成本上行周期内,车企将逐渐告别单纯的「以价换量」,转而寻求通过提升单车价值。

除常规换代外,小米也在扩展 SU7 产品线。近期曝光的长轴距版 SU7 L,轴距和车长均有所增加,旨在改善后排空间,切入对乘坐舒适性要求更高的细分市场。

结合即将推出的 YU9(家庭 SUV)、YU7 GT(性能 SUV)等新车型,小米正尝试通过多产品线覆盖家庭、性能与豪华三大场景。

在这种布局下,SU7 的定位也将发生微妙变化,它不再需要独自背负所有销量重担,而是可以更纯粹地聚焦于追求操控与科技尝鲜的年轻群体。

▲小米 SU7 L 渲染图,图片来源:@SugarDesign

当下的外部环境并不乐观。

乘联会数据显示,2025 年 12 月前两周,全国乘用车日均零售同比分别下滑 32% 和 17%,购置税优惠政策退坡叠加消费观望情绪,乘用车市场承压明显。

小米近期缩短交付周期、开放现车选配等动作,也被部分经销商解读为应对需求放缓的防御性举措。

从行业节奏看,21 个月推出换代车型,在传统车企中尚属中期改款范畴,但在当前中国新能源市场,多数品牌一年一迭代甚至半年一升级,小米已然显得有些保守。

在政策红利消退、竞品围剿、成本高企的三重压力下,小米必须利用这次换代来证明,在 20 万级的纯电轿车市场, SU7 仍然是最优选。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


专访苹果科学家:睡得好≠得分高,睡眠评分是路标不是指标

在最近的 iOS 26.2 更新之中,有一个相当细节的更新,用户会发现自己「睡眠评分」获得的评价和以前不太一样了:

以往只要获得 70 分就能收获「高」评价,现在需要达到 80 分;而最高的等级「极好」不仅改名为「非常高」,也需要用户睡到 95 分以上的高分。

带着这些问题,和更多的想法,爱范儿与苹果健康团队的研究科学家,主攻睡眠医学方面的 Matt Bianchi 博士进行了一次专访。

在 2018 年加入苹果之前,Bianchi 博士在麻省总医院、哈佛医学院都工作过,研究失眠、睡眠呼吸暂停等等睡眠议题,这些都是苹果正在关注的健康领域。

在这次访谈开始前,其实我内心一直有个疑问:昨晚如果我拿下了「100 分」的睡眠评分,是不是就意味着我睡得特别好?

Bianchi 博士告诉我,并不。

睡眠这件事,有一个标准

在运动健康领域,苹果很喜欢「说人话」,像生命体征、睡眠呼吸暂停这些指标,其实都是苹果将体温、心率、血氧、呼吸等抽象的监测数据,转换成用户一眼能懂的图表。

Bianchi 告诉爱范儿,对于睡眠评分以及更多睡眠功能时,苹果遵循三个基本原则:

透明、客观、可理解。
Transparent, obejctive, easy to understand.

但这些指标主要是以范围和趋势的形式呈现,爱范儿问 Bianchi 博士,为什么要在睡眠这个行为上引入确定的、量化的打分方式,他的答案很简单:因为睡眠真的太重要了。

睡眠对我们的身心健康至关重要,我们希望能够有一个方式可以很容易地让用户可以看到自己在前一晚的睡眠状况如何,也希望能通过这种方式鼓励用户去行动起来,提升自己的睡眠品质。

在访谈中,Bianchi 博士多次强调,苹果的睡眠评分功能,都是基于美国睡眠医学会、世界睡眠基金会等多种组织的公开指引,结合苹果自己的心脏和运动健康医学研究,研发出一套算法。

苹果的睡眠评分系统主要以三个指标构成:

  • 持续时间,占 50 分
  • 就寝时间,占 30 分
  • 中断情况,占 20 分

这些指标并非单纯是苹果自己的研究结果,也是严格参考学界给出的公开指引和指南。Bianchi 博士称,希望这些透明、标准化的指标,能够为这个功能带来进一步的影响力。

美国心脏学会在今年的一份声明中,也指出了多维睡眠健康对心脏代谢功能的重要性,其中就提到了八大维度:睡眠时长、连续性、入睡时间、规律性、睡眠相关的日间功能、睡眠结构以及无睡眠障碍。

在使用睡眠评分的过程中,我发现自己确实可以根据睡眠评分的几条细分和反馈,去积极调整自己的作息习惯,比以往的「睡眠阶段」图表,更能发挥主观能动性,形成更好的睡眠习惯。

不过这也带来了一种错位,似乎以前我们关注的「深度睡眠时长」,和这个全新的睡眠评分并没有明显的关系,包括我在内不少用户发现,即使深度睡眠时间不长,也能有很高的分数,难道我们以前关注的这些数据意义不大?

对此,Bianchi 博士解释道,在「持续时间」这一维度中,评分权重本身就有明确分配——其中 40 分用于评估整体睡眠时长,5 分对应快速眼动睡眠的持续时间,另有 5 分分配给深度睡眠周期。

这样的分配,其实也体现了苹果对优秀睡眠的一种取向:时长为先,深度其次,能掌握的才最值得鼓励。

睡眠习惯 > 睡眠数据

关于睡眠评分,最大的争议往往来自于「完美睡眠主义」——即把改善睡眠的指标当成了必须考满分的 KPI,反而引发焦虑而睡不好。

对此,在 iOS 26.2 版本中,苹果做出了一个看似微小却意味深长的调整:

将评分的最高评级名称从「极好(Excellent)」调整为「非常高(Very High)」 。

在访谈的过程,Bianchi 其实也反复强调了睡眠评分的意义:

这个评分并不反映用户的主观感觉,它不是在反映「睡得好不好」这件事,它只是根据科学标准和我们的指引,所呈现的一个客观分数的总结。

这意味着,分数的涨跌不一定总是与你的主观感受同步。

苹果希望通过这种透明的方式,让用户直观地看到:在医学和科学的视角下,究竟什么样的睡眠才被定义为「健康」。

这一改动旨在消除「必须做到优秀」的心理暗示,使评价体系更加客观。

Bianchi 博士坦言,虽然底层的数值算法和科学指引没有变,但这一调整是基于用户反馈,为了让体验更贴合用户心理,避免盲目追求「高分」带来的压力 。

对于锻炼身体,苹果设计了「锻炼圆环」这种激励机制,完成得好会有奖励,还鼓励用户多和其他人竞争,获得更高的分数,完成圆环。

但睡眠分数很不一样,健康共享中没有这个指标,避免和其他用户对比,而不管高分和低分都不会有更多反馈。

一言蔽之:睡眠评分,和睡得好不好没有关系,更关心的是你如何能睡好,比起「指标」更像「路标」。

毕竟睡眠评分只是一个晚上的数据,但用户根据评分去改变自己的行为,形成良好的睡眠习惯,才是终身受益的事情。

睡眠评分中有 70 的分数都是围绕「睡眠行为」进行评判,而不是「睡眠质量」——只要用户按时作息、睡够时间,至少能获得一个「一般」的评价,而只要睡得安稳,高分也并不困难。

这种标准,是苹果依据大量公开的睡眠医学准则制定的,具有全球范围内的基本普适性。

Bianchi 博士也表示,对于赋分方式和评级,苹果也在倾听用户意见不断调整,iOS 26.2 整体将评级对应的分数提高,就是基于用户洞察的结果。

我问 Bianchi 博士,不同文化背景下,睡眠习惯也有所差异,比如中国人传统健康观念的「早睡早起」,但好像不会体现在睡眠评分中。

Bianchi 博士则表示:

其实美国传统医学很强调「早睡早起」,但在我们参照的科学性指引中非常强调所谓的「一致性(consistency)」。当然,如果用户是规律性早睡早起,其实也会反映在分数之中。

Bianchi 博士还提到了一个很小的例子:小睡。

在很多文化中,小睡特别是午睡是很重要的睡眠形式,其实苹果也考虑到了这点,小睡的时间也会计算到睡眠评分的「时长」之中。

这种「睡了就有得分」的机制,和其他睡眠追踪应用还不一样。一位用 AutoSleep 的同事表示,这个应用不仅很复杂,而且走的是一种「睡眠负债」的路线——只要睡不够,它就会让你第二天睡更多的时间来补偿,并且还会有一堆警告。

但苹果睡眠评分很简单,午睡不是「还债」而是「拿分」,睡得少也只是得分低,甚至得分也只是「一般」,同事觉得还不错。

▲ 同一个晚上,上面是 AutoSleep 的结果,下面是苹果健康

自初代 Apple Watch 到现在,苹果已经在健康医学的领域深耕了超过十年的时间,积累了海量的健康数据。

根据这些研究,苹果也正在推动 Apple Watch 乃至整个苹果健康生态的转型:从单纯绑在手腕上的一系列传感器,变成一个能指示身体状况的健康助理。

不管是睡眠评分,还是生命体征、睡眠呼吸暂停这些指标,本质上都是「透明、可理解、客观」三大原则的体现,从让用户看见数据,到鼓励用户做出改变。

更新 iOS 26 后,我确实每天睁眼之后的第一件事,就是看一眼手表上的睡眠评分——昨晚睡得对不对,一目了然。

我想这也是睡眠评分功能的设计初衷,这不是一个计分板,而是一枚指南针。

睡眠这件事,从来不应该只关心某一晚的好坏,而是一生的习惯。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


突发|ChatGPT 版应用商店正式上线

就在刚刚,ChatGPT 应用商店已经正式推出。

在 ChatGPT 里的「应用(BETA)」页面里,我们可以看到 OpenAI 按「精选 / 生活方式 / 工作效率」等分类列出多款应用,如 Adobe Photoshop、Apple Music、Canva、Figma、Booking.com 等,点开即可查看或使用对应能力。

当然,用户也可以直接访问 chatgpt.com/apps 浏览精选应用。

这些应用能够为 ChatGPT 对话带来新的上下文,让用户在聊天中执行各种实际操作——订购、将大纲转化为幻灯片、搜索酒店公寓等等。

用户连接应用后,可以通过「@ 应用名」直接触发,或从应用栏中选择。更智能的是,ChatGPT 还会根据对话上下文、使用习惯和用户偏好,自动推荐相关应用。

实际体验下来发现,可能由于仍处于 Beta 阶段,连接速度相对较慢,且首次使用时需要登录对应账号。

而根据 OpenAI 昨天发布的官方博客,开发者已经可以正式向 ChatGPT 提交应用进行审核和发布。这标志着 OpenAI 在构建 AI 生态系统上迈出了关键一步。

为了帮助开发者打造高质量应用,OpenAI 提供了完整的资源体系:

最佳实践指南、开源示例应用、专门的 UI 库,以及处于测试阶段的 Apps SDK。开发者可以在 OpenAI 开发者平台提交应用,内容包括 MCP 连接详情、测试说明、目录元数据等等。

首批通过审核的应用将陆续上线。符合质量与安全标准的应用会被收录至应用目录,而深受用户喜爱的应用可能会被重点推荐,或由 ChatGPT 在对话中主动提示。

在早期阶段,开发者可将 ChatGPT 应用与其网站或原生应用相连,用于完成实体商品的交易。OpenAI 还在探索更多变现方式,包括数字商品,并会根据反馈持续更新。

所有应用必须遵守严格的安全和隐私规定:需符合 OpenAI 使用政策、提供清晰的隐私政策、仅请求实现功能所需的必要信息。用户始终掌握主动权——可随时断开应用连接,一旦断开,该应用将立即失去访问权限。

OpenAI 并不是第一次尝试做类似平台。

之前那个 GPT Store,上线之初讨论声不小,但热度下滑得也很快。即使是 OpenAI 的死忠粉也不得不承认,GPTs Store 更像是 prompt 的集散地,而非真正的商业护城河。

OpenAI 大概也很清楚,于是这次干脆推倒重做。

今天亮相的应用商店,形态明显更接近我们熟悉的苹果应用商店。不是简单把一个个 GPT 名字挂在列表里,而是把复杂能力封装成可以被点击、被订阅、被组合的「应用」。

一旦这种封装方式成熟,ChatGPT 那个看似普通的对话框,就会逐渐变成一个总入口。前台是聊天,后台接着的,却是一整片由第三方应用支撑的能力网络。

那个曾在 2008 年登上苹果年度开发者大会,用 App Store 给自己应用做推介的奥特曼,大概没想到多年后的自己,会试图在 AI 时代复刻当年苹果的玩法。

只不过这回,他不再是被平台挑选的开发者,而是那个要亲手搭出下一个「App Store」的人。从过往的操作来看,ChatGPT 不满足于做浏览器里的一个 Chatbot,而是想要向 OS 靠拢,把自己变成 AI 时代的基础层。

历史的子弹像是绕了一大圈,最终还是对准了他自己的眉心。

模型能力可以被追平,生态惯性却一旦形成,就很难被轻易迁移。这也正是 Google 多年来最大的底牌之一: 它有完整的操作系统、有浏览器入口、有开发工具链,还有一个已经运转多年的应用体系。

为了在这场生态之战中获得优势,OpenAI 正在寻求更多资本支持。

今天凌晨,The Information 报道,OpenAI 已与部分投资者进行了初步洽谈,计划以大约 7500 亿美元的估值筹集新一轮资金。根据知情人士的说法,OpenAI 可能筹集数百亿美元,最高可能达到 1000 亿美元。目前谈判仍处于早期阶段,尚未有任何最终决定。

对厂商而言,这是一次极具诱惑力也同样危险的选项。

一方面,挂靠在 OpenAI 的生态之上,意味着你可以更快接触到全球范围的用户;另一方面,你对平台的依赖度也会逐步加深,一旦分发规则或抽成模式发生变化,整个商业规则都要重新计算。

而当 AI 成为默认入口,未来的我们或许也会慢慢形成一种新习惯: 不是先打开浏览器找网址,而是先打开任何一个 AI 工具,说一句「帮我找一个能做某件事的应用」,然后在对话中完成查找、试用、付费和调用。

这种交互方式一旦普及,传统的搜索引擎和应用商店,可能都要被重新定义。OpenAI 显然也看到了这个机会,所以才会在应用商店这件事上下这么大的功夫。

模型是起点,生态是终点。

面对来自 Google 的持续竞争,OpenAI 的故事还远未结束,但它需要在接下来的几个月里证明,自己不仅能做出好的模型,还能搭建起一个让开发者和用户都愿意留下的生态系统。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


早报|曝iPhone 18 Pro将采用打孔屏/前OpenAI大神姚顺雨入职腾讯/又快又便宜,Gemini 3 Flash发布

cover

📱

iPhone 18 Pro 系列或采用打孔屏

🎙

罗福莉加入小米后,首次公开演讲

🔬

腾讯升级大模型研发架构,成立多个新部门

🚓

抹黑小米华为理想等品牌 12 人被抓

💰

特斯拉成美国市值第七大公司

🌐

曝亚马逊正与 OpenAI 谈百亿投资,后者还有意采购 AI 芯片

🤖

AI 六小龙抢跑 IPO

🖨

比亚迪推进 L3 量产内测

💡

何小鹏:当前没有 AI 泡沫,未来市场有巨大机遇

🎮

腾讯混元发布国内首个开放体验的实时世界模型

💎

Gemini 3 Flash 正式上线

📷

理光 GR IV HDF 版正式发布

☕

瑞幸咖啡或收购多个咖啡品牌

重磅

iPhone 18 Pro 系列或采用打孔屏

据 The Information 报道,苹果计划在未来两年内,将 iPhone 产品线从目前的 5 款扩张到至少 7 款之多。报道还同时曝光了部分产品的细节信息:

图自 X 博主「Tekova」

  • iPhone 18 Pro 系列:预计 2026 年秋季发布

对于代号为 V63 和 V64 的 iPhone 18 Pro 与 Pro Max 来说,最引人注目的变化是,苹果将采用加拿大公司 OTI Lumionics 的技术,将整个 Face ID 传感器隐藏在屏幕下方。

据悉,iPhone 18 Pro 正面将是「打孔屏」,屏幕左上角保留一个单独前置摄像头圆形开孔,逐步过渡到屏下摄像头方案。

后置摄像头方面,苹果计划为至少一颗后置摄像头加入机械光圈结构,能够控制镜头的进光量,苹果还将采用新的摄像头传感器,能在夜间捕捉更多光线的同时,避免照片在白天过曝。

苹果还将在 iPhone 18 Pro 系列上采用台积电的新一代芯片封装技术——晶圆级多芯片模组封装(Wafer-Level Multi-Chip Module),可将运行内存放置在更接近处理器的位置,让设备能在本地运行更高级的 AI 功能,无需等待云端响应,也能减少成本。

预计 iPhone 18 Pro 系列在外观设计方面,与 iPhone 17 Pro 保持相似。

  • iPhone 18:预计 2027 年春季发布

苹果计划移除 iPhone 18 拍照按钮的触觉反馈和触摸功能,以节省成本。虽然功能被砍是一次退步,但考虑到用户对拍照按钮的冷淡甚至消极态度,这次牙膏倒吸或许不会收到太多负面评价。

iPhone 18e 计划与 iPhone 18 一同在 2027 年秋季发布,代号为 V69,目前信息较少,但 iPhone 18 和 iPhone 18e 将首次尝试先在印度班加罗尔的富士康工厂进行大规模生产,然后再在中国生产。

  • iPhone 17e:预计 2026 年春季发布

万众期待的 Magsafe 磁吸背板终于要来到 e 系列机型。前代 iPhone 16e 尽管以入门级的 iPhone 定位发布,但缺乏了 Magsafe 磁吸。另外,iPhone 17e 还将搭载自研的最新基带 C1X。

  • iPhone 20 周年纪念版:预计 2027 年秋季发布

该款 iPhone 将采用正反四曲面设计,并且黑边将被压缩到极致。而手机中框将被压缩成为一条极窄的金属条,位于目前 iPhone 的中部,用于放置手机的按键。

苹果也将消灭手机开孔,将前置摄像头和面容 ID 组件放置于屏下,这台 iPhone 20 将成为首款「真 · 全面屏设计」iPhone,实现乔布斯「魔力玻璃」的夙愿。

🔗 相关阅读:iPhone 路线图全曝光:两年七款新机,阔折叠、四曲面全来了!

大公司

罗福莉加入小米后,首次公开演讲

昨日,小米 2025 人车家生态合作伙伴大会正式举行,会上公布了集团收入、AI 技术最新进展等一系列新消息。

小米集团合伙人、总裁,手机部总裁卢伟冰公布了 2025 年前三季度小米集团成绩:

小米集团 2025 年前三季度收入 3404 亿元,同比增长 32.5%;经调整利润 328 亿元,同比增长 73.5%;小米连续 7 年上榜财富世界 500 强,2025 年排名提升 100 位至第 297 名。另外,小米汽车交付量已超 50 万台。

另外,据卢伟冰援引 Omdia 和第三方数据表示,小米手机业务连续 21 个季度位居全球前三,2025 年 1~10 月位居中国市场第二。

高端化方面,卢伟冰表示小米高端手机 2024 年销量达 1300 万台,预计 2025 年高端手机销量 1500 万台。

本次大会中,备受关注的 Xiaomi MiMo 大模型负责人罗福莉也迎来入职后首秀。其对近期发布的 Xiaomi MiMo-V2-Flash 开源 MoE 模型进行了介绍。

据悉,模型推理速度十分快。罗福莉解释称,MiMo-V2-Flash 围绕极致推理效率设计了模型结构,通过 3 层 MTP 推理加速并行 Token 验证,实现了 2.0~2.6 倍的推理速度提升。

MiMo-V2-Flash 凭借总参数 309B(激活 15B),实现了代码和 Agent 评测基准上全球开源模型 Top2,且初步具备模拟世界的能力。

值得一提的是,罗福莉还谈到了下一代智能体系统,认为下一代智能体系统不是一个「语言模拟器」,而是一个真正能够理解世界、并与之共存的「智能体」。

其他方面:

  • 小米核心系统部总经理牛坤宣布,小米与行业领先的脑机接口公司展开早期合作。合作伙伴包括脑虎、阶梯医疗。
  • 小米互联网业务部总经理刘婵透露,小米目前已拥有 1000 部 S 级短剧,这些高质量的短剧作品深受用户喜爱,人均短剧消费时长达到了 70 分钟。
  • CarIoT 生态开放进展:小米汽车部人车家智能化产品总监陈君宇透露,CarIoT 生态今年已开放家控车,明年将开放车控家;2027 年将迎来车载中枢网关,实现车载生态设备全连接。
  • 另外,陈君宇宣布小米 SU7/YU7 系列迎来辅助智驾小蓝灯配件,这个小蓝灯由第三方开发。据悉,小蓝灯开发者是福安市豆豆游软件开发有限公司的开发者王云柳。
  • 小米生态链部总经理陈波还在会上发布了自研 MINT 统一模型部署平台,帮助 IoT 开发商降低 AI 开发门槛。MINT 平台提供开箱即用的芯片级优化能力,支持跨厂商算法集成,还有自研模型小型化技术。

苹果考虑在印度封装部分 iPhone 芯片

据路透社报道,苹果正与印度芯片制造商进行初步商谈,计划为让 iPhone 在印进行组装以及封装零部件。

报道指出,苹果与印度的工业合作主要集中在 iPhone、AirPods 等终端产品的整机组装环节。而据最新谈判进度显示,苹果在印的组装布局,可能会进一步向上游延伸,至更复杂的半导体封装领域。

据悉,苹果与穆鲁加帕集团(Murugappa)旗下 CG Semi 半导体公司进行了会谈。

而本次也是苹果首次考虑在印度组装和封装部分芯片产品。目前尚不清楚将在印度工厂封装哪些芯片,但它们很可能是显示芯片。

今年 4 月,曾有媒体报道,苹果正致力于在 2026 年底前,将美国市场上的大部分 iPhone 产品在印度的工厂生产完成,并且正在加快这些计划。

值得一提的是,据知情人士补充说,对于 CG Semi 而言,这或许只是「艰难征程的开始」,因为即便与苹果的谈判进展顺利,CG Semi 也必须通过苹果严格的质量标准才能最终达成交易。

人士还表示,苹果已经在与其他几家公司就供应链的其他环节进行洽谈,最终能成为其供应商的公司寥寥无几。

腾讯升级大模型研发架构,成立多个新部门

12 月 17 日,腾讯升级大模型研发架构,新成立 AI Infra 部、AI Data 部、数据计算平台部,全面强化其大模型的研发体系与核心能力。

🔗 相关阅读:官宣!姚顺雨出任腾讯首席 AI 科学家,27 岁清华学霸掌舵腾讯 AI 下半场

腾讯表示,知名 AI 研究员姚顺雨 (Vinces Yao) 正式出任「CEO / 总裁办公室」首席 AI 科学家,向腾讯总裁刘炽平汇报;同时兼任 AI Infra 部、大语言模型部负责人,向技术工程事业群总裁卢山汇报。

调整后,AI Infra 部将负责大模型训练和推理平台技术能力建设,聚焦大模型分布式训练、高性能推理服务等核心技术能力,为大模型算法研发和业务场景落地提供稳定高效的技术支持和服务。

而 AI Data 部、数据计算平台部,将分别负责大模型数据及评测体系建设、大数据和机器学习的数据智能融合平台建设工作。

王迪继续担任大语言模型部副总经理,向姚顺雨汇报;刘煜宏担任 AI Data 部负责人、陈鹏担任数据计算平台部负责人,均向公司副总裁蒋杰汇报。

另据智能涌现,姚顺雨在加入腾讯后,已经帮助混元招募到了更多的人才,如字节、阿里、AI 六小虎(Kimi、MiniMax、智谱、阶跃星辰、百川、零一万物)中的数位核心员工。

抹黑小米华为理想等品牌 12 人被抓

据烟台公安消息,近期,烟台公安历时四个月,打掉一个炒作新能源汽车负面信息的团伙,一举抓获 12 人、查扣资金百万、关停账号 8000 余个。

烟台公安称,今年 7 月份以来,小米公司、华为鸿蒙智行、理想汽车等企业先后报警称:某平台集中涌现大量针对其汽车品牌的负面文章。烟台公安指出,这些内容呈现出高度的组织化特征:

  • 有的串联炒作、歪曲解读,对企业进行恶意诋毁;
  • 有的伪装身份、虚构场景,冒充消费者发布不实体验;
  • 更有甚者,通过搬运洗稿、批量炮制,将个别问题放大渲染,甚至剪辑成短视频广泛传播,严重侵害企业品牌声誉,扰乱正常生产经营秩序。

办案人员对平台上 3000 余条负面文章逐一甄别后,发现均出自一批注册时间短、活跃度异常、IP 地址分散的账号,背后存在明显的产业化运作痕迹,疑似「网络水军」有预谋地进行炒作引流并牟利。

在初步掌握犯罪事实后,烟台市公安局成立专案组展开攻坚。经进一步侦查,发现该团伙利用技术工具抓取「小米」「华为」「理想」等关键词,借助人工智能技术批量生产低质、雷同的「网络垃圾」,其目的仅仅是为了赚取平台流量带来的收益。

在牢牢掌握证据后,专案组于烟台、聊城两地同步收网,成功抓获 12 名犯罪嫌疑人,查扣涉案资金 100 余万元,关停违法网络账号 8000 余个,实现了对这一新型「网络水军」犯罪团伙的全链条、穿透式打击。

特斯拉成美国市值第七大公司

美东时间 12 月 16 日,特斯拉股价涨 3.07%,报收于 489.88 美元 / 股,创下自上市以来的历史新高。

其单日市值激增 485 亿美元,总市值借此攀升至约 1.63 万亿美元,超越博通成为美国市值第七大公司。

据多方报道,本次股票上涨是因市场对特斯拉的自动驾驶与 Robotaxi(无人驾驶出租车)业务进展的高度期待。

据悉,有海外网友拍摄到一台特斯拉 Model Y 在奥斯汀街头行驶的画面,车内似乎空无一人,甚至没有配备安全监督员。而马斯克也在隔天对此回应表示「测试正在进行中,车内没有人。」

马斯克还在近期的活动中透露,特斯拉 Robotaxi 将在三周内取消安全员,实现真正无人驾驶载客。其透露,公司旗下 Robotaxi 车队规模预计将于下月翻番。

另外,特斯拉目前正筹备再度扩建美国得克萨斯超级工厂,拟新建一座专用设施用于其人形机器人 Optimus 的量产,以实现年产能 1000 万台的目标。不过,这两项业务均未明确商业化落地时间表。

曝亚马逊正与 OpenAI 谈百亿投资,后者还有意采购 AI 芯片

据 The Information 报道,亚马逊与 OpenAI 进行融资谈判,前者计划为后者投资至少 100 亿美元。据悉,此轮融资对 OpenAI 的估值将超过 5000 亿美元。

据悉,OpenAI 上个月曾宣布,将在未来七年通过亚马逊网络服务(AWS),租用价值 380 亿美元的服务器。据报道,OpenAI 目前至少使用包括 AWS 在内的五家云服务提供商来训练和运行其 AI 模型。

而本次亚马逊的投资,则有望帮助 OpenAI 承担其此前许下的「七年租用服务器」承诺。

值得一提的是,本次谈判还将帮助亚马逊售出自研的 Trainium AI 服务器芯片给 OpenAI。知情人士透露,作为讨论交易的一部分,OpenAI 将计划使用 Trainium 芯片。

虽然双方有意合作,但亚马逊无法向其云服务的客户提供 OpenAI 的模型——微软目前持有 OpenAI 约 27% 的股权,并锁定了在云端分销 OpenAI 模型的独家权利。

知情人士透露,亚马逊和 OpenAI 已讨论商业合作机会。OpenAI 希望将 ChatGPT 打造成一个购物中心,并讨论了通过向零售商推荐客户来赚取费用的可能性。同时,OpenAI 也希望向亚马逊出售 ChatGPT 的企业版。

The Information 还报道称,OpenAI 已与部分投资者就以约 7500 亿美元估值进行新一轮融资进行了初步讨论。

据透露,OpenAI 可能筹集数百亿美元,甚至高达 1000 亿美元。目前谈判尚处早期阶段,尚未最终确定。

AI 六小龙抢跑 IPO

据腾讯新闻《一线》获悉,「AI 六小龙」MiniMax 和智谱 AI,均于本周初获得了中国证监会备案,并参与了港交所的上市聆讯。

报道称,MiniMax 于 12 月 17 日通过了港交所聆讯。针对智谱 AI 的聆讯事宜,市场也有传闻称其于 12 月 16 日在港参与并通过了聆讯,多位相关人士处证实了该消息。

除此之外,MiniMax 计划于 2026 年 1 月在港挂牌上市,因为下周开始(即 12 月 20 日),香港开始进入圣诞节假期。暂未知智谱后续的上市安排。

公开资料显示,MiniMax 的保荐人为瑞银等多家投行,智谱 AI 的保荐人则为中金等多家投行。据悉,MiniMax 曾于今年 6 月在港通过秘交申请上市,是首个在港提交 IPO 的国内 AI 大模型公司。

报道指出,这两家公司可能是内地企业赴港上市「报备制」以来,在港过聆讯最快的案例。

公开资料显示,MiniMax 的投资人包括阿里巴巴、明势创投、红杉、高瓴以及腾讯、IDG 等多家机构。

比亚迪推进 L3 量产内测

据第一财经消息,比亚迪已联合深圳市交通局等部门,在深圳开启面向量产的 L3 级自动驾驶全面内测,目前已完成超过 15 万公里的 L3 级自动驾驶实际道路验证。

据悉,本次测试覆盖深圳开放的高快速路,兼顾雨天、夜间、施工等场景工况。

比亚迪于 2024 年成为国家四部门首批 L3 级自动驾驶准入及上路通行试点的 9 家企业之一。

近期,还有我国首批 L3 级有条件自动驾驶车型准入许可,以及其他品牌获得 L3 级自动驾驶道路测试牌照:

  • 日前工信部公布我国首批 L3 级有条件自动驾驶车型准入许可,两款车型分别来自重庆长安以及北汽极狐,两款分别适配城市拥堵、高速路段的车型将在北京、重庆指定区域开展上路试点。
  • 小鹏汽车已在广州市获得 L3 级自动驾驶道路测试牌照,并启动常态化 L3 路测,测试场景主要面向广州市智能网联汽车测试高快速路上的「有条件自动驾驶」场景。

Meta:不限制员工使用 Gemini 和 GPT 等三方 AI 模型

据 Business Insider 报道,Meta 正在扩大员工对 Google 和 OpenAI 等竞争对手工具的访问权限。

报道称,从内部文件以及帖子显示,Meta 一直在鼓励员工将 AI 工具整合到几乎所有的工作中,并采取「AI 优先」战略。

据悉,Meta 的员工可以使用 Google 的 Gemini 3 Pro 以及 OpenAI 的 GPT-5 等第三方 AI 模型,从而来提高生产效率。同时,Meta 还将其生产力套件迁移至 Google Workspace,从而「解锁 AI 驱动的能力」。

从曝光的名单里显示,Meta 目前已经允许 GPT-5、GPT-4.1、Gemini 3 Pro、Claude 等 AI 模型,甚至连 Google 的 NotebookLM Pro 也在内部使用。

另外,Meta 的领导层还将绩效与通过 AI 转化的成果挂钩,奖励那些能够证明「AI 驱动影响」的人,并将其纳入 2026 年的绩效评估中。

快造科技多色 3D 打印机 Snapmaker U1 亮相京东 MALL

12 月 16 日至 18 日,消费级 3D 打印领域的革新之作——Snapmaker U1 3D 打印机亮相位于京东 MALL 北京双井店的京东新品超级现场线下新品体验会。

据悉,Snapmaker U1 在海外 Kickstarter 众筹平台曾以 2061 万美元创下 3D 打印机品类最高众筹纪录。12 月 12 日京东独家开启预售 2 小时内,Snapmaker U1 成交便突破 2000 台,并登顶了京东 3D 打印类目 TOP1 单品。

作为创新搭载 SnapSwap 独立四头并联系统的彩色 3D 打印机产品,Snapmaker U1 有效解决了传统单头 3D 打印的效能瓶颈,真正实现了「5 倍高速,5 倍省料」。

具体来看,其 SnapSwap 独立四头并联系统如同「多色笔」,四个打印头协同工作,通过 5 秒极速换头技术,避免了传统单头 3D 打印机换色料道冲刷的过程,从而兼顾打印的高效和环保。

U1 完成同类四色打印任务仅需 5-6 小时,相比传统单头 3D 打印机整体打印效率最高提升 5 倍,节省耗材约 80%。

理想 L 系列正式进入埃及、哈萨克斯坦和阿塞拜疆市场

近日,理想汽车宣布,其海外业务拓展取得关键突破:

继布局乌兹别克斯坦市场之后,理想汽车正式登陆埃及、哈萨克斯坦和阿塞拜疆市场,标志着品牌已完成横跨中亚、高加索地区及非洲的核心市场布局,全球化进程迈入实质性落地阶段。

此次海外上市,理想汽车同步推出理想 L9、理想 L7、理想 L6 三款主力车型,充分覆盖当地豪华市场需求。

据悉,自 2025 年 10 月起,理想汽车海外拓展节奏持续加快,在短时间内完成四个重要国际市场的渠道搭建与产品落地。全球化布局多点开花:

  • 研发端已在德国、美国设立研发中心,强化技术全球化适配能力;
  • 渠道端正式构建起标准化的海外销售与售后服务体系,为长期运营奠定基础;
  • 产品端则提前规划,2026 年上市的全新产品在研发初期即纳入海外市场法规适配考量,进一步提升全球市场竞争力。

💡 何小鹏:当前没有 AI 泡沫,未来市场有巨大机遇

据悉,小鹏汽车董事长何小鹏昨日在朋友圈发文,对 AI 泡沫、物理 AI、美国的新创业和机器人,以及 AGI 的到来等热门话题发表自己的感受与见解。

关于时下热门的 AI 泡沫话题,何小鹏认为「任何科技时代都是阶段或局部有泡沫的,但是这是一个市场从混沌到有序的必然竞争过程。」其表示,整体来说,AI 必然会推动整个社会巨大的变革,今天还是 0 到 0.1 的最开始阶段。

何小鹏提到,「如果一定要说泡沫,感觉中国估值比较合理,美国估值实在有一点高;中国更关注市场应用,美国更关注前沿研究。」

对此,他认为当前没有 AI 泡沫,未来 AI 的市场有着巨大机遇。

在机器人以及物理 AI 相关方面,何小鹏则指出:

我认为人形机器人将来会是巨头的竞争,而不同的专用机器人则会有大量不同领域的选手,且会有非常多的成功机会。

我认为未来 3 年,最有可能有大突破的不一定是在数字世界,反而有可能在物理 AI 领域会产生大变局,如自动驾驶会直接到达准 L4 或完整 L4;人形机器人会实现从类自动驾驶的 L1 到 L4 初阶的快速跨越。

物理 AI 的发展速度会比数字 AI 慢,但是改变我们生活的力度会更大。

针对 AGI 的到来,何小鹏也提出了自己的看法。其认为当今的 AI 主要是类似人类的模仿学习+强化学习,哪怕有新的涌现能力,但是这些并不是真正的创造力。

他强调,真正的 AGI 还需要很多能力,例如从多模态到世界模型、持续学习、长时序洞见和规划能力等,但这些都还没有完全到来,因此可能还需要数年时间以及等待部分底层能力的再次提高。

新产品

腾讯混元发布国内首个开放体验的实时世界模型

12 月 17 日,腾讯混元发布世界模型 1.5(Tencent HY WorldPlay)。

据悉,混元世界模型 1.5 是国内首个开放体验的实时世界模型,用户输入文字描述或者图片即可创建专属的互动世界。

同时,混元世界模型 1.5(WorldPlay) 首次开源了业界最系统、最全面的实时世界模型框架,涵盖数据、训练、流式推理部署等全链路、全环节,并提出了重构记忆力、长上下文蒸馏、基于 3D 的自回归扩散模型强化学习等算法模块。

值得一提的是,混元世界模型 1.5 能够让用户在生成的世界里随意移动探索:离开某个区域再次返回时,模型能够「记住」该区域的三维结构,呈现前后一致的场景。

另外,模型支持多样化的交互体验、长范围的 3D 一致性、实时的交互生成(可以按照 24 FPS 的速度生成 720P 的高清视频)。

目前,用户可以在腾讯混元 3D 官网申请使用。

在线体验网站:https://3d.hunyuan.tencent.com/sceneTo3D?tab=worldplay

Github 链接:https://github.com/Tencent-Hunyuan/HY-WorldPlay

Hugging Face 链接:https://huggingface.co/tencent/HY-WorldPlay

项目主页:https://3d-models.hunyuan.tencent.com/world/

Gemini 3 Flash 正式上线

今天凌晨,Gemini 3 Flash 正式发布,直接对标 OpenAI 和 Anthropic 的旗舰模型,官方号称比 2.5 Pro 速度快 3 倍,价格砍到 3 Pro 的四分之一,性能还不降反升。

从今天开始,用户可以在 Gemini 产品线中体验到 Gemini 3 Flash(Fast/Thinking)和 Gemini 3 Pro。

基准测试结果显示,Gemini 3 Flash 保留了 Pro 级别的推理能力,但延迟、成本直接降到 Flash 级别。

具体来说,在 GPQA Diamond 这种博士级推理测试里,它能拿到 90.4% 的成绩,跟那些体积更大的前沿模型打得有来有回。而 MMMU Pro 测试 Gemini 3 Flash 直接拿下 81.2%,达到业界最先进水平,跟自家的 3 Pro 表现相当。

数据显示,Gemini 3 Flash 的 Token 消耗比 2.5 Pro 少了三成,速度快三倍,价格更是压到了输入 0.5 美元/百万 Token,输出 3 美元/百万 Token 的地板价。

此外,Gemini 3 Flash 的亮点还在于多模态能力,它能更快地处理视觉、音频等输入,把「看见、听见、理解」串成一条相对顺滑的链路,适合需要即时反馈的交互场景。

🔗 相关阅读:刚刚,Gemini 3 再次大更新!全球免费享 Pro 级智商,奥特曼又要失眠了

理光 GR IV HDF 版正式发布

昨日,理光映像正式公布了其最新产品「理光 GR IV HDF 版本」。

据介绍,理光 GR IV HDF 版搭载了理光原创的 HDF(Highlight Diffusion Filter),该滤镜专为突出高光区域、打造柔和扩散的影像效果而设计。

具体来看,HDF 特效滤镜依托理光多年积累的先进喷墨技术研发而成,能柔化高光区域并在影像边缘营造朦胧效果,从而呈现出类似胶片摄影或电影画面的怀旧质感。

另外,理光 GR IV HDF 除了常规机械快门单元外,还配备电子控制快门机构,用户可自主将快门速度提升至最高 1/16000 秒。(GR IV 也会在新版功能扩展固件中提供)

官方还表示,新机快门按钮的颜色已从 GR IV 的黑色改为银灰色,象征着相机能够瞬间改变图像的视觉表现力。

理光 GR IV HDF 已于 2025 年 12 月 17 日(周三)起,陆续登陆东京、上海、北京及布里斯班的 GR SPACE。

荣耀 WIN 系列外观公布

昨日,荣耀正式公布了 WIN 系列新机的外观信息以及部分配置。

本次将推出荣耀 WIN 以及 WIN RT 两个版本,均采用前后直板+金属直边中框设计,镜头部分均横向贯穿式矩形模组,其中 WIN 配备三枚后置镜头,WIN RT 为两枚。

从公布的图片显示,WIN 系列都将配备「Ultra Fan」主动散热技术,并且新机侧面均提供 AI 快捷键。

据悉,荣耀 WIN 系列都将采用 10000mAh 超大容量电池,配备 100W 有线快充(WIN 提供 80W 无线)。性能方面,WIN 将配备高通骁龙 8 Elite Gen 5,WIN RT 则为高通骁龙 8 Elite。

新消费

蜜雪冰城美国首店开启试运营

界面新闻消息,日前有多名网友在社交平台分享在美国好莱坞看到了「雪王」,有网友分享其在洛杉矶蜜雪冰城门店购买打卡的体验。

据网友们在社交平台分享的信息,该门店位于洛杉矶好莱坞星光大道,在中国剧院对面,地处繁华地段。目前该店在试运营阶段,已启动预售及预热活动。

对于上述情况,蜜雪冰城相关工作人员通过报道表示,美国门店的「相关业务正在稳步推进」。

从饭团外卖 APP 发现,位于洛杉矶名为「蜜雪冰城 (Hollywood)」的商家开启独家预售,已上架 2 款预售套餐。这两款套餐定价均为 3.99 美元(约合人民币 28 元),含两杯饮品及冰淇淋,支持微信、支付宝支付,新用户最低仅需 1.17 美元(约合人民币 8.2 元)。

值得注意的是,在套餐选择饮品糖度时,除了常规的正常糖、七分糖、五分糖、三分糖、不另外加糖的选项外,还有 120% 糖度、150% 糖度、200% 糖度可选。

瑞幸咖啡或收购多个咖啡品牌

据彭博社报道,瑞幸咖啡及其股东大钲资本正评估多个收购项目的可能性,包括 Blue Bottle Coffee(蓝瓶咖啡)、% Arabica、可口可乐旗下的 Costa Coffee 等,但相关讨论尚处于早期阶段,未必会提出收购。

报道指出,瑞幸目前正在考虑竞购雀巢的蓝瓶咖啡,以提升品牌形象并在高端咖啡市场扩大规模。

据悉,蓝瓶咖啡于 2002 年成立,强调精品和调性,2017 年被雀巢以约 4.25 亿美元的价格收购 68% 股份。

万宁将关闭内地线上线下全部门店

日前,广东万宁连锁商业有限公司发布《关于线下及线上门店停止运营及会员积分处理的公告》。

万宁方面表示,因业务战略调整需要,公司将关闭中国大陆大部分门店:

  • 线上门店:最后营业日为 2026 年 1 月 15 日,之后将正式停止运营;
  • 线上:官方商城小程序将于 2025 年 12 月 28 日 24 时停止运营;天猫旗舰店/保健、京东旗舰店、拼多多旗舰店专营店将于 2025 年 12 月 26 日 24 时停止销售、停止提供会员权益,售后服务截止 2026 年 1 月 25 日。

后续,万宁跨境官方商城(小程序)、万宁跨境天猫旗舰店/京东旗舰店/拼多多旗舰店将继续为用户提供服务。

据悉,万宁是中国香港健与美连锁品牌,隶属于牛奶国际集团,创立于 1972 年,主营健康、美容、个人护理及母婴产品。该品牌在香港中环开设首家药行起步,2004 年进入内地市场。

数据显示,截至 2025 年 12 月 17 日,万宁总门店超 440 家,其中港澳地区超 320 家,内地超 120 家,覆盖 33 个城市。

好看的

B 站 2025 跨年晚会阵容官宣

昨天,哔哩哔哩正式公布了其 2025 年跨年晚会阵容:

阿云嘎、柏栩栩、曹骏、曹杨、蹲妹Carly Rae Jepsen 、陈洁丽、冯禧、管泽元、胡彦斌、黄子弘凡、蒋龙、鞠婧祎、卡布叻_周深、科莫 CÔME、刘谦 魔术大师、罗家英、MARTY FRIEDMAN、MyKey、单依纯、上上、沈佳润 Nina、舒畅、唐汉霄、Tank 吕建忠、汪东城、汪峰、王铮亮、吴彤、谢楠、余霜 Candice、曾沛慈、张韶涵、赵兆。(按艺人首字母排序)

除了艺人外,还有多个热门 IP:

浪浪山小妖怪、洛天依、花园宝宝、LABUBU、凡人修仙传、迪士尼奇妙夜、地下城与勇士、原神、植物大战僵尸 3、跨年红与黑、牡丹亭、黑猫警长、邋遢大王奇遇记、三打白骨精。(按字母排序)

据悉,哔哩哔哩 2025 跨年晚会将于 12 月 31 日 19:30 开启。

《鸿蒙星光盛典》彩排及录制内容将于 20 日播出

央视频消息,12 月 20 日 19:30,中央广播电视总台将为您特别呈现《鸿蒙星光盛典》。

据悉,《鸿蒙星光盛典》在准备直播的过程中,香港大埔突发火灾,因此原定 11 月 28 日晚的活动延迟举办。

官方表示,虽暂缓相聚,但温暖始终同频,节目组将深圳龙岗大运体育中心全流程彩排和录制的内容精编成节目。

值得一提的是,搭载鸿蒙系统的 HUAWEI Mate 80 系列手机全程参与盛典全要素彩排的竖屏录制。通过 13 台竖拍机位的协同调度与专业竖屏导播录制系统的实时切换,特写与全景在掌间流畅切换。

电影《我的妈耶》入围鹿特丹电影节

日前,电影《我的妈耶》入围鹿特丹电影节「大银幕竞赛」(Big Screen Competition)单元,同步曝光电影节片段。

电影围绕着东玉一家人展开,讲述了处于青春叛逆期的十一意外发现了妈妈东玉日记本的故事。透过这本日记,他看见了东玉短暂却灿烂的一生。

据悉,电影《我的妈耶》由宁浩监制,肖麓西执导,马思纯、白客、黄明昊领衔主演,孙阳特别出演,梁靖康特邀出演,嵇嘉禾(锤娜丽莎)、王天放主演。影片将于明年 1 月底世界首映。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


2025年度词「Slop」:如果屏幕里装的是泔水,那我们算什么?

这是最好的时代,互联网上,应享尽享。这也是最坏的时代,是一个下沉的年代,互联网上充斥着的都是「泔水」。

韦氏词典(Merriam-Webster)发布了 2025 年的年度词汇:Slop。

这个英语单词的原意是「猪食」「泔水」。精准,也令人不适。根据韦氏词典的官方释义,Slop 指的是「通常由人工智能大量生产的低质量数字内容」。在英语原义中,它原本的含义包括淤泥、污水,或者更直白一点——倒在食槽里喂猪的泔水。编辑部特意强调,这个词自带一种「湿漉漉的、你绝对不想碰触的声音」。

如果说几年前我们谈论 AI 时,使用的词汇还是充满科幻色彩的「奇点」或稍显恐慌的「幻觉」,那么到了 2025 年,人类终于对满屏的生成式内容失去了一切好奇,只剩下一个发音黏糊糊的、带有生理性厌恶的单词:slop。

它毫不避讳地指出 AI 内容的廉价感,直接揭穿了当下互联网最尴尬的真相:AI 的确在又快又大量地生产内容,但都是营养匮乏的数字垃圾。这一切的背后,不过是一场巨头和巨头联手打造的、关于榨干注意力的算计。

从「幻觉」到「泔水」

前两年的 AI 好像还没那么让人厌恶,虽然它会画六根手指,做一些奇形怪状的动画,或者跑各种奇奇怪怪的

但到了 2025 年,这种情绪彻底变了。AI 生成的质量越来越好,越来越精致,不再犯以前那样的低级错误,却也越来越让人不适:放眼望去,到处是漫山遍野的平庸。

这就是 Slop 的问题所在:正确,却平庸。

Slop 的泛滥,在某种程度上又说了一遍「互联网已死」这句话,它正在成为现实。韦氏词典说,「这个词向人工智能传递了一个信息:在取代人类创造力这件事上,有时候AI 看起来并没有想象中的那么超级智能」。

这些内容不是为了交流,不是为了表达,甚至不是为了被阅读,它们存在的唯一目的就是为了被算法抓取,为了占据屏幕的像素,为了塞在广告加载的那几秒钟里。

为了被消耗掉而存在,导致这些内容是粘稠的、同质化的,也让真正有价值的信息沉入海底。现在上网冲浪的体验更复杂了,比如你试图搜索一个生活小技巧,不得在返送回来的内容里,小心识别出 AI 生成的废话文学,才能找到一句人话——最后也还要核实,因为可能是二次传播了 AI 内容。

累觉不爱,最终汇聚成了「Slop」这个词里的全部愤怒。

当「梦工厂」去掉「梦」字

然而,这种让用户感到恶心的「泔水」,在商业巨头的报表里却是香饽饽。最令人细思极恐的,莫过于最近迪士尼和 Sora 联手的消息。

在传统认知里,迪士尼应当是站在 Slop 对立面的。一开始也确实是这样的,在各种 IP 人物里,迪士尼的人物形象往往是比较难生成的,版权保护是其中的重要原因。

毕竟,这家造梦工厂的护城河,是人类最极致的才华、最细腻的情感连接和最不可替代的 IP 故事。如果连米老鼠和艾莎女王都开始由算法批量生产,那么「创意」二字将一文不值。可就在不久前,迪士尼表示已与 OpenAI 达成协议,不仅计划将 Sora 生成的视频引入其流媒体平台,还向 OpenAI 进行 10 亿美元的股权投资,并获得购买额外股权的认股权证。

也……不能说就是迪士尼堕落了,流媒体赛道早已白热化,Netflix 都要大举收购华纳兄弟,进入下半场后,走向 AI 几乎是必然选择,我们可以称之为「Slop 经济学」。

在流媒体的初期,巨头们比拼的是「头部内容」——谁有最好的电影,最火的剧集,才能吸引用户成为会员且长期订阅。但订阅并非完全排他,以及愿意在流媒体上花钱的用户总量有限,在增长见顶的今天,比拼变成了「时长占有率」。不止迪士尼,所有流媒体都不约而同发现,用户在流媒体上不仅仅是在看电影,更多时候,他们需要的是一种「背景音」或「视觉伴随」。

对于这种伴随式内容,人类艺术家的成本太高了。雇佣一流的画师去绘制动画里一朵云,或者雇佣摄影师去拍摄每一个空镜,或者让音乐人去写每一段配乐,相比于能创造的效益而言,性价比太低。

而 AI 恰好能以接近零的边际成本,生成无数看起来「足够好」的画面——反正这些内容也就是「听个响」,不可能像《甄嬛传》一样被观众拿着放大镜看,连一点点穿帮都找出来。

这可能就是迪士尼的算盘,所以在一年前,迪士尼就已经开始探索AI介入的可能性,并为此专门成立了一个部门,并成为「技术赋能办公室」。

他们的想法是,保留最核心的主角和剧本(至少目前还得这么做,主要是为了维持版权壁垒),而将一些周边内容比如背景、过场、宣发物料以及那些为了杀时间的次生内容,交给 AI 去生成。对于平台而言,内容不再需要是「作品」,它只需要是「填充物」。

这是一种「风险控制」的思路,跟创作关系不大。迪士尼入股 OpenAI,本质上是在买一张通往未来的船票。技术只会越来越好,打不过就加入,然后用它来降低自己的生产成本。

这已经是很多大公司在做的事,美名其曰「降本增效」,只是长期来看这就带来了审美降级,它默认了观众并不需要很精致的艺术,只需要不断流动的像素,持续刺激他们的多巴胺——正如所有的短视频一样。

 

分裂的互联网,在垃圾场里淘金

当然,也不是所有内容平台,都「打不过就加入」,比如维基百科就很抗拒这种纯生成的内容泥石流。倒不是因为他们有多高尚,而是因为他们的商业模式依然依赖于「真实性」和用户的信任。

维基百科如果被 AI 生成的虚假条目淹没,它就失去了作为知识库的意义,其实这个道理对于很多其它平台也是类似的:Pinterest 如果满屏都是 AI 生成的虚构家居图,用户就会因为找不到图里的商品而愤怒离开;Spotify 如果充斥着 AI 合成的虚假歌手,真实的音乐人生态就会枯竭。平台或多或少都仰仗用户的信任。

而另一边,则是「投喂派」的狂欢,主打的就是无脑刷屏。在这些平台上,逻辑不再重要,画面的连贯性也不重要,重要的是色彩的刺激和无穷无尽的滚动。这些平台不仅不排斥 Slop,反而鼓励 Slop。因为他们的算法目标只有一个:停留时长。

▲ 2020-2026 年间美国居民在电视和短视频上的使用时长对比。 图片来自:EMARKETER

只要用户还停留在 App 里,无论他是在看一部精心制作的短片,还是在看一段 AI 生成的猫猫狗狗,其实都是一样的。甚至,AI 视频因为成本更低、更能根据用户的数据实时生成其偏好的「诱饵」,在商业效率上反而更高。

这种分裂构成了 2025 年最荒诞的景观。互联网不再是平的,它变成了折叠的。一边是少数坚持「全手工制作」的精品内容社区,它们可能不仅需要付费,还需要用户具备极高的辨别能力;另一边是免费、泛滥、充斥着感官刺激的公共流量池,那里是 Slop 的海洋。

那,我们用户算什么?

现在,回头看「Slop」这个年度词汇,会发现它多少有点让人不寒而栗。

Slop 其实不是很好翻译成中文,「泔水」是最贴近的意译。泔水的特点是什么?混杂、粘稠、黏黏腻腻看不清的一堆东西。毕竟,猪吃的东西不需要美味,不需要营养均衡,甚至都不需要是卫生的,只要足够便宜、量大管饱。

当迪士尼开始用 Sora 生成的画面填充大大小小的屏幕,当算法试图用无穷无尽的 AI 废料填满每一个人的碎片时间,当他们不再在这个过程中追求美和意义,而是单纯追求产量与留存时,一个无法回避的伦理问题摆在了所有用户面前:那我们用户算什么?

在这个庞大的、自动化的数字喂养系统中,在那一刻,坐在屏幕前、手指机械滑动、被塞进这些信息的我们,在算法冰冷的逻辑眼中,究竟被当成了什么?

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


17.88 万元起,红旗 HS6 PHEV 版上市, 全面对标方程豹钛 7

12 月 16 日,红旗品牌旗下全新一代大五座旗舰 SUV——红旗 HS6 PHEV 正式上市,新车共推出 3 款配置,指导价区间为 17.88 万 – 22.88 万元。

红旗 HS6 PHEV 定位为中大型 SUV,长宽高分别为 4925mm、1970mm、1740mm,轴距 2925mm 。

在传承品牌经典基因的同时,HS6 PHEV 融入了大量新能源设计语汇。前脸标志性的「高山飞瀑」格栅采用与车身同色的极简封闭式设计,既保留了家族辨识度,又优化了空气动力学性能。

车辆前脸采用「龙睛」厚壁光导大灯与「龙须」日行灯组合,尾部则采用「凤翎」贯穿式尾灯,通过光影层次营造科技感 。车身侧面承袭了经典的「船式车身」姿态,通过 A 柱和 C 柱反向延长线交点后移的视觉重心设计,营造出端庄稳重的气场。新车还引入了无边框外后视镜和隐藏式雨刷等细节设计,以进一步降低风阻并提升现代感 。

内饰是此次红旗 HS6 PHEV 升级的核心。新车采用「东方颐和」设计理念,试图在冰冷的科技配置之外,注入有温度的文化氛围。

红旗 HS6 的内饰细节中融入了大量中式园林元素。中央出风口采用「叠石理水」设计,拨钮模拟石形,网口模拟水纹 。中央扬声器设计为「湖心明月」造型,车门扬声器则呈现「长桥卧波」意象 。内饰配色方面,提供墨石黑、芳华红、秋实橙、林雪白四种「四时之色」,分别对应春夏秋冬的自然意境。

整个座舱前排的视觉核心是一块双 15.6 英寸 2.5K 分辨率超薄联屏,整体屏占比达 88.5% 。驾驶位前方则配备了同级领先的 30 英寸 AR-HUD,亮度高达 12000 尼特,支持强光下清晰显示及眼球追踪自动调节 。

软件层面上,红旗自研的「灵犀」系统 FAW.OS HMI 5.0 接入了「豆包」大模型,支持四音区连续对话与手势交互 ,车机系统内还深度适配了字节系与腾讯系的主流应用。

得益于 2925mm 的超长轴距,红旗 HS6 PHEV 拥有第一梯队的内部空间表现。官方称新车「得房率」达 84.2%,后排腿部空间 1070mm,肩部宽度 1510mm,头部空间 1034mm,即使身高 185cm 的乘客坐入后排,腿部仍有三拳以上余量。

同时,新车座椅也支持切换单人床、双人床及大床房三种躺卧模式,车内前后排座椅均可打通。

红旗 HS6 前排配备零重力副驾座椅,支持一键躺平、18 向调节及通风加热 ,后排的「云舒」座椅则填充了 20mm 厚的慢回弹记忆棉,并在靠背角度、坐垫长度上针对国人身材进行了专门优化(中式坐姿),中配以上车型后排同样配备通风加热功能 。

此外,新车还配备了丹拿音响系统和宽温域智能车载冷暖箱,支持 -15℃ 到 50℃ 的温度调节,可满足从冷饮到温奶的多种需求。

动力层面,红旗 HS6 PHEV 基于红旗自研「鸿鹄」插电混动平台打造,全系搭载 1.5T 混动专用发动机,热效率 45.21%,最大功率 110kW,匹配前/后电机组成两驱或四驱版本。

四驱版系统综合功率 479kW,零百加速 4.8 秒;即便在电池馈电状态下,加速时间微微增加至 5.1 秒,动力一致性优于多数竞品。纯电模式下仍可实现 5.4 秒破百,极速 190km/h。

新车中高配版配备了一块 40kWh 的磷酸铁锂电池,CLTC 纯电续航最高 248km,综合续航 1650km,WLTC 工况下最低荷电油耗 5.1L/100km,综合油耗低至 0.4L/100km,电池支持 4C 快充,20%-80% 仅需 15 分钟。

HS6 PHEV 提供「司南 100」和「司南 500」两套驾驶辅助系统。高阶版支持高速领航、城市记忆领航及跨层记忆、断头路车位、立体机械车位等复杂场景的泊车系统。

高速领航可实现点到点通行,包括自动过 ETC、上下匝道、环岛绕行等,宣称不依赖高精地图。城市记忆领航最多可学习 10 条常用路线(单条最长 100 公里),能够复现驾驶员的操作风格。

车辆的感知硬件包括 10 摄像头、1 毫米波雷达、12 超声波雷达。前视三目摄像头最远可识别 600 米外大型车辆,算法基于 BEV 鸟瞰图与 PnP-Net 预测模型,危险目标识别准确率≥99%。

安全是红旗的传统强项。

HS6 PHEV 车身高强度钢占比 75%,热成型钢达 26%,A/B 柱采用 1800MPa 一体式双门环工艺。全车配备 7 安全气囊(含远端气囊)、双预紧安全带,功能安全等级达 ASIL D,覆盖电控、制动、转向等 18 类系统。

电池安全方面,新车除通过国标全部测试外,还实现 IPX8 级防水、20 吨挤压强度、在 900℃火烧下 130 秒不起火,并搭载「电池云医生」系统,每秒采集 1500+项数据,可提前 14 天预警风险。

以往,红旗的产品定位往往偏向传统稳重。但这款 HS6 PHEV 无论从设计语言、配置丰富度还是价格策略来看,都充满了「新势力」的锐气。

依托全系标配的高通 8295P 芯片、30 英寸 AR-HUD、15.6 英寸双联屏及宽温域冷暖箱,红旗 HS6 PHEV 在配置层面显著提升了其在 20 万元级市场的竞争力。同时,通过下放金葵花车型的设计元素与安全标准,新车在提供主流智能化体验的同时,保持了红旗品牌特有的设计辨识度。

HS6 PHEV 这种兼顾科技配置与品牌底蕴的差异化定位,为消费者提供了一个更具差异化的可选项。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


在这个开源「从夯到拉」榜单,我终于明白中国 AI 为什么能逆袭

最近几天,一张开源模型的等级列表在 X 上被疯狂转载。

▲ 图片来源:https://www.interconnects.ai/p/2025-open-models-year-in-review

从夯到拉,国产开源模型排在了数一数二的位置,DeepSeek、Qwen、Kimi、智谱、还有 MiniMax 是全球开源模型的前五名。而 OpenAI 排在了第四梯队,小扎的 Meta,挖了硅谷半壁江山想打造的 Llama 更扎心,只落得了一个荣誉提名。

这份榜单并不是国产模型花钱打广告,也不是中国人王婆卖瓜,自卖自夸。知名的 AI 研究员 Nathan Lambert 和德国 AI 研究中心的博士生 Florian Brand,在 interconnectai 上的一篇文章,给出了全球开源模型的完整排名。

▲Nathan Lambert 曾在 Meta、DeepMind、和 Hugging Face 工作

文章里详细回顾过去这一年,全球开源模型的发展,以 DeepSeek 和 Qwen 为主的国产开源模型,正在用开源改变整个 AI 行业的运行规则

事实也如此,2024 年对于全球开源来说,可能还是 Llama 的天下。到了今年,国产开源以一种不可忽视的姿态,持续刷新着全球大模型的默认选项。

性能、价格、生态、可用性……每个维度都在快速逼近闭源巨头,甚至在某些方向已经实现了反超。

▲中美开源模型发布历史,2024.01-2025.11,图片来源:https://www.atomproject.ai/

当我们还在想国产模型什么时候能追上 ChatGPT、Gemini 时,AI 的军备竞赛场上,另一个问题也开始沸腾起来,为什么全球开发者都在用国产开源模型?

开源模型,前浪后浪一起上

过去这几个月,国产开源模型的更新节奏几乎没有停过。而且不只是某一家模型公司的爆发,是整个国产开源生态,持续接力,就像一条快速攀升的曲线,不断在突破瓶颈。

11 月,Kimi 发布了万亿参数的混合专家模型,Kimi K2 Thinking,直接拿下多个榜单第一名,甚至超过了 OpenAI 的 GPT-5 和 Anthropic 的 Claude 4.5。

10 月底,MiniMax 正式发布了 MiniMax M2 混合专家模型 MoE,和 Kimi 一样,继续开源,在综合榜单上的表现,MiniMax M2 排名第五,超过了 Gemini 2.5 Pro 和 Claude Opus 4.1。

9 月,阿里在云栖大会上,一套模型七连发的组合拳,在视觉、语音、推理、编程等多个领域做到极致。

海外社交媒体上,关于国产开源模型的认可,从横空出世的 DeepSeek 以来就没停过。「好用、便宜、小公司的开发首选、自己做的副业项目,用的就是中国开源模型……」,这些评论在 X 上随处可见。

像是网友们对 Kimi K2 Thinking 写作风格,以及用 token 数量换思考深度的称赞。

还有网友说拿 Minimax M2 和 Claude Sonnet 4 对比,M2 只用一次就能生成一个功能齐全的网站,但是 Sonnet 4 会失败。

关于 Qwen 的帖子就更多了,从 2.5 更新到现在的 3.0,从大尺寸的 4800 亿参数,到只有 6 亿参数的小模型,从视觉语言 Qwen 3 VL,到代码编写 Qwen 3 Coder,开源市场几乎都有 Qwen 的影子在。

爱彼迎 CEO 在接受采访时,甚至大方的表示 OpenAI 虽然好,但是不适合我们;而来自中国的开源模型 Qwen 非常好,能实际地应用到他们的工作中,比 OpenAI 更好更便宜。

在开源这块,说国产开源模型还在追赶都不贴切,是已经实打实地成为了全球默认的开源选择。

MiniMax M2,能落地的开源智能体

如果要用具体案例,来说明国产开源模型,到底好在哪里,过去我们分享的多个开源工具的实测体验,其实就已经有了答案。

发布时间最近的 Kimi K2 Thinking,一次性能执行 300 次工具调用的超长思考链条,还有为手机而生的通用 Agent,智谱 AutoGLM 2.0;以及 AI 时代的安卓,阿里通义模型大家族。

▲Artificial Analysis 统计的 2025 Q1 国产前沿 AI 模型大厂和初创公司

这些模型虽然都是开源,但是都有各自的技术亮点,努力让国产开源模型这张地图,变得更完整、更丰富。

像 K2 Thinking 主打万亿参数大模型,然后还有自己的 KDA(Kimi Delta Attention)机制;DeepSeek 主打混合注意力,成本骤降;Minimax M2 在这次的更新里面,反而是一改常态,使用了完全注意力,模型参数也仅 2300 亿。

M2 好不好用,本着能体验都上手试试的原则,我们也简单测了一下。

第一个任务是让他处理 Excel 表格数据,我们把今年国考的岗位信息表格发给他,让它根据表格内容,设计一个通用的公务员岗位筛选工具。

表格的数据非常多,大小有 10MB,累计两万多个岗位。MiniMax M2 特别好的一点是,它会在正式执行任务前,询问用户,是否需要对任务进行调整。

在他们的技术博客里面提到,M2 此次采用了「交错思考」的技术,这项技术最早是在 Claude Sonnet 4 模型中开始应用,但具体的采用还很有限。

MiniMax 给了一个小贴士,提醒用户保留模型的思考记录,即 think 标签。M2 依赖于交错式思维,上下文就是为记忆,保留了,才能更好的开展交错式思考。

▲MiniMax 工程主管发 X 解释,交错思考如何让模型更好地完成智能体任务

简单来说,交错思维(Interleaved Thinking)就是让大模型在「动手做事(用工具/调用接口),停下来想一想再动手,然后接着再思考」,这样的循环里推进任务,而不是先把一大段思路想完再一次性执行。

最近更新的 Kimi K2 Thinking 同样采用了交错式思考的技术。边思考边调用的方式,能让模型在每次拿到工具输出后,立刻复盘、调整计划,这特别适合流程长、结果不确定的智能体任务。

▲ 体验地址:https://2rfxtimus5nr.space.minimaxi.com/;虽然考试已经结束,但是也能看到 MiniMax M2 处理 Excel 表格数据的能力,不容小觑

最后给出的结果是非常的准确的,20714 个岗位,以及对于应届生、基层工作年限、户籍地等方面的条件,它都有统计到;相比市面上一些付费的选岗工具,自己用 Agent 自动生成一个,再方便不过。

我们还让它去做一些深度研究,丢给它关于 M2 自己的信息,让它制作一个精美的 PPT。

▲预览链接:https://z4czsdfoakc7.space.minimaxi.com/

除了这种从零开始做一个产品的 vibe coding 体验,MiniMax 还提供了详细的教程,关于如何接入 Claude Code 等命令行工具,或开发平台 Cursor、VS Code 等。

▲使用 MiniMax M2 模型 API 的 Claude Code

交错思考能让模型更聪明,知道何时该调用何种工具。但 MiniMax M2 这次在技术上还有一个亮点,是它一反常态的使用了全注意力机制

之前我们介绍过 DeepSeek 能把成本打到这么低,其中最重要的原因之一就是它采用了稀疏注意力,以及混合注意力机制。稀疏注意力能让模型在处理 token 时,和我们人类一样,有选择的聚焦在重要信息,而忽略掉次要信息。

配合其他的策略,就能在不影响输出质量的前提下,提升模型的推理速度,降低成本。

▲ 博客原文:https://huggingface.co/blog/MiniMax-AI/why-did-m2-end-up-as-a-full-attention-model

MiniMax 团队也专门写了一篇技术博客来介绍,为什么又走回了原点,继续选择全注意力机制,这种增加训练和推理压力的方式。

他们提到主要的原因是「具体的表现」,现在大部分所说的稀疏注意力、或者高效注意力,并不是让模型的效果更好,而是单纯为了节省计算资源、降低成本。

全注意力模型的性能,和可靠性仍然是更高,随着上下文长度需求不断增加,以及 GPU 计算增速放缓,到那时,线性和稀疏注意力的潜力,可能会逐渐显现。

而 MiniMax M2 目前要做的,是在有限的算力资源下,尽可能实现质量、速度、价格这个三角的平衡,这次它也确实做到了。

所以说,在某种程度上,很多人觉得开源,就意味着把技术白白送给别人;但在整个的技术发展路线历史上,开源是让不同的技术碰撞,让不同的研究员合作,从而取得进一步的技术创新。

大模型分析平台,Artificial Analysis 在发 X 介绍 MiniMax M2 的综合榜单表现时,也提到了国产开源,他说。

中国 AI 实验室在开源领域持续保持领先地位。

 

 

MiniMax 的发布延续了中国 AI 在开源领域的领先地位,这一地位由 DeepSeek 在 2024 年底开启,并由 DeepSeek 的后续发布、阿里巴巴、智谱、和 Kimi 等公司持续保持。

确实是这样,等了一年都没等来的 DeepSeek R2,却让我们看到了在国外爆火的 Kimi K2,智谱 GLM 系列,还有几乎所有开发者都离不开的 Qwen 系列。

所有的这些国产开源模型,多元的技术路线、不同的应用方向,完全组合在一起,才有了真正的优势和力量,让闭源不再成为「好模型」的代表。

▲ Hugging Face 上,热门榜单前四个,都是国产开源模型;图片来源:https://huggingface.co/models?sort=trending

闭源没法卷赢闭源,只有开源,才能打穿壁垒

前段时间,在小红书的 1024 程序员节上,Hugging Face 创始人提到,开源和闭源差距在缩小,中国在这方面比较领先;小红书的技术负责人也说,开源降低了社会运用 AI 的成本,动用大家的力量,推着技术往前走。

毫无疑问,开源肯定是一件好事,只是没有人想到,打败闭源的,是来自我们的开源。

DeepSeek 的出现,除了向全世界公开了全新的模型训练逻辑,以更低的成本实现同等惊艳的效果;更多的是让整个国产 AI 的运行模式,有了明确的方向。

它让所有人意识到,在当时全球 AI 话语权被美国垄断的语境里,开源是让自己被看见的唯一方式。

▲OpenAI 的万亿算力商业帝国,包括 Google、Meta、Anthropic 等

当然,选择开源,背后更具体的原因有很多,OpenAI、Anthropic、Gemini 每家都在闭门造车,他们可以靠着无上限的显卡,训练更大的模型,融资动辄千亿美元。

但国产模型面临的困境是,算力紧张、芯片受限……如果不共享模型,就没人能复用算力。没有可以使用的基础模型,就意味着一切都要从头开始。百度一开始选择了闭源,为了商业模式的运转;在今年六月,他们也宣布正式开源了,文心大模型 4.5 系列模型。

另一方面是国产模型厂商太多、竞争太激烈,他选择不开源,就会有别人开源;而闭源,用户就有可能选择其他模型。

▲图片来源:https://a16z.substack.com/p/charts-of-the-week-open-model-of

a16z 前段时间统计了开源模型的数据,结果显示,国产开源模型的累计下载量,不仅超过了美国模型,而且领先优势还在不断扩大。

今年四月,斯坦福大学也发表了一份 2025 人工智能指数报告,里面统计了开源模型和闭源模型的性能对比,以及中美两国模型的性能对比。这份报告的数据只截止到今年 2 月份,明年再看的时候,国产开源大概会顺利超过闭源和美国。

如果把国产开源的优势拆到最小,我们会发现现在的领先,是因为一个完整、庞大的开源系统,这个系统的每一环都在让国产开源的能力,越来越强大。

▲无论是社区对国产开源模型的评价,即 Elo 排名,还是在 ArtificialAnalysis 基准测试中,按地区划分的性能对比,国产开源都在领先位置|图片来源:https://www.atomproject.ai/

DeepSeek 拿成本结构和高效推理打开了第一道缝;Qwen 凭借着生态规模把缝撕成了口;MiniMax、智谱和 Kimi 则用不同的技术路线,把这个口越撑越大。

当全球的小团队都用 Qwen 做微调、用 DeepSeek 做推理基座、用 MiniMax 做智能体验证,国产开源从选择变成了默认。结果就是,全球开源生态的中心,开始向中国倾斜。

上个月,黄仁勋在人工智能峰会上接受采访时表示,「中国将在人工智能竞赛中获胜。」尽管随后他立刻通过英伟达官方账号 X 发表声明,收回了之前的言论,澄清说中国实际上「在人工智能竞赛中,落后美国仅几纳秒。」

其实这也不是黄仁勋第一次提到,中国在人工智能竞赛的位置了。过去在多个公开场合,他都表示开源模型极其重要,无论是对开发者还是初创公司,甚至是所谓的 AI 竞赛。

今年 10 月的英伟达 GTC 大会上,黄仁勋的演讲里再次提到,全球模型开源市场,来自中国的通义千问排名第一,并且占据了大部分的市场份额。

▲几乎超过 60% 都是 Qwen

今年 4 月,他还在华盛顿的科技大会上说,「毫无疑问,华为是世界上最强大的科技公司之一……中国在人工智能领域并不落后。我们非常非常接近……全球50%的人工智能研究人员是中国人。我们将不得不竞争。」

但是在开源上的竞争,看美国的开源老大,来自 Meta 的 Llama,去年四月发布了 Llama 3,7 月 Llama 3.1,9 月 Llama 3.2,然后到了今年 4 月让人大跌眼镜的 Llama 4,甚至还有一个更高级的 Behemoth 版本至今没发布。

▲四月份发布的 Llama 4,提到有 Behemoth、Maverick、Scout 三个版本,Behemoth 目前看来是被放弃了

再后来,关于 Meta 的新闻就只有小扎开出天价薪酬到处挖人,然后最近又疯狂裁员六百人,连图灵奖得主 Yann LeCun 都不干了,要走人自己去创业。

大概小扎根本没想到,自己在硅谷选择开源,可以说是一枝独秀的存在,也会被今年 1 月爆火的 DeepSeek 偷了家。于是乎,Meta 现在开源也不是,闭源也难追赶,进退两难。

很难不认同,Llama 走到今天这步,有一半是国产开源的「功劳」。

▲Meta 相关的衍生模型,和 Mistral AI 早期领先优势,完全被阿里巴巴的 Qwen 模型超越

前几天刷社交媒体,看到一个评论说,「开源就是把你的对手变成了你的儿子,没有儿子会去打爸爸。」话糙理不糙,在 AI 的开源周期里,中国的代表性开源模型,明显地变成了 AI 生态的底座。

这场由国产开源引领的 AI 模型浪潮,正在改变谁能定义未来的 AI 这个问题。它会让我们每个人,以更低的成本、更快的速度,用上全世界最顶尖、也最好用的 AI。

最后这张图的详细情况如下。

▲从上到下依次为:
前沿模型:DeepSeek、Qwen、Moonshot AI(Kimi)
主要竞争对手 :智谱(Z.Ai)、MiniMax
值得关注的公司 :StepFun 阶跃星辰、InclusionAI / 蚂蚁 Ling、美团龙猫、腾讯、IBM、英伟达、谷歌、Mistral
专业领域 :OpenAI、Ai2、Moondream、Arcee、RedNote、HuggingFace、LiquidAI、微软、小米、穆罕默德·本·扎耶德人工智能大学
崛起中 :字节跳动 Seed、Apertus、OpenBMB、Motif、百度、Marin Community、InternLM、OpenGVLab、ServiceNow、Skywork
荣誉提名 :TNG 集团、Meta、Cohere、北京人工智能研究院、多模态艺术投影、华为

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


刚刚,OpenAI 版 Nano Banana 发布:奥特曼秒变性感男模|附实测

GPT-4o 上半年带来的那波热度,不仅让奥特曼感受到了 GPU 融化的气息,也让生图、理解视觉几乎变成了所有大模型的标配卖点。

但到了今年下半年,真正刷足存在感的却是那根「香蕉」:Nano Banana。

为了抢回头把交椅,OpenAI 今天正式推出了最新图像视觉模型 GPT-Image-1.5。这也是继 GPT-5.2 之后,OpenAI 红色警报计划中又一记重拳。

省流版如下:

  • 指令执行更准确
  • 编辑更精确
  • 细节保留更完整
  • 比之前快 4 倍

告别「抽卡」玄学,编辑细节能力拉满

GPT-Image-1.5 最大的升级点在于「精准编辑」。

以前用 AI 改图,简直像碰上了一个听不懂人话的「托尼老师」,你只想修修刘海,它反手就给你剃了个光头。现在,模型终于听懂了人话。你改哪里,它就动哪里。

光线、构图、人物特征,在输入、输出和后续编辑的闭环都能保持一致性。

听起来很抽象?看看官方给出的示例。

  • 将两个男性和一只狗合成到一张 2000 年代胶片风格的儿童生日派对照片中 →
  • 添加背景中吵闹投掷东西的孩子们 →
  • 将左边的男人改为复古手绘风格,把狗变成毛绒玩具风格,右边男子和背景保持不变 →
  • 为所有人换上 OpenAI 毛衣 →
  • 最后只保留狗,把画面放入一场 OpenAI 的直播中……

一套连招下来,画面逻辑居然没崩。这说明 GPT-Image-1.5 不再是靠「蒙」,而是真的理解了画面结构,并完成增删改查。而能改得准、稳得住,才是现在的技术护城河。

再来看几个我实际测试的案例。

你或许看过《千里江山图》这幅传世名作,但你或许还遗漏了亿点点细节。

同理可得,谁说《百骏图》里,不能突然出现一只从现代穿越过来的网红柴犬 Kabosu。

就连马斯克和扎克伯格那场没打成的笼中决斗,在 GPT-Image-1.5 的加持下,一次性就成功把主角换成了奥特曼。脸没崩,违和感也几乎为零。

我们要一张细节丰富、逼真写实的极端仰拍照片,马斯克坐在珠江岸边单手搭着广州塔尖。为了体现巨物感,还得在他的脚边撒上微小的游船和游客。

结果,它也确实懂了什么是「比例感」。

▲提示词:一张细节丰富、逼真写实的极端仰拍照片,画面中的马斯克正在坐在珠江岸边,一只手搭在广州塔的塔尖上,为了体现巨大的体型比例,可在他的脚边加入一些微小的游船、观光游客等,2K,16:9

终于不再画「鬼画符」,但中文表现……

相比初版图像模型,GPT-Image-1.5 更擅长遵循复杂、细致的指令,能保持各元素之间的预设关系。

官方展示了一个 6×6 的网格图案例,每一行都要按指定内容布置,希腊字母、动物、物品、图标、单词,模型排列得井井有条,强迫症看了都得说声舒服。

经过实测,把线稿转成真实图片这种操作,现在也成了基操。

文本渲染能力也进一步提升,能更好地处理密集、小字体内容。比如将一段 Markdown 格式的内容呈现为自然的报纸文章布局,内容包括 GPT-5.2 发布说明、性能基准对比等,格式和数字都能保持完整准确。

这个能力听起来可能不起眼,但对于需要生成海报、宣传图、信息图表的用户来说,简直是刚需。

在 Nano Banana Pro 出现之前,生成式 AI 的文本渲染一直抽象得离谱,现在终于能看了。不过我们得泼盆冷水,GPT-Image-1.5 的英文能力确实能打,但中文表现依然是灾难现场。

我让它画个「擎天柱征服火星」的中文漫画,它能给你自创一门火星文。

亦或者让其生成一张古人在墙壁写水调歌头的图片,不仅文字错漏百出,握笔姿势还居然是拿钢笔的手法。

好在生成速度快了 4 倍,这边还在画着,那边你可以同时开几个新任务,试错成本大大降低。物体知识储备也还算在线,问它往水里加盐鸡蛋会怎样,生成的图片倒是有模有样。

▲左为原图,右为生成的图片。提示词:如果往水中加入大量盐,生成一张图片,展示鸡蛋会发生什么。

博主 @Yuchenj_UW 则认为 GPT Image 1.5 的生成效果大致达到了 Nano Banana Pro 水准,但「智商/推理能力」明显落后于 Nano Banana Pro,尤其在数学题上(以及其他物理/迷宫类问题)表现更差。

你的下一位设计师,何必是人?ChatGPT 申请出战

OpenAI 这次还在 ChatGPT 里专门开辟了一个图像创作入口。

网页和移动端侧边栏都能看到这个新入口,里面塞满了预设滤镜和热门提示词,还会定期更新。上传一次肖像,以后张张都是你,不用反复喂图。

说实话,这功能 Nano Banana 没有,但国内的生图模型早就玩烂了。 某种程度上,GPT-Image-1.5 也算是在摸着国内同行的石头过河。

刚刚,奥特曼也在社交媒体上分享了自己用 GPT-Image-1.5 生成的圣诞性感月历男模照片。

来都来了,我们也顺手给奥特曼换了几套皮肤。贴纸风、摇头娃娃风、素描风,预计今天过后,奥特曼又要成为互联网上最忙的男人。

有个细节很值得点赞,当你要求生成预设方案时,OpenAI 会公开预设的提示词。从这一点来看,OpenAI 确实 open 了。

除此之外,制作贺卡、创建专辑封面,修复老照片,拍摄专业求职照片等也都是非常实用的预设方案。比如,那张经典的鲁迅和泰戈尔的合照,经过修复后,其实效果还是挺不错。

OpenAI 应用 CEO Fidji Simo 在博客中写道:「人类的思维并不只是由文字组成。事实上,我们最有创意的想法,往往起源于脑海中的图像、声音、动作或模式。」

她透露,ChatGPT 正在从一个反应式、以文本为核心的产品,转变为一个更直观、更能贴合你各种任务需求的工具。从纯文字向多媒体和动态界面转变,是这一进化过程中的重要一步。

很多用户第一次接触 ChatGPT,都是通过文字生成图片。这种「把文字变成画面」的过程充满魔力,但 ChatGPT 的聊天界面最初并不是为此设计的。图像创作和编辑是一种完全不同的任务,需要专门的视觉空间来支持。

OpenAI 干脆给它搞了个专属入口,让图像生成有了一个更像创意工作室的环境。

计划还不止于此。

OpenAI 未来还将引入更多视觉元素,优化 ChatGPT 的整体体验。未来在进行搜索查询时,结果将更多地包含图片和清晰来源。在单位换算或查阅体育比分等任务中,你需要的是一目了然的可视化结果,而不是一段文字描述。

甚至写作体验也在改,未来内置的写作模块让你在聊天中就能直接编辑,还能一键导出 PDF 或直接调用邮件应用发送。ChatGPT 早已不是一款单纯的语言模型,它正在变成一个真正的多模态工作台。

当然,除了普通用户,开发者也能通过 API 用上 GPT-Image-1.5。

相比 GPT-Image-1,GPT-Image-1.5 具备更强的品牌元素与关键视觉保持能力,适合电商、品牌营销等需要生成大量变体图片的场景。图像输入输出费用降低 20%,同样预算可生成更多图像。

降价+提效,这套组合拳打得还是挺实在的。

除此之外,迪士尼上周已经宣布向 OpenAI 投资 10 亿美元,并达成了合作协议。根据这项为期三年的授权协议,OpenAI 旗下的 Sora 和图像生成模型都能生成迪士尼、漫威、皮克斯和星球大战旗下角色,并计划在明年初正式上线相关功能。

内容 IP 加 AI 生成,这背后想象空间确实挺大。

更重要的是,GPT-Image-1.5 的发布,标志着图像生成工具正在从「玩具」向「工具」转变。

目前市面上大多数 AI 改图工具,一改就崩,毫无一致性可言。

GPT-Image-1.5 至少在这个方向上迈出了坚实的一步。它开始具备后期编辑能力,能像 Nano Banana Pro 一样控制细节,确保画面连贯。

在模型能力较弱的情况下,GPT-Image-1.5 通过更完善的图片生成预设方案, 以及功能设置来完成对新版 Nano Banana 的反击, 也确实是不错的选择。

专属图像创作入口、预设滤镜库等等,这些看似不起眼的产品设计, 恰恰击中了普通用户的痛点。很多人并不需要最强的模型, 他们需要的是「能快速上手、不用反复调教、生成结果八九不离十」的工具。

模型能力领先只是第一步, 如何把能力转化为好用、易用、爱用的产品,才是真正的护城河。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


小米突然发布新模型:媲美 DeepSeek-V3.2,把手机的性价比卷到 AI

开源模型再次迎来一位重磅选手,就在刚刚,小米正式发布并开源新模型 MiMo-V2-Flash。

MiMo-V2-Flash 总参数 3090 亿,活跃参数 150 亿,采用专家混合架构 (MoE),性能还能和 DeepSeek-V3.2、Kimi-K2 这些头部开源模型掰掰手腕。

此外,MiMo-V2-Flash 采用 MIT 开源协议,基础版权重也已经在 Hugging Face 上发布,除了开源,新模型真正的杀手锏在于架构设计上的激进创新,把推理速度拉到了 150 tokens/秒,成本压到了每百万 token 输入 0.1 美元、输出 0.3 美元,主打一个超绝性价比。

从官方提供的页面来看,MiMo-V2-Flash 支持深度思考和联网搜索功能,这意味着它不仅能写代码、解数学题,还能实时获取最新信息。

附上AI Studio 体验地址:
http://aistudio.xiaomimimo.com

开源模型新标杆,SWE-Bench 霸榜开源第一

老规矩,咱们先来看看 MiMo-V2-Flash 的跑分环节。

在数学推理方面,AIME 2025 数学竞赛和 GPQA-Diamond 科学知识测试中,MiMo-V2-Flash 都排在开源模型前两名。

编程能力更是亮眼,SWE-bench Verified 得分 73.4%,超越所有开源模型,直逼 GPT-5-High。做个简单科普,这个测试是让 AI 去修真实世界的软件 bug,73.4% 的成功率意味着它能搞定大部分实际编程问题。

多语言编程基准测试 SWE-Bench Multilingual 解决率 71.7%,智能体任务上,MiMo-V2-Flash 在τ²-Bench 分类得分中,通信类 95.3 分,零售类 79.5 分,航空类 66.0 分。

BrowseComp 搜索代理得分 45.4,启用上下文管理后直接飙到 58.3。

这些数据说明,MiMo-V2-Flash 不仅会写代码,还能真正理解复杂任务逻辑,执行多轮智能体交互。长文本能力也没拉胯,实测表现甚至超越了体量更大的 Kimi-K2 Thinking,证明混合滑动窗口注意力架构的长程建模能力确实强悍。

写作质量也接近顶级闭源模型,这意味着 MiMo-V2-Flash 不只是个工具,还能当个靠谱的日常助手。

长文本性能不打折,成本降 6 倍的秘密

MiMo-V2-Flash 最核心的创新是混合滑动窗口注意力。

传统大模型处理长文本时,全局注意力机制会导致计算量二次爆炸,存储中间结果的 KV 缓存也跟着飙升。小米这次采用了 5 比 1 的激进比例,5 层滑动窗口注意力搭配 1 层全局注意力交替使用,滑动窗口只看 128 个 token。

(考虑到有朋友不太了解 AI,简单科普一下:「token」(中文常译作「词元」)在大模型/自然语言处理里,指的是模型读入和输出文字时使用的最小计数单位。模型并不是按「一个汉字=1、一个英文单词=1」这样固定地数,而是把文本切成一段段 token 来处理。)

简单说就是,模型不用每次都看全部内容,只看最近 128 个 token,偶尔看一次全局,这样计算量和存储都能大幅下降。这种设计让 KV 缓存存储量直接减少了近 6 倍,但长文本能力却没打折扣,最长支持 256k 上下文窗口。

关键是小米还整了个「可学习的注意力汇入偏置」,其的用是让模型即使在这么激进的窗口设置下,照样能稳住长文本性能。

罗福莉在社交平台上特别强调,窗口大小 128 被证明是「最佳数值」,而 512 反而会导致性能下降。这个发现挺反直觉的,你会觉得窗口越大越好,但实际测下来 128 才是甜点。另外,sink 值(attention sink values)必不可少,绝对不要省略它们。

另一个黑科技是轻量级多 Token 预测 (MTP)。

传统模型生成文本时一次只能吐一个 token,就像打字员一个字一个字敲。MiMo-V2-Flash 通过原生集成的 MTP 模块,能并行预测多个 token,一次性猜出接下来好几个 token。

实测平均能接受 2.8 到 3.6 个 token,推理速度直接提升 2 到 2.6 倍,不仅在推理时管用,训练阶段也能加速采样,减少 GPU 空转,属于一箭双雕。

罗福莉提到,在三层 MTP 设置下,他们观察到平均接受长度超过 3,编码任务速度提升约 2.5 倍。它有效解决了小批量 On-Policy 强化学习中「长尾样本」带来的 GPU 空闲时间浪费问题。

啥叫长尾样本?就是那些特别难、特别慢的任务,拖着其他任务一起等,GPU 就在那干瞪眼。MTP 把这个问题给解了,效率直接起飞。

不过罗福莉也坦诚,这次因为时间紧迫没能把 MTP 完整集成进 RL 训练循环,但它与该流程高度契合。小米已经把三层 MTP 开源了,方便大家在自己的项目中使用与开发。

算力只用 1/50,性能如何不打折?

预训练阶段,新模型使用 FP8 混合精度,在 27 万亿 token 数据上完成训练,原生支持 32k 序列长度。

FP8 混合精度是一种压缩数值表示的技术,能在保持精度的同时减少显存占用和加速训练。这种训练方式在业界并不常见,需要对底层框架进行深度优化。

而在后训练阶段,小米整了个大活,提出了多教师在线策略蒸馏 (MOPD)。

传统的监督微调加强化学习管线,不仅训练不稳定,算力消耗还贼高。MOPD 的思路是让学生模型在自己的策略分布上采样,然后由多个专家教师在每个 token 位置提供密集的奖励信号。

通俗点说就是,学生模型自己写作业,老师在每个字上都给评分,不用等写完整篇才打分。这样一来,学生模型能快速从教师那里学到精髓,而且训练过程稳定得多。

最夸张的是效率提升,MOPD 只需要传统方法 1/50 的算力,就能让学生模型达到教师性能峰值。这意味着小米能用更少的资源,更快地迭代模型。

而且 MOPD 支持灵活接入新教师,学生模型成长后还能反过来当教师,形成「教与学」的闭环自我进化。今天的学生,明天的老师,后天又能教出更强的学生,套娃玩法属实有点东西。

用罗福莉的话来说,他们借鉴 Thinking Machine 的 On-Policy Distillation 方法,将多个强化学习模型进行融合,结果带来了惊人的效率提升。这为构建一个自我强化循环系统奠定了基础,学生模型可以逐步进化,最终成为更强的教师模型。

在智能体强化学习扩展上,小米 MiMo-V2-Flash 研究团队基于真实 GitHub issue 构建了超过 10 万个可验证任务,自动化流水线跑在 Kubernetes 集群上,并发能开 10000 多个 Pod,环境部署成功率 70%。

针对网页开发任务,还专门搞了个多模态验证器,通过录制视频而非静态截图来验证代码执行结果,直接减少视觉幻觉,确保功能正确。

对于开发者而言,MiMo-V2-Flash 能与 Claude Code、Cursor、Cline 等主流开发环境无缝配合,256k 的超长上下文窗口支持数百轮智能体交互与工具调用。

256k 是什么概念? 大概相当于一本中等篇幅的小说,或者几十页技术文档。这意味着开发者可以把 MiMo-V2-Flash 直接融入现有工作流,不需要额外适配,拿来就用。

小米还把所有推理代码贡献给了 SGLang,并在 LMSYS 博客分享了推理优化经验。

技术报告公开了完整模型细节,模型权重 (包括 MiMo-V2-Flash-Base) 在 Hugging Face 上以 MIT 许可协议发布。这种全面开源的态度,在国内大厂里属实少见。

目前 MiMo-V2-Flash 已经在 API Platform 限时免费开放,开发者可以直接上手体验。

小米的 AI 野心,不止于手机助手

MiMo-V2-Flash 的发布,标志着小米在 AI 赛道上的全面发力。

罗福莉在社交平台上透露了更多信息,「MiMo-V2-Flash 已正式上线。这只是我们 AGI 路线图上的第二步。」第二步就已经这么猛了,那后面还有啥大招?想想就有点期待。

当然,小米在技术报告中也坦诚,MiMo-V2-Flash 与最强的闭源模型相比仍有差距。但他们的计划很明确,通过扩大模型规模与训练算力来缩小差距,同时继续探索更稳健、更高效的智能体架构。

MOPD 框架下教师模型与学生模型的迭代共进化,也为未来的能力提升留足了空间。

把视角拉高来看,背后是小米对整个 AI 生态的一次战略押注。手机、IoT、汽车,小米的硬件生态需要一个强大的 AI 底座,MiMo-V2-Flash 显然就是小米为全硬件生态准备的那块基石。

就像十年前小米手机用 1999 元重新定义了旗舰机的价格标准,如今 MiMo-V2-Flash 正在用 0.1 美元/百万 token 的成本、73.4% 的 SWE-Bench 得分,重新定义开源大模型的性能标准。

这一次,属于开源模型的「小米时刻」真的来了。

HuggingFace 模型地址:
http://hf.co/XiaomiMiMo/MiMo-V2-Flash
技术报道地址:
http://github.com/XiaomiMiMo/MiMo-V2-Flash/blob/main/paper.pdf

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


每天被问 500 万次的健康 AI 火了!原来这届网友在偷偷养生

现代人的「脆皮」生活,往往是从一次深夜搜索开始的。

也许是加班后莫名其妙的心悸,也许是体检报告上突然出现的几个箭头。那一刻,巨大的不确定性像潮水一样涌来。

我们习惯性地打开搜索框,看着那些真假难辨的「绝症预警」,然后陷入更深的焦虑;想去医院求个心安吧,一想到挂号靠抢、排队半天只为问两句日常琐事,又默默退了号。

健康焦虑这件事,是时候有个靠谱的解法了。

半年前,蚂蚁集团推出了一款独立应用 AQ,成了千万人的「健康搭子」,而就在 12 月 15 日,AQ 品牌正式升级为「蚂蚁阿福」, 并发布 App 新版本,升级健康陪伴、健康问答、健康服务三大功能。

蚂蚁集团副总裁、健康事业群总裁张俊杰介绍说,取名「阿福」寓意健康是福,健康的事就找阿福。

从 AI 工具转向 AI 健康朋友,阿福最大的变化在于健康陪伴板块,能够定制健康小目标、智能提醒、日常打卡,试图把健康管理变成每天都能做到的小事。

数据显示,阿福 App 的月活用户已超 1500 万,跻身国内 AI App 前五,每天回答用户 500 多万个健康提问,55% 用户来自三线及以下城市。

当 1500 万人把健康问题交给 AI,我们也不禁想问,在健康这个专业性极强的领域,为什么有这么多人会找它?

会追问、能辟谣、还有名医分身,蚂蚁阿福缓解了我的「健康焦虑」

挂号靠抢,看病靠等,回家靠猜。这是很多人身体不舒服的就医三部曲。

阿福与通用型 AI 最大的不同在于,它的服务融入了「健康医疗」需求的一个个环节。健康陪伴、健康问答、在线问诊、解读报告、买药、挂号、医保支付……你以为只是个能问答的 AI,其实他能帮你走完大半个健康解答和就医的流程。

打开阿福,首先扑面而来的是那种熟悉的聊天界面。

在阿福内点击「AI 诊室」功能,它不会直接甩给你一堆医学文献,也不会用专业术语把你绕晕,而是像个老练的医生一样学会了「追问」。

比如我说「胃胀」,它会进一步追问症状出现的时间和进展,接着给出建议和原因分析。要知道,通用 AI 往往一问一答就结束了,而阿福的问诊方式更接近真人健康顾问。

并且,问诊结束后,它还能根据需求帮你预约挂号,推荐对症的医生专家。

听说吃木耳会致癌,是真的吗?

当我把这个问题输入阿福时,它先引用了权威的医学资料进行辟谣,然后详细解释了这类谣言的来源,最后还给出了科学的饮食建议。

让我惊喜的还有「名医 AI 分身」这个功能。

名医的资源为什么稀缺?因为他们的经验、注意力和时间都是有限的。而 AI 分身嘛,复制的正是他们最宝贵的知识和经验。

我关注了邓杰医生,并询问:「孕期爱吃辣会对宝宝有危害吗?」,这个 AI 分身解释了辛辣食物对孕妇的影响机制,并贴心地提醒了注意事项。

随手拍个药盒,阿福就能告诉你这药是干什么的,怎么吃,什么人不能吃,给出分量十足的用药提醒。

面对皮肤问题心里没底?拍张照,AI 能识别痤疮、银屑病等 50 种常见皮肤病。水油、衰老、敏感度等等,它能把感性的「皮肤不好」变成理性的数据指标,并给出护肤建议。

以前还得花钱去医院看的毛发检测,现在手机拍一下就能搞定。至于隐私问题,阿福设计了「无痕拍」模式,主打一个阅后即焚,本地不留痕。

而最解决痛点的,莫过于解读体检报告。

体检报告像天书,医生说的每个字都懂,连起来就不知道什么意思了。拍照上传或导入 PDF,几分钟内,阿福就能读懂 99% 的常见报告,准确率高达 90% 以上。

比起给你念一遍报告上的数字,它还会用人话解释这些指标是什么意思,哪些地方需要注意。

当然,阿福给出的是健康科普和参考建议,绝不越俎代庖替代诊疗。要是感到身体非常不舒服,还得老老实实去医院。

体检一年只有一次,但健康管理需要 365 天都「在场」

除了生病时的救急,阿福明显想更好地照顾你的日常生活。

通过增加健康陪伴的功能板块,阿福希望陪伴用户从日常就开始养成健康好习惯,构筑健康防线。这也是阿福区别于通用 AI 的核心优势。

现在,阿福支持连接华为、苹果、欧姆龙等主流品牌的智能设备,步数、睡眠时间、血压这些数据都会自动同步。这样一来,AI 对你的身体状况就有了更全面的了解,给出的建议也不会是通用的「多喝热水」。

比如你在健康档案里记录了身高体重,阿福帮你制定运动计划时就会根据你的 BMI 给出更科学的强度建议。你之前咨询过体重过轻怎么办,它就不会再跑来建议你减肥。

健康管理最理想的状态,是把大事化小,把小事化了,把了事化无。

新版阿福还上线了「健康小目标」和「健康小提醒」这两个陪伴型功能,用户可以设定运动、饮食、生活习惯等健康目标,阿福会像「私人教练」一样,根据目标为用户定制专属计划, 并每日提醒。

▲提升注意力秘籍

从运动饮食到戒烟睡眠,它每天盯着你打卡。甚至会根据季节变迁,提醒你流感防护或给老人小孩的照护建议。

以前是病了才想起医生,现在是 AI 追着提醒你别生病。

当然,AI 能做的始终是陪伴和提醒,真正的健康习惯养成,还得靠你自己的坚持和自觉。

而这一切体验的闭环,最终落在了蚂蚁最擅长的领域:服务集成。查医保、刷医保码、挂号买药,不需要在四五个 App 间来回跳转,阿福一站式搞定。

「有时治愈,常常帮助,总是安慰」

说实话,要把自己的健康放心交给 AI ,光有情绪价值是不够的,阿福背后的技术积累其实挺扎实的。

它基于蚂蚁医疗大模型,这个大模型在 HealthBench、MedBench 等行业榜单上长期霸榜。甚至在 OpenAI 主导的 HealthBench 测评里,某些指标还超过了 DeepSeek。

在数据层面,超万亿 tokens 的专业医疗语料,千万级医疗知识图谱,支撑起千亿参数的多模态模型。

简单说就是:它不光能看懂文字,还能看懂图片,能像真人医生一样主动追问你的症状。

更关键的是,AQ 背后站着一群真人专家。六位国家院士领衔,500 多位名医在上面开通了「AI 分身」。

蚂蚁健康团队里,60% 的人都有医学院、医院或互联网医疗背景,还组建了千人规模的医学标注团队在持续调教大模型。你问的每个健康问题,背后其实都有这群人在帮你「把关」。

用户也用脚投票,给这款「正规军」出身的 AI 产品投出了惊人的赞成票。目前阿福的月活用户已经超 1500 万,跻身国内 AI App 前五,成为第一大健康管理 AI App。

有时去治愈,常常去帮助,总是去安慰。(To Cure Sometimes,To Relieve Often,To Comfort Alway)

公共卫生先驱特鲁多医生墓志铭上的这句话,在 AI 时代有了新的注解。

归根结底,大家对健康的焦虑,源于一个巨大的「供需错配」。

中国居民人均预期寿命已经到了 79 岁,3 亿多老人对养生、康复、护理有巨大需求。90 后、00 后也开始保温杯里泡枸杞,练起了八段锦。

同时慢病管理成了全民课题。中国慢病患者超过 5 亿人,但知晓率、分析率、控制率都很低。拿高血压来说,2.7 亿患者里知晓率只有 57%,超八成的患者血压控制不佳。

这种时候你去三甲医院挂号?排队三小时看病三分钟,医生也没空跟你细聊。

而正如药王孙思邈所言:「上工治未病之病,中工治欲病之病,下工治已病之病」,高明的医生往往能够在疾病未发之时及早干预,从而防止病发。

阿福这种随时可问、专业靠谱、还不用排队的健康 AI,正好卡在了这个需求点上,不仅能够及时地提供帮助和安慰,还解决了普通人日常那些不值当跑医院但又真实存在的健康困惑。

对于医生而言,这也是一种解放。

杭州市七医院副院长毛洪京的 AI 分身,累计服务了 368 万人。这是线下门诊无论如何也无法企及的效率杠杆。健康 AI 不是要干掉医生,而是让优质健康服务变得更可及,让每个人都能在日常生活中被好好照顾到。

比尔·盖茨曾预测,未来十年内 AI 将让优秀医疗建议变得像水和电一样廉价普及。

阿福让我们看到,这样的未来并非遥不可及。

通过将专业医理通俗化、专家经验普惠化,阿福让每个人都能平等地获取优质健康服务。填平专业鸿沟,让稀缺资源变得唾手可得,这才是技术最大的善意。

所以,当 1500 万人把健康问题交给 AI,他们相信的除了技术本身,还有技术背后那些真正懂健康、守边界、有温度的人。

在这个人人都有点「脆皮」的时代,我们需要的不只是一个搜索引擎或聊天机器人,而是一个真正懂你、陪你、帮你的「健康搭子」。

作者:李超凡、莫崇宇

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


❌