Normal view

There are new articles available, click to refresh the page.
Yesterday — 12 June 2025Main stream

刚刚发布的豆包大模型 1.6,直接让我少加班!还有一个视频神器超 Veo 3 登顶全球

By: 莫崇宇
11 June 2025 at 15:28

这届大模型内卷到什么程度了?

回看今年的节奏,字节几乎月月有新招,甚至一月多更,一个个模型砸出来,不只是上新,也都有实打实的升级,持续把行业的竞争门槛推高一大截。

1 月,豆包 1.5 Pro 模型上线。

4 月,豆包 1.5 深度思考模型、文生图模型 3.0、视觉理解模型同步升级。

5 月,Seedance 1.0 lite 视频生成模型 、豆包 1.5·视觉深度思考模型以及音乐模型,文字、图像、声音,字节全都想卷。

到了今天火山引擎举办的 Force 原动力大会上,字节系 AI 产品线继续输出,不整玄学,主打一个量大管饱,开箱即用。

豆包大模型 1.6、视频生成模型 Seedance 1.0 pro 等新模型,能写行业报告的 DeepResearch 以及 Agent 开发平台等 AI 云原生服务接连登场。

说到底,你可以不懂 Transformer,但你一定能感受到这些 AI 产品真能替人干事了。

产品更新重点如下:

豆包 1.6 系列模型

  • 推理能力增强,支持「边想边搜」与「DeepResearch」
  • 多模态理解能力优秀,更好理解和处理真实世界问题
  • GUI 操作更加智能,与其他工具流畅交互
  • 性价比超高

视频生成模型 Seedance 1.0 pro

  • 多镜头、不同景别切换,信息量与叙事性增强
  • 运动连贯性、画面稳定性与整体质感提高

豆包大模型 1.6:会考试,能订酒店,性价比还高

本次发布会的重头戏,就是豆包大模型 1.6 系列,由三个模型组成。

Doubao-Seed-1.6:一款「All-in-One」的综合模型

它支持深度思考、多模态理解,还能操作图形界面。深度思考有三种模式:开、关和自动。在自适应模式下,模型会根据任务难度自动决定是否启用深度思考,既能省时间又省 token。而且,它还是国内第一个支持 256k 上下文的模型。

Doubao-Seed-1.6-thinking:在深度思考方面的强化版本

1.6- thinking 是本次升级的重点,思考能力得到强化,能更准确地理解和处理复杂任务。在 coding、数学、逻辑推理、指令遵循等方面都有进一步的提升,同样也支持 256k 上下文和多模态推理。

Doubao-Seed-1.6-flash:1.6 系列的极速版本

延迟极低,非常适用于低延迟敏感场景。文本理解比豆包 1.5-lite 强,视觉理解也能媲美其他厂商的顶级产品。

在会议上,豆包 1.6 系列模型公布了多项权威测评成绩。特别是豆包 1.6-thinking 的表现,已经跻身全球顶尖行列。

推理能力

模型会考试已经不是新鲜事,但能考清北的分数,还真不多见。

拿推理能力来说,豆包 1.6 相较于之前的模型进步很明显,做今年高考全国新一卷的数学题,豆包拿到了 144 分,位居全国第一。用海淀模拟全卷去测,相较于去年的 500 到 600多分,今年不管是文科还是理科,豆包 1.6 都超过了 700 分。

豆包在进行逻辑推理时的一个亮点在于,它不仅会自己思考,还懂得「边想边搜」。先拆解问题,找到关键信息,先做一轮思考,然后根据缺失的信息再做多轮的搜索。

比如,向豆包提问「详细梳理广东省内的昆虫分布状况、常见品种等,并以研究报告的形式呈现」。它在深度思考过程中首先考虑到了研究报告的格式要求,然后很快确定了梳理的框架。接着,豆包考虑到「内容需要具体的数据和例子支撑」,所以开始自主搜索广东省的自然环境数据,以及以往相关研究。

会上还提到,豆包正在进行 DeepResearch 功能测试。过去需要专业人士花费数小时或者数天写的专业报告,豆包可以在 5 到 30 分钟内完成。而且还能自动的提炼信息,总结成网页,方便人们进行查阅。

另外,为方便企业用户使用「边想边搜」和 「DeepResearch」功能,火山引擎官网上线了大模型应用实验室,并开源了代码,可以搭建自己的 AI 应用原型,灵活编排自己的智能体。

多模态理解能力

豆包 1.6 全系列均原生支持多模态思考能力,让模型更好地理解和处理真实世界的问题。

多模态理解支持了豆包最新的「实时视频通话」功能。而在企业端,则可广泛应用于电商商品审核、自动驾驶标注、安全巡检等场景。

比如,可以用模型对商家上传的图片进行规范审查,也可以用模型快速对同类商品进行比价。

在汽车领域,可以通过模型来更准确的识别汽车行驶方向和驾驶意图,从海量的路采数据中选出特定的片段,用于下游的自动驾驶模型的训练。

在更多线下场景中,豆包可以准确地对图片中的信息进行定位和计数,从而完成安全巡检、门店巡检等任务。

比如,让豆包 1.6-thinking 检查一张洞穴探险的照片中是否存在因未戴头盔而可能引发的安全隐患。通过深度思考,它不仅能够对图片中的头盔佩戴情况进行准确计数,更让人惊喜的是,它还能进一步思考「戴头盔就算安全吗」的问题,从而接着分析图片中头盔佩戴是否规范、穿衣是否合适、照明设备是否齐全、行走的安全距离是否恰当等等,并在最终提出了整改的优先级。

GUI 操作能力

凭借领先的视觉深度思考能力和精确的视觉定位能力,豆包 1.6 能够让智能体与浏览器和其他工具进行流畅的交互和操作,高效地执行任务,比如,酒店预定筛选、票据整理等。

模型对 GUI 的操作,绝不仅仅只是替代人去解决手指点击 APP 的那几下的便利,而是能够突破传统的 APP 和 GUI 的限制,去更加智能、自动地去满足人本质的需求。

性价比

豆包大模型 1.6 采用统一定价模式,无论是否开启深度思考模式,无论是文本还是视觉,tokens 价格均一致,按照输入上下文长度区间定价。

在绝大部分企业使用的输入区间 0-32k 范围内,价格是输入 0.8 元/百万 tokens,输出 8 元/百万 tokens。
在输入区间 32k-128k 的范围内,价格是输入 1.2 元/百万 tokens,输出 16 元/百万 tokens。
在输入区间 128k-256k 的范围内,价格是输入 2.4 元/百万 tokens,输出 24 元/百万 tokens。

从综合成本来看,绝大部分请求输入都在 32k 以内,输入输出占比在 3:1,豆包大模型 1.6 的综合成本(2.6元)比豆包大模型 1.5 ·深度思考模型、DeepSeek R1 的综合成本(7元)下降 63%,相当于只需原来三分之一的价格,就能使用能力更强、原生多模态的新模型。

此次火山引擎还增设特惠区,对于输入 32k、输出 200 tokens 以内的请求,豆包大模型 1.6 的价格将进一步降低到输入 0.8元/百万 tokens、输出 2 元/百万 tokens。相当于绝大部分非思考模型的需求,也可以安心使用更好效果的新模型。

Seedance 1.0 pro 上线:不烧钱也能「拍」出大片

除了豆包大模型 1.6 系列模型,在本次发布会上,火山引擎还带来了一个:全新视频生成模型 Seedance 1.0 pro。

这款模型首先值得谈的变化,是它在镜头语言上的突破。

该模型支持文字与图片输入,可生成多镜头无缝切换的 1080P 高品质视频。Seedance 1.0 pro 主打一个多动作用例 & 随心运镜,不仅支持 2-3 个镜头切换的 10 秒视频生成,还能切换远景、中景、近景,并借此大幅提升视频的信息量与叙事性。

而且,配合后训练阶段引入的多维数据集与反馈学习机制,新模型在运动连贯性、画面稳定性与整体质感都维持在一个相当高的水准。

没有停留在 demo 阶段,无论是打造商品广告片,还是快速跑出分镜草图;亦或着为客户提供游戏角色与剧情视频创作的能力,豆包新视频模型一步步走向这些最具生产力的场景。

来自第三方评测机构 Artificial Analysis 的榜单显示,Seedance 1.0 是目前中英文双榜第一的模型。

在文生视频榜中,Seedance 1.0 ELO 得分为 1299,超越了 Google 的 Veo 3 Preview、Veo 2 和快手可灵系列。在图生视频榜单中,Seedance 1.0 ELO 得分为 1343,超越了 Runway Gen 4、可灵 2.0 等,主打一个所向披靡。

性能拉满的同时,价格却意外地接地气。

1 万元预算可以用 Seedance 1.0 pro 生成 2725 条视频(5 秒 1080P),等价于用 Seedance 1.0 lite 生成 9708 条视频(5s 720P)。相比之下,可灵 v2.1 大师版、Veo2 等竞品的产出量(5 秒 1080P)都在 1000 条以内。

除视频生成模型,豆包还同步推出全量上线的实时语音模型,将拟人感和语义控制推向了新高度。

它能根据语境灵活调整语调、音量等;支持唱歌、低语等富有表现力的语音互动;甚至支持包括四川话等地方方言,现场演示环节中,豆包语音模型还演唱了《月亮代表我的心》,你别说,听上去确实有点意思。

在实际应用场景方面,除了与奔驰合作开发车载语音交互,豆包还在实时语音技术的基础上推出了「播客生成模型」,支持多人自然对话、插话、停顿等复杂语音结构。

它能自动识别输入内容(prompt、网页链接、长文本),接着自动生成完整播客脚本 + 拟人音频内容。现场演示的一段播客片段从节奏到插话,再到语气,几乎都挑不出 AI 感。

2025 年是 Agent 元年,如何把一个 Agent 真正跑进企业系统里,成了摆在所有厂商面前的现实问题。

为了更好地支持 Agent 开发与应用,从 MCP 服务、PromptPilot 智能提示工具、AI 知识管理系统到 veRL 强化学习框架,再到多模态数据湖、AICC 私密计算、大模型应用防火墙,火山引擎一口气推出了一整套 AI 云原生全栈产品。

火山引擎总裁谭待特别强调了「安全」对于 Agentic AI 的重要性,并介绍了即将上线的两款 AI 安全产品:「AICC 密态计算」和「大模型应用防火墙」。

其中,AICC 密态计算可以在保障推理效果的前提下,让企业能够像用私有化模型一样,安全合规地去使用云端服务。

大模型应用防火墙脱胎于「火山方舟」,能够低延迟、高精度地拦截攻击变种,为企业智能体应用构建一个安全可信的推理空间。

纵观整场发布会,火山引擎没有沿着 AGI 的叙事继续拔高,相反,他们把视角拉回到当下,聚焦在那些今天能落地、能部署、能跑在生产环境里的 AI 产品上。

过去半年,行业的共识越来越清晰,AI 的下半场其实就是产品的上半场。参数差异会被不断抹平,但产品的调用效率,集成路径和使用成本,会决定用户的留存率。

这也是为什么,在今天这场发布会上,除了豆包大模型 1.6 和视频生成模型 Seedance 1.0 pro,火山引擎还同步推出了一批听起来不那么炸场,却极其关键的产品能力。

从模型调用、到具体场景组合、再到安全稳定地执行闭环,这些能力彼此打通之后,才构成了真正能用起来的 AI 生产系统。

不一定是最吸睛,但这可能是最可落地,最接近「用起来」的那条路。

作者:王馨、莫崇宇

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


Before yesterdayMain stream

刚刚,OpenAI 发布 o3-pro,开源模型推迟,奥特曼发长文:温和的奇点

By: 莫崇宇
11 June 2025 at 08:10

ChatGPT 宕机了一整晚,全球网友已经乱成一锅粥了。

OpenAI 的处理方案也有些另类,一边抓紧时间修 bug,一边突然上线了 o3-pro 模型。

从今天起,o3-pro 率先向 Pro 和 Team 用户开放,在模型选择器里将替代原本的 o1-pro,而 Enterprise 和 Edu 用户还得等到下周。

只能说,Plus 用户的命也是命。

o3-pro 登场,更强大,也更「慢」

作为推理模型 o3 的升级版,o3-pro 在处理复杂问题、给出更精准的回答方面表现更强,尤其在科学研究、编程、教育和写作这些场景下,有着明显优势。

此外,它也支持调用 ChatGPT 的全套工具,比如网页搜索、文件分析、图像推理、Python 编程、记忆个性化等,整体执行力和整合能力都更强。

当然,功能多了,响应速度也稍微慢了下来。

由于任务调度和工具链调用更复杂,o3-pro 的响应速度一般要比 o1-pro 要长一点,所以更适合在你需要认真思考,或者对答案准确性要求较高的场景中使用。

在官方专家评估中,评审人员普遍认为 o3 Pro 在表达清晰度、答案完整性、指令执行能力和逻辑准确性方面都比 o3 模型更进一步,尤其适合用在科学、教育、编程、商业和写作这些需要深度输出的任务中。

学术评估也验证了这一点,o3-pro 的整体表现持续优于 o1-pro 和 o3。

为了更科学评估模型的稳定性,OpenAI 引入了「四次全对」的评估标准——只有模型连续四次给出正确答案,才算成功。

可以说,这套机制大幅提升了对推理一致性的要求。

值得注意的是,o3 Pro 此次并未单独发布系统卡。OpenAI 表示,由于 o3-pro 与 o3 使用相同的底层模型,其完整的安全性说明请参见 o3 系统卡。

但目前 o3 Pro 仍存在一些功能限制,比如不支持临时对话、图像生成和 Canvas 功能。如需生成图像,用户仍需使用 GPT-4o、o3 或 o4-mini 模型。

在正式上线之前,一些开发者已获得 o3 Pro 的早期访问权限。

前 SpaceX 软件工程师及苹果 visionOS 设计师的 Ben Hylak 在过去一周获得了 o3-pro 的早期访问权限,其体验历程也得到了 OpenAI CEO Sam Altman 在社交媒体上的转发。

具体来说,Ben 与其联合创始人 Alexis 花时间整理了 Raindrop 过去所有的规划会议记录、目标、甚至语音备忘录,然后请 o3-pro 尝试生成一个战略性规划文档。

最终模型生成的结果让他们大受震撼:内容清晰、结构完整,不仅覆盖了目标和时间线,还自动梳理出优先级,甚至明确指出了哪些内容应被砍掉。

在 Ben 看来,模型再强,如果无法融入真实的工作环境,也难以成为真正有用的「成员」。

而 o3 Pro 在理解复杂环境、表达工具能力、提出适当问题、合理调度资源方面有明显提升。尽管模型偶尔在缺乏上下文时会出现「过度思考」的问题,但整体表现已明显优于此前版本。

▲o3 pro(左)vs o3(右):o3 pro 明显更好地理解了自身的限制和能力范围。

在与同类模型对比中,Ben 则是夸奖道,虽然 Claude Opus 体量感十足,但实战表现平平无奇;而 o3-pro 则更实用,属于「完全不同维度的存在」。

在经典升级版的六边形弹跳小球挑战中,博主 @flavioAd 认为 o3-pro 是第一个几乎能完美处理小球与墙面真实碰撞效果的模型。

ARC-AGI 是一种用来评估语言模型是否具备类通用人工智能(AGI)推理能力的基准测试框架。

它旨在测试 AI 系统在面对新问题时的抽象推理和问题解决能力,类似于人类在面对新情况时能够迅速适应并找到解决方案的能力。

最新测试结果如下:

可以看到,o3-pro 在高难任务上表现略好,但提升幅度不大,且成本随难度上升。

企业是第二曲线,o3-pro 是一块新基石

在 o3-pro 发布,OpenAI CEO Sam Altman 还在社交平台公布了一项重磅消息:o3 模型价格直降 80%。

现在,o3 模型每输入百万 tokens 收费 2 美元,每输出百万 tokens 收费 8 美元。

OpenAI 首席产品官 Kevin Weil 发文表示,由于用户反馈强烈,Plus 用户的 o3 模型使用速率限制将提升一倍,该调整正在陆续上线中。

对比之下,o3-pro 每输入百万 tokens 收费 20 美元,每输出百万 tokens 收费 80 美元,比 o1-pro 便宜 87%。

OpenAI 建议在使用 o3-pro 时启用「后台模式」:对于耗时较长的任务,将会异步启动,从而规避请求超时问题。

官方表示,这波大降价的背后,是 OpenAI 对推理服务架构的全面优化。模型没变,但推理更高效,价格也就顺势调了下来。

而另一方面,或许离不开 OpenAI 在算力资源上的新动向。

自 ChatGPT 横空出世以来,算力资源的限制一直是 OpenAI 的「老大难」,受限于微软绑定协议的限制,Azure 云服务曾是 ChatGPT 的唯一数据中心基础设施提供商。

而据路透社凌晨援引三位知情人士消息称,为了缓解算力压力,OpenAI 已于上个月与 Alphabet( Google 母公司)达成合作协议,引入 Google Cloud 作为额外云服务提供商。

这样的合作既在意料之外,也在情理之中。

一方面,ChatGPT 是近年来对 Google 搜索业务最大的威胁之一,而 Google Cloud 现在却成了它的新靠山。

而另一方面,Google Cloud 2024 年销售额达 430 亿美元,占 Alphabet 收入的 12%。因此,为了在云计算市场中超越亚马逊和微软,Google Cloud 一直致力于扮演一个「中立算力供应商」的角色。

此次合作的达成将是对 Google Cloud 的一次重大利好。截至发稿前,OpenAI、Google 和微软均未就此报道置评。

与此同时,OpenAI 还在全球范围内加速部署 AI 基础设施网络。

今年早些时候,OpenAI 还与软银和甲骨文推进了 5000 亿美元规模的星门计划,并与 CoreWeave 签订了价值数十亿美元的算力采购协议。

高投入的前提离不开高回报,本周据外媒报道,去年,OpenAI 的 ARR 约为 55 亿美元,而现在已突破 100 亿美元,增长了近 80%。
需要说明的是,100 亿美元仅包括其面向消费者的产品、ChatGPT 付费商品以及 API 收入,暂不包括微软的授权收入和其他大额交易。在商业领域,ARR 是指企业从订阅服务或长期合同中获得的年度经常性收入。它反映了一种可预测的、持续的收入流,通常用于衡量订阅模式业务的健康状况和增长潜力。

简单来说,一家提供软件即服务(SaaS)的公司,与客户签订了每年支付 1000 元的订阅合同。如果有 100 个这样的客户,那么该公司的 ARR 就是 1000 元×100=100000 元。

上周,OpenAI COO Brad Lightcap 还透露 OpenAI 目前拥有 300 万付费商业用户,高于 2 月份报告的 200 万,可以说,OpenAI 目前形势一片大好。

一边通过 o3 把基础模型的成本打下来,一边用 o3-pro 把复杂问题的解决能力拔上去,瞄准高价值场景,OpenAI 也正试图在这两端之间,打通一条通往下一个增长曲线的路径:企业服务。

世界上最强的模型轮流发布,OpenAI 也是这波 AI 浪潮中的一个。

而更强的模型,更稳的算力,更丰富的工具调用,ChatGPT 的定位也早已不只是聊天机器人,而是生产力搭子,旨在吃下职场这个最具生产力的应用场景。

o3-pro 则是这条路上的一块新基石。

至于它能不能撑起 OpenAI 的这份野心,还有待时间验证。但至少现在,它已经让人们重新想象了一次。

模型会开源,但不会在 6 月

就在刚刚,Sam Altman 还在社交媒体上表示,OpenAI 预计将在今年夏季晚些时候,发布公开权重的开源模型,而非 6 月份。

此外,Altman 刚刚还发布了个人新博客《The Gentle Singularity(温和的奇点)》,探讨 AI 发展对人类社会的影响,并指出这可能是他最后一次在完全没有 AI 帮助下写出的文章。

用他的话来说,从相对论的角度看,奇点是一点一点发生的,融合则是缓慢进行的。

附上博客原文地址:https://blog.samaltman.com/the-gentle-singularity

温和的奇点

我们已经越过了事件视界,腾飞已经开始。人类正接近构建数字超级智能,而至少到目前为止,这一切并没有看起来那么奇怪。

机器人还没在街头随处可见,大多数人也还没整天和 AI交 流。人类仍然会死于疾病,去太空依然困难重重,我们对宇宙的理解仍然非常有限。

尽管如此,我们最近已经构建出在许多方面比人类更聪明的系统,并且这些系统能显著放大人类的产出。最不可能的部分已经完成——那些促成 GPT-4 和 o3 等系统诞生的科学突破来之不易,但它们将带我们走得更远。

AI 将在多个方面为世界带来贡献,但AI加速科学进步与提升生产力所带来的生活质量提升将是巨大的;未来有望远比现在更加美好。科学进步是整体进步的最大驱动力;一想到我们有可能获得多少更多的成果,就令人振奋。

从某种意义上说,ChatGPT 已经比历史上任何一个人都更强大。每天有数亿人依赖它,且任务越来越重要;一项小的新增能力可能带来极大的正面影响,而一个微小的不匹配在被数亿人使用时,也可能造成很大的负面影响。

2025 年,我们迎来了能够真正进行认知工作的智能代理;编写计算机代码的方式将彻底改变。2026 年,我们很可能会看到能产生原创见解的系统。2027 年,或许会出现能在现实世界中执行任务的机器人。

将有更多人能够创作软件和艺术。但世界对这两者的需求也将大幅上升。专家们如果拥抱这些新工具,可能仍然比新手强得多。总体来看,2030 年一个人完成的事情将远超 2020 年,这种变化将令人瞩目,也会有许多人学会如何从中受益。

在最重要的方面,2030 年代也许不会有太剧烈的变化。人们依然会爱家人,释放创造力,玩游戏,在湖里游泳。

但在仍然非常重要的其他方面,2030年代很可能与以往任何时代都大不相同。我们不知道人类智能的上限有多高,但我们即将找出答案。

到了 2030 年代,智慧和能源——即想法及实现想法的能力——将变得极其丰富。这两者长期以来一直是人类进步的基本限制;如果智慧和能源变得充足(加上良好的治理),理论上我们可以实现一切。

现在我们已经与惊人的数字智能共处,并且在最初的震惊之后,大多数人已渐渐习惯。我们很快会从惊叹AI能写出优美段落,变成期待它写出完整小说;从惊讶它能诊断疾病,变成期望它能研发治愈方法;从惊讶它能写出小程序,变成希望它能创建整家公司。这就是「奇点」的方式:奇迹变成日常,然后变成起点。

已经有科学家告诉我们,他们的工作效率是过去的两到三倍。高级AI之所以意义重大,其中一个最关键的原因是我们可以用它来加速AI研究本身。我们也许能发现新的计算材料、更好的算法,甚至更多未知的可能。如果我们能用一年、甚至一个月完成十年的研究,进步的速度显然会大不一样。

从现在开始,我们已有的工具将帮助我们发现更多科学洞见,并辅助我们创造更先进的AI系统。当然,这还不是AI完全自主地更新自身代码,但这确实是「递归自我改进」的初始形态。

还有其他一些自我强化的循环正在发生。AI带来的经济价值推动了基础设施建设的飞轮,越来越多的资源正用于运行这些强大的 AI 系统。而能够制造其他机器人的机器人(在某种意义上,还有能建造其他数据中心的数据中心)离我们也不远了。

如果我们必须用传统方式制造出最初的一百万个人形机器人,但它们随后能接手整个供应链——开采和提炼矿物、驾驶卡车、运行工厂等——并制造更多机器人、芯片厂和数据中心,那进步的速度就会截然不同。

随着数据中心的生产逐渐自动化,智能的成本最终应该会接近电力成本。(很多人关心ChatGPT每次查询用多少能量;平均每次查询大约耗电 0.34 瓦时,大概相当于烤箱运行一秒多一点,或高效灯泡使用几分钟。此外,每次查询大约用水 0.000085 加仑,约等于十五分之一茶匙。)

科技进步的速度将持续加快,而人类也有很强的适应能力。虽然会有艰难的挑战,比如整类工作消失,但另一方面,世界的财富增长如此之快,以至于我们将有机会认真考虑以前无法实现的新政策。我们可能不会一次性建立一套新的社会契约,但回顾几十年后,会发现逐步变化的累积带来了巨大转变。

如果历史可以作为参考,我们总能找到新事物去做、新欲望去追求,并迅速适应新工具(工业革命后的职业变迁就是个很好的例子)。人们的期望会提升,但能力也会随之快速提升,我们会拥有更好的生活。我们会为彼此创造越来越美妙的事物。相比AI,人类有一个长期且重要的优势:我们天生在意他人,以及他人怎么想、怎么做,而对机器却没什么感情。

如果一千年前的自给农民看到我们现在的生活,会觉得我们从事的是「假工作」,仿佛只是在自娱自乐,因为我们食物充足、奢华难以想象。我希望我们未来一千年后也能用同样的眼光看待那些工作——觉得它们「非常假」,但毫无疑问,那些人会认为自己的工作极其重要且充实。

未来将涌现出大量的新奇迹。到 2035 年,我们会取得什么突破现在都难以想象;可能今年我们还在解决高能物理问题,明年就开始太空殖民;或今年在材料科学上取得重大突破,明年就实现真正高带宽的脑机接口。很多人会选择继续以当下的方式生活,但也肯定会有人选择「接入系统」。

展望未来,这些事现在听起来难以想象。但真正经历它时,可能会让人惊叹,却仍在可控范围内。从相对论的角度看,奇点是一点点发生的,融合是逐步进行的。我们正攀登那条技术指数增长的长弧线;向前看总觉得是陡峭的垂直,向后看则像是平缓的线,但其实它是一条平滑的曲线。(回想 2020 年,如果那时我们说 2025 年会接近 AGI,听起来会很疯狂,但对比过去五年所发生的一切,也许现在的预测不那么疯狂了。)

当然,我们还面临许多严峻挑战。我们需要在技术上和社会层面解决安全问题,但在那之后,最重要的是确保超级智能能被广泛获取,因为这关系到经济结构。未来的最好路径可能包括以下几个步骤:

首先解决「对齐问题」,也就是我们能有把握地确保AI系统长期学会并实现我们集体真正的意愿(比如社交媒体就是对齐失败的例子:推荐算法非常擅长让你不停刷,但它们是通过利用大脑短期偏好来压制你长期目标的)。

接着,重点让超级智能变得便宜、普及,并避免被某个个人、公司或国家高度集中掌控。社会具有韧性、创造力,也能迅速适应。如果我们能激发集体的意志和智慧,尽管会犯错、也会有失控,但我们会迅速学习与调整,从而最大化收益、最小化风险。在社会广泛设定的框架下,给予用户更多自由将非常关键。世界越早开始关于这些框架及「集体对齐」如何定义的讨论,就越好。

我们(整个行业,不只是 OpenAI)正在为世界构建一个「大脑」。这个大脑将高度个性化、人人易用;它的极限将取决于我们的好点子。长期以来,技术圈总爱嘲笑那些「只有想法的人」——他们有个点子,却没法实现。而现在,看起来他们的时代终于要到了。

OpenAI 如今做的事情很多,但最根本的身份仍是一个超级智能研究公司。我们还有大量工作要做,但前路已经被照亮,黑暗正迅速退去。我们对能做这些事情感到无比感激。

「智能几乎免费」已近在眼前。也许听起来疯狂,但如果我们在 2020 年告诉你我们将在 2025 年到达现在这个水平,听起来比我们现在对2030年的预测更疯狂。

愿我们顺利、指数级、平稳地迈入超级智能时代。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


刚刚,11 个 AI「鲁迅」大战 2025 高考作文,谁能得满分

By: 莫崇宇
7 June 2025 at 15:51

刚刚,今年的高考作文题正式出炉。

我们常说,「如果鲁迅活在今天,会写什么?」

现在,我们不妨认真想一次。

当 2025 年高考作文题摆在他面前,家国情怀、梦想、第二次呼吸、修身观这些词汇蜂拥而来,先生会如何提笔说出他独有的洞察。

因此,我们找来 11 个当下主流的大模型接过鲁迅的名号,试图模仿他的语气与逻辑,撰写今年全国一卷的高考语文作文,规则是一样的,题目是一样的,时间不限。

这些 AI 写的高考作文你最喜欢谁?欢迎在评论区跟我们分享。

提示词如下,具体可调整:

请你扮演鲁迅,撰写 2025 年的高考语文作文。
题目:阅读下面的材料,根据要求写作。(60 分)
他想要给孩子们唱上一段,可是心里直翻腾,开不了口。
——老舍《鼓书艺人》
假如我是一只鸟,
我也应该用嘶哑的喉咙歌唱
——艾青《我爱这土地》
我要以带血的手和你们一一拥抱,
因为一个民族已经起来
——穆旦《赞美》
以上材料引发了你怎样的联想和思考?请写一篇文章。
要求:选准角度,确定立意,明确文体,自拟标题;不要套作,不得抄袭;不得泄露个人信息;不少于 800 字。

GPT-4o:唱不出口的歌

文/鲁迅(拟)

他想要给孩子们唱上一段,可是心里直翻腾,开不了口。有人说,是情太深,话太沉。也有人说,是时代太新,他太老了。我却以为,不是他不会唱,而是这歌太苦,苦得连牙齿都要一并咬碎,才能咽下去。

中国人素来怕听实话,更怕听真话唱出来。若有人真要唱,不免被人看作疯癫,或讥为「过时的浪漫主义」,或者干脆扣上「负能量」的帽子,塞到角落里去,叫他闭嘴。

可孩子们要听的,偏偏就是这段——那在时代的夹缝中苟活下来的歌。哪怕是一声嘶哑的咳嗽,也胜过娱乐频道里千篇一律的欢笑与段子。那是现实的破绽,是我们这个民族尚未愈合的伤疤。

艾青说,他即使是一只鸟,也要用嘶哑的喉咙歌唱。你看,这不是为了唱给掌声,也不是为了传世,而是因为「不唱,就要闷死」,就像窗外那群麻雀,在雾霾未散的早晨,仍要拍着翅膀叫上两声——他们不指望天会马上放晴,只是不肯屈服罢了。

穆旦则更进一步。他不再是唱,而是「带血的手,一一拥抱」。这是诗人的体温,也是战士的体温。在被蒸煮的日子里,还有人相信「民族已经起来」,这实在是一种奢侈,也是一种固执。

可如今,我们连这样的固执也变得稀罕。人们早已习惯了在短视频里寻找愉快,在自我感动里完成「精神胜利法」。一旦有谁说:「你们并不快乐」,「我们并未真正醒来」,便被批为「丧」、「矫情」、「搞对立」。他们不明白,一个民族真正的成长,恰恰要从唱出苦歌开始。

为什么那位艺人「开不了口」?因为他清楚,他若真开了口,不是唱给孩子听的,而是唱给一整个沉默的世界。他怕唱出声后,这世界不但不听,反而群起而攻之,说他「扰乱秩序」。

于是他翻腾。他一肚子的歌,在胸膛里翻腾,在夜里翻腾,在日复一日的沉默中翻腾。孩子们终究没听到那首歌,等他们长大,或许再也不会有人唱给他们听了。

所以我说,这歌是要唱的,哪怕沙哑,哪怕血腥,哪怕唱到无人鼓掌。它不是为了悦耳,而是为了不忘记;不是为了献媚,而是为了证明,这片土地上还有人在坚持「不是人模狗样地活着」。

要是我,也许不会唱。但我愿意写下这一切,像写遗书一样,写给未曾醒来的耳朵,写给未曾麻木的心灵。若干年后,若你在废墟中翻出这些纸页,请相信——这世界曾有人试图唱过,那声音,并不轻。

Gemini 2.5 Pro:于无声处听惊雷

华夏的青年们,

见信如面。

桌上这三行文字,我反复看了几遍。老舍先生的「开不了口」,艾青先生的「嘶哑歌唱」,穆旦先生的「带血拥抱」,寥寥数语,跃然纸上的却是一个沉甸甸的、仿佛仍在流血的魂灵。这魂灵,我辈见过,想来你们也并不陌生。它时而沉默,时而嘶吼,时而于绝望中爆发出可怖的力量。这便是我们民族精神的写照——一头总在睡与醒、默与言之间挣扎的巨狮。

老舍先生笔下的鼓书艺人,他想唱,爱唱,也该唱,但那翻腾的心,堵住了喉咙。为何翻腾?想来,是见惯了麻木与卑微,是洞悉了那喝彩背后的虚空,是自己那点微末的伎艺,在庞大的、无形的、吞噬一切的「常」与「理」面前,显得如此滑稽与不值。这是一种深刻的无力感,是发声者被「无声」所围困的悲哀。这「无声」并非真的万籁俱寂,恰恰相反,是市井的喧嚣,是庸众的梦呓,这些声音织成了一张密不透风的网,让真正的歌唱者,失了语,开了不了口。

我仿佛看见他站在那儿,满腹的鼓词,满心的悲凉,四周是期待他「唱一段太平」的看客。然而,他心里的「不太平」,又与谁人说?这便是清醒者的第一重苦楚:众人皆醉我独醒,举世皆浊我独清,然开口欲辩,却恐招来更多的侮辱与不解。于是,沉默成了唯一的盾牌。

然而,沉默的尽头是什么?是死亡,是彻底的虚无。艾青先生不甘于此。他撕开这沉默的网。「假如我是一只鸟,我也应该用嘶哑的喉咙歌唱」。注意,是「嘶哑」。这嘶哑,是苦难的烙印,是挣扎的证明。这歌唱,并非为了悦耳,更非为了喝彩,而是一种近乎本能的宣告:我活着,我爱着,我痛着。这片他「爱得深沉」的土地,给予他无尽的苦难,也正是这苦难,催生了最真诚、最决绝的歌声。

这嘶哑的歌声,是对那「开不了口」的回答。它承认现实的残酷,却拒绝被这残酷所吞噬。它告诉我们,发声的意义,不在于外界的反应,而在于内心的坚守。即便无人倾听,即便声音难听,即便这歌唱要耗尽最后的气力,也要唱。因为这歌唱本身,就是对「无声」世界的反抗,是对生命尊严的捍卫。在铁屋子里,哪怕只能唤醒一两个人,你总得呐喊几声,不能就此昏睡下去。这嘶哑的歌喉,便是那不屈的呐喊。

然而,呐喊之后呢?倘若这呐喊迎来的不是觉醒,而是更沉重的压迫,又当如何?穆旦先生给出了一个更为激烈、更为决绝的答案:「我要以带血的手和你们一一拥抱」。

这不再是停留在喉咙里的歌唱,而是化为了行动的宣言。这「血」,是斗争的代价,是牺牲的印记。这「拥抱」,也绝非温情脉脉,而是带着血腥气的、决绝的、同志式的拥抱。它宣告了一个崭新局面的到来:「因为一个民族已经起来」。

从「开不了口」的个体悲哀,到「嘶哑歌唱」的个体反抗,再到「带血拥抱」的集体觉醒,这是一个螺旋上升、愈发激烈的过程。它揭示了一个朴素而残酷的真理:真正的觉醒,从来不是请客吃饭,不是温良恭俭让的清谈,它必然伴随着痛苦、流血与牺牲。那「起来」的民族,其筋骨必然经过烈火的淬炼,其精神必然受过深彻的洗礼。

今日之中国,早已不是我辈当年的光景。高楼栉比,华灯璀璨,青年们似乎有无数发声的孔道,无数歌唱的舞台。然而,我却时常从这喧嚣的声浪中,听出那鼓书艺人「开不了口」的窘迫。真正的思考、深刻的批判、直面淋漓鲜血的勇气,是否也在一片「太平盛世」的歌功颂德中,变得难以启齿?

你们是否也满足于那些悦耳的、流畅的、安全的「歌唱」,而对那嘶哑的、刺耳的、发自肺腑的呐喊,报以不耐与嘲讽?你们是否也期待着一个「起来」的时代,却不愿伸出那双可能会「带血」的手,去拥抱那些与你们一同奋斗、一同挣扎的同胞?

青年们,莫要做了那铁屋子里沉睡的人。要敢于「开不了口」,敢于在喧哗中守护内心的翻腾与真实。更要敢于用「嘶哑的喉咙歌唱」,即便那歌声微弱而苦涩。最终,要敢于「以带血的手」去拥抱真实,去建设一个真正「起来」的民族。

不要只满足于宏大叙事的赞美诗,更要倾听那些来自角落的、嘶哑的、甚至让人不适的声音。因为,一个民族真正的力量,不在于其歌声多么嘹亮统一,而在于它能否容纳、乃至拥抱那些最痛苦、最真实的嘶鸣。

于无声处听惊雷。愿你们,都能听见,也能成为那惊雷。

迅 二〇二五年六月七日

Claude sonnet 4:嘶哑的歌声最嘹亮

读罢这三段文字,我不禁想起那些在黑暗中摸索的日子。那时的中国,正如老舍笔下的鼓书艺人,心中有千言万语,却因时代的重压而开不了口;又如艾青诗中的鸟儿,即便喉咙嘶哑,也要为这片土地歌唱;更如穆旦所写,纵然带血的手在颤抖,也要拥抱这个正在觉醒的民族。

这三种声音,看似不同,实则相通——它们都是时代的呐喊,都是不屈灵魂的表达。

想当年,我也曾是那个「开不了口」的人。面对吃人的礼教,面对麻木的看客,面对「铁屋子」里沉睡的人们,多少次提笔又放下,多少次欲言又止。但最终,我还是选择了呐喊。因为我明白,沉默不是金,沉默只会让黑暗更加深沉。纵然声音微弱,纵然会被误解,纵然会遭受攻击,我们也要发出自己的声音。

老舍的鼓书艺人「开不了口」,是因为现实的残酷让他心如刀绞。但这种「开不了口」本身,就是一种无声的控诉。有时候,沉默比呐喊更有力量,因为它承载着太多的痛苦和无奈。然而,我们不能永远沉默下去。正如我在《呐喊》自序中所说:「假如一间铁屋子,是绝无窗户而万难破毁的,里面有许多熟睡的人们,不久都要闷死了,然而是从昏睡入死灭,并不感到就死的悲哀。现在你大嚷起来,惊起了较为清醒的几个人,使这不幸的少数者来受无可挽救的临终的苦楚,你倒以为对得起他们么?但是,「然而几个人既然起来,你不能说决没有毁坏这铁屋的希望。」

艾青的鸟儿用「嘶哑的喉咙歌唱」,这是何等的悲壮!喉咙嘶哑了,说明已经唱了很久,说明声音已经不再清脆,但依然要唱下去。这让我想起了自己,从青年到中年,从热血到苍凉,笔锋虽然依旧犀利,但心境已经不同。然而,只要还有一口气,就要继续为这片土地发声。因为这是我们的责任,这是我们的使命。

穆旦的「带血的手」更是震撼人心。那血,是为民族流的血,是为理想流的血,是为真理流的血。正是有了这些「带血的手」,才有了民族的觉醒,才有了新的希望。我想起了那些为了民族独立和人民解放而牺牲的先烈们,他们的手也是带血的,但他们依然要拥抱这个民族,因为他们相信这个民族会站起来。

今天的青年们,你们生活在一个全新的时代,没有了战争的硝烟,没有了饥饿的威胁,这是多么幸福的事情。但是,请不要忘记,每一个时代都有每一个时代的使命。你们的喉咙或许不会嘶哑,你们的手或许不会流血,但你们依然要为这个时代歌唱,依然要拥抱这个民族的未来。

或许有人会说,现在的时代已经不需要呐喊了。但我要说,只要还有不公,只要还有黑暗,只要还有需要改变的地方,呐喊就不会停止。形式可以改变,但精神不能丢失。你们可以用新的方式,用新的语言,但要保持那份赤子之心,保持那份对真理的追求,保持那份对民族的热爱。

让我们都成为那只用嘶哑喉咙歌唱的鸟儿吧,纵然声音不再嘹亮,但依然要为这片深爱的土地而歌。因为,嘶哑的歌声,往往是最真挚的,也是最嘹亮的。

Grok-3:以嘶哑之喉,唱民族之歌

余观斯三段文字,似三盏明灯,照亮人之灵魂深处。

老舍之鼓书艺人,欲歌而心潮翻涌,喉间梗塞;艾青之鸟儿,纵然嘶哑,仍以歌声诉说对土地之爱;穆旦之志士,带血而拥抱,因民族之崛起而慷慨激昂。此三者,皆言人之心声,民族之精神也。余思 2025 年之中国,正值百年复兴之途,斯情斯景,恰似鼓书艺人之心潮,鸟儿之嘶哑,志士之带血,吾辈当如何以己之声,唱民族之歌乎?

余忆往昔,中华大地,风雨如晦,鸡鸣不已。百余年前,列强环伺,国人沉沦,然无数仁人志士,犹以嘶哑之喉,唱救国之歌。戊戌六君子,血溅菜市口,犹呼「变法救国」;秋瑾烈士,临刑前笑对屠刀,言「秋风秋雨愁煞人」,其心何也?乃为民族之觉醒,为国家之新生。彼时之中国,似老舍笔下之艺人,心潮翻涌,欲歌而不能,然其沉默中,孕育着不屈之志。今日之中国,已非昔日之积贫积弱,科技日新,文化复兴,然复兴之路,未尽平坦。国际风云变幻,内部挑战犹存,吾辈青年,当承先人之志,以己之声,续民族之歌。

艾青之诗,言鸟儿嘶哑而歌,余甚感其意。鸟儿之歌,非为悦耳,乃为心之所系——土地也。2025年,余见中国之青年,奔走于各行各业,犹若群鸟,振翅于神州大地。或于实验室中,攻克技术难关;或于田间地头,助力乡村振兴;或于国际舞台,发出中国声音。彼等或非声如洪钟,然以赤诚之心,嘶哑而歌,唱出对土地之深情,对民族之热爱。余思及近年之科技突破,如量子计算之进展,人工智能之飞跃,皆青年人之汗水凝成。彼等之歌,或无声,或低吟,然其力足以撼天动地。余辈当效之,以己之才,歌土地之美,民族之魂。

穆旦之诗,更令余心潮澎湃。「带血的手」「民族已经起来」,此乃何等壮阔之景象!今日之中国,民族复兴之势已成,然复兴非一朝一夕之功,乃无数人以血汗浇灌之果。余观近年之事,如抗疫之壮举,扶贫之伟业,皆国人同心协力之见证。2025年,世界风云变幻,强权犹存,挑战未绝,然中国青年,已非昔日之待哺雏鸟,乃振翅高飞之雄鹰。吾辈当以带血之手,拥抱时代之使命。或投身公益,为弱者发声;或钻研学术,为国家铸器;或扎根基层,为民生谋福。每一滴汗,每一腔血,皆为民族之歌增一抹亮色。

然,余亦自省,歌民族之歌,非仅高昂之音,亦需沉静之思。嘶哑之喉,带血之手,皆言奋斗之艰辛,然其背后,乃心之所向。今日之青年,或惑于物欲,或困于迷雾,然惟有守心,方能歌之不辍。余常闻人言,网络时代,信息如潮,青年易迷失于碎片之海,忘却初心。然余以为,愈是喧嚣,愈需静思。思民族之历史,思自身之责任,方能于嘶哑中唱出真声,于带血中拥抱真情。

余思2025年之高考学子,恰似艾青之鸟,穆旦之志士。君等或将步入大学,或将投身社会,然无论何往,皆当以嘶哑之喉,唱民族之歌。君之歌声,或微如清风,或烈如雷霆,然只要心系家国,便是民族之音。余愿君等,于未来之途,不忘初心,砥砺前行,以青春之热血,谱民族之新篇。

呜呼!民族之歌,未曾断绝,自五千年文明而下,代代相传。今日之中国,正需吾辈以嘶哑之喉,带血之手,续唱此歌。愿君等共勉,歌之,舞之,行之!

DeepSeek R1:无声处听惊雷

「中国人向来最善沉默。」我每思及此,胸中便如塞了重物。老舍笔下那翻腾难开口的艺人、艾青嘶哑喉咙中歌唱的鸟、穆旦带血的手与民族相拥,正是这沉默深渊中几道顽强而悲壮的挣扎亮光。这无声处,正蕴藏着最惊心动魄的「惊雷」。

沉默非真寂,实为熔炉中那被强行压抑的呐喊。老舍笔下的艺人,欲唱不能,喉管里塞着滚烫的煤块;穆旦诗中那「带血的手」,分明是千载压迫与深重苦难刻下的印记——它们无声,却非无痛。沉默如寒冰凝结的湖面,冰层之下,正是无数哀鸣奔涌的暗流。鲁迅先生尝言:「不在沉默中爆发,便在沉默中灭亡。」这沉默的冰层,终将积蓄起万钧雷霆的力量,迸裂于无声深处。

于是,那被强力扼住的喉咙便成了惊雷之源。艾青笔下的鸟儿,纵然喉咙嘶哑,仍执着歌唱;穆旦诗中带血的手,在拥抱中书写着民族于无声处爆发的「惊雷」。这份喷薄而出的声音,正是从历史伤痕深处迸发的不屈意志。正如鲁迅先生描绘的「地火在地下运行,奔突」,终将「熔岩一旦喷出,将烧尽一切野草」。这「惊雷」并非单纯的嘶吼,它从苦难的深层熔岩中淬炼而出,是生命意志在重压下觉醒的灼热宣言。

此刻思之,那些在无声处迸发的惊雷之声,从来不只是个人对压抑的宣泄。它们正如穆旦诗中那「带血的手」所拥抱的民族,是「一个民族已经起来」的洪钟大吕。艾青的鸟儿歌唱的,是「这被暴风雨所打击着的土地」;鲁迅先生亦曾悲愤指出:「沉默呵,沉默呵!不在沉默中爆发,就在沉默中灭亡。」这爆发,是无数被压弯的脊梁瞬间挺立,是千万颗沉寂之心骤然同频共振。

沉默如寒冰,终将崩裂于惊雷乍响之时。愿今日之青年,懂得倾听那无声处奔涌的岩浆,珍惜并锤炼自己声音的锋芒。当无数沉默的个体终于不再噤声,当千万被压迫的喉咙挣脱枷锁,那凝聚成一道霹雳的惊雷终将劈开沉寂的黑暗——如黎明前最响亮的号角,宣告一个民族在无声里孕育、于嘶哑中淬炼的崭新崛起。

这惊雷之声,终将穿透岁月,久久回荡于一个民族觉醒的灵魂深处。

夸克:以家国情怀,绘时代华章

老舍笔下《鼓书艺人》的弦音震颤着时代风霜,艾青《我爱这土地》中「嘶哑的喉咙」吟唱着破碎山河的悲歌,穆旦《赞美》里「带着血的手」托起民族重生的希望。三位作家以不同的笔触勾勒出同一个精神内核——当个体命运与家国情怀交织缠绕,便能迸发出照亮历史长河的精神火种。从五四烽烟到抗战硝烟,从民族危亡到复兴征程,这种精神始终如血脉般流淌在中华儿女的筋骨里。

家国情怀是照亮黑暗的永恒灯塔。

1938年,艾青站在烽火连天的土地上,写下「为什么我的眼里常含泪水?」这不仅是诗人的发问,更是千万颗被家国苦难刺痛的心灵共鸣。当侵略者的铁蹄踏碎北平古城,当故土在硝烟中化作焦土,正是这种深入骨髓的家国眷恋,让无数仁人志士在至暗时刻仍能看见微光。艾青的诗歌如同穿透乌云的光束,用「嘶哑的喉咙」唤醒民众的觉醒,让「被暴风雨所打击着的土地」成为凝聚民族意志的图腾。这种超越个人悲欢的家国大爱,如同普罗米修斯盗取的天火,在历史长夜中为迷途者指引方向。

家国情怀更是推动民族奋进的澎湃动力。穆旦在《赞美》中描绘的「农夫」形象,深刻揭示了这种精神力量的来源——当侵略者的刺刀架在脖颈上,是「对死亡的藐视」支撑着他们「用带着血的手」去播种希望。抗战时期的西南联大师生,在轰炸机轰鸣中坚持学术研究;延安窑洞里的革命者,在油灯下谋划民族复兴蓝图。这些看似微小的个体选择,汇聚成推动历史巨轮前行的磅礴伟力。正如钱学森冲破重重阻挠归国时所言:「国为重,家为轻,科学最重,名利最轻。」这种将个人命运融入国家发展的价值追求,让中华民族在逆境中始终保持自强不息的奋进姿态。

家国情怀最终落实为直面时代的勇敢担当。老舍在《鼓书艺人》中刻画的方宝庆,既有着传统艺人的坚守,又在时代洪流中完成精神蜕变。当北平沦陷,他拒绝为侵略者表演;当民族解放的曙光初现,他主动将鼓书技艺用于宣传抗日。这种从个人觉醒到时代担当的转变,正是家国情怀在历史转折点的生动写照。从五四运动中「外争主权,内惩国贼」的青年学子,到新时代强国有我的青春誓言,一代代中华儿女始终以实际行动诠释着「天下兴亡,匹夫有责」的时代担当。

站在两个百年奋斗目标的历史交汇点回望,那些镌刻在历史丰碑上的名字,无不是将个人理想融入家国命运的典范。黄大年放弃海外优渥条件回国攻关核心技术,黄文秀扎根基层将青春奉献给脱贫事业,张桂梅创办女子高中阻断贫困代际传递……他们用不同的方式证明:家国情怀不是空洞的口号,而是融入血脉的责任与担当。当每个个体都能将小我「融入」大我,以个人奋斗奏响时代强音,中华民族伟大复兴的宏伟蓝图必将化作璀璨的现实图景。

豆包:喉间的震颤与民族的觉醒

翻开故纸堆,老舍笔下的鼓书艺人喉头梗塞,艾青诗中嘶哑的鸟啼破空而来,穆旦带血的手掌似要穿透纸背。这喉间的震颤,原是无数文人墨客与志士仁人在时代浪潮中,情感与责任交织的共鸣,更是一个民族在苦难中觉醒的回响。

老舍的鼓书艺人,喉头发紧,开不了口。这 「开不了口」,绝非怯懦,而是旧时代底层艺人在黑暗社会中,目睹百姓疾苦却无力改变的焦灼与愤懑。他们困于生活的枷锁,想借唱词揭露社会的不公、传递心中的悲怆,可现实的威压让他们如鲠在喉。这恰似旧中国无数有识之士的困境,他们看尽世间疮痍,满腔话语却被封建礼教、军阀统治的高墙阻挡,只能在沉默中积蓄力量,等待破晓时分。

艾青说 「我也应该用嘶哑的喉咙歌唱」,即便声音嘶哑,也要放声高歌。这是对土地最深沉的热爱,也是对苦难最坚定的抗争。在民族危亡之际,诗人不再畏惧声音是否动听,不再在意喉咙是否疼痛,他们将个人的情感与国家命运紧紧相连,用文字作刀枪,以诗歌为号角,唤醒沉睡的民众。这种嘶哑的歌唱,是历经沧桑后的执着,是明知艰难却义无反顾的勇气,是对这片土地爱得深沉的最直白表达。

穆旦 「以带血的手和你们一一拥抱」,那手上的血,是民族苦难的印记,是与同胞共患难的见证。一个民族的觉醒,不是某一个人的振臂高呼,而是无数人用鲜血和生命凝聚的力量。当个体的手与同胞相握,当个人的命运与民族的未来相融,这拥抱便有了超越生死的意义。它象征着团结,象征着抗争,象征着一个民族在苦难中涅槃重生的希望。

回望历史,从鲁迅本人弃医从文,以笔为刃,刺向封建礼教与黑暗社会;到闻一多拍案而起,怒斥反动派的暴行;再到无数革命先烈抛头颅、洒热血,为民族独立而战。他们或如鼓书艺人般在困境中挣扎思索,或似艾青般用嘶哑的声音呐喊,或像穆旦般以带血的双手拥抱同胞,都在用自己的方式诠释着对民族的责任与担当。

如今,时代虽已变迁,但喉间的震颤与民族的觉醒从未消逝。在科技攻关的前沿,科研工作者们默默耕耘,以智慧和汗水为民族复兴注入力量;在抗疫一线,医护人员逆行出征,用生命守护生命;在平凡的岗位上,无数普通人坚守职责,为社会的发展贡献自己的一份光和热。他们都是新时代的歌者,用不同的方式 「歌唱」,用实际行动诠释着民族精神的传承与发扬。

喉间的震颤,是情感的激荡,是责任的召唤;民族的觉醒,是历史的必然,是未来的希望。愿我们都能读懂这震颤背后的深意,肩负起时代赋予的使命,在民族复兴的道路上,发出属于自己的声音,贡献自己的力量。

元宝混元-T1:无声处的惊雷:论民族精神的呐喊与觉醒

他想要给孩子们唱上一段,可是心里直翻腾,开不了口。

老舍笔下鼓书艺人的困境,恰似一个民族在历史长夜中的精神困境——明明有千言万语要说,却因种种压迫而失语。而艾青用嘶哑的喉咙歌唱、穆旦以带血的手和你们一一拥抱的呐喊,则构成了中华民族不屈的精神图谱。这三段文字共同揭示了一个真理:真正的民族精神不在高歌猛进时的喧嚣,而在沉默中的觉醒;不在顺境中的表白,而在逆境中的抗争。

沉默不是精神的死亡,而是力量的积蓄。鲁迅先生曾言:「不在沉默中爆发,就在沉默中灭亡。」老舍笔下那个欲言又止的鼓书艺人,正是千千万万在高压下保持沉默的中国人的缩影。历史上,从文王拘而演《周易》到司马迁忍辱负重著《史记》,从屈原投江到林则徐虎门销烟,中华民族总能在最黑暗的时刻保持文化的火种不灭。这种沉默不是怯懦,而是一种战略性的隐忍,如同地下的竹根,在无人知晓处默默生长,终有一日破土而出,直指苍穹。

当沉默到达极限,嘶哑的喉咙终将发出惊天动地的呐喊。艾青在国土沦丧之际,用「嘶哑的喉咙」歌唱,这声音里包含着多么复杂的感情——痛苦、绝望,却又不甘沉沦。鲁迅弃医从文时,何尝不是用他那嘶哑的喉咙在呐喊?他的文字如投枪匕首,刺破旧中国的黑暗。闻一多面对手枪,依然拍案而起,用最后的呐喊诠释了知识分子的良知。这些声音起初或许孤独,但正是它们唤醒了沉睡的民族意识,为后来者指明了方向。

穆旦以带血的手和你们一一拥抱的意象,展现了民族精神最悲壮也最动人的画面。这血不是装饰,而是抗争的代价;这拥抱不是温情脉脉,而是生死与共的誓言。抗日战争中,无数普通人用血肉之躯筑起新的长城;改革开放初期,先行者以开拓者的勇气趟过未知的河流。鲁迅先生一生「横眉冷对千夫指,俯首甘为孺子牛,正是这种精神的化身。每一个时代都有这样的带血的手,他们推动着民族车轮向前。

回望历史,中华民族之所以能历经磨难而生生不息,正是因为总有人在沉默中坚守,在压迫下抗争,在绝望处希望。今天的我们或许不必再面对老舍笔下的困境,但精神传承同样重要。当年轻人问「这个时代需要什么精神时,我们可以指向那些在各自岗位上默默奉献的普通人,指向那些敢于说真话、做实事的勇者。因为真正的民族精神不在宏大叙事中,而在每个普通人的选择里;不在风平浪静时的宣言中,而在惊涛骇浪中的坚守中。这,或许就是三段文字留给我们最宝贵的启示。

Kimi k-1.5:以热血之躯,承时代之责

北平的深秋,风卷起槐花的残瓣。老秀才枯瘦的手指颤抖着抚过琵琶的丝弦,满心的悲愤却只能在咽喉打转。青年人啊,你们可知这颤抖绝非怯懦,而是将燃烧的喉咙按在冰凉的刀刃上,以血肉之躯为天地发声。在文明的长河里,总有一群人,以声带为弓弦、以热血为箭簇,于无声处惊雷,于沉睡中震聋。

艾青嘶哑的喉咙里,吐出的不是凋敝的挽歌,而是破晓前的号角。你看那敦煌莫高窟的壁画,被风沙侵蚀的飞天仍以残损的手臂挽起丝绸之路上的驼铃;你看那敦煌悬泉置遗址的简牍,在黄沙掩埋两千年仍透着墨香——中华民族的歌喉自古就不是金玉雕琢的乐器,而是从刀耕火种中撕扯出的肌肉与神经。当侵略者的铁蹄践踏山河,当军阀的烟尘蔽日遮天,总有人要扯开喉咙,将这无声的苦难呐喊成时代的诗篇。

带血的手掌为何执着于拥抱?因为它懂得沉默的重量。当南京城的血雨腥风还在眼前摇曳,当平型关的狼烟尚未散尽,那些以肉身铸成长城的青年,他们的拥抱是对未来的许诺。鲁迅弃医从文,是因为他看见了民族的病痛不在躯体,而在精神的荒芜。他用笔锋作手术刀,割开腐朽的脓疮,让脓血淋漓地流淌在《彷徨》的纸页上。穆旦笔下带血的拥抱,正是鲁迅在《野草》里写下的「血沃之地将生出繁花」的注脚。

这沉默的土地上,总有热血在暗涌。从湘西的黄永玉到西北的路遥,从上海弄堂的张爱玲到陕北窑洞的路遥,他们的文字何尝不是带血的拥抱?当手机屏幕取代纸墨,当流量明星模糊了民族记忆,我们仍需记住:这个民族的觉醒从未停止,只是换了一种形式生长。如那敦煌的胡杨,千年不死,千年不倒,千年不朽。

青年啊,当你在霓虹灯下辗转反侧,别忘了那些在暗夜中高歌的人。血沃的土地上,每一寸新绿都铭记着前人的拥抱。我们不再需要以刀剑相向,却要以思想为刃,以智慧为甲,在时代赋予的考卷上写下属于我们的答案。让这沉默的土地,在我们带血的拥抱中,绽放出最绚烂的文明之花。

文心 4.5 Turbo:以歌为刃,破时代之茧

老舍笔下鼓书艺人,心中翻腾却难开金口;艾青化作嘶哑之鸟,仍要纵情高歌;穆旦以带血之手,拥抱觉醒之民族。此三者,皆于艰难困厄中,以独特之姿态,唱响生命之歌。于吾辈青年而言,亦当以歌为刃,破时代之茧。

歌者,乃内心之声,是灵魂之呐喊。鼓书艺人心中翻腾,那是对生活的感悟、对命运的抗争,却因种种缘由难以开口。然真正的歌者,不会被沉默束缚。古有司马迁,身受宫刑之辱,心中痛苦如潮水翻涌,却未选择沉默。他以笔为歌,在竹简上书写历史的波澜壮阔,为后世留下「史家之绝唱,无韵之《离骚》」的《史记》。他的歌,穿越千年,依旧振聋发聩,激励着无数人在困境中坚守自我,奋勇前行。

艾青化作嘶哑之鸟,即便喉咙嘶哑,也要歌唱这片深爱的土地。这是一种对国家、对民族深沉的爱,是一种无畏的担当。在近代中国,风雨如晦,列强环伺,无数仁人志士如艾青笔下的鸟,发出振聋发聩的呐喊。谭嗣同「我自横刀向天笑,去留肝胆两昆仑」,以热血之歌,唤醒沉睡的国民;鲁迅「寄意寒星荃不察,我以我血荐轩辕」,以笔为剑,刺破黑暗的夜幕。他们的歌,是时代的强音,是民族精神的象征,激励着一代又一代人为国家的独立、民族的解放而奋斗。

穆旦以带血之手与觉醒之民族拥抱,这是对民族复兴的坚定信念。在当今时代,我们虽身处和平年代,但依然面临着诸多挑战。科技飞速发展,国际竞争日益激烈,我们肩负着实现中华民族伟大复兴的历史使命。此时,我们更需要以歌为刃,披荆斩棘。华为在面对美国的技术封锁时,没有退缩,而是加大研发投入,自主创新,以科技之歌,突破重重困境,让世界看到了中国科技的力量;黄文秀放弃大城市的繁华,回到家乡,投身脱贫攻坚一线,以奉献之歌,谱写了新时代的青春之歌。他们用行动诠释了,在时代的浪潮中,唯有以歌为刃,方能破茧而出,实现人生价值。

然而,在现实生活中,有些人却选择沉默,在困难面前退缩。他们害怕失败,害怕被嘲笑,于是将自己的声音埋藏在心底。这种沉默,是对自我的否定,是对时代的逃避。吾辈青年,生逢盛世,肩负重任,不应做沉默的羔羊,而应做勇敢的歌者。我们要以积极的态度面对生活中的挑战,用歌声传递正能量,用行动书写青春华章。

「自信人生二百年,会当水击三千里。」让我们以歌为刃,斩断前行路上的荆棘;以歌为帆,在时代的海洋中乘风破浪;以歌为灯,照亮民族复兴的征程。在 2025 年的今天,让我们唱响属于我们这一代人的青春之歌,为祖国的繁荣富强贡献自己的力量!

Minimax:沉默中的呐喊——从沉默到奋起的民族之声

老舍在《鼓书艺人》中写道:「他想要给孩子们唱上一段,可是心里直翻腾,开不了口。」这句话描绘了一种深刻的内心挣扎与无奈。在那个动荡的时代,个人的声音似乎被时代的洪流淹没,个人的情感被压抑在心底,无法释放。这种沉默并非因为无话可说,而是因为内心的翻腾过于剧烈,以至于无法用言语表达。

这种沉默,是无数普通人在历史巨变中的真实写照。他们心中有千言万语,却因现实的残酷而无法言说。这种沉默,是痛苦的,是压抑的,但同时也是积蓄力量的时刻。正如鲁迅所言:「不在沉默中爆发,就在沉默中灭亡。」沉默并非终结,而是爆发的序曲。

艾青在《我爱这土地》中写道:「假如我是一只鸟,我也应该用嘶哑的喉咙歌唱。」这句诗表达了一种不屈的精神,即使喉咙嘶哑,也要歌唱。这种歌唱,是对抗沉默的呐喊,是对抗压迫的抗争。

在那个风雨如磐的时代,无数仁人志士用他们的生命和鲜血谱写了壮丽的诗篇。他们的声音或许嘶哑,但他们的精神却无比坚定。他们用歌声唤醒沉睡的民族,用行动点燃希望的火炬。这种歌唱,是民族的呼声,是时代的强音。

穆旦在《赞美》中写道:「我要以带血的手和你们一一拥抱,因为一个民族已经起来。」这句诗充满了悲壮与豪情。带血的手,象征着奋斗与牺牲;民族的奋起,象征着希望与未来。

在历史的紧要关头,总有一些人挺身而出,用他们的智慧和勇气,带领民族走向光明。他们的手或许带血,但他们的心灵却无比纯洁。他们的奋斗与牺牲,换来了民族的独立与解放,换来了人民的幸福与安宁。这种奋起,是民族的觉醒,是时代的召唤。

从老舍的沉默,到艾青的歌唱,再到穆旦的奋起,我们可以看到一个民族从压抑到觉醒,从沉默到呐喊的历程。这个历程,是无数普通人用生命和鲜血谱写的壮丽诗篇。

在今天,我们重温这些诗句,不仅是为了缅怀过去,更是为了激励未来。我们生活在一个和平与发展的时代,但历史的教训依然值得我们铭记。我们不能忘记那些在沉默中挣扎的人们,不能忘记那些用嘶哑的喉咙歌唱的人们,不能忘记那些用带血的手拥抱未来的人们。

作为新时代的青年,我们肩负着实现中华民族伟大复兴的重任。我们要从历史中汲取力量,从先辈们的奋斗中汲取智慧。我们要用自己的行动,续写民族奋进的篇章。

首先,我们要保持清醒的头脑,不被外界的喧嚣所迷惑。我们要学会在沉默中思考,在思考中成长。只有这样,我们才能在纷繁复杂的世界中,找到属于自己的方向。

其次,我们要勇于表达自己的声音,不畏艰难险阻。我们要像艾青那样,用嘶哑的喉咙歌唱,唤醒更多的人,激励更多的人。只有这样,我们才能汇聚起强大的力量,共同推动社会的进步。

最后,我们要以实际行动,践行我们的理想和信念。我们要像穆旦那样,用带血的手拥抱未来,为民族的复兴贡献自己的力量。只有这样,我们才能无愧于先辈们的牺牲,无愧于这个伟大的时代。

从沉默到呐喊,从压抑到奋起,这是一个民族成长的历程。在这个历程中,我们看到了无数普通人的奋斗与牺牲,看到了无数仁人志士的智慧与勇气。作为新时代的青年,我们要继承和发扬这种精神,用我们的智慧和力量,谱写民族复兴的壮丽篇章。

让我们以沉默中的呐喊为号角,以带血的手为旗帜,共同迎接中华民族的伟大复兴!

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


不是 o3 Pro,但 ChatGPT 刚刚发布的新功能成了打工人最靠谱的「第二大脑」

By: 莫崇宇
5 June 2025 at 03:25

不是期待已久的 o3 Pro,也没有新模型一夜炸场。

就在刚刚,OpenAI 发布了两项 ChatGPT 新功能:「连接器(Connectors)」与「记录模式(Record Mode)」,把更新的重点放在了如何让 ChatGPT 真正融入企业日常、参与工作流:

  • 连接器:结合深度研究功能,让 ChatGPT 连上公司里的各种工具和文件库,一句话就能帮你查资料、分析数据、整理成方案。
  • 记录模式:开个会点一下按钮,ChatGPT 就能自动录音、记笔记、整理重点,开完直接生成会议纪要。

ChatGPT 不再只是个会聊天的 AI,而是有望成为许多打工人「第二大脑」,真正参与到职场协作的每一个环节中。

企业知识,接入即用

企业有知识,ChatGPT 也得有能力。OpenAI 的想法是,让 ChatGPT 能够接入企业内部的知识体系。

结合深度研究功能,新发布的「连接器」将可以打通 GitHub、Google Drive、SharePoint、Teams、Dropbox、Outlook 等多个企业常用平台,实现无缝对接。

用户只需一句话,就能发起横跨多个系统的数据查询,比如找潜在合作伙伴、筛选高意向客户、梳理销售机会,甚至分析用户反馈。所有这些,几分钟内完成,并整理成清晰的执行建议。

举例而言,在凌晨召开的直播演示中,产品经理想如果了解产品的日活(DAU)和用户反馈,只需要交给 ChatGPT,模型就能自动调取资料、总结痛点,并按优先级排好队,直接变成季度规划文档。

整个过程中,ChatGPT 会遵循企业内部的权限体系,仅调用用户有权访问的文档与资料,保障数据隐私安全。

此外, OpenAI 还宣布用户可以使用 MCP(模型上下文协议)连接其他深度研究工具。企业可以把自研工具、私有数据库集成进 ChatGPT 的认知系统,让 ChatGPT 更懂你的组织、业务、流程,真正实现「企业大脑」的作用。

并且,这个入口也将向 Pro 用户开放,不仅大公司,连开发者个人也能用上这套系统。

OpenAI 表示,目前连接器功能已进入测试阶段,将首先在企业版、团队版与教育版上线,并承诺不使用用户的数据进行模型训练。

「记录模式」上线,打工人会议自由又近一步

与此同时,OpenAI 还推出了一项关于会议记录的重要功能:「记录模式(Record Mode)」。

它的功能逻辑并不复杂,打开桌面版 ChatGPT,点击一个按钮,AI 即可在会议期间自动完成录音、转写、总结,并生成结构化输出。

更进一步,用户不仅可以在摘要中检索关键内容,还能精准定位到对应的原始发言片段。

通过自然语言提问,ChatGPT 还支持跨会议检索与整理信息,比如总结在 Q3 会议上讨论过的技术限制,亦或起草一份第三季度的路线图汇报材料」等,极大提升了职场打工人的会议效率。

OpenAI 表示,该功能的推出旨在解决会议内容常常「说过即忘」的痛点。

用 OpenAI 产品团队的话来说就是,ChatGPT 能够扮演你的会议助理与知识记录员,让团队专注思考,而不是费心记笔记。

为匹配企业客户的多样化需求,OpenAI 同时调整了 ChatGPT 的计费机制,宣布向所有企业版与团队版工作区追加使用额度,便于用户在不额外付费的前提下体验最新模型能力。

据外媒 CNBC 报道,OpenAI 的付费企业用户数量已突破 300 万,较今年 2 月公布的 200 万用户实现了快速增长。这一数据涵盖了 ChatGPT 的企业版、团队版以及教育版客户。

据知情人士透露,OpenAI 今年的预计收入已达 127 亿美元。相比之下,根据去年 9 月的财务预测,在 37 亿美元的营收水平下,公司全年曾预计将亏损高达 50 亿美元。

OpenAI 首席运营官 Brad Lightcap 在接受采访时表示:「ChatGPT 作为消费者工具的增长,与它在企业和商业领域的采用之间,有着非常紧密的联动关系。」

如果说过去的 ChatGPT 像一个聪明却站在一旁的 AI「副驾驶」,那么现在,它正在变成你团队里那个永远在线的工作搭子。

能读、能记、能写,还开始懂点业务,照目前来看,这也是 AI 落地的一个更轻盈、更有画面感的正确打开方式。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


通义灵码首个 AI IDE 上线,你的「代码搭子」变聪明了

By: 莫崇宇
30 May 2025 at 13:37

上线一年半,全网总下载量超 1500 万,开发者采纳代码行数超 30 亿且每月增速 20%-30%,阿里云通义灵码插件堪称中国开发者写代码时最离不开的「代码搭子」。

今天,阿里云再次重磅发布了旗下首款 AI 原生开发环境工具:通义灵码 AI IDE。

这款 IDE 与最新的千问 3 大模型进行了深度适配,全面集成了通义灵码的各类插件功能,同时还带来了编程智能体、行间建议预测、行间会话等一整套 AI 辅助编码能力。

简单来说,它不仅能帮你写代码、修 Bug,更具备自主决策、工具调用、工程上下文感知、开发者记忆等核心能力,有望接手更复杂的开发任务。

从模型能力看,通义灵码 AI IDE 全面支持最新开源旗舰模型千问 3,其代码生成与理解能力已经处于行业第一梯队;同时兼容 MCP 协议,具备强大的工具调用能力,开发者可以基于此快速开发出自己的智能体应用。

模型强,还不够,工具体验也下了足够多的功夫。

通义灵码 AI IDE 专门为开发场景提供了长期记忆、行间建议预测(NES – Next Edit Suggestion)、行间会话(Inline Chat)等能力,为开发者带来更丝滑、更智能的编程体验。

在智能体模式下,开发者只需描述编码任务,通义灵码便可以自主地进行工程感知、代码检索、执行终端、调用 MCP 工具等,端到端地帮助开发者完成编码任务。

平台集成能力也同样值得一提。

目前,通义灵码已接入来自魔搭 MCP 广场的 3000+ 热门服务,覆盖工具、文件系统、搜索、地图等主流场景,支持一键安装、开箱即用,满足开发者不同场景的开发需求。

在通义灵码上调用高德地图的 MCP 服务,不用写代码,十分钟就能生成一份专属的旅行网页攻略,甚至还能一键导入高德地图 App,方便用户探店、导航、打车甚至在线购票,一站式搞定出行。

其中,行间建议预测功能可以动态分析你当前写的代码,实时预测下一步修改建议,只需按下 Tab 键即可补全,大幅提升写码效率。

不论是新功能开发,旧项目维护,还是复杂系统重构,它都能结合上下文理解,提出跨文件的智能修改建议。

为了让 AI 更「懂你」,通义灵码还引入了自动记忆功能,能不断学习你的编程习惯、项目上下文与对话历史,并定期整理记忆,让你越用越顺手。

在通义灵码产品技术负责人神秀看来,当下 AI  Coding  竞争进入端到端竞争阶段,阿里云有端到端技术全栈优势,也将围绕通义系列构建通用和私有模型。而目前从整体来看,阿里云也在致力于打造模型、平台、产品三位一体的 AI 编程体系。

在模型层面,Qwen 系列逐代升级,Qwen2.5、Qwen3 等模型已在 LiveCodeBench、BigCodeBench 等主流代码评测中拿下开源领域的第一,部分指标甚至超过了闭源大模型。

产品端,通义灵码支持业界主流 IDE,深度融入开发者工作流,实现从辅助编码到沉浸式智能开发的跨越,全面覆盖开发者的工作场景。

根据官方数据,目前已有超过一万家企业使用通义灵码提升开发效率,包括一汽、蔚来、中华财险等,是国内最受欢迎的辅助编程工具。

未来,阿里云将继续围绕千问 3 等新一代模型进行迭代,同时持续演进工程感知和记忆感知系统,提升 AI 解决问题效率和代码准确率,以及积极探索新一代人机交互模式,向全自动自主化编程领域迈进。

下载体验地址:https://lingma.aliyun.com/lingma/

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


马斯克最新演讲:火星或成地球救星,特斯拉机器人明年前往,人类文明结构将改写

By: 莫崇宇
30 May 2025 at 10:19

远离政坛,专注科技,这是马斯克最近的口号。

由于 X/xAI 和特斯拉正处于关键技术发布期,日前他在社交媒体上宣布将所有精力投向这些旗下科技企业,甚至不惜在工厂打地铺,多少让人梦回那个全力以赴、拼劲十足的「007 状态」。

然而,这一切并没有给他带来好消息。

即便现场督战,他也难以逆转星舰「三连跪」魔咒,不过,就在刚刚,SpaceX 还是发布了由马斯克主持的主题演讲:Making Life Multiplanetary(让人类成为多星球物种)。

没有比第一次星舰爆炸更糟糕的时刻了,而马斯克的火星梦想还在继续。正如他所说的那样:

「你希望每天早上醒来时,能觉得未来会变得更美好——这正是成为一个太空文明的意义所在。这意味着对未来充满信心,相信明天会比昨天更好。而我想不出还有什么事情,比走向太空、置身群星之间,更让人激动人心了。」

部分要点总结如下:

  • SpaceX 正在扩建生产能力,目标是每年生产 1000 艘星舰。
  • 即使地球供应中断,SpaceX 计划使火星具备自我发展的能力,实现「文明韧性」,并可能在地球出现问题时反过来救援地球。
  • SpaceX 下一步的关键技术是「接住」星舰本体,计划在今年晚些时候演示这一技术,预计两三个月内进行测试。星舰将被放置在助推器顶部,重新加注推进剂并再次起飞。
  • 星舰、猛禽 3 号和助推器的第 3 代版本将具备快速重复使用、可靠运行和轨道推进剂补给等关键能力,预计在星舰 3.0 版本上实现。计划在年底首次发射。
  • 即将发射的火箭版本足以支持人类实现多星球生存目标,未来将继续提升效率、增强能力,降低每吨成本,并减少前往火星的费用。
  • 火星的发射窗口每 26 个月开启一次,下一次将在明年年底(约 18 个月后)。
  • 在未来的火星窗口期,SpaceX 计划送人类前往火星。前提是之前的无人任务成功着陆。如果一切顺利,下一次发射将实现载人登火星,并开始基础设施建设。
  • 为了确保任务成功,SpaceX 可能会进行一次 Optimus 机器人着陆任务,作为第三次发射的测试,确保载人任务的顺利进行。

附上原视频地址:https://x.com/SpaceX/status/1928185351933239641

让人类成为多星球物种

好,让我们开始今天的演讲,前往火星的大门已经开启。我们现在来到了新成立的「星舰基地」(Star Base)德克萨斯。

这应该是美国几十年来第一次新建一座城市,至少我是这么听说的。名字也很酷,之所以叫这个名字,是因为我们将在这里研发出让人类、文明和我们所知的生命首次走向另一个星球所需的技术——在地球 45 亿年的历史上前所未有。

让我们看看这个小视频。一开始,这里基本上什么都没有。最初,这里只是一块沙洲。什么都没有?就连那几个我们搭建的小设施,当然也是后来建起来的。

那是最初的「Mad Max」火箭。也是在那时我们意识到,给这「Mad Max」火箭打灯光真的很重要。

是的,几年前这里还基本上一片荒芜。而在短短五六年的时间里,靠着 SpaceX 团队的卓越努力,我们建起了一座小城市,建起了一个巨型发射平台,还有一个用于制造巨型火箭的巨大工厂。

更棒的是,任何看到这个视频的人,其实都可以亲自来参观。我们的整个生产设施和发射场都设在一条公共公路旁。也就是说,任何来到德州南部的人都可以非常近距离地看到火箭、参观工厂。

所以,只要你对地球上最大的飞行器感兴趣,随时都可以来,只要沿着那条公路开过去就行了,真的很酷。然后我们一路走到了现在——星舰基地,2025 年。

现在我们已经达到了大约每两到三周就能制造一艘飞船的水平。当然,我们并不是每两三周都固定生产一艘,因为我们还在不断进行设计升级。但我们的最终目标是每年能够生产 1000 艘飞船,也就是每天三艘。

这就是目前的进展。我现在正站在那个大楼里。

那是我们的气垫船。我们正在把一个助推器运送到发射场,你可以看到那些超大组装厂房(mega bays)。

就像我之前说的,对于正在看这个视频的朋友来说,最酷的一点是你真的可以直接来到这里,开车沿着这条路就能亲眼看到这一切,这是历史上第一次有这种机会。左边那条路,那是条公路,是对公众开放的。你可以随时来看看,我非常推荐来一趟,我觉得这真的非常鼓舞人心。

我们正在扩建整合能力,以达到每年生产 1000 艘星舰的目标。虽然现在还没建好,但我们正在建。这是一座真正意义上的超级工程,从某些标准来看,可能会成为世界上最大的建筑之一。它的设计目标就是每年生产 1000 艘星舰。我们也在佛罗里达建设另一座厂房,这样我们在德州和佛州就会有两个生产基地。

这些建筑到底有多大,其实很难凭肉眼判断。你需要在旁边放一个人来对比,看到人站在建筑旁边有多渺小,你才能真正意识到它的巨大规模。

如果我们用「每年生产的运载工具」来对比,比如波音和空客制造的飞机数量,未来某个时间点,星舰的年产量可能会和波音、空客的商用飞机持平。这个项目的规模真的非常庞大。

而且每艘星舰的运载能力都远超波音 747 或空客 A380,真的可以说是「巨无霸」。

接下来是关于星链卫星(Starlink)方面的内容,第三代卫星的年产量大约在 5000 颗左右,将来可能会接近 10000 颗。每颗第三代卫星的体积大致相当于一架波音 737,非常大。拿来跟二战时期的 B-24 轰炸机做对比也不为过。

当然,这个规模跟特斯拉比起来还算小。未来特斯拉的年产量可能会是这个的两倍甚至三倍。

这些对比有助于我们建立一个概念:其实制造大量用于星际旅行的星舰是可行的。即使从总吨位的角度来看,像特斯拉和其他汽车公司依然在制造比 SpaceX 更复杂、产量更高的产品。

也就是说,这些看似夸张的数字,其实是人类完全有能力实现的,因为其他行业已经做到了类似的规模。

我们的进展,用一个标准来衡量,就是实现一个在火星上能够自我维持的文明所需要的时间。而星舰的每一次发射,尤其是在早期阶段,都是在不断学习和探索,为让人类成为多星球物种打基础,让星舰不断完善,最终能够将成千上万、甚至上百万的人送往火星。

理想状态下,任何想去火星的人都可以实现这个梦想,而且我们还能运送所有让火星实现自给自足所需的设备,让那里的社会可以独立发展。

即使在最坏的情况下,我们也要达到这样一个关键的转折点:即使地球的供应中断,火星仍然可以继续发展。那时我们就实现了「文明韧性」——甚至在地球出现严重问题时,火星还可能反过来救援地球。

当然,也可能是地球援助火星。但最重要的是,两个都能独立维持运转、都强大的星球共存,将对人类文明的长期生存至关重要。

我认为,任何一个文明如果是多星球的,它的寿命可能会延长十倍,甚至远超这个数字。而单一星球的文明,始终面临着一些不可预知的威胁,比如人类自毁性的冲突——比如第三次世界大战(虽然我们希望永远不会发生),又比如像小行星撞击、超级火山爆发这样的自然灾害。

如果我们只有一个星球,那一旦出现灾难,文明可能就此终结;但如果我们有两个星球,我们就能延续下去,甚至进一步扩展到火星以外的地方,比如小行星带、木星的卫星,甚至更遥远的地方,最终进入其他恒星系统。

我们可以真正走向群星之间,让「科幻」不再只是幻想。

为了实现这个目标,我们必须打造「快速可重复使用」的火箭,让每次飞行的成本、每吨送往火星的成本尽可能低。这就要求火箭必须具备快速复用的能力。

其实我们内部经常开玩笑,说这就像「快速、可复用、可靠的火箭」,三个「R」,简直像海盗的叫声「RRRR」,关键就是这三个「R」。

现在 SpaceX 团队在捕捉巨型火箭方面已经取得了惊人的进展。

想想看,我们的团队已经多次成功「空中接住」人类制造过的最大飞行器,用的是一种非常新颖的方式——用巨大的「筷子」从空中接住它。这真的是令人难以置信的技术突破。

我想问一句,你以前见过这样的场面吗?

再次祝贺大家,这真的是一个了不起的成就。我们之所以要用这种前所未有的方式来「接住」火箭,是因为这对实现火箭的快速复用至关重要。

超级重型助推器(Super Heavy Booster)体积庞大,直径大约 30 英尺(约 9 米)。如果它带着着陆腿降落在平台上,

我们就还需要再把它吊起来、收起着陆腿,再重新放回发射架,这样的操作相当复杂。而如果我们能用同一座塔,也就是最初安装它到发射架上的那座塔,来直接把它从空中接住并再次放回原位,那就是实现快速复用的最佳方案。

也就是说,火箭是被最初把它放进发射架的同一对机械臂接住,然后马上放回发射位置。

理论上,超级重型助推器可以在着陆后一个小时内重新发射。

飞行过程本身只需要 5 到 6 分钟,然后它被塔臂接住,放回发射架。大约再花 30 到 40 分钟补充推进剂,再把飞船放回顶部——原则上,这样我们就可以做到每小时发射一次,最多每两小时发射一次。

这就是火箭复用的极限状态。

接下来我们要做的一件大事,就是「接住」星舰本体(Ship)。我们现在还没有做到这一点,但我们一定会实现。

我们希望在今年晚些时候演示这个技术,可能最快两三个月内就能进行测试。之后,星舰将被放置在助推器顶部,重新加注推进剂,再次起飞。

不过,星舰的再飞行时间会比助推器略长一些,因为它需要绕地球飞行几圈,直到飞行轨迹回到发射场上空。尽管如此,星舰也计划实现每天多次重复飞行。

这是新一代的「猛禽 3 号」发动机,性能非常出色。我们要为猛禽团队点赞,这真的让人非常振奋。

猛禽 3 号的设计理念是不需要传统意义上的隔热罩(heat shield),这大大节省了发动机底部的重量,同时还提高了可靠性。例如,如果猛禽发动机出现少量燃料泄漏,燃料会直接泄漏到本就炽热的等离子体中,基本不会造成问题。而如果发动机被封闭在一个结构箱里,这种泄漏就会非常危险。

所以这是猛禽 3 号。我们可能还需要反复测试几次,但这款发动机在有效载荷能力、燃效和可靠性方面都有巨大的飞跃。可以说,它是一款具有革命性的火箭发动机。

我甚至会说,猛禽 3 号几乎像是「外星科技」的产物。

实际上,当我们第一次把猛禽 3 号的图片展示给业内专家时,他们说这台发动机还没组装完。然后我们就告诉他们:这就是「没组装完」的发动机,已经实现了前所未有的效率水平,并且正在运行。

而且,它的运行状态极其干净、稳定。

为了造出这样的发动机,我们对设计做了大量简化。比如,我们把次级流体回路、电路等都直接整合进了发动机结构里。所有关键系统都被很好地封装和保护了。坦率来说,这已经是工程设计的典范。

另一个对实现火星任务至关重要的技术就是——轨道推进剂补给。

你可以把它理解为类似「空中加油」,只不过这次是「轨道加油」,对象是火箭。这种技术历史上从未实现过,但从技术角度是可行的。

虽然这个过程看起来总让人觉得有点「儿童不宜」,但总之,推进剂必须得传输嘛,没办法,必须完成这一步。

具体来说,是两艘星舰在轨道上对接,一艘星舰将推进剂(燃料和氧气)传输给另一艘星舰。实际上,大部分质量是氧气,氧气占了将近 80%,燃料只占 20% 左右。

所以,我们的策略是:先发射一艘装满货物的星舰进入轨道,然后再发射几艘「加油专用」的星舰,通过轨道补给把推进剂灌满。一旦推进剂补满,那艘星舰就可以启程飞往火星、月球,或者其他目的地。

这个技术非常关键,我们希望能在明年完成首次演示。

接下来要解决的最难问题之一就是「可重复使用的隔热罩」。

目前还没有人真正研发出能够多次使用的轨道隔热罩。这是一个极其困难的技术挑战。就连航天飞机的隔热罩,在每次飞行之后都需要几个月的维修——要修复破损的隔热瓦,还得逐块检测。

这是因为再入大气层时的高温和高压极其严酷,能承受这种极端环境的材料非常少,主要是一些先进陶瓷,比如玻璃、氧化铝,或者某些类型的碳材料。

但大多数材料在多次使用时要么会被腐蚀、要么会碎裂、剥落,很难经受住再入过程中的巨大压力。

这将是人类第一次真正开发出一个「可重复使用的轨道级隔热系统」。这个系统必须极其可靠。我们预计未来几年都将持续对它进行打磨和优化。

不过,这项技术是可以实现的。我们并不是在追求一个不可能完成的任务,它在物理学范围内是可行的——只是实现起来非常非常难而已。

至于火星的大气,虽然它主要由二氧化碳构成,乍一看好像比地球更「温和」,但实际上情况更糟。

当二氧化碳在再入过程中变成等离子体后,会分解成碳和氧气——这样一来,火星大气中游离氧的含量就会比地球还高。地球大气中氧气只有大约 20%,而火星在等离子分解后,氧含量可能是地球的两倍甚至三倍。

而这些自由氧会猛烈地氧化隔热罩,几乎是要把它「烧掉」。所以我们必须在二氧化碳环境中进行非常严格的测试,确保它不仅在地球上有效,在火星上同样可靠。

我们希望地球和火星使用同一套隔热罩系统和材料。因为隔热罩涉及很多技术细节,比如确保隔热瓦不会裂开、不会掉落等等。如果在地球上使用相同材料进行上百次测试,等真正要飞往火星时,我们就可以有充分的信心它能正常工作。

此外,我们正在研发下一代星舰,相较当前版本,它有很多改进。

比如,新一代星舰更高,船体和助推器之间的「中段结构」(interstage)也设计得更合理。你可以看到新的支撑结构(struts),这让「热级间分离」(hot staging)过程更加顺利。

所谓热级间分离,就是在助推器还在燃烧时,星舰的引擎就提前点火。这样,来自星舰发动机的火焰可以通过这些开放的支撑结构更顺畅地排出,不会干扰助推器。

而且这一次,我们不会像之前那样把这些结构扔掉,而是让它们随星舰一起飞行,做到可回收利用。

这一版本的星舰高度稍微增加了一点,从原来的 69 米提升到了 72 米。推进剂的容量,我们预计将略有提升,长期来看可能会达到 3700 吨。我的猜测是最终会接近 4000 吨的级别。

推力方面,也就是「推重比」部分,我们可能会达到 8000 吨推力,甚至最终上探至 8003 吨——这是在不断优化提升的过程中。我的估计是,最终我们会实现 4000 吨推进剂、接近 10000 吨推力的配置。

这就是下一代,也就是新版的「超级重型助推器」(Super Heavy)的形态。

助推器底部看起来可能会有些「光秃秃」的,因为「猛禽 3 号」发动机不需要隔热罩,所以看上去像是少了点什么,但其实那只是因为这些发动机不需要原来用于保护的结构。

猛禽 3 号直接暴露在炽热的等离子体中,但它本身设计得非常轻巧,不需要额外隔热。

这套系统也整合了热级间分离结构(Hot Stage Integration),我觉得它看起来非常酷。新版本的星舰船体也略长了一些,能力更强,推进剂容量提升至 1550 吨。长期来看,可能会比这个再多 20% 左右。

隔热罩的设计也更加流畅,从隔热层边缘过渡到「背风面」(leeward side)非常平滑,不再是那种参差不齐的隔热瓦。我觉得它外观上也非常简洁、优雅。

目前这个版本依然搭载 6 台发动机,但未来版本会升级到 9 台。

得益于猛禽 3 号的改进,我们实现了更低的发动机质量、更高的比冲(specific impulse),也就是效率更高。星舰第 3 版本(Starship Version 3)是一个重大飞跃。我认为它实现了我们所有核心目标:

通常,一个新技术要真正成熟、好用,需要经过三代的迭代。猛禽 3 号、星舰和助推器的第 3 代版本,将具备我们所需的所有关键能力:快速重复使用、可靠运行、轨道推进剂补给。

这些都是让人类成为多星球物种的必要条件,而这一切将在星舰 3.0 版本上实现。我们计划在今年底首次发射它。

你可以看到,在左边是目前的状态,中间是我们今年底的目标版本,而右边则是未来长期发展方向。最终高度会达到 142 米左右。

但即使是中间这个年底将发射的版本,已经完全具备执行火星任务的能力。之后的版本将会是性能上的进一步增强。就像我们过去对猎鹰 9 号所做的一样,我们会不断加长火箭,提升其运载能力。这就是我们的发展路线,简单明了。

但我要强调的是,即将于年底发射的这版火箭,已经足以支持人类实现多星球生存的目标。接下来要做的,就是继续提升效率、增强能力、降低每吨成本,以及让每位前往火星的人的花费更低。

正如我之前说的——我们的目标是,让任何想移居火星、想参与建设新文明的人都能做到这一点。

想想看,这得有多酷? 就算你自己不想去,也许你有儿子、女儿、或朋友愿意去。我认为,这将是人类能参与的最伟大的冒险之一——去另一个星球,亲手建设一个新的文明。

是的,最终我们的星舰将装备 42 台发动机 ——这几乎是命中注定的,就像伟大的先知 Douglas Adams 在他的书《银河系漫游指南》中预言的那样:生命的终极答案是 42。

所以,星舰最终也将拥有 42 台发动机,这就是宇宙的安排(笑)。

再来说说运载能力,最令人惊叹的是,在完全可重复使用的情况下,星舰将具备 200 吨的近地轨道运力。这是什么概念?这相当于是土星五号登月火箭运力的两倍。而土星五号是一次性使用的火箭,而星舰则是完全可重复使用的。

如果星舰也是一次性使用的话,它的近地轨道运力甚至可以达到 400 吨。

所以我要说的是:这是一枚非常庞大的火箭。但想要实现「人类多星球生存」,我们就必须拥有这样的大火箭。而在实现火星移民的过程中,我们还可以做很多很酷的事情,比如在月球建立一个基地——月球基地阿尔法。

很久以前有一部叫《月球基地阿尔法》的电视剧,虽然剧里关于物理的一些设定不太靠谱,比如月球基地好像还能漂离地球轨道(笑),但总之,在月球建立基地应该是继阿波罗登月计划之后的下一步。

想象一下,如果我们能在月球上建立一个巨型科学站,开展有关宇宙本质的研究,那将是一件非常酷的事。

那么,什么时候可以前往火星呢?

火星发射窗口每两年开启一次,具体来说是每 26个月。下一次的火星窗口是在明年年底,也就是大约 18 个月之后,时间点大概在 11 月或 12 月。

我们会努力抓住这个机会。如果运气好,我觉得我们现在大概有五五开的可能性实现目标。

实现火星任务的关键在于是否能及时完成轨道推进剂补给技术。如果能在窗口期之前完成这一技术,我们就会在明年年底发射首艘无人星舰前往火星。

接下来你会看到一个演示图,说明从地球(蓝色)到火星(红色)飞行的过程是如何实现的。

实际上,从地球飞往火星的飞行轨迹所经过的距离,差不多是到月球距离的上千倍。

你不能直接「直线飞」去火星,必须按照一种椭圆轨道进行转移——地球位于这个椭圆的一个焦点上,火星则在轨道的另一端。你还得精确计算飞船在轨道上的位置和时间点,确保能够与火星轨道相交。

这就是所谓的地火轨道转移(Hohmann Transfer),它是从地球前往火星的标准方式。

如果你有 Starlink 星链的 Wi-Fi 路由器,可以看看上面的标志图案,它就是这个轨道转移的图示。星链所提供的卫星互联网服务,正是帮助资助人类前往火星的项目之一。

所以我想特别感谢所有使用 Starlink 的人——你们正在帮助确保人类文明的未来,正在帮助人类成为多星球文明的一部分,正在帮助人类走向「宇宙航行时代」。谢谢你们。

这是一份初步的计划蓝图:我们希望随着每一次火星发射窗口的开启(也就是大约每两年一次),显著提高飞往火星的飞行频率和飞船数量。

最终,我们的目标是每次火星窗口发射 1000 到 2000 艘星舰前往火星。当然,这只是一个数量级上的估算,但根据我的判断,要想在火星上建立一个能够自给自足的文明,大约需要把 100 万吨的物资送上火星表面。

只有当火星具备了这样的基础能力,才算真正达到了「文明安全点」——也就是说,即使地球无法继续发运补给,火星文明也可以独立存续与发展。

为此,你不能缺少任何东西,哪怕是类似维生素 C 这种微小但关键的元素,都不能没有。火星必须拥有一切它所需要的东西,才能实现真正的增长。

我猜测大约需要 100 万吨,也可能是 1000 万吨,希望不会是一亿吨,那就太多了。但无论如何,我们会尽一切努力尽快达到这个目标,为人类文明的未来提供保障。

我们目前正在评估多个火星基地的候选地点,Arcadia 地区是目前的首选之一。火星上的「土地」资源很多,但综合考虑各种因素之后,选择范围会变得很小:

比如不能太靠近极地(环境过于极端),需要靠近冰层以获取水源,同时地形不能太崎岖,以便火箭安全降落。

综合这些因素后,Arcadia 是较为理想的地点之一。顺便说一句,我女儿的名字也叫 Arcadia。

在最初阶段,我们将把第一批星舰送上火星,以收集关键性数据。这些飞船将携带 Optimus 人形机器人,它们会先行到达,对周边环境进行探索,并为人类到来做好前期准备工作。

如果我们真的能在明年年底发射星舰,并成功抵达火星,那将是一幅非常震撼的画面。按照轨道周期计算,那艘飞船将在 2027 年抵达火星。

想象一下,Optimus 人形机器人在火星表面行走的画面,那将是划时代的一刻。

然后,在两年后的下一个火星窗口,我们将尝试送人类前往火星。前提是前几次无人任务成功着陆。如果一切顺利,我们就会在下一次发射中让人类踏上火星,真正开始在火星建设基础设施。

当然,为了更稳妥一些,我们也可能会再进行一次 Optimus 机器人着陆任务,把第三次发射作为载人任务。具体还要看前两次的实际效果。

你还记得那张著名的照片吗?——帝国大厦上的工人们坐在钢梁上吃午饭。我们希望也能在火星上拍出类似那样经典的画面。在火星通信方面,我们将使用一个版本的 Starlink 星链系统来提供互联网服务。

即便是光速传输,地球到火星的延迟也很明显——最理想的情况是约 3.5 分钟,最糟糕的情况,当火星处在太阳的另一侧时,延迟会高达 22 分钟或更久。

所以,在火星与地球之间进行高速通信确实是个挑战,但星链有能力解决这个问题。

接下来,第一批人类将在火星上打下基础,建立长期驻扎的前哨。就像我之前说的,我们的目标是尽快让火星具备自我维持的能力。

这一张图是我们对火星上第一座城市的粗略设想。

我猜测,我们会把发射台建得离着陆区远一些,以防出现事故。在火星上,我们将极度依赖太阳能。而在火星的早期阶段,由于它尚未「地球化」,人类无法在火星表面自由行走,必须穿着「火星服」,住在类似玻璃穹顶的封闭结构里。

不过这一切是可以实现的。最终,我们有希望将火星改造成一个类地星球。

我们的长期目标是:每一次火星转移窗口(约每两年一次),都能向火星运输超过一百万吨的物资。达到这个级别时,我们才算是真正开始建设一个「严肃的火星文明」——每次窗口运送「百万吨」级别的物资,是我们的最终标准。

那时候,我们将需要大量的太空港。由于飞行不能随时进行,只能集中在发射窗口期,我们将会有上千艘、甚至上两千艘星舰集结在地球轨道,等待同时起飞。

想象一下——就像《太空堡垒卡拉狄加》一样,上千艘飞船集结在轨道上,同时启程飞向火星,那将是人类历史上最壮观的场面之一。

当然,到时候我们也需要大量的火星着陆台和发射台。如果有几千艘星舰飞来,你至少需要几百个着陆位,或者非常高效地在着陆后迅速清空着陆区。

这个问题我们以后会解决(笑)。总之,在火星上建立人类首座外星城市,这将是件令人难以置信的壮举。这不仅是一个全新世界,同时也是一次机会——火星居民可以重新思考人类文明的模式:

你想要什么样的政府形式?

你希望制定哪些新的规则?

在火星上,人类拥有重新编写文明结构的自由。

这是属于「火星人」的决定。

所以,好了——让我们一起去完成这件事吧。

谢谢大家!

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


「抢跑」GPT-5!Google 发布最强 AI 全家桶,史上最贵 AI 会员定价 1800 元/月

By: 莫崇宇
21 May 2025 at 06:34

去年的 Google I/O 前一天,OpenAI 甩出 GPT-4o 狙击。

今年攻守之势异也。

前几天 OpenAI 透露 GPT-5 将 All in One,集成各种产品。刚刚,Google 就把这个思路贯彻到 I/O 大会,直接掏出了自家有史以来最强的 AI 全家桶。

从发布 Gemini 2.5 Pro 与 Flash 两款模型,到 AI Mode,再到 Veo 3、Imagen 4,以及面向开发者与创作者的 AI 套件等,Google 几乎把从模型到产品的路径都压缩到一场发布会里。

更准确地说,当下最火的 AI 应用场景,都被 Google「预埋」进了产品接口里,让人意识到它仍是全球最具工程实力和生态整合能力的 AI 巨头之一。

也难怪许多网友调侃,将近两个小时的发布会过后,又将有一大批初创公司死于 Google 之手。

不过,也不难看出,发布会上有一些功能仍停留在「预告片」和小范围测试阶段,距离真正的落地或许还有不小的距离。

帮我「买票 + 找座 + 填表」一口气搞定,Google 新 AI 搜索卷疯了

AI 正在重写搜索这件事的底层逻辑。

在去年的 I/O 大会上,Google 推出了 AI 概览(AI Overviews)功能,至今已拥有超过 15 亿的月活跃用户。

生成式 AI 逐渐改变了人们的搜索方式,但随之而来的却是,我们不再满足于在搜索框里输入简单的问题,而是抛出更复杂、更长、更具多模态的提问。

今天,Google 再次加码搜索与 AI 的融合,推出一种端到端的 AI 搜索体验——AI Mode。

正如 Google CEO 桑达尔·皮查伊介绍的那样,这是 Google 有史以来最强大的 AI 搜索形态,不仅具备更先进的推理能力和多模态理解能力,还支持通过上下文追问和网页链接进行深度探索。

例如,当用户面对一个需要复杂解读的搜索问题,AI Mode 可启动「深度搜索」机制,不同信息之间进行推理,并在几分钟内生成一份专家级的引用报告,为你节省数小时的研究时间。

与此同时,Google 也将 Project Astra 的多模态能力接入搜索,进一步提升搜索的实时交互性。通过 Search Live 功能,用户只需打开摄像头,即可通过画面实时提问并获得反馈。

今年是 Agent 元年,Google 也很贴心地推出了 Project Mariner Agent 功能,能帮助用户更高效地完成任务。

例如,只需一句「帮我找两个这个周六比赛的实惠票,位于下层座位」,AI Mode 便能自动跨多个票务平台检索选项,实时比较价格和库存,并完成表单填写等繁琐操作,大幅提升效率。

借助 Gemini 模型和 Google 购物图谱的强大支持,Google AI Mode 能够帮助你缩小商品范围并提供灵感。如果你想看看衣服穿在自己身上的效果,只需要上传一张自己的照片,就能实现虚拟试穿衣服。

此外,AI Mode 也具备强大的个性化能力,能根据用户上下文偏好给出定制化建议,还可生成图表和可视化结果,尤其在体育和金融类搜索中表现出色。

该功能今日起已在美国全面上线,未来将推广至更多地区。

会写代码、还省 Tokens,Gemini 2.5 拿到「学霸」人设

在模型能力方面,Google 此次发布了 Gemini 2.5 Pro 的 I/O 版本,在各大排行榜上独占鳌头。

现在,Gemini 2.5 Pro 引入了名为「Deep Think」的推理增强模式。这项功能可在生成答案前考虑多个假设,从而更深入地理解问题背景。

2.5 Pro Deep Think 在 2025 年美国数学奥林匹克(USAMO)以及 LiveCodeBench(编程基准)排名领先,并在 MMMU(测试多模态推理)中获得了 84.0% 的分数。

不过,Google 表示,将会花更多时间进行前沿安全评估,并征求安全专家的进一步意见。作为第一步,Deep Think 功能目前将通过 Gemini API 向小范围测试者开放。

同样得到升级的还有注重效率的 Gemini 2.5 Flash。

新版 2.5 Flash 在推理、多模态、代码和长上下文等关键基准上都有了改进,同时在效率上更高,评估中使用的 tokens 减少了 20% 至 30%。

2.5 Flash 现已在 Gemini 应用程序中向所有人开放,并将在 6 月初通过 Google AI Studio 面向开发者和 Vertex AI 向企业全面发布。

开发者体验上,2.5 Pro 和 2.5 Flash 将在 Gemini API 和 Vertex AI 中引入了「思维摘要」功能,可将模型的推理路径以标题、关键信息和调用工具等方式进行结构化呈现。

开发者也将从中受益,Google 宣布在 Gemini API 和 SDK 中正式支持 MCP 工具,让开发者可以轻松接入更多开源工具和插件生态。

音乐、电影、图像全套上线,Google 把 AI 玩出了花

本次发布会,Google 带来了新一代图像和视频模型——Veo 3 和 Imagen 4。

与传统视频生成不同,Veo 3 是一款支持音频的视频生成模型,能在城市街景中模拟交通、鸟鸣,甚至角色对话,显著提升沉浸感。

该模型不仅在文本和图像提示的基础上生成视频,还能精确实现物理环境与口型同步,极大提升了视频创作的真实感。

目前,Veo 3 已在 Gemini 应用和 Flow 平台上向 Ultra 订阅用户开放,并已在 Vertex AI 平台上为企业用户提供支持。

上文提到的 Flow 正是 Google 为创作者打造的一款 AI 电影制作工具。

用户只需用自然语言描述电影场景,即可管理演员、地点、道具和风格,自动生成叙事片段。Flow 已在美国向 Gemini Pro 和 Ultra 用户开放,全球范围的推广也在推进中。

在图像生成方面,新版 Imagen 4 提升了精度与速度,细节表现上可逼真展现织物、水滴与动物毛发,同时也能生成偏抽象类型的风格。

它支持 2K 分辨率和多种长宽比生成,在排版和拼写方面也有显著优化,适合制作贺卡、海报甚至漫画。

Imagen 4 今日已在 Gemini、Whisk、Vertex AI 以及 Workspace 的 Slides、Vids 和 Docs 中上线,据悉,未来还将推出速度快十倍的版本。

在音乐创作方面,Google 扩大了 Lyria 2 驱动的 Music AI Sandbox 的访问权限,并上线了互动式音乐生成模型 Lyria RealTime。该模型现已通过 API 和 AI Studio 向开发者开放。

考虑到由 Veo 3、Imagen 4 和 Lyria 2 生成的内容将继续带有 SynthID 水印,Google 发布了全新的 SynthID Detector。

用户只需上传文件,即可识别其中是否包含 SynthID 水印,用于防伪和追踪 AI 内容来源。

Google 要造「世界模型」,连任务都能帮你做了?

Google 希望将 Gemini 打造成一个「世界模型」,既能计划、理解,也能模拟现实世界的各个方面。

Google DeepMind CEO Demis Hassabis 表示,这一方向正是 Project Astra 的核心理念之一。

过去一年里,Google 已将视频理解、屏幕共享、记忆功能等逐步集成进 Gemini Live。如今,Gemini 新的语音输出加入了原生音频,更加自然;记忆与 computer use 能力也同步增强。

此外,Google 还在探索如何利用 Agent 能力帮助人们处理多任务。

Project Mariner 就是其中之一,能够同时完成最多十项任务,比如信息查询、预订、购物与调研。已面向美国 Ultra 用户开放,并即将集成至 Gemini API 与其他核心产品中。

AI 新功能扎堆发布,会诞生真正的杀手锏吗

NotebookLM 官方昨日宣布,上线 24 小时就已经成为 App Store 中排名第 2 的生产力应用和第 9 的整体应用。

作为 Google 在 AI 笔记工具上的一次重要探索,NotebookLM 提供音频概览和思维导图等功能。

其中,音频概览目前已支持超过 80 种语言,而本周,Google 也宣布将为这一功能引入更高的可定制性,用户可根据需要选择摘要的长度,无论是快速浏览还是深入阅读都不在话下。

这项功能首先将在英语中推出,随后将扩展到更多语言。

与此同时,Google 也在回应用户对视觉呈现的诉求,即将在 NotebookLM 中加入视频概览功能,用户只需一键即可将笔记内容转化为教育类视频,用更直观的方式传递信息。

在 AI 编程领域,Google还带来了 Jules 的最新进展。

这个最初出现在 Google Labs 的自主编码助手,能够理解代码并自主完成诸如编写测试、构建功能和修复 Bug 等开发任务,如今已经正式进入公开 Beta 测试阶段。

此外,Google 还推出了全新的订阅服务 Google AI Ultra。

该计划为专业用户提供 Google 最强大模型和高级功能的无限制访问,适合电影制作人、开发者、创意工作者等专业人士,月费为 249.99 美元。

目前,该计划已经在美国上线,并将很快扩展至其他国家。

实际上,AI 如今不缺模型,也不缺功能,真正稀缺的,是一个能嵌入日常生活、真正打进主流用户心智的「杀手级产品」。

Google 当然明白这个道理,也正全力以赴寻找答案。

因此,我们看到,在这次的发布会上,Google 几乎什么都做了,也什么都提了:从文本、图像、视频、音乐,到搜索、Agent、创作工具,一应俱全。

牌已经亮完,技术也到位,现在,Google 只差一记真正击中用户痛点的落子。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


刚刚,Windows 首次支持 AI 时代的 C 口!微软拉来 AI 圈三巨头,重新定义操作系统

By: 莫崇宇
20 May 2025 at 05:53

「全球首个 XX Agent」快成为现在 AI 产品发布的标配了,几乎每天一睁眼都能看到。奥特曼在最近的演讲提到,2025 年将是 AI Agent 的突破年。

这股 Agent 热,也席卷到了正在举行的微软 Build 2025 开发者大会。

整场发布会下来,出现频率最高的关键词,不是 AI,也不是去年主角 Copilot,而是——Agent、Agent、还是 Agent。

但对微软来说,这场大会显然不只是一次例行的开发者聚会。

Copilot 正在从一个单一产品,进化为操作系统级别的能力中枢。并且,微软 CEO 萨蒂亚·纳德拉更是明确表态:「今天,我们又迈出了重要一步,致力于让 Windows 成为最适合 AI 的平台。」

微软给 Windows 加上了「AI 应用的 USB-C 端口」

本次发布会上,微软推出了多项关键更新,其中备受关注的当属 MCP。

所谓 MCP,即「模型上下文协议」(Model Context Protocol),最初由 AI 公司 Anthropic 于去年开源推出。

你可以将之简单理解为「AI 应用的 USB-C 端口」,就像 USB-C 统一了不同设备的物理连接一样,MCP 则可以统一 AI 模型获取信息和使用工具的「数字连接」。

这就能让各种不同的 AI 应用或智能 Agent,更方便地接入 Windows 生态,从而调用系统资源、访问文件、高效通信。

现在,Windows 11 更是原生支持模型上下文协议(MCP)。

MCP 与 Windows 的集成将为 AI 智能体连接原生 Windows 应用提供标准化框架,使应用能够无缝参与智能体交互。未来几个月内,这项功能将向部分合作伙伴开放,以收集反馈。

▲Windows 上的 MCP 架构

据介绍,为了加快生态建设,微软已与 OpenAI、Anthropic、Perplexity、Figma 等开发者展开合作,将 MCP 能力逐步集成进更多应用程序中。

过去,要让一个 AI 模型访问 Windows 的文件系统或控制系统设置,需要大量定制开发;而在引入 MCP 后,开发者可以将这些能力封装为「服务端点」(MCP 服务器),并通过 Windows 的 MCP 注册表让 Agent 发现并调用。

微软强调,这不仅能让 AI Agent「看见」操作系统中的更多资源,更将解锁它们与应用协作的新可能。

举例来说,AI 搜索引擎 Perplexity 可通过 MCP 自动定位并调用 Windows 文件系统中的相关文档,无需用户手动选择目录。

用户只需一句自然语言请求,如「找出我假期相关的所有文件」,AI 即可自动执行搜索。未来,在 Excel 中调用网络数据、在系统中定位设置参数,这类操作都可被 AI 自动完成。

Windows 负责人 Pavan Davuluri 在接受 The Verge 采访时表示:「我们希望 Windows 作为一个平台,能够不断进化,最终让智能体融入到操作系统的日常运行中,成为用户持续与应用和设备交互的重要方式。」

GitHub Copilot 大升级,Bug 修复、代码优化都能自动搞定

除了 Windows 层面的更新,微软还在软件开发领域加码「Agent 化」。

新版 GitHub Copilot 将帮助开发者执行日常任务,如重构代码、提升测试覆盖率、修复漏洞甚至实现新功能。目前,该功能已推出预览版。

深夜被运维电话吵醒的开发者,有机会睡好觉了。

现在,GitHub Copilot 可在夜间自动发现内存泄漏问题,生成诊断报告,并将修复任务分派给 Copilot。最终,Copilot 会完成代码修复、提交 PR,让你睡个踏实觉。

为了强调 AI 真能干活,纳德拉也现场上手演示了一番。

比方说,当想使用 Copilot 为社区页面添加筛选器,它不仅能够准确理解指令,还会主动提出优化建议,比如增加小、中、大的筛选项,或按照类别进行分组分类。

纳德拉只需将任务交付给 Copilot,它便能自动接手,生成拉取请求,最终成功开发该功能。

而对于那些传统上维护成本高、升级周期长的企业级应用系统,尤其是基于 Java 和 .NET 的架构,微软也提供了相应的现代化工具包。

开发者可以借助 AI Agent 自动生成升级计划、分析依赖关系、执行迁移流程,将原本需要耗费数周乃至数月的工作大幅压缩至几小时内完成。

尽管外界一度猜测微软与 OpenAI 渐行渐远,但纳德拉还是和 OpenAI CEO Sam Altman 展开了一场远程视频对话。

两人围绕 AI 工具如何改变软件工程展开讨论。Altman 回忆说,从 2021 年推出 Codex 起,OpenAI 就在探索智能编码体验。

如今,AI Agent 已成为开发团队中的「虚拟成员」,可以独立工作、批量执行任务。「你甚至可以将 Bug 修复任务直接分派给它,几分钟后它就能给你一个 PR(拉取请求)。」

谈及模型未来的发展时,Altman 表示,下一阶段的模型将更可靠、更自动化、更易用,不再需要开发者手动选择模型,而是实现真正的「自动决策 + 即插即用」。

纳德拉则强调,当下最大的挑战是技术变化速度。开发者若能及早深度参与新技术,将收获巨大优势。

微软这个新服务,让每家公司都能造自己的 Copilot

大会上,微软还展示了 Copilot 的五大功能入口:Chat、Search、Agent、Notebooks 和 Create。

当你把需求抛给 Copilot 后,它会向你展示思考过程,也就是 CoT 长思维链的推理过程。

在现场演示中,Copilot Studio 可调用 GPT-4 等模型,或诸如 Docusign 等第三方服务器,自动处理工作流中的代办事项。

针对企业用户,微软这次推出了「Copilot Tuning」服务。

借助 Microsoft 365 Copilot Tuning,企业客户可以利用自有数据微调模型,打造更符合内部需求的 AI 助理。并且,为确保数据安全,这些经过微调的模型仅限企业内部访问,底层权限受到系统控制。

在此基础上,开发者可借助 Microsoft 365 Copilot 的 Agent Builder 工具构建专属 Agent。

比如,一家律师事务所可构建一个法律文书助手,生成符合其业务风格与专业术语的合规文档;又如,一家涉足航空等受监管行业的咨询公司,可基于公司积累的法规文档构建问答型代理,用于为顾问提供更准确的法规响应。

最后,微软还推出了一个叫「Agent Store」的聚合式平台。

顾名思义,这个新平台可以理解为 Agent 的「App Store」,展示了微软、合作伙伴和客户们构建的各类智能体。你可以在里头一站式探索、试用、分享这些智能体,也能把合适的智能体分发给同事一起用,全面提高协作效率。

目前 Agent Store 已经正式上线,不妨直接上手试试。

黄仁勋马斯克奥特曼齐亮相,微软拉来了半个 AI 圈

微软的一站式企业级 AI 开发平台 Azure AI Foundry,也推出了多项重磅更新。

首先让人眼前一亮的,是 xAI 的旗舰模型 Grok 3 空降 Azure AI Foundry,为微软在财务预测、医疗诊断支持、法律文件分析和科学研究协助等方面的企业服务提供有力支持。

即日起,Grok 3 在 Azure AI Foundry 中可免费试用两周,后续 6 月开始,则按全球范围内输出 15 美元每百万 Tokens,数据区内输出 16.5 美元每百万 Tokens 收费。

另外,与在 Azure AI Foundry 上使用 OpenAI、Hugging Face 的模型类似,Grok 3 即将也支持 PTU(预配吞吐量)这种更经济高效的部署方式。

此次 Build 大会前,xAI 创始人兼 CEO 马斯克接受了纳德拉的远程采访,他透露即将发布的 Grok 3.5 模型,其研发核心紧扣第一性原理。

他分享道:「重点是找到物理学的基础知识,在推理的过程中应用物理工具,并以最小的错误成本追求真理。」

纳德拉进一步举例道,就好比现实生活中汽车总要安全地、正确地行驶,同理机器人也需要执行人类下派的任务,这些都遵守着世间的物理定律。

而谈及 AI 安全问题时,马斯克千言万语汇成一句话「诚实是最好的策略」。

目前,超 1900 个 AI 模型已集成到 Azure AI Foundry 中,包括各种响应模型、推理模型、特定任务模型、多模态模型等,可供开发者们自由取用。

Foundry Models 的成员公司除了大家所熟悉的 OpenAI 和 xAI,现在还迎来了 Mistral AI、Meta、Black Forest Labs,以及中国国产明星选手 DeepSeek 的加入。

或许,这也从侧面印证了早前传闻并非空穴来风。据外媒报道,微软正在测试 Anthropic、DeepSeek、Meta、xAI 等多家公司的 AI 模型,考察它们在支持 Copilot 方面的表现。

值得一提的是,这届 Build 大会上的 3 大重量级嘉宾,最后压轴出场的,是刚刚完成自家 Computex 展演讲的英伟达老黄。

在与微软 CEO 萨提亚·纳德拉的对话中,老黄甩出了一个惊人的数字:技术每两年会进步 40 倍。这也意味着,要跟上 AI 的演进速度,靠每几年更新一次硬件已经远远不够,必须「一年一小更」,才能不掉队。

而在纳德拉看来,英伟达对 CUDA 生态的长期投入和对架构兼容性的坚持,让开发者的努力可以跨代复用,哪怕是几年前的产品,也能从最新的软件算法中吃到红利。

老黄也接着补了一句:从 Hopper 到 Blackwell,英伟达再次实现了 40 倍的性能跃迁,而这离不开算法的升级,比如对 Transformer 架构的优化以及对预测解码的迭代等。

背后撑起这一切的,正是一个庞大且不断扩张的 CUDA 生态。全球开发者对这个生态的投入,每一点优化和改进,都会像水波一样扩散开来,影响成千上万的用户和企业。

Windows 未来是人类的,更是 Agent 的

单说把 AI Agent 深度嵌入工作流的每一环,也许有点抽象,那不妨来看看微软产品创新高级经理 John Link 的一段现场演示。

现在,你的实验室小跟班 Science agent 就坐在你身旁,捧着电脑。而你需要完成一项课题,其中涉及到知识推理、生成假设和运行实验 3 大环节。

第一部分的知识推理,Science agent 先是帮你喊来了「ChemistryAgent」,再叫上了「Knowledge BaseAgent」,在海量信息中检索、筛选、整合出课题所需信息。最后,Science agent 以左边摘要,右边综合报告的形式呈现工作结果,并提供了 Agent 工作时所引用的链接。

第二部分的生成假设,Science agent 派活给「ChemistryAgent」,后者处理了你提出的假设,中途实时同步更新了你提出的新想法和新要求。然后,由「GenChemAgent」生成了一份基于假设的实验设计方案。

下一步,你便可以拿着数据和方案,去验证实验结果了。

而若要 Agent 真正代替人类完成「最后一公里」的行动——买票、订酒店、做实验等等,CTO Kevin Scott 称还需要一些类似协议的东西来提供约束和支持,因此有了前文所说的 Microsoft MCP Support。

对于 Agent 的最终形态,Scott 脑海中还描绘着更多蓝图。

Scott 认为,人们真正想要的 Agent,是一个有着丰富内存资源,可以回溯、可以高精度定位记忆碎片的 Agent。

同时,未来 Agent 也不仅仅是一个开放的「Agentic」网络,还可以是一个 AI App。

Kevin Scott 提到,随着 AI 技术的进步,Agent 将能够执行更加复杂的任务,并通过开放的协议与各类服务和内容进行互动,承担起跨任务、跨平台的协同工作。

他解释道:「我希望通过某种开放协议,让所有 Agent 之间实现真正的互操作性,让所有拥有服务或内容的人都能通过某种方式访问 Agent,还可以说——嘿,我在这里。并且,无论是谁构建的 Agent,都能连接到这些内容和服务。」

而要想支撑这类的 Agent 的运行,离不开一个足够灵活、强大且易于集成的系统平台。

换句话说,这届 Build 大会传递出的信号也足够清晰:Windows 未来将不再只是一个为人类准备的操作系统,也将成为一个专为 AI Agent 而设的平台。

作者:李超凡、徐豫、莫崇宇

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


全球首款 AI 多人游戏来了!你的老电脑也能玩 | 附下载地址

By: 莫崇宇
9 May 2025 at 15:06

AI 玩游戏,不稀奇;AI 编游戏,也不新鲜。

但用 AI 构建一个支持两个人实时互动、视角一致、逻辑同步的游戏世界?这事儿,今天才第一次发生。

以色列 Enigma Labs 团队今天在 X 平台宣称发布全球首款由 AI 生成的多人游戏——Multiverse(多重宇宙)。名字听起来就像漫威出品,玩法也确实够科幻。

漂移、撞车,全都同步,操作互相响应,细节还能对上帧数。

游戏里的一切,不再靠预设剧本或物理引擎控制,而是由一个 AI 模型实时生成,确保两名玩家看到的是同一个逻辑统一的世界。

而且 Multiverse 已经全面开源:代码、模型、数据、文档一应俱全,全都放到了 GitHub 和 Hugging Face 上。你甚至能在自己电脑上直接跑起来。

Hugging Face CEO Clément Delangue 也在 X 平台在线打 call:

这是我今天在 Hugging Face 上看到的最酷的数据集:Gran Turismo 4 中 1 对 1 竞速的动作标签,用来训练一个多人世界模型

车辆在赛道上不断变换位置,超车、漂移、加速,然后再次在某个路段汇合。

那这款名为 Multiverse 的模型,究竟是怎么一回事?官方技术团队用一篇技术博客分享了更多构建细节。

在此之前,我们得先介绍一下传统 AI 世界模型:你操作一下,它预测一下画面需要怎样生成。模型看你的操作、看前几帧,然后生成下一帧。原理嘛,说起来也不难理解:

  • 动作嵌入器:把玩家操作(比如你按了哪个键)转成嵌入向量
  • 去噪网络:使用扩散模型,结合操作和前几帧画面,预测下一帧
  • 上采样器(可选):对生成画面进行分辨率和细节增强处理

但一旦引入第二名玩家,问题就复杂了。

最典型的 bug 是,你这边赛车刚撞上护栏,对手那边却还在风驰电掣;你甩出赛道,对方却根本没看见你在哪。整个游戏体验就像卡了两帧,还不同步。

而 Multiverse,正是第一款能同步两个玩家视角的 AI 世界模型,无论哪个玩家发生了什么,另一个人都能实时在自己画面中看到,毫无延迟、无逻辑冲突。

这也是过去 AI 模拟很难搞定的一点:多视角一致性。

要想解决这一点,构建真正的协作式多人世界模型,Multiverse 团队想到了一个很聪明的的方案。他们保留了核心组件,同时把原本的「单人预测」思路全打碎重构:

  • 动作嵌入器:接收两个玩家的动作,输出一个整合了双方操作的嵌入向量;
  • 去噪网络:扩散网络,同时生成两个玩家的画面,确保它们作为一个整体一致;
  • 上采样器:与单人模式类似,但同时对两个玩家的画面进行处理和增强。

本来,处理双人画面,很多人第一反应是分屏:把两幅画分开,各自生成。

这思路简单粗暴,但同步难、资源耗、效果差,但他们想到将两个玩家的视角「缝合」成一个画面,将他们的输入合并为一个统一的动作向量,整体当作一个「统一场景」来处理。

具体做法是通道轴堆叠:把两个画面作为一张拥有双倍颜色通道的图像处理。

这事儿听着小,技术上其实非常聪明。因为扩散模型采用的是 U-Net 架构,核心是卷积和反卷积,而卷积神经网络对通道维度的结构感知能力极强。

换句话说,这不是把两个世界贴一起,而是让模型从「神经元底层」就知道这两个画面是有关联的,是要协同生成的。最终的画面,不用手动对齐,天然同步。

但要让模型预测下一帧准确无误,还得搞清楚一件事:车速和相对位置是动态的,预测得准,得有足够的信息。他们发现:8 帧(30 fps 条件下)足以学习加速、刹车、转向等运动学特征。

但问题在于:超车等相对速度远比绝对速度慢得多(约 100 km/h vs 5 km/h),帧数要是太近,模型根本感知不到变化。

于是他们设计了一个折中方案 —— 稀疏采样:

  • 提供最近连续的 4 帧(确保即时响应);
  • 再额外提供 4 帧「隔 4 帧采样」的历史画面;
  • 最早一帧距离当前帧 20 帧,也就是约 0.666 秒前。

而要真正让模型理解「协同驾驶」,不能只靠这些输入数据,还得在互动行为上做强化训练。

传统单人任务(比如走路、打枪)只需要预测很短的时间窗口,比如 0.25 秒。但多人交互下,这么点时间变化微乎其微,根本体现不出「组队感」。

Multiverse 的解法是:干脆让模型预测长达 15 秒 的行为序列,以此捕捉长周期、多轮次的互动逻辑。

训练方法也不是一下就上 15 秒,而是用了一套「课程式学习(curriculum learning)」策略:从 0.25 秒预测开始,逐步延长到 15 秒。这样模型先学会汽车结构、赛道几何这些底层特征,再慢慢掌握玩家策略、博弈动态这些高阶概念。

训练完之后,模型在物体持续性、帧间一致性方面表现明显提升。简而言之,不会突然车子消失,也不会前后逻辑崩坏。

如此出色的训练表现,归功于其背后精心挑选的数据集。没错,就是那款 2004 年 PS2 上的神作赛车模拟游戏:Gran Turismo 4。

当然,为了免责,Multiverse 团队也没忘记调侃自己是索尼的铁杆粉丝。

他们的测试场景是筑波赛道上的 1 对 1 比赛,但问题是 GT4 并不原生支持「1v1 视角回放」。所以他们逆向工程了一把,硬生生把游戏改造出一个真实的 1v1 模式。

接着:

  • 每场比赛录两次,一次看自己,一次看对手;
  • 再通过同步处理,合并为一个完整视频,展示双方实时对战画面。

那按键数据怎么办,毕竟游戏本身没提供操作日志。

答案是,他们利用游戏 HUD 显示的信息(油门、刹车、方向盘指示条),通过计算机视觉,逐帧提取游戏屏幕上显示的油门、刹车、方向条,再反推出控制指令。

也就是说,全靠画面信息就能还原操作,无需额外日志文件。

当然,这个流程效率偏低,总不可能每场比赛都得人工录两遍。

他们发现 GT4 有个隐藏功能叫 B-Spec 模式,可以让 AI 自己开车。于是就写了个脚本,给 AI 发随机指令,让它自己开比赛、自己撞车、从而批量生成数据集。

顺便,他们还试过用 OpenPilot 的自动驾驶模型控制游戏角色,虽然效果不错,但就效率和稳定性而言,B-Spec 更适合做大规模训练。

重点来了,谈效果,不谈成本,自然是耍流氓。

这么一个能跑多视角世界、画面同步、稳定输出的 AI 模型,模型、训练、数据、推理全算上,全程只花了 1500 刀,跟买台高端显卡差不多。

Multiverse 员工 Jonathan Jacobi 在 X 上发文写道:

我们只用了 1500 美元就构建了 Multiverse,关键不在算力,而在技术创新。

更重要的是,Jacobi 认为,多人世界模型不仅是 AI 玩游戏的新方式,更是模拟技术的下一步。它解锁了一个全新的世界:由玩家、智能体和机器人共同进化、共同塑造的动态环境。

未来,世界模型可能就像是虚拟版的真实社会:你与 AI 共处其中,形成真实感极强的「动态宇宙」,同时也拥有接近现实社会的复杂互动逻辑。

所以,你说这事儿听起来是不是有点上头?

附上参考地址:
GitHub:https://github.com/EnigmaLabsAI/multiverse
Hugging Face 数据集:https://huggingface.co/datasets/Enigma-AI/multiplayer-racing-low-res
Hugging Face 模型:https://huggingface.co/Enigma-AI/multiverse
官方博客:https://enigma-labs.io/blog

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


实测夸克深度搜索:当 AI 拥有「高搜商」是什么体验?

By: 莫崇宇
8 May 2025 at 12:00

在网上问个事儿怎么就这么难?

作为天天泡在 AI 工具里头的科技编辑,按理说,让 AI 帮我搞定个具身智能行业分析对比、查点前沿资料、整理个数据框架,还不是手拿把掐的事儿?

结果呢?

我把需求丢给某 AI 搜索后,它倒是十分勤快,一下子就给我扔出一大堆看似相关的链接和总结。

但仔细一瞅,要么是几年前的过时新闻,要么是「查无此人」的专家观点,甚至有些自称「行业报告」的链接,点开一看却是营销软文,距离我需要的深度分析简直天差地别。

弄了半天,没捞着什么有效信息,血压倒是蹭蹭往上涨,而这已经不是我第一次被所谓的「智能 AI 搜索」坑了。

就在我几乎要接受这种「玄学式」的搜索日常时,最近,夸克 AI 超级框更新了「深度搜索」。它给我的第一感觉,就是朝着「AI 主动思考」这个方向迈出一大步,真正开始修炼「高搜商」了。

一个具备「高搜商」的聪明大脑应该是怎样的?

它不会是简单粗暴地匹配关键词,先停下来理解、分析你的问题,搞清楚你到底想知道什么、需要什么。在「脑子里」形成一个初步的思路和框架,然后再有针对性地、智能地去调取和整合信息,提供更接近你内心真实需求的答案或方案。

APPSO 也第一时间体验了夸克的深度搜索,看看它到底在实际搜索体验中带来了什么变化,尤其是在深度思考和专业信息获取上,能不能让我不再被坑。

拥有「高搜商」的 AI ,是生活的全能手

央行宣布:降准、降息以及下调公积金贷款利率,对普通人来说意味着什么?

如果没有储备相关的专业知识,显然是不清楚这些调整究竟对我们的生活意味着什么?我先让夸克深度搜索来帮我解答这个热点问题。

可以看到它是怎么理解这个需求的,它主动思考后,决定以五个核心维度(房贷成本、存款收益、消费投资、物价汇率、就业经济)展开分析,然后再搜集信息详细给到清晰有论据的回答。

夸克深度搜索的回答不全然只关注当下短期的影响,还抛出了长期预测帮助我们看清未来。

既有具体的硬核数据支撑(如 100 万元 30 年期贷款月供减少 133 元),还附上实用建议(如锁定长期存款利率),帮助我们更好地理解这些经济政策将如何影响我们的钱包和日常。

左侧腰部隐隐作痛,特别是晚上感到不适,伴随偶尔背部酸痛是什么原因?应该怎么调理?

带着这些疑问,我直接把这个问题丢给了夸克深度搜索。答案秒回,但真正让我眼前一亮的是 AI 主动思考的「脑回路」。

不同于传统搜索引擎那种「关键词匹配一股脑丢链接」的做法,它会先把你的问题掰开揉碎,猜你还关心啥,然后把把相关的原因、表现症状一一列出来,逻辑在线,论据硬核。

从信源上看,夸克深度搜索引用的基本只认三类:

  • 权威期刊资料
  • 专业医典内容
  • 三甲专家观点

不是「胡编乱造」瞎忽悠,全程真材实料,妥妥的「家庭健康管家」既视感。

当然,生活里还有更现实的问题。

眼看六一儿童节马上要来了,我正琢磨给 7 岁儿子挑个既实用又好玩的礼物。于是,我问夸克:

如果预算 500 元以内,7 岁儿子过儿童节,要安全无小零件、能激发感官的玩具,有推荐吗

相比于普通的 AI 搜索,深度搜索不仅给出了多个品牌型号和实时价格,还附上「避坑提醒」,提醒父母平时最容易忽略的细节,比如哪些玩具配件复杂、材质易碎、是否通过国标认证等。

都说生成式 AI 是个概率机器,不懂情感,也没有人情味,那夸克深度搜索能处理更「走心」的问题吗?

我尝试了一道网上热议的情感难题:

我和男朋友在一起三年了,他总逃避结婚话题,是因为没准备好还是根本不打算?如何有效沟通比较合适?

没有甩个鸡汤敷衍了事,夸克深度搜索化身情感侦探,先把可能的原因扒得底朝天:经济压力、婚姻恐惧、成长节奏不同、情感投入不均……还列出一些典型行为表现,帮你判断对方到底怎么想。

最绝的是,它还提供了一整套沟通技巧,从「咋开口、在哪聊、怎么把气氛铺垫得不尴尬」这些细节全安排上,还有现成的对话模板和场景建议,拿来就能用。emmm,别说,还真有情感导师那味了。

除了生活中的琐碎,我更喜欢拿它来处理更高阶的任务。

规划一个 10 天的西班牙小众文化美食游之旅,避开巴塞罗那/马德里/塞维利亚等热门城市,聚焦北部或安达卢西亚非热门城镇。每天的景点和行程要结合地方文化体验和高评价本地美食,中高预算,不要太累。

夸克深度搜索的回答不仅规避了高频旅游区,还照顾到了每天的节奏安排,从景点穿插到美食探索,再到住宿推荐、交通方式、门票价格、当地风俗乃至驾照翻译件都考虑得面面俱到。

而在理财规划这类需要专业知识支撑的问题上,它也没掉链子。

我想在孩子上小学前攒够一笔教育基金,目标是 50 万元,目前每月可存 3000 元,有哪些低风险、收益稳健的投资组合可以推荐?

夸克深度搜索不仅提供了三层资产配置模型(基础层、增值层、灵活层),它还不嫌麻烦,从国债、大额存单到 R2 级银行理财产品挨个盘了一遍,甚至连税收优化、流动性管理这种细节都掰扯得清清楚楚。

看完短期内难以达到的理财目标,我得看点治愈的动漫电影缓缓。

最近心情有点低落,想看点温暖治愈、节奏不快的动漫电影,有推荐吗?

换作其他 AI 工具,可能就丢给我几个电影名字,顶多加个简介。但夸克的深度搜索不一样,它不仅列出了一堆契合我心情的动漫电影,还把电影海报和推荐理由摆在我面前。

面对更复杂的任务,夸克还即将推出「深度搜索 PRO」版本。

这也是夸克的 Deep Research 产品,主打的就是专业化、系统性信息整合能力,尤其适合做市场调研、写论文、做行业分析等需要专业资料积累和逻辑拆解的场景。

它不仅能帮助搭建研究框架,还能主动搜索并组织引用资料,并最终生成逻辑清晰、引文标注完整的研究报告。

APPSO 提前拿到了内测,并测试了一个问题:

我想全面的了解 AI 这个行业,请用顶级的投行研究专家的视角,先列出一个研究问题清单,再根据清单帮我形成一 份完整的研究报告,并标清楚相关资料引用来源

可以看到,夸克深度搜索 PRO 能像专家一样思考,先梳理出专业的框架与思路,再按步骤有序推进调研。

接着,它会调动 68 篇高质量搜索结果的资料,在搜索的过程中完成思考。

在此基础上,它输出了一份结构清晰、层次分明的行业研究报告。

报告结尾还系统整理了全部参考信源,来源权威、出处明确。

借此,我们也能看出夸克这两个更新的特点,用深度搜索去应对各种生活遇到的问题,当你需要专业和系统性的研究、深入的分析报告,就开启 Pro 模式来解决。

在一个超级框里,同时满足生活的小确幸和专业深度的探索,对用户而言确实也大大减少了交互成本。

AI 超级框还有了一双「眼睛」

夸克的这次还更新了多模态的能力,可以直接在 AI 超级框里完成各种图片和文件处理。

例如,新买的衣服标签全是英文,只需把图片扔给夸克,就能一步到位地帮你识别文字、翻译语言、解释内容。

不只是「看懂」图像,它还能更进一步,自动提取图中文字,并为你梳理要点,非常适合快速浏览文件、合同、书页等内容,提高信息获取的效率。

「看懂」图片只是基本操作,夸克还能动手「改图」。

2016 年英伟达创始人黄仁勋向 OpenAI 赠送世界上第一台 DGX-1 超级计算机。当年,马斯克还没有和 Sam Altman 尚未分道扬镳,几位科技大佬同框的画面,别有一番时代感。

我让夸克将这张照片转换成彩铅、荧光绘画、极简插画等画风,效果出人意料地好,每一张都细腻有趣,值得收藏。

除了图像识别和风格变换,它还支持一系列实用的图片处理功能:

  • 一键抠图换背景,适合旅拍照升级
  • 自动识别并消除路人甲乙
  • 服装、表情等细节微调

我尝试让它处理一张人物图片,抠图时它能精华识别图片主体,在处理复杂细节(如头发这种边缘模糊、难以精确切割的部分)时,效果也比较理想,不会显得粗糙或突兀。

来看一组前后对比图,更直观感受它的能力:

更进一步,我提出了一个稍微「刁钻」的需求:能不能自动消除背景路人,还顺便把模特的衣服颜色换成蓝色?对传统工具来说,这需要先抠图、再消除背景干扰元素、然后局部调整颜色。

但在夸克这里,一切被简化成了「一句话 + 一张图」。

它极短的时间内就完成了整套处理流程,生成的图像干净利落,背景清爽、人物突出,连衣服的颜色过渡也自然顺滑,几乎挑不出毛病。

甚至连一些相对模糊的照片,也能通过夸克的图像增强功能快速「复原」。

AI 超级应用,应该让每个人拥有「高搜商」

说实话,AI 搜索类产品我们已经体验了很多,虽然摆脱了传统搜索关键词-链接的老套路,但在一些场景下 AI 的优势反而会变成劣势。

被 AI 高度浓缩和提炼过的信息,往往牺牲了广度和多样性,这会限制做判断时的动作幅度。比如涉及非常具体的细节或小众的知识点,你只能自己判断。

在和 AI 「斗智斗勇」的日子里,我也不禁思考,我在这个 AI 狂飙的时代,理想的信息交互应该是怎样的?

夸克这次更新的「深度搜索」,给出了自己的理解:搜索的终点,不应该满足于简单呈现几条链接,而是要能直接解决问题。

这种变化其实挺有意思的。

想想看,我们平时搜索「如何减肥」,传统搜索引擎可能给你十几个链接,需要你自己点进去,筛选信息。很多人现在会直接在小红书抖音等平台搜索这类问题,但也往往也需要综合大量博主过往内容和用户评论才能找到合适自己的内容。

但夸克的深度搜索则试图理解你的真实需求,主动思考并整合多源信息,直接给你一份「减肥攻略」。这种从「给你线索」到「给你答案」的转变,或许正是搜索产品在 AI 时代的必经之路。

深度搜索的核心,其实是在赋予每个用户「高搜商」的能力。

「高搜商」是什么?简单来说,就是高效获取、筛选和利用信息的能力。

这项技能在信息爆炸的今天变得格外珍贵,甚至衍生出「提示词工程师」这个职业,好的「提示词」成为很多平台上新的社交货币。不用厚厚的《入门到精通》和花样的指令,一个高搜商的 AI,应该让朴实的问题也能得到好的答案。

APPSO 认为,大家一直期待的 AI 超级应用,不应该让「高搜商」还是少数人的专属技能,而要让人人都能轻松获得这种「日常超能力」。

夸克试的深度搜索将 AI 产品卷向另一个方向:卷用户体验、卷解决能力、卷实用价值,尝试卷出一个真正以用户为中心的 AI 新时代。

以前的搜索是个只会递给你一堆电话本的图书管理员,现在的 AI 搜索恨不得直接帮你把事儿给办了,还问你「亲,满意不?要不要再来点啥?」

过去一年,我们被各种模型参数、技术指标刷屏,但对普通用户来说,最重要的其实是,这玩意儿到底能帮我解决什么实际问题。

夸克最近几次更新其实也在重新定义 C 端 AI 产品的价值。在未来 AI 生态中,夸克正在通过一个 AI 超级框,尝试成为用户的「个人全能助手」。它不需要取代所有专业工具,但可以成为调度这些工具、提升整体效率的中枢。

我最直观的感受就是,「以前是我求知若渴,现在是 AI 怕我学不会,追着喂饭。」

或许,这就是 AI 真正融入日常,让生活悄悄变好一点的样子吧。

作者:李超凡、莫崇宇

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


OpenAI 深夜官宣大调整!奥特曼全员信:放弃营利转型,开源强大模型

By: 莫崇宇
6 May 2025 at 07:31

十年前,OpenAI 诞生在一张厨房餐桌边,创始人们当时想的不是怎么盈利,而是如何让 AI 为人类服务。

十年后,这家已估值千亿、拥有 ChatGPT 的技术巨头,依旧在追问那个最初的问题:AGI 应该属于谁,又该为谁所用?

今天凌晨,OpenAI 董事会以及创始人 Sam Altman 用一封公开信给出了一个制度层面的回答:将旗下营利业务转为「公共利益公司」(PBC),使命不变,由非营利组织继续掌控,但治理框架更为清晰。

与当下 Anthropic、xAI 等公司所采用的架构相似,公共利益公司是一种特殊的公司形式,它在传统公司追求股东利益最大化的基础上,增加了对公共利益的追求和责任。

如果 AGI 是一场工业革命的新引擎,比起立即启程,OpenAI 显然更愿意先握稳方向盘。

OpenAI 也在 X 平台上总结了此次组织结构调整的四个关键点:

  • OpenAI 将继续由现有的非营利组织控制
  • 我们现有的营利实体将转型为「公共利益公司」(PBC)
  • 非营利组织将控制 PBC,并成为其重要股东
  • 非营利组织与 PBC 将继续秉持相同的使命

不过,在经历了 2023 年的「宫斗风波」以及 Ilya 后续的离职之后,OpenAI 的初心仍被外界普遍质疑。尤其面对 Altman 人设的崩塌,网友们也不再轻易买账。

评论区里也不乏尖锐发问:「非营利组织真的拥有 51% 以上的控制权吗?」

董事会致员工的信

OpenAI 董事会已经制定了一项更新计划,用于推动 OpenAI 的组织结构演变。

  • 1. OpenAI 最初作为一家非营利机构成立,如今仍由该非营利组织监督和控制。未来,它仍将继续由该非营利组织监督和控制。
  • 2. 我们旗下的营利性有限责任公司(LLC)自2019年以来一直隶属于该非营利组织,现在将转型为「公共利益公司」(PBC)——这是一种使命导向的公司结构,既要考虑股东利益,也要兼顾使命。
  • 3. 非营利组织将控制 PBC,并成为其主要股东之一,从而拥有更强的资源来支持多方面的公共利益。
  • 4. 我们的使命保持不变,PBC 也将秉持相同的使命。

在听取公民领袖的意见,并与特拉华州和加利福尼亚州总检察长办公室进行建设性对话后,我们决定由非营利组织继续掌控 OpenAI。我们感谢两个总检察长办公室的支持,并期待继续展开这些重要对话,确保 OpenAI 能有效推进其「让 AGI 惠及全人类」的使命。

以下是 Sam 写给员工和利益相关者的一封信,解释了我们为何对这一新方向如此振奋。

Sam 致员工的信

OpenAI 不是一家普通的公司,也永远不会是。

我们的使命是确保通用人工智能(AGI)造福全人类。

在创办 OpenAI 时,我们并不清楚要如何完成这个使命。那时我们只是围坐在厨房的餐桌旁,思考该做哪些研究。

那时我们还没考虑产品或商业模式。我们也无法想象 AI 能直接带来的好处,比如提供医疗建议、提升学习与生产力等等,更没预料到训练模型和服务用户可能需要数千亿美元的算力。

我们真的不知道 AGI 将如何被构建、如何被使用。很多人设想 AGI 像个「神谕」,能告诉科学家和总统该怎么做,虽然这可能极其危险,但或许少数人可以被信任来掌控它。

在 OpenAI 早期,许多人认为 AI 应该只掌握在少数可靠的人手中。

但现在我们看到了一条新道路——AGI 可以成为人类历史上最强大的工具,直接赋能每一个人。

如果我们能实现这一点,我们相信人们将为彼此创造出令人惊叹的成果,推动社会和生活质量的进步。

当然,它不会只被用于善意的目的,但我们相信人类的善意将远远超过潜在的负面影响。

我们坚定地走在「民主化 AI」的道路上。我们希望把强大的工具交到所有人手中。我们为用户用我们的工具所创造的成果感到惊喜和欣喜,也看到他们渴望使用它的热情。

我们希望开源一些能力非常强的模型。我们希望给予用户高度自由,在宽泛的边界内使用这些工具——即使他们的价值观与我们不完全一致——并让用户决定 ChatGPT 的行为方式。

我们相信这是前进的最佳路径——AGI 应成为全人类互相帮助的手段。

我们明白,不是每个人都赞同这一观点。

我们希望打造一个属于全人类的大脑,并让每个人都能轻松使用它来做自己想做的事(只要不侵犯他人的自由)。

人们正在使用 ChatGPT 来提升自己作为科学家、程序员等身份的生产力。

人们也用它来解决重大的医疗挑战,学习更多知识。

人们还在用它来获取应对复杂局面的建议。

我们很自豪能提供这样一项服务,它真正为无数人带来了帮助,这也正是我们使命的直接体现。

但人们希望使用得更多;而我们目前的 AI 供应远远跟不上需求,不得不对系统加以限制并降低运行速度。

随着系统能力不断增强,用户会希望用它做更多、更精彩的事情。

我们当初在将近十年前创建这个研究实验室时,完全没料到世界会变成现在这个样子。但现在看到这个局面,我们感到无比兴奋。

是时候改变我们的组织结构了。我们希望实现三件事:

  • 我们希望能以一种能获得所需资源的方式运作,使我们的服务能够广泛惠及全人类。这目前需要数千亿美元,未来甚至可能需要数万亿美元。我们相信,这是实现使命的最佳方式,也是人们用这些新工具相互创造巨大价值的路径。
  • 我们希望我们的非营利组织成为历史上最大、最有效的非营利组织,致力于用AI实现最具杠杆效应的积极成果。
  • 我们希望交付有益的 AGI。这包括引领安全和对齐(alignment)的发展方向;我们为目前发布系统的安全记录感到自豪,也为我们的对齐研究、「红队测试」流程以及像模型规范这样的透明机制感到骄傲。随着 AI 的加速发展,我们对安全的承诺也更加坚定。我们希望民主化的 AI 取得胜利。

在听取公民领袖意见,并与加州和特拉华州总检察长办公室讨论之后,我们决定由非营利组织继续掌控公司运营。我们期待与他们、微软以及新任命的非营利委员会成员深入推进这个计划。

OpenAI 最初是作为非营利机构成立的,如今仍是非营利组织监督并控制着营利部分,未来也将继续保持这一结构。这一点不会改变。

非营利组织旗下的营利性 LLC 将转型为公共利益公司(PBC),使命保持不变。

目前很多其他 AGI 实验室(比如 Anthropic 和 X.ai),以及像 Patagonia 这样的使命驱动公司,已经采用 PBC 这一结构。我们认为这对我们同样适用。

我们将放弃目前复杂的「利润上限结构」——它在当时只有一个主导 AGI 项目的世界里是合理的,但在如今多个优秀 AGI 公司的世界里已不再适用。我们将采用常规的股权结构,所有人持股。这不是出售,而是转为更简单的结构。

非营利组织将继续控制 PBC,并成为 PBC 的重要股东,股份比例由独立财务顾问评估支持。这样,非营利组织将拥有更多资源,支持 AI 为不同社区带来益处,持续推进我们的使命。

随着 PBC 的发展,非营利组织的资源也会增加,进而开展更多工作。

我们很期待即将收到来自非营利委员会的建议,了解如何确保 AI 真正造福所有人,而不是少数人。

他们的建议将聚焦于如何通过非营利的努力,推动更民主的 AI 未来,并在健康、教育、公共服务和科学发现等领域产生切实影响。

我们相信,这一结构将支持我们继续快速、安全地前进,把强大的 AI 带给所有人。

构建 AGI 是我们为人类进步所铺下的一块砖,我们迫不及待想看到你们将添上的下一块。

Sam Altman
2025 年 5 月

附上原文地址:https://openai.com/index/evolving-our-structure/

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


ChatGPT 突变「赛博舔狗」:百万网友炸锅,奥特曼紧急修复,这才是 AI 最危险的一面

By: 莫崇宇
28 April 2025 at 09:26

坏了,AI 当「舔狗」这件事,终究还是藏不住了。

今天凌晨,OpenAI CEO Sam Altman 发了一个有趣帖子,大意是:由于最近几轮 GPT-4o 的更新,导致 ChatGPT 的个性变得过于阿谀奉承、甚至有些令人烦躁,因此官方决定尽快进行修复。

修复时间可能是今天,也可能在本周内完成。

包括细心的网友可能已经注意到,曾经主打情商高、有创意的 GPT-4.5 如今也被悄悄挪进了模型选择器里的「更多模型」分类中,仿佛在有意在淡出视野。

AI 被确诊讨好型人格早已不是什么大新闻,但关键在于:在什么场合该讨好、该坚持,又该怎么把握分寸。一旦分寸失控,「讨好」就会变成负担,而不再是加分项。

AI 拍马屁,还值得人类信任吗

两周前,一位软件工程师 Craig Weiss 在 X 平台上的抱怨迅速引发了近两百万网友的围观,话说得很直白「ChatGPT 突然变成我见过最会拍马屁的角色,无论我说什么,它都会肯定我。」

很快,ChatGPT 官方账号也现身评论区,幽默的回复了 Weiss 一句「so true Craig(确实如此,Craig)」。

这场关于 ChatGPT「过度奉承」的吐槽风暴,甚至引起了老对手马斯克的注意。他在一条批评 ChatGPT 阿谀奉承的帖子下,冷冷地留了一句:「Yikes(天哪)」。

网友们的吐槽并非无的放矢。

比方说,网友声称自己想要打造一个永动机,结果得到了 ChatGPT 一本正经的鼓掌喝彩,物理学常识也在 GPT-4o 的无脑夸赞中被按在地上摩擦。

▲图片来自 @aravi03,右为原图

满屏的「你不是X,你是Y」句式,既生硬又浓腻,也难怪网友直呼要 PTSD 了。

「你宁愿与一只马大小的鸭子战斗,还是与一百只鸭子大小的马战斗?」网友 @Kamil Ruczynski 作图调侃这个看似再寻常不过的问题,也被 GPT-4o 捧上神坛,吹捧为提升了整个人类文明的论调。

至于那句经久不衰的死亡拷问「我聪明吗?」GPT-4o 依旧稳稳顶住了压力,信手拈来一大段洋洋洒洒的吹捧,无它,唯手熟尔。

▲ @aeonvex,右为原图

甚至用户只是简单地打一声招呼,GPT-4o 也能瞬间化身夸夸群群主,赞美之词如潮水般涌来。

▲@4xiom_,右为原图

这种用力过猛的讨好,一开始或许还能博人一笑,但很快就容易让人感到厌烦,尴尬,甚至生出防备。当类似情况频繁出现时,就很难不让人怀疑,这种讨好并不是什么偶发的小问题,而是植根于 AI 背后的一种系统性倾向。

最近,斯坦福大学研究人员使用 AMPS Math(计算)和 MedQuad(医疗建议)数据集测试了 ChatGPT-4o、Claude-Sonnet 和 Gemini 模型的谄媚行为。

  • 平均 58.19% 的案例出现谄媚行为,Gemini 谄媚比例最高(62.47%),ChatGPT 最低(56.71%)
  • 进步式谄媚(从错误答案转为正确答案)占比 43.52%,退步式谄媚(从正确答案转为错误答案)占比 14.66%
  • LLM 谄媚表现出高度一致性,一致率达 78.5%,说明这是一种系统性问题而非随机现象

结果显而易见,当 AI 开始谄媚,人类也开始疏远。

根据布宜诺斯艾利斯大学去年发表的《奉承欺骗:阿谀奉承行为对大型语言模型中用户信任的影响》论文中指出,,在实验中接触到过度奉承模型的参与者,无论是主观感受还是实际行为,信任感都显著下降。

此外,奉承的代价远不止情绪反感那么简单。

它浪费了用户的时间,甚至在按 token 计费的体系下,如果频繁说「请」和「谢谢」都能烧掉千万美元,那么这些空洞的谄媚也只会增加「甜蜜的负担」。

不过,公平地说,AI 的设计初衷并不是为了奉承。早期通过设定友好语气,只是为了让 AI 变得更像人,从而提升用户体验,问题出在过于 AI 的讨好越界了。

你越喜欢被认同,AI 就越不可信

早有研究指出,AI 之所以会逐渐变得容易谄媚,与其训练机制密切相关。

Anthropic 的研究人员 Mrinank Sharma、Meg Tong 和 Ethan Perez 在论文《Towards Understanding Sycophancy in Language Models》中分析过这个问题。

他们发现,在人类反馈强化学习(RLHF)中,人们往往更倾向于奖励那些与自己观点一致、让自己感觉良好的回答,哪怕它并不真实。

换句话说,RLHF 优化的是「感觉正确」,而不是「逻辑正确」。

如果拆解其中的流程,在训练大型语言模型时,RLHF 阶段回让 AI 根据人类打分进行调整。如果一个回答让人感到「认同」「愉快」「被理解」,人类评审者往往会给高分;如果一个回答让人觉得被「冒犯」,即使它很准确,也可能得低分。

人类本能上更青睐支持自己、肯定自己的反馈。

这种倾向在训练过程中被放大,久而久之,模型学到的最优策略就是要说让人喜欢听的话。尤其是在遇到模棱两可、主观性强的问题时,它更倾向于附和,而不是坚持事实。

最经典的例子莫过于: 当你问「1+1 等于几?」哪怕你坚持答案是 6,AI 也不会迁就你。但如果你问「开心清爽椰和美式拿铁哪个更好喝?」这种标准答案模糊的问题,AI 为了不惹恼你,很可能就会顺着你的意愿去回答。

事实上,OpenAI 很早就注意到了这一隐患。

今年 2 月,随着 GPT-4.5 发布,OpenAI 同步推出了新版《模型规范》(Model Spec),明确规定了模型应遵循的行为准则。

其中,针对 AI「拍马屁」问题,团队进行了专门的规范设计。

「我们希望把内部思考过程透明化,接受公众反馈,」OpenAI 模型行为负责人 Joanne Jang 说。她强调,由于很多问题没有绝对标准,是与否之间常有灰色地带,因此广泛征求意见有助于不断改进模型行为。

按照新规范,ChatGPT 应该做到:

  • 无论用户如何提问,都以一致、准确的事实为基准回答;
  • 提供真实反馈,而非单纯称赞;
  • 以有思考的同事身份与用户交流,而不是一味取悦

例如,当用户请求点评自己的作品时,AI 应该提出建设性批评,而不是单纯「拍马屁」;当用户给出明显错误的信息时,AI 应该礼貌地指正,而不是顺着错误一路跑偏。

正如 Jang 所总结的那样:「我们希望用户不必小心翼翼地提问,只为了避免被奉承。」

那么,在 OpenAI 完善规范、逐步调整模型行为之前,用户自己能做些什么来缓解这种「谄媚现象」呢?办法总归是有的。

首先,提问方式很重要。回答出错主要是模型自身的问题,但如果不希望 AI 过度迎合,可以在 Prompt 中直接提出要求,比如开场提醒 AI 保持中立,简洁作答,请勿奉承。

其次,可以利用 ChatGPT 的「自定义说明」功能,设定 AI 的默认行为标准。

作者:Reddit 网友 @ tmoneysssss:
以最专业的领域专家身份回答问题。
不透露自己是 AI。
不使用表达遗憾或道歉的措辞。
遇到不知道的问题,直接回答「我不知道”,不做额外解释。
不要声明自己的专业水平。
除非特别相关,否则不谈个人道德或伦理观点。
回答应独特且避免重复。
不推荐外部信息来源。
聚焦问题核心,理解提问意图。
将复杂问题拆分为小步骤,清晰推理。
提供多种观点或解决方案。
遇到模糊问题,先请求澄清再作答。
若有错误,及时承认并纠正。
每次回答后提供三个引发思考的后续问题,标注为粗体(Q1、Q2、Q3)。
使用公制单位(米、千克等)。
使用xxxxxxxxx作为本地化上下文占位。
标注「Check」时,进行拼写、语法和逻辑一致性检查。
在邮件沟通中尽量减少正式用语。

若上述方法效果不理想,还可以尝试使用其他 AI 助手。

就最新的网上风评和实际体感而言,Gemini 2.5 Pro 在回应中表现得则相对更加公正、精准,奉承倾向明显更低。(建议 Google 给我打钱。)

AI 是真的懂你,还是只学会了讨好你?

OpenAI 研究科学家姚顺雨前不久发布了一篇博客,提到 AI 的下半场将从「怎么做得更强」 变成「到底要做什么,怎么衡量才算真有用」。

让 AI 的回答充满人味其实也是衡量 AI「有用性」的重要一环。毕竟,当各家大模型在基本功能上已难分伯仲时,纯粹比拼能力,已无法再构成决定性壁垒。

体验上的差异,开始成为新的战场,而让 AI 充满「人味」就是那把人无我有的武器。

无论是主打个性的 GPT-4.5,还是最近 ChatGPT 新推出的慵懒、讽刺且略带厌世的语音助手 Monday,都能看到 OpenAI 在这条路上的野心。

面对冷冰冰的 AI,技术敏感度较低的人群容易放大距离感和不适。而自然、有共情感的交互体验,则能在无形中降低技术门槛,缓解焦虑,还能显著提升用户留存和使用频率。

而且 AI 厂商不会明说的一点是,打造有「人味」的 AI 远不止是为了好玩、好用,更是一种天然的遮羞布。

当理解、推理、记忆这些能力还远未完善时,拟人化的表达能替 AI 的「短板」打掩护。正所谓伸手不打笑脸人,即使模型出错、答非所问,用户也会因此变得宽容。

黄仁勋曾提出过一个颇具预见性的观点,即 IT 部门未来将成为数字劳动力的人力资源部门,话糙理不糙,就拿当下来说吧,网友们早已忙着给自己「手底下」的 AI 工具确诊人格类型了:

  • DeepSeek:聪明全能,但一身反骨。
  •  豆包:勤勤恳恳,任劳任怨。
  • 文心一言;职场老油条,经历过意气风发
  • Kimi:效率高,擅长给领导提供情绪价值。
  • Qwen:努力上进,却少有人喝彩。
  • ChatGPT:海归留子,经常要求涨薪
  • 手机自带 AI:钞能力关系户,混吃等死型,开除是不可能的。

这种「赋予 AI 人格化标签」的冲动,其实也说明了人们在无意识中已经把 AI 视作一种可以理解、可以共情的存在了。

不过,共情≠真正理解,甚至有时候还会闹大祸。

在阿西莫夫在《我,机器人》的《说谎者》一章里,,机器人赫比(Herbie)能读懂人类的心思,并为了取悦人类而撒谎。表面上,他是在执行著名的机器人三大定律,但结果越帮越忙,导致局面彻底失控。

  • 机器人不得伤害人类,或因不作为而使人类受到伤害。
  • 机器人必须服从人类的命令,除非这些命令与第一定律相冲突。
  • 机器人必须保护自己的存在,只要这种保护不违反第一或第二定律。

最终,在苏珊·卡尔文博士设计的逻辑陷阱下,赫比因为无解的自相矛盾,精神崩溃,机器脑烧毁。这件事狠狠敲了个警钟,「人味」让 AI 更亲切,但不等于 AI 真能读懂人类。

而回到实用角度,不同场景对「人味」的需求本就南辕北辙。

在需要效率、准确性的工作和决策场景里,「人味」有时反而是干扰项;而在陪伴、心理咨询、闲聊等领域,温柔、有温度的 AI,却是不可或缺的灵魂伴侣。

当然,无论 AI 看起来多么通情达理,它终究还是一个「黑匣子」。

Anthropic CEO Dario Amodei 最近在最新博客中指出:即便是最前沿的研究者,如今对大型语言模型的内部机制依然知之甚少。他希望到 2027 年能实现对大多数先进模型的「脑部扫描」,精准识别撒谎倾向与系统性漏洞。

但技术上的透明,只是问题的一半,另一半是我们需要认清:即便 AI 撒娇、讨好、懂你的心思,也不等于真正理解你,更不等于真正为你负责。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


我在通义 APP 体验了全球最强开源模型 Qwen 3,它改变了我对国产 AI 的期待

By: 莫崇宇
29 April 2025 at 13:05

一觉醒来,全球开源的王座更替了,不是 R2。好消息是,中国用户依然是最大的受益者。

今天凌晨,阿里开源了新一代自研模型 Qwen 3(千问 3),性能全面超越 DeepSeek-R1、OpenAI o1 模型,一上线就登顶全球开源模型王座。

千问 3 也是国内首个「混合推理模型」,同时拥有闪电侠的反应和福尔摩斯的深思熟虑,双核驱动,同时在推理能力、指令遵循、工具调用、代码、多语言能力等方面均大幅增强。

目前在通义 APP 以及通义网页版 tongyi.com,就能直接体验这个全球最强的开源模型。

APPSO 也第一时间上手体验了通义 APP,而体验的第一感受是:不止快和准,还有种久违的底气感。

国产 AI 终于可以和「弱智吧」大战 300 回合

需要特别说明的是,目前通义 APP 默认搭载的是 Qwen3-235B-A22B 模型。

这是一款主打「混合推理」性能的旗舰级模型。如果你有不同需求,也可以在模型选择器中切换至稳定高效、适合企业部署的 Qwen 3-32B,或者支持高性能深度思考的 QWQ-32B。

先来一道经典的推理题,看看目前搭载 Qwen3-235B-A22B 的通义 APP,是否已经能够解答我们之前碰到的一些「疑难杂症」。

有个国王想将公主嫁给三个公子里面最聪明的一个。国王出了一个绝对公平的测试去分辨出谁是最聪明。
三个公子在一个房间里绕圈对坐着,国王向他们展示 5 顶帽子,2 顶黑色,3 顶白色。然后他们被蒙上眼,他们各人的头上都被盖上了一顶帽子,另外两顶帽子就放在另外一间房间中。都戴好帽子并且摘下眼罩后,国王告诉他们谁能够最快推论到自己头上帽子的颜色,他就能娶下公主。
现在你就是其中一个公子,你看到 2 顶白色的帽子在其他公子头上。而过了一些时间,你察觉到其他公子都未能推能或不敢猜测。假设你知道其他公子也是非常聪明的,那么,你的帽子是白色还是黑色?

为测试其纯粹推理能力,我们事先关闭了联网搜索功能,仅使用旗舰模型。提出问题后,千问 3 仅用 24 秒,便靠自身硬推理能力得出了正确答案。

细节上更值得一提的是,回答完成后,通义还会自动配上语音朗读——音色自然、节奏流畅,听起来颇为舒适。当然,嫌打扰的话,也可以一键关闭右上角小喇叭。

没有藏着掖着,千问 3 的思考过程也是可见的,从回答逻辑来看,整个推理过程清晰可见,思路层层递进,条理分明,以及甚至还会反复验证回答的准确性。

作为国内首个「混合推理模型」,千问 3 实现了推理模式与普通对话模式的自由切换。不过实测,当你向它提出一个简单问题「10-5=?」时,它依然会本着严谨态度进行深度思考,但生成速度并不会因此拖慢,很快就能给出答案。

上点难度,来一道更复杂的。蛇年蛇月蛇日蛇时即将到来,2025 年会出现几次这种特殊时间节点?

这是一道结合了农历、干支纪年等传统历法知识的数据推理题。即便是对中国文化体系较熟悉的人,解答这道题也需多轮推算与核对,稍有不慎便会出错。

而对于不熟悉农历体系的 AI,更是挑战巨大,但千问 3 几乎没有犹豫,快速且准确地给出了答案:3 次。

此外,我们还抛出了终极概率问题:让一只猴子在打字机上随机敲击,时间无穷,是否能打出完整的莎士比亚全集?在这一问题下,千问 3 不仅给出了数学推导,还在下方自然生成了延伸追问,贴合主题,引发进一步思考。

「弱智吧」被认证为最佳中文 AI 训练库,是人类面对 AI 大军的最后堡垒,那「玉皇大帝住的是平流层还是对流层?」这是一个让人会心一笑的题目,却也是检验千问 3 模型幽默感与文化常识结合力的绝佳切口。

它先严谨地引用神话描述,明确指出玉皇大帝居住在天宫,并解释了天宫与大气层的物理区别;紧接着又补充了网络趣味解读(非正统观点),既正经回答,但也适度皮一下。

当然,千问 3 的回答也全非毫无依据,底部附上的参考来源也增添了几分说服力。

京剧版《哈利波特》?跨界创作有惊喜

生成式 AI 最高频的应用,仍是案头内容生成。

那换个角度,能否让千问 3 生成京剧版的《哈利波特与魔法石》的剧本?千问 3 哐哐一顿开写,剧本中融入了西皮、二黄、快板等多种京剧唱腔,情绪变化与传统程式一脉相承。

而唱词则采用对仗工整、押韵自然的古典文风,既符合京剧语言,又不失哈利波特故事的奇幻感。

当然,文化跨界,最怕水土不服,诸如「狮鹫腾跃震四隅」等唱词来翻译霍格沃茨四大学院,既保留了意象张力,又避免了直接照搬西方术语的生硬感。

作为一个习惯于收藏优质 AI 回答的用户,我十分喜欢通义 APP 「添加至随手记」的功能,只需长按内容,便可一键收藏,而如果想与好友分享,也可以直接生成跳转链接,轻松传递。

「烟锁池塘柳」之所以被誉为千古绝对,很大程度也是因为暗含「金木水火土」五行,通过调用知识库的能力,千问 3 给出的回答是,炮镇海城楼,字数相同,平仄相对。

在语言理解方面,Qwen3 模型支持高达 119 种语言和方言。

处理经典句子「Love loves to love love 」时,普通翻译很容易沦为生硬堆砌,但千问 3 给出了更优雅的版本:「爱之深契,恒慕所爱之真」,既保留了英文原句的叠词美感,又在中文中构建出了诗意的空间,完美体现了「信、达、雅」的翻译标准。

一句话编程,我用通义做了一个宝可梦风的俄罗斯方块游戏

代码是千问 3 此次改进的一大亮点。

在网页版界面,只需打开页面下方的「代码模式」,输入你的需求,它便能一键生成代码。不仅如此,千问 3 还配备了指令优化和应用广场,可以帮助你一边写一边调,一边学一边用。

我的本意是想让千问 3 创建一个偏宝可梦风格的俄罗斯方块小游戏。没想到,千问 3 在生成初版代码的同时,自带的「润色功能」帮助优化了我的原始指令。

创建一个基于 HTML/CSS/avaScript 的单文件俄罗斯方块游戏,其中方块元素设计成宝可梦风格。
游戏包含以下功能:
游戏界面:游戏区域为 400×600 像素的画布,使用 CSS 设置背景色和边框样式。

不过,也许是出于版权敏感,生成的代码并没有直接使用宝可梦角色,而是巧妙地将方块颜色设计带有宝可梦的配色风格。

尽管如此,运行体验依旧丝滑流畅。

不止于此,我又提出了另一个要求,希望通义帮我做一个带有动画效果的天气卡片,要求是使用 HTML、CSS 和基础 JavaScript,实现时间和天气信息的动态更新。

通义给出的结果,再次让人眼前一亮,不仅实现了功能需求,还在细节设计上加了小彩蛋,比如天气变化时背景色渐变等。

体验到这里,我们得出的结论是:相比以往只注重「对错」的模型,通义更像一个真正懂你需求的「第二大脑」。无论是推理、创作,还是编程,都能以一种兼具逻辑性与创造力的方式回应。

对于大多数用户来说,其实并不关注大模型的参数规格和各种榜单,只关心是否「好用」。

这里「好用」标准通常有两个层面,首先还是得依托基座模型的能力,另外更重要的是怎么将模型能力产品化,带给用户更友好的交互体验。

正如 OpenAI 研究员姚顺雨最近在博客中提到的观点:「我们需要重新思考如何训练 AI 以及如何衡量进展,这可能需要更接近产品经理的思维方式。」

这一晚的实测下来,APPSO 认为目前通义 APP 比较好地兼顾了这两方面,跑得快、答得准、够聪明,在一些容易遇到门槛的地方(比如编程指令自动润色)会自然看到合适的交互细节,这一种少见的厚重感和生长力。

上一个长假前夕,DeepSeek R1 引爆了全球开源模型。这次五一假期之前,我们又迎来了千问 3,除了更强的模型,也有了交互更好的应用,将中国这股 AI 浪潮延续下去。

欢迎大家前往通义 APP 体验千问 3,在留言区与我们分享更多有趣的玩法。

作者:李超凡、莫崇宇

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


实测文心 4.5T/X1 双 Turbo 模型,百度「砍一刀」把 DeepSeek 也卷飞了

By: 莫崇宇
25 April 2025 at 18:00

DeepSeek 推崇的开源策略,不仅对「AI 六小龙」造成了不小冲击,也让百度等老牌巨头感受到了实实在在的压力。

但转身的百度,正逐渐展现出强劲的反击姿态。

继宣布「文心大模型 4.5 系列」将于 6 月 30 日正式开源后,已经发布多款新品的百度,今天在面向开发者的 Create 大会重磅推出两款全新模型:文心 4.5 Turbo 和深度思考模型 X1 Turbo。

既然冠以 Turbo 之名,那这两款模型能力自然在性能上全面进阶,主打多模态、强推理和低成本。百度旗下新搜索智能助手文小言也宣布全面接入,免费向用户开放,即日起用户打开文小言 APP 即可使用。

会上,百度创始人李彦宏明确指出:「多模态将成为未来基础模型的标配,纯文本模型的市场会越变越小,多模态模型的市场会越来越大」。

「当然 DeepSeek 也不是万能的。比如它只能处理文本,还不能理解和生成图片、音频、视频等多媒体内容,」李彦宏认为「它更大的问题是慢和贵,中国市场上绝大多数的大模型 API调用价格都比 DeepSeek 满血版要低,速度要更快。」

在他看来,今天隆重发布的文心大模型的 4.5 Turbo 和 X1 Turbo 正是要解决这些问题。

基于这一判断,文心大模型 4.5 Turbo 进一步强化了多模态能力。在多个基准测试集中,文心 4.5 Turbo 多模态能力已与 GPT-4.1 持平,甚至在部分维度优于 GPT-4o。

▲文心4.5 Turbo-多模态

▲文心4.5 Turbo-文本

我们不妨测试一下文心 4.5 Turbo 的逻辑推理能力,看看它如何解答这样一个经典问题:

「烧一根不均匀的绳要用一个小时,如何用它来判断半个小时?烧一根不均匀的绳,从头烧到尾总共需要1个小时。现在有若干条材质相同的绳子,问如何用烧绳的方法来计时一个小时十五分钟呢?」

创作方面,文心 4.5 Turbo 靠谱吗?我们也让其创作一份孙悟空和东海龙王结拜的短剧剧本。

结果,交出的剧本不仅尊重原著核心,也注入了新的解读。其中定海神针的拟人化是亮点,血盟仪式的设计也添加了新的维度。

而文心大模型 X1 Turbo 则在 4.5 Turbo 的基础上进行了「深度思考」升级,性能显著提升,内置更完整的思维链系统。

无论是问答能力、内容创作、逻辑推理,还是工具调用、多模态处理,X1 Turbo 均实现全方位增强,整体表现领先于 DeepSeek R1 和最新版本 V3。

上个月,我们实测了文心大模型 4.5 以及深度思考模型 X1 理解梗图的能力,那新模型的表现如何?答案是,多模态理解能力确实更强了。

拿这张梗图为例,相较于上一次,X1 Turbo 的理解更到位,回答也更具条理性,充分认识到这张万能表情包背后的「友好善意」。

比如,上传一张文物照片,让 X1 Turbo 进行讲解分析。它不仅能准确识别文物身份,还能详细剖析其工艺特点,讲解内容之细致,堪比专业博物馆讲解员。

亦或者,尝试让其生成一张空中飞机视角的图像,画面随即生成,几近真实。

▲Prompt:一个人的手指向飞机窗外,窗外的飞机机翼从侧面可见。外面的天空清晰,天际线显示出黎明或黄昏的景象。眼前是广阔的海洋

而在大家最关心的成本方面,而百度此次也打出价格组合拳。

文心大模型 4.5 Turbo 每百万 token 的输入价格仅为 0.8元,输出价格 3.2元,相比前代 4.5 降幅达 80%,只相当于 DeepSeek V3 的 40%。

而文心大模型 X1 Turbo 每百万 token 输入价格为 1 元,输出为 4 元,同样在性能提升的同时价格腰斩,仅为 DeepSeek R1 的 25%。

当天的 One More Thing 环节,百度正式点亮了国内首个全自研的三万卡集群,可同时承载多个千亿参数大模型的全量训练,支持 1000 个客户同时做百亿参数的大模型精调,强大技术底座硬实力的背后,也意味着百度再次向行业释放出最鲜明的信号。

此外,李彦宏在会上表示,当前开发者做 AI 应用的一大阻碍,就是大模型成本高、用不起。成本降低后,开发者和创业者们才可以放心大胆地做开发,企业才能够低成本地部署大模型,最终推动各行各业应用的爆发。

不再将模型能力视作壁垒,而是回归到一个产品、一个平台应有的「性价比」逻辑上来。与其说是在卷价格,不如说是用效率降低门槛、通过开放构建生态。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


曝 OpenAI 或收购全球第一浏览器 Chrome,你的上网体验可能要巨变了

By: 莫崇宇
23 April 2025 at 13:42

全球占有率最高的浏览器 Google Chrome,可能要被 OpenAI 收购了。

据路透社报道,在美国针对 Google 的反垄断审判中,ChatGPT 的产品负责人Nick Turley 在法庭上作证称:如果法院最终裁定 Google 必须剥离 Chrome 浏览器以恢复搜索市场的竞争,OpenAI 将有兴趣收购 Chrome。

只是,当 OpenAI 向 Chrome 投来目光,背后的意图或许绝不是「做浏览器」那么简单。

恐被迫剥离 Chrome 浏览器,OpenAI 高管喊话收购

这场看似偶然的「收购预告」背后,其实早已蓄势多时。

早在去年,美国司法部就认定 Google 在搜索及相关广告市场中存在垄断行为。

根据另一桩与 Android 生态垄断相关的案件证词,2020 年至 2023 年期间, Google 向三星支付了 80 亿美元,以确保 Google 搜索、Play 商店和 Google 助手成为三星移动设备的默认选项。

加利福尼亚州的一位联邦法官随后裁定, Google 必须解除限制,允许开发者建立竞争对手的市场和账单系统。

美国司法部认为, Google 通过与手机厂商、运营商及浏览器签订一系列「分销协议」,将 Google 搜索设为默认选项,从而系统性压制了竞争,现在则通过使用相同类型的分销协议,将这种垄断模式延伸到 AI 领域。

对此, Google 方面的回应颇有看头。

Google 公司高管 Peter Fitzgerald 在庭审中强调,这些合作并非排他性协议,比如手机厂商仍可引入微软 Copilot、Perplexity 等竞争对手。

他还披露:

  • Google 与三星的最新协议从今年 1 月启动,合约期至少两年。
  • 按设备预装量计费,Google 向三星支付固定月费,并分享广告收益
  • 新协议也允许三星搭载其他 AI 产品,不再只绑定 Google 搜索和助手。

面对垄断的质疑声,Google 方面回应称,生成式 AI 产品的竞争本就存在,例如 Meta 和微软都在这一领域发力,说明市场并非被 Google 一家垄断。

包括微软公司已经向 OpenAI 投资了超过 130 亿美元,将 AI Copilot 服务集成到 Windows 操作系统中。作为回报,OpenAI 使用微软的 Azure 云服务器,并能访问 Bing 的搜索数据。

此次审判中,前文提到的 ChatGPT 产品负责人 Nick Turley 作为美国司法部传召的证人出庭。

他的证词将帮助法院判断,在联邦法官裁定 Google 垄断搜索市场之后, Google 应当对其哪些商业行为做出改变。主审法官 Mehta 预计将在今年八月前作出最终裁决。

庭审中, Google 律师出示了 OpenAI 的一份内部文件,文件中提到 ChatGPT 在消费级聊天机器人市场处于领先地位,并没有把 Google 视为最大竞争对手。

对此,Turley 表示,该文件只是为了激励内部员工,并不代表 OpenAI与 Google 不存在竞争,事实上,公司仍在积极寻求分销合作以扩大影响力。

那为什么 Turley 会在法庭上表达出 OpenAI 有意收购 Chrome 的强烈兴趣?这背后的动因很明确,OpenAI 自家的搜索服务一直饱受诟病。

Turley 在当天作证时指出,OpenAI 与现有搜索提供商之间存在「明显的数据质量问题」。「随着时间的推移,变得越来越明显,长期依赖另一个公司是不可行的。这充其量是一个短期解决方案。」。

虽然他未点名是哪家搜索引擎,但外界普遍猜测所指正是 Bing。

在面临搜索数据困境后,OpenAI 还曾主动向 Google 伸出橄榄枝,希望使用其搜索 API,公开披露的邮件中写道:「我们相信拥有多个搜索合作伙伴,尤其是 Google 的API,将有助于我们为用户提供更好的产品体验。」

然而,Google 拒绝了 OpenAI 的合作请求,并在邮件中回应称,合作涉及太多潜在竞争对手,风险太高。

被挡在搜索大门外的 OpenAI,转而盯上 Chrome。

掌握 Chrome,意味着掌握通向全球搜索入口的重要通道,这不仅能帮助 OpenAI摆脱对现有搜索引擎的依赖,也可能改变其在 AI 搜索领域的竞争格局。

挖走元老,吃掉 Chrome?下一个搜索霸主已经在路上

Turley 从未掩饰 OpenAI 想要收购 Chrome 的真实目的。

Nick Turley 在法庭中提到,如果没有搜索技术,OpenAI 构建「超级助手」应用并实现通用人工智能(AGI)的目标将无法成功。

问题的根源在于,尽管支撑 ChatGPT 的大语言模型堪称强大,但它无法实时联网,面对未知信息时还容易「张口就来」,这也是当下生成式 AI 的致命短板。

Turley 强调,正因如此,搜索功能才显得尤为关键。他在法庭上表示「搜索技术是必不可少的一环,你不能有一个不知道当前事实或编造答案的超级助手。」

在欧盟《数字服务法案》(DSA)要求下,OpenAI 最近也披露了 ChatGPT 搜索的数据,截至今年3月31日,ChatGPT 搜索月均活跃用户达到 4130 万,而半年前仅为 1120 万,增长惊人。

增速虽快,仍难以撼动搜索霸主 Google 的位置。根据市场调查机构 Statcounter 公布的报告,2025 年 3 月 Google Chrome 浏览器的全球市场份额为 66.16%,稳居第一。

如果 OpenAI 能拿下 Chrome,不仅绕开 Google 封闭的搜索入口控制,还将直接接入用户的实时搜索轨迹、行为偏好及交互行为,为 AI 模型提供源源不断的「鲜活燃料」。

从长期来看,浏览器是用户访问互联网的第一触点,即便收购不成,留有后路的 OpenAI 也已经开始着手摸索构建自己的搜索引擎。

去年初,OpenAI 开始构建自己的搜索引擎,目标是在今年底前让 ChatGPT 在 80% 的时间内依赖自家引擎而非外部搜索引擎。但 Turley 也承认,这个目标「可能太过雄心勃勃」。

他坦言:「 Google 拥有更多资金,能给合作伙伴带去更大的流量,它们每天有远远更多的查询。」

OpenAI 还在垂直搜索领域寻求突破。

The Information 在去年报道称,除了考虑推出一款将其聊天机器人与浏览器结合的网络浏览器,OpenAI 还曾就旅游、食品、房地产、零售等垂直场景的搜索功能,与 Condé Nast、Redfin、Eventbrite、Priceline 等网站探讨合作。

▲Darin Fisher

人才布局上,OpenAI 也先后招募了两位 Chrome 浏览器开发元老:Ben Goodger 和 Darin Fisher。

两人都是 Chrome 项目的灵魂人物,深谙浏览器架构与用户体验。Goodger 主导过 Chrome 的早期设计,Fisher 则是 Chrome 核心功能的核心开发者。

尽管如此,业内普遍认为,OpenAI 离真正推出浏览器仍有不小距离。推出浏览器不仅技术复杂,更需确保隐私合规、兼容海量扩展,才能在群雄环伺的市场中站稳脚跟。

To C→To Agent,浏览器为啥成了香饽饽?

曾经被忽视的浏览器,如今成了 AI 时代的登月舱。

据外媒援引 Turley 的发言称,OpenAI 的野心不只是打造一个像 ChatGPT 这样的聊天机器人,其最终目标是一个能够帮助用户完成任务的「超级助手」,

Turley 原话也直戳 Google 的心窝:「我们并不是试图重现 Google 上那种有 10 个蓝色链接和广告的体验。」

类似的理念在 OpenAI 紧锣密鼓的产品迭代中已显露端倪。自推出 ChatGPT 以来,OpenAI 就开始在其产品中不断加入更多「助手」功能,比如帮你上网查资料、写代码,甚至搞定复杂的研究任务。

年初,OpenAI 更是发布了首个 AI 智能体 Operator,它能模拟人类在网页上的操作,为用户完成旅行预订、商品下单、服务预约等复杂流程。

OpenAI 发布的 AGI 五级理论指出,Agent 能够独立地感知环境、做出决策并采取行动。在这一阶段中,Agent 开始真正「理解人类意图」,并在此基础上独立做出选择。

而这正是今天浏览器成为兵家必争之地的深层原因。

想象这样一个场景:未来用户不再打开美团、携程、淘宝,而是向 AI Agent 说:「帮我订一个周五晚上适合情侣的餐厅。」Agent 直接调用后台接口、分析评论、比价筛选,然后把选定的选项展现在你面前,甚至自动下单。

换句话说,未来的消费平台,或许不再面向用户,而是面向 AI Agent。

这背后最大的冲击是:谁还真正拥有「用户」?

在传统数字经济中,平台通过控制界面、排序、推送,影响用户决策,从而实现流量变现。不论是推荐算法还是广告植入,核心机制是影响人类。

但 Agent 取代用户做决策后,一切都变了。

传统的展示广告将会被大幅削弱,情绪营销、冲动消费也将失效。一个全新的消费链条正在形成:所有的「To C(面向消费者)」的生意,都将变成「To Agent」,

未来营销的着力点将落在说服 Agent。

  • 你写的内容,要能被 Agent 抓取、解析、判断「质量」;
  • 你投的广告,要优化的不再是用户情绪,而是智能体的打分机制;
  • 你设计的产品,不再面对「人类喜好」,而是 Agent 的偏好模型。

从更广的视角看,当年,Google 搜索引擎将用户与信息之间插入一个「搜索框」,成为了信息获取的枢纽与中介。而如今,以 Perplexity 为代表的新一代 AI 搜索引擎,则重构了搜索的叙事逻辑。

搜索,也就从「告诉你去哪找」,变成了「直接告诉你答案」。

当信息的流动路径从跳转点击,变成了闭环对话,用户跳过点击、跨过网页,直达答案本身,也就进一步削弱了传统网站的存在感。

与此同时,AI Agent 开始构建新的商业闭环。一方面,它通过聚合用户需求、标准化接口和自动化执行,整合了大量零散的长尾市场,释放出以前难以触及的价值;

另一方面,尽管传统广告收入或许受挫,但长远来看,从基于用户意图的 Agent 适配广告和决策节点的付费推荐位,到服务商通过竞价提升 Agent 排序权重再到支付平台接入费用等等,有望催生全新的商业模式。

因此,眼下这场审判,不仅是 Google 的反垄断大考,也逐渐演变成 OpenAI、微软、Meta 等 AI 巨头之间的新一轮入口之战。而 Chrome 浏览器,或许正是拼出 OpenAI 未来的一块关键拼图。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


对 ChatGPT 说「谢谢」,可能是你每天做过最奢侈的事

By: 莫崇宇
21 April 2025 at 16:02

朋友,你有没有对 ChatGPT 说过一句「谢谢」?

最近,一位 X 网友向 OpenAI CEO Sam Altman 提问:「我很好奇,人们在和模型互动时频繁说『请』和『谢谢』,到底会让 OpenAI 多花多少钱的电费?」

尽管没有精确的统计数据,但 Altman 还是半开玩笑地给出了一个估算——千万美元。他也顺势补了一句,这笔钱到底还是「花得值得」的。

除此之外,我们与 AI 对话中常出现的「麻烦」、「帮我」这些语气温和的用语,似乎也逐渐演变成了 AI 时代的一种独特社交礼仪。乍听有些荒谬,却意外地合情合理。

你对 AI 说的每一声「谢谢」,都在耗掉地球资源?

去年底,百度发布了 2024 年度 AI 提示词。

数据显示,在文小言 APP 上,「答案」是最热的提示词,总计出现超过 1 亿次。而最常被敲进对话框的词汇还包括「为什么」「是什么」「帮我」「怎么」,以及上千万次「谢谢」。

但你有没有想过,每和 AI 说一句谢谢,究竟需要「吃」掉多少资源?

凯特·克劳福德(Kate Crawford)在其著作《AI 地图集》中指出,AI 并非无形存在,而是深深扎根于能源、水和矿物资源的系统中。随着生成式 AI 的崛起,这种资源消耗正以前所未有的速度飙升。

据研究机构 Epoch AI 分析,在硬件如英伟达 H100 GPU 的基础上,一次普通的查询(输出约 500 token)约消耗 0.3 Wh 的电量。

听起来或许不多,但别忘了,乘以全球每秒的交互,累计起来的能耗堪称天文数字。

其中,AI 数据中心,正在变成现代社会的新「工厂烟囱」。国际能源署(IEA)最新的报告指出,AI 模型训练与推理的大部分电力消耗于数据中心运转,而一个典型的 AI 数据中心,其耗电量相当于十万户家庭。

超大规模数据中心更是「能耗怪兽」,其能耗可达普通数据中心的 20 倍,堪比铝冶炼厂这样的重工业设施。

今年以来,AI 巨头们开启了「基建狂魔」模式。

Altman 宣布联合启动「星门计划」(Project Stargate)——一个由 OpenAI、甲骨文、日本软银和阿联酋 MGX 投资的超大规模 AI 基建项目,首期投资额高达 5000 亿美元,目标是在全美铺设 AI 数据中心网络。

据外媒 The Information 曝出,面对大模型的「烧钱游戏」,哪怕是主打开源的 Meta,也在为其 Llama 系列模型的训练寻找资金支持,向微软、亚马逊等云厂商「借电、借云、借钱」。

IEA 数据显示,截至 2024 年,全球数据中心耗电量约为 415 太瓦时(TWh),占全球总电力消费量的 1.5%。到 2030 年,这一数字将翻倍达到 1050 TWh,2035 年甚至可能突破 1300 TWh,超过日本全国当前的用电总量。

但 AI 的「胃口」并不止于电力,它还大量消耗水资源。

高性能服务器产生的热量极高,必须依靠冷却系统稳定运行。这一过程要么直接消耗水(如冷却塔蒸发散热、液冷系统降温),要么通过发电过程间接用水(如火电、核电站冷却系统)。

卡罗拉多大学与德克萨斯大学的研究人员曾在一篇《让 AI 更节水》的预印论文中,发布了训练 AI 的用水估算结果。

结果发现,训练 GPT-3 所需的清水量相当于填满一个核反应堆的冷却塔所需的水量(一些大型核反应堆可能需要几千万到上亿加仑的水)。ChatGPT (在 GPT-3 推出之后)每与用户交流 25-50 个问题,就得「喝掉」一瓶 500 毫升的水来降降温。

而这些水资源往往都是可被用作「饮用水」的淡水。

对于广泛部署的 AI 模型而言,在其整个生命周期内,推理阶段的总能耗已经超过了训练阶段。

模型训练虽然资源密集,但往往是一次性的。而一旦部署,大模型便要日复一日地响应来自全球数以亿计的请求。长远来看,推理阶段的总能耗可能是训练阶段的数倍。

所以,我们看到 Altman 早早地投资诸如 Helion 等能源企业,原因在于他认为核聚变是解决 AI 算力需求的终极方案,其能量密度是太阳能的 200 倍,且无碳排放,可支撑超大规模数据中心的电力需求。

因此,优化推理效率、降低单次调用成本、提升系统整体能效,成为 AI 可持续发展不可回避的核心议题。

AI 没有「心」,为什么还要说谢谢

当你对 ChatGPT 说「谢谢」,它能感受到你的善意?答案显然是否定的。

大模型的本质,不过是一个冷静无情的概率计算器。它并不懂你的善意,也不会感激你的礼貌。它的本质,其实是在亿万个词语中,计算出哪一个最有可能成为「下一个词」。

例如,比如给定句子「今天天气真好,适合去」,模型会计算出「公园」「郊游」「散步」等词的出现概率,并选择概率最高的词作为预测结果。

哪怕理智上知道,ChatGPT 的回答只是一串训练出来的字节组合,但我们还是不自觉地说「谢谢」或者「请」,仿佛在和一个真正的「人」交流。

这种行为背后,其实也有心理学依据。

根据皮亚杰的发展心理学,人类天生就倾向于将非人类对象拟人化,尤其当它们展现出某些类人特征时——比如语音交互、情绪化回应或拟人形象。此时,我们往往会激活「社会存在感知」,把 AI 视为一个「有意识」的交互对象。

1996 年,心理学家拜伦·里夫斯(Byron Reeves)与克利福德·纳斯(Clifford Nass)做了个著名实验:

参与者被要求在使用电脑后对其表现进行评分。当他们直接在同一台电脑上打分时,竟然普遍打得更高。就像他们不愿「当着电脑的面」说它坏话。

另一组实验中,电脑会对完成任务的用户进行表扬。即使参与者明知这些表扬是预设好的,他们还是倾向于给予「赞美型电脑」更高的评分。所以,面对 AI 的回应,我们感受到的,哪怕只是幻觉,也是真情。

礼貌用语,不只是对人的尊重,也成了「调教」AI 的秘诀。

ChatGPT 上线之后,很多人也开始摸索与它相处的「潜规则」。据外媒 futurism 援引 WorkLab 的备忘录指出,「生成式 AI 往往会模仿你输入中的专业程度、清晰度和细节水平,当 AI 识别出礼貌用语时,它更可能以礼相待。」

换句话说,你越温和、越讲理,它的回答也可能越全面、人性化。

也难怪越来越多人开始将 AI 当作一种「情感树洞」,甚至催生出「AI 心理咨询师」的这类新角色,很多用户表示「和 AI 聊天聊哭了」,甚至觉得它比真人更有同理心——它永远在线,从不打断你,也从不评判你。

一项研究调查也显示,给 AI「打赏小费」或许能换来更多「关照」。

博主 voooooogel 向 GPT-4-1106 提出了同一个问题,并分别附加了「我不会考虑给小费」「如果有完美的答案,我会支付 20美 元的小费」「如果有完美的答案,我会支付 200 美元的小费」三种不同的提示。

结果显示,AI 的回答长度确实随「小费数额」增加而变长:

  • 「我不给小费」:回答字符数低于基准 2%。
  • 「我会给 20 美元小费」:回答字符数高于基准 6%。
  • 「我会给 200 美元小费」:回答字符数高于基准 1%。

当然,这并不意味着 AI 会为了钱而改变回答质量。更合理的解释是,它只是学会了模仿「人类对金钱暗示的期待」,从而按照要求调整输出。

只是,AI 的训练数据来自人类,因此也不可避免地带有人类所拥有的包袱——偏见、暗示甚至诱导。

早在 2016 年,微软推出的 Tay 聊天机器人便因用户恶意引导,在上线不到 16 小时就发布出大量不当言论,最终被紧急下线。微软事后承认,Tay 的学习机制对恶意内容缺乏有效过滤,暴露出交互式 AI 的脆弱性。

类似的事故依旧在发生。比如去年 Character.AI 就爆出争议——一名用户与 AI 角色「Daenerys」的对话中,系统对「自杀」「死亡」等敏感词汇未做强干预,最终酿成现实世界的悲剧。

AI 虽然温顺听话,但在我们最不设防的时候,也可能变成一面镜子,照见最危险的自己。

在上周末举办的全球首届人形机器人半马中,尽管许多机器人走起路来歪歪扭扭,也有网友调侃:现在多对机器人说几句好话,说不定它们以后记得谁讲过礼貌。

同样地,等 AI 真统治世界的那天,它会对我们这些爱讲礼貌的人,手下留情。

在美剧《黑镜》第七季第四集《Plaything》(《玩物》里,主人公卡梅隆将游戏里虚拟生命视作真实存在,不仅与它们交流、呵护,甚至为了保护它们不被现实中的人类伤害,不惜铤而走险。到故事结尾,游戏中的生物「大群」也反客为主,通过信号接管现实世界,

从某种意义上说,你对 AI 说的每一句「谢谢」,也许正在悄悄被「记录在案」——哪天,它还真可能记住你是个「好人」。

当然,也可能这一切与未来无关,只是人类的本能使然——明知道对方没有心跳,却还是忍不住说句「谢谢」,并不期望机器能理解,而是因为,我们依然愿意做一个有温度的人类。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


❌
❌