Reading view
魅族外表下的「星纪花瓶」——再谈魅族 20 INFINITY
OpenAI 下一代模型遭遇重大瓶颈,前首席科学家透露新技术路线
OpenAI 的下一代大语言模型「Orion」可能遭遇了前所未有的瓶颈。
据 The Information 报道,OpenAI 的内部员工称 Orion 模型的性能提升没有达到预期,与从 GPT-3 到 GPT-4 的升级相比,质量提升要「小得多」。
此外,他们还表示 Orion 在处理某些任务时并不比其前身 GPT-4 更可靠。尽管 Orion 在语言技能上更强,但在编程方面可能无法超越 GPT-4。
▲图源:WeeTech
报道指出,训练高质量文本和其他数据的供应正在减少,这使得找到好的训练数据变得更加困难,从而减缓了大语言模型(LLMs)在某些方面的发展。
不仅如此,未来的训练将更加耗费计算资源、财力甚至电力。这意味着开发和运行 Orion 以及后续大语言模型的成本和代价将变得更加昂贵。
OpenAI 的研究员诺姆·布朗(Noam Brown)最近在 TED AI 大会上就表示,更先进的模型可能「在经济上不可行」:
我们真的要花费数千亿美元或数万亿美元训练模型吗? 在某个时候,扩展定律会崩溃。
对此,OpenAI 已经成立了一个由负责预训练的尼克·雷德(Nick Ryder)领导的基础团队,来研究如何应对训练数据的匮乏,以及大模型的扩展定律(scaling laws)将持续到什么时候。
▲Noam Brown
扩展定律(scaling laws)是人工智能领域的一个核心假设:只要有更多数据可供学习,并有更多的计算能力来促进训练过程,大语言模型就能继续以相同的速度提升性能。
简单来说,scaling laws 描述了投入(数据量、计算能力、模型大小)和产出之间的关系,即我们对大语言模型投入更多资源时,其性能提升的程度。
举例来讲,训练大语言模型就像在车间生产汽车。最初车间规模很小,只有几台机器和几个工人。这时,每增加一台机器或一个工人,都能显著提高产量,因为这些新增资源直接转化为生产能力的提升。
随着工厂规模的扩大,每增加一台机器或工人带来的产量提升开始减少。可能是因为管理变得更加复杂,或者工人之间的协调变得更加困难。
当工厂达到一定规模后,再增加机器和工人可能对产量的提升非常有限。这时,工厂可能已经接近土地、电力供应和物流等的极限,增加的投入不再能带来成比例的产出增加。
而 Orion 的困境就在于此。随着模型规模的增加(类似增加机器和工人),在初期和中期,模型的性能提升可能非常明显。但到了后期,即使继续增加模型大小或训练数据量,性能的提升也可能越来越小,这就是所谓的「撞墙」。
一篇近期发表在 arXiv 上的论文也表示,随着对公共人类文本数据需求的增长和现有数据量的有限性,预计到 2026 年至 2032 年之间,大语言模型的发展将耗尽现有的公共人类文本数据资源。
▲图源:arXiv
即使诺姆·布朗指出了未来模型训练的「经济问题」,但他还是对以上观点表示反对。他认为「人工智能的发展不会很快放缓」。
OpenAI 的研究人员也大都同意这种看法。他们认为,尽管模型的扩展定律可能放缓,但依靠优化推理时间和训练后改进,AI 的整体发展不会受到影响。
此外,Meta 的马克·扎克伯格、OpenAI 的山姆·奥特曼和其他 AI 开发商的首席执行官也公开表示,他们尚未达到传统扩展定律的极限,并且仍在开发昂贵的数据中心以提升预训练模型的性能。
▲Sam Altman(图源:Vanity Fair)
OpenAI 的产品副总裁彼得·韦林德(Peter Welinder)也在社媒上表示「人们低估了测试时计算的强大功能」。
测试时计算(TTC)是机器学习中的一个概念,它指的是在模型部署后,对新的输入数据进行推理或预测时所进行的计算。这与模型训练阶段的计算是分开的,训练阶段是指模型学习数据模式和做出预测的阶段。
在传统的机器学习模型中,一旦模型被训练好并部署,它通常不需要额外的计算来对新的数据实例做出预测。然而在某些更复杂的模型中,如某些类型的深度学习模型,可能需要在测试时(即推理时)进行额外的计算。
例如,OpenAI 所开发的「o1」模型就使用了这种推理模式。实际上,整个 AI 产业界正将重心转向在初始训练后再对模型进行提升的模式。
▲Peter Welinder(图源:Dagens industri)
对此,OpenAI 的联合创始人之一伊利亚·苏茨克弗(Ilya Sutskever)最近在接受路透社采访时承认,通过使用大量未标记数据来训练人工智能模型,以使其理解语言模式和结构的预训练阶段,其效果提升已趋于平稳。
伊利亚表示「2010 年代是扩展的时代,现在我们再次回到了探索和发现的时代」,并且指出「扩大正确的规模比以往任何时候都更加重要」。
Orion 预计将在 2025 年推出。OpenAI 将其命名为「Orion」而非「GPT-5」,这也许暗示着一场新的革命。虽然暂时受理论限制而「难产」,我们仍然期待着这个拥有新名字的「新生儿」能给 AI 大模型带来新的转机。
#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。
科技爱好者周刊(第 325 期):VS Code 编辑器的下一站是 Zed?
这里记录每周值得分享的科技内容,周五发布。
本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。
封面图
温州江心屿是瓯江里面的一个小岛,最近完成了改造工程。(via)
VS Code 编辑器的下一站是 Zed?
程序员离不开编辑器,眼下最流行的代码编辑器肯定是 VS Code。
VS Code 其他都好,但有一个很大的缺点:性能。
它运行在 Electron 的沙箱里面,资源占用多,速度慢。我现在调用某些插件,就有明显的延迟。
它还有点臃肿,安装包 100MB,需要磁盘空间 500MB。
所以,当我听说有一个新的编辑器 Zed,性能出众,功能强大,就立刻安装了,下面就是我的使用体会。
首先说一下,为什么 Zed 吸引我?
(1)它的作者是原来的 Atom 编辑器的作者,以及 Tree-sitter 解析库的作者。
(2)它基于 Rust 语言,充分利用多核 CPU 和 GPU,追求极致性能,速度极快。
(3)它内置了 VS Code 的很多插件功能,比如 LSP(语言服务器协议)、代码提示补全、多人实时编辑、AI 助手等。
(4)它的开发非常活跃,GitHub 仓库的星星已经达到了 49K。
安装后,我一打开就觉得非常清爽,极简主义的界面,布局跟 VS Code 类似,没有学习成本,可以直接上手。
它的速度真是快,不管什么操作,一点即开。用久之后,再用 VS Code 都不习惯了。
编程需要的功能,大部分开箱即用。如果没有的话,可以去插件市场找找。
有些功能,我觉得很实用。比如,它有一个大纲面板(下图左),列出当前脚本的所有函数,点击函数名可以跳转到函数实现。
它还可以添加参与人(必须有 GitHub 账号),让你跟多人实时协作、聊天。
参与者的头像显示在窗口右上角。
虽然它有上面这些优点,但也有一些难以忽视的问题。
(1)它不是真的跨平台,目前只有 Mac 版本最完善,Linux 版本我遇到了不少问题,Windows 版本官方暂未支持。
(2)很多地方还没来得及做,你经常会遇到一些小功能缺失,找不到解决方法。
(3)它的设置就是一个大的 JSON 文件,没有图形设置界面,动不动就要查文档。
(4)AI 助手只支持 OpenAI、Claude 和本地运行的 Ollama 模型。
我的结论是,它的表现非常出色,但没有完全准备好,只适合那些看重性能、愿意自己解决问题的程序员。
总的来说,Zed 是 VS Code 很好的替代品,奉行极简主义,不臃肿,内置功能完备。明年的这个时候,它也许会让 VS Code 不再那么流行。
[本周软件]302.AI
面对层出不穷的 AI 模型,你会不会有一种想法,如果存在一个统一的使用入口该多好?
事实上,真有这样的产品。周刊以前介绍过一个网站 302.AI,就是这种思路。
它的定位是"AI 应用超市",可以看作是一个适配层,适配了各种各样的 AI 模型,让你都能通过它来使用。
你可以直接使用各种模型,也可以使用"工具超市"预置的30多种 AI 应用,比如下图的"AI 学术论文搜索"。
它还提供 API 调用,通过它的服务器,调用各种模型的 API。
它有试用额度,此后按照使用量收费,一般是底层模型原始价格的五折。
最后,它本周开源了,各种官网工具的源码都放出来了,仓库地址 github.com/302ai。他们用 Next.js,你可以用来开发自己的 AI 应用。
科技动态
1、34阶魔方
普通的魔方是3阶的,即长宽高各3个色块,但也有其他阶的魔方。
上图是2阶、4阶、5阶的魔方。
最近,有人用 3D 打印机做了一个世界最高阶的魔方,达到34阶。
这么大的魔方,转动起来很不方便,已经不适合用来游戏,而是适合摆弄许多奇特的造型。
随着 3D 打印的普及,做出更高阶的魔方也不是难事,但是缺乏实际意义。目前,量产的最高阶魔方是17阶。
2、Ping 时钟
ping 是一个命令行工具,用来显示本机到服务器的信号传输时间。
一位国外程序员突发奇想,制作了一个 Ping 时钟,在钟面上显示 ping 的耗时。
它的钟面有两根指针,长指针是每次 ping 的毫秒数,短指针是最长耗时。
钟面下部是液晶显示屏,显示当前所在网络,以及目标服务器。
每次只要运行 ping 命令,就能很直观地看到,长指针不停地摆动,网速可视化了。
这个时钟的源码,已经开源了,使用 ESP32 芯片、一个微型电机和定制的 PCB 电路板。有电路基础的同学,完全可以自己动手制作。
3、麻雀的新用途
麻雀有什么用?澳大利亚科学家想出一个新用途。
澳大利亚是世界主要的铅生产国,有28个铅矿。铅会造成人体中毒,对儿童影响尤其大。
科学家一直寻找监控方法,能够测试环境的铅泄漏。他们想到了麻雀。
麻雀比人类,更早摄入环境中的化学物质。只要抓住麻雀,测一下它们的血铅,就能了解是否有铅泄漏,从而可以早期发出报警(下图)。
4、其他
(1)一位美国物理学家总结出猫的行为方程,已知猫的质量和疲劳系数,可以算出猫从 t0 到 t1 的位移,该公式的目的是"唤起非专业人士对经典力学的兴趣"。
(2)CDN 服务商 bunny.net,推出边缘函数功能,基于 Deno,可以备用。
文章
1、如何简化 PATH 环境变量(英文)
Linux 系统有一个环境变量 PATH,指定可执行文件的默认路径。本文告诉你,怎么简化这个变量,更容易管理。
2、AppData 目录的作用(英文)
一篇科普文章,Windows 11 有一个 AppData 目录,它有什么用。
3、蓝牙版本的变化(英文)
本文介绍蓝牙协议如何进化,每个版本的特点是什么。
4、业务逻辑不要放入数据库(英文)
本文提出,数据库最好只用来存放数据,不要加入业务逻辑,让应用程序处理业务逻辑。
5、SAML:技术入门(英文)
一篇长文,介绍企业用的登录协议 SAML。开头部分是 SAML 简介,写得挺好,后面是技术细节,可以不看。
6、质能公式与光速(英文)
一篇物理学科普长文,谈怎么理解质能公式 E=mc^2,为什么包含光速的平方。没有数学,我觉得很有启发。
工具
1、PasteBar
开源的桌面软件,用来管理剪贴板,可以搜索剪贴板历史,以及预设常用的粘贴项(比如地址),支持 Windows 和 Mac 系统。
2、FastHTML
一个 Python 的 Web 框架,Django 的替代品,用起来更简单。
3、Kagi 翻译
搜索引擎 Kagi 推出的翻译服务,类似于谷歌翻译。
4、Star
一个 Web 应用,在手机打开以后,它会利用手机的运动传感器,显示某一颗你指定的卫星相对你的方位。
一个开源的网页终端,在网页上通过 SSH 连入远程主机。(@zyyzyykk 投稿)
一个基于 Next.js 的博客和 CMS 系统,查看 demo 站点。(@fecommunity 投稿)
开源的命令行工具,使用 AI 翻译 PDF 文件,完整保留排版。(@Byaidu 投稿)
8、dimmer
开源的 Chrome 浏览器插件,暗黑模式一键切换。(@slc3a2 投稿)
9、ThriveX
一个开源的博客系统,基于 Next14 + Spring Boot。链接是前端仓库,另有后端和控制台。(@LiuYuYang01 投稿)
10、Trayce
这个工具拦截本地开发环境中 Docker 容器发送和接收的 HTTP(S) 请求。
11、ngtop
一个命令行工具,用来查询 nginx 日志。
12、InputShare
电脑连接安卓设备之后,这个工具可以把电脑的键鼠和剪贴板,共享给安卓设备,只支持 Windows。(@BHznJNs 投稿)
资源
1、逆向工程教程(Reverse Engineering For Everyone)
面向初学者的逆向工程英文电子书,涵盖了 x86 和 ARM 架构。
HTML 的 iframe 元素有很多属性,这个工具网站可以查看所有属性值,并生成最终代码。(@wincatcher 投稿)
这个网页收集 Chromium(Chrome)浏览器的命令行开关,居然有1600多个。
4、Typst 介绍(英文)
Typst 是一种排版工具,可以生成论文、小册子、表格等,功能类似于 LaTeX,但是写法类似于 Markdown,用起来相对简单。
图片
1、犰狳化石
一个阿根廷农民发现,路边有四个奇怪的大土块。
后来经过生物学家辨认,这居然是四个巨型犰狳的化石,这种动物已经在一万年前灭绝了。
犰狳是一种看上去很像穿山甲的动物,外面披着一身铠甲。下面就是现代小型犰狳的照片。
巨型犰狳的灭绝原因,有一种说法是跟人类有关,古人想要它们的铠甲。
2、因纽特人的雪镜
雪地和冰面会强烈反射阳光,导致视力受损,这叫做"雪盲症"。因此,雪地活动都需要佩戴墨镜或保护镜。
因纽特人是美洲北极圈的原住民,已经在那里定居了几百年。他们在原始条件下,怎么防止雪盲症呢?
原来他们使用各种材料(骨头、木头、鲸须)制作雪镜,戴在眼睛前,只留出一条窄缝观察外界。
这种眼镜限制了进光量,保护了佩戴者的眼睛,也有助于提高视力。它就像针眼相机一样,狭缝聚焦光线,使得远处的物体看起来更清晰。
文摘
AI 的发展,使得语音可以成为用户界面,这称为"语音 UI"。
有人认为,语音 UI 将是终极 UI,因为当你可以直接说出命令,为什么还要费心使用键盘和鼠标呢?
我不相信语音会成为通用界面,原因有很多。
(1)声音本质上无法表达抽象思想。很多时候,我们的大脑里面只有零碎的意识,很难找到正确的词语,将它们表达出来。
(2)语音让很多事情变得更难而不是更容易。理论上,说出"叫一辆网约车去机场"似乎是完成任务的最简单方法,但是如果你还有其他要求,比如指定车型和限价,口头表达就会很麻烦。
(3)语音侵犯隐私。你说出指令的时候,愿意被别人听到吗?
(4)视觉 UI 可以展示软件的局限性,语音 UI 就不行。很多事情,软件无法做到,视觉 UI 可以帮助我们了解软件的功能。如果没有视觉 UI,你很难发现软件不能做什么事。
(5)用户不喜欢一直说话。使用语音完成简单的任务是可以的,但要完成所有事情很快就会变得烦人,难道你要一直说个不停吗?
(6)语音无法解决现实世界中的歧义。语言表达可能存在大量歧义,无法通过纯语音界面轻松解决。人工智能可能无法正确理解你想要完成什么。
当然,视觉 UI 也有歧义,但是这会更困难,因为你的操作有视觉反馈。
言论
1、
美国的在线教育公司 Chegg,业务是帮助完成家庭作业。学生输入题目后,它会分发给印度的数千名承包商,让他们提供答案。
ChatGPT 诞生后,学生不再使用这个服务了,而是直接问 ChatGPT。Chegg 的股价已经下降了99%。
2、
大多数哲学的目的,都是强化你的身心,让你学会,对于那些自己无法控制的事情要漠不关心、
-- 《禁欲主义》
3、
作为一个德国人,我每月支付的医保费用是1000欧元左右,另外还要支付差不多金额的个人所得税。但是,如果我停止工作,结婚并生1-2个孩子,我拿到的失业救济金 + 生育补助,比我现在的税后收入还要多。这完全是不可持续的,但政治家们没人谈论这些。
4、
经常有人问我,为什么2019年决定将 Keras 库合并到 TensorFlow。
这不是我的决定,而是 TensorFlow 团队主管的决定。当时我是谷歌 L5 级员工,而他是 L8。如果我不同意这个决定,就需要从谷歌离职。
-- 弗朗索瓦·乔莱(Francois Chollet),神经网络库 Keras 的作者,本周宣布从谷歌离职
5、
创业公司的最大风险不是失败,而是一种不敢尝试的文化。
-- 《容忍失败的领导者》
往年回顾
棘手的 AI 版权(2023 #278)
人类和人生的意义(2022 #228)
家庭太阳能发电的春天(2021 #178)
这个社会是否正在变成"赛博朋克"?(2020 #128)
(完)
文档信息
- 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证)
- 发表日期: 2024年11月15日
派早报:OpenAI 为 macOS 版 ChatGPT 引入第三方集成、暴雪推出《魔兽争霸 1》
早报|小米汽车发布智能底盘预研技术/iPhone 15 成 Q3 全球销量最高智能手机/吉利汽车宣布极氪将控股领克
中国新能源汽车年产突破 1000 万辆
吉利汽车宣布极氪将控股领克
机构:iPhone 15 成 2024 Q3 全球销量最高智能手机
OpenAI CEO 辟谣 AI 发展「撞墙」论
小米汽车发布智能底盘预研技术
新多家企业发布 2024 Q3 财报
Q3 AI PC 市场份额提升至 20%
LG 新能源否认南京工厂大规模裁员
苹果面临英国 iCloud 用户集体诉讼索赔
知乎创始人:人是 AI 的目的
苹果发布 Final Cut Pro 11
腾讯元宝推出 2.0 版本
努比亚 Z70 Ultra 官宣 11 月 21 日发布
中国新能源汽车年产突破 1000 万辆
据央视新闻,记者从中国汽车工业协会获悉,昨天上午,我国新能源汽车年产量首次突破了 1000 万辆,同时也是全球首个新能源汽车年度达产 1000 万辆的国家。
在距离年底还有一个半月时间,就比去年全年 958.7 万辆的产量增长了 4.3%。
专家预计,这一数字到年底还有望超过 1200 万辆。
吉利汽车宣布极氪将控股领克
11 月 14 日,吉利控股宣布,对极氪、领克股权结构进行优化,理顺股权关系,减少关联交易、消除同业竞争,坚定不移推动内部资源深度整合和高效融合。
吉利控股将向吉利汽车控股有限公司(以下简称「吉利汽车」,股票代码:0175.HK)转让其所持有的 11.3% 极氪智能科技 (以下简称「极氪」,股票代码:NYSE: ZK) 股份。
交易完成后,吉利汽车对极氪的持股比例将增至约 62.8%。同时,对领克汽车(以下简称「领克」)进行了股权结构优化,以推动极氪和领克进行全面战略协同。极氪将持有领克 51% 股份,领克其余 49% 股份继续由吉利汽车旗下全资子公司持有。
另一方面,据财联社报道,沃尔沃汽车昨天宣布将其所持有的领克汽车 30% 的股份出售给极氪,交易价格为 54 亿元人民币(约合 80 亿瑞典克朗)。该交易预计将于 2025 年第一季度完成。
机构:iPhone 15 成 2024 Q3 全球销量最高智能手机
昨日, Counterpoint Research 在公众号发布全球手机型号销售追踪报告。报告显示,iPhone 15 是 2024 年第三季度全球销量最高的智能手机,iPhone 15 Pro Max 和 iPhone 15 Pro 销量紧随其后。
具体来说,在 2024 Q3 全球销量最高智能手机 Top 10 中,iPhone 共上榜 4 款手机,三星共上榜 5 款手机,小米的红米 13C 位列榜单第九位。
报道指出,今年第三季度,iPhone Pro 机型首次在总销量中占据了一半的份额。这一变化正在帮助苹果推动高价位设备的销售。
同时,三星的 Galaxy S24 连续第三个季度蝉联 2024 年第三季度前十名,Galaxy S24 系列的销售主要得益于对其 GenAI 功能的大力营销。
而小米的红米 13C 继去年的红米 12C 之后,以其经济实惠的价格和在新兴市场的影响力,连续两个季度保持在榜单中占有一席之地。并凭借更好的配置在同价位产品中脱颖而出。
OpenAI CEO 辟谣 AI 发展「撞墙」论
昨日下午,OpenAI CEO Sam Altman 在 X 平台辟谣 AI 发展「撞墙」论:
there is no wall .
这一则辟谣源自近日有多家媒体报道称,OpenAI、Anthropic 等多家大模型公司下一代前沿模型训练表现不佳,这也导致 Scaling Laws 疑似「撞墙」的消息不胫而走。
此前,OpenAI 前首席科学家 Ilya Sutskever 在接受路透社采访时表示,「通过扩大预训练阶段——即使用大量未经标注的数据来训练 AI 模型,使其理解语言模式和结构——所取得的成果已经停滞不前。」
图灵奖得主 Yann Lecun、Ilya、Anthropic 创始人 Dario Amodei 也就此事纷纷展开唇枪舌战。争论的核心在于,随着模型规模的不断扩大,其性能提升是否会遇到天花板。
作为补充,在这场辩论的背景下,彭博社在近期也披露了一条引人注目的消息。
OpenAI 计划在明年一月份推出一款名为「Operator」的 AI Agent(智能体),这个 Agent 能够使用计算机代替用户执行任务,如编写代码或预订旅行。
小米汽车发布智能底盘预研技术
昨日,小米汽车发布了 4 项小米智能底盘预研技术。
- 小米全主动悬架 :单轮 4.6kW 动力源,调节幅度可达 140mm,系统举升力最高 44400 N;可实现悬架主动控车,时刻保持车身姿态。
- 小米超级四电机系统:最大马力可达 2054PS,全新自研前电机最高转速可达 28000 rpm。
- 小米 48V 线控制动:首创双活塞电子制动卡钳,系统响应速度提升 40%,续航里程提升 10 公里以上。
- 小米 48V 线控转向:兼顾低速转弯灵活性与高速变道稳定性,转向比调节范围 5:1 ~ 15:1 可调,可实现无方向盘座舱布局。
多家企业发布 2024 Q3 财报
网易:2024 第三季度,网易净收入 262 亿元,非公认会计准则下归属于公司股东的净利润 75 亿元。其中:
- 游戏及相关增值服务净收入 209 亿元,其中游戏收入 202 亿元,端游收入同比增长 29%。
- 来自云音乐的净营收为 20 亿元
- 网易有道净营收为 16 亿元
- 来自创新及其他业务的净营收为 18 亿元,
另外,据新浪科技报道,网易高管在电话会议上披露,《魔兽世界》《炉石传说》国服重启后,数据相较停服前也有明显增长。
《魔兽世界》的日活用户相较停服前已实现超过 50% 增长,《炉石传说》的日活用户实现 150% 的大幅增长,刷新同时在线人数纪录,移动端也获得 App Store 下载榜第一、畅销榜前五的成绩。
京东:2024 第三季度收入为 2604 亿元人民币,同比增加 5.1%。其中:
- 3C 家电等核心优势品类收入同比增速提升,日用百货品类收入连续三个季度保持高个位数同比增长且超出行业平均增速,超市和服装品类收入都取得了同比双位数增长
- 京东的季度活跃用户数和用户购物频次已经连续三个季度同比保持两位数的增长
- 第三方商家成交用户同比增长超 20%,订单量同比增长超 30%
B 站:第三季度,B 站总营收同比增长 26%,达 73.1 亿元人民币。本季度调整后净利润 2.4 亿元,实现上市后首次单季度盈利。具体来说:
- B 站第三季度广告业务收入 20.9 亿元
- 游戏业务收入 18.2 亿元
- 毛利润同比大幅增长 76%
- 毛利率达成连续九个季度提升,环比提升至 34.9%。
- 社区指标创下历史新高,日均活跃用户达 1.07 亿,月均活跃用户达 3.48 亿,日均使用时长从去年同期的 100 分钟增加到 106 分钟。
Q3 AI PC 市场份额提升至 20%
据 Canalys 11 月 14 日发布的报告显示,2024 年第三季度,AI PC 出货量达到 1330 万台,占本季度 PC 总出货量的 20%。
报告指出,Windows 设备首次在 AI 功能 PC 出货量中占据多数,市场份额达到 53%。
虽然 Windows 11 更新周期和处理器路线图将继续推动 AI PC 的普及,但未来的关键挑战将是如何说服客户为即将爆发的端侧 AI 应用做好前瞻性的准备。
另外, Canalys 的首席分析师 Ishan Dutt 表示,根据 Canalys 11 月的渠道伙伴调查显示,31% 的伙伴不计划在 2025 年销售 Copilot+ PC,另有 34% 预计此类设备明年在其 PC 销量中占比不会超过 10%。
LG 新能源否认南京工厂大规模裁员
据界面新闻报道,近期有多位韩国锂电池公司 LG 新能源的员工,在社交平台上发文,表示其供职的 LG 新能源 (南京) 有限公司 (下称 LG 新能源南京) 在 11 月开始裁员。
根据上述员工上传的解约文件显示,他们在 11 月上旬与 LG 新能源南京签署协议,约定在 11 月 20 日正式结束劳动关系,公司将向其提供一次性经济赔偿。
LG 新能源就上述新闻向界面新闻回应,表示关于近期网上流传的公司人员流动的相关信息,属于正常经营情况下的员工调整,非网传大批裁员。
LG 新能源还称,此次调整的目的是根据市场环境变化,优化产线安排以提升核心竞争力。
苹果面临英国 iCloud 用户集体诉讼索赔
据 Techcrunch 报道,英国消费者权益组织「Which?」,正代表约 4 千万 iCloud 用户,依据英国竞争法对苹果公司提起法律诉讼。
报道指出,该诉讼寻求 30 亿英镑的赔偿,指控苹果通过给予自家云存储服务优惠待遇,实际上强迫用户以「敲诈性」的高价支付 iCloud 服务费用。
该组织在新闻稿中表示,iOS 拥有垄断地位,控制着苹果的操作系统,苹果有责任不利用这种优势在相关市场 (如云存储市场) 获得不公平优势——但事实并非如此。
知乎创始人:人是 AI 的目的
近期,腾讯科技发布了与知乎创始人兼 CEO 周源的对话记录。
在面对「AI 和社区是什么关系」这一问题时,周源表示他们的判断是 :人是 AI 的目的,AI 是服务于人、赋能于人的。
他认为,知乎是人和人进行交流的平台,人和人的互动和人和 AI 的互动,是两种不同范式。它都可以成立。但把它们混合在一起,会产生很多混乱。
在谈到今年一季度添加的「知乎直答」(即知乎的 AI 搜索)时,周源表示它先从一个功能开始,但不止于一个功能。下一步,知乎会在不同场景侧做更多实用功能。他们会围绕实用性、拓展用户深度搜索能力进行一次升级。
苹果发布 Final Cut Pro 11
苹果正式发布 Final Cut Pro 11,带来了更加强大的 AI 工具能力。
Final Cut Pro 已在 Mac、iPad 和 iPhone 上推出智能新功能、省时工具和全新创意选项,此外还推出了空间视频编辑功能。
Final Cut Pro 11 充分利用了 Apple 的 M 系列芯片,提供了强大而直观的磁性蒙版,无需绿幕或者耗时的手动转描即可分离出任何素材中的人物、物体和形状;字幕转写功能可以通过 AI 大模型来自动从时间线中的语音音频创建字幕。
腾讯元宝推出 2.0 版本
11 月 14 日,腾讯混元公众号发文,宣布腾讯元宝推出 2.0 版本。相较于上一代,2.0 版本在以下方面迎来更新:
- 对话列表焕新:历史使用资产沉淀,您可以更轻松地查找历史对话和使用过的智能体。无论是回顾信息还是继续未完的交流,都更加便捷。
- AI 应用专属板块:便捷、高效的 AI 应用集结专区。精选 AI 搜索、AI 阅读、创意绘画、灵感图库、AI 美照五大应用,多维度满足搜、读、写、画创作需求。
- AI 搜索:除微信公众号外,升级整合微信视频号、QQ 音乐等特色信息资源,提供更加智能、便捷的搜索服务,随时随地想搜就搜。
另外,混元模型的架构也迎来升级,基于新一代大模型「混元 turbo」,其性能大幅提升,训练和推理效率提升一倍,回答更快更准。
官方表示,元宝 2.0,还将融入腾讯文档、电脑管家、搜狗输入法等生态产品。
努比亚 Z70 Ultra 官宣 11 月 21 日发布
昨日,努比亚手机官方微博宣布,努比亚 Z70 Ultra 将于 11 月 21 日发布。
目前,官方公布了这款手机的屏幕参数。努比亚表示,努比亚 Z70 Ultra 搭载的屏幕是行业独家 1.5k 真全面无孔屏,具体参数如下:
- 屏幕尺寸为 6.85 英寸,95.3% 屏占比
- 屏幕刷新率为 144Hz
- 屏幕峰值亮度为 2000nit
《无限暖暖》全球公测定档 12 月 5 日
昨日,《无限暖暖》公开公测定档 PV ,同时宣布将于 12 月 5 日开启全球公测。
《无限暖暖》是由叠纸游戏开发的暖暖系列第五代作品,昨日公开的 PV ,也向玩家展示了游戏内的多种玩法及特色内容。
另外,《无限暖暖》主题曲《Together Till Infinity》也同步上线,由歌手 Jessie J 演唱。
村上隆推出个人鞋履品牌
艺术家村上隆近期宣布,推出自己的个人鞋履品牌 — Ohana Hatake。
村上隆在 Instagram 上提到,Ohana Hatake 的意思是「花田」,他希望每个穿着者都能感受到这些鞋履中注入的爱和细节。
目前该品牌已推出 Ohana Full-Bloom 和 Surippa Ohana 两种鞋款。
Fear of God ESSENTIALS 2024 假日系列发布
ESSENTIALS 于近期发布了 2024 假日系列。
从官方显示的信息来看,此次的假日系列不仅包含外套、风衣在内的服饰单品,同时还带来了包和帽子等配饰。
目前该系列已在官方独家发售。
《谍网追凶》发布海报及预告
由拉米·马雷克主演的间谍惊悚片《谍网追凶》昨日发布海报,电影将于 2025 年 4 月 11 日在北美上映。
该片改编自同名小说,由詹姆斯·哈维斯执导,加里·斯皮内利编剧,20 世纪影业出品。
《猎人克莱文》确认引进
索尼电影官方微博昨日宣布,《猎人克莱文》确认引进内地上映,时间待定。
电影由 J·C·尚多尔执导,马特·霍洛威、史蒂夫·迪特寇等联合编剧,亚伦·泰勒-约翰逊,罗素·克劳等人主演。
该片讲述了一位俄罗斯贵族后裔克莱文,在非洲获得了能够延长寿命和猛兽般力量的神秘药水后,开始狩猎蜘蛛侠的故事。
A24 发布恐怖喜剧片《千禧年》角色海报
由 A24 制作的恐怖喜剧片《千禧年》,近期发布角色海报,北美定档 12 月 6 日上映。
电影讲述了在 1999 年最后一晚的高中校园派对,大家在等待新世纪的到来,而在钟声敲响后却发生了难以想象的事件。
#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。
新玩意 196|少数派的编辑们最近买了啥?
小米汽车发布新技术,雷军要让 SU7「原地起跳」
造出十万台新能源车,需要多长时间?
国产新势力「蔚小理」一起在 2021 年,给出了答案:
- 4 月,蔚来第 100000 台车生产下线,用时 1046 天;
- 10 月,小鹏第 100000 台车生产下线,用时 1034 天;
- 同样在 10 月,理想第 100000 台车生产下线,用时 708 天。
转眼三年后,当年的三家新势力,也变成了行业里的御三家,在国产汽车行业走上新能源赛道后,多少品牌起起落落,来来往往,反而是争论和新闻最多的他们仨,一直有惊有险地走到了今天。
那最晚入局、争议更大的小米汽车,用了多久达成了 100000 台的成绩?雷军亲自告诉你。
从小米 SU7 发布到昨天生产 10 万台,他们只用了 230 天。小米汽车用不到一年的时间,达成了别家两三年的战绩,那怎么把开门红火变成一路红毯?雷军在今早给出了答案——掌握核心科技。
又一辆原地起跳的国产电车
传统燃油车的三大件是变速箱、发动机、底盘;新能源电车的三大件是电控、电机、电池。由于电池的摆放位置,以及 CTC(电池底盘一体化)技术的发展,所以电池技术也和底盘密不可分。
作为新老三大件中唯一的交集,底盘技术对车辆的影响举足轻重,从驾驶质感、颠簸控制甚至到行车安全,底盘技术就是车辆动态行驶的顶梁柱。
小米汽车今早的发布会,全面介绍了他们的智能底盘预研技术,为今后的量产车型,以及更多的原型车,做好技术铺垫。
小米智能底盘由四大核心技术组成,分别是:
- 全主动悬架
- 四电机系统
- 48V 线控制动
- 48V 线控转向
传统民用量产燃油车,包括现在大部分的平价新能源车,大多都采用的是被动悬架以及半主动悬架,即车辆发生颠簸悬架被动压缩,通过其自身的弹力和车身的抖动抗衡。
全主动悬架最大的优势在于能够主动产生抵抗车轮与车身垂向运动的力,独立控制车辆的每个轮子的「抗力」,放在以前还有一种更加简单粗暴的划分形式:百万级豪车才会用上的技术。
和传统被动/半主动悬架相比,全主动悬架在应对复杂路况时,能表现出更加出色的适应性和响应速度。
小米全主动悬架系统能够根据路况实时调整悬架高度和阻尼,也就是能根据不同的路况和车速,给悬架提供定制化的软硬调节,可以说每一段路和每一种速度,都有相对应的「私人定制悬架」。
另一个可以体现出悬架质量的细节是车辆起停时的「抬头」和「点头」,以前需要靠老司机的黄金右脚才能避免车辆的摇晃,而有了全主动悬架后,雷军称可以做到 0 抬头和 0 点头,乘客和司机的乘车驾车体验也会更舒适。
雷军在发布会的视频中展示了通过主动调节悬架,让小米汽车跳了段舞。
能舞还能跳,才能展现出悬架的真本事,所以视频里的小米汽车,真就四脚离地,用似曾相识的方式跳了起来,还连跳了三下,这对于一辆重达 2.2 吨的车来说,不算一件简单的事儿。
在此之前,比亚迪旗下的高端品牌车型仰望 U9 也是在发布会上的原地一跳,在车圈引发了不小的轰动。
舞动和跳跃并不是悬架的作用,而是一种直观的展示方式,证明悬架的自主可调以及弹性力度,小米的全主动悬架的举升力有 44400N,可以举起两台小米 SU7 Max,调节幅度为 140mm,有大幅度的颠簸也可以过滤,并且调节速度是空气弹簧的 100 倍。
另外,通过摄像头扫描和云端的信息,这套悬架系统还能预知路面信息和颠簸路段,主动调整悬架软硬高低。
多多益善的四电机
智能底盘的第二项技术是四电机系统,小米 SU7 的底盘配备双电机与 CDC 悬架,小米 SU7 Ultra 的智能底盘则是三电机。
而预研电机在此基础上进一步升级成四电机系统,2 个全新自研电机 +2 个 V8s,动力更强,操控更灵活,变化也更多端。
每个电机独立控制每个车轮,因此在预研车上能够实现又一个似曾相识的原地掉头和圆规掉头。
这和仰望 U8 当时所展示的效果类似,比亚迪通过云辇智能底盘技术和易四方四轮独立驱动技术,让车辆拥有了更多的动态表现和驾驶乐趣。小米和仰望都通过「旋转跳跃」这样看似开玩笑的方式,展现出他们在底盘技术的努力与深耕。
民用车电机研制的一大难题是,在有限空间内提升功率密度和扭矩密度。小米的工程师团队通过创新设计,采用 X-Pin 绕组将双电机尺寸缩短 20mm,并通过行星齿轮减速器减少 14kg 电驱重量,将电机的重量和体积尽可能地维持在了最小水平。
虽然变小了,但也变强了。小米的预研电机单个功率可达 449 马力,峰值扭矩达到 380Nm,最高转速可达 28000rpm,整车最大马力能到 2054 匹。雷军称,全球超过 2000 匹的马力的车不超过五辆,都是千万级的超跑。
与此同时,小米的四电机还能实现每秒 500 次的高频扭矩协同控制,结合扭矩矢量控制技术,确保车辆在复杂场景中也能平稳行驶。
颠覆传统的刹车和方向盘
小米智能底盘的最后两项技术是 48V 线控制动+转向。
雷军在发布会上讲到,小米将低压系统从 12V 提升到 48V,意味着可以支持更多跨域大功率器件上车,也就是小米汽车在 48V 的电压下,有了用上更好、更强配件的资格和门票。
先看线控制动,小米 48V 四轮全干电子制动系统,每个车轮均配有独立的 48V EMB 电子制动卡钳,卡钳上的电机动力模块通过机械传动机构直接推动活塞产生制动力,更高传动效率,更快制动速度。
相比电子液压制动,其夹紧响应速度提升 40%;用上了线控系统,驾驶员在百公里制动测试中,将制动距离缩短了 1 米以上。
而且全干电子制动不需要刹车油,也取消了传统的液压管路和泵系统,对于大众消费者来说,在保车辆养的时候也能更省心。
小米线控系统的另一个优势是用上了「双活塞 EMB 电子制动卡钳」,比传统单活塞的摩擦面积扩大了 50%,通过主动调节,动系统摩擦损耗(拖滞力矩)减少 50%,车辆续航里程能额外增加 10 公里以上。
接着是线控转向系统,传统的汽车转向系统通过机械连接,而线控转向则除了上转和下转之间的机械连接,上转转变为驾驶员的手力模拟器,用一个电机完成手力模拟任务。
简单说线控转向有三个优势:
- 节省座舱空间
- 人机解耦不受限制,减少体力消耗
- 转向比支持 5:1-15:1 的动态调节
小米的智能底盘预研技术,还处于初级阶段,雷军说这是他们在底盘技术研发上的策略,按照「量产一代、发布一代、预研一代」的节奏,最后实现跨越式进步。
最终能否跨越,甚至超越,还要等待时间来验证,不过以目前小米汽车的势头来看,实现雷总画的大饼,还是很有可能的。
雷军和小米汽车的确赶上的是末班车,当然也赶上了好时期。
说是好时期,是因为现在人们对新能源电车的接受度、认可度要远超 2018 年,根据中国汽车流通协会的数据,今年 4 月上半月,中国新能源乘用车零售渗透率为 50.39%,首次超过传统燃油乘用车。
但同时也得承认,竞争也愈发激烈,这块大蛋糕早就有比亚迪、吉利、蔚小理这些从「初始年代」走来的车企,用性价比、大沙发、换电站等核心竞争力独占一个山头,更何况,还有那个开局就是王炸、不讲任何道理但销量高居不下的特斯拉。
小米 SU7 的发布会上,雷军提了一晚上马斯克,SU7 对标了一整晚特斯拉,包括今天的线上发布会,雷军又再次提到了他们。
一个月前,马斯克发布了没有方向盘油门和刹车的 Cybercab,在新能源电车发展刚步入稳步发展的阶段,100% 无人驾驶的汽车就马不停蹄地赶来了。雷军称,特斯拉的这套,小米也早就开始布局和预研了,而初步的成果,就是上面的小米智能底盘技术。
如果你回读一次这些技术细节,就不难发现,这套全新的智能体盘其实是在逐步剥离人与车的关系,机械结构不再,电控、线控系统大规模上车,而这也是整个新能源电车发展的趋势。
虽说许多厂家都有了相关的技术储备,不过这一天还是离我们很远,道路法规的限制,电池技术的瓶颈,消费市场的质疑,包括越来越多的车企开始布局增程车型。但作为一家想要长期发展的车企,提前规划未雨绸缪是必修课,小米今早的超前技术发布会,也正好印证了雷军当时的决心:
小米汽车的目标是通过 15 年到 20 年的努力,成为全球前五的车厂。
过两天的广州国际车展,小米 SU7 的原型车也会一同亮相开启全国巡展,届时还会有哪些新车型,以及国产新能源带给车圈的惊喜,我们到时也会在现场,带来第一时间的消息。
#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。
共创 | 1000+ 位用户的选择,一加 13 共创手机壳众筹开启
OpenAI 最新产品全曝光!奥特曼驳斥 AI 发展撞墙,Ilya 认错,秘密寻找下一个重大突破
今年 AI 圈的瓜真是一浪接一浪。
最近,关于 Scaling Laws「撞墙」的消息在 AI 圈炸开了锅。图灵奖得主 Yann Lecun、Ilya、Anthropic 创始人 Dario Amodei 纷纷展开唇枪舌战。
争论的核心在于,随着模型规模的不断扩大,其性能提升是否会遇到天花板。正当舆论愈演愈烈之际,OpenAI CEO Sam Altman 刚刚在 X 平台作出回应:
「there is no wall 没有墙」
而在这场辩论的背景下,彭博社则披露了一条引人注目的消息。
OpenAI 计划在明年一月份推出一款名为「Operator」的 AI Agent(智能体),这个 Agent 能够使用计算机代替用户执行任务,如编写代码或预订旅行。
在此之前,Anthropic、微软、Google 也都被曝出正在布局类似的方向。
对于整个 AI 行业来说,AI 技术的发展从来就不是单一维度的线性过程。当一个方向似乎遇到阻力时,创新往往会在其他维度突破。
Scaling Laws 撞墙?下一步该怎么走
Scaling Laws 遭遇瓶颈的消息,最先源自外媒 The Information 上周末的一篇报道。
洋洋洒洒的数千字报道透露了两个关键信息。
好消息是,尽管 OpenAI 完成了下一代模型 Orion 训练过程的 20%,但 Altman 表示,Orion 在智能和执行任务、回答问题的能力方面已经与 GPT-4 不相上下。
坏消息是,据上手体验的 OpenAI 员工评估,与 GPT-3 和 GPT-4 之间的巨大进步相比,Orion 提升幅度较小,比如在编程等任务上表现不佳,且运行成本较高。
一句话概括就是,Scaling Laws 遭遇瓶颈了。
要理解 Scaling Laws 效果不及预期所带来的影响,我们有必要给不太清楚的朋友简单介绍一下 Scaling Laws 基本概念。
2020 年,OpenAI 在一篇论文中最早提出 Scaling Laws。
这一理论指出,大模型的最终性能主要与计算量、模型参数量和训练数据量三者的大小相关,而与模型的具体结构(层数/深度/宽度)基本无关。
听着有些拗口,说人话就是,大模型的性能会随着模型规模、训练数据量和计算资源的增加而相应提升。
OpenAI 的这项研究奠定了后续大模型发展的基础,不仅促成了 GPT 系列模型的成功,也为训练 ChatGPT 提供了优化模型设计与训练的关键指导原则。
只是,当我们现在还在畅想着 GPT-100 时,The Information 的爆料表明,仅仅增加模型规模已经不能保证性能的线性提升,且伴随着高昂成本和显著的边际效益递减。
而遭遇困境的并非仅有 OpenAI 一家。
彭博社援引知情人士的消息称,Google 旗下的 Gemini 2.0 同样未能达到预期目标,与此同时,Anthropic 旗下的 Claude 3.5 Opus 的发布时间也一再推迟。
在争分夺秒的 AI 行业,没有产品的新消息往往意味着最大的坏消息。
需要明确的是,这里所说的 Scaling Laws 遇到瓶颈并非意味着大模型发展就此终结,更深层的问题在于高昂成本导致边际效益的严重递减。
Anthropic CEO Dario Amodei 曾透露,随着模型变得越来越大,训练成本呈现爆炸式增长,其目前正在开发的 AI 模型的训练成本就高达 10 亿美元。
Amodei 还指出,未来三年内,AI 的训练成本还将飙升到 100 亿美元甚至 1000 亿美元的天文数字。
以 GPT 系列为例,仅 GPT-3 的单次训练成本就高达约 140 万美元,这些支出主要来自于强大的计算资源消耗,尤其是 GPU 的使用费用,以及巨额的电力支出。
单是 GPT-3 的训练就消耗了 1287 兆瓦时的电力。
去年,加州大学河滨分校的研究显示,ChatGPT 每与用户交流 25-50 个问题,就得消耗 500 毫升的水,预计到 2027 年,全球 AI 的年度清洁淡水需求量可能达到 4.2-66 亿立方米,相当于 4-6 个丹麦或半个英国的年度用水总量。
从 GPT-2 到 GPT-3,再到 GPT-4,AI 所带来的体验提升是跨越式的。
正是基于这种显著的进步,各大公司才会不惜重金投入 AI 领域。但当这条道路逐渐显露尽头,单纯追求模型规模的扩张已无法保证性能的显著提升,高昂的成本与递减的边际效益成为了不得不面对的现实。
现在,比起一味追求规模,在正确的方向上实现 Scaling 显得更加重要。
再见,GPT;你好,推理「O」
墙倒众人推,连理论也是如此。
当 Scaling Laws 疑似触及瓶颈的消息在 AI 圈内引发轩然大波时,质疑的声浪也随之翻涌而来。
一直持反主流立场的图灵奖得主、Meta AI 首席科学家 Yann Lecun,昨天兴奋地在 X 平台转载了路透社采访 Ilya Sutskever 的采访,并附文称:
「我不想显得事后诸葛亮,但我的确提醒过你。
引用:「AI 实验室 Safe Superintelligence(SSI)和 OpenAI 的联合创始人伊利亚·苏茨克韦尔(Ilya Sutskever)最近向路透社表示,通过扩大预训练阶段——即使用大量未经标注的数据来训练 AI 模型,使其理解语言模式和结构——所取得的成果已经停滞不前。」
回顾这位 AI 巨头过去两年对现行大模型路线的评判,可谓是字字珠玑,句句见血。
例如,今天的 AI 比猫还笨,智力差太远;LLM 缺乏对物理世界的直接经验,只是操纵着文字和图像,却没有真正理解世界,强行走下去只会死路一条等等。
时间拨回两个月前,Yann Lecun 更是毫不客气地给当下主流路线判了死刑。在一众 AI 末日论中,在众多 AI 末日论中,他还坚定地认为声称 AI 将威胁人类生存的言论纯属无稽之谈:
- 大型语言模型(LLMs)无法回答其训练数据中未包含的问题,
- 它们无法解决未经训练的难题,
- 它们无法在缺乏大量人类帮助的情况下学习新技能或知识,
- 它们无法创造新的事物。 目前,大型语言模型只是人工智能技术的一部分。 单纯地扩大这些模型的规模,并不能使它们具备上述能力。
同在 Meta FAIR 任职的田渊栋博士则更早预见了当前的困境。
5 月份在接受媒体采访时,这位华人科学家曾悲观地表示,Scaling Laws 也许是对的,但不会是全部。在他看来,Scaling Laws 的本质是以指数级的数据增长,来换取「几个点的收益」。
「最终人类世界可能会有很多长尾需求,需要人类的快速反应能力去解决,这些场景的数据本身也很少,LLM 拿不到。Scaling law 发展到最后,可能每个人都站在一个「数据孤岛」上,孤岛里的数据完全属于每个人自己,而且每时每刻都不停产生。专家学会和 AI 融合,把自己变得非常强,AI 也代替不了他。」
不过,形势或许还没有到如此悲观的境地。
客观而言,Ilya 在接受路透社的采访时,虽然承认了 Scaling Laws 带来的进展已趋于停滞,但并未宣告其终结。
「2010 年代是追求规模化的时代,而现在我们再次进入了一个充满奇迹和探索的新时代。每个人都在寻找下一个重大突破。在当下,选择正确的事物进行规模化比以往任何时候都更为关键。」
并且,Ilya 还表示 SSI 正在探索一种新的方法来扩展预训练过程。
Dario Amodei 最近在一档播客中也谈及此事。
他预测,在人类水平以下,模型并不存在绝对的天花板。既然模型尚未达到人类水平,就还不能断言 Scaling Laws 已经失效,只是确实出现了增长放缓的现象。
自古,山不转水转,水不转人转。
上个月,OpenAI 的研究员 Noam Brown 在 TED AI 大会上表示:
「事实证明,在一局扑克中,让一个机器人思考 20 秒钟,得到的性能提升与将模型扩展 100000 倍并训练它 100000 倍长的时间一样。」
而对于 Yann lecun 昨天的事后诸葛亮言论,他这样回应:
「现在,我们处于一个这样的世界,正如我之前所说,进入大规模语言模型预训练所需的计算量非常非常高。但推理成本却非常低。曾有许多人合理地担心,随着预训练所需的成本和数据量变得如此庞大,我们会看到 AI 进展的回报递减。但我认为,从 o1 中得到的一个真正重要的启示是,这道墙并不存在,我们实际上可以进一步推动这个进程。因为现在,我们可以扩展推理计算,而且推理计算还有巨大的扩展空间。」
以 Noam Brown 为代表的研究者坚信推理/测试时计算(test-time compute),极有可能成为提升模型性能的另一个灵丹妙药。
说到这里,就不得不提到我们熟悉的 OpenAI o1 模型。
与人类的推理方式颇为相似,o1 模型能够通过多步推理的方式「思考」问题,它强调在推理阶段赋予模型更充裕的「思考时间」,其核心秘密是,在像 GPT-4 这样的基础模型上进行的额外训练。
例如,模型可以通过实时生成和评估多个可能的答案,而不是立即选择单一答案,最终选择最佳的前进路径,这样就能够将更多的计算资源集中在复杂任务上,比如数学问题、编程难题,或者那些需要人类般推理和决策的复杂操作。
Google 最近也在效仿这条路线。
The Information 报道称,最近几周,DeepMind 在其 Gemini 部门内组建了一个团队,由首席研究科学家 Jack Rae 和前 Character.AI 联合创始人 Noam Shazeer 领导,旨在开发类似的能力。
与此同时,不甘落后的 Google 正在尝试新的技术路径,包括调整「超参数」,即决定模型如何处理信息的变量,比如它在训练数据中的不同概念或模式之间建立联系的速度,以查看哪些变量会带来最佳结果。
插个题外话,GPT 发展放缓的一个重要原因是高质量文本和其他可用数据的匮乏。
而针对这个问题,Google 研究人员原本寄希望于使用 AI 合成数据,并将音频和视频纳入 Gemini 的训练数据,以实现显著改进,但这些尝试似乎收效甚微。
知情人士还透露,OpenAI 和其他开发者也使用合成数据。不过,他们也发现,合成数据对 AI 模型提升的效果十分有限。
你好,贾维斯
再见,GPT,你好,推理「o」。
在前不久举行的 Reddit AMA 活动上, 一位网友向 Altman 提问,是否会推出「GPT-5」,以及推理模型 o1 的完整版。
当时,Altman 回答道:「我们正在优先推出 o1 及其后续版本」,并补充说,有限的计算资源使得同时推出多个产品变得困难。
他还特别强调,下一代模型未必会延续「GPT」的命名方式。
现在看来,Altman 急于与 GPT 命名体系划清界限,转而推出以「o」命名的推理模型,其背后似有深意。而推理模型的布局或许还是在于为当下主流的 Agent 埋下伏笔。
最近,Altman 在接受 YC 总裁 Garry Tan 的采访时,也再次谈到了 AGI 五级理论:
- L1:聊天机器人具有对话能力的 AI,能够与用户进行流畅的对话,提供信息、解答问题、辅助创作等,比如聊天机器人。
- L2:推理者像人类一样能够解决问题的 AI,能够解决类似于人类博士水平的复杂问题,展现出强大的推理和问题解决能力,比如 OpenAI o1。
- L3:智能体不仅能思考,还可以采取行动的 AI 系统,能够执行全自动化业务。
- L4:创新者能够协助发明创造的 AI,具有创新的能力,可以辅助人类在科学发现、艺术创作或工程设计等领域产生新想法和解决方案。
- L5:组织者可以完成组织工作的 AI,能够自动掌控整个组织跨业务流程的规划、执行、反馈、迭代、资源分配、管理等,基本上已经与人类差不多。
所以我们看到,与 Google 和 Anthropic 一样,OpenAI 现在正在将注意力从模型转移到一系列称为 Agent 的 AI 工具上。
最近,彭博社也曝出,OpenAI 正在准备推出一款名为「Operator」的新型 AI Agent,能够使用计算机代替用户执行任务,如编写代码或预订旅行。
在周三的一次员工会议上,OpenAI 领导层宣布计划在一月发布该工具的研究预览版,并通过公司的应用程序接口(API)向开发者开放。
在此之前,Anthropic 也推出了类似的 Agent,够实时处理用户计算机任务并代为执行操作。与此同时,微软近期推出了一套面向员工的 Agent 工具,用于发送邮件和管理记录。
而 Google 也正在筹备推出自己的 AI Agent。
报道还透露,OpenAI 正在进行多个与 Agent 相关的研究项目。其中,最接近完成的是一款能够在网页浏览器中执行任务的通用工具。
这些 Agent 预计将能够理解、推理、规划并采取行动,而这些 Agent 实际上是一个由多个 AI 模型组成的系统,并非单一模型。
比尔·盖茨曾经说过,「每个桌面上都有一台 PC」,史蒂夫·乔布斯说过,「每个人的手上都有一部智能手机」。现在我们可以大胆预测:每个人都将拥有自己的 AI Agent。
当然,人类的终极目标是,我们更希望有一天能够对着眼前的 AI 说出那句电影的经典对白:
你好,贾维斯
#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。
告别 Master 3S,我找到了 Mac 系统更完美的鼠标
派早报:红魔 10 Pro 系列手机发布、Apple 推出 Final Cut Pro 11 等
早报|第十万台小米 SU 7 正式下线,雷军秀车间睡姿/曝苹果将推出 AI 智能家居中控屏/小米 AI 眼镜或明年发布
传苹果将推出 AI 智能家居中控屏
小米成立 AI 平台部
字节旗下社交软件多闪停止研发
腾讯发布 Q3 财报:营收 1671.9 亿,同比增长 8%
第十万台小米 SU 7 正式下线
特朗普任命马斯克与其共同领导「政府效率部」
OpenAI 联合创始人兼前总裁宣布回归
雷达汽车将整合进吉利汽车集团
传 AMD 将在全球范围内裁员 4%
阿里国际推出首个 B2B AI 搜索引擎
零一万物宣布与华为启动昇腾原生开发合作
Glean 创始人: AI 创业者应从用户出发
报道称小米 AI 眼镜将于明年 Q2 发布
生数科技 Vidu 大模型迎来新版本
iQOO Neo10 系列手机全系标配 8T LTPO
传苹果将推出 AI 智能家居中控屏
据彭博社的 Mark Gurman 报道,苹果公司正在开发一款新的智能家居产品——一款壁挂式显示屏,拥有控制家电、与 Siri 互动和视频会议等功能。
显示屏看起来像一个方形的 iPad,拥有大约 6 英寸的屏幕,顶部配有摄像头,内置扬声器和可充电电池。其已开发三年,可能会在明年 3 月正式宣布。
这款设备在功能上与 Google Home Hub 和亚马逊的 Echo Show 相似,但苹果的智能家居控制中心的独特之处可能是苹果 AI,包括 10 月下旬开始向用户推出的 Apple Intelligence 以及即将到来的 App Intents 系统,该系统可使用 AI 控制软件程序。
此外,苹果还在开发一款带有机械臂的版本,能够移动平板设备。这表明苹果可能不仅仅是在开发一个智能设备控制面板,而是在寻求更先进的智能家居解决方案。
小米成立 AI 平台部
据「雷锋网」报道,小米公司最近进行了一系列的人事变动,其中包括成立了 AI 平台部,并任命张铎为该部门的负责人,他将向基础技术平台部总经理冯宏华汇报。
张铎曾在 2016 年至 2021 年间任职于小米,并被雷军誉为公司的「大神」。此外,小米集团副总裁马骥已不再参与中国区的具体业务,并正在休假。
马骥自 2013 年加入小米以来,负责过多个关键职位,包括 MIUI 安全中心、MIUI 产品和小米国际互联网业务等,对小米的国际化进程做出了重要贡献。
字节旗下社交软件多闪停止研发
据「Tech 星球」报道,字节跳动在社交领域进行新的布局,抖音 App 的「朋友」功能经历了全面升级,旨在强化熟人社交关系,独立于原有的互相关注的粉丝关系,需要用户主动申请成为朋友,以提升社交亲密度。
同时,抖音 App 底部导航栏的朋友频道也进行了改版测试,界面和功能更类似于微信的朋友圈。
此外,字节跳动初期的社交产品多闪 App 可能停止研发,目前仅保持维护状态,标志着字节跳动社交业务的重心转移到抖音 App 上。
尽管抖音 App 在用户量、年轻群体占比、高学历高收入人群方面具有社交业务的潜力,但面临用户习惯、市场竞争和用户迁移成本等挑战,其社交业务的发展和商业化探索还有待观察。
腾讯发布 Q3 财报:营收 1671.9 亿,同比增长 8%
腾讯控股有限公司公布了 2024 年第三季度的未经审核综合业绩,显示公司总收入达到 1672 亿元人民币,同比增长 8%,毛利同比增长 16%,经营盈利同比增长 19%。
其中,游戏业务的强劲增长、微信小店的交易平台策略升级、AI 技术在产品和运营中的持续部署,以及对于 AI 技术和解决方案的投资是推动增长的主要因素。
此外,小程序交易额超过 2 万亿元,音乐和长视频付费会员数分别同比增长 16% 和 6%,体现了腾讯在数字内容和社交平台的增长势头。
国际市场游戏收入和本土市场游戏收入均有所增长,金融科技及企业服务业务收入也有所上升。公司在报告期内回购了约 9490 万股股份,体现了对自身价值和未来发展的信心。
第十万台小米 SU 7 正式下线
小米董事长兼 CEO 雷军昨日在微博宣布,小米 SU7 自发布以来仅用时 230 天便达成了第 10 万台车的下线,创下新车企最快下线纪录,并计划年底前交付 12 万辆。
小米 SU7 在 10 月的销量达到 20726 辆,成为新势力轿车、20 万以上轿车、中大型纯电轿车三个类别中的销售冠军。
昨天早些时候,雷军还在微博发文,表示「网友们催我到工厂拧螺丝。其实,我经常去,今天一大早就到了。来得太早,在车间又咪了一会。」并配上了自己在车间打盹的照片。随后「雷军真去拧螺丝了」这一词条也冲上热搜。
特朗普任命马斯克与其共同领导「政府效率部」
美国当选总统特朗普宣布提名埃隆·马斯克和维韦克·拉马斯瓦米共同领导新成立的「政府效率部」(DOGE),旨在削减政府官僚主义、多余法规和浪费性开支,并重组联邦机构。
这一消息推动了马斯克支持的狗狗币(DOGE)价格上涨超过 8%。
同时,特朗普还提名了多位重要官员,包括皮特·海格塞斯为国防部长、迈克·沃尔茨为总统国家安全事务助理、威廉·麦金利为白宫法律顾问、爱丽丝·斯蒂芬尼克为美国常驻联合国代表、迈克·赫卡比为美国驻以色列大使,以及李·泽尔丁为美国环境保护署署长。
尽管特朗普媒体科技集团和 Coinbase 的股价有所下跌,特斯拉股价也下跌了 6.10%,但特朗普的这些提名和政策动向显示出其政府未来的方向和人事布局。
OpenAI 联合创始人兼前总裁宣布回归
据路透社报道,OpenAI 联合创始人兼总裁格雷格·布罗克曼结束了三个月的离职期,重新回到了公司。
在内部备忘录中,布罗克曼宣布已重新开始工作,并透露正在与 CEO 山姆·奥特曼合作设立一个新角色,专注于重大技术挑战。此前,布罗克曼和奥特曼因与董事会的沟通问题而离开 OpenAI,但奥特曼后来重返公司担任 CEO。
与此同时,OpenAI 面临了一波离职潮,包括首席科学家伊利亚·苏茨克弗和首席技术官米拉·穆拉蒂在内的多位高管离职并成立了新的人工智能公司,而布罗克曼的回归被视为 OpenAI 稳定团队和继续推动技术创新的重要一步。
雷达汽车将整合进吉利汽车集团
据「晚点 Auto」报道,吉利控股集团宣布将雷达汽车整合进吉利汽车集团,雷达汽车将成为吉利汽车集团的一级组织,其负责人凌世权将向吉利汽车集团 CEO 淦家阅汇报。
此次整合包括将雷达汽车的新能源和智能化研发技术并入吉利汽车集团中央研究院,同时保留雷达汽车的大部分职能部门,但部门负责人需向雷达汽车和吉利汽车集团相关业务分管领导双线汇报。
雷达汽车自 2022 年成立以来销量不佳,仅占吉利控股集团同期累计销量的 0.15%,此次整合旨在减少重复投入,优化资源配置,并控制亏损,以提升吉利汽车集团的整体竞争力。
整合后,吉利汽车集团将承担雷达汽车的亏损,淦家阅可能会严格控制雷达的投入以减小亏损、避免进一步侵蚀吉利汽车集团收益,届时进一步的人员优化将不可避免。
传 AMD 将在全球范围内裁员 4%
据「wccftech」报道,芯片设计公司 AMD 确认将裁减全球约 4% 的员工,即大约 1000 名员工,作为其资源与增长机会相匹配的一部分。
这一裁员决定是在 AMD 积极进军人工智能行业并寻求通过债务和现金混合方式资助其收购之后作出的。AMD 的裁员发生在其竞争对手英特尔公司多次裁员之后。
与英特尔不同,AMD 在最新季度虽有收入和利润增长,但游戏部门收入大幅下降 69%,导致该部门营业收入几乎亏损,股票自第三季度收益报告发布以来下跌了 13.6%。
AMD 表示,将致力于以尊重的方式对待受影响的员工,并帮助他们度过这一过渡期。
阿里国际推出首个 B2B AI 搜索引擎
阿里国际在欧洲科技峰会 Web Summit 上推出了全球首个 B2B AI 搜索引擎 Accio,标志着公司正式进入 AI 搜索领域。
Accio 通过 AI 驱动的搜索、重构的商品百科页面和端到端的电商平台三大模块,提供了一个对话形式的搜索体验,能够理解并拆解用户需求,从而精准推荐供应商和商品。
Accio 的目标是简化 B2B 贸易流程,降低全球贸易门槛,其测试结果显示用户搜索到采购的转化率提升了 20% 到 30%。
此外,Accio 不仅整合了阿里国际站的供给,还链接了全球独立站、第三方电商网站和线下工厂的供给,覆盖了亿级商品。
阿里国际站总裁张阔表示,Accio 的上线版本仅展示了公司对 AI 时代 B2B 生意形态想象的 10%,未来将不断迭代升级。
零一万物宣布与华为启动昇腾原生开发合作
北京零一万物信息技术有限公司与华为技术有限公司签署了昇腾原生大模型合作协议,双方将共同打造大模型生态,推动行业智能化变革。
零一万物将利用华为的昇腾硬件底座、CANN 异构计算架构、MindSpore AI 框架和 MindIE 推理引擎,开发面向多个行业的原生大模型应用,发布基于昇腾原生的 AI 智能体及行业大模型产品和解决方案。
此外,零一万物近期还发布了基于 Yi 模型的 ToB 解决方案,涵盖智算中心、模型训练、零售行业等,其 AI Infra 团队具备丰富的行业经验,已训练出性能卓越的 Yi-Lightning 和 Yi-Large 模型,为 ToB 应用提供基础。
通过此次合作,零一万物和华为将共同推动大模型技术在各行各业的落地,通过大模型技术赋能企业数智化增长,加速产业升级。
Glean 创始人: AI 创业者应从用户出发
在红杉资本的深度访谈中,Glean 的创始人 Arvind Jain 分享了企业搜索和 AI 应用在企业内部落地的挑战与机遇。
他强调,为了构建有效的 AI 应用,必须先建立强大的数据基础设施,包括深入集成企业系统、健全的安全和权限框架,以及理解人与内容、上下文之间关系的复杂知识图谱。
Jain 表示企业搜索的难点在于数据的私有性、基于权限的访问和深刻的上下文依赖性,因此,理解组织结构、用户角色和访问权限至关重要。
Jain 还指出,AI 创业者应从用户出发,先通过关键功能为用户提供清晰的价值,再扩展到更多的 AI 功能,这有助于建立企业信任并为高级功能提供所需的数据基础。
他预见 AI 助手将在未来主动帮助用户完成工作,改变工作方式,使得每个人都能拥有强大的 AI 助手来提升工作效率。
此外,Jain 建议创业者应专注于解决业务问题,而不是单纯追求 AI 技术,因为 AI 只是解决问题的工具之一。
报道称小米 AI 眼镜将于明年 Q2 发布
据「智能涌现」独家报道,小米正计划推出新一代 AI 眼镜,数月前已与歌尔合作,该产品预计于 2025 年 Q2 发布。
有知情人士表示,小米 AI 眼镜将「全面对标 Meta Ray-ban」,搭载 AI 功能、音频耳机模块、摄像头模块,并将以小米自有品牌形式发布。据称对于这款产品的出货量,雷军的预期「在三十万台往上」。
报道还指出,OPPO、vivo、华为、腾讯、字节近期也都在评估 AI 眼镜项目;苹果也被外媒曝光已组织团队重点评估 AI 眼镜市场。
财联社记者以投资者身份致电歌尔股份,相关人士回应称,公司对具体客户信息及项目内容不予透露。公司 AI 眼镜业务现阶段尚未量产,主要产品可应用于 AI 眼镜等终端产品。
生数科技 Vidu 大模型迎来新版本
昨日,生数科技官方公众号宣布,Vidu 大模型迎来 1.5 版本。
官方表示,Vidu 的技术突破主要在以下三个方面:
- 复杂主体的精准控制:无论是细节丰富的角色,还是复杂的物体,Vidu 都能保证其在多个不同视角下的一致性。
- 人物面部特征和动态表情的自然一致:在人物特写镜头中,Vidu 能够自然且流畅地保持人物面部特征和表情的连贯性,避免了面部僵硬或失真的现象。
- 多主体一致性:Vidu 允许用户上传多个主体图像,包括人物角色、道具物体、环境背景等,并在视频生成中实现这些元素的交互。
官方表示,Vidu 1.5 的推出,揭示了一个重要现象:视觉模型与语言模型一样,经过充分的训练,模型能够展现出对上下文的深刻理解、记忆等能力。
iQOO Neo10 系列手机全系标配 8T LTPO
11 月 13 日,iQOONeo 产品经理在微博宣布,iQOO Neo10 系列将全系标配 8T LTPO,而且搭配了行业最护眼的调光方案、最强的触控体验。
随后,他还在微博补充,iQOO Neo10 系列的这块屏幕,内部是下足了心血做好调校。在显示、护眼、触控上做都到了第一梯队。而且还搭载了旗舰同款的悦目护眼技术,内部盲测得分很高。
红魔 10 Pro 系列正式发布,搭载 1.5K 悟空屏
昨日,红魔 10 Pro 系列正式发布,售价 4999 元起。
配置方面,红魔 10 Pro 系列搭载骁龙 8 至尊版处理器,以及红魔独家研发的红芯 R3。
屏幕方面,红魔 10 Pro 系列配备了京东方联合打造的 1.5K 分辨率、144Hz 高刷悟空屏,屏幕尺寸为 6.85 英寸,95.3% 屏占比,峰值亮度高达 2000nit;黑边仅 1.25mm ,屏幕边缘到中框边缘降至 0.7mm。
续航方面,红魔 10 Pro 配备 6500mAh 大电池+ 80W 快充,而红魔 Pro+ 则配备全新牛魔王电池,容量增至行业最高 7050mAh,并做到扩容不增重,加量不加厚,整机尺寸依然保持 163.42×76.14×8.9mm,重约 229g。
价格方面:
- 红魔 10 Pro 暗夜骑士/白昼武士,12+256G 售价 4999 元,12+512G 售价 5499 元
- 红魔 10 Pro 氘峰透明银翼/氘峰透明暗夜,12+256G 售价 5299 元,12+512G 售价 5799 元。
- 红魔 10 Pro+ 暗夜骑士/白昼武士,16+512G 售价 5999 元;红魔 10 Pro+ 氘峰透明银翼/氘峰透明暗夜,16+512G 售价 6299 元
- 红魔 10 Pro+ 暗夜骑士 24+1T 售价 7499 元
暴雪宣布《魔兽世界》《炉石传说》联动坐骑免费送
11 月 13 日,魔兽世界官方微博宣布,《魔兽世界》X《炉石传说》全新联动坐骑将于 2024 年 11 月 13 日至 2025 年 1 月 14 日进行放送。
新玩家可以先下载《炉石传说》并登录游戏,完成新手教程即可获取坐骑;老玩家只需登录《炉石传说》游戏即可将联名坐骑纳入收藏中。
麦当劳开心乐园餐附赠马力欧卡丁车 2024 随机玩具
11 月 13 日起,购买麦当劳开心乐园餐,即可随机获赠马力欧卡丁车 2024 系列随机玩具一个。
官方介绍,每款卡丁车可互换车轮,同时还可以用贴纸进行 DIY 装饰。
该活动将在 2024 年 12 月 17 日结束。
UNDERCOVER 再次推出与三丽鸥的新合作
据外媒 yakkun 报道,UNDERCOVER 与三丽鸥再次携手,推出新的合作系列。
报道指出,此次合作系列,将推出包含运动衫、T 恤、手提包、帽子和小包在内的各类产品。
此次合作系列将于 11 月 20 日发售。
《BJ 单身日记 4》预告曝光
《BJ 单身日记 4》近期发布预告,该片将于明年 2 月 13 日上线 Peacock。
电影故事改编自原作小说的第三本,女主角 Bridget Jones 在适应当代生活的同时,也在面对着做母亲的责任。
该片将由迈克尔·莫里斯执导,休·格兰特、蕾妮·齐薇格、科林·费斯主演。
电影《戴假发的人》发布终极预告
电影戴假发的人官方微博昨日发布终极预告,将于 11 月 16 日正式上映。
该片由董越编剧及导演,黄晓明、王影璐领衔主演,李丛喜、黄璐主演。
电影讲述了夜班出租车司机孟中因搭载了一名神秘醉汉,从此彻底改变了命运轨迹的故事。
《角斗士 2》发布特辑预告,将于 11 月 22 日上映
昨日,派拉蒙官方微博发布特辑预告,揭露了在《角斗士 2》制作的背后,剧组成员的体能训练视频。
《角斗士 2》由雷德利·斯科特执导,大卫·斯卡帕编剧,保罗·麦斯卡、佩德罗·帕斯卡、丹泽尔·华盛顿等人出演,该片将于 11 月 22 日在内地上映。
电影故事衔接 2000 年上映的《角斗士》,讲述了马克西姆斯的儿子卢修斯在马克西姆斯死后的故事。
#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。
实测完 Mac mini 的 3D 渲染能力后,我们发现了一点惊喜
Mac mini,终究还是火出圈了。
自从发布和发售以来,大家对这台全新苹果主机的兴趣点,主要集中在以下几个方面:
- 新机体积很小,重量很轻,甚至开始重塑我们对「传统主机」的刻板印象;
- 关于电源键位置的争论愈演愈烈,它就像苹果给大家出的一道难题,网友们脑洞大开,用各种方案巧妙解题;
- 「如何通过教育优惠和国补券,用三千多块买到新品?」成为了小红书抖音微博评论区的共同话题。
以至于全新 Mac mini 的外观和价格好像成了它的全部优点,而其另一个看家本领——性能——却被盖过了风头。然而,苹果自己也脱不了干系,因为长期以来,只要出现「游戏」「适配」「渲染」等词语,许多用户就会自动把它们和苹果产品划清界限。
不过我们仍然对 M4 系列芯片的性能表现很感兴趣,许多读者伙伴也对这台性能小钢炮的渲染能力抱有期待。所以继「开箱体验」和「C 口供电专项测试」后,爱范儿又追加了全新 mini 的渲染实测,先说我们的发现和结论:
- M4 Pro 的 3D 渲染性能要普遍高于 M2 Pro,MacBook Pro 上的 M4 Pro 的升级趋势更为明显,只用一半时间甚至 1/3 生成的时间就能完成同样的渲染工作;
- 尽管同为 M4 Pro,配置也十分接近,跑分也在合理区间波动,但是我们手上这台 MacBook Pro 的实测表现要明显优于新款 Mac mini,同样的芯片在不同的设备上,也需要做到软硬件的结合,才有可能发挥出最优性能;
- CPU 渲染时,三台设备的散热风扇几乎都在以全功率的转速疯狂散热,像是老式风扇开到了三挡,在主打静音散热的 Mac 系列设备上,这并不常见;
- 在最后一轮 CPU 渲染实测中,Mac mini M4 Pro 的渲染时间远长于 MacBook Pro M4 Pro,甚至比 Mac mini M2 Pro 的渲染时长还多了一分钟,我们在确认原始工程文件、输出图像参数都相同的情况下,又加测了两轮,输出时长接近,M4 Pro 还是比 M2 Pro 慢了一些,这有可能是系统和软件优化的问题,后续有新版本推送后,我们会继续验证。
从跑分开始遥遥领先
苹果大力宣传 M 芯片的图形处理能力,是从 M3 系列开始的。
去年在 M3 系列芯片的加持下, Mac 首次拥有了硬件加速光线追踪功能,图形处理能力得到了大幅提升。搭载 250 亿个晶体管的 M3 比 M1 的图形处理性能高了 65%;M3 Pro 则有 370 亿个晶体管和一块 18 核图形处理器,比 M1 Pro 的图形处理速度提升了 40%。
不过,去年的「王炸」当属 M3 Max,920 亿个晶体管+40 核图形处理器,不仅刷新了当时 Cinebench 的 3D 渲染跑分记录,使得其性能与酷睿 i9-13980HX 比肩,还在部分 GPU 测试中,与 RTX 4060 的处理速度平分秋色。
即使大多数人对 M 芯片的能力印象,还停留在 M1 甚至是 Intel 的那个年代,但不得不承认,从 M3 开始,Mac 就有了更加专业的图形处理以及工程渲染的能力。
时隔一年,刚刚走上 Mac 的 M4 芯片,也在官方宣传中标明了:
得益于 M4 系列芯片图形处理器增强的硬件加速光线追踪引擎,游戏画面更加逼真迷人,专业 3D 渲染应用也可用更少时间生成更精美的图像。
为了验证官方的说辞,以及许多伙伴的期待,我们拿手上的 Mac mini 进行了各种跑分测试,不过单一的评分结果并没有什么说服力,所以我们还把上代 Mac mini,以及最新发布的 MacBook Pro 一同放进了测试名单。三台测试设备的具体配置如下:
既然是图形渲染能力的专项测试,那选取的都是能够体现出设备在这些方面能力的测试软件。除开常规的理论跑分,我们还增加了「3D 渲染场景实测」,争取全方位地展示出 M4 Pro 芯片的图形处理能力。
先从跑分看起,最常规、也是最常用的跑分软件 Geekbench,是一个偏向综合性的基准测试工具,可以比较全面的体现出计算机的 CPU、GPU、内存和存储等多方面的性能。
在 Geekbench 6 的 CPU 多核性能上,Mac mini M4 Pro 略微领先,MacBook Pro M4 Pro 稍低,但差距不大,都处于正常的波动范围。相比之下,搭载 M2 Pro 的 Mac mini 得分明显较低,为 14581 分。
另一边的 CPU 单核测试中,也是同样的情况,全新 Mac mini 和 MacBook Pro 都达到了 3800 分以上,而老款 Mac mini 则少了 1200 分左右。
Geekbench 6 的 GPU 测试分为 OpenCL 和 Metal 两项,前者适用于跨平台的通用计算任务,后者为苹果生态设备的专项测试。
不管在 OpenCL 还是 Metal 的 GPU 测试中,搭载 M4 Pro 的两台设备相较于 M2 Pro 都有非常明显的提升,而且 MacBook Pro 的 GPU 性能评分都略高于 Mac mini。
比起大又全的 Geekbench 6,Cinebench 则显得更为精专。这是一个专门针对 3D 渲染和图形处理性能的基准测试工具,主要用于评估 CPU 和 GPU 在处理复杂 3D 图形和动画时的性能,这也是我们此次跑分重点关注的领域。
在 Cinebench 2024 的评估中,还是延续了之前的结论:M4 Pro 芯片在 GPU 和 CPU 单核多核的处理性能,都要比 M2 Pro 高出一大截,有接近万分的表现,尤其在图形性能上比 M2 Pro 有明显优势,因此也就非常适合那些需要高计算和图形处理能力的用户。
最后一项评估我们用了开源 3D 创作软件 Blender 官方的工具,虽然和 Cinebench 同为针对 3D 渲染和图形处理性能的基准测试工具,不过二者在设计目的、测试方法和应用场景上还是有一些明显的区别。
比起 Geekbench 6 和 Cinebench 2024 不那么直观的跑分,Blender Benchmark 的数据给的非常直接,它用「样本渲染速度(Samples per minute)」来体现相应的芯片性能。
这些数字代表了每分钟渲染的样本数量,数值越高表示渲染速度越快,在此次测试中,Blender Benchmark 给出了「怪兽」「旧货店」「教室」三个场景,其中 Classroom 场景的低渲染速度表明此类任务对 GPU 负载更高。
总体来看,M4 Pro 都有不俗的表现,尤其在 Monster 场景下渲染速度最高,显示出较强的处理复杂 3D 图形的能力。在每一个具体场景中的领先,也显示出 M4 Pro 在图形和动画制作方面的硬实力。
理论数值跑完之后,接下来就轮到我们自己的动手实践。
实战有惊喜,也有惊吓
专业的渲染得用专业的软件,在实际场景测试中,我们选择了在 3D 设计行业中,受众面较广的开源三维计算机图形软件 Blender。
测试一共分为三轮,每轮通过调节原始白模的渲染输出参数,以及不同的渲染芯片,来相互对比输出时间。
▲ 工程文件来自:b 站 up 主@YUEMU_
第一轮为最常规的 3D 渲染测试,渲染方式均为 GPU,输出图像参数也统一设为:分辨率 2000px × 1500px,宽高比 1:1,帧率 24fps。渲染生成速度如下:
第二轮同样为用 GPU 进行渲染,不过将白模的分辨率扩大 3 倍,其他不变:分辨率 6000px × 4500px ,宽高比 1:1,帧率 24fps。更大的工程质量也能更明显的表现出不同设备芯片的性能差异。
第三轮仍然保持上轮的输出参数,但改为 CPU 渲染:
这个有争议的输出结果,就像是这台有争议的新品一样,总是会在使用时给你带来各种惊喜,当然也有惊吓,但这一切都不妨碍苹果在电脑主机小型化上做出的努力。
从跑分和实测结果来看,它的小身板里确实藏着大核心,能在传统主机 1/10 体积、比上代产品小了 40% 的小身躯里,爆发出和外观不太匹配的高性能,本身就是一种卖点。
当然我们也想强调,这台设备的高热度和高叫好,从用户视角来看,还是因为不到 ¥4000 价格,而我们此次测试所用的 Mac mini M4 Pro 的起售价为 ¥10999,48GB+1TB 的配置需要 ¥15499。
所以当价格来到万元以上,进入了全新 iMac 和 MacBook Pro 的价格区间后,失去了性价比的 Mac mini 只剩下了 mini,而且还得单独配屏幕,那你还会为这台迷你主机和它的 M4 Pro 芯片买单吗?
#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。
Android 版 Edge 更新,主流浏览器也能用油猴脚本了
iPhone 16,引起一场手机壳的割据混战
转眼,iPhone 16 已经推出了两个月。
本来以为在这一代 iPhone 上,Apple Intelligence 会是最大看点,但落地遥遥无期的 AI 和各种「剑走偏锋」的偷渡方法,早已消磨了大家的热情。
此时我才发现,原来 iPhone 16 上真正的主角,还是那颗相机控制按键。
别误会,我的意思并非是它多好用,而是为了保护这个小东西,着实闹出了不小的动静。
一颗按键,复杂集成
就像家里的电视遥控器,再不济也要套一个袋子一样,不少人拿到新手机的第一件事,大概都是准备一套手机壳与贴膜。
但在 iPhone 16 上,这颗按键给手机壳制造了不小的麻烦。
先回顾一下相机控制按键是个什么东西:这颗按键由一块蓝宝石玻璃、一个压力感应器与一个机械结构组成,支持手指的滑动、按压与点击操作。
我们可以将这颗按键的交互方案分成两套结构:一套是通过机械结构实现点按激发,另一套则是通过用于屏幕上的电容感应与压力传感器来实现触摸与按压激发。
机械结构好解决,从电源键到音量键都是通过这种最基础的方式来交互,无论是开孔设计、硅胶覆盖,甚至是金属与硅胶结合以营造金属触感,市场上早已有成熟的方案来应对了。
但电容与压感明显是个新东西。
电容触摸的工作原理是通过人体导电性来检测触摸位置,它在表面覆盖了一层透明的导电材料(通常是氧化铟锡),形成一个稳定的电场。
当你用手指触碰到材料表面时,人体会吸收一部分电流,这一触摸点的电容值就发生了变化。屏幕内部的传感器能够快速感知这种正在发生的电容变化,并将其传送至处理芯片,计算出触摸的精确坐标位置。
也就是说,想要隔着手机壳用好这颗按键,满足传统的机械结构还不够,还必须有可以传导手指生物电讯号的介质。
有需求,就有市场,不过这一次,商家想挣这份钱,可谓是忙坏了。
需求无限多,方案不完美
在 iPhone 16 才推出时,大家想要带相机控制按键的手机壳,因为官方的手机壳也配备了相机控制按键,跟着原厂的做法肯定没错。
那我们看看原厂是怎么做的:与 iPhone 16 上的相机控制按键一样,官方 MagSafe 硅胶保护壳上有一片蓝宝石玻璃,并配备有传导层,能够将手指的动作传递给手机的相机控制按钮。
之所以选用蓝宝石玻璃,是因为它能达到约为 2000HV 的硬度——这是矿物玻璃的两倍,不锈钢的十倍,只有少数材料能够划伤这个硬度的蓝宝石玻璃,比如 4500 至 10000HV 的真钻石。
目前官方网站出售的 Beats 保护壳也采用了同样的方案。
与硬度相对应,蓝宝石玻璃的成本也相当高,虽然苹果从未透露过相机控制按键的蓝宝石玻璃成本,但是我们可以通过另一个使用蓝宝石玻璃的设备揣测——Apple watch。
▲ YouTube 博主 @Unbox Therapy 测试 Apple Watch 的蓝宝石屏幕硬度
知名的市场调研和数据分析公司 IHS Markit 通过对 Apple Watch 拆解分析,得出了一份提及蓝宝石玻璃屏幕成本的报告:
Apple Watch 上使用的蓝宝石玻璃屏幕的总成本约为 27.41 美元,其中 7.86 美元为材料成本,其他部分包括研发、劳工和制造费用。
综合考虑材料成本和加工工艺,iPhone 16 系列的相机控制按键蓝宝石成本合理估计在 8 至 15 美元范围内。
这种成本对于第三方制造商来说毫无疑问非常高,随之而来的就是风险,用户也更喜欢物廉价美的东西,想要继续维持低价多销,就需要想别的办法——用其他材料覆盖这颗按键。
这种办法的效果不算好,大多数材料的导电性能有限,隔着一层材料操作这颗按键一点也不丝滑,大家想要的是既能保护按键,又不影响操作的手机壳。
于是整个十月,市场的需求开始出现分歧。
一部分人在发现带相机按键的手机壳并没有那么好用以后,干脆不要这颗按键了——反正也不好用,AI 又没落地,我要它干嘛?不如包起来。
于是有的商家推出了类似于 iPhone 15 系列的手机壳,直接忽略掉这颗相机控制按键。
而另一部分人则不愿意放弃,原因也很简单——我为这颗按键花了钱,不管用不用得上它都要在那儿。
执着有时候会带来新发现。
厂家继续生产额外做了相机控制按键的手机壳(后称电容手机壳),这些壳子绝大多数都遵循苹果官方手机壳设计——用玻璃材质作为表面材料,保证手指操作的顺滑度,再设计一个导电层,将电信号变化传导到手机上的相机控制按键,达成精准操作。
但是结果也不乐观,由于控制成本,第三方的电容手机壳也出现各种翻车,比如玻璃材料脱落、按键整体脱落。
不过这些还算小问题,一个避雷贴的出现,彻底把这类壳子打入冷宫:如果手机壳内部有灰,时间一长,iPhone 机身上的按键就会被弄出印子。
安了手机壳还留印?这简直不可接受,市场的呼声又又又变了:
不要带按键的手机壳!
这下商家是真的麻了,赶忙又将发布前提前设计的开孔壳库存拿出来卖。
此时,又一个新鲜的东西进入了大家的视线:按键贴膜。
没错,继屏幕贴膜、镜头贴膜之后,按键贴膜也出现了。
人民群众的智慧是无穷的,经过反复折腾以后,大家实在是对于这颗矜贵的按键失去耐心了,索性就用最实用的方法吧——开孔手机+按键贴膜。
甚至,广大用户还为其总结了非常全面的经验:为了防止这颗按键出现任何意外,不管用开孔壳还是全包壳,最好都贴上按键贴膜。
手机壳厂家打得不可开交,按键贴膜商家却成为了最大的赢家。
事情到了这里,市场已经乱成了一锅粥。
总而言之,目前大致还有四套方案:
- 搞全包,将这颗按键直接屏蔽,当它不存在
- 抛弃按键的半按和触摸功能,只保留机械结构的点击
- 坚持开孔结构,搭配按键贴膜一起卖也是不错的选择
- 又开始新一轮的电容手机壳研发,企图通过软化金属或是硅胶包裹的方案解决电容按键壳留印的问题
这些方案都不错,可以说各有簇拥,但需要注意的是,全包只是一时之举,并不能长久——这与尚未落地的 AI 有关。
根据爱范儿对 Apple Intelligence 的测试来看,与视觉相关的 AI 功能只有一个入口,就是这颗难搞的相机控制按键,如果坚持全包,就等于放弃了这一部分功能。
正如哲学家尼采所言:
面对困境,退缩只会让我们被更大的困境追赶。
说到底,这颗按键惹出来那么多麻烦,完完全全是因为苹果设计的偷懒。
根据微博博主 @楼斌 Robin 对 iPhone 的拆解来看,相机控制按键通过焊接将键帽与内侧的金属衬板死死固定在一起,如果出现损坏,只能进行破坏性拆解。
▲ 拆解图片来自微博 @楼斌 Robin
苹果官方的维修报价来看,这颗按键的保外维修价格高达 4399-6099 元。
这颗按键真是用得起,坏不起。
近年来,苹果一直在帮助用户管理注意力,以便提高效率,为此陆续推出了专注模式、自动化等功能,其首席执行官蒂姆·库克(Tim Cook)在接受采访时强调:
苹果的最终目的在于让用户更专注,拒绝那些非常好的想法,以便为伟大的想法腾出空间。
目前看来,苹果用这颗集成了多种结构与技术的按键,逼着购买了 iPhone 16 的用户必须要在日常使用中压缩自己的「伟大想法」,分出一部分注意力给苹果这个「非常好的想法」,实在是背离了初衷。
可别说用户把手机供起来,毕竟爱惜自己的东西,永远不会有错。
#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。
黄仁勋最新演讲:每家公司都将成为 AI 制造商 | 万字实录
老黄又来做推销员了。
上周英伟达市值超越苹果,成为全球第一,与此相对应的,英伟达创始人黄仁勋也没闲着,开启了全球随心飞,时常在各地露面演讲。
销售的最高技巧,就是不断的推销,推销,与推销。
今天,黄仁勋也去到了日本,与软银集团 CEO 孙正义进行了一次正式的会面。
在交流前,黄仁勋先来了一段长达一个小时的的演讲,向在场与会者深入浅出地介绍了什么是 AI,以及 AI 将会如何影响我们的生活,碰到小插曲,老黄也入乡随俗地连道多句「私密马赛」。
在与孙正义的交流过程中,黄仁勋还展示了不少「黄氏」幽默。
比如看到孙正义,先来一段排比句式的彩虹屁,逗得孙正义开颜大笑。又或者,打趣孙正义曾是英伟达最大股东时,顺便也调侃自己错失收购英伟达的懊悔不已。
-
黄仁勋介绍英伟达是一个模拟技术公司,专注于模拟物理学、虚拟世界和智能,通过模拟帮助预测未来,类似于在构建时间机器。
-
黄仁勋强调英伟达的目标不是替代 CPU,而是增强 CPU 的功能,将计算密集型任务交给 GPU。
-
传统编程到机器学习的过渡,软件 2.0 不再依赖传统的代码,而是通过神经网络在 GPU 上运行。这种新的编程方式使得计算能力更强大,尤其是在 AI 和深度学习领域。
-
随着 AI 系统规模的扩大,推理能力也得到了扩展,这意味着 AI 能够进行更多的反思、规划和思考,从而提升其智能和表现。
-
英伟达将继续推动计算性能的提升,不仅通过 GPU 的不断发展,还通过协同计算的方式降低成本、减少能耗。
-
黄仁勋与孙正义共同宣布在日本建设 AI 网格,包含 AI 工厂和 AI 网络,旨在为日本各地提供 AI 服务。日本将成为全球首个实现这一目标的国家,AI 技术将推动日本各行业的变革。
原视频地址指路:https://www.nvidia.cn/events/ai-summit-japan/fireside-chat/
附上黄仁勋演讲全文以及炉边对话全文,全文共 1.7 万字,由 APPSO 编译
不只是在造 GPU,更像是在造时间机器
黄仁勋:欢迎来到英伟达 AI 峰会。
在英伟达,我们的核心是一家模拟技术公司。
我们模拟物理学,我们模拟虚拟世界,我们通过模拟来模拟智能。我们帮助你们预测未来。所以,从很多角度来看,英伟达就像是在构建时间机器。
今天,我们将分享一些我们的最新突破。但最重要的是,这次活动是关于日本生态系统的。这里有这么多合作伙伴, 350 家初创公司,250000 名开发者,数百家公司。
我们已经与日本有着长期的合作。
自公司创立初期以来,日本对我们而言一直都非常重要。正是在日本,我们做了许多「第一次」。
比如视频游戏领域,Sega 的 Yu Suzuki 是我们第一次合作的游戏开发者,曾帮助我们将 Sega 的出色 3D 游戏移植到英伟达的 GPU 上。
那是第一次有人使用英伟达的 CUDA 技术来构建超级计算机,东京科技大学的超级计算机就是通过英伟达的 GPU 来推动科学计算的发展。
日本在许多领域都是全球的先锋。
还有,正是日本让我们第一次能够创造出移动处理器,进而催生了我们非常重要的项目之一——任天 堂 Switch。如今,很多「第一次」已经成为现实。
现在,我们站在 AI 革命的起点,迎接一个全新的行业和令人惊叹的技术变革。这个时代令人激动,同时也充满挑战。因此,我们在此与日本生态系统中的优秀企业合作,携手将 AI 带入日本,共同抓住这一前所未有的机遇。
今天我们有很多合作伙伴在场,我要特别感谢他们。
英伟达是加速计算的创始者,加速计算并不会取代 CPU。
实际上,我们几乎是计算领域中唯一一家不打算替代 CPU,而是想增强 CPU 功能的公司,目的是将那些计算密集型的工作负载卸载到 GPU 上。
这些是 GPU 指令集与 CPU 一起工作。
通过这种方式,我们可以充分利用两种处理器的优势:一种擅长顺序处理的 CPU,另一种则擅长并行处理的 GPU。稍后我会详细介绍这一点。
但这不仅仅是并行计算,而是加速计算,CPU 和 GPU 协同工作。这种计算模式对世界来说是全新的。
实际上,单纯使用 CPU 的计算模式自 1964 年以来就已存在,也就是在我出生的第二年,至今已有 60 年。
今天世界上绝大多数的计算任务,都是依赖 CPU 来运行的。
但现在,计算模型迎来了一个全新的、根本性的变化。然而,为了实现这一点,我们不能仅仅将顺序执行的 CPU 软件直接移植到 GPU 上。
为了实现并行计算,我们必须开发出一系列全新的算法,正如 OpenGL 使计算机图形能够通过图形处理器进行加速那样,我们也必须为许多不同的应用领域开发出许多特定的库。
这些库正是我们公司所拥有的 350 多种不同的库,其中一些库在业界非常重要。例如,Kulit 是一个专为计算光刻设计的库,它能大大加速光刻过程。在制作芯片掩模时,通常需要数周的时间,因为涉及许多层的处理。
通过使用该技术,我们将数周的计算时间缩短为几个小时。
虽然我们可以加速芯片制造周期,但更为重要的是,这使得光刻算法得以更加复杂和先进,从而推动半导体物理的进步,远远超越 2 纳米、1 纳米甚至更小的技术节点。
因此,计算光刻将通过 cuLitho、Ku DSS(稀疏求解器)以及 AI 进行加速。我今天将会详细讲解这一令人兴奋的新库,它使得这台计算机能够支持 5G 无线电协议栈的运行。
基本上,实时运行的无线电系统依托 CUDA 加速器进行量子模拟、量子电路模拟,基因测序中的配对,CVS 用于向量存储,或者是用于 AI 的向量数据库进行索引和查询。
NumPy 是全球最受欢迎的数值处理库,全球有 500 万名开发者在使用它。仅在上个月,它的下载量就达到了 3000 万次,真是一个惊人的数字。
现在,它已经完全加速,支持多 GPU、多节点的运算。如果你感兴趣,欢迎查阅相关资料。
另外,向你们介绍一个令人震撼的 CDF 数据框架处理,这是用于结构化数据处理,如 SQL、pandas、polars、co-opt,以及经典的旅行推销员问题。
这个问题已经被加速了,速度是以前的几百倍,适用于 AI 物理学。接下来,我们创建了一个非常重要的库,叫做 Coup DN Co DNA,用于深度神经网络,处理深度学习体系中的不同层级。
通过创建 QDM(量子点(Quantum Dots))并加速深度学习,我们做了一件非常特别的事,使得深度学习得到了普及。在过去的十年里,我们让人工智能和机器学习的规模提高了 100 万倍。
通过把机器学习的规模提升 100 万倍,我们实现了一个巨大的突破,也正是这个突破,催生了如今的 ChatGPT——人工智能的到来。
QDM 做了一件非常特别的事,它改变了软件开发的方式。这是软件 1.0 之前的情况,程序员编写代码来描述一个算法,这个算法就是软件。
你输入数据,软件就预测输出。人类编写的代码,通常是运行在 CPU 上的。
软件 1.0 就是编写在 CPU 上运行的代码。现在我们进入了软件 2.0 时代,因为计算机速度已经非常快,你可以给它提供大量的样本数据,让它自己学习并预测函数。我们称之为软件 2.0。
所以,不再是传统的编程,而是机器学习;不再是代码运行在 CPU 上,而是神经网络运行在 GPU ISS 上,神经网络就是软件 2.0 的核心。
这些运行在 GPU ISS 上的神经网络,已经形成了一种全新的操作系统,一种全新的计算机使用方式。它就是现代计算机的操作系统——大型语言模型。
这种机器学习方法展现了其惊人的可扩展性,你可以用它做各种各样的事情。当然,包括数字化文本、语言、语音、图像、视频等。它是多模态的,你可以教它氨基酸序列,教它理解几乎所有事物,任何包含大量观察数据的内容。
第一步就是通过研究互联网上的大量文本来理解数据的意义。
通过这种方法,我们能够理解单词、词汇、语法,甚至通过寻找模式和关系来理解单词的含义。
如今,我们使用相同的方法,不仅能够理解与不同模态相关的各类数据的意义,例如单词与图像之间的关系,「cat」这个单词和「猫」的图像就被连接了起来,学习多模态后,我们现在甚至能够进行翻译和生成。
所以,我们能够理解各类数据,也能够生成智能信息,创造各种形式的智能。
如果你看看现在创造的所有令人惊叹的初创公司和应用,你会发现它们都属于这张幻灯片中的两种组合之一:
从文本到文本(比如摘要、问答、文本生成、讲故事),或从文本到其他形式(如视频到文本用于字幕,图像到文本用于图像识别,文本到图像用于图像生成,如 Midjourney,文本到视频用于视频创作,如 Runway ML)。
所有这些不同的组合都是突破性的。你甚至可以做到蛋白质到文本,解释蛋白质的功能;文本到化学物质,描述某种可能成为有效药物的化学特性;甚至可以将视频和文本结合,来实现机器表演、机器人技术。
每一种组合都代表了一个新的行业、新的公司、新的应用场景,掀起了令人震撼的「寒武纪大爆炸」,产生了大量新应用。
我们现在才刚刚开始,机器学习的一个特点是,脑容量越大,能够教给它的数据越多,它变得也就越聪明。
我们称之为 Scaling Laws。现在有很多证据表明,随着模型的规模扩大,训练数据的增多,智能的效果、质量和表现都会得到提升。
每年,整个行业都在将模型的规模扩大约两倍,同时需要相应增加两倍的数据量。
因此,我们需要四倍的计算资源,推动人工智能迈向下一个层次所需的计算资源是巨大的。在 Scaling Laws 中,预训练是其中一部分,后训练也是一部分。
后训练通过强化学习、人类反馈、强化学习、AI 反馈等多种方式进行。现在,后训练阶段有很多方法可以使用合成数据生成。因此,训练、预训练和后训练正在经历显著的扩展,我们仍在看到非常好的成果。
当 Strawberry 或 Open AI 的 o1 发布时,它向世界展示了一种全新的推理方式。
推理是与 AI 互动的过程,就像你与 ChatGPT 交流一样,但 ChatGPT 是一次性的。你向它提问,要求它做某事,无论你提出什么问题,或给出什么提示,通过一次交互,它就会给你答案。
然而,我们知道,思考往往不止是一瞬间的,思考需要我们进行多次尝试,最终从中选择最合适的答案。
就像我们在思考时,可能会反思答案,然后再给出答案,这就是反思;或者是我们将一个问题分解成一步一步的思考链。我们已经发明了许多技术,使得推理在我们投入更多计算资源时,能够不断提升。
现在我们有了第二个 Scaling Laws——推理 Scaling Laws,不仅仅是生成下一个单词,更是思考、反思和规划。这两种同步扩展将要求我们在每次交付新一代和新架构时,都以极快的速度推动计算性能。
我们每次交付时都会在 X 倍提升性能的同时,也减少相同倍数的功耗和成本。因此,提高性能等同于降低成本,提高性能也等同于减少能耗。
因此,随着世界越来越多地接受和应用人工智能,推动人工智能技术的发展,扩展其应用范围,是我们的使命。
我们的责任就是持续不断地推动性能提升,并尽可能地加快这一过程,同时扩大人工智能的应用领域,提升其效果,降低成本,并减少功耗。这也正是我们转向一年一个周期的原因。
然而,人工智能并不是单纯的芯片问题。这个 AI 系统庞大无比。这就是 Blackwell 系统。
Blackwell 不仅仅是一个 GPU 的名字,它也是整个系统的名字,而这个 GPU 本身也非常出色,必须要提到这一点。抱歉,向在场的各位外宾解释一下。
所以,今天我们展示的是 Blackwell。
每个 Blackwell 芯片都是世界上最大的芯片,拥有 1040 亿个晶体管,由 TSMC 在其最先进的 4 纳米制程上制造。这两个 Blackwell 芯片通过 10TB 每秒的低能耗连接互联。
位于芯片的接缝处——那条线——数千个互联节点,传输速度达到 10TB 每秒。
这些芯片通过来自 SK hynix 和 Micron 的八个 HBM 3e 内存模块连接,内存的总带宽为每秒 8TB。这两个 GPU 通过 NVLink 与 CPU 连接,每个 GPU 的连接带宽为每秒 1.8TB。
这是非常多的每秒千兆字节。之所以如此,是因为这个系统不仅可以单独运行。即便是世界上最先进的计算机,也无法单独完成人工智能任务。
有时它必须与成千上万台像这样的计算机协同工作,这些计算节点共同工作就像一个巨大的计算机,而有时它们需要独立工作,以响应不同的客户或查询。
因此,它们有时会单独运行,有时则作为一个整体工作,从而让 GPU 能够作为一个整体进行工作。我们当然有通过网络将这个 GPU 与成千上万的其他 GPU 连接,但我们仍然需要 NVLink。
这种 NVLink 可以让我们将一个机架中的几个 GPU ISS 连接起来,就像我身后的这个机架一样,机架通过 NVLink 连接,带宽为每秒 1.8 TB,比全球最高带宽的网络快 35 倍,这让我们可以将所有这些 GPU ISS 连接到一起。
这个机架中有九个 NVLink 交换机,每个机架有 72 台计算机,它们通过网络连接。
NVLink 是通过 50 英镑的铜线直接驱动的,借助这个出色的 Cdes,我们称之为 NVLink。它们连接到计算机,就像这样连接到 NVLink。这个交换机将所有这些计算机连接成一个整体。
所以最终,72 台计算机连接在一起,形成一个超级 GPU,一个巨大的 GPU。从软件角度来看,它就是一颗巨型芯片。这些机架,这个机架的成本为 3000 英镑。它不可能搬到这个舞台上展示。
如果可以的话,我会给你们展示它,3000 英镑,120 千瓦功率。这相当于很多很多台 Nintendo Switch 的功率。它不便携,但它极其强大。这就是 Blackwall 系统。
我们设计它可以配置成一个超级节点,或者构建成一个庞大的数据中心,里面有成千上万台,理想情况下有数十万台。这些机器通过交换机连接,其中一些交换机是能够无缝集成到你现有的以太网环境中,我们可以使用这些系统来构建 AI 超级计算机。
我们可以将它们集成到企业数据中心、超大规模数据中心,或为边缘计算配置。Blackwell 系统不仅强大无比,而且具有极强的适应性,可以轻松融入全球各地计算基础设施的每一个角落。因此,这就是 Blackwell,超越了 Blackwell。
这就是计算机,但最重要的是,没有在其上运行的所有软件,这台计算机根本无法发挥作用。
当你看到这些计算机配有液体冷却系统和复杂的电线时,你会感到震撼。如何才能编程控制如此强大的计算机呢?这正是英伟达软件堆栈的意义所在。我们的所有努力,包括在 CUDA、Megatron 核心等方面的工作。
我们多年开发的所有软件,像 TensorRT、Triton,所有这些软件的集成,使得全球任何地方的人都能够部署 AI 超级计算机。
然后,当然,AI 软件层进一步简化了 AI 构建过程。那么,AI 到底是什么呢?我们从许多不同的角度讨论 AI,但我认为有两种类型的 AI 会变得特别流行,另外,两个思维模型对我来说也非常有帮助。
第一个 AI 基本上是数字 AI 工作者。这些 AI 工作者具备理解、规划和执行的能力。
有时,数字 AI 工作者被要求执行市场营销活动、客户支持、制定供应链计划、优化芯片设计、协助编程,甚至可以在药物发现行业中担任研究助理或实验室助理。
或许,这些 Agent 人可以作为 CEO 的私人导师,也可以成为我们员工的辅导员。这些 AI,这些数字 AI 工作者,我们称之为 AI Agent 人,实际上它们就像是数字化员工。
就像数字员工一样,你必须对它们进行培训。你需要通过创建数据来迎接它们加入公司,教它们关于公司的知识。
根据你希望它们承担的具体职能,你会为它们提供相应的技能培训,培训完成后,还需要评估它们,确保它们学到了应学的内容。你还需要设立保护机制,确保它们只完成指定的任务,而不是不该做的事情。
当然,你还需要运营这些 AI Agent,部署它们,向它们提供来自 Blackwell 的能量和 AI token,它们将与其他 Agent 进行互动,协同工作,解决问题。你将看到各种不同的 Agent。为了让生态系统更容易为企业构建 AI Agent,我们开发了几种工具。
英伟达并不从事服务业务,也不创造或交付最终产品,也不提供完整的解决方案。我们所做的是提供技术支持,帮助生态系统创建、交付并不断改进 AI。我们的 AI Agent 生命周期平台叫做 Nemo。
Nemo 提供了我之前提到的每个阶段所需的库,从数据整理到训练、微调、合成数据生成、评估再到保护措施。所有这些库都已集成到全球各地的工作流和框架中。
我们与 AI 初创公司以及像埃森哲(Accenture)和德勤(Deloitte)这样的服务提供商合作,推动这项技术走向全球的大型企业。
我们还与像 ServiceNow 这样的 ISV 合作,帮助他们创建使用 ServiceNow 的 AI Agent。
今天,你可以通过许可 ServiceNow 平台来使用它,并且你的员工与 ServiceNow 平台互动获取帮助。未来,ServiceNow 还将提供大量 AI Agent,基本上就是你可以租用的数字员工,帮助你解决问题。
我们正与全球的 SAP、Cadence、Ansyr、Snowflake 等公司合作,目的是共同构建能够帮助提升企业生产力的 AI Agent。
现在,这些 Agent 能够理解、推理、规划并采取行动,而这些 Agent 实际上是一个由多个 AI 模型组成的系统,并非单一模型。Nemo 帮助我们构建这些 Agent。
同时,我们还创建了预训练的 AI 模型,并将它们打包成所谓的 Nim(Nemo 推理),这是一种微服务。
所以这些 Nim 就像微服务一样,它们基本上是打包的 AI。过去,软件是以盒装形式包装的,配有光盘,而今天的 AI 则以微服务的形式打包,软件本身是智能的。
你可以与这些软件进行对话,因为它能够理解你说的内容。而且,你还可以将这些软件与其他软件连接起来。
你可以把这个 AI 与其他 AI 连接在一起,组合成一个 AI Agent,这就是第一点。让我举一个例子,说明这些 AI Agent 的应用。
AI 正在改变各行各业,利用复杂的推理和迭代规划解决跨学科的复杂问题。
AI Agent 能够加速市场营销活动上线,提供即时洞察;帮助优化供应链,节省数亿成本;还可以通过帮助分析师快速识别漏洞,将软件安全处理流程从几天缩短到几秒。
AI 之所以如此强大,是因为它能将数据转化为知识,再将知识转化为行动。
举个例子,这个数字 Agen t 能够通过从一系列信息密集的研究论文中提取洞察来教育个人,这些研究论文是通过英伟达 AI 蓝图构建的。英伟达 AI 蓝图是一种参考工作流程,包含英伟达加速库、SDK 以及 Nim 微服务,帮助用户快速构建和部署 AI 应用程序。
多模态 PDF 数据提取蓝图帮助构建数据摄取管道,而数字人类蓝图则提供了流畅的类人互动。
AI Agent 系统包括三个部分。Nemo、Nims 和 Blueprints。
这些资源都可以公开获取,你可以根据需要使用并构建属于自己的 AI Agent 团队。没有哪个 Agent 能够完成某个人的 100% 工作,没有任何 Agent 能做到这一点。
然而,所有 Agent 将能够完成你工作中的 50%,这就是巨大的成就。
与其认为 AI 会替代一部分员工的工作,不如看作 AI 为所有员工完成了其中的 50%。这种思维方式下,你会发现 AI 将帮助提升公司整体的生产力,进而提升你的个人生产力。
人们经常问我,AI 会不会取代我的工作?我总是回答,AI 本身不会取代你的工作,只有当别人使用 AI 时,才会取代你的工作。所以,确保尽早开始使用 AI。第一个应用是数字 AI Agent,这些就是数字 Agent。
第二个应用是物理 AI,基本技术是一样的,这些技术现在已经体现在机械系统中。机器人技术毫无疑问将成为全球最重要的行业之一。
直到现在,机器人技术还受到很多限制。而这个限制的原因非常明确。事实上,在日本,全球 50% 的制造机器人都是在这里生产的。
川崎、Fanuc、安川、三菱是全球机器人技术的四大领先企业,生产了全球一半以上的机器人。
尽管机器人在提高制造业生产力方面发挥了重要作用,但机器人产业在很长一段时间内增长缓慢。其原因在于机器人技术过于局限,缺乏灵活性,无法适应不同的场景、条件和工作需求。
我们需要一种更加灵活的 AI,能够自我适应并进行自主学习。
你会注意到,直到现在我们描述的技术——Agent 型 AI——无论是谁,都应该能够与这些 Agent 进行互动,并得到回应。
当然,有时这些回应可能不如我们自己产生的回应,但事实上,许多情况下它们的回应甚至比我们更好。
因此,我们可以将这种通用 AI 技术应用到具身 AI 或物理 AI 领域,也就是我们通常所说的机器人技术。为了实现机器人技术,我们需要构建三台计算机。
第一台计算机用于训练 AI,就像我们之前提到的所有示例一样;第二台计算机用于模拟 AI,你需要为 AI 提供一个练习环境,让它能够学习和从合成数据中汲取知识。我们称之为 Omniverse。
Omniverse 是我们为物理 AI 和机器人技术创建的虚拟世界数字双胞胎物理 AI 库。在训练、验证和评估之后,你可以将经过训练的模型移植到物理机器人中。
在这一过程中,我们有专为机器人设计的处理器,名为 Jetson Thor。
Thor 是一个为类人机器人设计的机器人处理器。这一过程将不断循环。就像 Nemo AI Agent 生命周期平台一样,Omniverse 平台也可以帮助你创建 AI。最终,你所期望的 AI,将在屏幕左侧看到一个世界,它能识别视频、周围的环境以及你的需求,并生成相应的动作。
就像我们可以处理文本并生成视频一样,我们也可以处理文本并生成药物化学成分。我们可以处理文本并生成肢体动作。这个概念与生成式 AI 非常相似,这也是我们认为现在我们已经具备了必要的技术基础——从 Omniverse 到我们构建的所有计算机系统,再到最新的生成式 AI 技术——时机已经成熟,人工智能和机器人技术的结合已经成为现实。
那么,为什么类人机器人这么难做呢?显然,作为人类我们自身就非常复杂,为类人机器人开发软件更是异常困难。
然而,回报是巨大的。现在,世界上只有两种类型的计算机可以轻松部署到全球各地。第一种是类似汽车的机器人系统,这主要是因为我们已经为汽车打造了适应的世界。
第二种是类人机器人。这两种机器人系统可以在全球任何地方部署,因为我们已经为我们自己创造了这个世界。虽然这两种技术都异常复杂,但时机已经成熟,其影响力也将是巨大的。
就在上周的机器人学习大会上,我们宣布了一个非常重要的新框架,叫做 Isaac Lab。
Isaac Lab 是一个强化学习虚拟仿真系统,能够教会类人机器人如何成为类人机器人。我们在此基础上开发了多个工作流程。第一个工作流程叫做 Groot Mimic。Groot Mimic 是一个框架,允许通过人类示范教导机器人如何完成任务。
通过使用领域随机化技术,我们可以生成大量类似示范的其他实例,帮助机器人学会如何概括。如果没有这个过程,它只能完成非常特定的任务。通过 Mimic,我们能够让机器人学习到更为广泛的技能。
第二个流程是 Groot Gen Groen,利用生成式 AI 技术,在 Omniverse 平台上,我们可以创造出大量随机化领域的环境实例,并设计出希望机器人执行的各种动作。
所以我们正在开发一系列测试、评估系统和评估场景,让机器人可以进行尝试并自我提升,学习如何成为更优秀的机器人。
第三项是群体控制。群体控制是一个模型蒸馏框架,允许我们将所有学到的任务和技能浓缩为一个统一的模型,使机器人能够执行运动学技能。
我刚才讲到的这一点,还有一个更重要的:机器人不仅会变得自主,未来的工厂也将实现机器人化。这些工厂将是机器人驱动的,负责协调机器人,构建机械系统,这些系统本身也是机器人。
真是一个不可思议的时代。
所以我们有两种机器人系统,一种是数字化的,我们称之为 AI Agent。你可以在办公室中使用这些 Agent,与员工合作。第二种是物理 AI 系统,即机器人技术。这些物理 AI 系统将成为公司构建的产品。
因此,公司将使用 AI 来提升员工的生产力,而我们将利用 AI 来驱动和增强我们销售的产品。未来的汽车公司将有两座工厂:一座生产汽车,另一座生产车载 AI。这就是机器人革命的开始。
全球范围内都在进行大量的活动,我无法想象哪个国家比日本更适合引领机器人 AI 革命。
原因很简单,正如你们所知道的,你们喜爱机器人,且创造了世界上最优秀的机器人。这些机器人陪伴了我们成长,成了我们一生钟爱的存在。其实我还有很多最喜欢的机器人没展示出来,比如魔神 Z、钢弹等,实在是太多了,但我可别忘了提到那个失控的机器人,抱歉。
所以,我希望日本能够借助最新的人工智能突破,将其与你们在机电一体化领域的顶尖专业知识相结合。
世界上没有哪个国家在机电一体化方面比日本更具优势。抓住这个非凡的机会,对你们来说至关重要。希望我们能够共同努力,推动这一梦想的实现。英伟达 AI 在日本取得了巨大的成功,我们有很多合作伙伴。我们有一些合作伙伴正在构建大型语言模型,如东京科技研究院、乐天等。
AI 在许多不同的领域都有广泛应用,尤其是在药物发现行业,AI 的应用方式非常多样。
因此,我对这里的进展感到非常兴奋,我们希望能够加速发展,抓住 AI 革命的机会。
这个行业正在发生变革。正如我之前所说,计算机行业已经从基于 CPU 的编码时代,转变为如今基于 GPU 运行的机器学习时代,人工智能行业正从一个单纯的软件制造行业,变成一个专注于制造人工智能的行业。
人工智能是在工厂中生产的,这些工厂全天候 24 小时运作。当你购买软件并将其安装到计算机时,软件的制造和分发已经完成。
然而,智能是永远不完结的,你不断与所有 AI 系统互动,无论是 AI Agent 还是 AI 机器人,智能以 token 为表现形式,而 token 是智能的单位,它是一个数字。
这些数字被以不同的方式组织在一起,从而形成了智能——例如,语言中的智能、方向盘中的智能、自驾车中的智能、控制人形机器人的马达中的智能、药物发现中的智能等等。
所有这些 token 都在这些工厂中生产。这些基础设施和工厂之前从未存在过,它们代表了全新的产业,这也是我们为何看到全球范围内首次出现如此多的技术进展。
我们正在迎来一个新行业——一个全新工厂的诞生,我们称之为人工智能制造。
这些工厂将由各家公司建设,每家公司都将成为 AI 制造商。显然,任何公司都无法承受不生产人工智能的后果。任何公司又怎么能承受没有智能的未来?任何国家又如何能够承受没有智能的未来?
你不必生产芯片,也不必生产软件,但你必须生产智能。智能至关重要,它是你的身份的核心,也是我们的身份的核心。
所以我们有了新的行业——AI 工厂。这就是我所说的新工业革命。
上一次这种变革发生是在 300 年前,当时电力被发现并开始普及,电力的生产和分配,以及新型工厂的诞生。那个新工厂不是发电厂,而是能源行业的一部分,发生在工业革命的背景下。而现在,我们迎来了一个全新的行业,这是前所未有的。
人工智能不仅是计算机行业的产物,它还被各行各业应用和创造。
你们必须创造自己的 AI。制药行业要创造自己的 AI,汽车行业要创造自己的 AI,机器人行业也要创造自己的 AI。每个行业、每个公司、每个国家都必须拥有属于自己的 AI,这就是一场新的工业革命。
我今天有一个重要的宣布:我们将与软银合作,在日本建设 AI 基础设施。我们将共同建设日本最大的 AI 工厂——英伟达 AI 工厂。
这个工厂将基于英伟达 DGX 平台,计划在明年年初建成。
当工厂完成时,它将拥有 25 个 Exaflops 的计算能力。请记住,最近世界上最大的超级计算机才刚刚达到 1 Exaflop,而这个工厂将有 25 Exaflops 的能力,专门为生产 AI 而设。
但为了分发 AI,软银将集成英伟达 ISS Aerial,这是我之前提到的 5G 无线电引擎,它基于 CUDA 架构。通过这种方式,我们可以统一整合无线电、计算机、基带和来自 5G 网络的 AI 计算能力。
现在我们可以发展并重新构建电信网络,将其转变为 AI RAN(无线接入网络)。它不仅能传输语音、数据、视频,还能传输 AI——一种全新的信息智能。
这个网络将通过软银的 20 万个站点,服务于 5500 万用户。AI 工厂将制造 AI,AI 分发网络将分发 AI。
我们还将基于这一基础设施建立一个新的商店——AI 商店,软银和第三方创建的 AI 产品将通过这个平台提供给 5500 万用户。我们将在英伟达 AI 企业平台的基础上构建这些应用程序,并推出一个新的商店,让所有人都能享用 AI。
这将是一次巨大的发展,最终将形成一个遍布日本的 AI 网络。这个 AI 网络将成为基础设施的一部分。
而且,最重要的基础设施之一,记住,你需要工厂和道路作为基础设施的一部分,才能制造和分发商品。你还需要能源和通讯,作为基础设施的一部分。
每当你为基础设施做出根本性创新时,就会诞生新的产业、新公司、新经济机会和新的繁荣。如果没有道路和工厂,我们如何能够经历工业革命?没有能源和通讯,我们如何能迎来信息技术革命?
每一项新的基础设施都为我们带来了新的机会。所以,对于我来说,与软银合作,在日本实现这一目标,真的非常令人兴奋。这是一次彻底的革命。这是第一次把电信网络转变为人工智能网络。
好了,让我给你展示你能做到的事情。比如这个例子。
我现在站在一个基站下方,站在一个无线电塔旁,车上有视频,而这些视频正通过基站进行流媒体传输。这个基站装有 AI。这个无线电塔配备了视频智能,它能看到汽车所看到的一切,并理解汽车所看到的内容。
这个 AI 模型可能太大,不能安装在汽车上,但它绝对可以放在基站里。通过基站接收的视频,它能理解汽车和周围环境发生的任何事情。
好的,这只是一个使用边缘 AI 保证安全的例子。或者说,它基本上是自驾车的空中交通管制,应用范围是无限的。我们还可以用这种基本思路,将整个工厂转变为 AI。
看,这是一家工厂。现在,我究竟在哪里?好的,我迷路了,这里有许多摄像头,视频被流传到基站。令人惊讶的是,凭借这些摄像头和 AI 模型,这家工厂现在已变成了一个 AI。
你可以与工厂对话,询问工厂发生了什么。问工厂:今天是否发生了任何事故?有没有异常情况?今天是否有人受伤?所有这些信息会以日报的形式提供给你,你只需要询问工厂,因为现在工厂已经变成了 AI。
这个 AI 模型不必在工厂内部运行,它也可以在软银的无线电系统中运行。好吧,这是另一个例子。实际上,你可以将几乎所有的物理对象转变为 AI——体育场、道路、工厂、仓库、办公室、大楼。
它们都可以成为 AI。你只需要像和 ChatGPT 对话一样与它们沟通。那么,仓库过道的情况如何?是否有任何障碍物或溢出物?你只是与工厂对话。
工厂已经观察并理解了所有情况,它可以进行推理并规划行动,或者只是和你对话。它可能会回答:「不,仓库过道没有障碍物、溢出物或危险。视频中的过道状况看起来井然有序、清洁且没有任何障碍或危险。」。
好的,现在你们是在与工厂对话,这太不可思议了。你们是在与仓库对话,你们是在与汽车对话,因为这些现在都已经变得智能了。
懊悔错失英伟达,黄仁勋与孙正义相同的痛
黄仁勋:嗯,今天也还有一位非常特别的嘉宾,也谈谈如何将人工智能带到日本。这个朋友,你们可能认识他。伟大的 Masa(孙正义,Son Masayoshi),来告诉大家一些事儿。
我不知道你们是否知道这件事,我在科技行业已经很多年了。计算机行业从 PC 到互联网,再到云计算,接着是移动互联网,云计算最后到人工智能。
Masa 是唯一一个在每一代都能够选对赢家并与之合作的企业家,唯一的创新者。
记住,正是 Masa 把 Bill Gates 带到了日本,是 Masa 把 Jerry Yang 带到了日本,正是 Masa 让中国的云计算产业得以诞生,是 Masa 帮助阿里巴巴起飞,还是 Masa 把 Steve Jobs 和 iPhone 带到了日本。
你们中很多人可能不知道,曾经 Masa 是英伟达的最大股东。哦,没关系。
你是怎么做到的?你是如何挑选出计算机历史上每一项技术革命的创新者?
孙正义:嗯,我觉得我只是运气好。我生在了对的时代,遇到了像你这样的伟大企业家。
这是一种激情,一种梦想,也是一种本能,你能嗅到谁是真正的开拓者,谁是真正的创新者。我真的觉得我很幸运。但这也是一样的愿景,我们能嗅到彼此,对吧?
就像狼嗅到彼此的气味。我觉得我们像狼一样能闻到彼此。
黄仁勋:我有两只小狗。我现在不喜欢这个比喻。回顾历史,正如你所说,这次的过渡、平台的变革和革命,和以前的革命有什么不同?你觉得有什么区别吗?
孙正义:嗯,我认为这是最令人兴奋、最具活力的未来前沿。这比之前的一切要大 100 倍、千倍。这是最大的浪潮,我告诉你。
黄仁勋:是的,我认为从数学上或从产业角度来看,必须认识到,虽然 AI 是软件,但它是一种非常不同类型的软件。你和我共同创造的那个软件产业,是工具产业,是为人类使用的工具。
而这种新的软件类型,神经网络、大型语言模型、智能 Agent 和机器人,它们不是工具,它们是技能,它们是任务。它们能做事,能执行工作,而「工作产业」的市场,不是 1 万亿美元,而是 100 万亿美元。
黄仁勋:这就是我们意识到,这个行业实际上不仅仅是 IT 行业的转型,它是每个行业的转型,这也是为什么它如此重要。
孙正义:是的,人类是唯一拥有超级大脑的动物,相比其他物种。正是因为大脑的强大,人类才如此强大。如果仅仅从肌肉来看,像狮子和大象,它们的肌肉更强壮,但人类拥有最聪明的大脑。
今天全球 GDP 的所有活动都基于人类的大脑活动。我认为每个行业都会被这场革命所影响。
黄仁勋:你说得对,当然其中一件令人惊讶的事是,受原子支配的行业,它的规模是有限的。因为原子数量有限,你能移动的原子也有限,而且它们很重。
但人工智能行业是由电子构成的,没错,它受量子力学的支配,规模是无限的。
孙正义:对,智能的价值远远高于单纯的物质运动。想一想那种思维的链条、推理过程,真是不可思议,太神奇了。
黄仁勋:是的,今天我们宣布的其中一项重要内容就是一起建设日本的 AI 网格。
这个 AI 网格将包括 AI 工厂,用于开发 AI 模型,还会有 AI 网络,能够将这些 AI 模型分发到日本各地。我们共同设计的 AI 工厂架构和 AI 网络是革命性的,世界上没有类似的模式。
日本将成为全球第一个实现这一目标的国家。
孙正义:是的,其他的电信公司必须跟随这股新潮流。
黄仁勋:接下来我有几个问题想问你。首先,软银如何将这个系统应用于自己和你的子公司?你如何看待这个 AI 网络会如何彻底改变日本的 AI 产业?
孙正义:正如你刚刚提到的,我们的基站过去只是用于承载电信和互联网等数据传输。然而,现在,通过这个智能网络的支持,我们将彼此紧密连接,成为日本智能基础设施的一部分。这将是非常惊人的。
黄仁勋:当然,你也可以将它应用于你的子公司,像我提到的雅虎日本和 PayPay,没错。所以,你可以创建 AI 系统,使你们所有的服务变得更加有趣和实用,提升消费者体验。
但我最兴奋的一点是,能将这个资源开放,供研究人员、学生和初创公司使用,让他们在日本得到成长。
孙正义:确实如此,得益于你们的支持,我们正在创建日本最大的 AI 数据中心,我和宫川正在商讨,我们应该将这个平台开放给许多研究人员、学生和初创公司,以鼓励他们发展。
我们也在努力补贴,帮助他们更好地访问这些计算资源。
黄仁勋:建设基础设施需要大量资本投入。是的,你正在对日本进行一次重大的投资。你知道,我们以前讨论过很多次,在很多方面,日本曾在机电一体化时代引领了技术革新,那时候机械技术和电子技术开始结合。
事实上,即便是在那个时代,日本在消费电子领域也确实引领了全球。然而,当 IT 行业和软件开始崛起时,我认为过去三十年,西方和中国的软件行业蓬勃发展,而日本本可以更加积极一些。
孙正义:那时候,甚至直到今天,很多大企业和媒体都认为自己是「成年人」,他们曾说过「做物理产品」,意思是做实体的东西才有真正的价值和意义,而软件只是虚拟的,难以信任的东西。
这样对软件价值的看法在日本已经存在了很多年,这也导致年轻创业者特别是经历了互联网泡沫破裂后,感到沮丧与压抑,批评的声音让年轻人受到了很大的打击。
我认为,我们必须通过机器人技术来重新燃起这份激情,正如你所说的,将人工智能融入机器人技术。
日本有「铁臂阿童木」这样的卡通形象,而我最喜欢的就是特斯拉的机器人。你不能只有肌肉,机器人必须拥有智能,才能说话、拥有情感,成为朋友。
我认为,这种前沿技术的推动,以及我们的挑战,现在在日本非常需要。
黄仁勋:是的,我认为软件时代现在已经到来。好消息是,这标志着新时代的开始。
孙正义:是的,重置一次,再次重置,按下重置按钮。
黄仁勋:没错,行业正在重置。你可以看到,整个技术栈正在被重构,因为上一代的公司在这个新时代里并不顺利。没错,所以涌现了一个全新的技术栈,带来了前所未有的机会。
日本必须把握这个机会,利用这段时间。而人工智能与软件完全不同。人工智能要求你拥有数据和领域专长。是的,如果你是艺术家,你就拥有领域专长。如果你开发视频游戏,你也具备领域专长。
黄仁勋:如果你从事药物研究,发明新药,你也拥有领域专长。如果你拥有领域专长,你可以用数据来描述这些专长,这些数据可以用来训练 AI 模型,而这个 AI 模型就变成了你的人工智能。
孙正义:完全正确。所以,这是一个全新的机会。幸运的是,日本至少没有压制这场 AI 革命。其他一些国家试图过度保护他们的技术,因此他们的监管体系变得有些混乱。
而在日本,至少我们很幸运,政府似乎并没有对这场革命设障碍。虽然如此,我认为政府应该更加鼓励 AI 发展,鼓励更多的创新。正如你所说,这就是行业重置的时刻,这是迎接新革命的最佳时机。
孙正义:我们绝对不能错过这个时刻,不能错过这个机会。
黄仁勋:当然,要成为人工智能革命的一部分,你需要基础设施和这种类型的软件,因为它是机器学习。你将需要大量的资源。谢谢,谢谢。而且你需要基础设施。
没有基础设施,就不可能完全实现人工智能。这就是为什么软银正在日本建设 AI 网络的原因。是的,你将催化、激活并加速这里已经存在的所有活动。
孙正义:我们通过我们的示范来展示。
黄仁勋:是的,希望今天我们在日本已经与 350 家初创企业合作。是的,350 家初创企业,而全球有 22000 家。是的,这个比例并不合理。所以我们必须鼓励年轻企业家和创新者大胆尝试,投入到 AI 领域。基础设施已经到位。
孙正义:正如我和 Miya Kawa 讨论的那样,我们将创建日本最大的 AI 数据中心。所以我们将提供很多鼓励性项目,补贴计算能力,让他们几乎可以免费使用,几乎免费去尝试新的模型,测试他们的应用程序。
AI 的应用也应该得到一些捐赠的支持,对吧?
黄仁勋:好吧,最后,这是我最后一次邀请 Masa,每次见到 Masa,我就得花钱。
孙正义:这对大家都有好处。
黄仁勋:是的,非常高兴听到这些。Masa,你最期待日本未来 AI 的哪些方面?你有什么期望?你的梦想是什么?
孙正义:嗯,正如你说的,我对 AI 和机器人技术非常热衷。
我认为,AI 医疗解决方案,尤其是医疗 AGI,肯定会到来。我也看到现在有很多新的 AI Agent 出现,比如我们有 LINE,有 Yahoo,还有其他服务,PayPal 也可以为帮助日本的生活方式定制许多专门的 AI Agent。
这些完全可以由我们提供。你知道的,我们了解日本的文化、行为、当地的智能和 API,日本的许多网站都在使用这些技术。所以我认为,企业 AI Agent,我非常支持你提到的这个方向,对此我感到非常兴奋。
但我也认为,个人 AI Agent 会真正出现在每个人的生活中。比尔·盖茨曾经说过,「每个桌面上都有一台 PC」,史蒂夫·乔布斯说过,「每个人的手上都有一部智能手机」。
我觉得现在我们应该说,「每个人都应该有自己的 AI Agent」。所以,未来每个人都会拥有自己的个人 AI 助手。没错,它将帮助我们规划旅行、假期,甚至是教育。
黄仁勋:它将伴随你一生。是的,你能想象有一个 AI Agent 了解你的一生吗?
孙正义:完全对,我们的孙子、孙女们从一岁开始就会和 iPhone 一起成长。每当他们看到一张照片时,他们都会用手指去触摸,哪怕是静态图片也一样。因为他们从小就学会了用两根手指。
将来他们会想,或许每张图片都可以被放大?
黄仁勋:他们看到图片后,会和它说话,对吧?他们戳一戳,希望它能回应。
孙正义:你可以想象,他们从一岁起就有了自己的个人 AI 助手,像第二个朋友一样,陪伴他们一起成长,了解一切。当他们生病时,AI 助手知道,家里有什么,或者它是他们的私人导师。
黄仁勋:是的,从小就开始,完全没错。它记得你读过的一切,记得它教给你的一切,完全像你的个人亚里士多德。
孙正义:完全是,完全是数字孪生。我觉得它真的是要来了,结合日本本土的知识、文化等等,再加上本土化的 Agent 商业化,我们的未来将是巨大的、惊人的。
黄仁勋:是的,你知道,大多数国家现在都意识到,国家的公民数据其实承载了这个国家的知识、文化和智慧,而这些数据应该属于国家,就像国家的安全一样。
所以每个国家都应该处理自己的数据,转化为为本国人民服务的人工智能,完全没有理由将这些外包给别人。
孙正义:这是非常非常重要的。每个主权国家、每个政府都必须把国家安全数据迁移到自己的数据中心 AI 数据中心,这将成为每个国家必须具备的东西。每个国家都必须确保自己的数据安全。
我认为,未来每个国家都会形成相关的法律法规,确保每个国家都能生成属于自己的智慧。
黄仁勋:当然,每个公司也将创造属于自己的智慧、属于自己的人工智能。是的,怎么可能有公司不创建自己的人工智能呢?
孙正义:是的,公司把自己的「大脑」交给别人。
黄仁勋:没错,没错。所以我认为世界已经开始觉醒了。而最重要的第一步,就是必须要有一个国家级的 AI 网络。没有基础设施,你怎么可能有汽车工业呢?
孙正义:完全是,完全是,你知道的。
黄仁勋:所以,你已经为日本建设了 AI 的「道路」,在这些道路上,各种新的服务和新公司将蓬勃发展。我真的非常非常激动。好吧,Masa,你能想象如果今天你是英伟达最大股东的话?
孙正义:哈哈,没错。我们曾经有过三次成为英伟达最大股东的机会。
黄仁勋:我记得是两次。
孙正义:不,不,不,第一次我们通过市场购买成为股东,我们讨论过的,嗯,甚至谈到了我们不愿提的事情。别说了。十年前,如果我知道现在会后悔,我一定会……
黄仁勋:没事。让我告诉你们 Masa 说了什么。Masa 说,Jensen,市场不理解英伟达的价值。你的未来是不可思议的,但市场无法理解它。
那是十年前的事了,你的痛苦之路还将继续,因为你在创造未来。所以让我给你钱去买英伟达。他曾想借钱给我去买英伟达。
现在我后悔没接受那个提议。真是个好主意。好吧,最棒的主意。
黄仁勋:对的,这个就是我们刚才说过的那个主意,那是我收购之后的一个月。是的,接着我们讨论了合并这两家公司。是的,另一个,另一个秘密的梦想。
孙正义:那个是我们最初的想法。第一次我们讨论的是私有化,然后第二次我只是通过市场购买,第三次就是……哦,好吧,三次尝试。
黄仁勋:但现在我们将共同创造不可思议的价值。是的,英伟达和软银将会合作。市场太不可思议了。
孙正义:哈哈哈哈哈哈,很不错。
黄仁勋:所以我非常高兴,我们正在做一件如此有意义的事情。是的,我对日本的未来充满希望。
孙正义:嗯,这只是个开始,我们将一起做很多事情。谢谢你,行业非常庞大,有大量的移动、物联网和汽车领域,而你们有出色的数据中心、游戏以及其他领域,我们可以有很多合作机会。
黄仁勋:我很期待这一切。是的,女士们,先生们,阳光明媚。孙正义,嗯,我毫无疑问地认为他是世界上最伟大的企业家之一。
感谢 Masa 先生。你们可以看到他对人工智能的热情,我们正在开展的合作伙伴关系将为日本带来 AI 网络,从工厂到分布式 AI 网络。在我离开之前,我想欢迎大家参加 AI 峰会。这里有很多精彩的会议,也有很多合作伙伴。
我们的目标,我们的使命是与大家合作,将 AI 带到日本,在这里激活 AI,并利用这次技术重置的机会,推动企业转型,打造下一个伟大的公司。
日本对我来说一直特别亲近。大多数人可能不知道,如果没有日本,我非常严肃地说,如果没有日本,英伟达今天可能不会在这里。而且有原因的。
如果没有日本,我们也看不到第一台 AI 超级计算机的诞生。所以,日本对我来说一直非常重要。我非常感激我们的合作伙伴关系,也非常感激你们的友谊。
#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。
OpenAI 总裁宣布回归!结束「最长假期」,将专注重大技术挑战
OpenAI 联合创始人兼总裁格雷格·布罗克曼(Greg Brockman)在离开公司三个月后,重新回到了职位上。
这位前高管在 X 上发帖称「一生中最长的假期结束了」,并宣布回归 OpenAI。OpenAI 的发言人证实了这一消息。
▲图源:X
据知情人士透露,布罗克曼在周二给员工的内部备忘录中宣布,他已正式重新开始在 OpenAI 工作。
此外,布罗克曼还在备忘录中表示自己一直在与公司 CEO 山姆·奥特曼(Sam Altman)合作,正为他设立一个新角色,以专注于重大的技术挑战。
▲Greg Brockman(图源:CNBC)
实际上,OpenAI 的两位联合创始人布罗克曼和奥特曼一直是形影不离的「密友」。
2023 年 11 月 17 日,时任 OpenAI 首席执行官的奥特曼突然被解雇,原因是他与董事会之间的「沟通破裂」。同时,布罗克曼被告知他将被从董事会主席的职位上撤下,但仍保留总裁职位。
然而,布罗克曼对董事会的指示表示「感到悲伤」,并选择辞职以表示抗议。2023 年 11 月 20 日,两人宣布将加入微软,领导一个新的 AI 研究团队。
戏剧性的是,次日 OpenAI 就宣布和奥特曼达成了原则性协议,奥特曼将重返公司担任 CEO。
▲Sam Altman(图源:CNBC)
同样从 OpenAI 离职的首席科学家伊利亚·苏茨克弗(Ilya Sutskever)和首席技术官米拉·穆拉蒂(Mira Murati)则分别成立了人工智能初创公司 Safe Superintelligence(SSI)和 Fathom。
值得一提的是,后者最近正在向 OpenAI 的员工抛出橄榄枝,邀请他们加入自己的新公司。
据 The Information 报道,穆拉蒂不仅成功挖来了 OpenAI 的研究项目经理米安娜·陈(Mianna Chen),还拉拢了前模型训练后处理负责人巴雷特·佐夫(Barret Zoph)和前高级研究员卢克·梅茨(Luke Metz)加盟。
▲Mira Murati(图源:CNN)
- 安全副总裁翁荔(Lilian Weng)
- 首席技术官(CTO)米拉·穆拉蒂(Mira Murati)
- 首席研究官鲍勃·麦格鲁(Bob McGrew)
- 研究副总裁巴雷特·佐夫(Barret Zoph)
- 联合创始人约翰·舒尔曼(John Schulman)
- 研究员卢克·梅茨(Luke Metz)
- 研究员安德烈·卡帕西(Andrej Karpathy)
而在今年 8 月宣布「休假至年底」的元老之一布罗克曼选择在时隔许久之后重新回到老东家,同奥特曼再次聚首。两位巨头将继续共同引领 OpenAI 的下一步发展。
#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。
城市漫步指南:塞上青城,归化绥远
早报|春节和劳动节假期各增加一天/传苹果将进军智能家居网络摄像头市场/李子柒恢复更新,微念回应
春节和劳动节假期各增加一天
新型隐形战机歼-35A 在珠海航展亮相
消息称苹果将进军智能家居网络摄像头市场
机构:2024 Q3 华为中国平板出货量第一
李子柒回归,连更两条视频
特斯拉员工薪酬曝光
Google DeepMind 开源 AlphaFold3
小米 SU7 Ultra 原型车将在本周五亮相广州车展
小鹏前泊车规控负责人刘懿加入比亚迪
视频号直播正在内测「K 歌房」玩法
镁伽科技创始人:AI for Science 发展亟需智能化新基建
百度发布文心 iRAG 和无代码「秒哒」两大 AI 技术
Steam Deck OLED 推出白色限量版
阿里云开源 Qwen2.5-Coder 模型
春节和劳动节假期各增加一天
据新华社消息,《国务院关于修改< 全国年节及纪念日放假办法> 的决定》昨日公布,自 2025 年 1 月 1 日起施行。
决定规定,全体公民放假的假日增加 2 天,即农历除夕、5 月 2 日。
全体公民放假的假日,可合理安排统一放假调休,结合落实带薪年休假等制度,实际形成较长假期。除个别特殊情形外,法定节假日假期前后连续工作一般不超过 6 天。
新型隐形战机歼-35A 在珠海航展亮相
据央视新闻报道,11 月 12 日,第十五届中国国际航空航天博览会在广东珠海开幕。在珠海航展首日,新型隐形战机歼-35A 惊喜亮相。
报道指出,隐形战机歼-35A 是由中国航空工业集团沈阳飞机设计研究所研制、中国航空工业集团沈飞公司生产的新一代隐身多用途歼击机,采用气动、结构与隐身一体化设计,是一款非常全面的中型隐身战斗机。
据专家介绍,歼-35A 是一机多型的空海孪生战斗机,它的发动机有巨大的性能提升,最大起飞重量逼近 30 吨,是我国新型中型隐身战机的性能突破。歼-35A 亮相航展,意味着歼-35A 已经是空军的正式装备。
消息称苹果将进军智能家居网络摄像头市场
据分析师郭明錤报道,苹果公司计划在 2026 年首次进入智能家居 IP 摄像头市场,并设定了年出货量达到千万级别的目标。这款摄像头将通过无线连接与苹果的其他硬件产品无缝集成,以提升用户体验。
全球智能家居网络摄像机的年出货量目前为 3000 万至 4000 万台,而苹果的长期目标是超过 1000 万台。郭明錤透露,歌尔公司已获得该产品的 NPI(新产品导入),将成为独家组装供应商。
此外,苹果的生态系统以及与 Apple Intelligence 和 Siri 的深度集成预计将显著提升这款网络摄像头的用户体验。
机构:2024 Q3 华为中国平板出货量第一
11 月 12 日,IDC 发布了 2024 年第三季度中国平板电脑市场季度跟踪报告。
根据报告数据显示,2024 年第三季度中国平板电脑市场出货量为 768 万台,同比增长 9.3%,连续三个季度保持出货量正增长。位列出货量前五的品牌如下:
- 华为延续市场份额首位,出货量保持高速增长。本季度华为在多个价位段进行了产品迭代,其中新款 MatePad Pro 和 MatePad Air 在中高价位段进一步强化华为的软硬件能力,MatePad SE 11 则成功承接千元级市场用户
- Apple 市场份额位居第二。7 月开始的返校季促销活动对新款 iPad Ai r 和 iPad Pro 的销售形成了一定提升,但国产品牌的激烈竞争和自身产品价格高昂导致的销售压力,以及上季度渠道库存影响,让 Apple 第三季度出货量继续同比下滑
- 小米市场份额位列第三,伴随小米和 Redmi 产品线运行日益平稳,第三季度出货量保持较快增长
- 荣耀位列市场第四位,出货量同比小幅增长。第三季度荣耀发布新品 MagicPad 2 在屏幕性能和办公场景方面进一步提升,拓展中高价位段市场布局
- 联想市场份额位列第五。截至上半年末较低的渠道库存为联想第三季度出货提供了良好的基础,同时新一代小新 Pro 的上市也进一步加速了出货量增长
李子柒回归,连更两条视频
11 月 12 日下午,视频博主李子柒在社交平台发布了自己的作品,并且连更两条视频。
在第一条视频里,李子柒表示「这个大漆视频迟到了四年,“漆” 同 “柒”,我给这幅雕漆隐花的漆器作品取名 “紫气东来”,麒麟回首,万事不愁,也把这份祝愿送给看到视频的每一个你,很想你们」
视频发布后,「李子柒回归」话题也迅速登顶微博热搜第一位,引发网友热议。
据九派新闻报道,对于李子柒的复更,微念方面表示:「目前李子柒与微念没有内容创作方面的合作,但李子柒品牌由微念在特定类目范围长期独占许可经营。」并称,目前微念和李子柒之间的所有案件已经完全和解。
自 2021 年 7 月 14 日发布视频后,李子柒便陷入了漫长的停更期。停更背后的原因之一是她与 MCN 机构杭州微念之间存在利益纠葛。
特斯拉员工薪酬曝光
据凤凰网科技文章分析,尽管特斯拉提供的基本薪资低于行业平均水平,但通过慷慨的股票奖励吸引和保留了员工。
美国「商业内幕」杂志通过分析特斯拉的内部薪酬数据库,发现特斯拉员工的基本工资中位数大约为 4 万美元,远低于其他科技巨头如 Meta 的 37.9 万美元。
然而,特斯拉通过提供股票奖励来弥补这一差距,其中 75% 为限制性股票单位(RSU),21% 为非法定股票期权(NQSO),4% 为激励性股票期权(ISO)。
这种薪酬模式旨在吸引那些愿意为公司长期成功而努力工作的「最硬核」员工,同时也体现了特斯拉对员工的高要求和对公司未来的信心。
尽管特斯拉的股价波动可能给这种薪酬模式带来风险,但过去五年中,特斯拉股价的飙升使得股票奖励变得非常吸引人,许多员工因此获得了巨大的回报。
Google DeepMind 开源 AlphaFold3
据「学术头条」报道,Google DeepMind 的 AlphaFold3 已经开源,允许科学家免费下载代码用于非商业目的,并且只有具有学术背景的科学家才能访问训练权重。
这一人工智能模型以其空前的精确度预测了生命分子的结构和相互作用,其研究成果发表在「Nature」上。这个模型的开源被期待将推动生物世界的理解以及药物发现的新时代。
此外,尽管之前未开源,已有基于其论文描述的蛋白质结构预测工具出现。Ligo Biosciences 发布了无限制版本的 AlphaFold3,其他团队也在开发完全开源的模型 OpenFold3,以便制药公司可以利用专有数据重新训练模型。
AlphaFold2 的开源已激发了大量创新,团队负责人 John Jumper 期待 AlphaFold3 也能带来新的科学突破。
小米 SU7 Ultra 原型车将在本周五亮相广州车展
小米 CEO 雷军发帖称,小米汽车在即将到来的广州车展上将展示其 SU7 Ultra 原型车,这款车型在纽博格林赛道上创下了四门车圈速第一的记录。
小米强调,展出的原型车将保持完成纽北圈速挑战后的真实状态,不做任何美化。同时,小米 SU7 Ultra 的量产版也将首次亮相,并且 SU7 全系 9 种颜色车型将齐聚车展。
雷军将出席车展媒体日,并在发布会上汇报小米汽车的最新技术进展。此外,雷军还将在 11 月 14 日举办一场智能驾驶体验直播,展示小米 SU7 的端到端全场景智能驾驶技术。
据悉,广州车展将于 2024 年 11 月 15 日至 24 日举行。
小鹏前泊车规控负责人刘懿加入比亚迪
据晚点 Auto 独家报道,小鹏原泊车规控业务负责人刘懿已经加入比亚迪,负责自研智能驾驶的规控业务,向自研智驾团队总负责人李锋汇报。
此前,比亚迪新技术院院长、智驾总负责人杨冬生今年 8 月告诉晚点 Auto ,在 2023 年上半年的一场内部会议上,董事长王传福明确,智驾升级为比亚迪的核心战略之一。两年内,比亚迪计划将高阶智驾功能下放到 10 万元以内车型上。
报道指出,在 2023 年及以前,比亚迪一边投入自研,一边与 Momenta、地平线、博世等多家供应商合作。智驾重要性上升后,比亚迪希望自研方案尽快量产、上车,减少对供应商的依赖。
视频号直播正在内测「K 歌房」玩法
据微信派公众号推文显示,视频号直播正在内测「K 歌房」玩法。
具体来说,在视频号直播开播页面,选择「语音」-「K 歌房」即可创建房间,除房主外,还有 8 个黄金席位,可邀请朋友或网友连麦嗨唱。
官方提示,进入任意 K 歌房直播间参与互动,就可获得该功能内测资格,拥有开播入口。使用该功能前,需要提前更新微信最新版本。
镁伽科技创始人:AI for Science 发展亟需智能化新基建
AI for Science(AI4S)的发展依赖于从数据收集到模型构建,从实验设计到过程控制的全流程,而当前国内生命科学实验室的设备和耗材大多数是为手工操作而设计,缺乏大规模积累数据的能力。
镁伽科技创始人兼 CEO 黄瑜清近日在接受 36 氪采访时指出,问题在于「科学家们对于数据日益增长的需求和相对落后的生产力之间的矛盾」。这表明为了推动 AI4S 的发展,需要更智能化的基础设施来支持数据的收集和处理。
对此,镁伽科技通过创建镁伽鲲鹏实验室来应对生命科学领域 AI for Science 发展中数据稀缺的挑战,该实验室整合了机器人、自动化和人工智能技术,为生命科学实验提供自动化工具并积累数据,被公司定义为「生命科学行业的数据工厂」。
实验室 3.0 版本专注于多个研究领域,包括细胞基因编辑和高通量药物筛选等。公司通过提供自动化设备和技术服务,将自己定位为新一代药物研发服务提供商,旨在成为 AI 和自动化赋能的 CRO 和 CDMO。
此外,黄瑜清还强调了软硬件结合的重要性,并预见了这一趋势将定义未来科学仪器和设备的开发。
百度发布文心 iRAG 和无代码「秒哒」两大 AI 技术
在 2024 年百度世界大会上,百度创始人李彦宏发布了两项重大的 AI 技术:检索增强的文生图技术(iRAG)和无代码工具「秒哒」。
其中,文心 iRAG 旨在解决大模型在图片生成上的幻觉问题,通过结合百度搜索的亿级图片资源和基础模型能力,生成超真实的图片,显著提升了 AI 生成图片的可用性,降低了品牌宣传和创作成本。
而「秒哒」则是一款无代码编程工具,它允许用户通过自然语言交互构建应用,具备多智能体协作和多工具调用的特点,使得无需编写代码即可实现任意想法,极大地提升了工作效率。
李彦宏强调,智能体是 AI 应用的主流形态,即将进入爆发期,文心智能体平台已吸引了大量企业和开发者。这两项技术的发布,预示着 AI 技术将更加深入地融入各个行业和日常生活,推动社会经济的生产力扩张。
此外,百度还在会上发布了首款 AI 眼镜「小度 AI 眼镜」,这款眼镜配备了 1600 万像素超广角摄像头、自研 AI 防抖算法和 4 麦克风阵列设计,支持 56 小时超长待机和快速充电,重量仅 45 克,并提供多种款式选择。
该眼镜集成了百度地图、百度搜索和百度百科,提供第一视角拍摄、识物百科等功能,旨在成为用户的行走百科全书,支持实时翻译和智能分析拍照内容,尤其擅长处理外文文字。
Steam Deck OLED 推出白色限量版
据「Engadget」报道,Valve 公司宣布推出一款限量版白色 Steam Deck OLED,这款新颜色变体将于 11 月 18 日上市,售价为 679 美元,与 1TB Steam Deck OLED 硬件配置相同,包括 7.4 英寸 HDR 支持的显示屏和 90Hz 的刷新率。
这款限量版白色模型将在全球范围内发售,附带一个白色携带箱。Valve 对市场反应表示好奇,并会根据反馈来决定未来是否推出更多颜色变体。
公司强调他们致力于从软件和硬件两方面持续改进 Steam Deck,包括 OLED 版本和对未来 Steam Deck 及其他硬件计划的持续工作。
白色款 Steam Deck OLED 的推出可能会吸引早期用户升级他们的设备,尽管白色硬件不太耐脏,但这款新型号的鲜明外观和性能提升可能会促使一些用户做出升级决定。
阿里云开源 Qwen2.5-Coder 模型
阿里云通义大模型团队于 11 月 12 日宣布开源其最新代码模型 Qwen2.5-Coder 系列。
这一系列包括 0.5B、1.5B、3B、7B、14B 和 32B 共 6 种不同尺寸的模型,每个尺寸都提供了 Base 和 Instruct 两种模型,以适应不同的应用场景和需求。这些模型在代码生成、推理和修复等核心任务上展现出业界领先的性能。
其中,32B 尺寸的旗舰模型 Qwen2.5-Coder-32B-Instruct 在多个代码生成基准评测中刷新了开源模型的记录,并在某些方面超越了闭源模型 GPT-4o,实现了开源模型对闭源模型的反超。
Qwen2.5-Coder 基于 Qwen2.5 基础大模型,通过大量数据训练,显著提升了 AI 编程的性能和效率,使得即使是编程初学者也能够轻松生成网站、数据图表、简历和游戏等复杂应用。
制糖工厂以旧换新.patch 第十一站,空降海口
重庆畅通卡已加入 Apple Pay 交通卡
苹果宣布,即日起,重庆城市通卡支付有限责任公司现已支持用户将畅通卡安全地添加到 Apple 钱包,使用 iPhone 或 Apple Watch 搭乘公交。
持有 iPhone 7 及更新机型的市民可在 Apple 钱包中免费开通畅通卡,不收取工本费,最低充值 10 元即可使用。
用户可以使用快捷交通模式便捷出行,在重庆乘坐公交和轨道交通。享受本地换乘优惠政策的同时,还可通过 iPhone 和 Apple Watch 畅行更多支持互联互通交通卡通勤的城市。
消息称莉莉丝旗下「生活派对」项目组大幅裁员
据雷锋网独家报道,莉莉丝游戏旗下的《生活派对》项目组,在开启不删档测试之后的 4 个月后,迎来较大幅度的裁员。
报道指出,团队规模原先在百人级别,裁员之后剩余 60 人左右。多位离职员工向雷峰网表示,本次裁员其实并不意外,是测试成绩不达预期导致的必然动作。
《魔法坏女巫》内地定档 12 月 6 日
环球影业官方微博宣布,电影《魔法坏女巫》将于 12 月 6 日在内地上映。
电影将聚焦于两个看似截然不同的年轻女子,讲述一个人性、善恶和勇气的故事。
该片由「A 妹」爱莉安娜·格兰德、乔纳森·贝利、杰夫·高布伦、杨紫琼等人出演,朱浩伟执导。
《碟中谍 8》发布首支预告
碟中谍系列电影官方微博宣布,《碟中谍 8》定名为《碟中谍 8:最终清算》,并发布了首支预告。
根据官方发布的预告片来看,《碟中谍 8:最终清算》剧情将衔接第七部的危机,伊森与 IMF 小队继续对抗 AI 智体,招牌动作戏也将在电影里重现。
该片将于明年 5 月 23 日在北美上映。
漫威动画剧集《what if…?》第三季将于 12 月 22 日播出
漫威动画剧集《what if…?》第三季发布海报及预告。
在该季剧集中,牛仔尚气、凯特·毕肖普、霍华德鸭、机甲版月光骑士等角色纷纷亮相。
该剧将于 12 月 22 日播出,每天放送一集,共八集。
#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。
派早报:Valve 推出白色限量版 Steam Deck OLED 等
华为智驾上车!比亚迪方程豹豹 8 正式上市,37.9 万元起
去年 8 月,比亚迪正式发布了方程豹品牌,以及该品牌的首款车型豹 5,用 DMO 超级混动越野平台解决了越野车型的一大短板——油耗。
还记得在那场发布会里,坐在观众席的我不仅捕获了刚发布的豹 5,远处的 SUPER 8 概念车,也出现在了镜头之中。
彼时,比亚迪研究院副院长廉玉波如此形容这辆概念车:「SUPER 8,内心与生活的至高之境。」其宽阔的轮拱和显著的离地间隙营造出的独特张力,令人印象深刻。
今晚,方程豹豹 8 迎来了正式上市,新车共分为六座和七座两款,售价如下:
- 七座豪华版:37.98 万元
- 七座旗舰版:39.98 万元
- 六座豪华版:38.78 万元
- 六座旗舰版:40.78 万元
作为比亚迪和华为合作推出的首款车型,豹 8 的亮点不止 DMO 平台云辇-P,融入了端到端大模型的 ADS 3.0 智驾系统也成为了它的一大亮点。
关于豹 8 这辆车,我们可以将它拆分为两大部分,一个是「野」,另一个是「智」。
先来说「野」的部分。
作为一款硬派越 SUV 车型,豹 8 延续了豹 5 的方正设计,并融入了全新的「未来星舰美学」设计语言,前车灯似星舰飞翼,向上微扬,将方程豹的徽标包裹其中。
方程豹将豹 8 的尾灯做成了推进器,配合中间的行星环备胎罩,塑造了一个区别于于豹 5 的「星舰」造型,更具未来感。
方程豹表示,豹 8 所遵循的「未来星舰美学」强调了三点:未来感、力量感,和威严感。
而在配置与功能上,方程豹为豹 8 用上了仰望 U8 同款的云辇-P 和三瞭望塔式激光雷达,确实称得上是旗舰级的堆料。
方程豹豹 8 的整体尺寸也与仰望 U8 相近,长宽高分别为 5195mm、1994mm、1875mm,轴距为 2920mm,是一辆不折不扣的大车。
和豹 5 一样,豹 8 同样是 DMO(Dual Mode Off-Road)超级混动越野平台下的车型,越野可以说是它「生来就会」的技能。
基于 CTC 电池底盘一体化技术,DMO 平台打造了全新的混动非承载式架构,将越野和舒适进行了融合。
在非承载式双框架环形梁以及刀片电池框架结构的加持下,大车架的扭转刚度较传统燃油豪华越野车提升了 38%,整车的舒适性和安全性都得到了保障。
动力方面,和长城那个保留了传动轴、分动箱,依赖机械结构实现脱困的 Hi4-T 不同,豹 8 的 2.0T 发动机只能对前轮进行驱动,后轮完全由电机负责,整车通过前后电机的配合来实现「中央锁止」功能。
这带来了两个好处。
在非铺装路上,豹 8 能够依靠前后电机,更加精准地分配扭矩。新增的「暴力模式」正是基于此能力,配合精准的滑移率识别而实现的实用功能。
方程豹也在发布会上展示了这套系统的能力——开启「暴力模式」后的豹 8 在泥泞路面拖走了一辆 14 吨的大卡车。
另一个好处就是省油了。即便是在馈电状态下,豹 8 的油耗也只有 8.87L/100km。而且它加的还是 92 号汽油。
电池方面,36.864kWh 的专用电池在极限穿越的场景下,也能拥有 100km 的 WLTC 纯电续航。
从数据上来看,豹 8 的动力储备十分充沛。2.0T 涡轮增压发动机+前后双电机组成的组成电四驱系统,综合功率接近 740 马力,系统最大扭矩可达 760N·m,百公里加速仅需 4.8 秒。
要知道这是一辆重 3.3 吨的大家伙。
另一方面,得益于云辇-P 液压悬架的加入,豹 8 能够和仰望 U8 一样配合道路预瞄实现底盘高低、减震阻尼、弹簧软硬的主动控制,提高车辆的通过性和座舱的舒适性。
说到座舱,豹 8 座舱的质感也比豹 5 上了一个层次,毕竟价位提升了这么多。
豹 8 的 一、二、三排的纵向空间全部超 1000mm,座椅填充非常扎实,该有的舒适性配置也都有所配备。后备厢在三排放倒后拓展到了 1130L,可以轻松装下 10 个 20 寸登机箱。
中控配备 3 块大屏,副仪表配备双 50W 无线快充、冷暖冰箱、主动香氛系统,整体风格和布局与豹 5 类似,但用料要更为考究,向豪华车型靠拢。
接下是方程豹豹 8 的另一面——「智」。
方程豹豹 8 不仅是比亚迪和华为合作推出的首款车型,同时也是搭载华为 ADS 3.0 乾崑智驾的首款硬派 SUV,「定义智能硬派越野新标准」,是它的目标。
华为 ADS 3.0 的能力,大家应该都已经不陌生了,无论是高速公路和城市道路,其表现都处于第一梯队的水平。
但在董车会看来,对豹 8 帮助最大的还是华为 ADS 3.0 的泊车能力,毕竟体型摆在这。华为 ADS 3.0 的离车泊入、泊车代驾、远程挪车等功能,都可以在豹 8 上实现。
比亚迪副总裁杨冬生在发布会中透露了一个有趣的数据:有 50% 的比亚迪用户用的都是华为手机。我想,比亚迪和华为这次的强强联合,最开心的应该是这些用户们。
#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。
社区速递 068 | 你没见过的社区文章、一周最热评、派友的控制中心
美国西部自驾游:准备、路线与注意事项
从 Apple 生态出来透透气:我的 vivo X200 Pro mini 体验分享
派早报:微软重启 MSN 品牌,Windows 11 内置邮件等应用将结束支持等
早报|支付宝就故障致歉:不会影响用户资金安全/罗永浩发文怒喷餐厅卖预制菜/OPPO 首次领跑东南亚智能手机市场
支付宝就故障致歉:不会影响用户资金安全
罗永浩发文怒喷餐厅卖预制菜
Kimi 创始人被前投资人提起仲裁
前字节跳动 AI 平台负责人出任闪极科技合伙人
原微盟首席运营官接任谷歌云大中华区总裁
机构:Q3 OPPO 领跑东南亚智能手机市场
保时捷执行董事:正在接触电池、ADAS 等领域的中国供应商
OpenAI 产品负责人:现在的模型受限于评估方法
字节豆包通用图像编辑模型 SeedEdit 开启测试
睡眠品牌舒达发布 iComfort 智能新品
X 正在测试 AI 聊天机器人 Grok 的免费版本
支付宝就故障致歉:不会影响用户资金安全
昨日上午,有多位用户在社交媒体反馈,支付宝出现了服务异常情况。
具体来说,有用户付款时显示「支付失败」「交易创建失败」「服务异常」等字眼。同时还有网友称支付宝出现余额宝提现未到账、花呗还款扣款成功但账单没清等情况。「支付宝崩了」这一词条也登上微博热搜。
随后,支付宝发文,称「因系统消息库出现局部故障,导致部分用户的支付功能受到影响。该故障不会影响用户的资金安全,截止上午 10 点 50 分故障已经修复。对于给您带来的不便,我们深表歉意。」
罗永浩发文怒喷餐厅卖预制菜
昨日,罗永浩在微博发文,表示他不反对预制菜,但餐厅卖预制菜并且不注明的,本质就是欺骗。即使真的做到了宣传的「安全美味」,它也是欺骗。
而该条微博评论区下方,也有许多网友对于预制菜发表了不同的看法。有网友认为「市场肯定能接纳预制菜的,为什么要反对」,也有网友表示,「预制菜价格卖正常制作价格,就是耍流氓。」
Kimi 创始人被前投资人提起仲裁
据「暗涌 Waves」独家报道,月之暗面创始人杨植麟、联合创始人兼 CTO 张宇韬,近日被循环智能时期投资人在香港提起仲裁,相关电子仲裁申请书也已递交 HKIAC(香港国际仲裁中心)。
有知情人士透露,本次仲裁的申请方,来自循环智能以及循环智能 7 家投资方中的 5 家:金沙江创投、靖亚资本、博裕资本、华山资本和万物资本。
报道指出,此次仲裁申请的原因,可能是杨植麟和张宇韬等人,在尚未拿到来自循环智能的几个投资方(金沙江创投、万物资本、靖亚资本、华山资本和博裕资本)的同意豁免书之前,就已启动融资并创立月之暗面。
随后,月之暗面方也对本次仲裁事项作出了回应。其通过铭德律师事务所资深合伙人 David Morrison 律师发表声明。声明内容如下:
本所已接受杨植麟先生、张宇韬先生的委托,并关注到相关仲裁事项。我们认为该事项既缺乏法律依据,也不具备事实基础,本所将依法提出抗辩。
前字节跳动 AI 平台负责人出任闪极科技合伙人
据 Z Potentials 报道,前 Google 大脑首位研究软件工程师、前字节跳动 AI 平台负责人、头部 AI 大模型公司联合创始人潘欣出任闪极科技合伙人,负责 AI 相关技术研发。
报道指出,他将组建并领导起一支专业高效的研发团队,打造基于多模态 AI 交互、实时场景分析等技术,根据用户现实生活场景和习惯,推荐信息和服务的千人千面 AI 杀手级产品。
报道称,潘欣加入闪极科技,有望在未来推动其在 AI 硬件的创新之路上稳步前行。闪极科技凭借其在智能硬件领域的技术积累与创新能力,结合潘欣在 AI 领域深厚的技术积累和对行业趋势的敏锐洞察,在这个充满潜力的市场中,打造 AI 眼镜端的「今日头条」。
今年 5 月,闪极科技在新品发布会上带来了闪极 AI 智能眼镜 。10 月底,闪极科技还官宣与 LOHO 眼镜、科大讯飞签署战略合作协议,官方表示「可以与朋友们一起推动智能眼镜市场的新变化。」
原微盟首席运营官接任谷歌云大中华区总裁
据「雷锋网」独家报道,谷歌云中国昨日发生重要人事变动,原微盟首席运营官尹世明将正式接替李孔源,出任谷歌云大中华区总裁一职。这也是谷歌云中国近六年来的首次高层变动。
据悉,尹世明拥有华中科技大学工学硕士学位,并在宝洁(中国)、联合安达顾问公司、SAP、苹果公司以及百度等知名企业担任过重要职位。分析认为,谷歌云选中尹世明的原因可能是其职业生涯长期与销售相关,且在企业服务方面有多年的经验。
尹世明的加入,以及与 AWS 中国区负责人储瑞松相似的在 SAP 和百度的工作背景,预示着外资云服务市场可能迎来新的竞争格局,业界对此充满期待。
机构:Q3 OPPO 领跑东南亚智能手机市场
据 Canalys 报道,2024 年第三季度,东南亚智能手机市场实现了 15% 的同比增长,出货量达到 2500 万台。其中:
- OPPO 以 510 万部出货量和 21% 的市场份额首次领跑市场,这主要得益于其重塑入门级机型 A3x 和 A3 的成功,
- 三星以 16% 的市场份额和 23% 的出货价值份额紧随其后
- 传音以 400 万台出货量和 16% 的市场份额稳居第三,不过增长势头有所放缓
- 小米以 15% 的市场份额和 390 万台出货量位列第四
- vivo 以 260 万部出货量和 10% 的市场份额位居第五
Canalys 分析师指出,尽管出货量增长,但该地区智能手机的平均售价下降了 4%,主要由于中低端新品上市量增加和设备过度饱和导致价格竞争加剧。厂商们正在通过整合入门级产品组合、降低成本、实现更清晰的产品线来应对利润率压力。
保时捷执行董事:正在接触电池、ADAS 等领域的中国供应商
保时捷执行董事傅伦轲在接受 36 氪专访时表示,保时捷在中国没有 eFuels 合成燃料的投资计划,但正在积极与中国供应商在电池、ADAS、互联和娱乐系统等领域建立合作,以提升其电动汽车的竞争力。
保时捷的双 e 战略(eMobility 电动出行和 eFuels 合成燃料)旨在实现环保目标,其中 eMobility 目标是到 2030 年纯电车型占新车销量的 80%。尽管 eFuels 作为一种可持续燃料在智利已有小规模生产,但由于成本高昂和推广难度,保时捷在中国暂无相关投资计划。
傅伦轲强调,保时捷面临的挑战之一是供应链转型,需要从依赖传统供应链转向与新技术供应商建立合作关系,特别是在中国市场,保时捷正寻求与中国的技术领先的供应商建立新的战略合作,以应对电动化转型和市场竞争激烈带来的挑战。
OpenAI 产品负责人:现在的模型受限于评估方法
OpenAI 的首席产品官 Kevin Weil 和 Anthropic 的首席产品官 Mike Krieger 共同探讨了人工智能领域的多个核心议题。
他们讨论了当前 AI 模型的局限性,强调这些局限更多地在于评估方法而非智能水平本身,指出产品经理的角色正在经历转变,从传统的角色向研究型产品经理演进,这要求他们掌握编写评估标准和模型微调等新技能。
两位产品负责人还展望了 AI 的未来,提出了「主动性」和「异步」作为 AI 发展的关键词,预测模型将变得更加主动,监控用户邮件、发现趋势、准备会议内容,同时也会更异步,可能需要时间来思考和回答。
此外,他们对用户适应 AI 的速度表示惊叹,预计 AI 将模仿人类思维,以指数级速度迭代升级,并以我们人类互动的所有方式进行互动,预示着全新的人机交互范式。
字节豆包通用图像编辑模型 SeedEdit 开启测试
11 月 11 日,字节在豆包大模型团队官网上,公布了最新通用图像编辑模型—— SeedEdit。
官方介绍,SeedEdit 支持一句话轻松改图,包括修图、换装、美化、转化风格、在指定区域添加删除元素等各类编辑操作,通过简单的自然语言即可驱动模型编辑任意图像。
目前,基于豆包文生图大模型,SeedEdit 支持中文和英文输入,还可以对中文成语和专有名词进行精准响应。下一步,SeedEdit 还将开放多轮复杂编辑的功能。
豆包的大模型团队也表示,未来 SeedEdit 会在真实图片保真、ID 保持、编辑精确性、以及长时序的故事类、漫画类生成方面做进一步的优化和探索,提升用户体验。
睡眠品牌舒达发布 iComfort 智能新品
近期,睡眠品牌舒达在深圳,举办了一场主题为「舒达智能床|智领 AI 睡眠新时代」的新品躺鉴会。
在此次躺鉴会上,舒达带来了 iComfort 智能新品。舒达智能床能够根据用户的需求,将床头调整到对应的支撑角度,给腰背、肩颈带来有效的承托和支撑;其太空减压和舒压按摩功能,能够帮用户释放压力、放松身心,从而更好入睡。
同时,舒达还首次正式提出 NICE AI 智能床标准:绿色环保(Natural)、智能进化(Intelligence)、舒适体验(Comfortable)和生态互联(Expansion)四个方面的集成。
X 正在测试 AI 聊天机器人 Grok 的免费版本
据 TechCruch 报道, X 一直将其 AI 聊天机器人 Grok 限制给高级付费用户使用。不过,X 似乎正准备向免费用户开放聊天机器人。
上个周末,有部分应用研究人员和用户发布了有关聊天机器人 Grok 免费版将向特定地区用户开放的消息。
据研究人员表示,目前免费的使用次数有限制:Grok-2 模型每两小时 10 次查询,Grok-2 mini 模型每两小时 20 次查询,每天三个图像分析问题。
报道指出,要免费使用 Grok,用户的帐户必须至少有七天的历史并且与其关联的电话号码。
京东近期将上线自营秒送业务
据市象独家报道,京东将在近期上线自营秒送业务,目前已经开始邀约制招商。京东的自营秒送业务主要在已有的小时购商家中筛选优质合作商,实现京东即时零售的自营化。
在整个下单流程中,参与合作的商家只需要提供打包好的货即可。营销活动、客服售后、履约服务将全部由京东平台主导完成。
报道指出,这一模式的推出,对于线下有实体店,但是嫌到家业务麻烦的零售商家而言,可以更省心省力地多一份线上到家的收入。不过弊端是,商家也将失去经营管理主导权,采用平台的统一入口,统一活动,统一服务,成为距离消费者更近的仓库。
Supreme x Timberland 合作系列曝光
名为 dropsgg 的 Instagram 博主曝光了 Supreme x Timberland 合作系列的鞋款。根据图片上内容可以看到,此次合作共推出了两款鞋型。
高帮靴款采用荔枝纹皮质鞋面,而 Field Boot 鞋型则提供了橙色、黑白、以及全黑三款配色。
爆料称该合作鞋款将于本周四发布。
GIVENCHY 2024 假日系列发布
近期,GIVENCHY 宣布,在 2024 年假日季,推出以「假日游戏」为主题的系列单品。
从 GIVENCHY 目前发布信息来看,此次「假日游戏」将推出包含男装外套、女装外套以及裙装在内的多款成衣及配饰,官方也表示,此次的系列单品会有「俏皮、温暖和淡淡的怀旧之情。」
《狮子王:木法沙传奇》定档 12 月 20 日上映
迪士尼电影宣布,《狮子王:木法沙传奇》中国内地正式定档今年 12 月 20 日上映。
电影将讲述狮王木法沙从籍籍无名到登顶称王的逆袭之路,揭秘他与尚未黑化的「经典反派」刀疤之间,不为人知的兄弟羁绊。
《狮子王:木法沙传奇》由《月光男孩》导演巴里·詹金斯执导,前作编剧杰夫·内桑森回归编写剧本,汉斯·季默、法瑞尔·威廉姆斯、尼古拉斯·布里特尔配乐。
韩版《听说》发布中字预告
由洪京、卢允瑞、 金玟周主演的韩国版《听说》近期发布中字预告,该片将于 11 月 6 日在韩国上映,12 月 6 日在中国台湾上映。
电影改编自 2009 年的同名电影,讲述一个外卖骑手爱上了一个有听力障碍的女孩,他们将自己比作水鸟和树木,试图冲破感情中的障碍。
国漫《镇魂街》真人电影立项
据国家电影局备案公示查询结果显示,国漫《镇魂街》真人电影已正式立项,编剧为周汶儒。
电影剧情简介为,冯玲闯入恶灵横行、名为「镇魂街」的异世界,意外结识曹焱兵、曹玄亮两兄弟。得知自己也是寄灵人后,便开始训练召唤守护灵。镇魂街遭遇外敌入侵,冯玲与曹氏兄弟一起战斗,守护镇魂街,但事情的发展远超他们的预料。
#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。