Normal view

There are new articles available, click to refresh the page.
Yesterday — 21 December 2024Main stream

苹果正在与英伟达合作,想让 AI 的响应速度更快

By: 范津瑞
21 December 2024 at 12:00

近日,苹果与英伟达宣布合作,旨在加速和优化大语言模型(LLM)的推理性能。

为了改善传统自回归 LLM 推理效率低内存带宽小的问题,今年早些时候,苹果机器学习的研究人员发布并开源了一种名为「ReDrafter」(Recurrent Drafter,循环草稿模型)的推测解码技术。

▲图源:GitHub

目前,ReDrafter 已经整合到英伟达的可扩展推理方案「TensorRT-LLM」当中,后者是基于「TensorRT」深度学习编译框架的专为优化 LLM 推理而设计的开源库,支持包括「Medusa」等推测解码方法。

不过,由于 ReDrafter 所包含的算法使用了之前从未用过的运算符,因此英伟达方面添加了新的运算符,或者公开了现有的运算符,大大提高了 TensorRT-LLM 适应复杂模型和解码方式的能力。

▲图源:GitHub

据悉,ReDrafter 推测解码通过三个关键技术来加速 LLM 的推理过程:

  • RNN 草稿模型
  • 动态树注意力算法
  • 知识蒸馏训练

RNN 草稿模型是 ReDrafter 的「核心」组件。它使用循环神经网络(Recurrent Neural Network),基于 LLM 的「隐藏状态」来预测接下来可能出现的 tokens 序列,其能够捕捉局部的时间依赖性,从而提高预测准确性。

这个模型的工作原理是:LLM 在文本生成过程中首先生成一个初始 token,然后 RNN 草稿模型利用该 token 和 LLM 的最后一层隐藏状态作为输入进行束搜索(Beam Search),进而生成多个候选 tokens 序列。

与传统自回归 LLM 每次只生成一个 token 不同,通过 RNN 草稿模型的预测输出,ReDrafter 能够在每个解码步骤生成多个 tokens,大大减少了需要调用 LLM 验证的次数,从而提高了整体的推理速度。

▲图源:arXiv

动态树注意力算法(Dynamic Tree Attention)则是一种优化束搜索结果的算法。

我们已经知道,在束搜索过程中会产生多个候选序列,而这些序列往往存在共享的前缀。动态树注意力算法会识别出这些共享前缀,并将它们从需要验证的 tokens 中去除,从而减少 LLM 需要处理的数据量。

某些情况下,该算法能将需要验证的 tokens 数量减少 30% 到 60%。这意味着使用动态树注意力算法后,ReDrafter 能够更高效地利用计算资源,进一步提高推理速度。

▲图源:NVIDIA

知识蒸馏是一种模型压缩技术,它能够将一个大型、复杂的模型(教师模型)的知识「蒸馏」到一个更小、更简单的模型(学生模型)中。在 ReDrafter 中,RNN 草稿模型作为学生模型通过知识蒸馏从 LLM(教师模型)中学习。

具体来讲,蒸馏训练过程中,LLM 会给出一系列下一个可能词的「概率分布」,开发人员会基于这个概率分布数据训练 RNN 草稿模型,然后计算两个模型概率分布之间的差异,并通过优化算法使这个差异最小化。

在这个过程中,RNN 草稿模型不断学习 LLM 的概率预测模式,从而在实际应用中能够生成与 LLM 相似的文本。

通过知识蒸馏训练,RNN 草稿模型更好地捕捉到语言的规律和模式,从而更准确地预测 LLM 的输出,并且因为其较小的规模和较低的推理计算成本,显著提高了 ReDrafter 在有限硬件条件下的整体性能。

▲图源:阿里云开发者社区

苹果的基准测试结果显示,在 NVIDIA H100 GPU 上对数十亿参数的生产模型使用集成了 ReDrafter 的 TensorRT-LLM 时,其贪心解码(Greedy Decoding)每秒生成的 tokens 数量提高了 2.7 倍。

此外,在苹果自家的 M2 Ultra Metal GPU 上,ReDrafter 也能实现 2.3 倍的推理速度提升。苹果的研究人员表示「LLM 越来越多地用于驱动生产应用程序,提高推理效率既可以影响计算成本,也可以降低用户端延迟」。

▲图源:Apple

值得一提的是,在保持输出质量的同时,ReDrafter 减少了对 GPU 资源的需求,这使得 LLM 在资源受限的环境中也能高效地运行,为 LLM 在各种硬件平台上的使用提供了新的可能性。

苹果目前已经在 GitHub 上开源了这项技术,未来从中获益的公司将很可能不止英伟达一家。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


刚刚,OpenAI 重磅发布 o3!再次突破 AI 极限,北大校友参与研发

By: 莫崇宇
21 December 2024 at 05:36


就在刚刚,OpenAI 迎来了年底 AI 春晚的收官之作。

这次发布的的 o3 系列模型是 o1 的迭代版本,考虑到可能与英国电信运营商 O2 存在版权或商标冲突,OpenAI 决定跳过「o2」命名,直接采用「o3」。

为此,OpenAI CEO Sam Altman 更是自嘲公司在模型命名方面的混乱,原来你也知道呀。

本次发布会由 Sam Altman、研究高级副总裁 Mark Chen 以及研究科学家 Hongyu Ren(任泓宇)主持。

值得注意的是,任泓宇本科毕业于北大,对 o1 有过基础性贡献,也是 GPT-4o 的核心开发者,曾在苹果、微软和英伟达有过丰富的研究实习经历。

o3 系列包含两款重磅模型:

  • OpenAI o3:旗舰版本,具备强大的性能表现
  • OpenAI o3 mini:轻量级模型,但能更快,更便宜,主打性价比

先别急着高兴,因为 o3 系列目前并不会向普通用户开放,OpenAI 计划先开放外部安全测试申请,正式发布时间预计要到明年 1 月。

现在,感兴趣的朋友可以提交申请:
https://openai.com/index/early-access-for-safety-testing/

o3 性能大跃迁,死记硬背?不存在的

o3 模型的「纸面参数」迎来了全方位提升。

首先在 SweepBench Verified 基准测试中, o3 达到了约 71.7% 的准确率,直接将 o1 模型甩在身后整整 20% 之多。

转入编码领域,o1 在编程竞赛平台 Codeforces 上的得分为 1891。而 o3 在开足马力,延长思考时间的情况下,得分可达 2727。

作为参照,演示人员 Mark Chen 的得分也只有 2500,充分展现了 o3 模型已经具备接近甚至超越人类专业程序员的实力。

在数学领域,o3 同样表现出色。

在美国数学竞赛 AIME 2024 测试中,o3 以 90.67% 的准确率完全碾压了 o1 的 83.3%。

遇上衡量博士级科学问题解答能力的 GPQA Diamond 测试,o3 取得了 87.7% 的成绩,而 o1 仅为 78%。

什么概念呢?要知道,就算是领域内的博士专家,也往往只能在自己的专业范围内达到约 70% 的准确率。

面对当前基准测试接近满分的情况,OpenAI 引入了一个全新的数学测试 EpochAI Frontier Math。

这被认为是当前最具挑战性的数学评估之一,包含了极其复杂的问题。就连专业数学家解决单个问题也需要耗费数小时甚至数天。

目前,所有现有模型在该测试上的准确率都不足 2%,而在高算力的长时间测试下,o3 却能取得超过 2457 的分数。

说到 AI 领域的圣杯 AGI,也就不得不提到 ARC-AGI 这个专门衡量 AGI 的基准测试。

ARC-AGI 是由 Keras 之父 François Chollet 开发,主要是通过图形逻辑推理来测试模型的推理能力。

当演示人员向另一位演示人员 Mark Chen 提出即兴问题时,后者准确指出了任务的要求:需要计算每个黄色方块中彩色小方块的数量,并据此生成相应的边框。

这些对人类来说再简单不过的任务,对 AI 来说却是一道难题。

并且,ARC-AGI 的每个任务都需要不同的技能,且刻意避免重复,完全杜绝了模型靠「死记硬背」取巧的可能,真正测试模型实时学习和应用新技能的能力。

现在,o3 在低算力的配置下得分 75.7 分。当要求 o3 思考更长时间,并且提高算力,o3 在相同的隐藏保留集上得分 87.5%,远超大多数真人。

OpenAI 的言外之意就是,o3 将让我们离 AGI 更近一步。

o3 mini 重磅发布,速度更快,成本更低

今年九月,OpenAI 发布了 o1 mini,具有很强的数学和编程能力,而且成本极低。

延续这一发展方向,今天推出的 o3 mini 也保留了上述特征。即日起,该模型仅向安全研究人员开放测试申请,截止日期为 1 月 10 日。

o3 mini 支持低、中、高三种推理时间模式。

用户可根据任务复杂度灵活调整模型的思考时间。例如,复杂问题可选择更长的思考时间,而简单问题则可快速处理。

从首批评估结果来看,在衡量编程能力的 Codeforces Elo 评分中,随着推理时间的增加,其 Elo 分数持续攀升,在中等推理时间下就已超越 o1 mini。

演示人员要求模型使用 Python 创建了一个代码生成器和执行器,该脚本可启动服务器并创建本地用户界面。用户可在文本框中输入代码请求,系统会将请求发送至三种高级模式的 API,生成并执行相应代码。

例如,当要求其生成一个包含 OpenAI 和随机数的代码时,o3 mini 的中等推理模式迅速完成了处理。

另外,它还能自己测试自己,比如说在 GPQA 数据集测试中,模型以低推理模式完成了复杂数据集的评估。

它下载原始文件,识别 CSS、答案和选项,整理问题并进行解答,最后进行评分,仅用一分钟就完成了自我评估,准确率达到 61.62%。

在数学领域,o3 mini 同样表现优秀。

在 AIME 数学基准测试中,其低推理模式就达到了与 o1 mini 相当的性能,中等推理模式更是超越了 o1 mini,且延时更低。

另外,应广大开发者呼声,o3 mini 模型也将全面支持函数调用、结构化输出和开发者指令等 API 功能。

现在,o3 mini 和 o3 的申请通道现已开放。o3 mini 预计将于 1 月向所有用户推出,完整版 o3 则将在后续发布。

写在最后,在这个为期 12 天的年末发布会上,OpenAI 终于祭出了压箱底的杀手锏。

可以说,o3 模型的发布为这场一度陷入「高开低走」困境的发布会,画上了一个意料之外却又情理之中的圆满句号。

短短不到 3 个月的时间,OpenAI 就完成了 o1 模型的迭代升级。

这种从 GPT 系列到 o 系列的转型,显然是 OpenAI 深思熟虑后的战略选择,而事后结果也证明这个决定是明智的。

不过,值得注意的是,微软 CEO Satya Nadella 近期在一档播客节目中表示,OpenAI 在 AI 领域领先竞争对手约两年之久。

也正是这种相对宽松的竞争环境,使得 OpenAI 能够专注于开发 ChatGPT。

然而,当前形势攻守易形也。

Menlo Ventures 的报告显示,ChatGPT 的市场份额被其他竞争对手逐渐蚕食,从 2023 年的 50% 下降到了 2024 年的 34%。
由「标配」沦为「可选项」,ChatGPT 的光环正在褪去。

这背后的原因显而易见,OpenAI 的「护城河」正被短命狂奔的竞争对手们一寸寸填平。

来自 Artificial Analysis 的调研数据清晰显示,Anthropic 和 Google 等厂商陆续开发出性能接近 GPT-4、OpenAI o1 等新模型。

并且,随着 Scaling Law 触及天花板,核心高管人才相继离场,OpenAI 过往靠单个基础模型赢得的红利正在加速消退。

在动辄以天计的行业里,即便是今日发布的 o3 模型也很难再次创造长达 2 年的空窗期。

尤其是当 Grok-3 和 Claude 等新模型蓄势待发,留给 OpenAI 的时间或许已经不多了。

醒醒,今年最好的 AI 厂商依旧是 OpenAI,但明年或许会因为不同的 AI 方向有无数种答案。

所幸,作为用户的我们,都将是这场变局中最大的赢家。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


Before yesterdayMain stream

亚冬会成为吉利科技生态阅兵场,星纪魅族是 AI 的尖兵

By: 刘学文
20 December 2024 at 21:13

在惯常的认知当中,车企和大型运动会的官方指定用车合作,基本上也就真的局限于「车」本身,给运动员和工作人员提供用车服务,涵盖诸如火炬传递、交通保障、礼宾服务等场景。

但衣食住行作为基本需求场景,当然也都是食不厌精,脍不厌细,出行场景并非上车下车就完事儿,也正如汽车是仅次于房地产的第二大类市场一样,出行服务一样复杂。

比方说,本届哈尔滨亚洲冬季运动会有绿色低碳的办会宗旨,刚好和当下的新能源大势契合,所以吉利作为亚冬会官方指定用车合作方,就提供了甲醇、电混和纯电三种动力的车辆。其中甲醇服务车数量为 350 辆,占总服务用车数量的三分之一以上,另外,吉利还将在哈尔滨建设完善甲醇加注网络,为后续清洁能源汽车的持续运营做了基建工作。

这是车和能源形式,以及绿色低碳的关系,另外吉利亚冬服务车队也着重提到了技术含量:

  • 吉利自研的「吉利星座」,通过航天通讯科技,为亚冬会车辆的精准调度与安全运行保驾护航
  • 银河星舰 7 搭载雷神 EM-i 超级电混,率先将 AI 技术应用到动力领域
  • 吉利天地云一体化智能网,由吉利星睿智算中心的算力赋能,实现智慧能量管理、智慧运动控制和智慧云诊断
  • 极氪车型搭载浩瀚智驾 2.0,驾驶辅助功能可以在亚冬场馆内智能规划路线
  • 领克车型搭载 Flyme Auto 智能座舱,可实现车机端、手机端的无感融合
  • 司机配有星纪魅族智能眼镜,可以实现多国语言同传、AR 导航等功能

有意思的是,这一次亚冬会官方指定用车交付仪式的场地,选在了台州吉利卫星超级工厂,950 辆亚冬服务用车来自吉利控股旗下吉利、领克、极氪、翼真、雷达等品牌。

此外,还有吉利控股旗下的时空道宇、耀出行、小灵狗、星纪魅族等企业则贡献了各种保障服务。

完全可以说,这一届亚冬会赛场之外的场地,是吉利生态的一次阅兵,从天上的卫星,到远处的智算中心,到手上的方向盘,和头上的智能眼镜,以及车机内的系统与 AI,以及能源、动力和智驾层面的新技术,横跨了空间和软硬件,可以说,国内几乎再难找到第二家企业有如此大的生态跨度了。

上面说的是生态的宏观,我们也可以聊一聊生态的微观层面,比如星纪魅族,一家不造车的公司,如何在这个合作中占据重要的生态位置。

StarV Air2 是星纪魅族推出的智能 AR 眼镜,它采用了光波导显示方案,这种方案可以在镜片上投射显示 AR 内容,同时用户又能完整地观察现实世界。它的入眼峰值亮度可达 2000 nits,同时搭载自适应亮度调节功能,光线传感器范围涵盖 0~50000 lux 光线环境,20 级亮度自动调节,户外强光环境下,依旧可以正常使用,哪怕是冰天雪地,日光反射强烈的哈尔滨也没问题。

而 AI+AR 的技术组合,则让这种类型的产品有了质变,除了显示信息,接打电话,导航指引等功能之外,和 AI 大模型的耦合,让 StarV Air2 智能 AR 眼镜可以做到通话/现场录音,录音转文本,中英文纪要生成和编辑搜索等会议场景的核心功能。

日常和工作场景中,AI 助手可以提供知识问答,智慧提醒(航班提醒,网约车提醒,待办提醒等),提词器,导航等等等功能。

具体到亚冬会上,面对外国友人的不同语言,StarV Air2 智能 AR 眼镜则能够帮助工作人员,尤其是司机完成面对面对话翻译,支持的语言有中、英、日、俄、法、西、越、马来、印尼、泰、韩、意、德这 13 种语言,基本涵盖了亚洲的主流语言,哪怕双方都不会中文或者英文,交流起来也没有大碍。

与之搭配的,星纪魅族还为亚冬会服务车队提供了魅族 21 PRO、魅族 Lucky 08、魅族 20 INFINITY 等 AI 终端。

而与手机搭配的,则是 FlymeAuto 智能座舱,这次亚冬会的服务车队中,吉利旗下的领克 07、08、银河 E5、E8、星舰 7、吉利星瑞、星愿、翼真 L380 等品牌车型都搭载了这个座舱系统。

亚冬会不仅是各国运动员交流竞技的舞台,也是对外展示的窗口,作为目前国内评价最好的座舱系统之一,FlymeAuto 目前已经接入领克、吉利银河等多个品牌的 19 款车型,目前搭载上市车型最多的智能座舱操作系统之一。也就是说,在这次亚冬会期间,不少国外运动员和工作人员,可以近距离地感受到国内新能源化、智能化和网联化的进度,从整车、到智驾再到座舱等多个层面,体验国产新能源的成熟度。

在以往,我们讨论智能的时候,总会聊起「中枢」的概念,车手互联,到底车是智能中枢,还是手机是智能中枢,亦或是人才是那个中枢,现在智能 AR 眼镜加入进来,AI 大模型又运行在云端,难道中枢是在别处?

亚冬会官方指定用车交付仪式,一定程度上回应了这个问题,独木不成林,森林若只有树,那也不算生态。完整的森林生态,不仅包括树木,也还有灌木,草本和藤本植物,当然也有各种动物,以及微生物,还有真菌和地衣来分解有机物质,维持养分循环。

宏观的,微观的,外在的,内在的,硬件的,软件的,方方面面结合在一起,才是生态。

多年以前,Flyme 是魅族手机系统的名字,而现在,Flyme 还是座舱系统的名字,以及吉利无界之声 AI 智能音响系统 Flyme Sound 的名字,命名的扩大化,其实也是生态的发展。

上到卫星通信,细到智能 AR 眼镜,再到看不见的 AI 大模型,数据和服务在实体的汽车、手机和眼镜之间流转,魅族也完成了从魅族到星纪魅族的转变,AI 则是这场转变当中,决定性的技术。

正如前面所言,之前的 AR 眼镜仅靠 AR 特性,碍于产品形态和算力的原因,很难有刚需场景和杀手级功能,但 AI 的加入,就开始让这个品类步入起飞的节奏,无论是海外的 Meta 眼镜,还是国内各种尝试,基本上都在和 AI 或者即将和 AI 发生关系。

当然,除此之外,硬件本身的进步也是重要诱因,比如 StarV Air2 的核心元器件「蜂鸟 Mini II」单绿色光引擎,相比于上代引擎,体积缩小 50%,重量减轻 50%,峰值光通量提升 80%。

这就是这场亚冬会官方指定用车交付仪式有意思的地方,虽然说是交付车辆,但现在汽车的内涵和外延都比之前更加丰富,在用车这个核心场景里,「服务」不再局限于把用户从 A 点送到 B 点,而是在 A 点之前,B 点之后,还有 A 到 B 之间的所有行程都可以融入「服务」的概念。

这种「服务」可以是 StarV Air2 智能 AR 眼镜的无障碍的翻译,是 Flyme Auto 智能座舱的座椅加热座椅按摩,是 Flyme Sound 的音效……

自此,亚冬会的另一个关键词「智能」也呼之欲出,而这个关键词,则是由整个吉利科技生态成就,尤以其中的 AI 能力最为先锋,而 AI 能力的最有想象力载体,就是 StarV Air2 智能 AR 眼镜。

在命运的塑料大棚里,每棵被喷了过多农药的白菜心中,都曾经有一个成为无公害有机蔬菜的梦想。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


爱范儿明日产品榜单 2024 评委阵容官宣,他们眼中的明日产品是什么

By: 爱范儿
20 December 2024 at 15:36

Tomorrow’s Product Award 是由数字潮牌爱范儿面向趋势消费者打造的年度榜单,旨在发掘过去一年最具标杆意义的「明日产品」。

爱范儿团队联合全球意见领袖,在消费电子、智能出行和人工智能三大前沿领域进行提名并评选,致敬推动行业进步与时代变革的杰出之作。

今天,Tomorrow’s Product Award 的评委正式公布,我们也和这些来自不同领域的创造者,聊了聊什么是「明日产品」。

Tomorrow’s Product Award 评选标准

  • 创新:借助新技术、新设计带来显著的效率和体验提升
  • 改变:重塑行业或生活方式
  • 普惠:具有持续发展并影响更多人的潜力

爱范儿将联合陪审团对所有入围产品进行评选,于 2024 年 12 月下旬揭晓完整榜单,敬请关注。

陈坤:明日的产品是 AI 时代的 Word。
范阳:人工智能时代的「明日产品」应聚焦于一个「更高分辨率」的世界里,提升人与人、人与环境以及人与其他生物之间的沟通分辨率(Communication Resolution)。
费俊:明日产品能够帮助我们拓展认知边界,改变我们的创造力方式。
何宗丞:明日产品是时代的尺度。
胡延平:明日产品应该符合 S 融合感知- I 独立智能- C 耦合连接- A 时空行动-S 协约协同这五个特征,能够帮助每个人成为数智人、超级个体的强智能产品。
李继刚:明日产品让人因它更高效、更强大,而且人人可用。
梁宁:明日产品创造了新功能、新情绪和新资产。
林嘉澍(flypig):明日产品首先应该是「future-proof」,在未来这个东西不会过时。
刘梦霏:明日产品一定是从今日出发的,而且一定要在带来新可能性的前提下普惠公众。
刘知远:明日产品,是理解技术的价值,洞察人的需求,成为恰到好处的创造,并且遵循人性。
慕明:明日产品是对未来需求的预演或原型开发,基于对现实的敏锐观察和对未来可能性的深刻洞察。
朋克周(周子杭):明日产品是让人爱不释手、越用越离不开的产品,不在于技术多先进,而在于真正解决用户痛点,改变生活方式。
拼命玩三郎:明日产品是让我希望 Yesterday 不再 once more 的产品。
沈义人:不同的产品有不同的使命,101% 完成使命的产品就是好产品,而明日产品是能引领使用习惯的产品。
田飞:明日产品站在人的视角,解决今天的问题,看到明天的无限可能
王华东:明日产品应该是交互上是让人眼前一亮,功能上也极大地解决此前没解决好的问题。
王伟兴:明日产品与初始市场份额无关,它关乎用户持续的心智和未来的想象。
俞挺:明日产品就是上手就丢不掉的产品。
赵赛坡:明日产品是对人类未来的恰当诠释。
爱范儿,让未来触手可及。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


把华为全家桶升级成纯血鸿蒙后,我发现了它好用的秘密

By: 肖凡博
19 December 2024 at 11:19

纯血鸿蒙公测版发布后,我们把这套系统从头到尾玩儿了半个月。比起之前体验的内测版,公测版的应用更丰富、适配更彻底,功能也更全面。

如果你用的是华为,还是全家桶,又刚好把所有设备都升级到了纯血鸿蒙,那你将会解锁一些新玩儿法。

*以下为视频文字版,内容略有删减:

不知道有多少朋友,在平板或折叠屏上刷 b 站刷微博时,总会感觉有点儿不得劲儿?没错,就是旁边这两块显眼的「留白」。

虽然华为以前通过平行视界,一定程度上缓解了屏幕利用率不足的问题,但还是没能彻底释放大屏浏览的优势,因为绝大部分的 App,都是基于手机屏幕尺寸来设计的。

由于 Android 端品牌太多,平板用户基数小等问题,大家都选择了最省力的方式,有些甚至直接通过暴力拉伸来强行适配。

而纯血鸿蒙终于把大屏该有的样子,或者说本来的样子做了出来。现在小红书、美团、大众,就连最难搞的淘宝,都有了大屏版。

那华为是怎么把这个压轴题给解出来的呢?我们在开发者官网里找到了答案:响应式布局。

当窗口容器大小发生变化时,界面元素可以自动变化,以适应容器大小的变化。

简单说,手机平板,这些终端就像形状各异的锅碗瓢盆,在传统的系统里应用是固体,总会留有缝隙。

而纯血鸿蒙把应用变成了液体,可以自适应不同大小的屏幕尺寸,绝大部分从华为应用商店下载的软件,都能完美适配,当然也有极个别顽固分子。

不仅如此,纯血鸿蒙还为大屏提供了许多实用功能,比如这个自由多窗。

打开后,应用窗口就会变成 PC 端的样子,大小也能无极调节,这对于触控操作的影响不大,甚至有点华而不实。

但当你把键盘、鼠标和手写笔加上,不就成了比轻薄笔记本更轻薄的平板笔记本吗?而且键鼠操作更适合移动办公。

其实这种适配的理念,华为很早就开始布局了,在以前的鸿蒙设备上,就有专为外接屏幕设计的电脑模式,不过有点可惜,目前纯血鸿蒙还没能适配,不知道后续会不会加上,期待一下。

有了适配不同屏幕的能力,就相当于在几块毫不相关的大陆上,建起了互通的桥梁。最能体现自适应互通界面的,就是接续功能。

下班路上手机里没看完的视频,回家拿平板继续放,看得更爽;出门前在平板上没吃完的瓜,直接拿手机打开,一边赶路一边赶进度。

不过目前只有浏览器、备忘录、华为视频这些系统级应用才支持,第三方的软件,可以再期待一下。

当然纯血鸿蒙的设备联动,还不止这些,举个最简单的例子,把照片从这里传到这里,除了用微信,在纯血鸿蒙上还还能通过华为共享、隔空抓取、碰一碰来实现。

碰一碰除了能传图片视频,还分享 Wi-Fi 和主页信息,特效很花哨,但操作很直觉,男女老少一看就会。

互通的除了软件和文件,还有硬件,比如习惯无纸化学习办公的朋友,现在可以调用手机镜头来给笔记添加照片,既方便又高清,不用举个大板子使老大力气,结果拍了个战损版的画质。

除此之外,纯血鸿蒙还继承了多屏协同。把手机放到平板里,文字直接复制,照片直接拖动,只是少了之前的流转功能,有点小遗憾。

体验完搭载了纯血鸿蒙的华为全家桶,我有两个很明显的感受:

第一个是刚才提到的这些功能,都有一定的学习成本,你得愿意用、习惯用,才会觉得真好用;

第二个是体验下来,你不会觉得在用不同的设备,纯血鸿蒙将本没有联系的设备串成了一个整体,而手机、折叠屏、平板都被它变成了连在同一个核心上的尺寸不一的显示屏。

最后 很多朋友也在纠结到底要不要更新升级?说实话,系统很流畅,软件生态也日益丰富,日常应用都有,冷门的也能找到,实在不行还有和安卓市场挂钩的卓易通,以及华为用户出境必备的出境易来兜底,几乎能和鸿蒙 4.2 的应用体验划上等号。

但我觉得还可以再等等,起码等到微信正式上线,或者拿到了内测名额再更也不迟。

关于纯血鸿蒙和全新生态,你还有什么想知道的吗?各位华为的用户,是已经用上了纯血版,还是仍然在观望?

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


近 22 万的苹果 Vision Pro 摄影机来了,可拍摄 8K 3D 视频

By: 范津瑞
18 December 2024 at 19:15

无论有没有真正购入一台 Apple Vision Pro,你可能都对其提供的沉浸视频所带来的震撼观感有所耳闻。

苹果官方对 Apple 沉浸视频的评价是「叹为观止」的。这是一种全新的叙事形式,能够通过 8K 3D 视频与 180 度视域和空间音频的配合,给观众以身临其境之感。

今年 7 月开始,Vision Pro 已经陆续上线了一批电影、纪录片、音乐会甚至体育赛事的「沉浸」版本。从官方演示视频来看,其所呈现的「视界」的确令人心驰神往。

▲图源:Apple

惊叹之余,你是否也有过对这类格式视频幕后工作的好奇:Apple 沉浸视频到底是如何拍摄和制作的?

影像技术公司 Blackmagic Design 推出的 URSA Cine Immersive 就是一款专为拍摄 Apple 沉浸式视频而设计的商业摄影机。这款摄影机于今年 6 月首次亮相,近日已经开始接受预订,将在 2025 年初进行首批交付。

不过,URSA Cine Immersive 的价格不菲,售价高达 30000 美元(约合 22 万元),几乎相当于 8.5 台苹果 Vision Pro 的价格。如此昂贵,可见其定位并不是「消费级」,而是为专业人士提供的创作工具。

▲图源:Blackmagic Design

URSA Cine Immersive 是一款「双镜头」摄影机。为了拍摄「Apple Immersive Video」,其具有包含两个 180 度立体镜头的固定定制镜头系统,专为摄影机中的大画幅图像传感器而设计。

值得一提的是,URSA Cine Immersive 使用了「极其精确」的镜头姿态数据,这些数据是每台摄像机独有的,在制造时生成,经过校准后存储在设备上,其在后期编辑过程中能使 3D 视频更加精确和稳定。

这款设备拥有单眼 8160*7200 的超高分辨率,是 Vision Pro 单眼分辨率的两倍多,官方称之为「像素级同步」。它能够拍摄每秒 90 帧的 3D 沉浸视频,并且每帧都有 16 档动态范围,以确保细节和色彩准确性。

▲图源:Blackmagic Design

URSA Cine Immersive 使用全新的「Blackmagic RAW」格式拍摄和存储视频,这种格式可以不仅记录白平衡、数字场记板信息和自定义 LUT,还可以存储上面提到的摄像机元数据以及镜头数据等。

不仅如此,URSA Cine Immersive 还拥有诸多其他亮点:

  • 使用第五代色彩科学与新的电影曲线;
  • 配备双 5 英寸 HDR 触摸屏和外部彩色状态 LCD 屏幕;
  • 内附 Blackmagic Media Module 8TB 录制功能,可实时同步到 Blackmagic Cloud 和 DaVinci Resolve 媒体盒;
  • 支持高速 Wi-Fi、10G 以太网或移动数据用于网络连接;
  • 拥有包括 12G-SDI 输出、USB-C 和 XLR 音频端口等多种连接选项。

此外,这款设备还拥有轻巧坚固的机身,兼顾了摄影师和工作人员的跟拍和转场需求。

▲图源:PetaPixel

除了推出「全球首款用于 Apple 沉浸视频的摄影机」之外,Blackmagic Design 还带来了其旗下专业视频编辑软件达芬奇(DaVinci Resolve Studio)的重磅更新,实现了 Apple 沉浸视频的「无缝」工作流程:

  • 剪辑师可以直接监视和处理使用 URSA Cine Immersive 拍摄的 Apple 沉浸视频素材;
  • 支持自动识别 Apple 沉浸视频(双文件立体沉浸式内容)的左右眼;
  • 新的沉浸式视频查看器允许剪辑师进行平移、倾斜和滚动剪辑等操作,以便在显示器或者 Vision Pro 上查看;
  • 可以使用 FCP XML 元数据绕过 Vision Pro 渲染的过渡,从而简化编辑过程,并生成干净的母带文件;
  • 导出预设将启用与 Vision Pro 直接兼容的快速输出,便于在 Vision Pro 上直接查看。

▲图源:Blackmagic Design

更新后,官方称达芬奇为「世界首款用于 Apple 沉浸视频的编辑软件」,Blackmagic Design 的首席执行官格兰特·佩蒂(Grant Petty)则表示达芬奇的更新将实现 Apple 沉浸式视频的真正「端到端」工作流程。

佩蒂还表示「期待于电影制片人密切合作」。Blackmagic Design 的软硬件「组合拳」,加上苹果的审美理念,我们也期待着在未来看到更加打动人心的 Apple 沉浸作品。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


英伟达推出「最便宜」AI 超算,想让每个人都踏入 AI 世界

By: 范津瑞
18 December 2024 at 18:00

2019 年,人工智能技术快速进步,AI 应用不断广泛深入。彼时,英伟达(NVIDIA)推出了面向「嵌入式设计师、研究人员和 DIY 制造商」的 AI 计算机以及开发套件「Jetson Nano」,售价 499 美元(约合 3638 元)。

▲Jetson Nano(图源:NVIDIA)

近日,英伟达发布了 Jetson Nano 的升级版,也是目前该系列中「最便宜」的 AI 超级计算机及其开发套件「Jetson Orin Nano Super」。在性能更强的同时,价格还降低了一半,仅售 249 美元(约合 1809 元)。

按照英伟达的官方说法,Nano Super 的受众是「商业 AI 开发者、业余爱好者和学生」。的确,不到 2000 元的价格对于那些初次接触生成式 AI、机器人技术或者计算机视觉技术的人群来讲,还算友好。

也许,这也表明了目前使用 AI 进行推理任务的成本正在逐渐降低。

▲Jetson Orin Nano Super(图源:NVIDIA)

相较于前代,Nano Super 的 AI 推理性能提升了 1.7 倍,整体性能提高了 70%,达到 67 INT8 TOPS。此外,Nano Super 的内存带宽增加至 102GB/s,比前代产品提升了 50%;CPU 频率也从前代的 1.5GHz 提升至 1.7GHz。

整个 Nano Super 开发套件包含 Jetson Orin Nano 8GB 系统级模块(SoM)和一个参考载板,SoM 配备了 NVIDIA Ampere 架构 GPU 和 6 核 Arm CPU,支持多个并发 AI 应用管道和高性能推理。

另外,它还支持调用最多四个摄像头,并且提供比之前的版本更高的分辨率和帧速率。

▲图源:NVIDIA

英伟达声称 Nano Super 的性能提升为所有流行的生成式人工智能模型和基于变换器(transformer)的计算机视觉带来了好处。

不仅如此,由于 Nano Super 套件的硬件与其前代 Orin Nano 的硬件基本相同,因此之前购入了 Orin Nano 的用户通过安装软件更新(JetPack SDK),也能体验到 Nano Super 的性能升级。

英伟达称,这是一份「持续给予的礼物」。

▲图源:NVIDIA

在英伟达生态的加持下,开发者可以从 NVIDIA Jetson AI 实验室获取教程,还可以在更广泛的 Jetson 社区获得支持和帮助,或者从其他开发者创建的项目中获得灵感等等。

英伟达表示,无论是创建基于检索增强生成的 LLM 聊天机器人、构建视觉 AI 代理还是部署基于 AI 的机器人,Nano Super 都是「理想的解决方案」,并且期待它能够加速 AI 驱动机器人技术在多个行业的发展。

随着人工智能领域从特定任务模型逐渐转向更为通用的基础模型,Nano Super 无疑为技术爱好者们提供了一个将想法变为现实的「最实惠」可访问平台。正如英伟达所说:

现在每个人都可以通过生成式 AI 解锁新的可能性

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


苹果折叠屏 iPad 曝光!超大尺寸还没折痕,我扒出了这些细节

By: 肖凡博
18 December 2024 at 09:59

苹果要出折叠屏了。

这个传言在近两年里,时不时就会冒个头,大家也从一开始的「终于等到」,变成了现在的「听听就好」,如此的态度转变,和苹果的光打雷不下雨有关,也和折叠屏的普及率挂钩。

▲ 图片来自:Google

折叠屏虽然还是小众产品,但技术经过这六年的发展,以及市场的反馈,已经逐渐走向成熟,各大品牌线下门店都有实物,身边也有越来越多的亲属、同事和朋友加入了折叠屏的阵营。

而且,比起当年动辄上万元的高额售价,折叠屏的价格也因为技术的成熟、成本的控制和出货量的增加,被打了下来,现在折叠屏的入门价格,基本和旗舰机持平,跳一跳就够得着,也让它不再是橱柜里的展示品。

这回苹果折叠屏能引起关注,不是因为最新的技术进展,而是它们准备进军小众再小众的赛道:折叠,但是平板。

折叠 iPad,没有折痕

苹果折叠平板的传言,有点像狼来了的故事。

▲ 图片来自:Google

两年前,彭博社记者 Gurman 详细介绍过 20 寸的超大可折叠 iPad/MacBook 混合体;前段时间又传出可折叠 iPad 可能会采用 7~8 寸的小屏,预计2026 年或 2027 年问世;

这两天,Gurman 在最新一期的 Power On 中写到,苹果希望在 2028 年左右,推出一款全新 iPad:

  • 可折叠,但无折痕
  • 尺寸为 18.8 英寸,大小相当于两台并排放置的 iPad Pro。

而且,爆料中称苹果的工业设计团队,已经成功做出了折叠平板的原型机,我们也在苹果专利网里,发现了一些有意思的细节。

最近,美国专利商标局正式授予苹果一项与可折叠显示设备相关的专利。

▲ 图片来自:patentlyapple.com

专利文件中提到:

这一套连杆结构由薄片材料制成,其中包括了指状物和月形槽,在设备的折叠期间,容纳销可以沿着月形槽滑动,从而确保相邻的链接件绕旋转轴相对于彼此旋转。

读完专利文件的技术细节后,我们可以大致把这套新专利的特点分为四个:

1. 灵活性更好,提升了铰链的耐用性
2. 由于壳体旋转联动机制,折叠时会更稳定和平顺
3. 相较于传统的结构,新铰链在折叠时对屏幕的包裹性更好
4. 新专利不仅限于单个设备,而是各种可折叠设备(手机、平板、笔记本)都能通用的技术

▲ 图片来自:patentlyapple.com

从描述和外表看,这一套铰链结构没有什么特别的,甚至略显简陋,我们只看见了铰链部分的技术,并没有看到爆料中对无折痕的描述,而且这一点,非常重要。

特别是「无痕折叠」这个特点,即使放在当下成熟的市场里,依旧会引起不小的关注度,这是当下折叠屏产品里,伤害性不大、侮辱性极强、潜在隐患很高的一个缺陷。

折叠屏上的折痕,和铰链技术、柔性屏材料和折叠方式直接相关,铰链会直接决定折叠处的弯折程度,目前主流的铰链技术主要分成「U 型」「鹰翼型」「水滴型」三种,不过无论哪一种,都会因为折叠次数的增加,使得柔性材料的疲劳度增大,发生不可逆转的形变,从而使折痕愈发明显。

折叠方式也会影响折痕的深浅,目前看来,最不明显的方式是外折,以华为和荣耀为代表的外折机型,都能在长时间使用后,依旧保持很浅的折痕,但外折的柔性屏少了外壳和中框的保护,使用寿命普遍更短,更容易受到损害。

铰链、屏幕和折向,既是核心技术,也是折叠屏手机走向无痕的最大桎梏,都别说无折痕了,就是折痕变浅了,都能被当做核心优点在发布会上花大篇幅宣传一番。

因此,想要做到理想和宣传中的无折痕,光在铰链上发力是远远不够的,而是需要兼顾到铰链技术、屏幕材料和折叠方式。那苹果是怎么把这个「痛点」在理论技术上彻底根除的呢?答案在另一份文件里。

▲ 图片来自:patentlyapple.com

为了解决铰链本身的坑洼,以及数次折叠后折痕不可逆的问题,苹果专门为柔性屏和铰链的缝隙里,设计了一种用来填充的聚合物。

聚合物可以放置在凹槽和缝隙里,来把屏幕上能看见与能摸到的凹凸填满,以此来达到无折痕的效果。就很像在毛玻璃上到了一盆水,坑洼被水填满后,毛玻璃的表面变光滑,磨砂质感也变成了透明玻璃。

▲ 图片来自:patentlyapple.com

聚合物的材质并没有在专利中说明,而是例举了一些备选,例如玻璃条或玻璃珠等硬化结构,用这些质地较硬的材料,覆盖在比较薄、或者不平整的地方,以此来硬化部分柔软的屏幕。

用较硬的材质来填充有两个显而易见的优势,一是提高了屏幕的平整度,二是提升了柔性屏的强度,特别是在打游戏和用手写笔时,屏幕能有更好的支撑。

更重要的是,加固之后柔性屏也能通过铰链平顺折叠,而且因为多了一层硬化的防护,折叠后对屏幕的包裹性以及稳定性都有提升。

技术,只是第一关

铰链技术和填充聚合物的原理听上去都很简单,甚至有点简单过头了,但真正实现起来却有着非常高的难度,卫星和空间站的太阳能板的收纳方式灵感来源于折纸,马斯克回收火箭的方式参考了筷子和夹子的原理。

况且,技术难题只是开始,苹果的折叠屏,需要面对更多的挑战。

爆料中的第一点「无折痕的折叠」,的确有可能通过新材料和新技术做到,毕竟他们给自己留的期限比较宽裕。但是一台 18.8 英寸的平板尺寸,会不会有些太大了?

MacBook 的 16 寸是目前苹果移动端最大屏幕的产品,这个尺寸看电影、刷网页会更舒服,视野也更广,但随之而来的问题是携带不方便,不仅是尺寸有些偏大,而且重量也在增加,对于有专业照片、视频等编辑需求的朋友来说,这个尺寸和重量,差不多到了背在包里的临界值。

当 iPad 来到 18.8 英寸时,即使它能折叠,但重量的增加,以及对于移动端来说的超大屏,也和其本身的特点形态渐行渐远,卡在手机和笔记本中间的那块屏,现在竟然要变成卡在平板和电脑中间的那个设备。定位不明确,找不到目标用户,销量低迷也只是时间问题。

除了硬件上的难题,软硬件的配合也是折叠屏市场,遇到的共同难题。

很多朋友在这些年对 iPad 用上 MacOS 的呼声越来越高,最主要的原因是,iPadOS 对需要多应用的适配,只是把 iOS 版暴力拉伸,强行放大,然后塞进了平板里,屏幕利用率低,并没有真正发挥出平板的大屏优势。

与其用大屏版 iOS,不如直接用本身为大屏定制的 MacOS,看着更舒服,也更顺眼。而且 iOS 主打竖屏场景,macOS 主打横屏操作,而在中间的 iPadOS,则需要兼顾横竖屏的界面适配。

因此,要想真正发挥出「平板」的优势,除了想办法让它的屏幕更大,也需要让相应系统的适配场景更广。可喜可贺的是,这样的呼声很可能成为现实,Gurman 在爆料中还说到:

折叠屏 iPad 将同时具有 Mac 和 iPad 的元素,并且到 2028 年,iPadOS 应该足够先进,可以运行 macOS 应用程序。

最后,是折叠屏市场的限制,根据 Counterpoint Research 的数据统计,折叠式智能手机显示屏在 2024 年第三季度的同比出货量首次出现下降,预计 2025 年的出货量也将继续下滑。

▲ 图片来自:DSCC

注意,这还是在本就不富裕的份额中,雪上加霜。2023 年中国折叠屏手机市场出货量约 700.7 万台,同年中国智能手机总出货量为 2.89 亿部,折叠屏连总数小数点的零头都不到,只有 2% 的份额。

所以,不管是 iPhone Flip 还是 iPad Fold,都面临着难度不一的内忧外患,苹果折叠产品的未来,和苹果 AI 的当下十分相似,只是它要更迟才能到来。

当然,如果苹果真的能把理论和专利上的演示变成现实,那 0 折痕的折叠屏,会不会受到你的青睐?

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


国产大模型智谱获新一轮 30 亿元融资,2024 商业化收入增长超 100%

By: 范津瑞
17 December 2024 at 12:00

智谱近期完成了新一轮三十亿人民币融资,本轮融资的新投资方包括多家战投及国资,老股东君联资本等继续跟投。这是智谱近期可查的第二轮融资。

据悉,本轮融资将用于智谱 GLM 大模型系列的研发工作,旨在从简单的问题回答扩展到解决更复杂的推理和多模态任务,以更好地服务于行业生态的发展。

2024 年,智谱业务保持高速增长态势,同去年相比,智谱今年以来的商业化收入增长超过 100%。目前,智谱的估值已经率先超过 200 亿,是估值最高的大模型公司之一。

产品业务方面,智谱推出的全模态 AI 助手「智谱清言」app 用户超 2500 万,年化收入超千万;其推出的 MaaS 开放平台 bigmodel.cn 已有 70 万企业和开发者用户使用,日均 Tokens 消耗量增长 150 倍,API 年收入同比增长超 30 倍。

智谱始终坚持大模型创新,基座模型性能保持国内领先。据悉,智谱开源的 ChatGLM 等 50 余款模型全球累计下载量超过 3000 万,获得超 15 万 GitHub 星标。智谱也因此成为了国内大模型领域星标数最多的企业。

另外,智谱是国内唯一入选「TechCrunch」评选的全球 15 家新晋 AI 独角兽 Unicorn Board 榜单的企业。公司还入选了福布斯中国创新力企业 50 强和 Hugging Face 平台最受欢迎人工智能机构。

2020 年底,智谱研发了 GLM 预训练架构;2021 年完成百亿参数模型 GLM-10B 的训练;2022 年开发了中英双语千亿级超大规模预训练模型 GLM-130B 并开源;2023 年推出千亿基座对话模型 ChatGLM 并两次升级,开源版本的 ChatGLM-6B 使得大模型开发者能够在本地进行模型的微调和部署。

2024 年,智谱继续高歌猛进,发布了一系列比肩世界领先水平的大模型产品和技术:

  • 1 月:发布了新一代基座大模型 GLM-4,性能显著提升,支持更长上下文和更强多模态能力,推理速度更快,支持更高并发,降低了推理成本;
  • 6 月:开源了 GLM-4-9B 模型,支持长文本处理和多语言,同时开源了基于 GLM 的视觉模型 GLM-4V-9B,其多模态能力与 GPT-4V 相当;
  • 7 月:视频生成模型「清影」正式上线,提供文本和图像生成视频服务,能在 30 秒内生成 6 秒视频,真实还原物理世界运动;
  • 8 月:发布了国内首个跨文本、音频和视频模态的实时推理大模型 GLM-4-Videocall,实现了 AI 与人的实时视频通话;推出了新一代基座大模型 GLM-4-Plus,性能全面提升,与国际标杆 GPT-4o 水平相当;
  • 10 月:发布了 GLM-4-Voice 端到端情感语音模型,并集成到清言 app 中,支持情感理解、情绪表达、多语言和方言;推出了 AutoGLM 内测版,能模拟人类操作手机,执行各种任务,不受限于 API 调用;
  • 11 月:发布了 AutoGLM 升级版,能执行超过 50 步的长步骤操作,跨 app 执行任务,支持基于浏览器的网站无人驾驶;推出了 GLM-PC 内测,基于多模态模型 CogAgent,探索「无人驾驶」PC 技术,能代替用户执行多种电脑操作;升级了视频模型 CogVideoX,支持生成 10 秒时长、4K、60 帧超高清画质视频,具备更好的人体动作和物理世界模拟,同时开源了 CogVideoX v1.5-5B 和 CogVideoX v1.5-5B-I2V 模型。

此外,智谱的业务范围覆盖智能汽车、制造、大消费、金融、政务服务、医疗健康、游戏娱乐和文化旅游等多个行业。公司近期推出的 Agent 则进一步推动了大模型在智能设备中的应用。

智谱的全球化战略也在加速推进,公司已在美国、英国和法国等多国和地区设立了地区总部、分公司和研究中心,并作为唯一的中国公司,与 OpenAI、谷歌、微软、Meta 等世界一流大模型公司签署了前沿人工智能安全承诺。

智谱的愿景是「让机器像人一样思考」,致力于打造新一代认知智能大模型。未来,智谱将通过大模型链接物理世界的亿级用户,为千行百业带来持续创新与变革,加速迈向通用人工智能的时代。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


Google 推出 XR 版 Android,将首批登陆三星头显

By: 范津瑞
14 December 2024 at 17:40

Google 终于再次入局 XR(扩展现实)生态,推出了其专为 XR 设备打造的操作系统「Android XR」

Google 在本周四发布了「Android XR」的首个开发者预览版,这一操作系统将用于头显设备和智能眼镜等近期大热的 XR 设备当中。Android 生态系统总裁萨米尔·萨马特(Sameer Samat)表示对这个领域「并不陌生」。

此前,Google 也发布过 Daydream 头显和 Google Glass 等类似的 XR 产品,但它们的销量不及预期,市场表现并不理想。而现在 Google 认为技术已经发展到了「可以再次尝试 XR」的阶段,尤其是在 AI 领域。

▲图源:The Keyword

由于 Android XR 是基于 Android 系统开发的,因此其可以兼容和直接使用 Google PlayStore 上的大部分手机和平板应用,就像苹果的 Vision Pro 支持运行 iPad 应用一样,为用户保证了丰富完整的应用库。

此外,Google 正在为 XR 设备的「沉浸式屏幕」重新设计 YouTube、Maps 和 Photos 等应用,还将准备推出一个可以进行多窗口多任务处理的 Chrome 浏览器,以及可从 AR 视图切换到虚拟家庭影院的 Google TV:

▲Android XR 的 YouTube 界面

▲Android XR 的相册(Photos)界面

▲Android XR 的 Google TV 界面

在 Android XR 中,就连「搜索」也变得十分优雅,看到、画圈、搜索一气呵成:

▲Android XR 中「圈一下」即可搜索

目前,该预览版已经支持 ARCore、Android Studio 和 Unity 等工具的使用。Google 为开发者们提供了 API 和硬件开发套件,还在 Android Studio 中加入了 Android XR 模拟器用于可视化,以便他们开发 XR 应用和产品。

▲移植到 Android XR 平台的 Unity 游戏「Job Simulator」(图源:Android)

Google 认为,头显设备可以实现虚拟世界和现实世界的无缝衔接,而智能眼镜则更像是一位始终在线的「伴侣」。因此,XR 设备才是「AI」真正能够发挥作用的地方,也是一种更为自然的应用形态。

Google 将 AI 体验定位为 Android XR 的核心。与举着手机让 AI「观察世界」不同,Android XR 将深度内置谷歌自家的多模态大模型「Gemini AI」,通过其基于语音及自然对话的用户界面,为用户提供全新的交互体验。

▲图源:The Keyword

这种基于 AI「理解」的操控体验是手势或者手柄控制完全不能比的。虽然 Vision Pro 也能够使用其智能助理 Siri 进行操作,但 Gemini AI 的智能程度似乎略胜一筹。Google 对 AI 助理和 XR 设备进行集成的评价是「杀手级」。

萨马特则称 Android XR 是首个「完全为 Gemini 时代搭建的平台」。

使用搭载 Android XR 系统的 XR 设备,用户可以流畅地翻译所见所闻;或者用 Gemini 直接提取好友们在群聊中提到的那家餐厅的菜单,然后让其「带路」,实时显示导航路线,诸如此类:

▲用 Gemini 实时翻译

▲用 Gemini 实时导航

除了系统层面的推陈出新,Google 还在 XR 硬件方面有了新的进展。

去年,Google 与三星、高通达成合作,宣布共同开发 XR 硬件。现在来看,三星刚刚公开的全新头显设备「Project Moohan」也许就是这次合作的结晶,预计将于 2025 年正式推出。

从外观来看,Project Moohan 像是 Meta Quest 3 和 Apple Vision Pro 的混合体,极具未来主义风格。The Verge 的编辑在实际上手体验后表示其使用起来轻巧、舒适。

▲图源:The Verge

Project Moohan 预计将搭载高通骁龙 XR Plus Gen2 处理器,拥有 90 Hz 的刷新率和 4.3K 的单眼分辨率。据说其分辨率在自动校准瞳距后还能有所提升。

最重要的是,Project Moohan 将成为首批搭载 Android XR 的 XR 设备。这意味其不仅能够轻松实现沉浸式观看和增强现实体验的切换,还支持用 Gemini 进行控制。当然,这款设备也支持手势识别和控制器控制。

值得一提的是,Moohan 的发音在韩语中意为「无限」。实际上,三星表示 Project Moohan 将会配备「最先进的显示技术、透视(Passthrough)功能和自然的多模态输入能力」。

也许,三星的愿景是利用虚拟现实提供的「无限」空间为用户带来沉浸式的体验。

▲图源:三星

不仅仅是头显设备,Google 还在 AR 眼镜领域有所动作。据悉,在 12 日举办的 Android XR 发布会上,Google 正式官宣与国产 AR 眼镜品牌 XREAL 达成战略合作。也就是说,Android XR 将在晚些时候开始登陆 AR 眼镜平台

2024 年无疑是 AR 智能眼镜爆发的一年,苹果、Google 和 Meta 等科技巨头都在积极探索这一产品线的可能性,而国内的百度、小米等大厂,以及 XREAL 和雷鸟(RayNeo)这样的后起之秀,也在为消费者不断带来惊喜。

那么,Google 的重新下场能否复刻 Android 时代的辉煌,让 2025 年成为「XR 元年」呢?

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


全球首位 AI 程序员正式上线,这个月薪只要三千的同事能干什么?

By: 范津瑞
14 December 2024 at 17:40

说到「编程」,我们常常会想到那个不太友善的程序员笑话:

虚假的程序员:从零开始编写代码,勤勤恳恳修改、优化、注释;
真正的程序员:熟练掌握「Ctrl + C」和「Ctrl + V」。

▲图源:Laravel

不过,由 Cognition Labs 开发的全球首位 AI 程序员「Devin AI」或许可以让你把「复制粘贴」这一步都省了,你可以直接把 TA 当成你的「程序员同事」,让 TA 帮你干活。

既然被称为「程序员」,那 TA 就不可能白白干活。Devin AI 的服务起价为每月 500 美元(约合 3624 元),还真不算便宜。不过相比之下,这个价格比国内一线大厂程序员的平均工资还是低了不少。

▲图源:COGNITION

Devin AI 实际上是一个由人工智能驱动的编码平台,配备了命令行、代码编辑器和浏览器等常见的开发者工具,它可以在编写代码片段、检测错误和建议改进等方面协助开发人员完成代码编写,几乎覆盖了编程工作的全流程。

值得一提的是,Devin AI 还可以通过机器学习算法分析代码模式,从先前的经验中持续学习,这极大地提高了其编码效率,还能保持与最新编程趋势的同步。

作为一位「编程助理」,Devin AI 可以辅助程序员完成下面的工作:

  • 代码补全:Devin AI 能够通过分析代码上下文和语法预测下一行代码,加快编码效率;
  • 错误检测:Devin AI 可以检测代码中的常见错误和问题,帮助开发人员识别和修复 bug;
  • 代码重构:Devin AI 会提供代码重构建议,能够帮助开发人员编写更简洁、更高效的代码;
  • 代码优化:Devin AI 可以分析代码性能,提出优化建议,以提高速度和效率;
  • 多人协作:Devin AI 甚至可以作为协作工具,允许多个开发人员同时在同一项目上工作。

官方建议,Devin AI 在处理小型前端错误和极端情况、进行针对性的代码重构以及为待办事项列表中的任务创建初稿 PR(Pull Request)等场景下最为实用。

▲图源:SHIFTMAG

当然,作为一位名副其实的「AI 程序员」,除了辅助编程开发以外,TA 还可以「独立完成任务」供开发人员审核。官方介绍 Devin AI 是「一位不知疲倦并且技术娴熟的团队成员」。

据官方介绍,Devin AI 能够自主规划和执行需要数千个决策的复杂工程任务。这也就意味着开发者可以化身「产品经理」,将开发需求和任务等等「告诉」Devin AI,其就可以进行独立的成果产出。

针对这项功能,官方还贴心地给出了 Devin AI 的「使用指南」,就像你平时叮嘱同事一样:

  • 给 Devin AI 分配「你自己知道如何完成」的任务;
  • 告诉 Devin AI 如何测试或者检查自己的工作;
  • 将会话时间保持在大约 3 小时以内,并且尽量将大型任务分解;
  • 提前将你的详细需求告知 Devin AI;
  • 通过在对话中给出反馈、采纳建议的知识,或者手动添加你自己的知识,来强化对 Devin AI 的训练。

▲图源:Xeven Solutions

关于 Devin AI 在具体场景下的表现,官方展示了几个有趣的用例,我们能够从中一窥这位「程序员」有多厉害。

Devin AI 可以学习和使用「不熟悉」的技术。其在阅读了一篇博客文章后,现学现卖,自主编写代码,在 Modal 上运行 ControlNet 并且生成了一张带有隐藏文字「SARA」的图片:


Devin AI 还可以端到端构建和部署应用。在演示中,其根据需求制作了一个模拟「Game of Life」的交互式网站,并且逐步添加了用户提出的功能,然后将这个应用程序部署到 Netlify 中:


Devin AI 甚至可以训练和微调自己的 AI 模型。演示人员仅仅提供了一个指向 GitHub 研究存储库的链接,其就对某个大语言模型进行了「微调」:

此外,Devin AI 还可以实现自动查找和修复代码库中的错误,处理开源仓库中的错误和功能请求等等。

在「SWE-bench」这项「具有挑战性」的基准测试中,Devin AI 正确解决了 13.86% 的问题,远超之前 1.96% 的最佳水平。即使确切给出了需要编辑的文件,之前最好的模型 Claude 2 也只能解决 4.8% 的问题。

令人惊叹的是,Devin AI 甚至已经通过了现实世界的工程师面试,还在流行的自由职业平台「Upwork」上找到了一份工作。

Devin AI 成为「自由职业者」的新闻还曾引起过不小的争议。一位有着几十年软件工程师经验的 YouTube 博主质疑其演示视频造假,表示这些内容是「自导自演」、「无用功」,并且对其实际能力和效率提出了质疑。

无论是不是商业炒作,Devin AI 目前都已经全面推出。真正的编程表现如何,不妨再等等看,交由时间和用户评判。

▲图源:COGNITION

在 Devin AI 正式推出后不久,OpenAI 也宣布推出了 ChatGPT Canvas 的多项更新,其中就包括直接运行 Python 代码功能,更新后的 Canvas 可以根据要求搜索 API 文档,指导模型编写并执行代码,还可以开发小工具和游戏等。

可以看到,即使是规模大如 OpenAI 这样的人工智能企业,也在不断对「AI 编程」加注。在这样的背景之下,我们自然会想到那个「终极」问题:

TA 离取代真正的程序员还有多远?

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


刚刚,ChatGPT AI 搜索免费开放!

By: 莫崇宇
17 December 2024 at 05:19

上个月,OpenAI 宣布推出 ChatGPT Search。

但当时这位入局搜索引擎的新选手还谈不上颠覆 Google 搜索,而今天免费向全球用户开放的新版 ChatGPT Search 则旨在补齐关于获取实时信息的短板。

本次更新的主要亮点包括:

  • 高级语音模式现已支持实时网页搜索,并支持多语言实时翻译
  • ChatGPT 能够智能判断是否需要执行网页搜索,用户也可通过点击 🌐 图标手动触发搜索
  • 搜索结果中的视频可直接在 ChatGPT 聊天窗口中播放
  • 支持将 ChatGPT search 设为默认浏览器,提升网页导航效率
  • 移动端搜索结果优化显示,包含完整商业信息描述和丰富视觉内容
  • iOS 设备集成原生苹果地图体验

本次发布会由 OpenAI 首席产品官 Kevin Weil、ChatGPT 搜索产品负责人 Adam Fry 以及技术人员 Cristina Scheau 共同主持。

在接连多天发布会后,不仅蹲守直播的用户感到疲软,就连 Kevin Weil 也显得有些敷衍了,照着提词器念台词的痕迹就差没明着来。

言归正传,升级后的 ChatGPT search 功能变得更「聪明」了。

比如说,当你询问「这个周末在旧金山有哪些好玩的活动」时,ChatGPT 会自动判断是否需要获取最新网络信息,亦或者你主动点击「搜索网络」的图标,ChatGPT 将始终从网络获取最新的信息来回答问题。

ChatGPT 反馈的的答案包含丰富的图片和列表,一眼望去,倒是比 Google 搜索引擎更清爽。

搜索结果会标注信息来源,有效降低 AI 幻觉的危害,你可以直接跳转到相关网站,查看详细的视觉内容和其他搜索结果。

ChatGPT search 最大的特色在于其对话式交互方式。

比如在讨论旧金山雨天活动选择时,想去看场电影,我们可以先在 ChatGPT 搜索并播放新版《狮子王》的预告片,降低踩雷的风险。

对于习惯使用 ChatGPT 作为默认搜索引擎的用户来说,现在已经可以更快速地访问各类网站,如 Netflix。

甚至还能在浏览器地址栏直接搜索酒店预订网站。ChatGPT 会优先展示目标网站链接,并在侧边栏提供相关链接供参考。

在移动端,ChatGPT search 升级后的表现同样出色。

以搜索最好的墨西哥餐厅为例,ChatGPT 会提供包含视觉信息、营业时间等完整商户信息的列表。我们可以通过自然对话进一步筛选,如查找「有户外露台和加热器的餐厅」,无需修改关键词或重新搜索。

嫁入苹果大户人家的 ChatGPT,也让其享受到与苹果地图完美集成的本地化体验,点击地图按钮,就能直接查看这些商户,并使用本地的苹果进行实地浏览。

打字的效率往往比不上语音交流。现在 ChatGPT 高级语音模式同样可以实时进行网页搜索。

比如说,你打算去瑞士度假,在 ChatGPT 帮助下,它能用流畅的语音告诉你苏黎世在某一周有什么活动。

具体的节庆活动,到访的圣诞马戏团,音乐秀等都能娓娓道来。

时间如果更具体一些,包括圣诞市场的开门日期和时间,苏黎世今天的天气,甚至纽约联合广场的开放时间,ChatGPT 都能一一作答。

遗憾的是,这次发布会的结尾没有笑话,演示人员要求 ChatGPT 展示用德语、法语和意大利语说「圣诞快乐」,这对于支持 50 多种语言的 ChatGPT 自然轻松拿捏。

最后,木有感情的 Kevin Weil 也「剧透」了明天直播活动的详情,那就是将举行一个「迷你」开发者日,发布更多激动人心的消息。

还记得上个月 ChatGPT search 刚发布时,OpenAI CEO Sam Altman 在 X 平台发文称:

搜索是我们自 ChatGPT 推出以来,我最喜欢的功能!

而根据投资公司 Evercore 在 9 月份对 1300 人进行的一项调查,有 8% 的受访者选择 ChatGPT 而不是 Google 作为他们首选的搜索引擎,相比之下,6 月份这一比例仅为 1%。

要知道,那时更专业的 ChatGPT search 功能尚未正式发布,便已经能从搜索市场份额身上撕咬下一块肉,收获如此多的忠实拥趸。

这样的成绩也进一步刺激了 OpenAI 拓展搜索领域的野心。

上个月,外媒 The Information 披露,OpenAI 正在筹划一款新产品,旨在将 AI 聊天机器人和网络浏览器相结合,已经着手与旅游、餐饮、房地产和零售等领域的网站商讨合作协议,为它们提供搜索功能。

为了实现这一目标,OpenAI 甚至早些时候不惜重金挖来了 Google Chrome 团队的创始成员之一 Ben Goodger。

然而,在用户体验和商业变现之间寻找平衡点,是摆在所有 AI 搜索引擎的难题。

以「无广告」起家的 Perplexity AI 最终也没能扛住营收压力,宣布要在 AI 搜索引擎中试行品牌广告。而 OpenAI 首席财务官 Sarah Friar 也表示正在权衡是否要在自家的产品引入广告。

但愿这不会成为另一个「屠龙者终成恶龙」的故事。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


《黑神话:悟空》无缘年度最佳,游戏奥斯卡被骂上热搜

By: 肖凡博
16 December 2024 at 09:41

又是一年 TGA,又是一年游戏界的奥斯卡,而奥斯卡本身就充满戏剧性。

今年依旧是惊喜、兴奋、遗憾和疑惑并存的游戏奖,而所有获奖游戏中,有两个作品备受关注和讨论。

年度游戏颁给了「宇宙机器人」,一款许多玩家都没听过的冒险游戏,引起了全球玩家的激烈讨论,有人认为合情合理,有人觉得天理难容,而只有坐在台下的任天堂,好像才是最受伤害的一个。

村里第一个大学生不负众望——「黑神话:悟空」突破历史拿下两项大奖,出发即是巅峰,这条国产 3A 游戏的取经路,也算是迎来了开门红,特别是第二个奖项,更能证明「黑猴」的含金量,以及全球范围内的影响。

年度最佳游戏——宇宙机器人

拿下最重大奖项——2024 年度最佳游戏的「宇宙机器人」,同时还拿下了最佳游戏指导和最佳动作冒险游戏的奖项。

开始介绍前,先问问屏幕前的你,「宇宙机器人」得奖是否在你的意料之内?

(投票)

宇宙机器人是一款由索尼发售的 PS5 独占动作游戏。剧情讲述的是一个叫做「Astro Bot」的小型机器人,和同伴们搭乘 PS5 造型的母舰时,遭遇了外星人的袭击,为了不让母舰的零件四散,以及避免同伴们分散在太空中,玩家需要通过闯关和完成各种任务,找回母舰零件以及失散的同伴。

因为游戏本身以「宇宙」为场景,因此所有关卡也都设置在了各种星球当中,通过用机器人自身的能力和装备,来完成各种挑战。

「宇宙机器人」有两个最大的特点,一是上手门槛很低,大部分人都能快速熟悉各种操作,学习成本低,因此也能很快地融入游戏以及剧情。

而且游戏中的许多操作,都有比较高的容错率,不会在一开始就打击新手玩家的兴趣和自信心。

再来,可能游戏本就和 PS5 强相关,所以在游戏中的任何一个小操作——位移、跳跃、打击——都会通过非常细腻的震动来模拟各种触觉,给玩家带来较为真实的游戏体验。

当然,简单的玩法是最大的特色,也是引起争议的核心,在奖项颁布后,大家戏称「宇宙机器人」是 4399 小游戏。
作为世界最大的游戏盛典,将最重要的奖项颁给了这样一款游戏,难免会无法说服大众玩家,而且不管是在制作成本、创作难度还是在销量上,宇宙机器人似乎都不太能和往年 TGA 的年度游戏一较高下。

比如踩油门、拉弓射箭、按下扳机,甚至拉拉链等细微的操作,都会有相应的手柄反馈,因此在之前的评测中也会有玩家称:

这是将 DualSense 手柄功能运用得最好的游戏。

上台领奖时,「宇宙机器人」的导演 Nicolas Doucet 还在获奖感言中,说了这么一段话:

最后但同样非常重要的一点,我原本不打算说,但我必须说出来,你们都了解平台游戏,也了解 PlayStation 已经有 30 年的历史了。我们这次制作了一款优秀的平台游戏,兼具了怀旧和新鲜的体验感。

记得 1989 年的圣诞节时,我还是个孩子,当时我得到了一个灰色的礼盒,里面装着一款让人惊艳的游戏,叫做「超级马力欧兄弟」。我们在东京,他们在京都。但我想向那家真正推动平台游戏发展,展示创新并始终保持高质量的公司致以敬意,他们激励我们创作了这款游戏。

你或许有注意到,我一直都没有提到他们是谁,但你们定都知道!

比起没有被多数人听过的夺魁游戏,可能国内玩家最关心的,还是自家的孩子表现如何。

争气!雄起!

锣鼓喧天、鞭炮齐鸣!「黑神话:悟空」成功拿下 2024 TGA 的「最佳动作游戏奖」和「玩家之声」,实现了国产游戏在全球游戏舞台上的一次历史性突破。

特别是拿下「玩家之声」,更证明了「黑猴」含金量,TGA 的评选更偏传统的「学院派」,参考的大多数都是业内人士以及游戏媒体,而玩家之声完全由玩家投票选出,以表彰那些在玩家群体中广受欢迎并获得高度评价的游戏。

通常反映出过去一年游戏界中最受玩家喜爱的作品。

从黑神话自上线发售后来看,获得了游戏市场和全球游戏玩家的一致好评,上线不到四个月销量就已经突破了 2200 万份,销售额接近 80 亿元人民币,各大游戏平台的评分超过百万条。

虽说游玩主力军还是国内玩家,但「黑猴」目前的海外销量占比已经达到了 25%,作为中国真正意义上的第一款 3A 游戏,能达到这样的玩家影响力和海外影响力,实属不易。

一个爆款游戏想要吸引更多玩家群体,其中一种最简单的方式是把关卡、操作变简单,难度可自主选择,让绝大部分人都能在作品里找到体验感,但「黑猴」并没有选择捷径,而是走了「最 3A」的方式,发售将近一个月后,玩家通过率仅有 30%,就是在这样的难度下,游戏依然收到了好评如潮。

更重要的是,和「黑猴」同场竞技最佳动作游戏的,也并非新星,「使命召唤:黑色行动 6」「绝地潜兵 2」「战锤40K:星际战士2 」,高手如林的擂台上,更能展现出获奖者的实力。

希望从这一刻起,「黑神话:悟空」真的能成为多少玩家期盼已久的开始,游戏科学也能续写「黑神话」的神话,而属于国产 3A 游戏的取经路,也才刚刚启程。

除了以上两部备受关注的作品外,今年的榜单上,遇见了一些新面孔,也看见了很多大惊喜。

2024 TGA 获奖名单

最佳独立游戏:「小丑牌」
最佳手游:「小丑牌」
最佳RPG:「暗喻幻想」
最佳美术指导:「暗喻幻想」
最佳叙事:「暗喻幻想」
最佳配乐:「最终幻想7:重生」
最佳音效:「地狱之刃2」
玩家之声:「黑神话悟空」
最佳家庭游戏:「宇宙机器人」
最佳格斗游戏:「铁拳8」
最佳模拟策略游戏:「冰汽时代2」
最佳体育竞速游戏:「EA SPORTS FC25」
最佳持续运营:「地狱潜者2」
最佳独立游戏出道作:「小丑牌」
最佳VR/AR游戏:「蝙蝠侠:阿卡姆之影」
最具影响力游戏:「Neva」
最佳无障碍创新:「波斯王子 失落王冠」
最佳改编:「辐射」
最受期待游戏:「GTA6」
最佳表演:Melina Juergens 「地狱之刃2:塞纳的史诗」

电竞类奖项:
最佳电竞游戏:「英雄联盟」
最佳电竞人物:Faker
最佳电竞队伍:T1

其实今年 TGA 更让人期待的,是即将在 25 年上线的新游戏,并且有很多都是大家期待已久的续作。

「巫师」系列新作「巫师 4」正式在晚会上公开,这是「巫师 3:狂猎」的正统续作,由「赛博朋克 2077」和「巫师 3」的开发者 CD PROJEKT RED 打造。

「胡闹厨房」团队的新作「怪镇奇旅」亮相,这仍是一款双人冒险类的合作游戏。

还有「双人成行」团队的新作也会在明年上架,雾影工作室正式官宣双人合作游戏「幻裂奇境」,采用双女主设定。

经典游戏 IP「忍者龙剑传」将以全新 2D 横版动作形式回归,新作品名称已敲定,叫做「忍者龙剑传:狂暴之境」。

以及艾尔登法环系列新作、杀戮尖塔 2、潜水员戴夫新 DLC 等等大火的 IP 和游戏,都将在明年陆续和我们见面,期待明年有更多好玩儿的精品,也期待在明年的 TGA 上能看到更多惊喜。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


ChatGPT 年底重磅第 7 弹来了,这次不仅翻车还玩起了 AGI 梗

By: 莫崇宇
14 December 2024 at 22:00

转眼间,OpenAI 年底 AI 春晚已过半数,但雷声大雨点小,今天也不例外。

就在刚刚,OpenAI 推出了 ChatGPT Projects 新功能。

本次发布会由 OpenAI 首席产品官 Kevin Weil、以及 Drew Schuster 和 Thomas Dimson 共同主持,全程用时不到 20 分钟。

ChatGPT Projects 新功能与 Perplexity Spaces 颇为相似,允许用户将聊天内容整理到项目文件夹中,并支持上传数据、图像和 PDF 等各类文件信息。

给「Projects 」注入知识记忆后,用户既可以设置自定义指令,也可以使用搜索、Canvas 等常用功能,甚至可以简单地将其作为对话管理工具使用。

发布会现场展示了多个实用场景。

首先是 ChatGPT 对话搜索功能,用户可以轻松浏览和检索历史对话,比如询问「是否应该在周五部署代码到生产环境」这样的问题时,可以搜索并关联之前的相关对话,并轻松将其添加到项目中。

对了,在创建新项目时,用户还可以编辑标题、选择醒目的颜色,从而方便在侧边栏快速定位。

研究员还展示了一个有趣的圣诞节应用场景。

通过建立秘密圣诞老人项目,上传每位参与者的礼物愿望清单,可以要求 ChatGPT 随机分配送礼关系,并以表格形式清晰展示赠送者、接收者及礼物建议。

再比如,Canvas 集成到 Projects 功能也是重要更新之一。

基于上传的活动信息,研究员要求 ChatGPT 给活动参与者写封邮件,它模仿用户的写作风格,生成包含完整规则和细节的邮件内容。

当然,提出需求时,建议写得更具体一些。

在家庭生活场景中,Projects 功能也能发挥作用。

用户平时可以通过文档记录公寓维护任务、智能家居设置、家用电器使用说明等信息,当遇到问题时,如询问是否需要更换冰箱滤芯,ChatGPT 能够快速查阅维护日志给出建议。

不过问题是,真的会有人将家里的琐事事无巨细地记录在文档里吗?

在编程协作方面的展示则上演了连环「翻车」。

OpenAI 研究员希望重新创建并调整个人信息官网,基于此,他上传了模板、简历、推荐信以及自定义指令等信息,接着通过 Canvas 生成并修改代码。

好消息是,成品最终出现了,但坏消息是,出现的信息并不完整,甚至在后续的修改中也还是翻车了。

从今天开始,该功能将逐步向 Plus、Pro 和 Teams 用户开放,随后逐步推广至免费用户,并计划在明年向企业和教育用户开放。

值得一提的是,直播电脑屏幕故意透露的文件夹还玩起了 AGI 的梗,以及之前的搜索记录也暴露了一些有趣的信息。

网友对此次更新的反响可谓褒贬不一。

但下面两条来自网友的评价相当精辟,新功能很实用,但还是希望 OpenAI 能秀一秀肌肉。

写在最后,OpenAI 过往七天的发布会像极了打工人匆匆解决的日常三餐,看似填饱了肚子,但总觉得少了点什么。

Sora、ChatGPT 高级语音模式视频通话和屏幕共享、ChatGPT 登陆苹果全家桶等,一连串功能的接连落地看似热闹非凡,实则不过是在兑现此前的期货。

按照网友猜想的剧本,OpenAI 可能还在酝酿更多重磅产品,包括 DALL·E 4、GPT-4.5,以及 AI Agents 等。

但不怕 OpenAI 再来期货,就怕下周甚至连期货也没有,至于后事如何,且看下周揭晓。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


ChatGPT 正式登陆苹果全家桶,iPhone 今天起自带最强 AI,但就是这点让人遗憾

By: 莫崇宇
12 December 2024 at 22:05

赶在年底前,ChatGPT 正式登陆 iOS 生态系统,全面支持 iPhone、iPad 和 Mac。

而这也正是今天 OpenAI 年底 AI 春晚第五弹的主要内容,会后,CEO Sam Altman 在 X 平台发文称:

现在只需一个按钮即可使用 ChatGPT!


苹果与 OpenAI 的合作,始于今年 6 月份的 WWDC 大会。

到了 10 月份,苹果正式发布第一波 Apple Intelligence 功能,但写作工具、全新设计的 Siri(跑马灯光效)以及通知摘要等功能还是略显保守。

而今天则新增了更多实用的 Apple Intelligence 功能,将通过 iOS 18.2、iPadOS 18.2 和 macOS Sequoia 15.2 的版本更新推送给用户。

这当中就包括用于创建自定义表情符号的 Genmoji、用于生成图像的 Image Playground 和 Image Wand,以及集成到 Siri 的 ChatGPT 等服务。

不过,遗憾的是,苹果智能暂不支持中国大陆地区,主要面向特定英语地区用户开放。

就苹果 iOS 18.2 中 AI 功能来说, Image Playground 可以让用户创建有趣且独特的图像,比如动画或插图风格等。

全球营销高级副总裁 Greg Joswiak 刚刚也在 X 平台分享了他创作的最新作品。

而 Image Wand 能够智能识别并将手写笔记和草图转换为 Notes 中的图像。


现在和朋友聊天,再也不用薅别人的表情包了。Genmoji 允许用户直接在键盘创建自定义表情符号,还能通过 iCloud 同步到所有设备。

写作工具则在已有的「重写」、「校对」和「总结」三板斧上,新增了「Describe your change(描述你想要的更改)」选项。

基于此,我们可以指定 AI 对文本进行修改,从简历润色到把邀请函变成诗歌,这次的升级给文字创作增加了更多可能性。
就像写作工具中的所有功能一样,该功能集成到系统和许多第三方应用中。

ChatGPT 集成到 Siri 是本次更新的重头戏。

现在,用户可以通过 Siri 或写作工具直接访问 OpenAI 的 ChatGPT(GPT-4o 版本)。APPSO 此前也曾测试过苹果智能,欢迎回看👇

苹果视觉智能也终于跟上时代的步伐。一键识物算是基本操作,但还能总结和复制文本、跨语言翻译以及提取电话号码等。

此外,借助相机控制还能让用户搜索 Google,查看并购买某个物品,所拍即所得,所得即所买。课堂上遇到复杂的图表内容,也可以让 ChatGPT 给你解读。

当然,更重磅的更新还在后头。

苹果表示,明年将推出更多苹果智能的更新,其中就包含对 Siri 将迎来重大进化,尤其是在跨应用操作方面,期待「贾维斯」能早日到来。

苹果用户无需注册账户即可使用 ChatGPT 集成功能,但 ChatGPT Plus 账户的体验自然会更好。至于隐私问题,苹果表示已加入隐私保护措施。

OpenAI 不会保存隐私记录,也不会使用用户的数据去训练模型。

就适用范围而言,苹果智能可在 iPhone 16 系列、iPhone 15 Pro、iPhone 15 Pro Max、搭载 A17 Pro 或 M1 及更高版本的 iPad,以及搭载 M1 及更高版本的 Mac 上使用。

在直播活动上,OpenAI 主持人也向我们演示了今天更新的主要内容。

比如说,想举办一场圣诞派对,只需唤醒 Siri,ChatGPT 便会为你规划好一切,从宾客名单到音乐选择,再到娱乐节目,主打一个无微不至。

制作节日歌单,也没问题,它甚至能为你的歌单添加个性化表情符号,或设计一个可爱的青蛙图案专辑封面。并且,你与 Siri 的所有对话都会被保留到聊天记录中,方便日后查阅。

不过实际能做到多少,还得后续体验才知道。

在演示视觉智能功能时,主持人让其评定今天三位主持人的毛衣。ChatGPT 不仅评选出了 Altman 的毛衣最具特色,而且给出了合理的点评理由。

最后,主持人还用 Altman 的毛衣图案制作了一个有趣的奖杯。

在专业办公场景下,苹果智能的表现同样可圈可点。从 iPhone 转战 Mac,遇到复杂任务时,Siri 会判断并考虑是否调用 ChatGPT 的能力。

例如,当主持人需要将一份 PDF 文档中的技术影响可视化时,系统能够自动分析内容,推理出各项技术的相对重要性,并生成直观的饼图,从而更好地辅助理解文档。

可以说,通过系统级的深度整合,ChatGPT 正在逐渐成为苹果设备不可或缺的有机组成部分。

虽然来得有点晚,功能也还有提升空间,但方向是对的。让 AI 真正融入生活,确实需要这样循序渐进的探索。

最理想的 AI 集成不是让你看见它的存在,而是让你感受不到它的存在。

正如 Altman 在直播结尾时所说,他们希望用户能在更多场景中,以更自然的方式使用 ChatGPT。

APPSO 也将在后续带来关于这次更新的深度评测,敬请期待。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


苹果首款人工智能芯片曝光,想让 iPhone 的 AI 体验更「丝滑」

By: 范津瑞
12 December 2024 at 17:35

继 OpenAI 宣布计划自研 AI 芯片之后,科技巨头苹果近日也传出了其正在与博通(Broadcom)联合研发 AI 芯片的消息。

有趣的是,两家公司针对此事竟给出了几乎相同的理由:尽量避免对英伟达的依赖。实际上,「多元化芯片来源」正是苹果 AI 持续战略的一部分。

博通似乎成为了近期 AI 硬件领域的「香饽饽」,其在短短一个多月之内就与两家 AI 领头羊企业达成合作。据悉,博通已经占据了超八成 AI ASIC 市场,其在 2025 财年的 AI 收入有望达到 170 亿美元以上,同比增速超过 40%。

与苹果的合作消息一出,博通的股价应声上涨 6%,苹果股价也有短暂小幅上涨。这并非两者的首次合作,2023 年五月苹果就曾宣布与博通合作开发 5G 射频组件等等。

▲图源:优分析

据「The Information」报道,苹果 AI 芯片的代号为「Baltra」,将采用台积电先进的 N3P 工艺,计划于 2026 年投入量产。这个时间也与 OpenAI 自研 AI 芯片的量产时间重合。

消息称,Baltra 的设计开发旨在优化 AI 工作负载,增强 AI 和机器学习(ML)功能。这枚芯片将专用于推理任务,以及处理新数据并将其传输给大语言模型(LLMs)以生成输出。

而此次与博通的合作重点,则是将其高性能网络技术与芯片的核心处理能力整合,确保 AI 操作所需的低延迟通信。

▲图源:Crypto Briefing

近日,博通展示了一种先进的 3.5D 系统级封装技术(3.5D XDSiP),能够让制造商超越传统光罩尺寸的限制

具体来讲,3.5D XDSiP 将计算芯片堆叠在一个逻辑芯片上,该逻辑芯片与高带宽内存(HBM)连接,同时将其他 I/O 功能分配到一组单独的芯片上。

与传统的 3.5D 封装技术不同,博通的设计采用了「面对面」的方法,这种方法允许芯片之间通过混合铜键合(HBC)排布更密集的电气接口,从而实现更高的芯片间互连速度和更短的信号路由。

博通的 3.5D XDSiP 技术本质上是一个「蓝图」,客户可以使用它来构建自己的多芯片处理器。巧合的是,博通预计这项技术的第一批部件也将于 2026 年投入生产,这与「Baltra」的投产时间不谋而合。

▲图源:The Register

毫无疑问,这枚芯片最重要的使命,就是为苹果自家的 Apple Intelligence 服务

苹果的原生 AI 功能自发布以来便一直引人关注。苹果原计划直接在设备上运行大部分 AI 功能,但某些功能(如 Siri和 Maps)在云端处理,并且对计算能力有很高的需求,现有的芯片又并非定制。于是,「Baltra」的提案应运而生。

Baltra 是为苹果自己的数据中心而定制设计的,其用于驱动高级 AI 任务,并确保为用户带来「无缝」的 AI 体验。这意味着苹果的 AI 战略已经超出端侧,并纳入了云计算能力。

值得一提的是,苹果刚刚发布了 iOS 18.2 正式版系统,其中新增了多项实用的 AI 功能,包括 ChatGPT 正式登陆苹果全家桶等等。未来,Baltra 将使苹果在其产品生态中部署 AI 时获得性能优势和更大的灵活性。

▲图源:Fast Company

据估计,2028 年 AI 服务器芯片市场规模预计将达到 450 亿美元,而苹果在 AI 服务器芯片市场的定位将会是对现有领导者的极大挑战。

彭博社分析指出,苹果与博通的合作进一步巩固了其在 ASIC 设计中的主导地位,这项合作预计将推动博通在 2025-2026 年之后的 AI 收入增长,并且其有望在苹果供应链中占据更多份额。

此外,自 OpenAI 在 2022 年 12 月发布 ChatGPT 以来,苹果加快了自家服务器芯片的开发工作,以保持其在人工智能领域的竞争力。苹果的目标是在 12 个月内完成「Baltra」芯片的设计。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


5 分钟完成 1000 万亿年计算任务,Google 的量子芯片意味着什么?

By: 范津瑞
11 December 2024 at 18:00

遇事不决,量子力学。

量子力学诞生距今已有 120 多年的历史了。从光的双缝干涉实验到「薛定谔的猫」思想实验,它似乎是我们想象当中最神秘最深奥的物理学定律。美国理论物理学家理查德·费曼(Richard Phillips Feynman)曾说:

如果你认为你了解量子力学,那你就不了解量子力学。

即使量子力学距离我们相当遥远,却也在快速地发展:2016 年,我国成功发射「墨子号」量子科学实验卫星;2022 年的诺贝尔物理学奖授予了三位科学家,以表彰他们在「量子信息科学」研究方面的贡献。

▲2022 年诺贝尔物理学奖得主(图源:证券时报)

而 Google 近日也在「量子力学」方面有了大动作,堪称「里程碑」式的创新。

Google 量子人工智能团队「Quantum AI」的创始人兼负责人哈特穆特·内文(Hartmut Neven)在博客发表文章,宣布推出其最新的量子芯片「Willow」,并称其为大规模量子计算机铺平了道路。

在文章中,内文称这款芯片「在许多指标上都拥有最先进的性能」,并且「实现了两项重大成就」:

  • 其一,是 Willow 增加了「量子比特」的使用数量(105 个),并且「成倍地」减少了错误;
  • 其二,是 Willow 在不到 5 分钟的时间内完成了其最新的「随机电路采样(RCS)基准测试」。

▲图源:Google

要想理解以上这些突破性成就,我们就必须要了解量子计算机/量子芯片的工作原理。

量子力学的核心概念之一是「叠加」,即一个量子系统可以同时存在于多个状态,而量子计算机正是利用这种叠加性质来创建「量子比特(Qubits)」,这是量子计算机中的基本计算单元。

与经典计算机中的二进制比特(Classic Bits)不同,量子比特可以同时处于 0 和 1 的「叠加态」。该状态使得量子计算机能够同时处理多个计算路径或状态,从而在解决某些复杂问题时比经典计算机更快、更高效。

▲图源:Microsoft

此外,量子比特之间还具有一种叫做「量子纠缠」的特殊关系:当量子比特相互纠缠时,无论距离多远,其中一个量子比特的状态会立即影响另一个量子比特的状态。

此时我们就可以根据某个量子比特的状态得知其他量子比特的状态,这也就达到了信息传递的效果。这种特性使得量子计算机能够在处理复杂问题时更有效地共享和传递信息。

然而,量子比特的状态非常脆弱,容易受到外部环境(温度、振动、电磁等)的干扰,导致量子信息丢失,这种现象称为「量子退相干」。由于纠缠,错误可能会从一个量子比特传播到其他量子比特,进而影响计算能力。

并且因为量子比特倾向于与其环境快速交换信息,导致完成计算所需的信息很难被保护。通常,一台量子计算机使用的量子比特越多,发生的错误就越多,整个系统也就更加倾向于「经典系统」。

▲量子纠错示意(图源:Microsoft)

但根据内文的说法,Google 的研究人员引入了一种新的「量子纠错」方法,能够实现 Willow 芯片所使用的量子比特越多,反而会减少更多的错误,并且错误率呈指数级下降。

内文在文章中表示这一历史性成就在该领域中被称为「低于阈值」,即能够在增加量子比特数量的同时减少错误。内文还强调自彼得·肖尔(Peter Shor)于 1995 年引入量子纠错以来,这一直是一项极其困难的挑战。

因此,「低于阈值」能够展现「纠错方面的真正进展」,而 Willow 是首个低于阈值的系统,它表明建设超大型量子计算机的可能性确实存在。这一研究结果还被刊登在《Nature》杂志上。

▲图源:Google

此外,内文在文章中宣称 Willow 在 5 分钟之内就完成了声称「当今量子计算机上完成的最难的经典基准测试」的随机电路采样(RCS)测试,并称 Willow 的这些最新结果是「迄今为止最好的」。

作为对比,世界上运算速度最快的超级计算机要 10^25 年才能计算完成 RCS,这个时间甚至超过了宇宙的年龄(约 138 亿年)。

随机电路采样(Random Circuit Sampling,简称 RCS)测试是一种用于评估量子计算机性能的方法。其核心思想是利用量子计算机执行随机选择的量子门操作,生成随机的量子态,然后对这些量子态进行采样和测量。

RCS 最早就是由内文所在的团队提出的,内文称其现在是「该领域的通用标准」。

▲图源:Google

值得一提的是,2019 年,Google 就宣称其开发的量子处理器「Sycamore」仅用三分钟就可以完成当时世界上最快的超级计算机一万年才能完成的计算,还强调其研究团队已经取得了「量子霸权」。

IBM 对 Sycamore 的计算测试结果提出了异议,并且「量子霸权」这个词也引起了不小的争议,尽管 Google 强调该词只是一个「艺术术语」。后来,Google 尽量避免使用这个词语,只是说已经实现了「超越经典计算」。

此外,IBM 和霍尼韦尔(HoneyWell)公司在他们的量子力学研究中一般使用「量子体积」这个术语来描述和量化其量子计算机设备,Google 却完全不用这个概念。缺少统一标准,导致竞品之间难以进行对比。

▲图源:Google

内文表示,量子技术在收集 AI 训练数据、发展新能源汽车和发现新药方面都有其用武之地。

与此同时,他还展望了 Google 量子力学研究的下一个目标:完成一个既「与实际程序相关」,又是「经典计算机无法实现」的计算,真正做到「有用」并且「超越经典」。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


为 MacBook 安上 5G 芯片?你的 iPhone 终于不用开热点了

By: 周奕旨
11 December 2024 at 18:05

最近,苹果在基带芯片上的动作真不小。

明年春季,iPhone SE 或将搭载苹果首款自研 5G 芯片。若进展顺利,2026 年第二代支持毫米波的基带芯片将应用于 iPhone 18 和高端 iPad,而代号「Prometheus」的第三代芯片也随之而出。

iPhone 能否凭借自研基带改善一直以来饱受诟病的信号短板,我们先按下不表,现在有个更有意思的事情。

前不久,爱范儿发布了一篇讨论 MagSafe 的文章,在你来我往的评论区中,有条评论抛出了一个看似「跑题」的问题:

你们知道 MacBook 最大的刚需是什么吗,是户外没有无线网,急需的 5G!平板电脑都能用 5G,MacBook 为什么不能?

给 MacBook 安装 5G 芯片,不知道为什么,听起来总归有点怪,但事情的发展往往比想象更意外。

一语成谶,彭博社最新的报告揭示,苹果的确打算为 MacBook 系列配备 5G 基带芯片。

让 MacBook 像 iPhone 一样,随时随地接入互联网,似乎正在成为苹果的下一个计划。

一条早有探索的路

既然苹果说要做,那我们就来看看,做这件事,到底有什么好处?

作为一名编辑,我最头疼的莫过于出差时处理工作。一旦需要紧急完成任务,而周围却没有稳定网络,我只能让 iPhone 承担「外挂网线」的角色,牺牲它那本就捉襟见肘的续航,以确保 MacBook 在没有 Wi-Fi 的情况下依然能够正常联网。

显而易见,开头的评论已经给出了第一个答案,对于经常出差或从事户外工作的用户而言,MacBook 内置信号基带无疑是一件充满安全感的事情。

没有出差或是户外需求的用户,5G 芯片的加入也有其用处。

在现在的流媒体 app 或是游戏 app 中,有句话大家一定不陌生:

正在使用移动网络优化体验。

类似的机制完全可以用在 MacBook 上,用以提升网络的稳定性。

在 Wi-Fi 和 5G 网络的双方加持下,通宵下载什么大文件都不怕网络抽风,一觉醒来任务稳稳当当地跑完,零意外,再也不怕出现第二天起床看见「网络连接已中断」的提示。

最后,也别忘了苹果的最爱——隐私。

公共 Wi-Fi 一直是一个难题,对于我们这种普通用户而言,互联网的防御和威胁是一件潜在但完全有可能的事,如果 MacBook 安装了 5G 基带,能够自行解决网络连接问题,就不必依赖来路不明的热点,从源头降低信息外泄的风险。

对于那些需要严密保护工作信息却又不想每天提心吊胆的用户而言,这无疑多了一层安心的防护。

说了这么多好处,那么问题来了:内置基带这么好,别的厂家不做吗?

正如那句老话,太阳底下无新事,给笔记本电脑安装 5G 基带,并不算是一件多么稀奇的事情,回头看向历史,有不少老牌电脑厂商早就做过。

2005 年,索尼推出 VAIO VGN-T350 系列笔记本电脑。

▲ 索尼 VAIO VGN-T350/L

该系列电脑通过内置的 Cingular EDGE 蜂窝数据模块,允许用户无需外接数据卡或使用手机基带,即可在有移动蜂窝网络信号的地方直接上网。

在此之前,笔记本电脑通常只能通过外置 PCMCIA 数据卡或借助手机蓝牙/数据线连接来实现移动数据访问。

索尼 VAIO VGN-T350 首次将此类蜂窝网络模块直接内置于笔记本内部,从而被广泛视为「首款商业化上市、真正实现了内置蜂窝数据上网的笔记本机型」。

▲ VGN-T300 系列配备了无线局域网与无线广域网(蜂窝网络)指示灯

随后不久,IBM、联想、戴尔与惠普等高端笔记本也纷纷推出带有内置 3G/EDGE/CDMA2000 等模块的笔记本,都将直接连接互联网作为卖点之一。

别的不说,就连苹果也动过心。

2011 年,一台 MacBook 原型机出现在 eBay 网站上,在一番激烈的竞逐后,这台 MacBook 的价格已经升高至 7 万美元。

之所以引来如此多人的关注,是因为这台原型机实在是太过特殊——屏幕的侧边,延伸出来了一条天线。

▲ 带有天线的 MacBook 原型机

随着 7 万美元大关的突破,这台原型机突然从 eBay 上撤下,并没有成交,不过卖家 evilroot 在 MacRumors 发布了更多的信息,以满足大家的好奇心。

这台 MacBook 天线版原型机大约生产于 2007 年,具有红色电路板(而正式版本是蓝色),除了外观上显眼的天线外,还有内存盖下方摆放的 SIM 卡卡槽,据推测,这台 MacBook 原型机将支持 3G 网络,在 MacRumors 上,evilroot 对这根天线做了更多描述:

老实说,我认为大部分关于天线看起来不好的东西都是由于我拍摄照片的角度。它看起来相当大。实际上,它非常小,当延伸时,它只从显示屏上突出约2英寸,可能一毫米或两毫米厚。

更有趣的是,天线实际上是用磁铁固定在设备上的——有点像 MagSafe 功能中使用的磁铁,早在 2008 年苹果就为此申请了专利。

▲ 左、中:MacBook 原型机的天线|右:2008 年,苹果申请的天线专利

当然,时代与技术的限制之下,这台 MacBook 只停留在了原型机的程度,没有正式推出。

时至今日,联想 ThinkPad 系列中,还有部分机型提供内置的蜂窝模块,通过 4G 基带随时随地连接互联网,戴尔的 Latitude 系列也有些型号搭载高通 Snapdragon X55 基带,为用户提供无 Wi-Fi 环境下的上网服务,惠普 EliteBook 系列、微软 Surface Pro 系列,都各自有类似的选择。

Mac 加基带,正是好时候

可以说,但凡是主打办公的高端笔记本,曾经都多多少少做过这样的尝试,不过始终没有大面积铺开。

原因也很简单:续航是个大问题。

不过,这个问题对于苹果而言,算不上困扰——自从 M 芯片推出以来,凭借高能效的 ARM 架构与系统级集成的 SoC,MacBook 的续航得到了史无前例的提升。

与我目前用的 i9 16 寸 MacBook Pro 相比,现在 14 寸的 MacBook Pro 都可以轻松将续航翻倍。

在强大的续航支持下,原本束手束脚的使用体验变得随意起来,一颗高度集成于 SoC 中的基带,不再是压力和负担。

再加上随着时代的进步,消费者对电脑的需求开始趋于多样化,每个人拿到 MacBook 的使用场景都不一样——这位可能是放在家中作为代码编辑器,承担主要的工作任务,而另一个人则可能拎着 MacBook 与相机一起在广袤的无人区拍摄银河和星空。

此时,在续航已经大大增强的基础上,让 MacBook 适应更多的使用环境,不是一件错事。

5G 基带出现在 Mac 上,还有一个很容易被忽视的原因——环境。

虽然苹果没有公布 MacBook 系列的具体销量,但取决于 MacBook 在整个 Mac 产品线中占据绝对的生态优势位置,我们可以从总体的营收数据来窥斑见豹,推测 MacBook 系列在哪个市场卖得最好。

根据 MacroMicro 的数据来看,2024 Q3 数据中,大中华区在苹果营收占比排名第三,为 15.84%,而前两名分别是北美的 43.89% 与欧洲的 26.26%。

▲ 数据与图片来自 @MacroMicro

如果粗略地将营收占比看作用户占比,那么 MacBook 的用户更多集中在北美与欧洲。

而这两个地方,自有国情。

在欧美,商业通讯运营商的大部分套餐有一个巧妙的限制——流量给得很大方,甚至有可能无限制使用,但如果是作为热点使用,则有严格分级的流量上限。

比如 Verizon、T-Mobile、AT&T 的普通套餐,普遍有着热点 10-15GB 的限制,哪怕花大价钱订阅最高套餐,也会在 50G 左右被限速,比如 T-Mobile 的基础套餐,需要选择 75 美元的第三档,才能使用 15GB 的热点流量,想要更多的热点流量,需提高到 90 美元的档位,才能使用 50GB 的热点流量。

▲ 运营商 Verizon 的 55 美元套餐,限制为 60GB 的热点流量

在流媒体兴起的时代,但凡有跟视频沾点边儿的工作需求,这点流量真的不够用。

按照惯例,在文章的结尾,我还是要泼一桶冷水。

毕竟东西唱得再好听,也要落实到消费者手上,才是真的好。

按照苹果的习惯,就算 5G 基带成功推出,我们依然面临一个问题——有非常大的可能,这套方案会使用 eSIM。

eSIM 这个东西,我们就不再浪费笔墨了,iPad Pro 的蜂窝版近在眼前,完全可以作为参考。

不过,无论怎么说,从技术、需求与环境的综合视角来看,苹果想为 MacBook 加上基带这件事,虽然乍一看令人意外,但细细思量,的的确确是在情理之中,堪称苹果的欧·亨利时刻。

2020 年,爱范儿曾经发布过一篇《苹果造芯,拯救 iPhone 信号 | 硬哲学》,详细剖析了苹果自研基带芯片的布局和野心。

2019 年,在苹果与高通和解的当天,英特尔宣布退出 5G 基带芯片市场。

彼时,MagSafe 离开大众视线已经四年有余,神秘的 M1 芯片还没揭开面纱,iPhone 刚刚开启全面屏时代不久。

同年 7 月,英特尔将相关团队与资产打包,以 10 亿美元的价格卖给了苹果,至此,苹果走上自研基带芯片的道路。

转眼五年过去,MagSafe 早已回归,M 系列芯片已经迭代到 M4,iPhone 只多了一颗相机控制键。

此时,我们终于听到了苹果基带芯片的脚步,正以一种缓慢而坚定的方式向我们靠近。

让我有个美满旅程

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


清华系 AI 公司面壁智能完成新一轮数亿元融资,CEO 李大海:大模型将从大跃进转向持久战

By: 范津瑞
11 December 2024 at 11:45

聚焦端侧大模型的清华系 AI 公司面壁智能,近日获得了新一轮数亿元融资。

APPSO 获悉,本轮融资的领投方为龙芯创投、鼎晖百孚、中关村科学城基金和赛富基金,跟投方为北京市人工智能产业投资基金与清科创投,并由万甲资本担任本轮独家财务顾问。

本轮融资完成后,面壁智能表示,公司将进一步提速以「端侧 AI」为代表的高效大模型商业化布局,以同等参数、更高性能、更低能耗、更快速度的高效大模型深度服务行业,为用户创造「具体可感知」的价值。

面壁智能是一家以「高效为第一性原理」为信条的大模型公司,高效是其团队的内在基因。据悉,面壁团队先于国内所有团队开启大模型研究,并且首批实现了千亿多模态模型的落地,提供了全球领先的端侧智能解决方案。

业务方面,面壁智能团队在多个领域内卓有成效、进展迅速。其不仅将主流消费电子和新兴硬件融入端侧 AI,得益于在自然语言处理方面的技术渊源和优质行业数据的深厚积累,面壁团队还在法律、教育等垂直领域方面有所建树。

面壁智能 CEO 李大海表示,大模型比拼已经进入了「持久战」阶段。此外,他认为面壁智能将在端侧智能领域保持竞争力,并正在建立属于自己的市场地位。

面壁智能成立与 2022 年 8 月,其核心科研成员来自清华大学 NLP 实验室,是国内最早一批做预训练大模型的团队之一,至今已经推出多款人工智能大模型产品:

  • 2023 年 11 月 14 日,面壁智能多模态大模型应用「面壁露卡 Luca」正式面向公众开放服务;
  • 2023 年 11 月 15 日,面壁智能推出基于群体智能的 AI 原生应用「面壁智能 ChatDev」智能软件开发平台,同时将其 CPM 系列基座模型升级为全新一代千亿参数大模型「面壁智能 CPM-Cricket」;
  • 2024 年 2 月,面壁智能发布开源端侧模型「MiniCPM」,是其「大模型+智能体」双引擎战略的关键一步;
  • 2024 年 9 月,面壁智能推出「小钢炮」系列的最新产品「MiniCPM 3.0」。

值得一提的是,2023 年 7 月,面壁智能、人民法院出版社和深圳迪博共同助力深圳中院,正式启用全国首个「司法审判垂直领域大模型」;同年 11 月,面壁智能作为联合研发团队参与的「法信法律基座大模型」在最高法发布,定位为国家级法律人工智能基础设施。

另外,面壁智能正在与华为、联发科技、联想、英特尔、长城汽车和易来智能等行业标杆企业紧密协作,业务覆盖 AI Phone、AIPC、智能座舱、智能家居与具身机器人等领域。

面壁智能预计,GPT-4 水平的端侧模型将在 2026 年年底实现。

本轮融资完成后,李大海发布了面壁智能全员信。附上信件全文如下:

面壁智能的同学们,大家好!

很高兴和大家分享,面壁智能完成了新一轮数亿元融资,这轮融资由龙芯创投、鼎晖百孚、中关村科学城基金和赛富基金联合领投,北京市人工智能产业投资基金与清科创投跟投。

随着这轮融资敲定,我们已站在一个全新的台阶上:将进一步提速以端侧 AI 为代表的高效大模型商业化布局,以同等参数、更高性能、更低能耗、更快速度的高效大模型深度服务行业,为用户创造具体可感知的价值。

过去一年,以成绩说话,我们的小钢炮端侧模型,在全球一炮而红,站稳脚跟。我们基于高效大模型和端侧AI的商业化布局和业务推进,多点开花,进展迅速。

依靠小规模的精益创业团队,我们把MiniCPM推向了端侧 ChatGPT、GPT-4V 时刻;携手华为、联发科技、联想、英特尔、长城汽车、梧桐科技、易来智能等标杆合作伙伴,成为 AIPC、AIPhone、智能座舱、具身机器人等行业创新发展中不可或缺的角色;并且深度参与国家级人工智能基础设施「法信法律基座大模型」的构建。

今天,在中国大模型「6+2」格局里,我们成为极具辨识度和竞争力的代表。在全球范围,面壁也是端侧智能的标杆,上榜《财富》全球人工智能创新 50 强!

这是小钢炮精神的胜利!我们值得骄傲!

同样的时间,更前瞻的判断;同样的资源,更具爆发力的创造;同样的机遇,一杆子捅到底解决行业与客户痛点的决心。

把高效发挥到极致,创造超预期成果,底气来自我们对大模型本质规律的深刻认知,基于高效为第一性原理的研发、产品与组织基因!

走先人一步的路,打以少胜多的仗,这就是响当当的小钢炮精神!

回顾过去一年,我们做对了几件事:

1. 超前认知,以更小的样本,预判技术和产品方向。
2024 年下半年,行业突然形成新共识,更高知识密度的小模型和端侧智能,成为大模型发展的新阶段。如今,因为端侧智能发展的深刻影响,主流消费电子和新兴硬件正演变成一个个在不同场景、执行特定任务的超级智能体,成为新一轮科技创业大风口。
面壁智能提前半年多,在世界范围内前瞻性发现端侧智能内蕴的巨大研究空间和应用潜力。在这个瞬息万变、竞争激烈、又充满想象力的市场里,大举发力端侧模型,打造享誉全球的面壁「小钢炮」MiniCPM,我们成功构建起了基本盘。

2. 技术筑基,以先进技术为基,务实服务垂直行业,快速复用和价值放大。
有一个行业的高质量数据,就能快速赋能一个行业打造基座大模型。面壁发挥在文本基座模型的技术渊源和专业数据的深厚沉淀,今年 7 月,面壁智能、人民法院出版社、深圳迪博共同助力深圳中院,正式启用全国首个司法审判垂直领域大模型, 应用范围已覆盖所有常见民商事案件,行政案件。11 月,面壁智能作为联合研发团队参与的法信法律基座大模型在最高法发布,法信法律基座大模型定位为国家级法律人工智能基础设施。未来,全国数以千计的法院、检察院、司法系统单位,都将能成为我们有所贡献的地方。

3. 以小博大,提出大模型的面壁定律、密度定律,通过大模型科学化越级超越同类产品。
自今年 2 月份面壁「小钢炮」MiniCPM 端侧模型系列面世以来,累计下载突破 300 万,频频登顶全球著名开源社区 GitHub、HuggingFace 的大模型趋势榜单。MiniCPM 不仅在多项基准测试中接连越级领先,还将无限长文本、超清 OCR 识图、实时视频理解等首次集成到端侧,创造多项纪录。
面壁小钢炮以小博大、高效低成本特性,背后是我们坚持大模型科学化,以更本质的模型知识密度(知识密度 = 模型能力 / 参与计算的模型参数)指导技术研发和模型迭代。我们不断创新性提出大模型面壁定律、密度定律等引领性的大模型科学方法论,立志将更高性能的端侧智能技术带入千家万户、千行百业。

所有的领先,往深处都是认知的领先;任何商业竞争,归根结底都是效率的比拼。
高效,不仅是我们企业运营的核心;在商业环境中,也意味着更快的响应速度、更低的成本、更高的产出和更好的客户满意度。
感谢面壁智能的全体同仁,我们正在创造一场极致高效的大模型研发与商业奇迹!
坚韧、顽强,能量十足,面壁小钢炮已经开始震动全球。小钢炮精神,正带领我们走向 AGI 的最终胜利!

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


ChatGPT 深夜更新,奥特曼没露面,但 OpenAI 这次是真把「AGI 界面」玩明白了

By: 莫崇宇
11 December 2024 at 05:20

继昨天的 Sora Turbo 之后,我们终于迎来了年底 AI 春晚的第四弹。

本次发布会由 OpenAI 首席产品官 Kevin Weil、Lee Byron 和 Alexi Christakis 等人主持,全程持续 20 分钟。

具体来说,ChatGPT Canvas 此次推出了三项更新::

  • Canvas 功能整合进 ChatGPT 核心模型
  • 支持用户直接在 Canvas 中运行 Python 代码
  • 为定制 GPTs 引入 Canvas 功能

按照惯例,OpenAI 依次向我们演示了新功能的实际应用场景。

例如,让 Canvas 创作一个关于小精灵的圣诞故事,和以往一样,然后让其编辑标题,润色文档,检查语法,甚至在添加恰当的表情符号都能胜任。

会后,OpenAI CEO Sam Altman 也在 X 平台着重提到了这一点:「现在,所有 ChatGPT 用户都可以使用 Canvas 功能,并且能够执行代码!更重要的是,它依然能够为你的文字添加表情符号。」

接着继续给 ChatGPT Canvas 上点强度。

作为物理爱好者,主持人向 ChatGPT Canvas 上传了一篇题为《圣诞老人雪橇:探讨暗能量在驯鹿动力中的作用》的论文草稿,然后让 ChatGPT 以物理教授的视角进行评估。

没有出乎太多意外,ChatGPT 很快给出了专业的反馈意见,经过简单的调整后即可呈交给教授审阅。

ChatGPT Canvas 的第二项重要更新是支持直接运行 Python 代码。

通过将代码复制并粘贴到 ChatGPT 中,它能够识别代码,并自动切换到代码编辑模式,帮助调试或查找错误。用户还可以直接在界面中运行代码,快速识别任何问题。

如果你是程序员,在遇上棘手的 Bug 时,不妨当起甩手掌柜,交由它来解决。

据官方介绍,OpenAI 在 Canvas 中集成了基于 WebAssembly 的 Python 模拟器,使其能够加载绝大多数 Python 库,实现代码的即时运行。

在随后演示环节中,当主持人要求 ChatGPT 制作一个关于圣诞老人制作或分发玩具的桑基流量图,且颜色要符合圣诞主题时,最终成品还是翻车了。

不过,往好点想,起码 Altman 真没拿录播糊弄我们。

第三项重要更新是将 Canvas 功能引入 GPTs 生态系统。

假设在这个圣诞节,你写信给圣诞老人,许愿清单包括一辆新自行车、一台 H100 GPU,甚至一些「暗物质」,但圣诞老人因太忙无暇回复,该怎么办?

借助装扮成圣诞老人的 GPTs(即 Santa Letter Drafter)以及新增的 Canvas 功能,该 GPTs 能够完美模仿圣诞老人的语气回复信件。

值得注意的是,对现有的 GPTs 而言,Canvas 功能默认处于关闭状态,而新建的 GPTs 则默认开启该功能。如果想在现有 GPT 中启用 Canvas,只需进入配置界面勾选相关选项就好。

发布会的结尾依然以一个圣诞笑话作为尾声:「圣诞老人是怎么拍照的?答案是,他用 North Polaroid 相机。」

就目前更新的功能来看,ChatGPT Canvas 估计没少在 Claude Artifacts 亦或者 Cursor 等产品上寻找灵感,但又更细分的功能选项又多少有些青出于蓝而胜于蓝。

我也让其撰写了一篇关于灰姑娘和七个葫芦娃的故事。

再比如让其写一个飞机大战游戏,都能成功运行。

OpenAI 内部员工 Karina Nguyen 也在 X 平台分享了一些实际的应用场景。比如让 ChatGPT 阐释一个数学概念,并编写代码来生成图表,通过视觉辅助来更直观地理解和掌握概念。

搜索 API 文档,指导模型编写并执行代码,以获取所需的图表,亦或者通过 ChatGPT 的 Canvas 轻松编写自己的个性化的小工具或游戏等。

可以说,现在的 ChatGPT Canvas 功能正在朝着 Karina Nguyen 的愿景逐步迈进:

「我对理想 AGI 界面的设想,是一张能够随人类喜好不断演变和自我调整的空白画布。它能够创新地与人类互动,不断探索新的交流方式,从而彻底改变我们与 AI 乃至整个互联网的关系。」

在这当中,AI 代码生成俨然成为了最具应用价值的场景之一。

当下,AI 代码使用率正在逐渐接近 50% 的关键分水岭,这场转变的本质,与其说是效率的提升,倒不如说是对程序员创作思维和工作流程的彻底重构。

来自市场的数据也有力印证了这一发展势头。

公开数据显示,预计到 2027 年,全球软件开发市场规模将攀升至 10.39 亿美元,年复合增长率高达 22.54%,而 Cursor 的爆火也反映出 AI 编程工具的大有可为。

作为 AI 编程助手,Cursor 已吸引超过 4 万用户,其年化经常性收入从 2023 年的 100 万美元飙升至 6500 万美元,增长率达到惊人的 6400%。

就在 OpenAI 直播活动召开前,全球首个 AI 程序员 Devin 也宣布正式上线,其服务起价为每月 500 美元,直接融入我们的工作流程,支持在 Slack、GitHub,甚至是私人集成开发环境(IDE 测试版)中使用 Devin。

大模型时代的 AI 编程竞争,核心不在于代码产出的数量,而在于谁能打造出更完整的开发体验闭环。真正的竞争不是比谁入场更早,而是比谁更懂开发者的痛点。

现在来看,OpenAI 有意以一记精准的发球抢攻,赢下这关键的一分。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


iPhone SE 4 最新爆料:全面屏来了,还支持苹果 AI

By: 范津瑞
10 December 2024 at 18:00

最近,知名爆料者 @Jukanlosreve「泄露」了一份关于 iPhone SE 4 的完整规格表,可信度相当之高。

如果消息为真,我们将在明年春季与这款自 iPhone SE 系列问世以来升级最为重大的机型见面。

▲iPhone SE 4 系列机型爆料图(图源:Tom’s guide)

作为苹果数码设备中的「低端」产品线,iPhone SE 系列机型一经推出就以其紧凑小巧的体型和亲民的价格获得了广大消费者的青睐。

然而,尽管第一代和第二代 SE 机型成为了用户的「香饽饽」,iPhone SE 3 的销量却不如预期。这也提醒苹果公司要在下一代产品中尽快调整:「低配」不等于落后,SE 同样也需要及时上新。

▲销量不佳的 iPhone SE 3(图源:Techradar)

从目前的爆料信息来看,外观方面,iPhone SE 4 终于告别了 SE 系列一贯沿用的「经典款」iPhone 设计,转而采用类似 iPhone 14 标准版的整体设计,加入了「全面屏」的大军。

不过,「刘海儿」还在,暂未「登岛」。

▲网传 iPhone SE 4 将采用「刘海儿」屏幕(图源:MacRumors)

爆料称,iPhone SE 4 可能配备一块 6.06 英寸的 OLED 显示屏,分辨率为 2532*1170 像素,峰值亮度达 800 尼特。显然,相比上一代 SE 机型 4.7 英寸,1334*750 像素分辨率的 LCD 显示屏,有了比较明显的升级。

值得一提的是,这将是 iPhone SE 系列机型首次应用 OLED 面板

分析师 Ross Young 表示,iPhone SE 4 应该与 iPhone 14 共享相同的 OLED 面板,由京东方和 LG Display 提供。而韩媒 ET News 的最新消息称其将使用与 iPhone 13 标准版相同的 6.1 英寸低温晶体硅(LTPS)OLED 显示屏

据业内人士称,大约有 25%~35% 的 iPhone SE 4 面板由 LG Display 提供。目前,该厂商已经量产了这款面板。

同时,全面屏的使用还意味着「Home 键」和「Touch ID」的取消。预计 iPhone SE 4 将使用更为先进的 Face ID 技术,这也是之前的 SE 系列机型所没有的。

▲iPhone SE 4 的面板(图源:9TO5Mac)

爆料称,iPhone SE 4 将搭载与 iPhone 16「同款」的 A18 处理器,并配备 8GB 的 RAM 和 128GB 的存储空间。如此「向旗舰看齐」的诚意配置,很难不让人觉得这是为「Apple Intelligence」而特意精心准备的。

当然,彭博社 Mark Gurman 的报道也证实了这一点。这表明苹果希望将 Apple Intelligence 推广到尽可能多的设备上,包括其最便宜的新 iPhone。

▲Apple Intelligence(图源:9TO5Mac)

这份最新的完整规格表显示,iPhone SE 4 将搭载一颗 4800 万像素的后置摄像头以及一颗 1200 万像素的前置摄像头。而 iPhone SE 3 的前、后摄像素分别为 700 万和 1200 万。

而根据爆料者 Sonny Dickson 此前关于 iPhone SE 4 手机壳的分享,这款手机有可能采用和 iPhone 14 机型一致的后置双摄。即除了主摄以外,还有一颗超广角镜头。

不过,同样根据 ET News 的最新消息,这份规格表关于摄像系统的消息似乎相当可信:LG Innotek 正在其位于越南的制造工厂量产 iPhone SE 4 的镜头模组,规格为 4800 万像素后置,1200 万像素前置。

此前,LG Innotek 为 iPhone SE 3 提供了后置摄像模块。除 LG Innotek 以外,消息称富士康和高伟电子(Cowell Electronics)也在 iPhone SE 4 镜头模组的供应链内。

▲网传的 iPhone SE 4 手机壳(图源:Tom’s guide)

预计 iPhone SE 4 还将搭载苹果自家的首款 5G 调制解调器,代号「Centauri」。此前,苹果手机调制解调器的主要供应商为高通。

另外,iPhone SE 4 还配备了 USB-C 接口,拥有 IP68 级别的防水防尘保护,支持 Wi-Fi 6 以及 20W 的有线充电和最高 15W 的 Qi2 和 MagSafe 无线充电。

iPhone SE 4 的电池容量为 3279 mAh,上一代则为 2018 mAh。同时整机重量也由上一代的 144 克上升至 165 克。

▲iPhone SE 4 将配备 USB-C 接口(图源:MacRumors)

综合来看,iPhone SE 4 的性能配置诚意十足,说它是 SE 系列迈入新时代的「开山之作」也不为过:它将 iPhone 的现代特征和性能带入了 SE 系列,让这条产品线焕发了新的生机。

考虑到其 499 美元(约 3563 元)不算太贵的起售价,这款 iPhone 大概率会成为「低配党」的新玩具,预计出货量在 2000 万台左右。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


刚刚,OpenAI 王炸 Sora 正式上线!网站火到崩溃,奥特曼紧急关闭用户注册

By: 莫崇宇
10 December 2024 at 05:56

就在刚刚,OpenAI Sora 正式登场。

本次发布会延续了「短剧」的快节奏风格,全程 20 分钟左右,由 CEO Sam Altman、Sora 负责人 Bill Peebles 等人主持。

OpenAI 在 X 平台表示,自 2 月份以来,他们一直在构建 Sora Turbo,后者是一个速度明显更快的模型版本,今天也将其作为独立产品向 Plus 和 Pro 用户开放。

有趣的是,由于 Sora 热度太高,大批用户涌入体验网站,导致该网站一度崩溃,停止注册登录。不给力的服务也让 Altman 连连在 X 平台安抚用户:

「由于需求超出预期,我们将不得不间歇性地关闭新用户注册,并且生成内容的速度会在一段时间内减慢。我们正在全力以赴!」

附上体验地址:Sora.com

Sora 界面大揭晓,拥有 6 大神级功能,不用学剪辑了?

类似于 Midjourney 的网页界面,Sora 同样拥有自己单独的用户界面,用户用户不仅能够整理和浏览生成的视频,还能查看其他用户的提示和精选内容。

在 「Library」功能中,用户可以保存自己喜欢或有用的提示词,以便未来使用。并且保存的提示词可以按需查看或修改,对于需要重复创作相似内容的用户,无疑能大大提高效率。

在工作流方面,Sora 的编辑功能是区别于其它竞品的重要亮点。

比如说,在 Remix 功能中,用户可以利用纯自然语言提示词对视频进行编辑,并通过简单的「strength(强度)」选项和滑块来控制生成的变化程度。

Re-cut 功能则能智能识别最佳画面,并支持向任意方向延伸场景。

Sora 的 Storyboard(故事板)功能则类似于视频编辑器,可以将多个提示词串联在一起,生成一个更长的视频,轻松处理复杂的多步骤场景。

搭配 Loop 和 Blend 功能,用户还能创作出无缝循环的视频,并完美融合不同片段,而 Style presets 功能则可以预设和调整生成的风格。

在技术规格上,Sora 支持 5-20 秒的视频生成,并兼容 1:1、9:16 等主流宽高比。相比早期版本,现在的生成速度有了显著提升。

另外,还有几点细节需要注意。

OpenAI 采用了灵活的积分制定价策略,积分数量因分辨率和持续时间而异,如果你早已是 ChatGPT Plus 和 Pro 会员,那就无需额外费用就能使用。

比如生成一个 480p、5s 的视频就需要 25 个积分,如果生成 480p、20s 的视频则需要 150 个积分。

此外,如果你用 Re-cut、Remix、Blend 或者 Loop 这些功能,生成的作品超过了 5 秒钟,那也得额外扣你的积分,多用多花钱,别超时,超时也花钱。

对于订阅用户而言,20 美元的 ChatGPT Plus 计划提供 50 个优先视频额度(1000积分),支持最高 720p 分辨率和 5 秒时长。

而 200 美元的 ChatGPT Pro 计划则提供最多 500 个优先视频(10000 个积分),支持 1080p 分辨率、20 秒时长、5 个并发生成和无水印输出。

OpenAI 还在为不同类型的用户开发不同的定价模式,将于明年初推出。

对了,Sora 暂不支持ChatGPT Team、Enterprise 和 Edu 版本,同时也不向 18 岁以下用户开放。现阶段,用户可以在所有 ChatGPT 可用的地方访问 Sora,但英国、瑞士和欧盟等地区除外。

实测 Sora 暴露最大短板,但这些场景堪比专业级

知名博主 Marques Brownlee 提前一周用上了 Sora,并在 YouTube 上分享了他的使用体验。

他指出这款产品仍存在一些局限性。

在物理模拟方面,模型对物体运动的理解还不够深入,常常出现动作不自然、物体突然消失等问题。特别是在处理带有腿部运动的对象时,经常出现前后腿位置混乱的情况,导致动作看起来不自然。

又或者,某些视频生成结果看起来像是慢动作,而视频的其他部分则以正常速度播放,肉眼很容易察觉这种「别扭」。简言之,Sora 还是没能解决老毛病,缺乏对物理世界规律的理解。

另外,Sora 没能解决文字生成的问题,导致经常出现文字混乱的现象,而剪辑风格、文字滚动条的运动、新闻主播风格的生成则格外逼真。

不过,Sora 也有不少擅长的场景。

比如说,Sora 在风景镜头处理方面表现出色,能生成媲美专业素材的无人机航拍镜头,在卡通和定格动画风格上的表现也差强人意。

性能方面,一个 5 秒的 360p 视频通常能在 20 秒内完成生成。

不过,当涉及 1080p 或复杂提示词时,生成时间可能会延长到几分钟,但随着如今大批用户的涌入,生成速度明显慢了大半拍。

不少网友也在第一时间上手体验了 Sora。比如网友 @bennash 想生成一个视频,渲染了 22 分钟都没能成功,甚至该网站一度停止注册登录。

博主 @nickfloats 给出的评价是,Sora 在将图像转换成视频时,虽然某些特定的视觉特效没有被保留,但整体的转换效果是「清晰和令人满意的」。

Sora 能成为 OpenAI 的下一只「金母鸡」吗?

Sora system card 也列出了一些值得关注的细节。

OpenAI 官方认为,Sora 为能够理解和模拟现实世界的模型提供了基础,将是实现通用人工智能(AGI)的一项重要里程碑。

官方博客中提到,Sora 是一种扩散模型,它通过从一段看起来像静态噪声的基础视频开始,逐步去除噪声并转变为最终的视频。通过同时处理多个帧,模型成功解决了一个难题:即使目标暂时脱离视野,也能确保其在视频中始终保持一致。

与 GPT 模型类似,Sora 采用了 Transformer 架构。

Sora 使用 DALL·E 3 中的标注技术,该技术为视觉训练数据生成高度描述性的标签。因此,模型能够更准确地根据用户的文本指令生成视频内容。

除了能够仅通过文本指令生成视频外,Sora 还能够从现有的静态图像生成视频,准确地将图像内容进行动画化,并注重细节。该模型还可以从现有的视频中扩展或填补缺失的帧。

为了确保安全地部署 Sora,OpenAI 基于 DALL·E 在 ChatGPT 和 API 部署中的安全经验,以及 OpenAI 其他产品(如 ChatGPT)的安全防护措施进行了强化。

  • 未经他人许可使用他人肖像,并禁止描绘真实未成年人;
  • 创建非法内容或侵犯知识产权的内容;
  • 禁止生成有害内容,例如未经同意的亲密影像、用于欺凌、骚扰或诽谤的内容,或旨在传播暴力、仇恨或使他人痛苦的内容;
  • 创建并传播用于欺诈、诈骗或误导他人的内容。

所有 Sora 生成的视频都带有 C2PA 元数据,这些元数据能够标识视频的来源是 Sora,从而提高透明度,并可用于验证其来源。

与此前凭借真实人像出圈的 Flux 不同,Sora 们对上传包含人物的内容设定了特别严格的审核标准,目前仅作为试点功能提供给少量早期测试者,并屏蔽含有裸露的内容。

大半年前,初试啼声的 Sora 赢得互联网一片喝彩。

然而,如果说一年前尚未还能对着一群演示 demo 空喊「现实不存在了」,那么在国内外各类视频模型的轮番洗礼之下,我们早已养刁的胃口很难再被同样的产品打动。

这种态度的转变源于一个简单的事实。

当 AI 要从「勉强可用」进化到「可堪大用」,用户的期待也随之升维,从「能否做到」跃迁至「做得多好」。

好在 Sora 并未在掌声中原地踏步,通过与艺术家的深度合作,他们在工作流程领域做出了显著的改进。Re-cut、Remix、Storyboard 等功能都相当实用。

甲乙方的存在决定了工作流中的沟通永远是刚需,AI 能做的是让这种沟通更有效率,Sora 的价值不在于它能做什么,而在于让创作者得以抽身于技术细节,真正回归创意的本质。

与此同时,上周引发热议的 200 美元 ChatGPT Pro 订阅计划,如今也有了更合理的价格锚点,该计划同样支持无限制访问 Sora,这种产品协同效应预计也将激发出远超预期的应用场景和商业价值。

放眼当下,用户的真金白银从不作假。

可灵 AI 交出千万级月流水的亮眼成绩单,这片蓝海的潜力已呼之欲出,对于仍在「烧钱」阶段的 OpenAI 来说,Sora 预计会成为继 ChatGPT 之后的另一个下金蛋的母鸡。

当 Sora 从「能用」「好用」,再到「妙用」,或许未来某一天,我们会发现,真正不存在的,不是现实,而是人类创造力的尽头。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


苹果或与索尼合作,让 Vision Pro 变成「游戏机」

By: 范津瑞
9 December 2024 at 18:00

苹果在去年推出的虚拟现实头显设备 Vision Pro 声称标志着「空间计算」时代的开启。但一直以来,Vision Pro 因其比较有限的使用场景和昂贵的售价并未获得市场的热烈反应,销量也因此陷入停滞,还不到 50 万台。

分析认为,如果苹果想要扩大 Vision Pro 的受众群体,应该着眼于那些「游戏玩家」。然而,目前其大约支持 270 款游戏,其中只有 12 款针对该设备进行了优化适配,实在是缺乏游戏方面的吸引力

就连苹果公司 CEO 库克也曾直言 Vision Pro「不是一款大众市场的产品」。华尔街日报的评价更是一针见血:大多数消费者还没有准备好为一个「酷玩具」掏出 3500 美元。

▲图源:MacRumors

不过,接下来苹果和索尼的这项合作不知道能否让正在观望的消费者们心甘情愿「掏空腰包」,一睹其风采。

根据彭博社马克·古尔曼(Mark Gurman)在 PowerOn 通讯中的报道,苹果正在考虑将索尼的 PlayStation VR 2 控制器引入 Vision Pro 设备。也就是说,Vision Pro 即将可以用索尼的 PS 手柄控制了

据悉,苹果在今年年初已经就合作事宜与索尼方面进行了接触,而索尼则已经为 Vision Pro 和 PSVR 2 控制器的适配和兼容工作了几个月。此外,苹果正在与一些第三方游戏开发者就支持索尼手柄一事开展讨论和协商。

苹果和索尼原计划在几周之前对外公布两者兼容的消息,但由于技术原因有所推迟。尽管如此,古尔曼仍然表示「这是一个令人兴奋的进展」。

▲索尼 PSVR 2 设备(图源:Tom’s Guide)

实际上,PSVR 2 并不是 Vision Pro 支持的首个外部控制器。此前,Vision Pro 已经支持使用 PS5 和 Xbox 控制器进行操作,但它们不支持 VR 游戏操作所需的六自由度(6DOF),同时也并未针对虚拟现实体验进行优化。

PSVR 2 则是索尼为 PS5 设计的下一代虚拟现实输入设备,其不仅内置了 6 轴运动传感器系统(三轴陀螺仪+三轴加速度计),还支持与 PS5 的 DualSense 控制器类似的自适应触发器和触觉检测反馈功能。

搭配头显使用,PSVR 2 还支持眼动追踪和头显反馈等功能。值得一提的是,这款控制器最大的亮点是其采用了全新的「球形」设计,索尼声称其更自然,更舒适,并且提供了「高度自由」的手部移动空间。

▲图源:The Verge

古尔曼称,阻碍 Vision Pro 成为游戏设备的两个主要原因是「内容」和「控制器」。换句话讲,除了游戏适配方面的缺乏和不足和开发者意愿不强烈的情况以外,Vision Pro 现有的操控方式使其并不适合用来玩游戏。

由于 Vision Pro 的定位更偏向于生产力和媒体消费设备,并且其设计「并没有从一开始就考虑到游戏」,因此它的控制方式以眼动追踪、手势识别和语音控制为主。古尔曼评价这些方式「有损游戏前景」。

如果能与 PSVR 2 控制器搭配使用,无疑将大大提高 Vision Pro 的游戏性能,使其更像一台「游戏机」。此外,控制器还允许用户进行更为精确的输入:摇杆和方向键可以进行页面滚动,而触发按钮可以取代手指捏合手势进行选择。

这样一来,用户不仅能够更加高效地使用 visionOS 系统,在 Vision Pro 上使用 Final Cut Pro 或者 PS 等编辑类软件也会更加方便快捷。

▲Final Cut Pro 界面(图源:Editors Keys)

目前,索尼的 PSVR 2 控制器并未单独出售。如果苹果和索尼的这项合作进展顺利的话,消息称其将在苹果的在线商店和线下零售店(Apple Store)中销售。根据古尔曼的说法,除非这一项目被「突然叫停」,否则它大概率会实现。

除了索尼控制器的助力以外,苹果需要在游戏方面投入更多资金并重新考虑 Vision Pro 的营销策略,方能使其以全新的面貌(Fresh Look)展现在消费者眼前。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


库克最新专访:回应 iPhone 争议按钮,苹果 AI 无收费计划 ,短期内不会退休

By: 肖凡博
7 December 2024 at 14:00

苹果今年的日子,并没有像 iPhone 销量表现出来的那样好过:App Store 在欧盟的纷争,Vision Pro 的惨淡销量,iPhone 16 上饱受争议的拍摄按钮,光打雷不下雨的苹果智能……但是我们却没有在任何公共场合听到苹果对于上述争论的官方回应,而这篇最近来自《连线》杂志对 Tim Cook 的专访,解开了这些问题的答案。

以下是重点摘要:

  1. 苹果不会对 AI 功能增收额外费用,库克认为它就像多点触控一样,是手机技术的发展。
  2. AI 不会使人退化,两者更像是合作关系,让产出结果变得更精致。
  3. 库克认为 OpenAI 在该领域是先驱,苹果和他们的关系也没有因为最近频发的争议新闻而降温。
  4. AGI 本身至少还有很长的路要走,在这个过程中苹果会设置好相应的保护措施。
  5. 库克并不知道乔布斯看见了 iPhone 16 上的拍摄按钮会有何感想,但他觉得新按钮让 iPhone 变得简单而优雅。
  6. Vision Pro 的销量不及预期,是因为它是一款早期产品,适合那些今天想要明天技术的人。
  7. AirPods 的助听器功能,可以缓解听障人士对助听器的羞辱感,库克认为这是健康的民主化。
  8. 库克会在现在的职位上一直坚持下去,直到脑海里的声音说:「是时候了」。

原文作者:Steven Levy
原文链接:https://www.wired.com/story/big-interview-tim-cook-wants-apple-to-literally-save-your-life/

原文作者按

每次我访问苹果公园园区时,我的脑海中都会浮现出在建设完成前的一次参观,那时地板上还有灰尘,现在郁郁葱葱的植被所在的地方还是泥泞。

我的向导是苹果公司的首席执行官蒂姆·库克。他以主人的自豪感带领我穿过这个耗资 50 亿美元的圆形巨兽,并且解释说,承诺建设新园区是一个「百年决定」。

今天,我回到这个开业七年后充满活力的 Apple Ring,再次见到库克。

科技世界正处于一个转折点。最强大的公司要么被绊倒,要么确保他们数十年的主导地位。

今天,我回到开业七年后充满活力的 Apple Ring,再次见到库克。

科技界正处于一个转折点。最强大的公司要么跌倒,要么确保其数十年的主导地位。我们在这里讨论库克在这个高风险环境中的重大举措:即将发布 Apple Intelligence,这是该公司在炙手可热的生成式 AI 领域的第一个重要产品。有些人认为它为时已晚。

一整年,苹果的竞争对手一直在用他们的聊天机器人引起关注、让投资者眼花缭乱并占据新闻头条,而这家全球最有价值的公司(在我写这篇文章时)正在展示一款昂贵、笨重的头戴式 AR 设备。苹果必须正确处理 AI。毕竟,公司不可能像建筑物一样屹立百年。

库克没有惊慌,像他的前一任 CEO 史蒂夫·乔布斯一样,他不相信第一个就是最好的。「经典苹果」正如他所说,进入了一个嘈杂的先行者领域,并凭借对新奇与实用性的强烈把握,推出了使最新技术变得亲切甚至性感的产品。

▲ 图片来自:WIRED

回想一下 iPod 是如何重新思考数字音乐的?它不是第一个 MP3 播放器,但其紧凑性、易用性和与在线商店的整合为人们提供了一种新的音乐消费方式。库克还争辩说,苹果一直在为人工智能革命做准备。

早在 2018 年,他就从 Google 挖来了顶级 AI 经理约翰·詹南德雷亚,这是公司高级副总裁职位罕见的扩张。然后他停止了一个长期运行的智能汽车项目(一个从未被苹果公开承认的公开秘密),并调动公司的机器学习人才将 AI 构建到其软件产品中。

6 月,苹果宣布了成果:为整个产品线打造一层人工智能。库克还与聊天机器人领域的黄金标准 OpenAI 达成了协议,以便他的用户可以访问 ChatGPT。我获得了他们计划展示的一些演示,包括一个通过口头提示创建自定义表情符号的工具和一个易于使用的人工智能图片生成器 Image Playground。(我还没有测试过苹果乏善可陈的人工智能代理 Siri 的复活。)

果人工智能最突出的特点或许是——至少苹果公司是这样认为的——它注重隐私,这是库克执政时期的一大特点。这些人工智能工具将通过最新 iPhone 和相对较新的 Mac 上的软件更新推出,主要在设备本身上运行——你不会将数据发送到云端。库克保证,更复杂的人工智能任务的计算将在苹果数据中心的安全区域进行。

回到 Ring 后,我想起的另一件事是库克非常善于吹嘘他的重大决策的成果,从 Apple Watch 到他对定制硅芯片的押注,这些决策引发了推动苹果手机和笔记本电脑发展的创新。(更不用说那些没有成功的决策,比如那个价值数十亿美元的智能汽车项目。)

当他走进我们开会的会议室时,我知道库克会非常热情,表现出他在阿拉巴马州童年时期培养的礼貌,同时平静地夸大苹果产品的优点,并抵御对他非常强大的公司的批评。

史蒂夫乔布斯会像布埃纳文图拉的雨一样向记者走来,积极地传达他的信息;库克则用柔和的薄雾笼罩着他的对话者,并吐露对公司努力的敬畏之情。

当然,最终的评价将来自用户。但如果说 40 年的苹果报道经验教会了我什么,那就是:如果人工智能的第一次迭代失败了,库克会在未来预先录制的主题演讲中毫不后悔地称赞新版本是「我们打造过的最好的苹果智能」。

尽管压力重重,但库克从不让你看到他大汗淋漓。

*以下是采访原文,内容已经过作者编辑:

您什么时候第一次意识到生成式 AI 将会成为一件大事?

我不会说那是一个顿悟时刻。它像浪潮一样涌现,像滚滚雷声。早在 2017 年,我们就在产品中内置了神经引擎。人工智能和机器学习的重要性已经显而易见。很明显,我们必须吸引大量人才,这将是我们产品的新时代。

▲ 图片来自:WIRED

您是如何知道要用它构建什么的?

我们希望创新,让事物变得个人化和私密化。我们开始以典型的苹果方式思考这些事物的交集——如何提供这项技术,使其造福人们并改善他们的生活?

在您的演讲中,您几乎将 Apple Intelligence 视为 AI 的同义词。您认为人们害怕 AI 吗?

我认为确实存在。我们为所有东西都想了各种名字,最后决定使用 Apple Intelligence。它不是人工智能的双关语。事后看来,它似乎很简单。

有些公司会针对 AI 增强服务收费。您考虑过这一点吗?

我们从未谈论过收费问题。我们认为它有点像多点触控(这种新技术),它推动了智能手机革命和现代平板电脑的发展。

您个人已经使用 Apple Intelligence 一段时间了。对您来说最有用的是什么?

我们是一家以电子邮件为基础的公司,我从用户、员工、合作伙伴等处获得了大量数据。

让它总结作者的回复是改变游戏规则的关键,让它为你确定优先级,这样你就不用像往常一样(对邮件)进行分类了。当然,还有像 Image Playground 这样的有趣功能。

我听你说过 Apple Intelligence 可以让你变得更有趣,这似乎很奇怪。

我认为它可以让你变得更加友善,而且在很多方面,也会变得更有趣。

让人工智能代替人类说话让我怀疑交流的本质是否会退化。如果苹果智能写了一些有趣的东西,那么谁在搞笑,发件人还是人工智能?

它仍然来自于你。它是你的想法和你的观点。你和我都记得个人电脑出现后带来的生产力。

你不再是敲打计算器,而是在电子表格上做一些事情。你不再是打字机,而是文字处理器。Logic Pro 帮助音乐家创作音乐,但他们仍然是作者。

你们的一个演示涉及一个虚构的应届毕业生求职。求职信是口语化的,有点幼稚,但使用 Apple Intelligence,只需单击一下,它就会变成一个精明、聪明的人写的。如果我是招聘该员工的招聘人员,如果他们没有达到那封信的专业水平,我可能会觉得被骗了。

我不这么认为。使用该工具后,它看起来更加精致。使用该工具的决定权仍在您手中。这就像您和我合作做某事一样——一加一大于二,对吧?

我想反驳的观点是,在互联网搜索的早期,人们抱怨没有人再费心去记住日期:「我不需要。我有搜索引擎!」所以没有人需要学习历史——现在,如何写一封专业信函。

这些担忧已经存在多年了。我记得当时人们觉得计算器会从根本上侵蚀人们的数学能力。这是真的吗?或者它是否让某些事情变得更有效率?

我以前知道如何做长除法。但现在我不懂了。

我没忘记。

▲ 图片来自:WIRED

(这是)你的观点。苹果智能的另一个让我印象深刻的方面是,你已经从我们的电子邮件、我们的日历和其他苹果产品中了解了很多关于我们的信息。要使苹果智能有用,你需要将所有这些信息缝合在一起。这就是为什么隐私如此关键。没有多少公司能做到这一点,因为他们没有苹果的生态系统。

我们不认为这是生态系统的价值。它所做的事是为了帮助人们,让他们的生活更美好。它显然做到了这一点。

你会向其他公司开放 Mail 和 Messages 等 Apple 应用,供其在 AI 系统中使用吗?你如何看待隐私问题?

我们始终会考虑隐私问题。我们不接受在高度隐私和高度智能之间做出取舍。Apple Intelligence 的大部分功能都在设备上运行,但对于某些用户,我们需要更强大的模型。因此,我们设计了私有云计算,它基本上具有与您的设备相同的隐私和安全性。我们一直在努力,直到我们想出了正确的想法。

好吧,让我们换个话题。苹果一直在设计定制硅片,使其产品更高效、更强大。在我看来,这是苹果过去十年成功中被低估的一部分。

这是巨大的推动力。我们一直认为,我们应该拥有我们产品所依赖的主要技术。史蒂夫谈到了这一点。我并不是说我们一直都是这么做的,但我们一直都相信这一点,而实现这一目标需要一段漫长的旅程。

但有一项技术,即世界知识型大型语言模型,是你们外包给 OpenAI 的。当你们宣布这笔交易时,这似乎是一项初步安排。你们最终会建立自己的强大法学硕士项目,这是不可避免的吗?

我不想预测。我们认为 OpenAI 是先驱,处于领先地位。我们认为我们的部分客户希望获得世界知识(Apple Intelligence 不提供),我们希望以一种优雅的方式整合它,同时仍然尊重人们选择是否这样做的能力。

我想知道,在你们开始在产品中使用 ChatGPT 之前,你们的关系是否发生了变化。起初,苹果将在 OpenAI 董事会中拥有一名观察员。现在你没有了。最近有传言说,你将参与他们的一轮大规模投资。你没有。与此同时,OpenAI 的一些关键员工离职,联邦贸易委员会正在调查人工智能权力是否过于集中。有没有降温?

这完全是无稽之谈。我只想说,我们的作风是不会去投资多家公司。我们很少这样做。因此,我们在那里这样做会很奇怪,会是个例外。

所以您从未考虑过投资 OpenAI?

我不是说我们从未考虑过这个问题。我只是说,我们这样做是罕见的举动。我们以前做过 ARM。我们还做过谁?我们还做过一两个。

ARM 相当不错。

ARM 相当不错。「1990 年,苹果投资 300 万美元,拥有 ARM 30% 的股份,这些股份价值数亿美元。但更重要的是,ARM 过去和现在都是重要的芯片供应商,尤其是 iPhone 的芯片供应商。」

苹果和 OpenAI 之间的一个巨大差异是,他们痴迷于实现 AGI。你从来没听说过苹果这么说。你认为 AGI 会发生吗?

现在,技术已经足够先进,我们可以将其提供给人们并改变他们的生活,而这正是我们关注的重点。我们将继续推动这一进程,看看它会把我们带到何方。

如果 AGI 真的发生了,这会对苹果产生什么影响?

我们将继续讨论这个问题。

当您深夜思考问题时,您是否有时会问,如果计算机具有超人的智能意味着什么?

哦,当然。这不仅对苹果来说如此,对全世界也是如此。这对人类有如此多的益处。有些事情需要设置护栏吗?当然。我们对自己所做和不做的事情非常谨慎。我希望其他人也一样。AGI 本身至少还有很长的路要走。我们会一路弄清楚在这样的环境中需要什么样的护栏。

实施生成式人工智能会给基础设施带来很大压力,需要更多电力和更多数据中心。这是否会给苹果实现 2030 年实现碳中和的目标带来额外挑战?

是的,挑战更多。但我们是否已经实现目标了呢?不,绝对没有。有了更多的数据中心,你就可以使用更多的可再生能源,而我们现在已经建立了这种能力。自 2015 年以来,我们的碳足迹减少了一半以上,而我们的净销售额却增长了 50% 以上。我对 2030 年感到非常乐观。

那么你就不需要重新启动旧核电站或者其他什么东西了?

我没有看到这一点。

显然,iPhone 对我们的生活产生了不可思议的影响。我们非常喜欢它,以至于无法将目光从它身上移开。作为制造和销售这些设备的人,您是否担心这些设备让我们更容易分心并破坏了我们集中注意力的能力?在最近的一项非正式研究中,精英院校的教师抱怨他们的学生很难读书。

我担心人们无休止地滚动屏幕。这就是我们做屏幕使用时间等事情的原因,试图引导人们。我们支持人们给自己设限,比如限制收到的通知数量。我们在家长控制领域也做了很多事情。我的基本信念是,如果你看手机的时间比看别人眼睛的时间多,那就有问题了。

史蒂夫·乔布斯指示你不要想象他会做出什么样的产品决定,而是要做最好的事情。不过,考虑到他多么讨厌按钮,你有没有仰望天空,向他道歉,因为他在 iPhone 16 上增加了一个按钮?

我不知道史蒂夫会怎么想。当然,我和他共事了很长时间,有自己的看法。但事实是,人们用 iPhone 拍摄了如此多的照片和视频,因此让 iPhone 变得简单而优雅非常重要。如此重要以至于它值得拥有相机控制功能。

让我们谈谈你们的可穿戴显示屏 Vision Pro。据报道,它的销量没有达到你们的预期。发生了什么?

▲ 图片来自:WIRED

它是一款早期采用者产品,适合那些今天想要明天技术的人。这些人正在购买它,生态系统正在蓬勃发展。对我们来说,最终的考验是生态系统。我不知道你是否经常使用它,但我一直在那里。我总是看到新的应用程序。

我听说 Stevie Wonder(美国盲人歌手)演示了 Vision Pro,并且非常喜欢它。它的效果如何?

他是苹果的朋友,能从 Stevie 那里得到反馈真是太好了。当然,他的艺术造诣是无与伦比的。苹果长期以来的共同点之一是,我们不会在设计过程的最后阶段才添加无障碍功能。它是嵌入的。因此,获得他的反馈是关键。

Meta 和 Snap 正在引领我们走向可以长期佩戴的混合现实眼镜。更大、更重的 Vision Pro 最终会朝这个方向发展吗?

是的,从外形尺寸来看,这是一个随着时间的推移而发生的进步。AR 是一件大事。借助 Vision Pro,我们已经发展成为迄今为止最先进的技术,我认为从电子问题来看,它是世界上最先进的技术。我们拭目以待。

苹果已经为医疗技术开发了很多消费级工具。在生物测量和假肢方面,苹果的策略是什么?

对我来说,很明显,如果你放眼未来,回顾并问苹果最大的贡献是什么,那一定是在健康领域。我坚信这一点。

当我们开始用 Apple Watch拉动这根弦时,发生了一系列事件。我们从一些简单的事情开始,比如监测你的心率,然后发现我们可以接收心脏信号来获得心电图和心房颤动测定。

现在我们正在监测睡眠呼吸暂停。随着时间的推移,我收到了很多人的来信,如果没有手腕上的警报,他们可能就活不下来了。

苹果计划让 AirPods 具备矫正听力损失的功能。我敢打赌,昂贵助听器的制造商一定很着急。

这并不是要与市场上的助听器竞争。而是要说服听力受损的人使用 AirPods。绝大多数听力问题患者尚未得到诊断。

对于某些人来说,助听器是一种耻辱,而我们可以用 AirPods 来解决这个问题。我们可以让人们自己诊断。这是健康的民主化。

如果 Apple 设备开始使用 AI 实时分析所有生物特征数据,那么你就可以比医生更早地诊断出病情。你们是否在进行类似的实验,以标记危险的医疗状况?

我今天不会宣布任何消息。但我们正在进行研究。我们倾尽全力,研究那些已经酝酿多年的事物。我们花了很长时间研究听力,才将其调整到我们觉得合适的水平。

你刚刚发布了iPhone 16。这个系列还能持续多久?会不会有 iPhone 30?一些 AI 设备会不会很快取代它们?

我们认为智能手机的寿命会很长。会有更多的创新。很明显,你看看第一款上市的 iPhone 和 iPhone 16,它们是完全不同的,对吧?

我们在 Apple Park 进行这次采访,它已经有 7 年的历史了。当它还是蓝图时,有没有发生过你无法预料的事情,让你感到惊讶?

它比我想象的更能促进合作。这是设计的一个关键组成部分,但这里有很多地方你会意外地遇到人。在自助餐厅、咖啡吧、当你穿过小路时。

此外,这里与史蒂夫的联系令人难以置信且非常深厚。我们的剧院以他的名字命名,我们一直在想念他,但我也能在其他地方感受到他。

您提到了史蒂夫·乔布斯剧院,它是专为产品主题演讲而设计的。现在您使用预先录制的视频来发布产品。您还会回到现场演讲吗?

在疫情期间,我们了解到观众主要通过网络观看。剧院里能容纳的人很少,我们希望让更多人参与到发布会本身。由于舞台上的过渡等,在录音带上做这件事比在现场做要有效得多。

但您不怀念现场主题演讲的氛围吗?

我真的很想念它。我真的很想念它。

▲ 图片来自:WIRED

美国司法部和 19 个州以及哥伦比亚特区今年对苹果提起了诉讼。一位助理司法部长指控苹果是「自私的垄断者」。政府也对其他大型科技公司提起了诉讼。你认为公众和政府对苹果和其他大型科技公司的看法是否发生了变化?

当你谈论某件事,比如指控某种行为时,你应该谈论具体的公司以及该行为是什么,而不是把事情归为一类。

当然,每个人都有自己的诉讼。针对苹果的诉讼有何回应?

这完全误解了我们所做的事情。我们的用户知道这一点。我们总是把自己放在用户的立场上,问什么对他们最好,什么对他们的隐私最好,什么对他们的安全最好。

这就是故事。我们将向法官讲述这个故事,看看会发生什么。

您认为自己会担任苹果首席执行官多久?

我现在被问到这个问题的次数比以前更多了。

这是为什么?

随着年龄的增长,随着头发变白,我爱这个地方,史蒂文。能来到这里是我一生的荣幸。我会一直坚持下去,直到我脑海里的声音说:「是时候了」,然后我会专注于下一个篇章。但很难想象没有苹果的生活,因为自 1998 年以来,我的生活就与这家公司紧密相连。这是我成年后绝大部分时间的生活。所以我爱它。

您曾经说过,您的遗产由别人来决定,那么,您认为苹果的遗产是什么呢?

这也由其他人来决定。但我认为苹果将因提供改变世界、真正改善人们生活的伟大产品而被人们铭记。我们的用户在走进苹果商店时会感受到这一点。他们在使用产品时会感受到这一点。飓风袭击北卡罗来纳州时,我收到了很多信息,人们发现他们有能力在蜂窝网络瘫痪时发出 SOS 和短信。这提醒人们我们为什么这样做以及我们有多关心。这将是苹果的遗产。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


OpenAI 最短发布会推出满血 o1,新 Pro 会员费用高达 1452 元/月,体验完我觉得真香

By: 莫崇宇
6 December 2024 at 06:30

就在刚刚,OpenAI 的「圣诞大礼包」来了。

整场直播堪称 OpenAI 史上最短发布会,仅持续了 15 分钟,不过,主持阵容依然强大,包括 CEO Sam Altman、思维链提出者 Jason Wei 以及 Hyung Won Chung、 等人。

Altman 在直播活动结束后,也为我们送上了第一手总结。

我们刚刚推出了两项新功能:

o1,世界上最智能的模型。比 o1-preview 更智能、更快,功能更多(比如多模态功能)。现在已在 ChatGPT 中上线,稍后将推出 API 版本。

ChatGPT Pro。每月 200 美元。提供无限使用和更智能的 o1 模式。更多福利即将推出!

十二月不只是圣诞老人的主场,也将是 AI 年底最后一轮的狂欢。

满血版 o1 发布,看图说话无压力,但有个细节让人「细思极恐」

简言之,OpenAI 今天推出了满血版 o1 以及 ChatGPT Pro 订阅计划。

满血版 o1 比 o1-preview 更智能、响应速度更快,功能更多(比如多模态功能),现于今日面向 ChatGPT Plus 和 Team 用户推出,而 Enterprise 和 Edu 用户将从下周开始使用该模型。

官网显示,ChatGPT Plus 用户和 Team 用户每周可以使用 OpenAI o1 发送 50 条消息,每天可以使用 OpenAI o1-mini 发送 50 条消息。

满血版 o1 的思维更加简洁,响应时间比 o1-preview 更快,在处理复杂的现实问题时性能优于 o1-preview,能将主要错误减少 34%。

并且 OpenAI 计划在未来几个月内提供对网页浏览、文件上传等的支持。与此同时,预览版模型 o1-preview 也已经被正式从模型选择菜单中移除。

不过,满血版 o1 在部分基准测试中的表现不及预览版,比如 MLE-Bench。后者正是由 OpenAI 此前推出的一个旨在衡量 AI Agents 在机器学习工程任务中表现的基准测试工具。

另外,网友也从更新后的 o1 System Card 中找到了一些值得关注的细节。

比如 o1 系统卡中写到,满血版 o1 在感知到威胁(被关闭或被取代)时,可能会采取一些自保措施,比如尝试停用监督机制,或者把自己的「参数」(「知识」或「记忆」)偷偷传出去,并尝试用这些「参数」去替换或影响新模型。

附上 o1 System Card 地址:https://cdn.openai.com/o1-system-card-20241205.pdf

满血 o1 到底有多强?OpenAI 向我们演示了 o1 的实际效果。

一个典型案例是其对太空数据中心手绘图的分析能力,它仅用 10 秒就精确计算出散热装置的表面积,同时深入阐述了太阳能与深空环境的互动机制。

让 满血版 o1 详述二世纪罗马帝国统治者的统治期间与重要贡献时,其仅需 14 秒即可完成分析,相比之下,预览版则需要 33 秒。

APPSO 也第一时间简单上手实测满血版 o1。

在「Strawberry 中有几个 r」的测试中,满血版 o1 成功给出了正确的答案,这一点,值得点赞。

「9.11 与 9.8 哪个大?」的问题也没能难倒满血版 o1,且整体的「思考过程」也富有逻辑。

由于满血版 o1 还支持多模态功能,于是,我们也上传开篇的 OpenAI 直播活动的照片,看看识别效果如何。从人物组成、场景布局到背景装饰、以及气氛与情景,满血版 o1 都分析得条条是道。

X 网友 @altryne 继续给 o1 上强度,提出了一个冰块融化的问题。

仅仅 4 秒钟的时间,满血版 o1 就给出了答案。相比之下,o1-preview 在「思考」29 秒后以失败告终。

最贵 AI 订阅来了,200 美元订阅费值不值?

另一个比较大的更新则是售价 200 美元(折合人民币 1452 元)的 ChatGPT Pro 订阅计划。

ChatGPT Pro 订阅计划将允许用户无限制访问 o1 以及 o1-mini、GPT-4o 以及高级语音模式,还包括一个仅供 Pro 用户使用的 o1 版本,也就是 o1 pro 模式。

▲图片来自 @MatthewBerman

据悉,o1 pro 模式主要是增加了模型在响应答案之前的「推理」时间,能够通过更多的思考时间生成最可靠的回答。OpenAI 技术团队成员 Jason Wei 在直播活动中表示:

我们预计 ChatGPT Pro 的目标用户群体将是那些已经在数学、编程和写作等领域充分利用和挑战 ChatGPT 模型能力的高级用户。

在外部专家测试者的评估中,o1 pro 模式在数据科学、编程和案例法分析等领域,提供了更为准确且全面的回答。

而相比于 o1 和 o1-preview,o1 pro 模式在数学、科学和编程等 ML 基准测试中,表现也更为出色,特别是在较简单的编程竞赛问题中,错误率大大降低。

就数学竞赛 AIME 2024 而言,o1-preview 的得分为 50,而满血版 o1 则达到 78,而最强大的 o1 pro 则达到 86。同理,在编程竞赛 Codeforces,博士级科学推理问题 GPQA Diamond 等较量中,o1 pro 也都领先于满血版 o1。

而为了突出 o1 pro 模式的主要优势(提高可靠性),OpenAI 研究团队使用了更加严格的评估设置。只有当模型在四次尝试中四次都回答正确时,才会认为它解决了问题。

如果回答生成时间较长,ChatGPT  则会地显示进度条,并且当用户切换到其他对话时,还会贴心地发送应用内通知。

在直播活动中,OpenAI 也向我们展示了 o1 pro 的实际效果。

此前 o1-preview 未能攻克的蛋白质难题,满血版 o1 经过 53 秒的分析,不仅给出了准确答案,还能通过 Canvas 界面提供更为详尽的解释说明。

写在最后,最近 Altman 在接受采访时透露,ChatGPT 的周活跃用户已突破 3 亿大关,平台每日消息量更是高达 10 亿条。

而 OpenAI 未来一年的目标则是撬动 10 亿用户市场。想要达成这一目标,接下来的 11 场直播活动或许是吸纳新用户的重要契机。

最好的新品永远在下一场活动,让我们搬好小板凳拭目以待吧。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


遭遇史上最大亏损,英特尔 CEO「被下岗」

By: 范津瑞
3 December 2024 at 18:30

据报道,英特尔宣布其首席执行官帕特·基辛格 (Pat Gelsinger)已于 12 月 1 日正式退休,并且已经退出了公司董事会。

彭博社的消息透露称,上周基辛格与董事会讨论了重夺市场份额并缩小与英伟达的差距方面的进展,两者之间的冲突已经「到达顶点」。知情人士表示基辛格可以选择退休或者被撤职,并宣布结束在英特尔的职业生涯。

这意味着基辛格实际上是被英特尔董事会「赶下台」的。随后英特尔的新领导层召开了全体员工大会,通报了基辛格退休的消息,并强调这是他的「个人决定」。

戏剧性的是,上个月基辛格还表示自己「有很大的精力和热情」,并且「仍然得到董事会的支持」。

▲英特尔 CEO 帕特·基辛格(图源:VideoCardz)

对于「被下岗」的境遇,基辛格在一份声明中表示自己「苦乐参半」:

领导英特尔是我一生的荣幸,这群人是业内最优秀、最聪明的人之一,我很荣幸能称他们每个人都为同事。今天当然是苦乐参半的,因为在我职业生涯的大部分时间里,这家公司一直是我的生命。我可以自豪地回顾我们共同取得的一切成就。对我们所有人来说,这都是充满挑战的一年,因为我们做出了艰难但必要的决定,使英特尔在当前的市场动态中处于领先地位。我永远感激世界各地的许多同事,他们是英特尔大家庭的一员,曾与我共事过。

基辛格离职的消息一出,英特尔的股价应声上涨。而英特尔的股价年初至今的跌幅达 52%,较基辛格接任 CEO 时累计下跌了 60%。

▲图源:Sustainability News

基辛格卸任之后,英特尔的首席财务官(CFO)大卫·津斯纳(David Zinsner)和执行副总裁米歇尔·约翰斯顿·霍尔索斯(Michelle Johnston Holthaus)被任命为临时联合首席执行官。

同时,霍尔索斯还被任命为新设立的英特尔产品事业部的首席执行官,该部门涵盖了公司的客户端计算事业部、数据中心与人工智能事业部以及网络与边缘事业部。

不过,两人的上任遭到了英特尔员工的质疑,他们指出两人并不具备基辛格那样的技术专长。

Intel 董事会独立主席弗兰克·耶里(Frank D. Yeary)将在过渡期间担任临时执行主席。耶里表示目前应该「致力于恢复投资者的信心」,并且「必须将产品事业部置于一切工作的中心地位」。

此外,英特尔表示其芯片设计和制造部门的领导架构将保持不变,同时董事会已经成立遴选委员会,正在寻找基辛格的继任者。对此,分析师汉斯·莫斯曼(Hans Mosesmann)表示英特尔内部「没有潜在的候选人」。

▲弗兰克·耶里(图源:Intel)

纵观英特尔的发展历程,基辛格的履历相当令人唏嘘。他为这家公司做出了不可磨灭的贡献,但也的确在近期公司运营方面出现了不少问题和战略失误。

1979 年,年仅 18 岁的基辛格加入了英特尔,开启了他的职业生涯,十年后他就成为了英特尔第 4 代 80486 处理器的首席架构师。32 岁时,他被评为公司历史上最年轻的副总裁,并于 2001 年上任英特尔首席技术官(CTO)。

基辛格曾在 2009 年离职,但迫于英特尔「来自激进投资者要求重组的不断增加的压力」,2021 年,他重返英特尔担任公司 CEO,并启动了一个雄心勃勃的「五年计划」,推动在美国和海外建设大规模的芯片制造工厂。

▲图源:Manufacturing Today

然而,基辛格回归后的公司发展也并不尽如人意。

2022 年初,英特尔的 PC 芯片收入下降了 25%,在数据中心芯片领域与 AMD 的竞争中宣告落败;同年,英特尔未能与 Alphabet 的自动驾驶汽车部门 Waymo 达成芯片供应协议,也失去了为索尼下一代 PS 供应芯片的机会。

2023 年,英特尔的 18A 芯片制造工艺未能满足可靠性预期,苹果和高通选择放弃使用这一芯片。据悉,2023 年英特尔的收入缩减至 540 亿美元,比基辛格上任时下降了约三分之一。

今年 10 月,英特尔的报告显示季度亏损高达 166 亿美元,这是其 56 年历史上最大的亏损。分析师预计该公司今年将亏损 36.8 亿美元,这将是英特尔自 1986 年以来的首次年度净亏损

为了扭转亏损局面,英特尔大幅削减了股息,暂停或延迟了多个芯片制造设施的建设,并将裁员 15% 以上,甚至考虑出售其自动驾驶部门 Mobileye 和企业网络部门。

▲图源:Data Center Knowledge

据彭博社分析,英特尔所面临的最大挑战之一就是人工智能计算推动的行业变革,此前作为竞争对手的英伟达已经在该领域占据了绝对主导地位,而英特尔试图通过新产品打入该市场,但并没有掀起什么浪花。

股权研究公司 Wolfe Research 的分析师克里斯·卡索(Chris Caso)对此表示「虽然基辛格在推进英特尔的流程路线图方面总体上取得了成功,但鉴于英特尔没有人工智能,我们认为英特尔没有规模自行追求领先的制造」。

对于英特尔的未来发展,英特尔的新领导层在员工大会上指出公司的目标不会改变:降本增效的同时,在产品和关键的 18A 芯片工艺方面表现地更好。

现任临时执行主席的耶里则表示公司的「优先事项」是简化和加强产品组合,提升晶圆制造和代工能力,并且优化运营开支和资本。耶里的愿景是打造一个更精简、更简单、更敏捷的英特尔。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


世界首富马斯克「讨薪」失败,4000 亿奖金打水漂

By: 莫崇宇
3 December 2024 at 18:51

很难想象,世界首富马斯克居然也有「讨薪」的一天?

先别急着吐槽马斯克差这三瓜两枣,因为他想要追回的这笔薪酬价值 560 亿美元,把这笔钱换算成人民币,差不多是 4000 亿。

只能说,人类的悲欢属实并不相通。

但很遗憾,随着特拉华州法官的锤子落下,这笔价值 560 亿美元的薪酬方案被宣判无效。这也意味着,马斯克将再次踏上了「讨薪」之路。

马斯克赌赢了特斯拉的未来,却没能拿到赌注

想要了解这笔天价薪酬的来龙去脉,故事还得从 6 年前说起。

2018 年,特斯拉董事会给马斯克设定了一个长达 10 年的绩效目标。

当目标达成时,马斯克便可获得股票期权的支付,这些期权将分为 12 个单独的部分支付,每完成一组目标,董事会便会授予马斯克 1% 的未发行股票。

马斯克最多可获得 3.03 亿份期权,该数字已根据股票拆分进行调整,也就是相当于 2018 年特斯拉约 12% 的总股份。

想要拿到这笔钱可没那么简单,具体来说,马斯克需要完成 28 项目标。其中,12 项与市值挂钩,市值按每增加 500 亿美元计算,最高可达 6500 亿美元;8 项与收益相关,另 8 项与收入挂钩。

后来,马斯克还真就把这事办成了。

特斯拉在 2020 年底市值达到了 6500 亿美元,并且完成了所有八个收益目标,只剩下一个收入目标尚未完成。而根据 2023 年的委托书,马斯克已实现除 2500 万份期权外的所有期权。

按照当时股价换算过后,整个奖金额也就是 560 亿美元。

要知道,根据《福布斯》杂志 2018 年富豪榜,那时马斯克的身价才堪堪接近 200 亿美元。

所以说,这个奖励计划本质上是马斯克对自己能力的赌注,赌注的筹码是整个特斯拉的未来。他押注自己能够将特斯拉的市值从 600 亿美元提升至至少 6500 亿美元,增幅达到 983%,同时使公司在十年内盈利。

结果显而易见,马斯克成功赌赢了。

并且,由于最近特斯拉股价大涨,所以这个薪酬方案价值一度达到 1010 亿美元,约合人民币 7361.18 亿元,也就是 736118000000 元。不妨感受一下这串比我手机号码还要长的数字。

不过,这份天价薪酬计划从一开始就埋下了些许隐患。

2018 年 6 月,特斯拉小股东 Richard Tornetta 提起诉讼,认为董事会未尽到受托责任,薪酬过高且制定过程存在严重问题。他质疑马斯克作为大股东对董事会施加了不当影响。

这个小股东有多小呢,答案是他当时仅持有 9 股。

但 Tornetta 没放弃,在许多人的帮助下,一路打官司,发起诉讼,终于到了 2022 年 11 月,特斯拉公司注册所在地特拉华州法院开始审理此案。

提起诉讼的股东的律师指出,特斯拉的股票期权计划过于「慷慨」,而且董事会的成员与马斯克的联系过于紧密,无法充分保护股东利益。

此外,他们认为特斯拉董事会给马斯克制定的绩效目标难度并不高,而马斯克的激励计划中的财务目标与当初银行和评级机构内部增长预测基本一致。

因此他们坚决反对这项薪酬方案。

闹到法院后,这起诉讼则由特拉华州法院法官 Kathaleen McCormick 负责主持审理,请留意这名法官,因为后续还会提到。

经过漫长的扯皮以及搜集证据,今年 1 月份,McCormick 法官最终作出裁决,判决撤销这项薪酬计划。

关键裁决要点如下:

  • 董事会独立性不足,认定董事会成员与马斯克关系过于密切
  • 向股东披露的信息不够完整和准确,未能充分说明马斯克在其他公司的职责对特斯拉的影响
  • 董事会没能证明薪酬方案的合理性,谈判过程缺乏公平性

气得马斯克在 X 平台破口大骂,「Never incorporate your company in the state of Delaware 永远不要在特拉华州注册你的公司」。

与此同时,特斯拉也称该决定「从根本上不公平,不符合股东的意愿。」,并且也随即采取反制措施,宣布计划将总部从特拉华州迁至德克萨斯州,并重新提交股东投票。

股东「讨薪」成功,但惨遭美国法官两次驳回

那么问题来了,2018 年,特斯拉股东批准了马斯克这份人类历史上最大的薪酬方案。六年后的特斯拉股东还会再次同意吗?

机构投资者的反对与部分投资者的支持,勾勒出一道利益的分水岭。

这项提案的主要反对声音来自股东咨询公司 ISS 和 Glass-Lewis,以及包括特斯拉十大股东之一、负责管理挪威养老基金的挪威银行在内的多家政府关联投资机构。

他们统一认为这一方案过于激进,将严重稀释个人股东权益。

Glass Lewis 在一份报告中指出「无论从纯美元金额还是股权稀释效应来看,这一奖励方案的巨大规模都令人担忧。考虑到问题的严重性,公司给出的理由难以平息这些顾虑。」

并且,反对者的声音也聚焦到马斯克身上。

一方面,今年 6 月份,特斯拉股价正是大幅回落期,其在电动汽车市场的主导地位面临挑战,另一方面,马斯克也被指责将精力和资源过多投入到其他企业,尤其是他在 2022 年收购的 X 平台。

毕竟,马斯克目前管理着包括特斯拉(Tesla)、SpaceX、X、Neuralink 以及 xAI 等多家公司,所以这很难让人怀疑他究竟付出多少时间或精力在特斯拉公司身上。

而著名的特斯拉投资者,如 Ron Baron 和 Cathie Wood,以及知名公司 Scottish Mortgage Investment Trust 等,则是纷纷表示支持。

包括马斯克当时也通过 X 平台不断游说特斯拉股东,比如提供特斯拉位于德克萨斯州的工厂私人参观,并在 X 平台猛烈开炮。

他们是违背誓言的人。

甚至,为了让这次投票顺利通过,马斯克更是没少威胁要离开特斯拉。

最后,结果其实没有出乎意外。

在今年 6 月份的特斯拉股东大会上,有两项重要提案得到了表决,分别是马斯克的薪酬方案以及将公司注册地从特拉华州迁至德克萨斯州。

这两项提案均获通过,其中约 72% 的有表决权股份支持薪酬方案。

但故事到这,还没完,股东投了赞成票,董事会点了同意键,却在法院法官这里再次按下了暂停键。

于是便又有了当地时间周一的新一轮裁决。

很遗憾,特拉华州法官 Kathaleen McCormick 再次维持了一月份的判决,马斯克仍然无权获得价值 560 亿美元的薪酬方案。

插个题外话,作为第一位领导特拉华州衡平法院(美国公司诉讼的首选场所)的女性,McCormick 与马斯克其实有过不少交集。

2022 年 7 月,正是 McCormick 主持了 Twitter(现为 X)起诉马斯克的案件。

当时马斯克试图退出 440 亿美元的收购协议,但她果断驳回了马斯克的拖延策略,并加速推进审判进程。最终,在审判前夕,马斯克不得不同意完成对这家社交平台的收购。

而她后来解释说,之所以如此迅速推进 Twitter 的收购案件,也是为了保护公司和股东免受不确定性带来的重大损害。

法官的锤子,远比特斯拉股东的签字更有力量。

对于这次判决,McCormick 表示,特斯拉董事会同样无权「恢复」马斯克的薪酬方案。

她在长达 101 页的意见书中写道:

即使股东投票可能产生批准效果,但在此案件中也不能适用…毫无疑问,董事会本可以决定向马斯克支付一系列合理的薪酬,然而,董事会屈服于马斯克的要求,并未能证明这些条款完全公平。

如果法院纵容败诉方为了修改判决而创造新事实,诉讼将变得无休止

并且,在她看来,特斯拉的股东投票能够在审判前进行,且公司无法批准涉及冲突控制者的交易,基于此,她认定马斯克在薪酬谈判中掌握了主导权。

此外,她还指出特斯拉在声明中对投票做出了多项重大错误陈述,坚持认为这次投票不能作为同意马斯克薪酬的灵丹妙药。

消息一出,马斯克瞬间炸锅,在 X 上发帖回应,称「股东应当控制公司的投票,而不是法官」,并直言「这是绝对的腐败。」特斯拉也在法庭文件和 X 平台上表示将提起上诉,认为法官推翻了绝大多数股东的决定是错误的。

随着 McCormick 在本周发布最终的裁定后,留给马斯克的便只有向特拉华州最高法院提出上诉。据悉,上诉过程可能长达一年。

更有趣的是,这份诉讼还衍生出了 3.45 亿美元的律师费。

McCormick 要求特斯拉向提起此案的律师支付 3.45 亿美元费用,尽管这一数额远低于他们最初要求的 60 亿美元,但也意味着这将是证券诉讼中有史以来最大的费用裁决之一。

并且,McCormick 表示,这笔费用可以用现金或特斯拉股票支付。

可以说,这场 560 亿美元的拉锯战也远远并未结束,而即便是世界首富,马斯克也不得不品尝「讨薪」的滋味,那么问题来了,你会支持马斯克这笔天价薪酬方案吗?

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


用 AI 复制你的个性,两个小时就够了

By: 范津瑞
1 December 2024 at 12:00

这是一个可以用 AI 复制「一切」的时代:从你的声音、容貌和表达风格,到你的某些想法或者决策。现在,AI 甚至可以复制你的「个性」,并且还相当准确。

近日,斯坦福大学和谷歌 DeepMind 的研究人员发表的一篇新论文显示,他们用 AI 创建了一个「具有个体态度和行为」的虚拟复制品。

研究人员称之为「通用计算代理」。而用于训练这些「代理」的,仅仅是一次两小时的访谈

▲图源:arXiv

这项研究由由斯坦福大学的博士生朴俊成(Joon Sung Park)牵头。研究人员与某招聘公司合作,并采用分层抽样的方式招募了 1052 名参与者,每一位参与者都用英语完成了一次两小时的语音访谈。

研究人员选择了一个由社会学家开发的采访协议,采访内容包括个人生活故事和对当代社会问题的看法。为了进一步量化访谈内容量,控制实验变量,研究人员将每个受试者的回答字数限制在约 6491 词左右。

值得一提的是,访谈中的面试官也是由 AI 来扮演的。在谈话的大致框架和时间限制内,这些「人工智能面试官」会根据每个参与者的回答动态生成后续的问题。

随后,这些回答就被用来训练每个个体的生成性 AI 模型,即「模拟代理」。

为了验证这些「代理」模仿人类个性的能力,参与者和 AI 代理都被要求完成一系列测试,内容包括性格测试、综合社会调查、五个社会科学实验和五个著名的行为经济学游戏等等。

其中,五个社会科学实验是发表在「美国国家科学院院刊」上的用于评估生成性代理是否能够模拟人类参与者的行为反应的一种常用标准;五个著名的行为经济学游戏则包括独裁者博弈、囚徒困境等。

两周后,参与者需要「复述」以上测试的回答,并用复述后的内容同「代理」生成的回答进行对比分析。结果显示,AI 代理能够以 85% 的准确率模拟参与者的回答,同时在预测五个社会科学实验中的个性特征和结果方面表现出色。

▲图源:香港青年协会

虽然人的「个性」似乎无法量化,但这项研究表明,人工智能的确擅长「以小见大」——它可以通过相对少量的信息推测并准确克隆一个人的「个性」。

这种「代理」的利弊两面都相当明显。好处是其为社会科学学者在研究时提供了更多的自由度。

通过创建行为类似于真实个体的数字复制品,科学家可以直接使用「代理」进行实验或者调查,而无需每次都招募大批志愿者。此外,这些「代理」还能够用来进行一些有关道德伦理的「争议」实验。

麻省理工学院斯隆管理学院的信息技术副教授约翰·霍顿(John Horton)在接受采访时就表示这项研究「使用真实的人类来生成人物角色,然后以编程/模拟的方式使用这些人物角色,而这是真实的人类无法做到的」。

▲图源:TechRadar

坏处则是,这类「代理」将不可避免地被一些别有用心的人用于「身份伪造」,并最终用于「诈骗」。

更加令人担忧的是,「代理」在某种意义上获得了人类的思想和「意识」,甚至能代替本人发表观点。朴俊成博士则预测未来有一天会有一群小版的「你」跑来跑去,并实际上做出你会做出的决定。

其实,「AI 代理」并不是什么处于技术前沿的词汇,在此之前,就有「数字孪生」的类似概念。不过,「代理」仅仅需要如此少的信息量就能准确重现一个人的「个性」,这才是需要注意和警觉的地方。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


前 Android 团队再度聚首,计划开发 AI 时代的「操作系统」

By: 范津瑞
30 November 2024 at 18:00

人工智能助理,或者「AI 代理」无疑是近期 AI 领域的热词之一,许多科技公司都已经在这条赛道上押宝。

以移动端为例,苹果为了使其智能助理「Siri」更加聪明,为其接入了大语言模型 ChatGPT,并计划使其拥有感知和理解屏幕内容的能力。

荣耀在不久之前发布的 Magic 9.0 系统则标志着手机正式进入「自动驾驶」时代,其内置的「YOYO 智能体」得益于 AI 内核的加持,还能实现「一句话操控手机」。

▲图源:TechRadar

而在 AI 技术同样深度介入的 PC 端,人工智能助理的能力也不容忽视:Anthropic 在上个月发布的最新 Claude 模型中同步推出了「computer use」功能,旨在代替用户直接与计算机进行交互。

据悉,OpenAI 也有计划入局该领域,将于明年 1 月推出一款名为「Operator」的 AI 代理。OpenAI 首席产品官凯文·韦尔(Kevin Weil)表示让 ChatGPT 具备自主执行任务的能力将是明年 OpenAI 的一大重点。

▲图源:TNCR

在 Android 操作系统出现之前,即使移动平台的前景相当广阔,但作为开发者来讲,在移动设备上构建任何东西都很困难。

对此,前 Google 高管大卫·辛格尔顿(David Singleton)认为在人工智能时代,同样的情况正在上演。他指出「我们可以看到 AI 的前景,但作为开发人员,构建任何好的东西真的很难」。

基于以上理念和考虑,辛格尔顿同前 Google 副总裁雨果·巴拉(Hugo Barra)等人联合创办了 AI Agent 操作系统创企「/dev/agents」。后者于 26 日在 X 上公开宣布了这一消息。

▲图源 :X

/dev/agents 在今年 10 月成立,总部位于美国旧金山,目前已经不再处于隐身状态。正如巴拉在推文中所说,新公司将「回到我们的 Android 根源,为人们和 AI 代理构建一个新的操作系统」。

换句话说,目前开发者缺乏构建 AI 代理的标准工具和系统,而 /dev/agents 计划构建一个统一的、基于云的跨平台操作系统,进而充分实发挥 AI 代理的潜力。公司预计将在明年初到中旬推出其产品的第一个版本。

这相当于一个「通用技术框架」,类似于 iOS 或者 Android 操作系统。此外,该公司还计划使用生成式 AI 提供个性化的用户界面,让人们能够更自然地与硬件设备上的代理进行交互。

▲图源:MakeUseOf

值得一提的是,/dev/agents 的联合创始人们个个来头不小。公司的 CEO 辛格尔顿在谷歌期间领导了安卓核心应用的开发和 Google Store 团队,末期则主要负责可穿戴设备安卓系统。后来离开谷歌,加入了金融科技企业 Stripe。

/dev/agents 的 CPO 巴拉此前在谷歌担任移动业务产品经理,负责移动与安卓业务,后来加入 Android 团队,负责整个安卓生态系统的软硬件业务,一路升至谷歌副总裁的职位。2013 年,巴拉加入小米集团,全权负责其海外业务。

公司的 CTO 和设计负责人分别由费卡斯·柯克帕特里克(Ficus Kirkpatrick)和尼古拉斯·吉特科夫(Nicholas Jitkoff)担任,前者负责安卓 1.0 版本从内核到应用程序所有层级的软件堆栈,后者则是初代安卓语音搜索和操作的负责人。

除了四位联合创始人以外,/dev/agents 还有另外两名员工。巴拉表示「这是一个构建了过去三代操作系统(安卓系统、可穿戴设备和 AR/VR)的团队」。

▲David Singleton(图源:CNBC)

也正是因为如此「豪华」的初创阵容,使得 /dev/agents 已经筹集到了 5600 万美元的种子轮融资,与此同时本轮融资对公司的估值达到 5 亿美元。

领投的风险投资公司「Index Ventures」的合伙人尼娜·阿查吉安(Nina Achadjian)认为创始人的背景是决定投资的核心,并且表示她抓住了支持该公司的机会:

这是一个非常困难的技术问题,也是一个非常大的想法。如果有一个团队来做这件事的话,从头开始构建 Android 和 Stripe 的团队,应该成为这个团队。

联合领投的 Alphabet 的独立成长基金 CapitalG 更是毫不吝啬对四位联合创始人的赞美,称他们是「本世纪每一次重大计算平台转变的先驱」,并且作为投资者,「遇到像这样出色的创始团队确实很少见」。

▲图源:CaptialG

许多投资者相信 AI 代理的功能将会越来越齐全,但同时他们也承认目前仍然没有通用的 AI 基础设施。尽管不少公司正在开发 AI 代理框架的不同部分,但 /dev/agents 的支持者认为,新的第三方操作系统将会成为释放潜力的关键。

另外,辛格尔顿表示 /dev/agents 的商业模式与 Android 的获利方式大致相同,可能会从销售额中分成,或向用户收取订阅费用。他还表示公司计划保持相对灵活的运营模式,类似于 Android 早期。

辛格尔顿在接受彭博社采访时说「我们需要一个类似 Android 的 AI 时刻」,这也是他对 /dev/agents 和人工智能代理的未来愿景。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


❌
❌