Reading view

There are new articles available, click to refresh the page.

这个 AI 生图神器太好玩了,连提示词都不用写

AI 生图工具,已经多得泛滥了,但 Google 最新推出的 Whisk,还是找到了一种很新的玩法,让见过世面的网友也直呼好玩。

只需输入三张图片,subject(主题)、scene(场景)、style(风格),Whisk 就可以生成一张博采众长的图片。

▲ 图片来自:Google

举个例子,主题是老人,场景是藤蔓,风格是 90 年代复古动漫,写上「角色骑着飞行自行车」的提示词,等待一会儿,一张类似吉卜力画风的新图片诞生了。

▲ 图片来自:Google

老人还是那个老人,戴帽子,穿西装,拿着书,但他骑上了提示词里的车,场景和风格也都变成了参考图片的样子。

Whisk 的长处便在这里——让我们少写、不写提示词的同时,轻松玩转各种风格,妈妈再也不担心我不会写提示词了。

别写复杂的提示词了,直接把图片端上来就行

别看只需要几张图片,Whisk 的玩法简单,却又无穷无尽。

刷刷刷上传三张图片——主题图片,麦当劳薯条;场景图片,莫奈画作《睡莲》;风格图片,像素风游戏《星露谷物语》。

不写提示词,直接生成,Whisk 给出的结果,一张更比三张强。

除了上传自己的图片,我们也可以掷骰子,让 Whisk 随机生成主题、场景、风格。

其实,Whisk 为我们提供的预设风格已经很够用,徽章、贴纸、刺绣、黏土、美漫、马赛克拼贴等等,特色鲜明,效果立竿见影。

只要有脑洞和想象力,无需一个字,仅仅通过不同图片的排列组合,我们可以不断地做完形填空的游戏——主题+场景+风格,而且不是每个空都必须填。

▲ 1.主题图片,熏鸡;2.场景图片,梵高《星月夜》画作;3.风格图片,日本木版画

▲ 1.主题图片,《戴珍珠耳环的少女》;2.场景图片,电影《千与千寻》剧照;3.风格图片,蒙德里安抽象画

▲ 1.主题图片,微信「死亡笑脸」表情包;2.场景图片,电影《星际穿越》剧照;3.风格图片,史努比漫画截图

▲ 1.主题图片,冲浪默认头像粉色恐龙 momo;2.风格图片,Jellycat 玩偶

另外,Whisk 的每一次生成,场景和风格只能选择一个参考图片,但主题可以选择多个。这意味着什么?我们可以让多个角色同框了!

比如,让马斯克、奥特曼、扎克伯格通通变成珐琅徽章。

三位的服装、装饰、神态都还原得挺好,扎克伯格的话筒和项链都没漏掉,但人脸没法保持一致性,全部变成了大众脸。

虽然 Whisk 减少了写提示词的需求,但你需要写的话,Whisk 也鼓励。

在对话框加上一句「角色们都举着一块告示牌,上面写着 AGI」,徽章小人们轻轻松松地遵循了提示词。

如果我们需要某个场景或者某种风格,但一时找不到参考图,Whisk 的预设也没有提供呢?

解决方式很简单,没有图片,那就写提示词,让 Whisk 临场发挥一个。

就像我需要一个让角色站上去的、像素风格的底座作为场景,就让 Whisk 帮我生成了。

然后,再把猫猫表情包作为主题图片,把像素小鸡作为风格图片,就可以得到一个有底座的像素猫猫。

总之,Whisk 就是非常自由,像橡皮泥一样,怎么捏都可以。

既生图又识图,把复杂的工作流包装成有趣的「打蛋器」

Whisk,其实是 Google 多模态模型秀肌肉的一种方式。

为了让我们少写提示词,Whisk 整合了视觉理解和图片生成能力。

Gemini 模型识别图片,自动生成详细的描述,然后这些描述会被输入到 Google 的图片生成模型 Imagen 3,由 Imagen 3 生图。

Whisk 是这样的,用户只要上传和生成图片就可以了,但它自己要考虑的事情就很多了。

Whisk 的每张图片,不管是上传的还是生成的,都写了很长的底层提示词,并且不藏着掩着,我们点开图片就能看,也可以上手修改。

如果把一个人作为主题图片,Whisk 会详细地描述他的外貌特征,场景图片也是类似的。

▲ Whisk 对奥特曼的描述:「一个肤色较浅的男子,有着短而深棕色的卷发,从胸部以上展示。他有着浅色的眼睛。他穿着一件浅米色的针织圆领毛衣。背景是一面斑驳的灰色混凝土墙。男子的表情严肃而中性。光线有些昏暗,他的右脸有轻微的阴影。」

风格图片略有些不同,如果把一张动画截图作为风格参考,Whisk 不会说,画面里有三个人,而是描述这幅画的色彩、光线、线条……

▲ Whisk 对史努比画风的描述:「这张图片以卡通风格呈现,具有粗犷的轮廓和平面着色。色彩调色板有限,主要使用原色和柔和的次要颜色。光线均匀,缺乏强烈的阴影或高光,给人一种简单、几乎孩童般的质感。线条清晰且一致,带有轻微不均匀的质感,暗示手绘的效果。整体美学让人联想到经典的连环漫画或儿童动画。」

所以,Whisk 不是精准地复制图片,而是提取图片的特点和精髓,将主题、场景、风格自然地融合在一起,各司其职,互不干扰。

同时,Whisk 也叠了甲——只从图片提取少量关键特征,结果可能和预期不同。这也解释了,为什么 Whisk 做不到人脸的精准还原。

所以,哪怕选择不那么抽象的复古胶片风格,三位大佬的脸也是和本尊都不挨着,但其他细节都很准确。

物体也是一样,特斯拉的赛博皮卡,经过特征提取再生成之后,变得非常普通。

但如果是麦当劳薯条这种素材丰富的超级 IP,效果倒还不错,可以拿来当广告图了。试过一些迪士尼的角色,Whisk 复刻得也原模原样,但图就不放上来了。

另外,Whisk 还存在一个问题——没法做很细致的风格参考,模仿不了某种特定的画风。

当我让 Whisk 生成蒙娜丽莎的乐高小人,出来的结果让我两眼一黑,但多加一句提示词,「让角色更像乐高人物」,Whisk 又能模仿个七八成。

某个漫画家的画风就更难模仿了,上传漫画截图让 Whisk 参考,它最终给出的是一个非常普通的漫画风格图片,就算通过提示词强调作品、角色、漫画家,也不起什么作用。

其实,Whisk 好玩就够了,它更适合做一些不追求精准的创意探索,俗称整活。

Whisk 可以翻译为「搅拌」或者「打蛋器」,Google 的这个名字取得即视感很强,可不就是把食材都混搭在一起吗?

Whisk 的不精准,也让它的定位和传统的图片编辑器不同,更像是一种创意工具。有了什么脑洞,由它实现粗略的视觉效果。

▲ Whisk 生成,1.主题图片,《火影忍者》截图;2.风格图片,毛绒玩具

以前实现 Whisk 这种风格化的效果,跑通一整个图像生成的流程,我们可能需要在 ComfyUI 搭建工作流。

但现在有了 Whisk,好像就在玩抽卡游戏或者开盲盒,而且只要能登录(限美国地区),目前还免费。

体验指路👇
https://labs.google/fx/zh/tools/whisk

Google 领先的模型能力固然是前提和基础,但设计出被大家需要的产品,仍然需要创造力和审美。

很喜欢 Whisk 的 slogan:「prompt less, play more.」(少写提示词,多玩耍。)

Whisk 出自 Google labs,之前爆火的 AI 播客 NotebookLM,也是出自这里,后来慢慢发展为成熟的项目。这个实验室,本身就是这句 slogan 的最好注解。

强大的模型能力,有新意的产品,开放的心态,曾经似乎被 OpenAI 威胁的 Google,风轻云淡地展现出了王者归来的姿态。

利若秋霜,辟除凶殃。 工作邮箱:zhangchengchen@ifanr.com

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


苹果正在与英伟达合作,想让 AI 的响应速度更快

近日,苹果与英伟达宣布合作,旨在加速和优化大语言模型(LLM)的推理性能。

为了改善传统自回归 LLM 推理效率低内存带宽小的问题,今年早些时候,苹果机器学习的研究人员发布并开源了一种名为「ReDrafter」(Recurrent Drafter,循环草稿模型)的推测解码技术。

▲图源:GitHub

目前,ReDrafter 已经整合到英伟达的可扩展推理方案「TensorRT-LLM」当中,后者是基于「TensorRT」深度学习编译框架的专为优化 LLM 推理而设计的开源库,支持包括「Medusa」等推测解码方法。

不过,由于 ReDrafter 所包含的算法使用了之前从未用过的运算符,因此英伟达方面添加了新的运算符,或者公开了现有的运算符,大大提高了 TensorRT-LLM 适应复杂模型和解码方式的能力。

▲图源:GitHub

据悉,ReDrafter 推测解码通过三个关键技术来加速 LLM 的推理过程:

  • RNN 草稿模型
  • 动态树注意力算法
  • 知识蒸馏训练

RNN 草稿模型是 ReDrafter 的「核心」组件。它使用循环神经网络(Recurrent Neural Network),基于 LLM 的「隐藏状态」来预测接下来可能出现的 tokens 序列,其能够捕捉局部的时间依赖性,从而提高预测准确性。

这个模型的工作原理是:LLM 在文本生成过程中首先生成一个初始 token,然后 RNN 草稿模型利用该 token 和 LLM 的最后一层隐藏状态作为输入进行束搜索(Beam Search),进而生成多个候选 tokens 序列。

与传统自回归 LLM 每次只生成一个 token 不同,通过 RNN 草稿模型的预测输出,ReDrafter 能够在每个解码步骤生成多个 tokens,大大减少了需要调用 LLM 验证的次数,从而提高了整体的推理速度。

▲图源:arXiv

动态树注意力算法(Dynamic Tree Attention)则是一种优化束搜索结果的算法。

我们已经知道,在束搜索过程中会产生多个候选序列,而这些序列往往存在共享的前缀。动态树注意力算法会识别出这些共享前缀,并将它们从需要验证的 tokens 中去除,从而减少 LLM 需要处理的数据量。

某些情况下,该算法能将需要验证的 tokens 数量减少 30% 到 60%。这意味着使用动态树注意力算法后,ReDrafter 能够更高效地利用计算资源,进一步提高推理速度。

▲图源:NVIDIA

知识蒸馏是一种模型压缩技术,它能够将一个大型、复杂的模型(教师模型)的知识「蒸馏」到一个更小、更简单的模型(学生模型)中。在 ReDrafter 中,RNN 草稿模型作为学生模型通过知识蒸馏从 LLM(教师模型)中学习。

具体来讲,蒸馏训练过程中,LLM 会给出一系列下一个可能词的「概率分布」,开发人员会基于这个概率分布数据训练 RNN 草稿模型,然后计算两个模型概率分布之间的差异,并通过优化算法使这个差异最小化。

在这个过程中,RNN 草稿模型不断学习 LLM 的概率预测模式,从而在实际应用中能够生成与 LLM 相似的文本。

通过知识蒸馏训练,RNN 草稿模型更好地捕捉到语言的规律和模式,从而更准确地预测 LLM 的输出,并且因为其较小的规模和较低的推理计算成本,显著提高了 ReDrafter 在有限硬件条件下的整体性能。

▲图源:阿里云开发者社区

苹果的基准测试结果显示,在 NVIDIA H100 GPU 上对数十亿参数的生产模型使用集成了 ReDrafter 的 TensorRT-LLM 时,其贪心解码(Greedy Decoding)每秒生成的 tokens 数量提高了 2.7 倍。

此外,在苹果自家的 M2 Ultra Metal GPU 上,ReDrafter 也能实现 2.3 倍的推理速度提升。苹果的研究人员表示「LLM 越来越多地用于驱动生产应用程序,提高推理效率既可以影响计算成本,也可以降低用户端延迟」。

▲图源:Apple

值得一提的是,在保持输出质量的同时,ReDrafter 减少了对 GPU 资源的需求,这使得 LLM 在资源受限的环境中也能高效地运行,为 LLM 在各种硬件平台上的使用提供了新的可能性。

苹果目前已经在 GitHub 上开源了这项技术,未来从中获益的公司将很可能不止英伟达一家。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


极越公关负责人被开除/小红书大量封号,官方回应/坠崖车主感谢小米 SU7 保命

cover

💥

突破 AI 极限,OpenAI 重磅发布 o3

🍎

苹果智能总结新闻出大错

🐺

极越公关负责人徐继业被开除

🍻

GPT 系列开创人从 OpenAI 离职

🤖

与 DeepMind 合作的机器人即将商用

🦊

「银狐」木马病毒出现新变种

📚

小红书大量封号,官方回应

🚗

SK 海力士获得博通供应内存的大订单

👏

坠崖车主感谢小米 SU7

💬

李想「回归」,理想汽车举行「AI Talk」活动

💡

OpenAI 前首席研究官:面对 AI 浪潮,记得关注 AI 人才的培养

📰 周末也值得一看的新闻

突破 AI 极限,OpenAI 重磅发布 o3

今日凌晨,OpenAI 完成了连续 12 天发布会的收官之作,重磅推出 o3 系列模型。

此次发布的的 o3 系列模型是 o1 的迭代版本,考虑到可能与英国电信运营商 O2 存在版权或商标冲突,OpenAI 决定跳过「o2」命名,直接采用「o3」。

o3 系列包含两款重磅模型:

  • OpenAI o3:旗舰版本,具备强大的性能表现
  • OpenAI o3 mini:轻量级模型,但能更快,更便宜,主打性价比

据官方介绍,o3 在多领域迎来全面提升:

  • 在 SweepBench Verified 基准测试中, o3 达到了约 71.7% 的准确率,直接将 o1 模型甩在身后整整 20% 之多。
  • 编码领域,o1 在编程竞赛平台 Codeforces 上的得分为 1,891。而 o3 在开足马力,延长思考时间的情况下,得分可达 2,727。
  • 在美国数学竞赛 AIME 2024 测试中,o3 以 90.67% 的准确率完全碾压了 o1 的 83.3%。
  • 遇上衡量博士级科学问题解答能力的 GPQA Diamond 测试,o3 取得了 87.7% 的成绩,而 o1 仅为 78%。
  • OpenAI 还引入了一个全新的数学测试 EpochAI Frontier Math。目前,所有现有模型在该测试上的准确率都不足 2%,而在高算力的长时间测试下,o3 却能取得超过 2,457 的分数。
  • ARC-AGI 方面,o3 在低算力的配置下得分 75.7 分。当要求 o3 思考更长时间,并且提高算力,o3 在相同的隐藏保留集上得分 87.5%,远超大多数真人。

o1 mini 的延续之作 o3 mini 也一同亮相。保留了 o1 mini 「具有很强的数学和编程能力,而且成本极低」的特征。

据官方介绍,o3 mini 支持低、中、高三种推理时间模式,用户可根据任务复杂度灵活调整模型的思考时间。从首批评估结果来看,在衡量编程能力的 Codeforces Elo 评分中,随着推理时间的增加,其 Elo 分数持续攀升,在中等推理时间下就已超越 o1 mini。

同时,在 AIME 数学基准测试中,其低推理模式就达到了与 o1 mini 相当的性能,中等推理模式更是超越了 o1 mini,且延时更低。

另外,应广大开发者呼声,o3 mini 模型也将全面支持函数调用、结构化输出和开发者指令等 API 功能。

o3 系列目前并不会向普通用户开放,OpenAI 计划先开放外部安全测试申请。现在,o3 mini 和 o3 的申请通道现已开放。o3 mini 预计将于 1 月向所有用户推出,完整版 o3 则将在后续发布。

本次发布会由 Sam Altman、研究高级副总裁 Mark Chen 以及研究科学家 Hongyu Ren(任泓宇)主持。值得注意的是,任泓宇本科毕业于北大,对 o1 有过基础性贡献,也是 GPT-4o 的核心开发者,曾在苹果、微软和英伟达有过丰富的研究实习经历。

苹果智能总结新闻出大错

近日,多家媒体表示,苹果所推出的 Apple Intelligence 频繁出错,甚至以误导用户的方式推送虚假信息。

12 月 19 日,据 BBC 报道,Apple Intelligence 在推送本月初美国联合健康集团(UNH)旗下联合健康保险公司 CEO 布莱恩·汤普森于纽约街头遭枪杀的报道时,将其错误提取总结成「枪手本人对自己开枪」,并最终以「BBC新闻客户端」的形式,向苹果用户进行推送。BBC 表示,Apple Intelligence 在推送错误消息时,会让人以为是 BBC 所推送。

除此之外,11 月 21 日,Apple Intelligence 还试图将纽约时报的三篇文章整合在一起,总结出了「以色列总理内塔尼亚胡被逮捕」的信息,并以「纽约时报客户端」形式推送给用户。而这篇推送其实是根据「国际刑事法院对内塔尼亚胡发出逮捕令」的报道生成,并非内塔尼亚胡已经被逮捕。

据分析,Apple Intelligence 之所以「翻车」,大概与其应用的语言大模型体量有关。其分析模型由苹果自研,其在设备端的本地模型仅有 30 亿数据,如此「小体量」导致处理信息能力自然不足。

极越公关负责人徐继业被开除

据多家媒体报道,今天上午,极越汽车通过邮件发布「员工违纪行为通报」,表示公司依据《员工手册》相关规定,予以徐继业单方解除劳动合同的处理,并通报批评。

网传截图显示,徐继业在朋友圈发文,表示在此邮件出现之前,自己并未接到任何通知,一直联系 HR 负责人和 CEO 夏一平,均处于联系不上状态。

近日,极越汽车的一位离职员工发布了一篇万字长文,直指极越内部管理和 CEO 夏一平的问题。随后徐继业朋友圈回应了此事,并表示「仆从的眼里没有英雄」,认为极越发展至今天,不仅仅是老板的问题,并反问员工是否也有责任,此回应引发大批网友热议。

12 月 20 日午间,徐继业最新朋友圈动态再被曝光,称自己已经「基本搞清楚这是个假诏」,并暗示接下来将有更多内幕信息曝光,称「回头弄点好瓜给大家尝尝」。

GPT 系列开创人从 OpenAI 离职

近日,据 The Information 报道,OpenAI 又一位元老级研究人员 Alec Radford 即将离职,寻求独立研究的机会。

作为 GPT 论文的主要作者,Alec Radford 的贡献包括了 GPT、GPT-2、CLIP 等多个重要研究,论文被引用超过 18 万次,并且参与了 GPT-2、语音模型 Whisper 以及 Dall-E 的开发——称他为 OpenAI 所有重大技术突破的「幕后推手」。

2015 年起,Alec Radford 就投身于研究卷积网络、batch norm 和 GAN 等核心技术的研究。2016 年,他加入 OpenAI,成为早期团队的一员。2017 年,划时代的论文「Attention Is All You Need」发布,改写了计算机领域接下来的走向。

目前,包括 Ilya 在内的其他早期 OpenAI 核心成员如 Mira Murati,Andrej Karpathy,Bob McGrew,John Schulman 等人,都已经悉数离职。

与 DeepMind 合作的机器人即将商用

近日,Google DeepMind 与机器人公司 Apptronik 宣布达成合作,计划共同开发能够在动态环境中运作的 AI 人形机器人。

此次合作双方希望将 Apptronik 的机器人硬件与谷歌 DeepMind 的 AI 大模型相结合,打造可以在复杂环境中工作的 AI 人形机器人。

Apptronik 成立于2016年,源自德克萨斯大学奥斯汀分校的人机中心机器人实验室,目前已开发出 15 种不同型号的机器人,其中包括 NASA 的 Valkyrie 机器人。

此次合作的重点是 Apptronik 最新推出的 Apollo 机器人,身高 1.73 米,重量 73 公斤,专为工业环境设计,能够与人类协作工作。在一段近期的 DeepMind 演示中,Apollo 机器人在 Gemini2.0 的控制下进行操作,展示了其在复杂环境中工作的能力。

同时,谷歌 DeepMind 的机器人团队在机器学习、工程和物理仿真等领域具有丰富的专业知识。团队最近展示了其 AI 模型如何帮助机器人在复杂环境中导航,使用 Gemini1.5Pro 模型时,导航任务的成功率高达 90%。

「银狐」木马病毒出现新变种

近日,国家计算机病毒应急处理中心发布预警,指出针对中国用户的 「银狐」 木马病毒出现新变种,并更新了传播方式。

变种「银狐」病毒通过伪造「财务违规通知」等钓鱼信息,在微信群中传播加密压缩包文件。用户解压后会发现包含 「银狐」 木马的可执行文件,运行后可能导致被远程控制等安全问题。该变种具有针对安全软件的攻击功能,并设置了回联地址和命令控制服务器域名。

国家计算机病毒应急处理中心建议用户不要轻信社交媒体上的官方通知,解压加密包前先进行安全性检测,发现异常情况立即切断网络并备份数据。

11 月,国家计算机病毒应急处理中心和计算机病毒防治技术国家工程实验室发现了一种名为 「银狐」 的最新木马病毒变种,通过虚构财务、税务等主题的钓鱼网页,在微信群中传播病毒下载链接。同时,对于可疑文件,可提交至国家计算机病毒协同分析平台检测。

小红书大量封号,官方回应

近日,有部份网友反馈自己的小红书账号被封禁,同时「小红书封号」相关话题也登上热搜,引发热议。

对于封号一事,小红书官方客服给出回应,称会将情况登记并进行内部反馈,并表示账号处罚情况只和账号违规程度有关。

据悉,近日小红书官方账号「薯管家」曾发布一篇「黑灰产账号治理阶段进展」的公告,公告中提到,11 月 18 日至 12 月 16 日,小红书一共处置账号 1,259,709 个,其中包括了 252 个 10 万粉丝以上和 4,941 个 1 万粉丝以上的账号。并明确指出此类账号定义:黑灰产矩阵账号主要操作方式是前期养号,后期转售账号,「换头」变现。

腾讯与荣耀达成战略合作

近日,腾讯与荣耀正式签署战略合作协议。

据官方介绍,双方将长期合作,充分发挥荣耀在终端、AI 和生态建设上的硬核实力,与腾讯在云计算、内容平台和游戏科技领域的强大资源深度结合,实现优势互补,共同成长。

双方还宣布,携手推出了「荣耀 CoMagic 编码助手」。这一工具基于腾讯云 AI 代码助手的「代码补全」和「智能对话」等关键功能开发而成,可以辅助开发人员编写、调试代码,提高开发效率。目前已经有超过 8000 名荣耀软件工程师使用 AI 辅助编程,将开发过程代码生成比例提升至 30%,代码采纳率提升至 25%。

荣耀还将于 12 月 23 日发布荣耀 Magic7 RSR。新机将首发 2 亿超感光潜望长焦,配备行业领先1G+5P浮动潜望镜组,融合行业首创双电磁对焦马达,据悉,新机长焦将搭载 1/1.4″ 大底传感器,光圈大小达 f1.88。

SK 海力士获得博通供应内存的大订单

12 月 20 日,据 TheElec 报道,韩国存储芯片巨头 SK 海力士赢得了一份向博通供应 HBM 芯片的大单,但具体额度未知。

消息人士称,博通计划从 SK 海力士采购存储芯片,并将其应用到一家大型科技公司的 AI 计算芯片上。SK 海力士预计将在明年下半年供应该芯片。

此前 SK 集团会长崔泰源曾透露,英伟达 CEO 黄仁勋请求 SK 海力士提前六个月供应下一代高带宽内存芯片 HBM4。因此由于需要同时向英伟达和博通供应 HBM,SK 海力士将会调整其 DRAM 产能预测。TheElec 预计其产能将增加到 16~17 万片 300mm 晶圆。

SK 海力士在 10 月份的第三季度电话会议上表示,预计 HBM 将在第四季度占其 DRAM 业务营收的 40% 份额。随着 SK 海力士与博通达成协议,预计这一比例将进一步上升。

乐道定下月产 3 万辆,并打算引入英国市场

近日,据 Automotive News Europe 报道,蔚来计划将乐道引入欧洲,并在英国推出旗下 L60。

蔚来产品规划负责人 Eric Yu 表示,乐道品牌首先进入英国市场的原因是英国与欧盟不同,不对中国制造的电动汽车征收进口关税,这对乐道品牌「以性价比为核心」的价格策略至关重要。

同时乐道引入欧洲并没有确切时间点,但 Eric Yu 表示,当乐道月产量达 3 万辆时,蔚来将开始出口乐道 L60,时间预计会在 2025 年 2 月。

据报道,蔚来目前在欧洲的产品线主要定位于高端市场,因此欧盟的进口关税对其盈利影响较小。但预计蔚来会选择在当地生产乐道和萤火虫系列车型,以保持价格竞争力。同时,由于英国尚未建立换电基础设施,L60 初期可能不会提供换电功能。

坠崖车主感谢小米 SU7

近日,来自河南的一家四口驾驶小米 SU7 去巩义市浮戏山景区游玩,下山过程中车辆冲下二三十米高的山崖,经过翻转后被树木挡住,一家人均无生命危险。

随后,坠崖车主在社交平台发文称,「谢谢小米SU7安全,谢谢所有帮助的救援人员。」。车主提到 2024 年 10 月 24 日提车,12 月 11 日发生事故,刚提车一个月遭遇事故,车辆面临报废。车主还表示,车很扎实,安全意识也比较重要,如果要是再订的话,未来可能还会考虑。

近期,小米第二款车 YU7 的无伪装实车遭曝光。实拍图中展示了小米 YU7 正面 45 度、尾部左 45 度以及侧面,此次被拍摄到的实车颜色为官方宣传图中的深蓝色。

小米 YU7 于 12 月 9 日正式公布亮相,为小米旗下第二款车型,该款新车预计于明年 6、7 月正式上市。

机构:预计 2025 年中国新能源汽车将近 1,400 万辆

12 月 20 日,IDC 基于科技产业最新趋势,以及中国汽车市场近年来的发展历程,公布了 2025 年中国汽车市场十大洞察。

报告中指出,随着高压快充技术由 4C 向 4C+ 挺进,以及半固态电池实现装车量产,新能源车的补能短板正逐渐补齐。电池管理技术的发展扩大了电池组设计的自由度,使厂商在解决电池寿命、工况限制等问题时具备更大的创新空间。针对于插混、增程式电动车的电池研发也在各动力电池头部厂商中得到恰当的资源倾斜。IDC 预测,2025 年中国汽车市场新能源车的市场规模将接近 1,400 万辆。

同时,IDC 还提到,插电式混合动力汽车在新能源车中的占比将继续上升,增程式电动汽车也将开拓更加丰富的细分市场。此前,小鹏、智己等品牌纷纷计划在 2025 年推出增程式车型,增程式动力模式将在更加丰富的车身形态与更广泛的价位段占据一席之地。

支付宝推出 AI 创意生成平台

近日,支付宝推出 AI 创意生成平台「蚂上有创意」,将面向商家机构提供 AI 快速生成创意素材、营销广告智能分析等营销服务。

据官方介绍,在 AI 技术的加持下,「蚂上有创意」支持用口语描述就能快速生成海报、Banner、视频等内容,也支持 AI 图片优化、线稿上色、艺术字生成等功能,平台还将提供 AI 创意洞察的智能服务。商家上传营销物料后,支付宝的创意诊断模型便会对物料进行分析评估并给出优化建议,帮助商家提高投放转化率。

据悉,过去一年支付宝将 AI 全面应用于商业开放生态,共接入近 70 个业务场景,累计为生态商家机构生成 8700 万张 AI 素材。此次推出的「蚂上有创意」,则面向所有商家机构及设计师群体开放,聚焦于用 AI 让商业营销更简单。

今年 4 月,支付宝数字推广平台「灯火」宣布推出 AI 广告创意等功能,目前已覆盖数字推广平台「灯火」近 7 成的智能投放场景,相较商家自主上传素材,AI 生成广告的点击转化率提升了 4.74%。

此外,Meta、淘宝、腾讯等互联网大厂也均在开展 AI 广告的布局。今年 10 月,Meta CEO 扎克伯格表示,已有超过 100 万广告使用 AI 生成了超 1500 万条广告。腾讯 CEO 马化腾也曾在年报中表示,广告 AI 模型的改进显著提升了精准投放的效果。

李想「回归」,理想汽车举行「AI Talk」活动

12 月 20 日,理想汽车官方宣布,将于 12 月 25 日至 12 月 27 日,举行「2024 理想 AI Talk」直播,届时理想汽车 CEO 李想将出镜直播。

据官方介绍,这次直播将于每晚 8 点,对话直播 30 分钟,将解答「李想回来了!车企也能做 AI?」、「理想汽车到底谁懂智驾?」、「李想回应为什么买法拉利」等相关话题,同时李想本人也将在此次活动中「回归」。

此前,李想曾被冠以「微博之王」的称号,但自今年 3 月起在微博上一度陷入数月沉寂,其微博最新一条内容为 8 月 14 日发布。

💡 OpenAI 前首席研究官:面对 AI 浪潮,记得关注 AI 人才的培养

近期,OpenAI 前首席研究官 Bob McGrew 与 Unsupervised Learning 频道进行了深度对话,对话提到了「GPT-5 何时到来」、「多模态 AI 如何改变世界」等问题,并且 McGrew 表示,面对 AI 浪潮,要记得关注 AI 人才的培养。

对话中,McGrew 预言,未来几年 AI 领域将迎来巨变。算力竞赛将进一步升温,视频生成模型和机器人技术将迎来爆发式增长,同时多模态 AI 将深刻改变大家的生活。同时他对 GPT-5 进行了一点预测,认为 OpenAI 有望在不大幅增加成本的情况下,持续提升 AI 模型的性能。目前,OpenAI 正专注于「测试时计算」技术,它可以在无需建设新数据中心的情况下实现算力增长。

McGrew 预测了 AI 将在各行业的运用。他认为视频生成模型将在未来两年内彻底改变电影制作方式,以及机器人技术也将在五年后迎来广泛应用。

最后,McGrew 提醒公众应该关注 AI 人才的培养。他认为,数学、编程和写作能力将是未来人才的核心竞争力,相关教育领域的投资也将获得丰厚回报。

REDMI 天玑新机即将推出

12 月 20 日,REDMI 品牌总经理王腾晒出联发科 MTK 送给小米的感谢奖牌。

根据王腾发出的照片所示,奖牌内容为联发科祝贺小米集团在天玑 8000 系上累计出货已经突破 3000 万部,并感谢小米对联发科的大力肯定。

王腾还提到,REDMI 联合联发科定制的天玑新 8 系即将推出,并表示性能更强、能效更好。

此前,联发科宣布新一代天玑芯片将于 12 月 23 日发布,届时将带来天玑 8400 处理器。天玑 8400 将采用台积电 4nm 工艺,8 核 A725 。据悉,REDMI Turbo4 将会首发天玑 8400。

《美队 4》确认引入内地

12 月 20 日,漫威影业宣布新片《美国队长 4》确认引进内地。

《美国队长 4》讲述了世界格局正在改变,曾经的「猎鹰」山姆·威尔逊正式接过美国队长的盾牌,以身入局,勇闯新世界的故事。该片由朱利叶斯·约拿执导,马尔科姆·斯拜尔曼、达兰·穆森、马修·奥尔顿编剧,安东尼·麦凯、哈里森·福特、吉安卡罗·埃斯波西托、丹尼·拉米雷斯、蒂姆·布雷克·尼尔森、丽芙·泰勒等主演的动作科幻电影。

《唐探 1900》定档大年初一

近日,陈思诚宣布电影《唐探 1900》定档 2025 年大年初一(2025 年 1 月 29 日)。

该片是《唐探》系列前传,故事背景设置在 1900 年的旧金山唐人街,围绕一起谋杀案展开。影片由陈思诚携手戴墨共同执导,主演包括刘昊然、王宝强以及张译、黄渤等知名演员。

《唐探》系列前三部电影累计票房高达 87.43 亿元。《唐探 1900》将与《哪吒之魔童闹海》等四部电影共同竞争 2025 年春节档。

✨ 是周末啊!

One Fun Thing | 日本麦当劳联名 EVA 打造萌版小手办

近日,日本麦当劳宣布将与《新世纪福音战士》开展联动,推出「麦当劳 EVA 奇迹机器人」套装。

「麦当劳 EVA 奇迹机器人」套装包括零号机、初号机和 2 号机等三个可变形机器人,售价 3900 日元(约合 184 元)。

此次联动活动将持续到 2025 年 1 月 10 日,参与者需在活动期间登录日本麦当劳 APP 参与抽奖,中奖后可在 2025 年 1 月 20 日至 26 日期间前往指定店铺购买。

周末看什么 | 《好东西》

《好东西》是由邵艺辉自编自导,宋佳、钟楚曦、曾慕梅、章宇领衔主演,赵又廷、周野芒特别出演的爱情院线电影。

该片讲述了单亲妈妈王铁梅带小孩王茉莉搬到新家后,结识了邻居小叶,两位性格迥异的女性,一个坚强,一个柔软,一个擅长给人当妈,一个擅长随时撒谎,面对旧创伤和新挑战,她们彼此温暖互相慰藉的故事。

此前,2024 年 5 月,《好东西》入围 2024 微博电影之夜微博网友年度期待影片。 《好东西》于 2024 年 11 月 22 日在全国上映。

买书不读指南 | 《双胞胎》

《双胞胎》由日本乐队 Sekai No Owari 钢琴手藤崎彩织所写情感类小说,其内容改编自其亲身经历。

书中讲述了 Sekai No Owari 乐队成员 Saori(藤崎彩织)和主唱深瀬慧的成长经历。只有钢琴作伴的孤独少女夏子,认识了不爱学习的月岛,经历许多陪伴与艰辛后,月岛对夏子说出了「你和我就像双胞胎。」。什么事也不会,只知道弹琴的夏子也渐渐明白了自己想要的是什么,找到了归属。

藤崎彩织为 Sekai No Owari 乐队的钢琴手。自从出道以来,藤崎彩织将敏锐感性发挥到极致的演奏获得了绝对的支持。她的写作活动也引人注目,在杂志《文学界》上连载散文《读书间奏文》。

游戏推荐 | 《星露谷物语》

《星露谷物语》是一个牧场类的RPG游戏。

故事中,玩家所扮演的角色继承了爷爷在星露谷的农场,但是手头上只有最基础的农具和少许的金钱,玩家需要靠此开始新的故事生活。

《星露谷物语》的游戏内容简单容易上手,既可以发展各种职业探索,也可以选择在湖边钓鱼度日。复古的像素画风以及温性的颜色搭配,在冬日里玩也能得到治愈。游戏还支持多人链接,无论身处何地,都能与好友一同在星露谷小镇获得快乐。

《星露谷物语》目前已上线 PC、PlayStation、Xbox、Switch、iOS 以及 Android 等各大平台。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


刚刚,OpenAI 重磅发布 o3!再次突破 AI 极限,北大校友参与研发


就在刚刚,OpenAI 迎来了年底 AI 春晚的收官之作。

这次发布的的 o3 系列模型是 o1 的迭代版本,考虑到可能与英国电信运营商 O2 存在版权或商标冲突,OpenAI 决定跳过「o2」命名,直接采用「o3」。

为此,OpenAI CEO Sam Altman 更是自嘲公司在模型命名方面的混乱,原来你也知道呀。

本次发布会由 Sam Altman、研究高级副总裁 Mark Chen 以及研究科学家 Hongyu Ren(任泓宇)主持。

值得注意的是,任泓宇本科毕业于北大,对 o1 有过基础性贡献,也是 GPT-4o 的核心开发者,曾在苹果、微软和英伟达有过丰富的研究实习经历。

o3 系列包含两款重磅模型:

  • OpenAI o3:旗舰版本,具备强大的性能表现
  • OpenAI o3 mini:轻量级模型,但能更快,更便宜,主打性价比

先别急着高兴,因为 o3 系列目前并不会向普通用户开放,OpenAI 计划先开放外部安全测试申请,正式发布时间预计要到明年 1 月。

现在,感兴趣的朋友可以提交申请:
https://openai.com/index/early-access-for-safety-testing/

o3 性能大跃迁,死记硬背?不存在的

o3 模型的「纸面参数」迎来了全方位提升。

首先在 SweepBench Verified 基准测试中, o3 达到了约 71.7% 的准确率,直接将 o1 模型甩在身后整整 20% 之多。

转入编码领域,o1 在编程竞赛平台 Codeforces 上的得分为 1891。而 o3 在开足马力,延长思考时间的情况下,得分可达 2727。

作为参照,演示人员 Mark Chen 的得分也只有 2500,充分展现了 o3 模型已经具备接近甚至超越人类专业程序员的实力。

在数学领域,o3 同样表现出色。

在美国数学竞赛 AIME 2024 测试中,o3 以 90.67% 的准确率完全碾压了 o1 的 83.3%。

遇上衡量博士级科学问题解答能力的 GPQA Diamond 测试,o3 取得了 87.7% 的成绩,而 o1 仅为 78%。

什么概念呢?要知道,就算是领域内的博士专家,也往往只能在自己的专业范围内达到约 70% 的准确率。

面对当前基准测试接近满分的情况,OpenAI 引入了一个全新的数学测试 EpochAI Frontier Math。

这被认为是当前最具挑战性的数学评估之一,包含了极其复杂的问题。就连专业数学家解决单个问题也需要耗费数小时甚至数天。

目前,所有现有模型在该测试上的准确率都不足 2%,而在高算力的长时间测试下,o3 却能取得超过 2457 的分数。

说到 AI 领域的圣杯 AGI,也就不得不提到 ARC-AGI 这个专门衡量 AGI 的基准测试。

ARC-AGI 是由 Keras 之父 François Chollet 开发,主要是通过图形逻辑推理来测试模型的推理能力。

当演示人员向另一位演示人员 Mark Chen 提出即兴问题时,后者准确指出了任务的要求:需要计算每个黄色方块中彩色小方块的数量,并据此生成相应的边框。

这些对人类来说再简单不过的任务,对 AI 来说却是一道难题。

并且,ARC-AGI 的每个任务都需要不同的技能,且刻意避免重复,完全杜绝了模型靠「死记硬背」取巧的可能,真正测试模型实时学习和应用新技能的能力。

现在,o3 在低算力的配置下得分 75.7 分。当要求 o3 思考更长时间,并且提高算力,o3 在相同的隐藏保留集上得分 87.5%,远超大多数真人。

OpenAI 的言外之意就是,o3 将让我们离 AGI 更近一步。

o3 mini 重磅发布,速度更快,成本更低

今年九月,OpenAI 发布了 o1 mini,具有很强的数学和编程能力,而且成本极低。

延续这一发展方向,今天推出的 o3 mini 也保留了上述特征。即日起,该模型仅向安全研究人员开放测试申请,截止日期为 1 月 10 日。

o3 mini 支持低、中、高三种推理时间模式。

用户可根据任务复杂度灵活调整模型的思考时间。例如,复杂问题可选择更长的思考时间,而简单问题则可快速处理。

从首批评估结果来看,在衡量编程能力的 Codeforces Elo 评分中,随着推理时间的增加,其 Elo 分数持续攀升,在中等推理时间下就已超越 o1 mini。

演示人员要求模型使用 Python 创建了一个代码生成器和执行器,该脚本可启动服务器并创建本地用户界面。用户可在文本框中输入代码请求,系统会将请求发送至三种高级模式的 API,生成并执行相应代码。

例如,当要求其生成一个包含 OpenAI 和随机数的代码时,o3 mini 的中等推理模式迅速完成了处理。

另外,它还能自己测试自己,比如说在 GPQA 数据集测试中,模型以低推理模式完成了复杂数据集的评估。

它下载原始文件,识别 CSS、答案和选项,整理问题并进行解答,最后进行评分,仅用一分钟就完成了自我评估,准确率达到 61.62%。

在数学领域,o3 mini 同样表现优秀。

在 AIME 数学基准测试中,其低推理模式就达到了与 o1 mini 相当的性能,中等推理模式更是超越了 o1 mini,且延时更低。

另外,应广大开发者呼声,o3 mini 模型也将全面支持函数调用、结构化输出和开发者指令等 API 功能。

现在,o3 mini 和 o3 的申请通道现已开放。o3 mini 预计将于 1 月向所有用户推出,完整版 o3 则将在后续发布。

写在最后,在这个为期 12 天的年末发布会上,OpenAI 终于祭出了压箱底的杀手锏。

可以说,o3 模型的发布为这场一度陷入「高开低走」困境的发布会,画上了一个意料之外却又情理之中的圆满句号。

短短不到 3 个月的时间,OpenAI 就完成了 o1 模型的迭代升级。

这种从 GPT 系列到 o 系列的转型,显然是 OpenAI 深思熟虑后的战略选择,而事后结果也证明这个决定是明智的。

不过,值得注意的是,微软 CEO Satya Nadella 近期在一档播客节目中表示,OpenAI 在 AI 领域领先竞争对手约两年之久。

也正是这种相对宽松的竞争环境,使得 OpenAI 能够专注于开发 ChatGPT。

然而,当前形势攻守易形也。

Menlo Ventures 的报告显示,ChatGPT 的市场份额被其他竞争对手逐渐蚕食,从 2023 年的 50% 下降到了 2024 年的 34%。
由「标配」沦为「可选项」,ChatGPT 的光环正在褪去。

这背后的原因显而易见,OpenAI 的「护城河」正被短命狂奔的竞争对手们一寸寸填平。

来自 Artificial Analysis 的调研数据清晰显示,Anthropic 和 Google 等厂商陆续开发出性能接近 GPT-4、OpenAI o1 等新模型。

并且,随着 Scaling Law 触及天花板,核心高管人才相继离场,OpenAI 过往靠单个基础模型赢得的红利正在加速消退。

在动辄以天计的行业里,即便是今日发布的 o3 模型也很难再次创造长达 2 年的空窗期。

尤其是当 Grok-3 和 Claude 等新模型蓄势待发,留给 OpenAI 的时间或许已经不多了。

醒醒,今年最好的 AI 厂商依旧是 OpenAI,但明年或许会因为不同的 AI 方向有无数种答案。

所幸,作为用户的我们,都将是这场变局中最大的赢家。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


亚冬会成为吉利科技生态阅兵场,星纪魅族是 AI 的尖兵

在惯常的认知当中,车企和大型运动会的官方指定用车合作,基本上也就真的局限于「车」本身,给运动员和工作人员提供用车服务,涵盖诸如火炬传递、交通保障、礼宾服务等场景。

但衣食住行作为基本需求场景,当然也都是食不厌精,脍不厌细,出行场景并非上车下车就完事儿,也正如汽车是仅次于房地产的第二大类市场一样,出行服务一样复杂。

比方说,本届哈尔滨亚洲冬季运动会有绿色低碳的办会宗旨,刚好和当下的新能源大势契合,所以吉利作为亚冬会官方指定用车合作方,就提供了甲醇、电混和纯电三种动力的车辆。其中甲醇服务车数量为 350 辆,占总服务用车数量的三分之一以上,另外,吉利还将在哈尔滨建设完善甲醇加注网络,为后续清洁能源汽车的持续运营做了基建工作。

这是车和能源形式,以及绿色低碳的关系,另外吉利亚冬服务车队也着重提到了技术含量:

  • 吉利自研的「吉利星座」,通过航天通讯科技,为亚冬会车辆的精准调度与安全运行保驾护航
  • 银河星舰 7 搭载雷神 EM-i 超级电混,率先将 AI 技术应用到动力领域
  • 吉利天地云一体化智能网,由吉利星睿智算中心的算力赋能,实现智慧能量管理、智慧运动控制和智慧云诊断
  • 极氪车型搭载浩瀚智驾 2.0,驾驶辅助功能可以在亚冬场馆内智能规划路线
  • 领克车型搭载 Flyme Auto 智能座舱,可实现车机端、手机端的无感融合
  • 司机配有星纪魅族智能眼镜,可以实现多国语言同传、AR 导航等功能

有意思的是,这一次亚冬会官方指定用车交付仪式的场地,选在了台州吉利卫星超级工厂,950 辆亚冬服务用车来自吉利控股旗下吉利、领克、极氪、翼真、雷达等品牌。

此外,还有吉利控股旗下的时空道宇、耀出行、小灵狗、星纪魅族等企业则贡献了各种保障服务。

完全可以说,这一届亚冬会赛场之外的场地,是吉利生态的一次阅兵,从天上的卫星,到远处的智算中心,到手上的方向盘,和头上的智能眼镜,以及车机内的系统与 AI,以及能源、动力和智驾层面的新技术,横跨了空间和软硬件,可以说,国内几乎再难找到第二家企业有如此大的生态跨度了。

上面说的是生态的宏观,我们也可以聊一聊生态的微观层面,比如星纪魅族,一家不造车的公司,如何在这个合作中占据重要的生态位置。

StarV Air2 是星纪魅族推出的智能 AR 眼镜,它采用了光波导显示方案,这种方案可以在镜片上投射显示 AR 内容,同时用户又能完整地观察现实世界。它的入眼峰值亮度可达 2000 nits,同时搭载自适应亮度调节功能,光线传感器范围涵盖 0~50000 lux 光线环境,20 级亮度自动调节,户外强光环境下,依旧可以正常使用,哪怕是冰天雪地,日光反射强烈的哈尔滨也没问题。

而 AI+AR 的技术组合,则让这种类型的产品有了质变,除了显示信息,接打电话,导航指引等功能之外,和 AI 大模型的耦合,让 StarV Air2 智能 AR 眼镜可以做到通话/现场录音,录音转文本,中英文纪要生成和编辑搜索等会议场景的核心功能。

日常和工作场景中,AI 助手可以提供知识问答,智慧提醒(航班提醒,网约车提醒,待办提醒等),提词器,导航等等等功能。

具体到亚冬会上,面对外国友人的不同语言,StarV Air2 智能 AR 眼镜则能够帮助工作人员,尤其是司机完成面对面对话翻译,支持的语言有中、英、日、俄、法、西、越、马来、印尼、泰、韩、意、德这 13 种语言,基本涵盖了亚洲的主流语言,哪怕双方都不会中文或者英文,交流起来也没有大碍。

与之搭配的,星纪魅族还为亚冬会服务车队提供了魅族 21 PRO、魅族 Lucky 08、魅族 20 INFINITY 等 AI 终端。

而与手机搭配的,则是 FlymeAuto 智能座舱,这次亚冬会的服务车队中,吉利旗下的领克 07、08、银河 E5、E8、星舰 7、吉利星瑞、星愿、翼真 L380 等品牌车型都搭载了这个座舱系统。

亚冬会不仅是各国运动员交流竞技的舞台,也是对外展示的窗口,作为目前国内评价最好的座舱系统之一,FlymeAuto 目前已经接入领克、吉利银河等多个品牌的 19 款车型,目前搭载上市车型最多的智能座舱操作系统之一。也就是说,在这次亚冬会期间,不少国外运动员和工作人员,可以近距离地感受到国内新能源化、智能化和网联化的进度,从整车、到智驾再到座舱等多个层面,体验国产新能源的成熟度。

在以往,我们讨论智能的时候,总会聊起「中枢」的概念,车手互联,到底车是智能中枢,还是手机是智能中枢,亦或是人才是那个中枢,现在智能 AR 眼镜加入进来,AI 大模型又运行在云端,难道中枢是在别处?

亚冬会官方指定用车交付仪式,一定程度上回应了这个问题,独木不成林,森林若只有树,那也不算生态。完整的森林生态,不仅包括树木,也还有灌木,草本和藤本植物,当然也有各种动物,以及微生物,还有真菌和地衣来分解有机物质,维持养分循环。

宏观的,微观的,外在的,内在的,硬件的,软件的,方方面面结合在一起,才是生态。

多年以前,Flyme 是魅族手机系统的名字,而现在,Flyme 还是座舱系统的名字,以及吉利无界之声 AI 智能音响系统 Flyme Sound 的名字,命名的扩大化,其实也是生态的发展。

上到卫星通信,细到智能 AR 眼镜,再到看不见的 AI 大模型,数据和服务在实体的汽车、手机和眼镜之间流转,魅族也完成了从魅族到星纪魅族的转变,AI 则是这场转变当中,决定性的技术。

正如前面所言,之前的 AR 眼镜仅靠 AR 特性,碍于产品形态和算力的原因,很难有刚需场景和杀手级功能,但 AI 的加入,就开始让这个品类步入起飞的节奏,无论是海外的 Meta 眼镜,还是国内各种尝试,基本上都在和 AI 或者即将和 AI 发生关系。

当然,除此之外,硬件本身的进步也是重要诱因,比如 StarV Air2 的核心元器件「蜂鸟 Mini II」单绿色光引擎,相比于上代引擎,体积缩小 50%,重量减轻 50%,峰值光通量提升 80%。

这就是这场亚冬会官方指定用车交付仪式有意思的地方,虽然说是交付车辆,但现在汽车的内涵和外延都比之前更加丰富,在用车这个核心场景里,「服务」不再局限于把用户从 A 点送到 B 点,而是在 A 点之前,B 点之后,还有 A 到 B 之间的所有行程都可以融入「服务」的概念。

这种「服务」可以是 StarV Air2 智能 AR 眼镜的无障碍的翻译,是 Flyme Auto 智能座舱的座椅加热座椅按摩,是 Flyme Sound 的音效……

自此,亚冬会的另一个关键词「智能」也呼之欲出,而这个关键词,则是由整个吉利科技生态成就,尤以其中的 AI 能力最为先锋,而 AI 能力的最有想象力载体,就是 StarV Air2 智能 AR 眼镜。

在命运的塑料大棚里,每棵被喷了过多农药的白菜心中,都曾经有一个成为无公害有机蔬菜的梦想。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


爱范儿明日产品榜单 2024 评委阵容官宣,他们眼中的明日产品是什么

Tomorrow’s Product Award 是由数字潮牌爱范儿面向趋势消费者打造的年度榜单,旨在发掘过去一年最具标杆意义的「明日产品」。

爱范儿团队联合全球意见领袖,在消费电子、智能出行和人工智能三大前沿领域进行提名并评选,致敬推动行业进步与时代变革的杰出之作。

今天,Tomorrow’s Product Award 的评委正式公布,我们也和这些来自不同领域的创造者,聊了聊什么是「明日产品」。

Tomorrow’s Product Award 评选标准

  • 创新:借助新技术、新设计带来显著的效率和体验提升
  • 改变:重塑行业或生活方式
  • 普惠:具有持续发展并影响更多人的潜力

爱范儿将联合陪审团对所有入围产品进行评选,于 2024 年 12 月下旬揭晓完整榜单,敬请关注。

陈坤:明日的产品是 AI 时代的 Word。
范阳:人工智能时代的「明日产品」应聚焦于一个「更高分辨率」的世界里,提升人与人、人与环境以及人与其他生物之间的沟通分辨率(Communication Resolution)。
费俊:明日产品能够帮助我们拓展认知边界,改变我们的创造力方式。
何宗丞:明日产品是时代的尺度。
胡延平:明日产品应该符合 S 融合感知- I 独立智能- C 耦合连接- A 时空行动-S 协约协同这五个特征,能够帮助每个人成为数智人、超级个体的强智能产品。
李继刚:明日产品让人因它更高效、更强大,而且人人可用。
梁宁:明日产品创造了新功能、新情绪和新资产。
林嘉澍(flypig):明日产品首先应该是「future-proof」,在未来这个东西不会过时。
刘梦霏:明日产品一定是从今日出发的,而且一定要在带来新可能性的前提下普惠公众。
刘知远:明日产品,是理解技术的价值,洞察人的需求,成为恰到好处的创造,并且遵循人性。
慕明:明日产品是对未来需求的预演或原型开发,基于对现实的敏锐观察和对未来可能性的深刻洞察。
朋克周(周子杭):明日产品是让人爱不释手、越用越离不开的产品,不在于技术多先进,而在于真正解决用户痛点,改变生活方式。
拼命玩三郎:明日产品是让我希望 Yesterday 不再 once more 的产品。
沈义人:不同的产品有不同的使命,101% 完成使命的产品就是好产品,而明日产品是能引领使用习惯的产品。
田飞:明日产品站在人的视角,解决今天的问题,看到明天的无限可能
王华东:明日产品应该是交互上是让人眼前一亮,功能上也极大地解决此前没解决好的问题。
王伟兴:明日产品与初始市场份额无关,它关乎用户持续的心智和未来的想象。
俞挺:明日产品就是上手就丢不掉的产品。
赵赛坡:明日产品是对人类未来的恰当诠释。
爱范儿,让未来触手可及。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


苹果国行 AI 会选谁?字节、腾讯还是智谱/小米:特斯拉厂长没来我们这/微信上线「送礼物」功能

cover

🍏

苹果在华 AI 或接入字节、腾讯、智谱

💻

OpenAI 展示全新桌面版 ChatGPT

🚀

Google 版 o1 重磅推出

📱

苹果停止打造 iPhone 硬件订阅服务

🧩

宁德时代或将赴港上市

🎮

索尼官宣成为角川集团最大股东

🔍

图森未来更名,从自动驾驶跨入 AI 赛道

🦾

初创公司 Odyssey 推出 AI 工具 Explorer

🆓

GitHub Copilot 免费版登陆 VS Code

🎁

微信小店将支持「送礼物」给好友

🧲

消息称极越员工获「n+1」赔偿

🏭

小米王化否认特斯拉厂长跳槽小米

🐜

蚂蚁集团否认上市计划

💡

库克:高阶 AI 应该像多点触控一样普及开来

重磅

苹果在华 AI 或接入字节、腾讯、智谱

近日,据路透社报道,苹果目前正就国行 iPhone 整合 AI 模型事宜与腾讯和字节跳动展开谈判。

近期苹果已在海外推出 Apple Intelligence,但目前苹果官网显示,Apple 智能在中国市场的具体推出时间取决于监管部门的审批情况。此前也有报道称,苹果曾与百度就在中国市场使用其 AI 模型进行谈判,计划使用其最先进的文心大模型 4.0 为旗下 iPhone、Mac 和 iPad 等设备提供生成式 AI 服务。

近年来,中国各大科技公司陆续推出 AI 助手,其中就包括腾讯的元宝、字节跳动的豆包等。报道称,消息人士表示,苹果与腾讯以及字节跳动的谈判目前仍处于初期阶段。由于谈判尚未公开,这些知情人士要求匿名。截至发稿前,字节跳动拒绝置评,苹果和腾讯也未立即回应置评请求。

同日,第一财经获悉,苹果也在与智谱就国行 iPhone 中使用其大模型进行谈判。智谱于 10 月推出了能够代用户操作手机的智能体 AutoGLM,可以根据用户的口头吩咐完成一系列复杂操作。12 月 17 日,智谱刚刚宣布完成一轮 30 亿元融资。

大公司

OpenAI 展示全新桌面版 ChatGPT

今天凌晨,OpenAI 发布会重点展示了桌面版 ChatGPT 与 Mac 应用的深度集成能力。

据官方介绍,全新桌面版 ChatGPT 将超越单纯的问答,能够通过与 30 多种应用协作来辅助提升用户的写作和编程能力。同时也放出了所支持的程序名单,如 Apple Notes、Notion、Xcode、VS Code、Warp 等应用程序程序。

使用方式十分简单,用户只需确保目标应用正在运行,然后在 ChatGPT 聊天栏中点击「与应用协作」(Work With Apps)按钮并选择相应应用即可。

目前,上述提到的新功能已在 macOS ChatGPT 最新版本中上线,而 Windows 版本很快也会推出。发布会最后,OpenAI CPO Kevin Weil 还预告明天将会发布「令人兴奋」的新产品。

Google 版 o1 重磅推出

今天凌晨,Google 重磅推出了 Gemini 2.0 Flash Thinking 模型。

新的 Thinking 模型支持多模态推理,使用类似 o1 模型的慢思维思考方式,可以深度可视化展示整个思维链过程,尤其是在执行数学、编程等复杂问题方面,能持续输出全部推理过程,而不是直接给出答案。

据悉,在大模型排行榜 LMSYS 上,所有综合类别指标中显示,目前 Gemini 2.0 Flash Thinking 排名第一,包括数学、代码、指令跟随、长 QA、创意写作等等各方面。

目前在Google AI Studio 就可以免费使用 Gemini 2.0 Flash Thinking。

此外,近日据 TechCrunch 报道,Google 针对其大型语言模型 Gemini 回复内容的外包审核流程进行了一项调整,引发了外界对其在敏感领域信息准确性的担忧。

此项调整要求外包人员审核流程不再像以往那样,因自身专业知识不足而跳过某些特定的审核任务,这或将导致 Gemini 在医疗保健等高度专业性领域的信息输出出现偏差。

为改进 Gemini,Google 与其外包公司日立旗下的 GlobalLogic 合作,由后者雇佣的合同工负责审核人工智能生成的回复,审核标准包括「真实性」等因素。此前,如果审核员认为某个问题超出了自身专业领域,例如一个关于心脏病学的专业问题,而审核员本身并无相关科学背景,他们可以选择「跳过」该回应,并避免审核该回应内容。

苹果停止打造 iPhone 硬件订阅服务

据彭博社记者 Mark Gurman 的报道指出,有知情人士透露,苹果已暂停推出 iPhone 硬件订阅服务项目,放弃了改变消费者购买其旗舰产品方式的尝试。

早在 2022 年,彭博社就曾报道过 iPhone 硬件订阅服务,并且指出该计划定于当年年底推出。不过,在遭遇了软件漏洞和监管问题等诸多挫折后,最终被推迟到 2023 年甚至更晚。

报道指出, iPhone 硬件订阅服务项目,是想让用户拥有一部 iPhone 就像订阅应用一样:消费者每月支付费用,每年更换新手机。

在停止这个项目后,负责该项目的原团队已被解散并且被重新分配到其他项目。

宁德时代或将赴港上市

近日,据彭博社透露,国内动力电池巨头宁德时代正考虑在香港进行第二次上市,预计筹集资金至少达到50亿美元。

据知情人士表示,宁德时代目前正与多家潜在顾问机构进行深入沟通,探讨上市的具体事宜。如果一切顺利,宁德时代最早可能于 2025 年上半年在香港市场完成第二次上市。此次融资规模若能如愿达到 50 亿美元,将一举超越美的集团在今年 9 月份以 46 亿美元完成的上市规模,成为继快手科技去年初募集 62 亿美元后,香港市场上最大的一次股票发行。

此前,2018 年 6 月 11 日,宁德时代首次在深交所上市,其 2024 年第三季度营收 922.78 亿元,同比下降 12.48%;第三季度净利润 131.36 亿元,同比增长 25.97%。

索尼官宣成为角川集团最大股东

12 月 19 日,索尼正式宣布以 500 亿日元收购角川集团,并成为角川最大股东。

索尼本次与角川签订战略性资本业务合作协议,计划于 2025 年 1 月 7 日通过第三方分配协议收购角川公司 12,054,100 股新股,金额约为 500 亿日元;连同 2021 年2 月获得的股份,此次收购后索尼集团将成为角川公司的最大股东,持有约 10% 的股份。

角川首席执行官夏野刚表示,非常高兴与索尼达成这项资本和商业联盟协议,并称这项联盟不仅有望进一步增强索尼与角川的知识产权创造能力,而且还将在索尼对全球扩张的支持下增加角川的知识产权媒体组合选项。

今后,两家公司计划讨论具体的合作计划,例如将角川的 IP 改编为全球真人电影和电视剧,共同制作动漫作品,通过索尼集团扩大角川动漫作品的全球发行,进一步扩大角川游戏的出版,以及开发人力资源以促进和扩大虚拟制作。

图森未来更名,从自动驾驶跨入 AI 赛道

12 月 19 日,图森未来宣布,正式启用全新品牌 CreateAI,并发布多项在生成式 AI 领域的重大进展。

CreateAI 宣布获著名武侠 IP《金庸群侠传》正版授权,将开发一款大型武侠开放世界 RPG 游戏。CreateAI还将与著名动画导演河森正治,以及顶级动画制作公司株式会社白组展开合作,利用 AIGC 技术推动创作者在展示宏大宇宙文明方面实现更多突破。

与此同时,CreateAI 还发布了其首个大模型产品「Ruyi」,该模型定位于开源图生视频领域。作为其自研 AI 基础设施的底层核心,公司将基于「Ruyi」打造多个针对游戏和动画制作的 AI 生成式工具。

图森未来总裁兼 CEO 吕程曾表示,公司并无计划退出交通运输行业,将通过技术合作和授权,继续推动自动驾驶技术实现商业化。

图森未来成立于 2015 年 9 月,专注于大型货运卡车自动驾驶系统自主研发,创立初衷在于以 L4 级别(SAE 标准)的无人驾驶卡车技术为全球物流运输行业赋能。2019 年 6 月,图森未来入选「2019 福布斯中国最具创新力企业榜」。

初创公司 Odyssey 推出 AI 工具 Explorer

近日,自动驾驶领域先驱 Oliver Cameron 和 Jeff Hawke 创立的初创公司 Odyssey 推出了一款名为 Explorer 的 AI 驱动工具,可将文本或图像转换为 3D 渲染场景。

Odyssey 声称,其工具尤其擅长创建逼真的场景,这主要归功于其独特的技术方法:Explorer 的 AI 模型接受了由该公司定制的 360 度背包式相机系统捕捉的真实世界景观的训练。

Explorer 在某些方面与 DeepMind、World Labs 和以色列初创公司 Decart 近期演示的「世界模型」类似,只需输入所需要生成内容的相关描述,Explorer 便可生成可交互的实时场景。

Odyssey 表示,Explorer 生成的任何场景都可以加载到 Unreal Engine、Blender 和 Adobe After Effects 等创作工具中进行手动编辑。

Odyssey 也承认 Explorer 目前存在一些局限性,如该工具平均需要 10 分钟才能生成场景,且场景分辨率相对较低,并且存在一些明显的视觉伪影。

Odyssey 表示,已向英国的 Garden Studios 等制作公司和更多独立艺术家提供了 Explorer 的试用版本,并已在其博客上开放了申请通道。

GitHub Copilot 免费版登陆 VS Code

12 月 19 日,GitHub 发文宣布,GitHub Copilot Free 免费订阅,开发者可以在 Visual Studio Code 代码编辑器中,免费使用 GitHub Copilot AI 服务。

此前,GitHub 宣布其平台开发人员数量突破 1.5 亿,而本次免费开放,意味着全球 1.5 亿开发者能在 VS Code 中体验 AI 辅助编程的强大功能。

开发者通过 GitHub Copilot Free 免费订阅,可以选择 Anthropic 的 Claude 3.5 Sonnet 或 OpenAI 的 GPT-4o 模型,每月可以调用 2000 次生成和补全代码,以及 50 次聊天信息,要求其回答编程问题、解释现有代码、排查代码 BUG、跨文件执行编辑等,此外还支持 Copilot 的第三方智能体。

微信小店将支持「送礼物」给好友

日前,微信小店官方上线并灰度测试「送礼物」功能。

根据官方介绍,微信小店的「送礼物」功能支持除珠宝、教育培训类外的其他商品,用户可通过 「送给朋友」 操作,选择款式和金额后确认礼物并支付,礼物将自动发送给朋友。朋友收到礼物后可填写地址并确认收下,也可选择其他价格相同的款式。确认收礼后,可在微信的订单与卡包中查看相关订单。

微信小店官方也给出了相关的注意事项:

  • 目前商品单价限制为商品款式原价不得高于 1 万元。
  • 每次只能给一位朋友赠送一件商品,赠送后不支持转赠给其他朋友。
  • 一旦送出礼物(以礼物消息成功发送给接收方为准),不论朋友是否收下礼物,赠送方在 24 小时内都无法主动取消赠送或取消订单。
  • 若朋友超过 24 小时未收下礼物(以打开礼物消息并轻触「收下礼物」为准),订单将自动取消并退款给赠送方,退款将按订单支付时的渠道原路返回。

消息称极越员工获「n+1」赔偿

据 21 世纪经济报道记者独家报道,在有关部门进行协调后,极越将按照「N+1」的标准为员工提供经济补偿。

同时,工资结算至 2024 年 12 月 20 日,公司将给员工的社会保险和公积金缴纳至 2024年 12 月,并在人社部门要求的办理时间前办理缴纳完成。

而关于履行方式与时间,报道指出会在相关政府部门的指导和见证下,建立监管共管账户,代集度公司于 2025 年 1 月 20 日之前支付工资及经济补偿垫付资金由百度、吉利打入。

小米王化否认特斯拉厂长跳槽小米

12 月 19 日,小米公关部总经理王化发文,否认了特斯拉上海工厂厂长跳槽小米汽车。

此前,有报道称特斯拉上海工厂厂长宋钢离职,并计划加入一家目前正处在产能瓶颈的本土新兴汽车品牌。不少人猜测宋钢将加入小米汽车。

王化对此回应,「大家都在传的宋厂长确实很好,不过我们小米汽车工厂的季厂长也很优秀,足矣!」。

同日,有消息称,宋钢将加入中国能源企业远景集团(Envision),在其中承担供应链管理职责。而特斯拉上海工厂厂长一职,将由特斯拉的汽车与零件质量高级总监费文进接任。

蚂蚁集团否认上市计划

12 月 19 日消息,蚂蚁集团官方微博发文,回应近期网传「蚂蚁集团即将借壳上市」的消息。

官方表示,蚂蚁集团目前没有上市计划,更不存在所谓的「借壳上市」,请大家注意甄别,警惕「荐股」类骗局,避免财产损失。

此前,蚂蚁集团曾于 2020 年 7 月 20 日宣布启动上市计划,计划将在科创板和港交所同时上市。但同年 11 月 3 日,上海证券交易所发布决定,暂缓蚂蚁集团在上交所科创板上市。同日,蚂蚁集团宣布暂缓在港交所上市。

今年 12 月 18 日,蚂蚁集团传出大消息。蚂蚁集团董事长兼 CEO 井贤栋通过全员信宣布,蚂蚁集团总裁韩歆毅将从2025 年 3 月 1 日起正式接任蚂蚁集团 CEO 一职,全面负责蚂蚁的各项业务及日常管理工作,向井贤栋及董事会汇报。

💡 库克:高阶 AI 应该像多点触控一样普及开来

近日,苹果 CEO 库克接受了 WIRED 的采访,并以 Apple Intelligence 为中心,分享了多个观点。

库克提到,更高级的 AI 应该如同「多点触控推动智能手机发展」一样,普及到各个产品或层面来,因此苹果将不会对 AI 服务进行收费。并且他提到,AI 虽然帮助用户生成更多有趣的内容,但想法和观点依然来自用户,因此 AI 帮助用户生成内容,并不会让沟通的本质退化。

当提及「是否会为了 AI 能力而牺牲用户隐私」时,库克明确表示用户的隐私至上,并且不会在隐私与 AI 能力上做出权衡。库克还提到,对于超人类能力的 AI,有必要对其作出限制或者安全控制,而作出的限制,也必须是深思熟虑。

采访中库克还提到自己对于数码产品使用的看法,他表示,虽然手机等设备对人类产生了很大影响,但也需要有意地限制自身使用的时长,当看手机的时间多过注视他人的眼睛,那就是一个需要反思的问题了。

新产品

一加 Ace5 系列官宣 12 月 26 日发布

12 月 19 日,一加官方宣布一加 Ace5 系列将于 12 月 26 日发布。

一加 Ace5 和一加 Ace5 Pro 分别提供 3 款配色(共 5 款),其中 2 款配色为陶瓷材质后盖。新机均采用前后直板+直角中框设计。配置方面,一加 Ace5 标准版搭载第三代骁龙 8,Pro 版搭载骁龙 8 至尊版,均拥有「风驰游戏内核」技术,均搭载第二代「东方屏」和新一代冰川电池。

此次发布会还将带来全新一加平板和一加 Buds Ace 2 真无线降噪耳机,同时一加官方公布了一加 Ace5 系列首席电竞官 Uzi 简自豪。

智界 R7 增程版上市

12 月 19 日,智界 R7 增程版上市,24.98 万元起。

据官方介绍,智界 R7 增程版搭载首发华为雪鸮智能静音增程技术和新一代智能增程系统,CLTC 纯电续航 251km(增程版 Max);CLTC 满油满电综合续航 1570km(增程版 Max)。

新车提供「增程版 Pro」和「增程版 Max」两个版本,售价分别为 24.98 万元和 28.98 万元。

水月雨头戴耳机「羽翼Edge」即将上线

12 月 19 日,水月雨公布便携式头戴耳机「羽翼 Edge」,并将于 12 月 20 日上线。

羽翼 Edge 采用可伸缩折叠金属头梁以及惰性海绵填充的非平面耳垫,搭载 40mm 大动态动圈单元,支持 LDAC 音频编解码,内置 5 种预设调音,并拥有全新自然音色解决方案。支持混合式主动降噪,搭载四颗高灵敏度麦克风和大尺寸板载天线。

新机售价 399 元,灰色先行上架,米色后续上架;将于 12 月 20 日开启预售。首发立减 20 元,并赠送水月友希表情包小立牌一套(共 5 款),优惠活动 12 月 23 日 10:00 截止。

新消费

奈雪的茶 × 魔卡少女樱联名正式上市

12 月 19 日,奈雪的茶 × 魔卡少女樱联名正式上市。

本次联名带来「霸气红苹果车厘子」系列饮品,「小樱&知世」车厘子蛋糕、「小可&斯比」星星小贝等甜品一同上市。同时提供联名主题杯、联名包装袋、主题光栅卡、主题贺卡等联名周边。

《失落之魂》最新宣传片公布

近日,PlayStation 中国 10 周年庆典上,《失落之魂》最新宣传片公布。

《失落之魂》由 Ultizero games 制作,PlayStation 发行。据官方介绍,游戏中,玩家将踏上史诗般的冒险之旅,在游戏中从异次元入侵者手中拯救主角的妹妹和全人类。

游戏将于 2025 年登陆 PS5 主机与 PC 平台,目前已在 Steam 上架。

《黎明杀机》手游将于 2025 年 3 月 20 日停服

近日,《黎明杀机》团队发布公告,宣布《黎明杀机》手游版将于 2025 年 1 月 16 日从苹果 App Store 和谷歌 Play Store 下架,并将于 3 月 20 日完全停止运营。

公告中提到,《黎明杀机》手游玩家可转移至 PC 或主机平台继续游戏,并可领取 「欢迎礼包」 及额外奖励,其中包括 50 万血点和 2250 虹彩碎片。此外,官方还为手游玩家提供了额外的金细胞、虹彩碎片和血点奖励,将根据玩家在手游中的消费金额和经验值计算得出。

《黎明杀机》是一款多人恐怖和动作游戏,在其中一个无情的杀手追捕四名试图逃避可怕死亡的幸存者,其手游版本于 2020 年春季正式推出。

好看的

《星际宝贝》真人电影将联动《狮子王》

日前,迪士尼的《星际宝贝》真人电影发布新先导预告,同时将联动《狮子王:木法沙传奇》。

该片改编自 2002 年动画电影,讲述孤独的夏威夷小女孩莉萝和看起来调皮捣蛋的外星生物史迪仔的冒险故事。

该片迪恩·弗雷斯彻-坎普(《穿鞋子的贝壳马塞尔》)执导,玛雅·基洛哈饰演莉萝,西德妮·阿古顿饰演饰演莉萝的姐姐兰莉,扎克·加利凡纳基斯配音独眼霹雳,比利·马格努森等也出演,史迪仔为电脑 CG 打造。

该片明年 5 月 23 日北美上映。

《不说话的爱》将于 2025 年上映

12 月 19 日,电影《不说话的爱》发布先导海报和贴片预告视频,并预计于 2025 年上映。

张艺兴挑战出演聋人父亲,影片中全程使用手语,并与李珞桉搭档父女。影片改编自沙漠执导的同名短片,讲述聋人小马和听人女儿木木彼此为伴一起生活,然而一场意外的发生,不仅让小马后悔莫及,也让木木暗暗做了一个惊人的决定。

《电幻国度》发布正式预告

近日,科幻动作冒险片《电幻国度》发布正式预告。

该片背景设定在洋溢未来风格的过往年代,主角 Michelle 是个失去双亲的青少女,为了寻找失踪的弟弟,踏上穿越美国西部的旅程,与她相伴同行的是个来历成谜的可爱机器人,以及一名古怪的流浪客。

影片改编自瑞典艺术家、设计师西蒙·斯塔伦海格的同名热门漫画,原作重新构想了90年代中期美国西部的低科技世界末日。《电幻国度》由罗素兄弟执导,米莉·波比·布朗、克里斯·帕拉特、关继威等人出演。

该片将于 2025 年 3 月 14 日上线 Netflix。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


科技爱好者周刊(第 330 期):李开复梳理人工智能

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

上个月正式开放的杭州良渚玉湖公园,公园的设计象征良渚文化和运河文化的连接。(via

李开复梳理人工智能

前些日子,我读了李开复老师的两本书:《AI·未来》(浙江人民出版社,2018)和《AI·未来进行式》(浙江人民出版社,2022)。

这两本书都是面向社会大众解释 AI,不是技术类书籍,但是有一些段落,阐述 AI 概念。

李开复老师用通俗的语言来解释,人工智能、机器学习、神经网络、深度学习......这些词到底是什么意思?彼此有什么关系?

我觉得,这些介绍对理解 AI 的体系,挺有启发的。它们分散在各个章节,我将它们整理在一起。

为了行文连贯,我没有完全照搬原文,而是用自己的语言重新叙述,如果有错误,也归咎我。

(1)人工智能

1956年夏天,计算机科学家约翰·麦卡锡(John McCarthy)首次提出"人工智能"(AI)这个概念。

人工智能指的是,通过软件和硬件,来完成通常需要人类智能才能完成的任务。它的研究对象,就是在机器上模拟人类智能。

(2)机器学习

早期,人工智能研究分成两个阵营。

第一个阵营是规则式(rule-based)方法,又称专家系统(expert systems),指的是人类写好一系列逻辑规则,来教导计算机如何思考。

可想而知,对于复杂的、大规模的现实问题,很难写出完备的、明确的规则。所以,这种方法的进展一直很有限。

第二个阵营就是机器学习(machine learning),指的是没有预置的规则,只是把材料提供给计算机,让机器通过自我学习,自己发现规则,给出结果。

(3)神经网络

神经网络(neural network)是机器学习的一种主要形式。

神经网络就是在机器上模拟人脑的结构,构建类似生物神经元的计算网络来处理信息。

一个计算节点就是一个神经元,大量的计算节点组成网络,进行协同计算。

神经网络需要极大的算力,以及海量的训练材料。以前,这是难以做到的,所以20世纪70年代开始,就陷入了停滞,长期没有进展。

(4)深度学习

深度学习是神经网络的一种实现方法,在20世纪80年代由杰弗里·辛顿提出。它让神经网络研究重新复活。

深度学习是一种让多层神经元可以进行有效计算的方法,大大提高了神经网络的性能。"深度学习"这个名字,就是比喻多层神经元的自主学习过程。

多层神经元包括一个输入层和一个输出层,它们之间有很多中间层(又称隐藏层)。以前,计算机算力有限,只能支撑一两个中间层,深度学习使得我们可以构建成千上万个中间层的网络,具有极大的"深度"。

(5)Transformer

早些年,深度学习用到的方法是卷积神经网络(CNN)和循环神经网络(RNN)。

2017年,谷歌的研究人员发明了一种新的深度学习处理方法,叫做 Transformer(转换器)。

Transformer 不同于以前的方法,不再一个个处理输入的单词,而是一次性处理整个输入,对每个词分配不同的权重。

这种方法直接导致了2022年 ChatGPT 和后来无数生成式 AI 模型的诞生,是神经网络和深度学习目前的主流方法。

由于基于 Transformer 的模型需要一次性处理整个输入,所以都有"上下文大小"这个指标,指的是一次可以处理的最大输入。

比如,GPT-4 Turbo 的上下文是 128k 个 Token,相当于一次性读取超过300页的文本。上下文越大,模型能够考虑的信息就越多,生成的回答也就越相关和连贯,相应地,所需要的算力也就越多。

豆包 MarsCode 动手实验室(杭州站)

先提一下,上周说的全国 AI 编程挑战赛

应用赛道的作品提交,从12月16日已经开始了,大家可以上传自己用 AI 完成的作品了。

算法赛道目前还在报名中,只要你有信心,在 AI 的辅助下解出算法题,不妨报名试试,也是一种体验和锻炼。

比赛规则和报名链接,请访问这里,也可以看上周的周刊。

(此处有分隔线)

本周介绍的活动,是12月28日(星期六)下午两点,在杭州的字节工区举行的豆包 MarsCode 动手实验室

到时,大家可以现场深度体验豆包 MarsCode 的 AI 编程能力,并跟字节的同学当面交流。在动手环节,你可以用 AI 实现自己的创意。如果你的作品很优秀,还有机会直通 AI 编程挑战赛的决赛。

活动的详细介绍,以及报名链接,请访问这里

科技动态

1、硬盘打孔机

硬盘报废时,一般需要擦除数据。最保险的方法,莫过于物理破坏硬盘。

但是,这样很费事,你要找把锤子,把硬盘敲碎了。

为了解决这个问题,一家日本公司推出了"硬盘打孔机"。这种机器可以在硬盘上轻松打四个孔,保证彻底破坏数据。

它采用电动液压系统,产生12吨的压力,足以穿透任何硬盘。

它的尺寸为 410 x 289 x 187 毫米,跟台式电脑差不多大小,但是重达18公斤,适合那些有成千上万硬盘需要销毁的大公司。

2、沙子国际象棋

一位英国设计师用沙子作为材料,3D 打印了一套国际象棋。

他说,这样做只是为了追求一种奇特的感觉。沙子是一种无形且流动的材料,塑造成坚固耐用的东西,让人感到难以把握、随时可能变化。

而且,沙子表面是不光滑的,当你用沙子下棋时,会有真实的、与众不同的触觉。

3、玻璃砖

大家考虑过吗,房子为什么需要墙?难道不能建造一所没有墙、全部是窗户的房子吗?

回答是不能,因为建筑的重量由墙承受,窗户不承受重量。如果把墙全改成窗户,建筑物就会倒塌。

那么,能不能用玻璃来造墙呢?玻璃既可以承重,又可以透光。

麻省理工学院的科学家,最近就发明了这样一种全透明的玻璃砖(上图),根据测试具有跟普通砖相同的承重能力。

除了透光,玻璃砖还有一个好处,可以重新利用。只要高温加热,玻璃砖就会融化,能够塑造成其他形状,还能 3D 打印,但这也导致它不防火。

总的来说,玻璃砖比红砖更环保,在很多场合有推广潜力。

4、其他

(1)本周发生了一笔史上最大的风险投资,AI 公司 Databricks 一次性募集了100亿美元。

(2)GitHub 宣布,编程助手 GitHub Copilot 向所有用户免费开放。

(3)OpenAI 推出了免费电话 1-800-ChatGPT,北美用户可以拨打该电话,跟 AI 语音聊天,每月额度为15分钟。

(4)小米官方开始支持,小米物联网设备接入智能家居管理助手 Home Assistant。

文章

1、汇编语言的一点入门介绍(中文)

这篇短文通俗解释了汇编语言的基本概念。

2、CSS 网格区块详解(英文)

这篇长文详细介绍 CSS grid 布局的区块功能(template area)。

3、网页如何插入 JSON-LD 语义数据(中文)

本文详细介绍网页的 JSON-LD 数据块,用来插入机读的语义数据。

4、13个对前端开发有用的 Chrome 插件(英文)

本文介绍13个用于前端开发的 Chrome 插件。

5、谷歌不再是最好的搜索引擎(英文)

本文是一篇新闻分析,作者认为 Perplexity 的 AI 搜索体验已经优于谷歌了。

6、如何为 Windows 添加6个 macOS 最好的功能(英文)

一篇 Windows 使用技巧,教你怎么为 Windows 添加一些 macOS 功能,比如文件浏览器可以文档预览。

工具

1、Presenterm

将 Markdown 文件转成幻灯片,在命令行播放的开源工具。(@lengyijun 投稿)

2、Rslib

制作 JavaScript 软件包的工具,可以直接开发组件库和命令行工具。(@fi3ework 投稿)

3、Midscene.js

AI 驱动的网页 UI 自动化测试框架,通过文字描述,生成 UI 测试用例。(@yuyutaotao 投稿)

4、wechatDataBackup

Windows 桌面 PC 端的微信聊天记录一键导出。(@git-jiadong 投稿)

5、MoeMail

基于 Next.js + Cloudflare 技术栈构建的临时邮箱服务,在线体验。(@beilunyang 投稿)

6、my-github-2024

一个 Python 程序,生成你在2024年的 GitHub 代码提交统计。(@WCY-dt 投稿)

7、Vanilla

Canonical 公司的 CSS 框架,就是 Ubuntu 官网采用的样式。

8、OpenAuth

网页登录的第三方认证的集成库。

9、Schemio

基于 Web 的示意图可视化编辑器。

10、Buzee

一个桌面软件,提供本地文件的全文搜索(包括图片里面的文字),支持 Windows 和 Mac。

AI 相关

1、Hika AI

免费的 AI 搜索。(@atlas-comstock 投稿)

2、Slea.ai

免费的 AI Logo 生成器。(@aaamomo64 投稿)

3、AI 音效生成器

免费生成各种音效,比如雨声、风声。(@aurthur 投稿)

资源

1、SQL 风格指南

一份书写 SQL 语句的风格约定。

2、颜色代码表

在线配色设计工具集,做在一个网站。(@nettsz 投稿)

图片

1、机器蜻蜓

美国首都华盛顿的中央情报局博物馆,有一只上个世纪70年代制造的机器蜻蜓。

它其实是一架微型直升机,飞到目标对象附近,窃听对方的谈话。

这只蜻蜓可以飞200米,然后落下来,通过激光捕捉空气振动,来还原谈话声。

但是,它不防风,也难以控制,所以从来没有实际用过。

2、荷兰的邮资代码

荷兰寄信不用邮票,而是用一种9个字母和数字组成的代码。

你花钱买一个代码,以 3 x 3 的格式写在信封上,就能代替邮票,作为付款证明。

因为代码的有效期只有五天(以邮戳为准),需要购买后及时寄出,被猜到的可能性很小。

文摘

1、没有编程生产力这样的东西

正如马丁·福勒(Martin Fowler)所观察到的那样,程序员的编程生产力无法有效地衡量,因为它不存在。

软件开发并不是一项必然会产生任何东西的活动。

假设你有两个开发人员在同一个项目上工作,并且偶然地,他俩在同一天接受了相同的任务。

甲写了一个1000行的框架,完美地解决了这个问题。代码编写良好,并经过充分测试,每一步都有详细记录。

乙则是当天去了公园,一边喂鸽子一边思考问题,然后漫步回到办公室,删除了100行代码,部署了更改......问题就解决了。

请问谁的生产力更高?

回答是,这不重要。重要的是乙解决了问题,同时降低了团队的长期维护成本。甲也解决了这个问题,但是他通过增加代码,增加了维护成本,因此(在其他条件相同的情况下)他的解决方案较差。

我们能说,乙具有更高的生产力吗?显然,很难找到编程生产力的正确衡量指标。

我认为,优秀的软件开发者所做的就是解决问题。但是,生产力的衡量指标,比如代码、文档、数据等等,都只是解决问题的工具,并不是解决问题本身。

言论

1、

我写 SQLite 的时候,从来没人教过我 B 树的知识。我需要自己实现 B 树,我就从书架取下高德纳的《计算机编程艺术》,找到了 B 树的章节。他描述了算法,我就照着实现。

有趣的是,高德纳详细介绍了搜索 B 树和插入 B 树的算法,没有提供从 B 树删除数据的算法,这是放在本章末尾的练习。所以我在实现自己的 B 树之前,还必须先做完该章的练习。谢谢高德纳,我真的很感激。

-- 理查德·希普《SQLite 不为人知的故事》

2、

瑞典南部的马尔默市,洗一次10分钟的淋浴,电费高达2.65欧元(约20元人民币)。原因是该市接入的是德国电网,德国能源短缺,推高了电价。

-- 《瑞典能源危机》

3、

职业生涯最重要的一课是,你需要认识到,你工作的目的不在于使得公司的客户满意,而在于使得那些控制你的加薪、奖金和晋升的人满意。

-- Hacker News 读者

4、

正在开发的水下无人机技术,会使得以航空母舰为中心的海军战略过时,从而大幅削减军事开支。

举例来说,美国开发的水下无人机 Orca XLUUV,可以携带8吨的有效载荷,行驶数千英里,并且不需要长时间浮出水面。

-- Hacker News 读者

5、

我第一次尝试 MidJourney(文生图工具)和 Suno(文生音乐工具)时,我想知道未来是否每个人都会成为数字艺术家。

很快,我就意识到我没有"创作冲动",即使看过很多别人的创作,我也常常不清楚自己想要创作的东西。

因此,未来的 AI 即使具备无比强大的绘画和编曲能力,还是只有少数人能成为画家和音乐家。程序员也是如此,即使 AI 会编程,也无法人人成为程序员。

-- 《Cursor 深度体验》

往年回顾

没有目的地,向前走(2023 #283)

生活就像一个鱼缸(2022 #233)

腾讯的员工退休福利(2021 #183)

贵州变瑞士,有没有可能?(2020 #133)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年12月20日

把华为全家桶升级成纯血鸿蒙后,我发现了它好用的秘密

纯血鸿蒙公测版发布后,我们把这套系统从头到尾玩儿了半个月。比起之前体验的内测版,公测版的应用更丰富、适配更彻底,功能也更全面。

如果你用的是华为,还是全家桶,又刚好把所有设备都升级到了纯血鸿蒙,那你将会解锁一些新玩儿法。

*以下为视频文字版,内容略有删减:

不知道有多少朋友,在平板或折叠屏上刷 b 站刷微博时,总会感觉有点儿不得劲儿?没错,就是旁边这两块显眼的「留白」。

虽然华为以前通过平行视界,一定程度上缓解了屏幕利用率不足的问题,但还是没能彻底释放大屏浏览的优势,因为绝大部分的 App,都是基于手机屏幕尺寸来设计的。

由于 Android 端品牌太多,平板用户基数小等问题,大家都选择了最省力的方式,有些甚至直接通过暴力拉伸来强行适配。

而纯血鸿蒙终于把大屏该有的样子,或者说本来的样子做了出来。现在小红书、美团、大众,就连最难搞的淘宝,都有了大屏版。

那华为是怎么把这个压轴题给解出来的呢?我们在开发者官网里找到了答案:响应式布局。

当窗口容器大小发生变化时,界面元素可以自动变化,以适应容器大小的变化。

简单说,手机平板,这些终端就像形状各异的锅碗瓢盆,在传统的系统里应用是固体,总会留有缝隙。

而纯血鸿蒙把应用变成了液体,可以自适应不同大小的屏幕尺寸,绝大部分从华为应用商店下载的软件,都能完美适配,当然也有极个别顽固分子。

不仅如此,纯血鸿蒙还为大屏提供了许多实用功能,比如这个自由多窗。

打开后,应用窗口就会变成 PC 端的样子,大小也能无极调节,这对于触控操作的影响不大,甚至有点华而不实。

但当你把键盘、鼠标和手写笔加上,不就成了比轻薄笔记本更轻薄的平板笔记本吗?而且键鼠操作更适合移动办公。

其实这种适配的理念,华为很早就开始布局了,在以前的鸿蒙设备上,就有专为外接屏幕设计的电脑模式,不过有点可惜,目前纯血鸿蒙还没能适配,不知道后续会不会加上,期待一下。

有了适配不同屏幕的能力,就相当于在几块毫不相关的大陆上,建起了互通的桥梁。最能体现自适应互通界面的,就是接续功能。

下班路上手机里没看完的视频,回家拿平板继续放,看得更爽;出门前在平板上没吃完的瓜,直接拿手机打开,一边赶路一边赶进度。

不过目前只有浏览器、备忘录、华为视频这些系统级应用才支持,第三方的软件,可以再期待一下。

当然纯血鸿蒙的设备联动,还不止这些,举个最简单的例子,把照片从这里传到这里,除了用微信,在纯血鸿蒙上还还能通过华为共享、隔空抓取、碰一碰来实现。

碰一碰除了能传图片视频,还分享 Wi-Fi 和主页信息,特效很花哨,但操作很直觉,男女老少一看就会。

互通的除了软件和文件,还有硬件,比如习惯无纸化学习办公的朋友,现在可以调用手机镜头来给笔记添加照片,既方便又高清,不用举个大板子使老大力气,结果拍了个战损版的画质。

除此之外,纯血鸿蒙还继承了多屏协同。把手机放到平板里,文字直接复制,照片直接拖动,只是少了之前的流转功能,有点小遗憾。

体验完搭载了纯血鸿蒙的华为全家桶,我有两个很明显的感受:

第一个是刚才提到的这些功能,都有一定的学习成本,你得愿意用、习惯用,才会觉得真好用;

第二个是体验下来,你不会觉得在用不同的设备,纯血鸿蒙将本没有联系的设备串成了一个整体,而手机、折叠屏、平板都被它变成了连在同一个核心上的尺寸不一的显示屏。

最后 很多朋友也在纠结到底要不要更新升级?说实话,系统很流畅,软件生态也日益丰富,日常应用都有,冷门的也能找到,实在不行还有和安卓市场挂钩的卓易通,以及华为用户出境必备的出境易来兜底,几乎能和鸿蒙 4.2 的应用体验划上等号。

但我觉得还可以再等等,起码等到微信正式上线,或者拿到了内测名额再更也不迟。

关于纯血鸿蒙和全新生态,你还有什么想知道的吗?各位华为的用户,是已经用上了纯血版,还是仍然在观望?

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


舒达智能床体验:怎么科学睡个好觉,这里有个答案

人的一生,总有一样东西贯穿始终——

有人说千金难买,但有人唾手可得;它是最长情的伴侣,也是最难征服的对手;哪怕地球上最有权势的人,也无法将其驾驭,那就是:

睡眠。

问鼎《纽约时报》畅销书榜的《我们为什么要睡觉》里提到:

一晚糟糕的睡眠所造成的身体和精神损害之严重,会让那些因食物和运动缺乏造成的损害相形见绌……睡眠是上天赐予我们对抗死亡的最好方法。

但睡眠好的人大抵相似,失眠者的疑难却千差万别。相比「我们为什么要睡觉」,真正困扰大家的事情其实是「怎样才能睡个好觉」。

自出生起,就有人不断教我们怎么吃喝玩乐,但睡觉这件事,老师也教不来。睡眠是件很私人的事情,千人千面,从不循规蹈矩。

我们对如何科学、舒适地睡眠了解甚少。但睡眠从不应该成为一门玄学。比起人适应床,或许更好的选择是,让床来适应人。

现在,能适应人的床出现了——舒达 iComfort 智能床。

智能床,不止于床

当我们谈到「床」这个词时,脑海中通常会浮现出一个固定画面:四条腿,一块平面,也许还有一个床头板。

但舒达智能床的床体有些不一样,由三部分组成:美妙 Pro 床垫、AI Pro 智能底床和云逸床架——有点像汽车的底盘、车身和座舱,智能床的多结构可动设计,可以带动床垫随心所欲地改变形态。

舒达 iComfort 智能床内置了一套专利动力机电系统,可以带动床垫平稳升降,配合美妙 Pro 的定制床垫,就可以让床头和床尾实现多角度无级抬升。

与此同时,整张床还能保持全程静音运行,实际体验下来,在底床带动床垫无感抬升过程,整体很丝滑平稳。

我试睡了一周的智能床,其中最显著带来的变化,是在于它对于卧室空间的改造。

床,通常是卧室里占地面积最大的物件,一张一米八的大床,几乎占到了十平米主卧的一半,考虑到飘窗、衣柜的占地面积,实际上留给人活动的空间并不多。

很多人绞尽脑汁在螺蛳壳里做道场,但试想一下,如果这个空间中唯一不可舍弃的部件——你的床,不仅能用来睡觉呢?

舒达智能床相当灵活,可以通过手机 App、语音、遥控器等多种方式灵活调整床垫和床架的角度,让其变身躺椅,沙发,甚至是个电影角。

当你睡觉前,可以一键把床调成阅读模式,这时候床头会稍微上抬,刚好是手肘能够靠到床垫的位置,这时候床就变成了一张大躺椅,可以舒舒服服看书或刷手机。

如果床头再往上升一些,一部分床垫就成为靠背,这时候床就成了沙发,躺在卧室就能看电视了:

这让我想起大学看《老友记》的时候,每个人都想有一把 Lazyboy 的躺椅,在闲适时候做一个沙发土豆。

其中,我最喜欢的是「太空减压」模式,这个模式下会同时把床头和床尾抬高,让颈部和腿部的疲劳都能得到舒缓,这时候躺床上,就有点零重力座舱的感觉了。

智能床作为一个创新品类,进入家庭空间的日子并不长,而舒达智能床对于卧室功能边界的拓宽,算得上是一个让人眼前一亮的视角。

比躺着睡、侧着睡更好的,是哄着睡

有过失眠经历的人,大抵都会想到同一个问题:

为什么婴儿睡得香,大人反而睡不着?

造成这个情况的原因有许多,但关键在于有没有人「哄着睡」——婴儿只要有人哄着就能产生睡意,而大人要考虑的就多了。

这是舒达智能床为我带来的第二个显著变化。

▲圣母画像,图片来源:Terranuova Madonna (c.1505) by Raphael

「一键哄睡」是舒达智能床一个比较有意思的功能,在一个十来分钟的短周期内,通过四段式的智能助眠系统,帮助你快速培养睡意,进入睡眠状态。

开启「一键哄睡」后,舒达智能床首先会模拟太空失重状态,帮助身体放松,促进脚腿部血液回流至心脏,配合按摩震动,来缓解身体的疲劳感;紧接着,智能床会模仿婴儿摇篮的方式,适度摇摆床身,来营造一种入睡的节奏;之后,床会模拟悬浮状态,来让身体进一步放松;最后,轻缓平稳放平床体,这时候人差不多就已经睡着了。

我想对于大部分人而言,这个哄睡过程是均匀且可接受的,我们试着放了一瓶水在床上,在整个床体摇晃的过程中,基本上水面也不会有太大晃动:

「一键哄睡」最巧妙的地方在于,通过这样一套由「床」来执行的动作,实现了一种入睡的仪式感。

打开这个模式后,原本很方便刷手机看电视的床,变得不那么方便了,相当于进入到一个半强制睡眠的状态,而顺着智能床的摇晃节奏,身心都会慢慢放松下来。睡觉,也就成了一件理所当然的事情。

智能睡眠,是舒达智能床传递的一种产品设计理念——如果你不想睡觉,而是想刷手机或看电影,那么床也能给你提供最合适的支撑,倘若你这时候想睡觉了,那么床就应该给你营造最合适的环境。

让睡觉,成为一件自然的事。

这一点,从舒达智能床的睡眠监测功能上也能看到一脉相承的地方。

舒达 iComfort 智能床内置了 AI Dream 引擎,通过专为睡眠场景调试的 AI 大模型来提供更细致的睡眠监测服务,可以说这个床本身,就是一个巨大的 AI 硬件。

从前,我们习惯把手机放在床头或戴上个智能手表来监测睡眠状况,但也许有更好的办法——让你的床帮你记录睡眠的情况。你只要像往常一样自然入睡,智能床就会悄无声息地收集数据,醒来时就能交上一份数据详实的睡眠报告——不同睡眠阶段时长、心率呼吸率、打鼾情况等十余项睡眠质量评估指标,一目了然。

我想,这就是智能睡眠这个产品理念带来的最大价值。

在智能床试睡的这段时间里,我还发现了几个有意思的小细节:

一个是舒达智能床会分别监测睡在床两侧的用户数据,尽管是睡同一张床,但两个人的睡眠监测数据是分开的,除了用遥控器进行控制之外,也能各自通过手机 app 对床进行调控。

另一个是智能鼾声感应功能,睡眠中,当智能床监测到有打鼾的情况,会轻柔缓慢的调整床的高度,帮助缓解打鼾,确保整晚深睡质量,对于深受打鼾困扰的人来说是个福音。

用科学的办法,睡个好觉

失眠已经成为一种现代流行病,全球范围内有超过 5 亿人患有睡眠障碍,在一些发达国家,每两个成人中就有一位彻夜难寐。

▲图片来源:Birmingham Museums Trust

一张能哄你睡觉的智能床,可以帮你培养科学的就寝习惯,从而获得高质量的睡眠。而你并不需要额外佩戴什么设备或进行某种练习,这是最难得可贵的地方。

最后,无论你对智能床这种新产品是否感兴趣,我都推荐你去读一读《我们为什么要睡觉》这本书,这不仅是个书名,也是一个困扰学界已久的难题,而其中最重要的提醒是:

人类(以及所有其他物种)永远不能把我们之前失去的睡眠「睡回来」。

睡个好觉这件事,什么时候开始都不会太晚。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


iPhone 17 Pro Max渲染图曝光/蔚来第三品牌萤火虫官宣,售价或低于10万/ChatGPT推出电话服务,老人机也能用

cover

📞

OpenAI 重磅推出电话服务

🌍

中国工程院发布 2024 全球十大工程成就

🦗

蔚来第三品牌「萤火虫」官宣

💻

英伟达承认其软件导致游戏性能下降

🗓

携程正在探索更加灵活的 4 天工作制

🧠

「通义」团队并入阿里智能信息事业群

🚗

本田、日产或将抱团合并

🔥

极越公关回应离职员工万字长文

💃

抖音创始人张一鸣进军私募行业

📚

小红书新任战略负责人到位

🏭

特斯拉上海工厂厂长离职

💰

阿维塔顺利完成 C 轮融资

🔊

微信公众号上线作者朗读音色功能

💡

「AI 教母」李飞飞:世界是三维的,我们需要尊重这一事实

🧐

豆包视觉理解大模型正式发布

📱

iPhone 17 Pro 系列设计被曝光

重磅

OpenAI 重磅推出电话服务

北京时间今天凌晨,在 OpenAI 第十场发布会上 ,重磅推出电话服务。

据官方介绍,即日起,美国用户可将 ChatGPT 添加到电话通讯录,然后用智能手机/座机/老人机拨打 1-800-242-8478,它就能回应你提出的问题,比如景点导览亦或者语言翻译等。并且OpenAI 将向美国用户提供 15 分钟的免费通话时间。

直播中,OpenAI 首席产品官 Kevin Weil 表示:

「我们的使命是让通用人工智能造福全人类,部分目标就是尽可能让它向更多人开放。今天,我们迈出了下一步,把 ChatGPT 带到你的电话中。」

与此同时,ChatGPT 也正式「入驻」WhatsApp。

届时,GPT-4o mini 将为 WhatsApp 用户提供基础对话服务。虽然无需注册即可使用,但受限于使用额度,建议你还是转向 App 或网页版获取完整体验。

OpenAI 表示,正在为 WhatsApp 开发图像分析和网页搜索等更多功能,但暂未公布这些功能的上线时间。

另外,微软搜索主管 Jordi Ribas 于今日凌晨宣布 DALL·E 3 更新了一个新型号 DALL-E 3(PR16),不仅图片生成速度提升一倍,同时质量也有所提高。

大公司

中国工程院发布 2024 全球十大工程成就

12 月 18 日,中国工程院院刊《Engineering》官方公布了由该刊评选的「2024 全球十大工程成就」。

「2024 全球十大工程成就」经由全球征集提名、专家遴选推荐、公众问卷调查、评选委员会审议确定,包括:CAR-T 细胞疗法、嫦娥六号、低轨通信卫星星座、柔性显示、高温气冷堆核电站、智能工厂、无人驾驶汽车、手术机器人、文生视频大模型 Sora、超大型风力发电装备。

官方表示,本次评选的全球十大工程成就体现了三个特点:

  • 代表了某一个或多个工程科技领域最先进的技术水平或者重大的原创性突破,能够引领未来技术进步方向。
  • 通过技术整合、资源优化配置达成了整体目标,呈现出显著的系统集成创新特色。
  • 催生新产业、新动能,具有重要的产业带动和经济驱动价值,代表新质生产力发展方向。

《Engineering》期刊由中国工程院与高等教育出版社联合创办,致力于建设世界一流工程科技综合性权威期刊,为全球提供高水平工程科技重大创新成果发布交流平台。

蔚来第三品牌「萤火虫」官宣

12 月 18 日,蔚来正式宣布第三品牌「firefly 萤火虫」,并将于 12 月 21 日的 NIO Day 进行全球首秀。

官方介绍,萤火虫将作为蔚来的智能电动高端小车品牌,主打「为自在自信、热爱生活的用户而生」。同时公布的还有品牌表示,其灵感来自于正在飞舞中发光的萤火虫。

萤火虫作为继乐道之后,蔚来第三个自有品牌,其首款车型将为一款入门级四门两厢轿车,主打年轻个性化市场,预计定价在 15 万元以内。目前,「firefly 萤火虫」官方 App 已上架各大应用市场。

同时,蔚来旗下行政旗舰轿车 ET9 也将在 12 月 21 日 NIO Day 2024 中一同发布,蔚来 ET9 是中国首款搭载线控转向技术的量产车型,并配备先进数字架构。

英伟达承认其软件导致游戏性能下降

近日,据 Tom’s Hardware 对最新的「英伟达应用程序」(NVIDIA App)进行了测试,发现它会导致某些游戏的性能降低最高 15%。

目前,英伟达官方回复 Tom’s Hardware 并承认 NVIDIA App 会导致游戏性能下降。针对此情况,英伟达称已经意识到了这些问题,目前正在努力修复。同时英伟达给出临时解决方法:如果用户遇到类似的更新后性能下滑问题,建议在设置中关闭「游戏滤镜和照片模式」切换开关,然后重新启动游戏。

NVIDIA App 于 2024 年 2 月开启测试,于 11 月正式发布,是一款实现 NVIDIA 控制面板、GeForce Experience、RTX Experience 等整合与升级的全新软件,具有统一的 GPU 控制中心,以便用户在一个应用内对游戏、程序、驱动进行控制微调。

携程正在探索更加灵活的 4 天工作制

12 月 18 日,携程集团联合创始人梁建章在携程集团全球合作伙伴峰会上表示,携程正在探索更加灵活的 4 天工作制。

梁建章表示,此举有利于绿色办公、提升员工满意度,也可以让员工有更多时间去旅游和生孩子。

此前,日本东京都政府将从下一财政年度开始实行四天工作制,职员可选 「一周休 3 天」 的弹性工作制度。同时,针对有小学三年级以下孩子的职员,推出家长早退制度,每天晚来或早退最多两小时。政策旨在减轻养育孩子的压力,提高工作与生活的平衡。

「通义」团队并入阿里智能信息事业群

12 月 18 日,据智能涌现从多个独立信源处获悉,阿里旗下的 AI 应用「通义」近期正式从阿里云分拆,并入阿里智能信息事业群。

据知情人士透露,此次调整包括通义 To C 方向的产品经理,以及相关的工程团队,一并调整至阿里智能信息事业群。调整后,通义 PC 及 App 团队与智能搜索产品「夸克」平级,原有的通义实验室,仍然留在阿里云体系内。

此前,阿里旗下的大模型家族「通义」,包括应用层的「通义」App、PC 端,均属于阿里云体系。其中,通义大模型家族由达摩院开发,为达摩院的主要职能,更偏向基础科学和创新性技术研究;而阿里云又是一个 To B 业务,也不适合投入进直面 To C 市场的应用开发和推广中。

据了解,除了夸克,此前阿里体系内的一些 To C 产品,很早就开始逐步整合至阿里智能信息事业群。比如,在 2023 年年底,处于原阿里云 IoT 业务线下的 C 端硬件产品「天猫精灵」,就调整至了夸克旗下。

本田、日产或将抱团合并

近日,据日本财经新闻报道,本田汽车和日产汽车正在准备就可能的合并计划展开谈判。

报道中还提到,两家公司还计划最终将三菱汽车纳入控股公司旗下,目前日产是三菱汽车的最大股东,持有 24% 的股份。

目前,日产深陷财务困境,仅剩 12 至 14 个月的现金储备,本田财务状况也有所下滑,再度下调业绩和交付指引。这一合并,未来将创建一个包括本田、日产和三菱汽车的控股公司,也是继 2021 年 Stellantis 集团成立之后,汽车行业最大的一次重组,三家车企合并后的年销量预计将超过 800 万辆。

报道分析指出,合并将有助于这两家制造商与特斯拉和中国汽车制造商等电动汽车竞争对手展开竞争,这也使它们在国内外与全球最大汽车制造商丰田展开竞争时处于更有利的地位。

12 月 18 日,据彭博社报道,本田执行副总裁青山真司(Shinji Aoyama)对「本田与日产探讨合并」这一消息称,本田正在考虑几种选项,包括合并、资本合作或设立控股公司。

本田与日产 12 月 18 日回应称,报道内容并非基于三家公司所发布的公告。今年 3 月和 8 月,日产、本田、三菱汽车在公告中表示将整合各方优势,探讨各种合作可能性,但目前尚未做出决定。如有最新情况,将在合适的时间向利益相关方进行通报。

极越公关回应离职员工万字长文

近日,极越汽车的一位离职员工发布了一篇万字长文,直指极越内部管理和 CEO 夏一平的问题。

极越公关徐继业近期也对此位员工所写的长文作出回应。回应中,徐继业表示「仆从的眼里没有英雄」,认为极越发展至今天,不仅仅是老板的问题,并反问员工是否也有责任。

极越离职员工所写的万字长文中,详细披露了公司存在的管理混乱,员工权益受损等问题,并着重提到夏一平在公司会议上的侮辱性言论,造成了不少极越员工的心理受到伤害。同时长文中还反映了极越拖欠多名员工工资、社保未缴纳齐全等情况。

此前,极越 CEO 夏一平发长文道歉,文中夏一平强调自己并未跑路,并且表示将与员工、用户站在一边,一同面对困难。随后,一位极越早期员工通过媒体发声,称夏一平并非李彦宏的首选,并透露,夏一平喜欢快速获取结果,不惜巨大风险,同时解散团队的方式过于轻率,影响了员工、车主甚至供应链。

抖音创始人张一鸣进军私募行业

12 月 18 日,香港证监会公告,字节跳动联合创始人张一鸣创立的「Cool River Venture HK Limited」公司于 2024 年 11 月正式拿下香港 9 号牌,即资产管理牌照。获颁牌照后,公司可在香港开展资管服务业务。

根据香港查册中心的信息,Cool River Venture 于 2023 年 5 月 22 日成立,性质为私人股份有限公司,张一鸣是唯一董事,唯一股东为 Galaxy LLC,股东注册地位于开曼群岛。业内人士表示,Cool River Venture 类似于私募股权基金。此前有消息人士透露,该基金的主要投资方向是科技相关行业。

2021 年 5 月,张一鸣正式卸任字节跳动 CEO 一职,在全员信中他说自己要「聚焦到远景战略、企业文化、社会责任等长期重要的事情上去」。。

张一鸣极力强调字节跳动无法错过 AGI,要全面拥抱 AGI。今年以来,字节在 AI 的投入上有增无减,并且展现了全力押注的态势。一名知情人士透露,近期,字节跳动与美团、红杉中国联合完成了对国内一家数字人企业的投资,这笔交易总投资额为 1000 多万美元,字节为领投方。

小红书新任战略负责人到位

近日,据晚点报道,今日资本原合伙人戴丽丹近期已加入小红书,负责战略。

据悉,在戴丽丹加入前,小红书不同战略方向各有负责人,而现在统一向戴丽丹汇报;小红书同时计划组建战略投资团队,由戴丽丹负责,主要投资硬科技赛道,尤其是 AI 应用;小红书原投资团队不变,继续做财务投资。

戴丽丹毕业于北京大学,后加入百度任百度地图产品经理;2013 年-2015 年,她在哈佛商学院攻读 MBA,此后,戴丽丹加入由 「风投女王」徐新创办的今日资本,于 2022 年升任今日资本合伙人。

小红书近年已频繁出手投资,主要方向是投消费品牌,覆盖食品、潮玩、美妆和母婴等领域。同时,AI 应用也将是小红书计划搭建的战投团队的重点投资方向。

特斯拉上海工厂厂长离职

据晚点报道,,特斯拉制造副总裁、上海工厂厂长宋钢数月前已提交辞呈,12 月 18 日是他的最后工作日期。两位知情人士称,宋钢计划加入一家目前正处在产能瓶颈的本土新兴汽车品牌。

目前,特斯拉还未正式任命新的上海工厂厂长。知情人士透露,最有可能接替宋钢的是特斯拉上海工厂汽车与零件质量高级总监费文进,另一位候选人是特斯拉上海工厂现任物流总监孙郝林。

2018 年,宋钢加入特斯拉,加入特斯拉前,他曾在福特和上汽通用任职。宋钢是特斯拉上海工厂的首位员工,带领团队在一年之内实现 Model 3 的本地生产。2020 年,特斯拉开始建设上海工厂二期,用于 Model Y 的国产制造,这个团队同样由宋钢负责领导。目前,二期工厂已成为全球产线效率最高、质量最好的工厂。

2021 年,特斯拉全年交付新车 93.6 万辆,上海工厂占其中的 51.7%。今年 10 月 11 日,特斯拉上海工厂下线了第 300 万辆整车。乘联会数据显示,今年 1-11 月,特斯拉上海工厂出口量约占其同期产量的 30.2%。

阿维塔顺利完成 C 轮融资

近日,阿维塔宣布顺利完成超 110 亿元 C 轮融资。

据官方介绍,本轮融资由长安汽车、渝富系基金、南方资产系基金、国投系基金、交银以及其他战略和市场化投资人共同出资。同时阿维塔官方表示,已经同步开启上市准备工作,拟于 2026 年 IPO 上市。

阿维塔官方还提到,正式投资华为子公司「引望」,成为引望公司第二大股东,并与华为签署深化战略合作协议,旨在共同为用户提供领先的智能出行及生活体验。

据悉,8 月,长安汽车发布公告,子公司阿维塔科技将斥资 115 亿元购买华为引望 10% 股份,同月阿维塔官宣投资华为引望协议签约完成,成为华为引望第二大股东;11 月阿维塔拟定增募资不超过 120 亿元,主要用于引望公司投资,以及后续车型的研发设计、产线投入、市场品牌发展、渠道建设等方面,并补充企业流动资金。

爱诗科技完成近 3 亿元 A+ 轮融资

12 月 18 日,爱诗科技宣布完成 A2 至 A4 轮融资,总金额近 3 亿元人民币。

此前,A2 轮融资由蚂蚁集团投资,近期 A3、A4 轮融资由北京市人工智能产业投资基金、国科投资及光源资本投资。

据官方介绍,融资将主要用于提升技术研发能力、扩展算力资源以及建设人才团队,加速产品功能迭代与市场覆盖,持续推动 AI 视频生成技术的普惠。

截至目前,爱诗科技的核心 AI 视频生成产品 PixVerse 全球用户数超 1200 万,月活跃用户数近 600 万。自 2024 年 10 月 PixVerse V3 版本发布后,「毒液变身」等创意特效功能席卷海内外社交媒体,为亿万用户提供了前所未有的 AI 视频生成体验。

微信公众号上线作者朗读音色功能

12 月 18 日,微信派发文,宣布公众号上线「作者朗读音色」新功能。用户点击「🎧 听全文」,就能够「听」到由作者音色朗读的公众号文章。

作者在下载「订阅号助手」APP 后,点击「我-设置-朗读音色」,就可以录制例句,例句会复刻作者的语气和情感。录制完成并点击应用,即可在公众号里拥有自己的个性化语音。并且,每一个公众号都可以创建多个不同的音色。

不过官方表示,目前该功能还在灰度中。

💡「AI 教母」李飞飞:世界是三维的,我们需要尊重这一事实

近日,「AI 教母」李飞飞在 2024 NeurIPS 上发表了她的个人演讲,其主题为「攀登视觉智能的阶梯」。

李飞飞在演讲中阐述了对未来机器视觉的愿景。其中她提到,空间智能是视觉智能的发展方向。李飞飞认为,世界是三维的,一旦尊重了世界的三维性,很多事情就自然而然地发生了。李飞飞同时举出「篮球被投入一个场景中,只有三维能做到,2D 平面中篮球则无处可去」的例子来证明了三维空间事情发生的逻辑性。

最后,当被提问到「人工智能理解了三维世界所带来的好处」时,李飞飞回答出了具体使用场景。她觉得可以结合 AR 技术,在三维空间构建出用户所需要获取的内容,如通过视觉三维去解释周遭一切的实体信息。

新产品

豆包视觉理解大模型正式发布

12 月 18 日,在举行的火山引擎 Force原动力大会上,豆包视觉理解大模型正式发布。

该模型允许用户同时输入文本与图像数据,并迅速提供精准回应。它的亮点在于强大的内容识别技术、深度的理解及推理能力以及细腻入微的视觉表述技巧。

同时火山引擎总裁谭待宣布该模型价格为 0.003 元/千 tokens,比行业价格低 85%,视觉理解模型进入「厘时代」。

iPhone 17 Pro 系列设计被曝光

12 月 17 日,YouTube 博主 Wylsacom 在自己的视频中放出了基于多方爆料信息,制作而成的 iPhone 17 Pro Max 模型渲染图。

从渲染图中可以看到, iPhone 17 Pro Max 的镜头模组设计相较上一代有了较大变化,后置摄像头的模组采用了类似 Pixel 9 系列的水平三镜头设计。

上月底,The Information 的报道曾提到,苹果 iPhone 17 Pro 和 iPhone 17 Pro Max 的背面,将采用新的半铝半玻璃设计,上半部分将由铝金属制成,同时采用矩形铝制相机凸起,而非传统的 3D 玻璃;下半部分则仍将继续使用玻璃以支持无线充电功能。

三星 S25 系列将于 1 月 22 日发布

近日,博主 Evan Blass 曝光了三星 Galaxy Unpacked 预热海报,活动将于太平洋时间 2025 年 1 月 22 日举行。

据悉,此次发布会预计将发布 Galaxy S25/S25+/S25 Ultra 以及三星的首款 XR 设备。预热海报暗示,Galaxy S25 系列将会有 4 个版本,同时传闻已久的 Galaxy S25 Slim 可能晚些时候推出。

近期,三星 Galaxy S25+ 美版实机也遭到泄漏。Galaxy S25/S25+ 将采用与前代 Galaxy S24 相同的设计语言,前后直板加直角金属中框。从泄露图中得知,Galaxy S25+ 美版将配备毫米波天线,其开孔区域与按键同侧。

联发科新一代天玑芯片将于 12 月 23 日发布

12 月 18 日,联发科官方微博发文,2024 MediaTek 天玑芯片新品发布会定档 12 月 23 日 15:00 举办。

此前有博主爆料,这次发布的新品预计为天玑 8400 芯片,该芯片将采用台积电 4nm 制程,全大核「1+3+4」CPU 架构,分别为 3.25GHz、3.0GHz 以及 2.1GHz 的 A725,GPU 为 Immortalis G720 MC7 1.3GHz,安兔兔跑分将最高至 180W+。

新消费

App Store:Apple 账户充值额外奖励 5%

近日,苹果宣布,用户可以在 App Store 为 Apple 账户充值,限时可获得额外 5% 奖励。

根据此奖励推算,用户在 App Store 充值 100 块钱的话,会获得 5 块钱奖励;充值 500 块钱的话,会获得 25 元奖励。充值之后的账户余额,可以用来在 App Store 购买喜爱的 App 和游戏,还可订阅 Apple Music、iCloud+ 等服务。

此活动有效期至 2024 年 12 月 30 日。充值金额介于 ¥5.00 至 ¥1,000.00 之间时,可享受此优惠。每名用户仅可享受一次优惠。

《仙剑奇侠传 4 重制版》公布

日前,《仙剑奇侠传 4 重制版》公布最新前导 PV

《仙剑奇侠传四 重制版》是由 UP software 研发、方块游戏发行的 RPG 单机游戏,将登陆 PC 及各主机平台。本作基于 Unreal5 引擎开发,在原作基础上以最新的技术完全重制。玩家将和主角云天河等人一同踏上寻仙之旅,一段尘封已久的秘闻也将随之揭开。

前身之作《仙剑奇侠传四》是由软星科技(上海)有限公司研发,寰宇之星发行代理的角色扮演单机游戏,也是系列单机游戏《仙剑奇侠传》的第五部作品,于 2007 年 8 月 1 日上市。

此前,据CMGE中手游于 2022 年 8 月 25 日发布的 2022 中期业绩财报显示,上海软星科技于 2022 年上半年正式立项单机游戏《仙剑奇侠传4 重制版》。

《黑神话:悟空》官宣 PS5 国行版

12 月 18 日,在 PlayStation 中国 10 周年派对「玩翻夜」的现场,《黑神话:悟空》宣布 PS5 国行版本正在准备中。

日前, 2024 年度索尼 PlayStation Blog 游戏奖正式公布。12 月 17 日,《黑神话:悟空》获得 2024 年度索尼 PlayStation Blog 游戏奖的最佳图形白金奖以及最佳 PS5 游戏金奖。

同时,《黑神话:悟空》入围 2024 年 Steam 大奖,获得「纵使手残仍大爱奖」、「杰出剧情游戏奖」以及「年度最佳游戏奖」提名。2024 年 Steam 大奖将于北京时间 12 月 20 日凌晨 2 时开放投票,所有非受限 Steam 帐户皆可为 11 个奖项中的每个奖项投一票,Steam 大奖投票将于 2025 年 1 月 1 日结束,届时将揭晓获奖名单。

好看的

电影《果然》入围鹿特丹电影节

近日,电影《果然》宣布入围第 54 届鹿特丹国际电影节主竞赛。

该片由李冬梅执导及编剧,马可·穆勒监制,李蔓瑄、王一通主演,讲述一位普通女性遭遇的生育难关,探讨关于「存在」和「失去」的生命课题,同步释出海报与新剧照。

影片将于 1 月 30 日至 2 月 9 日期间在鹿特丹国际电影节进行世界首映,并角逐金虎奖。

《姥姥的外孙》进入 25 年奥斯卡初选短名单

近日,The Academy 公布了第 97 届奥斯卡初选短名单。

本次公开的名单包含「最佳国际影片」、「最佳视觉效果」、「最佳音效」、「最佳配乐」等 10 个类别的初选短名单。其中,泰国影片《《姥姥的外孙》入围「最佳国际影片」奖项的初选短名单,成为首部进入奥斯卡最佳国际电影短名单(前 15 名)的泰国电影。

《姥姥的外孙》由帕特·波尼蒂帕特执导,马群耀、乌萨·萨梅坎姆等主演,于 2024 年 4 月 4 日在泰国上映,8 月 23 日在中国上映。影片讲述一个华裔家庭在泰国发生的故事,外孙为了照顾垂死的祖母而辞去工作,他扮演一个忠诚的孙子的角色并不只是出于爱,还为了价值数百万美元的巨额遗产,外孙随着陪伴时间增长,逐渐成长。

本届奥斯卡提名明年 1 月 17 日公布,颁奖典礼 3 月 2 日举行。

《封神》第二部发布首支预告

12 月 18 日,《封神第二部:战火西岐》公布首支预告片。

《封神第二部》作为《封神三部曲》中承上启下的关键篇章,将聚焦「西岐保卫战」中「人」的力量,展现西岐军民为家人而战,保卫家园、守护信仰的过程。

影片由导演乌尔善执导,江志强监制,黄渤监制及出演,于适、那尔那茜、陈牧驰、费翔、夏雨以及陈坤等演员出演。

影片将于2025大年初一全国上映。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


近 22 万的苹果 Vision Pro 摄影机来了,可拍摄 8K 3D 视频

无论有没有真正购入一台 Apple Vision Pro,你可能都对其提供的沉浸视频所带来的震撼观感有所耳闻。

苹果官方对 Apple 沉浸视频的评价是「叹为观止」的。这是一种全新的叙事形式,能够通过 8K 3D 视频与 180 度视域和空间音频的配合,给观众以身临其境之感。

今年 7 月开始,Vision Pro 已经陆续上线了一批电影、纪录片、音乐会甚至体育赛事的「沉浸」版本。从官方演示视频来看,其所呈现的「视界」的确令人心驰神往。

▲图源:Apple

惊叹之余,你是否也有过对这类格式视频幕后工作的好奇:Apple 沉浸视频到底是如何拍摄和制作的?

影像技术公司 Blackmagic Design 推出的 URSA Cine Immersive 就是一款专为拍摄 Apple 沉浸式视频而设计的商业摄影机。这款摄影机于今年 6 月首次亮相,近日已经开始接受预订,将在 2025 年初进行首批交付。

不过,URSA Cine Immersive 的价格不菲,售价高达 30000 美元(约合 22 万元),几乎相当于 8.5 台苹果 Vision Pro 的价格。如此昂贵,可见其定位并不是「消费级」,而是为专业人士提供的创作工具。

▲图源:Blackmagic Design

URSA Cine Immersive 是一款「双镜头」摄影机。为了拍摄「Apple Immersive Video」,其具有包含两个 180 度立体镜头的固定定制镜头系统,专为摄影机中的大画幅图像传感器而设计。

值得一提的是,URSA Cine Immersive 使用了「极其精确」的镜头姿态数据,这些数据是每台摄像机独有的,在制造时生成,经过校准后存储在设备上,其在后期编辑过程中能使 3D 视频更加精确和稳定。

这款设备拥有单眼 8160*7200 的超高分辨率,是 Vision Pro 单眼分辨率的两倍多,官方称之为「像素级同步」。它能够拍摄每秒 90 帧的 3D 沉浸视频,并且每帧都有 16 档动态范围,以确保细节和色彩准确性。

▲图源:Blackmagic Design

URSA Cine Immersive 使用全新的「Blackmagic RAW」格式拍摄和存储视频,这种格式可以不仅记录白平衡、数字场记板信息和自定义 LUT,还可以存储上面提到的摄像机元数据以及镜头数据等。

不仅如此,URSA Cine Immersive 还拥有诸多其他亮点:

  • 使用第五代色彩科学与新的电影曲线;
  • 配备双 5 英寸 HDR 触摸屏和外部彩色状态 LCD 屏幕;
  • 内附 Blackmagic Media Module 8TB 录制功能,可实时同步到 Blackmagic Cloud 和 DaVinci Resolve 媒体盒;
  • 支持高速 Wi-Fi、10G 以太网或移动数据用于网络连接;
  • 拥有包括 12G-SDI 输出、USB-C 和 XLR 音频端口等多种连接选项。

此外,这款设备还拥有轻巧坚固的机身,兼顾了摄影师和工作人员的跟拍和转场需求。

▲图源:PetaPixel

除了推出「全球首款用于 Apple 沉浸视频的摄影机」之外,Blackmagic Design 还带来了其旗下专业视频编辑软件达芬奇(DaVinci Resolve Studio)的重磅更新,实现了 Apple 沉浸视频的「无缝」工作流程:

  • 剪辑师可以直接监视和处理使用 URSA Cine Immersive 拍摄的 Apple 沉浸视频素材;
  • 支持自动识别 Apple 沉浸视频(双文件立体沉浸式内容)的左右眼;
  • 新的沉浸式视频查看器允许剪辑师进行平移、倾斜和滚动剪辑等操作,以便在显示器或者 Vision Pro 上查看;
  • 可以使用 FCP XML 元数据绕过 Vision Pro 渲染的过渡,从而简化编辑过程,并生成干净的母带文件;
  • 导出预设将启用与 Vision Pro 直接兼容的快速输出,便于在 Vision Pro 上直接查看。

▲图源:Blackmagic Design

更新后,官方称达芬奇为「世界首款用于 Apple 沉浸视频的编辑软件」,Blackmagic Design 的首席执行官格兰特·佩蒂(Grant Petty)则表示达芬奇的更新将实现 Apple 沉浸式视频的真正「端到端」工作流程。

佩蒂还表示「期待于电影制片人密切合作」。Blackmagic Design 的软硬件「组合拳」,加上苹果的审美理念,我们也期待着在未来看到更加打动人心的 Apple 沉浸作品。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


英伟达推出「最便宜」AI 超算,想让每个人都踏入 AI 世界

2019 年,人工智能技术快速进步,AI 应用不断广泛深入。彼时,英伟达(NVIDIA)推出了面向「嵌入式设计师、研究人员和 DIY 制造商」的 AI 计算机以及开发套件「Jetson Nano」,售价 499 美元(约合 3638 元)。

▲Jetson Nano(图源:NVIDIA)

近日,英伟达发布了 Jetson Nano 的升级版,也是目前该系列中「最便宜」的 AI 超级计算机及其开发套件「Jetson Orin Nano Super」。在性能更强的同时,价格还降低了一半,仅售 249 美元(约合 1809 元)。

按照英伟达的官方说法,Nano Super 的受众是「商业 AI 开发者、业余爱好者和学生」。的确,不到 2000 元的价格对于那些初次接触生成式 AI、机器人技术或者计算机视觉技术的人群来讲,还算友好。

也许,这也表明了目前使用 AI 进行推理任务的成本正在逐渐降低。

▲Jetson Orin Nano Super(图源:NVIDIA)

相较于前代,Nano Super 的 AI 推理性能提升了 1.7 倍,整体性能提高了 70%,达到 67 INT8 TOPS。此外,Nano Super 的内存带宽增加至 102GB/s,比前代产品提升了 50%;CPU 频率也从前代的 1.5GHz 提升至 1.7GHz。

整个 Nano Super 开发套件包含 Jetson Orin Nano 8GB 系统级模块(SoM)和一个参考载板,SoM 配备了 NVIDIA Ampere 架构 GPU 和 6 核 Arm CPU,支持多个并发 AI 应用管道和高性能推理。

另外,它还支持调用最多四个摄像头,并且提供比之前的版本更高的分辨率和帧速率。

▲图源:NVIDIA

英伟达声称 Nano Super 的性能提升为所有流行的生成式人工智能模型和基于变换器(transformer)的计算机视觉带来了好处。

不仅如此,由于 Nano Super 套件的硬件与其前代 Orin Nano 的硬件基本相同,因此之前购入了 Orin Nano 的用户通过安装软件更新(JetPack SDK),也能体验到 Nano Super 的性能升级。

英伟达称,这是一份「持续给予的礼物」。

▲图源:NVIDIA

在英伟达生态的加持下,开发者可以从 NVIDIA Jetson AI 实验室获取教程,还可以在更广泛的 Jetson 社区获得支持和帮助,或者从其他开发者创建的项目中获得灵感等等。

英伟达表示,无论是创建基于检索增强生成的 LLM 聊天机器人、构建视觉 AI 代理还是部署基于 AI 的机器人,Nano Super 都是「理想的解决方案」,并且期待它能够加速 AI 驱动机器人技术在多个行业的发展。

随着人工智能领域从特定任务模型逐渐转向更为通用的基础模型,Nano Super 无疑为技术爱好者们提供了一个将想法变为现实的「最实惠」可访问平台。正如英伟达所说:

现在每个人都可以通过生成式 AI 解锁新的可能性

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


火遍小红书的 AI 视频神器,这次整出的新活又让我停不下来

AI 视频的多主体一致性,向来是个难题。让 AI 凭空生成模特和衣服不难,但如果甲方要求,必须要让马斯克代言,穿上毛绒大衣,AI 可能就办不到了。

Pika 最近更新的 2.0 模型,提出了一种很有趣的解决方式——我们上传多张图片,Pika 会精准参考图片中的元素,生成视频。

集齐人物、商品、场景的照片,一个非常基础的广告片就出炉了,而且这些素材在视频里长得都和照片里一样。

这是否意味着,AI 视频的一致性难题解决了,广告行业的朋友们又要焦虑了?其实并没有,经过实测,Pika 的可玩性很高,但论实用,道行还不够。

马斯克和奥特曼看电影,名画吃薯条,同框从未如此简单

Pika 上传多张参考图片的功能,叫作「Scene Ingredients」(场景成分)。

使用起来很简单:1.点击「+」上传图片,上限 6 张;2.在文本框里,写上简单的提示词。

接下来就进入实操——让闹得水深火热的马斯克和奥特曼,化干戈为玉帛,在一起看电影。

▲提示词:两个人坐在漆黑的观众席中。他们手捧一桶爆米花,一把放到嘴里嚼着,全神贯注地看着眼前的场景。他们睁大眼睛的表情传达出热切的期待或着迷,仿佛他们完全沉浸在正在展开的戏剧或场景中。周围的环境表明人群拥挤,但焦点仍然集中在他们的反应上

上传两位的照片就够了,观众席可以用提示词写出来。

对于马斯克,AI 的发挥很稳定。但奥特曼看起来是地主家的傻儿子,吃相恐怖就不说了,眼睛大得要掉出来。

Pika 很有趣的一点是,素材可以「复用」。

所以,我们可以让马斯克和奥特曼过把模特瘾。只上传一张服装图片,然后通过提示词,让他们穿着一样的绿色大衣,拍个时尚大片。

▲提示词:两名男子在壮丽的冬日风景中站在一起自拍。两人都穿着相同的绿色长外套。全身照,从头到脚展现他们。他们摆出专业模特般的姿势,脸上挂着自信的微笑。电影灯光突出了他们的脸庞和外套的奢华质感。高端时尚摄影风格,专业相机品质,时尚杂志美学

两人的照片都找了现成的,绿色的大衣和冰天雪地的背景是另外用 AI 生成的,衣服上的「AIGC」,算是考验 Pika 的附加题。

结果,场景和大衣的一致性保持得不错,「AIGC」的字样依稀可以辨认,两位模特的动作也遵循了提示词。

但最大的问题是,这两人是谁?视频的人脸和照片,不能说一模一样,可以说是毫不相干。

不信邪,继续让 Pika 玩换装。

这次,我们请出扎克伯格,照例先用 AI 图片工具生成衣服,上面写着「I was human」(我曾是人类),呼应经典的机器人梗。

然后,再找一张扎克伯格的图片,和一把尤克里里的图片,让小扎玩个音乐。

▲提示词:一位身穿黑色 T 恤的男子站在温馨的房间里,弹奏着尤克里里琴。镜头从中远景开始,展现他的整个身体,逐渐拉近,最后聚焦在 T 恤上的字迹上

Pika 对提示词的遵循和镜头的运动都挺好,衣服也丝滑地穿上了,但右手,尤其大拇指,还是不完美。

相较 Google Veo、OpenAI Sora 等,Pika 的模型能力不算顶尖,一个问题解决了,还有更多的 bug 被发现。

尝试了写实的,再来试试二次元画风,为了让坂田银时和漩涡鸣人同框,我特意挑选了两张背景都是蓝天白云的图片。

▲提示词:动漫风格的场景,镜头聚焦在两个年轻男子的脸上,背景是蔚蓝的天空和白云。他们一边聊天一边眼神交流,保留了原有的动漫艺术风格

背景融合得很自然,两位正面的表情发挥不错,吹动头发和衣服的风也恰到好处。然而,转身实在太可怕了。银时是死鱼眼,不是真的翻白眼啊喂。

次元壁都打破了,当然也可以让名画跨年代互动——蒙娜丽莎和戴珍珠耳环的少女在麦当劳餐厅吃薯条。

▲ 提示词:蒙娜丽莎和戴珍珠耳环的少女正在麦当劳餐厅用餐。她们相对而坐,桌上摆着薯条。她们边聊天边品尝薯条,摄像机从侧面捕捉她们,两位角色偶尔看向镜头,营造出一种随意而友好的氛围

效果一言难尽,看到蒙娜丽莎,不知道达芬奇想不想掀棺材板。两位好像贴图一样,被放在了视频里,头部也运动得非常诡异。

有时候,回归简单,道法自然,结果反而超出预期。

▲提示词:特写镜头,池塘表面出现气泡,然后咖啡杯从水中浮出

上传一张星巴克的图片,一幅莫奈的睡莲,就可以得到一个「清水出芙蓉」的咖啡杯。

PK 国产模型,控制 AI 视频的门槛更低了

一定程度上,Pika 提高了视频的可控性。话不说满,因为从实践看来,Pika 在场景、服装、物品上的一致性保持地较好,人物的脸容易崩,不管是什么次元。

同时,模型的基础能力,Pika 也有待进步,吃东西、弹琴等物体运动,仍然会出现问题。这些问题,能不能通过抽卡缓解呢?

三个字:抽不起。

Pika 2.0 目前仅对 Pro 和 Fancy 用户开放,如果按月订阅,每月至少花 35 美元,连免费试用的额度都没有。

而且,Pro 用户每月只有 2000 积分,但使用 Scene Ingredients 功能,一个视频就要花掉 100 积分。

▲vidu 界面

其实,国产 AI 视频模型 Vidu,比 Pika 更早地实现了「多图参考」的功能。更拿捏用户的是,它有免费体验的积分。

Pika 的几个案例,我也在 Vidu 跑了一下。蒙娜丽莎和戴珍珠耳环的少女吃薯条,两位像刚出土,但蒙娜丽莎的还原度比 Pika 高。

马斯克和奥特曼一起看电影,马斯克的脸像了七八成,奥特曼的脸依旧灾难。

坂田银时和漩涡鸣人同框,Vidu 居然能基于正脸生成侧脸,但画风和原图不太一样。

另外,在功能上,Vidu 有一点不如 Pika——最多只能上传三张图片。所以,让 Vidu 给马斯克和奥特曼拍时尚大片,我就没有上传背景,只上传了两位的照片和绿色的大衣。

两位给人的感觉很陌生。可以看出,人脸的稳定性,仍然是个难题。

和 Pika 相比,Vidu 效果如何,可以见仁见智。Pika 用的是 Pro 版,Vidu 用的是免费版,客观上也会导致两者的差异。

但 Pika 和 Vidu 的思路是相似的——仅靠几个图片素材、一段简单的提示词,就生成相对稳定的物体。

在 AI 视频生成中,保持主体一致性,目前相对可靠的是 LoRA 方案,用一定数量的、特定主体的素材,对模型进行微调。通过适量的素材和训练,模型能逐渐掌握这个角色的样貌特征。

但为了让 AI 视频被更多人用起来,有更广阔的商业价值,门槛就要降低。至少,从 Vidu 和 Pika 身上,我们看到了可能性。

靠 AI 短视频出圈,在整活的道路上一去不复返

Pika 的 2.0 模型发了没几天,海外网友已经玩疯了。

拿自己的照片,反复生成不同场景的视频,就可以实现「瞬息全宇宙」。

▲ 图片来自:X@EladRichardson

通过 AI 一键试衣,模特和衣服如流水,场景都不带换的,实拍的钱省下来了。

▲ 图片来自:X@martgent

玩着玩着,Pika 给了我一种玩「QQ 秀」和模拟人生的感觉,怎么打扮视频里的角色,我们来决定。

如果让马斯克「圆梦」,很容易,先用其他 AI 工具,生成了一件「占领火星」的 T 恤、一个写着「MAGA」的红色帽子。

然后,把这些图片、火星的场景、马斯克的照片,以及他的擎天柱人形机器人、他特别喜欢的网红表情包 Doge 原型,全部上传到 Pika。

▲提示词:一名男子站在火星表面,身穿黑色T恤,头戴红色帽子。他的左边坐着一只狗,右边站着一个机器人。镜头以广角镜头开始,捕捉男子、狗、机器人的全身。随着镜头平稳拉近,男子朝镜头欢快地挥手,表情洋溢着喜悦和冒险精神

最终,一个阳光开朗大男孩出现,左牵黄,右擎苍,憨厚有余,但就是不像马斯克。

像不像是一回事,只要思路开阔,玩法无穷无尽。

基于我们自己和名人的照片,可以无痛追星。上传帽子、衣服、乐器,能把自己从头打扮到脚。集齐场景、产品、模特,一个 5 毛特效的广告片子就有了……

照片+AI 图片+Pika 2.0+提示词,可以生成很多好玩的画面。同时,这样的生成方式也规避了一些视频模型的短板,比如写字,在图片模型就可以解决。

不和 Google 硬刚模型能力,不和 Runway 这种逐梦好莱坞的对手比较,Pika 有自己的弯道超车玩法。

其实一直以来,Pika 在整活和创意方面就是一把好手,之前的一系列 AI 特效功能 Pikaffect 全网爆火,刷屏小红书和 TikTok,推动 Pika 用户突破 1100 万。

▲ AI 捏捏. 图片来自:Pika

▲AI 切蛋糕. 图片来自:Pika

Pika 切中了一群对整活短视频有高需求的用户,哪怕这些视频是模板化的,稍纵即逝的,但只要有趣,人们就会蜂拥而至。

谁说赢者通吃才是胜利?AI 的市场是广阔的,模拟物理世界固然是个远大的梦想,先完成让 AI 短视频有趣起来的小目标,未尝不是一种成功的方式。

利若秋霜,辟除凶殃。 工作邮箱:zhangchengchen@ifanr.com

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


苹果折叠屏 iPad 曝光!超大尺寸还没折痕,我扒出了这些细节

苹果要出折叠屏了。

这个传言在近两年里,时不时就会冒个头,大家也从一开始的「终于等到」,变成了现在的「听听就好」,如此的态度转变,和苹果的光打雷不下雨有关,也和折叠屏的普及率挂钩。

▲ 图片来自:Google

折叠屏虽然还是小众产品,但技术经过这六年的发展,以及市场的反馈,已经逐渐走向成熟,各大品牌线下门店都有实物,身边也有越来越多的亲属、同事和朋友加入了折叠屏的阵营。

而且,比起当年动辄上万元的高额售价,折叠屏的价格也因为技术的成熟、成本的控制和出货量的增加,被打了下来,现在折叠屏的入门价格,基本和旗舰机持平,跳一跳就够得着,也让它不再是橱柜里的展示品。

这回苹果折叠屏能引起关注,不是因为最新的技术进展,而是它们准备进军小众再小众的赛道:折叠,但是平板。

折叠 iPad,没有折痕

苹果折叠平板的传言,有点像狼来了的故事。

▲ 图片来自:Google

两年前,彭博社记者 Gurman 详细介绍过 20 寸的超大可折叠 iPad/MacBook 混合体;前段时间又传出可折叠 iPad 可能会采用 7~8 寸的小屏,预计2026 年或 2027 年问世;

这两天,Gurman 在最新一期的 Power On 中写到,苹果希望在 2028 年左右,推出一款全新 iPad:

  • 可折叠,但无折痕
  • 尺寸为 18.8 英寸,大小相当于两台并排放置的 iPad Pro。

而且,爆料中称苹果的工业设计团队,已经成功做出了折叠平板的原型机,我们也在苹果专利网里,发现了一些有意思的细节。

最近,美国专利商标局正式授予苹果一项与可折叠显示设备相关的专利。

▲ 图片来自:patentlyapple.com

专利文件中提到:

这一套连杆结构由薄片材料制成,其中包括了指状物和月形槽,在设备的折叠期间,容纳销可以沿着月形槽滑动,从而确保相邻的链接件绕旋转轴相对于彼此旋转。

读完专利文件的技术细节后,我们可以大致把这套新专利的特点分为四个:

1. 灵活性更好,提升了铰链的耐用性
2. 由于壳体旋转联动机制,折叠时会更稳定和平顺
3. 相较于传统的结构,新铰链在折叠时对屏幕的包裹性更好
4. 新专利不仅限于单个设备,而是各种可折叠设备(手机、平板、笔记本)都能通用的技术

▲ 图片来自:patentlyapple.com

从描述和外表看,这一套铰链结构没有什么特别的,甚至略显简陋,我们只看见了铰链部分的技术,并没有看到爆料中对无折痕的描述,而且这一点,非常重要。

特别是「无痕折叠」这个特点,即使放在当下成熟的市场里,依旧会引起不小的关注度,这是当下折叠屏产品里,伤害性不大、侮辱性极强、潜在隐患很高的一个缺陷。

折叠屏上的折痕,和铰链技术、柔性屏材料和折叠方式直接相关,铰链会直接决定折叠处的弯折程度,目前主流的铰链技术主要分成「U 型」「鹰翼型」「水滴型」三种,不过无论哪一种,都会因为折叠次数的增加,使得柔性材料的疲劳度增大,发生不可逆转的形变,从而使折痕愈发明显。

折叠方式也会影响折痕的深浅,目前看来,最不明显的方式是外折,以华为和荣耀为代表的外折机型,都能在长时间使用后,依旧保持很浅的折痕,但外折的柔性屏少了外壳和中框的保护,使用寿命普遍更短,更容易受到损害。

铰链、屏幕和折向,既是核心技术,也是折叠屏手机走向无痕的最大桎梏,都别说无折痕了,就是折痕变浅了,都能被当做核心优点在发布会上花大篇幅宣传一番。

因此,想要做到理想和宣传中的无折痕,光在铰链上发力是远远不够的,而是需要兼顾到铰链技术、屏幕材料和折叠方式。那苹果是怎么把这个「痛点」在理论技术上彻底根除的呢?答案在另一份文件里。

▲ 图片来自:patentlyapple.com

为了解决铰链本身的坑洼,以及数次折叠后折痕不可逆的问题,苹果专门为柔性屏和铰链的缝隙里,设计了一种用来填充的聚合物。

聚合物可以放置在凹槽和缝隙里,来把屏幕上能看见与能摸到的凹凸填满,以此来达到无折痕的效果。就很像在毛玻璃上到了一盆水,坑洼被水填满后,毛玻璃的表面变光滑,磨砂质感也变成了透明玻璃。

▲ 图片来自:patentlyapple.com

聚合物的材质并没有在专利中说明,而是例举了一些备选,例如玻璃条或玻璃珠等硬化结构,用这些质地较硬的材料,覆盖在比较薄、或者不平整的地方,以此来硬化部分柔软的屏幕。

用较硬的材质来填充有两个显而易见的优势,一是提高了屏幕的平整度,二是提升了柔性屏的强度,特别是在打游戏和用手写笔时,屏幕能有更好的支撑。

更重要的是,加固之后柔性屏也能通过铰链平顺折叠,而且因为多了一层硬化的防护,折叠后对屏幕的包裹性以及稳定性都有提升。

技术,只是第一关

铰链技术和填充聚合物的原理听上去都很简单,甚至有点简单过头了,但真正实现起来却有着非常高的难度,卫星和空间站的太阳能板的收纳方式灵感来源于折纸,马斯克回收火箭的方式参考了筷子和夹子的原理。

况且,技术难题只是开始,苹果的折叠屏,需要面对更多的挑战。

爆料中的第一点「无折痕的折叠」,的确有可能通过新材料和新技术做到,毕竟他们给自己留的期限比较宽裕。但是一台 18.8 英寸的平板尺寸,会不会有些太大了?

MacBook 的 16 寸是目前苹果移动端最大屏幕的产品,这个尺寸看电影、刷网页会更舒服,视野也更广,但随之而来的问题是携带不方便,不仅是尺寸有些偏大,而且重量也在增加,对于有专业照片、视频等编辑需求的朋友来说,这个尺寸和重量,差不多到了背在包里的临界值。

当 iPad 来到 18.8 英寸时,即使它能折叠,但重量的增加,以及对于移动端来说的超大屏,也和其本身的特点形态渐行渐远,卡在手机和笔记本中间的那块屏,现在竟然要变成卡在平板和电脑中间的那个设备。定位不明确,找不到目标用户,销量低迷也只是时间问题。

除了硬件上的难题,软硬件的配合也是折叠屏市场,遇到的共同难题。

很多朋友在这些年对 iPad 用上 MacOS 的呼声越来越高,最主要的原因是,iPadOS 对需要多应用的适配,只是把 iOS 版暴力拉伸,强行放大,然后塞进了平板里,屏幕利用率低,并没有真正发挥出平板的大屏优势。

与其用大屏版 iOS,不如直接用本身为大屏定制的 MacOS,看着更舒服,也更顺眼。而且 iOS 主打竖屏场景,macOS 主打横屏操作,而在中间的 iPadOS,则需要兼顾横竖屏的界面适配。

因此,要想真正发挥出「平板」的优势,除了想办法让它的屏幕更大,也需要让相应系统的适配场景更广。可喜可贺的是,这样的呼声很可能成为现实,Gurman 在爆料中还说到:

折叠屏 iPad 将同时具有 Mac 和 iPad 的元素,并且到 2028 年,iPadOS 应该足够先进,可以运行 macOS 应用程序。

最后,是折叠屏市场的限制,根据 Counterpoint Research 的数据统计,折叠式智能手机显示屏在 2024 年第三季度的同比出货量首次出现下降,预计 2025 年的出货量也将继续下滑。

▲ 图片来自:DSCC

注意,这还是在本就不富裕的份额中,雪上加霜。2023 年中国折叠屏手机市场出货量约 700.7 万台,同年中国智能手机总出货量为 2.89 亿部,折叠屏连总数小数点的零头都不到,只有 2% 的份额。

所以,不管是 iPhone Flip 还是 iPad Fold,都面临着难度不一的内忧外患,苹果折叠产品的未来,和苹果 AI 的当下十分相似,只是它要更迟才能到来。

当然,如果苹果真的能把理论和专利上的演示变成现实,那 0 折痕的折叠屏,会不会受到你的青睐?

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


❌