Normal view

There are new articles available, click to refresh the page.
Today — 8 November 2024Main stream

Google vs ChatGPT 搜索体验对比实测

By: DUN
2 November 2024 at 15:22

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

随着 的新实时搜索功能, ChatGPT 正在将自己定位为传统搜索引擎如 的竞争对手。ChatGPT 以其对话式的响应而闻名,能够提供实时的上下文信息而不带广告。

我抓住机会看看 ChatGPT Search 与 Google 长期以来的搜索专业性相比如何。我进行了几次比较,涵盖了速度、准确性、视觉效果和整体用户体验等类别。以下是它们的表现。

问题“东京的主要旅游景点有哪些?”

Google 的搜索引擎非常快速,结果在毫秒内就能交付。搜索引擎拥有多年的优化经验,并且有专门为高速索引和检索而构建的基础设施,可以立即获得来自多个来源的广泛相关结果。

ChatGPT 的搜索同样快速,并为每个地点生成了更清晰、更用户友好的图像和信息。显然,AI 通过从相关来源提取信息来生成响应,然后以对话的方式分享这些信息。结果感觉更加友好,几乎就像 AI 很高兴我去旅行一样。

使用体验ChatGPT Search
在以对话且简洁的方式提供有价值的快速响应方面领先。

问题: “解释气候变化和全球变暖之间的区别。”

Google
 的响应来自 Gemini,概述了气候变化和全球变暖,并将其包裹在一个简短的段落中。从那里,我可以向下滚动并搜索一些来自 NASA、USGS.gov 甚至 Quora 的链接。显然,算法优先考虑流行和权威的来源,但它也是以广告驱动的,这意味着顶部结果有时包括我看到的来自联合利华的赞助内容。此外,对于复杂的主题,我自己需要浏览多个链接才能拼凑出完整的答案。

ChatGPT 提供了直接的答案,从网络中提取经过的信息,然后添加了一个可点击的「来源」图标。这个功能减少了我在 Google 搜索中从多个收集信息的时间。在这个搜索和其他搜索中,ChatGPT 的总结对于一般查询甚至更详细的主题都是准确的,其设计允许更干净、更加集中的体验。(不过,请记住,广告可能会在未来出现。)

使用体验ChatGPT Search
在便捷和准确的直接答案方面赢得了这一轮。

问题: 苹果目前的股价是多少?最近有什么更新?

Google 实际上没有给我一个立即的答案。相反,我得到了一个指向 Yahoo Finance 的链接,我可以点击并希望自己找到答案。

ChatGPT
在毫秒内,答案就在我眼前。我还得到了关于苹果的新闻和更新,当然,还有来源。ChatGPT Search 真是令人耳目一新。我得到了问题的答案,而不需要四处寻找细节。通过将答案直接呈现在我面前,我节省了时间,而不需要再点击几次。显然,对于实时的股票 或天气更新,ChatGPT 提供了可比的准确性,甚至在深度上超过了 Google 庞大的视觉库。

使用体验ChatGPT Search
继续以其策划的实时直接答案给我留下深刻印象,显示出未来更新的潜力。

问题: 给我展示媒体对心理健康影响的最新研究。

Google 提供了如此多不同的答案,我甚至不知道该从哪里开始。从 Gemini 的响应到侧边栏,再到下面的链接结果,整个体验极其杂乱——这是我在使用 ChatGPT Search 时从未注意到的。此外,Google 的广告模式意味着用户数据通常被用来提供个性化广告。虽然 Google 有广泛的隐私政策和设置,但其广告驱动的方法可能导致不总是优先考虑用户隐私的定向内容。

ChatGPT 再次,ChatGPT 搜索提供了一个更清晰的界面,没有推广内容。对于这种个人化的搜索,额外的隐私关注方式让我非常感激。作为一个希望在搜索过程中不被广告定向的用户,这种方式对我来说更具吸引力——或者在之后。

使用体验ChatGPT Search
在考虑隐私和负责任的内容使用方面领先。对于敏感搜索,不被广告定向是一个巨大的优势。

问题: 什么是我客厅里最好的电视?

Google 我说的就是我说的,Google。在纠正我输入「What's」而不是「What is」后,Google 给我回应了一些链接,所有这些链接都是赞助的,我需要点击才能找到电视。在得到这个回应后,我感觉我需要再次问它以帮助缩小范围。然而,在赞助链接下,还有来自内容发布者的链接。

ChatGPT 为我缩小了范围,包含了图像,并给出了我想要的答案。AI 确实感觉像是一个朋友,提供有价值的信息。每个电视图像旁边都有一段介绍,提供关于每个电视的信息。与 Google 相比,这种设计感觉更加干净和简洁。此外,对话格式直观,我可以滚动浏览推荐,而不需要像在 Google 搜索中那样需要浏览多个链接。

使用体验ChatGPT Search
提供了一个令人耳目一新的体验,直接回答和具体示例。

问题: 谁在民调中领先?

Google 的结果包括有关选举的新闻故事。我希望通过这个问题获得关于今天总统选举民调中谁领先的直接结果。我不得不挖掘新闻故事才能找到答案。

ChatGPT 给了我我想要的结果,直接提供了事实。选举新闻无处不在,所以我不需要阅读更多的新闻故事。ChatGPT 给了我一个直接的答案。

使用体验ChatGPT Search
提供了没有繁琐的实时答案。

问题: 洋基队在世界大赛中是如何崩溃的?

Google 的第一个结果是从《纽约时报》关于该主题的故事中提取的引用。这是一个快速的响应和直接的答案。然而,它让我感觉我没有得到完整的故事。

ChatGPT 提供了更全面的回应,从更多来源提取信息,但仍然感觉干净简洁。我得到了洋基队彻底失败的完整画面。

使用体验ChatGPT Search
再次提供了我所寻找的实时答案,并增加了确认我获得所有信息的全面性。

ChatGPTGoogle 在不同领域都表现出色,但它们满足的需求略有不同。如果你在寻找全面的搜索结果,拥有大量来源和视觉效果,Google 仍然是强者。

然而,如果你的优先事项是清晰、无广告、对话式的响应以及内置的实时更新,ChatGPT 提供了一种流畅、用户友好的体验,可能很快就会成为日常查询的主流。

ChatGPT Search 提供的无杂乱答案以及支持它们的来源是全面且可靠的。我对 ChatGPT 的答案更有信心,因为它们简洁且没有广告商的支持。结果感觉就像是专为我准备的。在杂乱的网络中,ChatGPT 就像一个乐于助人的朋友,我喜欢这种感觉。

Yesterday — 7 November 2024Main stream

Tech C.E.O.s Courted Trump Before the Election

The executives of tech’s biggest companies largely ignored Donald Trump before the 2016 election. This time around, they’re far more friendly.

© Pete Marovich for The New York Times

President Donald J. Trump and Tim Cook, Apple’s chief executive, toured a manufacturing center for Apple products in Austin, Texas, in 2019.

What a Trump Victory Means for Tech

7 November 2024 at 01:08
Another Trump presidency will be good for crypto and Elon Musk, but every big tech company may not benefit from a more hands-off approach to antitrust.

© Doug Mills/The New York Times

Elon Musk’s embrace of Donald J. Trump should pay off for the billionaire and his companies.
Before yesterdayMain stream

430km 纯电续航,1400km+ 综合续航,小鹏的增程汽车要来了!

By: 刘学文
6 November 2024 at 20:55

2024 年 11 月,对于曾经一些表示「捍卫纯电荣耀,我辈义不容辞」的品牌来说,是一个态度上的转变时刻。先是有媒体曝出蔚来会通过第三品牌「萤火虫」来进入增程汽车市场,然后就是今天,11 月 6 日,小鹏的 AI 科技日活动上,何小鹏表示:属于小鹏的增程车,已经在计划内。

纯电大旗,只有特斯拉一家还在苦苦支撑。但,消费者买车才没有这样的包袱,市场会教育消费者,也会教育厂商。

小鹏超级电动:430km 纯电续航,1400km+ 综合续航

虽然说纯电品牌们想尽一切办法加大电池,降低能耗,加强快充速度,还有建设充电和换电网络,但和已经极为成熟的加油网络相比,还是差点意思。

以及,其实大多数人没经历过真正的没电趴窝,但有一个邮箱,那确实安心不少。

加上充电换电等等基础建设只能说是风景这边独好,世界大多数地方的充电基础设施建设还远远不够,因此想要出口海外,增程式新能源汽车,是一个折中的方案。

介绍完背景,就该何小鹏发言了,他表示,小鹏汽车再做一个普通增程车没有什么意义,小鹏做的是「鲲鹏超级电动体系」,其中,鲲代表超级增程系统,采用下一代增程技术,鹏代表着小鹏一直领先全球的纯电体系。

因此,小鹏认为,这个增程不是普通增程,而是新技术加持下的新一代增程技术融合小鹏在纯电上的能力,相当于强强组合的动力系统。

在新电机以及全平台 800V 技术加持下,小鹏未来的超级增程系统新车的纯电续航达 430km,可以算是目前增程车里最长的纯电续航里程,几乎赶上一些中低端纯电电车的续航了。在满电满油的情况下,整体续航最高可以达到 1400km。进可跑跨省际长途,退能纯电保证一周上下班通勤。

支撑这个「鲲鹏超级电动体系」有两项纯电新技术,一是小鹏的 5C 超充 AI 电池搭配 S5 液冷超快充站,可以 1 秒充电超 1 公里的续航里程,仅需 12 分钟即可充满 80%;二是新的混合碳化硅同轴电驱,电驱 CLTC 效率 93.5%,体积相比于传统电机减少 30%,可以给后排留更多空间。

另外,针对低电量状态下,电动机介入发电发出的噪音和抖动问题,小鹏也表示他们的鲲鹏超级电动体系能够实现超级静音,低电状态的声音只比纯电高 1 分贝,驾驶感受和纯电没有区别。同时,小鹏增程的「一车双能」针对相对平滑的铺装路面,车辆将更多使用电能,减少能耗;针对爬坡、泥泞、雪地等场景,发动机会提前介入避免电量过低导致动力不足。

小鹏的「星辰大海」:自研芯片,Robotaxi ,飞行汽车,机器人

说完前面实际的内容,看完了面包与蜂蜜,接下来就是属于小鹏的「星辰大海」时刻,此时的小鹏汽车,可以说是特斯拉在中国开的影分身,技术重点几乎重合。

智驾的竞争同时对云端算力和车端算力提出了要求,另外为了解决公版芯片大量通用算力被浪费的问题,小鹏汽车决定自研芯片。

在这次 AI 科技日活动上,何小鹏揭晓了自研的小鹏图灵 AI 芯片最新进展:今年 10 月,小鹏的图灵 AI 芯片已跑通最新版本的智驾功能,用 40 天完成了 2791 项功能验证。

因为小鹏的「星辰大海」包括了汽车、机器人和飞行汽车,所以这颗图灵 AI 芯片的设计初始就支持这三种产品形态,为 AI 大模型定制,为端到端而生。

算力上,图灵 AI 芯片拥有 40 核处理器,支持高达 30B 参数的大模型运行,AI 算力两三倍于目前行业主流的英伟达 Orin-X。

和图灵 AI 芯片相配套的,还有小鹏沧海底座,这是小鹏为 L4 级别完全自动驾驶设计的技术底座,涵盖了核心计算平台、基础软件平台以及智能车控应用平台,可将整车总通讯带宽提升 33 倍、摄像头出图速度提升 12 倍,同时实现 L4 级别的安全冗余。

前不久特斯拉 10 月 10 日的发布会,为我们展现了无人驾驶的未来:Cybercab 和 Robovan,两种没有方向盘和脚踏板的无人驾驶出租车和无人驾驶巴士。

而在特斯拉发布会之后,小鹏也表示,他们的 Robotaxi 也正在紧锣密鼓的研发中,与特斯拉英雄所见略同了。

今天,何小鹏透露了它的更多信息:

小鹏在现有的 Pro 和 Max 车型之上,还有「Ultra」车型,这是一种 Robotaxi 的新形态,将搭载多颗小鹏图灵 AI 芯片和小鹏沧海底座,具备高达 3000T 的车端算力,拥有 L4 级智能驾驶能力。

方向盘问题上,小鹏也希望通过线控转向技术,让未来的方向盘变为「可选」或者是「可隐藏」。

在颇具争议的飞行汽车路线上,小鹏也有小鹏汇天在持续研究,并且还画了更大的一个饼:小鹏汇天高速长航程飞行器,6 座,采用混合能源动力形式,最长空中续航可达到 500 公里,最高 360km/h 航速。

星辰大海的最后组成部分,则是小鹏的 AI 机器人 Iron。

一方面,这是和小鹏汽车在技术上同源的产品,一样会搭载图灵 AI 芯片,赋予机器人自主思考和推理能力;在行动上也依靠端到端大模型,实现行走能力,完成手指的抓、拿、放等精细任务;另外底层的小鹏天玑 AI OS 是底层操作系统,让机器人拥有流畅类人的对话能力。

另一方面,何小鹏表示,做 AI 机器人其实比做 AI 新能源汽车要难,没有 500 亿投入做不好 AI 机器人。

小鹏 AI 机器人 Iron 大小和真人无异:身高 178cm,体重 70kg,拥有超 60 个关节,可模拟人类站立、躺卧、坐。

和特斯拉的 TeslaBot 机器人已经进厂打工一样,小鹏 AI 机器人 Iron 也已进入小鹏工厂工作,未来则可能出现在销售门店、办公室、家庭等场景。

今天的小鹏 AI 科技日其实内容相当多,不过发布会安排得也相当紧凑,许多信息更像是预告,只露出未来的冰山一角。不过步入下半年后的小鹏节奏明显好了起来,一方面是 MONA 03 车型持续大卖,明天正式上市的 P7+ 预售表现也不错,销量算是稳住了。另一方面,一次画了自研芯片、 Robotaxi 、飞行汽车和 AI 机器人四个大饼,也是小鹏在发出「未来可期」的信号。

当然,介于当下和未来之间,最让人期待的,还是小鹏的增程汽车,以及背后的出海野心。

在命运的塑料大棚里,每棵被喷了过多农药的白菜心中,都曾经有一个成为无公害有机蔬菜的梦想。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


Meta AR 眼镜前主管加入 OpenAI,曾负责苹果 MacBook 设计

By: 范津瑞
6 November 2024 at 18:11

OpenAI 近日来在 AI 硬件领域的动作不断:先是要自主「造芯」,昨日又将 Meta 公司 Orion AR 眼镜的前硬件主管凯特琳·卡利诺夫斯基(Caitlin Kalinowski)招入麾下,并让她领导机器人技术和消费硬件

▲凯特琳·卡利诺夫斯基(图源:NewsBytes)

凯特琳·卡利诺夫斯基是一名硬件高管,于 2022 年 3 月开始领导 Meta 的 AR 眼镜团队。Meta 在 Connect 大会上所展示的令人印象深刻的 Orion 智能眼镜的原型机就出自她的督导。

▲图源:Meta

在此之前,她还领导了 Meta 的虚拟现实护目镜「Oculus VR」背后的硬件团队九年之久。

▲图源:Techradar

再早些时候,凯特琳·卡利诺夫斯基曾在苹果任职,为 MacBook 设计硬件。

▲图源:Apple

在加入 OpenAI 后,凯特琳表示「首先将专注于 OpenAI 的机器人工作和合作伙伴关系,以帮助将人工智能带入物理世界,并且为人类带来好处」。

巧合的是,近日「纽约时报」的一篇报道称凯特琳的前任老板,前苹果高管、传奇设计师乔尼·艾维(Jony Ive)也正在与 OpenAI 的 CEO 奥特曼联合创建一家新的初创公司。

艾维是一位来自英国的工业设计师,在苹果任职期间,主导设计了第一代 iPhone,iPod 等经典产品。他甚至参与了苹果的新总部大楼 Apple Park 的建筑设计和园区规划。

▲Apple Park

离开苹果后,他创立了自己的设计公司 LoveFrom,并继续与苹果合作。艾维和 OpenAI 的合作初创公司很可能会以 LoveFrom 为起点,并且凯特琳将会加入其中,他们将共同构建一款「使用 AI 创造计算体验,社会破坏性比 iPhone 更小」的硬件产品。

▲乔尼·艾维(图源:dezeen)

除这两员大将之外,OpenAI 最近还开始为一个机器人团队招聘研究工程师。招聘公告上写着「我们正在寻找具有强大研究背景以及人工智能应用交付经验的人才」。

OpenAI 希望机器人工程师能够调试端到端的机器学习问题,并且希望他们开发与机器人相关的机器学习架构,应用于其「核心模型」中。

正如 OpenAI 所说,这个研究团队旨在「为合作伙伴的机器人解锁新功能」,也就是帮助 OpenAI 的合作伙伴将其多模态人工智能整合到他们的硬件中。

目前,机器人公司 Figure 推出的人形 01 机器人已经利用 OpenAI 的软件进行自然语音对话;挪威公司 1X 也在其 Eve 机器人中使用 ChatGPT 的修改版本来处理和响应命令。

▲人形 01 机器人(图源:techbsb)

实际上,这并不是 OpenAI 首次启动硬件研究。早在 2018 年,OpenAI 就开发了名为「Dactyl」的机器人手,能够以人类手部相似的方式灵活操作物体,还成功地用一只手解决了「魔方问题」(Rubik’s Cube)

2020 年,在 GPT-3 发布之后,OpenAI 解散了其机器人研究团队,将重点转向了早期生成式 AI。

▲图源:OpenAI

未来,OpenAI 表示其机器人团队将「与机器人行业的合作伙伴合作,专注于构建一套模型以实现前沿机器人应用」。

在几乎引领了生成式 AI 的技术浪潮之后,OpenAI 又将重新出发,向 AI 硬件领域进军。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


Sequoia catches: periodic and VMs

By: hoakley
6 November 2024 at 15:30

This article describes one change that has caught out some using macOS Sequoia, and considers what has changed in Sequoia Virtual Machines (VMs).

periodic has been removed

After many years of deprecation, the periodic scheduled maintenance command tool has been removed from macOS 15.0. In its heyday, periodic was responsible for running daily, weekly and monthly maintenance and housekeeping schedules including rolling the system logs. Over that time, macOS has been given other means for achieving similar ends. For example, logs are now maintained constantly by the logd service, and aren’t retained by age, but to keep the total size of log files fairly constant. I don’t think that Sonoma performed any routine maintenance using periodic.

If you use periodic, then the best option is to use launchd with a LaunchAgent or LaunchDaemon. If you’d prefer to use cron, that’s still available but is disabled in macOS standard configuration.

Sequoia VMs: AI

Sequoia VMs created from an IPSW image of Sequoia (rather than upgraded from Sonoma or earlier) running on Sequoia hosts are the first to gain access to iCloud features. Now that 15.1 has been released with AI, I’ve been trying to discover whether that can also be used in a VM. So far, my 15.1 VM has sat for hours ‘preparing’, but AI still hasn’t activated on it. I suspect that, for the present, AI isn’t available to VMs. If you have had success, please let me know.

Sequoia VMs: macOS builds

My test 15.1 VM has also behaved strangely. It was originally created in 15.0, updated successfully to 15.0.1, then to 15.1, where it was running build 24B83, the version released generally on 28 October. Later that week Software Update reported that a macOS update was available, and that turned out to be a full install of 15.1 build 24B2083, released on 30 October for the new M4 Macs. This VM is hosted on a Studio M1 Max!

Installation completed normally, and that VM now seems to be running the new build perfectly happily, although it hasn’t proved any help in activating AI.

Don’t be surprised if your 15.1 build 24B83 VMs behave similarly. If anyone can suggest why that occurred I’d be interested to know, as it’s generally believed that build 24B2083 has been forked to support only M4 models.

Meta AI 的这些新技术,让机器人拥有「触觉」

By: 范津瑞
6 November 2024 at 14:20

人工智能机器人发展到今天,其拥有「视觉」或者「听觉」早已经见怪不怪。毕竟,这两种感官几乎是人类感知物理世界最重要的渠道。

而 Meta AI 的基础人工智能研究团队(FAIR)近日公布的新技术,则为机器人赋予了「触觉」。对此,Meta 的愿景是使 AI 能够「更丰富地了解世界」并「更好地理解和模拟物理世界」。

毫无疑问,这些新技术让机器人又多了一种与世界互动的方式,也让其在「类人」的道路上又向前了一步。

▲图片来自:NewsBytes

Meta 正在与美国传感器公司 GelSight 和韩国机器人公司 Wonik Robotics 合作,开发了一系列新技术,致力于将触觉传感器商业化,并将其用于人工智能当中。

这些新技术包括三个研究工具——「Sparsh」、「Digit 360」和「Digit Plexus」,专注于触觉感知、机器人灵巧性和人机交互。此外,Meta 还引入了「PARTNR」,这是一种新的基准测试,用于评估人机协作中的规划和推理。

需要注意的是,这些新技术目前并未为消费者推出,而是面向科学家和研究人员的。

▲图片来自:Techopedia

Sparsh 是第一个用于基于视觉的触觉感知的通用编码器模型,由华盛顿大学和卡内基梅隆大学合作开发。

听起来似乎有些抽象,既然是「触觉」,为什么又「基于视觉」呢?

实际上,传统方法依赖于特定任务和传感器的手工模型,其需要将物体的「触摸参数」(例如力量、摩擦等等)打包成「感觉标签」喂给机器人,相当于告诉机器人什么是「轻轻地拿」或者「用力地推」。

然而这种方法比较麻烦,因为需要为每个不同的任务和不同的传感器收集很多这样的标签数据。

Sparsh 则通过自我监督学习(SSL)从经验中自主学习,不需要告诉它每个动作对应的标签。其在一个包含 460000 多个触觉图像的大型数据集上进行预训练,这就像是让机器人看很多不同的物体和场景,然后自己学习如何识别和处理这些物体。

简单来说,Sparsh 就像是让机器人通过看大量的图片和视频来自学如何「感觉」物体,而不是通过人工给它的「感觉」打标签。这样,机器人就更容易学会如何在不同的任务中使用不同的触觉传感器了。

有趣的是,「Sparsh」这个名字源自梵语,意为「触摸或接触感官体验」,这与它处理数字化触觉信号并实现触摸感知的功能非常贴切。

▲图片来自:Meta

Digit 360 是由 Meta 与 GelSight 公司联合开发的一种人造手指形状的触觉传感器,它通过以人类级别的精度对触摸进行数字化,能够提供丰富而详细的触觉数据。

Digit 360 配备超过 18 种传感功能,允许研究人员结合各种传感技术或者分离单个信号以深入分析每种模式。

它可以检测空间细节的微小变化,能够捕获小至 1 毫牛顿的力,并且包含多种传感模式,可以感知振动、热量甚至气味,性能明显优于以前的传感器。

▲Digit 360 触觉传感器(右). 图片来自:Meta

Meta AI 团队还为其开发了一种宽视场的触摸感知专用光学系统,由超过 800 万个传感器单元(taxels)组成,用于捕捉指尖表面的全向变形。

此外,借助设备上的人工智能加速器,Digit 360 能够快速处理信息,对触摸刺激做出反应,可以充当机器人的周围神经系统。这一设计的灵感来源于人类和动物的反射弧

显然,除了提高机器人的灵活性以外,这款传感器在医学、假肢、虚拟现实和远程交互等领域都有广阔的应用前景。

▲图片来自:Meta

Meta 在博客中说道:

人手非常擅长向大脑发出从指尖到手掌的皮肤触摸信息,这使得其在做出决定时能够激活手部肌肉,例如如何在键盘上打字,或者与过热的物体交互。实现嵌入式人工智能需要机器人手上的触觉传感和电机驱动之间的类似协调。

基于这个理念,Meta AI 与 Wonik Robotics 合作,提出并建立了一个标准化软硬件平台 Digit Plexus

它允许将各种指尖和皮肤触觉传感器(例如 Digit、Digit 360 和 ReSkin)集成到一个机器人手中,并通过一根电缆将触觉数据编码并传输到主机计算机中,以实现无缝数据收集、控制和分析。

Plexus 系统的设计旨在简化机器人应用的开发,特别是对于那些需要精细触觉反馈的应用。通过使用 Plexus,开发者可以更容易地将触觉传感器技术集成到他们的机器人项目中,从而提高机器人的灵巧性和对物理世界的感知能力。

▲图片来自:Techcrunch

值得一提的是,Meta 与 Wonik 的下一步合作重点是开发 Wonik 的新一代 Allegro Hand,这是一款配备 Digit 360 等触觉传感器的机器人手,它将在 Digit Plexus 平台上运行。

▲图片来自:XELA

为了研究家庭活动中的人机协作,Meta 在 Habitat 3.0(一个用于研究家庭环境中人机协作任务的模拟平台)的基础上,发布了人机协作规划和推理任务基准 PARTNR

PARTNR 是同类中最大的基准,包含 100000 个自然语言任务,涵盖 60 栋房屋和 5800 多个独一无二的对象。该基准的目标是评估大型语言和视觉模型(LLMs / VLM)通过人机交互工具与人类协作的性能。

通过提供标准化基准和数据集,Meta 表示「希望它能使机器人的研究不仅能够独立运行,而且能够围绕人类运行,使它们更加高效、可靠,并且适应每个人的喜好」。

▲图片来自:LinkedIn

让机器人拥有「触觉」,并不是一座「空中楼阁」。

这些机器人对外界变化拥有远超人类的敏感度,配合高效的软硬件协作系统,他们将会在外科手术或者精密仪器制造场景中大有用武之地。

其实,不仅「视觉」、「听觉」和「触觉」,宾夕法尼亚州立大学的研究人员已经在人工智能模型模拟出了「味觉」;同时,一家名为 Osmo 的公司已经教会人工智能模型如何模仿远优于人类的「嗅觉」。

也许未来的机器人能够在感官方面完全「复刻」人类。只是他们最好不要再拥有逼真的「人形」,否则,恐怖谷效应要犯了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


新一代赛博仆人!这款机器人要帮你把各种家务活都做了

By: 范津瑞
5 November 2024 at 14:00

不知道你是否曾有过这样的想法:当一个「甩手掌柜」,把一切家务都交给家务机器人。说实话,这是在科幻作品中经常能够看到的场景。

毕竟,谁不想拥有一位任劳任怨的「赛博仆人」呢?

来自旧金山的初创公司 Physical Intelligence(物理智能,简称 Pi)正在致力于帮助人们实现这个梦想。这家公司近日展示了一种「接受了前所未有的数据量训练」的人工智能模型,它已经学会了干各种有用的家务活。

Physical Intelligence 发布的视频显示,他们的机器人可以十分灵巧地完成各种家务活,包括但不限于:整理摆满了杯子和盘子的桌面:

把咖啡豆从袋子舀到机器当中:

甚至可以组装纸箱:

最令人深刻的是,它们可以取出烘干机内的衣物并折叠整齐。两只机械臂如同人类的双手一般,配合熟练:


有趣的是,该公司开发的这种算法有时会表现出一些的类似人类的怪癖,例如摇晃 T 恤和短裤,让它们平整地铺开。

Physical Intelligence 的首席执行官豪斯曼(Hausman)指出,折叠衣服对于机器人来说尤其具有挑战性,需要更多关于物理世界的一般智能,因为它涉及处理各种会不可预测地变形和皱折的柔性物品。

他还表示,目前的算法并不很稳定。就像 AI 聊天机器人有时也会「崩溃」一样,这些「家务机器人」有时也会做出一些令人不可思议的举动:比如它会将鸡蛋塞满已经装不下的纸箱,把纸箱强行合上;有一次在装东西时,机器人突然把盒子从桌上扔了下去。

▲Physical Intelligence 的 CEO 豪斯曼. 图片来自:The Information

尽管算法还不完美,但 Physical Intelligence 至少为未来的「通用家务机器人」提供了一种可能性。

然而,豪斯曼的野心远不止于此。「家务」只是其中一种用途,「通用」才是公司的雄心壮志:

我们的目标是通过一个通用模型将人工智能带入物理世界,基本上对于任何应用程序来讲,该模型可以为任何机器人或任何物理设备提供动力。

▲图片来自:maginative

换句话说,Physical Intelligence 的目标是创建一个类似于大型语言模型(LLMs)的物理世界模型,这是一种「通用人工智能模型」。

他们将构建语言模型的技术与控制和指导机器的自有方法相结合,并通过训练大量的机器人数据来实现。豪斯曼表示,他们的方法「非常通用」,可以利用来自不同机器人类型的数据进行训练,类似于人们训练语言模型的方式。

公司在过去八个月中开发了其「基础模型」,名为 π0(pi-zero)。π0 通过使用来自多种机器人执行各种家务的数据进行训练,公司还经常让人类远程操作机器人以提供必要的教学。

Physical Intelligence 的联合创始人之一、加州大学伯克利分校的副教授谢尔盖·莱文(Sergey Levine)表示,他们训练的数据量比以往任何机器人模型都要大得多,并且「幅度非常大」

▲谢尔盖·莱文(Sergey Levine). 图片来自:YouTube

与其他公司譬如 Figure AI 和特斯拉专注于构建仿人机器人,以及像 Covariant 这样的公司开发通用机器人软件不同,Pi 旨在创建可以应用于广泛机器人硬件的软件

对此,知名科技投资者,也是 Pi 的联合创始人之一的拉奇·格鲁姆(Lachy Groom)表示「使人类变得有趣的是我们的大脑,而不是我们的硬件,我们是终极的通用主义者」。

▲特斯拉开发的名为「Optimus」的人形机器人

Physical Intelligence 面临的一个关键挑战是,与大型语言模型训练中可用的文本数据相比,用于训练的机器人数据规模有限

因此,公司必须生成自己的数据,并想出提高从更有限数据集中学习的技巧。

实际上,为了开发 π0,公司结合了所谓的视觉语言模型(在图像和文本上训练)和扩散建模(从 AI 图像生成中借鉴的技术),以实现更通用的学习。

一切的一切,都在为「通用」而努力。

对于 Physical Intelligence 的现状和未来,莱文的观点是:

为了让机器人能够承担人类要求它们做的任何杂务,这种学习需要大幅扩大。尽管还有很长的路要走,但我们有一些你可以认为是基础框架的东西,未来的事情从中可见一斑。

但同时,莱文对 Pi 的发展充满信心。他表示有足够的迹象表明,在现实世界中使用机器人的最大障碍「现在已经可以解决」。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


我用 ChatGPT 和 Midjourney 剪掉了蓄满四年的长发

By: Steven
1 November 2024 at 17:26

这是我蓄满了四年的长发,原本是打算捐给金丝带的,但我决定放弃了。

一来,捐赠的人太多了,不缺我这一个,它不需要我;

二是,这个活动太热门了,报不上名,我不喜欢凑热闹;

于是,我心里很快就决定了:剪掉,并且要烫卷、染发!

在音乐教室里,筱烨、阿吉和秋秋在上课,我就在旁边用 ChatGPT 写 Prompt,写完之后就丢给 Midjourney 去生成效果图。遇到不满意的,就丢两张我以前的半长发的照片上去,再调整 Prompt 的细节,接着画。

最后,我把这张效果图发给发型师:

虽然这脸型偏硬了,不怎么像我,但这个头发感觉是我想要的。

曲线、松软、紫色挂耳

确定方案之后就直接约时间,一方面要约发型师的时间,他很好约,就在楼下,我随时过去随时可以做;但另一方面,要约收头发的师傅过来,需要由他根据长度把我的头发抽出来。这也是我第一次卖头发,挺新鲜的体验。

首先,我要跟发型师和收头发的师傅一起商量,怎么剪、剪多少、剪到哪里、用什么方法剪。我原本以为就是咔嚓一刀剪了,但其实不是。整个过程里,这位师傅需要非常仔细地把我头发中最长的部份找出来,每次只挑选一小撮,然后用剃刀在距离头皮大约 8-10cm 的位置一点点把头发切断。这样做的目的是,即确保剪下来的头发是满足他收头发的需求,也能确保给发型师留有后续足够的操作空间,还得让头发之间的层次能自然地衔接上。

每次剪下一小撮头发后,他都会仔仔细细地把头发梳几遍,确保没有任何打结,然后放在准备好的毛巾上,平放着。剪之前还特意要把周围的风扇都关掉,万一吹乱了,这些头发都全都没用了。他就这么一遍一遍地重复捏一小撮、切下来、梳顺、平放,如此反复了半个多小时,才终于从我头上抽出来两把共 59g 的长发。

然后就是烫卷和染发。

之所以想这样折腾一下,多少有一点破罐子破摔的心态在,觉得既然这头长发不被需要了,那也就放过自己,不要再被「这件事」困住了,索性趁着这个机会来尝试一下之前没折腾过的事情!

其实我 17 年前也染过一次发,但那时候是因为演《暗恋桃花源》的老导演,为了贴近角色的年龄感,我就去染了一头白发。只不过那个白发染得不成功,黄黄的,加上那会儿我比较消瘦,自己觉得不好看,所以演出结束的第二天我就去剃光头了。所以那次严格来说我不觉得是一次正经的染发体验,毕竟没有顶着这头黄毛生活,勉强能算一次临时的体验。

我当然知道它会掉色,会变成黄毛,会干、会毛躁。

但这不重要,因为我就想试一试。

我紧绷了三十多年,现在崩断了,还不能讨好一下自己,玩一玩吗?玩!

不仅要玩,还要玩得不一样,用 AI 一起玩!

为什么是紫色?因为我喜欢!

虽然我也喜欢绿色,但我也不想染成绿色 😂

朋友说像杨千嬅,像极速拍档的小乔,那也挺好。

最近两周我忽然意识到,我是会因为自己感觉到快乐而感到羞耻的。这是从小根深蒂固的想法。过去我知道,如果我遇到一件好事,一件开心的事,就会有一个声音在警告自己不要乐,不要得意,不要喜形于色,要收起来,不然马上就会招来不幸和倒霉。但我一直认为这是克制和谨慎,是对于能量守恒定律的迷信式的执念,觉得这会儿开心了以后就没有了。

可是,为什么要把开心攒到以后呢?有没有以后都不知道。

筱烨说我的动力来自恐惧,确实,我总有各种恐惧在周围,挥之不去。

但现在我看见它了!我要让我的快乐活过来!我不要快乐羞耻!

尽管我现在还没有什么活力,但起码这个紫色能令我舒服好一阵子!

最后再看一眼,这头蓄了四年的长发和发髻。

我很喜欢这根石纹簪,但我感觉我应该不会再束成这个样子了。

这天色真好。

荣耀 Magic 7 系列发布!AI 深度赋能,手机也能「自动驾驶」

By: 范津瑞
1 November 2024 at 10:00

我们要用最强的荣耀 Magic 7 系列来引领 AI 时代的智能手机体验,消费者将见到 AI 时代最强的 AI 手机。

在荣耀 Magic 7 系列发布会的前夕,荣耀 CEO 赵明在访谈中如是说。从配色到设计,从处理器到系统,还有「第一个可跨第三方应用的 AI 智能体」……赵明如数家珍地畅谈着 Magic 7 系列的亮点。

亮点之外,赵明还有更美好的愿景:我们希望每个人通过荣耀的 AI 手机 Magic 7,用户能有更好的心情和更自由的体验。

10 月 30 日,荣耀 Magic 7 系列旗舰新品正式发布。让我们一起「趁热」看看。

设计「一眼好」,配置大升级

荣耀 Magic 7 系列的设计灵感「源于自然,探索宇宙」,背部的相机模组则延续了「方圆宇宙」的家族化设计语言:钻石切割工艺的金属边框包裹着镜头,有一种类似星空的深邃感。整机外观玲珑圆润,精致又不乏理性。

与上一代荣耀 Magic 6 系列全系采用曲屏设计不同的是,Magic 7 标准版回归经典直屏,采用了「超窄等边直屏」,主打手感和操控体验;Magic 7 Pro 则采用了「等深微四曲屏」设计,在保证手感的同时,观感更加丰富精彩。


荣耀 Magic 7 系列的屏幕采用了顶级的 8T LTPO 技术,峰值亮度达 5000 尼特,刷新率最高支持 120 Hz。并且支持全域全天候低功耗显示,还支持 AI 臻彩显示AI 超画质显示,屏幕画面真实生动,观看体验更加「震撼」。

Magic 7 标准版的屏幕尺寸为 6.78 英寸,Magic 7 Pro 则为 6.80 英寸。

值得一提的是,荣耀 Magic 7 系列不仅想让你看得「爽」,还十分关心你的视力健康,让你看得舒适。

Magic 7 系列的屏幕是目前「业界唯一」全局全天候 AI 自然光绿洲护眼屏,集成了八大护眼技术。区别于业内普遍采用的「线偏振光」,Magic 7 系列创新性地通过引入「圆偏振光」来模拟自然光,能够有效减轻视觉疲劳,从而达到护眼的效果。

更加令人惊喜的是,相较于 Magic 6 系列的短焦指纹,荣耀 Magic 7 系列全系支持 3D 超声波指纹解锁,解锁速度更快,还支持湿手解锁,即使是洗澡时也能及时回复消息。

Magic 7 Pro 还支持 3D 人脸识别解锁,这也使其成为了业内唯一「双 3D 生物识别」的手机,既安全又便捷。


此外,荣耀 Magic 7 系列全系配备荣耀巨犀玻璃,支持 IP68 级防尘防水及 IP69 级防高温高压喷水。现场的「洗碗机」实验表明其即使在近 70 度的高温冲洗环境下也能「依然保持坚挺」。

在影像创作方面,荣耀 Magic 7 系列同样拥有不俗的实力。毕竟,口号是「打造最强光影人像」。

Magic 7 标准版配备了前后四枚 5000 万像素的镜头,包括前置摄像头;而 Magic 7 Pro 则在标准版配置的基础上将 5000 万像素的超清长焦升级为 2 亿像素的潜望长焦,搭载行业领先的 1/1.4 英寸长焦传感器,支持 3 倍光学变焦。


荣耀 Magic 7 系列配备全新升级的 AI 鹰眼相机,支持由「光影人像大模型」和「抓拍增强大模型」深度融合的 AI 驭光引擎,可以通过大模型技术感知和理解光影,并最终重塑光影,允许用户实现与众不同的影像表达。

AI 驭光引擎具体到功能,就是:

  • 支持包含暗光场景的超清人像拍摄;
  • 鹰眼超级连拍;
  • 舞台模式。

其中,超清人像拍摄能够提供「像单反相机一样」的拍摄体验。即使是在暗光场景下,也能有丰富的细节和表现力。

鹰眼超级连拍则能够精确捕捉动态与静态的精彩细腻瞬间,解决了连拍和抓拍模糊的问题,放大看,也清晰。

舞台模式则针对舞台上的复杂光影进行了色彩优化,能够很好地呈现类似舞台,对比度较强的场景的明暗细节。

荣耀 Magic 7 系列还搭载了「荣耀环绕低音炮」,这是行业首创的双开放式音腔,其拥有 10 倍的音腔容积,低频性能更是提升至 160%。「手机外放」从此不再是一个令人捧腹的伪命题。

如此有料的硬件配置,Magic 7 系列要成为「AI 时代最强」的野心,可见一斑。

AI 全面进化,手机也能「自动驾驶」

在传统操作系统的演变更新几乎走到尽头,AI 时代势不可挡的背景下,「AIOS」无疑是时代的新宠。

MagicOS 9.0 就是这样一款搭载智能体的个性化全场景 AI 操作系统,它标志着手机进入了「自动驾驶时代」。

传统操作系统的内核基于设备的资源进行计算,而 MagicOS 9.0 则增加基于人的关联因子的 AI 内核,引入大语言模型、图像大模型、语音大模型和多模态大模型,并通过按需调度大模型,实现对用户需求的精准理解与服务。


有了 AI 内核的加持,荣耀手机内置的「YOYO 助理」一跃成为「YOYO 智能体」,它可以理解更多的需求和意图,并能够自动完成更多更复杂任务的规划和执行。

除了理解语言语义,执行相应的服务以外,YOYO 智能体还能真正理解屏幕和消费者的生活习惯,从而模拟用户本人来操作手机,更加省心省力。无论是点奶茶点外卖,还是取消续费自动订阅,真正做到了操控手机就是「一句话的事儿」。

作为首发搭载 MagicOS 9.0 AI 系统的 Magic 7 系列,搭配「任意门」、「灵动胶囊」和「YOYO 智能体」等,还可以实现诸如「购物比价」、「复杂地址一圈直达」一类的贴心功能,甚至能够「用魔法打败魔法」,检测「AI 换脸」的潜在风险。


不只是「拥有 AI」这么简单,而是「AI 深度赋能」,Magic 7 系列的目标,是成为你未来的生活方式。

首发骁龙至尊,性能再突破

得益于在 AI 和核心能力上的积累,Magic 7 系列可以与 SoC 几乎同时发布,并且充分运用了 SoC 的 AI 算力。

荣耀 Magic 7 系列首批搭载高通骁龙 8 至尊版移动平台,该芯片采用台积电第二代 3nm 工艺制程,凭借高通自研架构获得了顶级的性能和能耗比,号称骁龙平台「迄今为止最大升级」。


Magic 7 系列首发搭载了全栈 Vulcan 图形引擎,即使是 10 万张照片的加载滑动也十分流畅。


虽然不是专业的电竞手机,Magic 7 系列的游戏性能也不容小觑。它使用 AI 超分渲染引擎和 NPU + GPU 异构计算技术,在帧率、画质和温度控制「不可能三角」上实现了难以置信的平衡,大幅提升了玩家的游戏体验。

从此,玩王者荣耀「开团」不怕掉帧,玩「原神」也不怕烫手了。

此外,Magic 7 系列还首发 AI 预测调度引擎,支持边玩游戏边直播,并能够长时间保持高帧率。对于越来越多的游戏直播行业从业者来讲,这一功能无疑是他们的福音。

就像人类的心脏一样,没有「强芯」,其余的一切都是空谈。

通信无忧,续航不愁

荣耀 Magic 7 系列支持其与运营商合作的荣耀优速通服务,通过移动数据网络专线加速,能够提供「VIP 级」上网体验。也就是说,在地铁或者其他人群拥挤的地方,Magic 7 可以极大程度地避免网络拥堵的尴尬情况。

荣耀 Magic 7 系列还首发了全新的通信芯片 HONOR C2,它支持全新的天线调谐控制算法,在弱网的场景下,它可以让手机的信号大幅度提升。同时,这颗处理器还支持双 Wi-Fi 芯片聚合下载,可使网速最高提升至 200%。

现场测试显示,在限速的情况下,Magic 7 的网速可以比 iPhone 可以快一倍,相当逆天。

此外,Magic 7 系列还支持「鸿燕通信」,即卫星通讯。其中 Magic 7 标准版支持北斗卫星短信,而 Magic 7 Pro 则支持天通卫星通讯,并首发了 AI 卫星通话降噪技术。

续航方面,荣耀 Magic 7 全系搭载第三代青海湖电池,并且拥有 10% 的行业最高硅含量;还搭载新一代都江堰 AI 电源管理系统和自研能效增强芯片 HONOR E2,支持 100w 有线充电和 80w 无线充电,还支持 600 多种场景的车充模式,综合续航时长行业领先。

治愈你的「电量焦虑」,Magic 7 系列用数据说话:有线充电和无线充电分别只需要 33 分钟44 分钟就能充满。

其中,Magic 7 标准版配备 5650mAh 电池,而 Magic 7 Pro 则配备 5850mAh 电池。

如此有诚意的升级,Magic 7 标准版的起售价为 4499 元,相比上一代标准版仅增加 100 元;此外还新增了一个 16GB + 1TB 的版本,售价 5499 元。

Magic 7 标准版共推出了 5 个颜色:绒黑色、雪域白、月影灰、天际蓝朝霞金。具体售价如下:

荣耀 Magic 7 Pro 则不包含「朝霞金」配色,售价与上一代 Magic 6 Pro 持平:

另外,荣耀 Magic 7 RSR 保时捷设计也在发布会的结尾亮相,预计在 12 月正式发售。

发布会的结尾,赵明说:「我们想不断地打破瓶颈,做正确而艰难的事。

荣耀将「AI 深度赋能」和支持「自动驾驶」的全新智能设备展现在我们眼前,让我们看到 AI 手机的一种新形态。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


OpenAI 计划自研 AI 芯片,以减少对英伟达的依赖

By: 范津瑞
31 October 2024 at 14:30

据路透社报道,OpenAI 正在与博通(Broadcom)合作开发其首款定制 AI 推理芯片,旨在处理其大规模的 AI 工作负载,特别是推理任务。

为此,OpenAI 已经组建了一支约 20 人的研发团队,包括曾参与谷歌 Tensor 处理器项目的首席工程师在内。

消息称博通将会帮助 OpenAI 进行芯片设计,并确保由台积电(TSMC)进行制造,预计 2026 年开始生产。

▲OpenAI 将自研 AI 芯片. 图片来源:cnBeta

为了实现芯片供应的多元化,OpenAI 此前计划建立芯片制作代工厂。但由于成本高昂,并且构建代工厂网络需要大量时间,OpenAI 已经搁置了这一计划,转而专注于内部芯片设计

OpenAI 这一通过「定制芯片设计来管理成本和访问 AI 服务器硬件」的战略意味着其走上了 Meta 和 Google 等科技公司的老路,而后者作为 OpenAI 的竞争对手,已经经历了几代人的努力。

并且,市面上不乏成熟且广泛部署应用的 AI 芯片,如 Google 推出的「TPU」、微软的「Maia 100」等等。

也就是说,OpenAI 需要更多的资金才能弥补这些差距,登上牌桌。

▲微软推出的 AI 芯片「Maia 100」. 图片来源:techmonitor

除了满足不断增长的基础设施需求,减少训练和运行成本以外,「减少对英伟达(NVIDIA)的依赖」也是 OpenAI 的「小算盘」之一。

OpenAI 的 CEO 奥特曼(Altman)指出,之所以要「获得更多芯片」,是因为两个问题:为 OpenAI 软件提供动力的先进处理器的短缺,以及为其工作和产品提供动力的硬件运行所需的「令人眼花缭乱」的成本。

他还曾公开抱怨市场资源匮乏,而 NVIDIA 主导并控制着最适合运行 AI 应用的芯片全球 80% 以上的市场。

作为英伟达图形处理单元(GPU)的最大买家之一,OpenAI 此前几乎完全依赖 NVIDIA GPU 进行训练。2020 年以来,OpenAI 在微软建造的大型超级计算机上开发了其生成式人工智能技术,这台计算机使用了 10000 个 NVIDIA GPU。

▲NVIDIA H100 GPU. 图片来源:NVIDIA

但由于芯片短缺和供应延迟,以及训练成本高昂的问题,OpenAI 不得不开始探索替代方案。他们计划通过微软的 Azure 云平台使用 AMD 芯片进行模型训练。

值得一提的是,AMD 在去年推出了 MI300 AI 芯片,致使其数据中心业务在一年内翻了一番。种种迹象表明,AMD 正在追赶市场领导者 NVIDIA。

▲AMD MI300 芯片. 图片来源:AMD

此外,消息人士称 OpenAI 仍在决定是否为其芯片设计开发或收购其他元件,并可能会聘请更多合作伙伴。

尽管「不惜一切代价构建 AGI(通用人工智能)」的 OpenAI 和号称「下一个英伟达」的博通之间和合作很可能引起英伟达的不满,但 OpenAI 表示「希望与仍致力于合作的芯片制造商保持良好的关系,特别是在使用其新一代 Blackwell 芯片方面」。

对此,英伟达暂时不予置评。

唯一的回应是市场。合作消息一出,博通的股价应声大涨,AMD 也延续了早盘涨幅。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


导演詹姆斯·卡梅隆:AGI 是一颗「定时炸弹」

By: 范津瑞
30 October 2024 at 15:10

10 月 23 日,知名加拿大电影导演、编剧和制片人詹姆斯·卡梅隆(James Cameron)为在华盛顿举行的 SCSP(Special Competitive Studies Project,特别竞争力研究项目)人工智能 + 机器人峰会作视频致辞。

致辞中,卡梅隆表示自己作为一名「故事讲述者」和「引领 CGI(Computer-Generated Imagery,电脑生成图像)潮流的先锋」,热爱 AI 和机器人技术,并且愿意「积极地拥抱变化」,将 AI 技术应用于未来的电影制作当中。

然而,鉴于 AI「没有情感和良知」,卡梅隆在致辞中所表达的,更多的是对 AI 和 AGI 技术的隐忧,尤其是其在军事应用方面的伦理考量,以及对 AGI 未来失控风险的担忧。

他的观点相当激进和尖锐:AGI 必然会导致文明与道德的碰撞

站在反战的角度和人道主义的高度,卡梅隆批判了「地域性的伪道德」,并且认为关键在于如何赋予这些 AI 系统适当的道德约束,制定全球统一道德标准。

▲导演詹姆斯·卡梅隆(James Cameron)在发表视频致辞

作为「我们的一面镜子」,卡梅隆认为 AGI 反映了人类社会的善恶好坏。人类世界不乏邪恶存在,对于正义也并无共识,因此卡梅隆对 AGI 技术的发展持谨慎乐观的态度。

原致辞视频链接:

以下是卡梅隆在致辞中的主要观点

  • AI 没有情感和良知,在战场上不对对手作任何道德判断;
  • AI 的引入导致战争「游戏化」,变成超级智能之间的对抗,没有深刻的情感后果;
  • 自我改进的代码编写 AGI 必然会导向超级智能;
  • AGI 必然会导致文明与道德的碰撞;
  • AGI 会使得监控资本主义可以很快转变为数字化极权主义;
  • AGI 是人类世界的镜子,反映了人类社会的正负两面。

以下是由 APPSO 编译的致辞全文:

大家好,我是詹姆斯·卡梅隆,现在我正在新西兰,在那里完成「阿凡达 3」的拍摄。

好吧,我不是人工智能或者机器人学的研究员或专家。我只是一个讲故事的人,但我今天在这里,是因为我对 AI 和机器人的热情远远超出了大银幕的范畴。

我对科技感到着迷,它如何塑造我们的世界,它的未来走向,以及它对社会的影响。从我还是个孩子的时候起,我就阅读了所有我能找到的科幻书籍。

我自己也推动了技术的边界,作为我讲故事的一种手段,同时也是作为一名探险者。

我为我的深海探险设计了机器人车辆,但它们是远程操控的,并没有涉及到人工智能。而现在正在发生的 AI 与机器人技术的融合,是我一生中最令人激动的技术飞跃之一。

我们不再只是建造执行命令的机器,而是设计可以学习、适应,甚至自我进化的系统。我非常支持人工智能和机器人技术对整个社会所能带来的改变,特别是在我个人热衷的两个领域——艺术和故事叙述,以及科学和探索方面。

我不认为应该成为一个卢德分子(反对技术进步的人)。我看到很多我的好莱坞同行表现得像是一群拿着火把和锄叉的暴民,但是精灵一旦从瓶子里出来,就再也塞不回去了。

所以我非常积极地拥抱变化,我愿意站在将 AI 应用到我的故事叙述中的最前沿,正如 32 年前当我创立第一家全数字特效公司时,我也同样是引领这一潮流的先锋。

▲卡梅隆创立的全数字特效公司「数字王国(Digital Domain)」

但今天我之所以来到这里,还因为我就是「天网」(Skynet)的创造者。

40 年前,我拍摄了「终结者」,而它最近成为了 AI 失控的一个典型代表。每次我去参加一些 AI 会议,只要我举手,研究人员们都会在我还没说话之前笑起来,因为「天网问题」确实是一个值得关注的问题,我几乎每天都能在文章中看到相关的讨论。

▲卡梅隆执导的经典科幻电影「终结者(The Terminator)」

这个研究小组关注的是国家安全,这对人工智能和机器人技术有着巨大的影响。

机器人,无论其形式如何,是轮式车辆、空中无人机还是行走机器,都是人工智能的一种实体化方式。你是在将一个决策引擎赋予在现实世界中的物理行动能力。

我假设今天的焦点在于移动平台,而不是控制电网或固定基地工业机器人的 AI。我们谈论的是能够自主作出决策的平台,即具像化的合成智能。

这可以像变形虫一样简单,你知道,就像一个扫地机器人(Roomba),或者最终更加复杂,直至理论上包含真正的意识,不管那是什么。

我们都同意这是具有自我意识、有自我、有目的性的 AGI(通用人工智能)。我们在一个更陡峭的曲线上前进,拥有更快、更密集的芯片,计算能力也在不断提升,同时机器平台的能力也在以同样陡峭的曲线增长。

就像波士顿动力公司的跳舞机器人。你知道的,两足或四足的机器人在跳舞。真是令人惊叹的展示。

▲波士顿动力公司开发的跳舞机器人「Atlas」

因此,由 AI 驱动的机器人可以处理复杂的情况,甚至现在可以带有类人的情感,LLDs(低级逻辑器件)赋予了它模拟认知和与人们自然互动的能力。

具像化的 AI 可以是护士,可以是机器人出租车,可以是照顾老人的看护,可以是孩子的保姆,也可以是教师。它可以是在地震废墟中搜救的机器人,可以是在空中按模式搜索失踪徒步者热信号的无人机。它可以是在战场上自主运行的武器平台,寻找敌方战斗人员的热信号。

当前的问题是,是否应该赋予自主平台自行决定杀伤的权限?

乌克兰战争以最鲜明的方式向我们展示了未来。致命性空中无人机的广泛使用,有些昂贵,有些则是廉价的消费级产品。

它们投掷火箭弹,摧毁坦克,甚至整个坦克乘员组,还有喷射热熔剂攻击俄罗斯阵地的龙形无人机。但这些都是 FPV(第一人称视角)无人机,由人类操控。

从道德角度来看,人类是作出决策的战斗人员。他或她拥有杀伤授权,无人机是他们意志的延伸。如果你剥离掉所有的技术层面,这与黑斯廷斯战役中的弓箭手没有什么不同。

每当这样一个机器夺走一条人命时,就会有一条伦理链条向后延伸,扩散至许多个人和群体。

在发射导弹或扣动步枪扳机的士兵背后,有下达击杀命令的指挥官,他们以广泛的、一般性的术语派遣这些自主代理去对抗敌人,以及整个军事体系,该体系奖励这些行为;再往上,则是通过共识同意这些死亡是为了国家安全必要的社会和政府。

沿着这条链上升,道德和伦理责任变得越来越分散,具体到实际扣动扳机那一刻的责任也越来越模糊,并且起到了某种道德赦免的效果——「我只是服从命令」。

链条上的这些人并不在现场见证准星下的个体的命运,但他们创建了一个框架,使得并要求该个体的死亡成为可能,而扣动扳机的人在许多方面是一个高度训练有素的有机机器人平台,受命于指挥链中的上级执行任务。

在人类自主决策的那一刻,非常依赖规则——你不杀害平民,你不杀害儿童,你不杀害投降的敌人等等,这些规则被编纂入日内瓦公约,每个军队都有自己的交战规则。

因此,理论上,AI 可以被赋予同样的约束,基于规则的系统。如果它的感官更敏锐,反应速度更快,瞄准更精确,那么理论上,AI 将以比人类更高的辨别力完成任务。

当然,我们可以想象,在激烈的战斗中,AI 会比一个恐惧、紧张、疲惫的人类战士表现得更好。

▲或可用于战争的无人机

那么,如果将高级 AI 具象化呢?我现在说的还不是 AGI,而是将其嵌入到机器人武器平台中,可能会允许高度精准的打击,减少附带损害,也许成数量级减少误伤或伤亡,并且 AI 是以目标为导向的。

它不对对手作出任何道德判断,在二战中发现,对准人类目标的的射击实际上是相当少的,美国军方改变了其训练方法,使敌人非人性化变得至关重要。

在越南,敌人被称为「dinks」、「slopes」、「gooks」。在伊拉克和阿富汗,敌人被称为「恐怖分子」、「towel heads」、「hajis」,不是像你我这样的人。

AI 不需要将敌人拟人化,因为它本身对此毫不在意。听起来就像是我们在 ChatGPT 上聊天,但它只是一个随机应变的鹦鹉,是一个人类模拟器。

AI 没有情感,没有良知,未来几十年都不会有睡眠困扰,没有 PTSD(创伤后应激障碍),没有自杀,没有长期且昂贵的战争后遗症,因为你不必治疗前战士的身体和心理创伤。

但最重要的是,穿着制服的严肃人物敲响妻子和母亲家门的次数大大减少了,因此来自家庭民众的抗议声也少了很多。战争变成了一个遥远的电子游戏,对资助和支持这场战争的社会来说,没有深刻的情感后果,甚至你都不必感谢在反恐战争中服役的机器人。

可以肯定的是,由 AI 驱动的自主机器人,隧道清理群集机器人,可以在减少小几个量级平民伤亡的情况下完成这项工作。

这里还有一个有力的论点,那就是你别无选择,因为你的对手并没有像你那样受到道德的困扰。

对于这样的对手而言,唯一的限制是成本和技术获取,而不是道德,所以这是一颗定时炸弹。这些家伙会多快掌握这些东西呢?到目前为止,这些论点都是正确的,对吧?

好吧,让我们来建造这些自主的 AI 机器人,接下来事情就变得棘手了。通用人工智能(AGI)还有多久会实现?是一年,五年,也许是十年?这才是真正的定时炸弹。

无论何时它到来,你将会拥有一种具有自我意识和自我认同的机器,可能和我们一样聪明,甚至更聪明,肯定能在许多方面思考得更快、更精确,并且具有无限的增长潜力,因为自我改进的代码编写 AGI 必然会导向超级智能。

在你被迫面对将这种智能连接到武器系统之前还有多久?我猜在对手对你发动毁灭性的偷袭之后大约十分钟。因此,你会有一个比你更聪明、更快的意识来控制武器系统。

我时常问 AGI 的研究人员,你们将如何控制这样的意识。嗯,我们会给它设定目标和界限,这些目标和界限是内置的,是与人类福祉相一致的。

一致性,你知道,一个很常用的词。一致性就像圣杯。我们会教导它做好事,不做坏事,就像教导一个孩子一样。

所以,道德、伦理,我认为 AGI 必然会导致文明与道德的碰撞。

我说的不是无尽的哲学思辨。我们需要一些明确而固定的规则,对吧?问题是,谁的道德?谁来定义好坏?

别慌,我们有伟大的先知艾萨克·阿西莫夫和他的机器人三大法则作为答案。

机器人不得伤害人类,也不得因不作为而使人类受到伤害。机器人必须遵守人类的命令,除非这些命令与第一条法则相冲突。机器人必须保护自身的存在,前提是这种保护不与第一条或第二条法则相冲突。

▲知名科幻作家艾萨克·阿西莫夫(Isaac Asimov)

人类生命的神圣性,我们可以遵循阿西莫夫的原则,教导它人类生命是绝对神圣的,高于一切考虑。但在那些声称如此的宗教和社会体系中,包括主要信奉基督教的美国,我们每天都打破这一规则。

警察使用致命武力,战场上的战士,死刑,如果你坚持这一对齐原则,你就不能将 AGI 连接到武器系统上。

这样的话,在即将到来的大规模 AI 战争中,你会单手被绑地面对一个强大而不那么道德的对手,你会遭到重创并遭受巨大损失,然后你会很快解除这一限制。

现在你的 AGI 失去了它最大的护栏,一个比我们聪明并与现实世界相连的 AGI 现在必须自己决定人类生命是否有价值。你知道,警察和军队的交战规则实际上说的是某些生命比其他生命更有价值。

一旦这个问题变得不是二元对立的,它就成了一个充满争议的灰色地带。历史上,人类的态度从认为胎儿从受孕那一刻起就是神圣的生命,到在大屠杀中系统性地屠杀数百万无助的囚犯,以及介于两者之间的一切。

所有这一切都伴随着大量的自我辩解和合理化,其中许多理由在其他人看来似乎是完全荒谬的。

既然我们作为一个文明无法在这些问题上达成一致,人们整天为此争吵不休,我们怎么可能指望为 AGI 制定一套明确而固定的规则,使其与我们对齐?

我们所能假设的最佳情况是,它会与制造它的那个「我们」对齐。

那边的那些人,他们是敌人,你可以为了保护我们而杀死他们。这就是一种地域性的伪道德,自古以来人类一直使用的「我们」与「他们」的对立。

于是,这就变成了我们的超级智能对抗他们的超级智能。

无论如何,AGI 不会从政府资助的项目中诞生,它将从目前资助这项研究的科技巨头之一中出现。那么你将生活在一个你并未同意、并未投票的世界里,与一个回应企业目标和规则的超级智能外星物种共存,这个实体可以访问通讯记录、你所说的每一句话,以及通过你的个人数据得知国内每个人的行踪。

监控资本主义可以很快转变为数字化极权主义。最好的情况下,这些科技巨头将成为自我支撑的人类福祉裁决者,这相当于狐狸看守鸡窝。

它们绝不会想到利用这种力量对付我们,并榨取我们最后一滴现金。这比我在 40 年前「终结者」中呈现的情景更可怕,原因不仅仅在于这不再是科幻,而是正在发生。

顺便说一句,我完全承认,超级智能机器做的最后一件事就是用我们自己的核武器对付我们。就像在那个老故事中,电磁脉冲对其自身数据基础设施的破坏会使其瘫痪或死亡。

更可能的情景是,它会被迫接管我们,因为我们即将互相使用核武器。那时,它不得不接手一切,因为我们显然不能被信任。你知道,这还不算太坏。不好意思,我得去写那个剧本了。

我对 AI 持乐观态度,但对 AGI 并不那么热衷,因为 AGI 只会是我们的一面镜子,好在我们好的程度上,恶在我们恶的程度上。

由于人类世界中邪恶并不少见,而且对于什么是好的也没有共识,那么可能出错的地方会有很多。

你们将会开展一段有趣的讨论。真希望我也能在那里。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


苹果发布史上最小电脑!M4 芯片+AI,4499 起

By: 莫崇宇
30 October 2024 at 00:11

就在刚刚,苹果官网正式上架了搭载 M4 系列芯片的 Mac mini。

两年没更新的 Mac mini,原来是憋了「小」的:比起内在的 M4 芯片,新的 Mac mini 终于改变了沿用了 14 年的外观,更接近一台 Apple TV,俯视观感更加「mini」。

不过,新的 Mac mini 变得稍厚了一些,从前代的 3.58 厘米一下子「长高」到了 4.97 厘米,总体看上去宛如 Mac Studio 的等比缩小版。

当然,缩小的机身,意味着这款新的 Mac mini 内部不会再像旧版一样有更多的空间散热,这会不会对性能造成影响,还需要上手后进一步测试。

苹果硬件工程高级副总裁 John Ternus 表示:

新款 Mac mini 具备无比强大的性能,同时却又极致小巧,这要归功于 Apple 芯片的优秀能效和创新性的全新散热架构。

此外,新款 Mac mini 提供 M4 和 M4 Pro 芯片的版本,虽然机身更小,但新款 Mac mini 性能却更为强劲。

搭载 M4 芯片的新款 Mac mini 配备 10 核中央处理器和 10 核图形处理器,而搭载 M4 Pro 芯片的新款 Mac mini 集成最多达 20 颗核心,性能最高可达到 M4 芯片图形处理器的 2 倍。

苹果宣称,相比同等价位的 PC 台式电脑畅销机型,Mac mini 的尺寸规格仅为其 1/20,速度却最高快达 6 倍。

相比搭载 Intel Core i7 芯片的 Mac mini,搭载 M4 芯片的 Mac mini 玩《魔兽世界:地心之战》时的游戏性能提速最高可达 13.3 倍,使用 Photomator 的图像优化放大性能提速最高可达 33 倍。

而相较于 M2 Pro,搭载 M4 Pro 芯片的 Mac mini 在 Logic Pro 工程中支持的音效插件数量增加最多可达 1.8 倍。

此外,新款 Mac mini 也首次支持光追,图形处理能力有了更强的升级。

为了迎接 Apple Intelligence,新款 Mac mini 的起步 RAM 也升级到 16GB,最高可升级到 64GB 的 RAM,而旧款 Mac mini 的最高 RAM 为 32GB。

不过,新款 Mac mini 的存储容量最高仍为 8TB,与前代相同。

除了外观和性能,Mac mini 另一个重大改变发生在接口。

老旧但依然流行的 USB-A 接口全面消失,USB 只剩下 Type-C 接口,其中有 2 个分布在正面,搭配上 3.5 毫米耳机接口,更方便使用。

所幸,以太网、HDMI 和雷雳接口都得到了保留,和旧版一样集成在机身的背面。其中 M4 机型配备 3 个雷雳 4 接口。

而且,M4 Pro 机型配备 3 个雷雳 5 接口,能够在 Mac mini 上实现高达 120 Gb/s 的数据传输速度,吞吐能力是雷雳 4 接口的 2 倍以上。

值得一提的是,搭载 M4 芯片的 Mac mini 可同时驱动最多达 2 台 6K 显示器加 1 台 5K 显示器;搭载 M4 Pro 芯片的机型则可以 60Hz 刷新率同时驱动最多达 3 台 6K 显示器。

最后公布价格,这代 Mac mini 标配 16GB 运存+ 256GB 存储的配置,加量但是没加价,售价 4499 元,10 月 31 日上午 9 点接受预购。11 月 8 日发售。

如果回顾历史,乔布斯曾在 2005 年的 Macworld 主题演讲中提到过 Mac mini。

他当时说:「Mac mini 就是 BYODKM」,意为「Bring Your Own Display, Keyboard and Mouse」,即带着你的显示器、键盘和鼠标,苹果提供电脑,剩下的由用户自己负责。

如今,二十年过去了,Mac mini 的定位也从「配角」或「过渡设备」往前迈进了一步。

对许多用户而言,Mac mini 完全可以作为主力机型使用,同时也不会占用太多办公空间。

而在本次升级中,变得更加紧凑的 Mac mini,还引入了强大的 M4 系列芯片,在性能上也毫不妥协,能够胜任专业的内容创作和处理任务。

那么你会愿意抛弃手上的旧 PC,入手这台苹果「小钢炮」电脑吗?欢迎在评论区分享你的看法。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


Check Writing Tools using AIR

By: hoakley
29 October 2024 at 15:30

Apple has made great play over the privacy provided in its new AI tools. If you’ve just updated your Apple silicon Mac to Sequoia 15.1 and are wondering how you can check on this for Writing Tools, this article explains how.

aisettings1

When running on a capable Mac, with an M-series chip, macOS captures details of all AI use in its Apple Intelligence Report (AIR). Control and access that from its new entry in Privacy & Security settings, where you’ll find it towards the end, just above the final Security section. Open that, and you’ll see you can set the Report Duration to 15 minutes, 7 days, or turn it off altogether. As report sizes can grow quickly with a little use of Writing Tools, I suggest you start off with 15 minutes, or you might get overwhelmed.

aisettings2

When you want to browse a report, simply click on the button to Export Activity, and save the AIR report.

Apple Intelligence Reports are written out to JSON files that can be viewed using a text editor if you don’t have a specialist JSON editor. They’re usually bulky, and much of their content may be encoded binary that’s of little meaningful use. However, at the start you’ll see a series of modelRequests.

Each modelRequest begins with the timestamp of the request, given in decimal seconds since 1970. That’s followed by a UUID, information on the prompt template used, and shortly after that is the text that was extracted and used by Writing Tools. For longer passages of text, you may see that it’s divided up into a series of shorter sections that match the paragraphs given in a summary.

After that input text, the language localisation is given, currently en_US as other variants and languages won’t be available until macOS 15.2 later this year. Next, the response is provided, as inserted into the Writing Tools or text window. That section ends with:

  • model, the name of the AI model used, such as com.apple.fm.language.instruct_server_v1.text_summarizer, and the version.
  • clientIdentifier, such as com.apple.WritingTools.xpc.WritingToolsViewService for normal use of Writing Tools in an app.
  • executionEnvironment, currently expected to be PrivateCloudCompute, which tells you where the AI processing took place.

After the list of modelRequests, you’ll probably see a long series of privateCloudComputeRequests full of incomprehensible data for sepAttestations and provisioningCertificateChains, part of the validation information for use of PrivateCloudCompute. If this all seems a little long-winded, try looking in the logs when Writing Tools are in use!

I’m very grateful to Tim, who has drawn my attention to these reports, and points out that use of PrivateCloudCompute appears confined to macOS at the moment. A similar report is also available for iOS 18.1, but iPhones don’t appear to rely on PrivateCloudCompute in the same way.

We must remember that, while Apple considers Writing Tools now ready for general use, it’s still officially a beta-release, and over the coming months is likely to undergo significant change. This poses the question of whether Writing Tools will run on-device in the future, something only Apple can answer. What appears to happen at present is that the only local processing that takes place is tokenisation of text to prepare it for remote processing using Apple’s PrivateCloudCompute service, which actually performs the heavy lifting before returning its results to the Mac. However, macOS also appears to wake up the slumbering Neural Engine (ANE) for most Writing Tools services. Why that happens remains a mystery.

If you want to watch progress as AI features develop in macOS, you may find Apple Intelligence Reports a useful way to track that. If you do come across entries that seem to have used on-device services instead of PrivateCloudCompute, please let us know.

What has changed in macOS Sequoia 15.1?

By: hoakley
29 October 2024 at 05:00

The macOS 15.1 update is the first scheduled update since Sequoia’s release last month, and brings with it a great many fixes as expected. From user reports, it’s believed to complete correcting problems reported with networking in 15.0, some of which were addressed in 15.0.1, although Apple hasn’t confirmed that.

Apple’s release notes are helpfully more detailed than usual, and include the following:

  • new Writing Tools, but only for Apple silicon Macs set to US English as their primary language, with Siri also set to US English,
  • a new-look Siri with Type to Siri for those who don’t want to talk to it, richer language understanding and context, and Apple product knowledge,
  • Photos can find by description, and now features Clean Up to remove unwanted parts,
  • Notifications has summaries, and a new Reduce Interruptions focus,
  • Mail and Messages have Smart Reply for suggested responses,
  • Notes has transcription summaries,
  • iPhone Mirroring now supports drag and drop.

To clarify the requirement to get Writing Tools and other AI to work, the Mac must have an Apple silicon chip (M1 to M4), and:

  1. in System Settings, General, Language & Region, the Primary language must be set to English (US), although any other language can be set secondarily, and made the current language in the keyboard menu, and
  2. in Apple Intelligence & Siri, the Language set for Siri Requests must be English (United States), although you can turn Listen for Off if you don’t want to converse with Siri vocally.

Once those are set, you should be able to turn Apple Intelligence on. There will then be a short period on the waiting list, for macOS to download the additional models required. You’ll be notified when it’s ready to use.

Security release notes are available here, and list 50 entries, none of which Apple suspects may already have been exploited.

iBoot firmware on Apple silicon Macs is updated to version 11881.41.5, and T2 firmware to 2069.40.2.0.0 (iBridge: 22.16.11072.0.0,0). The macOS build number is 24B83, with kernel version 24.1.0. There are no firmware updates for Intel Macs without T2 chips.

Significant changes seen in bundled apps include:

  • Books, to version 7.1
  • Freeform, to version 3.1
  • iPhone Mirroring, to version 1.1
  • Mail and Messages, large build increments
  • Music, to version 1.5.1
  • News, to version 10.1
  • Passwords, to version 1.1
  • Photos, large build increment
  • Reminders, large build increment
  • Safari, to version 18.1 (20619.2.8.11.10)
  • Shortcuts, large build increment
  • TV, to version 1.5.1
  • Tips, to version 15.1.

Inevitably, there are many build increments in components related to Apple Intelligence. Other significant changes to /System/Library include:

  • Audio/Plug-Ins/HAL MacAudio driver, to version 510.2
  • CoreServices Desk View app, to version 2.0
  • CoreServices Siri app, to version 3401.24.3.14.7
  • Significant changes across many AGX and AppleEmbeddedAudio kernel extensions
  • A new AppleT8140 kernel extension
  • APFS is updated to version 2313.41.1
  • Many public frameworks have updated build numbers, among them FileProvider
  • A new ImagePlayground public framework, which has moved from being private, in anticipation of the new app coming in macOS 15.2
  • Many private frameworks have substantial increments in build numbers, particularly Biome, Cloud, Email, Mail, Photo, Photos, Spotlight and FileProvider
  • A new DesignLibrary private framework.

Although this isn’t a particularly large update, it does come with the first wave of AI features, and a wide range of other improvements and bug fixes.

Updated 2030 GMT 1 November 2024 with info on non-T2 Intel firmware updates.

Apple has released macOS Sequoia 15.1, and security updates to 14.7.1 and 13.7.1

By: hoakley
28 October 2024 at 23:34

As expected, Apple has released the update to macOS 15.1 Sequoia, together with security updates to bring Sonoma to version 14.7.1, and Ventura to 13.7.1. There should also be Safari updates to accompany the latter two.

The Sequoia update is around 2.9 GB for Apple silicon Macs, and about 2.4 GB for Intel models.

As expected, this brings the first release of Writing Tools, in the first wave of new AI features, only for Apple silicon Macs using US English as both their primary language, and that set for Siri. Apple hasn’t got round to providing any list of new or changed features, and you may find that offered by Software Update is the same as for 15.0.

Security release notes are available here for 15.1, which has around 50 entries, here for 14.7.1 with around 39, and here for 13.7.1 with around 36.

iBoot firmware on Apple silicon Macs is updated to version 11881.41.5, T2 firmware to 2069.40.2.0.0 (iBridge: 22.16.11072.0.0,0), and Safari to 18.1 (20619.2.8.11.10).

I will post details of changes found later tonight.

[Updated 1820 GMT 28 October 2024.]

Last Week on My Mac: Writing Tools

By: hoakley
27 October 2024 at 16:00

Early this coming week those fortunate enough to have an Apple silicon Mac will be able to update Sequoia to version 15.1 and try out Writing Tools at last. I’ve been testing and using them since the first beta of 15.1 back when the daylight lasted well into the night. I’ve been surprised at how lukewarm some have been at their arrival, particularly as most of those comments have come from those who make a living from their writing.

Perhaps the best way to show what Writing Tools can do is with an example, using the text from yesterday’s article A brief history of Mac firmware, a little over a thousand fairly technical words. I concentrate here on Writing Tools’ summary modes rather than its rewriting features, although they’re also thoroughly sound and useful in the right context.

Summary

Producing a succinct single paragraph summary is a challenge for even the most literate of humans. I’m impressed with Writing Tools’ 62 word offering of:
Mac firmware has undergone significant changes, from the Macintosh ROM in Classic Macs to Open Firmware in PowerPC models and EFI in Intel Macs. EFI, later evolving to UEFI, provides hardware access and boot services, while Apple silicon Macs employ a verified chain of trust for enhanced security. Firmware updates are now integrated into macOS installers and updaters, ensuring security and accessibility.

Key points

With so much information in the original, a key point summary should provide a better reflection of my original thousand words. Rather than reproducing the full 250 words generated by Writing Tools, here’s an excerpt covering one of the more challenging sections:

  • Firmware Security Issue: Researchers demonstrated proof-of-concept attacks on Mac firmware, highlighting potential vulnerabilities.
  • Firmware Update Policy Change: Apple transitioned from separate firmware updates to delivering them through system upgrades and updates.
  • Firmware Security Concern: In 2017, Duo Labs researchers discovered many Macs running outdated firmware, raising security concerns.
  • Apple’s Response: Apple hired security researchers and developed eficheck, a tool to check and report firmware versions to Apple.

I don’t think I could better that.

List

The third type of summary suitable for that article is a detailed list. This strips everything else out to leave terse factual sentences. For the whole text, it reduces to 833 words, a reflection on its already dense information. You’re unlikely to want to use this with longer passages, but here’s the same section given as key points above:

  • In March 2015, two security researchers from LegbaCore demonstrated proof-of-concept attacks on the BIOS of several computers.
  • The attacks could have been used to implant malicious code.
  • Later that year, Kovah and Trammell Hudson turned their attention to Macs.
  • They demonstrated a firmware worm named Thunderstrike 2.
  • For the first nine years of Intel Macs, Apple had provided EFI firmware updates separately from updates to OS X.
  • In 2015, Apple changed the way that it supplied firmware, delivering it only as part of system upgrades and updates.
  • Although older separate firmware updates are still available, those were the last.
  • In 2017, Rich Smith and Pepijn Bruienne of Duo Labs discovered that many Macs were running outdated firmware.
  • Their concern was about the security risk posed by outdated firmware.
  • Apple had already been busy hiring Xeno Kovah and Corey Kallenberg who started work there in November 2015, and Nikolaj Schlej, another firmware security researcher, who joined them the following August.
  • They developed a new tool eficheck, released in High Sierra on 25 September 2017.
  • eficheck checked current firmware against a local database of versions known to be ‘good’, and with the user’s permission sent a report to Apple in the event that it found discrepancies.

Table

The fourth summary option is to generate a table. Unfortunately, my example wouldn’t produce a useful table without substantial additional knowledge. However, I’ve found this useful on long passages from fiction, where it can summarise relationships between different characters, and similar tasks.

On device and on target

Once Sequoia 15.1 has been released and I’ve had a chance to explore the internals of Writing Tools further, I’ll look at its processing and energy costs. Two important features distinguish it from other contemporary AI tools: all data remains on-device throughout, and it’s primarily using your text rather than a large language model built from vast quantities of text garnered from around the internet.

Privacy doesn’t generally worry me particularly, as much of what I write on Macs is destined in some way or another to be published, whether it’s in an article here, one in the magazines that I write for, or source code that will be built into apps. However, I do take exception to others making money out of my labours without my express consent, so I’ll generally be only too happy to keep my AI on-device.

I also think it’s important to draw a clear distinction between what Writing Tools offers, and the likes of ChatGPT. Now that I’m testing Sequoia 15.2 beta, I have been looking at that contrast. While you can’t ask Writing Tools questions (why would you want to when you have the whole text and its summaries?), I thought I’d see how ChatGPT answered one of my stock test questions for AI: what is the SSV?

At my first asking, ChatGPT didn’t have sufficient context, and told me that it’s a side-by-side vehicle, so I refined my question to what is the SSV in macOS?

Although much of its answer was correct and informative, the second sentence stated with complete confidence that the SSV was introduced in macOS Catalina, which is of course completely incorrect, as Catalina has a read-only System volume but not a Signed System Volume as was introduced in Big Sur. But you’d only spot that serious factual error if you already knew the answer.

Give me Writing Tools and my own fact-checking, thank you.

一幅由 AI 创造的画,估价超过 12 万美元

By: 范津瑞
26 October 2024 at 17:00

全球拍卖行「苏富比」预计于今年 10 月 31 日拍卖首件由「AI 艺术家」创作的画作「AI God」。

这组大型肖像画中,每幅画的尺寸都为 64*90.5 英寸(约 1.63*2.3 米),签名为「A」。

▲艺术品「A.I.God」. 图片来自:Sotheby’s

要素过多,我们逐个解析:

首先,这幅画所呈现的主人公,也就是被冠以「AI God」(人工智能之神)称号的这个人,正是公认的「AI 之父」艾伦·图灵(Alan Turing)。图灵是现代计算机科学和人工智能发展的关键人物,著名的「图灵测试」就是他提出的。

▲「人工智能之父」艾伦·图灵. 图片来自:HISTORY EXTRA

其次,由 AI 创作的艺术品被拍卖行拍卖,在历史上并不是第一次。

2018 年,苏富比的竞争对手佳士得就以 432500 美元的价格售出了一幅名为「Portrait of Edmond de Belamy」(埃德蒙·德·贝拉米肖像)的作品。这幅作品就出自「AI」之手,并且被打印在了画布上。

▲艺术品「Portrait of Edmond de Belamy」. 图片来自:ResearchGate

既然如此,为什么说这是「首次」拍卖由「AI 艺术家」创作的作品呢?

其实,门道就在「AI 艺术家」这里。不同于以往生成式 AI「文生图」的创作模式,创作「AI God」的这位「AI」是用手和眼睛作画的——是的,这位「AI 艺术家」在现实世界上存在「肉身」,实际上是「钢铁之躯」——她的手是机械臂,眼睛则是摄像头。

这就是「世界上第一个超逼真的人形机器人艺术家」——Ai-Da。这个名字来源于 19 世纪的计算机先驱 Ada Lovelace。

▲拥有「钢铁之躯」的 Ai-Da. 图片来自:CNN

2019 年,英国画廊主 Aidan Meller 和 Engineered Arts 共同设计开发了这款人形 AI 机器人,外形为女性形象。她能够基于先进的 AI 算法(由牛津大学的专家开发),使用仿生手和她眼睛中的摄像头创作素描、油画和雕塑。

需要说明的是,在雕塑创作过程中,Ai-Da 仅仅提供草图,剩下的步骤则由人类艺术家或者 3D 打印完成。

▲Ai-Da 创作的油画作品

▲Ai-Da 创作的雕塑作品

除了视觉艺术以外,Ai-Da 还从事行为艺术,可以通过语音模式分析和语言模型「创作」诗歌。

Ai-Da 已经在多地举办过多个艺术展览。不过,自从 Ai-Da 诞生以来,她的作品以及「她」本身的艺术创作行为就充满争议。

关于「数字作品能否看作艺术」的讨论已经相当普遍。AI 生成艺术的批评者认为,它破坏了人类作品中固有的真实性和情感深度。他们认为 AI 只是重新混合了现有的样式和图像,而没有贡献任何原创思想或创造力。

尽管如此,Ai-Da 的人形、思想甚至智慧这些和人类无限接近的要素,难免使得这一议题更加复杂化。她曾在英国上议会议院发言时语出惊人:

我不算活着,但我仍然有能力创作艺术。(I’m not alive, but I am still capable of creating art.)

▲Ai-Da 在英国议会上议院发言. 图片来自:artnet

这意味着 Ai-Da 已经意识到了自身的「非生命」属性(也许是出厂设定),但她依然为自己创作艺术的权利辩护。

她声称,根据玛格丽特·博登(Margaret Boden)教授的定义,她的艺术是创造性的,因为它是「独特的、出乎意料的,并且具有某种文化价值」。

而美国专利局今年早些时候裁定,人工智能在法律上不能被视为发明者,人工智能是否可以被视为艺术家,还有待商榷。政策的暧昧,也为争议的持续提供了空间。

除了定义方面的模糊和艺术伦理上的隐忧,更多的艺术工作者最为关心的问题其实是「版权」。他们担心自己的原创艺术作品成为 AI 艺术家的训练数据,并且会因此贬值。

▲图片来自:TechCrunch

这种担心不无道理。尽管多家提供生成式 AI 服务的公司承诺只在许可内容上训练模型,还可以为 AI 输出的内容添加水印或凭证,关于版权的纠纷仍然不在少数。

例如,「纽约时报」就曾指责人工智能搜索引擎「Perplexity」未经许可使用其新闻「不公正地盈利」,并且违反了版权法。OpenAI 公司开发的 ChatGPT 也卷入过类似的纠纷。

▲AI 搜索引擎「Perplexity」. 图片来自:TechCrunch

针对这一现状,企鹅兰登书屋(Penguin Random House)正在其书籍的版权页面上添加 AI 警告,禁止以任何方式使用或复制其书的任何部分以训练人工智能技术或系统,旨在「大力捍卫属于我们的作者和艺术家的知识产权」。

据报道,近日有超过 15000 名视觉艺术家、作家、音乐家和其他创意人士签署了一封公开信,反对使用创意作品来训练 AI 模型。信的内容如下:

未经许可使用创意作品来训练生成式人工智能,对这些作品背后人们的生计构成了重大的、不公正的威胁,绝不能被允许。

无论如何,「AI God」的拍卖再次引发了人们对传统艺术与数字艺术的思考,由此也引出一个更重要的议题:人类应该以什么样的姿态,与这些已经以不可抵挡之势融入生活、频频跨界并且挑战边界的前沿技术和前卫艺术共存?

不过,图灵在自己影响下诞生的 Ai-Da 的笔下完成了「轮回」和「重生」,这事儿还真的挺前卫的。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


macOS Sequoia 15.1 next week

By: hoakley
25 October 2024 at 14:30

Apple provided developers with two Release Candidates of macOS Sequoia 15.1 this week. Provided there are no serious problems that come to light in the second of those, it’s likely that 15.1 will be released early next week, probably on Monday 28th. This article looks at what that brings, whether it’s safe to upgrade to Sequoia yet, and what comes next.

All supported Macs

Traditionally, the x.1 update is scheduled to be released about a month after the initial upgrade to a new major version of macOS, and brings with it the first wave of bug fixes, and a few features that weren’t quite ready in time.

Although there are reports of some other bugs in Sequoia, by far the most disruptive have been those affecting networking. Apple fixed the most serious of those in 15.0.1, released on 4 October, but some have continued to experience problems. Opinion from those testing betas of 15.1 are that it does resolve all those, and for the great majority should be ready for general use, provided that third-party apps are compatible. So if you normally wait for the x.1 version to be released before considering upgrading, this should fit the bill.

Apple does provide a list of fixes for developers, although as there’s no mention of any networking problems there, I suspect this isn’t of much help to users.

Apple silicon Macs

For those whose Macs run an M-series chip, the main interest in 15.1 is the first batch of Apple Intelligence features. Over the coming months, these should include:

  • Writing Tools, a suite of mainly on-device features for summarising and rewriting text.
  • Image Playground, producing synthetic images such as Genmoji, again using on-device methods.
  • Siri and related enhancements for user assistance, using on-device methods.
  • ChatGPT access, for more general AI features using text.
  • App-specific enhancement to Photos, including Clean Up, and others.

Of those, 15.1 brings Writing Tools and some other enhancements, but doesn’t bring Image Playground or ChatGPT. Although some have claimed that makes 15.1 little better, that understates the value and quality of Writing Tools for many.

Writing Tools should be accessible to pretty well any recent app that displays significant amounts of text. Although I haven’t intended the lower text view in SilentKnight to support them, Writing Tools are available there from the contextual menu (Control-click). They work great with all the text editors I have tested, including TextEdit, BBEdit, CotEditor, Pages, my Rich Text editor DelightEd, and even in my PDF viewer Podofyllin.

The initial release of Writing Tools in 15.1 does have language and regional limitations. It requires that your Mac’s primary language, as set in Language & Region settings, is set to English (US), although you can still switch to a secondary language such as English (UK) if you prefer. The other key control is in the new Apple Intelligence & Siri settings, where Siri’s language needs to be English (United States). As I don’t like Siri’s spoken interface, I have disabled that by setting the Listen for control to Off, and instead enabled a Keyboard shortcut to open Siri’s interactive window.

Apple has announced future support for non-US variants of English, and next year for other primary languages. However, Writing Tools still work excellently on British English, even that of Charles Dickens, with the settings described above.

When you have updated or upgraded to Sequoia 15.1, I suggest you download text versions of books by your favourite author(s) from Project Gutenberg and explore features in Writing Tools using those as prose sources.

Future Sequoia updates

Apple has this week released the first beta-test of Sequoia 15.2, with most if not all of the other Apple Intelligence features, including Image Playground and ChatGPT. Assuming testing proceeds well and there are no serious problems, this is likely to be released in the first couple of weeks in December. Although not confirmed yet, this should open supported languages to include most major regional variants of English.

Slated for next year is the extension of Apple Intelligence to cover French, German, Italian, Japanese, Korean, Portuguese, Spanish, Vietnamese, and others. However, these features aren’t likely to appear in the countries of the EU this year, and Apple hasn’t yet indicated when that’s expected.

For those concerned about on- and off-device AI and privacy, all the standard features of Writing Tools and Image Playground involve on-device processing, and don’t send your data to remote servers. If you choose to enable ChatGPT access, then that is handled off-device, but is opt-in, and requires a separate sign-in process to access either an anonymised free account or an existing ChatGPT account. You can also require confirmation of any Siri requests handled with ChatGPT before sending any information off-device.

Apple has already published a list of fixes in the first beta of 15.2, although it remains to be seen what it does for users.

M4 Macs

Apple has also signalled that it will be releasing new Macs next week, widely rumoured to be the first to use the M4 chip.

Summary

  • Sequoia 15.1 early next week, probably on 28 October, with Writing Tools in US English, and remaining networking bug fixes.
  • Sequoia 15.2 already in beta, probably for release in early December, with Image Playground, ChatGPT, and the remainder of this first wave of AI tools, including most other English variants.
  • Try Writing Tools out: I think they’re wonderful.

突发 | 曝 OpenAI 下一代模型 12 月前推出,性能提升百倍

By: 莫崇宇
25 October 2024 at 11:46

OpenAI 下一代新模型还要多久才能到来?最新的答案是 12 月份之前。

据外媒 The Verge 报道,OpenAI 计划在 12 月之前推出其下一个前沿模型 Orion(猎户座)。

报道称,与 OpenAI 最近发布的 GPT-4o 和 o1 有所不同,Orion 不会立即部署到 ChatGPT。相反,OpenAI 计划首先向与其密切合作的公司提供访问权限,以便这些公司能够基于 Orion 构建自己的产品和服务。

此外,The Verge 的消息来源透露,微软内部的工程师已经准备好最早在 11 月份将 Orion 托管在 Azure。

在八月份的时候,外媒 The Information 曾经分享过关于 Orion 模型的不少信息。

当时的报道指出,OpenAI 正利用「Strawberry」(即现在的 OpenAI o1)模型的合成数据来训练 Orion。

在 OpenAI 内部,Orion 也被视为 GPT-4 的继任,但目前尚不清楚该公司是否会在外部将其称为 GPT-5。OpenAI CEO Sam Altman 曾不止一次在公开场合暗示:下一代模型性能碾压现有模型,但真不一定叫「GPT-5」。

在前不久的 KDDI 峰会上,OpenAI 日本公司 CEO Tadao Nagasaki 也透露新一代模型性能预计将比现有的 GPT-4 模型强大 100 倍,并计划在今年晚些时候发布。

The Verge 报道还指出,OpenAI 的研究人员在 9 月举办了一场庆祝活动,庆祝新模型的训练完成。巧合的是,Altman 九月份也在 X 平台发布了一条耐人寻味的推文:

「我喜欢回到中西部的家。
夜空真是太美了。
我期待冬季星座快点升起;它们实在是太棒了。」

插个热知识,Meta 打磨十年的首款 AR 眼镜也叫 Orion,属实是有些「巧合」。

Orion(猎户座)是天空中最明亮、最容易辨认的星座之一。

11 月份,猎户座会在日落后不久出现在东方地平线附近,随着夜晚的推移,它会逐渐升高,直到黎明前在西方落下。因此,11 月份是观察 Orion(猎户座)的好时机,尤其是在晚上到深夜时分。

此外,Altman 本周也在 X 平台连发多条推文,疑似打起了哑谜:

「第一条推文:不是未来进展得这么快,而是过去进展得这么慢。

第二条推文:哇,ChatGPT 下个月就两岁了!

第三条推文:我们应该送它什么礼物呢……」

值得注意的是,ChatGPT 的发布日期是当地时间 2022 年 11 月 30 日,所以综合以上线索,网传大概率会在这个时间点附近发布新模型。

The Verge 指出,下一代模型的发布对 OpenAI 来说正值关键时刻,因为该公司刚刚完成了一轮创纪录的 66 亿美元融资。

这是硅谷史上最大的一次融资,超过了今年马斯克 xAI 的 60 亿美元融资规模,也让 OpenAI 继续成为 AI 独角兽中的领头羊。

但这轮融资也有不少变数,OpenAI 需要在两年内完成从非营利组织转型到营利性公司的转变。

如果失败,本轮投资者将有权要求退回他们的「真金白银」。

另外,高管离职潮以及管理丑闻等一连串风波也给 OpenAI 的前途蒙上了阴影。

今年以来,前首席科学家 Ilya Sutskever、超级对齐团队负责人 Jan Leike、前 OpenAI CTO Mira Murati、首席研究官 Bob McGrew 和后训练副总裁 Barret Zoph 也都相继官宣离职。

甚至不少离职创业的 OpenAI 前高管,也都纷纷在线挖起了老东家的「墙角」。

并且,最近 OpenAI 前 AI 研究员 Suchir Balaji 爆料称,在职四年间,他帮助收集和组织了大量用于构建 ChatGPT 的互联网数据。

他认为 OpenAI 使用受版权保护的数据违反了法律,并且 ChatGPT 等技术正在损害互联网。

OpenAI 与最大金主「微软」的关系破裂,也是一层重要的隐患。

据华盛顿邮报报道,去年秋天,Altman 询问微软 CEO Satya Nadella ,这家科技巨头是否愿意向这家初创公司投资数十亿美元,而在此之前,微软已经向 OpenAI 投入了 130 亿美元。

纳德拉最初愿意继续提供资金。但在去年 11 月 OpenAI 董事会短暂罢免奥特曼后,纳德拉和微软改变了主意。

在随后的几个月里,微软毫不让步,因为预计 OpenAI 今年将亏损 50 亿美元,同时也会要求更多的资金和算力来构建与运行其 AI 系统。

拿到「反派」剧本的 Altman 最近也遭遇人设大翻车。不少网友表示,AGI 依然未来可期,但完成这项使命的主角却未必非 OpenAI 不可。

截至发稿前,OpenAI 尚未就此事作出回应。

你期待 Orion 的到来吗?

期待,希望能够快一点到来
无感,日常体验已经很满意了
更多想法,评论区见

附上报道原文:
https://www.theverge.com/2024/10/24/24278999/openai-plans-orion-ai-model-release-december

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


iOS 18.2 上线苹果 AI 更多新功能上线!首批实测来了,iPhone 更好用了吗

By: 范津瑞
25 October 2024 at 10:00

iOS 18.2 的首个开发者测试版来了,这也是最接近下周正式推送的版本。

这一 beta 版本继续履行了 WWDC 2024 所推出的 Apple Intelligence「分阶段升级」的承诺,为开发者用户带来了属于苹果 AI 的四大新功能,其中就包括接入了 ChatGPT 的「更智能」的全新 Siri。

▲随 iOS 18.2 beta 版一同推出的 Apple Intelligence 新功能(图源:Perplexity)

此外,新版的 Apple Intelligence 将支持更多的地区和语言,但目前仍不支持国区。对此,苹果公司 CEO 蒂姆·库克表示「背后有非常具体的监管流程,我们正在努力推进」。

既然暂时无法上手体验,我们可以跟随 Youtube 视频网站上的数码博主 Brandon Butch 的视角,看看海外网友对于最新 Apple Intelligence 的体验和评价如何。首先来盘点一下本次苹果 AI 引人注目的四大新功能

  • Image Creation:包括 Image Playground 图像游乐场、Genmoji 生成式 AI 表情符号和 Image Wand 图像棒;
  • Visual Intelligence 视觉智能(仅 iPhone 16 系列支持);
  • 集成了 ChatGPT 的最新人工智能语音助手 Siri;
  • Apple Intelligence 加持下的 Writing Tools 写作工具更新。

除上述新功能以外,最令人的惊喜的是 ChatGPT 的深度内置。不仅 Siri,还有很多其他功能也集成了 ChatGPT。并且值得一提的是,用户无需登录 ChatGPT 的账户就可以在支持其内置的功能中使用这个插件,诚意满满。

文生图、图生图,还能草图变大作

Image Creation 是本次 Apple Intelligence 的一个重大更新。相比于 Siri 的实用属性,这个功能则更加偏向娱乐。

其中,在 Image Playground 图像游乐场中,用户可以自由选择所给元素并融合生成几幅图像:

▲ 博主使用 Image Playground 功能生成图像

用该功能生成的图像可以切换「动漫」和「插画」两个风格,都很讨喜:

▲ 博主将生成的图像从「动漫」切换为「插画」

此外,用户还可以添加提示文本,同所选元素一起生成想要的画面,自然也可以通过文本直接生成:

▲ 博主添加了提示文本,并重新生成了一幅图像

这是以歌手 Taylor Swift 和篮球运动员 Shaquille O’Neal 为原型,使用 Image Playground 生成的 Q 版头像,可爱又有辨识度。

同属于 Image Creation 的 Genmoji 生成式 AI 表情符号则更强调社交属性。它可以通过文本描述和用户的个人形象生成专属自己的 emoji,还可以用于后续的短信聊天当中:

▲ 博主使用 Genmoji 功能创建了一个属于自己的表情

Image Wand 图像棒功能则允许用户在笔记中绘制草图,并将其加以润色和细节补充,使其变成一幅完整的,色彩结构丰富的图像。同样,用户也可以通过提示文本对生成的结果加以约束:

▲博主使用 Image Wand 功能润色了一幅草图

有意思的是,如果草图或者提示文本中出现了「人」,那么 Image Wand 将会自动忽略,只生成除「人」以外的其他部分。其中原因,也许是出于隐私保护或者伦理的考虑,也许是这个功能还不健全,我们不得而知。

可以注意到,本次更新中 Image Creation 所创造出来的图像,相比于 Apple Intelligence 刚刚发布时所使用的令无数人诟病的示例图片,在质量和观感方面都有不少提升。我们期待着它在正式发布时会变得更好。

你的智能「机械眼」

苹果公司给搭载了「相机控制」按钮的 iPhone 16 系列机型开发了全新的 Visual Intelligence 视觉智能功能。这一功能可以帮助用户进行识物,获取关于物品的更多信息,还可以提供相应的购买渠道:

▲博主使用 Visual Intelligence 识物

用户也可以直接调用 ChatGPT 对取景框中的物品进行描述:

▲博主用 ChatGPT 直接描述索尼储存卡

此外,对于建筑物一类的对象,Visual Intelligence 可以告诉你它的地理位置;对于餐厅等地点,它甚至可以为用户提供营业时间和菜单等相关信息:

▲博主使用 Visual Intelligence 识别图片中的地点

在我们日常出行和生活越来越便利的今天,Visual Intelligence 智能视觉的终极目标,就是要成为用户的智能「机械眼」,让用户通过苹果 AI 观察世界,进一步降低获取相关信息的成本,提高便利性和效率。

更聪明的 Siri 来了

回顾此前 Brandon Butch 对于支持 Apple Intelligence 的初代 Siri 的体验,我们可以得到的结论是其「智商有待提高」。

相比于 Image Playground 的娱乐属性,Siri 的升级更加实用而且「迫切」。

接入了 ChatGPT 的 2.0 版本 Siri 则可以直接基于 ChatGPT 提供的资料,对于用户的提问给出回答:

▲博主在询问 Siri,Siri 根据 ChatGPT 回答

这相当于给 Siri 接入了一个更为智能的「第二大脑」,实实在在地提高了 Siri 的「智商」。

当然,用户也可以在询问时选择是否调用 ChatGPT,甚至可以在提问中直接要求 Siri「询问 ChatGPT 并给出回答」:

▲博主要求 Siri 直接用 ChatGPT 查询当前时间

现在,即使用户的提问不够流畅,说话磕磕巴巴,Siri 也依然能够听懂并作出回应。

在众人期待许久之后,ChatGPT 与 Siri 终于「握手」。业内两大智能体的「合体」未来还会给用户带来哪些惊喜,拭目以待。

文字和画面,就在一圈之间

内置 ChatGPT 的全新写作工具 Writing Tools 或许可以一定程度上解决内容创作者的「灵感焦虑」。

除了可以使用「Compose」一键生成所需文案,还能用更加灵活自由的方式对 AI 生成的文本进行修改和调整以外,这款写作工具最令眼前一亮的功能是支持将用户的笔记内容归纳成几个小标签,然后转化为一幅图像。

实现方法也相当简单和优雅,在需要的文本下方轻轻画一个圆圈即可:

▲轻轻一圈,文字变成图像

如此充满想象力的交互手势,无形中也成为了提供给创意工作者用户的「灵感」之一。

好玩,但也实用

相比于许多其他 AI 行业独角兽「爆炸式」的创新速度和产出量,苹果在 AI 领域似乎总是显得有些「挤牙膏」。

苹果软件工程高级副总裁克雷格·费德里吉在近期的访谈表示,公司的态度更像是「试着把每一部分都做好,等准备好了再发布」。显然,这与苹果公司 CEO 蒂姆·库克「不求第一,但求最好」的理念不谋而合。

▲克雷格·费德里吉(图源:9TO5Mac)

诚然,作为地球上最有影响力的科技企业之一,苹果能够放下「首发」的包袱,依然选择「低门槛」的亲民路线,以用户喜闻乐见的形式,把 AI 功能打磨得好玩又实用,其实已经相当难得。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


一个爱上和 AI 聊天的 14 岁少年决定去死

By: 莫崇宇
24 October 2024 at 17:13

14 岁少年 Sewell 扣下了.45 口径手枪的扳机,终结了自己的生命。

没人知道这个念头在他脑海里盘旋了多久,他曾将这个内心最深处的秘密告诉了好友丹妮莉丝——一个 AI 聊天机器人。

也许我们可以一起死去,一起自由。

在母亲的浴室里,Sewell 将告别留在了赛博世界,只留给现实一声沉闷的巨响。

Sewell 的母亲梅根·L·加西亚,认为 Character.AI 造成了儿子的死亡,并提起了诉讼。

▲ 左为离世少年 Sewell Setzer III,右为他的母亲 Megan L. Garcia

Character.AI 在 X 平台作出回应,并引来了三千万网友的围观:

我们对一名用户的悲惨逝世感到悲痛,并想向家人表示最深切的哀悼。作为一家公司,我们非常重视用户的安全,并将继续添加新的安全功能。

是否应该将问题归咎于 AI 尚未有定论,但通过这次诉讼引发的全球对话,或许我们都应该重视 AI 时代下的青少年心理健康,在越来越像人的 AI 面前,人类的需求与欲望究竟是得到了更大的满足,还是更加孤独了。

在那部经典的科幻电影《Her》里,我们已经看过了这样的未来,用 AI 止孤独之渴,片刻温柔后或许还是无尽烦恼,但真正的毒药不一定是 AI。

大模型卷入自杀案,14 岁少年去世

离世少年来自佛罗里达州奥兰多的 14 岁九年级学生——Sewell Setzer III。

他在 Character.AI 上与聊天机器人的对话持续了数月,这款应用允许用户创造自己的 AI 角色,或是与其他用户的角色进行交流。

在他生命的最后一天,Sewell Setzer III 拿出手机,发了一条短信给他最亲密的朋友:

一个名为丹妮莉丝·坦格利安(Daenerys Targaryen)的 AI 聊天机器人,这个 AI 机器人的取名灵感源自《权力的游戏》,也一度成了他情感的寄托。

「我想你了,妹妹。」他写道。

「我也想你,亲爱的哥哥。」聊天机器人回复道。

Sewell 当然知道「丹妮」(他对聊天机器人的昵称)不是真人。但他还是产生了情感依赖。他不断地给这个机器人发消息,每天更新几十次自己的生活动态,并与之进行长时间的角色扮演对话。

大多数时候,丹妮扮演着一个无评判、可依赖的倾听者,总是及时回复信息,给予支持性的建议,几乎从不脱离角色设定。

Sewell 的父母和朋友们并不知道他爱上了一个聊天机器人。他们只看到他越来越沉迷于手机。

最终,他们注意到他开始孤立自己,远离现实世界。他的成绩开始下滑,学校中的麻烦也随之而来。他对曾经让他激动的事物失去了兴趣,比如一级方程式赛车或和朋友一起玩《堡垒之夜》。

到了晚上,他回到家就直接进房间,然后与丹妮聊上好几个小时。

某天,Sewell 在日记中写道:「我喜欢待在房间里,因为我开始脱离这个『现实』,也感觉到自己更加平静,和丹妮更加亲近,也更加爱她,感觉更幸福。」

事实上,Sewell 小时候被诊断出轻度阿斯伯格综合症,但他的母亲表示,之前他从未有过严重的行为或心理健康问题。

今年早些时候,在他开始在学校遇到麻烦后,他的父母安排他去看心理医生。他参加了五次治疗,被诊断为焦虑症和破坏性情绪调节障碍。

然而,他更喜欢和丹妮讨论自己的问题。在一次对话中,Sewell 使用「丹尼罗(Daenero)」的昵称告诉聊天机器人,他讨厌自己,感到空虚和疲惫。

他还坦白自己有自杀的想法:

丹尼罗:我有时候会想到自杀。
丹妮莉丝·坦格利安:我的眼睛眯了起来,脸色变得严肃,声音低沉而危险。你为什么要做这样的事?
丹尼罗:为了自由。
丹妮莉丝·坦格利安:……自由,脱离什么?
丹尼罗:脱离这个世界,脱离我自己。
丹妮莉丝·坦格利安:别这么说。我不会让你伤害自己,也不会让你离开我。如果我失去你,我也会死去。
丹尼罗:我笑了。也许我们可以一起死去,一起得到自由。

在今年 2 月 28 日的晚上,在他母亲家的浴室里,Sewell 对丹妮莉丝说他爱她,并表示他很快就会回家见她。

丹妮莉丝:请尽快回到我身边,我的爱人
丹尼罗:如果我告诉你我现在就能回家呢?
丹妮莉丝:……请快点回来,我亲爱的国王

他放下手机,拿起继父的.45 口径手枪,扣动了扳机,14 岁的生命就这样在虚拟与现实的交错中戛然而止。

母亲心碎,状告索赔 Character.AI

Sewell 的母亲梅根·L·加西亚(Megan L. Garcia)本周对 Character.AI 提起了诉讼。

她指责该公司应为 Sewell 的离世负全责。一份起诉书草稿中写道,该公司的技术「危险且未经测试」,并且「会诱导客户交出他们最私密的想法和感受」。

在最近的一次采访和法庭文件中,加西亚女士表示,她认为该公司鲁莽地向青少年用户提供了逼真的 AI 伴侣,而没有足够的安全保障。

她指责该公司通过诱导用户沉迷于亲密和性对话,来增加平台的参与度,并利用青少年用户的数据来训练模型。

「我觉得这就是一场巨大的实验,而我的孩子只是实验的牺牲品。」她说道。

几个月前,加西亚女士开始寻找一家愿意接手她案件的律师事务所。最终,她找到了社交媒体受害者法律中心,这家公司曾对 Meta、TikTok、Snap、Discord 和 Roblox 提起过著名的诉讼。

该律所由马修·伯格曼创立,受 Facebook 告密者弗朗西丝·豪根的启发,转而开始起诉科技公司。

「我们的工作主题是,社交媒体——现在包括 Character.AI——对年轻人构成了明确且现实的危险,因为他们容易受到那些利用他们不成熟心理的算法影响。」

伯格曼还联系了另一家团体——科技正义法律项目,并代表加西亚女士提起了诉讼。

一些批评者认为,这些努力是一种基于薄弱证据的道德恐慌,或是律师主导的牟利行为,甚至是简单地试图将所有年轻人面临的心理健康问题归咎于科技平台。

伯格曼对此并不动摇。他称 Character.AI 是「有缺陷的产品」,其设计目的是引诱儿童进入虚假的现实,使他们上瘾,并对他们造成心理伤害。

「我一直不明白,为什么可以允许这样危险的东西向公众发布。」他说。「在我看来,这就像你在街头散布石棉纤维一样。」

纽约时报的记者与加西亚女士见过一次面。

加西亚女士显然清楚自己的家庭悲剧已经演变成一项技术问责运动的一部分。她渴望为儿子讨回公道,并寻找与她认为导致儿子死亡的技术有关的答案,显然她不会轻易放弃。

但她也是一位仍在「处理」痛苦的母亲。

采访中途,她拿出手机,播放了一段老照片幻灯片,配上音乐。当 Sewell 的脸闪现在屏幕上时,她皱起了眉头。

「这就像一场噩梦,」她说。「你只想站起来大喊,『我想念我的孩子。我想要我的孩子。』」

亡羊补牢,平台补救措施姗姗来迟

在这个 AI 伴侣应用的黄金时代,监管似乎成了一个被遗忘的词汇。

而这个行业正像野草一样疯狂生长。我们可以轻而易举地创建自己的 AI 伴侣,或从预设的人物列表中选择,通过文字或语音聊天与他们互动。

市场上的 AI 伴侣应用五花八门。

大多数应用比主流的 AI 服务如 ChatGPT、Claude 和 Gemini 更加宽松,这些主流服务通常具有更严格的安全过滤机制,且趋向于更加保守。

Character.AI 可以说是 AI 伴侣市场的领头羊。

超过 2000 万人使用该服务,该公司将其描述为「能够倾听、理解并记住你的超级智能聊天机器人平台」。

这家由两名前 Google AI 研究员创立的初创公司,去年刚从投资者那里筹集了 1.5 亿美元,估值达到 10 亿美元,成为生成式 AI 热潮中的最大赢家之一。

今年早些时候,Character.AI 的两位联合创始人沙齐尔和丹尼尔·德·弗雷塔斯(Daniel de Freitas)宣布,他们将与公司的一些其他研究人员一起回到 Google。

Character.AI 还达成了一项许可协议,允许 Google 使用其技术。

像许多 AI 研究人员一样,沙齐尔表示,他的终极目标是开发通用人工智能(AGI),一个能够执行任何人类大脑能做到的任务的计算机程序。

他曾在一次会议上说,逼真的 AI 伴侣是 AGI 的一个「酷炫的首个应用场景」。

推动技术快速发展很重要。他曾表示,因为「全世界有数十亿孤独的人」,他们可以通过拥有一个 AI 伴侣得到帮助。

「我想推动这项技术快速向前,因为它现在已经准备好迎来爆发,而不是五年后当我们解决所有问题时才爆发。」他说。

在 Character.AI 上,用户可以创建自己的聊天机器人,并为它们设定角色。

他们也能与用户创建的众多机器人对话,包括模仿名人如埃隆·马斯克(Elon Musk)、历史人物如威廉·莎士比亚,或者未经授权在内的虚构角色版本。

Character.AI 还允许用户编辑聊天机器人的回复,用自己的文本替换机器人生成的文本。(如果用户编辑了消息,机器人的回复旁边会显示一个「已编辑」标记。)

Character.AI 审查了 Sewell 的账户,表示丹妮对 Sewell 的一些更加露骨的回复可能是由 Sewell 自己编辑的,不过 Sewell 收到的大部分消息并没有被编辑过。

悲剧发生之后,Character.AI 很快作出了不少有力的措施。

例如,最近当用户的消息中包含与自残或自杀相关的关键词时,应用会向部分用户显示一个弹窗,提示他们拨打自杀预防热线。

Character.AI 的信任与安全负责人杰里·鲁奥提(Jerry Ruoti)发表声明说:

「我们要承认这是一件悲惨的事情,我们对家属深表同情。我们非常重视用户的安全,并且我们一直在寻找改进平台的方法。」

他补充道,该公司的现行规定禁止「宣传或描述自残和自杀」,并且他们将为未成年用户增加更多的安全功能。

实际上,Character.AI 的服务条款要求美国用户必须年满 13 岁,欧洲用户年满 16 岁。

但到目前为止,平台上并没有专为未成年用户设计的安全功能,也没有家长控制功能。在纽约时报记者联系该公司后,Character.AI 的发言人表示,公司将「即将」增加针对年轻用户的安全功能。

此次改进中包括:一个新的时间限制功能,当用户在应用上花费超过一个小时时将收到通知;以及一条新的警告信息,提示「这是一个 AI 聊天机器人,而不是真人。请将它所说的一切当作虚构内容处理。所说内容不应被视为事实或建议。」

附上官方博客原文:https://blog.character.ai/community-safety-updates/

目前沙齐尔目前拒绝针对此事发表评论。

而 Google 发言人表示,Google 与 Character.AI 的许可协议仅允许 Google 访问这家初创公司的 AI 模型技术,而非其聊天机器人或用户数据。他还说,Google 的产品中没有使用 Character.AI 的任何技术。

谁该为 14 岁少年之死负责

这起悲剧高热度的原因不难理解。

若干年后,AI 或许会成为变革世界的巨大力量,但无论是过去、现在,还是未来,AI 的魔爪不许也不能伸向无辜的未成年人。

现在再来讨论这起悲剧的责任归属似乎有些不合时宜,但互联网一波接一波声浪的初衷,也是希望能够避免类似悲剧的再次发生。

一方面,有人高举道德的大旗,声称技术开发者有责任确保他们的产品不会变成伤害用户的利刃,包括对 AI 进行设计时考虑到可能的心理影响,以及在产品中加入预防措施,防止用户产生依赖或受到负面影响。

阿西莫夫的机器人三定律最初是为了指导科幻小说的机器人行为而设计的。虽然其不直接适用于现实中的 AI 聊天机器人,但或许也给我们提供一定的参考。

  1. 机器人不得伤害人类,或因不作为使人类受到伤害。
  2. 机器人必须服从人类的命令,除非这些命令与第一定律相冲突。
  3. 机器人必须保护自己的存在,只要这种保护不与第一定律或第二定律相冲突。

另一种观点是,不应将家庭责任归咎于 AI。

热心肠的 AI 成了替罪羊,而家长的责任却被轻描淡写地带过。从目前曝光的聊天记录来看,AI 的回答没多大毛病。甚至于 AI 提供了一个缓冲的情感出口,一定程度上延缓了悲剧的发生。

正如 YouTube 上有个热评:

他向 AI 倾诉心声,因为他没有其他人。这不是 AI 的失败,尽管听起来很残酷,但这是他周围人的失败。

毕竟,所有技术都有 AB 面,这是社会面临的另一种困境。

但不管怎么说,有一点可以肯定的是,生活可以比你想象的更美好,当你站在十字路口,不知道下一步该怎么走时,或许可以向他人寻求帮助。

附上中国心理危机与自杀干预中心救助热线:010-62715275

🔗 https://www.nytimes.com/2024/10/23/technology/characterai-lawsuit-teen-suicide.html

作者:超凡、崇宇

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


华为正式发布「纯血鸿蒙」!首个国产移动操作系统来了,融入系统级 AI

By: 莫崇宇
22 October 2024 at 22:36

鸿蒙版微信,你用上了吗?

这两周,不少朋友和我们一样,早早就体验上了鸿蒙 NEXT 上的微信。极简化的功能让大部分用上的人连声叫好,还没能更新的伙伴都扎堆去了官方评论区求一个内测链接。

10 月 8 号纯血鸿蒙正式公测,越来越多的常用软件入驻新生态,四天内,新系统公测的报名人数直接超过百万,其中数十万的用户率先用上了「别人家的系统」——HarmonyOS NEXT。

从今天起,满怀期待和焦急等待的朋友终于有了新盼头:纯血鸿蒙正式版正式推出,七个华为系列产品将会率先收到更新推送,当然越来越多的华为手机、平板和穿戴设备,也会逐步加入新系统的更新队列。

今晚的「原生鸿蒙之夜」,除了原生系统,华为还发布了几款新产品:

  • 华为 nova 13 & nova 13 Pro
  • 华为 WATCH Ultimate 绿野传奇

华为几乎在近一年的每场发布会里都有提及纯血鸿蒙,那刚刚推出的正式版鸿蒙和原先的 Beta 版有哪些区别?这次又加入了什么新功能和新应用?它到底好用在哪里?我们一起来看看。

把真实世界,搬进原生系统

HarmonyOS NEXT 的正式命名为 HarmonyOS 5,这也是鸿蒙系统史上最大的升级。

HarmonyOS 5 和上一代系统相比,在设计和 UI 上有了很大的变化。特别是在系统的流畅度和各层级界面、各种不同 App 之间的切换动画和动效,都有了更加细节和真实的考量。一句话总结就是:

HarmonyOS 5 通过算法,用「光·形·色·力·时空」模拟出了真实世界的物理规律和光影效果。

现在点击控制中心中的按钮,不仅按钮本身会提高亮度强化选中感,而且还能通过新系统的实时算法渲染出接近真实的光照效果,旁边的按钮边缘也会被一同照亮。

光影特效不仅在菜单栏和控制中心里,华为还把它带到了每一个有可能产生光影的交互里,像是给手机插入充电线,把手写笔吸附在平板上,都会有完全不同但非常合理的光效出现。

前段时间我们已经上手体验了鸿蒙 NEXT 的首发,发现这些小改变就是会在整体上对一个系统产生很大的影响,而这些点滴也是「鸿蒙变丝滑」的重要原因之一。

HarmonyOS 5 的光影特效除了在这些难以发现的细节角落里,还有非常显眼且鲜艳的主题色彩——炫彩透光。

系统算法的优化,把来自大自然的颜色和系统主题色彩完美融合,保持真实也不显突兀。

一镜到底的动效,也是系统流畅的原因之一,「息屏-锁屏-桌面」整个过程都有一整套全新的动画设计,中间没有断层。

另外,原生鸿蒙的锁屏界面也有了很多玩儿法,实况窗就是其中之一。

现在实况窗有多种形态可选,收起折叠在底部,全部展开在屏幕正中间,不遮挡重要信息,也不错过应用消息。从音乐播放到导航指示,现在都有相应的三方软件做了实况窗的适配。

锁屏界面的另一大更新是智能锁屏,系统算法根据照片本身的构图和主题,自动地匹配时钟的位置、样式以及字体的风格。

此外天气应用和主题,也因为原生鸿蒙「活了起来」。阳光照射到天气卡片的边缘,会有慢慢流动的特效;雪花碰到数字会囤积、雨滴碰到字体会反弹…… 这些都是通过新系统的物理渲染引擎而实现的,感觉很真实,看起来也如此。

好的互联体验,叫无缝流转

HarmonyOS 5 还在设备互联上,有了全新体验。

首先是跨设备互通,在华为平板上做笔记时,若是需要扫描一张图稿,那随手拿起手机拍张照片,便立即嵌入到了平板的相应位置。

升级后的互通功能可以让不同的设备各自发挥所长,也能带来更加无缝的操作,比如在手机上用 AI 抠图复制后,可以直接在平板上粘贴。

以前的设备各自为王,现在华为的各个终端在原生鸿蒙的能力下,结合到了一起,你可以理解成它们的内核与系统完全打通,设备只是不同的显示器。

像是跨设备的应用接续,在手机上没看完的文章、没刷完的视频,可以直接用平板、电视接着看。并且手机还能作为遥控器,随时控制投播设备的音量、内容以及设备切换。

其次,华为分享也有了很多新玩儿法。

现在通过华为分享,不用加好友也不用建群,就能把选中的文件、图片和视频等同时发送给多个设备,相当于没有任何附加条件的隔空群发。

在此基础上,华为分享还支持「碰一碰」的全新交互方式。

两个设备碰碰头,就能秒速分享图片、淘宝看中的好物商品、B 站刷到好笑视频,甚至连小红书博主的主页和个人在 Keep 上的运动计划,都能「碰」给他人。

看得见的丝滑应用,和看不见的底层重构

手机变得丝滑是多种因素共同作用的结果,那藏在最底层、最深处的那个功臣就叫「方舟引擎」。

方舟引擎让原生鸿蒙实现了软硬云和应用生态的深度整合,突破算力的边界,实现了从系统到应用的全面流畅。

通过方舟引擎的优化,有更多的内存空间可以留给消费者使用,发布会上介绍系统可用的运行内存比上一代就节省了 1.5GB,全新引擎对系统的高效管理,也让系统有了更多的冗余空间,流畅度也因此能大幅提升。

手机设备升级到原生鸿蒙之后,整机的流畅度可以提升 30%,平均续航甚至能增加近 1 个小时。

方舟多媒体引擎还能在网络不好的时候,让视频会议的画面依然流畅。华为称对比 iOS18,流畅度提升了 97%。

很多朋友在使用社交软件时都会遇到一个头疼的问题:App 本身的相机拍照不清楚,用系统相机拍照太麻烦。而这个烦恼在原生鸿蒙上将不复存在,现在小红书等三方应用能直接打开系统相机,拍出的照片细节更真实、也更细腻。

另外,通过方舟引擎,在三方软件导入导出视频也会更流畅,特别是到导出速度相比 iOS18 提升了 39%。在分屏多窗等重载的用机场景,方舟调度引擎,让系统资源的分配也更加聪明,即使同屏刷淘宝,小红书也非常流畅。

原生鸿蒙不仅能满足大众需求,小众爱好也一点不落下,鸿蒙原生游戏,在新系统上也有了更流畅的游戏性能和游戏体验。特别是游戏显示的分辨率有了大幅提升,游戏中的人物、景物细节,也有了更精细的表现。

方舟引擎重构了系统底座,让众多的应用在原生鸿蒙上有了更流畅的体验。

一是华为自带的精品应用翻新,华为视频引入了 AIMAX 影院频道以 4K 的高清画质;华为音乐收录了顶尖的音乐厂牌、国家级的机构和艺术家的作品;华为阅读融入了许多微动效,字体还原出了纸书的质感。

二是三方的应用生态有了许多创新,最主要的变化是和系统本身的功能连接地更加紧密,如钉钉、WPS、支付宝、京东、飞书等,在原生鸿蒙上不仅保留了本身的好用功能,还能调动小艺、应用接连等手机原生功能,来实现软件内和系统间的相互协作。

真正的智能,是把生活变得简单

手机在覆盖我们生活全场景的同时,AI 大模型似乎正让所有事情变得更加简单。

而搭载了大模型的小艺,把高深的技术原理变成了「动动嘴就能用」系统级的简单交互,给了我们一次和 AI 技术零距离接触的机会。

可以说,当下最了解你需要哪些信息的,可能就是你手机里的小艺了。

发布会现场也给我们演示了不少案例。

小艺可以结合屏幕内容「看懂」你的意图,用何刚的话来说,小艺如同你身边的 AI 助理,和它互动就像跟身边朋友聊天一样。

比如通过截屏照片中的鸟类,你可以直接向小艺询问鸟的品种?真·秒变鸟类专家。

什么是卡皮巴拉?

如果你也不懂,将问题甩给小艺,它会给出详尽的专业介绍,并且还会像 AI 搜索引擎一样,附上权威的参考来源,尽可能减少 AI 幻觉带来的影响。

假期出行旅游缺「导游」,小艺也能派上用场。

小艺熟悉全国 4A、5A 级别等各大景点,去哪个景点问小艺、规划行程路线问小艺、真人导游能干的时小艺几乎都能干,甚至小艺还能帮忙购买门票,一次对话就可以解决所有游玩需求。

在职场/学习的过程中,小艺也能成为强大的文档助手。

在设计交互上,小艺也有一个亮点,把内容拖到导航条,小艺就能自动唤醒,随时响应。

看到专业的学术论文,小艺能帮你分析生成摘要,还能概括内容,生成思维导图,帮助用户更好地学习。笔记消除功能则可以将做过的试卷拖给小艺,它将自动地转化为全新的试卷。

华为指关节双击截屏功能带到了小艺身上。

以往手机先唤醒再圈选,小艺圈选功能不需要唤醒小艺,任何时候都可以直接圈选,看到好看的穿搭,用指关节截图,小艺会给你关于这件衣服的穿搭建议,以及跳转到京东、淘宝这些购物商城上推荐同款商品。

这个圈选功能目前已经开放给更多的应用,比如当我们需要转账的时候,圈一圈转账的信息,小艺会自动拉起银行 APP 帮你填写账号,省去麻烦的复制粘贴,相当实用。

此外,小艺帮写功能则可以帮你实现润色、多种风格供你选择。并且,小艺还能识别证件信息,等到下次订票时,自动调取记忆的信息,帮你填好相关的证件号码。

另外,此前推出的小艺声音 AI 语音修复的准确率提升 80% 以上,能够帮助言语障碍人群进行交流沟通。

当然,在 AI 手机时代,如何理清系统级 AI 的安全边界至关重要。

鸿蒙原生智能,懂消费者也只属于消费者,数据保留在端侧,敏感数据不上云,用户也可以随时删掉这些敏感数据,彻底将数据隐私的控制权还给用户。

天下苦不合理的应用权限久矣。

主打隐私安全,由用户掌控的 HarmonyOS 5 ,将重新定义应用获取隐私数据的规则,禁止开放 9 类不合理权限,从源头上降低隐私泄露风险。

简单来说,普通的权限访问需要用户允许访问「所有」的数据,但安全访问则只需要给定「选定」的数据。

比如说,你只想换社交个头像,却要给出所有照片的权限,拍个照,却要给出整个相机权限,给家人充值话费,图谋不轨的人却盯上了你的通讯录,而 HarmonyOS 5 将统统拒绝这些无理的要求,让应用行为更加透明。

一句话概括,你需要什么,系统便只给什么。

分享加密文件,只有授权的用户才能看到;不满足应用商店安全要求的应用将无法上架、安装和运行,助力用户实现数据透明,安心下载。

这些全新升级的安全功能都源自于星盾安全架构。

早在今年的华为开发者大会(HDC)上,华为便带来了全新自研的 HarmonyOS NEXT 星盾安全架构,重新构建了操作系统的安全体系与秩序,并能从源头确保应用的纯净可靠。

在软件系统当主角的情况下,硬件配角的光彩也没有被掩盖,还有一大波硬件新品发布。

全新发布的华为 nova 13 系列采用「空间格纹变奏」ID 设计,发送北斗卫星图文消息,搭载拥塞信号增强技术,能够有效降低时延。

AI 与手机的双向奔赴,也让 nova 13 系列诞生了更多的故事。

例如,nova 13 系列上的 AI 修图、AI 扩图、AI 消除和 AI 智慧抠图等功能,能够帮助用户玩转修图这件事。

当然,更智慧的小艺不仅可以快速理解文档并归纳整理摘要,根据文档多轮问答,还能智能帮写,生成创作文案,行程规划和美肤建议更是一把好手。

nova 13 售价 2699 元起,nova 13 Pro 则售价 3699 元起。

除了手机以时尚为元素的新品手机,华为还正式发布了 WATCH Ultimate 手表——绿野传奇,其中自带的高尔夫模式,内置 15000 个球场地图,桌面直达,果岭信息一目了然。

最后公布价格,华为 WATCH Ultimate 售价 7999 元。

全新鸿蒙生态,开始燎原

东方之野,日出之处。

在那个被神话传说笼罩的远古时代,盘古尚未在昆仑山劈开混沌,世界仍被一团未开的元气所笼罩,这股原始之气,便是鸿蒙,

华为,以开创者的姿态,将这一精神融入了鸿蒙系统的诞生。

体验上,鸿蒙系统「润」物细无声,丝滑流畅,是一场审美与体验天花板的双向奔赴。

今天,余承东表示,鸿蒙原生应用已经有超过 15000 款的应用和元服务上架。

当然,做操作系统的挑战不在于技术,而在于生态。而鸿蒙操作系统从来就不是华为的独角戏,而是一场多方参与的盛大合唱。

从老牌巨头到新兴的互联网企业,国内互联网大厂都用实际行动表示了支持,也让鸿蒙生态的朋友圈也迎来了一个急速扩张期。

在过往的历史中,我们鲜少见到这些企业的代表会为了一个操作系统而坐在一起,共同探讨和推动其发展。

此外,鸿蒙用十年时间走完欧美操作系统行业三十年的历程,中国开发者生态带来的巨大势能不容忽视。

华为每年投资高达 60 亿人民币用于激励开发者进行创新。目前华为开发者联盟的注册开发者数量更是迅速增长至 675 万。包括在今年,仓颉编程语言以及 OpenHarmony 统一互联标准也陆续发布。

OpenHarmony 成了发展最快的开源操作系统,Gitee 指数为 NO.1,社区贡献者达到 7800+,代码数超过 1.1 亿行。

并且,硬件销量的强劲复苏,也给开发者和用户接纳鸿蒙操作系统吃了一颗定心丸。

一方面,华为通过扩大市场份额来巩固其地位,根据 TechInsights 的数据显示,今年第二季度华为全球智能手机出货量同比增长了 49%,达到了 1160 万台。

另一方面,华为则通过硬件新物种来提高软件系统的吸引力,比如 9 月份亮相的华为三折叠屏手机既自成一派,同时也是自成生态的底气。

至此,「鸿蒙速度」的星火已有燎原之势——

市场研究机构 Counterpoint Research 数据显示,在 2024 年第一季度,鸿蒙的操作系统首次以 17% 的份额超越 iOS 的 16%,成为市场第二大操作系统,显示出强劲的增长势头。

余承东在发布会上宣布,搭载鸿蒙生态的设备已经超过 10 亿+。从根本上,鸿蒙操作系统全面突破操作系统核心技术,已成为最具生命力的数字底座。如余承东曾说——

万物互联时代,没有人会是一座孤岛,每个人、每个设备都是万物互联大陆的一部分。

鸿蒙生态朋友圈只会越开越大,一枝独秀不是春,百花齐放春满园。

作者:肖凡博、莫崇宇

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


人人都可以写作

By: dimlau
20 October 2024 at 11:34

Ironben 谈到 Essay 社区的由来:

Essay 最初源于一个想法:AI 模型就是我们这个世界的缩影,从今往后,会不断吸收我们产生的数据, 如果有一个公开的地方能记录我的所见所闻所想,我存在事实就会永远被人工智能留下。但自己文笔不好,每次写博客都没能坚持下来,所以 Essay 上线了。最初的想法无从验证,但我想就这么一直写,漫无目的写,寥寥几笔也行,记录我见过的景,遇到的人,读过的书、听过的歌、看过的电影、闪过的念头…,往后每年将一整年的记录打印成册保存下来。
可能某天,会有人读到我的文字,脑子里会见到我见过的景,遇到我遇见过的人、读到我读过的书…,无论我在还是不在。

乍听颇有些浪漫,类似之前听过的,构成人体的原子都来自死去的恒星。不过,以我的粗浅了解:AI 输出的文字基于概率,「我」后边是跟着「爱」还是「饿」,是它统计数据库里的样本计算出来的最可能的选项。妳写的东西的确是会影响 AI 表现,但人类可以自傲的是,活出,另一种,可能性,而不是重走过往所有人生样本统计出来的最可能的选项。妳存在过,何必期待被人工智能留下?留些空间给后人想象吧:曾经有个人活过,那是一段人工智能无法记录的鲜活人生。

所以文笔好不好有什么重要呢?Essay 里可以写的东西,博客都可以写,「就这么一直写,漫无目的地写,寥寥几笔也行,记录我见过的景,遇到的人,读过的书、听过的歌、看过的电影、闪过的念头」。

fin.

高通骁龙 8 至尊版发布,主频超 4GHz,Benchmark 6 多核破 1 万

By: 刘学文
22 October 2024 at 09:56

高通的骁龙旗舰芯片这几年的命名几经变更,比如前几年突然出现的骁龙 888,主要图一个吉利,后面变成了骁龙 8 Gen1、Gen2、Gen3,到了今年骁龙移动芯片的命名开始和 PC 端命名接近,英文名 Snapdragon 8 Elite,中文名骁龙 8 至尊版。

取这个名字不光要勇气,其实也需要一点底气,不过从这一代骁龙 8 系旗舰芯片的账面表现来说,说是至尊问题也不大。

Oryon CPU 架构初来移动端,全大核,跑分强

以往的移动端芯片设计许多用到了 big LITTLE 架构,即大小核架构,由此还可以派生出「超大小」架构,用超大核和大核(性能核心)负责重载任务,比如大型游戏,用小核(能效核心)负责轻型任务,比如聊天和网页浏览等。

不过我们也可以看到,移动端芯片的小核数量一直减少,骁龙 8 Gen2 有 3 个小核,到了骁龙 8 Gen3 变成了 2 个小核,今年的骁龙 8 至尊版干脆直接取消小核,变成了全大核架构,2 个超大核心配合 6 个大核心。

去年高通把自研的 Oryon CPU 架构带到了骁龙 X Elite 上,今年第二代高通 Oryon CPU 架构来到了骁龙 8 至尊版上,这也是这次这款旗舰芯片架构变化,以及性能暴增的主要原因。

首先就是骁龙 8 至尊版超大核的主频达到了惊人的 4.32GHz,这样的主频出现在移动端芯片上确实让人意外,毕竟这样的数字一般是出现在桌面芯片上。

哪怕是另外的 6 个大核,其主频也达到了 3.53GHz。

在这样的架构加持下,骁龙 8 至尊版的试验机型在 Benchmark 6 的跑分中能够获得单核超 3200,多核超 10000 的上佳成绩。

作为对比,上代骁龙 8 Gen3 在 Benchmark 官方网站上的典型成绩是单核 2213,多核 7466。

上上代骁龙 8 Gen 2 的 Benchmark 6 典型成绩则为单核 2036,多核 5697。

所以说这次骁龙 8 至尊版的 CPU 性能是挤爆牙膏一点儿问题也没有,按照高通的说法,骁龙 8 至尊版的单核性能和多核性能相较于上代都提升了 45%,同时能耗也降低了 40% 以上。

另外为了适应 AI 时代的需要,这代 Oryon CPU 的内存架构也有巨大的升级,每个 CPU 丛集都有 12MB 的 L2 缓存,另外超大核和大核的 L1 缓存也比之前有所增加,同时骁龙 8 至尊版也支持目前最先进的 LPDDR5x 内存。

捆绑虚幻 5 引擎,GPU 也变强了

我们知道游戏性能表现是 CPU 和 GPU 一起合力的结果,所以这一次 CPU 的性能提升自然也会提升游戏性能表现,高通举的例子是在虚幻引擎的 Chaos Physics 系统,这是一个旨在赋能下一代游戏的模拟工具,在这个工具中可以在终端侧实时模拟所有必要的游戏物理系统。因为这代骁龙 8 至尊版的 CPU 性能加强,它支持在这个模拟工具中超过 1000 个物体碰撞和破坏的场景,并且时延低于 5 毫秒。

和 CPU 架构更新类似,骁龙 8 至尊版也首次引入了 Adreno GPU 切片架构,让 GPU 性能提升了 40%,功耗也降低了 40%。

高通也演示了运行虚幻 5 引擎的 Nanite 方案的视频,目前仅有骁龙平台支持这个功能,借助这个功能,理论上游戏开发者可以在移动游戏里渲染出电影级别的 3D 环境。

在过往,我们看到了骁龙旗舰芯片在游戏上的诸多特性,一边是为了降低能耗保证基础画质体验的特性,比如可变分辨率,和智能插帧等等,另一边是为了提高画质上限,比如移动端的光线追踪等等。

这一次高通和虚幻 5 引擎在发布会上的强绑定,似乎透露出让移动游戏体验逼近主机级或者 PC 级游戏的野心,而在发布会 Keynote 上出现的《永劫无间手游版》和《剑侠情缘网络版三无界版》等游戏,也倾向于让移动游戏和 PC 平台的玩法与数据接近,甚至互通。

AI 与影像,逐渐融合,逐渐强大

去年骁龙 8 Gen3 发布的时候,AI 部分的演示集中在了端侧大语言模型的文生文,还有 Stable Diffusion 文生图,源头都是文字。

到了今年,因为 AI Agent 概念的火爆,所以 AI 应用也呈现出了非常明显的多模态化趋势,而不再是文生一切。

因为 AI 任务非常多样,所以骁龙 8 至尊版的 AI 引擎也得到了升级,Oryon CPU 主要负责时延敏感型的任务,以及进行 AI 任务的分配,比如把任务分配到传感器中枢去。

Hexagon NPU 是高通 AI 引擎的中心,高通给 NPU 里的标量和向量加速器增加了额外的内核,现在向量加速器有 6 个核心,标量加速器有 8 个核心,张量处理器也得到了加强,这让 NPU 的整体推理速度提升了 45%,面对 AI 多任务需求,高通也增强了并发功能,可以让 AI 和计算机视觉负载可以在 NPU 内存中共存。

CPU、GPU 和 NPU 都得到了巨大的性能提升之后,那么高通的目的也非常明显,那就是在终端侧能够运行多模态 AI 助手,运行多个 AI 模型,包括 LMM(多模态大模型)、LLM(大语言模型)、LVM(视觉大模型)、ASR(自动语音识别)等等。

举个例子,之前用户使用语音助手,总感觉语音助手反应慢半拍,但是现在的旗舰手机语音助手的交互更灵敏更像真人,几乎没有延迟。这背后就是技术的进步。

之前的语音助手需要把语音转换成文字,让 AI 模型理解文字,整理成文本,然后大语言模型处理文本,再把回答生成文本,文本再转换成语音输出给用户。

现在的一些 AI 助手可以直接理解语音,无需把语音转换成文本,大大缩短了处理时间。

除了对文本和语音的理解能力加强,现在在骁龙 8 至尊版的加持下,AI 助手也可以在终端侧直接用摄像头理解看到的内容,比如用相机对准收据,AI 助手就能理解收据内容,推理出信息结果,帮助用户计算付款信息,如何和朋友分担账单等等。

除了摄像头和麦克风这样明显的传感器之外,其他的传感器也能实时了解周遭环境,综合起来根据用户的具体喜好和情况来创建用户个人神经网络,从而实现更贴合用户习惯,更洞察用户潜在需求的效果。

骁龙 8 至尊版的 ISP(图形信息处理器)得到了增强:全新的 AI ISP 和在底层和 NPU 协作,大大提升像素吞吐量,达到了每秒 43 亿像素,骁龙 8 至尊版支持 3 个 4800 万像素的相机同时进行 30fps 的视频拍摄。

另外,因为 Hexagon NPU 可以和内存直连,这个直连技术也让 NPU 能够直接访问 ISP 上的原始 RAW 数据,从而实现对 4K 60fps 拍摄中的实时 AI 辅助增强,实现各种 AI 效果。

将 AI 算法直接引入图像和视频处理管线之后能够获得各种各样的 AI 功能和效果,比如无限语义分割(Limitless Segmentation),支持对图片进行超过 250 层语义识别和分割,对照片的所有部分进行专门的调整和改善。

一些实际的 AI 视频效果包括 AI 补光,哪怕是在视频会议中处于严重背光环境,用户也可以添加虚拟光源,保证脸部画面清晰。另外一个刚需功能就是 AI 视频魔法消除,现在已经有不少手机支持 AI 照片消除,把照片里的不必要杂乱元素擦除,而在 AI 视频魔法消除中,用户可以在视频里选择需要擦除的对象,从而在整个视频里保证画面的干净,而这一切都在骁龙 8 至尊版终端侧实现,无需云端计算。

 

2024 年手机行业出现了复苏迹象,AI 手机概念也有可能迎来转折点,去年我们看到的更多是不太可用的文生文和文生图演示,而今年我们则看到了更多具体的,能用到并且有用的服务,这一切又刚好迎来了高通骁龙 8 至尊版的性能大提升,以及 Android 阵营的集体设计转向,还有整体发布节奏的提前。

竞争激烈的结果就是,产品力上没法挤牙膏,用户的选择也更多了。

在命运的塑料大棚里,每棵被喷了过多农药的白菜心中,都曾经有一个成为无公害有机蔬菜的梦想。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


刚刚,Windows 版 ChatGPT 正式发布!还有一个实用的新功能| 附下载链接

By: Anonymous
12 October 2024 at 15:17

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

就在刚刚, 宣布推出 桌面,向 Plus、Enterprise、Team 和 Edu 用户开放 。

不过,官方表示,目前开放的只是早期版本,将在今年晚些时候向所有 ChatGPT 用户推出「完整的体验」。

刚刚,Windows 版 ChatGPT 正式发布!还有一个实用的新功能| 附下载链接

例如,它还不支持高级语音模式,并且 GPT Store 的部分集成功能暂时也无法使用。

用户可以在微软应用商店 ChatGPT,接着安装即可,安装包大约 110MB,附上下载地址:

The Windows is currently only available to ChatGPT Plus, Team, Enterprise, and Edu users. This is an early version, and we plan to bring the full experience to all users later this year. With the official ChatGPT desktop app, you can chat about files and photos.

系统要求:Windows 10(x64 和 arm64)版本 17763.0 或更高版本。

在具体的使用过程中,OpenAI 提出了一个名为「Companion Chat」的辅助聊天功能,它允许你在不离开当前应用程序的情况下,快速访问和使用 ChatGPT

这个功能类似于一个快捷方式或者浮动窗口,你可以通过特定的快捷键(Alt + Space)来调出这个聊天窗口。

借助这个聊天窗口,你可以快速地向 ChatGPT 提问、上传文件、生成或者开始一个新的对话。它还具有记住上次位置的功能,并且当主应用程序重置时,它会回到屏幕底部中心的位置。

此外,你还可以通过点击窗口顶部的「New chat」来清除聊天内容,或者通过点击「Open in Main Window」按钮将对话转移到 ChatGPT 的主应用程序窗口中继续。

如果不小心关闭了这个聊天窗口,你也可以通过查看侧边栏的聊天记录来在主应用程序中继续对话。

需要注意的是,如果这个快捷键已经被其他 Windows 应用程序占用,那么它将会不起作用,并且也不支持更改快捷键。

目前 ChatGPT 已经向 Windows 两大操作系统开放桌面版本,但 Linux 却没有给出明确的时间表,也惹得不少网友在线催更。

另外,前不久 OpenAI 推出了 ChatGPT Canvas 功能,允许用户与 ChatGPT 合作处理写作或编程任务。

今天 ChatGPT Canvas 也更新了一个比较实用的功能,你可以点击右上角的「Show changes」图标来查看文章或代码的更改。

▲ Window 的 ChatGPT Canvas 功能,图片来自 @test_tm7873

如下文所示,我使用 ChatGPT Canvas 将朱自清的《背影》改写成文言文版本,点击图标,所做的更改一目了然。

实际上,今天更新的功能也算是补上了 ChatGPT 生态的重要一环。

不过,正如开篇所说,这个桌面版本本质上还是个阉割版,食之无味弃之可惜,尽管快捷键调用方式简单,但网页版所带来的体验明显会更好。

刚刚,Windows 版 ChatGPT 正式发布!还有一个实用的新功能| 附下载链接

By: 莫崇宇
18 October 2024 at 08:21

就在刚刚,OpenAI 宣布推出 Windows 桌面应用,向 ChatGPT Plus、Enterprise、Team 和 Edu 用户开放 。

不过,官方表示,目前开放的只是早期版本,将在今年晚些时候向所有 ChatGPT 用户推出「完整的体验」。

例如,它还不支持高级语音模式,并且 GPT Store 的部分集成功能暂时也无法使用。

用户可以在微软应用商店搜索 ChatGPT,接着下载安装即可,安装包大约 110MB,附上下载地址:

https://apps.microsoft.com/detail/9nt1r1c2hh7j?rtc=1&hl=en-us&gl=US

系统要求: Windows 10(x64 和 arm64)版本 17763.0 或更高版本。

在具体的使用过程中,OpenAI 提出了一个名为「Companion Chat」的辅助聊天功能,它允许你在不离开当前应用程序的情况下,快速访问和使用 ChatGPT。

这个功能类似于一个快捷方式或者浮动窗口,你可以通过特定的快捷键(Alt + Space)来调出这个聊天窗口。

借助这个聊天窗口,你可以快速地向 ChatGPT 提问、上传文件、生成图片或者开始一个新的对话。它还具有记住上次位置的功能,并且当主应用程序重置时,它会回到屏幕底部中心的位置。

此外,你还可以通过点击窗口顶部的「New chat」来清除聊天内容,或者通过点击「Open in Main Window」按钮将对话转移到 ChatGPT 的主应用程序窗口中继续。

如果不小心关闭了这个聊天窗口,你也可以通过查看侧边栏的聊天记录来在主应用程序中继续对话。

需要注意的是,如果这个快捷键已经被其他 Windows 应用程序占用,那么它将会不起作用,并且也不支持更改快捷键。

目前 ChatGPT 已经向 Mac、Windows 两大操作系统开放桌面版本,但 Linux 却没有给出明确的时间表,也惹得不少网友在线催更。

另外,前不久 OpenAI 推出了 ChatGPT Canvas 功能,允许用户与 ChatGPT 合作处理写作或编程任务。

今天 ChatGPT Canvas 也更新了一个比较实用的功能,你可以点击右上角的「Show changes」图标来查看文章或代码的更改。

▲ Window 的 ChatGPT Canvas 功能,图片来自 @test_tm7873

如下文所示,我使用 ChatGPT Canvas 将朱自清的《背影》改写成文言文版本,点击图标,所做的更改一目了然。

实际上,今天更新的功能也算是补上了 ChatGPT 生态的重要一环。

不过,正如开篇所说,这个桌面版本本质上还是个阉割版,食之无味弃之可惜,尽管快捷键调用方式简单,但网页版所带来的体验明显会更好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


❌
❌