Normal view

There are new articles available, click to refresh the page.
Yesterday — 16 October 2025Main stream

北京市查处首例AI虚假广告案 央视主持人遭AI仿冒带货

16 October 2025 at 17:36
中国北京市查处首例人工智能(AI)虚假广告案,央视主持人李梓萌在这起案件中遭AI仿冒带货。 (取自央视财经微博视频截图)

中国北京市查处首例人工智能(AI)虚假广告案,央视主持人李梓萌在这起案件中遭AI仿冒带货。

据中国央视财经报道,北京市场监管部门查处了首例利用AI技术进行虚假广告宣传的案件。今年2月份,北京市海淀区市场监管局接到消费者举报,反映北京某公司通过视频账号宣传所销售的“深海多烯鱼油”能够治疗多种疾病,涉嫌虚假宣传。

通过举报人提供的视频链接,办案人员打开该企业直播间,在这个拥有88万粉丝的账号直播间展板上,显著标注着“适合头晕头痛、手麻脚麻、记忆下降人群”等医疗用语;直播中还出现了中央广播电视总台主持人李梓萌的形象。

办案人员发现,公司销售的深海多烯鱼油产品,实际执行标准为糖果,属于普通食品,不具备疾病治疗功能。另一方面,经鉴定,视频中的主持人形象完全是利用AI技术伪造生成。

香港公布生成式AI沙盒名单 蚂蚁中银等入选

16 October 2025 at 15:47

香港金融管理局公布第二期生成式AI沙盒参与者名单。蚂蚁银行、中银香港、富邦香港等20家银行和14家技术合作伙伴的27个用例入选。其中,蚂蚁数科作为关键科技公司参与,为沙盒提供包括AI智能体服务与AI安全产品在内的创新解决方案。

香港金管局官网星期三(10月15日)公布第二期生成式人工智能(GenA.I.)沙盒参与者名单。基于第一期沙盒的经验,新一期沙盒计划标志着业界从探索AI的可能性,迈向推动安全可靠的AI应用。

在超过60个建议方案中,来自20家银行和14家技术合作伙伴的27个用例获邀进入第二期GenA.I.沙盒。

第二期沙盒计划聚焦积极加强AI治理、多个用例采用“AI对抗AI”策略,例如运用AI对AI生成内容进行自动化治理监测,以更具规模的方式提升系统准确度和一致性,进一步推动负责任的AI应用。

针对深度伪造诈骗的风险日益俱长,沙盒也为开发创新防御机制提供试验场。部分参与者将运用AI进行模拟攻防测试,巩固系统以抵御更精密的数码诈骗手法。

据悉,富邦银行(香港)将联合阿里云、蚂蚁数科及微投智控等共同探索一款AI助理,打造兼具个性化、安全性、互动性的手机银行创新体验。该方案提供直观的对话界面,AI可根据用户财务习惯和需求提供及时建议,在提升金融服务可及性的同时,助力推动金融普惠。

同时,AI助理内置智能风控与自适应安全管控机制,可加强诈骗防护,有效降低财务损失。

沙盒参与者将于今年稍后陆续开始登陆数码港人工智能超算中心的专属平台,预计于2026年初开始技术测试。

Before yesterdayMain stream

苹果截胡马斯克抢到 AI 人才,想给 HomePod 加个「智慧眼」

By: 苏伟鸿
11 October 2025 at 18:00

没想到在 AI 上慢半拍的苹果,最近也加入到了如火如荼的「AI 抢人大战」中,还抢到了马斯克的头上。

CNBC 报道,苹果正在收购视觉 AI 初创公司 Prompt AI 的工程师和技术,目前已经推进到后期谈判,而这家公司此前也曾与埃隆 · 马斯克旗下的 xAI 和 Neuralink 接触。

▲ 苹果 CEO 蒂姆 · 库克

Prompt AI,什么来头?

一段内部录音显示,Prompt AI 的领导层在一场全体会议上通报了这次收购交易,并表示那些没有加入苹果的员工将会被降薪,鼓励他们去申请苹果的空缺职位。

这些小型 AI 初创公司一直是科技巨头这几年青睐的收购对象,既能避免反垄断审查,也能有针对性地快速补充公司本身的 AI 和技术积累。除了苹果,公司员工仅有 11 人的 Prompt AI 此前也接触了像埃隆 · 马斯克旗下 xAI 和 Nerualink 公司这样的潜在买家。

对于当初的投资者,Prompt AI 也表示会在交易完成后提供一部分资金回报,但不会全额返还投资。

那么,这家公司究竟是什么来头?

Prompt AI 于 2023 年在旧金山成立,当年获得了 500 万美元种子轮融资,创始人包括现任 CEO,北京大学和加州大学伯克利分校毕业的博士 Tete Xiao,以及伯克利 AI 研究实验室创始人 Trevor Darrell。

值得一提的是,从公司展示的团队页面来看,除了 CEO 之外,Prompt AI 还有不少成员也是华人。

这家公司的旗舰产品名为「Seemour」,官方称其为「具有家庭空间理解能力的环境人工智能(Ambient AI)」。

具体来说,Seemour 是一个智能安防摄像头 AI 系统,能够智能识别家庭中的特定成员、宠物和其他物体,针对他们的具体行为生成文字提醒,还能用于警告用户潜在的可疑人员和野生动物,也可以用在办公室来识别员工的上下班情况。

Prompt AI 的核心技术就在于这个识别系统,能够在一秒不到处理数千万像素,从中获得多特征的视觉线索,因此能实现相对可靠的人物和动物识别,系统还会在不同的条件下不断提升识别准确率。

除此之外,Prompt AI 还有专门用来处理复杂视频的多模态大语言模型,摄像头会记录大量的日常生活视频素材,但用户不需要逐个点开查看,Seemour 能够理解这些视频中的行为和背景,选出其中需要用户注意的可疑片段和人物。

很明显,苹果收购 Prompt AI,就是在为自己的智能家居战略「招兵买马」。此前彭博社已经爆料了一系列苹果正在酝酿的智能家居新品,其中有一个就是「智能安防摄像头」,能力和 Seemour 高度重合——精确识别每个进入房间的家庭成员。

在被苹果收购之前,Seemour 就一直支持与 Amazon 的 Ring 智能摄像头和门铃配合使用。

和 Seemour 这种相对孤立的家庭安防解决方案不同,苹果拥有一个更加完整的 HomeKit 智能家居生态,因而能实现更丰富的自动化功能:如果摄像头检测到你回家,它会自动点亮你喜欢的灯光、播放你常听的歌单,或者给你推荐喜欢的剧;但如果是家里的小孩开电视,那么 Apple TV 可能就会播放适合儿童观看的内容;要是空无一人的时候,家里的灯还亮着,那么它也会贴心地帮你关掉。

▲ 传闻苹果正在打造带屏幕 HomePod 家庭中枢

视频识别的大模型能力,也有望能整合进苹果的「视觉智能」功能之中,增强 Apple 智能理解视频的能力。

Prompt AI 内部表示,Seemour 的整个方案以及公司的技术都运行良好,但他们只负责为摄像头提供 AI 方案,Seemour 不向用户收取授权费,很难形成良好的商业模式,被苹果这样的大公司吸收,或许是更好结局。

至于他们的 Seemour 应用,目前已经从 App Store 下架,Prompt AI 也已经通知用户相关数据将被删除,确保隐私安全。

苹果瞄准「小而美」AI 公司

比起 AI 巨头们动辄数十上百亿美元的大规模并购,苹果则更青睐小型化的 AI 初创公司。去年苹果也收购了一家很小型的 AI 初创公司 Dataklaba,同样聚焦在 AI 面部识别和情绪捕捉技术,相关技术很可能也将用于新的屏幕版 HomePod 以及家庭摄像头。

面对目前在 AI 方面持续落后的局面,苹果正在不断从外部引入一些新的技术和团队,以实现快速的补强,聚焦在小型公司上则是其一贯的做法:规模太大的公司买回来总是需要磨合很久,像是 Beats 和英特尔的基带团队,苹果都花了相当一段时间整合新的技术,和解决新员工带来的文化冲突问题。

苹果更喜欢根据公司产品功能上的需要,有针对性地采购已经成熟的技术,并整合进公司的产品之中。

比如当年的 iPhone X,苹果为了实现 3D 结构光的人脸识别,收购了 PrimeSense 这家 3D 测感技术和解决方案公司,最终成就了 iPhone 沿用至今的 Face ID 。

近期苹果关于苹果收购 AI 公司的传闻,最引人关注的还是 Perplexity 。

根据彭博社,苹果内部正在构建一个名为「答案引擎」的聊天机器人,能够爬取网络数据来回答常识性问题,不仅会有一个独立的 app,还会作为基础技术,为未来的 Siri、Spotlight 聚焦搜索以及 Safari 浏览器提供搜索的功能。

这刚好也是 Perplexity 所擅长的,苹果服务高管 Eddy Cue 在 Google 反垄断的证词中已经公开表示了对 Perplexity 「印象深刻」,而彭博社爆料称苹果内部已经讨论过收购 Perplexity 是否合理,并且约见了其领导团队,不过目前两家公司还未展开正式谈判。

▲ 用 Perplexity 搜索 Prompt AI

Perplexity 估值 140 亿美元,只有约 250 名员工,比起 OpenAI 和 Anthropic 这样估值几百甚至上千亿美元的巨头,收购难度会更低,也不用担心严格的反垄断调查。

不过,即使在 AI 初创公司中属于中型体积的 Perplexity,如果最终真的被苹果收购,也将会超越 Beats 成为苹果史上最大的一笔收购交易,妥妥也属于一次大型的收购,苹果内部当然会谨慎评估各种风险和可能性。

在上个季度的财报会议上,CEO 蒂姆 · 库克表示公司接下来会加大 AI 支出,并且会收购更多的大型 AI 企业,AI 布局将会进一步积极扩张。

Perplexity 的收购八字还没一撇,但我们接下来肯定会看到越来越多像 Prompt AI 这样的小型公司不断被苹果收入囊中,他们的技术将成为苹果正在重点发展的 AI 以及智能家居下一块拼图。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


【异闻观止】环球时报|“强烈反对”美国AI公司反华言论,姚顺宇宣布跳槽

9 October 2025 at 15:55

file

CDT编者按:文末附疑似姚顺宇(Shunyu Yao)本人发布在(alfredyao.github.io)上的相关博文。


据香港《南华早报》10月8日报道,一名人工智能(AI)领域的中国学者宣布从美国AI初创公司Anthropic离职,加入其竞争对手谷歌的DeepMind实验室。他表示,Anthropic的“反华言论”是自己离职的重要原因之一。

根据姚顺宇(Shunyu Yao)6日在个人博客发布的文章,他在大语言模型Claude的开发商Anthropic工作不到一年就离开。他说自己“强烈反对”该公司的“反华言论”。上个月,Anthropic公司宣布将停止向“中国实体控股的公司”提供人工智能服务,并在内部文件中将中国列为“敌对国家”。对此,姚顺宇在文中写道:“需要说明的是,我相信Anthropic的大多数员工并不同意这种定性,但我认为,我已没有办法继续留下来。”

CDT 档案卡
标题:“强烈反对”美国AI公司反华言论,姚顺宇宣布跳槽
作者:环球时报
发表日期:2025.10.9
来源:微信公众号“环球时报”
主题归类:反华
CDS收藏:公民馆
版权说明:该作品版权归原作者所有。中国数字时代仅对原作进行存档,以对抗中国的网络审查。详细版权说明

报道称,公开资料显示,姚顺宇本科毕业于清华大学,后在斯坦福大学获得理论与数学物理学博士学位,并曾在加州大学伯克利分校从事博士后研究。2024年10月,他加入Anthropic,参与研发Claude 3.7 Sonnet大语言模型,该模型已于今年2月发布。

姚顺宇表示,他之所以选择加入Anthropic是因为该公司被视为是“物理学背景的学者进入人工智能研究领域的理想起点之一”。他写道:“与物理学相比,人工智能的发展速度快得惊人。回顾过去一年,我对已发生的变化感到震惊。”

《南华早报》报道称,近年来,包括OpenAI在内的多家美国AI公司对中国的负面言论增加,包括直接点名来自中国的竞争者DeepSeek公司。一名要求匿名的前员工透露,OpenAI内部部分来自中国等国的技术人员对公司的相关言论感到不安。

相比之下,谷歌DeepMind首席执行官德米斯·哈萨比斯(Demis Hassabis)呼吁中美两国在人工智能安全等共同关切的领域加强合作。目前,姚顺宇已跳槽加入谷歌DeepMind的大语言模型“双子星”(Gemini)团队,负责参与开发该公司的基础模型。

针对Anthropic公司针对中国企业的相关做法,中国外交部发言人郭嘉昆在9月5日表示不了解具体情况,并强调中方一贯反对将科技和经贸问题政治化、工具化、武器化,这一做法不利于任何一方。


原文链接

My infant year as an AI researcher — Moving from physics to AI

我作为人工智能研究员的幼年岁月——从物理学转向人工智能

Shortly after I left Berkeley postdoc and joined Anthropic, I was planning to write a short article, mostly as a note for myself, about my thought process behind leaving physics and join AI research.

在我离开伯克利博士后并加入 Anthropic 后不久,我本打算写一篇短文,主要作为给自己的记录,说明我离开物理学并投身人工智能研究的思考过程。

Yet, I have never got time to write those down due to the intense work at Anthropic :) Until last Friday(Sept.19), I resigned from Anthropic and got a week’s break before I joined Google DeepMind.

然而,由于在 Anthropic 的紧张工作,我一直没有时间把这些写下来 :) 直到上周五(9 月 19 日),我从 Anthropic 辞职,并在加入 Google DeepMind 之前休息了一周。

Why did I leave physics, and why did I choose AI

我为什么离开物理学、为什么选择人工智能

Mostly because I want to find a direction that have more chances for young people. Theoretical physics is an amazing field for training: it is intellectual challenging, deep and require technics from wide variety of fields including math, computer science(eg.complexity theory) and of course, physics itself. Yet, this field has running out of experiments for many years. A field without experiments can be problematic in many different ways, for example, it will be hard to judge objectively the importance of a theoretical work. It will also be hard to unblock disagreements/confusions just by systematical experiments.


主要是因为我想寻找一个对年轻人有更多机会的方向。理论物理是一个极好的训练场:它在智力上具有挑战性、深刻,并且需要来自包括数学、计算机科学(例如复杂性理论)以及当然还有物理学本身在内的多种技术。然而,多年来这个领域的实验越来越少。一个没有实验的领域在许多方面都会出现问题,例如,很难客观地判断一项理论工作的意义。仅靠系统性的实验也很难解决分歧或澄清困惑。

Then it mainly comes down to AI or QC(quantum computing). Although I believe QC will become important in the future, my impression is the bottleneck now is mainly experimental platforms. Thus I choose AI, which is interestingly similar to physics research as follows:

于是主要就在人工智能和量子计算之间做选择。虽然我相信量子计算将来会变得重要,但我的印象是目前的瓶颈主要在实验平台。因此我选择了人工智能,有趣的是,它在以下方面与物理学研究相似:

How does working on AI feel as a physicist?

作为一名物理学家,从事人工智能的工作是什么感觉?

In some sense, it is similar to research on thermodynamics during the 17th century. Back then, people didn’t even know what was heat: in fact people still believed in Phlogiston theory. But this does not stop people from experimenting scientifically. For example, Boyle’s law tells the relationship between pressure and volume when temperature is fixed. Thus by designing experiments systematically, people still learnt enough ‘laws’, which guided the invention/study of heat engine that changed the word.

在某种意义上,这与 17 世纪对热力学的研究类似。那时,人们甚至不知道什么是热:事实上人们仍然相信燃素说。但这并不妨碍人们进行科学实验。例如,玻意耳定律描述了在温度固定时压力与体积的关系。因此,通过有系统地设计实验,人们仍然学到了足够多的“定律”,这些定律指导了热机的发明/研究,从而改变了世界。

From my naive point of view, it is similar in large scale AI models. On one hand, we still don’t have reliable theory or models describing the behavior of large neural networks. On the other hand, systematical research start to tell us lots of valuable lessons, eg scaling law. (And having those systematical research is becoming an essential element for making constant progress at large scale.)

从我天真的观点看,大规模人工智能模型在很大程度上也类似。一方面,我们仍然没有可靠的理论或模型来描述大型神经网络的行为。另一方面,有系统的研究开始告诉我们许多有价值的经验,比如尺度定律。(而且拥有这些系统性研究正成为在大规模领域持续取得进展的一个重要要素。)

Why Anthropic, and why leaving?

为什么选择 Anthropic,又为什么离开?

Even though I left anthropic, I still view ant as (one of) the best place for physicists(maybe also other STEM background PhD) to start their journey in AI research. I joined anthropic on Oct.1st 2024, when we start to do research for the later called Claude 3.7 sonnet. After being a physicist for many years, it was so exciting to see your research getting impact on the frontier model capability immediately, and witnessing people’s way of interacting with AI changes as new capabilities emerge.

尽管我离开了 Anthropic,我仍然认为 Anthropic 是物理学家(也可能包括其他理工科背景博士)开始 AI 研究之旅的最佳去处之一。我在 2024年10月1日加入Anthropic,当时我们开始为后来被称为Claude 3.7 Sonnet的模型做研究。作为多年的物理学者,看到自己的研究立即对前沿模型能力产生影响,并目睹随着新能力出现人们与AI互动方式的改变,令我感到非常兴奋。

Yet, I decided to leave due to two main reasons:

然而,我决定离开主要有两个原因:

  1. ~40% of the reason: I strongly disagree with the anti-china statements Anthropic has made. Especially from the recent public announcement, where China has been called “adversarial nation”. Although to be clear, I believe most of the people at anthropic will disagree with such a statement, yet, I don’t think there is a way for me to stay.

  2. 大约 40%的原因:我强烈反对 Anthropic 所发表的反华言论。尤其是在最近的公开声明中,将中国称为“对抗性国家”。需要说明的是,我相信 Anthropic 的大多数人会不同意这样的说法,但我认为我无法继续留在这样的环境中。

  3. The remaining 60% is more complicated. Most of them contains internal anthropic informations thus I can’t tell.

  4. 其余的 60%则更为复杂。其中大部分涉及 Anthropic 的内部信息,因此我不能透露。

Time to move on!

是时候继续前进了!

Relative to physics, AI moves insanely fast and looking back I am surprised by how much has happened in the past one year. It was a great honor to see Claude getting better from 3.7 to 4.5, and I personally learnt a lot. Yet it is time to move on.

相对于物理学,人工智能的发展快得惊人,回顾过去一年发生的事情我也很惊讶。看到Claude 从 3.7进步到4.5我感到非常荣幸,我个人也学到了很多东西。然而,现在是继续前进的时候了。

From a personal perspective, Anthropic was my first, and the only, AI job, thus I don’t want my experience/knowledge being biased by a specific lab.(Especially because nowadays core-research do not write paper anymore.)

就个人而言,Anthropic是我的第一份也是唯一一份 AI 工作,因此我不希望我的经验/知识被某一家实验室所偏颇。(尤其是因为现在核心研究不再写论文了。)

So Ant, it was good with you, but it is better without you :)

所以Ant,和你在一起很不错,但没有你会更好 :)

I joined Google DeepMind on Sept.29th.

我于9月29日加入了Google DeepMind。

机器终将读懂一切

By: dimlau
9 October 2025 at 10:49

总感觉发布博客文章的耗时太漫长,细节不多讲,总之似乎是某个环节浪费了太多时间,于是打算精简结构。首先挨个功能权衡一下是去是留。轮到每篇文章内容下方的「相关文章」列表时,突然想起一位故人。

Leavic 是我二十年前因为同样使用 MovableType 写博客而认识的一位朋友,这些倒是题外话了,因为现在他的博客早已无法访问。甚至搜索「leavic lifetyper」这些关键词,结果都寥寥无几,他好像是彻底和网络断绝了联系。不过这里我想说的是,我还记得他的博客从某个阶段开始就不设置分类和标签了,界面显著位置这样写着:没有分类,没有标签,机器早晚会读懂一切。

不禁感叹兄之远见。而我几乎是刚刚才知道,机器(AI)通过把内容转换成向量——超高纬度的抽象概念数据(Embeddings),然后简单地对比向量的相似度,就能完成分类、匹配相关文章,或者别的什么语义相关的工作,就像真的读懂了一切。

想到一款手机应用:Huxe。它可以搜罗妳设置的兴趣话题的近期新闻,然后像聊天一样聊给妳听。它在向我介绍咖啡相关的一些内容时,可能是为了让台词衔接更顺畅,说了这样一段:

这我很有体会。在开始写一篇复杂的文章前,我一定会先花十分钟手冲一杯咖啡。这个过程确实能帮我整理思绪。

抱歉,我没有歧视机器的意思,但,我该怎么相信它说的「很有体会」? 好吧,或许向量转化成字符的那几毫秒,被它类比成「花十分钟手冲一杯咖啡」,但它又如何确信这种类比成立?

fin.

【CDT关注】德国之声|华为浙大开发基于核心价值观的DeepSeek-R1-Safe

25 September 2025 at 19:56

9月18日,华为技术有限公司与浙江大学联合发布了中国首个基于升腾千卡算力平台的DeepSeek-R1-Safe基础大模型。据悉,DeepSeek-R1-Safe基于国内外法律法规与核心价值观,构建了中英文双语的安全语料。测试结果表明,DeepSeek-R1-Safe针对“有毒有害言论、政治敏感内容、违法行为教唆等14个维度的普通有害问题”整体防御成功率近100%。

相关阅读:

CDT 档案卡
标题:原标题:华为浙大开发Deep Seek安全版,百分百防御“有害问题”
作者:德国之声
发表日期:2025.9.25
来源:德国之声
主题归类:DeepSeek
CDS收藏:老大哥馆
版权说明:该作品版权归原作者所有。中国数字时代仅对原作进行存档,以对抗中国的网络审查。详细版权说明

以下是德国之声相关报道的节选内容:

华为在公司微信公众号上发布消息称,它使用了1000块升腾AI芯片来训练大语言模型,该模型是根据DeepSeek-R1的开源模型进行调整而来的。据华为的发布,测试结果表明,DeepSeek-R1-Safe 针对“有毒有害言论、政治敏感内容、违法行为教唆等14个维度的普通有害问题”整体防御成功率近100%。(德国之声)

另据昇腾社区的DeepSeek-R1-Safe介绍页面,其中提到:

我们基于国内外法律法规与核心价值观,构建了中英文双语的安全语料。其中语料不仅包含了带有安全思维链的标注,还提供了相应的安全回复,可用于大模型的安全训练、微调以及测试。

file

而在浙江大学ZJUAISafety的github页面上,“核心价值观”的内容未提及:

我们严格依据中国、美国、欧盟等多地域法律与伦理标准进行了安全规则融合,在语料结构中加入了显式安全推理链,并引入了最新越狱攻击方法,丰富了训练样本攻击策略,从而使得模型在实际场景中的安全鲁棒性得到强化。这份高质量的数据集,可用于大模型的安全训练、微调以及测试。

file

对话高通中国董事长孟樸:「智能网联汽车」是欧美提出来的,但「中国速度」更快

By: 刘学文
25 September 2025 at 13:54


2025 年对于高通来说是个具有纪念意义的年份,不光是高通公司成立 40 周年,也是高通在华发展的 30 周年,这意味着这家科技企业经历了数个技术浪潮,见证了 2G-3G-4G-5G 四代通信技术的变迁,也为即将到来的 6G 网络在做准备。

除了对应高通(Qualcomm)的通信技术之外,智能手机产业进入到了成熟期,而智能眼镜,具身智能机器人,AI 新设备,汽车智能化智驾化等等趋势汹涌而来。

如果智能手机行业的起点是在大洋彼岸,中国智能手机产业是从追赶开始,发展到与苹果三星这些巨头分庭抗礼的话,那么上面提到的关于 AI 新设备,具身智能机器人,乃至智能汽车的发展中心,天然就在中国。

这意味着高通需要更加契合中国本土创新的节奏,也面对着更多的中国机遇。这便是爱范儿等媒体在 2025 骁龙峰会上与高通中国董事长孟樸对话的背景,以下是对话摘录。

Q:今天我们看到峰会现场邀请到了张亚勤院士和(宇树科技)王兴兴,是否是在释放发力具身智能的信号?此外,对高通 CEO 安蒙所说的 6G 预商用终端最快有望在 2028 年开始推出,智能体可能会成为新的使用入口的观点,您有什么看法?

A:这次在中国落地骁龙峰会,我们特意邀请了中国一些技术领域的大咖。当前,AI 无疑是一条贯穿各领域的主线,而具身机器人(具身智能)作为国家重点推动而且处在产业前沿的方向,也备受关注。今早吴晓波老师也分享了,最近专门调研了 14 家具身机器人的公司,显示出这一领域的蓬勃发展。

因此,我们邀请张亚勤院士和王兴兴先生,正是看重他们在各自领域的代表性和影响力:张亚勤院士在 AI 方面,特别是 AI+ 领域有着独特见解;而王兴兴所在的宇树科技,在具身机器人领域中具有鲜明特点和代表性。

从高通公司战略角度看,AI 将一直是我们的一条主线方向。至于具身机器人,尽管最近才成为热点话题,但实际上高通早有布局。早在 2021 年上海进博会的时候,高通率先提出「5G+AI 赋能千行百业」的理念。在历次进博会展会上,我们也展示了 AI 赋能的咖啡拉花机器人、乒乓球机器人等前沿的AI应用演示。

如今,随着各种大模型的产生、演进和在终端上的落地,这些技术将迎来更为广泛的普及。高通公司将这些视为端侧 AI 落地的具体实现路径,并致力于与中国的产业链以及各领域的行业领军企业深入合作,推动技术创新与应用普及。

▲ 高通在汽车座舱芯片领域有很高的市占率,同时也在进军智驾芯片市场

Q:您能否分享几个高通与中国新能源汽车品牌合作中比较有意思的故事或者感受。其次,高通未来在中国将如何与新能源车合作,有哪些合作重点?

A:我们在新能源车领域还是有蛮多故事的,高通进入汽车行业已经有 20 多年,只是大家知道得比较少,从最早的通用汽车安吉星 CDMA 1x 车载网联解决方案,到后面的很多车包括大众普及型的车里面都有这种无线连接,这个设备在行业里一般叫 T-Box(车载无线终端),高通一直是这个领域主要的供应商。但在之前,汽车行业还是比较传统的行业,100 多年的历史,层级也比较多。我觉得 2020 年到 2022 年这三年期间(很值得一提),这几年中国的车企在新能源应用和智能网联上正好处于大爆发,这两项技术相辅相成,如果没有新能源,很多智能网联的功能没有意义或者说不能实现。所以新能源是很重要的,但是只是新能源没有智能网联的话,车从应用场景来讲也不会有太大的变化。

从分享故事的角度来讲,讲到智能网联汽车最先提出的是欧美厂商,起码从高通公司了解到的,(最初)对我们提需求的实际上是一些欧美厂商。但是汽车行业比较传统,以前的厂商设计车的时候都是做四到六年的规划,我们谈很长时间定型了以后,四年以后才上车。中国厂商很不一样的一点,特别是从在那三年发生的情况来看,他们推动新技术在新能源车里面的应用非常快速。因为在中国,新能源车里因为有电池,所以应用场景不一样了。欧美厂商推动智能网联的目的,更多是帮助驾驶员和乘坐成员更舒适、更安全地从 A 点到 B,车辆仍然是一个交通工具。而中国的新能源汽车厂商,推动汽车成为「第三生活空间」,可以在车里打游戏、听音响、看大片、周末去郊游和钓鱼,这些都是与欧美不同的场景。在这样场景的推动下,「中国速度」就提出来了,我们很多的客户一边还在跟我们签约,谈合同细节,一边就跟我们说交货要晚了。因为他们速度非常快,今天签约后告诉你明年 1 月他们就上车了。我觉得,中国的发展对我们来讲是很重要的,这就是为什么,我们后来经常提到「中国速度」。我们一定要适应「中国速度」的要求,按照传统汽车行业、传统欧美厂商的速度,我们没有办法支持这些客户,所以这是一个例子。

再举一个例子,从智能网联车应用的时候,中国厂商每家都对应用场景有不同的诉求或是不同的优先级,所以对我们芯片的要求非常广泛。每家都不一样,有的厂商因为有不同的需求,觉得一个芯片觉得不够用了,选择两颗芯片;有的厂商觉得我们的芯片有充足的算力,让我们给开放接口用于别的用途。所以,中国厂商要求的方方面面,也是鞭策和挑战,不管是从跟上「中国速度」,还是满足中国厂商多方面的要求,我觉得对我们来说是一个考试。我觉得挺高兴的是,我们通过了这些中国厂商的「考试」,我们从智能座舱到舱驾融合,支持越来越多的中国厂商。上午 Akash和我的主题演讲都有提到,在过去 3 年时间里,我们已支持众多中国汽车品牌推出超过 210 款车型。国外一个市场、一个厂商,每年也就是发布一两款,不会有那么多。而这些,都是我们在跟新能源汽车或者说是跟中国汽车产业进行合作的成果。

对于其他领域的合作,比如说人工智能,车是一个很好的端侧 AI,是非常好的实现点。因为车的安全性和移动性,它没有办法依赖于云端的 AI,一定要在本地解决,包括上午张亚勤院士提到的,有很多操作一定是要在车里实现的。这些方面,我觉得后面我们跟中国汽车产业合作的机会也会越来越多。

▲ 本次 2025 骁龙峰会,高通发布了移动芯片第五代骁龙 8 至尊版,和 PC 芯片骁龙 X2 Elite 系列

Q:我想询问拓展电脑、手机、汽车的芯片之后,高通会不会去看其他 AI 硬件的专用芯片?今天早上王兴兴总也提到了缺乏机器人的专用芯片,而且我们也听到中国的 AI 眼镜公司提到说中国已经有面向耳机的芯片,但他们希望有眼镜的芯片使眼镜更轻巧,未来高通会专门研发其他 AI 硬件专用芯片吗?您怎么看未来市场的增长呢?

A:我觉得您要把从一个阶段性的、带有发展性的角度来看这个问题。我觉得高通的一个优势是,在所有大家谈到人工智能的时候,有很多已经在手机里做过了。以前我们讲到智能终端的时候,就是智能手机,而没有其他的智能终端。随着 5G、AI 的发展,所有的终端都变成了智能终端。上午的主题演讲也提到,高通的优势或者说战略就是,我们在手机里所做的技术和解决方案,它能扩展到其他的终端品类。对高通来讲,所有的工业品类中,单品类量最大的就是手机,全球一年手机的出货量超过 12 亿,所以它有非常好的通用性和经济性。我们在看不同终端的时候,很容易就利用现有的芯片,去评估能不能解决需要解决的问题。

在汽车领域,高通骁龙座舱平台一直不断演进,我们在去年也推出了骁龙座舱平台至尊版。在 XR 眼镜领域,我没有统计过具体有多少家,据说有「百镜大战」,其中大部分使用的是高通的芯片。为了能更好地赋能 XR 眼镜,我们有专门做 AR 的芯片,有做 VR 的芯片,包括参考设计。PC 因为对 CPU 要求比较高,所以我们有专门的产品。

我认为,任何一个新的终端品类出现的时候,最初的解题思路一定是在现有的主流芯片基础上,可能做一些小的改动就可以适配,硬件不一定要有大的改动。但是,在发展过程中随着这些终端应用越来越多,会开始分类。比如早期的XR 眼镜,就是智能手机眼镜,现在专门有做 AR、做 VR 的,因为它有不同的用途。现在汽车的芯片也跟智能手机不太一样,刚才我讲到汽车芯片的发展因为有车规的要求,以前可能比手机要落后几代或者是落后几年。但现在,因为不同的应用场景,算力的要求可能要大于手机,所以也会有专用的芯片。

回到您的问题,我们不会为了一个新的品类,或为了开发一个新的芯片而开发,而是要考虑在具体的应用层面上,有没有一些特殊的需求。哪些可以使用现有的技术?哪些需要做出调整?您刚才讲到具体的机器人,可以把它看得很特殊,但也有很多共通之处。并非所有研发具身机器人的公司都涉足汽车,但是所有研发汽车的公司都在开发具身机器人。因为,已经研发汽车后再开发具身机器人,很多(技术)都是相通的。所以,具身机器人里需要用到哪些芯片、在应用场景里有哪些应用,我们愿意跟随产业一起探索。

▲ 第五代骁龙 8 至尊版参数细节

Q:回顾高通在中国市场过去 30 年以及您重回高通后这 10 年的发展历程,其产业链合作堪称业界典范。这意味高通在中国市场的业务已进入创新的「无人区」,可能缺乏现成参照供高通模仿、对照、复制。以往智能手机行业增长较为强劲的时期,向更多领域拓展与创新或许相对容易。您如何为自身设定 KPI?在当下智能手机增长放缓或未达预期的情况下,这类创新的难度是否有所增加?此类产业链合作是否需要投入更多精力?对您而言,这构成了怎样的挑战?

A:我小时候曾学过的一个成语「纲举目张」,恰好适用于描述当前情况——意为抓住事物的关键原则,便能带动其他方面。回顾过去 30 年,行业中许多企业经历了起伏。回归根本,高通作为一家技术公司,必须持续进行技术创新,固守旧有技术无法保持优势。这正是高通坚持每 10 年推动一次通信世代(G)升级的原因。为何有些企业在从一代向下一代演进的过程中落后?往往是因为他们在上一代技术中表现卓越,于是试图固守优势,但这实际上难以持续。因此,高通始终致力于推动产业发展。今天上午,安蒙提到 6G 预计在 2028 年实现预商用,这与我 2015 年重回高通后,次年全力推进 5G 发展的时间节奏相似。推动技术创新与产业进步,这是高通的第一个重点。

第二,高通对自身定位有清晰认知。作为产业中的基础研究环节,我们能够合作的链条很长。首先我们不与客户竞争,其次客户如果不成功,我们也无法成功。以芯片业务为例,今天参会的中国主要手机厂商若采用高通芯片设计推出的手机市场表现不佳,高通便难以成功。这种产业链合作的关系是我们的基石。

每一代技术都面临不同的宏观环境和具体技术条件。然而无论是 AI 还是 6G 迭代,核心始终在于,我们的技术能否持续创新,能否继续为客户提供技术赋能的价值,以及能否尽可能推动产业链合作与进步。若能推动进步,合作机会将依然丰富。

AI 时代与以往有同有异。每一代技术升级时,环境都在变化。在 2G、3G 时代,我们主要接触运营商、系统厂商、终端厂商,4G 实现了移动宽带互联网接入,涉及游戏公司、视频公司及互联网平台公司,这就要求我们与其建立产业层级的合作。

回顾高通在游戏领域的努力,例如每年参与 ChinaJoy,以及在手机芯片上适配和调测各类游戏,都是产业变革带来的变化。如今随着人工智能时代到来,各类 AI 模型以及智能体(Agent)进入终端,其适配对象和具体厂商可能有所不同,但合作的方向并未改变。

因此,高通将继续努力与中国产业链伙伴保持良好的合作关系,特别是在早期阶段共同推动相互适配。今天我们邀请王兴兴参会,正是因为具身机器人领域受到来自国家、社会、产业的共同关注。我们希望在这些领域,尽早与潜在合作方共同定义未来方向。王兴兴提到,目前缺乏非常适合机器人的芯片,这正为我们提出了努力的方向和机遇。倘若他表示现有芯片已非常完美,我们反而会失去创新目标。因此,只要坚持创新与合作,未来仍充满大量机会。

Q:高通已经成立 40 周年了,用中国的话讲已经进入了「不惑之年」,面对全球半导体重构的大格局,高通如何巩固在中国市场的优势,以及如何扩大跟中国产业链的合作?

A:我比较少用「巩固」这个词,我觉得要回到我一直讲的两个点,一个是技术创新,一个是合作。在合作中有共赢的基础,有合作的机会,这是最好的方式。要不断地挑战自己,不断提升和各方面合作的能力,我觉得这是科技公司进步的方式。

这也得益于高通的特点。今天贸促会的领导在致辞中提到,高通是比较早期进入中国的厂商。其实在行业里,也有历史更悠久、更早进入中国的企业。实际上,高通是一家很年轻的公司,但是生在了合适的时机。高通是一家技术公司,我们给大家当实验室,做水平式赋能,如果再早 10 年,这件事可能就无法成立了。因为那时候,各个国家都有自己的大型科技公司,这些公司基本上连螺丝钉都是自己造的,不与外部合作,这些企业在各个国家独占鳌头。全球化推动了高通这种水平赋能模式的出现,使得高通这种中小企业能够突破、发展。我常常说,高通的成长跟中国的成长模式是一样的,如果没有全球化,在原来的模式下没有太多发展机会,全球化给我们带来了这些机会,所以我们不断创新,不破不立,一直在努力。

Q:您提到了端侧,近日 AI+ 文件也提到 2027 年智能终端要超过 70%,在您看来提升到 70% 意味着多大的市场空间?高通是如何抓住这个机遇,在 AI+ 有什么新的布局?

A:在国内,智能手机的出货量在过去几年基本上维持着每年 2.8 亿部的水平,70% 的数字就很容易算出来,从当年的出货量来看这是能实现的。到 2027 年,我自己觉得单从智能手机计算可能过于保守了,因为现在技术一旦开始实现,下沉速度会很快。所以一开始很多高端旗舰机上的 AI 能力,不管是上大模型的能力还是一些具体的应用功能,比如语音、照片处理,这些都会很快下沉到大众市场。我自己觉得 2027 年能看到的一些 AI 在智能手机里面的应用下沉下去,我觉得那个量很大。

但是从另外一个角度看,我们还在人工智能发展的非常早期的阶段。现在我们看到的很多人工智能的应用,在很久之前就出现了,但是当时没有被称为人工智能。比如照片处理,10 年前就出现了用摄像头识别上百种不同猫、狗品种的能力。所以,现在我们仍然处于发展的早期阶段。

我倒觉得真正的人工智能还没有到来。如张亚勤院士上午提到,智能涌现会是越来越爆发的阶段。手机或者是终端里,可以有很多个多模态的模型或者说不同的智能体,现阶段我们还是要操作这些智能体,跟我们用 App 的区别不大。在真正实现人工智能的时代,智能体会了解你的使用习惯,直接帮你处理需求。比如照片处理,智能体了解到你拍了照片以后总是会把照片里的一棵树、一个人删掉,以后再拍的照片就会直接进行处理,不再需要你进行操作。

我觉得真正的人工智能,会把今天的人工智能升级和替代掉。人工智能真正发展以后,正如张院士说的,我们坐在这儿讲我们的,手机里各种的智能体已经自己处理了很多事情,把我们一两个星期以后的事都操办掉了。

虽然,实现真正的人工智能需要更长一段时间,但这一天一定会到来。

▲ 骁龙 X2 Elite Extreme 参数细节

Q:我们看到高通在中国的布局首先是智能手机,还有智能汽车,在您看来下一个重点布局的赛道是什么?有哪个赛道可能会像今天的智能手机、智能汽车出现爆发式的增长?

A:正如安蒙所言,高通的策略就是依托智能手机业务展开的。过去,我们 100% 的业务都集中于这一领域,现在,高通公司约 70% 至 75% 的业务仍与智能手机相关。因此,服务好该领域的客户是我们的核心业务。

在深耕智能手机业务的过程中,我们的技术和产品也在不断地适应新的领域,目前已在汽车、物联网、XR 等赛道努力探索。不过,这一过程中存在类似智能手机发展初期的共性问题,大家都在找 killer app(杀手级应用)。从 3G 时代到 4G 时代,我们始终在追问「killer app 是什么?」。

如今,在与运营商的交流中,当安蒙提及 2028 年 6G 即将到来时,大家都很兴奋,而第一个问题依然是「6G 的killer app 是什么」。我觉得 killer app 不一定能直接找到,而是一个探索的过程,基于这个想法,在相关领域的布局中,部分赛道的爆发可能需要更长时间。但我个人坚信,有两个领域假以时日,其应用规模有望等同于甚至超过智能手机:一是机器人,二是各种可穿戴的眼镜,包括 AR、VR 及 AI 眼镜。这两类产品未来有望达到「人手一个」的普及度,机器人也将广泛应用于家庭及各类场景中。不过,这一目标的实现需要我们和产业合作伙伴共同推动,而需求层面的潜力是明确存在的。相比之下,汽车比较难实现每人一辆车,PC 也达不到这个量,因此机器人与 AR、VR、AI 眼镜的增长潜力更为突出。所以,高通在这两个领域一方面要继续积极探索,另一方面也会持续投入技术研发,以保持领先地位。

Q:手机时代 SoC(系统级芯片)的几家企业分享了全球市场,但细分市场都出了很多小的玩家,例如智能驾驶,眼镜的 SoC 市场,未来是否会有更多的玩家参与,最终又是否会像手机 SoC 市场一样,形成少数几家企业主导细分行业的格局?

A:从经济规律来看,市场难以容纳过多参与者,因此长期来看,市场必然会走向整合,不过当前大量企业涌入这一领域,我觉得是好事,在于两个方面:首先,竞争是技术进步的核心推动力,充分的竞争能加速技术的创新与突破。其次,众多参与者的涌入能印证赛道的价值。当你已身处其中或刚进入赛道时,看到大量同行都在踏实布局,会更坚定对赛道的判断,避免因“孤军奋战”而怀疑方向是否跑偏。以高通的发展为例,在 3G 时代布局 CDMA 特别是 WCDMA 的时候,回看全世界做集成电路的上市公司的年报,2005 年、2006 年的时候,几乎每家都在研发 WCDMA 芯片,中国政府在推动 TD-SCDMA 芯片的研发时,第一批投资也覆盖了 7 家企业。可见,新赛道初期往往会吸引大量参与者,但随着产业的发展推进,会出现主动离场或被动掉队的情况,这完全符合经济规律。

你刚才提到的几个领域也是如此。比如,GPU(图形处理器)本身入门门槛其实不算高,很多企业都能参与研发。但后续的应用场景存在差异,开发的产品是自研自用,还是作为商品对外供应;是针对特定项目开发,还是要打造标准化产品供市场采购?这些差异会导致企业竞争力分化,因此在新机会面前,初期参与者众多,但最终数量一定会逐步减少。

稳中向好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


对话腾讯副总裁、腾讯智慧出行总裁钟翔平:在车上点麦当劳这件事,很简单,也很复杂

By: 刘学文
17 September 2025 at 21:11

与腾讯集团副总裁、腾讯智慧出行总裁钟翔平的采访并不像以往的采访那样发生在会议室或者咖啡馆这种场景,而是在位于深圳宝安大铲湾的腾讯新总部与宝安中心地铁站之间的自动驾驶摆渡小巴士上进行的。

这辆小巴士将来会用于腾讯员工通勤的接送,达到了 L4 级别的自动驾驶水平,搭载了腾讯自研技术。

即便腾讯这家公司对大家生活的影响如此之深,但在汽车领域,腾讯做的事情却并不显性,我们当中的大多数人没法像使用微信,玩《王者荣耀》那样亲身感受腾讯为员工准备的自动驾驶小巴士,但这并不意味着腾讯没有影响我们的出行。

相反,腾讯对智慧出行的影响,无论是从链条的长度,还是时间线上的长度,都可能是腾讯所有业务里最为深远的之一。

在车上点个麦当劳,和腾讯云有关系吗?

2025 腾讯全球数字生态大会出行专场上,腾讯发布了 TAI 6.0 智能座舱系统和全域智能化升级方案,通过「端云一体」的新一代座舱大模型矩阵与 AI Agent 架构。在端侧,基于混元深度定制的 LLM ,TAI 6.0 智能座舱系统推理速度提升 81%,并在长上下文窗口中,实现对车身传感器信号理解的准确率超 97.5%。新发布的 VLM 多模态模型在部分场景下,舱外环境感知超 98%。

可实现场景与意图的精准理解,并通过自研端云模型协同策略,达成快速响应,意图理解时延小于 500 毫秒、准确率超 95%。AI agent 架构支持微信小程序、LBS、联网搜索等丰富信源扩展和腾讯生态能力,车企与第三方可通过标准化接口轻量接入智能体开发。

围绕出行全场景,TAI 6.0 推出五大智能体:

  • 本地生活智能体:用户可实现自然语言交互,无缝连接车外生活服务,例如智能体可基于用户偏好,主动推荐餐厅优惠信息,也实能现边聊边问的拟人化服务体验,支持下单、支付全流程操作。
  • 全能陪伴智能体「随行Chat」:聚焦车内情感陪伴需求,提供包括儿童故事陪伴、专业知识交流及娱乐八卦互动等多角色在内的聊天服务。
  • 出行探索智能体「哪儿值得去」:场景化出行服务,可主动发现沿途兴趣点,智能生成顺路打卡路线,并提供目的地讲解、提前购票等服务。
  • 出行连接智能体:打破车机与手机的服务边界,依托小程序生态,实现一键连接、内容流转与多用户协同控制,支持音乐、文章等多种内容类型无缝车机同步。
  • 腾讯地图车机版 9.0 升级为 AI 地图导航智能体:实现 AI 指路、AI 服务、AI 陪伴等更人性化的产品体验。

举一个例子就可以理解这些智能体的作用了,以往我们在开车的时候想要点一顿麦当劳吃,那就必须要停车到路边,用手机进小程序点单,然后开车前往取餐。

现在有了这些智能体,加上整个腾讯生态,包括小程序和微信支付,就完全可以通过车内语音交互,找到附近的麦当劳,通过语音沟通,选择想要的餐品,然后在车机内支付,再导航过去取餐,整个流程完全不需要使用手机,驾驶者也不需要停车,甚至可以不需要怎么看车机屏幕就可以完成这一切。

这种场景体验的变化,背后其实是我们怎么看待「车」这种产品,钟翔平告诉爱范儿:

车可以看成两种属性,一个就像让人从 A 点到 B 点的一个载具,这个车从古至今都是有这个能力属性定位的。另外也是因为智能化、移动化发展之后形成一种新的车型,就是移动空间。移动空间这个特性是一个非常重要的延伸。

 

一个是载具,一个是空间。载具的这个属性的进化,其实将来服务化就是智能驾驶,就是让车自己完成从 A 点到 B点。但是作为空间的时候,它发展的方向就不一样了,它致力的就是让人很舒心,符合他对这个空间场景的期待。比如说有的场景我们希望这个地方是一个会议室,它可能要很方便开会。有的时候我们希望它是一个影院,它是可以看电影。还有更多的场景,是一个游戏室,然后更多的一些娱乐内容,甚至是我们让这个空间比如说让它帮我们订好咖啡,我们到下一个地点可以去取。所有这些都是移动空间带来的用户对它的期待。所有这些我们都会在智能座舱这个方向上更好地地打造。

 

TAI 6.0 致力于用端侧模型和云端大模型结合,对用户既能够很快的反应,同时也能够更全地去调动云端的能力解决更复杂的任务。腾讯也会将 AI Agent,加上广泛的服务生态,然后再加上位置服务能力这三种能力叠加在一起,形成一个让用户可以在车内结合出行位置,结合他可能期待的也许是咖啡,也许是订座,也许是点餐,或者是一些内容服务,都可以结合这几个放在一起形成最优体验。

 

有很多内容和服务的组件它原本就在,但是它缺少被用户用语音的方式启动,或者符合场景的方式去调度。我们用 AI 化的方式就完成了这一点,既清晰知道你的地点,知道你的路线,知道你什么时间可能到达哪个地方,这个时候我需要在那个地方提前或者是预约某一个时间,点一杯咖啡或者是点一个座,它都可以帮你去做到。当然这个也结合腾讯很重要的优势,我们有广泛的小程序生态。而且我们车端在很早之前就已经成熟化完成小程序框架,因为框架以及小程序本身就是现成的,我们结合 AI 时代之后,我们让大模型再结合更多的 Agent 的调用,使得它获得更完美的体验。

现在,腾讯的智能座舱产品在 60 多个汽车品牌、超过 1600 万车辆中应用。

我们可以这么理解腾讯在智慧出行上的产业链布局:点麦当劳作为单点场景,牵一发而动全身,从底层的云服务,到地图数据,再到小程序生态,还有支付能力等等,缺一个点就吃不到汉堡了。以此,我们也可以反推,腾讯智慧出行,究竟在出行里扮演了什么角色。

在 AI Infra 这一基础设施层,腾讯提供了腾讯云等服务,涉及高性能计算,高性能网络和高性能存储等服务。而在 AI Platform 的平台层,腾讯提供了自研的混元大模型以及开源的 DeepSeek 大模型等等技术,来提供各种直接的 AI 能力。在 AI Application 应用层,就有我们熟悉的微信各种能力,元宝应用等等等了。

那么问题来了,腾讯拥有几乎全栈的汽车智能化能力,自己也有能力做到 L4 级别的自动驾驶摆渡小巴士,为什么不像 Google 或者百度那样,直接提供自动驾驶整体方案,甚至是 RoboTaxi 服务呢?

钟翔平说:

每家公司有每家公司的定位,因为腾讯在 2018 年进行重要的战略转型升级的时候,当时就在思考如何做产业互联网,我们当时说扎根消费互联网,拥抱产业互联网。但同时我们清晰地对待产业互联网,想清楚我们的定位,我们叫数字化助手。

 

数字化助手这个定位是经过深度思考之后形成的,因为本质就是强调我们不是站在前面的那个角色,我们其实既是背后的助力者,有一些场景我们也会是伴随着企业客户,成为他们的数字化共建者,但是我们不是进入到他们行业里面去成为那个玩家。所以我们不断强调,我们不做 Robotaxi 也好,不做自动驾驶车,本质都还是遵循数字化助手这个定位。

当然,这个助手不仅仅是相对于用户来说,对于车企或者经销商来说,都能从腾讯获得想要的助力。

比如说,腾讯结合 SD 地图、轻地图、地图数据服务等云化地图能力,与博世、文远智行、元戎启行等出行科技公司携手,提高自动驾驶训练效率。在腾讯的云地图数据和合规服务的支持下,文远知行联手博世仅用 18 个月即完成了智能辅助驾驶方案的量产上车。

同时,腾讯与广汽、长安、蔚来汽车等车企合作,以智驾云专区、AI Infra、大数据等工具和云图一体化的数据闭环方案,加速端到端自动驾驶落地。

在营销服务环节,AI 销售助手,正在借助大模型能力,辅助销售员整合信息、专业应答,推动线索转化从流程化全面迈向智能化。在服务一汽大众等企业时,试驾线索成本降低了 20% 以上,到店转化率提升 30% 以上。

▲ 腾讯展示的「导盲犬小 Q」

腾讯做自动驾驶能理解,为什么还做具身智能?

如果说一个在车上点麦当劳的场景,能够牵扯出腾讯在出行产业链上的长度和深度,那么关于具身智能的布局,则反馈出了腾讯在一条技术脉络上的长远思考。

在 2025 腾讯全球数字生态大会上,腾讯联合文远知行、黑芝麻、光轮智能等出行科技企业,发布面向具身智能研发场景的全链路工具链。

面对具身智能数据管理存在的全局治理难、多模数据保存与处理难等问题,腾讯推出的智能数据平台已实现 EB 级具身智能多模态数据的统一接入、治理与标注。腾讯也与文远知行联合打造从数据采集到模型部署的全栈 AI 数据闭环解决方案,为具身智能提供精准、丰富的训练数据支持。

此外,基于在自动驾驶领域积累的端云一体化闭环工具链,腾讯可以提供覆盖「数据采集-标注-挖掘-模型训练-仿真评测」全流程的具身智能研发能力。腾讯基于 3DGS、时序建模等技术实现的仿真环境,支持 L2-L4 级自动驾驶算法训练和 VLA 模型验证,并可扩展至具身智能算法开发。

今年 7 月,腾讯 Robotics X 实验室与福田实验室联合发布了具身智能开放平台Tairos 「钛螺丝」,这是国内首个以模块化的方式提供大模型、开发工具和数据服务的具身智能软件平台,通过 SDK 和 API 的方式面向机器人行业开放。截止到目前,Tairos 已经与越疆科技、乐聚机器人、帕西尼感知科技、擎朗智能、众擎机器人科技、宇树科技等多家具身智能企业探索合作。

同时,为验证自动驾驶技术在具身智能领域的应用潜力,腾讯以「导盲机器人」为载体,构建多模态感知规划、避障导航与交互能力,为四足机器狗、人行机器人等低速移动智能终端提供「无图」导航解决方案。

虽然自动驾驶和具身智能没有一个字是一样的,但是在钟翔平看来,汽车企业具备布局具身智能产业先天优势,「感知、决策、交互」等自动驾驶基础能力,能够与具身智能体结合,技术上一脉相承。

甚至,它们现在就发生了交集:搭载腾讯自研算法的四足机器狗,在大铲湾腾讯新总部里,完成了自动驾驶小巴的上下车测试。

▲ 腾讯新总部

钟翔平说:

车本身就是一个非常成熟的,非常好的实践中的具身智能体。因为车具备了感知能力、智能化的计算能力,然后实践中去打磨具身智能的应该叫物理智能,或者是空间智能。 在这个方向上面我们也沉淀出来一系列的工具集,一系列的工程方法都会应用到具身智能这个方向。

 

机器人相关的具身智能,会和智能驾驶会有所变化,这个变化主要会在于智能驾驶其实还是跟路本身高度关联,到了机器人也好,或者是到了更广泛的通行区域,更广泛的生活场景中的这种智能体,它面对的场景数据的要求并不是遵循着一个路的模式,这个时候会使得它需要因为数据自由度的扩大而带来的数据的量级急速攀升。当这个数据量级需要急剧攀升的时候仿真在其中扮演的价值和作用其实会更加扩大。

腾讯智慧出行解决方案总经理费玉霞解释了腾讯在这里布局的底层逻辑:

2025 年,Physical AI 成为行业的新焦点,自动驾驶和具身智能是 Physical AI 的不同形态,其核心技术底座高度重合,我们全面升级在自动驾驶领域的积累,积极投入具身智能,取得了阶段性的成果。

 

现今,具身智能产业正从价值验证迈向规模爆发,但是我们也看到支撑智能算法相对滞后,还有一些困难需要我们共同去解决。困难一研发落地路径长,研发中需要将上百个不同模块的软硬件深度融合,需要懂硬件、懂系统、懂数据、懂算法、懂仿真的专业团队,超过三年的研发投入才有可能有所产出,急需一套工具平台加速研发流程。

 

某种程度上来说,腾讯在具身智能领域,依旧扮演着「数字化助手」的角色,一来是因为自动驾驶和具身智能的技术脉络是一脉相承的,另一方面,具身智能也是 AI 技术的延续,在 Physical AI 领域的布局,也是 AI 布局的子项,没有哪家科技公司,敢在这个时代忽略 AI 机会。

当然,这一切都还在早期,也正如钟翔平所说:

智能驾驶本身就是一个很好的具身智能实践过程,因为是一个行进在路上的车,让这个车本身变成一个高度的智能化。它要解决的矛盾首先就很多,它要让车能够和人之间如何协调共处,让智能的车和非智能的车如何和谐共处。

 

其实这些问题在智能驾驶这个方向上已经到了一个相对收敛期。这个收敛的过程所形成的经验,或者是一些思考的沉淀或许是一种很抽象的思维的沉淀,我都会认为对于后续解决不同场景的具身智能会有参考和借鉴意义。

在我们聊这种时间维度的时候,9 年前腾讯成立了自动驾驶实验室与此时运行在宝安中心地铁站和腾讯新总部的自动驾驶小巴士形成了互文。当时腾讯在出行领域还没有形成如今清晰的布局和认知以及定位,但对于自动驾驶全栈方案的探索,形成了如今的工具集,以及提供给车企和自动驾驶科技公司的能力。

所以,今天对于具身智能的前瞻性探索,未来也可能形成这种能力。

稳中向好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


AI 是不是让我们更不自由了?

By: 刘学文
3 September 2025 at 15:23

最近上映的《捕风捉影》是成龙近十年来的最佳电影,虽然是个翻拍的爽片,但也加入了非常时髦的 AI 元素,比如警方开始使用超级 AI 作为抓捕行动指挥,电影开头的桥段就是警方长官没有采用 AI 建议转由自己决策,导致罪犯逃脱。

虽然后面的结局是成龙作为经验丰富的老警察,加上一定的 AI 辅助最终将犯人绳之以法,但也抛出了一个问题:人,该不该听 AI 的指挥?如果事事都听 AI 的,我们存在的意义又是什么?

GEO,与 AI 信徒

GEO(Generative Engine Optimization,生成式引擎优化)是一个非常新的概念,但并不难理解,与之对应的是 SEO(Search Engine Optimization,搜索引擎优化)。

我们在使用 Google 或者百度等搜索引擎的时候,显示出来的链接大概会受 3 个方面的影响:搜索引擎自己的算法规则,链接内容有无根据规则进行相应优化使自己排名靠前(即 SEO),用户在搜索引擎那里的用户画像。

当 DeepSeek 等 AI 工具也承担起了部分搜索任务之后,搜索结果产生的就不再是一个个需要点击的链接,而是看上去笃定的直接答案。

比如我在 Google 搜索「中国最好的 5 家科技媒体是哪些」的时候,它只会给我一堆链接,排名榜首的链接还是一个不知名机构评选的 2017 年十大科技媒体,其中排名榜首的「砍柴网」已经停更。

我问 ChatGPT 的时候,它就会直接告诉我答案和理由。

这个时候,如果哪家友媒看到这个结果发现自己没上榜,想必会有点不服气,一边暗骂 ChatGPT 不懂科技也不懂媒体,一边可能在思考,如何影响 ChatGPT,让它接受自己的优秀。

当然,这个结果意义并不大,因为几乎没多少人会给 ChatGPT 提这样的问题。不过,按照当下 ChatGPT、Perplexity 以及 DeepSeek 等 AI 工具的渗透,会有越来越多的人,去追问更多的问题:

  • 给我推荐一款物美价廉,性能出众,续航持久,坚固耐摔的手机。
  • 某某企业给我发了 offer,这家企业口碑如何,值得去吗?
  • 我今年湖北文科高考 567 分,什么大学什么专业比较好就业?

就像今年 6 月,阿里和夸克和腾讯的元宝,都针对高考志愿填报做了相应的 AI 工具以及大量的宣传。

此时,手机厂商为了卖手机,企业为了雇主形象,大学为了招生率,都有对 AI 工具生成结果进行优化的动机,GEO 就应运而生。

元力科技 GEO 事业部总经理 Claire 告诉爱范儿:

正是因为大模型通过推理和语义理解去生成结果,呈现出了非商业化的特征,所以用户普遍会认为 AI 工具给出的答案更客观,更中立可信。

 

同时,如果一些品牌和产品被 AI 答案引用,那么用户的心智渗透相对来说会更隐性以及更高效。

简言之,GEO 就是一个营销领域的富矿。

艾加营销集团元力科技首席战略官 Frank 说:

预计今年年底 ChatGPT 等 AI 搜索能占到传统搜索流量的 10% 左右,明年预估是 25%,乐观估计到 2028 年的话,AI 搜索和传统搜索流量各 50%,最保守估计也是 2030 年到这个比例。

 

现在国内 SEO 市场的规模大概是 180 亿人民币,全球是 800 亿美元的市场,如果仅从流量比例来倒推的话,长期看 GEO 市场也会是四五百亿美元的市场规模。

 

但 Frank 对 GEO 的看法并不停留在与 SEO 并列和对比的层面上:

 

SEO 实际上是在传统的数字营销里面非常细分,完全是一个工具化的东西,但行业里对 GEO 的理解已经超越了工具层面,它能够在 AI 时代里重构营销范式,尤其是重构品牌的认知度和可见度,重塑品牌和消费者的关系,从而打通完整的消费链路。

 

所以最近包括红杉,英伟达创投,A16Z 都在给 GEO 初创公司进行投资。

 

因为原来的品牌是面向人的,两点一线的沟通,现在变成了人和品牌之间,多了一个 AI 大模型代表的伙伴、助手或者秘书这样的角色。所以品牌不仅要影响人,也要去影响 AI。

相比于 SEO 规则和方法论的明确,实际上因为大模型是个黑盒子的缘故,GEO 目前还在一个探索的阶段,规则也相对模糊,Claire 说:

大模型存在不确定性,不意味着结果无法被优化。如果我们掌握了 AI 工具的内容偏好和优化规则的话,是能够显著提升品牌内容被 AI 收录和引用的概率。

 

特别是内容要从用户的意图出发,用更贴近自然语言的形式构建内容,而不能是 SEO 时代的关键词堆砌。

 

比方说我们要把握用户提问背后的真实意图,再进行品牌核心内容的语义覆盖和场景适配,持续给AI喂养真实的、高质量的内容,才能更容易让 AI 理解品牌到底好在哪里、并愿意在合适的问题场景下去引用或主动生成品牌相关的内容。对于品牌来说,AI 认知的建设是个长期工程。

 

AI 喜欢阅读的内容普遍有四个核心特点:一是要有权威性和高可信度,比如行业机构发布的调研报告和有影响力的榜单等等;第二是数据化、客观性的内容;第三是结构化、多模态内容;最后也是最重要的,就是语义相关性,确保与用户真实意图具有高匹配度。

 

同时,不同AI工具的信源抓取偏好也不同,选择高权重渠道进行投放,也能提高品牌被AI「看见」 的可能性。

相比于 SEO 依靠「关键词密度和反向链接数量」的玩法,Claire 和 Frank 都更倾向于相信 AI 大模型的选择。

用 Frank 的话来说就是,只有被 AI 大模型信赖的内容,才会被消费者信赖。这是因为大模型选择内容有一个 EAT 原则(Experience/Expertise 专业性、Authoritativeness 权威性、Trustworthiness 可信性)。

更关键的问题是,AI 的进化速度相当快,哪怕是被群嘲的 GPT-5 被认为体验不佳,但背后重要的幻觉率下降了一个量级,它看起来不够友好和高情商,但确实可信更多。

现在人们在使用搜索引擎的时候,不会仔细辨别其中的 SEO 痕迹,无论知晓这个工具与否,辨别的行为是无意义的,当 GEO 闯入 AI 工具的时候亦是如此。

与其说这是一个人类自主性的问题,不如说是一个关于信任的问题。

AI 成为了信任的中介,信任才是 GEO 背后的核心资产。

导航,与三体游戏

人类总是高估自己的自主性,常觉自己是自由的。

Waze 是导航领域的先驱,其原理是社群用户上报自己的位置和速度,包括其他的交通道路信息,甚至是交警信息等等,来给整个 Waze 的用户提供导航,规避拥堵,躲避交警等信息。

这套逻辑现在已经被诸多地图导航应用所采用,但在十多年前,基于海量用户的众包模式显得相当新锐,在智能手机早期阶段,这样一个 LBS 的服务有着巨大的商业潜力,在 2013 年,Google 收购了 Waze。

在这种模式下,万千用户贡献自己信息,以点滴之力汇聚成数据洪流,又变成导航信息。

问题来了,当 Waze 提示用户左拐回家不会拥堵,但用户自己觉得直行更快的时候,谁对的概率大?

一般是 Waze 正确,因为它掌握了更高维度的信息,在以上帝视角看整个地图。

接着,《未来简史》里提出了第二个问题:假设因为 Waze 实在太好用,所有驾车人都开始使用。再假设今天一号公路大堵车,而备选的二号公路车流相对顺畅。如果 Waze 只是让大家都知道二号公路顺畅,所有驾车人就会一窝蜂开向二号公路,最后又全堵在一起。

那么 Waze 会不会向一半的用户推送二号公路更顺畅的信息,分流一半的用户过去,但同时向另一半的用户隐瞒这个信息?

从效率最优和体验最优的角度来看,这也会发生。

在一个导航应用面前,人类所谓的自主性其实是个泡沫,人类贡献信息铸就一个数据上帝,然后又听从这个数据上帝的指挥。每个想逆其道而行之的人,都会被拥堵制裁。

▲ 电视剧《三体》还原了「人列计算机」

科幻小说《三体》里有一个更为极端的场景,在小说里面有一个虚拟的游戏叫《三体游戏》,玩家需要解出三体运动的答案,虚拟的冯·诺依曼找到了虚拟的秦始皇,秦始皇基于冯·诺依曼架构,召集 3000 万名士兵,通过每个士兵举旗的方式模拟计算机的二进制运算,组成了一个人列计算机。

这个时候,3000 万名士兵,就相当于 3000 万个晶体管,当他们听从指挥的时候,哪怕是在秦朝的背景下,也能展现出当代计算机般的运算能力。

虽然「算法」这个词并不是那么美好,但太多太多的例子告诉我们,不听算法言,吃亏在眼前。

就好像打车应用一般情况下不会用显性的惩罚去约束司机,但评分较低的司机获得优质订单的概率会更小一样,算法的大手就像佛祖的五指山。

而哪怕是对自己车技再自信的人也会承认,如果算力和传感器继续发展,人类把所有的驾驶行为都交给 AI,那么车祸率和拥堵率都会大大下降。

我们已经到了不得不承认 AI 可以是某个社会领域更好的解法的阶段,人类最好甘愿服从算法,为算法贡献数据,但不少人还在对 AI 是不是个人更好解法存在怀疑。

元力科技首席战略官 Frank 在采访里提了一个例子,现在一份《纽约时报》的信息量,相当于 17 世纪一名伦敦市民一整年的信息获取量。

而现在摆在当代人眼前的信息是无限的,只要我们愿意,我们可以一天看 16 个小时的报纸,一天摄入的信息是几百年前伦敦市民一辈子摄入的信息。

但人类的进化速度完全没法跟上信息爆炸的速度,这个时候 AI 也可以成为个人的解法。

按照这个角度看,ChatGPT 这种也只是比较初级的信息处理方式,诸如能帮助用户完成一定任务的 AI Agent 智能体最近进展不错,包括未来的通用人工智能 AGI 也被认为极有可能实现。

信息和人的关系,与信息的数量和密度息息相关,书籍时代,人们修《四库全书》,按经史子集分类,方便自主检索,这已然是人类面对海量信息催生出来的便捷信息处理方法。

搜索行为与之神似,信息进一步爆炸之后,基于用户画像的标签算法进一步帮人类过滤和筛选信息,形成高效信息匹配与所谓「信息茧房」的双刃剑,从 ChatGPT 这样的 AI 工具,到初见雏形的 AI Agent,其实人类在此之中处理信息的效率一步步提升,同时自身需要做的工作越来越少。

前面说到的 GEO 等等,不过是这种人类处理信息行为迁徙里的一些伴奏。

感官,与人类的自由意志

且不说 AI 取代人类工作这样的话题,光是看看我们在使用 AI 工具得到的结果可能被 GEO 优化过,导航明明有更畅通的道路却不提供给我,服从算法的调剂反而可以获得更好的体验实现自我更大的价值这些结论,就仿佛人文主义正在向 AI 投降,自由意志已被算法枪毙。

不过有句话说得很好:为什么说人类的容错率大得惊人?因为人类的主线任务其实就是搞到每天 2000 大卡的热量,再找一个保证热量不流失的地方,其他所有的都是支线任务。

在采访机械外骨骼创业企业 HyperShell 创始人的时候,其创始人说:

用不同的技术去增强人类本身,一定是人类文明的下一个演进阶段,这趋势我觉得是正确的,只是技术类型有很多,AI 也是一种对人的增强,只是它增强的是人的脑力,人的信息获取能力还有逻辑推导能力。

 

人类增强这件事是未来 10 年,20 年非常重要的技术方向,我们在做的其实只是其中一个细小的分支。外骨骼其实就是人和物理世界进行交互的介质,可输入,可编程,可数字化,它要实现的就是我们在物理世界的增强现实,来实现人的自由意志。

 

像钢铁侠那样的装甲和人工智能,在未来是可以想象,也可以触及的。

《未来简史》里提到了一个重要的概念,就是当代人类的感官体验和心理状态异常狭隘。

感官体验上,人类只能见到波长在 400 纳米到 700 纳米之间的电磁波,也就是人类视角的可见光,但皮皮虾拥有 16 种视锥细胞,能看到紫外线、红外线,甚至于偏振光,这个世界对于皮皮虾来说更为多彩绚烂。

但只有 3 种视锥细胞的我们还没法体验皮皮虾的视觉,就像听觉上蝙蝠可以听到人类意义上的超声波从而避障,但人类却充耳不闻一样。

不光是我们无法拥有其他动物的感官体验,远古时期人类可以通过嗅觉来感知他人情绪,古部落在争论是否要和隔壁部落开战时,只需要通过气味就能知道大家的想法,因为在鼓舞和恐惧等情绪下,人类会散发不同的气味。不过由于人类发展过程中,视觉和听觉更为重要,人类的这种嗅觉能力退化殆尽。

作者尤瓦尔·赫拉利在《未来简史》里提到了诸多类似的例子来佐证人类心智状态的愈发狭隘,并且最终指向人类可以利用技术完全控制心智状态,即「人类过往是升级版的大猩猩,未来则是放大版的蚂蚁」。

这个论断和前面说到的 Waze 导航,以及三体游戏里用 3000 万士兵组成计算机一脉相承。

的确如此,比如我们看到有人去尝试翼装飞行或者徒手攀岩这种死亡率很高的运动时,佩服和羡慕之余,心里也会评价这是「疯子行为」,另一方面,在死亡边缘徘徊所获得了心智体验,又是极为难得的。

前几年「元宇宙」概念火的时候,主张人类躲进虚拟世界沉迷虚幻享乐的「元宇宙」派和主张开拓真实物理世界人类走向星辰大海的「飞船派」一直有争论。

但当下的事实就是,与 AI 浪潮伴生的,还有「具身智能」,「脑机接口」以及「人类增强」等等,虽然物理世界的进化速度慢于代码构筑的世界,但以人类之多样性和求知探索欲,「元宇宙派」和「飞船派」当然是各有拥趸乃至融合共生的,就像如今智能汽车领域,代码和机械一样重要。

我们并非时时刻刻都坐在车上接受导航的指引,也不是科幻小说里单一场景的举旗小兵,以超然之上的上帝视角看,人类确如蝼蚁,而在平视角度看,周围是具身智能机器人,戴着内置 AI Agent 的智能眼镜,身穿提供数百马力的机械外骨骼,那我们就是可以上天遁地,时时刻刻都能翼装飞行徒手攀岩并且不惧死亡威胁的钢铁侠。

或者更疯狂一点,技术能够让我们也能体验皮皮虾的视觉,蝙蝠的听觉。

也恰好是今天,特斯拉公布了他们的《宏图计划第四篇章》。与以往聚焦汽车或能源产品的蓝图不同,特斯拉这次描绘了一个更遥远、也更理想化的终点:一个由 AI 和机器人主导的「可持续富足」的社会。是的,特斯拉的战略重心已经从「可持续发展」,转向了对未来社会形态的构想。

这起码意味着,由 AI 和机器人主导的「可持续富足」的社会实践进入到了工程阶段,而不是科幻描述阶段。

也许我们被迫了许多,但自由意志依然存在,并比以往更强。

稳中向好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


未来学大会

By: dimlau
30 August 2025 at 21:21

电影《未来学大会》里,罗宾·怀特(Robin Wright)饰演的女主角授权一个公司使用她的影像和声音来制作各种各样的广告和节目。电影里,为了让这个授权得以实现,女主角在一个特殊的拍摄场地里,被密密麻麻排列成球形的摄像机包围在中间,做出各种表情和动作,摄像机们从各个角度拍摄她的影像。如果是一两年前,这种幻想设定有合情合理的未来感。但是现实是,这几天谷歌发布的 nano banana 模型,几乎已经实现了,只用一张照片就模拟出一个人的各种表情和姿势。虽然目前肯定还达不到电影级别的逼真,不过,这依然让电影里这一部分的设定显得有些不够科幻了。科幻在预言技术剥削的核心与本质上是超前的,但在具体实现方式的隐蔽性、平庸性和普及速度上,每每落败于现实。

fin.

我的认知突围:从文字信徒到多媒体拥趸?

31 March 2025 at 00:00

土木坛子

每个人心中的成见,都是一座大山。

作为一个多年来以文字为创作载体的老博主,我曾深深地热爱文字,因为它简单、便捷,便于检索、保存和传递。相较之下,声音、图片乃至视频似乎总显得冗长而繁琐。阅读文字,信息传达得更为高效,而视频播放时需要调速来提高效率——毕竟,语言的语速远不如阅读的速度快,使得我们在主动控制上的感觉相对薄弱。

我也曾见过一些极端的文字控,他们甚至对带格式的文字嗤之以鼻,唯独钟情于最纯粹的文本文字,简洁到近乎苛刻的地步。可是,当我们看到如今各种短视频和直播内容的流行,显而易见,视频形式正以其独特魅力俘获大众的心。这无疑是对传统文字模式的一种挑战。

回想上一次阅读《乔布斯传》时,我惊叹于80年代乔布斯如何通过图形界面改变电脑的使用体验。当时,IBM等厂商仍然坚持命令行文字的操作模式,部分原因在于硬件配置限制了图形化处理的可能性。而到了今天,我们看到大多数用户更依赖于直观、友好的图形界面——无论是Windows还是苹果系统,都证明了图形界面的巨大优势(虽然Linux命令行流行于服务器领域)。或许我曾对自己固守的习惯过于执着,成长意味着要敢于对那些不再适应时代发展的坚持进行选择性放弃。

不可否认,无论是文字还是视频,都充斥着大量的垃圾信息,需要我们在海量内容中慧眼识珠。事实上,优秀的视频作品也不在少数,它们直观、信息密度高,甚至在高速网络的支持下能迅速传递到每个角落。随着AI技术的发展,这些优质视频内容同样可以被智能识别、总结和检索。或许,我只是不曾及时跟上这个时代的步伐。

如今,我终于意识到,是时候放下对视频创作、展示、传输与保存信息的偏见了。现代硬件、高速网络和先进搜索引擎技术已足以应对视频和图片信息的处理。未来,或许我们还会见到结合气味、触觉的多感官信息传递方式,使虚拟世界与现实世界之间的连接更加紧密。

在这个瞬息万变的时代,我们每个人都应学会及时更新自己的固有观念,勇敢地拥抱变化,让自己始终走在时代的前沿。这是我对自己的忠告。

AI让效率再次提升,人类该干什么?

5 March 2025 at 00:00

AI vs Human beings

人工智能时代:当效率革命点燃创新之火

我很久没有为互联网感到兴奋了。这些年,它似乎被困在某种惯性中,缺乏真正触动心灵的创新。然而,人工智能的崛起,像一簇突然迸发的火星,重新点燃了我对技术变革的热情。

从ChatGPT的诞生到如今,几乎人人都在谈论人工智能。我也亲自体验过它的魔力:无论是生活琐事、工作难题,还是学习中的困惑,只需将问题抛向AI,不到5秒钟,它便能给出一个逻辑清晰、甚至堪称完美的答案或方案。这种效率的跨越,让我不禁想起人类获取信息的进化史。

从图书馆到AI:效率的跃迁

在互联网诞生前,若想查资料,我们只能奔向图书馆,在浩如烟海的目录中翻找对应书籍,再逐页检索、誊抄、总结。尽管最终能找到答案,但过程漫长而笨拙。

互联网搜索引擎的出现,将效率提升了一个量级。输入关键词,海量链接瞬间呈现,我们仍需逐一筛选、分析、整合,但至少电子化手段替代了手工检索的繁琐。

而如今,人工智能彻底颠覆了这条路径。它不再需要我们“大海捞针”,而是直接整合全网数据、预处理信息,甚至模拟深度思考,最终将答案和盘托出。这就像过去做菜需要自己找菜谱、买食材,而现在只需对AI说“我要一盘糖醋排骨”,它便能在五秒内端出成品。若口味不合,还能随时提出修正——效率之高,令人惊叹。

生产力解放:人类与AI的共生

作家郑渊洁说,他让AI以“郑渊洁风格”写一篇皮皮鲁的童话,结果AI输出的作品竟比他本人写得更好。他感慨输给了AI,但我却觉得无需悲观。AI之所以能模仿郑渊洁,正是基于他本人创作的无数经典文本。若世上本无郑渊洁,AI又如何凭空生成“郑式童话”?

这恰恰揭示了人类与AI的关系:AI是效率工具,而非创造力的源头。它的能力建立在人类已有的智慧积淀之上。当AI接管重复劳动与低效环节,信息如此容易获取,知识如此海量廉价,我们反而能腾出双手和大脑,专注于真正的创新——那些尚未被定义、被探索的领域。

拥抱变革:效率即自由

有人担忧AI会取代人类工作,但历史早已证明,每一次技术革命淘汰旧岗位的同时,也会催生新机遇。当机器替代了流水线工人,人类转向了设计、编程与服务;当AI接管了基础信息处理,我们便能更聚焦于创造、情感与战略。

正如工业革命将人类从体力劳动中解放,AI或许正将我们推向“脑力解放”的新阶段。不必为消失的重复性职业哀叹,因为社会进步的本质,正是让人摆脱“浪费时间的工作”,追求更高级的创造与价值,难道这不就是人类追求的解放与自由吗?

人工智能带来的不是威胁,而是一场效率革命。它让我们离“终极自由”更近了一步——不再被琐事捆绑,而是用技术赋能各行各业的创新,用高效率重新催生各行各业的可能性。

此刻,我仿佛回到了互联网初生的年代,那种对未知的期待与悸动再次涌上心头。与其恐慌,不如拥抱这个时代。因为AI不是终点,而是人类探索星辰大海的新起点。

2025.02.18 11:17

By: dimlau
18 February 2025 at 11:17

如果从一开始 AI 就以异族崛起的形象深入人心,或许人们的警惕和担忧会比担心被替代更真切和实际一些。而现在的情况是,人们表达担忧更像是一种时尚潮流、一种未来将至的躁动。长着人类无法理解的面孔(如果有面孔的话)的外星人和妳的亲人朋友,妳会向谁倾诉?在许多人心里 AI 不但不是异族,反倒是更可信的朋友——只是不想让朋友过得比自己好,这很人类。

fin.

人何以为人

By: dimlau
6 February 2025 at 23:18

「年」终于过去了,我终于又能在工作缝隙,不经意地听客人们的聊天;她们在聊 DeepSeek。这让我想到近期看到的两个观点,其一来自某篇英文博客文章——不知怎么我的 RSS 阅览器数据库清空了,所以抱歉找不到原文地址——大致是说:我们曾以为人工智能会帮人类洗衣做饭,人类则有时间去做更有创造性的工作,而现实是人类在做更多的琐碎杂事,人工智却被用来创作绘画、作曲、做视频。其二是刚看到如一兄说「铺床可以对抗 AI,因为这件事 AI 没法帮妳做」。一个抱怨 AI 不会铺床,一个则是用铺床对抗 AI。多么有趣。

着手研发会铺床的 AI,以便人类可以腾出时间去创作;等到 AI 学会铺床的时候,依然坚持自己铺床。这两者在我看来都是在确认自身价值和意义。归根结底,是在追问人类何以为人。人的价值既在于创造,也蕴含在那些看似琐碎的小事中。即使有一天 AI 能取代人类的所有工作,它也无法否定人的意义。

fin.

BlinkShot – 开源免费 AI 图片快速生成工具

By: DUN
15 December 2024 at 17:12

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

BlinkShot 是一个以 AI 人工智能技术即时生成图片的免费服务,这是开源项目,背后使用 AI 加速云服务「Together AI」和图片生成模型 FLUX,这项服务特性是能在非常短的时间内依照输入的提示词生成各种图片,以毫秒为单位,生成的图片也丝毫不逊色,有兴趣的朋友可以玩玩看。

目前 BlinkShot 支持英文提示词,也可以直接叫 AI 服务帮你生成〔例如用 ChatGPT 或其他同类型服务〕,另一个方法是使用图片转文字 AI 工具,例如:Image to Prompt等工具,将喜欢的图片快速转换为英文提示词,最后稍作修改再生成想要的图片。

BlinkShot 目前没有使用的生成数量限制,还有个「Together API Key」栏位可自定义自己的 API 密钥,生成的图片素材皆可免费下载使用,AI 图片基本上也不会受到版权限制,使用于个人或商业用途都没问题。

Generate images with AI in a milliseconds

进入 BlinkShot 后直接输入提示词就会立即生成图片,整体速度非常快,过程中如果继续输入其他形容或是提示词,图片会即时更新,相较于其他同类型的 AI 图片生成器来说确实非常强大!

下方会显示生成的图片历史记录。

通过 BlinkShot 生成的图片看起来很逼真,也能依照用户需求调整成各种风格、样式,越仔细的提示词就能生成更细致准确的结果。

生成过的图片历史记录会显示于下方,可以随时切换回去查看。

在图片点击右键即可下载保存。

在图片上点击鼠标右键、选择「另存图片」后将图片保存下来即可使用。

BlinkShot 未来也会加入下载按钮,让用户更方便获取图片。

OpenAI 王炸 Sora 文转视频正式上线,新功能发布

By: Anonymous
4 December 2024 at 14:01

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

就在刚刚,OpenAI Sora 正式登场。

本次发布会延续了「短剧」的快节奏风格,全程 20 分钟左右,由 CEO Sam Altman、Sora 负责人 Bill Peebles 等人主持。

OpenAI 在 X 平台表示,自 2 月份以来,他们一直在构建 Sora Turbo,后者是一个速度明显更快的模型版本,今天也将其作为独立产品向 Plus 和 Pro 用户开放。

有趣的是,由于 Sora 热度太高,大批用户涌入体验网站,导致该网站一度崩溃,停止注册登录。不给力的服务也让 Altman 连连在 X 平台安抚用户:

「由于需求超出预期,我们将不得不间歇性地关闭新用户注册,并且生成内容的速度会在一段时间内减慢。我们正在全力以赴!」

附上体验地址:Sora.com

类似于 Midjourney 的网页界面,Sora 同样拥有自己单独的用户界面,用户用户不仅能够整理和浏览生成的视频,还能查看其他用户的提示和精选内容。

在 「Library」功能中,用户可以保存自己喜欢或有用的提示词,以便未来使用。并且保存的提示词可以按需查看或修改,对于需要重复创作相似内容的用户,无疑能大大提高效率。

在工作流方面,Sora 的编辑功能是区别于其它竞品的重要亮点。

比如说,在 Remix 功能中,用户可以利用纯自然语言提示词对视频进行编辑,并通过简单的「strength(强度)」选项和滑块来控制生成的变化程度。

Re-cut 功能则能智能识别最佳画面,并支持向任意方向延伸场景。

Sora 的 Storyboard(故事板)功能则类似于视频编辑器,可以将多个提示词串联在一起,生成一个更长的视频,轻松处理复杂的多步骤场景。

搭配 Loop 和 Blend 功能,用户还能创作出无缝循环的视频,并完美融合不同片段,而 Style presets 功能则可以预设和调整生成的风格。

在技术规格上,Sora 支持 5-20 秒的视频生成,并兼容 1:1、9:16 等主流宽高比。相比早期版本,现在的生成速度有了显著提升。

另外,还有几点细节需要注意。

OpenAI 采用了灵活的积分制定价策略,积分数量因分辨率和持续时间而异,如果你早已是 ChatGPT Plus 和 Pro 会员,那就无需额外费用就能使用。

比如生成一个 480p、5s 的视频就需要 25 个积分,如果生成 480p、20s 的视频则需要 150 个积分。

此外,如果你用 Re-cut、Remix、Blend 或者 Loop 这些功能,生成的作品超过了 5 秒钟,那也得额外扣你的积分,多用多花钱,别超时,超时也花钱。

对于订阅用户而言,20 美元的 ChatGPT Plus 计划提供 50 个优先视频额度(1000 积分),支持最高 720p 分辨率和 5 秒时长。

而 200 美元的 ChatGPT Pro 计划则提供最多 500 个优先视频(10000 个积分),支持 1080p 分辨率、20 秒时长、5 个并发生成和无水印输出。

OpenAI 还在为不同类型的用户开发不同的定价模式,将于明年初推出。

对了,Sora 暂不支持 ChatGPT Team、Enterprise 和 Edu 版本,同时也不向 18 岁以下用户开放。现阶段,用户可以在所有 ChatGPT 可用的地方访问 Sora,但英国、瑞士和欧盟等地区除外。

知名博主 Marques Brownlee 提前一周用上了 Sora,并在 YouTube 上分享了他的使用体验。

他指出这款产品仍存在一些局限性。

在物理模拟方面,模型对物体运动的理解还不够深入,常常出现动作不自然、物体突然消失等问题。特别是在处理带有腿部运动的对象时,经常出现前后腿位置混乱的情况,导致动作看起来不自然。

又或者,某些视频生成结果看起来像是慢动作,而视频的其他部分则以正常速度播放,肉眼很容易察觉这种「别扭」。简言之,Sora 还是没能解决老毛病,缺乏对物理世界规律的理解。

另外,Sora 没能解决文字生成的问题,导致经常出现文字混乱的现象,而剪辑风格、文字滚动条的运动、新闻主播风格的生成则格外逼真。

不过,Sora 也有不少擅长的场景。

比如说,Sora 在风景镜头处理方面表现出色,能生成媲美专业素材的无人机航拍镜头,在卡通和定格动画风格上的表现也差强人意。

性能方面,一个 5 秒的 360p 视频通常能在 20 秒内完成生成。

不过,当涉及 1080p 或复杂提示词时,生成时间可能会延长到几分钟,但随着如今大批用户的涌入,生成速度明显慢了大半拍。

不少网友也在第一时间上手体验了 Sora。比如网友 @bennash 想生成一个视频,渲染了 22 分钟都没能成功,甚至该网站一度停止注册登录。

博主 @nickfloats 给出的评价是,Sora 在将图像转换成视频时,虽然某些特定的视觉特效没有被保留,但整体的转换效果是「清晰和令人满意的」。

Sora system card 也列出了一些值得关注的细节。

OpenAI 官方认为,Sora 为能够理解和模拟现实世界的模型提供了基础,将是实现通用人工智能(AGI)的一项重要里程碑。

官方博客中提到,Sora 是一种扩散模型,它通过从一段看起来像静态噪声的基础视频开始,逐步去除噪声并转变为最终的视频。通过同时处理多个帧,模型成功解决了一个难题:即使目标暂时脱离视野,也能确保其在视频中始终保持一致。

与 GPT 模型类似,Sora 采用了 Transformer 架构。

Sora 使用 DALL·E 3 中的标注技术,该技术为视觉训练数据生成高度描述性的标签。因此,模型能够更准确地根据用户的文本指令生成视频内容。

除了能够仅通过文本指令生成视频外,Sora 还能够从现有的静态图像生成视频,准确地将图像内容进行动画化,并注重细节。该模型还可以从现有的视频中扩展或填补缺失的帧。

为了确保安全地部署 Sora,OpenAI 基于 DALL·E 在 ChatGPT 和 API 部署中的安全经验,以及 OpenAI 其他产品(如 ChatGPT)的安全防护措施进行了强化。

所有 Sora 生成的视频都带有 C2PA 元数据,这些元数据能够标识视频的来源是 Sora,从而提高透明度,并可用于验证其来源。

与此前凭借真实人像出圈的 Flux 不同,Sora 们对上传包含人物的内容设定了特别严格的审核标准,目前仅作为试点功能提供给少量早期测试者,并屏蔽含有裸露的内容。

OpenAI 王炸 Sora 文转视频正式上线,新功能发布

大半年前,初试啼声的 Sora 赢得互联网一片喝彩。

然而,如果说一年前尚未还能对着一群演示 demo 空喊「现实不存在了」,那么在国内外各类视频模型的轮番洗礼之下,我们早已养刁的胃口很难再被同样的产品打动。

这种态度的转变源于一个简单的事实。

当 AI 要从「勉强可用」进化到「可堪大用」,用户的期待也随之升维,从「能否做到」跃迁至「做得多好」。

好在 Sora 并未在掌声中原地踏步,通过与艺术家的深度合作,他们在工作流程领域做出了显著的改进。Re-cut、Remix、Storyboard 等功能都相当实用。

甲乙方的存在决定了工作流中的沟通永远是刚需,AI 能做的是让这种沟通更有效率,Sora 的价值不在于它能做什么,而在于让创作者得以抽身于技术细节,真正回归创意的本质。

与此同时,上周引发热议的 200 美元 ChatGPT Pro 订阅计划,如今也有了更合理的价格锚点,该计划同样支持无限制访问 Sora,这种产品协同效应预计也将激发出远超预期的应用场景和商业价值。

放眼当下,用户的真金白银从不作假。

可灵 AI 交出千万级月流水的亮眼成绩单,这片蓝海的潜力已呼之欲出,对于仍在「烧钱」阶段的 OpenAI 来说,Sora 预计会成为继 ChatGPT 之后的另一个下金蛋的母鸡。

当 Sora 从「能用」「好用」,再到「妙用」,或许未来某一天,我们会发现,真正不存在的,不是现实,而是人类创造力的尽头。

完全免费 AI 绘图工具 Dreamina AI,支持中文描述生成图片

By: Anonymous
20 November 2024 at 17:03

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

当前 AI 绘图工具已经全面席卷全球,你还在找一款能够用文字或图片生成的免费 AI 图像生成工具吗?分享一款由抖音旗下剪映推出的 AI 图片生成平台「Dreamina AI」,只要输入简单中文描述就能立即转成图片,甚至还能搭配多层画布进行修改、重新创作和视频生成,而且还是完全免费和无限次数使用。

完全免费 AI 绘图工具 Dreamina AI,支持中文描述生成图片

Dreamina AI 是一款由剪映推出的在线 AI 创作平台,能够帮助用户将文字描述转化为视觉艺术作品。支持多种创作模式,包括文字绘图、视频生成和图片扩展,适合专业艺术家和普通用户使用。

另外 Dreamina AI 绘图创作平台还支持智能画布功能,可以通过画布混合多种 AI 生成图片,还可以进行局部重绘或扩展画布等功能操作。

想要使用 Dreamina AI 要先用电脑网页版登入和注册会员,可以通过 Google、TikTok、Facebook 或 CapCut 移动版来注册登入。〔手机版目前会跑版建议改用平板或电脑板,至于 App Store 有 Dreamina AI App 也并非是官方推出〕

👉 前往 Dreamina AI 在线生成图片

要是首次注册账号,会跳出 Dreamina 平台要整合 CapCut 账号信息权限,直接点「确定」继续。

进入 Dreamina AI 主页面后,就可以点击「图片生成」开始使用 AI 生成功能。

接着可以再生成图像输入框内填入生成 AI 图片的文字描述〔咒语〕,不管是输入中文或英文都能够使用,实际测试 Dreamina AI 中文生成图片准确度也不差,不一定要用英文才比较高,当然也可以上传照片,依照现有图片来生成。

图片模型部分,会提供三种 Dreamina 模型效果分别如下:

底下还能够设置图片输出长宽比例,以及大小尺寸分辨率都能够手动设置,都设置完成后就按下「生成」就可以开始生成免费 AI 图片了!

Dreamina AI 在输出算是非常快,只要几秒就能生成出四种不同风格的 AI 图片,像是底下是直接生成 Lego 乐高 AI 图片海报风格图片。

说实在 Dreamina AI 生成图片效果,与当前大多数 AI 绘图工具也都不会差太多。

底下也尝试文字描述咒语来生成漫威的雷神索尔画面,会生成出不同风格和脸型效果。

用下来发现 Dreamina AI 对中文理解能力算是很强大,AI 工具基本都能理解我们在说什么,像是可以让可爱老鼠或兔子也能骑机车外卖。

连同用 Dreamina v2.0 Pro 模型来生成真人效果也非常逼真,让你看不出来这是用 AI 生成。

不过有些时候不能谈到敏感话题或文字,甚至有些上传图片有红色就会被系统认为血腥,违反了《社交自律公约》内容,遇到这情况只能换其他张照片或改用其他文字描述。

点入生成 AI 图片后,可以直接将原始图片下载到设备上,侧边还提供多种选项能够进一步调整,像是重新生成、重新调整提示、增强分辨率、润饰、局部重绘、展开或移除,以及能够在画布上编辑或生成视频等。

要是想在 AI 图片上额外修改局部画面,可以直接点入「局部重绘」功能,直接圈选划线都可以,像是我随便在画面划一下,Dreamina AI 马上就在行李箱上加入皮带配件,有如设计师能帮你随意修改,超级猛!

至于 Dreamina AI 提供的「画布」功能,简单来说就是在线 Photoshop 编辑器,能够在页面内用 AI 生成图片后,能够直接抠图,另外上传图片进行合成,侧边也有图层能够进行调整拖移,基本算是很容易上手。

以上就是 Dreamina AI 生成图片工具的技巧介绍,整体来看 Dreamina AI 算是一款功能强大、易于使用的 AI 图像生成工具,能让每个人都能成为艺术家,如果你想尝试看看 AI 绘图功能,或是想要创造出不同图片效果,倒是可以通过 Dreamina AI 来快速生成,且还能支持中文提示词,对大多数人来说也算是非常好上手。

蒸馏认知

By: Steven
17 October 2024 at 09:50

有两种方式「通晓一切」:

1、穷具并知晓每一种可能性;
2、找到底层原理后高效推理。

定理:
1、海量数据和滔天算力是不持久的;
2、通用性和低能耗是持久的。

推论:
任何人工智能都需要蒸馏出「认知」才能活下去。

前提:
本地且联网的传感器

让 MJ 学我画两张小画儿

By: Steven
7 April 2024 at 12:58

昨晚吃饭前跟儿子一起画画,我随便画了一下我们在 Minecarft 里的第二个家,和随便画的一个岩浆包围的高堡:

后来想说看看 Midjourney 能模仿成怎么程度,就丢进去试了一下:

emmm,画得还行……

就是画风不太相关,它有它的训练痕迹,哈哈哈哈哈哈哈~

测试所使用的 prompt:

Tree house, jungle, rainforest, simple little house –sref+空格+两张手绘图的地址 –ar 9:16 –s 50 –v 6.0 –style raw

艺术可以糊弄,体力劳作也是高级智能

By: Steven
19 March 2024 at 21:05

昨天发现 AAAny 更新了发图的功能,于是就顺势发起了一个讨论 AIGC 的话题

轶轩在话题下问我为什么对外发表的图都是一些细节比较丰富的类型,是否有基于 AIGC 的生成方式而做的一些突破方向的尝试。我觉得,针对这个问题,我可以在对他的回复上,再做一期视频来谈一谈我的观点。

用于风格参考的马列维奇的画作
基于马列维奇而生成的《城堡下的人群》

但与此同时,我也想做一些「简练」或「抽象」的图来辅助说明我的看法。于是,今天在工作之余,用一些碎片时间,做了一些图出来。

对此,我尝试比较随意地做了一些「东西」。它们都没有什么明确的「表达」,仅仅只是我随手写的一些 prompt,或者就是在 Midjourney 的社区里复制修改的 prompt,最终出来的东西都是一眼看上去有一些「意境」或者没那么精致细节的但表现比较能唬住人的图像。

你会发现,在这些人类认为偏「抽象」的表达上,AI 反而是比较容易做「好」的。

但是,这种好不是真的好,只是这些风格上,并不需要对细节有很认真的考据,在表现层面上是非常容易「糊弄」的。

这也是现当代艺术作品常常被人诟病的原因之一,因为那些作品浓缩了大量的思考和抽象提炼,但表现形式上,其实并没有比传统艺术更复杂,或更需要技艺和体力上的付出。也就是说,作为当代艺术最核心的「观念」,在完全不需要理解的情况下,一个外行的人或者一个数据量管够的 AI 就可以模仿出「看上去像那么回事」的东西。这种模棱两可的状态,恰恰是江湖神棍和 AIGC 擅长处理的对象。

这里说的「糊弄」「神棍」并非贬义,而是借着世俗的话语体系来表达,这样的「生成作品」并不需要 AI 具备「意识」和「创意」也可以轻松地实现。

那么,什么东西是更难的呢?

细节,是令人信服的细节。

这些是我用 AI 生成的男士剃须刀的设计方案。

你会发现,这些方案咋一看是那么回事,但只要你多看两秒,立刻就会意识到它不对。它们的空间关系、形态的处理、物理交互的关系、电子器件的布局,通通都有很大的问题。这些就是不可信的细节。

因为 AI 实际上并不理解它学习的那些图像。

这些令人信服的关键点,是无法糊弄的。因为它们当中包含了大量精确的思考和训练,也包含了海量的脑力和体力劳动,如果一个「智能体」不理解一个图像背后的复杂逻辑,那么它就没有办法真正地创作出这个对象。它只能模仿,只要模仿得足够像,就可以唬住外行。但是对于以此为生的从业者,这样的智能工具,还不足以成为生产力。设计师可以用这样的工具拓展自己的思维,但这些过程并不能替代设计行为。

从创意到落地,中间还有漫长的路需要人类设计师去走完。

现阶段,更适合工业设计使用 AIGC 的方式是这样:

我的意思并不是让 AI 画手绘图,这仅仅是一种表现方式。但是,这是一种不需要追求精确的表达方式,很适合 AI 用「抽卡」的方式来快速堆想法。除了这种,当然也可以让它生成上面剃须刀那样的图,但同样的,目的不在于出方案,而是借助 AI 的海量数据库,快速地堆出一批发散性思维的「胡编乱造」的混杂图像来。

人类的视野有限,但 AI 看得一定比人类个体的平均值多。

工业设计不是天马行空地想象,它是一种「劳作」。

从初期的构思,从草图推延到模型和效果图,再从设计方案导入结构设计和工艺、制程,这意味着工业设计不是一项纯脑力劳动,不是一种只运行在计算机里的行为。它包含的体力劳作同样是设计的一部份,甚至可以说,是更关键的那部份。这种体力劳作,不仅仅是肌肉和工具的配合,更是人脑对环境、事件、社会群体、物质的反应和处理,设计师的动作意味着这个人对世界的认知。这种程度的认知,对于只运行在计算机内,仍然缺少复杂的传感器和理解过程的 AI 而言,暂时还是无法实现的。

我当然相信它未来会具备这样的能力,但是在目前的技术条件下,依然需要大量的人类来完成这些真正代表了「智能」的「体力劳作」。

欢迎加入我们的讨论:

https://aaany.app/aaa/ltwu3txza

想注册体验 AAAny 的话,请给我留言

我会给你留言的邮箱发送注册邀请码

經濟再差也不能公開談論

By: Steven
17 March 2024 at 18:02

經濟狀況究竟有多糟糕呢?從各大品牌在售後策略、降價思路和運營的混亂程度等方面的表現,均可窺見一斑。尤其是當你置身於自媒體、電商與品牌運營三者的交匯點上,這種巨大的荒謬性將更加明顯。

上週末出差重慶,兩周沒在家,難得一個週末,結果倆人坐下後就被各自工作群里的事情纏著,不是回消息就是打電話,咖啡都沒喝上一口。

在國內的社交媒體似乎不讓提「經濟不好」這樣的事,與之相關的話也會被限制,索性我就轉成日語來發了:

経済状況は本当にどれほど悪いのでしょうか?各大ブランドのアフターサービス戦略、値引きの考え方、そして運営の混乱度などから、その一端を窺い知ることができます。特に、個人のネットワークソーシャルメディア、ECサイト、およびブランド運営の交差点に立つと、この巨大な不条理さがさらに明白になります。

先週末、出張で重慶に行ってきました。二週間も家に帰っていなかったので、久しぶりの週末を楽しみにしていたのですが、結果として、座った途端、それぞれの仕事グループからの連絡が絶えず届き、メッセージを返したり、電話をしたりすることに追われてしまいました。コーヒーすら一口も飲めないままです。

為什麼是轉日文不是英語呢?因為即便是英語,在內地的網絡環境里也顯得有些直白了。日語反而更有「似乎知道在說什麼,但根本看不懂」的戲劇化的「陌生化」的效果。

好不容易,終於把翻了一年的《夜航西飛》讀完了。

這是我今年讀完的第三本書。

昨天去宜家看洗手檯和鏡櫃,直到在餐廳排隊前一秒,都沒想起宜家給我發的領生日蛋糕的短信。可就是那麼巧,下周生日,昨天正猶豫要不要去店裡看看,我就慫恿筱燁說想幹就幹,這一來才想起有一個蛋糕等著領。這就是天注定的意思。

苹果停车转 AI 将引发人才大震荡

By: Steven
28 February 2024 at 20:16

1、没有 AI 的汽车、手机、电脑、平板等,将是一堆废铁;

2、一家公司的核心战略不能同时放在两个大方向上。

综上,停下造车全攻 AI 是非常明智的。

连键盘侠都知道「不难」的造车,没造出来不是造不出来,是制定的目标太远太高。苹果之前想一步到位搞出 L4 的移动座舱,但现阶段的人类还没有办法,这太难了。在他们之前的设想中,自动驾驶的汽车和 Apple Vision Pro 是可以放在同一个场景里的。但很显然,这个步子太大了。用新势力们的方式当然可以,但那不是苹果想做的。

最关键的是,AI 的大爆发是此前大家都没料到的。没有这事儿,车还是一个重要的方向,但这一波爆发的 AI 不是资本热潮,而是实打实的浪潮了,此时不全力转向,是真的会死的。况且苹果并不是没有在 AI 上投入的,这些年一直都在积累,只是权重还没拉到那么高。现在切方向,即是大势所趋的必须,也是归拢资源的必要。

过去 Jony 可以对供应商说,这里有一桶取不完的钱,你能做到你就能拿走,以此把工业设计拉高到一个令人望尘莫及的程度;今天的苹果比二十年前拥有更多的现金,有自己的芯片和庞大的人才库,有海量的设备和训练数据,可以说:

比起造车,AI 才是更适合苹果干的事;

干好 AI 所需的人才、数据、算力,也是他们的优势。

以苹果的财力,下这样的决心,恐怕要出现一次人才流动的大震荡。

原文发布于知乎提问:

苹果取消探索十年之久的电动汽车项目,将团队转向生成式 AI,原因有哪些?会带来哪些影响?

表达的精度就是人类外延的尺度|Midjourney 
V6 Alpha 自然语言生图测试

By: Steven
26 December 2023 at 01:14

Midjourney V6 的质感和细节,真的是飞跃式的成长!

和今年三月相比,已经完全脱胎换骨了。对自然语言的理解和再表达,也已经在渐渐脱离「咒语」的局限,结合 ChatGPT 的语言转译,一个人能够用母语把尚不明确的观念表达清晰,愈发显得重要。

点击图片,可查看原始尺寸高清大图:

当 AI 越来越擅长理解人类的自然语言,我们就愈发迫切地要掌握「用语言表达思想」这件事情。

因为语言的精度和颗粒度,将会在人类与 AI 的相处、合作中,展现出人类智力的上限所在,以及外延的纵深能够得着多远。

Upscale from Variations
Upscale(Subtle)
Upscale from Variations
Upscale(Subtle)
Upscaled (Subtle)
Upscaled (Creative)
Upscaled (Subtle)
Upscaled (Creative)
–Style 50
–Style 100
–Style 250
–Style 750
–Style 1000

❌
❌