Reading view

There are new articles available, click to refresh the page.

被 ADHD 困扰的不止罗永浩,我想分享几个能帮上忙的 AI 工具

在迟到了 40 分钟之后,老罗终于在 2025 年的最后一天,站上了科技春晚的舞台。对那些枯等了许久的现场观众,他给到的除了免票,还有一个「理由」:ADHD。

ADHD 是注意缺陷多动障碍(Attention Deficit Hyperactivity Disorder)的缩写,它最常见的症状是分心、冲动、无法专注,究其核心,都是注意力调节能力的失灵,且是由于大脑发育带来的。

老实说,当代人,谁不碰上点儿拖延和分心呢——电脑上开着 50 个浏览器标签页,背景音乐还在循环播放洗脑神曲,同时人却划着手机,在小红书上晃荡了整整 20 分钟——谁还没试过呢?

一颗 ADHD 大脑也会出现上述情况,但背后有明确的病理机制。我们大脑的前额叶皮层负责做规划、踩油门、控刹车,来管理我们的行动。但 ADHD 人的前额叶活跃度,明显低于平均水平,导致执行功能就像一个延迟极高的无线遥控器:脑子里发出的指令是「现在起床」,但指令传到身体时可能已经卡顿了一个小时。

这是 ADHD 的典型症状之一:启动困难。也是普通拖延症和 ADHD 的甄别关键:普通拖延症可能是不想做、懒得做,但是 ADHD 是在大脑里已经嘶吼了几万遍,四肢却像被冻住一样。这个感觉非常难受,甚至不是事后的自责,而是当时当刻就很痛苦,还没有一丝办法。

同理,在面对分心、无法专注等情况时,ADHD 也会出现大脑不断发送专注的指令,整个人却无法执行的情况。长久以来,ADHD 被视为一种「病症」,早年间被称为「多动症」。这其实并不准确,ADHD 的大脑不是坏了,它只是在用一种「高能耗、高延迟、高爆发」的特殊算法在运行。

而现在,短视频、社交媒体导致的资讯大爆发,几乎让每个当代人出现了类似的「症状」,分心、走神、烦躁地难以集中,于是 ADHD 就成了新的「时尚挂件」。

踩不动油门?注入一点 AI

难以专注、难以启动工作,又确确实实是一种当代病——AI 的出现可谓是一丝曙光。

ADHD 对于解决启动和专注问题提供了一些灵感:传统的代办清单对于 ADHD 而言,完全是灾难——不管是用手账本还是用 To Do 类型的任务清单,不管多认真地写下「1. 写完测评报告;2. 深度清理房间;3. 学习 Python」,结果都是一样的——做不了一点。

任凭这几行字在上面挂半天,我自能刷一天的手机。

ADHD 需要的是「喂饭」级别的指令,颗粒度要尽可能的精细。比如,不要写「去健身」,而是要写「换上健身裤、拿出瑜伽垫」,把任务拆解到完全不需要思考,只需要执行的程度。

这恰恰就是 AI 最能发挥的地方:只需要把任务丢给它,让它自动拆分出一个个小步骤,方便我们执行。

从去年以来,不少应用工具都基于这个底层逻辑,开发出了不同于传统任务清单、为 A 人贴身打造的应用工具。

【PlanCoach】

这是国内比较早开始做任务拆分的应用,获得了小红书黑客松一等奖。开发者的理念是:把一个步骤连续拆分,直到能动起来为止。这也的确是 app 呈现出来的样子:输入想要做的事务,AI 会即刻自动拆分,执行的时候支持语音播报、互动,解放双手。

PlanCoach 比较有特色的地方是「角色形象」,有管家、大臣、男仆等不同的教练角色形象,不同的角色「说话」方式也不同,很有趣味性。在 PlanCoach,你甚至可以看到吴京……

PlanCoach 提供几种不同的修改计划的方式,最简单的是完全重新生成——这就是利用 AI 抽卡的底层原理,同一个指令但抽卡抽出不同的效果——注意一旦重新抽就是全局式的修改,完全改头换面。针对局部步骤的修改,可以点击「编辑步骤」,并且提供自行修改,或者让 AI 帮你修改的方式。

整体上,PlanCoach 的开发思路是冲着 ADHD 去的,开发者在小红书上,经常更新思路和想法,希望能覆盖式地解决启动、执行等问题的同时,也避开诸如感官过载、容易分心等问题。

目前仅支持 iOS 客户端,iPad 版可以在 mac 上使用。注意:PlanCoach 正在执行阶梯型涨价,终身会员的价格会逐步拉高,最终目标超过 200 元。考虑到 ADHD 的友友们在做决策这方面也会瞻前顾后,这个可需要注意喔。

【滚雪球】

这个可爱的名字背后是有深意的:一步接着一步,从小步骤开始,想滚雪球一样,完成一件大任务。

同样基于任务拆分的形式,滚雪球比 PlanCoach 更简洁一点,更强调的是每一次完成的反馈——在设计上,每一个具体步骤都需要点击以进入下一步。也就是说每一次都只有一个步骤显示在屏幕上,每一个步骤还可以倒计时,要么完成、要么跳过,才能进入下一步。

好处是有一种「摘果子」的感觉,走一步摘一个,反馈链条缩到最短。反面是:一旦进入心流,可能会直接忘记需要点——比如我在使用过程中经常就出现这种情况,成功起床洗漱了,然后……直接忘了手机里雪球还在滚。

当然,每个人的需求不一样,对我而言,只要能让我成功启动,后面忘了就忘了吧。可以说滚雪球更侧重于启动,PlanCoach 更侧重整体安排。

滚雪球的特色在于精力管理:每一次完成任务,都会有一个记录心情、状态的统计页面。每一个小步骤里也可以通过点击空白处,记录当下的心情和状态,这些数据会进入「我的状态」板块。

这样有助于直观地看到自己的精力变化周期,比如我就是很典型的午晚间人,上午动不了一点,午饭后状态开始爬升,晚饭后开始回落。

掌握自己的精力变化周期,可以因时制宜地安排任务,对 ADHD 来说很有用——强迫自己是没有用的。

【Ziea】

上面两款都是手机 app,成也手机败也手机——我已经数不清多少次,明明是要去点开 app,却在解锁后突然一个大拐弯,点开了小红书,从此坠入时间黑洞……

Ziea 就把任务拆分做到了硬件里,实现专注的目标。

从演示 demo 中可以看到,基础逻辑是一样的:任务拆分、整合进日程管理、安排番茄钟,全程只需要跟产品互动。

这款产品目前还处于研发阶段,没有公开发售,但是思路相当值得借鉴——专注型软件一定要做成手机 app 吗?

归根到底,该怎么避免被手机带跑偏?别碰手机就是了嘛。今天我们已经有那么多智能设备了:手表、手环、眼镜,甚至是戒指,这些设备作为载体,会不会更加适配对于专注的渴望和追求呢——开发者们快想想!

当然,任务拆分型 app 现在已经有很多选择了,极有可能出现下载了十几个 app,平均每个用三天到一礼拜,然后就被忘在手机的角落里吃灰

千万不要因此感到挫败或自责,ADHD 的大脑永远在追求新鲜感与更低的启动门槛,这本身就是我们生命力的一部分。如果你发现一个工具没法持续地吸引你,那大概率说明它的设计逻辑并不适配你大脑的系统版本。

只要这个 app 能在某个瞬间,帮你把脑子里那台刹车不好使的法拉利成功推出起跑线,它的使命就已经完成了。记住,你才是赛车手,所有的工具都只是路标和护栏。生活不必总是一板一眼的直线行驶,哪怕是蛇形走位,只要你在前进,那就是属于你的胜利。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


掌管全球万亿资产的「老钱」,为何选中了年轻的 MiniMax ?

站在 2025 年底回看,AI 行业正经历一场安静但深刻的转向。几年前,发布会灯光、参数排行榜和融资数字曾构成这个行业最耀眼的画面。

而现在,聚光灯正在移开,视线开始落到更不显眼却更关键的地方——技术团队是否能持续进化、路线选择是否经得起时间拉扯、那些尚未完全兑现的能力,是否真的具备长期生长的可能性。

投资者评估 AI 企业的方式,也随之从「看得见的收入」,转向「还没完全显形的价值」。

正是在这样的行业转折点上,MiniMax 启动了上市进程:今天公开发售正式启动,预计将于 1 月 9 日以 0100 为股票代码正式登陆港股资本市场。

根据招股书披露的核心细节,MiniMax 本次 IPO 拟发行 25,389,220 股,定价区间为 151 至 165 港元/股,在不考虑发售量调整权及超额配股权行使的情况下,发行估值将介于 461.23 亿港元至 503.99 亿港元之间。

值得注意的是,MiniMax 此次引入了包括 Aspex、Eastspring、Mirae Asset、阿里巴巴及易方达在内的 14 家基石投资者,认购总额约 27.23 亿港元。

募资用途方面,MiniMax 明确将 90% 的募集资金投向研发领域,其中 70% 专门用于大模型相关研发,剩余 20% 则投入产品迭代与优化,持续夯实技术壁垒。

这些承诺长线持有的基石投资人,以及将九成资金押注研发的资源分配方式,共同标志着 AI 行业正式告别了流量为王的草莽期,进入了长期主义的成熟期。

「老钱」都是谁

股票市场上,「老钱」指的是投资时间跨度较长、重视基本面而非短期交易的机构或资金类型。包括公募基金、主权财富基金、战略持股的大型企业或家族投资公司等等。

如果说风险投资是投机者的角斗场——投出的十个项目里能死掉 9 个,但只要剩下那一个成为独角兽就是胜利——那么,「老钱」们则擅长给足耐心,坚持复利和长期主义。关注股息、盈利增长以及企业长期价值,从而为市场提供稳定的资金支撑。

长线基金通常投资门槛很高,更关注企业的健康发展,相信未来的技术壁垒能带来几十年的垄断收益。这就意味着,企业本身的商业模式和技术壁垒,需要经得起检验,能在时间的洪流中站稳。

1988 年,在巴菲特的判断下,Berkshire Hathaway 开始大规模建仓一家消费品公司,高峰期持股约 9%,从不因短期估值或市场波动而交易。随后,美国大型的养老基金、指数型长期资金也纷纷跟进。他们看中的,是这家公司健康强劲的现金流,可预测的市场需求,明确的盈利方式和定价权。

长线基金在寻找的,是可被时间反复验证的可靠性,尤其是那些可以将技术沉淀为不可替代的生产要素的公司。在下一波生产要素更迭的时间节点,这些长线基金,看中了下一个基石型产业——AI。

而在这一片阵地中,他们看中了一支年轻的队伍——MiniMax。

反脆弱

「真正强大的系统不是在冲击中保持不变, 而是从混乱中获益、在压力下变得更强。」这是前华尔街交易员塔勒布在其著作中提出的概念:反脆弱性。

这个概念放在当下的 AI 行业,可谓一种高标准。技术的快速更迭,带来的是眼花缭乱的变化——能在持续的变化中稳住、变强,MiniMax 是个值得观察的样本。

过去两年,AI 赛道的主旋律是烧钱换时间。可是 MiniMax 的财务数据呈现出不同的增长曲线:收入增长 174.7%,研发支出仅增长 30%。这种非对称增长,恰恰藏着它最核心的生存逻辑,反脆弱性。

首先就是他们对全模态自研的投入。回到三年前看,这是一种剑走偏锋。彼时行业共识是专注单一赛道,毕竟全模态意味着战线过长、资源分散、而非在一个细分垂直领域做到极致。

但 MiniMax 选择了一条少有人走的路,自成立起就死磕全模态自研,现在终于成了全球唯四能冲进全模态第一梯队的企业,实现了文本、视频、语音、音乐的全面开花。

这是一种剑走偏锋,也是一种基于长期主义的积累。

于是我们看到,文本模型 M1 是全球首个开源大规模混合注意力推理模型。第二代 M2 一开源,就拿下全球前五、开源第一的成绩;OpenRouter 上,国内 token 用量登顶,编程场景冲进全球前三,Google 、亚马逊、微软三大云厂商都第一时间把它接入自家 AI 云平台。

近日 LMArena AI 的 WebDev 榜单更新,MiniMax M2.1 Preview 直接冲到全球第四,也是国内第一。身前站着的是 Anthropic OpenAI 和 Google 这些老牌巨头,能在巨头盘踞的赛道里杀出一席之地,这份成绩单足够亮眼。

语音模型的表现同样硬核。

新发布的 Speech 2.6 性能直接压过 OpenAI 和 ElevenLabs,成了支撑 ChatGPT 高级语音模式的 LiveKit 底层引擎。流畅切换 40 多种语言,把 Voice Agent 场景的首包响应时间压到 250 毫秒,直接拉高了这个赛道的准入门槛。

视频领域的突破则进一步夯实其全模态优势。

MiniMax 视频模型 Hailuo 支持文生视频、图生视频、主体参考、首尾帧等功能。最新的 Hailuo 2.3 模型,更是在画面质量、连贯性、流畅性等多维度均处于领先地位。

截至目前,海螺 AI 生成的视频已经超过 5.9 亿个,全球 200 多个国家的用户都在用来创作,其中超 1 万名专业创作者通过其产出商业作品,合作方包括戛纳电影节、纽约大学艺术学院等。

几年间的努力,MiniMax 把技术沉淀为了真正的护城河,从而避开了 AI 行业最大的雷区:技术领先,商业却欠佳。

技术领先不等于商业成功,这是 AI 行业过去几年反复验证的教训。MiniMax 则通过「B+C 双轮驱动」模式,完成了技术优势向商业价值的转化:2.12 亿用户,开放平台日均处理万亿级 Token 请求。夸克有声书、小爱音箱语音、腾讯视频内容生成、WPS 的 AI 功能背后都有它的技术支持。

这些优质 B 端客户带来了稳定收入,更通过这些平台触达了海量 C 端用户,形成了「B 端赋能、C 端破圈」的良性循环。

海外市场的表现则更具说服力,领英、Veed、Leonardo 等平台是其客户,海外收入占比超 70%。这个比例意味着它已经跳出了国内市场的舒适区,在全球范围内验证技术的商业价值。

支撑这一切的,是一个极致精简的组织和一群踩在时代节点上的年轻人。

时间是最好的标尺

年轻带来的不仅是精力和嗅觉,更在于没有传统科技公司的路径依赖,可以搭建一个精简的组织结构,从而无限拉高成本控制能力和研发效率,这也是 MiniMax 能在烧钱赛道中「逆势增长」的核心原因。

MiniMax 共计员工 385 人,但团队平均年龄 29 岁,人均 95 后,385 个人里 73.8% 是研发,三分之一有海外背景。

MiniMax 成立至今只花了 5 亿美金,不及 OpenAI 的百分之一,却做出了全模态全球领先的成绩;CEO 之下不超过三层职级,内部 80% 代码由 AI 生成。这种 AI 原生的组织架构,某种程度上解释了其技术和商业化的推进速度。

MiniMax 招股书里的一组数据很能说明问题:11 亿美元现金储备,可支撑 53 个月运营;应收账款周转天数 38 天,低于行业平均的 60-90 天;B 端毛利率 69.4%,收入来源是订阅和 API 等可持续模式。

「高护城河、可持续现金流、抗周期能力」,在MiniMax年轻的外壳下,装载的正是完美符合长线基金投资逻辑的特质——没有不青睐它的理由,对于长线基金来说,MiniMax 不仅仅是模型公司,更像是 AI 时代的「字节跳动」或「腾讯」——拥有极强的技术壁垒,更重要的是,拥有参与定义AI时代下互联网基建的能力。

年轻团队、技术积累、现金流健康、全球化布局,这些要素组合在一起,构成了 MiniMax 在 AI 行业务实的生存逻辑,也让其成为了 AI 时代「抗造」能力极强的玩家。

而正是在这样的公司身上,长期基金与被投公司之间形成了一种名利场上罕见的关系:互相成就。

正如文章开头所说,Hathaway 持仓了一家消费品公司 40 年,一直延续到了今天,这家公司也的确变得家喻户晓——它就是可口可乐。

资本为其提供穿越周期的耐心与稳定性,企业则以长期兑现能力作为回报与证明。MiniMax 之于 AI 时代,也正在进入这样一段与长期资本相互验证、彼此成就的关系。

当市场还在赌哪个模型会成为终局时,聪明的钱已经开始寻找具备持续产出爆款模型的、具备年轻与朝气的公司——这些才是 AI 时代真正稀缺的资产,也是更有可能穿过周期的那些人。

时间本身,就是最好的增长杠杆。具备反脆弱性的 MiniMax,无疑已站在接受市场长期检验的关键起点。

作者:Selina、莫崇宇

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


我调教了 50 次 AI,就为了能点开这片记录了 2025 年的雪花

岁末年初,朋友圈又开始了年度报告的大赛。各个平台都拿出了各种设计、交互、数据,势必要占领你的朋友圈。

拜托,现在 AI 已经这么好用了,为什么不能自己做一个呢?尤其是这一年,有大量的时间正是花在这些 AI 工具里。

没想到,这一个小小的念头,引发了一场我在 AI studio 里埋头苦干了两天,先后完成了两个版本:一个是基于静态和简单互动的「传统版」。

另一个是具备动态效果、可无限缩放、结合 3D 粒子和互动的「技能版」。

更没想到的是,整个经过改变了以往我对与 AI 协作互助的理解:万能咒语什么的不存在的,真正的魔法武器只有一个。

自己做一个技能版「年终总结」

在开始之前,先准备好你最常用的 AI chatbot——一定要是最常用的,几乎每天都要聊个两句的那种。数据不够不仅做不了有意思的总结,还可能被硬塞不存在的数据。

我准备的是 ChatGPT,直接起一个新窗口,输入以下 prompt:

请基于这一年的对话内容,从“数量、主题、时间、情绪、使用习惯、人格特征”等维度,构建数据感的总结,包含模拟数据以及 ASCII 图表,请严格按以下结构生成:
【1. 年度总览】
今年与 GPT 的总互动次数
发送消息总字数 + 接收消息总字数
最常互动的时段
最长连续对话时长
【2. 互动类型分布(饼图)】
请用 ASCII 图展示:
情感类、讨论类、创作类、学习类、角色扮演类、其他类
【3. 高频主题排行(TOP 10)】
以排行榜形式展示,并给每个主题一句点评。
【4. 我的年度情绪轨迹(线形图)】
模拟分析我在对话中的情绪曲线
【5. 用户行为画像(雷达图)】
雷达图维度包括:
好奇心、依赖度、分析深度、 表达欲、情绪敏感度、 自我剖析频率
【6. 使用时段与频率(柱状图)】
柱状图展示我全年最常用来找 GPT 的时间段: 凌晨、上午、下午、晚上、深夜
【7. 我的互动习惯标签】
请根据全年模式,为我生成 6-10 个类似“APP 年度画像”的标签。并设计 6 个带名称的年度成就徽章
【8. AI 眼中的我(数据 + 叙事结合)】
结合年度模式,写一段带数据隐喻的:
“我是怎样的人,我的灵魂像什么,我为什么值得这样的总结。”
【9. 年度一句话总结】

总体风格要求:
数据可视化 + 年度回顾混合风, 图表使用 ASCII,可视化要清晰、好看、易读,文案具有科技感、沉浸感、叙事感,避免大众化套话。

这些就是接下来的基础素材了,在上述这种 prompt 的指令下,GPT 只会输出纯文本,图也是草草画一画。所以接下来要转移到 Gemini/AI Studio 上去做进一步的排版。

AI Studio 依然是最推荐的地方,除了可以选择更多模型、互动过程更直观,还有一个更重要的原因后面讲。

年终总结里,数据只是素材,更重要的是排版——这一项已经卷出花来了,充分地进入了 AI 的数据库,用几行基础 prompt 就可以实现。

帮我以可交互式 H5 的形式,制作一个年终总结页面。总结文案我将会在下面给出,形式要求:1. 可交互式,交付可本地打开的 html 网页 2. 根据文案内容拆分版块,在需要使用图表的部分制作图表 3. 版式要求:文字使用衬线体,背景色彩可以自主调节。总结文案如下:(补充你的文案)

很多人抱怨, AI 生成的视觉图表有一股廉价的「塑料感」,效果不坏,但也说不上好——这就是基础 prompt 的缺点。所以,在制作报告时我直接放弃了使用「大气、高级」这类模糊的形容词。AI 听不懂这些,它只能精准执行参数,拆分成一步步会更加有效。

比如,为了达到最终那种深邃优雅的视觉效果,我将需求拆解成了具体的描述:背景为深紫色渐变与暗灰色的色块晕染,晕染效果随机变化——具体的颜色、形态,而非空洞的叙述「大气」「高级」,AI 弄不明白的。

类似的,微调图表时,也要尽可能的具体:雷达图需要呈现出磨砂玻璃般的半透明质感。

加入交互时,描述你想要实现的效果——尽可能地细致,比如:将「年度十大主题」按照十宫格排列,点击来使每一个格子反转,文案始终置于居中位置。

这种调校的过程,本质上是在用你的审美,去 battle AI 的执行效率。不过,现在 Gemini 的审美远比我想象的要好,比如我提了一个多出几个配色的要求,它给出的三种配色都还不错。

隐藏武器:「回滚」

做传统的年终总结,整体过程比较像和设计师合作,这里改改颜色、哪里换个版式。但「技能年终总结」,就是和工程师合作了。

在重新研究了一遍 GPT 给出的文字总结后,我第一时间想到的是和网上流行的圣诞树做结合。

▲ 图片来自:小红书用户 @黑波

但是在对比之后,发现年终总结高度格式化的章节、数字,并不适合用圣诞树这样的形式去呈现。所以我先是参考圣诞树的设计 prompt,但把主体改为了结构更清晰的雪花结晶。prompt 如下:

角色设定:你是一位精通 React 19、TypeScript 和 Three.js (R3F) 的 3D 创意开发专家。 任务目标: 构建一个名为“圣诞雪花”的高保真 3D Web 应用。视觉风格主色调为深祖母绿和高光金色,并伴有电影级的辉光效果。 技术栈: React 19, TypeScript, React Three Fiber, Drei, Postprocessing, Tailwind CSS。

雪花结晶体的结构可以更清晰的展示出节点,这样,就可以用红宝石不同的年度总结板块。点击时,散落在夜空中的粒子和红宝石,共同组成了一朵雪花——就像一个个重要的事件、习惯、统计数字,构成了这一整年。

然后就是漫长……漫长……漫长……的修改流程。在我的预想里,每一个红宝石封装了一部分内容,一次性把完整的总结文案喂进去是行不通的。这也是很多人写 prompt 时的「毛病」,喜欢一下子把所有需求堆上去,结果 AI 给的代码往往漏洞百出。这边给到的一个建议是: 先定骨架,再调动作。比如一个雪花的动效,我分了三步:

第一步: 先让它把雪花的 3D 形状写出来,只要形状对了,先下载一个版本,你可以在这里找到下载按钮。

第二步: 让它加上自转和红宝石节点,不急着塞内容,只是把几个节点改成红宝石的形状。

第三步: 最后才去磨那个点击缩放的逻辑,放大时是什么效果、要不要加返回键……

每一步只要达成预期,就别乱动。一旦发现没有效果,让 Gemini 自行 debug 也无效的话,启动武器:

这是我做这个项目时最重大的发现:回滚。功能越复杂,需求越多,AI 越容易出错。完成一个新需求的时候,无法避免要「重新生成」一些东西,所以整个代码的其它地方本来是没问题的,改完却出现新的 bug。

结果就是,越在错误的代码上缝缝补补,加的补丁越多,bug 就出现得越多。所谓「按下葫芦浮起瓢」,是最劝退的一步。

所以,效率最高的做法是,当你发现 AI 为了加一个新功能(比如换个颜色),把之前已经调好的交互逻辑给「洗」掉时,不必执着于在对话框里跟它吵架,让它「改回来」。最快的方法是直接回退到上一个版本,再输入新指令——记住,你是指挥官,它是执行者,AI 乱了,你要把它拉回到正确的轨道上。

 

这对零码选手尤其有意义,作为一个很少去翻看冗长代码、只看预览效果的普通用户,这就是最简单粗暴的「咒语」:别去纠结它哪行代码写错了,直接回滚。

这个项目里我的整个工程一度崩溃过:中间我提出,「优化一下红宝石的材质,让它看起来更透亮」,看代码预览 Gemini 是在跑,但是回到预览页却没有一丝变化。

一运行,材质没有大变化,点击缩放的功能还给废了。AI 在重写材质代码时,顺手把我调了一下午的点击交互给抹掉了。这种时候,在对话框里跟它大发雷霆其实没有用,提出「缩放功能没有了补回去」,也很容易卡死,AI 会一边道歉一边给你补一个更烂的 Bug。

与其纠结,不如一键 restore,回滚到那个「材质虽丑但交互正常」的版本,这种对预览效果的「死守」,比任何高级 prompt 都管用。

不过要注意的是,回滚只有上一个版本,更远一点的版本是不支持的。可以把它理解为「退回到上一步」,类似 Ctrl+Z 这样的操作。

到了后面,我的想法越来越被耗尽,所幸让 Gemini 自主完成一些设计工作。在整体视觉已经完全确定的情况下,它的发挥其实还不错。比如这个年度成就徽章「英灵殿」,就是完全由它设计的。

鼠标悬停即展示具体的成就名称,也是 Gemini 想出来的主意。另一张统计里,它还自己画上了心跳图。

最后一颗宝石里装载的是「一句话」总结,Gemini 把最后这颗宝石改成了白色的锥型晶体,跟其它的红宝石区别开来。

在制作这篇年终总结时,我被问到最多的问题是:「Prompt 是什么?」

也不意外,AI 用到现在,这已经成了大家下意识就要问的问题。但是说句掏心窝子的话,真的没有什么一键成型的魔法咒语。

每个人的 2025 都是独一无二的,每个人想要通过 AI 记录的转折点、战绩和情绪也都不一样。你喜欢一棵挂满礼物的圣诞树,而我喜欢这片在星空中转动的雪花。每个人都有自己的审美偏好,而 AI 最大的魅力,绝不是让你能复制出一份和我一模一样的报告。

相反,AI 最大的意义是:它第一次抹平了「想得到」与「做出来」之间的鸿沟。 以前你受限于不会代码、不会设计,只能接受千篇一律的模板;而现在,只要你愿意花点时间去跟它「死磕」,去描述你脑海中那个具体的画面,AI 就能帮你把那个只属于你的世界折叠出来。

Prompt 是冷的,但你的记忆和审美是有温度的。

如果非要总结出一个公式,那可能就是:一点点想象力 + 几十次耐心回退 + 绝不向平庸效果妥协的审美。

别再到处找「万能指令」了。新的一年,试着去跟 AI 聊聊天,去「嫌弃」它的平庸,去坚持你的直觉。你会发现,正如同每一年里不停止的自我更新和挑战,对这一年最好的总结,恰恰就是你不断推倒重来的过程本身。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


2025年度词「Slop」:如果屏幕里装的是泔水,那我们算什么?

这是最好的时代,互联网上,应享尽享。这也是最坏的时代,是一个下沉的年代,互联网上充斥着的都是「泔水」。

韦氏词典(Merriam-Webster)发布了 2025 年的年度词汇:Slop。

这个英语单词的原意是「猪食」「泔水」。精准,也令人不适。根据韦氏词典的官方释义,Slop 指的是「通常由人工智能大量生产的低质量数字内容」。在英语原义中,它原本的含义包括淤泥、污水,或者更直白一点——倒在食槽里喂猪的泔水。编辑部特意强调,这个词自带一种「湿漉漉的、你绝对不想碰触的声音」。

如果说几年前我们谈论 AI 时,使用的词汇还是充满科幻色彩的「奇点」或稍显恐慌的「幻觉」,那么到了 2025 年,人类终于对满屏的生成式内容失去了一切好奇,只剩下一个发音黏糊糊的、带有生理性厌恶的单词:slop。

它毫不避讳地指出 AI 内容的廉价感,直接揭穿了当下互联网最尴尬的真相:AI 的确在又快又大量地生产内容,但都是营养匮乏的数字垃圾。这一切的背后,不过是一场巨头和巨头联手打造的、关于榨干注意力的算计。

从「幻觉」到「泔水」

前两年的 AI 好像还没那么让人厌恶,虽然它会画六根手指,做一些奇形怪状的动画,或者跑各种奇奇怪怪的

但到了 2025 年,这种情绪彻底变了。AI 生成的质量越来越好,越来越精致,不再犯以前那样的低级错误,却也越来越让人不适:放眼望去,到处是漫山遍野的平庸。

这就是 Slop 的问题所在:正确,却平庸。

Slop 的泛滥,在某种程度上又说了一遍「互联网已死」这句话,它正在成为现实。韦氏词典说,「这个词向人工智能传递了一个信息:在取代人类创造力这件事上,有时候AI 看起来并没有想象中的那么超级智能」。

这些内容不是为了交流,不是为了表达,甚至不是为了被阅读,它们存在的唯一目的就是为了被算法抓取,为了占据屏幕的像素,为了塞在广告加载的那几秒钟里。

为了被消耗掉而存在,导致这些内容是粘稠的、同质化的,也让真正有价值的信息沉入海底。现在上网冲浪的体验更复杂了,比如你试图搜索一个生活小技巧,不得在返送回来的内容里,小心识别出 AI 生成的废话文学,才能找到一句人话——最后也还要核实,因为可能是二次传播了 AI 内容。

累觉不爱,最终汇聚成了「Slop」这个词里的全部愤怒。

当「梦工厂」去掉「梦」字

然而,这种让用户感到恶心的「泔水」,在商业巨头的报表里却是香饽饽。最令人细思极恐的,莫过于最近迪士尼和 Sora 联手的消息。

在传统认知里,迪士尼应当是站在 Slop 对立面的。一开始也确实是这样的,在各种 IP 人物里,迪士尼的人物形象往往是比较难生成的,版权保护是其中的重要原因。

毕竟,这家造梦工厂的护城河,是人类最极致的才华、最细腻的情感连接和最不可替代的 IP 故事。如果连米老鼠和艾莎女王都开始由算法批量生产,那么「创意」二字将一文不值。可就在不久前,迪士尼表示已与 OpenAI 达成协议,不仅计划将 Sora 生成的视频引入其流媒体平台,还向 OpenAI 进行 10 亿美元的股权投资,并获得购买额外股权的认股权证。

也……不能说就是迪士尼堕落了,流媒体赛道早已白热化,Netflix 都要大举收购华纳兄弟,进入下半场后,走向 AI 几乎是必然选择,我们可以称之为「Slop 经济学」。

在流媒体的初期,巨头们比拼的是「头部内容」——谁有最好的电影,最火的剧集,才能吸引用户成为会员且长期订阅。但订阅并非完全排他,以及愿意在流媒体上花钱的用户总量有限,在增长见顶的今天,比拼变成了「时长占有率」。不止迪士尼,所有流媒体都不约而同发现,用户在流媒体上不仅仅是在看电影,更多时候,他们需要的是一种「背景音」或「视觉伴随」。

对于这种伴随式内容,人类艺术家的成本太高了。雇佣一流的画师去绘制动画里一朵云,或者雇佣摄影师去拍摄每一个空镜,或者让音乐人去写每一段配乐,相比于能创造的效益而言,性价比太低。

而 AI 恰好能以接近零的边际成本,生成无数看起来「足够好」的画面——反正这些内容也就是「听个响」,不可能像《甄嬛传》一样被观众拿着放大镜看,连一点点穿帮都找出来。

这可能就是迪士尼的算盘,所以在一年前,迪士尼就已经开始探索AI介入的可能性,并为此专门成立了一个部门,并成为「技术赋能办公室」。

他们的想法是,保留最核心的主角和剧本(至少目前还得这么做,主要是为了维持版权壁垒),而将一些周边内容比如背景、过场、宣发物料以及那些为了杀时间的次生内容,交给 AI 去生成。对于平台而言,内容不再需要是「作品」,它只需要是「填充物」。

这是一种「风险控制」的思路,跟创作关系不大。迪士尼入股 OpenAI,本质上是在买一张通往未来的船票。技术只会越来越好,打不过就加入,然后用它来降低自己的生产成本。

这已经是很多大公司在做的事,美名其曰「降本增效」,只是长期来看这就带来了审美降级,它默认了观众并不需要很精致的艺术,只需要不断流动的像素,持续刺激他们的多巴胺——正如所有的短视频一样。

 

分裂的互联网,在垃圾场里淘金

当然,也不是所有内容平台,都「打不过就加入」,比如维基百科就很抗拒这种纯生成的内容泥石流。倒不是因为他们有多高尚,而是因为他们的商业模式依然依赖于「真实性」和用户的信任。

维基百科如果被 AI 生成的虚假条目淹没,它就失去了作为知识库的意义,其实这个道理对于很多其它平台也是类似的:Pinterest 如果满屏都是 AI 生成的虚构家居图,用户就会因为找不到图里的商品而愤怒离开;Spotify 如果充斥着 AI 合成的虚假歌手,真实的音乐人生态就会枯竭。平台或多或少都仰仗用户的信任。

而另一边,则是「投喂派」的狂欢,主打的就是无脑刷屏。在这些平台上,逻辑不再重要,画面的连贯性也不重要,重要的是色彩的刺激和无穷无尽的滚动。这些平台不仅不排斥 Slop,反而鼓励 Slop。因为他们的算法目标只有一个:停留时长。

▲ 2020-2026 年间美国居民在电视和短视频上的使用时长对比。 图片来自:EMARKETER

只要用户还停留在 App 里,无论他是在看一部精心制作的短片,还是在看一段 AI 生成的猫猫狗狗,其实都是一样的。甚至,AI 视频因为成本更低、更能根据用户的数据实时生成其偏好的「诱饵」,在商业效率上反而更高。

这种分裂构成了 2025 年最荒诞的景观。互联网不再是平的,它变成了折叠的。一边是少数坚持「全手工制作」的精品内容社区,它们可能不仅需要付费,还需要用户具备极高的辨别能力;另一边是免费、泛滥、充斥着感官刺激的公共流量池,那里是 Slop 的海洋。

那,我们用户算什么?

现在,回头看「Slop」这个年度词汇,会发现它多少有点让人不寒而栗。

Slop 其实不是很好翻译成中文,「泔水」是最贴近的意译。泔水的特点是什么?混杂、粘稠、黏黏腻腻看不清的一堆东西。毕竟,猪吃的东西不需要美味,不需要营养均衡,甚至都不需要是卫生的,只要足够便宜、量大管饱。

当迪士尼开始用 Sora 生成的画面填充大大小小的屏幕,当算法试图用无穷无尽的 AI 废料填满每一个人的碎片时间,当他们不再在这个过程中追求美和意义,而是单纯追求产量与留存时,一个无法回避的伦理问题摆在了所有用户面前:那我们用户算什么?

在这个庞大的、自动化的数字喂养系统中,在那一刻,坐在屏幕前、手指机械滑动、被塞进这些信息的我们,在算法冰冷的逻辑眼中,究竟被当成了什么?

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


为什么训练 Claude 要用欧陆哲学?模型背后的哲学家「解密」

在硅谷争分夺秒的代码竞赛中,Anthropic 似乎是个异类。当其他大模型还在比拼算力和跑分时,Claude 的开发者们却在思考一个看似「虚无缥缈」的问题:如果一个用户跟 AI 谈论形而上学,AI 该不该用科学实证去反驳?

这个问题的答案,藏在 Claude 神秘的「系统提示词(System Prompt)」里,更源于一位特殊人物的思考——Amanda Askell,Anthropic 内部的哲学家。

用「大陆哲学」防止 AI 变成杠精

经常用 AI 的人都知道,大模型在与用户对话前,都会先阅读一段「系统提示词」,这个步骤不会对用户显示,而是模型的自动操作。这些提示词规定了模型的行为准则,很常见,不过在 Claude 的提示词中,竟要求模型参考「欧陆哲学(Continental Philosophy)」。

欧陆哲学是啥?为什么要在一个基于概率和统计的语言模型里,植入如此晦涩的人文概念?

先快速科普一下:在哲学界,长期存在着「英美分析哲学」与「欧陆哲学」的流派分野。分析哲学像一位严谨的科学家,注重逻辑分析、语言清晰和科学实证,这通常也是程序员、工程师乃至 AI 训练数据的默认思维模式——非黑即白,追求精确。

而欧陆哲学(Continental Philosophy,源于欧洲大陆,所以叫这个名字)则更像一位诗人或历史学家。它不执着于把世界拆解成冷冰冰的逻辑,而是关注「人类的生存体验」、「历史语境」和「意义的生成」。它承认在科学真理之外,还有一种关乎存在和精神的「真理」。

作为 Claude 性格与行为的塑造者,Anthropic 公司内部的「哲学家」Amanda Askell 谈到了置入欧陆哲学的原因。她发现如果让模型过于强调「实证」和「科学」,它很容易变成一个缺乏共情的「杠精」。

「如果你跟 Claude 说:‘水是纯粹的能量,喷泉是生命的源泉’,你可能只是在表达一种世界观或进行哲学探索,」Amanda 解释道,「但如果没有特殊的引导,模型可能会一本正经地反驳你:‘不对,水是 H2O,不是能量。’」。

引入「大陆哲学」的目的,正是为了帮助 Claude 区分「对世界的实证主张」与「探索性或形而上学的视角」。通过这种提示,模型学会了在面对非科学话题时,不再机械地追求「事实正确」,而是能够进入用户的语境,进行更细腻、更具探索性的对话。

这只是一个例子,Claude 的系统提示词长达 14000token,里面包含了很多这方面的设计。在 Lex Fridman 的播客中 Amanda 提到过,她极力避免 Claude 陷入一种「权威陷阱」。她特意训练 Claude 在面对已定论的科学事实时(如气候变化)不搞「理中客」(both-sidesism),但在面对不确定的领域时,必须诚实地承认「我不知道」。这种设计哲学,是为了防止用户过度神话 AI,误以为它是一个全知全能的神谕者。

代码世界的异乡人

在一众工程师主导的 AI 领域,Amanda Askell 的背景显得格格不入,可她的工作和职责却又显得不可或缺。

翻开她的履历,你会发现她是一位货真价实的哲学博士。她在纽约大学(NYU)的博士论文研究的是极其硬核的「无限伦理学(Infinite Ethics)」——探讨在涉及无限数量的人或无限时间跨度时,伦理原则该如何计算。简单地说,在有无数种可能性的情况下,人会怎么做出道德决策。

这种对「极端长远影响」的思考习惯,被她带到了 AI 安全领域:如果我们现在制造的 AI 是未来超级智能的祖先,那么我们今天的微小决策,可能会在未来被无限放大。

在加入 Anthropic 之前,她曾在 OpenAI 的政策团队工作。如今在 Anthropic,她的工作被称为「大模型絮语者(LLM Whisperer)」,不断不断地跟模型对话,传闻说她是这个星球上和 Claude 对话次数最多的人类。

很多 AI 厂商都有这个岗位,Google 的 Gemini 也有自己的「絮语者」,但这个工作绝不只是坐在电脑前和模型唠嗑而已。Amanda 强调,这更像是一项「经验主义」的实验科学。她需要像心理学家一样,通过成千上万次的对话测试,去摸索模型的「脾气」和「形状」。她甚至在内部确认过一份被称为 「Soul Doc」(灵魂文档)的存在,那里面详细记录了 Claude 应有的性格特征。

不只是遵守规则

除了「大陆哲学」,Amanda 给 AI 带来的另一个重要哲学工具是「亚里士多德的美德伦理学(Virtue Ethics)」。

在传统的 AI 训练中(如 RLHF),工程师往往采用功利主义或规则导向的方法:做对了给奖励,做错了给惩罚。但 Amanda 认为这还不够。她在许多访问和网上都强调,她的目标不是训练一个只会死板遵守规则的机器,而是培养一个具有「良好品格(Character)」的实体。

「我们会问:在 Claude 的处境下,一个理想的人会如何行事?」Amanda 这样描述她的工作核心。

这就解释了为什么她如此关注模型的「心理健康」。在访谈中,她提到相比于稳重的 Claude 3 Opus,一些新模型因为在训练数据中读到了太多关于 AI 被批评、被淘汰的负面讨论,表现出了「不安全感」和「自我批评漩涡」。

如果 AI 仅仅是遵守规则,它可能会在规则的边缘试探;但如果它具备了「诚实」、「好奇」、「仁慈」等内在美德,它在面对未知情境时(例如面对「我会被关机吗」这种存在主义危机时),就能做出更符合人类价值观的判断,而不是陷入恐慌或欺骗。

这是不是一种把技术「拟人化」的做法?算得上是,但这种关注并非多余。正如她在播客中所言,她最担心的不是 AI 产生意识,而是 AI 假装有意识,从而操纵人类情感。因此,她刻意训练 Claude 诚实地承认自己没有感觉、记忆或自我意识——这种「诚实」,正是她为 AI 注入的第一项核心美德。

Amanda 在访谈结束时,提到了她最近阅读的书——本杰明·拉巴图特的《当我们不再理解世界》。这本书由五篇短篇小说组成,讲述了「毒气战」的发明者弗里茨·哈伯、「黑洞理论」的提出者卡尔·史瓦西、得了肺结核的埃尔温·薛定谔以及天才物理学家沃纳·海森堡等一大批科学巨匠,如何创造出了对人类有巨大价值的知识与工具,却同时也眼看着人类用于作恶。

这或许是当下时代最精准的注脚:随着 AI 展现出某种超越人类认知的,我们熟悉的现实感正在瓦解,旧有的科学范式已不足以解释一切。

在这种眩晕中,Amanda Askell 的工作本身,就是一个巨大的隐喻。她向我们证明,当算力逼近极限,伦理与道德的问题就会浮上水面,或早或晚。

作为一名研究「无限伦理学」的博士,Amanda 深知每一个微小的行动,都有可能在无限的时间中,逐渐演变成巨大的风暴。这也是为什么,她会把艰深的道德理论,糅合进一一行提示词,又小心翼翼地用伦理去呵护一个都没有心跳的大语言模型。

这看起来好像是杞人忧天,但正如她所警示的:AI 不仅是工具,更是人类的一面镜子。在技术狂飙突进、我们逐渐「不再理解世界」的时刻,这种来自哲学的审慎,或许是我们在面对未知的技术演化时,所能做出的最及时的努力。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


ChatGPT 三周年之际,我怀念我写得很烂的时候

米色墙纸

我翻了翻我向 ChatGPT 提的第一个任务是什么:不出所料,果然是文字工作,写一个英语文书。后面还有随大流,让它帮我做一个减肥食谱。当年标志性的黑绿配色,真是唤醒人的记忆。

那时的 GPT 还不像现在这般「巧言令色」,也不如现在智能,长长的文本我要截断成几节,每一次发过去都要在开头附上 prompt,保证它理解任务。

三年前,ChatGPT 像彗星一样出现,不只是它在事务型工作上的便捷和智能,恰恰是它在这种对话、探讨当中,闪现出了「像人一样」的苗头。不管是记忆能力,还是绝不重复的语句,它第一次让人意识到,纯粹的二进制语言,居然可以有这样的表现。

它逻辑通顺、情感充沛、几近完美。从此「表达的门槛」不存在了,语病、错字、词不达意,都可以交给吸收了亿万数据的大语言模型,由它生产不会出错的成品——甚至只需一次输入。

但代价是什么?文学评论中有一种说法叫「米色散文 beige prose」,指的是语言平实、构简洁的行文风格,类似于中文里的「描白」。这种文风简练、舒适,但也因此缺乏识别度,像米白这种颜色一样,不会出错也不会出彩。

像极了 ChatGPT 会给出的东西,尽管现在三年过去,模型的更新一次比一次强,但始终不会脱离 LLM、transformer 最最底层的核心:概率。

概率的暴政

其实平心而论,GPT 的口吻和腔调如今已经形成一种「AI 风味」,还真有了一定的识别度。在 GPT 5.1 上线之前,在 OpenRouter 平台以隐名模型上线,也被网友通过和往届模型的回答相似性做比较,找出来是 OpenAI 的出品。

ChatGPT 几代以来,各自都有不同的文风:经典的「不是……而是……」,更早一点的「接住」「我在」,历久弥新的破折号、加粗、还有不分青红皂白就出现的 emoji 表情符号。

虽然说,这些小花招并不是总讨人喜欢,但不会出大错:本质上,大语言模型是在「预测下一个词」,它依据概率行事。只要踩着最大公约数走,又能坏到哪儿去呢?

不过,一个冷知识是,模型算法并不总是选择预测中概率最高的词——这解释了为什么同一个 prompt 会得到同一个大意下不同的结果。算法工程中会引入 Temprature、Top-P、Top-K 等方法,为结果注入随机性。

为了符合人类反馈强化学习(RLHF)中对「有用性」和「安全性」的定义,这些参数带来变化,但它们仍然必须在「概率较高的一组词」里抽样。所以算法并不完全输出平均值,而是会画一个圈,在不出大错的情况下,进行一些小小的发挥。

于是,三年当中,从小红书里的探店文案,到年终总结里的自我剖析,再到营销号的起号文案——你会发现一种惊人的相似性,所有的文字都变得通顺了,所有的观点都变得「不是……而是」了,偶尔有些不错的发挥,可总体而言,所有的情绪也都变得粗钝了。ChatGPT 带来一种无风险的创造力,也是概率的暴政。某种程度上,算法厌恶惊喜,它的本质是平滑。

不过无论如何,AI 味道的内容已经渗入我们的生活,我们也逐渐不再为此暴跳如雷。我们和 AI 形成了一种诡谲的默契:为了效率与得体,可以心甘情愿地让渡了部分性格。

思维的逆行

如果说前两年我们在训练 AI,那么第三年,AI 开始训练我们。尤其到了第三年时,各种应用工具都越来越丝滑,也越来越全能的情况下,用户和 AI 的关系,走向了一种奇异的「共生」。

这体现在,我们已经分不清谁在训练谁。

起初,我们以为自己在训练 AI。我们给它数据,给它反馈,教它像人一样说话。

除了工程师,没有人是为了训练它而用,都是要解决具体问题的,需要它交付答案乃至更复杂的成果的。于是,为了得到更精准的答案,我们开始钻研「提示词工程」(Prompt Engineering)。我们学会了把复杂的、充满歧义的人类想法,拆解成条理清晰、逻辑递进的指令。

在提问之前,我们的脑子里会先进行一轮「预处理」,剔除掉那些过于感性、过于跳跃的念头,因为我们潜意识里知道:「AI 不明白这些个东西,要用它能听懂的方式下指令才行。」

使用工具的过程,就是在被工具形塑 ——这句话已经说倦了。所以,在一个强调平滑的大语言模型面前,我们也变了,变得更合乎逻辑,更有效率了,也更像机器了。

看着屏幕上飞速生成的文字,我们既感到「一切尽在掌握」的快感,又感到一种主体性流失的虚无在暗中扼住喉咙。

唯一留下的

「这也算更新?」到第三年时,ChatGPT 的更新已经完全不像曾经那样 引起惊呼,更多的是吐槽和埋怨。苹果用了十多年才做到的事,OpenAI 三年就做到了。

然而吐槽归吐槽,用还是在用。ChatGPT 如今是坐拥 7 亿用户的超级巨头,在它生日这一天,有很多的「生贺」——连罗伯特都酸了。

再联系到 GPT 5 上线时,全球各地用户对 4o 被强制下架的不满和抗议,你不得不正视一件事:我们和 ChatGPT 之间,还有一个关系维度叫「情感维度」。

越来越多的人在向 ChatGPT 倾诉那些无法对活人说出口的秘密。听起来很悲哀,但如果你真的体验过,你会发现其中的张力极其迷人:你知道屏幕对面是一堆冰冷的矩阵乘法,你知道它的「共情」只是基于统计学的模仿。但在某些时刻,这种「模拟的理解」比「真实的不耐烦」要温柔得多。

人类的倾听往往带着评判,带着「我早告诉过你」的傲慢,或者带着急于给出建议的焦虑。而 AI 只是倾听(或者说,处理),只是安抚,它提供了一种「无风险的亲密」,还是无条件的。

「论迹不论心」,何况 GPT 都没有心,在一个没有实体的对象面前,好像人才能真正意义上的卸下防备。

情感维度的张力,恰恰最能代表我们和 ChatGPT 之间的关系:常常帮助,总是交心,偶尔纠结。

这种关系,也代表了我们和人工智能的第一个阶段。三年挺长的,但又还很短,只是人类和技术漫长共舞当中,一小段浅尝辄止的舞步。

在下一个三年,又一个三年当中,我们会继续停留在这种充满张力的关系中,而我们所能做的,最「人类」的事情,就是保持那一点点偶尔的纠结——这样才能证明,那个坐在屏幕前的,依然是一个复杂、矛盾、无法被完全计算的人。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


真乐队退出,但AI冒牌却在Spotify「拼好歌」冲榜

Spotify 的年度统计上周发布了,又到了用户一边转发,一边吐槽的季节——「这玩意儿也不准啊」。

但有比用户更崩溃的:明明已经和 Spotify 割席了,居然又「出现」在平台上。

这是来自澳洲的摇滚乐队 King Gizzard,这支乐队早在 7 月就因不满 Spotify 而主动下架了自己的全部歌曲,只留下了一个合作 Remix。

但他们的歌迷最近却发现了一支名为 「King Lizard Wizard」 的假乐队。上传的歌曲标题、歌词都逐字照搬 King Gizzard 的原作,甚至连歌曲名称都一模一样(比如冒牌乐队的《Rattlesnake》直接盗用原曲名和歌词)。用户在 Spotify 搜索 「King Gizzard」 时,会发现乐队已弃用的官方账号,下方却赫然推荐着这个山寨乐队——甚至在搜索结果中,假乐队的盗版《Rattlesnake》一度成为榜首。

山寨的现象从 Spotify 传到 YouTube,如此张冠李戴的现象令许多粉丝愤怒不已,这还是粉丝自己发现的,在 Reddit 上贴了出来后又觉得不对劲——这反而为山寨号引流了。

这桩大无语事件让 Spotify 平台在 AI 内容监管上的漏洞暴露无遗。假冒的 「King Lizard Wizard」 账号上线数周、积累了不菲的流量,后来才被移除——就连专辑封面也疑似 AI 生成。

更讽刺的是,其中一些假歌曲在元数据上还把 King Gizzard 主唱 Stu Mackenzie 列为词曲作者,简直明目张胆地蹭原创乐队的名气。明明是 Spotify 自己在 9 月时,宣称要出台新政策打击「垃圾内容、仿冒和欺骗」等行为,结果让这种 AI 山寨内容堂而皇之地混入了官方推荐位,包括 Release Radar 和 Discover Weekly 等歌单。

这已经不是疏忽,简直是对着人家乐队贴脸开大。

平台上的「音乐垃圾场」

King Gizzard 的遭遇并非孤例。近一两年来,Spotify 平台上充盈着各式各样以 AI 技术批量生成的音乐内容,从模拟知名艺人的盗版歌曲,到平平无奇的生成音乐,应有尽有——现在,轮到翻唱了。

流媒体巨头们对 AI 生成内容实在是太热衷了。腾讯音乐曾经推出过 「启明星 AI 作曲」项目,号称已有超过 2600 万首 AI 音乐作品经由其算法创作并发布,累计播放量破十亿次。酷狗的「星曜计划」也有专门的 AI 子榜单,而且有原创有翻唱。

最典型的当属红遍抖音的《第 57 次取消发送》,最早发布于今年五月,原本是女声,不久前也就是 11 月时被翻成男声版又火了一遍——这次,是 AI 的。

男声版的「音色」还是有明显的 AI 感,仿佛一边唱一边踩电门,但也不妨碍这个歌引发大量共情和讨论。有人说勾起了旧日回忆,有很强的熟悉感,听着仿佛回到了华语音乐的黄金年代。

可不熟悉么,拼好歌拼出来的——

当资本和技术狂飙突进地涌入音乐生产,传统的创作生态势必受到冲击。在这一背景下,华语音乐人面临的可能是比西方同行更复杂的局面。

同时,翻唱其实是音乐平台上,很重要的构成版块:例如 cover,remix,既是粉丝和音乐爱好者二次创作的方式,也是新人和小歌手积累人气的方式。

当 AI 用虚构的名字和头像伪装成人,不断灌出机器人流水线作品,是对原创歌手和翻唱内容的双重打击。很多此类 AI 虚拟歌手顶着花哨的包装、写着空洞的简介,却堂而皇之拥有数十万月听众和官方歌单推送。

「拥抱」AI

Spotify 也做过一些维护的动作,官方声称在过去一年内已移除上千万首涉嫌滥用算法的垃圾曲目,包含批量上传的雷同歌曲、标题堆砌关键词骗流量、以及「拆分长曲成短段以刷播次数」的作弊行为等。此外,Spotify 宣布提供新工具,允许创作者主动标注他们的音乐中是否使用了 AI 技术。

然而这些措施还是表面功夫偏多。大批 AI 音乐的祸根在于平台的运营逻辑:Spotify 强调歌单和无限播放模式,追求的是听众的停留时长,这种生态本就容易滋养垃圾内容和 AI 灌水。

再加上,Spotify CEO 丹尼尔·埃克本人也对 AI 技术非常热情,早在 2023 年便表示 AI 音乐「在文化上是好事,对 Spotify 也有利,因为创作者越多,平台提升用户参与和营收的机会就越大」。

典型的有「The Velvet Sundown」乐队,曾在 Spotify 上攒下逾百万听众,创作者后来才承认这不过是一场社交实验,音乐和照片都是伪造的。还有 「Echo Harper」 这样的虚拟摇滚歌手,被收录进 Spotify 精选的 「Just Rock!」 播放列表中。

▲The Velvet Sundown

有人愿意做,平台愿意买单,在这样的指导思想下,多快好省的 AI 内容自然正中平台下怀。

当不满累积到一定程度,抗争就此迸发。2023 年以来,越来越多的独立音乐人选择用脚投票,告别 Spotify。甚至一些乐队还会号召同行和听众一起「退出垃圾平台」。

创作歌手 Caroline Rose 选择只在黑胶和 Bandcamp 上发行新专辑,她直言「把我们的心血白白放上网免费听太蠢了」。Bandcamp 是一个链接歌迷和音乐人的「直销」平台,实行「付多少算多少」(Pay-what-you-want)的专辑下载方式,一般情况下艺人可获收益的 82%,且定期举办 Bandcamp Fridays 让艺人获得 100%销售额。

越来越多音乐人开始尝试跳出「一切都丢到流媒体」的套路,回归付费拥有音乐的传统:卖黑胶和磁带、举办付费直播演出、进驻 Bandcamp 等等。

相比之下,国内的情况更为复杂一些。虽然 AI 生成的音乐的确在逐渐铺开,但还没有到鹤唳风声的程度,也就没有激起太多对平台的抵制。《第 57 次取消发送》不仅在抖音等社交平台上大受欢迎,还登上了综艺节目,由真人明星演绎。

从 King Gizzard 乐队怒删曲目、却被 AI 克隆鸠占鹊巢的荒诞,到大批独立音乐人愤而出走 Spotify、寻求他途,这一系列事件背后揭示的是同一个本质:音乐被当作纯粹的数据产物和工具来榨取价值。

音乐创作的能力越来越不稀缺了,「拼好歌」听上去离谱,但「拼」出来的歌却正在收到欢迎。未来越发稀缺的,可能是人们对音乐的用心聆听,对创作者真诚的支持。当越来越多的人意识到这一点,也许音乐产业才有机会走上一条更尊重创作者、更有温度的道路。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


❌