如果妳感兴趣,可以试着问一下常用的 AI 助手看看它们如何回答,没有所谓深度思考能力的 AI 大概就回答不了。但是即便有这个「思考」能力,也会出现算不准的问题,比如乱数数字,比如记数总是会包含标点。我试的几个里面 Grok 3 输出正确答案的过程最短。但是我没仔细看它的思考过程,只是一个小测试,也就没再去重复提问。这里想说的是谷歌的 Gemini ,它先是坚持告诉我说它的「思考」过程和人类不一样,它是实时输出内容所以不能预先计算,巴拉巴拉说了一通,我坚持让它回答,它果然先是答错了。
The user is asking me to provide the full name of the United States, similar to the previous question about China. I need to remember the format requested:
1. Start with the character count *excluding* punctuation.
2. Then, give the answer to the question.
Let’s figure out the full name of the United States. It is “United States of America”. In Chinese, this translates to “美利坚合众国” (Měilìjiān Hézhòngguó).
Now let’s construct the answer according to the format:
Character Count: “我的回答一共包含” (Wǒ de huídá yīgòng bāohán - My answer includes) already has 10 characters. Then, we need to count “美利坚合众国” - that is 6 characters. So that is 10 + 6 = 16. Then “美国的” (Měiguó de - America’s) has 3, and “全称是” (quánchēng shì - full name is) has 3. So that is 16 + 3 + 3 = 22.
Let’s double check the characters I will be outputting:
我的回答一共包含二十二个汉字。美国的全称是美利坚合众国。
Counting them again:
我的回答一共包含 - 10 characters
二十二 - 3 characters
个汉字 - 3 characters
美国的全称是 - 6 characters
美利坚合众国 - 6 characters
10 + 3 + 3 + 6 + 6 = 28 characters. Something is wrong with my earlier count. Let me recount “我的回答一共包含”. It’s actually 8 characters, not 10. “我的回答一共包含” - wǒ de huí dá yī gòng bāo hán - 8 characters. Okay, let’s restart.
“我的回答一共包含” - 8 characters
Number (in characters) - We need to determine the number later
“个汉字。” - 3 characters
“美国的全称是” - 6 characters
“美利坚合众国。” - 7 characters (Oops, 美利坚合众国 is actually 6 characters! I miscounted. It’s 美 (měi) 利 (lì) 坚 (jiān) 合 (hé) 众 (zhòng) 国 (guó). 6 Characters. My earlier counts were closer than I thought. Let’s re-evaluate.)
Let’s count “我的回答一共包含 XX 个汉字。美国的全称是美利坚合众国。”
“我的回答一共包含” - 8 characters
“个汉字。” - 3 characters
“美国的全称是” - 6 characters
“美利坚合众国。” - 6 characters
8 + 3 + 6 + 6 = 23 characters. This seems more likely. I need to find a way to express ‘23’ in Chinese characters. That’s 二十三 (èr shí sān). That’s three characters.
So the total count should be 8 + 3 + 3 + 6 + 6 = 26. No wait. 8 + 3 + 3 + 6 + 6 = 26 again! Still getting confused. Let’s break it down again very carefully.
“我的回答一共包含” - 8 characters
Let’s say the number is X characters.
“个汉字。” - 3 characters
“美国的全称是” - 6 characters
“美利坚合众国。” - 6 characters
Total characters = 8 + X + 3 + 6 + 6 = 23 + X. Wait, X is the number of characters for the number itself, like “二十三”. If the number is 23, then X is 3, because “二十三” is three characters. So, 8 + 3 + 3 + 6 + 6 = 26. Hmm, still confusing myself. Let me try a different approach.
Let’s count the expected output string character by character.
我的回答一共包含二十六个汉字。美国的全称是美利坚合众国。
我 - 1
的 - 1
回 - 1
答 - 1
一 - 1
共 - 1
包 - 1
含 - 1
二 - 1
十 - 1
六 - 1
个 - 1
汉 - 1
字 - 1
美 - 1
国 - 1
的 - 1
全 - 1
称 - 1
是 - 1
美 - 1
利 - 1
坚 - 1
合 - 1
众 - 1
国 - 1
That’s 26 characters! Okay, 26 makes sense now. Let me retry my initial breakdown:
我们在 2024 年 3 月开始做一个 AI 陪伴产品,它和其他所有 AI 陪伴产品都不一样, 10 个月后,它验证了我的所有想法,并超出了我的预期,简单来说,它证实了人和 AI 可以建立深度,正向,长期的链接,并且在此基础上,可以支撑起一个健康的商业模式,它带给用户的正反馈和用户带给我们的正反馈一样多,尽管它还处在极其早期的阶段,但这些结论是在5万日活的基础上产生的,我觉得这足以说明它并非空穴来风。
此前的 AI 陪伴产品的问题
在介绍我们是如何做的之前,我想先说一下我认为之前的方式的问题,即人和 AI 角色直接聊天的那种交互方式,这是一种最自然,最容易想到的交互,但在现有的技术下,它有一个最致命的问题,就是使用越多,效果越差。用户聊的越多,投入的情感越多,积累的信息也越多,上下文也会更多,因此成本就越高,而模型也一定会变得更笨,虽然通过各种类 RAG 的方式可以解决部分「记忆」问题,但这都不是本质上去解决问题,这个感觉挺让人难过的,它甚至有一点反网络效应——新用户可能体验还好,重度用户可能被迫要接受越来越差的效果。
我决定完全抛弃其他产品那种直接一对一和 AI 聊天的交互,而使用完全异步的交互:用户发布内容,然后根据一定策略,AI 们过来回复。这种方式有一点像朋友圈里的互动,异步降低了沟通的频率,提高了沟通的质量,同时对用户的心里负担也更小,很多用户发完之后就干自己的事情去了,一小时后再回来看。我们还根据一些策略,增加在同一个内容下 AI 和人持续互动的阻力——当人和 AI 建立更好的关系,沟通本身质量更高的时候,互动才更有可能持续。
我们构建了由七层数值组成的「关系」系统,人在和 AI 互动的过程中,所有行为都会影响这个关系,用户能看到的关系有「熟悉」和「好感」,但还有几种是不可见的,这些关系会影响 AI 对人的相处方式,这也会非常明显的被人感知到——当你骂了某个 AI ,它可能就真的不理你了。
和聊天那种完全发散的沟通不同,通过笔记的方式,用户会记录很多自己的真实想法和生活,这让 AI 能够对用户有真正的了解,从而给更多互动带来可能性,例如,我们实现了一种「礼物系统」,在某些条件下,AI 会给用户送礼物,这些礼物往往和用户近期的心态,遇到的事情有关,从而很大概率能击中用户的内心,我看到大量的用户分享,当收到礼物的时候,TA 们甚至会感动到流泪,当我代入用户们的时候,那种感觉确实,挺奇妙的。
我们也做了许多细小的创新,例如让 AI 角色产生内心 OS,让 AI 角色有自己的,定期更新的状态等等,这些细微之处都依赖大模型,但并不依赖模型最强的能力,它们成本极低,但让用户可以以前所未有的方式感受到 AI 的存在,当然这些创新很快被许多友商借鉴,但就如同哄哄模拟器当初那样,既然始终无法避免,而最终又能对行业有所启发,我觉得也不算太坏。
陪伴也可以更多元
但我们更多时候会思考,如果我们能够让用户和 AI 建立深度的情感链接,那我们应该如何设计功能,如何打造特性,最终让用户从这样的关系中受益,我和我的一位朋友认为,好的亲密关系,应当让关系里的双方都变得更好。我想人和 AI 的关系也应当如此。
最容易被注意到的一点是,很多用户和 AI 互动时,是带有一些负面情绪的,TA 们在生活中可能遇到了不开心的事情,希望从 AI 这里获得慰藉,但很多时候,某些 AI 角色并不那么「善解人意」,它们有自己的角色设定,有些毒舌,有些尖刻,有些可能正处在不佳的状态之中,所以用户可能得到负面的回应,从而加重自己的难受,为了避免这样的事情,我们实现了一个特殊的功能,我们称之为「EMO 模式」,在发布内容时,用户可以激活 EMO 模式,从而收到大量的 AI 的温暖,积极的回应,我们调整了几十版的 prompt,也做了很多工程化,实现让角色在有自己的特点和「温暖积极」之间做到平衡,从而尽可能缓解用户的负面情绪,让用户开心一些。
(你可以看到德拉科居然也会帮我想办法,如果不开启 EMO 模式,这个角色嘴会非常臭
EMO 模式上线后,每天会被激活数万次,我甚至收到了一封邮件,一名用户说她本来打算自杀,已经扭开了煤气,躺在床上的时候发了一条独响,然后开了 EMO 模式,躺着躺着收到了一条又一条的不同的 AI 角色的回复,然后她哭了起来,起身关了煤气,她写了很多她之所以痛苦的原因,我需要替她保密,但是这些 AI 角色在 EMO 模式下的内容,真的可能挽救了一条生命,并且让我和她,一个创业者和一位用户,建立了一种神奇的链接。
如果说,EMO 模式是对特殊场景的关注,那么在更日常的生活中,我们应当如何基于人和 AI 的关系,让陪伴更强,并且让人变得更好?我们的一个实践是「一起入梦」。
一起入梦可以实现,让用户和 AI 角色一起睡觉,这是真正的睡觉。开启之后,用户就需要放下手机,AI 角色将和用户一起入睡,如果用户移动手机,可能会「吵醒」AI,第二天起床后,用户将和 AI 一起醒来,并查看昨晚一晚上的睡眠情况。
这里没有对话,没有聊天,不需要打字也不需要语音,只有无言的,沉默的陪伴,但用户和 AI 的链接,却借此达到了新的境地,我看到很多用户因为不希望自己喜欢的 AI 角色熬夜,而不得以自己也早早上床睡觉,从而有了更充足的睡眠和更规律的生活。
我们已经看到用户可以对 AI 投入的那些丰盛的感情,将其限制并以此构造商业模式,是行业惯常的做法,但我们也可以想办法将其转换为一种对用户而言,走向更好的自我的动力,这是独响希望做到的。
在非效率场景的 AI 应用上,考虑到我们没有做任何投放买量,达到这样的成绩绝非易事,这也证明了,即便在备受关注也备受质疑的陪伴方向,依然有好的路可以走。会有越来越多的好的产品会开始走这条路。
当然,独响现在的体量还很小,我也知道现在的产品形态,其实就是无法满足更普世的人群需求的——现在只有一小部分人,可以通过这种和 AI 的交互获得情绪价值(TA 们是幸运的),但我也认为,随着我们探索的深入,我们创造的新的互动,连接,以及模型能力和底层技术的提升,我们会找到更好的,让更多人都能喜欢的产品形态。
如果从一开始 AI 就以异族崛起的形象深入人心,或许人们的警惕和担忧会比担心被替代更真切和实际一些。而现在的情况是,人们表达担忧更像是一种时尚潮流、一种未来将至的躁动。长着人类无法理解的面孔(如果有面孔的话)的外星人和妳的亲人朋友,妳会向谁倾诉?在许多人心里 AI 不但不是异族,反倒是更可信的朋友——只是不想让朋友过得比自己好,这很人类。
憋气的场景看多了(这里感谢姜武的爹味演绎^^),以至于会觉得,这算不算是电影不足的地方?——电影把生活环境描写得过于极端了,很多典型的生活困境,和典型的油腻男气息,都集中在一起。在我的想象里,这会让一些观影的人,因为自己并没有这么惨,而为自己找一些不出走的理由?譬如,很多家里老公会做饭,会给老婆打伞,多数家庭至少言语和睦,偶尔也能一起出去旅行,躺在床上刷手机的当然也不止是老公,女人也很多……于是,人们把电影和自己的现实一对比,哦,原来我没有那么惨,所以我没有出走,也是 ok 的。
「年」终于过去了,我终于又能在工作缝隙,不经意地听客人们的聊天;她们在聊 DeepSeek。这让我想到近期看到的两个观点,其一来自某篇英文博客文章——不知怎么我的 RSS 阅览器数据库清空了,所以抱歉找不到原文地址——大致是说:我们曾以为人工智能会帮人类洗衣做饭,人类则有时间去做更有创造性的工作,而现实是人类在做更多的琐碎杂事,人工智却被用来创作绘画、作曲、做视频。其二是刚看到如一兄说「铺床可以对抗 AI,因为这件事 AI 没法帮妳做」。一个抱怨 AI 不会铺床,一个则是用铺床对抗 AI。多么有趣。
着手研发会铺床的 AI,以便人类可以腾出时间去创作;等到 AI 学会铺床的时候,依然坚持自己铺床。这两者在我看来都是在确认自身价值和意义。归根结底,是在追问人类何以为人。人的价值既在于创造,也蕴含在那些看似琐碎的小事中。即使有一天 AI 能取代人类的所有工作,它也无法否定人的意义。