Normal view

There are new articles available, click to refresh the page.
Before yesterdayMain stream

ChatGPT o1 会主动思考推理的 AI,新模型发布实测总结

By: Anonymous
8 September 2024 at 12:45

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

ChatGPT o1 会主动思考推理的 AI,新模型发布实测总结

今天发布「 ChatGPT o1-preview」,是会尝试主动思考的 语言模型, Plus 订阅用户现在就可使用。

根据 OpenAI 的说法:「我们训练这些模型〔ChatGPT o1-preview〕在回应前花更多时间思考问题,就像人类一样。通过训练,它们学会精炼思考过程、尝试不同策略,并能察觉自己的错误。」「如果您正在解决科学、程序设计、数学和相关领域的复杂问题,这些增强的推理能力可能特别有用。」

我自己在讲 ChatGPT 提升工作效率的相关课程时,常常强调一个设计指令的重点:「如果我们写 AI 指令〔 prompt、提示语〕时,可以让 AI 写出自己在想什么、怎么处理任务,通常生成的内容结果会相对更好。

从用户端的角度来看「ChatGPT o1-preview」,就是在 AI 生成内容前,会先展开一步一步的思考流程,它可能会选择思考的策略与切入点,有时会提出一些批判思考,也会更仔细的分析资料细节来做深入处理。

在这个过程中,ChatGPT o1-preview」生成内容的速度其实比 GPT-4o 要慢上不少,可能需要 30~60 秒的思考时间〔或者更久〕,才会开始一步一步的生成内容。

也因为这样的「思考」过程需要耗费更多运算,所以即使是 ChatGPT Plus 用户,在使用「ChatGPT o1-preview」时也有一些限制:

也就是说,目前「ChatGPT o1-preview」比较像是「GPT-4o」的辅助,在进行一些需要深入分析资料、产出有逻辑结果的任务,或者像是科学、数学、程序代码相关领域时,可以运用。

今天这篇文章,我就从自己日常惯用的几个 AI 辅助需求:翻译、摘要、企划思考、文案,以及有时用代码写个小的角度,以实际案例测试看看,「ChatGPT o1-preview」的效果如何,并和「GPT-4o」同样指令下的结果作比较。

当然,如果能从科学、数学与代码的角度来更好,不过从我个人常用角度出发,也想验证看看 ChatGPT o1-preview 是否能满足我的日常工作需求,也提供大家参考。

下面,先提供大家下面测试案例的快速心得比较表格。

翻译结果更简洁有力,文句白话流畅。

用语更符合台湾惯用词汇。

在「白话流畅度」与「专业用语」间平衡得更好。

翻译结果相对较弱,文句不如 o1-preview 流畅。

能计算分数并回馈对错。

无需修改即可使用。

需要多次反复调整才能达到可用程度。

提供具体、逻辑分明的建议步骤和文章架构。

深入分析资料细节。

缺乏深入的分析和明确的建议。

能整理出详细的步骤和操作要点。

细节完整程度略有不足。

缺乏社交贴文所需的流畅性和吸引力。

更注重性和准确性,避免使用版权材料。

可能在细节上不够精准。

首先来试试看翻译〔英翻中〕,我通常会用下面指令来要求 ChatGPT 翻译文章:「把下面这篇 XXX 主题的文章,翻译成中文,请一段一段翻译,尽量在维持原文语意,主题风格的情况下,让上下文的语句更自然通顺,遇到专有名词时附注英文原文,并在第一遍基本翻译后,用台湾惯用词汇与语气进行最后修饰。

下图「左方」,是「ChatGPT o1-preview」翻译的结果。下图「右方」,是「GPT-4o」翻译的结果。

结论是,「ChatGPT o1-preview」花了 57 秒完成一整篇文章的翻译〔文章是 OpenAIChatGPT o1-preview」官方公告〕,但是翻译的结果比「GPT-4o」优异不少。

例如,大多数时候,ChatGPT o1-preview」翻译的文句更加简洁有力〔相对「GPT-4o」〕,可以在许多段落看到这样的差别。

ChatGPT o1-preview」翻译的结果也更白话,相对流畅,用语更符合我指定的中文用语。

ChatGPT o1-preview」在「白话的流畅度」与「专业用语」之间也相对更能拿捏得当,会让人更容易看懂,但又保持专业用语的明确性。

我让「ChatGPT o1-preview」测试直接写一个九九乘法表小工具。o1 同样会先思考撰写工具的逻辑,然后才开始写出程序代码。

我提供的指令是:「我的小孩正在练习记忆数学的 99 乘法表 ,你可以设计一个协助她练习的小游戏吗?

请一步一步分析,从简单的 2 与 5 的乘法表开始,然后练习 3、4、6、7、8、9 的乘法表,根据每一个乘法表设计一个记忆游戏,游戏一开始可以选择要练习哪一个乘法表,进入后可以随机考验该乘法表的熟练度,最好设计有游戏机制。

下面是 ChatGPT o1-preview 第一次生成的 99 乘法表小游戏,我没有做任何的修改,但是正确性、界面美化、操作流畅度都已经达到可用的程度,还会计算分数与回馈对错。

下面是旧版 GPT-4o 第一次生成的小游戏,基本界面可操作,但有一些明显错误〔如下图〕,可能还需要多几次的反复问答,才能调整正确。

我也很常跟 ChatGPT 一起讨论沟通企划案,下面是新旧版本生成的结果比较。

我提供了许多参考资料,请 AI 帮我做产品的企划报告。

ChatGPT o1-preview」在生成过程中,会主动做一些反向思考,与探索不同的报告呈现方式,并且提供一些具体的、逻辑分明的建议步骤,这些不一定有出现在我的指令中。

下面是 ChatGPT o1-preview 生成的版本,我举出其中一部分,它提出了一个撰写初稿的建议方案,并指出了一些明确的试写步骤、文章架构方向。

下面是 GPT-4o 类似段落的版本,虽然也提出了撰写初稿的建议,但整体的说明就比较一般,少了一些明确的、深入的分析与建议。

我也测试了用两个版本去摘要同一篇文章。

下面是 ChatGPT o1-preview 的版本,可以看到文章细节整理得更深入、完整、有条理。

下面是 GPT-4o 版本摘要的结果,基本架构也相似,但细节的完整程度就有一点落差。

不过,ChatGPT o1-preview 也有他不擅长的内容,目前看起来它撰写流畅文案的效果,反而没有 GPT-4o 好〔现在写文案相对效果最好的可能是 Claude 3.5 Sonnet 〕。

下面我请 AI 根据参考资料写出社交贴文上的文案。

ChatGPT o1-preview 版本,AI 会思考撰写过程,撰写时会进行更多安全性、准确性的思考,例如避免使用版权材料

但是多次尝试后, ChatGPT o1-preview 版本目前的结果,比较像是把参考资料更有结构、更有逻辑的分析整理,不太像是社交贴文。

相较之下, GPT 4o 的版本,可能细节没有那么精准,但文案比较流畅。〔如下图〕

以上就是我的初步测试案例与心得,提供大家参考。

清雨影的Blog|推荐系统如何让我们变得极端

31 August 2024 at 17:52

这个题目我想写很久了,之前我写过一篇互联网政治圈观察日志,算是描述了一下现象,我今天想猜测一下起因——以一个推荐系统工程师的身份,猜测和讨论一下推荐系统引起的那些问题。

虽然讨论推荐系统,但是我保证,这是一篇技术无关的文章,不需要任何数学的基础也可以轻松阅读,如果能对你有用,那我就再高兴不过了。文中可能会出现一些政治观点,由于本文不讨论任何政治和立场相关的内容,所有的观点都是为了举例,请务必注意。

文章自认为写的不太好,有些观点可能没有表达清楚,其中一个原因是没找到合适的作图工具,一些图形化表达很简单的观点可能表达的不是那么清晰。

CDT 档案卡
标题:推荐系统如何让我们变得极端
作者:清雨影
发表日期:2024.8.31
来源:清雨影的Blog
主题归类:信息操纵
CDS收藏:公民馆
版权说明:该作品版权归原作者所有。中国数字时代仅对原作进行存档,以对抗中国的网络审查。详细版权说明

我们为什么要有推荐系统

推荐系统的诞生,是为了解决信息过载的问题,今天人类出版书报的速度已经远远超过了单人阅读的极限,更不要说互联网,一个稍微有点人气的论坛,要读完每天的所有新帖子也是一件非常费劲的事情,以至于大一些的论坛需要许多的版主来维护。再比如知乎,每天的新问题,新回答都不是我等能阅读过来的速度,知乎需要雇佣很多人来做内容检查,删掉冲塔的,发广告的,搞黄色的……当然机器学习的NLP技术大大减少了所需要投入的岗位数量,不过这是另一个话题了。

我们从信息匮乏的过载,只用了区区几十年,面对这样过载的信息,必须要有新的技术解决。

首先是分类,比如针对书籍,我们有中国图书馆分类法。雅虎早期的内容分类目录也是这一思想的体现。事实上,这一分类法并不少见,很早我们在分类书籍的时候,就分为四大类:经史子集。以及分类生物的时候提出了7个层级:界、门、纲、目、科、属、种。今天打开腾讯的首页,仍然可以看到这些类别:新闻,视频,图片,军事,体育,NBA,娱乐,财经,科技,时尚,汽车,房产,教育,文化,星座,游戏等等。还有一些网站分为了亚洲图片,欧美图片,……咳咳。

但是信息仍然在过载,过载到了给每一个物品赋予对应的类别都很麻烦,甚至单单展示分类用的索引或者目录都很困难,要知道,互联网时代不少人的阅读能力是不高于140个字的。这个时候就有搜索引擎了,百度,谷歌,淘宝理论上都是搜索引擎(淘宝早期也是目录式的,现在以推荐+搜索为主了)。但是搜索引擎的基础是,你知道有这个东西,但是不知道在哪里。而我们往往是不知道有这个东西,大家有的时候会发出感叹:淘宝还有这个东西卖啊!就是这样的情况。

所谓的未知有两种:已知的未知,和未知的未知。前者你只是不知道答案,后者,你甚至不知道问题的存在。

这个时候,参考社会化推荐,人类开始准备做推荐系统。推荐系统的一个基础原理是,物以类聚,人以群分,并且将这个原理用数学公式体现出来。 举个例子,我爱读《三体》,但是不知道《流浪地球》,《球形闪电》,这个时候,有一个饱读大刘的朋友给我推荐这些书,那我应该是会欣然接受的。再比如,推荐系统认定我是个科幻迷,于是给我推荐科幻类的书籍,肯定比给我推荐《羊皮卷》这种洗脑书要靠谱的多。

如果我们给M个用户和N个物品都从0开始编号,并且将用户和物品的正面的交互信息(如阅读/点赞/购买)放入矩阵的小格子里,我们可以得到这样一张交互图:

img

经过推荐算法处理以后(我这里简单的用了一个SVD代替),大致是这样:

img

我们可以看到人群分为两派,一派喜欢前4种物品,另一派比较喜欢后4种物品,我们就这样把缺失值填上了,看上去问题解决了。 但是新的问题,也就从这里开始。

推荐系统为何让我们偏激

相信大家都不是粪车从门口过也要尝尝咸淡的人,所以我们大概率会集中在自己喜欢和支持的东西上——这个看上去也没什么大问题。比如饭圈之前就喜欢搞“封地自萌”,我们小圈子觉得哥哥最帅那就是最帅其实没有任何问题,哪怕出了圈子也没人认识你那哥哥姓甚名谁,你哥哥也可以天下第一。

但是这一切的前提是“人贵自知之明”,你需要知道你看到的结果是由你的历史行为形成的向量召回并且经过精排算法排序形成的,是你自己决定了自己看什么,你所在的就是一个小圈子,万万不要把它当成整个世界。

还是以饭圈为例,你的微博满屏都是你的好哥哥,但并不代表所有的人都在看你的哥哥,对你来说你的好哥哥是97%甚至100%,但是对于整个微博的流量可能只有10%,影射到生活可能之战1%都不到,毕竟大家还要回家做饭收衣服,很忙的!

不幸的是,人类就不是有自知之明的生物,之前的饭圈“破圈”,以及2.27事件就是相当的典型——一个我不认识的私域流量明星的粉丝通过举报等手段,让另一个我不熟悉的圈子(同人圈)的交流和发表作品用的网站消失。 从资本的角度看,所谓破圈是资本是不满足于收割私域流量,准备扩大收割面积,2.27事件是破圈的阵痛,是韭菜对资本无力的抵抗。 但是从普通用户的角度看,是一群异常极端的人在四处攻击他们所有看不顺眼的行为。在我看来,这些异常激动的行为的罪恶根源在于两方:推荐系统及其它原因产生的信息偏置,以及容易被偏置过的信息洗脑的人类。

支持观点A的人看到自己的首页上95%的观点都支持观点A,很高兴,支持观点B的人看到页面上99.85%都支持观点B,更加高兴。在他们看来,只不过还有5%或者0.15%的人似乎反对自己的观点。

天呐,大家都一边倒的支持自己的观点,怎么还有这么几个人冥顽不灵?

这个时候人类的另一个缺点——或者从生存的角度说是优点——就起作用了:仗势欺人,大家都觉得自己人多,自己的观点逻辑上也说得通——虽然他们的逻辑可能是基于错误事实推导出来的,但是没关系,我们现在人多,我们一人一口唾沫都能骂到你销号。

所以除了在自己的小圈子里互相转发以外,就是试图去“感化”支持自己能看到的、为数不多的、持对立观点的人。

我认为这种现象可以称作观测偏差,让人产生观测偏差,这也是洗脑的基本原理。一些政府也好、组织也罢,有目的,有组织的对互联网的内容进行注入或者删除,来达到让民众产生观测偏差,进而借此洗脑的目的。 比如我在前一篇文章里提到日本的“蓝莓星冰乐”推特,就是通过注入数据的方式,让大家觉得新冠并不是一个很严重问题,结果被日本网友掀了个底儿掉。 还有一些奇妙的机构,不仅通过注入,还通过删除的方式,让大家产生“岁月静好”,“万众一心”的错觉,就这样还经常翻车,真是“有心栽花花不开”。 这么来看,推荐系统造成的偏置只能算是“无心插柳柳成荫”。

稍微聪明一点的人会用小号或者匿名的模式去单纯的观测,可能可以得到类似:“AB两派势均力敌,但是从数据看,A暂时略胜一筹”这样较为中立的结论。

但是如果真正的从后台数据看,有可能支持观点A和观点B的人加起来不超过30%,大多数人其实支持的是更加温和的观点C,只不过他们甚至都不关心这个问题本身,所以被系统忽略了。 于是我们看到,AB两派吵得天翻地图,互相骂对方臭不可闻,是狗屎,是蛆,C则在风花雪月,聊天打牌,时不时莫名其妙被卷入AB之争当成对立面里面溅一身口水。

推特上的键政圈里这个问题尤其明显,有些观测偏差甚至不是推特在搞鬼,而是用户自己制造的:

file

比如上面这个小工具的主要作用就是:拉黑给某一条推特点赞的用户。 一般来说,有人发现了一条自己极其厌恶的推特,这个时候就可以拉黑所有给这个推特点赞的人。 本身推荐系统就有“协同过滤”之称的算法帮你过滤你不喜欢看的东西了,这个小工具可以说加剧了对立。

对立的产生本身就在于人类不愿意动脑子,不去思索为什么这些人会发让你厌恶的内容,而是单纯的觉得对方恶臭,讨厌,自己不愿意再见到。 我看到一条新闻,不需要确认其真伪,细节,只需要用我脑袋里的政治观点就可以作出评论,参见这个推特下面的评论:貴州女子高空玩兒秋千

廖雪峰老师也曾经吐槽过:

____国交警控制绿灯为过马路老人多亮了97秒,你怎么看?

我可以偏激的说一句,使用这个屏蔽点赞用户小工具的人,相当偏激,且相当容易被洗脑。因为他的脑袋里只允许装下一个观点,他的世界只能有一个声音,所有的反对意见都是这个世界的渣滓和污垢,他会认为这样的屏蔽行为只是一种“清洁”,就好像装纱窗防蚊虫一样自然。

如何对抗推荐系统

首先,你只要记住:“我看到的信息,大部分都是有偏向性的,不可轻信”,就足以对抗世界上大部分的洗脑,传销,带节奏。你甚至不用去特地对抗,因为你知道信息是有偏的,你就不会偏激。

当然,单单记住这一句话是有点问题的,毕竟我们还要靠互联网收集资料,如果不相信自己看到的信息,意味着无法获取任何有用的信息。这个时候我继续给出一个不是特别完美的解决方案:“孤证不立”。

当我们看到一个观点或者一个信息的时候,在接受它之前,首先最好能找到完整的证据链去证明它。比如你对我推荐系统“物以类聚,人以群分”的观点有疑惑,可以自己造一点数据去跑一跑诸如SVD++这样的算法,就知道我最后两张图表所言不虚。

对于一些证据不好找的内容,可以这样判断:如果你看到一些评论一边倒的内容,只有支持,没有任何反对,那这个内容肯定有问题。

要让一个内容成立,至少找到两个不同的支撑这个内容的证据,如果可以的话,最好找到反对的观点。如果实在无法确认,可以试试自己制造一些反对的观点,看看这些观点会引起怎样的讨论,或者怎样的消失,你对这个内容的可靠性心里就有数了。这样你才可以在相信与不相信之间慢慢抉择,有叫大概率作出正确判断。

所以,你最好关注一些你不喜欢的人,听一听你不喜欢的声音。尽管这么做可能对你造成不适,但是适度的不适可以让你成为一个更加开阔、理性、客观的人。成为所谓客观人不会带给你任何直接收益,但是减少偏激至少有助于防止形成极端主义,例如法西斯那样的独裁和专制。

看到喜欢的或者不喜欢的内容,切勿被一时的情绪所裹挟而冲昏了头脑,仔细想想,这个内容的作者本身可能抱有什么样的目的,作者隐藏了什么没有告诉你的内容。

以本文为例,我前面没有告诉你的是,新颖性也是推荐系统的指标之一,虽然难以评估,但是很重要。 推特并没有太多的过滤你的内容,最多是根据你的关注点赞信息给你推对应的广告,推特也有Trend这样的模块让你发现更大世界。 基于以上观点,将错误全部推给推荐系统并不对,如果你抱着前文的观点跑到互联网公司去要求他们撤掉推荐系统那就不对了,这篇文章也不是为了引起你对推荐系统的仇恨,我还是肯定推荐系统在解决信息爆炸上的价值的。

事实上,推荐系统会造成上述的问题,但是往往小于一些别有用心的人和组织进行的信息注入和删除——这是非常常见引导舆论的手段,这些特性的删除和注入的破坏力也远大于推荐系统造成的因为用户自我选择而带来的倾向性。

希望大家都能有更开阔的视野。

全球 AI 产品 Top100 出炉!只有一个国产应用进前十

By: Anonymous
19 August 2024 at 13:18

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

8 月 21 日,硅谷知名投资机构 a16z,根据近半年的数据,选出了前 100 名 应用

大多数人在使用哪些 AI 产品?哪些类别更受欢迎?用户会坚持使用哪些 AI 产品,而不是转瞬即忘?接下来,我们一起来看看。

这已经是 a16z 第三次发布 AI 百强榜单了,第一次是 2023 年 9 月,第二次是 2024 年 3 月,半年一更,频率稳定。

a16z 的评选方法是,基于 Similarweb、Sensor Tower 的数据,每 6 个月排一次名,榜单分成 2 部分:

全球 AI 产品 Top100 出炉!只有一个国产应用进前十

▲网页端前 50

▲移动端前 50

网页端和移动端的 TOP10 里,美图秀秀国际版 Meitu 属于国产,靠粘土滤镜爆红的 Remini 最开始也是出海产品,后被一家意大利公司收购。

接下来我们分门别类地谈谈,首先是通用型 AI 助手。

第三次了,ChatGPT 还是遥遥领先,在网页和移动端都拿下第一,绝对的 killer app

与此同时,ChatGPT 不如对手们增长势头猛烈。谁才是最好的 AI 助理,尚且没有定论。

▲增长指数

黄仁勋爱用的 AI 搜索 Perplexity 在网页端排名第三,并首次入围移动端榜单,正好排在第 50 名,差点名落孙山。

Perplexity 超过 7 分钟的用户平均停留时间,甚至略胜于 ChatGPT

比起 等传统搜索,Perplexity 直接提供简洁、实时、相对准确、可以引用信息来源的答案。数据说明,AI 搜索的形式在一定程度上走通了。

OpenAI 的 Sam Altman 也对这种形式保持认可,然而,OpenAI 的 AI 搜索 SearchGPT 还在小范围地内测,用户比 CEO 更着急。

ChatGPT 定位最像、竞争更直接的产品是 Claude,来自前 OpenAI 员工创立的 Anthropic。这次,Claude 的排名有所提升,在网页端排名第四,好过上个榜单的第十。

今年 6 月,Claude 推出的新功能 Artifacts 突破了聊天窗口的限制,可以实现实时可视化、互动编程等,拓展了用户与 Claude 交互的方式,好评不少。

▲Artifacts

除了早已功成名就的一代目,通用助手的赛道也有一些后起之秀。

字节跳动这次一次性上榜了五个产品:教育应用 Gauth、开发平台 Coze、通用助手豆包、豆包英文版 Cici、照片和编辑 Hypic。

除了 Hypic,其他都是首次出现在榜单,其中,豆包移动端第 26 名、网页端第 47 名,Cici 也在移动端排到第 34 名。

豆包的功能发展得很全面,并且多端覆盖,使用门槛又低,日常场景够用,所以有这么大的用户量,也在情理之中。论做产品和商业化,还得看字节。

另外,AI 助手 Luzia 首次上榜移动端,一来就是第 25 名。

你可能没有听说过这款产品,它主要服务西班牙语环境,全球拥有 4500 万名用户。最初,Luzia 作为 WhatsApp 的聊天机器人出道,但 2023 年 12 月有了独立的 app

除了什么都能聊的通用助手,消费者对于 AI 还有哪些垂直的、特别的需求?

一个重要的趋势是,大家都在用 AI 搞创作,并且创作的形式越来越丰富了。

a16z 的网页端榜单里,52% 的公司支持图像、视频音乐、语音等的内容生成和编辑。

其中包括 7 家新上榜的公司,排名还不低,视频生成工具 Luma 排在第 14 名,音乐生成工具 Udio 排在第 33 名。

和 Udio 同一个赛道、被称为音乐界 ChatGPT 的 Suno,存在感更是暴涨,从今年 3 月的第 36 名,上升到今年 8 月的第 5 名。

榜单和榜单的纵向比较也很有意思,之前的榜单里,大多数内容生成工具围绕图像。

但现在,图像生成的占比降到了 41%,只有一个图片生成工具(SeaArt)首次上榜,视频生成工具出现了三个新面孔(Luma、Viggle 和 Vidnoz)。

端新增产品

Udio 上线于今年 4 月,6 月则是 AI 视频工具爆发的一月,快手可灵、Dream Machine 的 Luma AI、Runway 的 Gen-3 Alpha 接二连三发布。

可以看到,不过半年,AI 在音乐和视频上的输出质量,都卷出了成绩。

至于移动端,最常见的创作形式是编辑图像、视频。相关工具占到榜单的 22%,是移动端的第二大产品类别。

▲Adobe Express

虽然也有初创公司涌现,但排名更高的,是那些在生成式 AI 浪潮里转型、推出更多玩法的传统创意公司。

其中有我们比较熟悉的名字,美图秀秀国际版 Meitu 在第 9 名,字节跳动旗下的照片和视频编辑器、醒图国际版 Hypic,位列第 19 名。

另外,韩国互联网巨擘 Naver 旗下的相机应用 SNOW 第 30 名,内置了 Adobe Firefly 生成式 AI 的 Adobe Express 第 35 名。

之前 washingtonpost 做过一个调查:人们会和聊天机器人说什么?他们分析了数千次对话,第一是搞黄色,第二是完成家庭作业。

最近也有一款很火的 P 肌肉应用 Gigabody,让你提前看看增肌之后的模样。它会产出很多照骗,也会打击健身人群的自信心,因为很可能练了半天,还不如 Gigabody。

举出这两个例子,是为了佐证 a16z 的结论。

a16z 移动和网页端的榜单,都出现了一个很有意思的新类别:美学和约会。

其中包括三个新入围移动端榜单的工具:LooksMax AI(第 43 名)、Umax(第 44 名)和 RIZZ(第 49 名)。

▲移动端新增产品

LooksMax 和 Umax 采集用户的照片并评分,然后给出建议,提升你的魅力。Umax 甚至会给出一个「满分模板」,也就是 AI 眼里你的完美模样。

LooksMax 不仅照顾到了颜控的看脸需求,也会分析用户声音的吸引力。

但它们的用户规模并不大,LooksMax 超过 200 万,Umax 在 100 万左右。

可能和这个赛道太卷有关,上网随便搜搜能够找到大量身体美颜滤镜,减肥、增肌、健身、变胖、换衣服,AI 都能帮忙,我们不再需要在 B 站学习复杂的 PS 教程

但这些应用的套路又都很类似,靠订阅赚钱,能赚多少是多少,Umax 每周收费 4.99 美元,LooksMax 每周收费 3.99 美元。

如果说 LooksMax 和 Umax 是认识更多发展对象的敲门砖,下一步就该用 RIZZ 了。

笨嘴拙舌的用户,可以用它提升回复约会 app 消息的水平。上传对话截图、个人资料等,RIZZ 都可以教你说些高情商表达。

古代的邹忌问身边人「吾与徐公孰美」,童话里的皇后问魔镜谁是世界上最好看的人,现在的人们则在问 AI:我怎么变得更帅、更漂亮、更有魅力,怎么不算一种科技与狠活呢?

食色性也,情感关系未必在人和人之间,也可以是人机。这次,AI 伴侣应用 Character.AI 排在移动端的第十,上次是第十六。

其实,上榜的还有一些尺度更大的 AI 伴侣应用,包括 Janitor、SpicyChat、candy.ai、Crushon 等,但 a16z 没有特别强调出来。

拿 a16z 今年 8 月的榜单和今年 3 月相比,近 30% 的公司是新公司。

如果再拿今年 3 月和去年 9 月的榜单相比,那么这个数字是 40%。

可见 AI 产品竞争之激烈和残酷,新一代 AI 原生产品和公司的发展速度,前所未有地快。

下一个爆款的 AI 产品,可能会是什么?答案或许在社交产品 Discord 出现。

a16z 发现,Discord 的流量,能够体现一个产品有没有潜力,尤其在内容生成方面。

Discord 的好处是,提供了服务器和交流社区,开发者无需构建完整的前端产品,所以它很适合作为一个沙盒,用来验证 PMF(产品与市场契合度)。

很多产品都是从 Discord 起步,构建社区,测试功能,积累用户,然后才有自己的独立,比如 Suno 和

时至今日,Midjourney 还是所有 Discord 服务器邀请流量的第一名。

▲ 在 Discord 受欢迎的 AI 公司

截至 7 月,10 家 AI 公司在所有 Discord 服务器邀请流量中排名前 100,与 1 月相比,其中一半是新秀。

AI 继续发展下去,未来可能连 app 的概念都会消失,人手一个 agent,AI 主动帮我们解决需求,但现在,我们还是从被用户选择的 app 中,一窥 AI 的可用性如何被定义。

常言道「不要创造需求」,产品的成功不在于通过广告等人为方式制造需求和虚假繁荣,而是找到并满足已经存在的、真实的需求。

AI 也是这样,融资、刷屏、炒作之后,依然是沉默的大多数,做出最诚实也最落地的投票。其中,有没有你正在使用并欣赏的产品呢?

We crunched the data to find out: Which gen AI apps are people actually using? And which are they returning to, versus dabbling and dropping?


2024 年 3 月:

Thousands of new AI-native companies are vying for attention. We crunched the data to find out: Which generative AI products are people actually using?


2023 年 9 月:
https://a16z.com/how-are-consumers-using-generative-ai/

LINE 更新群组「AI 信息摘要」怎么用?如何开关群聊重点总结与常见问题

By: Anonymous
21 March 2024 at 17:32

DUN.IM BLOG

DUN.IM BLOG

有不少人 群组都多出「 信息摘要」新功能,能够利用 AI 功能快速总结群组信息,不过你是否也发现并不是每个 LINE 群组都会出现,到底是什么情况才会跳出 LINE 信息摘要功能呢?本文就来替大家全面整理和解惑 LINE 的「AI 信息摘要」功能相关问题。

LINE AI 信息摘要是一项利用 AI 技术自动总结整理 LINE 群组信息的功能。当 LINE 群组内的信息累积到一定程度时,无需用户主动操作,AI 会在指定时间自动生成群组重点摘要,就可以替用户快速整理之前没参与到的群组重要讨论与话题,还能快速了解相关内容,方便跟上群组内对话。

至于 LINE 替群组加入 AI 信息摘要功能,主要有以下几个目的:

想使用 LINE AI 信息摘要功能方法也相当简单,只要打开群组,就会看见右下角会出现「AI 信息摘要」图标按钮,点击后就可以看见查看摘要结果。

LINE 更新群组「AI 信息摘要」怎么用?如何开关群聊重点总结与常见问题

「AI 信息摘要」功能不管是 LINE 社交管理者或所有成员,都能随时浏览信息摘要功能。只有群组内信息累积到足够量,群组就会自动在某些时间自动统整为摘要,而且 LINE AI 信息摘要功能每天最多只有 4 次使用频率。

要是在 LINE 社交内没看见群组右下角显示「AI 信息摘要」图标,有底下几个原因造成:

要是想关闭 LINE 信息摘要功能显示,可以手动通过 LINE 群设置内停用「在结果中显示此群」及「向所有人公开」任一开关后,就可以直接关闭信息摘要。

不过要提醒「AI 信息摘要」功能仅限管理者设置移除,且关闭后就无法恢复,至于群组成员无法自行决定手动关闭「AI 信息摘要」功能显示,按钮会一直停留在右下角。

LINE 信息摘要使用 的生成式 AI 模型,有可能会发生摘要结果不是 100%准确,用于摘要的信息不会保存在 OpenAI 中。

目前 LINE 群组的 AI 信息摘要无法提供给群组成员关闭,只能够由管理者手动关闭「在查找结果中显示此群」及「向所有人公开」任一群功能才能隐藏停用。

如果被摘要的信息被删除或收回,对已生成的信息摘要结果不会有任何影响,依旧能看见摘要记录。

信息摘要功能是阶段性功能更新,要是你的 LINE 未出现此功能,请稍加等待。

信息摘要功能仅限于主群组使用,不支持子群组。

Prompt Library – 沃顿商学院给教师和学生的 AI 提示词库

By: Anonymous
4 March 2024 at 12:04

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

沃顿商学院发布了一个专门用来教学的提示词库,里面包含了非常多用于学习和的提示词,同时也有一些其他很有用的提示,比如密度链总结、因果关系解释、产品发布提示和学术论文创建。我翻译了所有的提示词,感兴趣可以参考研究或者本身就是学生和教师可以收藏一下。

Prompts on this page (but no other content on the site) are licensed under Creative Commons License Attribution 4.0 International This license requires that reusers give credit to the creators (Ethan Mollick and Lilach Mollick). It allows reusers to distribute, remix, adapt, and build upon the material in any medium or format, even for commercial purposes.

本页面的提示(不包括的其他内容)采用知识共享署名 4.0 国际许可协议授权。该许可要求使用者注明原作者是 Ethan Mollick 和 Lilach Mollick。
在署名的前提下,使用者可以以任何媒介和形式自由地、改编、转换和构建这些内容,甚至可用于商业目的。但使用这些提示所产生的输出结果可能并不完全准确,风险请自负。

❌
❌