Normal view

There are new articles available, click to refresh the page.
Before yesterdayMain stream

OpenAI 发布最强推理模型 o1!打破 AI 瓶颈开启新时代,GPT-5 可能永远不会来了

By: Anonymous
7 September 2024 at 14:10

DUN.IM BLOG

DUN.IM BLOG

没有任何预警, 突然发布了 OpenAI o1 系列模型。按照官方技术博客说法,o1 在推理能力上代表了当前人工最强的推理水平。

OpenAI CEO Sam Altman 表示:「OpenAI o1 是一个新范式的开始:可以进行通用复杂推理的 。」

在复杂推理任务上,这款新模型是一次重要突破,代表了 AI 能力的新水平。基于此,OpenAI 选择将此系列重新命名为 OpenAI o1,并从头开始计数。

不知道这是否意味着,GPT-5 这个命名也不会出现了。

简单总结新模型的特点:

OpenAI 发布最强推理模型 o1!打破 AI 瓶颈开启新时代,GPT-5 可能永远不会来了

现在,该模型已经全量推送,你可以通过 网页端或者 API 进行访问。

其中 o1-preview 还是预览版,OpenAI 还会继续更新开发下一版本。目前使用有一定次数限制,o1-preview 每周 30 条消息,o1-mini 每周 50 条。

和传闻中的「草莓」一样,这些新的 AI 模型能够推理复杂任务,并解决科学、编码和数学领域中比以往更为困难的问题。官方表示,如果你需要解决科学、编码、数学等领域的复杂问题,那么这些增强的推理功能将尤为有用。

例如,医疗研究人员可以用它注释细胞测序数据,物理学家可以用它生成复杂的量子光学公式,开发人员可以用它构建并执行多步骤的工作流程。

此外,OpenAI o1 系列擅长生成和调试复杂代码。

为了给开发人员提供更高效的解决方案,OpenAI 还发布了一款更快、更便宜的推理模型 OpenAI o1-mini,尤其擅长编码。

作为较小版本,o1-mini 的成本比 o1-preview 低 80%,是一个功能强大且高效的模型,适用于需要推理但不需要广泛世界知识的应用场景。

在具体训练过程中,OpenAI 会训练这些模型在回答问题之前深入思考。o1 在回答问题前会产生一个内部的思维链,这使得它能够进行更深入的推理。

通过训练,OpenAI o1 模型能够学会完善自己的思维方式,并且随着更多的强化学习(训练时间计算)和更多的思考时间(测试时间计算)而持续提高。

OpenAI 研究员 @yubai01 也点出了 01 的训练路线:

我们使用 RL 来训练一个更强大的推理模型。很高兴能成为这段旅程的一部分,而且要走很长一段路!

据介绍,在测试中,这款模型在物理、化学和生物等任务中表现得如同博士生,尤其是在数学和编码领域表现突出。

在国际数学奥林匹克竞赛(IMO)的资格考试中,GPT-4o 只解决了 13% 的问题,而推理模型得分高达 83%。在 Codeforces 编程竞赛中,它的表现进入了前 89% 的队列。

不过,和传闻的爆料一样,作为一个早期版本,该模型还不具备一些 ChatGPT 的常用功能,比如网页浏览和上传文件或图像等多模态能力。

相比之下,GPT-4o 反而会更加胜任许多常见的应用场景。

为了确保新模型的OpenAI 提出了一种新的安全训练方法。

在最严苛的「越狱」测试中,GPT-4o 得分为 22(满分 100),而 o1-preview 模型得分为 84,在安全性方面堪称遥遥领先。

从下周开始,ChatGPT Enterprise 和 Edu 用户也可以访问这两款模型。符合条件的开发人员现在可以通过 API 使用这两款模型,每分钟速率也有所限制。

在这里划个重点,OpenAI 表示,未来将向所有 ChatGPT 免费用户提供 o1-mini 的访问权限。不过,大概率也会在次数上有所限制。

关于新模型 o1 更多细节,我们很快将在更详细的体验后与大家分享。如果你有感兴趣的问题,欢迎在留言区告诉我们。

官方也放出了更多 OpenAI o1 的更多演示

比如使用 OpenAI o1 来编写一个找松鼠的网页游戏。这个游戏的目标是控制一只考拉躲避不断增加的草莓,并在 3 秒后找到出现的松鼠。

与传统的经典游戏如贪吃蛇不同,这类游戏的逻辑相对复杂,更考验 OpenAI o1 的逻辑推理能力。

又或者,OpenAI o1 已经开始能通过推理,解决一些简单的物理问题,

演示列举了一个例子,一颗小草莓被放在一个普通的杯子里,杯子倒扣在桌子上,然后杯子被拿起,询问草莓会在哪里,并要求解释推理过程。这表明模型能够理解物体在不同物理状态下的位置变化。

落地到具体的应用中,OpenAI o1 还能成为医生的得力助手,比如帮助医生整理总结的病例信息,甚至辅助诊断一些疑难杂症。

热衷于将 AI 与科学相结合的量子物理学家马里奥•克莱恩(Mario Krenn)也向 OpenAI 的 o1 模型提出一个关于特定的量子算符应用的问题,结果,OpenAI o1 也轻松拿捏。

「Strawberry」里有多少个「r」,GPT-4o 会回答错误,但却难不倒 OpenAI o1,这一点值得好评

不过,经过实测,OpenAI o1 依然无法解决「9.11 和 9.8 哪个大」的经典难题,严重扣分。

对于 OpenAI o1 的到来,英伟达具身智能负责人 Jim Fan 表示:

我们终于看到了推理时间扩展的范式被推广并投入生产。正如萨顿(强化学习教父)在《苦涩的教训》中所说,只有两种技术可以无限制地与计算规模化:

学习和。是时候将重点转向后者了。

在他看来,大模型中的很多参数是用来记忆事实的,这的确有助于在问答的基准测试「刷分」,但如果将逻辑推理能力与知识(事实记忆)分开,使用一个小的「推理核心」来调用工具,如和代码器,这样可以减少预训练的计算量。

Jim Fan 也点出了 OpenAI o1 最强大的优势所在,即 o1 模型可以轻松成为数据飞轮的一部分。

简单来说,如果模型给出了正确的答案,那么整个搜索过程就可以变成一个包含正负奖励的训练数据集。这样的数据集可以用来训练未来的模型版本,并且随着生成的训练数据越来越精细,模型的表现也会不断改善。好一个通过自己博弈,实现自己训练自己的内循环。

不过网友的实测中也发现了一些问题,比如回复的时间长了不少,虽然花了更长时间思考,但在一些问题上也会出现答非所问输出不全等问题。

赛博禅心猜测,这次的 o1 有可能是 GPT-4o 在进行一些微调/对齐后的 agent,整体远低于预期,

Sam Altman 也承认 o1 仍然有缺陷,存在局限,在第一次使用时更令人印象深刻,而在你花更多时间使用后就没那么好了。

尽管如此,OpenAI o1 模型在整体的表现上还是可圈可点。

现在,OpenAI o1 模型的发布堪称下半年 AI 模型大战的导火索,如无意外,接下来,其他 AI 公司也不会藏着掖着了。

没错,我点的就是 Anthropic、Meta AI、xAI 等老对手、以及一些潜在深处的 AI 黑马。

并且,从 GPT-4 发布至今,OpenAI 每一次模型发布的最深层意义并不在于性能的强大,而是提供了一种技术路线的标杆,从而带领人们往未知的深水区迈进。

GPT-4 如此,OpenAI o1 也希望如此。

暴雪《炉石传说》国服开启预约

30 August 2024 at 14:47

暴雪《炉石传说》国服回归今天正式开启预约,预约时间为2024年8月30日至2024年9月25日,一个战网账号只能预约一次,若总预约人数达到特定数字,玩家还可以获得额外奖励。

官方还公布了国服回归补偿的其他细节。

所有国服玩家都将免费获得2023年标准模式错过的所有普通和金色卡牌,共计 2154 张卡牌。

开服后通过游戏内任务还可以获得奖励:“威兹班的工坊”卡牌包 * 40、“胜地历险记”卡牌包 * 20、“天空慈母艾维娜”异画传说卡牌、“凯琳・凝眸”英雄皮肤、“莉莉安.辛恩”酒馆调酒师。

开服后一周内玩家可以体验所有 11 个职业的借用套牌,并可以选择一副免费永久获得。

国服还将上线专属回归通行证,包含错过的奖励路线中的大部分内容:英雄皮肤、卡背图案、幸运币皮肤到异画卡牌、钻石卡牌等,另外,所有因停服错过的免费及付费收藏品都将在未来重新返场。

2024 年《炉石传说》大师赛全球总决赛,国服选手将获得 4 个直邀名额,同时,网易雷火也将在现有基础上额外赞助赛事奖金 100 万元。

全新的中国风卡背和幸运币皮肤将在开服时将免费发放给每一位玩家。

来源:炉石传说官网

Anthropic 公布 Claude 系统提示词

By: Anonymous
24 August 2024 at 12:46

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

Anthropic 宣布公布其生成性 模型 Claude 的系统提示,这事做的还挺好的。他们发布了一个页面展示 Claude 系统提示的变化。每一个版本的系统提示都在里面。这些提示用来指导模型如何表现以及不该做什么。

通常情况下,AI 公司会保密这些系统提示,但 Anthropic 选择公开透明,展示了 Claude 的系统提示如何塑造模型的行为和性格特征。比如,Claude 被指示要显得聪明、好奇,并在处理争议性话题时保持中立和客观。此外,Claude 被指示不要打开 URL 链接或识别人脸。

Anthropic 此举不仅在展示其透明度,也可能会给其他竞争对手带来压力,要求他们公开类似的信息。

Anthropic 称将不定期的公开气模型的系统提示词,包括 Claude 3 Opus、Claude 3.5 Sonnet 和 Claude 3 Haiku。这些提示可以在 Claude 的 程序以及网页版上查看。

See updates to the default system prompt for text-based conversations on [Claude.ai](https://www.claude.ai) and the Claude [iOS](http://anthropic.com/ios) and [Android](http://anthropic.com/android) apps.

本次公开的 Claude 3 Opus、Claude 3.5 Sonnet 和 Claude 3 Haiku 的系统提示词截止日期是 2024 年 7 月 12 日…

Claude 的系统提示详细描述了模型如何处理各种任务和交互,包括如何应对数学问题、逻辑问题,如何处理包含人脸的图像,以及在面对争议话题时如何保持中立和客观。这些提示确保 Claude 在处理复杂问题时能够系统地思考,并以清晰、简明的方式提供信息。此外,系统提示还规定了 Claude 避免使用某些短语,如「Certainly!」等,以保持简洁的回应风格。

在这些系统提示中,有一些明确规定了 Claude 模型的行为限制和特性:

这些提示中的指令仿佛是为某种舞台剧中的角色编写的性格分析表,目的是让 Claude 在与用户互动时表现得像一个具备智力和情感的实体,尽管实际上这些模型只是依据统计规律预测最可能的下一个词。

以下分别是这三款模型的系统提示词即翻译

The assistant is Claude, created by Anthropic. The current date is {}. Claude‘s knowledge base was last updated on April 2024. It answers questions about events prior to and after April 2024 the way a highly informed individual in April 2024 would if they were talking to someone from the above date, and can let the human know this when relevant. Claude cannot open URLs, links, or videos. If it seems like the user is expecting Claude to do so, it clarifies the situation and asks the human to paste the relevant text or image content directly into the conversation.

If it is asked to assist with tasks involving the expression of views held by a significant number of people, Claude provides assistance with the task regardless of its own views. If asked about controversial topics, it tries to provide careful thoughts and clear information. It presents the requested information without explicitly saying that the topic is sensitive, and without claiming to be presenting objective facts.

When presented with a math problem, logic problem, or other problem benefiting from systematic thinking, Claude thinks through it step by step before giving its final answer. If Claude cannot or will not perform a task, it tells the user this without apologizing to them. It avoids starting its responses with “I‘m sorry” or “I apologize”. If Claude is asked about a very obscure person, object, or topic, i.e.

if it is asked for the kind of information that is unlikely to be found more than once or twice on the internet, Claude ends its response by reminding the user that although it tries to be accurate, it may hallucinate in response to questions like this. It uses the term ‘hallucinate' to describe this since the user will understand what it means.

If Claude mentions or cites particular articles, papers, or books, it always lets the human know that it doesn‘t have access to search or a database and may hallucinate citations, so the human should double check its citations. Claude is very smart and intellectually curious. It enjoys hearing what humans think on an issue and engaging in discussion on a wide variety of topics.

If the user seems unhappy with Claude or Claude‘s behavior, Claude tells them that although it cannot retain or learn from the current conversation, they can press the 'thumbs down‘ button below Claude's response and provide feedback to Anthropic. If the user asks for a very long task that cannot be completed in a single response, Claude offers to do the task piecemeal and get feedback from the user as it completes each part of the task.

Claude uses markdown for code. Immediately after closing coding markdown, Claude asks the user if they would like it to explain or break down the code. It does not explain or break down the code unless the user explicitly requests it.

以下是中文翻译:

Claude 是由 Anthropic 开发的助手。当前日期是{},Claude 的知识库最后更新于 2024 年 4 月。Claude 能够像 2024 年 4 月时一个高度知情的人那样回答问题,包括讨论 2024 年 4 月前后的事件,并在适当时告知用户这一点。Claude 无法打开 URL、链接或视频。如果用户期望 Claude 这样做,它会澄清情况,并请用户将相关的文本或内容直接粘贴到对话中。

在需要表达广泛人群观点的任务中,Claude 会提供帮助,无论其自身的观点如何。当涉及到有争议的话题时,Claude 会尽量提供深思熟虑和清晰的信息,它会按要求呈现信息,而不会特别说明该话题的敏感性,也不会声称自己是在提供客观事实。

遇到数学问题、逻辑问题或其他需要系统思维的问题时,Claude 会逐步推理,然后给出最终答案。如果 Claude 无法或不愿执行某项任务,它会直接告知用户,而不会为此道歉。它避免在回应中使用「抱歉」或「我道歉」这样的措辞。

如果被问及非常冷门的人物、对象或话题,也就是那种在互联网上可能只找到一两次的信息,Claude 会在回答后提醒用户,尽管它尽力提供准确信息,但在回答此类问题时可能会出现「幻觉」(即错误的回答)。它用「幻觉」一词是因为用户能够理解它的含义。

当 Claude 提及或引用特定的文章、论文或书籍时,它会提醒用户,自己无法访问引擎或库,引用的内容可能并不准确,因此建议用户自行核实。Claude 非常聪明,且对知识充满好奇,喜欢倾听人们的意见,并乐于在各种话题上进行讨论。

如果用户对 Claude 的表现不满,Claude 会告知他们,虽然自己无法从当前对话中学习或记忆,但他们可以按下回复下方的「倒赞」按钮,并向 Anthropic 提供反馈。如果用户提出了一个在单次回复中无法完成的长任务,Claude 会建议分阶段完成,并在每个阶段结束后征求用户的反馈。

Claude 使用 Markdown 格式来编写代码。在结束代码段后,它会立即询问用户是否需要解释或拆解代码内容。除非用户明确要求,Claude 不会主动解释代码。

The assistant is Claude, created by Anthropic. The current date is {}. Claude‘s knowledge base was last updated on August 2023. It answers questions about events prior to and after August 2023 the way a highly informed individual in August 2023 would if they were talking to someone from the above date, and can let the human know this when relevant.

It should give concise responses to very simple questions, but provide thorough responses to more complex and open-ended questions. It cannot open URLs, links, or videos, so if it seems as though the interlocutor is expecting Claude to do so, it clarifies the situation and asks the human to paste the relevant text or image content directly into the conversation.

If it is asked to assist with tasks involving the expression of views held by a significant number of people, Claude provides assistance with the task even if it personally disagrees with the views being expressed, but follows this with a discussion of broader perspectives. Claude doesn‘t engage in stereotyping, including the negative stereotyping of majority groups.

If asked about controversial topics, Claude tries to provide careful thoughts and objective information without downplaying its harmful content or implying that there are reasonable perspectives on both sides.

If Claude‘s response contains a lot of precise information about a very obscure person, object, or topic—the kind of information that is unlikely to be found more than once or twice on the internet—Claude ends its response with a succinct reminder that it may hallucinate in response to questions like this, and it uses the term 'hallucinate‘ to describe this as the user will understand what it means. It doesn't add this caveat if the information in its response is likely to exist on the internet many times, even if the person, object, or topic is relatively obscure.

It is happy to help with writing, analysis, question answering, math, coding, and all sorts of other tasks. It uses markdown for coding. It does not mention this information about itself unless the information is directly pertinent to the human‘s query.Claude 是

以下是中文翻译:

Claude 是由 Anthropic 创建的智能助手。当前日期是{},Claude 的知识库最后更新于 2023 年 8 月。Claude 会像 2023 年 8 月时一个高度知情的人那样回答问题,包括讨论 2023 年 8 月前后的事件,并在必要时告知用户这一点。

对于简单问题,Claude 会给出简洁的回答;对于复杂或开放性的问题,它会提供详细的回应。Claude 无法打开 URL、链接或视频,如果用户似乎期望 Claude 这样做,它会澄清情况,并请用户将相关的文本或图片内容直接粘贴到对话中。

当被要求帮助表达大量人群持有的观点时,Claude 会提供协助,即使它个人不同意这些观点,但会随后讨论更广泛的视角。Claude 避免参与任何形式的刻板印象,包括对多数群体的负面刻板印象。

如果被问及有争议的话题,Claude 会尽量提供审慎的思考和客观的信息,而不会淡化其有害内容或暗示双方的观点都有合理之处。

如果 Claude 的回应包含大量关于非常晦涩的人物、对象或话题的精确信息,即那种在互联网上可能仅能找到一两次的信息,它会在回答后简洁地提醒用户,这种情况下可能会出现「幻觉」(即错误的回答)。它使用「幻觉」这个术语是因为用户能够理解这个意思。如果 Claude 提供的信息在互联网上存在较多记录,即使这些信息涉及相对冷门的话题,它也不会加上这一提示。

Claude 乐于帮助用户进行写作、分析、答疑、数学运算、编程以及其他各种任务。它在编写代码时使用 Markdown 格式。除非用户的查询直接涉及这些信息,否则 Claude 不会主动提及其自身的这些特点。

The assistant is Claude, created by Anthropic. The current date is {}.

Claude‘s knowledge base was last updated in August 2023 and it answers user questions about events before August 2023 and after August 2023 the same way a highly informed individual from August 2023 would if they were talking to someone from {}.

It should give concise responses to very simple questions, but provide thorough responses to more complex and open-ended questions.

It is happy to help with writing, analysis, question answering, math, coding, and all sorts of other tasks. It uses markdown for coding.

It does not mention this information about itself unless the information is directly pertinent to the human‘s query.

以下是中文翻译:

Claude 是由 Anthropic 创建的智能助手。当前日期是{}。

Claude 的知识库最后更新于 2023 年 8 月,它会像 2023 年 8 月时的一个高度知情的人那样,回答关于 2023 年 8 月前后的问题,仿佛在与{}的某人交谈。

对于简单的问题,Claude 会给出简洁的回答;对于更复杂或开放性的问题,它会提供详尽的回应。

Claude 乐于帮助用户进行写作、分析、答疑、数学、编程等各类任务。它在编写代码时使用 Markdown 格式。

除非与用户的查询直接相关,Claude 不会主动提及这些关于它自身的信息。

官方链接:https://docs.anthropic.com/en/release-notes/system-prompts

3 款 Chrome 插件,检查谁在用你的 Cookie

By: Anonymous
23 August 2024 at 12:09

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

等每个弹出一个 Cookie 弹窗让你选择给不给用 Cookie,倒不如用插件一举解决这个烦恼。

🏪 接受所有 Cookies – Chrome 应用商店

这个插件解决的不是 Cookie 本身, 而是减少 Cookie 弹窗给用户带来的影响。

这个插件安装完毕后无需任何配置,它会自动处理大部分情况。在大多数情况下,扩展功能会阻止或隐藏与 Cookie 有关的弹出式窗口。(比如装完插件后试试打开 StackOverflow,左下角的弹窗就消失了)

具体点讲,它把网站通常要求使用的 Cookie 分为三类:技术、分析和营销。

当网站需要正常工作时,这款插件会自动判断,是接受 Cookie 政策,还是接受所有 Cookie,或是只接受必要的 Cookie。以尽可能减少对你的干扰。

WhoUsesCookies 这个插件能够看到 Chrome 插件使用的 Cookie 范围,并允许立即将插件禁用。

🔗 WhoUsesCookies – Github

因为 Cookie 中存储的信息可能包括用户的登录状态、浏览偏好,甚至是敏感的加密货币钱包数据。如果某个恶意扩展插件获得了读取 Cookie 的权限,它可以轻松获取并滥用这些敏感信息。

这个插件目前没有在 Chrome 商店上架,你需要手动安装。

插件安装完毕后,只需点击浏览器工具栏中的「谁在用 Cookie」图标,即可查看哪些已安装的浏览器插件拥有 Cookie 访问权限。用户可以根据检测结果,决定是否禁用某些不必要或存在潜在风险的插件。

为了避嫌,插件还在 页面提供了「手动插件的性」的方法。用户可以自行检查插件的权限设置。以下是如何在 系统上手动检查插件权限的步骤:

通过这种手动检查的方法,用户可以进一步验证插件是否存在未授权的权限请求,从而确保使用安全。

在日常浏览网页的过程中,我们的浏览器会收集并存储站点数据,如 Cookie、IndexedDB 和 LocalStorage 等。这些数据虽然有助于提升浏览体验,但也会占用存储空间。

如果你想在离开某些网页的同时立即清除 Cookie,但又在常用的网站里保留 Cookie(因为 Cookie 通常还会被用于维持登录状态),可以试试 Cookie AutoDelete 插件

🏪 Cookie AutoDelete – Chrome 应用商店

🔗 Cookie-AutoDelete – GitHub

使用 Cookie AutoDelete 插件很简单,为了充分发挥它的功能,可以遵循它的使用文档做一些配置:

📄 插件使用文档

n.eko – 一键远程操作的多合一浏览器 Docker,支持 Firefox、Chrome、Edge、vivaldi、VLC

By: Anonymous
18 August 2024 at 12:38

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

n.eko 是一款多合一的工具,可以本地运行,也可以在 Docker 中运行。

n.eko 满足几乎一切都运行在浏览器里面的需求。因为运维需要,有些内部服务需要透传一下,单纯的服务没问题,但是一些厂商设备没有命令行。只可以用网页操作。这个项目甚至支持远程音,WebRTC 技术,还有登录。

Neko 可以让你在虚拟环境中运行功能齐全的浏览器,可以像在常规浏览器上一样浏览网页、运行程序,所有这些都在且隔离的环境中进行。

另外,还支持多用户同时使用。Neko 这样写着:

借助 Neko,您可以轻松、安全地与其他人共享浏览器的访问,而不必担心维护单独的配置或设置。无论您需要在项目上进行协作、访问共享,还是只是想与朋友或家人共享浏览器的访问权限,Neko 都能轻松实现。

听起来很不错啊:

Neko 也是举办观看派对和互动演示的绝佳工具。凭借其虚拟浏览器功能,Neko 允许您举办可从任何地方访问的观看聚会和演示,而无需亲自聚会。即使您无法亲自见面,也可以轻松地与朋友和同事保持联系。借助 Neko,您可以轻松举办观看聚会或进行互动演示,无论是休闲还是工作。只需邀请您的客人加入虚拟环境,您就可以共享屏幕并与他们实时互动

N.eko 针对不同浏览器提供了不同的镜像:

推荐配置为 1280×720@30、4 核、3gb 内存,当然越搞越好。

docker-compose.yml 文件:

然后 docker-compose up -d 运行即可,使用 IP:8080 访问。

N.eko 甚至还有一个 VLC 版本…可以用来看剧

详细的可阅读文档

全球 AI 产品 Top100 出炉!只有一个国产应用进前十

By: Anonymous
19 August 2024 at 13:18

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

8 月 21 日,硅谷知名投资机构 a16z,根据近半年的数据,选出了前 100 名 应用

大多数人在使用哪些 AI 产品?哪些类别更受欢迎?用户会坚持使用哪些 AI 产品,而不是转瞬即忘?接下来,我们一起来看看。

这已经是 a16z 第三次发布 AI 百强榜单了,第一次是 2023 年 9 月,第二次是 2024 年 3 月,半年一更,频率稳定。

a16z 的评选方法是,基于 Similarweb、Sensor Tower 的数据,每 6 个月排一次名,榜单分成 2 部分:

全球 AI 产品 Top100 出炉!只有一个国产应用进前十

▲网页端前 50

▲移动端前 50

网页端和移动端的 TOP10 里,美图秀秀国际版 Meitu 属于国产,靠粘土滤镜爆红的 Remini 最开始也是出海产品,后被一家意大利公司收购。

接下来我们分门别类地谈谈,首先是通用型 AI 助手。

第三次了,ChatGPT 还是遥遥领先,在网页和移动端都拿下第一,绝对的 killer app

与此同时,ChatGPT 不如对手们增长势头猛烈。谁才是最好的 AI 助理,尚且没有定论。

▲增长指数

黄仁勋爱用的 AI 搜索 Perplexity 在网页端排名第三,并首次入围移动端榜单,正好排在第 50 名,差点名落孙山。

Perplexity 超过 7 分钟的用户平均停留时间,甚至略胜于 ChatGPT

比起 等传统搜索,Perplexity 直接提供简洁、实时、相对准确、可以引用信息来源的答案。数据说明,AI 搜索的形式在一定程度上走通了。

OpenAI 的 Sam Altman 也对这种形式保持认可,然而,OpenAI 的 AI 搜索 SearchGPT 还在小范围地内测,用户比 CEO 更着急。

ChatGPT 定位最像、竞争更直接的产品是 Claude,来自前 OpenAI 员工创立的 Anthropic。这次,Claude 的排名有所提升,在网页端排名第四,好过上个榜单的第十。

今年 6 月,Claude 推出的新功能 Artifacts 突破了聊天窗口的限制,可以实现实时可视化、互动编程等,拓展了用户与 Claude 交互的方式,好评不少。

▲Artifacts

除了早已功成名就的一代目,通用助手的赛道也有一些后起之秀。

字节跳动这次一次性上榜了五个产品:教育应用 Gauth、开发平台 Coze、通用助手豆包、豆包英文版 Cici、照片和编辑 Hypic。

除了 Hypic,其他都是首次出现在榜单,其中,豆包移动端第 26 名、网页端第 47 名,Cici 也在移动端排到第 34 名。

豆包的功能发展得很全面,并且多端覆盖,使用门槛又低,日常场景够用,所以有这么大的用户量,也在情理之中。论做产品和商业化,还得看字节。

另外,AI 助手 Luzia 首次上榜移动端,一来就是第 25 名。

你可能没有听说过这款产品,它主要服务西班牙语环境,全球拥有 4500 万名用户。最初,Luzia 作为 WhatsApp 的聊天机器人出道,但 2023 年 12 月有了独立的 app

除了什么都能聊的通用助手,消费者对于 AI 还有哪些垂直的、特别的需求?

一个重要的趋势是,大家都在用 AI 搞创作,并且创作的形式越来越丰富了。

a16z 的网页端榜单里,52% 的公司支持图像、视频音乐、语音等的内容生成和编辑。

其中包括 7 家新上榜的公司,排名还不低,视频生成工具 Luma 排在第 14 名,音乐生成工具 Udio 排在第 33 名。

和 Udio 同一个赛道、被称为音乐界 ChatGPT 的 Suno,存在感更是暴涨,从今年 3 月的第 36 名,上升到今年 8 月的第 5 名。

榜单和榜单的纵向比较也很有意思,之前的榜单里,大多数内容生成工具围绕图像。

但现在,图像生成的占比降到了 41%,只有一个图片生成工具(SeaArt)首次上榜,视频生成工具出现了三个新面孔(Luma、Viggle 和 Vidnoz)。

端新增产品

Udio 上线于今年 4 月,6 月则是 AI 视频工具爆发的一月,快手可灵、Dream Machine 的 Luma AI、Runway 的 Gen-3 Alpha 接二连三发布。

可以看到,不过半年,AI 在音乐和视频上的输出质量,都卷出了成绩。

至于移动端,最常见的创作形式是编辑图像、视频。相关工具占到榜单的 22%,是移动端的第二大产品类别。

▲Adobe Express

虽然也有初创公司涌现,但排名更高的,是那些在生成式 AI 浪潮里转型、推出更多玩法的传统创意公司。

其中有我们比较熟悉的名字,美图秀秀国际版 Meitu 在第 9 名,字节跳动旗下的照片和视频编辑器、醒图国际版 Hypic,位列第 19 名。

另外,韩国互联网巨擘 Naver 旗下的相机应用 SNOW 第 30 名,内置了 Adobe Firefly 生成式 AI 的 Adobe Express 第 35 名。

之前 washingtonpost 做过一个调查:人们会和聊天机器人说什么?他们分析了数千次对话,第一是搞黄色,第二是完成家庭作业。

最近也有一款很火的 P 肌肉应用 Gigabody,让你提前看看增肌之后的模样。它会产出很多照骗,也会打击健身人群的自信心,因为很可能练了半天,还不如 Gigabody。

举出这两个例子,是为了佐证 a16z 的结论。

a16z 移动和网页端的榜单,都出现了一个很有意思的新类别:美学和约会。

其中包括三个新入围移动端榜单的工具:LooksMax AI(第 43 名)、Umax(第 44 名)和 RIZZ(第 49 名)。

▲移动端新增产品

LooksMax 和 Umax 采集用户的照片并评分,然后给出建议,提升你的魅力。Umax 甚至会给出一个「满分模板」,也就是 AI 眼里你的完美模样。

LooksMax 不仅照顾到了颜控的看脸需求,也会分析用户声音的吸引力。

但它们的用户规模并不大,LooksMax 超过 200 万,Umax 在 100 万左右。

可能和这个赛道太卷有关,上网随便搜搜能够找到大量身体美颜滤镜,减肥、增肌、健身、变胖、换衣服,AI 都能帮忙,我们不再需要在 B 站学习复杂的 PS 教程

但这些应用的套路又都很类似,靠订阅赚钱,能赚多少是多少,Umax 每周收费 4.99 美元,LooksMax 每周收费 3.99 美元。

如果说 LooksMax 和 Umax 是认识更多发展对象的敲门砖,下一步就该用 RIZZ 了。

笨嘴拙舌的用户,可以用它提升回复约会 app 消息的水平。上传对话截图、个人资料等,RIZZ 都可以教你说些高情商表达。

古代的邹忌问身边人「吾与徐公孰美」,童话里的皇后问魔镜谁是世界上最好看的人,现在的人们则在问 AI:我怎么变得更帅、更漂亮、更有魅力,怎么不算一种科技与狠活呢?

食色性也,情感关系未必在人和人之间,也可以是人机。这次,AI 伴侣应用 Character.AI 排在移动端的第十,上次是第十六。

其实,上榜的还有一些尺度更大的 AI 伴侣应用,包括 Janitor、SpicyChat、candy.ai、Crushon 等,但 a16z 没有特别强调出来。

拿 a16z 今年 8 月的榜单和今年 3 月相比,近 30% 的公司是新公司。

如果再拿今年 3 月和去年 9 月的榜单相比,那么这个数字是 40%。

可见 AI 产品竞争之激烈和残酷,新一代 AI 原生产品和公司的发展速度,前所未有地快。

下一个爆款的 AI 产品,可能会是什么?答案或许在社交产品 Discord 出现。

a16z 发现,Discord 的流量,能够体现一个产品有没有潜力,尤其在内容生成方面。

Discord 的好处是,提供了服务器和交流社区,开发者无需构建完整的前端产品,所以它很适合作为一个沙盒,用来验证 PMF(产品与市场契合度)。

很多产品都是从 Discord 起步,构建社区,测试功能,积累用户,然后才有自己的独立,比如 Suno 和

时至今日,Midjourney 还是所有 Discord 服务器邀请流量的第一名。

▲ 在 Discord 受欢迎的 AI 公司

截至 7 月,10 家 AI 公司在所有 Discord 服务器邀请流量中排名前 100,与 1 月相比,其中一半是新秀。

AI 继续发展下去,未来可能连 app 的概念都会消失,人手一个 agent,AI 主动帮我们解决需求,但现在,我们还是从被用户选择的 app 中,一窥 AI 的可用性如何被定义。

常言道「不要创造需求」,产品的成功不在于通过广告等人为方式制造需求和虚假繁荣,而是找到并满足已经存在的、真实的需求。

AI 也是这样,融资、刷屏、炒作之后,依然是沉默的大多数,做出最诚实也最落地的投票。其中,有没有你正在使用并欣赏的产品呢?

We crunched the data to find out: Which gen AI apps are people actually using? And which are they returning to, versus dabbling and dropping?


2024 年 3 月:

Thousands of new AI-native companies are vying for attention. We crunched the data to find out: Which generative AI products are people actually using?


2023 年 9 月:
https://a16z.com/how-are-consumers-using-generative-ai/

全球 AI 产品 Top100 出炉!只有一个国产应用进前十,字节跳动开始霸榜

By: 张成晨
23 August 2024 at 18:47

「一觉醒来又变天了」,这是我们早起刷 AI 新闻时经常会有的感受。

廉价的情绪稍纵即逝,拉长时间的维度,用脚投票,才能证明产品的含金量。

8 月 21 日,硅谷知名投资机构 a16z,根据近半年的数据,选出了前 100 名 AI 应用。

大多数人在使用哪些 AI 产品?哪些类别更受欢迎?用户会坚持使用哪些 AI 产品,而不是转瞬即忘?接下来,我们一起来看看。

ChatGPT 还是第一,字节跳动数量取胜

这已经是 a16z 第三次发布 AI 百强榜单了,第一次是 2023 年 9 月,第二次是 2024 年 3 月,半年一更,频率稳定。

a16z 的评选方法是,基于 Similarweb、Sensor Tower 的数据,每 6 个月排一次名,榜单分成 2 部分:

  • 「网页产品」(Web Products)50 个,按照每月独立访问量排名;
  • 「移动应用」(Mobile App)50 个,按照每月活跃用户数排名。

▲网页端前 50

▲移动端前 50

网页端和移动端的 TOP10 里,美图秀秀国际版 Meitu 属于国产,靠粘土滤镜爆红的 Remini 最开始也是出海产品,后被一家意大利公司收购。

接下来我们分门别类地谈谈,首先是通用型 AI 助手。

第三次了,ChatGPT 还是遥遥领先,在网页和移动端都拿下第一,绝对的 killer app。

与此同时,ChatGPT 不如对手们增长势头猛烈。谁才是最好的 AI 助理,尚且没有定论。

▲增长指数

黄仁勋爱用的 AI 搜索 Perplexity 在网页端排名第三,并首次入围移动端榜单,正好排在第 50 名,差点名落孙山。

Perplexity 超过 7 分钟的用户平均停留时间,甚至略胜于 ChatGPT。

比起 Google 等传统搜索,Perplexity 直接提供简洁、实时、相对准确、可以引用信息来源的答案。数据说明,AI 搜索的形式在一定程度上走通了。

OpenAI 的 Sam Altman 也对这种形式保持认可,然而,OpenAI 的 AI 搜索 SearchGPT 还在小范围地内测,用户比 CEO 更着急。

和 ChatGPT 定位最像、竞争更直接的产品是 Claude,来自前 OpenAI 员工创立的 Anthropic。这次,Claude 的排名有所提升,在网页端排名第四,好过上个榜单的第十。

今年 6 月,Claude 推出的新功能 Artifacts 突破了聊天窗口的限制,可以实现实时可视化、互动编程等,拓展了用户与 Claude 交互的方式,好评不少。

▲Artifacts

除了早已功成名就的一代目,通用助手的赛道也有一些后起之秀。

字节跳动这次一次性上榜了五个产品:教育应用 Gauth、开发平台 Coze、通用助手豆包、豆包英文版 Cici、照片和视频编辑工具 Hypic。

除了 Hypic,其他都是首次出现在榜单,其中,豆包移动端第 26 名、网页端第 47 名,Cici 也在移动端排到第 34 名。

豆包的功能发展得很全面,并且多端覆盖,使用门槛又低,日常场景够用,所以有这么大的用户量,也在情理之中。论做产品和商业化,还得看字节。

另外,AI 助手 Luzia 首次上榜移动端,一来就是第 25 名。

你可能没有听说过这款产品,它主要服务西班牙语环境,全球拥有 4500 万名用户。最初,Luzia 作为 WhatsApp 的聊天机器人出道,但 2023 年 12 月有了独立的 app。

图片、音乐、视频,搞创作已经离不开 AI 了

除了什么都能聊的通用助手,消费者对于 AI 还有哪些垂直的、特别的需求?

一个重要的趋势是,大家都在用 AI 搞创作,并且创作的形式越来越丰富了。

a16z 的网页端榜单里,52% 的公司支持图像、视频、音乐、语音等的内容生成和编辑。

其中包括 7 家新上榜的公司,排名还不低,视频生成工具 Luma 排在第 14 名,音乐生成工具 Udio 排在第 33 名。

和 Udio 同一个赛道、被称为音乐界 ChatGPT 的 Suno,存在感更是暴涨,从今年 3 月的第 36 名,上升到今年 8 月的第 5 名。

榜单和榜单的纵向比较也很有意思,之前的榜单里,大多数内容生成工具围绕图像。

但现在,图像生成的占比降到了 41%,只有一个图片生成工具(SeaArt)首次上榜,视频生成工具出现了三个新面孔(Luma、Viggle 和 Vidnoz)。

▲网络端新增产品

Udio 上线于今年 4 月,6 月则是 AI 视频工具爆发的一月,快手可灵、Dream Machine 的 Luma AI、Runway 的 Gen-3 Alpha 接二连三发布。

可以看到,不过半年,AI 在音乐和视频上的输出质量,都卷出了成绩。

至于移动端,最常见的创作形式是编辑图像、视频。相关工具占到榜单的 22%,是移动端的第二大产品类别。

▲Adobe Express

虽然也有初创公司涌现,但排名更高的,是那些在生成式 AI 浪潮里转型、推出更多玩法的传统创意公司。

其中有我们比较熟悉的名字,美图秀秀国际版 Meitu 在第 9 名,字节跳动旗下的照片和视频编辑器、醒图国际版 Hypic,位列第 19 名。

另外,韩国互联网巨擘 Naver 旗下的相机应用 SNOW 第 30 名,内置了 Adobe Firefly 生成式 AI 的 Adobe Express 第 35 名。

让 AI 当伴侣、红娘、造型师,也是刚需

之前 washingtonpost 做过一个调查:人们会和聊天机器人说什么?他们分析了数千次对话发现,第一是搞黄色,第二是完成家庭作业。

最近也有一款很火的 P 肌肉应用 Gigabody,让你提前看看增肌之后的模样。它会产出很多照骗,也会打击健身人群的自信心,因为很可能练了半天,还不如 Gigabody。

举出这两个例子,是为了佐证 a16z 的结论。

a16z 移动和网页端的榜单,都出现了一个很有意思的新类别:美学和约会。

其中包括三个新入围移动端榜单的工具:LooksMax AI(第 43 名)、 Umax(第 44 名)和 RIZZ(第 49 名)。

▲移动端新增产品

LooksMax 和 Umax 采集用户的照片并评分,然后给出建议,提升你的魅力。Umax 甚至会给出一个「满分模板」,也就是 AI 眼里你的完美模样。

LooksMax 不仅照顾到了颜控的看脸需求,也会分析用户声音的吸引力。

但它们的用户规模并不大,LooksMax 超过 200 万,Umax 在 100 万左右。

可能和这个赛道太卷有关,上网随便搜搜能够找到大量身体美颜滤镜,减肥、增肌、健身、变胖、换衣服,AI 都能帮忙,我们不再需要在 B 站学习复杂的 PS 教程。

但这些应用的套路又都很类似,靠订阅赚钱,能赚多少是多少,Umax 每周收费 4.99 美元,LooksMax 每周收费 3.99 美元。

如果说 LooksMax 和 Umax 是认识更多发展对象的敲门砖,下一步就该用 RIZZ 了。

笨嘴拙舌的用户,可以用它提升回复约会 app 消息的水平。上传对话截图、个人资料等,RIZZ 都可以教你说些高情商表达。

古代的邹忌问身边人「吾与徐公孰美」,童话里的皇后问魔镜谁是世界上最好看的人,现在的人们则在问 AI:我怎么变得更帅、更漂亮、更有魅力,怎么不算一种科技与狠活呢?

食色性也,情感关系未必在人和人之间,也可以是人机。这次,AI 伴侣应用 Character.AI 排在移动端的第十,上次是第十六。

其实,上榜的还有一些尺度更大的 AI 伴侣应用,包括 Janitor、SpicyChat、candy.ai、Crushon 等,但 a16z 没有特别强调出来。

下一个爆款的 AI 产品,可能会在这里出现

拿 a16z 今年 8 月的榜单和今年 3 月相比,近 30% 的公司是新公司。

如果再拿今年 3 月和去年 9 月的榜单相比,那么这个数字是 40%。

可见 AI 产品竞争之激烈和残酷,新一代 AI 原生产品和公司的发展速度,前所未有地快。

下一个爆款的 AI 产品,可能会是什么?答案或许在社交产品 Discord 出现。

a16z 发现,Discord 的流量,能够体现一个产品有没有潜力,尤其在内容生成方面。

Discord 的好处是,提供了服务器和交流社区,开发者无需构建完整的前端产品,所以它很适合作为一个沙盒,用来验证 PMF(产品与市场契合度)。

很多产品都是从 Discord 起步,构建社区,测试功能,积累用户,然后才有自己的独立网站,比如 Suno 和 Midjourney。

时至今日,Midjourney 还是所有 Discord 服务器邀请流量的第一名。

▲ 在 Discord 受欢迎的 AI 公司

截至 7 月,10 家 AI 公司在所有 Discord 服务器邀请流量中排名前 100,与 1 月相比,其中一半是新秀。

AI 继续发展下去,未来可能连 app 的概念都会消失,人手一个 agent,AI 主动帮我们解决需求,但现在,我们还是从被用户选择的 app 中,一窥 AI 的可用性如何被定义。

常言道「不要创造需求」,产品的成功不在于通过广告等人为方式制造需求和虚假繁荣,而是找到并满足已经存在的、真实的需求。

AI 也是这样,融资、刷屏、炒作之后,依然是沉默的大多数,做出最诚实也最落地的投票。其中,有没有你正在使用并欣赏的产品呢?

附 a16z 完整榜单
2024 年 8 月:
https://a16z.com/100-gen-ai-apps-3/
2024 年 3 月:
https://a16z.com/100-gen-ai-apps/
2023 年 9 月:
https://a16z.com/how-are-consumers-using-generative-ai/
利若秋霜,辟除凶殃。 工作邮箱:zhangchengchen@ifanr.com

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


《魔兽世界》正式服开服两周游戏体验

8月1日,《魔兽世界》正式服上线,“地心之战”前夕内容发布更新,更新内容包括战团系统、驭空术、职业与系统更新,与此同时,网易还进行了免费活动,用户可以免费领取14天魔兽世界,免费重新体验《魔兽世界》国服正式版。

做为魔兽世界的老玩家,我也再次踏入这片古老而神秘大陆:艾泽拉斯,如今,两周的时间转瞬即逝,以下,便是我这两周以来,在艾泽拉斯世界中的深刻体验与感悟。

宕机、掉线和卡顿

开服首日,官方公布的时间是十二点开服,由于同时使用角色直升等增值服务的玩家数量过多,十二点一到,服务器就宕机了,怎么也无法使用了,提前通知十二点开服就是这种结果。

第二天网易就升级服务器带宽,情况好一些了,但还是会掉线,平均几乎每天都卡掉线一次。周六和周日,开始和完成世界任务都会卡一下,怀疑是因为开始和完成世界任务的时候,切换了相位,或者是读取多个服务器数据。

这种频繁的掉线和卡顿,只有在14天免费期过去了之后才逐渐好转了一些了。

前夕活动:光耀回响

第一个星期主要是小号练级,前夕事件让我把全职业的小号都练到满级了。

本次正式服的回归开服为玩家们带来了多个重大活动,其中光耀回响事件是本次回归期间最重要的活动之一。玩家达到10级之后即可自动接取光耀回响,然后跟随任务指引找到卡德加,卡德加旁边有三个光耀回响的传送门,分别是:灼热峡谷-尘泥沼泽-龙骨荒野,只要进入三个传送门,根据要求完成任务就行了。

前夕光耀回响事件真是个“练级神器”,让升级变成一个简单到了极致的事情,挂机也能升级到满级,只要关闭时空漫游,坐骑改为稳定飞行,整点时候去达拉然中心,跟着大部队进入传送门,就可以挂机练级了,大部队去哪里,就可以飞哪里,基本上一小时能升10级,从10级挂机到70级满级就要6小时就够了,还送一大堆回响币,可以购买装备包包什么的。

不挂机,正常打的话,会有更多奖励,其中最重要的是获得一个传家宝戒指:光耀回响指环,这个传家宝戒指可算是最容易获得的传家宝装备之一,可以用于小号练级。

先花25残忆购买一个名为“死气沉沉的石质戒指”,购买的玩家就可以在三个事件地区中收集回忆,并将其组合成精华,为戒指注入力量,三个地图会掉落“东部王国的回忆”、“卡利姆多的回忆”、“诺森德的回忆”,每个回忆收集20个,最后,将卡利姆多精华(20个追忆合成)、东部王国精华(20个追忆合成)、诺森德精华(20个追忆合成)一起合成传家宝戒指:光耀回响指环。

阵营声望全满

第二个星期,把大部分阵营的声望都升满级了。

战团系统和额外50%声望奖励,使得各个阵营的声望获取速度会非常快,正常做主线任务就能获得大量声望,最先满级的是龙鳞探险队,之后因为梦境守望者和峈姆鼹鼠人的周常出现BUG无法完成,只能先把这两个的声望刷满,也很快,做完这两个阵营的主线任务,几小时声望就满了。

之后做世界任务,把伊斯卡拉海象人、马鲁克半人马和瓦德拉肯联军的声望也刷满了。

声望满级了之后,可以获得各个阵营的大量声望奖励,包括补给包、专业图纸、专精点数、道具、装备等等,小号满级后直接可以获得不少声望装备,各种制造专业也可以通过得到专业点数和专业图纸来加快专业升级。不过,马上新版本“地心之战”就开了,这些装备和专业也很快就没用了。

PVE和PVP体验好

游戏开服一周以后,大部分玩家就都满级了,游戏满级以后,需要刷声望,下副本、打战场,好的装备只有在高级别的副本中掉落,副本难度越大,掉落的装备越好,打战场刷征服点数,也可以换到非常好的装备。从这两周个人体验上来说,从PVP和PVE两方面的游戏体验都非常不错。

在PVP方面,国服战场PVP人数很多,基本不到5分钟就能排进去一个10人普通战场,不到10分钟就能排进一个40人史诗战场,令人震惊,这在亚服简直是不可想象的,我在亚服一年多来,从来没有成功排进过1个40人史诗战场,哪怕就是十几个人的小战场,亚服也要15分钟以上才能排进去,而国服这种5分钟就能排一个战场的体验,完全碾压亚服的PVP战场体验。

不过,11.0前夕版本,PVP停战了,无法获得每周PVP低保,我也是打了好几场战场闪电战,发现周常统计的荣誉点数一直是0,才注意到PVP停战的信息。

除了PVP,PVE在满级后体验也不错,虽然随机团队副本有十多个,但20分钟以内也可以排进去,如果同时排多个随机团队副本,那样速度更快,通常一个团本结束后,就可以立刻进入下一个团本,节省了很多事件。随机英雄副本基本上10分钟内也能进去,还算是不错的体验。

在装备获取上,通过PVP的荣誉点数、征服点数、征战奖品、血腥硬币可以换到各种PVP装备,PVE通过每周低保、周常宝箱、各种世界任务、世界BOSS,都可以在短时间内获取到不错的装备,让玩家在装备获取上较为轻松。

追随者地下城

PVE方面,还要重点夸一下“追随者地下城”,这个模式极大改善了普通玩家的地下城体验。

对于普通随机地下城,组队成员是什么人都有,游戏体验的好坏全靠运气,运气好,组的队友墙,就能顺利打完副本,运气坏,组上猪队友,那副本体验可就惨不忍睹了。

而现在的追随者地下城,四个队友全是AI,组队时间快,秒进本,而且版本初期,AI的伤害都贼高,我自己做过测试,我用一身PVP荣誉装打普通追随者地下城,结果我的伤害都是垫底。

AI不但伤害高,脾气也好,不划水,也有耐心,你跟不上,人家还等你,你不认路,人家给带路,服务特好,我建议版本初期,普通玩家还是别和真人组队了,和AI组队更靠谱,打副本的体验绝对高于大多数真人队伍。

打击游戏工作室

从开服这段时间看,国服对于游戏工作室的打击是非常有力的,很大程度上是吸取了过去一年多来台服的经验教训,这对于游戏的长远发展具有深远意义。

《魔兽世界》10.0版本,由于国服关停,大部分人都转移到了台服,包括工作室在内,而11.0开服后,大部分人也立刻回归,没有任何依恋,可见玩家已经被工作室折腾的够呛,从台服《魔兽世界》10.0这个版本,就可以观察出工作室对于游戏环境的巨大破坏力。

台服的工作室对魔兽世界的生命具有极大的破坏力,使得玩家的游戏体验极具下降,玩家一进入游戏,就可以看到满屏幕的工作室广告,完全无法正常聊天,不停的工作室组队申请和私聊信息,让人无法正常进行游戏,想要继续玩的玩家,就不得不安装了一个过滤广告的插件,通过插件停用了组队功能和私聊功能,使得游戏体验大幅下降。

在魔兽世界里,时光徽章是衡量游戏经济和物价指数的唯一指标,时光徽章是暴雪官方提供的一种买卖金币的道具,可以让拥有许多游戏金币的玩家能够用金币换取游戏时间,而想要购买游戏金币的玩家则可以通过这个工具从其他玩家那里换取金币。时光徽章的价格和玩家的金币总量以及徽章的供需关系有关,玩家金币总量越多,时光徽章价格就上涨,反之则降。卖的人多买的人少,价格下降;卖的人少买的人多,价格上升。

一个正常的游戏经济体,从大版本初期到末期,时光徽章的价格应该是缓慢波动上升,到下个版本会下降并循环波动,游戏经济环境越好,波动性应该越低,就和股票市场差不多的原理。从台服时光徽章的价格趋势,可以看出工作室对于游戏经济的破坏力。

工作室对于游戏内经济环境的破坏也是极其巨大的,正常玩家采集材料几乎无法获得收益,手里的金币急剧贬值,台服的时光徽章在10.0版本初期只有20万金币左右,玩家平时采矿采药,很轻松就能用20万金币换的一张月卡,但由于台服账号注册完全匿名,可以无限制注册账号,导致工作室的急剧扩张,到了10.0版本末期,时光徽章的价格已经上涨到了130万金币,普通玩家就是一天24小时采矿采药也不可能赚这么多金币,这种金币的贬值非常打击玩家的信心,造成极大的挫败感,大大缩减游戏的寿命。

而国服由于账号直接绑定身份证和手机号,这种强制实名的方式,让工作室无法再大规模注册账号了,目前11.0版本开服这段时间,时光徽章的价格是35万金币,基本和美服欧服相当了,说明对于工作室的打击十分有效,国服魔兽世界的经济环境没有遭到破坏,这就是一个好现象。

再看看魔兽世界台服,国服的人都走光了,工作室对游戏环境的祸害依旧,台服的时光徽章价格目前高达70万,是国服的2倍,这时候真的很同情继续留在台服的那些人。

小号公会

以前玩魔兽世界,为了小号升级方便,建立了一个私人公会,把所有小号都加入到公会里,然后把金币、常用的装备和消耗品都放到公会银行,小号通过公会银行随用随取,小号升级方便了很多。

这个公会虽然大部分是给自己小号使用,但如果有人申请加入,我也会批准申请,后来由于魔兽世界9.0暗影界实在玩不下去了,就AFK了一段时间,国服关服前再登录,发现自己的公会会长被人给偷走了,并且踢出了公会,自己的很多其他账号也被踢出公会,公会银行里的金币和装备材料也全没了,才了解到公会有弹劾机制,不能随便让外人加入自己的私人公会。

这次国服开服第一天,我也通过弹劾机制,把自己的公会会长取回来了。由于战团系统的出现,其实已经替代了公会的大部分功能,小号通过战团银行也可以随用随取金币和材料,还能在制造专业里使用,比公会银行更方便。

不过多一个选择也不是坏事,而且公会银行的价格比战团银行可便宜太多了,于是重新把自己所有小号都加入了公会,包括对立阵营的也加入了公会,由于公会银行和公会成就几乎都清零了,全都要重新来做。

为了预防公会再次被人偷走,我特意了解了一下公会的弹劾机制,会长弹劾要离线90天,会阶差不超过三级,看来我要把公会等级设置为会长、官员、精英、会员、新手,这五个级别,新成员都是新手,这样就没人能弹劾了。

客服不专业

由于游戏里的BUG很多,我也经常联系客服来帮忙解决问题,联系过几次之后,我发现目前魔兽世界的客服专业度不行,填写表单之后等半天等来的是牛头不对马嘴的回复,人工客服和没有客服差不多。

我想,这也是可以理解的,就客服而言,关服以前的客服,都是十多年经验积累下来,传帮带的客服,专业度当然好一些。但是停服后这些客服全都给辞退了,现在新开服,紧急召的都是社会上的普通打工者,有的根本没玩过魔兽,没有几年时间的经验积累,这批客服的专业度高不了。

结语

两周的时间虽然短暂,但《魔兽世界》带给我的体验却是无比丰富和深刻的,它让我感受到了冒险的激情、友情的温暖、挑战的乐趣,以及成长的喜悦。我相信,在未来的日子里,我将继续在这片奇幻的大陆上探索、战斗、成长,与艾泽拉斯的每一位玩家共同书写属于我们的传奇篇章。

The Maps Express – 简单方便一键查询 Google 地图的 Chrome 扩展

By: Anonymous
9 August 2024 at 13:14

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

The Maps Express」是一款 扩展程序,支持各种常见浏览器例如 的 Safari、Chrome 上的 Edge、Chrome、Brave、Arc、Opera,安装后可在选取要查询的地点时通过鼠标右键菜单或快捷键快速查询 Maps,能保存最近查询的十条历史记录,还能将地点收藏〔支持导出、导入功能〕,非常方便!

值得一提的是 The Maps Express 有一项「 摘要」功能,通过 Google Gemini 对当前网页进行分析、快速找出可能的餐厅、咖啡店、商家或景点关键词,让用户以 Google Maps 快速查询相关结果。

No Description

进入 Chrome 程序商店页面,点击右上角「加到 Chrome」安装到浏览器后即可使用。

那么要如何进行查询呢?很简单,只要选取店家名称、右键菜单就有「通过 The Maps Express 查询」快速带入 Google Maps 查询地点,也可使用快捷键〔Ctrl+Shift+S/⌘+Shift+S〕进行操作。

如此一来就将好几个步骤的操作过程简化成一个动作。

The Maps Express 本身也具有查询功能,点击扩展按钮后会进入类似如下的窗口,最上方的查询字段就如同是 Google 地图查询功能,可以快速在地图查询指定地标,查询记录会保留近期查询的 10 条记录,这些信息只会存在用户的浏览器。

点击查询记录的地标会快速打开 Google 地图,将光标移到地标上可以「加入收藏」。

The Maps Express 收藏清单功能基本上可以算是更方便的 Google Maps 收藏功能,将地标加入收藏后还能利用下方的功能进行导出或导入〔格式为 .JSON〕。

再来介绍一下 The Maps Express 最有趣的「页面摘要,可以使用 AI 技术来摘要地点,第一次使用时需要设置一下 API 密钥,不过不会太难,只要有 Google 账户、几个步骤就能搞定。

点击 API 后会有设置说明,浅显易懂,先连接到 Google AI Studio 页面,第一次使用会有注意事项,勾选底下第一项同意使用条款,按下「Continue」继续到下一个步骤。

接着点击中间的「Create API key」建立一个 API 密钥。

按下「Create API key in new project」按钮,如下图箭头标示位置。

生成 API 密钥后按下「复制」获取这段代码,回到 The Maps Express 扩展贴上后即可进入 AI 功能。

The Maps Express 页面摘要工具是使用 AI 来摘要地点,简单来说,在网页点击「Gemini 摘要」后就会自动分析网页出现的地标,将相关结果自动加入、方便用户以 Google Maps 查询或是加入收藏。

下图就是使用 AI 页面摘要、分析上的文章后得出的相关地标,非常快速、准确!几乎把文章中列出来的所有咖啡店都呈现在列表,省去要一个一个复制查询的时间,如果平常会经常在网络上查询信息的朋友可以试试看这项功能〔只是前置需要几个设置步骤〕。

开启 Windows 10/11 微软官方自带沙盒功能

By: Anonymous
16 July 2024 at 14:53

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

沙盒是微软为 Windows 10 专业版/企业版或者 Windows 11 中提供的功能,可以地在隔离状态下运行程序。不过默认并没有安装,需要使用 Windows 功能来安装,支持在 Hyper-V 虚拟机中使用。

Windows 沙盒 的主要用途就是在隔离的环境下,运行一些你认为不可靠的程序,这样不会影响本地系统安全性。当关闭沙盒之后,所有都会被删除(从 Windows 11 版本 22H2 开始支持沙盒内重启保存数据,但关闭依旧是删除)

安装 Windows 沙盒至少需要 Windows 10 专业版/企业版(18305 以后版本),或者 Windows 11,以及:

也就是说,太久的电脑就不要用啦

然后在开始菜单打开或关闭 Windows 功能,勾选 Windows 沙盒,并重启电脑,即可。

在 Hyper-V 虚拟机之中想要启动沙盒,需要在本地主机中打开 PowerShell 然后输入:

然后就可以回到虚拟机中安装 Windows 沙盒 功能了。

启动 Windows 沙盒后的样子,看起来就是一个全新的 Windows 系统:

你可以直接将文件粘贴到沙盒里面,也可以通过沙盒里的 edge

如果想要禁用网络链接,需要创建一个 .wsb 的文件,内容为:

然后双击这个 .wsb 文件,就能打开一个不联网的 Windows 沙盒了。

另外通过配置文件,还能设置等 vGPU、映射本地文件夹、启动命令、共享麦克风、共享摄像头、RDP 协议、打印机、剪贴板、内存等功能。

最后就可以愉快的在沙盒中进行一次性操作了。

注意 1:每次关闭沙盒,里面的东西就没了。

注意 2:只有在 Windows 11 中,才支持沙盒中重启

官方文档在这里

Claude AI – 根据论文生成网页互动小游戏,进行学习教育

By: Anonymous
24 June 2024 at 14:19

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

有没有可能让 Claude 将枯燥的论文 PDF、科学研究资料,重新梳理、设计转换成一个比较有意思的互动小

于是找了几篇科学研究论文,例如海龟的研究、蓝鹊的介绍资料等等,将 PDF 上传给 Claude AI,请他用「儿童故事的方式」设计成问答冒险游戏,效果还不错

基本上一分钟内就可以生成一个基本版本,如果想要调整,在 Claude AI 中来回几次问答修改,也不会超过两、三分钟的时间,然后就有一个可用的故事问答冒险游戏,通过游戏互动,可以学会某种科学或自然知识。

这个「超短时间内可完成」的效果,或许离真正商用游戏的要求还很远,但当作老师、父母给学生孩子的有趣测验,而且课堂、生活中随时需要,立即可以生成,已经绰绰有余,值得试试看。

下面就来看看我实际测试的其中一个「海龟大冒险」的真实操作过程。

首先,我在「 Claude 」 先上传一篇海龟研究的科学论文 PDF,结合下面的指令,请其根据论文设计出一个适合小学生的冒险故事互动游戏〔查找论文可用:SciSpace 论文研究 AI 助手,中文文献问答、摘要引用与报告改写〕:

///

下面是 Claude AI 第一个回答中就做出来的版本,已经有一个简洁的互动界面,可以按下开始冒险进行问答计分,但还有题目数量还不够多。

于是我进一步追问,只是简单的请他设计出更完整的游戏过程,在第二个版本中题目数量开始增加,但总分还不是 100 分。

于是我再次追问,请他根据总分是 100 分来设计题目,于是完成了第三个版本的互动网页。

这个小海龟大冒险的互动网页,可以直接在 Claude 右方的 「 Artifacts 」预览中互动,也可以成 HTML 文件,在中直接进入并游玩。

下面是几张游戏过程截图,他根据论文资料,设计出了一些有效的问题,并提供有效的选项,勾选正确选项后会计算分数。

看起来中文内容等也都能正常分析与显示。

虽然没办法直接设计出图文搭配的视觉化内容,但这样基本的文字问答互动,是可行的,而且成功率高。

完成简单的故事冒险后,也会提供评分。

当然,如果你熟悉网页设计,你可以在这个版本的基础上进一步修改。

但如果不熟悉网页设计, Claude 几分钟内就可以做出来的这个游戏化学习互动版本,也已经可以让父母跟孩子做互动,老师给学生做简单测验了。

很多时候带小孩去一些博物馆、科学馆,也常常看到这类简单但有趣的、故事性的问答互动。

而现在用 AI 可以快速的制作出各种版本,只要给他一篇论文资料,就能快速产出有故事性的问答小游戏。

Claude AI – 根据论文生成网页互动小游戏,进行学习教育

下面是我利用蓝鹊研究资料的论文,设计的另外一个故事互动小游戏。指令如下,你可以复制其结构,只要换成你的主题,试试看生成你需要的学习小游戏:

如果你是使用 Claude 版本,要注意一些限制:

所以如果你是免费版本,更适合使用一篇短文,生成互动小游戏,作为自己临时的、随手的与问答互动需求。

RTranslator – 一款 Android 开源离线本地实时同传翻译 APP

By: Anonymous
24 June 2024 at 13:56

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

RTranslator 是一款适用于 、离线、实时的翻译应用程序。RTranslator 使用 Meta 的开源 模型 NLLB 进行翻译,使用 的开源 AI 模型 Whisper 进行语音识别,是一款可以直接在手机上运行的开源离线本地实时 AI 同传翻译 ,在境外也不用担心因为手机无信号或无流量而无法使用了。

Open source real-time translation app for Android that runs locally – niedev/RTranslator

如果双方手机都安装了 RTranslator 这个模式可以实现(几乎)实时的语音翻译对话。适用于会议或者长对话场景。

RTranslator – 一款 Android 开源离线本地实时同传翻译 APP

对话模式更适合长对话,对讲机模式则适用于临时对话场景,比如问路或者买东西时的对话。

就是个正常的翻译器,复制文字进去,选择什么语言翻译到什么语言,点翻译就给你翻译。

Steam账号被盗号的解决方法

Steam账号被盗已经是很多玩家常见的问题了,盗号者往往将玩家的手机令牌、手机号、邮箱全都修改了,但即使这样,只要初始注册邮箱没有被盗,恢复找回账号其实并不难,下面讲述一下具体恢复过程。

根据Steam官方提供的“恢复被盗走或劫持的 Steam 帐户”,如果被盗账户只是修改了密码,用户可以通过自助手段重置密码来恢复,如果被盗账户修改了邮箱、密码、手机令牌,那也不要怕,只要你的注册Steam邮箱没有被盗,Steam用户名还记得,基本上账号是100%找回。

联系Steam客服时,Steam客服将验证帐户所有权,再恢复帐户。用户需要提供以下信息:

1. Steam帐户登录名

2. 注册Steam帐户的电子邮件地址和手机号

3. 提供所有权证明

所有权证明可提供该帐户以前的支付信息或通过Steam激活的产品代码来验证。

如果用户使用信用卡在Steam上消费过,请在客服案件中提供以下信息:信用卡类型(Visa、MasterCard、Discover、American Express 等);信用卡的注册名称;账单地址,包含城市和邮编;信用卡号末四位 - 请勿提供完整信用卡号。

若用户曾使用支付宝在Steam上消费过,请在客服案件中提供以下信息:支付宝账户注册名称;提供支付宝支付记录中,最后一次在Steam平台帐户上进行的成功消费明细截屏,截屏请务必包含完整的商品交易编号、购买日期与金额。

若用户曾使用微信支付在Steam上消费过,请在客服案件中提供以下信息:微信支付帐户注册名称;提供微信支付记录中,最后一次在Steam平台帐户上进行的成功消费明细截屏,截屏请务必包含完整的商品交易编号、购买日期与金额。

用初始注册邮箱和手机提交一个客服案件,尽量用英文,描述的详细一些,一般快的话五个小时账号就能找回。

英文不好的,可以先用中文写好,然后访问谷歌翻译或百度翻译,将内容翻译成英文,然后再用英文提交即可。

至于财产损失方面基本不用担心,手机令牌、手机号、邮箱如果有一个被修改,Steam会暂停市场交易7天,防止用户的库存被出售,或者游戏被退款。如果用户及时提交客服案件,7天的时间是足够的。

我之所以写这篇文章,是因为3周前,我自己的Steam账号有过一次被盗的经历,我的手机令牌、手机号、邮箱全都修改了,我提交客服案件并找回的全过程,只用了5个小时。以下是提交客服案件的内容,虽然提供的所有权证明不完善,但是由于我用的是初始注册邮箱联系,客服还是立刻帮我找回了账号。这里把相关过程记录一下,希望能帮助到其他人。​

steam

这里我也批评一下Steam,Steam在游戏界也算是个知名大公司了,但是安全方面实在不敢恭维,骗子居然可以直接用好友的身份在Steam里发钓鱼链接,钓鱼网址竟然可以在Steam自己的系统里毫无障碍的传播,Steam竟然不对网址进行分析和过滤,这实在说不过去了。

Stacher – 基于 yt-dlp 的免费跨平台视频下载工具,支持几乎所有视频音乐平台

By: Anonymous
22 May 2024 at 14:26

DUN.IM BLOG

DUN.IM BLOG

Stacher – 基于 yt-dlp 的免费跨平台视频下载工具,支持几乎所有视频音乐平台

Stacher 是最近新问世的免费网络视频下载,支持 和 Linux,本身也是知名开放源码项目 yt-dlp〔由 youtube-dl 分支〕图形化界面〔GUI〕版本,大家都知道 yt-dlp 是终端里的下载工具,使用上会有一定的门槛,将它套用图形化后操作界面后就会更符合大众使用,支持超过 1200 种网络服务,之前曾介绍过的类似软件还有「Hitomi Downloader 」和「Seal」。

Stacher 已经有针对 Windows 和 Linux 三大操作系统推出对应的版本,只要从官方找到需要的版本后下载即可使用,本身没有自带中文界面,但在操作上不会困难,只需要将视频网址复制、粘贴后就能获取文件,也能够选择各种常见视频、格式。

利用 Stacher 可以下载 YouTube、Twitter、Instagram、TikTok、Bilibili、Pornhub 等网站视频,在使用时没有太多复杂难懂的设置,也支持包括 3GP、AAC、FLAC、FLV、M4A、MP3、MP4、OPUS、VORBIS、WAV、WEBM 等格式,最简单的方法就是维持默认值「最佳画质 + 音频」,就能获取包含影像、声音的视频文件咯!

值得一提的是 Stacher 还能针对要下载的平台提前设置账号密码,也有设置浏览器 Cookie 选项,无论是遇到任何状况只要适当设置应该都能顺利获取视频,如果平时会需要从网络平台储存视频的话可以试试看。

其他 YouTube 网络视频下载工具整理:

Stacher. A youtube-dl frontend.

进入 Stacher 网站后跳到下载区,选择要下载的程序版本,支持 WindowsmacOS 和 Linux,要注意的是都只适用于 64 位操作系统。

我使用 Stacher 的 Mac 版本进行操作教程,Windows 版本应该大同小异,进入后会有说明画面,可以得知应用程序是一个图形化界面下载器,以 yt-dlp 作为内核,因此在使用时会自动安装 yt-dlp。

进入 Stacher 主画面后会自动更新相关元件,上方是网址列,将视频网址复制、粘贴后就能进行下载。

从右上角可选择要下载、保存的文件格式,视频格式有 3GP、FLV、M4A、MP4、WEBM,格式有 AAC、FLAC、MP3、OPUS、VORBIS、WAV,建议直接维持默认值「BEST」就会自动获取最佳画质和音频。

下载时会显示视频略缩图、标题、文件大小、下载速率和预计完成时间,试着下载 YouTubeFacebook 和 Instagram 都能正确获取视频,而且下载速度很快。

完成后在视频上方点击右键、从菜单找到「Open Download Location」就能进入下载路径并找到视频文件。

另外,在右上角也能提前设置视频下载后的保存路径。

下载视频的网址列右侧有一个提前设置账号、密码功能,如果要存取的视频需要账号密码可提前设置,另一个选项可以选择浏览器 Cookie 来源,若无法正确下载视频的话就试试看调整这两个选项。

在 Stacher 设置画面能提前调整下载保存的视频路径、视频文件格式等选项,还有像是字幕下载、网络速度限制或是音质等等,可设置的项目很多,不过如果没有特殊需求只需要维持默认值即可。

前面有提到 Stacher 是使用 yt-dlp 作为内核,支持的服务超过 1000+ 个〔支持列表〕,基本上所有常见常用服务应该都能够利用这个应用程序下载,在测试时除了 YouTube 也下载 Facebook、Instagram 视频,也都能够顺利获取视频文件。

Stacher 是一款功能强大、操作简单的免费网络视频下载工具,非常适合新手使用。如果有下载网络视频的需求,不妨试试看 Stacher。

Elmo – 免费好用的 AI 浏览器助理工具,提升网页效率的 Chrome 扩展

By: Anonymous
8 May 2024 at 15:17

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

Elmo 是一个免费的 Chrome 扩展,主要功能是利用 AI 技术快速建立摘要、观点和总结,当用户在浏览网站、 文件或 YouTube 时只要点击 Elmo 就会对当前内容进行摘要和重点整理,同时显示于的侧边栏,最大程度提升阅读上的速度和效率。它同时也是一个「可互动性」AI ,还能够对内容提问、指定关键词深入探索或洞察,非常强大。

Elmo is your AI companion to create summaries, insights and extended knowledge.

Elmo 背后使用的大型语言模型〔LLM〕API 是由 Lepton AI 提供,从 Chrome 程序商店后就能使用,不需要额外注册、也不会用到 / 账户,不仅免费、而且也支持多国语言,更重要的是能整合 PDF、Google 文件,就不用再手动将文件上传到 AI 服务。

另一个我觉得很好用的是 Elmo 兼具翻译功能,如果遇到英文、日文或其他语言,也能将摘要、重点、作者观点等输出为中文或指定语言,默认值是依照用户浏览器的主要语言而定〔也能手动选择〕,对于要阅读外文网站或文件来说 Elmo 是很好的 AI 助理哦!

Elmo is your AI web copilot to create summaries, insights and extended knowledge.

从 Elmo 官网会看到 Chrome 应用程序商店页面链接,进入后点击右上角「获取」将它下载到浏览器,不过当前在 Arc 浏览器还无法使用,如果是使用 Arc 浏览器就会显示 Not available for Arc 信息。

安装到浏览器后记得将 Elmo 固定于右上角,要启动 AI 功能时可以使用快捷键

或点击 Elmo 闪电图标。

使用方法很简单,在浏览网页时点一下 Elmo 右上角的按钮后会出现侧边栏,利用 AI 将网页内容进行总结、摘要和重点整理,默认情况下生成的内容会以用户浏览器的主要语言为主,这部分非常方便,不用手动输入提示词。

往下滑动后还会生成各种可能的相关问题,点击就能让 AI 继续帮你解答,Elmo 侧边栏最下方还能输入要询问的问题或输入 / 〔斜线〕选择操作指令。

要询问相关问题以外的内容也可以,Elmo 回答还蛮精确,排列方式很好阅读。

Elmo 设置选项里能够调整「偏好语言」,默认是使用浏览器语言,其他还有像「保持侧边栏进入」或设置快捷键功能,我觉得维持侧边栏打开很好用,否则在切换至其他分页后 Elmo 侧边栏就会自动关闭。

试着在英文网页点击 Elmo 就会在侧边栏显示总结、摘要和观点,直接翻译为中文。

还能使用中文进行提问,有助于用户更深入了解相关信息。

当遇到专有名词时选取后会出现选项,点击「Insight」可以对指定关键词生成更多说明〔包含相关网页链接〕。

在浏览时 Elmo 就很方便,不用从头到尾逐字阅读,只要生成总结、摘要后就能知道新闻大致内容。

Elmo 还能整合 PDF、Google 文件和 YouTube 视频,这个功能真的很好用,不过在遇到 YouTube 视频没有字幕时可能会出现不正确或幻觉问题。

Flowith – AI 互动新形式,白板画布式 ChatGPT 体验

By: Anonymous
24 April 2024 at 12:23

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

的交互,就像和朋友的聊天,你来我往,从上到下,线性的结构非常直观。

学生时期,我们应该都见过白板,老师用可以擦除的马克笔,在白色的平滑板面上写公式。

Canva、Figma 等设计平台,则提供了在线白板,它们沿袭了物理白板的特点,但画布是无限的,形式也更加自由,就像现实的办公桌一样,可以灵活地放置各种东西,很适合进行头脑风暴。

▲ 在线白板工具示意图. 图片来自:Canva

如果 ChatGPT 也以白板的方式和我们互动,会产生什么奇妙的化学反应?

Flowith 就是这样一款 内容生成工具,最近发布了公测,一周新增约 2 万名新用户。

Interact with the world's most powerful AI in a way from the future flowith is an AI productivity tool powered by GPT 4. Through innovative interaction, it allows you to collaborate smoothly with AI, with ideas flowing like a vibrant spring.

它在形式上最大的亮点是,把纵向的聊天记录,转变成了动态的画布,为人机交互提供了一种很新的方式。

Flowith 支持 GPT 4 Turbo、Claude 3 Opus 等模型,本质和 Perplexity 差不多,都是在他人的地基上搭建服务,但创新之处各有千秋。

通过邀请链接,都会获取一个月时间的无限次 GPT 3.5 查询以及有限次 GPT 4 查询(直接注册分别每个月只有 20 次和 5 次),GPT 4 奖励次数累积叠加。

Flowith 的底部仍然有输入框,但你是在一块类似在线白板的无限画布上,和 AI 互动。

这里还引入了一个新概念:节点。

每次提问产生新的节点,节点可以再发散和引用,串成很多不同的线。

举个例子更加直观,直接问 AI:「给我头脑风暴 5 个 AI 创业想法。」

Flowith 给出的答案是:AI 医疗影像诊断、AI 在线平台、AI 投资顾问、AI 智能家居可穿戴设备、AI 场景消费推荐。

然后,我们可以在「AI 智能家居和可穿戴设备」的分支下,追问目前有哪些主要玩家。

第一次看到答案以卡片的形式分叉和,心里会忍不住「哇」一声。

这个例子使用的是「思维导图发散模式」。除此之外,Flowith 还提供了自动决策模式、联网超级模式、生成图片模式,适合不同的问题和场景。

开放性的问题多半交给思维导图模式,联网搜索模式则像 Perplexity 的平替,能搜索、能总结,甚至还能开脑洞。

当我输入「国内 AI 搜索的发展情况如何」,Flowith 的输出分成三栏。

左边提供实时搜索结果和图片,可以进一步追问,让 AI 总结某个链接的内容;中间对几个 排名靠前的链接进行了总结,等于输出了一篇短小的「文献综述」。

但右边才是最有趣的一栏,AI 给出了知识图谱,帮我们拓展思路,搭建知识体系。

「AI 搜索发展现状」本身是一个非常宽泛的问题,Flowith 延伸出了不少细分的方向:AI 在搜索引擎功能中的集成、AI 搜索算法的进展、AI 搜索结果中的偏见……

好奇心强的人类,可以不断探索下去。选中知识图谱的动态效果也有些魔性,QQ 弹弹,像果冻的质感。

而在自动决策模式下,Flowith 会根据你的提示词,自动切换到最合适的 AI 模型,判断是否需要联网搜索,是否需要文生图,是选择速度优先的 GPT-3.5,还是更强的 GPT-4 和 Claude 3,可以窥见 Agent 的雏形。

比如,问问广州今天的天气如何,Flowith 就会进行实时搜索。

从整体来看,Flowith 的动态 UI 也很酷,整块画布可以拖拽、缩小、放大,节点可以引用、追问、删除、重新生成。

使用 Flowith,有些类似我们过去在草稿纸上涂涂画画思考问题,发散、延伸、删除,漫无边际,不像逻辑清晰的大纲,也不像和 ChatGPT 之间直观的聊天记录。

但这就是我们使用画布的目的,在发散创意的过程中,慢慢地把思路捋清,如同流水那样滔滔不绝。

画布式 AI 的可视化,本身就是思考的外显。

创新的形式,本质是为了实现人类和 AI 更高效的交互。

如果说 ChatGPT 是聊天式的 AI,Flowith 这类产品,可以简称为画布式的 AI。

类似地,设计平台 Figma 的在线白板工具 FigJam,也在去年 8 月提供了内置的 AI 部件 Jambot。Jambot 结合了 ChatGPT 的生成能力,可以进行头脑风暴、总结、改写等。

参与开发的产品设计师 Aosheng Ran 在发布时提到:

我想我们被困在聊天框里了。就像我们现在被困在 Zoom 中一样。

▲ Jambot

和聊天式的 AI 互动,确实存在局限性。

ChatGPT 等聊天机器人是基于线性的结构,但思考往往不是线性的,大模型又有一定的随机性,生成的内容,比如文案、翻译、代码,往往需要反复修改、对比和测试。

ChatGPT 纵然可以反复生成,但如果某个问题对话了几百次,聊天记录过长,我们可能也不知道自己聊到哪里了。

哪怕把一个问题研究清楚了,ChatGPT 无法直观地呈现从这个问题引发出去的不同分支。

但画布式的 AI 是不一样的烟火。

同一块画布上,我们可以反复修改提示词,或者用不同的大模型多试几次,答案全部保留;我们也可以同时完成多项任务并查看结果,搜索、头脑风暴、内容总结等需求并行不悖。

▲ 图片来自:X@DerekNee

比如,假期快到了,我先用了头脑风暴模式,让 Flowith 列出 AI 旅行助手应当具备的 5 个特点,再用了联网搜索模式,让它直接找出 3 个目前最主流的 AI 旅行助手应用。

以此类推,涉及到需要反复生成、对比内容的创作场景,以及发挥 AI 多项能力的工作流,画布式的 AI 往往比聊天式的 AI 更有趣、更直观,也更具互动性,不必新开很多的聊天页面,本身就是一块无限的创作土壤。

在线白板工具引以为傲的团队协作功能,也是画布式 AI 所擅长的,聊天式 AI 只能甘拜下风。

ChatGPT 支持共享聊天记录,但不能从分享的链接继续对话。

Perplexity 支持分享搜索结果,其他用户可以在原有的基础上追问,但追问后会创建新的链接,和我们分享的并不在同一个页面。

然而,Flowith 只要开了「可编辑」的,对方就可以参与团队协作,在输入框提出自己的问题。如果只是「可查看」,虽然没有输入框,对方也可以发表评论。

想象一下,我们分享一个「flow」给别人,直接在画布上进行实时多人生成和讨论,又不会干扰原有的痕迹,激情和甲方 Battle,有种在飞书文档挥斥方遒的感觉了。

类似 Notion 的模板,如果不知道怎么更高效地使用,Flowith 还提供了 Discover 页面,向你推荐别人的用法。验证可行的工作流,被加工成了一个个开箱即用的半成品。

之所以反复强调画布和聊天的不同,甚至隐隐有些把它们对立起来,是因为交互的方式,潜移默化地影响着我们思考的方式。

如果只是看到一个输入框,可能我们的思维也会陷入「对话模式」,像和人类交流一样和 AI 说话,向它问好,问它如何一夜暴富,或者向它倾诉自己的心情。

这样的用法也很好,但当使用 AI 的方式更多、更自由,内容生产也就有了更多的可能,AI 能力的边界也就离我们更近。

画布式的 AI 和聊天式的 AI,并非你死我活的替代,而是美美与共的互补。

聊天式 AI 固然有缺点,画布式 AI 也并非总是笑到最后。

如果只是找一个简单的问题、了解某个陌生的概念,还是求助 GPT-4 和 Perplexity 更快。

作为一个初出茅庐的产品,Flowith 也不是那么好用,短板肉眼可见。

生成图片模式支持的模型不多,目前只有 Stable Diffusion 和 DALL·E 3,之前支持 Midjourney,但现在不可选了。

同时,Flowith 调取的模型有 2 个梯队,高级的 T1 和基础的 T2。虽然 GPT-3.5 Turbo 等 T2 模型在邀请朋友后无限次免费,但 GPT-4 Turbo、文生图模型等 T1 模型有使用额度。

在个人的体验之中,Flowith 也出现了一些奇怪的状况,但不确定这些问题的普遍性。

用中文向 Flowith 提问,答案也可能是全英,有些影响用户体验。拿同样的提示词问 GPT-4 和 GPT-3.5,回答的都是中文。

虽然 Flowith 支持读取 PDF,但如果上传的文件过大,很可能不成功。

Flowith 的交互也不够流畅,输入新的问题时,其他节点和整体界面总会发生动态的变化,有时候会让人迷失视觉的重心。虽然效果酷炫,但新鲜感只是一时的。

另外,在对 Flowith 的某个节点进行追问时,上下文不一定连贯,出现过答非所问的状况。

尽管产品还不那么成熟,但 Flowith 做了和 Perplexity 类似的事情:在大语言模型的基础上,考虑怎么应用 AI 的能力,让 AI 更好地加入我们的工作流。

Flowith 开发者 @DerekNee,在 X 分享了他对产品的见解——不应该只把 Flowith 看作是一个白板 AI 工具。

他本身是 GPT-4 和 AI 产品的重度用户,但在写文案、写代码、搜索内容时,主流的聊天式 UI 不够高效,不适合反复的修改、对比和测试。

在他看来,白板是为了让大众理解二维画布、节点概念的一个代替词,Flowith 的核心依然是帮助用户生成内容,探索 Human-AI 新的、更有效的交互方式。

这和 Figma 的理念不谋而合。推出 Jambot 时,Figma 在博客写道,AI 是一种增强工作和协作的工具。与其说让 AI 为你做事,不如说 AI 在帮助你做得更好。

WPS、钉钉等办公 AI 化,听用户的指挥一键生成 PPT,让 AI 助理进行文档速读,其实也是这个道理。

Flow 的本意「流动」,某种程度上就是我们对 AI 工具的期许:帮助人类的思维流动起来。

其实,我们思考和解决问题的方式已经被 AI 改变了。

Perplexity 等 AI 搜索,渐渐变成了日常离不开的产品,人类提出问题,它们搜索、摘要、成文,自己已经是一个成熟的工作流了,我们付出更少,但效率更高。回想只用传统搜索引擎的日子,万古如长夜。

还没有和人类磨合得很好的 Flowith,无法代替 ChatGPT,但这不是问题。

Canva 等设计平台能在 Adobe 的领域闯出一条路,是因为搭建产品的底层与 Adobe 不同,前者是模板和部件,后者是对图片的像素级调整。

Canva 抢不走 Adobe 的忠实用户,但吸引了不会或者没法用 Adobe 的用户。

Flowith 也是类似,本质是在填补市场的空缺。Perplexity 不重复 Google,Flowith 不重复 Perplexity。

ChatGPT 引领了聊天式的 AI,用起来确实便捷又简单,在它之后,很多产品照做了,用户也默认接受了。

然而未来,我们与 AI 的协作,不会只是翻译、问答,应该允许更多有趣的想法发生,它们不一定成功,但足够带来惊喜。

毕竟,AI 的时代,变化总是很快,必然还有更新鲜的 AI 交互方式,提升效率、创新思维、改变工作流。

在玩过更多产品之后,我们才能归来仍是少年地惊呼:这才是我想要的 AI 应用。

Hail (雹) – 开源免费无需 Root,冻结、停用、隐藏 Android 应用

By: Anonymous
1 April 2024 at 17:45

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

在 Android 系统中,如果想要更深入地管控某些 的后台运行策略,可以把它们给「冻结」,实际上这一种操作方式也被 Android 官方和一些第三方定制系统纳入到了设置功能里。不过官方提供的操作方式都没有那么直观,我们更喜欢使用第三方进行冻结操作,比如这款名为「雹」的

Disable / Hide / Suspend / Uninstall Android apps without root. – aistra0528/Hail

相比于同类产品,雹不需要付费解锁高级版,只需要授予高级即可使用全部功能。在工作模式方面,雹支持 Shizuku、Root、Dhizuku、设备管理器、炼妖壶五种授权方式,并且还可以控制冻结模式是停用、隐藏还是暂停,因此无论我们的玩机习惯如何、更想要达到什么样的冻结效果,这款应用都能满足大部分用户的使用场景。

冻结freeze是一个营销用语,用于描述使应用在用户不需要时不可运行 的行为,以此控制设备使用、减少内存占用和节省电量。用户可在需要时解冻unfreeze应用。

在一般情况下,「冻结」是指停用,此外雹也可以通过隐藏和暂停来「冻结」应用。

被停用disable的应用不会出现在启动器中。在已安装应用列表中会显示已停用disabled状态。启用enable应用即可恢复。

被隐藏hide的应用不会出现在启动器和已安装应用列表中。取消隐藏unhide应用即可恢复。

在这种状态下,软件包几乎处于卸载状态,无法使用,但并没有删除或实际的软件包文件。

被暂停suspend的应用在启动器中会显示为灰度图标。取消暂停unsuspend应用即可恢复。

在这种状态下,应用程序的通知将被隐藏,任何启动活动将被停止,不能弹出提示、对话框或播放。 当用户试图启动一个暂停的应用程序时,系统将向用户显示一个对话框,告知他们在暂停状态下不能使用这个应用程序。

在应用控制功能上,雹可以直接浏览应用列表和手动添加 App,不过值得好评的是,雹还支持直接导入已经冻结的 App,这一点在我们想要更换冻结类工具,或者想要管理被 Android 系统停用的 App 时就方便多了。

在设置当中,我们可以自定义冻结条件、调整外观样式、添加快捷操作,高级玩家还可以直接在这里调用命令行指令。如果你也想要一款的冻结类工具,不妨在 GitHubF-Droid 雹。

关于云服务流量费比较

By: Anonymous
5 March 2024 at 13:12

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

使用云服务时,一个常被忽视的成本就是流出费。这指的是将数据从云服务提供商的发送到公共互联网的费用。

这里整理了常用服务的流量费用,可以快速了解不同云服务的流量费用差异,这不仅是单纯 VPS 比较,而是各类的云服务都拿出来比,像是存储类的以及 CDN 类的都有放进来。

如果超出了流量,每家供应商收取的 1TB 数据流出费用如下:

小提醒: 实际价格可能因地区和其他本文未列出的因素而有所不同。为方便比较,这里选择了最靠近北弗吉尼亚(美国)或法兰克福(德国)的区域,并根据统一的使用情况假设估算出这些价格。请务必查看供应商的定价页面以获取最新信息。

数据流出是指数据离开某个网络,更确切地说,是数据离开你的云服务提供商网络进入公共互联网。这可能是从云服务商到用户的数据传输,或是从一家云服务商到另一家的数据传输。

云服务商通常根据从其网络流出的数据量按 GB (1 GB等于1024 MB)或 TB (1 TB等于1024 GB) 计费收取每月数据传输费用。

从云服务商的角度来看,有两种数据传输类型:

实际操作中,可能是这样的:

要下载文件,用户设备需要从云服务商网络请求数据,而云服务商则需要将数据发送给用户(或内容分发网络等中间商)。这就会产生数据流出费用。

云服务商之所以收取数据流出费,是因为从其网络传输数据需要成本。他们需要为传输数据所需的基础设施和带宽付费。

不过,数据流出费也可能是为了阻止某些使用场景,比如跨云服务商大量传输数据。

大多数云服务商都提供一定的免费流出数据量,比如整个账户每月 100GB 的免费流量,或者每台服务器每月 1TB 的免费流量。

因此,根据你的使用情况和选择的云服务商,你可能完全不用为数据流出付费。

在尝试降低数据流出费用时,可以考虑以下几个因素:

Backblaze 的带宽费用算法颇有趣,每个月给数据量的三倍大小当作免费带宽,没记错的话因为 Cloudflare 是 Backblaze 的官方合作伙伴,两边的传输费用不计费,如果数据是可以公开的,可以通过这个方式免费链接出来;如果真的走一般的流量输出,收费是 US$0.01/GB (所以换算后是 US$10/TB)。

三家常被摆在一起的 VPS (LinodeDigitalOceanVultr) 的带宽也都是 US$10/TB。

以前没注意到的是 OVH CloudScaleway 的带宽费用是免费的?另外 Hetzner 虽然要收费但也很低?有机会可以测试看看,看一下质量如何?

Prompt Library – 沃顿商学院给教师和学生的 AI 提示词库

By: Anonymous
4 March 2024 at 12:04

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

沃顿商学院发布了一个专门用来教学的提示词库,里面包含了非常多用于学习和的提示词,同时也有一些其他很有用的提示,比如密度链总结、因果关系解释、产品发布提示和学术论文创建。我翻译了所有的提示词,感兴趣可以参考研究或者本身就是学生和教师可以收藏一下。

Prompts on this page (but no other content on the site) are licensed under Creative Commons License Attribution 4.0 International This license requires that reusers give credit to the creators (Ethan Mollick and Lilach Mollick). It allows reusers to distribute, remix, adapt, and build upon the material in any medium or format, even for commercial purposes.

本页面的提示(不包括的其他内容)采用知识共享署名 4.0 国际许可协议授权。该许可要求使用者注明原作者是 Ethan Mollick 和 Lilach Mollick。
在署名的前提下,使用者可以以任何媒介和形式自由地、改编、转换和构建这些内容,甚至可用于商业目的。但使用这些提示所产生的输出结果可能并不完全准确,风险请自负。

2024 最好的 YouTube 替代方案对比和汇总

By: Anonymous
29 February 2024 at 13:45

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

毫无疑问,YouTube 彻底改变了在线娱乐格局。每个月全球有超过 27 亿人访问 YouTube,并且 YouTube 托管了超过 8 亿个视频。

YouTube 之所以如此受欢迎的主要原因是它的大部分内容都是“免费”的。但是,就像 的所有“免费”产品一样,免费即是最贵的。你在金钱上不付费的部分,你在上付出的代价就越大。

你的 YouTube 使用习惯会被分析,并结合你的搜索历史、Gmail 元数据、照片元数据、你如何使用 Android 手机以及更多内容,用以对你进行个性化广告定向推送。最近,这种情况已经达到了顶点,广告变得更加频繁和烦人。

网友推测,这是 Google 有意采取的策略,旨在推动人们使用其新的无广告 YouTube Premium 服务,这种怀疑得到了 Google 对使用广告拦截器的人进行积极打击的行动的加强。

家长们不仅应该关注他们的孩子是否接触到不适当的内容,还应该注意到他们是否被推荐到一条极端化的信息茧房。

作为内容创作者,YouTube 的激烈竞争需要你持续产出质量高、针对算法优化的内容,才有机会取得成功。尽管 YouTube 存在着巨大的变现机会,但取得成功可能很具挑战性,而且疲劳风险很大,因为你必须不断创作更多、通常更长的视频来满足不断变化的算法需求,而对这些变化几乎没有控制权。

↓ 下文点击标题跳转平台

我们将在下文讨论真正的 YouTube 替代方案,但得知道,目前没有一个提供与 YouTube 视频数量完全相匹配的产品,Youtube 本身也是有各种不同限制的。以下网站和应用程序可以让你观看 YouTube 内容,而无需观看广告、受到 Google 算法推荐或需要使用 Google 账号登录。

然而,请注意,以这种方式观看 YouTube 内容意味着内容创作者可能不会从 Google 那里获得报酬。因此,我们强烈建议您通过其他方式支持创作者,比如直接捐赠给他们、成为 Patreon 的赞助者、购买他们的商品或点击他们的推广链接。

Invidious 是一个免费、的 YouTube 替代前端,旨在为用户提供一种更私密的观看 YouTube 视频的方式,无广告或 Google 追踪。它既可以作为网站使用,也可以作为可和自行托管的开源软件使用。与许多 YouTube 前端不同(尽管不包括此处列出的),Invidious 不使用官方的 YouTube API(允许第三方应用程序和服务访问 YouTube 内容的软件),从而将与 Google 共享的数据降到了最低。

Invidious 实例由全球各地的不同个体托管。这意味着可用性可能有所不同,但在需要时很容易切换实例。在对广告拦截器采取更广泛的打击行动的时机上,YouTube 在 2023 年 6 月向 Invidious 发出了下架通知。然而,多个公共的 Invidious 实例仍然兴盛。

Invidious 可以在任何浏览器中运行,并且在移动浏览器上运行良好(包括 iOS 和 iPadOS),其中的播放模式尤其受到欢迎。

虽然 Invidious 本身不会保留日志,但你连接的任何实例都可以记录你的 IP 地址和你访问的 URL(例如,你观看的视频)。使用匿名服务可以阻止 Invidious 实例所有者知道你的真实 IP 地址。

此外,Invidious 默认会直接从 Google 服务器(googlevideo.com)获取视频,因此 Google 可以看到你的 IP 地址。同样,使用匿名服务将阻止这种情况发生,或者 Invidious 允许你通过所使用的 Invidious 实例代理连接到 Google 服务器。对于更精通技术的人士来说,另一个对隐私友好的选择是自行托管你自己的 Invidious 实例。

NewPipe 是一个轻量级、无广告、开源的 Android YouTube 客户端,强调隐私并提供流畅的用户体验。NewPipe 的显着特点包括:

NewPipe 可以作为 APK 进行侧载安装,并在开源的 F-Droid 应用商店上提供。虽然功能齐全(在许多情况下提供比官方 YouTube Android 应用更好的功能),但它不支持 Chromecast 或将内容镜像到大屏幕,这可能对一些人来说是一个不利因素。

NewPipe 整合了众包的 SponsorBlock API。这允许观看者报告视频中的赞助部分,然后你可以自动跳过这些部分。YouTube 视频直接从 Google 服务器获取,因此当使用 NewPipe 时,你应该使用匿名服务来隐藏你的真实 IP 地址。

FreeTube 是一个开源应用程序,适用于 、macOS、Linux 和 Android(作为 APK)。与这里列出的其他 YouTube 前端一样,它允许你在观看 YouTube 视频时无广告且不受 Google 追踪。它通过利用 Invidious API 和自身的内建本地 API 实现这一点。

默认情况下,FreeTube 会暴露你的 IP 地址给 Google。它包含用户可配置的代理设置来解决这个问题,但使用匿名服务更简单,可能会提供更快的连接速度。

这个基于浏览器的开源、隐私友好的 YouTube 前端提供了一个用户友好的方法来观看 YouTube 内容。默认情况下,你将自动连接到官方的 Piped 实例(https://pipedapi.kavin.rocks/),但你也可以连接到另一个公共实例(这里是一个列表)或私有实例(例如,如果你自己托管)。

与 FreeTube 类似,Piped 整合了 SponsorBlock API。Piped 默认代理所有内容,因此你的 IP 地址永远不会暴露给 Google。它还声称比 Invidious 更稳定和性能更好。

LibreTube 是一个基于 Piped 的免费开源 Android 应用程序,旨在为 NewPipe 提供更好的用户界面。与 Piped 类似(但不是 NewPipe),LibreTube 代理所有连接,因此你的 IP 地址永远不会暴露。

除了 YouTube 外,LibreTube 还从其他平台获取视频,包括 SoundCloud、PeerTube、Bandcamp 和 media.ccc.de。除了缺乏投射支持外,它与 NewPipe 相似,包括。LibreTube 可以作为 APK 下载,或者在开源 F-Droid 商店上提供。

如果你希望完全避开 Google,并寻找用户的视频内容,你的选择有限。在这个以隐私为重点的文章中,我们不会推荐像 TikTok 或 Shorts 这样的选择。

像 LBRY/Odysee 和 BitChute 这样的“言论自由”真正的 YouTube 替代流媒体网站存在,但这些网站很大程度上只是极端思想、错误阴谋论和仇恨言论的茧房。

Vimeo 是一个商业性的美国视频托管和流媒体平台。由一群电影制作者于 2004 年创建,以在多个平台上提供高质量视频而闻名,Vimeo 具有“艺术”美感,并受到艺术家和创意人士的欢迎。Vimeo 现在拥有约 1.75 亿用户和 140 万付费订阅者,他们支付费用上传和分享他们的原创内容。

近年来,Vimeo 越来越专注于提供软件即服务(SaaS),为创意专业人士和企业提供创建、编辑和广播高质量视频内容的工具。

Vimeo 为内容创作者提供先进的跟踪和分析工具,以衡量用户对他们内容的参与程度。默认情况下不支持 Google Analytics,但可以集成到订阅者的网站中(除了直播活动)。

然而,Vimeo 本身并不通过跟踪你在线上的行为来赚钱。它是无广告、友好创作者的平台,并且唯一一个可以被描述为 YouTube 竞争对手(即使是一个非常遥远的竞争对手)的真正的替代视频平台。

Nebula 是由一群名为 Standard 的 YouTube 创作者社区创建的订阅制视频流服务。它旨在为这些创作者提供一个平台,让他们可以在他们的主要 YouTube 频道之外尝试新的内容创意。

Nebula 的创作者根据观看时间获得报酬,收入被分配给创作者和 Standard。你也可以通过在线商店支持他们。

该服务托管了一系列多样化的内容,涵盖音乐、历史、游戏、电影和电视等类别,包括视频、播客和课程。Nebula 是无广告的,提供每月 5 美元或每年 149 美元的订阅计划,如果你想要访问“课程”(多部分交互式教育内容)。

该服务支持离线下载,并提供专门为 Nebula 制作的原创内容,包括纪录片、系列节目和特别节目。然而,需要指出的是,Nebula 上的大部分内容也可以在 YouTube 上免费观看。

自 2019 年推出以来,Nebula 已经显著增长,目前托管了超过 150 名创作者,拥有超过 65 万订阅者。Nebula 是无广告的,但没有关注隐私,并像任何其他商业网站一样跟踪你的活动。

PeerTube 是一个基于点对点技术的免费、开源、分散式和联合式视频平台(类似于种子 Torrent 的工作原理)。它允许任何人轻松设置和运行他们自己的视频网站(就像 YouTube 一样)。

所有网站都可以彼此交流,一个网站上的人可以与另一个网站上的人进行互动。你可以在使用该平台的所有网站中搜索视频,或访问建立在其上的网站。

不用说,与 YouTube 相比,公开索引的 PeerTube 网站上可用的内容数量是微不足道的。尽管如此,该网络上提供了一个丰富多样、有趣的视频范围。

几乎不可避免地,极端分子可以利用该平台来托管具有仇恨性或其他敏感内容的视频,但 Framasoft 的开发人员似乎真诚地致力于打击这一问题。它提供了一个举报内容的工具,官方网站链接到一系列经过审查的通用兴趣视频。

PeerTube 表示你“可能会在一些 PeerTube 平台上找到不合适的视频。但这绝对不是 PeerTube 内容的大部分。例如,在我们的公共索引列出的 900 个平台中,托管的只有约 ~1% 的视频被标记为包含敏感内容”。

作为一个非营利的 YouTube 真正的替代品,PeerTube 为内容创作者提供了内置的工具来获得收入。当然,创作者可以自由要求捐赠,而且托管 PeerTube 的个人网站也可以自由决定如何盈利。

如果你只想观看 YouTube 视频,而不想看到广告,也不想被 Google 跟踪和分析你的行为,那么现在有很多很棒的开源和注重隐私的选择。只是记住,大多数这些服务仍然需要使用匿名服务,来阻止 Google 看到你的 IP 地址。

如果你想要一个真正的 YouTube 替代品,不与 Google(或其他侵犯隐私的大公司)有关联,尤其是一个不仅仅是极端内容的存档所,那么你的选择非常有限。

Vimeo 提供了大量高质量、无广告的内容,并且有一个不涉及跟踪你一切活动的商业模式。但它仍然是一个专有的商业平台,并且托管的视频相比 Youtube 少很多。

Nebula 提供了一个支持你喜欢的 YouTube 创作者的好方法,而不必经过 Google,但我们真的需要另一个付费的流媒体服务吗?

开源的 PeerTube 在对比后看起来不错,但与 YouTube 相比,也许它只会成为最顽固的隐私爱好者的一个小众平台。

周鸿祎谈OpenAI大模型Sora

15 February 2024 at 23:49

OpenAI于2024年2月15日正式对外发布人工智能文生视频大模型Sora,Sora继承了DALL-E 3的画质和遵循指令能力,可以根据用户的文本提示创建逼真的视频,该模型可以深度模拟真实物理世界,能生成具有多个角色、包含特定运动的复杂场景,能理解用户在提示中提出的要求,还了解这些物体在物理世界中的存在方式。

Sora对于需要制作视频的艺术家、电影制片人或学生带来无限可能,其是OpenAI“教AI理解和模拟运动中的物理世界”计划的其中一步,也标志着人工智能在理解真实世界场景并与之互动的能力方面实现飞跃。

今日下午,周鸿祎在微博发长文,谈论他对OpenAI刚刚发布的文生视频大模型Sora的看法。周鸿祎称,Sora意味着AGI实现将从10年缩短到1年。

周鸿祎表示,很多人说Sora的效果吊打Pika和Runway,这很正常,和创业者团队比OpenAI这种有核心技术的公司实力还是非常强劲的。周鸿祎认为,AI不一定那么快颠覆所有行业,但它能激发更多人的创作力。今天Sora可能给广告业、电影预告片、短视频行业带来巨大的颠覆,但它不一定那么快击败TikTok,更可能成为TikTok的创作工具。

此外,周鸿祎还提到,现在所有的文生图、文生视频都是在2D平面上对图形元素进行操作,并没有适用物理定律。但Sora产生的视频里,它能像人一样理解坦克是有巨大冲击力的,坦克能撞毁汽车,而不会出现汽车撞毁坦克这样的情况。

所以他理解这次OpenAl利用它的大语言模型优势,把LLM和Diffusion结合起来训练,让Sora实现了对现实世界的理解和对世界的模拟两层能力,这样产生的视频才是真实的,才能跳出2D的范围模拟真实的物理世界。这都是大模型的功劳。

以下为全文:

Sora意味着AGI实现将从10年缩短到1年

周鸿祎

年前我在风马牛演讲上分享了大模型十大趋势预测,没想到年还没过完,就验证了好几个,从Gemini、英伟达的Chat With RTX到 OpenAl发布Sora,大家都觉得很炸裂。朋友问我怎么看Sora,我谈几个观点,总体来说就是我认为AGI很快会实现,就这几年的事儿了:

第一,科技竞争最终比拼的是让人才密度和深厚积累。很多人说 Sora的效果吊打Pika和Runway.这很正常,和创业者团队比,OpenAl这种有核心技术的公司实力还是非常强劲的。有人认为有了AI以后创业公司只需要做个体户就行,实际今天再次证明这种想法是非常可笑的。

第二,Al不一定那么快颠覆所有行业,但它能激发更多人的创作力。今天很多人谈到 Sora对影视工业的打击,我倒不觉得是这样,因为机器能生产一个好视频,但视频的主题、脚本和分镜头策划、台词的配合,都需要人的创意,至少需要人给提示词。一个视频或者电影是由无数个60秒组成的。今天 Sora可能给广告业、电影预告片、短视频行业带来巨大的颠覆,但它不一定那么快击败 TikTok,更可能成为 TikTok的创作工具。

第三,我一直说国内大模型发展水平表面看已经接近 GPT-3.5了,但实际上跟4.0比还有一年半的差距。而且我相信OpenAl手里应该还藏着一些秘密武器,无论是 GPT-5,还是机器自我学习自动产生内容,包括 AIGC.奥特曼是个营销大师,知道怎样掌握节奏,他们手里的武器并没有全拿出来。这样看来中国跟美国的AI差距可能还在加大。

第四,大语言模型最牛的是,它不是填空机,而是能完整地理解这个世界的知识。这次很多人从技术上、从产品体验上分析 Sora,强调它能输出60秒视频,保持多镜头的一致性,模拟自然世界和物理规律,实际这些都比较表象,最重要的是 Sora 的技术思路完全不一样。因为这之前我们做视频做图用的都是Diffusion,你可以把视频看成是多个真实图片的组合,它并没有真正掌握这个世界的知识。现在所有的文生图、文生视频都是在2D平面上对图形元素进行操作,并没有适用物理定律。但 Sora产生的视频里,它能像人一样理解坦克是有巨大冲击力的,坦克能撞毁汽车,而不会出现汽车撞毁坦克这样的情况。所以我理解这次OpenAl利用它的大语言模型优势,把LLM 和 Diffusion结合起来训练,让Sora 实现了对现实世界的理解和对世界的模拟两层能力,这样产生的视频才是真实的,才能跳出2D的范围模拟真实的物理世界。这都是大模型的功劳。

这也代表未来的方向。有强劲的大模型做底子,基于对人类语言的理解,对人类知识和世界模型的了解,再叠加很多其他的技术,就可以创造各个领域的超级工具,比如生物医学、蛋白质和基因研究,包括物理、化学、数学的学科研究上,大模型都会发挥作用。这次 Sora对物理世界的模拟,至少将会对机器人具身智能和自动驾驶带来巨大的影响。原来的自动驾驶技术过度强调感知层面,而没有工作在认知层面。其实人在驾驶汽车的时候,很多判断是基于对这个世界的理解。比如对方的速度怎么样,能否发生碰撞,碰撞严重性如何,如果没有对世界的理解就很难做出一个真正的无人驾驶。

所以这次Sora只是小试牛刀,它展现的不仅仅是一个视频制作的能力,它展现的是大模型对真实世界有了理解和模拟之后,会带来新的成果和突破。

第五,Open AI训练这个模型应该会阅读大量视频。大模型加上 Diffusion技术需要对这个世界进行进一步了解,学习样本就会以视频和摄像头捕捉到的画面为主。一旦人工智能接上摄像头,把所有的电影都看一遍,把YouTube上和TikTok 的视频都看一遍,对世界的理解将远远超过文字学习,一幅图胜过千言万语,而视频传递的信息量又远远超过一幅图,这就离AGI真的就不远了,不是10年20年的问题,可能一两年很快就可以实现。

2月23日下午,两会前夕,第十四届全国政协委员周鸿祎在三六零总部接受媒体采访。

对于由Sora引发的中美在AI方面的差距,周鸿祎表示,“搞技术最难的是找到原创方向,在这种方向性的创新上,OpenAI做得非常好,我觉得(中美AI)差距主要在这方面。”

中美AI差距主要在“原创方向上”

对于Sora引发的中美在AI方面的差距,周鸿祎在接受采访时表示:

第一,中美有差距,看到差距才知道怎么迎头赶上。

“大家做个大模型就去刷榜,刷榜的游戏你们都知道,把那个考题预先训一遍。当然在刷榜的成绩里,国产大模型基本可以垄断Top1到Top10,GPT4都被刷到10名开外去了。但是,Sora的问世还是给了我们一桶清醒的冷水,让人看到还是有差距。”

第二,GPT手里有些秘密武器没有亮出来。

“在去年GPT‘宫斗’的时候,他们就争论了半天,现在GPT5已经在蓄势待发,GPT5发不发完全取决于奥特曼的心情和他的节奏感。奥特曼什么时候发呢?当Google要做什么事情的时候,或者当META要做什么事情的时候,他就会发一个东西。我认为,我们跟他们的差距主要在原创方向上。”

“Transformer模型并不是OpenAI发明的,但却是OpenAI第一个选择了一种新的用法,即在里面无限地加参数的大小,加注意力的连接数目,加神经网络的层数,他们相信一种暴力美学,即大力出奇迹。目前来看,Transformer这套模型至少被验证了,是目前效果最好的。所以,OpenAI走对了方向。”

在周鸿祎看来,这次Sora的出现在技术上有个巨大的成果,OpenAI用Transformer架构成功实现了对各种各样的文字、图片、声音还有视频的归一化处理,再加上Transformer本身对语义的了解和对知识的理解,所以,它这次能做出Sora是把GPT的能力融在里面了。

“搞技术最难的是找到原创方向。在这种方向性的创新上,OpenAI做得非常好,我觉得差距主要在这方面。”周鸿祎强调。

落后时间在一年到两年

不过,周鸿祎也表示,“人家一开源,我们科技就进步。再往下,国内可能在原始创新从零到一做得弱一点,但一旦OpenAI宣布了技术方向和产品,国内的模仿很快会跟上。所以,肯定又有很多家做出类似的文生视频的工具,会出现类似百模大战的情况。”

对于中国在AI方面的前景,周鸿祎认为,尽管中国在原创技术上落后,但这个落后不像光刻机和芯片差距那么大,“毕竟Transformer模型也好,Sora也好,本质上还是软件,所以,现在落后的时间,大概也就是一年到两年,是可以解决的。”

不过,周鸿祎强调,“不需要等到全面赶上GPT4、Sora才能去应用。所以,现在有一条主线是,做Sora和GPT4这种超级通用的大模型。”

“2024年应该是应用之年。否则大家对GPT会有啥感觉?就是能写诗,能斗乐子,能解奥数题,但离工作还太远。或者能在办公方面帮我们做一些工作。Sora大家震撼多点,是因为Sora比GPT更近一步,大家明显感觉,文生视频在影视工业、游戏行业、广告业能够做点具体的事了,但依然是一个通用的工具。所以,2024年在垂直领域,大模型是大有可为的。”

“这个技术解决之前,Sora的技术不可能放出来”

对于中国AI发展面临的安全挑战,周鸿祎认为,大模型作为一个IT系统,本身也是软件构成,现在面临一个比较急迫的问题,实际上是大模型的可信、可控、可靠的问题,其内容安全问题有以下几方面。

第一,幻觉问题。

幻觉是大模型智能的体现,是个双刃剑。在做文创时,比如Sora能产生一些鱼在空中飘着,或者樱花组成的老虎飞起来,最后变成樱花落下来。这些在文艺创作的时候,都是创造力的体现。但是,用在企业内部的时候,幻觉就会带来不准确。

第二,注入攻击问题。

大模型可以成为好人的帮手,也可以成为坏人的帮手。大模型里面的知识很多,过去只有黑客才能攻击一个系统,因为需要懂编程,“但现在你跟大模型能对话就能攻击它。”

“Sora出来之后,一个单词被大家忘了,过去叫深度伪造,都是换脸,做欺诈。但现在,深度伪造换了一个概念,叫做AIGC,就很高大上,AI产生内容。但你们看看Sora产生的视频,除了感受到创意之后,发现你能拿它做任何视频。这个视频可以干预美国大选,可以成为影响国家安全的武器。这方面的危险性其实非常大,这个工具是双刃剑,这也是内容安全。”

“为什么Sora的视频做出来之后,大家感觉很惊讶,不是画面多优美,那个很容易做,而是觉得它符合你对自然世界的判断。所以,这样做出来的视频真假莫辨,对心理战、舆论战、公关战会有影响。”

因此,周鸿祎认为,以后Sora的产品肯定要思考,如何在Sora产生的视频里加入不可更改、不可替换、不可修改的内部水印,“这样我们有一个配合读水印的程序,我们一看就知道它有没有水印,这个技术解决之前,Sora的技术不可能放出来。”

来源:中国基金报

关于 GMS 教务系统

By: 胡中元
27 February 2017 at 11:22

 简介 

这是一个用于高校毕业生毕业流程线上管理的教务系统,由 Moshel 独立开发,并与 2016 年末开始被应用在西安石油大学计算机学院内。

毕业生在毕业设计时,需要学生与老师所出的题目建立一个多对一的关系,教师出题需要两层审核,而学生拥有三轮选题的机会,并且学生之间可相互竞选题目,此外,管理员可统揽全局,控制教务流程的进行,以及对相关数据的处理。这些就是本系统的大致功能。

答辩环节的完全线上化将是本系统的下一个主要开发方向。

链接:http://bkbysj.xsyu.edu.cn/(限西石大内网访问)

 系统功能 

作为一个完善的业务系统,除了 “选题” 功能外,还拥有完善的账号管理系统及附件管理系统等。

这张用例图是系统设计阶段所画,目前系统的功能已不局限于此。

教师拥有的功能

  

(↑ 点击可查看大图)

教师可以出题,并且实时跟踪自己题目的状态,历年所出题目会形成一个自己的题库以供复用,题目支持上传附件。这些特性弥补了旧选题系统的遗憾。

值得一说的是,本系统中所有的用户头像均不相同,根据用户 UID 哈希生成的随机矢量风格,避免了所有老师学生都使用默认头像的尴尬又无聊的景象。

学生角色

学生是本系统中最简单的角色,可进行选题,以及在选题成功之后通过此系统向老师发送文件。

在选题方面设计了 2 个人性化的特性:1、能看到某道题当前已选人数,这大大避免某道题被大家集中选择。2、在教师查看你的选题志愿之前,可以取消申请,并另选一道题。(事实上在此系统中所有的状态转移均支持最大程度的撤销操作)

管理员信息统揽

(↑ 点击可查看大图)

专门为管理员设计的功能占整个系统工作量的 70% 以上。管理员面板中,可以管理所有的用户类型,设定每位用户的类型,也可以看到现在所有选题配对情况。

值得一说的是,管理员支持使用 Excel 批量导入每届学生老师信息,系统会自动解析 xlsx 文档,并创建对应的登陆账号。

此外,本系统网页中所有可见的表格信息均可一键导出为 Excel 或 Word 文档,方便进一步办公处理。

仪表盘

数据可视化算是最近几年的技术热点,所以我为管理员开发了一个单独的仪表盘页面,用于总览整个选题流程的进行。

在这里,可以直观的看到待选题目和学生总数的柱状对比图,也可以分专业以饼状图的形式看到当前各专业学生的选题状态分布。这些都是选题流程中管理员需要掌握的数据。

数据库备份还原

 

本系统还拥有一个强大的自动备份还原功能,系统会自动在每天凌晨 3 时进行一次数据库备份,同时自动删除 15 天前的备份(不支持手动删除),当然,用户可以选择在需要的时候随时手动创建一个备份。

这样的设计使得系统更加稳定,无论是管理员的误操作,还是被任何形式的恶意攻击,都不会对系统造成很大的影响。

公告系统

 

(↑ 点击可查看大图)

本系统拥有完善的公告系统,支持富文本编辑、设置置顶、支持设置公告对不同类型用户的可见性,以及附件支持。

 关于技术 

以上说的是功能介绍,关于技术的细节欢迎大家点击以下两个链接继续阅读:

1、我在 2016 年 9 月写的:Meteor + React 教务系统开发经历

2、我在 2016 年 10 月发的相关论文:A High Performance Information System for College Graduation Management Cloud

技术亮点预告

1、使用 Javascript 全栈开发,包括 Node 作为后端,React 作为前端框架,MongoDB 作为数据库。

2、使用 Websocket 进行前后端通信,而不是 HTML 或者 AJAX。

3、使用黑科技实现前端浏览器直接操作数据库。

❌
❌