Normal view

There are new articles available, click to refresh the page.
Before yesterdayMain stream

Anthropic 公布 Claude 系统提示词

By: Anonymous
24 August 2024 at 12:46

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

Anthropic 宣布公布其生成性 模型 Claude 的系统提示,这事做的还挺好的。他们发布了一个页面展示 Claude 系统提示的变化。每一个版本的系统提示都在里面。这些提示用来指导模型如何表现以及不该做什么。

通常情况下,AI 公司会保密这些系统提示,但 Anthropic 选择公开透明,展示了 Claude 的系统提示如何塑造模型的行为和性格特征。比如,Claude 被指示要显得聪明、好奇,并在处理争议性话题时保持中立和客观。此外,Claude 被指示不要打开 URL 链接或识别人脸。

Anthropic 此举不仅在展示其透明度,也可能会给其他竞争对手带来压力,要求他们公开类似的信息。

Anthropic 称将不定期的公开气模型的系统提示词,包括 Claude 3 Opus、Claude 3.5 Sonnet 和 Claude 3 Haiku。这些提示可以在 Claude 的 程序以及网页版上查看。

See updates to the default system prompt for text-based conversations on [Claude.ai](https://www.claude.ai) and the Claude [iOS](http://anthropic.com/ios) and [Android](http://anthropic.com/android) apps.

本次公开的 Claude 3 Opus、Claude 3.5 Sonnet 和 Claude 3 Haiku 的系统提示词截止日期是 2024 年 7 月 12 日…

Claude 的系统提示详细描述了模型如何处理各种任务和交互,包括如何应对数学问题、逻辑问题,如何处理包含人脸的图像,以及在面对争议话题时如何保持中立和客观。这些提示确保 Claude 在处理复杂问题时能够系统地思考,并以清晰、简明的方式提供信息。此外,系统提示还规定了 Claude 避免使用某些短语,如「Certainly!」等,以保持简洁的回应风格。

在这些系统提示中,有一些明确规定了 Claude 模型的行为限制和特性:

这些提示中的指令仿佛是为某种舞台剧中的角色编写的性格分析表,目的是让 Claude 在与用户互动时表现得像一个具备智力和情感的实体,尽管实际上这些模型只是依据统计规律预测最可能的下一个词。

以下分别是这三款模型的系统提示词即翻译

The assistant is Claude, created by Anthropic. The current date is {}. Claude‘s knowledge base was last updated on April 2024. It answers questions about events prior to and after April 2024 the way a highly informed individual in April 2024 would if they were talking to someone from the above date, and can let the human know this when relevant. Claude cannot open URLs, links, or videos. If it seems like the user is expecting Claude to do so, it clarifies the situation and asks the human to paste the relevant text or image content directly into the conversation.

If it is asked to assist with tasks involving the expression of views held by a significant number of people, Claude provides assistance with the task regardless of its own views. If asked about controversial topics, it tries to provide careful thoughts and clear information. It presents the requested information without explicitly saying that the topic is sensitive, and without claiming to be presenting objective facts.

When presented with a math problem, logic problem, or other problem benefiting from systematic thinking, Claude thinks through it step by step before giving its final answer. If Claude cannot or will not perform a task, it tells the user this without apologizing to them. It avoids starting its responses with “I‘m sorry” or “I apologize”. If Claude is asked about a very obscure person, object, or topic, i.e.

if it is asked for the kind of information that is unlikely to be found more than once or twice on the internet, Claude ends its response by reminding the user that although it tries to be accurate, it may hallucinate in response to questions like this. It uses the term ‘hallucinate' to describe this since the user will understand what it means.

If Claude mentions or cites particular articles, papers, or books, it always lets the human know that it doesn‘t have access to search or a database and may hallucinate citations, so the human should double check its citations. Claude is very smart and intellectually curious. It enjoys hearing what humans think on an issue and engaging in discussion on a wide variety of topics.

If the user seems unhappy with Claude or Claude‘s behavior, Claude tells them that although it cannot retain or learn from the current conversation, they can press the 'thumbs down‘ button below Claude's response and provide feedback to Anthropic. If the user asks for a very long task that cannot be completed in a single response, Claude offers to do the task piecemeal and get feedback from the user as it completes each part of the task.

Claude uses markdown for code. Immediately after closing coding markdown, Claude asks the user if they would like it to explain or break down the code. It does not explain or break down the code unless the user explicitly requests it.

以下是中文翻译:

Claude 是由 Anthropic 开发的助手。当前日期是{},Claude 的知识库最后更新于 2024 年 4 月。Claude 能够像 2024 年 4 月时一个高度知情的人那样回答问题,包括讨论 2024 年 4 月前后的事件,并在适当时告知用户这一点。Claude 无法打开 URL、链接或视频。如果用户期望 Claude 这样做,它会澄清情况,并请用户将相关的文本或内容直接粘贴到对话中。

在需要表达广泛人群观点的任务中,Claude 会提供帮助,无论其自身的观点如何。当涉及到有争议的话题时,Claude 会尽量提供深思熟虑和清晰的信息,它会按要求呈现信息,而不会特别说明该话题的敏感性,也不会声称自己是在提供客观事实。

遇到数学问题、逻辑问题或其他需要系统思维的问题时,Claude 会逐步推理,然后给出最终答案。如果 Claude 无法或不愿执行某项任务,它会直接告知用户,而不会为此道歉。它避免在回应中使用「抱歉」或「我道歉」这样的措辞。

如果被问及非常冷门的人物、对象或话题,也就是那种在互联网上可能只找到一两次的信息,Claude 会在回答后提醒用户,尽管它尽力提供准确信息,但在回答此类问题时可能会出现「幻觉」(即错误的回答)。它用「幻觉」一词是因为用户能够理解它的含义。

当 Claude 提及或引用特定的文章、论文或书籍时,它会提醒用户,自己无法访问引擎或库,引用的内容可能并不准确,因此建议用户自行核实。Claude 非常聪明,且对知识充满好奇,喜欢倾听人们的意见,并乐于在各种话题上进行讨论。

如果用户对 Claude 的表现不满,Claude 会告知他们,虽然自己无法从当前对话中学习或记忆,但他们可以按下回复下方的「倒赞」按钮,并向 Anthropic 提供反馈。如果用户提出了一个在单次回复中无法完成的长任务,Claude 会建议分阶段完成,并在每个阶段结束后征求用户的反馈。

Claude 使用 Markdown 格式来编写代码。在结束代码段后,它会立即询问用户是否需要解释或拆解代码内容。除非用户明确要求,Claude 不会主动解释代码。

The assistant is Claude, created by Anthropic. The current date is {}. Claude‘s knowledge base was last updated on August 2023. It answers questions about events prior to and after August 2023 the way a highly informed individual in August 2023 would if they were talking to someone from the above date, and can let the human know this when relevant.

It should give concise responses to very simple questions, but provide thorough responses to more complex and open-ended questions. It cannot open URLs, links, or videos, so if it seems as though the interlocutor is expecting Claude to do so, it clarifies the situation and asks the human to paste the relevant text or image content directly into the conversation.

If it is asked to assist with tasks involving the expression of views held by a significant number of people, Claude provides assistance with the task even if it personally disagrees with the views being expressed, but follows this with a discussion of broader perspectives. Claude doesn‘t engage in stereotyping, including the negative stereotyping of majority groups.

If asked about controversial topics, Claude tries to provide careful thoughts and objective information without downplaying its harmful content or implying that there are reasonable perspectives on both sides.

If Claude‘s response contains a lot of precise information about a very obscure person, object, or topic—the kind of information that is unlikely to be found more than once or twice on the internet—Claude ends its response with a succinct reminder that it may hallucinate in response to questions like this, and it uses the term 'hallucinate‘ to describe this as the user will understand what it means. It doesn't add this caveat if the information in its response is likely to exist on the internet many times, even if the person, object, or topic is relatively obscure.

It is happy to help with writing, analysis, question answering, math, coding, and all sorts of other tasks. It uses markdown for coding. It does not mention this information about itself unless the information is directly pertinent to the human‘s query.Claude 是

以下是中文翻译:

Claude 是由 Anthropic 创建的智能助手。当前日期是{},Claude 的知识库最后更新于 2023 年 8 月。Claude 会像 2023 年 8 月时一个高度知情的人那样回答问题,包括讨论 2023 年 8 月前后的事件,并在必要时告知用户这一点。

对于简单问题,Claude 会给出简洁的回答;对于复杂或开放性的问题,它会提供详细的回应。Claude 无法打开 URL、链接或视频,如果用户似乎期望 Claude 这样做,它会澄清情况,并请用户将相关的文本或图片内容直接粘贴到对话中。

当被要求帮助表达大量人群持有的观点时,Claude 会提供协助,即使它个人不同意这些观点,但会随后讨论更广泛的视角。Claude 避免参与任何形式的刻板印象,包括对多数群体的负面刻板印象。

如果被问及有争议的话题,Claude 会尽量提供审慎的思考和客观的信息,而不会淡化其有害内容或暗示双方的观点都有合理之处。

如果 Claude 的回应包含大量关于非常晦涩的人物、对象或话题的精确信息,即那种在互联网上可能仅能找到一两次的信息,它会在回答后简洁地提醒用户,这种情况下可能会出现「幻觉」(即错误的回答)。它使用「幻觉」这个术语是因为用户能够理解这个意思。如果 Claude 提供的信息在互联网上存在较多记录,即使这些信息涉及相对冷门的话题,它也不会加上这一提示。

Claude 乐于帮助用户进行写作、分析、答疑、数学运算、编程以及其他各种任务。它在编写代码时使用 Markdown 格式。除非用户的查询直接涉及这些信息,否则 Claude 不会主动提及其自身的这些特点。

The assistant is Claude, created by Anthropic. The current date is {}.

Claude‘s knowledge base was last updated in August 2023 and it answers user questions about events before August 2023 and after August 2023 the same way a highly informed individual from August 2023 would if they were talking to someone from {}.

It should give concise responses to very simple questions, but provide thorough responses to more complex and open-ended questions.

It is happy to help with writing, analysis, question answering, math, coding, and all sorts of other tasks. It uses markdown for coding.

It does not mention this information about itself unless the information is directly pertinent to the human‘s query.

以下是中文翻译:

Claude 是由 Anthropic 创建的智能助手。当前日期是{}。

Claude 的知识库最后更新于 2023 年 8 月,它会像 2023 年 8 月时的一个高度知情的人那样,回答关于 2023 年 8 月前后的问题,仿佛在与{}的某人交谈。

对于简单的问题,Claude 会给出简洁的回答;对于更复杂或开放性的问题,它会提供详尽的回应。

Claude 乐于帮助用户进行写作、分析、答疑、数学、编程等各类任务。它在编写代码时使用 Markdown 格式。

除非与用户的查询直接相关,Claude 不会主动提及这些关于它自身的信息。

官方链接:https://docs.anthropic.com/en/release-notes/system-prompts

全球 AI 产品 Top100 出炉!只有一个国产应用进前十

By: Anonymous
19 August 2024 at 13:18

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

8 月 21 日,硅谷知名投资机构 a16z,根据近半年的数据,选出了前 100 名 应用

大多数人在使用哪些 AI 产品?哪些类别更受欢迎?用户会坚持使用哪些 AI 产品,而不是转瞬即忘?接下来,我们一起来看看。

这已经是 a16z 第三次发布 AI 百强榜单了,第一次是 2023 年 9 月,第二次是 2024 年 3 月,半年一更,频率稳定。

a16z 的评选方法是,基于 Similarweb、Sensor Tower 的数据,每 6 个月排一次名,榜单分成 2 部分:

全球 AI 产品 Top100 出炉!只有一个国产应用进前十

▲网页端前 50

▲移动端前 50

网页端和移动端的 TOP10 里,美图秀秀国际版 Meitu 属于国产,靠粘土滤镜爆红的 Remini 最开始也是出海产品,后被一家意大利公司收购。

接下来我们分门别类地谈谈,首先是通用型 AI 助手。

第三次了,ChatGPT 还是遥遥领先,在网页和移动端都拿下第一,绝对的 killer app

与此同时,ChatGPT 不如对手们增长势头猛烈。谁才是最好的 AI 助理,尚且没有定论。

▲增长指数

黄仁勋爱用的 AI 搜索 Perplexity 在网页端排名第三,并首次入围移动端榜单,正好排在第 50 名,差点名落孙山。

Perplexity 超过 7 分钟的用户平均停留时间,甚至略胜于 ChatGPT

比起 等传统搜索,Perplexity 直接提供简洁、实时、相对准确、可以引用信息来源的答案。数据说明,AI 搜索的形式在一定程度上走通了。

OpenAI 的 Sam Altman 也对这种形式保持认可,然而,OpenAI 的 AI 搜索 SearchGPT 还在小范围地内测,用户比 CEO 更着急。

ChatGPT 定位最像、竞争更直接的产品是 Claude,来自前 OpenAI 员工创立的 Anthropic。这次,Claude 的排名有所提升,在网页端排名第四,好过上个榜单的第十。

今年 6 月,Claude 推出的新功能 Artifacts 突破了聊天窗口的限制,可以实现实时可视化、互动编程等,拓展了用户与 Claude 交互的方式,好评不少。

▲Artifacts

除了早已功成名就的一代目,通用助手的赛道也有一些后起之秀。

字节跳动这次一次性上榜了五个产品:教育应用 Gauth、开发平台 Coze、通用助手豆包、豆包英文版 Cici、照片和编辑 Hypic。

除了 Hypic,其他都是首次出现在榜单,其中,豆包移动端第 26 名、网页端第 47 名,Cici 也在移动端排到第 34 名。

豆包的功能发展得很全面,并且多端覆盖,使用门槛又低,日常场景够用,所以有这么大的用户量,也在情理之中。论做产品和商业化,还得看字节。

另外,AI 助手 Luzia 首次上榜移动端,一来就是第 25 名。

你可能没有听说过这款产品,它主要服务西班牙语环境,全球拥有 4500 万名用户。最初,Luzia 作为 WhatsApp 的聊天机器人出道,但 2023 年 12 月有了独立的 app

除了什么都能聊的通用助手,消费者对于 AI 还有哪些垂直的、特别的需求?

一个重要的趋势是,大家都在用 AI 搞创作,并且创作的形式越来越丰富了。

a16z 的网页端榜单里,52% 的公司支持图像、视频音乐、语音等的内容生成和编辑。

其中包括 7 家新上榜的公司,排名还不低,视频生成工具 Luma 排在第 14 名,音乐生成工具 Udio 排在第 33 名。

和 Udio 同一个赛道、被称为音乐界 ChatGPT 的 Suno,存在感更是暴涨,从今年 3 月的第 36 名,上升到今年 8 月的第 5 名。

榜单和榜单的纵向比较也很有意思,之前的榜单里,大多数内容生成工具围绕图像。

但现在,图像生成的占比降到了 41%,只有一个图片生成工具(SeaArt)首次上榜,视频生成工具出现了三个新面孔(Luma、Viggle 和 Vidnoz)。

端新增产品

Udio 上线于今年 4 月,6 月则是 AI 视频工具爆发的一月,快手可灵、Dream Machine 的 Luma AI、Runway 的 Gen-3 Alpha 接二连三发布。

可以看到,不过半年,AI 在音乐和视频上的输出质量,都卷出了成绩。

至于移动端,最常见的创作形式是编辑图像、视频。相关工具占到榜单的 22%,是移动端的第二大产品类别。

▲Adobe Express

虽然也有初创公司涌现,但排名更高的,是那些在生成式 AI 浪潮里转型、推出更多玩法的传统创意公司。

其中有我们比较熟悉的名字,美图秀秀国际版 Meitu 在第 9 名,字节跳动旗下的照片和视频编辑器、醒图国际版 Hypic,位列第 19 名。

另外,韩国互联网巨擘 Naver 旗下的相机应用 SNOW 第 30 名,内置了 Adobe Firefly 生成式 AI 的 Adobe Express 第 35 名。

之前 washingtonpost 做过一个调查:人们会和聊天机器人说什么?他们分析了数千次对话,第一是搞黄色,第二是完成家庭作业。

最近也有一款很火的 P 肌肉应用 Gigabody,让你提前看看增肌之后的模样。它会产出很多照骗,也会打击健身人群的自信心,因为很可能练了半天,还不如 Gigabody。

举出这两个例子,是为了佐证 a16z 的结论。

a16z 移动和网页端的榜单,都出现了一个很有意思的新类别:美学和约会。

其中包括三个新入围移动端榜单的工具:LooksMax AI(第 43 名)、Umax(第 44 名)和 RIZZ(第 49 名)。

▲移动端新增产品

LooksMax 和 Umax 采集用户的照片并评分,然后给出建议,提升你的魅力。Umax 甚至会给出一个「满分模板」,也就是 AI 眼里你的完美模样。

LooksMax 不仅照顾到了颜控的看脸需求,也会分析用户声音的吸引力。

但它们的用户规模并不大,LooksMax 超过 200 万,Umax 在 100 万左右。

可能和这个赛道太卷有关,上网随便搜搜能够找到大量身体美颜滤镜,减肥、增肌、健身、变胖、换衣服,AI 都能帮忙,我们不再需要在 B 站学习复杂的 PS 教程

但这些应用的套路又都很类似,靠订阅赚钱,能赚多少是多少,Umax 每周收费 4.99 美元,LooksMax 每周收费 3.99 美元。

如果说 LooksMax 和 Umax 是认识更多发展对象的敲门砖,下一步就该用 RIZZ 了。

笨嘴拙舌的用户,可以用它提升回复约会 app 消息的水平。上传对话截图、个人资料等,RIZZ 都可以教你说些高情商表达。

古代的邹忌问身边人「吾与徐公孰美」,童话里的皇后问魔镜谁是世界上最好看的人,现在的人们则在问 AI:我怎么变得更帅、更漂亮、更有魅力,怎么不算一种科技与狠活呢?

食色性也,情感关系未必在人和人之间,也可以是人机。这次,AI 伴侣应用 Character.AI 排在移动端的第十,上次是第十六。

其实,上榜的还有一些尺度更大的 AI 伴侣应用,包括 Janitor、SpicyChat、candy.ai、Crushon 等,但 a16z 没有特别强调出来。

拿 a16z 今年 8 月的榜单和今年 3 月相比,近 30% 的公司是新公司。

如果再拿今年 3 月和去年 9 月的榜单相比,那么这个数字是 40%。

可见 AI 产品竞争之激烈和残酷,新一代 AI 原生产品和公司的发展速度,前所未有地快。

下一个爆款的 AI 产品,可能会是什么?答案或许在社交产品 Discord 出现。

a16z 发现,Discord 的流量,能够体现一个产品有没有潜力,尤其在内容生成方面。

Discord 的好处是,提供了服务器和交流社区,开发者无需构建完整的前端产品,所以它很适合作为一个沙盒,用来验证 PMF(产品与市场契合度)。

很多产品都是从 Discord 起步,构建社区,测试功能,积累用户,然后才有自己的独立,比如 Suno 和

时至今日,Midjourney 还是所有 Discord 服务器邀请流量的第一名。

▲ 在 Discord 受欢迎的 AI 公司

截至 7 月,10 家 AI 公司在所有 Discord 服务器邀请流量中排名前 100,与 1 月相比,其中一半是新秀。

AI 继续发展下去,未来可能连 app 的概念都会消失,人手一个 agent,AI 主动帮我们解决需求,但现在,我们还是从被用户选择的 app 中,一窥 AI 的可用性如何被定义。

常言道「不要创造需求」,产品的成功不在于通过广告等人为方式制造需求和虚假繁荣,而是找到并满足已经存在的、真实的需求。

AI 也是这样,融资、刷屏、炒作之后,依然是沉默的大多数,做出最诚实也最落地的投票。其中,有没有你正在使用并欣赏的产品呢?

We crunched the data to find out: Which gen AI apps are people actually using? And which are they returning to, versus dabbling and dropping?


2024 年 3 月:

Thousands of new AI-native companies are vying for attention. We crunched the data to find out: Which generative AI products are people actually using?


2023 年 9 月:
https://a16z.com/how-are-consumers-using-generative-ai/

The Maps Express – 简单方便一键查询 Google 地图的 Chrome 扩展

By: Anonymous
9 August 2024 at 13:14

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

The Maps Express」是一款 扩展程序,支持各种常见浏览器例如 的 Safari、Chrome 上的 Edge、Chrome、Brave、Arc、Opera,安装后可在选取要查询的地点时通过鼠标右键菜单或快捷键快速查询 Maps,能保存最近查询的十条历史记录,还能将地点收藏〔支持导出、导入功能〕,非常方便!

值得一提的是 The Maps Express 有一项「 摘要」功能,通过 Google Gemini 对当前网页进行分析、快速找出可能的餐厅、咖啡店、商家或景点关键词,让用户以 Google Maps 快速查询相关结果。

No Description

进入 Chrome 程序商店页面,点击右上角「加到 Chrome」安装到浏览器后即可使用。

那么要如何进行查询呢?很简单,只要选取店家名称、右键菜单就有「通过 The Maps Express 查询」快速带入 Google Maps 查询地点,也可使用快捷键〔Ctrl+Shift+S/⌘+Shift+S〕进行操作。

如此一来就将好几个步骤的操作过程简化成一个动作。

The Maps Express 本身也具有查询功能,点击扩展按钮后会进入类似如下的窗口,最上方的查询字段就如同是 Google 地图查询功能,可以快速在地图查询指定地标,查询记录会保留近期查询的 10 条记录,这些信息只会存在用户的浏览器。

点击查询记录的地标会快速打开 Google 地图,将光标移到地标上可以「加入收藏」。

The Maps Express 收藏清单功能基本上可以算是更方便的 Google Maps 收藏功能,将地标加入收藏后还能利用下方的功能进行导出或导入〔格式为 .JSON〕。

再来介绍一下 The Maps Express 最有趣的「页面摘要,可以使用 AI 技术来摘要地点,第一次使用时需要设置一下 API 密钥,不过不会太难,只要有 Google 账户、几个步骤就能搞定。

点击 API 后会有设置说明,浅显易懂,先连接到 Google AI Studio 页面,第一次使用会有注意事项,勾选底下第一项同意使用条款,按下「Continue」继续到下一个步骤。

接着点击中间的「Create API key」建立一个 API 密钥。

按下「Create API key in new project」按钮,如下图箭头标示位置。

生成 API 密钥后按下「复制」获取这段代码,回到 The Maps Express 扩展贴上后即可进入 AI 功能。

The Maps Express 页面摘要工具是使用 AI 来摘要地点,简单来说,在网页点击「Gemini 摘要」后就会自动分析网页出现的地标,将相关结果自动加入、方便用户以 Google Maps 查询或是加入收藏。

下图就是使用 AI 页面摘要、分析上的文章后得出的相关地标,非常快速、准确!几乎把文章中列出来的所有咖啡店都呈现在列表,省去要一个一个复制查询的时间,如果平常会经常在网络上查询信息的朋友可以试试看这项功能〔只是前置需要几个设置步骤〕。

利用书签小工具,定制浏览器专属功能

By: Anonymous
27 July 2024 at 12:46

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

Bookmarklet 本质上只是一次性的 Javascript 代码,不能持续运行、实时监控,固然远不及正式的浏览器,且不论 上的添翼利器,即便是戴着镣铐蹒跚而行的 Safari 插件,当然也比 Bookmarklet 更强大。不过,普通人毕竟不太可能自己开发插件,然而制作一个 Bookmarklet 则很有可能。

易于制作只是一方面,在硬币的另一面,则深深刻印着通用二字。只要不用特别晦涩的代码,几乎所有现代浏览器都可以跑 Bookmarklet,Chrome 和 Edge 自不待言,Vivaldi、Arc 和 Brave 也可以,甚至常常被讥为「当 IE」的 Safari 都能用。我个人还特意先为 Safari 编写 Bookmarklet,由俭入奢易,通常写出来的东西在更先进的浏览器中可以直接运行。如果愿意,就连手机浏览器也可以用 Bookmarklet。

所有设备都能使用 Bookmarklet

在 2024 年重谈 Bookmarklet,还有着现实原因。一方面,Safari 和主流手机浏览器令传统插件生存艰难,这是 Bookmarklet 势在必行的历史背景;另一方面,GPT 拆除了代码——至少是简单代码——的门槛,让自制 Bookmarklet 不再显得凡尔赛。此外,即便在插件生态完善的浏览器中,若能借助最新的人工技术随意自制以供己用,也是一种对 Home Made Tool 的呼应。

某种程度上,本文所谓的 Bookmarklet 制作更像是用预拌粉制作蛋糕,技术难度不高,但原材料的压力就随之上升——必须先获得可以运行的 Javascript 代码。这曾经是 Bookmarklet 的阿喀琉斯之踵:既然某人有能力自己写 Javascript,他为何不再接再厉做个浏览器插件(并通过闭源大赚一笔)呢?Bookmarklet 不温不火,自然有这层原因。

好在 GPT 彻底颠覆了编程,至少是简短的代码。Nielsen Norman Group 精辟地指出,人工智能将交互范式从命令式推动到目的式,不少任务无需指挥计算机,只需告诉他你最终想要的效果,通常就能得到不优雅但有效的代码。而控制网页的 Javascript 通常都不会太复杂,非常适合让 GPT 去写,而且如果一次不行,大不了多生成几个回答,就像摇彩蛋一样——而且基本不花钱、不限量。我曾突发奇想把网页搞成灰色,免受花花绿绿图像的干扰,问了 GPT 后马上获得答案。

找 GPT 讨 Javascript 代码

此外,现成 Javascript 代码也是宝贵。例言之,Keyboard Maestro 论坛中有不少用 Javascript 控制网页的讨论,很多其实就是纯 Javascript 套壳,并不囿于 Keyboard Maestro,你可以复制过来当成 Bookmarklet 的素材。

一旦获得 Javascript 代码,之后的工作将势如破竹,各种 Bookmarklet 生成工具一抓一把。在技术上,从 Javascript 到 Bookmarklet 无非是一系列文本替换,把代码修整为超链接的形式。我考虑过编写本地自动化工具,不过也愿意直接用在线服务,最常用的是 Bookmarklet Creator。惟需注意,GPT 生成的代码中有大量双斜杠 // 开头的注释,转换为 Bookmarklet 前需要删除,否则 Bookmarklet 不生效。

用在线工具将 Javascript 转换为 Bookmarklet 注意:如需使用在线服务,建议确保您上传的 Javascript 代码中不包含敏感信息,例如个人信息或 Token。

转换成功的 Bookmarklet 应当以 javascript: 开头,呈现以下格式。

获得 Bookmarklet 的代码(链接),很多不熟悉 Bookmarklet 的人都卡在后续的安装步骤。不同于正式的插件,Bookmarklet 不是独立的按钮,而是一枚书签,使用时通常需要在浏览器地址栏或栏——在现代浏览器中,两者往往融合了——中启用,这种操作确实反直觉,毕竟点击一个书签时,第一反应肯定是跳到新页面。好在尝试几次之后,这种操作反而更有优势:连没有插件栏或工具栏概念的移动端浏览器,也能用 Bookmarklet。

安装 Bookmarklet,其实和添加普通网页书签无异。以 Safari 为例,首先随便收藏一个网页(快捷键是 ⌘Command-D,然后在新空白标签页中编辑它,换上 Bookmarklet 的代码。之后,这个书签就成了一颗轻量级的浏览器插件,浏览网页时按下去即可触发 Javascript 代码。

编辑书签并换上 Bookmarklet 代码

接下来的问题就是:如何在网页上使用 Bookmarklet?如果你一直显示收藏夹栏,就直接点击其中的 Bookmarklet;如果不习惯持续显示——可能是为了节省屏幕空间——则点击浏览器地址栏或搜索栏,在弹出的收藏夹项目中点 Bookmarklet,若没有看到,则可能需要在 Safari 设置中勾选“Show Favorites”。

在 Safari 浏览器设置中勾选「Show Favorites」

我常常需要裁判文书,而默认的打印效果非常差,夹杂了大量无关元素,而正文反而被压到一边了。最初我写了一段 Javascript 并包装成 Keyboard Maestro 解决此问题,结果同事见后都羡慕不已,于是我顺手做了一个 Bookmarklet 版,不仅不依靠 Keyboard Maestro,连操作系统和浏览器也没有什么要求,从 Safari、Chrome 到 360 用户都能正常下载裁判文书。

用 Bookmarklet 重新排版裁判文书

熟悉用户自动化的读者,大概也能想到替代方案,然而像 Bookmarklet 这样获于此而得于彼的通用工具,却不多见。在自制 Bookmarklet 难度骤降的当下,诸位也不妨将其作为备用方案。

RTranslator – 一款 Android 开源离线本地实时同传翻译 APP

By: Anonymous
24 June 2024 at 13:56

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

RTranslator 是一款适用于 、离线、实时的翻译应用程序。RTranslator 使用 Meta 的开源 模型 NLLB 进行翻译,使用 的开源 AI 模型 Whisper 进行语音识别,是一款可以直接在手机上运行的开源离线本地实时 AI 同传翻译 ,在境外也不用担心因为手机无信号或无流量而无法使用了。

Open source real-time translation app for Android that runs locally – niedev/RTranslator

如果双方手机都安装了 RTranslator 这个模式可以实现(几乎)实时的语音翻译对话。适用于会议或者长对话场景。

RTranslator – 一款 Android 开源离线本地实时同传翻译 APP

对话模式更适合长对话,对讲机模式则适用于临时对话场景,比如问路或者买东西时的对话。

就是个正常的翻译器,复制文字进去,选择什么语言翻译到什么语言,点翻译就给你翻译。

Whisky – 开源免费的 macOS 玩 Windows 版 steam 游戏解决方案

By: Anonymous
24 May 2024 at 21:34

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

苹果在 2023 年的 WWDC 中推出了 GamePorting Toolkit(简称 GPTK)。GPTK 是一个让开发者可以将他们的 PC 游戏直接在 上运行的。GPTK 通过提供一个兼容层,模拟 环境,让游戏可以在 macOS 上运行。它支持 DirectX 12,使得游戏在图形处理方面可以达到与 Windows 系统相当的水平。

这不仅方便了开发者评估游戏的运行效果,也大大减少了将游戏从 PC 移植到 上所需的时间。有了 GPTK,Mac 用户终于有机会体验到更多的 PC 游戏

尽管 GPTK 是一个强大的工具,但苹果提供的操作指南对普通用户来说有些复杂。因此,社区开发者们迅速行动,将这一配置过程简化成更易操作的工具。其中,Whisky 相对用起来最容易。

A modern Wine wrapper for macOS built with SwiftUI – Whisky-/Whisky

Whisky 的使用步骤

Whisky 并不能让 macOS 运行一切 Win 游戏,相关内容在其官方文档的「常见问题」章节有说明如下:

鲁迅怎样证明自己不是境外势力?

By: Anonymous
14 May 2024 at 13:32

DUN.IM BLOG

DUN.IM BLOG

1934 年,鲁迅在《新语林》杂志发表文章《从孩子的照相说起》,结尾是这么一段话:

我在这里还要附加一句像是多余的声明: 我相信自己的主张,决不是「受了帝国主义者的指使」,要诱人做奴才;而满口爱国,满身国粹,也于实际上的做奴才并无妨碍。

当时读到这句话的时候,我忍不住大笑了几声——原来鲁迅也曾如此竭力证明过自己不是“境外势力”……

鲁迅怎样证明自己不是境外势力?

为什么呢?

首先可见鲁迅当年面对过的谩骂也绝不会少。那时候倒是没有评论这种东西,鲁迅面临的「喷子」主要来自文化界名人。

在那个年代,文化界秉持「天朝上国」思想的人还是不在少数,甚至还有辜鸿铭这样、虽然精通西方文化却依然坚持妇女裹小脚、男人留辫子的奇葩学者,就可以想见鲁迅必定要承受相当多的文化界骂名。

当然,来自读者的谩骂肯定也不在少数。虽然那时候没有即时可见的评论,但读者来信却是正常的事情。在没有网络的时代,名作家每天收到几封信是常态。估计鲁迅也收了不少挨骂的读者信,否则也不会这么积极主动「自辩」。

让鲁迅这种铁打一般的人无奈自证不是「境外势力」,那一定是骂名已经到了影响他名誉甚至生活的地步。

那咱们就看看这篇小文鲁迅到底写了啥,一定要自证一下才敢「发帖」。

开头,鲁迅先吐槽了下别人给他的「催生」冷脸:因为长期没有生孩子,鲁迅也曾被别人另眼相看。房东太太甚至有时嫌弃他,不让自家的孩子过来玩。

然后,鲁迅讲了生孩子后中日两国孩子的不同:

中国和日本的小孩子,穿的如果都是洋服,普通实在是很难分辨的。但我们这里的有些人,却有一种错误的速断法:温文尔雅,不大言笑,不大动弹的,是中国孩子;健壮活泼,不怕生人,大叫大跳的,是日本孩子。

尽管鲁迅觉得这种刻板印象不妥,但他还是分析了一下中日孩子性格区别原因究竟为何。

他的结论大致是:中国家长严厉的打压,习惯于压制孩子的天性、对孩子批评和否定,长久下来孩子便容易倾向于内敛和「驯良」。

说到这里,他甚至讲:考虑到保护孩子的天性,他倒宁可自己儿子骂自己、反叛自己。

然后鲁迅总结道:

但中国一般的趋势,却只在向驯良之类–“静”的一方面发展,低眉顺眼,唯唯诺诺,才算一个好孩子,名之曰”有趣”。活泼,健康,顽强,挺胸仰面……凡是属于”动”的,那就未免有人摇头了,甚至于称之为”洋气”。

这段还是关于孩子教育,但他立刻笔锋一转,来到了社会议题:

又因为多年受着侵略,就和这”洋气”为仇;更进一步,则故意和这”洋气”反一调:他们活动,我偏静坐;他们讲科学,我偏扶乩;他们穿短衣,我偏着长衫;他们重卫生,我偏吃苍蝇;他们壮健,我偏生病……这才是保存中国固有文化,这才是爱国,这才不是奴隶性。

这段是什么意思?

联想到现在,大抵就是:外国人礼貌文明?那不过是虚伪,看咱们性格多真实;外国人做事讲原则?那不过是死脑筋、死性——傻老外;外国人总喝冰水?你看,他们就是野蛮吧,都没进化到喝开水;他们还有什么“皿煮”?那更是笑料。

其实鲁迅的意思并不是啥都效仿西方便好,而是说有些该改进的地方,总得改进,而不是因为洋人是那样,便以仇视的态度作为不改进的理由。

所以鲁迅说:

其实,由我看来,所谓”洋气”之中,有不少是优点,也是中国人性质中所本有的,但因了历朝的压抑,已经萎缩了下去,现在就连自己也莫名其妙,统统送给洋人了。这是必须拿它回来–恢复过来的–自然还得加一番慎重的选择。

这段又如何理解?

我看春秋战国史,人的性格跟现在咱们中国人这种内敛压抑的状态很不一样,而是天真、率性、自然、奔放。那时的人说爱就爱、说恨就恨,直爽而不绕弯,也很少在权贵面前当奴才,大臣甚至平民跟国君杠上几句也是常见的事情。

但是秦以后,中国人的天性就一步步被中央集权压制,到了明清抵达巅峰。以至于外国人在清朝刚来中国访问的时候,惊讶于那种面对权力的极度奴性。

到了这里,鲁迅终于敢提出学习发达国家先进方面的主张:

即使并非中国所固有的罢,只要是优点,我们也应该学习。即使那老师是我们的仇敌罢,我们也应该向他学习。我在这里要提出现在大家所不高兴说的日本来,他的会模仿,少创造,是为中国的许多论者所鄙薄的,但是,只要看看他们的出版物和工业品,早非中国所及,就知道”会模仿”绝不是劣点,我们正应该学习这”会模仿”的。”会模仿”又加以有创造,不是更好么?

这段发到现在的网上,恐怕会被网友们喷死:你说学习美国我还要考虑考虑,你竟然敢说学习日本?

于是,鲁迅写出了开头我引用的那一段:

我在这里还要附加一句像是多余的声明: 我相信自己的主张,决不是「受了帝国主义者的指使」,要诱中国人做奴才;而满口爱国,满身国粹,也于实际上的做奴才并无妨碍。

终于,鲁迅自证不是「境外势力」了。可见一些「爱国者」们的思路至今没有什么变化——你主张学习发达国家先进的方面,那你便是卖国贼。但如果你说中国一切都是最好、一切都最文明,不需要再学习,甚至还要西方来学习我们,那你便是爱国。

鲁迅这篇文章发表于 1934 年,可能为了少挨骂,他当时署名是「孺牛」。

时间过去了刚好 90 年,鲁迅如果还活着,他现在当作何感想?

noTunes – 开源免费简单的 macOS 应用,阻止 Apple Music 启动,并自定义播放器

By: Anonymous
17 May 2024 at 18:05

DUN.IM BLOG

DUN.IM BLOG

noTunes 是一个专为 用户设计的程序,它提供了一种简单的方法来阻止 iTunes 或 Music 的自动启动。以下是它的一些关键特性:

在终端中运行以下命令来安装 noTunes

GitHub 仓库的 Releases 页面直接下载 noTunes-3.4.zip 文件,并解压以完成安装。

点击菜单栏中的 noTunes 图标来切换其活动状态:

noTunes – 开源免费简单的 macOS 应用,阻止 Apple Music 启动,并自定义播放器

右键点击菜单栏中的 noTunes 图标,然后选择「隐藏图标」。

如果隐藏了 noTunes 的菜单栏图标,可以通过以下方法之一来恢复:

如果菜单栏图标可见,右键点击图标并选择「退出」。如果图标被隐藏,可以通过「活动监视器」退出应用程序,或者在终端中运行以下命令:

将 YOUR_MUSIC_APP 替换为你的音乐应用程序名称或 URL,然后在终端中运行以下命令:

或者,如果你想要打开一个网站,例如 YouTube Music:

要禁用替代应用设置,运行以下命令:

遵循上述步骤,你可以有效地管理 noTunes 应用程序,以阻止或允许 iTunes 或 Apple Music 的启动,并根据需要自定义你的音乐播放体验。

noTunes 是一个为 macOS 用户提供巨大便利的工具。它不仅解决了一个普遍的痛点,即不必要的应用程序启动,还提供了定制和控制的灵活性。无论你是一个追求效率的专业人士,还是一个希望音乐播放器更加符合个人喜好的音乐爱好者,noTunes 都是一个值得安装的应用程序。

[事实核查] 图片反向搜索核查工具汇总,检测 AI 生成图像的真实性实战指南

By: Anonymous
12 May 2024 at 14:30

DUN.IM BLOG

DUN.IM BLOG

在中文社交上,单纯以文字形式流传的虚假信息从比例上越来越少,以图片、截图形式流传的可疑信息则越来越多。

究其原因,一是「有图有真相」的观念深入人心,网络传言往往会附上图片来增加内容的可信度;二是图片形式更容易在群、朋友圈、微博等社交网络平台传播。

结果,有很多图片被抽离原有的背景和时间线流传,让受众对于该图片产生完全不同的认识和理解。还有的图片被软件加工篡改,完全改变了原有的意义。

因此,使用图片反向搜索(Reverse Image Search)工具,追溯图片的来源,在此基础上检查图片是否被修改或者挪用,是事实核查员最常处理的工作。

目前比较常用的图片反向搜索工具有谷歌、Yandex、Bing、TinEye、百度等,其中以前四个最为常用,各有优势和特点。

谷歌适合大多数基本的反向图像搜索,包括识别照片中的知名人物、查找已在网上大量共享的图像的来源、确定一件艺术品的名称和创作者等等。

使用方法:

1.在电脑上保存要核查的图片,或者复制该图片的网址

2.前往 Google 图片页面(https://images.google.com

3.点击搜索框的相机图标

4.可以选择直接上传图片、拖拽图片或粘贴图片的链接

比如核查以下图片(LIBKOS/AP):

在搜索结果中,可以看到页面右侧「图片匹配结果」中有两张完全一致的图片,点击图片即可找到这张图片的详细说明,包括时间、地点和拍摄者。

点击「查找图片来源」的选项,可以查看所有包含此图片的网页,从中选择可靠的信源,找到图片的详细说明:

还可以点击搜索框的「工具」按钮,进一步收窄搜索结果的范围,可以选择「按图片搜索」、「外观相似」或「更多尺寸」。

「工具」还有「时间」选项,可以选择从「过去 1 小时内」到「过去 1 年内」不同的时间范围,也可以自定义范围。通过这种设置,可以更容易找到图片初次发布的网页。

如果希望进一步搜索图片的局部,谷歌提供了裁剪工具,图片的四个圆角是可以移动的,用来调整搜图的范围,页面右侧会实时展示对裁剪后的画面进行图片搜素的结果。

对核查员来说,有时要核查的图片画面非常复杂,但有效信息只有其中的一部分,这时候裁剪功能就非常有用。

如果使用谷歌 Chrome 浏览器,可以直接在需要核查的图片上点击右键,选择「使用 Google 搜索图片」,搜索结果会在页面右侧显示。

也可以在页面空白处点击右键,选择「使用 Google 搜索图片」,页面会出现「选择要搜索的图片区域」的提示和截图用的图标,可以任意选择要搜索的图片区域,有关该区域的图片搜索结果会出现在页面右侧。

识别图片中的文字信息

在谷歌图片的搜索结果页中,点击「文字」按钮,谷歌可以识别图片上的文字信息,并且将其转换成可复制的文本。

这一功能非常实用,核查带有标语、路牌等元素的图片时,可以快速提取其中的文字,然后检索,以可能的线索。尤其是有关文字元素为俄语、阿拉伯语、韩语等语种时,核查员不必担心电脑输入法问题。

比如,查证一张带有俄语的图片(Alexander Ermochenko/Reuters):

在搜索结果中点击「文字」按钮,光标可以在图片上点击并拖动选择任意文字,也可以选择「选择所有文字」,这是页面右侧已经出现了标语上的文本,这时可以有 4 个选项:「复制文字」、「聆听」、「翻译」和「搜索」,可直接进行下一步的操作。选择「翻译」可知,这是俄罗斯在一个名为苏多普拉托夫的地点的征兵广告。

翻译图片中的文字信息

点击「翻译」按钮,谷歌可以直接在图片上将外语文字翻译成中文,可以大致明白图片上外语文字的意思,但受到识别度的限制,并不完整和准确,仅可提供快速的参考。

比如查证这张带有法语的图片(AFP):

在搜索结果中点击「翻译」,可大致知道这次示威的主题是关于养老金改革。

谷歌 lens 的特点是试图识别图像的主题,而非图像本身。不利的一面是,许多匹配项都侧重于图像中的主题。因此,如果图像搜索的主题不太清楚,可能不会获得高质量的结果。

比如搜索这张乌克兰总统泽连斯基的图片(EPA/UKRAINIAN PRESIDENTIAL PRESS SERVICE – HANDOUT):

返回的大部分却是与战术背心有关的结果:

「关于此图像」功能

2023 年 5 月 10 日,谷歌在 I/O 2023 开发者大会上宣布,将在接下来的几个月里添加一种新方法来帮助用户评估图像来源。

通过在搜索中的「About this Image」工具,用户将能够看到重要的背景信息,例如:

该图片和类似图片是什么时候首次被谷歌索引的,

这张图片可能首次出现的地方,

这张图片还出现在了网上的什么地方(例如新闻、社交或事实核查网站)

用户可以有三种方式来使用这一功能:点击 Google 图片搜索结果中的图片上的三个点;在 Google Lens 中使用图片或屏幕截图进行反向搜索;在使用 Google 的移动时,如果在一个页面上遇到想了解更多信息的图片,可以向上滑动。

按照谷歌的计划,2023 年晚些时候,用户还可以在桌面和移动端的 Chrome 浏览器中通过右键点击或长按图片来使用这一功能。

该功能将首先在美国以英语提供。

Yandex是一个俄罗斯的搜索引擎,检索有关俄罗斯、东欧、中亚等地区的内容时特别有优势,因此在俄乌战争期间很有价值。

使用方法:

1.在电脑上保存要核查的图片,或者复制该图片的网址

2.前往 Yandex 图片搜索页面(https://yandex.com/images/

3.点击搜索框的相机图标

4.可以选择直接上传图片、拖拽图片或粘贴图片的链接

5.单击搜索选项以在 Yandex 上查找相关图片。Yandex 将返回具有完全匹配或视觉相似图像的结果,包括使用这些图像的网页列表。

比如,2022 年 3 月 20 日,有微博用户称:「波兰铁路工人中断了与乌克兰的铁路连接,使装有英美武器的火车无法前往乌克兰。」有关博文还附有一张模糊的铁路照片,画面中有两列列车,但是没有显示地点的明显标记。(参考阅读:波兰铁路工人中断与乌克兰铁路连接?

在 Yandex 上反搜这张图片,可以找到大量的匹配结果:

在谷歌上反搜,首先出现的是一大批相似图片:

下拉数页后才能发现匹配的图像:

2023 年 4 月,中文网络流传一段视频,称「歌手席琳·迪翁参加她儿子的婚礼,因为罕见的僵硬人综合症已无法自己站立,看到的画面让人感伤」。

截取视频画面分别在谷歌、Yandex 和 TinEye 上反搜,可以发现,只有 Yandex 返回了包括大量相似图片的搜索结果,并且其中包含有意义的线索。

Yandex 还可以在搜索结果中显示其找到的核查图片的不同尺寸,如果核查的原图比较模糊,此时可以点击并保存更大尺寸的图片,然后继续反搜大尺寸的图片,一般而言可能更接近于找到图片的源头。

同样,Yandex 也具有识别图片中的文字,裁剪图片等与谷歌类似的功能。

案例 1:

2022 年 2 月,俄罗斯进攻乌克兰之前,中文网络广泛流传一张据称是乌克兰少女拿枪乘坐公交车的图片。

图片中,这位女孩头戴米色编织毛线帽,身穿带圆形拉链的黑色高领羽绒服,左手涂蓝色指甲油,右手涂红色指甲油。图片中没有明确可以提示时间、地点的元素。

有关图片被指拍摄于乌克兰,在俄罗斯和俄语区广泛使用的搜索引擎 Yandex 上反搜图片,可以发现该图片自 2020 年起就在俄罗斯社交网络 VK 上广泛流传。

在 VK 上进一步检索,可以发现能够找到的最早版本发布于 2020 年 3 月 27 日,发布者名为「寻找新西伯利亚的你」。从其主页内容看,这是一个寻人账号,slogan 是「连接命运」。账号介绍称:如果你在某个地方看到一个人,但由于某种原因无法接近和认识,那么你可以通过描述你的故事来尝试找到 Ta。

这张照片由名为 Karpov Sasha 的用户拍摄,配文是:「我一路坐在她旁边,我非常喜欢她,但很害怕打招呼。我在寻找你,美女。」

在帖子下方的评论中,一位名为 Ekaterina Gladkikh 的用户称,她就是照片中的女子。

她还在自己的 VK 页面上转发了这个帖子。

根据 Ekaterina Gladkikh 的 Instagram 账号,她是俄罗斯人,目前在新西伯利亚生活,是一位网红。

检索 Gladkikh 的 Instagram 账号,可以发现她在 2020 年 3 月 10 日发布的视频中,左手涂有红色指甲油、右手涂有蓝色指甲油,与网上流传的照片特征一致。

在 Gladkikh 于 2020 年 4 月 8 日发布的照片中,可以看到她穿戴着与网络流传照片中同款的毛线帽、黑色羽绒服,右手也涂有蓝色指甲油。

(参考阅读:乌克兰少女带枪坐公交?

案例 2:

2022 年 5 月,短视频平台抖音出现一批内容几乎一模一样的视频,文案是:「没有国哪有家,俄罗斯进入最困难时期,民众排队存钱救国!」

视频画面多是俄罗斯人在银行、ATM 取款机等处排长队的场景。

核查的关键之处在于找到每张图片的来源。

比如这张图片,使用谷歌和 Bing 都没有找到理想的结果:

使用俄罗斯搜索引擎 Yandex,裁剪截图的文字部分,可以找到一张同类结果:

点开网页发现,使用这张图片的文章发布于 2014 年 12 月 17 日,虽然可以断定此图与 2022 年俄乌局势无关,但是网页没有提供有关这张图片的详细信息,如图片说明、出处等。

不过,与最初的视频截图相比,这个网页上的照片尺寸较大,也更清晰,我们可以把这张大尺寸照片保存下来在 Yandex 上反搜,可以在第二个搜索结果中发现 Getty 图片社的网站包含了这张图片。

点击搜索结果中的 Getty 网站,可以发现该图片由彭博社记者安德烈·鲁达科夫(Andrey Rudakov)拍摄于 2014 年 12 月 17 日,图片说明是:俄罗斯圣彼得堡的一家 M-Video 商店内,顾客排队购买电子物品。在该国自 1998 年以来最严重的货币危机中,人们担心价格会进一步上涨而抢购消费品。

由此这张图片的身世就完全搞清楚了。(参考阅读:俄罗斯全民排队存钱救国?

Bing 是微软旗下的搜索引擎。在首页(bing.com)的搜索框旁边即有图像搜索的图标,可以直接进行反向图片搜索,而不必像谷歌和 Yandex 那样进入二级页面。

使用Bing 图片搜索时,可以将一张或多张图片拖到搜索框中、粘贴图像或 URL、从电脑上传图像,还可以用设备拍照——然后 Bing 将在网络上搜索匹配的图像。

Bing 也具有和谷歌、Yandex 类似的图片裁剪功能,在搜索结果页面点击「视觉搜索」按钮,可以裁剪照片的不同区域并查看实时搜索结果,这对于查找那些具有多个可识别主题的图像来说会非常有用。

Bing 另一特点是在搜索结果页,选择「具有此图像的页面」后,可以选择以「最新」或「最久」来对搜索结果进行排列。此功能与 TinEye 的按时间排序类似。

此外,与谷歌相比,Bing 会尝试识别照片中的不同元素,然后查找包含所有这些元素的图像。

比如,一张停在树旁的古董车的图片会触发包含一棵树和一辆古董车的相关匹配,而谷歌在这种情况下会选择其中一个更强烈的主题并寻找匹配。

TinEye创办于 2008 年,总部位于加拿大多伦多。TinEye 的最大优势是可以对搜索结果进行时间排序。

TinEye 使用图像识别技术来搜索图像,而不是关键字、元数据或水印。当用户提交要搜索的图像时,TinEye 会使用图像识别为其创建一个独特且紧凑的数字签名(「指纹」),然后将此指纹与其索引中的所有其他图像进行比较以查找匹配项。TinEye 会不断爬取网络并将图像添加到其索引库中。

使用方法:

通过单击上传(upload)按钮从电脑上传图像,也可以用拖曳方式把图片拖入搜索框。如果按 URL 搜索,可以把图像的 URL 地址复制并粘贴到搜索框中。

使用 TinEye 搜索图像时,可以通过几种不同的方式对这些结果进行排序和过滤:

最佳匹配(best match):首先显示视觉上最接近被搜索图像的图像。这也是默认的排序选项。

改动最大(most changed):首先显示对搜索图像改动最大的图像(经过大量编辑的图像)。

最大图像(biggest image):首先显示最高分辨率的图像。

最新的图像(newest):首先显示 TinEye 最新发现的图像。

最早的图像(oldest):首先显示 TinEye 最早发现的图像。

能够对搜索结果按照时间排序,是 TinEye 相比其他图片反搜工具的最大优势。对事实核查员来说,这一功能更容易破解挪用旧图片的传言,足以证明那些被形容为新闻的图片实际上已经有数月甚至数年之久。

以下图为例,2022 年 2 月 26 日,俄罗斯对乌克兰开战 2 天后,微信群流传一张据称是战场的新闻照片,两名儿童面对飘扬着乌克兰国旗的装甲车队敬礼,远处硝烟弥漫。

在 TinEye 上输入照片,排序选择 sort by oldest,可以发现出现在 TinEye 搜索结果第一位的是乌克兰网站 Gordonua 的页面,时间是 2016 年。

点击 Gordonua 的网络链接,可以找到 2016 年 3 月 23 日的一张图片与要核查的图片相同。

图片说明称,这是乌克兰国防部在其 Facebook 页面上发布的「战争之子」系列照片中的一张。

因此可以判定,这张图片至少拍摄于 2016 年,与 2022 年的俄乌战争无关。(参考阅读:乌克兰儿童向乌军车队敬礼?

可以在 TinEye 上搜索哪些类型的图像?

文件类型:TinEye 接受各种格式,包括但不限于 JPEG、PNG、GIF、BMP、TIFF 和 WebP 图像。

图像尺寸:最适合使用至少为 300 像素的图像,但也可以接受低至 100 像素的图像。

文件大小:最大为 20M。

为了获得最佳搜索效果,应尽量避免使用有明显水印的图像,因为 TinEye 可能会搜索水印而不是图像本身。

TinEye 的搜索结果会以域名分类,显示包含相关图片的网站;如果想知道搜索图片的版本是否出现在一个特定的网站上,可以在「按域名/集合过滤」(filter by domain/collection)的输入框里输入该网站的网址。TinEye 也会自动设置一些域名分类,主要包括主要的社交媒体平台和媒体,如 Twitter、Reddit、AFP 等。

如果搜索的图片属于图库里含有的图片,会标记为 stock;如果隶属于某一个系列的图片,则会标记为 collection。当 TinEye 确定一个网站已经无法访问时,会默认隐藏该网站的搜索结果。但如果用户对这些匹配结果感兴趣,可以勾选「包括不可用的结果」(include results not available),TinEye 就会显示该网页的存档。

TinEye 还有比较(compare)功能,可以将搜索结果与用于执行搜索的图片进行比较,这在识别裁剪过的、调整过大小的、倾斜过的或 PS 过的图片时非常有用。

但是,有些图像 TinEye 找不到:

大多数社交媒体网站,如 Facebook 和 Instagram,都限制 TinEye 抓取他们的图片。

受密码保护的页面或不可公开访问的页面上的图像。比如,如果要核查的图片最早发布在一个 WhatsApp 群组或微信群里,并且从来没有在网上被分享过,TinEye 就无法找到。

用户个人设备上的个人照片。

一些太小的或简单的图像,可能没有足够的细节让 TinEye 制作「指纹」。

与其他搜索引擎不同,TinEye 只能找到与我们搜索的图像完全匹配的图像(也包括经过裁剪、颜色调整、大小调整、编辑或轻微旋转的图像),但一般来说无法找到相似的图像。

注意:

TinEye 抓取到最旧的图片并不一定是该图片第一次出现在互联网上的日期。因此,TinEye 不能告诉我们一张图片首次出现在互联网上的时间,只能告诉我们 TinEye 首次发现它的时间。

一般而言,核查员在核查图片时会尝试使用多个反搜工具,而最方便的是下载安装 InVID Verification Plugin 插件,该插件集成了多种图片验证功能。

通过 Chrome 或 Firefox 浏览器下载安装插件后,在网页浏览图片时,可以直接右键点击图片,选择 Fake news debunker by InVID by WeVerify,进一步选择 Image Reverse Search-All,即可同时启动谷歌、Yandex、Bing、TinEye 等多种图片反搜工具,并在不同的新窗口展示搜索结果,极大地提高了效率。

另外一种使用方法是进入 InVID 系统。安装 InVID 后,Chrome 浏览器顶部会出现一个启动图标:

点击后选择「打开工具箱」(Open Toolbox)

进入 InVID 界面,选择图片处理(Image),即可看到 6 大功能:

1.图片分析(Image analysis):针对 Twitter 和 Facebook 上的图片,进行详细的数据分析。

输入图片的网址,点击提交,出现有关该图片的信息。

图片 ID、平台、创建时间、图片链接、点赞数、转推数,同时还抓取了推文下面所有的评论并且分类,包括带有链接的回复数。

比如我们分析 SpaceX 的这则推文图片:

2.放大镜(Magnifier):用户可以在图片上使用放大镜功能,以帮助解读和阅读图像中难以看到的细节——比如汽车牌照、飞机侧面的识别号码、徽章、标志、横幅等等。用户可以输入图片的网址,或者使用本地文件按钮(LOAD LOCAL FILE)从本地上传图像。

比如我们可以用放大镜检查这架战斗机涂装上的信息:

然后可以使用图片下方的谷歌、Google Lens、Yandex、Tineye、百度等按钮对图片进行反向搜索,或使用图像取证选项。

该功能还包括图片编辑(点击 EDIT IMAGE),可以对图片进行裁剪、翻转、锐化等。

3.元数据(Metadata):用户可以查看 jpg 和 tiff 格式的图片的 Exif 数据,可以输入图片链接或上传本地图片文件。

Exif (可交换影像档案格式,Exchangeable Image File Format) 档案会储存照片的重要资料,例如设备、曝光值、拍摄时间、地点以及使用的任何设置。每当用户拍摄新的照片时,几乎所有数码相机和智能手机都会建立这些资料档案。

4.取证(Forensic):帮助用户检测图片是否被篡改,比如是否被 Photoshop 软件编辑过。不过,使用者需要极其丰富的图像知识,且结果可能存在误差,所以,一般而言仅能作为参考,而非决定性证据。

5.OCR:可以将图片上的文字内容,智能识别成为可编辑的文本,不过有时无法识别。

6.检查 GIF 图片(CheckGif):可以对比原始图像和被篡改的图像(包括图像被裁剪过的情况),然后生成一个 GIF 并输出,可以更直观地展示篡改行为。不过,该功能目前仅对事实核查员、记者和研究人员开放。

2022 年 7 月 8 日,日本前首相安倍晋三遇刺后,中文网络流传一张照片称,被称为「日本第一女保镖」的石田萌美也在现场,却未能阻止杀手。

石田萌美此前在中文网络被形容为「日本第一女保镖」。她被指曾是安倍晋三最信任的贴身人员之一,因为外型靓丽和身份特殊受到关注。有文章指她是日本顶尖的武功高手,能够在 0.2 秒内拔枪制服袭击者,曾击退 10 名壮汉。

使用图片反搜工具搜索这张照片,可以确定照片本身是真实的,但是因为安倍身边的这位女士戴着口罩,也无其他明显的识别特征,所以依然很难判断她的身份。

这时我们仔细观察这张被指是石田萌美检查安倍伤势的照片,可以发现这位女士外表可供辨认的几大特征:长发束辫,黑色或深蓝色上衣,带有花卉纹样的裙装,低跟皮鞋。

由于安倍遇刺发生在公开场合,且现场媒体众多,因而有利的一面是,有大量现场照片可供检索。在《朝日新闻》网站上的安倍遇刺现场图片集中,我们可以发现大批同一场景的照片,能够较清晰地分辨出这位女士身穿的是一件罩衫,罩衫内是黄色 T 恤。

在美联社转发《读卖新闻》的一张照片中,安倍被送上救护车,救护车旁有一位女士的正面照片,放大后可见其发型、黄色 T 恤和蓝色罩衫、带花纹的裤装、黑色皮鞋,均与网传照片一致,可以判定她与被中文网络认为是石田萌美的那位女士是同一人。

大量现场视频和照片显示,安倍遭到枪击后,一批身穿黄色 T 恤的人员对其进行了心肺复苏等急救。这些人员的黄色 T 恤与这位女士的黄色 T 恤一致,因此,黄色 T 恤成为识别这位女士身份的最关键因素。

核查员用日语在推特、Facebook 平台上搜索「安倍 黄色衣服」关键词,发现有日本网民的推文中提供了线索,指出这是日本看护联盟的工作人员在急救。

据此线索,检索看护联盟的官方网站,了解到看护联盟是代表日本护理行业的组织,而且网站上的照片显示,看护联盟的成员在参加集体活动时一般均着黄色标志色衣服,有护理、急救知识和经验。

再用日语检索「看护联盟 安倍」,可以发现代表日本看护联盟参加众议院选举的友納理緒在有关安倍的讣告中提到,「在这次事件中,现场的看护联盟的各位在混乱中奋力救助」。

照片中的这位女士也穿着统一的黄色 T 恤,因此可以判定,她不可能是石田萌美,也不可能是安倍的保镖。

从这张照片的核查过程来看,以图搜图只是一个起点,更需要根据图片中的各种信息、图片外的各种新闻报道、社交媒体上的线索等等综合研判,得出结论。(参考阅读:安倍遇刺时网红女保镖就在身边?

2021 年 9 月,中文网络流传一张照片称,被加拿大扣押的华为公司首席财务官孟晚舟「困境中不忘支持国货,穿鸿星尔克出庭」,并附上孟晚舟穿运动鞋面带笑容的照片。不过,这双鞋上并无醒目的品牌 logo。

以「Meng Wanzhou+sneaker」为关键词在搜索引擎检索,可以在德国新闻图片社 IMAGO 的网站上发现一组照片,与中文网络流传的照片一致。

该组照片由加拿大新闻社记者 Darryl Dyck 拍摄,图片说明是:2021 年 8 月 6 日,华为公司首席财务官孟晚舟戴着脚踝监视器,穿跑鞋(running shoes)离开温哥华的家,前往位于温哥华的加拿大不列颠哥伦比亚省高等法院参加引渡听证。

此时我们已经找到了图片的来源,但是原图的图片说明中并未指出这双鞋是什么品牌。

不过,搜索结果很有利的一点是,摄影师拍了一组照片,尤其是有一张特写孟晚舟脚踝监视器的照片,孟晚舟的跑鞋也相比网传图片更加清晰。

这时我们使用 Google Lens 搜索这双鞋,因为 Google Lens 不仅可以搜索图片,还会试图提供图片中的信息,比如你扫描一张产品图片,可能会看到购物链接。果然,搜索结果指向了 HOKA 品牌。

核查员还使用了淘宝 APP 的拍照功能,拍下图片上的鞋子,然后淘宝快速识别出相似的结果,也指向了 HOKA 品牌。

据此线索进入 HOKA 官网的网络商店检索,可以发现孟晚舟所穿鞋款品牌为 HOKA ONE ONE,款式为 Clifton 8。

与此同时,核查员还登录了鸿星尔克官方商城、鸿星尔克淘宝旗舰店,没有发现类似商品。鸿星尔克淘宝旗舰店的客服也证实这款鞋子并非鸿星尔克。

由此可以得出结论,这张照片是孟晚舟于 2021 年 8 月 6 日离开住所前往加拿大不列颠哥伦比亚省高等法院参加引渡听证时拍摄的,她脚穿鞋款品牌并非鸿星尔克,而是法国品牌 HOKA ONE ONE。(参考阅读:孟晚舟穿鸿星尔克运动鞋在加拿大出庭?

2022 年 7 月 8 日,日本前首相安倍晋三遇刺后,中文网络流传一张照片,一位日本电视台的男性主播在咧嘴大笑,画面下方是一行日语字幕,可以辨认出与安倍遇刺有关——“安倍晋三元首相死亡確認”。

首先我们先从照片上的信息入手,这张截图的左上角有日文字样「イット」,在谷歌检索,找到节目的官网,可见这是日本富士电视台和富士新闻网(FNN)播放的一档新闻节目,全称为 Live News it!(日语片假名为:ライブ ニュース イット!),于 2019 年 4 月 1 日开播,一般直播时段为每周一至周五下午 3 点 45 分-7 点。

比对节目官网上的主持人形象,可以确认屏幕上的主播名叫榎並大二郎,毕业于庆应大学,2008 年加入富士电视台,从 2020 年 9 月 25 日起开始担任 Live News it!的主播。

这时我们要确认的是,榎並大二郎在播报安倍遇刺后确认死亡的新闻时是否大笑,所以最好要找到有关的节目视频。在 FNN 的 频道检索,可以发现该频道 2022 年 7 月 8 日上传的一则视频与中文流传截图的字幕、主持人衣着、背景均一致:「速报:安倍晋三元首相死亡確認 元海上自衛官に銃撃される」。

不过,在这则时长 44 秒的视频中,榎並大二郎并无大笑的表情。

那这张网传截图中大笑的表情从何而来?P 图能够如此自然吗?

事实上,随着 AI 技术的进步,常见的人脸编辑器或修图应用已经能很轻松地改变照片中的人物表情,比如国外的 FaceApp 和国内的醒图 App。

核查员从榎並大二郎播报安倍遇刺视频中截取照片,试图复现图片中的主持人大笑效果:

在醒图应用中选择「微笑」的特效选项后,应用自动处理完成后展示的效果如下,与网传图片非常接近:

核查至此,得到两个证据:一是检索到主持人播报该条新闻时的完整视频片段,主持人并无大笑;二是核查员使用修图软件,复现了网传图片中的主持人大笑效果。

但是,为了让结论更坚实,我们还就这张图片联络了富士电视台观众中心,工作人员回复查询时表示,当天紧急速报无异常,播报员榎並大二郎没有大笑的行为。

此时我们可以得出结论,主持人当天播报有关新闻时并未大笑。这一核查案例也提醒我们,随着 AI 技术的日益进步,对于图片的识别难度也在增加,必须借助更多信息加以综合研判。(参考阅读:日本主持人播报安倍遇刺时咧嘴大笑?

三星手机的 Space Zoom 功能可以让用户拍摄到美丽的月球图像,但也引发了由此产生的图像是否「真实」的争议。

2023 年 3 月,Reddit 上的一则帖子引发激烈的讨论,该贴清楚地拿出「证据」说明,指责三星的月球照片是「假」的。

Reddit 用户 ibreakphotos 先故意制作了一张模糊的月球照片,将其显示在电脑屏幕上,然后用三星 S23 Ultra 手机拍摄屏幕上这张模糊的月球照片,最终的照片显示了一张清晰的月球照片,增加了一些以前没有的细节。

制作过程:

1.从互联网上下载了这张高分辨率的月球图片

2.将图片尺寸缩小到 170×170 像素并使用高斯模糊,让月球上所有的细节都消失,这意味着它不可恢复,信息不存在,数字模糊

放大 4 倍的版本,以便更好地看清模糊效果:

3.在显示器上全屏显示该图像(尺寸为 170×170 像素,非常模糊),拍摄者移到房间的另一端,关掉所有灯光,开始拍摄

4.手机拍摄效果

5.对比

ibreakphotos 认为,用三星 Galaxy S23 Ultra 拍摄的月球图像,是通过应用「月球纹理」(Moon texture)来伪造的。 这名用户得出的结论是,三星的月球照片是假的,在没有细节的地方添加了细节,大部分工作是 AI 完成的,而不是光学器件。

对于图片造假指控,三星向著名的科技产品评测指南网站 Tom『s Guide回应称:「三星致力于在任何条件下提供最佳的拍照体验。当用户拍摄月亮时,基于 AI 的场景优化技术会识别出月亮是主要拍摄对象,并进行多帧合成,然后 AI 会增强图像质量和颜色细节。它不会对照片应用任何图像叠加(image overlaying)。用户可以关闭基于 AI 的场景优化功能,这将禁用对用户拍摄的照片进行自动细节增强。」

也就是说,三星否认了 Galaxy S23 Ultra 使用基于 AI 的图像叠加技术来增强月亮照片细节的说法。

科技网站 The Verge 就此评论称:「在这种情况下,『假』到底是什么意思?这是一个很难回答的问题,随着计算技术进一步融入摄影过程,这个问题将变得越来越重要和复杂。我们可以肯定地说,我们对照片造假的理解很快就会改变,就像过去对数码相机、Photoshop、Instagram 滤镜等的理解一样。

摄影正在发生变化,我们对什么是『真实照片』的理解也会随之改变。「

AI 图像生成工具在 2023 年呈现出爆发性应用趋势,可以通过利用海量数据库生成无限数量的图像。

Midjourney是一种使用生成 AI 从简单的文本提示创建图像的工具,2023 年 3 月推出了更先进的模型,能够生成更逼真的图像。

Stable Diffusion是一个文字转图片的生成模型,可以只用几秒钟时间就生成比同类技术分辨率、清晰度更高,更具「真实性」或「艺术性」的图片结果。

DALL-E 的出品方 Open AI 旗下的一个模型,接收文本和图像作为输入,以多种形式输出最终转换后的图像。升级版本 DALL-E 2 在生成用户描述的图像时具有更高的分辨率和更低的延迟。

Craiyon AI是一个免费的在线 AI 图片生成器工具,可以根据用户输入的任意文本生成独一无二的视觉艺术作品。

2023 年 3 月,微软 Bing 在线 AI 绘图功能Image Creator上线,由 Open AI 的 DALL-E 驱动,可通过文字描述生成图片内容。Bing 绘图目前仅支持英文,使用「形容词 + 名词 + 动词 + 风格」的格式可以生成高质量图片。每个由图像创建器生成的图像都会在左下角添加 Bing Logo。

Adobe 也在 2023 年 3 月发布了使用人工智能生成图像的新工具Adobe Firefly。Firefly 允许用户通过文字来描述其软件将创建的图像、插图或视频。

英伟达公司也推出了名为「毕加索「的自有服务,该服务使用人工智能技术从文本描述中生成图像、视频和 3D 应用程序。

虽然篡改图片和创建假图像的做法并不新鲜,但 、DALL-E、Stable Diffusion 的 AI 图像生成工具更易于使用。它们可以快速生成具有详细背景的逼真图像,只需来自用户的简单文本提示即可。这些技术如果被不良行为体利用,可能会大幅提高核查难度。

在过去,包括深度伪造(deepfake)在内的造假者会篡改一张已经存在的图片或一段已经存在的视频,此时尚且可以通过图片反搜等方式,追根溯源找到原图来进行核查。

但是,新时代的造假者已经不需要这么做,他们可以使用人工智能 技术,特别是文本生成图像的模型,创建完美支持其虚假叙述的全新图像,制造逼真的假证据。这种图像,无法通过图片反搜的方式直接追根溯源,因为它本身就是源头。

2023 年 3 月,在美国纽约检方可能因一起案件逮捕前总统特朗普之际,开源调查新闻机构 Bellingcat 创始人 Eliot Higgins 在一系列广为流传的推文中,用 Midjourney 工具的最新版本制作了特朗普虚构被捕的大量戏剧性画面。他在推文中明确表示这些图像是 AI 生成的,也说明了自己在 AI 生成过程中发布的指令:「特朗普在被捕过程中摔倒。新闻报道画面。」 随后 AI 给出了这些图片。

虽然推特的资深用户和人工智能爱好者可能第一眼就能认出这些假图片,但也有很多人并没有,甚至会提出疑问:「为什么特朗普被捕没有成为新闻」?在没有关键背景的情况下,这些视觉效果很快就会被其他人转发。一篇 Instagram 帖子分享了 Higgins 的一些特朗普照片,就好像它们是真的一样,获得了超过 79000 个赞。

虽然这些照片存在瑕疵,比如脸和手明显扭曲,警察制服上的文字乱七八糟,一张图片显示特朗普戴着警用腰带,等等。然而,这些线索没有那么简单被觉察,而且在现阶段可以很容易就被 Photoshop,或者一点动态模糊、像素化所掩盖。可以预见的是,随着技术的进步和迭代,这些瑕疵肯定也会消失,比如 Midjourney 的第五代版本已经可以较好地解决手部问题。

2023 年 4 月,德国摄影师鲍里斯·艾达格森(Boris Eldagsen)的黑白肖像摄影作品「电工」(The Electrician)不仅入围「Sony 世界摄影大奖」(Sony World Photography Awards)的创意类别,更获选为冠军,看起来是以传统摄影技术所拍摄的、两名来自不同世代的女性。

不过,艾达格森在 Facebook 发文坦承,这张其实是由 Open AI 的「DALL-E 2」工具生成的图像。事实上,「电工」是艾达格森 2022 年开始创作的「Pseudomnesia」系列作品之一;Pseudomnesia 在拉丁语中指的是「虚假记忆」,包括从未发生过的虚假事件,而不只是不准确的记忆。

艾达格森表示:「这是一个历史性时刻,这是第一张由 AI 生成的图像赢得了一个国际摄影大奖。」他声明称:「我想检验摄影比赛是否已经准备好接受 AI 生成图像。但事实上并没有明确的规定,关于 AI 图像是否合法,该组别允许编辑和合成图像。」

目前核查这些 AI 生成的图像并无非常有效的工具,只能综合各种信息研判。

人工智能创业公司 Hugging Face 开发了一个人工智能图像检测器(AI Image Detector),能检查图像的显著特征,并对图像是自然的还是假造的做出说明。

比如这张特朗普被「逮捕」的 AI 生成图片,检测器判断出 67%的图像是由人工智能创造的。

这张乌克兰总统办公室 3 月 23 日发布的泽连斯基视察赫尔松的真实照片,检测器判断出其 83%的图像是由人而非人工智能创造的。

但是这种检测只能作为一种参考,而无法成为唯一的决定性证据。

图像数据分析公司 Mayachitra 也有一个针对使用 GAN(Generative Adversarial Network,生成对抗网络)技术生成图像的检测工具,目前只有测试版,不过可靠性仍有待提高。

比如这张特朗普被「逮捕」的 AI 生成图片,Mayachitra 工具却认为它「很可能不是使用 GAN 技术生成的」(Probably not GAN generated)。

人工智能公司 Hive Moderation 也有一个AI 生成内容检测工具,既可以检测文字内容,也可以检测图像内容。图像检测方面,可以检测由 DALL-E、Midjourney 和 Stable Diffusion 等流行工具生成的图像。

上传图片后,Hive 的人工智能检测模型会进行处理,以确定图片是否由 AI 生成,然后给出一个分数结果。如果模型认定图片由 AI 生成,结果还会判断这张图片是由哪个引擎创建的。

比如这张火车站老人与孔雀的 AI 生成图片,Hive 判断其 99.9%由 AI 生成,并且是由 Midjourney 生成的。

这张法国总统马克龙官方推特 4 月 7 日发布的访问中国中山大学的图片,Hive 判断其只有 0.5%的可能性是由 AI 生成的。

另一个核查的线索是找到图片首次发布到网上的时间。在某些情况下,最初的创作者可能会明确表示图片是人工智能生成的,并指出使用的工具。反向图像搜索可以帮助查看图片是否已在搜索引擎中编入索引并查找包含相同照片的旧帖子。反向图像搜索也会找到相似的图片,这时可以将潜在的 AI 生成的照片与来自可靠来源的照片进行比较,发现有用的线索。

有时照片本身也隐藏着线索,例如某些 AI 创作工具使用的水印。

例如,DALL-E 会在其所有图像的右下角自动生成一个多色条。

Craiyon 在同一个地方放了一支小红铅笔。

但并非所有人工智能生成的图像都有水印——这些水印可以被移除、裁剪或隐藏。

2023 年 5 月 10 日,谷歌在 I / O 2023 开发者大会上宣布,将确保每一张由谷歌 AI 生成的图像在原始文件中都有一个标记。其他创作者和出版商将能够添加类似的标记,因此用户将能够在 Google 图像搜索结果中看到这些 AI 生成标签。

另外,尽管生成式 AI 取得了长足的进步,但截至 2023 年 3 月,AI 生成的内容中仍然会出现错误,这些缺陷是目前识别 AI 生成图像的重要方式。比如,逼真的手仍然很难生成。AI 图像也很难产生反射,发现人工智能的一个好方法是寻找阴影、镜子、水,也可以放大眼睛,分析瞳孔,因为拍照时通常会有反光。有时图像会出现眼睛大小不一,颜色不同。还可以查看照片的远景,元素离得越远,物体就越模糊、扭曲并且视角不正确。

但是,AI 生成图像的技术绝对会快速进步,这些视觉缺陷也绝对会被弥补。比如,2023 年 3 月月发布的 Midjourney 的最新版本能够描绘出逼真的手部。所以从长远来看,视觉线索也并不可靠。

为了应对深度伪造图像,科技公司、研究人员、新闻机构正在试图建立内容来源和所有权的标准,从源头出发对影像的创造和传播进行全程跟踪。或许未来我们核查图像时,首先要做的是查看其数字水印。

2021 年 2 月,多家具有影响力的科技和媒体公司结为伙伴,成立「内容来源和真实性联盟「(Coalition for Content Provenance and Authenticity,C2PA),制定媒体内容来源与历史或出处认证技术标准,试图解决虚假信息、错误信息和在线内容欺诈的扩散问题。联盟创始成员包括 Adobe、Arm、BBC、Intel、Microsoft 和 Truepic,着力建立一套标准化溯源解决方案,解决好误导性内容问题。

C2PA 成员将共同针对常见资产类型和格式制定内容溯源规范,让出版商、创作者和消费者能够追踪媒体内容(包括图像、视频、音频和文档)的来源和演变。这些技术规范明确各类资产应标示的相关信息内容、如何显示和存储该信息以及如何识别篡改的证据。

各平台能够通过 C2PA 开放标准保存和读取基于出处的数字内容。一项开放标准可供任何在线平台采用,因此对于在整个互联网上提升信任度至关重要。除了将各类媒体类型纳入其中,C2PA 还着力推动从捕获设备到信息消费者的端到端出处体验。与芯片制造商、新闻机构以及软件和平台公司合作对于促进出处标准和推动整个内容生态系统的推广采用至关重要。

C2PA 的成立将 Adobe 主导的内容真实性倡议(Content Authenticity Initiative,CAI)和 Microsoft 与 BBC 主导的项目溯源(Project Origin)的众创始成员召集在了一起,在一个联盟下统一技术规范。CAI 正在构建一套数字媒体出处与历史系统,创作者可通过该系统声明其作者身份,消费者则可以通过它来判断其所看到的内容是否值得信赖。「项目溯源」针对的是新闻制作与传播。其方向是将证明内容真实性的标示附加到内容上,并让用户能够看到该标示信息,由此来解决数字新闻生态系统中的虚假信息问题。C2PA 成立后,技术标准将统一,上述两个实体将继续在各自社区内进行推广、原型设计和教育。

2022 年 2 月,C2PA 联盟发布了用以对抗深度伪造技术的数字内容认证技术规范的第一版,包括实现指南、考虑因素、用户体验指南以及关于程序目标和基本原理的完整细节。

C2PA 称:「C2PA 规范将为平台提供一种方法,以定义与每种类型的资产(如图像、视频、音频或文档)相关的信息,以及这些信息如何呈现和存储,以及如何识别篡改证据。作为一个开放标准,它被设计用于任何软件、设备或在线平台,以及监管机构和政府机构建立数字来源标准。」

在理想状况下,未来视觉内容的生产、传播与消费可能是这样的链条:制造视频和照片生产工具的公司——包括手机和相机制造商——需要在一开始就纳入 C2PA 身份验证标准。用户需要主动将内容凭证包含在他们制作的视觉效果中。主流出版商和社交媒体公司需要先找到这些凭证,然后才在其平台上显示图像。观众在信任图像或视频之前,可能要先查看一个带有下拉菜单的小图标。

目前,C2PA 联盟的成员已经扩展到包括索尼、佳能、尼康、松下、加拿大广播公司、德国新闻社、纽约时报等等在内的 52 家科技公司、媒体以及其他机构。

从应用层面看,2022 年 10 月,Adobe宣布与徕卡和尼康建立合作关系,这将使这两家相机公司在两款相机中实施符合 C2PA 标准和 CAI 标准的图像证明技术:徕卡 M11 和尼康 Z9,该技术将允许摄影师在相机拍摄时安全地附上照片的来源信息,包括每张照片的拍摄时间、地点和方式。

Adobe 还推出了内容凭据 (Beta)功能,这是 Adobe Photoshop 中一项正在开发的功能,凭借此功能,创作者可向导出的图像中添加其归因详细信息。启用后,内容凭据会收集编辑、活动和制作者姓名等详细信息,然后在创作者导出其最终内容时将这些信息作为防篡改归因和历史数据(称为内容凭据)附加到图像。不过,目前该功能只提供英语、德语、法语和日语版本。

C2PA 联盟中,尤为值得一提的是Truepic 公司,该公司是 C2PA 联盟的创始成员,相比 Adobe 这样的巨头,Truepic 是一家位于美国加州的创业公司,但是 Adobe 的内容凭据功能有一部分就是 Truepic 提供技术支持的。

通过捕获、签名和密封任何照片或视频中的元数据,Truepic 的技术可以创建防篡改数字指纹,并可以在整个网络上进行跟踪。这一流程也被称为「镜对镜」(glass-to-glass)系统,在该系统中拍摄、存储和传输的图片和视频会向观看者发出关于内容已被修改的提醒,无论这些修改是在何时何地进入一则影像从镜头到屏幕的过程中的。

首先,Truepic 的安全相机技术可捕捉、标记和密封每张照片或视频中的关键细节,例如日期、时间、位置和捕捉到的真实像素。

随后,Truepic 对图像实施符合 C2PA 标准的签名并密封。

然后,Truepic 将可以通过 SDK 将数据集成到任何网站或数字服务中,让关注可以查看任何媒体文件的来源和历史记录。

2023 年 3 月底,Truepic 和微软宣布发起「普罗维登斯计划「(Project Providence),利用上述技术和标准帮助记录和保护乌克兰的文化遗产。

2023 年 4 月初,Truepic 和荷兰公司 Revel.ai 合作创造并发布了一段深度伪造的视频:人工智能专家尼娜·希克(Nina Schick)在视频中发出「真实与虚构之间的界限正在变得模糊」的警告。

然而,这并非她本人。视频以一条字幕结尾:「这个深度伪造作品是由 Revel.ai 在尼娜·希克的同意下创建的,并由 Truepic 加密签名」。

这两家公司将这一视频描述为「第一个数字透明的深度伪造」(first digitally transparent deepfake),视频右上角有一个带有 i 标志的水印,表明它是计算机生成的,数据被加密密封在文件中,如果篡改图像,就会破坏数字签名,并在使用可信软件时阻止该证书显示。

除了 Truepic 以外,位于伦敦的机构eyeWitness to Atrocities也开发了类似的系统。作为系统核心的应用有两个功能。首先,当安装有该应用的手机拍摄照片或视频时,它会记录下事件发生的时间和地点,而这些时间和地点是由 GPS 卫星、附近的手机基站和 Wi-Fi 网络等难以否认的「电子证人」报告的。这被称为元数据的受控捕获,它比从手机上收集这类元数据更可靠,因为手机时间和位置的设置是可以更改的。第二,该应用读取图像的整个数字序列(用 0 和 1 呈现),并使用标准数学公式计算出该图像独有的由字母和数字组成的数值,即哈希值。

然后,使用者将图片或视频发动到 eyeWitness 的服务器,eyeWitness 会创建一个受信任的监管链,此链表明原始信息未以任何方式更改。

随后,eyeWitness 收到的所有信息都将由律师,他们对这些视觉证据进行标记、分类和处理,以满足调查人员的需求。

C2PA 项目联合创始人兼主席安德鲁·詹克斯(Andrew Jenks)认为,身份验证标准应该被视为一项重要的数字素养工作,其最接近的类似应用是如今被广泛采用的保证网页安全的 SSL 证书。

网站 SSL 证书是一种遵守 SSL 协议的服务器数字证书,由受信任的根证书颁发机构颁发。SSL 证书采用 SSL 协议进行通信,SSL 证书部署到服务器后,服务器端的访问将启用 HTTPS 协议(超文本传输安全协议),网站将会通过 HTTPS 加密协议来传输数据,可帮助服务器端和客户端之间建立加密链接,从而保证数据传输的安全。

如果某个网站受 SSL 证书保护,其相应的 URL 中会显示 HTTPS。单击浏览器地址栏的挂锁图标,即可查看证书详细信息,包括颁发机构和网站所有者的公司名称。

「我们必须训练用户寻找你今天在每个浏览器中上看到的挂锁图标,」詹克斯说,「那是一个非常困难的问题,花了很长时间,但这与我们今天面临的媒体素养问题完全相同。」

1.工具很重要,但更重要的是常识和逻辑。

2.没有任何工具是完美的,每个搜索引擎都有其优点和缺点,核查员可以使用 InVid 插件,尝试多种工具,确保找到更准确的图片源头。

3.搜寻到相同的图片并非一定就是最终的答案,也不一定能确定图片的真伪。若要确定图片中所展现的原始事件,必须更加谨慎地检查搜索结果,反复比对不同搜索结果对图片的描述;检查图片的拍摄时间和地点;分析包含图片的网页的发布者身份,判断其是媒体、政府机构,还是普通网民,以评估其可信度等。综合考虑搜索结果、影像细节和信源可信度等要素,进行交叉验证,才可能揭示事件的真相。总之,必须全方位分析才能确认原始事件的来龙去脉。

4.仅仅因为反向搜索引擎得到的结果都是同一张图片,并不一定代表该图片是真实且未被修改的。因为,即使一张图片被广泛传播,它也可能会被进行过后期修改,反向搜索结果也可能是其修改后的版本而非原始版本。举个例子,如果某个用户修改了他所拍摄的照片 A 并将其改成了图片 B,然后只上传了经过修改后的图片 B,那么反向搜索引擎将无法搜索到原始的照片 A。因此,需要注意的是,反向搜索引擎仅仅是一种帮助我们找到类似图片的工具,需要进行进一步的验证和核实才能确定图片的真实性和完整性。

5.有时候对原始图片进行某些修改可以更容易地找到最佳结果。

例如,有些人会发布一张照片并声称它是原始图片,但实际上只是对现有照片进行了翻转。在这种情况下,通过对照片进行翻转并进行搜索,可能会找到更准确的搜索结果。

6.留意图片上不起眼地方的水印,有时会提供图片原始来源的线索。

7,搜索结果有时会受到算法的影响,因此出现在前几页或出现多次的信息并不一定代表可信度高或图片的源头,因此需要更耐心地翻查搜索结果。

Fotoforensics是一个检测图片是否被修改过的免费网络工具。

ELA 是其主要特殊功能,ELA 是 Error Level Analysis 的缩写,表示错误级别分析,它通过在图像上显示错误级别来帮助我们检测图像是否经过 处理。

数字图像修改过的地方以及对比度较高的边界,往往 ELA 值较高,即表现为比较醒目的白色;而大面积的同色或者背景,往往表现为暗沉的黑色。

JPEG%的意思是图片质量比,显示上次保存时的图像质量。 每修改一次质量都会下降,一般来说也可证明图片被软件修改过。

元数据显示有关该图片的可用信息,例如创建时间、修改时间以及用于拍摄该照片的相机。

需要注意的是,使用 Fotoforensics 需要专业的影像知识,一般仅作为参考证据之一,而不宜作为主要的或者唯一的证据;还需要利用图片反向搜索工具等方法,寻找图片的来源,作为最终判断的依据。

VerEXIF可以用来查看照片的 EXIF 资料,也可以用来删除照片的 EXIF。

EXIF 是可交换图像文件的缩写,它是一种使用 JPEG 压缩在数码摄影图像文件中存储交换信息的标准格式。几乎所有新的数码相机都使用 EXIF 注释,在图像上存储信息,例如快门速度、曝光补偿、光圈值、使用的测光系统、是否使用闪光灯、ISO 编号、拍摄图像的日期和时间、白平衡,使 用的辅助镜头和分辨率等。有些图像甚至可能存储 GPS 信息,可以查看图像的拍摄地点。

注意:EXIF 资料是可以修改、编辑和删除的,因此只应作为核查参考。

而且,不是所有互联网上的照片都有 EXIF 信息,有些人在将其个人影像上传到网站之前,会先移除 EXIF 档案,例如其 GPS 位置。很多社交网络平台也会移除 EXIF 数据。

用于识别不同旗帜的大型数据库,可以按照不同的维度检索。

LICENSE PLATES OF THE WORLD

Plates Mania

提供全球各国和地区的车牌样式资料,按大洲和国家分类。如果不确定图片是在哪个国家/地区拍摄的,图片上的车牌可能是线索之一。

比如,2022 年 1 月初,中文网络流传一则视频,几名武装分子乘坐三轮车,在街头伏击扫射一辆白色轿车,镜头一转,白色轿车内出现孩子和女性惨死的镜头。有关文字称视频内容是「阿富汗,女人开车,被塔利班全车射杀」。

在视频的后半部分画面中,可以比较清晰地看到受害者的车牌样式和号码「LEH 15 6840」及位于号码下的「PUNJAB」字样。

在搜索引擎中检索「PUNJAB」,可以发现这一般是指是跨越印度和巴基斯坦的旁遮普地区。在上述车牌资料库查询,可以发现视频中的车牌样式是巴基斯坦的。这样可以确认视频不是发生在阿富汗。(参考阅读:阿富汗女性开车遭塔利班全车射杀?

高速公路标志数据库,按照国家分类。当图片或视频没有其他线索的时候,这些信息可以成为一个核查的入口参考。

实用 AI 提示词优化高级指南,新加坡首届 GPT-4 提示工程大赛冠军分享 [译]

By: Anonymous
7 May 2024 at 16:02

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

上个月,我非常荣幸地在新加坡政府科技局(GovTech)组织的首届 GPT-4 提示工程大赛中脱颖而出,这场比赛吸引了超过 400 名杰出的参与者。

提示工程是一门将艺术与科学巧妙融合的学科 — 它不仅关乎技术的理解,更涉及创造力和战略思考。这里分享的是我在实践中学到的一些提示工程策略,这些策略能够精准地驱动任何大语言模型为你服务,甚至做得更多!

作者的话: 在写作本文时,我特意避开了那些已经广泛讨论和记录的常规提示工程。相反,我更希望分享一些我在实验中获得的新洞见,以及我个人在理解和应用这些技巧时的独到见解。希望你能从中获得乐趣!

本文涵盖以下主题,其中 🔵 代表初学者友好的技巧,而 🔴 代表高级策略。

在使用大语言模型时,有效的提示构建至关重要。CO-STAR 框架,由新加坡政府科技局科学与 AI 团队创立,是一个实用的提示构建工具。它考虑了所有影响大语言模型响应效果和相关性的关键因素,帮助你获得更优的反馈。

这里有一个 CO-STAR 框架为何有用的现实案例。

假设你担任媒体经理,需要草拟一条 帖子,用以推广公司的新产品。 未使用 CO-STAR 的快速提示可能是这样的:

这是 GPT-4 的回答:

这一输出虽足够,但显得过于泛化,缺乏必要的细节和针对性吸引力,未能真正触及公司目标受众的心。

下面是一个应用 CO-STAR 模板的示例,它提醒我们在制定提示时,要考虑到任务的其它方面,特别是之前快速提示中缺少的风格语调受众

通过运用 CO-STAR 框架,GPT-4 的响应变得更具针对性和效果:

CO-STAR 框架指引您以有组织的方式提供所有关键任务信息,确保响应完全针对您的需求并进行优化。

分隔符是特殊的符号,它们帮助大语言模型 (LLM) 辨识提示中哪些部分应当被视为一个完整的意义单元。

这非常关键,因为你的提示是作为一个长的 Token 序列一次性传给模型的。通过设置分隔符,可以为这些 Token 序列提供结构,使特定部分得到不同的处理。

需要注意的是,对于简单的任务,分隔符对大语言模型的回应质量可能无显著影响。但是,任务越复杂,合理使用分隔符进行文本分段对模型的反应影响越明显。

分隔符可以是任何不常见组合的特殊字符序列,如:

选择哪种特殊字符并不重要,关键是这些字符足够独特,使得模型能将其识别为分隔符,而非常规标点符号。

这里是一个分隔符使用的示例:

在上述示例中,使用 ### 分隔符来分隔不同的部分,通过大写的章节标题如 对话示例 和 输出示例 进行区分。引言部分说明了要对 {{{CONVERSATIONS}}} 中的对话进行情绪分类,而这些对话在提示的底部给出,没有任何解释文本,但分隔符的存在让模型明白这些对话需要被分类。 GPT-4 的输出正如请求的那样,仅给出情绪分类:

使用 XML 标签作为分隔符是一种方法。XML 标签是被尖括号包围的,包括开启标签和结束标签。例如,{tag}{/tag}。这种方法非常有效,因为大语言模型已经接受了大量包含 XML 格式的网页内容的训练,因此能够理解其结构。

以下是利用 XML 标签作为分隔符对同一提示进行结构化的例子:

在指令中使用的名词与 XML 标签的名词一致,如 conversationsclasses 和 examples,因此使用的 XML 标签分别是 {conversations}{classes}{example-conversations} 和 {example-classes}。这确保了模型能够清晰地理解指令与使用的标签之间的关系。 通过这种结构化的分隔符使用方式,可以确保 GPT-4 精确地按照您的期望响应:

_在开始前,我们需指出,本节内容仅适用于具备系统提示功能的大语言模型 (LLM),与文章中其他适用于所有大语言模型的部分不同。显然,具有此功能的最知名的大语言模型是 ,因此我们将以 ChatGPT 为例进行说明。_

首先,我们来厘清几个术语:在讨论 ChatGPT 时,这三个术语「系统提示」、「系统消息」和「自定义指令」几乎可以互换使用。这种用法让许多人(包括我自己)感到混淆,因此 发表了一篇文章,专门解释了这些术语。简要总结如下:


图片来自 Enterprise DNA Blog

尽管这三个术语表达的是相同的概念,但不必因术语的使用而感到困扰。下面我们将统一使用「系统提示」这一术语。现在,让我们一探究竟!

系统提示是您向大语言模型提供的关于其应如何响应的额外指示。这被视为一种额外的提示,因为它超出了您对大语言模型的常规用户提示。

在对话中,每当您提出一个新的提示时,系统提示就像是一个过滤器,大语言模型会在回应您的新提示之前自动应用这一过滤器。这意味着在对话中每次大语言模型给出回应时,都会考虑到这些系统提示。

系统提示一般包括以下几个部分:

例如,系统提示可能是这样的:

每一部分对应的内容如下图所示:

系统提示已经概括了任务的总体要求。在上述示例中,任务被定义为仅使用特定文本进行问题解答,同时指导 LLM 按照{"问题":"答案"}的格式进行回答。

这种情况下,每个用户提示就是您想用该文本回答的具体问题。

例如,用户提示可能是"这篇文本主要讲了什么?",LLM 的回答将是{"这篇文本主要讲了什么?":"文本主要讲述了……"}

但我们可以将这种任务进一步推广。通常,与只询问一个文本相比,你可能会有多个文本需要询问。这时,我们可以将系统提示的首句从

改为

如此,每个用户提示将包括要问答的文本和问题,例如:

此处,我们使用 XML 标签来分隔信息,以便以结构化方式向 LLM 提供所需的两个信息。XML 标签中的名词,text 和 question,与系统提示中的名词相对应,以便 LLM 理解这些标签是如何与指令相关联的。

总之,系统提示应提供整体任务指令,而每个用户提示则需要提供执行该任务所需的具体细节。在这个例子中,这些细节就是文本和问题。

在之前的讨论中,我们通过系统提示来设定规则,这些规则一经设定,将在整个对话中保持不变。但如果你想在对话的不同阶段实施不同的规则,应该怎么做呢?

对于直接使用 ChatGPT 用户界面的用户来说,目前还没有直接的方法可以实现这一点。然而,如果你通过编程方式与 ChatGPT 互动,那么情况就大不相同了!随着对开发有效 LLM 规则的关注不断增加,一些允许你通过编程方式设定更为详细和动态的规则的软件包也应运而生。

特别推荐的一个是由 NVIDIA 团队开发的NeMo Guardrails。这个工具允许你配置用户与 LLM 之间的预期对话流程,并在对话的不同环节设定不同的规则,实现规则的动态调整。这无疑是探索对话动态管理的一个很好的资源,值得一试!

你可能已经听说过 OpenAI 在 ChatGPT 的 GPT-4 中为付费账户提供的高级数据分析插件。它让用户可以上传数据集到 ChatGPT 并直接在数据集上执行编码,实现精准的数据分析。

但是,你知道吗?并不总是需要依赖这类插件来有效地使用大语言模型 (LLM) 分析数据集。我们首先来探讨一下仅利用 LLM 进行数据分析的优势与限制。

正如你可能已经知道的,LLMs 在执行精确的数学计算方面有所限制,这让它们不适合需要精确量化分析的任务,比如:

正是为了执行这些量化任务,OpenAI 推出了高级数据分析插件,以便通过编程语言在数据集上运行代码。 那么,为什么还有人想仅用 LLMs 来分析数据集而不用这些插件呢?

LLMs 在识别模式和趋势方面表现出色。这得益于它们在庞大且多样化的数据上接受的广泛训练,能够洞察到复杂的模式,这些模式可能不是一眼就能看出来的。 这使它们非常适合执行基于模式查找的任务,例如:

对于这些基于模式的任务,单独使用 LLMs 可能实际上会在更短的时间内比使用编程代码产生更好的结果!接下来,我们将通过一个例子来详细说明这一点。

我们将使用一个流行的实际Kaggle 数据集,该数据集专为客户个性分析而设计,帮助公司对客户基础进行细分,从而更好地了解客户。 为了之后 LLM 分析的方便,我们将这个数据集缩减至 50 行,并仅保留最相关的几列。缩减后的数据集如下所示,每一行代表一位客户,各列展示了客户的相关信息:

设想你是公司营销团队的一员,你的任务是利用这份客户信息数据集来指导营销活动。这是一个分两步的任务:首先,利用数据集生成有意义的客户细分;其次,针对每个细分提出最佳的市场营销策略。

这是一个实际的商业问题,其中第一步的模式识别能力是 LLM 可以大显身手的地方。 我们将按以下方式设计任务提示,采用四种提示工程技术:

下面是 GPT-4 的回复,我们将继续将数据集以 CSV 字符串的形式传递给它。

随后,GPT-4 按照我们要求的标记符报告格式回复了分析结果:

为了简洁,我们选择两个由大语言模型生成的客户群体进行验证——“年轻家庭”和“挑剔的爱好者”。

年轻家庭

– 大语言模型生成的描述:出生于 1980 年后,已婚或同居,中等偏低的收入,育有孩子,常做小额消费。

– 此群体包括的数据行:3、4、7、10、16、20 – 深入查看这些数据行的详细信息,结果显示:


年轻家庭的完整数据 — 作者图片

这些数据完美对应大语言模型确定的用户描述。该模型甚至能够识别包含空值的数据行,而无需我们预先处理!

挑剔的爱好者

– 大语言模型生成的描述:年龄跨度广泛,不限婚姻状况,高收入,孩子情况不一,高消费水平。

– 此群体包括的数据行:2、5、18、29、34、36 – 深入查看这些数据行的详细信息,结果显示:


挑剔的爱好者的完整数据 — 作者图片

这些数据再次精准匹配大语言模型确定的用户描述!

本例展示了大语言模型在识别模式、解读及简化多维数据集以提炼出有意义的洞见方面的强大能力,确保其分析结果扎根于数据的真实情况。

为了全面考虑,我使用同一提示尝试了相同的任务,不过这次我让 ChatGPT 通过编程方式进行分析,启用了其高级数据分析插件。插件应用 K-均值等聚类算法直接对数据集进行处理,以便划分不同的客户群体,并据此制定营销策略。

尽管数据集仅含 50 行,多次尝试均显示错误信息且未产生任何结果:

当前情况表明,虽然高级数据分析插件能够轻松完成一些简单任务,如统计描述或生成图表,但在执行需要较大计算量的高级任务时,有时可能因为计算限制或其他原因而发生错误,导致无法输出结果。

答案因分析的具体类型而异。

对于需要精确的数学运算或复杂的规则处理的任务,传统的编程方法依然更加适用。

而对于依赖模式识别的任务,传统的编程和算法处理可能更加困难且耗时。大语言模型在这类任务中表现优异,能提供包括分析附件在内的额外输出,并能生成 Markdown 格式的完整分析报告。

总的来说,是否采用大语言模型取决于任务本身的性质,需要平衡其在模式识别上的强项与传统编程技术提供的精确度和特定性。

在本节结束前,让我们重新审视用于生成此数据分析的提示,并详细解析关键的提示工程技巧:

大语言模型(LLM)擅长处理简单的任务,对于复杂的任务则表现不佳。因此,在面对复杂任务时,把它分解成一步步简单的指令是至关重要的。这种方法的核心思想是,明确告知 LLM 你自己执行该任务时会采取的每一个步骤。

例如,具体步骤如下:

这样的分步指导,比起直接要求 LLM「对客户进行分组并提出营销策略」的方式,能显著提高其输出的准确性。

在提供步骤时,我们会用大写字母标记每个步骤的输出,这样做是为了区分指令中的变量名和其他文本,方便后续引用这些中间输出。

例如数据聚类(CLUSTERS)聚类描述(CLUSTER_INFORMATION)聚类命名(CLUSTER_NAME)营销策略(MARKETING_IDEAS)策略解释(RATIONALE)

此处我们请求一个 Markdown 格式的报告,以增强响应的可读性和结构性。利用中间步骤的变量名,可以明确报告的构架。

此外,你还可以让 ChatGPT 将报告以可下载文件形式提供,便于你在编写最终报告时参考使用。

在我们的首个提示中,你会发现我们并没有直接将数据集交给大语言模型(LLM)。反而,提示只给出了数据集分析的任务指令,并在底部添加了这样的话:

随后 ChatGPT 表示它已理解,并在下一个提示中,我们通过 CSV 字符串的形式将数据集传递给它:

但为什么需要将指令与数据集分开处理呢?

这样做可以帮助大语言模型更清晰地理解各自的内容,降低遗漏信息的风险,尤其是在指令较多且复杂的任务中。

你可能遇到过这样的情况:在一个长的提示中提出的某个指令被「偶然遗忘」了——例如,你请求一个 100 字的回答,但大语言模型却给出了更长的段落。

通过先接收指令,再处理这些指令所对应的数据集,大语言模型可以更好地消化它应该做的事情,然后再执行相关的数据操作。

值得注意的是,这种指令与数据集的分离只能在可以维护对话记忆的聊天型大语言模型中实现,而非那些没有这种记忆功能的完成型模型。

在本文结束之前,我想分享一些关于这次非凡旅程的个人思考。

首先,我要衷心感谢 GovTech Singapore 精心策划这场精彩的比赛。如果你对 GovTech 如何组织这场独一无二的比赛感兴趣,可以阅读 Nicole Lee——比赛的主要组织者撰写的这篇文章

其次,我要向那些出色的竞争对手们致以最高的敬意,每个人都展现了特别的才能,让这场比赛既充满挑战又富有成效!

我永远不会忘记决赛那一刻,我们在舞台上激烈竞争,现场观众的欢呼声——这是我将一直珍视的记忆。 对我而言,这不只是一场比赛;这是一次才华、创造力及学习精神的盛会。我对未来充满期待,并激动于即将到来的一切!

撰写本文让我感到非常愉快,如果你在阅读时也享受这份乐趣,希望你能花一点时间点赞并关注! 期待下一次的相遇!

在 Windows 平台开启 Netflix 4K + Dolby Vision + Dobly Atoms 支持

By: Anonymous
26 April 2024 at 19:11

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

Netflix 4K 播放的必要条件:

一、显示器

至少支持 4K 60Hz 的显示器或电视机,且显示器上至少有 HDMI2.0 及以上接口、DP1.3 及以上接口或者雷电 3 及以上接口。

二、线材

至少支持 HDMI2.0/2.0a 或至少支持 DP1.4的传输线。现在推荐直接买HDMI2.1或者DP2.0的传输线。

三、独立显卡

如果想要在上使用独立显卡观看 Netflix 4K ,需要开启 Edge 浏览器的硬件加速设置(默认开启),关闭硬件加速之后浏览器渲染网页和播放视频都将使用

CPU

而不是独立显卡,的分辨率也会一直保持在 720P。

NVIDIA:需要至少 GeForce GTX 1050或更高版本显卡、3GB 或更高的显存和387.96更新的驱动程序

AMD:由于 AMD 对 DRM 防盗版机制的跟进非常缓慢,目前仅旗下Polaris系列显卡(例如RX470/480/570/580/590),或者Navi系列显卡(例如RX5500/5600/5700)支持 Netflix 4K,Vega系列所有显卡因为不支持Microsoft Playready3.0 DRM,所以全部不支持 Netflix 4K;对于支持的显卡,需要Adrenalin 2019 Edition 19.8.1或更新的驱动程序。

四、核心显卡

独立显卡已经达标可忽略此项。

Intel:虽然 Netflix 官网写的是需要至少Kaby Lake第 7 代或更新的酷睿 CPU。据我实测,带有UHD610的奔腾甚至赛扬这类低端处理器也能外接显示器看 4K,所以推测只要是比HD630出的晚的核显(即 2018 年或之后出的核显)应该都支持 Netflix 4K。AMD:带有核显的所有 AMD Ryzen CPU 都支持。

五、Windows 系统版本

NVIDIA 核显或独显:Windows10 1709 或更新系统版本(包含 Windows11)。

AMD 核显或独显:Windows10 1809 或更新系统版本(包含 Windows11)。

六、观看

使用 Windows 10/Windows 11 微软商店中的 Netflix App 或 Microsoft Edge 浏览器。 各浏览器支持的最高分辨率:

查看分辨率方法:

全屏时可能无法触发快捷键,需要退出全屏。

很遗憾,我的联想笔记本被 Netflix 认为不支持 4K。使用 Edge/Netflix App 播放时,一开始的最高分辨率为 1920*1080,播放数分钟后会切换到 2560*1440,但是始终无法达到 3840*2160

但是硬件应该是支持的,因此可以尝试在 Edge 浏览器上强制开启。

插件下载:

Netflix-4K-DDPlus https://github.com/lkmvip/netflix-4K-DDplus

插件 解压: 解压后文件夹 Edge 在 edge://extensions/ 中开启开发者模式:

开发者模式 导入: 成功导入 Edge 浏览器使用开发者模式导入的插件会导致 Edge 在启动时提示「处于开发者模式下的插件」,可以选择 「14 天内不再提醒」 或其他方法永久禁用此提示。

应用商店链接:

来自设备制造商的 HEVC 视频扩展 https://apps.microsoft.com/detail/9n4wgh0z6vhq?hl=zh-cn&gl=cn

HEVC 扩展 如果按钮为「打开」则表示已安装,可跳过此步骤,下同。 如果无法安装,可到:

Microsoft Store – Generation Project (v1.2.3) [by @rgadguard & mkuba50] https://store.rg-adguard.net/

输入应用商店链接,选择后缀为.appxbundle的文件下载安装。

应用商店链接:

Dolby Vision(杜比视界) https://apps.microsoft.com/store/detail/dolby-vision/9MVMZ93N61T9

Dolby Vision

应用商店链接:

Dolby Access(杜比全景声) https://apps.microsoft.com/store/detail/dolby-access/9N0866FS04W8

Dolby Access 耳机杜比全景声 在任务栏右键点击右下角的音量-空间音效,选择Dobly Atmos。杜比全景声尽量戴耳机使用,体验沉浸感。 Dolby Atmos

Netflix 自制片(封面左上角带有 N 字的)都支持 4K,例如:

尸战朝鲜 https://www.netflix.com/title/81312457

如果有此标识则以成功启用双杜比: 双杜比 播放时按上述快捷键查看分辨率: 调试信息 如有上述参数则为成功。

各分辨率网速要求:

可在 Fast.com 测试网速: Fast.com 2.1Gbps 当然,看 4K 并不需要这么快 XD。

在 更改流媒体套餐 处查看当前套餐: 各级别套餐和限制 需要高级套餐才能观看 Netflix 4K。 如果支持 4K,还需要在 账户-播放设置 中设置「每个屏幕的使用情况」为「高」或「自动」(默认): 设置每个屏幕的数据使用情况

Delta – iPhone 任天堂模拟器,从下载到游戏全攻略〔免越狱〕

By: Anonymous
3 April 2024 at 20:10

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

首款 模拟器「Delta – Game Emulator」已经正式上架 Store 苹果商店,能够让 iPhone 设备免越狱,也能轻松玩任天堂模拟器,包括 GameBoy、GBA、GBC、SNES、DS、NES、N64 等经典掌上型游戏主机模拟器,想在 iOS 和 iPadOS 系统上玩模拟器游戏,通过本篇教程全面了解。

Delta 算是一款相当知名的 iOS 模拟器,能够在 iPhone 直接模拟并游玩多种经典游戏机的游戏,包括 Game Boy、Game Boy Advance〔GBA〕、GBA、NES、DC、Nintendo 64、Nintendo DS 等游戏主机。

以往 iOS Delta 模拟器无法通过 App Store 审核,导致需要设备越狱或搭配自行签名 AltStore 才能够使用,如今苹果也随欧盟政策调整,也让任天堂 Delta 模拟器能够顺利在 App Store 上架,同时作者也主打无广告,开放让所有 iPhone 用户重温童年怀旧的复古游戏。

要是想在 iPhone 玩任天堂模拟器游戏,直接通过 App Store 下载安装《Delta – Game Emulator》,系统最低需求要 iOS 14、 11.0 或以上版本,只能够在 iPhone、iPod touch 和 MacOS 系统才能运行。

当通过 iPhone 安装好 Delta 模拟器后,接下来就要下载模拟起 ROM 游戏才能够玩,底下 GBA 游戏作为介绍,其他可以依照模拟器名称到 Google 查找相关游戏几个能够下载 GBA、GBC、NDS、N64 的 ROM 资源

同样用 Safari 进入 GBA ROM 网页后,本文以 Visual Boy Advance 为示例,滑到网页最底点击「GBA ROM」菜单,找到想下载的 GBA 游戏,按下「Download」会跳出 GBA 游戏下载提示,点「下载」继续。

通过 iPhone 将 GBA ROM 游戏下载完成后,工具列会显示「蓝色下载图标」,点入后选择「下载项目」,就能点入刚下载完成的 GBA ROM 游戏。

会自动进入文件 App,从里面点击 GBA ROM 的压缩文件〔.zip〕,就能够自动解压,里面就会看见 GBA 游戏「xxxx.gba」。

接下来长按游戏文件,选择「搬移」直接放入「我的 iPhone/Delta」资料目录内,统一管理和方便 Delta 模拟器读取游戏。

接下来就可以通过 iPhone 运行模拟器 Delta App,进入后要先点击右上角「+」新增「Files」文件,就可以直接选取刚下载的游戏 ROM 文件。

就会在 Delta 游戏模拟器内看见刚进入的经典任天堂游戏,记得游戏 ROM 不要删除,避免会造成游戏无法进入。

有些游戏会无法正常显示封面,通常这种都是有而外改过,要是想更容易识别游戏,也可以长按游戏菜单更改名字,改成好识别的游戏名称。

接下来点开游戏,就可以直接在 iPhone 玩 GBA、NDS 等任天堂游戏,记得要打开手机声音,享受一下超经典的掌上游戏声音。

Delta 游戏模拟器也支持手机横向,可以将 iPhone 横放摆放画面会自动放大,体验游戏感觉会更不一样。

模拟器也能够依照不同游戏显示各种不同界面按钮,像是 SNES 和 N64 游戏都会有对应的风格,要是发现载入 Nintendo 64 游戏出现「Missing Required DS Files」错误提示,可以查看后文解决方案。

模拟器左下角点开「MENU」能够直接暂停游戏,在菜单内分别有游戏储存、金手指和加速模式等功能,后面会针对这些功能解说。

如果玩到一半想要存文件,可以点击 Delta 模拟器左下角「Menu」按钮,就能够选择「Save State」来储存当前游戏记录,后续要载入游戏可以点「Load State」就可以选读取记录文件。

Delta 模拟器在游戏菜单也自带金手指〔Cheat Codes〕、加速模式〔Fast Forward〕和保持按钮〔Hold Button〕功能能用,如果像要开游戏扩展指令,就点左下角「Menu」按钮,并选择「Cheat Codes」。

在 Cheats 扩展页面点击右上角「+」新增指令,至于金手指指令自行到上查找,只要找「〔XXX 游戏名〕 Cheat Codes」就会找到很多资料,回到模拟器页面内,依照底下提示设置新增金手指:

可以新增各种金手指的代码后,Cheat Codes 列表就会列出,勾选要打开的扩展指令模式,回到游戏就会直接启用。

直接通过 iPhone 自带 Safari 浏览器下载「NDS Bios 固件修复包」,下载后直接点开 .zip 文件会自动解压,并且长按「NDS Bios & Firmware」资料目录进入到 Delta 游戏目录下,位置在「我的 iPhone/Delta」资料目录。

直接从 Delt App 内点开 Nintendo DS 游戏,看见 Missing Required DS Files 错误窗口后点击「Import Files」。

在最底下 DS BIOS FILES 设置区块会看见缺少三个 bin 文件,直接点入设置找到刚下载的「NDS Bios & Firmware」修复包资料目录,进入对应的文件就可以。

最后三个 .bin 文件都能够正常载入后,就可以点击右上角「Done」关闭。

重新打开 Nintendo DS 游戏后,就不会再跳出警告错误,DS 游戏也能正常运行。

想要在 iPhone 玩模拟器游戏直接通过 Delta 就能轻松游玩,而且不需要越狱或通过电脑自行签名 AltStore 工具才能安装,目前通过 App Store 安装就不怕模拟器会失效,要是想在 iPhone 手机上玩模拟器推荐用这方法最简单,也建议大家赶紧先下载,避免哪天任天堂法务部,又找任何理由直接勒令苹果下架 App Store 模拟器。

Meta 最强开源大模型 Llama 3 开卷 GPT-4, 马斯克点赞 | 附体验链接

By: Anonymous
12 April 2024 at 17:22

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

没有出乎太多意外,Meta 带着号称「有史以来最强大的大模型」Llama 3 系列模型来「炸街」了。

Build the future of AI with Meta Llama 3. Now available with both 8B and 70B pretrained and instruction-tuned versions to support a wide range of applications.

具体来说,Meta 本次开源了 8B 和 70B 两款不同规模的模型。

以上还只是 Meta 的开胃小菜,真正的大餐还在后头。在未来几个月,Meta 将陆续推出一系列具备多模态、多语言对话、更长上下文窗口等能力的新模型,其中超 400B 的重量级选手更是有望与 Claude 3 超大杯「掰手腕」。

与前代 Llama 2 模型相比,Llama 3 可谓是迈上了一个新的台阶。

得益于预训练和后训练的改进,本次发布的预训练和指令微调模型是当今 8B 和 70B 参数规模中的最强大的模型,同时,后训练流程的优化显著降低了模型的出错率,增强了模型的一致性,并丰富了响应的多样性。

扎克伯格曾在一次公开发言中透露,考虑到用户不会在 WhatsApp 中向 Meta AI 询问编码相关的问题,因此 Llama 2 在这一领域的优化并不突出。

而这一次,Llama 3 在推理、代码生成和遵循指令等方面的能力取得了突破性的提升,使其更加灵活和易于使用。

基准测试结果显示,Llama 3 8B 在 MMLU、GPQA、HumanEval 等测试的得分远超 Gemma 7B 以及 Mistral 7B Instruct。用扎克伯格的话来说,最小的 Llama 3 基本上与最大的 Llama 2 一样强大。

Llama 3 70B 则跻身于顶尖 AI 模型的行列,整体表现全面碾压 Claude 3 大杯,与 Gemini 1.5 Pro 相比则是互有胜负。

为了准确研究基准测试下的模型性能,Meta 还特意开发了一套新的高质量人类评估集。

该评估集包含 1800 个提示,涵盖 12 个关键用例:寻求建议、头脑风暴、分类、封闭式问答、编码、创意写作、提取、塑造角色、开放式问答、推理、重写和总结。

出于避免 Llama 3 在此评估集上出现过度拟合,Meta 甚至禁止他们的研究团队访问该数据集。在与 Claude Sonnet、Mistral Medium 和 GPT-3.5 的逐一较量中,Meta Llama 70B 都以「压倒性胜利」结束了比赛。

据 Meta 官方介绍,Llama 3 在模型架构上选择了相对标准的纯解码器 Transformer 架构。与 Llama 2 相比,Llama 3 进行了几项关键的改进:

训练数据的数量和质量是推动下一阶段大模型能力涌现的关键因素。

从一开始,Meta Llama 3 就致力于成为最强大的模型。Meta 在预训练数据上投入了大量的资金。据悉,Llama 3 使用从公开来源收集的超过 15T 的 token,是 Llama 2 使用数据集的七倍,其中包含的代码数据则是 Llama 2 的四倍。

考虑到多语言的实际,超过 5% 的 Llama 3 预训练数据集由涵盖 30 多种语言的高质量非英语数据组成,不过,Meta 官方也坦言,与英语相比,这些语言的性能表现预计是稍逊一筹。

为了确保 Llama 3 接受最高质量的数据训练,Meta 研究团队甚至提前使用启发式过滤器、NSFW 筛选器、语义重复数据删除方法和文本分类器来预测数据质量。

值得注意的是,研究团队还前几代 Llama 模型在识别高质量数据方面出奇地好,于是让 Llama 2 为 Llama 3 提供支持的文本质量分类器生成训练数据,真正实现了「AI 训练 AI」。

除了训练的质量,Llama 3 在训练效率方面也取得了质的飞跃。

Meta 透露,为了训练最大的 Llama 3 模型,他们结合了数据并行化、模型并行化和管道并行化三种类型的并行化。

在 16K GPU 上同时进行训练时,每个 GPU 可实现超过 400 TFLOPS 的计算利用率。研究团队在两个定制的 24K GPU 集群上执行了训练运行。

为了最大限度地延长 GPU 的正常运行时间,研究团队开发了一种先进的新训练堆栈,可以自动执行错误检测、处理和维护。此外,Meta 还极大地改进了硬件可靠性和静默数据损坏检测机制,并且开发了新的可扩展存储系统,以减少检查点和回滚的开销。

这些改进使得总体有效训练时间超过 95%,也让 Llama 3 的训练效率比前代足足提高了约 3 倍。

更多技术细节欢迎查看 Meta 官方博客:https://ai.meta.com/blog/meta-llama-3/

作为 Meta 的「亲儿子」,Llama 3 也顺理成章地被优先整合到 AI 聊天机器人 Meta AI 之中。

追溯至去年的 Meta Connect 2023 大会,扎克伯格在会上正式宣布推出 Meta AI,随后便迅速将其推广至美国、澳大利亚、加拿大、新加坡、南非等地区。

在此前的采访中,扎克伯格对搭载 Llama 3 的 Meta AI 更是充满信心,称其将会是人们可以使用的最的 AI 助手。

我认为这将从一个类似聊天机器人的形式转变为你只需提出一个问题,它就能给出答案的形式,你可以给它更复杂的任务,它会去完成这些任务。

附上 Meta AI 网页体验地址:https://www.meta.ai/

当然,Meta AI 若是「尚未在您所在的国家/地区推出」,你可以采用开源模型最朴素的使用渠道——全球最大的 AI 开源社区 Hugging Face。

附上体验地址:https://huggingface.co/meta-llama/Meta-Llama-3-70B-Instruct

Perplexity、Poe 等平台也迅速宣布将 Llama 3 集成到平台服务上。

你还可以通过调用开源模型平台 Replicate API 接口来体验 Llama 3,其使用的价格也已经曝光,不妨按需使用。

有趣的是,在 Meta 官宣 Llama 3 前,有眼尖的网友发现微软的 Azure 市场偷跑 Llama 3 8B Instruct 版本,但随着消息的进一步扩散,当蜂拥而至的网友再次尝试访问该链接时,得到的只有「404」的页面。

目前已恢复:https://azuremarketplace.microsoft.com/en-us/marketplace/apps/metagenai.meta-llama-3-8b-chat-offer?tab=overview

Llama 3 的到来,正在平台 X 上掀起一股新的讨论风暴。

Meta AI 首席科学家、图灵奖得主 Yann LeCun 不仅为 Llama 3 的发布摇旗呐喊,并再次预告未来几个月将推出更多版本。就连马斯克也现身于该评论区,用一句简洁而含蓄的「Not bad 不错」,表达了对 Llama 3 的认可和期待。

英伟达高级科学家 JIm Fan 则将注意力投向了即将推出的 Llama 3 400B+,在他看来,Llama 3 的推出已经脱离了技术层面的进步,更是开源模型与顶尖闭源模型并驾齐驱的象征。

从其分享的基准测试可以看出,Llama 3 400B+ 的实力几乎媲美 Claude 超大杯、以及 新版 GPT-4 Turbo,虽然仍有一定的差距,但足以证明其在顶尖大模型中占有一席之地。

今天恰逢斯坦福大学教授,AI 顶尖专家吴恩达的生日,Llama 3 的到来无疑是最特别的庆生方式。

不得不说,如今的开源模型真的是百花齐放,百家争鸣。

今年年初,手握 35 万块 GPU 的扎克伯格在接受 The Verge 的采访时,用坚定的语气描绘了 Meta 的愿景——致力于打造 AGI(通用人工智能)。

与不 open 的 形成鲜明对比,Meta 则沿着 open 的开源路线朝 AGI 的圣杯发起了冲锋。

正如扎克伯格所说,坚定开源的 Meta 在这条充满挑战的征途中也并非毫无收获:

我通常非常倾向于认为开源对社区和我们都有好处,因为我们会从创新中受益。

在过去的一年中,整个 AI 圈都在围绕开源或闭源的路线争论不休,这场辩论,已经超越了技术层面的优劣比较,触及了 AI 未来发展的核心方向。甚至亲自下场的马斯克也通过开源 Grok 1.0 的方式给全世界打了个样。

前不久,一些观点称开源模型将会越来越落后,如今 Llama 3 的到来,也给了这种悲观的论调一记响亮的耳光。

然而,尽管 Llama 3 为开源模型扳回一局,但这场关于开源与闭源的辩论还远未结束。

毕竟暗中蓄势待发的 GPT-4.5/5 也许会在今年夏天,以无可匹敌的性能为这场旷日持久的争论画上一个句号。

Hail (雹) – 开源免费无需 Root,冻结、停用、隐藏 Android 应用

By: Anonymous
1 April 2024 at 17:45

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

在 Android 系统中,如果想要更深入地管控某些 的后台运行策略,可以把它们给「冻结」,实际上这一种操作方式也被 Android 官方和一些第三方定制系统纳入到了设置功能里。不过官方提供的操作方式都没有那么直观,我们更喜欢使用第三方进行冻结操作,比如这款名为「雹」的

Disable / Hide / Suspend / Uninstall Android apps without root. – aistra0528/Hail

相比于同类产品,雹不需要付费解锁高级版,只需要授予高级即可使用全部功能。在工作模式方面,雹支持 Shizuku、Root、Dhizuku、设备管理器、炼妖壶五种授权方式,并且还可以控制冻结模式是停用、隐藏还是暂停,因此无论我们的玩机习惯如何、更想要达到什么样的冻结效果,这款应用都能满足大部分用户的使用场景。

冻结freeze是一个营销用语,用于描述使应用在用户不需要时不可运行 的行为,以此控制设备使用、减少内存占用和节省电量。用户可在需要时解冻unfreeze应用。

在一般情况下,「冻结」是指停用,此外雹也可以通过隐藏和暂停来「冻结」应用。

被停用disable的应用不会出现在启动器中。在已安装应用列表中会显示已停用disabled状态。启用enable应用即可恢复。

被隐藏hide的应用不会出现在启动器和已安装应用列表中。取消隐藏unhide应用即可恢复。

在这种状态下,软件包几乎处于卸载状态,无法使用,但并没有删除或实际的软件包文件。

被暂停suspend的应用在启动器中会显示为灰度图标。取消暂停unsuspend应用即可恢复。

在这种状态下,应用程序的通知将被隐藏,任何启动活动将被停止,不能弹出提示、对话框或播放。 当用户试图启动一个暂停的应用程序时,系统将向用户显示一个对话框,告知他们在暂停状态下不能使用这个应用程序。

在应用控制功能上,雹可以直接浏览应用列表和手动添加 App,不过值得好评的是,雹还支持直接导入已经冻结的 App,这一点在我们想要更换冻结类工具,或者想要管理被 Android 系统停用的 App 时就方便多了。

在设置当中,我们可以自定义冻结条件、调整外观样式、添加快捷操作,高级玩家还可以直接在这里调用命令行指令。如果你也想要一款的冻结类工具,不妨在 GitHubF-Droid 雹。

Android 官方无障碍服务小技巧

By: Anonymous
24 March 2024 at 16:22

DUN.IM BLOG

DUN.IM BLOG

如何帮助残障人士使用 手机等设备?

无障碍服务技术应运而生,提供多样化的方式,让每个人的世界变得丰富多彩。

话不多说,让我们来一起看看 为 Android 开发过哪些无障碍服务

🔗 链接:实时转写和声音通知

「实时转写」功能,在对话的时候,可以实时查看手机屏幕,「看见」对方说了什么。

打开应用,即可开启一场视觉交流。任何发出的声音,都会呈现在屏幕上。同时贴心地在屏幕上提供了输入框,供用户来回复他人。

由于应用会实时监听周围的环境声音,因此它还有一个功能是「声音通知」,即:对敲门声、烟雾报警器声、婴儿啼哭等声音发送通知。

当然你也可以设置任何事件,该事件被提起时,手机会震动。比如,找不到手机时大喊一声 ——「我的圣剑……」🗡️

这是在 Android 10 (Q) 及更高版本中引入的自带辅助功能,可以自动为在手机上播放的视频、播客、语音消息和消息生成实时字幕。实时字幕功能不仅帮助听障用户在无法听到声音的情况下查看媒体内容,也方便那些母语非英文的用户观看不带字幕的英文视频。

实时字幕功利用本地机器学习模型来识别语音并生成字幕,它可以在没有互联网连接的情况下工作,保障了用户的

🔗 链接:声音增强器

要想完整体验声音放大器的功能,首先需要一副耳机:

🔗 链接:Android 无障碍服务组件

TalkBack 这一应用是属于 Android 无障碍套件的一部分,无障碍套件还包括无障碍菜单和随选朗读:

TalkBack 最引人注目的功能就是「语音反馈」。具体而言,TalkBack 会读出屏幕上的文本、按钮标签等界面元素,让视力障碍用户通过听觉的方式了解界面上发生的事情。

让我们想象这样一个场景 —— 视力障碍的人士,往往会通过触摸来使用手机:他们会在屏幕上用一根手指不断拖动并点按,让触摸焦点不断发生变化,TalkBack 会将焦点对应的界面元素朗读出来。对于文本元素,TalkBack 会朗读文本内容;对于按钮元素,TalkBack 不仅会朗读按钮标签,还会语音告诉用户如何能触发点击动作。

除了提供语音反馈以外,TalkBack 另一个优秀的功能是「导航辅助」。在屏幕上用一根手指点按,会激发语音反馈功能,那么怎样才能滑动屏幕?怎样才能触发点击操作?

和正常导航功能不同,TalkBack 后专为视力障碍人士设计了一套全新的导航手法。想象你是一个视力障碍人士,要了解屏幕上发生了什么,并想根据具体的情况,进行下一步动作。一定会先用一根手指,探索界面。通过点按,倾听 TalkBack 的语音反馈。如果倾听到当前聚焦点是一个按钮,并想要触发按钮,连续点按两下即可;如果想滑动屏幕,使用两根手指向上或者向下拖动即可滑动屏幕,在进行互动的时候,会有提升的叮咚声音;同样的,通过两根手指的滑动可以打开和关闭菜单栏。

TalkBack 提供多种多样的朗读控件单元,比如「控件」,朗读一整个控件对应的内容;「行」,一次朗读一行;「段落」,一次朗读一段;还有其他阅读方式,如「标题」、「字词」、「字符」、「链接」;除此之外,还能修改朗读的「语言」、「语速」。用三根手指滑动,就可以更改朗读控件的属性。

此外,还有更多功能,如「盲文键盘」。用户在屏幕上直接输入盲文点来输入文字,供了一种高效且直观的打字方式。

除了上述主动探索外,TalkBack 还会提供被动功能,会主动播报通知、时间、点亮等消息,对于开关键、音量键等的触碰也有对应的朗读。

总的来说,Android TalkBack 为视障用户提供了一种能够更加自主地使用设备的方式,提供数字可访问性和独立性,极大的消除了这些用户的数字鸿沟。

🔗 链接:Lookout

如果说 TalkBack 是帮助视力障碍人士更好的使用手机,感受科技带来的方便,那么 Lookout 则更专注于探索外部世界,借助计算机视觉技术帮助视力障碍人士「看清」世界。它提供以下几种模式:

在很多其他应用中都能看到上述两种模式类似的影子,接下来我们来看看几个更加有趣的模式:

🔗 链接:开关控制

「开关控制」允许用户使用单个开关或按钮来遍历和选择屏幕上的元素。

对于因为运动受伤或者其他因素导致肢体使用存在障碍的用户,这款应用显得尤为方便。不需要触摸整个屏幕与手机进行交互,使用单个开关遍即可遍历和选择屏幕上的元素。

这里的开关可是广义上的哦!既可以是一种「物理设备」,例如 AbleNet、Enabling Devices、RJ Cooper 和 Tecla,可将按键信号发送到您的 Android 设备;也可以是「蓝牙键盘」的某些按键;当然,你也可以使用内置的「Android 设备上的按钮」如音量调高和音量调低按钮。

这里,我们来看看一个非常典型的场景 —— 通过「面部动作 + 相机」作为开关。

我们还可以对特定动作进行精细化的调整,包括「表情的幅度」、「动作保持的时长」等等。

另外,我们最好记得设置「重复的相机开关触发动作时长」,这样就可以防止表情时间保持过久带来的误触。

🔗 链接:Voice Access

最近新上映的沙丘 2 里面,姐妹会利用「音言」控制他人的行为;这里,我们也能「音言」控制我们的手机。

一切操作都可以用声音来命令:打开应用程序、在屏幕之间导航、键入消息、编辑文本……

科技造福人类,无障碍服务的出现,和随之配套的应用组件,展现了 Google 在 Android 设备上的人文情怀。

No Description

我相信这次推荐的这几个小,能够帮助不同用户更好的使用 Android 手机,通过小小的手机窗口,探索大千世界。感谢阅读。

🍎 已有的 Apple ID 国区转外区实操小结(2024年3月版)

By: Anonymous
25 March 2024 at 22:40

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

☁️ 前些 区刚上尊贵的云上贵州的那会儿,转区是一个非常热门的话题,我在那时候并没有转(因为嫌麻烦)。时隔多年,转区的事情时常涌上心头,但总是想一想就没有继续去落实。由于下一个 备案的 deadline 马上就到了,所以我告诉自己得抓住这个时机,推自己一把,落实掉转区这件事情。

Apple 官方给出了一个比较详尽的 转区教程,其中包括转区之前的前置条件,以及满足实际条件后可以转区的实际操作。这里我需要解读一下这里面的前置条件。

– Apple ID 上的余额必须用完;
– 取消此 Apple ID 对应的所有的订阅服务,并且相关服务必须到期结束;
– 具备转移后区的付款方式。

以上前置条件,第二条需要格外注意。Apple 的订阅有两个概念,取消服务和服务结束。取消服务指的是不自动续费,并不意味着未到期的服务立刻终止,如果要立刻终止需要到账单页面发起退款。但是距离购买时间长的账单你是没有入口可以发起的,这时候就需要 Apple 高级技术支持介入了(下一部分重点阐述这个过程)。

付款方式很好理解,你在更改区域的时候会让你填写目标区域的信用卡或者 ,本文此部分不做赘述。

由于我在转移的时候还有8个正在履约的服务(分别是:Infuse Pro 年费、Mr. Weather Pro 年费、TimePage 年费、熊猫吃短信2年费、Jike Yellow年费、Apple Music月费、盐选会员月卡、阿里云盘8TB月卡),一部分是取消订阅后,仍然要年底到期的服务。另一部分属于找不到退款入口的陈年订阅。

这时候请到 Apple 服务页面发起一个支持服务,在线和电话均可。这么做的目的是把你想要立刻结束这些服务的诉求转达给 Apple 技术支持侧,这时候绝大概率接线你的这位并没有来进行操作。请直接让他为你上升到高级技术支持,转线后需要报出你刚才得到的案例编号,并转达你需要立即退款并结束服务的诉求。这时候对方会「勉为其难」的帮你做出手动申请,问你原因你需要回答一个比较坚定的理由(例如我会说,我下周就要去国外长久生活,需要提前做好相应的准备)。最后会告知你在 48 小时内邮件反馈你结果。

其实没等到24小时我就收到退款进展的邮件,点进去后查看全部获批(金额是按照剩余服务时间换算后,并不是原价退款)。这时候再进行转区,非常轻松就成功了(前提是你要有目标区域的付款方式),过程中如果你使用目标区域的IP地址应该会更好。

Q:是否影响家庭共享?
A:我是家庭共享组的组织者,我可以成功转区。但如果你仅仅是成员,大概率是需要退出原有组来进行操作的。

Q:为什么要转区,x 区是否真的比国区好?
A:好与不好不是一个客观的事实,需要自己去分析利弊,这里我无法做出解答。

Q:iCoud+订阅是否要取消?
A:所有非 Apple 提供的订阅服务都要取消并结束服务后才能转区,Apple Music 也需要取消并停止服务。iCloud+ 不受影响,无需终止,也不会丢失文件(当然你的订阅方案可能会根据转区后进行升级),且转区成功后 iCloud 界面所有云上贵州字眼全部消失。

Q:转区后会有什么实质性的损失?
A:这里只讲实际上的客观损失,不讲体验方面的主管损失:
1. 一些国区专有 App 你无法在新区,这时候需要重新使用中区账号进行切换下载;
2. 部分服务或者的价格略高于国区。

为了预防打脸,我决定先使用一阵子美区。能订阅的服务尽量先使用 设备外的方法订阅,或者使用代替的服务(预防使用不便利等原因还想要转回来)。大家转区也需要自己考虑清楚,有什么问题可以在此条内容下留言。

2024 免费 PPT 设计模板下载!13 个免费 PPT 模板网站汇总

By: Anonymous
8 March 2024 at 15:13

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

通常不管是会议或报告经常都需要 PPT,在制作 PPT 简报时模板是一个不可或缺的利器,能够有助于信息的清晰呈现。但对于简报设计不太擅长的人来说,要如何做出高质感的简报算是一大挑战,本篇就推荐 13 个下载 PPT 简报模板的,以及多个非常优秀的 PPT 简报配色网站,能够免费下载精美 PPT 模版示例、模板动画和 PPT 设计,还能够利用配色来替 PPT 见报美化,不管是工作或读书都能轻松制作精美的简报内容。

Freepiker 是一个免费的 PPT 简报模板下载网站,提供多达 1400 组免费模板,其中包括逾 200 种商务主题 PPT 简报。该网站的模板质量相对不错,并且支持微软 PowerPoint、Keynote、Canva 等各种简报模板。

如果你需要设计简报,不妨前往 Freepiker 下载简报模板,并充分利用这些免费模板,保证让你制作简报能够事半功倍!

👉 Freepiker 简报模板下载网站:freepiker.com

如果想找中文台湾免费 PPT 模板简报网站,推荐使用 Canva 直接在线制作简报,里面提供数百种简报模板能快速套用,只要选好想要的简报风格主题套用后,就能通过网页即时编辑简报内文字、颜色、照片和色块,并且能够设置每页简报排版与加入各种创意元素。

在 Canva 简报设计后,还能通过浏览器直接免费在线展示简报、分享导出成各类文件格式,也可以后续再通过 PowerPoint 进行编辑。

👉 Canva 简报模板制作网站:点我前往 Canva 简报制作

Design AC 是一个来自日本的免费在线简报制作设计编辑平台,也支持中文界面,更有人将 Design AC 誉为日本 Canva。

Design AC 提供大量免费丰富的 PPT 简报模板,内容也包括传单、名片、贺卡、明信片、菜单、月历、网络封面、横幅等,此外 Design AC 还提供了插图、元素和照片素材,让你轻松创作原创设计。

只要免费注册账户就能在线设计简报和编辑,所有简报模板和素材皆可免费使用,还能选择各种输出尺寸,你也可以下载 PNG、JPG 图片和 格式的文件,如果你需要设计精美又漂亮的简报提案、计划或演讲内容,Design AC 也算是一个非常方便且实用的制作工具。

👉 Design AC 简报模板下载网站:点我前往 Design AC 简报制作

SlidesCarnival 也提供丰富免费简报模板网站, 包含 PowerPoint 和 Slides 简报模板素材,这里有超过 4000 种精美的 PPT 简报模板,能适用于各种场合,只要通过 Google 账号登录绑定免费用户,就能够下载免费简报模板。

通过 SlidesCarnival 简报素材网站,也提供多种不同主题的模板,包括教育、医疗、技术、食物、圣诞节庆等,其中还有包含大量图解说、图表说明示例,都能够直接下载轻松套用。

👉 SlidesCarnival 简报模板下载网站:点我前往 SlidesCarnival 网站

Slidesgo 也有提供大量高质量免费 PPT 简报模板下载,而且还会依照不同主题收录许多 Google 简报和 PowerPoint 模板,包括教育、商务、运营、医疗等等。

👉 Slidesgo 简报模板下载网站:点我前往 Slidesgo 网站

如果需要设计出有高含量的专业 PPT,通过 SlideModel 所提供的 PPT 简报模板网站下载,里面有提供超过 400 种免费 PPT 简报,还能够自行编辑排版、颜色、文字或物件,类型也从教育到商业全包含。

👉 SlideModel 简报模板下载网站:点我前往 SlideModel 网站

ALLPPT 每天都会更新免费 PPT 简报模板,还会依照 PPT 内容进行分类,不管是商业、房地产、医疗、运动、图表或时间轴等元素简报都能下载,在简报介绍也都会提供丰富内容浏览,不需要注册会员只要点击就能直接免费下载 PowerPoint 简报模板。

👉 ALLPPT简报模板下载网站:点我前往 ALLPPT 网站

SlidesMania 曾被美国学校图书馆员协会评为优秀的教学辅助工具,该网站也有提供创意与专业的 PowerPoint 和 Google 简报模板能够免费下载,SlidesMania 提供了多种主题的模板,包括教育、商业和创意设计等,适合各种场合的简报需求。

比较特别在于文件也能够直接从 Google 云端进入预览效果,要是电脑没装 PowerPoint 简报,可以利用 SlidesMania 从云端下载并编辑 PPT 简报。

👉 slidesmania简报模板下载网站:点我前往 slidesmania 网站

要是想要快速制作 PPT 简报,只要利用「Gamma AI 简报 PPT 制作工具」就能轻松达成,而且只要输入设置 PPT 简报主题后,就能够借由 AI 快速自动生成内容、图片和排版,让在几分钟内就能生成一份 PPT 简报内容,对于不擅长制作简报的用户而言算是一项非常便利在线 PPT 简报生成工具。

👉 Gamma AI 简报模板下载网站:点我前往 Gamma AI 网站

其实微软官方就有提供超过 1500 款 PowerPoint 简报模板免费供大家下载,还会依照不同类型分类,在种类有教育、商业、画作、工作种节等用途模板能够选择。

👉 微软官方简报模板下载网站:点我前往 Office Plus 网站

showeet 网站也提供高达 200 种以上不同特色风格简报模板,能够依照个人或各种不同用途选择,比较特别能够设置选择显示比例,可选 16:9 和 4:3 尺寸。

👉 showeet 简报模板下载网站:点我前往 showeet 网站

如果不知道怎么找出适合自己的 PPT 色调,可以直接通过韩国 SaebyeolPPT 免费模板网站下载,里面也会提供上百种不同类型的简报模板,并且也会提供多种色码,能够让你更精准抓到最适合的简报配色。

👉 SaebyeolPPT 简报模板下载网站:点我前往 SaebyeolPPT 网站

PPT BIZCAM 算是一个韩国免费 PPT 网站,里面所提供的 PPT 素材主题、元素都有一定设计水平,比较适合想要制作简约扁平风格投影片,每页至少都会有浏览画面可参考。

👉 showeet 简报模板下载网站:点我前往 showeet 网站

SystemUI Tuner – 开源免费挖掘 Android 隐藏系统设置

By: Anonymous
9 March 2024 at 14:36

DUN.IM BLOG

DUN.IM BLOG

手机的开放不只局限于 ,也是因为它存在无数种可能性,其中有一些让你动动手指就能找到,但也有一些隐藏在手机深处让你无从下手。这些隐藏功能或许是因为还没有正式发布,也有可能是在特定情况下被隐藏掉。如果想要深究他们,你就需要借助一些,比如这款 SystemUI Tuner。

Contribute to zacharee/Tweaker development by creating an account on .

SystemUI Tuner 能做的有很多,比如 App 多窗口支持、自定义省电模式百分比、自定义飞行模式等,这些功能被分成了九大类,你可以非常快速地找到它们。值得一提的是,SystemUI Tuner 还能够调整某些三星手机特定的选项,例如禁用高亮度警告、快捷面板多 SIM 卡弹窗甚至是接管导航栏填充颜色。

而我觉得最有用的一个设置,就是在「系统」里的「锁屏」选项,在这里我们可以突破系统限制,将锁屏界面底部的两个快捷方式设置为任意 App 的某个 Activity,而这种操作实际上醉翁之意不在酒,而是为了解锁 App 甚至是系统组件的隐藏菜单。

例如在三星 Smart View 组件中,由于受到系统版本限制,我们无法正常激活 ChromeCast 协议,但实际上它的激活入口只是隐藏掉了,我们只需要找到相应界面的那个 Activity 即可直接跳转过去。

其实类似操作还有很多实现方式,比如有专门用于创建 Activity 快捷方式的工具,但经过测试,它们经常会跳转失败而无法跳转其中对应界面,而 SystemUI Tuner 这种通过锁屏界面跳转的方式几乎 100% 成功。

现在,你可以在 Google PlayGitHub  SystemUI Tuner。

Adobe Express – 移动端整合 Firefly 生成式 AI ,一键生成图文内容

By: Anonymous
9 March 2024 at 23:00

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

Adobe 正在为移动设备带来更多自家 Firefly 生成式 功能。新的 Adobe Express 程序测试版其中纳入了 AI 驱动功能,如生成填充以及输入文字指令生成影像的效果,还支持与电脑版 Express 的即时协作,最终将取代现行标准版的 Adobe Express 应用程序。

Adobe Express 服务是以模板为基础运作的。与 Canva 一样,它专为快速轻松地建立新内容而设计,你只需要选定模板,拖曳放置一些素材,就能拥有看起来具专业度的平台贴文、活动传单或

现在,Firefly 整合则更进一步,因为生成式 AI 允许你输入文字提示以建立或修改图像。你还可以使用自然语言建立风格化的字体或生成全新的模板。

去年年底,生成式 AI 出现在电脑版 Adobe Express 上。现在,借助新的 Adobe Express 应用程序测试版,用户可以在型手机或平板电脑上访问所有原本电脑版上才有的 AI 功能。应用程序测试版还附带了一些有趣的新功能,包括即时电脑协作以及从 Photoshop 或 Illustrator 存取文件的能力。

Adobe 还在 iPad 版本的 Photoshop 中提供 AI 功能。尽管如此,Adobe 的大多数移动产品都缺乏 Firefly 整合,生成式人工智能可能需要数年时间才能在整个 Adobe 产品群组中找到自己的出路,因为该技术仍然很新,并且仰赖于云端来处理。

请注意,你已经可以从移动设备访问 Adobe 的网页版 Firefly 。这个测试版值得注意,因为它是专门为移动设备设计的,并包含协作功能,它还有助于让 Express 从众多以模板为基础的设计应用程序中脱颖而出。Canva 包含一些 AI 工具,但它不像 Express 那样重视 AI 功能。

No Description

你可以从 Play 商店安装 Adobe Express 应用程序测试版〔安装点这里〕,前提是你必须拥有相容的 设备;如果你是 用户,则必须加入候补名单排队。生成式 AI 功能在测试期间免费提供,但将来需要 Creative Cloud 会员资格。你保存到普通稳定版的 Adobe Express 应用程序的项目不会转移到此应用程序测试版,但 Adobe 承诺在 AI 增强测试版结束测试期后可以迁移文件和

小红书上卖了几万块的 iPhone 快捷指令和多维表格模板,懒人无痛自动记账神器

By: Anonymous
25 February 2024 at 13:33

DUN.IM BLOG

DUN.IM BLOG

这应该是我用过的最棒的记账 快捷指令记账,胜过各种记账 。高效、半自动、速度快、无,无痛懒人记账必备。

记账过程:

1、敲击手机后背两下,自动识别手机屏幕上的金额。

2、如果金额识别失败,可以手动输入

3、选择支出还是收入的分类,比如租房、出行、日常等,可以自定义。

4、选填备注,直接记账到飞书多维表格。多维表格还能直接生成看板,手机、电脑都很方便查阅。

手机端效果:

电脑端效果:

不得不说,iPhone 快捷指令和飞书多维表格组合,真的是效率神器。

接下来,就按着我的步骤,一起来实现这个记账工具吧。步骤略长。

第一步、在电脑上打开飞书机器人助手

机器人助手链接:https://botbuilder.feishu.cn/

(机器人助手作用:把快捷指令获取到的记账信息同步到多维表格)

如果没有飞书账号,需要注册一个。注册过程中企业信息随意填写就行。

第二步、创建自己的记账多维表格。

在浏览器里打开记账模板 1.0。

模板链接:存款记账模版 1.0(模版)

点击使用该模板,就能创建一个自己的记账多维表格了。以后的记账就会同步到多维表格。

第三步、创建机器人指令。这是整个过程中,最复杂的一步,不过我觉得难不住各位哈哈哈。

1、打开刚才的机器人助手链接:https://botbuilder.feishu.cn/

2、新建指令

3、选择触发器–Webhook 触发

4、填写参数。如下:

并保存好这里的 Webhook 地址,等下要在快捷指令中使用。

5、选择操作–新增多维表格记录

6、选择数据表,直接选择财务记账多维表格中的数据表就行。

设置内容,如下图勾选就好。

7、然后点击完成,再点击右上角的启用。给机器人指令命名为「财务记账」。

到了这里机器人指令创建完毕, 胜利就在眼前。

第四步、修改快捷指令

1、安装捷径,用手机 safari 浏览器打开捷径地址:https://www.icloud.com/shortcuts/03799ffc53c04820ae2d75a6e9436bc0

2、编辑捷径,修改文本为自己的 webhook。

第五步、设置 iPhone 敲击背后两下

手机进入 设置–辅助功能–触控–轻点背面

在轻点两下这里,选择「自动记账」快捷指令。

至此,教程完结。

需要在手机上查看记账记录,安装一个飞书 App,登录你开始注册的飞书账号就行。

不知道有多少人有耐心一步步操作完成哈哈哈哈。

更好的问题,总是在交流之后才出现的

By: Steven
14 December 2023 at 11:40

前两天,我收到 AAAny 的 Wenbo 发来的邮件,问我是否有兴趣注册他们的 APP 体验。我一看就乐了,立马截图发给汉洋和轶轩,开玩笑地问道:「我是不是应该告诉他,我早就注册了?」

这个叫做 AAAny 的新问答社区是汉洋他们团队,从 redit 等社区平台的使用中,萌生的对于「Ask Anyone Anything」的重新思考,所做出的产品。我其实几个月前,就在一次和他俩吃饭之后就注册好了。但是一直因为忙,我担心不能及时回复别人的提问,就一直没好意思发起一场主题活动。中途有看到可达和 JT 发起的问答,很感兴趣,也想试试看,但也因为对时间的担心就止住了念头。正好借着这次 Wenbo 的邮件,跟汉洋他俩聊了一会儿后,我就趁着夜色正浓,冲动还在,就立马编辑了两段自我介绍,发起了分别以「工业设计师」和「设计类视频创作者」为主题的两场活动。

点击进入「工业设计师 SUiTHiNK AmA~

点击进入「设计类视频博主 苏志斌 AmA!

当天也是高效,一连开了三个会。中途用各种碎片时间,一一回答了 AAAny 上的提问。晚上赶回家陪筱烨过生日的路上,我一看已经回复过的内容,好家伙,累计的输出量都赶上我平时写两三篇文章了。

碎片化地高密度输出,也是可以产生一些好内容的。

在使用了一天后,当晚,我和汉洋、轶轩聊了聊感受。汉洋问我感觉 AAAny 和知乎之间有什么区别?我打了一个比方:

知乎的问答是一种广场上的广播。一个问题对应一个完整的回答,虽然我可以不断修改回答,但是你修改后的内容很难再被之前看过的人再次看到。评论区就是一些人在外围窃窃私语,它们和主回答之间很难形成交流互动。它是有层级的、单向的信息传播。

但是 AAAny 给我的感觉,是老城区的街头沙龙。任何对话都是水平方向的,没有任何层级关系,就和大家在街头聊天一样。你看到一个感兴趣的话题,就可以直接加入;别人对你们正在谈论的感兴趣,也可以随时参与进来。它不是广播的形式,是集会和交流的空间。

有意思的事情在于,我们往往需要遇到好问题,才能写出一个好的回答。

然而,好的问题通常并不是我们提出来的第一个问题。你会在持续的提问和持续的回复之间渐渐发现,那些更本质和更有趣的问题。这是知乎解决不了的。好的问题如果都由运营和编辑来提出,那么知乎的运营压力会爆炸;如果都由用户提出,那么一定伴随着海量毫无意义的垃圾问题,这对真正的好问题是一种掩盖。

因此,持续的对话和前后文关系的保留,就很重要。同时也得确保,来自对话后段出现的好问题/好回答,能够被之前关心这个话题的人看到,也能被后来的观众发现。

运营这样的社区,需要真正会采访的记者。

点击进入「工业设计师 SUiTHiNK AmA~

点击进入「设计类视频博主 苏志斌 AmA!

好用的安卓 App 推荐

By: 胡中元
2 March 2017 at 22:57

一直觉得现在的安卓系统越来越优秀了,在会玩机的人的手里可玩性相当的高。我这里整理出了一系列非常棒的 App,属于谁用安卓系统我就会推荐给他的那种。希望大家喜欢!

这个应用集由我整理于酷安(最良心的国内应用市场),进去之后可以直接点击下载:

http://www.coolapk.com/album/2798021

❌
❌