Reading view

There are new articles available, click to refresh the page.

Google vs ChatGPT 搜索体验对比实测

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

随着 的新实时搜索功能, ChatGPT 正在将自己定位为传统搜索引擎如 的竞争对手。ChatGPT 以其对话式的响应而闻名,能够提供实时的上下文信息而不带广告。

我抓住机会看看 ChatGPT Search 与 Google 长期以来的搜索专业性相比如何。我进行了几次比较,涵盖了速度、准确性、视觉效果和整体用户体验等类别。以下是它们的表现。

问题“东京的主要旅游景点有哪些?”

Google 的搜索引擎非常快速,结果在毫秒内就能交付。搜索引擎拥有多年的优化经验,并且有专门为高速索引和检索而构建的基础设施,可以立即获得来自多个来源的广泛相关结果。

ChatGPT 的搜索同样快速,并为每个地点生成了更清晰、更用户友好的图像和信息。显然,AI 通过从相关来源提取信息来生成响应,然后以对话的方式分享这些信息。结果感觉更加友好,几乎就像 AI 很高兴我去旅行一样。

使用体验ChatGPT Search
在以对话且简洁的方式提供有价值的快速响应方面领先。

问题: “解释气候变化和全球变暖之间的区别。”

Google
 的响应来自 Gemini,概述了气候变化和全球变暖,并将其包裹在一个简短的段落中。从那里,我可以向下滚动并搜索一些来自 NASA、USGS.gov 甚至 Quora 的链接。显然,算法优先考虑流行和权威的来源,但它也是以广告驱动的,这意味着顶部结果有时包括我看到的来自联合利华的赞助内容。此外,对于复杂的主题,我自己需要浏览多个链接才能拼凑出完整的答案。

ChatGPT 提供了直接的答案,从网络中提取经过的信息,然后添加了一个可点击的「来源」图标。这个功能减少了我在 Google 搜索中从多个收集信息的时间。在这个搜索和其他搜索中,ChatGPT 的总结对于一般查询甚至更详细的主题都是准确的,其设计允许更干净、更加集中的体验。(不过,请记住,广告可能会在未来出现。)

使用体验ChatGPT Search
在便捷和准确的直接答案方面赢得了这一轮。

问题: 苹果目前的股价是多少?最近有什么更新?

Google 实际上没有给我一个立即的答案。相反,我得到了一个指向 Yahoo Finance 的链接,我可以点击并希望自己找到答案。

ChatGPT
在毫秒内,答案就在我眼前。我还得到了关于苹果的新闻和更新,当然,还有来源。ChatGPT Search 真是令人耳目一新。我得到了问题的答案,而不需要四处寻找细节。通过将答案直接呈现在我面前,我节省了时间,而不需要再点击几次。显然,对于实时的股票 或天气更新,ChatGPT 提供了可比的准确性,甚至在深度上超过了 Google 庞大的视觉库。

使用体验ChatGPT Search
继续以其策划的实时直接答案给我留下深刻印象,显示出未来更新的潜力。

问题: 给我展示媒体对心理健康影响的最新研究。

Google 提供了如此多不同的答案,我甚至不知道该从哪里开始。从 Gemini 的响应到侧边栏,再到下面的链接结果,整个体验极其杂乱——这是我在使用 ChatGPT Search 时从未注意到的。此外,Google 的广告模式意味着用户数据通常被用来提供个性化广告。虽然 Google 有广泛的隐私政策和设置,但其广告驱动的方法可能导致不总是优先考虑用户隐私的定向内容。

ChatGPT 再次,ChatGPT 搜索提供了一个更清晰的界面,没有推广内容。对于这种个人化的搜索,额外的隐私关注方式让我非常感激。作为一个希望在搜索过程中不被广告定向的用户,这种方式对我来说更具吸引力——或者在之后。

使用体验ChatGPT Search
在考虑隐私和负责任的内容使用方面领先。对于敏感搜索,不被广告定向是一个巨大的优势。

问题: 什么是我客厅里最好的电视?

Google 我说的就是我说的,Google。在纠正我输入「What's」而不是「What is」后,Google 给我回应了一些链接,所有这些链接都是赞助的,我需要点击才能找到电视。在得到这个回应后,我感觉我需要再次问它以帮助缩小范围。然而,在赞助链接下,还有来自内容发布者的链接。

ChatGPT 为我缩小了范围,包含了图像,并给出了我想要的答案。AI 确实感觉像是一个朋友,提供有价值的信息。每个电视图像旁边都有一段介绍,提供关于每个电视的信息。与 Google 相比,这种设计感觉更加干净和简洁。此外,对话格式直观,我可以滚动浏览推荐,而不需要像在 Google 搜索中那样需要浏览多个链接。

使用体验ChatGPT Search
提供了一个令人耳目一新的体验,直接回答和具体示例。

问题: 谁在民调中领先?

Google 的结果包括有关选举的新闻故事。我希望通过这个问题获得关于今天总统选举民调中谁领先的直接结果。我不得不挖掘新闻故事才能找到答案。

ChatGPT 给了我我想要的结果,直接提供了事实。选举新闻无处不在,所以我不需要阅读更多的新闻故事。ChatGPT 给了我一个直接的答案。

使用体验ChatGPT Search
提供了没有繁琐的实时答案。

问题: 洋基队在世界大赛中是如何崩溃的?

Google 的第一个结果是从《纽约时报》关于该主题的故事中提取的引用。这是一个快速的响应和直接的答案。然而,它让我感觉我没有得到完整的故事。

ChatGPT 提供了更全面的回应,从更多来源提取信息,但仍然感觉干净简洁。我得到了洋基队彻底失败的完整画面。

使用体验ChatGPT Search
再次提供了我所寻找的实时答案,并增加了确认我获得所有信息的全面性。

ChatGPTGoogle 在不同领域都表现出色,但它们满足的需求略有不同。如果你在寻找全面的搜索结果,拥有大量来源和视觉效果,Google 仍然是强者。

然而,如果你的优先事项是清晰、无广告、对话式的响应以及内置的实时更新,ChatGPT 提供了一种流畅、用户友好的体验,可能很快就会成为日常查询的主流。

ChatGPT Search 提供的无杂乱答案以及支持它们的来源是全面且可靠的。我对 ChatGPT 的答案更有信心,因为它们简洁且没有广告商的支持。结果感觉就像是专为我准备的。在杂乱的网络中,ChatGPT 就像一个乐于助人的朋友,我喜欢这种感觉。

关于谷歌开发者身份认证?

lokitwang: 最近被谷歌开发者认证弄的头大,自己有几个账号,已经两个不通过了,都是用了四五年的老号,日常都是一到三个月更新 app ,从没有违规过,申诉了,不给机会,直接提示无法验证资料。之前注册都是随意填写的资料,都是用的国内身份证验证的。后面有两个号不敢验证了,因为上面的 app 我废了很多心血在上面,一旦认证失败,损失会比较大。

所以想请教各位大佬,
1. 大家一般怎么过的开发者认证,尤其是不止一个号的。
2. 如果认证失败,一段时间会移除 app ,这个我知道,在移除之前能否转移 app 呢?
3. 是不是可以自己先去注册一个账号,认证通过过后,再把 app 直接转移过去,这样认证失败了就算了,认证成功了再转回去,新号注销掉,但我不知道转移 app 是否有限制?


感谢各位大佬不吝赐教,祝大佬们财源广进日进斗金。

开源许可证选择器 – 轻松比较、选择合适的开源许可协议

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

如果常在查找程序或浏览 源码,会每个项目底下都有一个 LICENSE 文件,这也是程序使用的许可协议,若想使用这个项目的源码或相关资料就必须了解许可方式,简单来说,许可协议规范的是什么可以做、什么不能做,必须遵守才能合法使用。

比较常见的有 GNU 通用公众许可协议〔GPL〕、Apache 许可协议、MIT 许可协议和 BSD 许可协议等,大家一定都曾经听过或看过。

不过许可协议本身就很复杂,即使去查找维基百科或上的资料也不一定可以短时间看懂,有开发者将许可变得更简单,通过问答选择题来推荐开源许可,以互动方式显示最适合的开源许可选项,同时以更浅显易懂的解释、条列出优缺点,在更短时间内找出最适合的许可方式。

开源许可证选择器〔Open Source License Chooser〕是为需要选择许可的用户提供指引,将枯燥的法律术语转为更容易被大众理解的语言,除此之外,有「许可比较器」最多可将三种许可加入比较功能,以表格方式列出彼此之间的差异。

如果你不是开发者,纯粹想知道指定的开源许可信息,也可以在「开源许可选择器」获取相关说明。

Choose the perfect open source license for your project with our humorous and easy-to-understand guide. No legal jargon, just straight talk!

进入「开源许可选择器」后先从右上角 Language 切换语言,有英文和简体中文语系。

接着从左边开始回答问题,完成后右边就会显示适合的许可许可证。

问题有五题,每一题都会有三个选项,主要就是分为是、否或是不确定,例如是否希望别人使用你的源码赚钱、别人能否修改你的源码、是否担心遇到专利流氓、是否会通过网络提供服务、是否在意其他开源项目的相容性,描述上都很平易近人,即使没有任何法律背景也很容易理解。

开源许可证选择器 – 轻松比较、选择合适的开源许可协议

这项服务一共收录 15 种开放源码许可,会依照用户的回答推荐许可方式,例如下图就有 MIT License 和 Apache License 2.0 两种,它会有一段简单介绍、趣味解释〔以其他更生活化的方式描述此许可〕,更重要的是下方会有优点和缺点、使用量和示例项目。

React、Angular 使用的是 MIT 许可协议,目前已超过 140 万个网站使用。

可以点击「了解更多」连到许可官方网页以获取更多信息〔或者以名称去 查找〕。

从「许可比较」功能可以选择最多三个许可类型,以表格方式列出更易于比较,包括描述、允许商业使用、网络服务相容、修改限制、优点、缺点、使用量和示例项目,支持可加入比较的开源许可有:

如果想知道开源许可被使用的比例,也可参考「许可使用情形图表」页面,主流是 MIT License、Apache License 2.0、BSD 3-Clause License 和 GNU GPL-3.0到图表上会显示使用量。

ChatGPT Canvas 全新 AI 写作、源码、文本编辑工具,功能测试

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

最近推出会主动思考推理的「 o1-preview 」,以及更即时、自然的「高级语音对话模式」后,今天又再次推出新功能:ChatGPT Canvas」,这是基于 GPT-4o 架构开发的全新 写作、源码编辑界面。让 ChatGPT 不再只能对话,而可以进行更深入、准确的内容创作工作。

第一波更新中,ChatGPT Plus 和 Team 用户会先获得 Canvas 功能,而全球的企业和版用户将会在下周获得使用权限。并且 还计划在 Canvas 正式发布后,向所有 ChatGPT 用户开放这项新的人机协作界面。

实际测试后,我觉得可以把「ChatGPT Canvas」想象成一种 AI 文本、源码,在这个中,人和 AI 可以更有效率的协作,共同编辑更好的内容成果。

以前的 ChatGPT 是即时通,一切内容要在对话中生成,也只能用对话引导 AI 去生成、修改,这很多时候会有点麻烦,常常在问答的过程偏离主题,难以指定要修改的部分,容易愈改愈乱,再也回不去之前更好的版本。

但是「ChatGPT Canvas」能够解决上述问题,它让人与 AI 在一个类似文本编辑的界面中讨论,就像多人一起编辑一份在线文件那样,可以一起处理文字、源码内容,可以针对任何指定段落修改,能够整合人与 AI 各自编写的内容,最后一起合作完成一份文本。

于是, ChatGPT 不再只是「对话软件」,而可以当作真正的「AI 文本内容、源码内容编辑器」,你可以利用来处理下面的工作流程:

在这篇文章中,我通过一个完整的写作实测案例,带大家了解 Canvas 的操作流程、快捷功能以及它如何帮助创作者解决具体问题。

ChatGPT 的 AI 模型中切换到「GPT-4o with canvas」模式,下面我测试看看利用这个新界面编写一篇文章。

首先,我先利用原本常用的 AI 指令结构,结合我的想法草稿,请 ChatGPT 改写成一篇完整的文章内容。

ChatGPT Canvas 全新 AI 写作、源码、文本编辑工具,功能测试

当 AI 开始编写文章草稿,或是源码时,「GPT-4o with canvas」就会像是下图这样,进入独立的文件编辑界面。

进入独立的 Canvas 编辑界面后,最大的优点就是,我们甚至可以直接在上面修改 AI 生成的文章内容。

于是这样一来,可以实现更流畅的「人与 AI 的协同写作流程」。

以前 AI 生成的内容,我们有不满意的地方,无法人为的介入修改,只能让 AI 自己去改,而常常愈改愈乱。

现在, AI 生成的草稿,我可以直接在编辑界面介入,修改成我觉得更好的版本,然后再请 AI 接续调整,实现真正的人与 AI 协同合作。

「GPT-4o with canvas」不只可以修改内容,也可以调整粗体、标题样式,就像是一个结合 AI 功能的简易 Word 编辑器,还支持 markdown 编辑格式

以文章写作的 ChatGPT Canvas 界面为例,编辑界面右下方会出现一排「快捷功能菜单」,文章写作、源码编辑会有不同的对应菜单。

「快捷菜单」中有很多默认功能,可以快速修改整篇文章、源码的内容。

例如其中有一个「阅读等级」的调整按钮,可以把文章的内容改成从小孩子到博士等级的不同风格与深度。

下面是一篇我让 AI 改写的、文章,我让 ChatGPT 把原本相对专业的文章内容,改成适合小朋友阅读的版本。

而下面是同一篇第二大脑的教程文章,我让 ChatGPT 把原本相对口语的草稿,改成更精炼、专业的文章风格。〔可以跟上面的小朋友版本进行比较,都是同一篇草稿的不同阅读等级修改。

通过快捷功能,一个按钮就可以快速转换我们需要的文字深度与风格。

以文章编辑界面为例,具备下面几种快捷功能:

下图是按下「建议编辑」后,ChatGPT 针对不同段落提供的编辑建议,我只要按下允许,就可以让 AI 直接进行修改。

这是不是跟以前的对话生成内容有很大的不同?现在 ChatGPT 可以针对一篇长篇文章,提供各种分段的调整、建议与修改。

除了整篇文章的快捷修改、建议外,在「ChatGPT Canvas」的编辑界面中,我可以任意圈选一段觉得有问题的段落,这时候会浮现「Ask ChatGPT」的按钮,点击后,我可以输入这一段的修改建议,让 ChatGPT 去进行指定段落的调整。

这是不是很像我们在 Google 文件上提供伙伴文章修改建议?只是这一次,AI 成为我的伙伴,听从我的指令去修改。

更棒的事,在「ChatGPT Canvas」中不用再怕 AI 修改内容后,回不去之前可能更好的版本。

因为在编辑器中,自带了可以还原之前版本的功能,而且不只可以还原到前一个版本,也可以回到上上版、上上上版,或是跳回最新版本。

经过简单的文章写作实测,我们可以看到 ChatGPT Canvas 的可能性,它突破了传统 AI 对话生成文本的限制,将人机协同的创作流程无缝结合,无论是在写作还是程序设计的应用场景中,Canvas 以更灵活的编辑能力和快捷的功能,帮助用户实现了更精准、有效的工作流程。

对于我相对熟悉的文章创作者而言,ChatGPT Canvas 不仅提供了文稿即时的优化、编辑建议,还能调整文本的阅读等级和风格,帮助你快速针对不同的受众进行调整。而对于程序员,Canvas 的源码、注解添加与错误修正功能,让程序开发过程变得易于维护。

这样的功能让人与 AI 之间的互动变得更具深度,不再只是被动地接受 AI 的生成内容,而是能主动参与其中,实现真正的协同创作。

无论你是需要改进写作的创作者、需要帮助调试的程序员,还是想要在教育中使用 AI 辅助的教师或学生,ChatGPT Canvas 都是一个值得一试的工具。

ChatGPT 中文语音对话测试心得,头脑风暴、即时口译、冥想教练

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

之前让许多人惊艳的「进阶语音模式」功能,今天开始陆续针对 Plus 与 Team 用户推出。这个模式最大的特色,就是可以用更加自然〔接近于真的跟一个人聊天〕的对话方式,让用户通过语音与 进行交流。

相较于旧版的功能,新的语音交谈过程更加流畅、AI 反应迅速、接话过程几乎没有等待,也能随时打断 AI、插入新话题,除了可以支持多国语言在同一个对话中自由切换外,还能让 AI 模仿或调整各种对话风格等等。

那时候在 推出的官方中,这个 AI 进阶语音不只是更自然流畅而已,他还可以结合看的功能〔摄影镜头〕来回答用户问题,或是在语音中识别出用户的情感而提供对应的回应,这些跟原本拟人化的语音结合在一起,效果确实令人惊艳。

不过目前的「进阶语音模式」功能,似乎还没有当时视频中「完成体」的样子,在我实际的测试中,目前的〔2024/9/25〕的「进阶语音模式」有下面这些特点与限制:

ChatGPT 中文语音对话测试心得,头脑风暴、即时口译、冥想教练

我测试了几个 ChatGPT「进阶语音模式」的情境,下面跟大家「纯心得」,之所以叫做纯心得,就是因为我没有时间录制成视频再剪辑,所以真实过程其实是手机 上的语音对话,但我就用事后图文的结果来说明

首先,我之前就尝试过,利用跟 ChatGPT 进行一来一往的语音对话,一起构思一个企划案、文章草稿,例如,ChatGPT 假装成一个采访者,采访我对某个主题的想法,引导我把想法说出来,最后我就可以把这些内容转换成报告或文章。

旧版本的时候,其实我就已经觉得满好用的,只是那时候 ChatGPT 的每一次回应「要等很久」,所以对话过程相对生硬很多。

但使用新版的「进阶语音」模式,整个对话讨论过程完全不需要等待,AI 几乎都可以立即回应、接话,而当我 AI 说的东西走偏时,我也可以立即打断他,重新拉回主题。

最大的改变就是整个过程会更迅速,更节省时间,而脑中的想法可以更顺畅地说出,更有头脑风暴的感觉。

我喜欢用这种来回对话的方式,把很多想法激发出来。

经过完整的语音讨论后,请 AI 统整前面的讨论,整理成报告、文章的草稿。

不过,最后这一段我用的是文字的指令,当我这样做之后,这个聊天室就不能再进入进阶语音模式了

其实现在有很多 App 可以做类似的事情,无论是真人还是 AI,有一个在线家教,通过语音来教我们学习一些事情。

于是我试试看让 ChatGPT 通过「进阶语音模式」,当一个冥想教练。

首先,我先试试看在对话中让他调整语调。〔毕竟冥想教练的语调应该更缓和、舒服一点〕

然后我请他当一个冥想教练,通过进阶语音模式,引导我进行深呼吸的练习,或是引导我做大脑放松,效果还可以,这看起来也是一个适合 ChatGPT「进阶语音模式」做的事情。

当然,在这种特别需要情感的情况下,AI 的声调听起来还是比真人的语调生硬一点点。

或者,我也请 ChatGPT 通过「进阶语音模式」当一个英文家教,带我练习口说。

相较于旧版本,因为现在对话过程更流畅,所以更有面对面家教的感觉。例如我先跟他说明想要学习的背景,通过讨论,我们决定一起来练习旅行中的英文。接着 AI 提示我可以先练习餐厅中使用的英文,于是他先说几句如何点餐的用语,然后要求我照着念一次,并且会给我即时回馈。

这部分的过程非常顺畅也满有用的,而且可以通过对话随时调整成自己想要学习的内容,比很多固定的英文学习 App 更好用。

我也尝试看看把这样的「进阶语音」当作翻译来使用看看,以后如果有旅行、会议场合,可否帮我更快速、流畅的翻译双方沟通的内容呢?

首先,我进入语音对话后,先做一些设置,请 ChatGPT 充当即时口译的角色,并告诉他听到什么语言时,要口译成什么语言。

然后我说了一段中文,他很顺畅地直接翻译成正确的日文内容,当然,是用说的说出来。

然后我尝试在不同的语言之间切换,ChatGPT 的 AI 语音都可以即时口译成我需要的另一种语言。

而且当使用台语〔闽南语〕沟通时,ChatGPT 的 AI 语音也能听得懂,并且也会用台语回答。

整体来说,昨天初步测试,上述几个应用情境,对我来说就可以生成很大帮助:

使用 ChatGPT Plus 或 Team 版本的用户,值得试试看。

Google NotebookLM 更新:用 AI 研究英文 YouTube,批量获取整理视频、音频内容

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

Google NotebookLM 是一个强大的,可以让我们上传各种不同内容,建立属于自己的 库。通过这个工具,我们可以用自己专属的文件、PPT、网页、文章,让 AI 生成各种新的报告、文案、文章,甚至是客服解答。

这个工具让很多团队和公司都觉得非常实用。比起从别人的数据库中生成内容,直接从自己的专业文件与专属知识中获得 AI 回应,对工作的性来说更有效。

NotebookLM 推出了一个全新的升级,比前阵子推出的生成英文 Podcast 更实用!

现在它可以支持上传「 」,和上传自己的「录音文件」,让你用更多不同的内容建立属于自己的 AI 数据库。AI 会自动分析 YouTube 视频的字幕,并将录音文件转成各种语言的字幕,从而帮助你生成所需的内容。

这次升级带来了许多新的应用可能性,例如:

Google NotebookLM 原本已经支持上传 Google 文件、简报和网址进行分析,而现在更加入了 YouTube 视频和录音文件的支持。无论是中文、英文、日文等多国语言,NotebookLM 都能进行高效的 AI 整理与生成。

接下来,我通过图文介绍,这些新功能的实际使用方式。

打开「 Google NotebookLM 」,建立一个新的笔记本,然后就可以上传各种文件、文件、影音内容。

而在这次更新中,上传的内容增加了「YouTube」与「录音文件」两种选项。

Google NotebookLM 更新:用 AI 研究英文 YouTube,批量获取整理视频、音频内容

上传 YouTube 时,其实就是贴上 YouTube 视频的网址即可。

Google NotebookLM 不支持某些视频,例如没有字幕、不公开、最近才上传的视频,都可能导入失败。

我把自己收集的大量跟「个人知识管理系统」有关的英文 YouTube 视频,全部上传到 Google NotebookLM,立刻整理成「中文」的第二大脑学习笔记内容。

看起来效果还算是精准有效。

也可以把 YouTube 视频,跟其他的文件、网页文章,全部一起上传到同一个数据库。

AI 生成的内容与回答,也会从数据库的不同视频、不同文章多种不同内容,整理出答案,引用不同形式的参考资料。

也就是说,现在文字、视频、声音内容,都可以在 Google NotebookLM 的同一个数据库中进行解析,让 AI 同时分析多种内容形式,生成更有效地回答。

AI 问答时,针对 YouTube 视频,AI 会抓出视频的字幕进行解析与诠释,回答时也会引用视频内容,我们可以看到视频完整的字幕稿,以及跟答案有关的引用部分。

另外这次升级,Google NotebookLM 还推出了一个更实用的更新,就是可以上传录音文件,解析出完整字幕〔中文也支持〕,并进行知识问答或整理

下面是我把一个 40~50 分钟的录音文件上传,解析出的完整字幕内容。

字幕本身不算很完美,但理解内容没问题,更重要的是,这些录音字幕,就可以变成 AI 未来生成我需要的内容的素材。

例如我上传很多次很长时间的会议录音文件,问他会议中的某个重点:

Google NotebookLM 就可以正确的挑出示哪一个会议录音文件的哪一段内容,提供回答,也可以在引用中直接让我跳到该次会议的录音字幕段落!

我也可以汇整一个项目多次的会议录音文件,请 AI 根据会议录音文件撰写报告、文案Google NotebookLM 也表现得还不错。

或者,我之前常常提到,我喜欢用说的把想法讲出来,再看怎么语音转文字,变成报告或文章的草稿。

Google NotebookLM 中,我现在可以更自在地先把想法完成的录音下来,把录音文件上传,让 NotebookLM 整理杂乱想法,引用原文,改写成通顺文章。

Google NotebookLM 的最新升级让它成为学习与工作上的强大工具,特别是支持 YouTube 视频和录音文件的上传与解析!

无论是学习英文视频、整理会议录音,还是将录音内容转换成报告和文章,Google NotebookLM 都能以有效帮助我们处理繁琐的资料,并生成实用的 AI 回应。

通过整合多种语言与多形式内容〔文章、PDF、简报、网页、视频、录音等等〕,Google NotebookLM 这个工具让学习和工作流程变得更聪明,无论你是学生、老师、职场专业人士,还是创作者,NotebookLM 都是一个值得试试看的 AI 助手。

ChatGPT o1 会主动思考推理的 AI,新模型发布实测总结

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

ChatGPT o1 会主动思考推理的 AI,新模型发布实测总结

今天发布「 ChatGPT o1-preview」,是会尝试主动思考的 语言模型, Plus 订阅用户现在就可使用。

根据 OpenAI 的说法:「我们训练这些模型〔ChatGPT o1-preview〕在回应前花更多时间思考问题,就像人类一样。通过训练,它们学会精炼思考过程、尝试不同策略,并能察觉自己的错误。」「如果您正在解决科学、程序设计、数学和相关领域的复杂问题,这些增强的推理能力可能特别有用。」

我自己在讲 ChatGPT 提升工作效率的相关课程时,常常强调一个设计指令的重点:「如果我们写 AI 指令〔 prompt、提示语〕时,可以让 AI 写出自己在想什么、怎么处理任务,通常生成的内容结果会相对更好。

从用户端的角度来看「ChatGPT o1-preview」,就是在 AI 生成内容前,会先展开一步一步的思考流程,它可能会选择思考的策略与切入点,有时会提出一些批判思考,也会更仔细的分析资料细节来做深入处理。

在这个过程中,ChatGPT o1-preview」生成内容的速度其实比 GPT-4o 要慢上不少,可能需要 30~60 秒的思考时间〔或者更久〕,才会开始一步一步的生成内容。

也因为这样的「思考」过程需要耗费更多运算,所以即使是 ChatGPT Plus 用户,在使用「ChatGPT o1-preview」时也有一些限制:

也就是说,目前「ChatGPT o1-preview」比较像是「GPT-4o」的辅助,在进行一些需要深入分析资料、产出有逻辑结果的任务,或者像是科学、数学、程序代码相关领域时,可以运用。

今天这篇文章,我就从自己日常惯用的几个 AI 辅助需求:翻译、摘要、企划思考、文案,以及有时用代码写个小的角度,以实际案例测试看看,「ChatGPT o1-preview」的效果如何,并和「GPT-4o」同样指令下的结果作比较。

当然,如果能从科学、数学与代码的角度来更好,不过从我个人常用角度出发,也想验证看看 ChatGPT o1-preview 是否能满足我的日常工作需求,也提供大家参考。

下面,先提供大家下面测试案例的快速心得比较表格。

翻译结果更简洁有力,文句白话流畅。

用语更符合台湾惯用词汇。

在「白话流畅度」与「专业用语」间平衡得更好。

翻译结果相对较弱,文句不如 o1-preview 流畅。

能计算分数并回馈对错。

无需修改即可使用。

需要多次反复调整才能达到可用程度。

提供具体、逻辑分明的建议步骤和文章架构。

深入分析资料细节。

缺乏深入的分析和明确的建议。

能整理出详细的步骤和操作要点。

细节完整程度略有不足。

缺乏社交贴文所需的流畅性和吸引力。

更注重性和准确性,避免使用版权材料。

可能在细节上不够精准。

首先来试试看翻译〔英翻中〕,我通常会用下面指令来要求 ChatGPT 翻译文章:「把下面这篇 XXX 主题的文章,翻译成中文,请一段一段翻译,尽量在维持原文语意,主题风格的情况下,让上下文的语句更自然通顺,遇到专有名词时附注英文原文,并在第一遍基本翻译后,用台湾惯用词汇与语气进行最后修饰。

下图「左方」,是「ChatGPT o1-preview」翻译的结果。下图「右方」,是「GPT-4o」翻译的结果。

结论是,「ChatGPT o1-preview」花了 57 秒完成一整篇文章的翻译〔文章是 OpenAIChatGPT o1-preview」官方公告〕,但是翻译的结果比「GPT-4o」优异不少。

例如,大多数时候,ChatGPT o1-preview」翻译的文句更加简洁有力〔相对「GPT-4o」〕,可以在许多段落看到这样的差别。

ChatGPT o1-preview」翻译的结果也更白话,相对流畅,用语更符合我指定的中文用语。

ChatGPT o1-preview」在「白话的流畅度」与「专业用语」之间也相对更能拿捏得当,会让人更容易看懂,但又保持专业用语的明确性。

我让「ChatGPT o1-preview」测试直接写一个九九乘法表小工具。o1 同样会先思考撰写工具的逻辑,然后才开始写出程序代码。

我提供的指令是:「我的小孩正在练习记忆数学的 99 乘法表 ,你可以设计一个协助她练习的小游戏吗?

请一步一步分析,从简单的 2 与 5 的乘法表开始,然后练习 3、4、6、7、8、9 的乘法表,根据每一个乘法表设计一个记忆游戏,游戏一开始可以选择要练习哪一个乘法表,进入后可以随机考验该乘法表的熟练度,最好设计有游戏机制。

下面是 ChatGPT o1-preview 第一次生成的 99 乘法表小游戏,我没有做任何的修改,但是正确性、界面美化、操作流畅度都已经达到可用的程度,还会计算分数与回馈对错。

下面是旧版 GPT-4o 第一次生成的小游戏,基本界面可操作,但有一些明显错误〔如下图〕,可能还需要多几次的反复问答,才能调整正确。

我也很常跟 ChatGPT 一起讨论沟通企划案,下面是新旧版本生成的结果比较。

我提供了许多参考资料,请 AI 帮我做产品的企划报告。

ChatGPT o1-preview」在生成过程中,会主动做一些反向思考,与探索不同的报告呈现方式,并且提供一些具体的、逻辑分明的建议步骤,这些不一定有出现在我的指令中。

下面是 ChatGPT o1-preview 生成的版本,我举出其中一部分,它提出了一个撰写初稿的建议方案,并指出了一些明确的试写步骤、文章架构方向。

下面是 GPT-4o 类似段落的版本,虽然也提出了撰写初稿的建议,但整体的说明就比较一般,少了一些明确的、深入的分析与建议。

我也测试了用两个版本去摘要同一篇文章。

下面是 ChatGPT o1-preview 的版本,可以看到文章细节整理得更深入、完整、有条理。

下面是 GPT-4o 版本摘要的结果,基本架构也相似,但细节的完整程度就有一点落差。

不过,ChatGPT o1-preview 也有他不擅长的内容,目前看起来它撰写流畅文案的效果,反而没有 GPT-4o 好〔现在写文案相对效果最好的可能是 Claude 3.5 Sonnet 〕。

下面我请 AI 根据参考资料写出社交贴文上的文案。

ChatGPT o1-preview 版本,AI 会思考撰写过程,撰写时会进行更多安全性、准确性的思考,例如避免使用版权材料

但是多次尝试后, ChatGPT o1-preview 版本目前的结果,比较像是把参考资料更有结构、更有逻辑的分析整理,不太像是社交贴文。

相较之下, GPT 4o 的版本,可能细节没有那么精准,但文案比较流畅。〔如下图〕

以上就是我的初步测试案例与心得,提供大家参考。

3 款 Chrome 插件,检查谁在用你的 Cookie

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

等每个弹出一个 Cookie 弹窗让你选择给不给用 Cookie,倒不如用插件一举解决这个烦恼。

🏪 接受所有 Cookies – Chrome 应用商店

这个插件解决的不是 Cookie 本身, 而是减少 Cookie 弹窗给用户带来的影响。

这个插件安装完毕后无需任何配置,它会自动处理大部分情况。在大多数情况下,扩展功能会阻止或隐藏与 Cookie 有关的弹出式窗口。(比如装完插件后试试打开 StackOverflow,左下角的弹窗就消失了)

具体点讲,它把网站通常要求使用的 Cookie 分为三类:技术、分析和营销。

当网站需要正常工作时,这款插件会自动判断,是接受 Cookie 政策,还是接受所有 Cookie,或是只接受必要的 Cookie。以尽可能减少对你的干扰。

WhoUsesCookies 这个插件能够看到 Chrome 插件使用的 Cookie 范围,并允许立即将插件禁用。

🔗 WhoUsesCookies – Github

因为 Cookie 中存储的信息可能包括用户的登录状态、浏览偏好,甚至是敏感的加密货币钱包数据。如果某个恶意扩展插件获得了读取 Cookie 的权限,它可以轻松获取并滥用这些敏感信息。

这个插件目前没有在 Chrome 商店上架,你需要手动安装。

插件安装完毕后,只需点击浏览器工具栏中的「谁在用 Cookie」图标,即可查看哪些已安装的浏览器插件拥有 Cookie 访问权限。用户可以根据检测结果,决定是否禁用某些不必要或存在潜在风险的插件。

为了避嫌,插件还在 页面提供了「手动插件的性」的方法。用户可以自行检查插件的权限设置。以下是如何在 系统上手动检查插件权限的步骤:

通过这种手动检查的方法,用户可以进一步验证插件是否存在未授权的权限请求,从而确保使用安全。

在日常浏览网页的过程中,我们的浏览器会收集并存储站点数据,如 Cookie、IndexedDB 和 LocalStorage 等。这些数据虽然有助于提升浏览体验,但也会占用存储空间。

如果你想在离开某些网页的同时立即清除 Cookie,但又在常用的网站里保留 Cookie(因为 Cookie 通常还会被用于维持登录状态),可以试试 Cookie AutoDelete 插件

🏪 Cookie AutoDelete – Chrome 应用商店

🔗 Cookie-AutoDelete – GitHub

使用 Cookie AutoDelete 插件很简单,为了充分发挥它的功能,可以遵循它的使用文档做一些配置:

📄 插件使用文档

n.eko – 一键远程操作的多合一浏览器 Docker,支持 Firefox、Chrome、Edge、vivaldi、VLC

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

n.eko 是一款多合一的工具,可以本地运行,也可以在 Docker 中运行。

n.eko 满足几乎一切都运行在浏览器里面的需求。因为运维需要,有些内部服务需要透传一下,单纯的服务没问题,但是一些厂商设备没有命令行。只可以用网页操作。这个项目甚至支持远程音,WebRTC 技术,还有登录。

Neko 可以让你在虚拟环境中运行功能齐全的浏览器,可以像在常规浏览器上一样浏览网页、运行程序,所有这些都在且隔离的环境中进行。

另外,还支持多用户同时使用。Neko 这样写着:

借助 Neko,您可以轻松、安全地与其他人共享浏览器的访问,而不必担心维护单独的配置或设置。无论您需要在项目上进行协作、访问共享,还是只是想与朋友或家人共享浏览器的访问权限,Neko 都能轻松实现。

听起来很不错啊:

Neko 也是举办观看派对和互动演示的绝佳工具。凭借其虚拟浏览器功能,Neko 允许您举办可从任何地方访问的观看聚会和演示,而无需亲自聚会。即使您无法亲自见面,也可以轻松地与朋友和同事保持联系。借助 Neko,您可以轻松举办观看聚会或进行互动演示,无论是休闲还是工作。只需邀请您的客人加入虚拟环境,您就可以共享屏幕并与他们实时互动

N.eko 针对不同浏览器提供了不同的镜像:

推荐配置为 1280×720@30、4 核、3gb 内存,当然越搞越好。

docker-compose.yml 文件:

然后 docker-compose up -d 运行即可,使用 IP:8080 访问。

N.eko 甚至还有一个 VLC 版本…可以用来看剧

详细的可阅读文档

全球 AI 产品 Top100 出炉!只有一个国产应用进前十

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

8 月 21 日,硅谷知名投资机构 a16z,根据近半年的数据,选出了前 100 名 应用

大多数人在使用哪些 AI 产品?哪些类别更受欢迎?用户会坚持使用哪些 AI 产品,而不是转瞬即忘?接下来,我们一起来看看。

这已经是 a16z 第三次发布 AI 百强榜单了,第一次是 2023 年 9 月,第二次是 2024 年 3 月,半年一更,频率稳定。

a16z 的评选方法是,基于 Similarweb、Sensor Tower 的数据,每 6 个月排一次名,榜单分成 2 部分:

全球 AI 产品 Top100 出炉!只有一个国产应用进前十

▲网页端前 50

▲移动端前 50

网页端和移动端的 TOP10 里,美图秀秀国际版 Meitu 属于国产,靠粘土滤镜爆红的 Remini 最开始也是出海产品,后被一家意大利公司收购。

接下来我们分门别类地谈谈,首先是通用型 AI 助手。

第三次了,ChatGPT 还是遥遥领先,在网页和移动端都拿下第一,绝对的 killer app

与此同时,ChatGPT 不如对手们增长势头猛烈。谁才是最好的 AI 助理,尚且没有定论。

▲增长指数

黄仁勋爱用的 AI 搜索 Perplexity 在网页端排名第三,并首次入围移动端榜单,正好排在第 50 名,差点名落孙山。

Perplexity 超过 7 分钟的用户平均停留时间,甚至略胜于 ChatGPT

比起 等传统搜索,Perplexity 直接提供简洁、实时、相对准确、可以引用信息来源的答案。数据说明,AI 搜索的形式在一定程度上走通了。

OpenAI 的 Sam Altman 也对这种形式保持认可,然而,OpenAI 的 AI 搜索 SearchGPT 还在小范围地内测,用户比 CEO 更着急。

ChatGPT 定位最像、竞争更直接的产品是 Claude,来自前 OpenAI 员工创立的 Anthropic。这次,Claude 的排名有所提升,在网页端排名第四,好过上个榜单的第十。

今年 6 月,Claude 推出的新功能 Artifacts 突破了聊天窗口的限制,可以实现实时可视化、互动编程等,拓展了用户与 Claude 交互的方式,好评不少。

▲Artifacts

除了早已功成名就的一代目,通用助手的赛道也有一些后起之秀。

字节跳动这次一次性上榜了五个产品:教育应用 Gauth、开发平台 Coze、通用助手豆包、豆包英文版 Cici、照片和编辑 Hypic。

除了 Hypic,其他都是首次出现在榜单,其中,豆包移动端第 26 名、网页端第 47 名,Cici 也在移动端排到第 34 名。

豆包的功能发展得很全面,并且多端覆盖,使用门槛又低,日常场景够用,所以有这么大的用户量,也在情理之中。论做产品和商业化,还得看字节。

另外,AI 助手 Luzia 首次上榜移动端,一来就是第 25 名。

你可能没有听说过这款产品,它主要服务西班牙语环境,全球拥有 4500 万名用户。最初,Luzia 作为 WhatsApp 的聊天机器人出道,但 2023 年 12 月有了独立的 app

除了什么都能聊的通用助手,消费者对于 AI 还有哪些垂直的、特别的需求?

一个重要的趋势是,大家都在用 AI 搞创作,并且创作的形式越来越丰富了。

a16z 的网页端榜单里,52% 的公司支持图像、视频音乐、语音等的内容生成和编辑。

其中包括 7 家新上榜的公司,排名还不低,视频生成工具 Luma 排在第 14 名,音乐生成工具 Udio 排在第 33 名。

和 Udio 同一个赛道、被称为音乐界 ChatGPT 的 Suno,存在感更是暴涨,从今年 3 月的第 36 名,上升到今年 8 月的第 5 名。

榜单和榜单的纵向比较也很有意思,之前的榜单里,大多数内容生成工具围绕图像。

但现在,图像生成的占比降到了 41%,只有一个图片生成工具(SeaArt)首次上榜,视频生成工具出现了三个新面孔(Luma、Viggle 和 Vidnoz)。

端新增产品

Udio 上线于今年 4 月,6 月则是 AI 视频工具爆发的一月,快手可灵、Dream Machine 的 Luma AI、Runway 的 Gen-3 Alpha 接二连三发布。

可以看到,不过半年,AI 在音乐和视频上的输出质量,都卷出了成绩。

至于移动端,最常见的创作形式是编辑图像、视频。相关工具占到榜单的 22%,是移动端的第二大产品类别。

▲Adobe Express

虽然也有初创公司涌现,但排名更高的,是那些在生成式 AI 浪潮里转型、推出更多玩法的传统创意公司。

其中有我们比较熟悉的名字,美图秀秀国际版 Meitu 在第 9 名,字节跳动旗下的照片和视频编辑器、醒图国际版 Hypic,位列第 19 名。

另外,韩国互联网巨擘 Naver 旗下的相机应用 SNOW 第 30 名,内置了 Adobe Firefly 生成式 AI 的 Adobe Express 第 35 名。

之前 washingtonpost 做过一个调查:人们会和聊天机器人说什么?他们分析了数千次对话,第一是搞黄色,第二是完成家庭作业。

最近也有一款很火的 P 肌肉应用 Gigabody,让你提前看看增肌之后的模样。它会产出很多照骗,也会打击健身人群的自信心,因为很可能练了半天,还不如 Gigabody。

举出这两个例子,是为了佐证 a16z 的结论。

a16z 移动和网页端的榜单,都出现了一个很有意思的新类别:美学和约会。

其中包括三个新入围移动端榜单的工具:LooksMax AI(第 43 名)、Umax(第 44 名)和 RIZZ(第 49 名)。

▲移动端新增产品

LooksMax 和 Umax 采集用户的照片并评分,然后给出建议,提升你的魅力。Umax 甚至会给出一个「满分模板」,也就是 AI 眼里你的完美模样。

LooksMax 不仅照顾到了颜控的看脸需求,也会分析用户声音的吸引力。

但它们的用户规模并不大,LooksMax 超过 200 万,Umax 在 100 万左右。

可能和这个赛道太卷有关,上网随便搜搜能够找到大量身体美颜滤镜,减肥、增肌、健身、变胖、换衣服,AI 都能帮忙,我们不再需要在 B 站学习复杂的 PS 教程

但这些应用的套路又都很类似,靠订阅赚钱,能赚多少是多少,Umax 每周收费 4.99 美元,LooksMax 每周收费 3.99 美元。

如果说 LooksMax 和 Umax 是认识更多发展对象的敲门砖,下一步就该用 RIZZ 了。

笨嘴拙舌的用户,可以用它提升回复约会 app 消息的水平。上传对话截图、个人资料等,RIZZ 都可以教你说些高情商表达。

古代的邹忌问身边人「吾与徐公孰美」,童话里的皇后问魔镜谁是世界上最好看的人,现在的人们则在问 AI:我怎么变得更帅、更漂亮、更有魅力,怎么不算一种科技与狠活呢?

食色性也,情感关系未必在人和人之间,也可以是人机。这次,AI 伴侣应用 Character.AI 排在移动端的第十,上次是第十六。

其实,上榜的还有一些尺度更大的 AI 伴侣应用,包括 Janitor、SpicyChat、candy.ai、Crushon 等,但 a16z 没有特别强调出来。

拿 a16z 今年 8 月的榜单和今年 3 月相比,近 30% 的公司是新公司。

如果再拿今年 3 月和去年 9 月的榜单相比,那么这个数字是 40%。

可见 AI 产品竞争之激烈和残酷,新一代 AI 原生产品和公司的发展速度,前所未有地快。

下一个爆款的 AI 产品,可能会是什么?答案或许在社交产品 Discord 出现。

a16z 发现,Discord 的流量,能够体现一个产品有没有潜力,尤其在内容生成方面。

Discord 的好处是,提供了服务器和交流社区,开发者无需构建完整的前端产品,所以它很适合作为一个沙盒,用来验证 PMF(产品与市场契合度)。

很多产品都是从 Discord 起步,构建社区,测试功能,积累用户,然后才有自己的独立,比如 Suno 和

时至今日,Midjourney 还是所有 Discord 服务器邀请流量的第一名。

▲ 在 Discord 受欢迎的 AI 公司

截至 7 月,10 家 AI 公司在所有 Discord 服务器邀请流量中排名前 100,与 1 月相比,其中一半是新秀。

AI 继续发展下去,未来可能连 app 的概念都会消失,人手一个 agent,AI 主动帮我们解决需求,但现在,我们还是从被用户选择的 app 中,一窥 AI 的可用性如何被定义。

常言道「不要创造需求」,产品的成功不在于通过广告等人为方式制造需求和虚假繁荣,而是找到并满足已经存在的、真实的需求。

AI 也是这样,融资、刷屏、炒作之后,依然是沉默的大多数,做出最诚实也最落地的投票。其中,有没有你正在使用并欣赏的产品呢?

We crunched the data to find out: Which gen AI apps are people actually using? And which are they returning to, versus dabbling and dropping?


2024 年 3 月:

Thousands of new AI-native companies are vying for attention. We crunched the data to find out: Which generative AI products are people actually using?


2023 年 9 月:
https://a16z.com/how-are-consumers-using-generative-ai/

PicLumen – 免费好用的 AI 图片生成与编辑工具,支持免费商用

DUN.IM BLOG

DUN.IM BLOG

PicLumen 提供一整套由 人工技术驱动的照片编辑和生成,用户在注册后从控制台输入提示词生成各种图片,选择不同的图片模型、长宽比、画质或进行各种细项的微调,此外,PicLumen 还整合 AI 抠图和编辑工具,可以说是非常先进、快速且方便易用的图片生成功能。

AI 生成的图片素材可自由使用于个人和商业用途,无需额外付费购买授权,生成的图片相当真实,任何类型的图片都能制作生成,不过要注意你只能将自己生成的图片使用于商业用途,其他人的图片可用作参考,但是不允许直接使用〔稍作修改即可〕。

如同大多数的 AI 图片生成器服务,PicLumen 也提供「探索」功能,查看其他用户生成的图片素材,也可以获取他们使用的提示词、反向提示词和各项参数,或是对图片进行「重混」〔Remix〕,如果没有什么灵感的话不妨在探索页面查看其他用户所使用的提示词和相关参数。

依照 PicLumen 支持中心提供的页面所述,PicLumen 生成的图片可以用于个人和商业用途,但要注意以下几点重要事项:

Create your unlimited AI images with PicLumen's AI image generator. Join the best AI image creator and turn your text to images freely.

进入 PicLumen 后点击首页「Generate for Free」按钮,来到登入注册页面,必须先注册账号才能使用,也可直接以 账户快速登入。

PicLumen – 免费好用的 AI 图片生成与编辑工具,支持免费商用

登入后会看到「探索」页面,也就是其他用户以 PicLumen AI 生成的图片,点击后会看到提示词和相关信息。

如果要自己生成图片,点击左上角「Create」进入图片制作工具。

生成器上方有几个可供调整的选项,包括 AI 图片模型、图片长宽比、画质和单次生成图片数〔最多四张〕。

长宽比〔Aspect Ratio〕功能很好用,预先选择要使用的图片比例后就不用后续编辑裁切。

将提示词输入后点击右边的「Generate」就能开始生成图片,速度很快,不到一分钟就会出现结果。

提示词右上角还有一个选项,可以设置反向提示词、CFG Scale、Steps 和 Seed。

PicLumen 一次可生成 1-4 张图片结果,看起来会有点像〔但又不太一样〕,如果不满意可微调提示词或切换为不同的图片 AI 模型,重新生成新的图片。

点击图片后会进入详细资料页面,从中间的按钮就能图片、AI 抠图或 AI 放大〔如下图红色圈选处〕。

PicLumen 还能将图片直接以 AI 去除背景,省去手动抠图的步骤,去除的效果也很优异!

前面有提到 PicLumen 本身也能查看其他人生成的图片,点击左上角「Explore」就能探索更多图片,很厉害的是利用 PicLumen 可以制作出各种风格的素材,从详细信息页面就能看到提示词和相关选项,稍微研究一下、修改后也能制作出很专业的图片哦!

在探索页面点击其他用户制作的 AI 图片,右下角会有一个「Remix」按钮能快速将相关信息带入 AI 生成器。

The Maps Express – 简单方便一键查询 Google 地图的 Chrome 扩展

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

The Maps Express」是一款 扩展程序,支持各种常见浏览器例如 的 Safari、Chrome 上的 Edge、Chrome、Brave、Arc、Opera,安装后可在选取要查询的地点时通过鼠标右键菜单或快捷键快速查询 Maps,能保存最近查询的十条历史记录,还能将地点收藏〔支持导出、导入功能〕,非常方便!

值得一提的是 The Maps Express 有一项「 摘要」功能,通过 Google Gemini 对当前网页进行分析、快速找出可能的餐厅、咖啡店、商家或景点关键词,让用户以 Google Maps 快速查询相关结果。

No Description

进入 Chrome 程序商店页面,点击右上角「加到 Chrome」安装到浏览器后即可使用。

那么要如何进行查询呢?很简单,只要选取店家名称、右键菜单就有「通过 The Maps Express 查询」快速带入 Google Maps 查询地点,也可使用快捷键〔Ctrl+Shift+S/⌘+Shift+S〕进行操作。

如此一来就将好几个步骤的操作过程简化成一个动作。

The Maps Express 本身也具有查询功能,点击扩展按钮后会进入类似如下的窗口,最上方的查询字段就如同是 Google 地图查询功能,可以快速在地图查询指定地标,查询记录会保留近期查询的 10 条记录,这些信息只会存在用户的浏览器。

点击查询记录的地标会快速打开 Google 地图,将光标移到地标上可以「加入收藏」。

The Maps Express 收藏清单功能基本上可以算是更方便的 Google Maps 收藏功能,将地标加入收藏后还能利用下方的功能进行导出或导入〔格式为 .JSON〕。

再来介绍一下 The Maps Express 最有趣的「页面摘要,可以使用 AI 技术来摘要地点,第一次使用时需要设置一下 API 密钥,不过不会太难,只要有 Google 账户、几个步骤就能搞定。

点击 API 后会有设置说明,浅显易懂,先连接到 Google AI Studio 页面,第一次使用会有注意事项,勾选底下第一项同意使用条款,按下「Continue」继续到下一个步骤。

接着点击中间的「Create API key」建立一个 API 密钥。

按下「Create API key in new project」按钮,如下图箭头标示位置。

生成 API 密钥后按下「复制」获取这段代码,回到 The Maps Express 扩展贴上后即可进入 AI 功能。

The Maps Express 页面摘要工具是使用 AI 来摘要地点,简单来说,在网页点击「Gemini 摘要」后就会自动分析网页出现的地标,将相关结果自动加入、方便用户以 Google Maps 查询或是加入收藏。

下图就是使用 AI 页面摘要、分析上的文章后得出的相关地标,非常快速、准确!几乎把文章中列出来的所有咖啡店都呈现在列表,省去要一个一个复制查询的时间,如果平常会经常在网络上查询信息的朋友可以试试看这项功能〔只是前置需要几个设置步骤〕。

Claude AI – 根据论文生成网页互动小游戏,进行学习教育

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

有没有可能让 Claude 将枯燥的论文 PDF、科学研究资料,重新梳理、设计转换成一个比较有意思的互动小

于是找了几篇科学研究论文,例如海龟的研究、蓝鹊的介绍资料等等,将 PDF 上传给 Claude AI,请他用「儿童故事的方式」设计成问答冒险游戏,效果还不错

基本上一分钟内就可以生成一个基本版本,如果想要调整,在 Claude AI 中来回几次问答修改,也不会超过两、三分钟的时间,然后就有一个可用的故事问答冒险游戏,通过游戏互动,可以学会某种科学或自然知识。

这个「超短时间内可完成」的效果,或许离真正商用游戏的要求还很远,但当作老师、父母给学生孩子的有趣测验,而且课堂、生活中随时需要,立即可以生成,已经绰绰有余,值得试试看。

下面就来看看我实际测试的其中一个「海龟大冒险」的真实操作过程。

首先,我在「 Claude 」 先上传一篇海龟研究的科学论文 PDF,结合下面的指令,请其根据论文设计出一个适合小学生的冒险故事互动游戏〔查找论文可用:SciSpace 论文研究 AI 助手,中文文献问答、摘要引用与报告改写〕:

///

下面是 Claude AI 第一个回答中就做出来的版本,已经有一个简洁的互动界面,可以按下开始冒险进行问答计分,但还有题目数量还不够多。

于是我进一步追问,只是简单的请他设计出更完整的游戏过程,在第二个版本中题目数量开始增加,但总分还不是 100 分。

于是我再次追问,请他根据总分是 100 分来设计题目,于是完成了第三个版本的互动网页。

这个小海龟大冒险的互动网页,可以直接在 Claude 右方的 「 Artifacts 」预览中互动,也可以成 HTML 文件,在中直接进入并游玩。

下面是几张游戏过程截图,他根据论文资料,设计出了一些有效的问题,并提供有效的选项,勾选正确选项后会计算分数。

看起来中文内容等也都能正常分析与显示。

虽然没办法直接设计出图文搭配的视觉化内容,但这样基本的文字问答互动,是可行的,而且成功率高。

完成简单的故事冒险后,也会提供评分。

当然,如果你熟悉网页设计,你可以在这个版本的基础上进一步修改。

但如果不熟悉网页设计, Claude 几分钟内就可以做出来的这个游戏化学习互动版本,也已经可以让父母跟孩子做互动,老师给学生做简单测验了。

很多时候带小孩去一些博物馆、科学馆,也常常看到这类简单但有趣的、故事性的问答互动。

而现在用 AI 可以快速的制作出各种版本,只要给他一篇论文资料,就能快速产出有故事性的问答小游戏。

Claude AI – 根据论文生成网页互动小游戏,进行学习教育

下面是我利用蓝鹊研究资料的论文,设计的另外一个故事互动小游戏。指令如下,你可以复制其结构,只要换成你的主题,试试看生成你需要的学习小游戏:

如果你是使用 Claude 版本,要注意一些限制:

所以如果你是免费版本,更适合使用一篇短文,生成互动小游戏,作为自己临时的、随手的与问答互动需求。

GeoSpy.ai – 利用 AI 轻松获取照片拍摄地点

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

GeoSpy.ai」是一个照片地点引擎,利用 来找出照片地点,利用强大的 AI 人工,可以在用户上传照片后以 AI 预测照片拍摄位置,这对于要搜索拍摄地点提供非常好的效果,以往可能只能通过以图找图方式找到相关的照片,但这通常要有一些很容易被识别出来的主体物,但这项服务就摆脱以往的限制。

GeoSpy.ai 使用方法很简单,只要上传照片就会有结果了,但是不一定 100% 准确,结果会标示照片可能出现的城市和座标信息,我试了几张照片,有些正确有些就真的错得离谱,不过整体来说还算蛮好玩的,搜索结果也会显示 Maps 信息,可以搭配街景功能查看是不是相关地点。

AI powered geo-location. Uncover the location photos were taken from by harnessing the power of ai

进入 GeoSpy.ai 后会看到很简单的功能,将照片拖曳或是点击、选择要分析的照片上传。

GeoSpy.ai 就会分析照片拍摄地点,在结果页面列出国家、城市、座标和 Google Maps 链接,不一定 100% 正确但可作为参考。

往下滑动会有分析的来源,可以看到其他相似建筑物和地点的照片,有助于识别是否为同个地点。

很有趣的是 GeoSpy.ai 也能分析、显示的地理位置信息,虽然不一定准确还是能作为参考,点击下方按钮就可以在 Google Maps 显示相关座标位置,同时利用街景模式查看是否是同个位置。

GeoSpy.ai – 利用 AI 轻松获取照片拍摄地点

Luma AI – 免费文字生成视频实测,支持中文和图片直接生成

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

这几天很热门的 AI 是:「Luma dream machine」,一款 AI 生成 5 秒钟动态的在线服务,并且号称有逼真的物理反应、运镜和人物动作,可类比之前 Open AI 公布的 Sora ,不过 Sora 虽然效果惊人〔还可生成一分钟视频〕,却尚未对一般用户开放。而 「Luma dream machine」 已经可以让一般用户直接试用,提供每天最多生成 10 个短片,每个月最多生成 30 个视频的免费账号额度。

如果想要试试看 AI 直接生成逼真视频效果,那么「 Luma dream machine」会是目前能够让我们马上可以体验看看的选择,在电影运镜与真实物理效果上,也确实比 Pika 之类 AI 生成动态画面的成品更突出。

Luma AI – 免费文字生成视频实测,支持中文和图片直接生成

Luma AI 上宣称的几个特色为:

而我针对上面宣传的几个特色,实际去测试后,目前的心得是:

例如下面这个雨中场景的短片〔可点击这个链接,观看短片播放〕,就可以注意到背景与路人基本上稳定,但前景的两个主角虽然有拟真的跑步动作但也有明显的错误,而指令虽然是英文但也没有 100% 符合。

下面是我实际测试的几段短片的合辑,可以看看从一般用户角度出发,生成的视频可能出现的各种成功、失败情况。

无论如何,我们都可以注册一个免费账号,试试看「https://lumalabs.ai/dream-machine」。

接着在指令列,输入对于视频场景、动作的描述。可输入中文指令,也可输入英文指令。通过「Enhance prompt」可以帮助指令最佳化,但也可能是因为这样而对于中英文指令似乎都无法 100% 掌握。

等待一小段时间,就可以根据我们的文字指令,生成 5 秒中的短视频。

在视频上点击右键,选择,就能获得 MP4 文件。

下面这段山谷溪流小船的视频〔点击链接播放〕效果就不错。

另外一个很适合「Luma dream machine」的使用方式,是把经典、真实照片中的人物变成电影短片场景。

例如我可以在指令列先上传一张狮子照片,然后辅助指令描述,让 AI 根据照片来生成。

这时候 Luma AI 会根据照片内的实景、人物生成更多的影格,最后串联出一个电影短片。

例如这个狮子走过草地的照片变成的电影短片〔点击观看〕,草地的场景被自动延伸生成,狮子也从侧面多出了正面,虽然多少有些不自然的地方,但也足够让人惊艳。

我还下载了一张第一次世界大战时的黑白照片,尝试让 AI 把照片中的军队动起来。

最后,Luma AI 自动延伸了房屋后的场景,并让军队往前前进〔点击观看视频〕,虽然,视频一开始的动作还好,但很明显的视频后段前进的步伐非常不自然〔人物动作依然比较容易出错〕。

在 Open AI 的 Sora 尚未开放前,就让我们来试试看「 Luma dream machine」,体验一下 AI 生成视频的效果吧!

整合利用 11 款 AI 工具,打造高效率个人专属工作流程

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

众多的 AI 工具让人眼花缭乱,根据不同需求有不同的工具选择,要如何针对自己的工作流程,选择适合自己的 AI 工具呢?有时候最困难的是不要在一大堆工具里迷失,才能建立刚刚好适合自己的 AI 工具组合。

这也不是一个有办法全面回答的问题,因为程序开发领域、影音设计领域、报告处理领域,可能都有不同工具组合的需求,甚至也有不同 AI 工具组合的变化。

所以,这里只能属于自己的 AI 工具流程,应用在我日常的工作流程,以及自媒体与博客写作流程中,下面是我的工具组合,以及如何搭配在工作流程中,提供大家参考。

工具流程没有标准答案,欢迎大家在留言分享你的选择与组合。

想要快速掌握我常用的 11 个 AI 工具的朋友,可以直接参考下面的表格,并通过工具名称的链接,进入到相关的工具的介绍文章。

我如何搭配这些工具,进入我真实的工作流程中呢?下面这张流程图,可以展示出目前我的工作流程。

如果你说,为什么没有 AI 视频编辑工具?没有 AI 源码工具?没有更进阶的 AI 图像编辑工具?很简单,因为这就是我目前需要的真实工作流程,每一个人需要的工具会有不同处,也欢迎分享你的工作流程与工具。

但工作流程的逻辑可以套用在不同的工作需求上。

以上就是我目前利用这些工具的工作流程,提供大家参考,也欢迎分享你的工作流程,大家互相参照。

ChatGPT Mac 官方客户端,无需灰度等待,抢先使用 GPT-4o 和语音模式指南

DUN.IM BLOG

DUN.IM BLOG

ChatGPT Mac 官方客户端,无需灰度等待,抢先使用 GPT-4o 和语音模式指南

OpenAI 今年 5 月 13 日宣布推出适用于 macOS 桌面程序〔来源,可以将 ChatGPT 整合到电脑上运行各种操作,不再受限于,还能通过快捷键快速进入 ChatGPT 发送信息,其中最引人注目的是语音模式,受益于 GPT-4o 模型提供更快的回应速度,达到用户和 AI 双向几乎没有延迟,犹如跟真人对话,如果有关注 OpenAI 发表会 Live Demo 应该会非常期待这个新功能。

虽然 OpenAI 表示 ChatGPT 应用程序会在发表会后先向 ChatGPT Plus 会员推出,最终用户一样可以使用该应用程序〔不过使用限制较严格〕,但从国外讨论来看目前还无法从官网找到 Mac 应用程序的链接,不过有抢先使用的攻略,有兴趣的朋友可以试试看。

当然 ChatGPT 应用程序未来还会推出 版本。

ChatGPT Mac 桌面应用程序要求必须为 macOS 14 以上,只支持 Apple Silicon 内核〔M1、M2 或 M3〕,较早之前的 Intel Mac 无法使用,我本身是 ChatGPT 免费用户,依然可以使用 Mac 应用程序。

先从以下链接获取 ChatGPTMac 版应用程序,oaistatic.com 是 OpenAI 公司用于托管静态文件的域名〔可在 ChatGPT 网站源码找到该域名〕,性是没有问题的。

下载后运行、将 ChatGPT 拖曳到应用程序资料夹即可使用。

进入 ChatGPT Mac 应用程序,第一步是先登入 OpenAI 账户,可使用 账户登入或使用电子邮件注册账号。

目前在登入时会跳出下面「即将推出」错误信息,会有「你尚无桌面版应用程序的存取权。你仍可以在 https://chatgpt.com 使用 ChatGPT」,这个错误和免费或付费用户无关,是官方仍在灰度提供给用户应用的使用

绕想要过限制使用很简单,只要重新登录应用程序,在登入后跳出错误信息前立刻以快捷键〔Command + Q〕推出应用,重新进入应用程序后就能绕过并进入主画面,强制关闭应用程序的时间点大概就是按下登入后跳出一个大窗口时,可以多试两回,时间点不会太难抓。

第一次进入 ChatGPT 应用程序后就会有一个启动工具介绍,简单来说就是快捷键组合,默认情况可以在按下「Option + Space」后快速打开 ChatGPT 聊天工具。

如此一来就能利用快速键进入聊天对话框,发送信息至 ChatGPT

如果你想将快捷键设置成其他按键组合,在 ChatGPT 应用程序设置选项可以找到键盘快捷键设置功能。

顺带一提,在写这篇文章时 ChatGPT 已有 GPT-4o 模型,从下方选项就能切换 GPT-4o 或 GPT-3.5,GPT-4o 的反应速度更快,免费用户也能使用,但问答次数有限。

ChatGPT 应用程序另一大特色就是可以抢先进入非常强大的「语音交谈」功能,点击右下角耳机图案就会看到相关介绍,可以通过语音方式和 ChatGPT 进行口语对话,不需查看屏幕,也几乎能够在口说后即时获得答复,整个对话过程会被转为文字内容,事后也能利用文字回顾和 AI 的对话记录。

进入新语音模式后会有几种不同的声音可以选择,不过语音 Sky 和好莱坞女星史嘉蕾乔韩森声音雷同引发争议,已从原先放出来的五种声音选项中移除,剩下 Ember、Cove、Breeze 和 Juniper。

通过全新的语音模式就能以口说方式和 ChatGPT AI 对话,我试着使用中文一样听得懂!搭配上 GPT-4o 回应速度真的很厉害,在很短时间就能获得回应,对话内容也会转为文字显示于聊天记录中,有兴趣想要体验一下最新技术的朋友可以去玩玩看。

ChatGPT 关联 Google 网盘功能,自动化分析处理 Excel 表格能力增强

DUN.IM BLOG

DUN.IM BLOG

ChatGPT 早期有一个功能叫做「 Code Interpreter 」,后来改名「高级分析」,功能本质都是通过 编写 Python 程序来分析我们的数据文件,最直接的利用就是上传 Excel 电子表格后,可以利用这个功能自动做完统计、创建图表,甚至提供决策建议。

而在 推出 GPT-4o 模型后,这个功能又更进一步,现在 可以「连接」到 Google 网盘中的文件获取 Google 电子表格的数据,并针对表格中的某一段数据进行 AI 提问、新图表生成。

前阵子开放 GPT-4o 后,许多功能〔包含 GPT-4o 〕也开放给用户试用〔有使用次数限制〕,我也看到有免费用户可以利用 GPT-4o 上传 Excel,制作简单的统计图表。〔ChatGPT Code Interpreter 八种应用:分析 Excel、制作图表与动画

现在,Plus 会员用户〔ChatGPT Plus、Team 和 Enterprise 用户〕也迎来了一个更强大的、可直接互动的 Excel、Google 电子表格 AI 分析统计功能,配合 GPT-4o,付费用户应该这几天就陆续收到更新。 在改进的「互动式」数据分析功能中,有下面这些特色:

如果你的付费 ChatGPT 账户获得了新功能,会看到提问中原本可以上传文件的按钮,现在可以直接关联 Google Drive、OneDrive 中的文件。 只要授权 Google Drive 或 OneDrive,就能直接获取网盘上的电子表格或文件,带入 ChatGPT 进行分析。 ChatGPT 关联 Google 网盘功能,自动化分析处理 Excel 表格能力增强

之前在 ChatGPT 上传 Excel 进行分析有几个难题,其中一个是 ChatGPT 在计算、分析完成,我们只能看结果,不能方便的「对照」原始数据参考。

而现在,只要电子表格的格式支持〔有些比较复杂的表格会无法正常显示〕,上传文件〔或连接 Google 电子表格〕后,可以在 ChatGPT 中直接「载入」完整表格内容,还可展开表格进行讨论。 把表格展开,就会变成左边是电子表格,右边是 ChatGPT 问答,我们能够一边对照电子表格,一边进行提问。〔很像其他第三方的 AI 问答的设计,例如: ChatDoc

ChatGPT Plus 之前分析 Excel 时还有一个问题,就是他针对整份文件做分析,如果我想单独分析其中一部分数据,就要在提问中做各种描述与限制,让 AI 理解我要处理哪一部分的数据内容。

现在这个问题就迎刃而解。 如图我可以在 ChatGPT 的电子表格浏览窗口中,先点击需要分析的字段,然后在右方提问下指令:「统计每个人的支出总金额」。让 AI 明确知道我想针对哪几个字段做整理或分析。

明确的指定字段, ChatGPT 的分析会更准确地完成总金额的统计。 而在分析过程中,发现 ChatGPT 现在喜欢生成新的电子表格,通过预览提供统计分析后的结果给我:

新版数据分析功能还解决了一个问题:中文图表。 之前 ChatGPT 生成的图表无法显示中文〔除非你先提供他字型文件〕。

不过,现在我们不只可以利用 ChatGPT 分析中文的电子表格文件,也可以在浏览窗口选择需要的范围,制作中文统计图表。 生成的电子表格图表支持显示中文〔如果切换到传统图表,中文默认一样是无法显示的空格〕。 还可以把图表下载成 PNG 图片,会正常显示中文,默认是透明底图。

结合这些新功能,ChatGPT 的数据分析不只可以帮我们画统计图、做决策建议,还可以帮我们「处理数据表格」。

如图这份旅行记账表中,我先在 ChatGPT 的电子表格浏览窗口选择需要的字段,请 ChatGPT 自动帮我:「根据最新汇率做货币转换」于是 ChatGPT 帮我在表格上加了一栏新的字段,然后直接根据原本的美金、日币完成汇率换算,填写最新金额。 虽然这不是直接改在原始的云端电子表格上,但我可以下载这份新的电子表格替换。

我先让 ChatGPT 帮我生成一个模拟的产品销售表格,ChatGPT 用表格方式直接生成的数据(没有利用 Python 的编程方式),在累计销售数量与金额上有问题。 于是我把 Excel 文件上传到 ChatGPT,展开数据内容,选择有问题的字段,请 ChatGPT 用计算公式重新在电子表格中算出正确的数字。 ChatGPT 就会自动写 Python 来做数据统计,这次确认完成后,ChatGPT 添加了新的一列,把正确数据跟错误数据进行对比展示。 现在我请 ChatGPT 把正确数据替换到原始表格中,ChatGPT 经过了一阵数据运算,最后提供给我可下载的电子表格文件链接。

下图就是我下载电子表格后进入的结果,除了中文有正常显示外,原本的累计销售数量字段已经被替换成正确版本了。

最后,我把 ChatGPT 提供给我的正确 Excel 报表,再次上传 ChatGPT,请他做统计图,并提供给我决策建议。

如果你拥有 ChatGPT Plus 版本,推荐试试这个最新功能。

[事实核查] 正确的信息获取能力,搜索工具的高级使用技巧实战指南

DUN.IM BLOG

DUN.IM BLOG

在事实核查实践中,网络搜索通常是必须的第一步。事实核查员要分析核查选题,识别并提取合适的关键词, 设置搜索条件,在合适的搜索引擎中开始检索, 筛选搜索结果,调整搜索策略,继续搜索 ,直到获得有效信息为止。

除了掌握搜索技巧之外,「搜索思维」是线上搜索最根本的能力——取词,优化,反推,转换。在搜索结果不理想的情况下,要有刨根问底的精神。

在实际操作中,谷歌是比较常用也比较有效的搜索引擎。当然,谷歌并不是唯一一家搜索引擎,其他的搜索引擎还包括 Bing、Yahoo、Yandex、Ask.com 和 DuckDuckGo、Baidu 等。

如果一个搜索引擎不能找到所需的内容,则使用其他搜索引擎可能会获得更多或更好的结果。

以下是一些更高效地使用搜索工具的技巧:

1.使用 site:搜索特定网站的内容

如果希望谷歌返回的搜索结果只来自某个特定的网站,可以在关键词前添加 site:和该网站的网址。

比如,想搜索纽约时报关于气球事件的报道,可以在搜索框中输入 site:nytimes.com China balloon, 返回的搜索结果仅会是来自纽约时报网站 www.nytimes.com 与中国气球有关的内容。

想搜索中国海关总署官网上有关中国稀土出口的内容,可以在搜索框输入 site:customs.gov.cn 稀土出口,返回的搜索结果都是来自海关总署官网的内容。

除了可以直接在谷歌进行上述操作外,当核查员想要在某个没有内置搜索选项的网站,或者内置搜索不太好用的网站进行搜索的时候,这个方法也可以派上用场。

这个技巧还可以用来搜索政府或者学术网站上的资源。当有关国家的政府和学术机构网站使用特别域名类型时,这一方法更加有效。如图所示,搜索英国学术网站上有关英国脱欧的资料时,输入 site:ac.uk Brexit:

注意:请勿在符号/字词和搜索字词之间加上空格。例如,搜索 site:nytimes.com 可以获得相关搜索结果,但搜索 site: nytimes.com 则不行。

网站域名不能有「http」「https」以及「www」前缀,也不能有任何「/」的目录后缀

有些信息一般会以特定的文件格式类型出现。比如,统计通常是 Excel 表格;专业报告、年报、论文通常以 文件的形式出现。

可以在关键词前添加 filetype:扩展名(如 PDF 文件的 pdf,Excel 表格的 xls,Word 文档的 docx,幻灯片的 pptx 等),搜索结果会聚焦在特定的文件类型上。这一技巧在事实核查中非常有用,可以提高效率。

目前支持.pdf、.ps、.dwf、.kml、.kmz、.xls、.ppt、.doc、.rtf 或.swf 格式的搜索。
这一技巧可以和 site:结合起来使用,以提高搜索的精准度。

比如,搜索瑞士信贷官网(credit-suisse.com)上 PDF 格式的年报(annual report),可在搜索框输入 annual report site:credit-suisse.com filetype:pdf

比如,搜索大学有关「人工智能」的论文,可在搜索框输入:人工智能 site:edu filetype:pdf,谷歌将只搜索 PDF 格式的人工智能研究论文,并且仅在教育机构的网站中搜索。

3.关键词加双引号,获得精准的搜索结果

将关键词加上双引号,搜索引擎会返回和关键词完全一致的搜索结果,在搜索英文人名、地点、引语、歌词、文学作品等比较确定的关键词时比较有用。

要注意的是,如果使用引号搜索,有可能会错过使用密切相关词汇的有用内容。因为在默认情况下,谷歌搜索系统被设计为既寻找所输入的准确单词和短语,又寻找相关的术语和概念。

比如,搜索一个名字 John Jack Lee,谷歌会有 1.9 亿条结果,因为不仅要显示 John 的名字,还会显示 Jack 和 Lee 的名字,甚至可能还会显示其他包括这些姓氏在内的名字。

如果搜索「John Jack Lee」,则谷歌会严格地按照关键词的先后顺序搜索,并返回完整包含所有关键词的结果:

比如,要搜索一部名为 Los Angeles 1991 的电影,如果直接在谷歌输入 Los Angeles 1991,会返回很多不相关的结果:

加双引号后,结果会更直接:

4.使用-在搜索结果中排除某个词汇

如果不希望搜索结果中出现某个词汇、日期甚至网站,可以在搜索框中输入关键词,然后再输入不希望出现的词语并在该词语前添加减号。

注意减号前面必须是空格,减号后面没有空格,要紧跟着需要排除的词,而且这里的减号是英文字符,不能用中文字符。

比如搜索「NBA 球星 -詹姆斯」,返回的搜索结果就不会包含詹姆斯。

比如搜索土耳其无人机 Bayraktar TB2 有关的信息,维基百科的内容是搜索结果的第一位:

如果不希望结果中包含来自维基百科的内容,则可以输入 Bayraktar TB2 -site:wikipedia.org

5.使用通配符*

如果不确定要搜索的关键词或者问题,可以在搜索中使用通配符*,谷歌会用一系列相关的词汇来替换这个符号。

比如,搜索「黄色的面孔有红色*」,会返回罗大佑《亚细亚的孤儿》的完整歌词:

6.使用 OR 选择性字词搜索

如果希望搜索结果包含两个或多个关键词中的任意一个, 可以在其中使用关键字 OR。 (注: OR 必须大写)。

例如,搜索 奥运会 2024 OR 2028,结果中会出现 「奥运会 2024」或者「奥运会 2028」的结果。OR 指令还可以用分隔符 | 代替。

7.使用……搜索数字范围

用两个半角句号(不加空格)隔开两个数字可搜索日期、价格、尺寸等介于两个数字之间的任意内容。

比如,搜索 2000 年到 2022 年之间的诺贝尔奖得住,输入”nobel prize winners” 2000……2022:

8.使用 intitle: 前缀,可以限制只在标题中搜索

在搜索中加入「intitle:」可以限定在网页标题 title 中搜索网站信息,注意 intitle:和后面的关键词之间不要有空格

比如,要查找有关美国武器出口的信息,搜索 arms export intitle:US,可以看到 US 出现在每个网页的标题上。

9.使用 related 搜索相关网站

如果想知道和某个特定网站相关的其他网站,可以使用 related:标签。

例如,搜索 related:brookings.edu 就会找到和布鲁金斯学会(brookings.edu)相似的智库网站,如美国企业研究所(American Enterprise Institute)、兰德公司(Rand Corporation)、卡托研究所(Cato Institute)、战略与国际研究中心(CSIS)等。

10.使用 inurl:在特定 url 链接中搜索

在搜索中加入 inurl:可以限定在网站 url 链接中搜索网站信息,比如搜索 India inurl:Narendra Modi,搜索词 India 可以出现在网页的任何位置,而 Narendra Modi 则必须出现在网页 url 中。

11.使用 imagesize:搜索精确尺寸的图片

如果想搜索特定大小的图片,可以在搜索查询中使用 imagesize:标签,并且标注以像素(pixels)为单位的宽度和高度。

比如搜索 Taylor Swift imagesize:2000×1200,得到的是尺寸为 2000×1200 像素的 Taylor Swift 图片。

12.高级搜索

在进行复杂搜索时,可以使用谷歌的高级搜索功能来缩小搜索结果范围。

按照搜索内容的类别,谷歌提供了不同的高级搜索页面

网站和文件的高级搜索页面:google.com/advanced_search

图片高级搜索页面:google.com/advanced_image_search

可以查找任意尺寸的图片,指定图片的形状,查找带有首选颜色的图片,查找在特定地区发布的图片,查找特定版权信息的图片。

比如,要搜索在美国发布的、与奥斯卡颁奖礼有关的、尺寸大于 1024*768 像素、依据知识共享许可协议可以自由使用的 JPG 格式横构图全彩照片,在谷歌图片高级搜索页面输入这些选项:

结果如下:

视频高级搜索页面:google.com/advanced_video_search

可以查找使用特定语言的网页,指定要搜索的视频时长,查找在指定时间内更新的网页,可以仅限高质量视频,可以只搜索某个网站(例如 youtube.com)或将搜索结果限制为特定的域名类型(例如.edu、.org 或.gov),可以查找带字幕的视频。

比如,要搜索 YouTube 网站上一个月内发布的有关乌克兰战争的带字幕的高质量英语短视频,在谷歌视频高级搜索页面输入这些选项:

结果如下:

13.谷歌对信源的初步辨识

在谷歌搜索的大多数结果旁边可以看到三个点,点击这三个点,即出现「关于这条结果的详细信息」(英文搜索页面会出现「About this result」字样),可以了解信息的来源、对来源的介绍、你与该站点的连接状态是否。这些内容有时可能有助于快速识别一些基本信息。

谷歌在 2023 年 3 月 28 日宣布,从当天开始,它将使用户更容易访问其「关于这条结果的详细信息」的功能。

该公司在一篇博文中说:「假设你正在搜索一个雨林保护组织。从今天开始,你可以在谷歌搜索中输入该组织的 URL,『关于这个页面』的信息将在搜索的顶部出现。你将能够迅速看到该网站如何描述自己、网络上其他人对一个网站的评价,以及最近对它的任何报道。从那里,你可以评估你是否想访问该网站并了解更多。这项功能现在在全球范围内以英语提供。」

谷歌还推出了一项名为「关于这个作者」(About this author)的新功能,让用户了解他们正在阅读的内容背后的作者,同样可以点击搜索结果旁边的三个点。

此外,谷歌即将推出新的「观点」(perspectives)功能,形式是一个卡片式轮播,将出现在「热门」下方,展示一系列记者、专家和其他相关声音所搜索的主题的见解。谷歌称该功能背后的理念是为用户提供关于某个新闻主题的各种值得注意的声音,以扩大用户对该主题的理解。该功能将很快在美国推出英文版本。

1.可以先查找是否已经有其他人或组织证实过某条信息为假或者怀疑该信息为假,有时可以提供有用的线索。这时通常可以在关键词后面加上「虚假」、「存疑」、「错误」、「false」、「fake」、「wrong」等字眼,或者在媒体的评论里面搜索这些关键词。

2.对事实核查员来说,要找到一手信源材料,可以试试在具体的关键词基础上,再添加如下的类别关键词搜索,可以提高效率。

要查找研究报告、调研报告,可以在谷歌搜索中添加「报告」、「研究」、「研究报告」、「调查」、research、report、survey 等关键词;也可以添加与要搜索的主题相关的关键词,例如「气候变化研究报告」或「金融行业研究报告」;或者添加报告发布机构,如「世界银行研究报告」或「麦肯锡全球研究报告」。

比如,如果想查找关于政府间气候变化专门委员会(IPCC)发布的有关全球气候变化的研究报告,可以在谷歌搜索中输入:climate change report IPCC。

要查找统计数据,可以在关键词后面添加「统计数据」、「数据」、「数据来源」、「数据库」、「data」、「dataset」、「database」、「statistics」、「figure」、「census」等关键词。

比如,2022 年 3 月 5 日开始,中文网络流传一则内容大同小异的消息称:「世界人口史上的一个历史性时刻!3 月 4 日,印度公布了 2021 年人口统计结果,印度人口达到 14.1565 亿人,正式超过中国 2021 年的人口 14.126 亿人,领先 300 万人左右,成为世界第一大人口大国」。(参考阅读:印度人口正式超越中国成全球第一?

要核查这些说法,可以拆解成这几个问题:印度目前有多少人口?印度公布 2021 年人口统计结果了吗?哪里可以看到印度人口的实时统计结果? 我们应该查找的重点信息类型是 数据报告、人口统计结果、媒体报道或政府公文。

我们可以设置搜索基础的关键词为「India census」、「India China population」、「India population data」等。

要查找比较直观的可视化数据、图表,可以尝试添加「可视化」、「图表」、「仪表盘」、「地图」、「交互图表」、visualization、dashboard、map、mapping、interactive、chart、graph 等关键词。

比如,搜索有关俄罗斯经济现状的图表,可以输入 Russian economy chart。

查找量化指标,如食品价格指数、全球金融中心指数、非洲避孕普及率、美国大城市犯罪率等,可以尝试添加「指数」、「率」、index、rate 等关键词。

比如,如果想查找美国的失业率统计数据,可以在谷歌搜索中输入 US unemployment rate。

快速了解具有时间维度特征、不断动态发展的事件或议题,可以添加「时间线」、「时间轴」、timeline 等关键词。

比如,检索「黑人的命也是命」运动的来龙去脉,可以输入 Black Lives Matter timeline

查找国家政策立场文件、法律文件、白皮书等,可以尝试添加「文件」、「文献」、「白皮书」、「蓝皮书」、file、document、publication、fact sheet、guideline、white paper 等关键词。

比如要搜索美国对于印太地区的政策立场,可以搜索 US Indo-Pacific white paper

查找各种领域的榜单,可以添加「排名」、rank、ranking 等关键词。

比如要查找世界营商环境的排名,可以输入 world business rank

查找各种民调数据,可以添加「民调」、「晴雨表」、poll、survey、barometer 等关键词。

比如查找美国对华态度的民调,可以输入 US attitude towards china poll

查找演讲、致辞的全文、实录或者电视节目、广播、播客的文字稿,可以添加 transcript 等关键词。

比如,中文平台流传说法称,老布什当年被派到北京担任美国驻华联络处主任,福特总统访华时,老布什第二次见到了毛泽东。二人见面后,毛泽东对老布什说:「我看你人很不错,将来能当美国总统」。有关的文字绘声绘色,那么毛泽东到底有没有说过这些话呢?(参考阅读:毛泽东提前 13 年预见老布什能当美国总统?

核查这段话真实与否的关键,是要找到毛泽东当年与老布什见面时的新闻报道、文字或影像记录,看是否有这段话的蛛丝马迹。

在谷歌检索 George Bush Mao Zedong,得到的搜索结果大部分是媒体对当年毛泽东与老布什见面场景的回顾,并没有细致的谈话记录。

这时我们把搜索关键词改为 George Bush Mao Zedong transcript,返回第二个搜索结果来自美国伍德罗·威尔逊国际学者中心(The Woodrow Wilson International Center for Scholars),保存了 1975 年 10 月 21 日老布什陪同美国国务卿基辛格会见毛泽东的完整会谈纪要。

在纪要页面检索 Bush,可以发现,在聊到参与会谈的时任美国国务院政策规划主任的温斯顿·洛德(Winston Lord)和老布什的职业生涯时,毛泽东确实说:「他(老布什)能当总统(He can be president)」,但并没有说:「我看你人不错」。

查找历史档案、图片、视频,可以添加 archive

比如查找新加坡前总理李光耀的历史资料,可以输入 Lee Kuan Yew archive

可以在 archive.org 和 archive.is 上查找被删除的页面,尤其是社交媒体帖文。

另外,还使用 Internet Archive搜索电视脚本。Internet Archive 允许用户搜索 2009 年之后播出的美国主要新闻节目的字幕,从而可以找到可能在电视上播出但没有书面记录从而无法被谷歌索引的那些说法。该网站的资源可以免费访问。

2022 年 7 月,俄罗斯驻华大使馆官方微博称:「基辅政权向美国出售最好的乌克兰土地:澳大利亚杂志《National Review(国家评论)》写道,三个美国大型跨国财团已经购买了 1700 万公顷乌克兰农业用地。相比之下,意大利全境拥有 1670 万公顷农田。如此看来,三家美国公司在乌克兰购买的可用农业用地比意大利拥有的全部耕地还多。乌克兰的总面积是 60 万平方公里,现已被买 17 万平方公里。」

对于这个说法,我们可以拆解成如下几个核查点:

1.澳大利亚杂志《National Review(国家评论)》是否发布过这篇报道?

2.澳大利亚杂志《National Review(国家评论)》是一家什么样的媒体?是否是可靠的信源?

3.三个美国大型跨国财团是否已经购买了 1700 万公顷乌克兰农业用地?有没有相关的新闻报道或者数据支持?

我们先在谷歌检索 Australian National Review(《澳大利亚国家评论》),比较反常的是,靠前的搜索结果并未显示这家媒体的存在,必须要翻到第五页才可以发现其官网https://www.australiannationalreview.com/

进入官网首页可以发现这家网站的内容选题、格式体例以及遍布网页的小等,都似乎与一家正规媒体的网站相去甚远,这时可以合理怀疑其内容的可靠性。

继续在网站站内检索关键词 Ukraine American land,可以查到该网站确实发布了一篇题为「三家大型美国跨国公司购买 1700 万公顷乌克兰农业用地」(Three Large American Multinationals Bought 17 Million Hectares of Ukrainian Agricultural Land)的文章,发布时间是 2022 年 5 月 27 日。

文章署名 Laura Aboli,全文如下:

「三家大型美国跨国公司购买了 1700 万公顷的乌克兰农业用地。

这三家公司是嘉吉公司、杜邦公司和孟山都公司(官方说法是一家德国-澳大利亚公司,但其实有美国资本)。随后,5%的乌克兰农业用地被中国购买。作为比较,整个意大利有 1670 万公顷的农业用地。

简而言之,三家美国公司在乌克兰购买的有用农业用地比整个意大利还多。

这三家公司的主要股东中包括 Vanguard、Blackrock、Blackstone(先锋、贝莱德和黑石,均为美国的投资公司——注)。

又是那些常见的嫌疑人…「

显然,这篇有关乌克兰的文章没有信源,也不是正常的新闻报道的写法。

《澳大利亚国家评论》是一家什么样的媒体呢?查看官网的自我介绍,其自称是「澳大利亚第一个真正自由和独立的媒体,一个没有精英阶层编辑控制的媒体,一个能够产生批判性思想家和批判性辩论的出版物,并让那些在主流媒体上散布错误信息和故意宣传的人承担责任。」

该网站页面的显著位置一直呼吁读者捐款。

根据其介绍,《澳大利亚国家评论》创始人名叫杰米·麦金太尔(Jamie McIntyre),再输入关键词 Jamie McIntyre,可以发现根据澳大利亚媒体的报道,他是澳大利亚一名极富争议的百万富翁。2010 年代,他旗下的房地产公司通过未经注册的投资管理计划,鼓吹通过房地产快速致富,导致大批投资者遭遇损失,随后被指控无照提供金融服务,被澳大利亚证券投资委员会禁止提供金融服务 10 年。新冠疫情爆发后,麦金太尔声称「全球主义者将新冠病毒用作特洛伊木马,来破坏我们的民主并推动建立一个新的世界极权主义政府」。他还是疫苗反对者,声称疫苗行业存在大规模欺诈行为。2021 年,麦金太尔成立了 TruthGroup,声称是「一家无的社交媒体公司」。

在提供媒体偏见评级的 Media Bias/Fact Check 官网上搜索《澳大利亚国家评论》,可以看到《澳大利亚国家评论》被评为「阴谋论-伪科学」类别,可信度「低」。

仔细观察,这篇有关乌克兰的文章结尾处附有一个法国网站 ritimo 的链接。被链接的 ritimo 网站的文章标题是「谁真正受益于在乌克兰建立土地市场?」,发布于 2021 年 11 月 12 日,为法文版。

ritimo 网站的这篇文章,在作者署名位置标注了 par Oakland Institute,MOUSSEAU Frederic,REICHER Ben 的字样,搜索这 3 个名字,可以发现该文翻译自专注社会、经济和环境议题的美国智库奥克兰研究院(The Oakland Institute)2021 年 8 月 6 日的英文同题文章。

文章主要分析了乌克兰土地改革的背景和前景,对在乌克兰建立土地市场持悲观态度,认为此举将进一步把土地控制权集中在寡头和大型农业综合企业手中,同时有利于外国投资者和银行的利益,而绝大多数乌克兰农民和公民将不得不为此付出代价。

不过,全文并未提及嘉吉公司、杜邦公司和孟山都公司购买了 1700 万公顷的乌克兰农业用地。

由此,经过层层搜索,可以梳理出这一说法的大致传播链条是:

-2021 年 8 月 6 日,美国智库奥克兰研究院发表了一篇关于乌克兰土地市场改革的文章。文章对乌克兰开放土地市场持批评态度,并未提及三家美国公司嘉吉、杜邦和孟山都购买了 1700 万公顷的乌克兰农业用地。

-2021 年 11 月 12 日,法国 ritimo 网站翻译了这篇文章。

-2022 年 5 月 27 日,《澳大利亚国家评论》链接了 ritimo 网站的文章,但在英文文章中炮制出原文中没有的「三家大型美国跨国公司购买了 1700 万公顷的乌克兰农业用地」的说法,同时还声称「中国购买了 5%的乌克兰农业用地」。

-2022 年 7 月 26 日,俄罗斯驻华大使馆用中文发布了这一说法,隐去了原文中提及的三家美国公司的名字和有关中国的部分。

此时,有关这一说法的核查只完成了前两部分,即:搞清楚了流言的来源,并初步判断内容本身高度存疑,但还需要更多证据。

接着,我们要检索关键词 Ukraine Agriculture land,这时会返回大量的搜索结果,既包括有关乌克兰农业用地的概况,也包括有关乌克兰农业改革、粮食生产、俄罗斯进攻导致的粮食问题等等媒体报道,其中并没有直接可以回答或者回应核查内容的信息。

这时我们要通过搜索结果快速了解有关乌克兰农业土地的概况和法律法规,可以发现围绕乌克兰农业改革有大量的报道,从中我们可以梳理出这样的事实:

苏联解体前,所有土地均属国家所有。1991 年乌克兰独立后,在国际货币基金组织和其他国际机构的指导和支持下,乌克兰政府将大部分农田私有化并向个人分发土地所有权证书。然而,在全国经济萧条的情况下,许多人开始转售土地所有权证书,导致土地越来越集中在寡头手中。

因此,乌克兰政府于 2001 年颁布了一项农业土地禁售令,禁止了除继承等少数情况之外的几乎所有的私有农业用地流转。

多年来,国际货币基金组织等国际机构一直呼吁乌克兰推行土地改革,但由于担心跨国公司低价从民众手中大举拿地引发社会不满,乌克兰立法机构最高拉达(议会)和多届政府多年来都未能通过相关法律改革,原本只是暂时的土地买卖禁令被延期 10 多次,涉及的土地面积占全国面积的 66%。

直到泽连斯基当选总统后,2020 年 3 月 31 日,乌克兰最高拉达三读通过了《乌克兰农业土地流转法案修正案》(第 552-IX 号法律),实行了近 20 年的农地禁售令得以废除。

根据新法案,乌克兰将于 2021 年 7 月 1 日起解除农业土地销售禁令。新法案规定,乌克兰农业土地市场开放的头两年,乌克兰公民可以购买农业用地,土地购买权仅适用于自然人,禁止法人购买农业用地,禁止出售国有土地,单次购买土地不得超过 100 公顷。两年后(2024 年 1 月 1 日起),由乌克兰公民控制的法人可以购买土地,但每名法人控制土地规模不能超过 1 万公顷。

对于最敏感的外国企业或个人拥有乌克兰农业土地的问题,新法案规定,这一问题将由全民公决。但新法案已确定的重要一点是,外国企业和个人不能购买距乌克兰边境 50 公里内的土地。

外国公司或外国人拥有农业土地,在乌克兰一直是一个政治烫手山芋。

2019 年 11 月,乌克兰最高达拉一读通过的《乌克兰农业土地流转法案修正案》版本中,规定自 2020 年 10 月 1 日起开放国内土地市场,允许不同所有制形式的农业用地进入市场流转,乌克兰国内公民、社团、法人代表均可自由购置土地。外国公民和企业 2024 年之后才能购买乌克兰土地,但目前已在乌克兰租赁土地并从事经营的外国企业从 2020 年 10 月 1 日起与乌克兰企业享有同等的土地购买权。

然而,乌克兰多地爆发了反对向外国人出售土地的抗议活动。随后乌克兰总统泽连斯基表示,是否允许外国公民和企业购买乌克兰土地的问题将付诸全民公投。

最终,乌克兰最高拉达在 2020 年 3 月 31 日三读通过的版本中,将是否允许外国企业和个人购买乌克兰农业土地的问题交由全民公决。

2021 年 6 月,基辅国际社会学研究所(KIIS)进行了一次全乌克兰民意调查,结果显示,84.1%的乌克兰人不支持向外国人出售农业用地。

可见,截至 2022 年 7 月核查之时,乌克兰仍然禁止外国企业和个人购买农业土地,未来是否允许,需要举行全民公决。而截至,乌克兰尚无公投的计划。因为战争的爆发,这一公投在相当长的时间内也不可能举行。

核查至此,似乎已经可以得出结论了——因为乌克兰仍然禁止外国企业和个人购买农业土地,所以三个美国大型跨国财团不可能拥有 1700 万公顷乌克兰农业用地。

但是,除了不能直接买,外国公司有没有可能通过其他方式拥有或者控制乌克兰农业用地呢?

我们不能排除这种可能,所以要继续检索。

在搜索结果中查阅媒体报道和智库研究,可以发现,乌克兰除了不允许外国公民和企业购买农业用地外,对外资参与其他形式的农业投资合作则无明确限制。因此,在暂停农业土地买卖的 20 年间,大型农业企业通过租赁的方式控制了大量土地。

这种可能性被证实之后,核查的重点变成了外国公司尤其是美国公司通过投资乌克兰公司的方式控制了多少乌克兰的农业用地。

因为许多租约没有登记,因此很难找到有关谁在租用乌克兰农田的可靠数据,不过我们依然从搜索结果中找到近年来三份相互印证、偏差不大的材料,可以一览外资在乌克兰农业用地方面的涉足情况以及具体的公司排名,其中有两份来自长期研究全球土地市场的智库,一份来自中国官方:

土地投资数据库 Land Matrix 2020 年 8 月发布的报告称,投资者控制着乌克兰 7.6%的农业用地和 10%的可耕地,投资者承包的土地总面积达 3,242,438 公顷。该组织东欧地区协调中心的研究表明,外国投资者(包括在国外注册公司进行再投资的乌克兰公民)在乌克兰控制的土地可能更多,大约承包了约 15%的农业用地。

2021 年 9 月,Land Matrix Initiative 发布了第三份分析报告《盘点全球土地争夺战》。根据这份报告,乌克兰在跨国农业投资的总合同面积方面在目标国家中排名第二,超过 330 万公顷。

Land Matrix 的报告指出,乌克兰前五大农业控股公司及其控制的土地面积分别为:

1)UkrLandFarming Plc(注册地为塞浦路斯)531,306 公顷

2)Kernel Holding S.A.(注册地为卢森堡)507,611 公顷

3)NCH Capital Inc.(注册地为美国)350,400 公顷

4)MHP S.E(注册地为塞浦路斯)349,321 公顷

5)Astarta Holding B.V.(注册地为荷兰)242,400 公顷

其中,除了美国的 NCH,其他四家公司都在传统避税国家注册,实际上则是乌克兰公司。

该报告称,乌克兰公民是该国五大农业控股公司中四个的最终受益者。

中国商务部出版的《对外投资合作国别(地区)指南-乌克兰》(2020 年版)列出的乌克兰主要农业企业为:

1)Ukrlandfarming,拥有土地 65.4 万公顷

2)NCHAgro,拥有土地 43 万公顷

3)Kernel,拥有土地 39 万公顷

4)MHP,拥有土地 36 万公顷

5)Mriya,拥有土地 25.9 万公顷

德国莱布尼茨转型经济农业发展研究所曾在 2018 年 5 月列出了乌克兰最大的 10 家农业土地持有者,这 10 大农业控股企业共经营约 285.6 万公顷土地,雇用了超过 10 万人。

1)Kernel(注册地为卢森堡)570,500 公顷

2)UkrLandFarming(注册地为塞浦路斯)570,000 公顷

3)Agroprosperis (New Century Holding)(注册地为美国纽约)430,000 公顷

4)MHP (Myronivsky Hliboprodukt)(注册地为塞浦路斯)370,000 公顷

5)Astarta(注册地为荷兰)250,000 公顷

6)Mriya(注册地为塞浦路斯)165,000 公顷

7)IMC(注册地为卢森堡)137,000 公顷

8)Agroton(注册地为塞浦路斯)122,000 公顷

9)Ukrprominvest-Agro(注册地为乌克兰)122,000 公顷

10)AgroGeneration(注册地为法国)120,000 公顷

从这三份材料的数据可以看出,包括美国公司在内的外国公司,通过租赁耕地、购买乌克兰公司股份等方式进入乌克兰农业用地市场,但控制的耕地面积远远不到 1700 万公顷。美国公司也只占其中的一部分。

那么接下来,我们可以自然延伸出一个问题,既然美国公司在乌克兰拥有的农业用地并不多,那么美国农业到底在乌克兰干些什么?

搜索流传说法中提到的几家美国公司——嘉吉公司、杜邦公司和孟山都,关键词为“公司名 乌克兰”,梳理这些公司在乌克兰的主要业务。

这时对搜索结果的筛选来自三个来源。

首先是智库奥克兰研究院,这家智库一直在跟踪研究乌克兰土地市场改革,在该话题上相当权威。奥克兰研究院 2014 年 12 月有关乌克兰农业领域的报告中提到:

「除了农业土地之外,乌克兰开发、生产和使用种子、农用化学品、化肥等的机会也吸引了农业企业巨头孟山都、嘉吉和杜邦公司。

虽然这三家公司在乌克兰已经有相当长的时间,但他们在乌克兰的投资在过去几年里有了很大的增长。例如,嘉吉公司在乌克兰已经有超过 20 年的历史。他们的活动包括但不限于销售农药、种子和化肥。近年来,他们扩大了农业投资,包括额外的粮食仓储、一家动物营养公司,以及购买 UkrLandFarming 的股份。

孟山都公司自 1992 年起在乌克兰开展业务,以种子和农用化学品为重点。新闻报道显示,2012 年,孟山都的乌克兰团队规模扩大了一倍,2014 年 3 月,该公司投资 1.4 亿美元建立了一个新的种子工厂。

最后,杜邦公司最近也扩大了其在乌克兰的投资。2013 年 6 月,该公司宣布,它也将投资建设一个新的种子工厂,『以满足该地区日益增长的需求』。杜邦公司欧洲区域总监 Jeff Rowe 指出,该公司将努力为该国生产抗干旱和耐热的种子。该种子厂的扩建工程于 2014 年 9 月完成,以支持『客户对先锋品牌玉米杂交种子的日益增加的需求』。「

第二个来源是媒体报道。以英文「公司名 乌克兰」为关键词,可以检索到核查时比较新的新闻,比如:2022 年 2 月 24 日,在俄罗斯进攻乌克兰的最初几个小时内,黑海上一艘名为 Yasa Jupiter 的散货船在敖德萨海岸附近被导弹击中,这艘船就是由嘉吉公司租用的。嘉吉公司的一位发言人对媒体表示,船员们很安全,并且在事故发生后该船仍然「适航」。报道中提到,嘉吉在敖德萨附近的尤日内深海港口拥有多数股权,并在乌克兰的谷物和油籽加工厂拥有 500 多名员工——这些信息很重要,说明嘉吉在乌克兰的主营业务并非农耕。

第三个来源是搜索这些公司的官网。在这些公司官网上以 Ukraine 为关键词检索,会出现该公司过去有关乌克兰业务的内容或者报告。

以这些检索方式类推,还可以找到美国其他一些在乌克兰有业务的重要粮食企业,主要涉及粮食加工、仓储和出口业务。

至此,经过各种信息检索、追根溯源、筛选搜索结果、梳理信息、综合整理,已经有充分的证据可以得出结论,所谓美国三大财团购买 1700 万公顷乌克兰农业用地的说法是虚假的。(参考阅读:美国三大财团购买 1700 万公顷乌克兰农业用地?

在核查涉及非英语国家的选题时,使用当地语言进行搜索至关重要,因为很多时候英文信息并不充分。

比如,2022 年 4 月初,中文网络流传一张截图,援引「联合国人口司」的「中国移民到各国人数」的数据称,从 1990 年到 2020 年,中国竟然没有一人移民到俄罗斯。

要证实或证伪这一说法,关键是要获得全文的中国人移民到俄罗斯的数据。一般而言,涉及移民问题,比较权威的统计主要来自移入国的相关部门,比如处理移民事务的部门、外交部门、统计部门等。就本核查而言,是否能找到来自俄罗斯相关政府部门的官方统计数据,显然是核查的关键,其重要性大于来自第三方智库、国际组织的数据。

然而,如果用英文 Chinese immigrants Russia 来检索,结果多是英语媒体对中国人移民俄远东地区的新闻报道和分析,很难找到反映中国人移民到俄罗斯全貌的报告或者数据。

进入俄罗斯联邦内务部、俄罗斯联邦国家统计局的官网可以发现,这些网站虽然有英文版,但是英文版内容更新滞后,且内容比俄语版少了很多,而且用英文关键词检索也几乎一无所获。

此时,用俄语Численность(人口) миграция(移民)为关键词,在上述两个官网检索,则可以很容易地在俄罗斯联邦内务部官网找到一份题为《按国家和地区划分的俄罗斯联邦移民状况具体指标》的俄语文件,每年一份,最新统计截至 2021 年。文件统计了历年来获得俄罗斯公民身份(接受、恢复、承认)的外国移民总数以及来源地分布。 以 2016 年-2021 年为例,获得俄罗斯公民身份的中国人的数量依次为 66 人(2016 年)、73 人(2017 年)、81 人(2018 年)、75 人(2019 年)、70 人(2020 年)、83 人(2021 年)。

同样使用上述俄语关键词在俄罗斯联邦国家统计局官网检索,也能迅速找到俄罗斯联邦国家统计局 2020 年的移民数据表格。该表格显示,2020 年,在俄罗斯的中国移民的状况是:总量(城市加农村):移民进入 7270 人,离开 11035 人;其中城市移民进入 6731 人,离开 9909 人;农村移民进入 539 人,离开 1126 人,移民总数在减少。 根据统计表格的俄语注释,这些关于人口迁移的数据来源于俄罗斯联邦内务部领土机构(从 2019 年起,联邦数据调研)的入境和出境的数据记录,这些记录主要针对居住地登记和取消登记时,以及在居住地登记 9 个月以上时的人口。

有了以上这些俄罗斯官方统计数据,已经足以证实「从 1990 年到 2020 年,中国竟然没有一人移民到俄罗斯」的说法并不准确。核查过程中,使用俄语检索显然是最关键的步骤。(参考阅读:中国 30 年来竟无一人移民俄罗斯?

[事实核查] 获取权威、可靠、可信、真实、可验证的事实来源实战指南

DUN.IM BLOG

DUN.IM BLOG

在事实核查实践中,找到可靠的信源对于证实或证伪某种说法是最为重要的。

就有据而言,我们鼓励核查员在可能的情况下尽力找到信息的最初源头,也就是一手信源,而非仅仅依靠媒体报道的二手信源。一手信源一般包括采访、统计资料、原始数据、研究论文、调查报告等等。

主要核查美国政治的事实核查组织 Factcheck.org 对于信源的使用标准是:

「我们的目标是使用最好的证据。(Our goal is to use the best evidence)

我们的信源包括:国会图书馆提供的国会证词;众议院书记员和参议院秘书办公室提供的投票记录;劳工统计局提供的就业数据;证券交易委员会提供的公司记录;国税局提供的税务数据;经济分析局提供的经济数据;以及能源信息管理局提供的能源数据,等等。

我们依靠无党派的政府机构提供专业知识、分析和报告,包括国会预算办公室、税务联合委员会、政府问责办公室、国会研究服务处、医疗保险和医疗补助服务中心以及联邦监察长。

我们还依靠一些受人尊敬和值得信赖的外部专家,如凯撒家庭基金会(Kaiser Family Foundation)的医疗保健数据、税收政策中心(Tax Policy Center)的税收数据和全国州立法机构会议(National Conference of State Legislatures)。我们还根据需要采访其他主题的专家—例如,在研究有关外国的问题时,我们会联系这些领域的专家。在引用专家的话时,我们会披露相关的履历信息,比如他们以前在政府或竞选活动中的工作——如果需要的话。“

美国另外一家著名的事实核查组织 Politifact 对于信源的要求是:

「PolitiFact 使用公开信源,并在每次事实核查中公布消息来源清单。在可能的情况下,该清单包括指向免费的消息来源的链接,不过,有些消息来源存在付费墙。

我们总是联系或试图联系发表我们正在进行事实核查的说法的个人、或组织。

我们强调主要来源和原始文件。我们寻求直接使用政府报告、学术研究和其他数据。对我们来说,仅仅得到一些二手的东西是不够的。我们不依赖竞选团队或民选官员告诉我们的东西,我们必须独立核实。

如果 PolitiFact 必须引用其他媒体的报道,而这些报道依靠的是未具名的来源,我们会注明,我们无法独立核实该报道。「

不过,与 PolitiFact 和 FactCheck.org 不同,《华盛顿邮报》的事实核查在某些情况下会使用匿名信源

《华盛顿邮报》事实核查员格伦·凯斯勒(Glenn Kessler)说他不喜欢咨询专家,即使是在解释复杂数据方面。他说: 「我是那种对自己的判断相当自信的记者。我喜欢用自己的声音说话,因为我实际上已经报道了华盛顿的几乎所有事情……你可以看我的简历,你可以看我报道过什么。我带来了一个独特的视角,我在华盛顿听了 30 年的胡言乱语。」

而且,《华盛顿邮报》称,「我们将采用『理性人』的标准来得出结论。我们不要求 100%的证据。证明某个说法准确性的举证责任在于发布者。」

一般而言,信息的可靠度与其信源的可靠度成正比。通常情况下,越是可靠的信源,发布的信息越值得我们信任。我们可以参考使用专业的评估网站和工具,对比评估结果,进行综合考虑。

近年来,全球媒体界出现一些机构和组织,试图对媒体的可信度和立场进行量化评级,它们设定了一些标准,制定了评估流程,使用人工或者算法对媒体或媒体报道进行打分。这些实践在一定程度上解决了评估信源质量的主观性问题,但同时也面临诸多争议。

注意:对事实核查员来说,媒体评级只是一个参考而非决定性证据。同时,我们可以参考这些评级组织的标准,在核查实践中对信源进行自己的评估。

NewsGuard 的媒体可信度评级

单就媒体信源而言,美国 NewsGuard 公司设计了一套可信度评估指标,在核查国际新闻时可作为参考。

NewsGuard 由斯蒂文·布里尔(Steven Brill)和戈登·克罗维茨 (Gordon Crovitz)创办,前者曾是资深记者,创办了法律出版物《美国律师》(The American Lawyer)、法庭电视台(Court TV)和耶鲁新闻倡议(the Yale Journalism Initiative),后者曾是《华尔街日报》的发行人和专栏作家。

NewsGuard 声称其评级涵盖超过 8000 个新闻和信息网站,这些网站占美国、英国、加拿大、法国、德国和意大利在线新闻互动的 95%。其评级不涉及中国媒体。

NewsGuard 聘请了一支由记者和经验丰富的编辑组成的团队,根据 9 项指标为新闻和信息网站制作可靠性评级和分数。这些指标分为「公信力」和「透明度」两大类,满分 100 分。

100(或 100%):高可信度:该网站遵守所有 9 项可信度和透明度标准。

75-99(或 75%-99%):总体上可信:该网站大部分遵守了可信度和透明度的基本标准。

60-74(或 60%-74%):除了例外情况之外,基本是可信的:该网站通常保持基本的可信度和透明度标准——但有重大例外情况。

40-59(或 40%-59%):谨慎对待:该网站不可靠,因为它未能遵守一些基本的新闻标准。

0-39(或 0% 至 39%):谨慎对待:该网站不可靠,因为它严重违反了基本的新闻标准。

有两类网站——幽默讽刺类网站和平台类网站, NewsGuard 不会根据其对 9 项标准的遵守情况而对其进行评分,而是分别用橙色和灰色标签区分。

需要注意的是,NewsGuard 对整个网站进行评分,而不是针对每篇特定文章。同时,并非所有网站都会获得 NewGuard 的评级,这并不一定意味着它们是很糟糕的网站或信源,只是它们的受众比大多数新闻网站都小。

2019 年,为减少虚假信息对互联网用户的误导,美国微软公司在其「Edge」使用 NewsGuard 的新闻评级服务,用户只需在浏览器设置「新闻分级」选项,开启「在地址栏显示分级」功能,就可使用该服务。值得信赖的新闻网站会以绿色标示。

NewsGuard 在其网站上列出了对新闻网站的评分指标。这些指标同样适用于事实核查员在评估信源时参考:

不重复发布虚假内容:该网站不重复发布而且现在也不发布明显虚假的内容,而且这些内容并未被迅速且显著地更正。要不通过这条标准其实很难,因为这意味着该网站每一天都可能在发布明显虚假的内容。(22 分)

负责任地收集和呈现信息:内容提供者在报道和呈现信息方面通常是公正和准确的。他们引用多个来源,最好是那些针对某一主题或事件提供直接第一手信息的来源,或者来自可靠的二手新闻来源,并且他们不会为了对某一主题进行报道而严重地歪曲信息。(18 分)

定期更正或澄清错误:网站在识别错误和发布澄清、更正方面有行之有效的做法,透明地承认错误,并且不会经常不更正重大的错误内容。(12.5 分)

负责任地处理新闻和观点之间的区别:内容提供者如果给人的印象是他们在报道新闻、或既报道新闻又发表观点,则应将观点与新闻报道区分开来。同时,在报道新闻时,不要为了宣扬某种观点而对事实或故事进行过分的挑选。倡导特定观点的内容提供者应披露该观点。(12.5 分)

避免欺骗性的标题:网站通常不会发布包含虚假信息、明显耸人听闻或未反映标题下面实际内容的标题。(10 分)

网站披露所有权和融资:网站要以方便用户的方式披露其所有权和/或融资情况,以及与网站有重大经济利益的人所持有的与网站报道有关的任何明显的政治关联或经济利益。简而言之,读者应该知道谁在资助网站的内容,以及所有者或资助者在网站内容中可能有哪些相关利益。(7.5 分)

清楚地标明广告:网站要清楚说明哪些内容是付费的,哪些不是。(7.5 分)

揭示谁是话事人,包括可能的利益冲突:在网站上标明负责内容的人,并且读者可以通过一种方式就编辑问题联系该网站。换句话说,读者被告知谁负责决定发布什么内容。(5 分)

揭示了谁在负责,包括可能的利益冲突。在网站上标明负责内容的人,并且有办法让读者就编辑问题联系网站。换句话说,读者被告知谁负责决定发布什么内容。(5 分)

网站提供内容创作者的姓名,以及联系方式或简历信息:有关内容生产者的信息可在该网站上找到,并且通常很清晰地显示了是谁制作了哪些内容。(5 分)

NewsGuard 的评分并非没有争议,有一些网站拒绝其评级,也有人质疑其评分标准的科学性。

根据 NewsGuard 网站上的信息,他们也采取了一系列措施进行质量控制,包括:强调 9 项指标是非政治性的;由训练有素的记者组成分析师团队,根据九项指标评估各网站的内容;运行「营养标签」制度——分析师书面解释为什么被评价对象会获得相应评价等级;联系被评价对象,征求对方的意见和回应,这些内容将包含在对该网站的书面评估中;由经验丰富的编辑进行和事实核查,至少有一名高级编辑和 NewsGuard 的联席首席执行官在发布前审查每个营养标签,以确保评级尽可能公平和准确;定期更新对每个网站的评分和评级;实行问责制,每个营养标签都包含参与评级的作者和编辑的姓名,被评价对象可以反馈或投诉。

媒体偏见评级

在有据核查美国政治有关的选题时,有时会参考「媒体偏见图表」(Media Bias Chart)。

目前比较流行的媒体偏见图表包括AllsidesAd FontesMedia Bias/Fact Check等机构编制的图表。虽然这些机构对于编制媒体偏见评级都有一整套方法论,然而有关媒体偏见图表本身是否存在偏见的质疑一直存在。同时,这些机构不评估媒体报道的准确性或可信度。

因此,对事实核查员来说,在核查美国政治选题时,这些图表可以提醒我们尽量多查找来自不同政治光谱的媒体,以免漏掉事实的全部,但总体而言这些图表只应是一种参考。

以 Allsides 为例,该机构目前已经编制了 1400 多个媒体偏见评级列表,它将不同的媒体放在五个类别中:「左」、「左倾」、「中间」、「右倾」和「右」,而且其评级仅限于有关美国政治的内容,仅对在线内容进行评级,不对电视、广播内容进行评级。

AllSides 声称:「每个人都有偏见——这没关系。没有偏见的消息是不存在的,但隐藏的媒体偏见会误导、操纵和分裂我们,所以每个人都应该学习如何媒体偏见。了解媒体机构的政治偏见可以让你获得均衡的新闻食谱,识别新闻中的不同观点和政治倾向,以便你了解全貌并独立思考,避免操纵、虚假信息和假新闻。“

Ad Fontes 和 Media Bias/Fact Check 也有自己的媒体偏见图表。

AllSides 还推出了事实核查偏见图表(Fact Check Bias Chart),试图展示事实核查机构存在的的偏见,例如 Snopes、Politifact、FactCheck.org 等。

Allsides 声称:「通常,事实核查员会为读者分析信息并得出有关事实含义的结论,这在本质上是主观的。其他时候,他们会根据他们选择淡化或强调的事实表现出偏见。他们还表现出基于故事选择的偏见——例如,主要核查左翼政客的事实,或仅核查右翼主张的事实。“

Allsides 同时承认,此图表不评估准确性或可信度。

The Factual 的算法评级

美国新闻评级网站Factual创办于 2019 年,使用算法来评估新闻来源可信度,与 NewsGuard 针对整个网站评分不同,Factual 针对的是具体文章,每篇文章都会得到一个介于 1-100%之间的评分,该评分基于四个指标:网站质量、作者的专业知识、信源的质量和多样性,以及写作的基调。

网站质量:这个网站是否长期发布信源良好、信息量大的文章?

作者的专长:该文章的作者是否曾经就该主题撰写过研究透彻、信息丰富的文章?作者是否专注于该主题,因此可能具有一些专业知识?

来源的质量和多样性:文章中使用了多少超链接信源和直接引用?这些来源的网站评级是什么?

文章基调:文章是以中立的、非观点性的语气写成的,还是带有观点性的情感语言?

Factual 会将这四项指标结合起来,由系统自动为每篇文章创建一个分数,并通过标签呈现给读者。该标签还注明了发布该文章的媒体的政治倾向。

高于 75% 的分数意味着文章写得很好,很可能提供有用的信息。此类文章提供广泛的信源,保持相对中立的语气,并且由在该主题中具有明显专业知识的记者撰写。也就是说,可能仍然存在偏见。

低于 50% 的分数意味着该文章不太可能提供信息。这些文章可能仍然值得一读,但应该与得分更高的文章进行交叉核对。

以《华盛顿邮报》2020 年 2 月 7 日发表的题为「南极洲刚刚达到 65 度,创有史以来最温暖的温度记录」(Antarctica just hit 65 degrees, its warmest temperature ever recorded)、作者为马修·卡普奇(Matthew Cappucci)的文章为例,Factual 将其评分 73%。

Factual 的解释是:

分数:得分 75%以上的文章显示为绿色,50%~75%的文章显示为黄色,50%以下的文章显示为橙色。这篇文章的得分是 73%,信息量适中。

政治倾向:The Factual 援引的是评估新闻媒体政治倾向的 AllSides 和 Media Bias Fact Check 的数据,《华盛顿邮报》被认为是中左派。The Factual 声称,政治倾向指标不会影响事实等级,仅作为故事框架的背景提供。

网站质量:曾经发表过很多高分文章的网站将具有更高的网站质量得分,《华盛顿邮报》正是如此。

作者专业知识:主要看作者历史上发表过的文章是否信息量丰富,以及作者过去就该主题写过多少内容。这篇文章的作者马修·卡普奇之前撰写过大量有关气象学的文章,因此他在这个科学主题方面的专业得分很高。

来源质量:这是衡量文章信源质量和多样性的指标,主要统计文章引用了多少带超链接的信源,以及使用了多少直接引语(至少 5 个词)。这篇文章只有 1 个链接和 4 个引语,在信源质量方面只能是中等。

文章基调:基本中立。

Factual 已经于 2022 年 9 月被雅虎收购,目前已经对 1000 万篇文章进行了评分。不过,Factual 尚未对非英语网站的内容评分,也无法对《华尔街日报》、《彭博社》等有付费墙的媒体内容进行评分。

直接信源:采访

在必要且可能的情况下,我们会鼓励核查员直接联系核查内容的直接当事方或者相关方,以获得直接的证据或者支持性证据。

同样,我们也会根据核查选题,密切关注当事人的公开回应或者有关其本人的一手信息,尤其是这些回应或信息对于验证该说法至关重要。

案例 1:

2021 年 9 月,简体中文社交网络流传一篇文章称,据新加坡《海峡时报》报道,新加坡总理李显龙在一次会议上说,中国战胜美国的唯一前提,就是必须克服自身体制内的「官僚主义」。

核查员检索新加坡《海峡时报》、新加坡总理办公室官网,均无李显龙谈及中国「官僚主义」的报道和内容。

同时,有据核查员还将流传的有关微博和微信链接通过李显龙官方 Facebook 账号发送至其办公室查询,李显龙办公室很快回复称:「你发送的微博链接是虚假新闻。李总理没有说过该文作者在他的帖文中声称的任何信息。」

这一回复也构成了这次核查的决定性证据,可以判断该说法为虚假。(参考阅读:李显龙称中国欲战胜美国必先战胜官僚主义?

案例 2:

2022 年 2 月 10 日,在北京冬奥会男子单人滑的自由滑决赛中,日本选手羽生结弦挑战阿克塞尔四周跳(quadruple Axel,4A)时落地摔倒,以男子单人滑第四名的成绩结束自己的第三届冬奥会。

中文网络流传热搜称「羽生结弦 4A 被国际滑联认定」、「羽生结弦 4A 未被国际滑联认定」等多个热搜,支持和反对的理由也都众说纷纭。认为羽生结弦 4A 未被国际滑联认定的网民认为,他成功完成 4A 动作,旋转周数不足,落冰摔倒。认为羽生结弦 4A 被国际滑联认定的网民和媒体则认为,羽生结弦的小分表上出现了「4A<“的字样,这意味着他的这一跳在国际滑冰联盟的官方赛事——奥运会上被认定为阿克塞尔四周跳。

对于这一颇为专业的问题,有据核查员直接通过邮件联络了国际滑冰联合会(International Skating Union,ISU),国际滑冰联合会的官网上有公开的媒体联络方式。2 月 11 日,国际滑冰联合会回复了我们提出的「国际滑联是否对羽生结弦的阿克塞尔四周跳进行了史上首次认定」的问题称:「根据裁判的详细评分,该跳的旋转度不足,因此未获认定。(According to the detailed Judges scores the jump was under rotated, therefore it was not ratified.)」

鉴于国际滑冰联合会是花样滑冰运动的主管机构和赛事组织、裁判机构,且是传言的直接当事方,因此,国际滑联的明确表态是本次核查的核心所在。我们可以就此判定,羽生结弦 4A 没有被国际滑联认定。(参考阅读:羽生结弦 4A 被国际滑联认定?

案例 3:

2022 年 6 月,中文网络流传说法称,中国机组在巴黎机场受到歧视,因为巴黎戴高乐机场表示,不允许任何机组成员穿成大白模样,否则不允许进入航站楼。

这一流言没有交代任何来源,检索互联网也没有找到戴高乐机场专门针对中国机组的相关规定。此时还有一种可能性不能排除,那就是戴高乐机场确实有类似的针对中国机组的规定,以内部文件或通知的形式发布,没有公布到互联网上。

核查当日为 2022 年 6 月 18 日,正值周日,联系戴高乐机场的公关部门基本不可能及时收到回复。而相比之下,尽管是周日,机场是一定会正常运转的,与机场相关的热线垂询电话也也运转。于是,核查员通过公开的热线电话联系了戴高乐机场所属的巴黎机场集团,工作人员表示,目前巴黎机场与新冠疫情有关的防疫规定已经不再有效,并且强调有关衣着的问题属于「个人自由」,「每个人都可以做他想做的事情」,至于机组人员是否可以穿戴个人防护装备,巴黎机场集团工作人员表示,不同航空公司的具体要求可能会有不同,但巴黎机场方面对此没有任何特别要求。

由此可以判定,所谓「戴高乐机场表示,不允许任何机组成员穿成大白模样,否则不允许进入航站楼」的说法是假的。(参考阅读:巴黎机场禁止中国机组成员穿成大白模样?

案例 4:

比如,中文网络长期流传一段据称是墨西哥作家、诺贝尔文学奖得主帕斯说过的话:「世界上有两民族最可怜,犹太人没国家,中国人没灵魂。两民族,一个 1000 万人,一个至少 13 亿人。1000 万人的民族,几乎每年都有人得诺奖,上市新兴企业数量惊人,这是奇迹;至少 13 亿人的民族,与现代世界最重要思想、科技、艺术等创造几乎无缘,这更是奇迹。」

帕斯 1990 年获得诺贝尔奖,1998 年去世。作为曾经的墨西哥派驻亚洲的外交官,帕斯接触到了日本和中国的诗歌,并表现出特殊的兴趣。

那么,帕斯到底说过这段话吗?

核查员以「Octavio Paz +China/Chinese+jew/jewish」为关键词,结合西班牙语和英语搜索,在帕斯的作品、帕斯的采访、演讲、媒体报道、研究帕斯的论文中均未找到帕斯说过这段话的证据。

同时,我们的核查员采访了帕斯作品的中文译者、北京大学西班牙语语言文学系赵振江教授。赵振江翻译了帕斯的访谈录《批评的激情》、诗集《太阳石》、诗论和文学创作论集《弓与琴》等作品,是国内翻译和研究帕斯的权威。

帕斯向有据表示,他没有见过帕斯这段话,「我只能说,根据帕斯对中国文化比较纯净的感情,我觉得他不会说这种话。……帕斯尤其对中国的老庄很熟悉,而且翻译过很多唐诗宋词,他怎么可能会说中国人没有灵魂?我觉得这个(可能性)不大。」

虽然赵振江教授的内容并非直接的决定性证据,但鉴于他对核查对象的熟悉程度,可以被视为权威信源。(参考阅读:诺贝尔文学奖得主批评「中国人没灵魂」?

在核查实践中,媒体报道是相对容易找到的信源入口,但此时我们依然鼓励核查员根据媒体报道中提到的线索,追根溯源,在可能的情况下,找到更相关的直接来源——包括法律条文、报告、统计、直接引语、新闻发布会的原始记录、当事人社交媒体账号等等。

但是,需要注意的是,推特在 2023 年 4 月 20 日正式取消了蓝色认证标签。长期以来,推特的蓝色认证标签主要面向政府机构、新闻媒体,以及公众知名度较高的用户。然而,推特的新主人马斯克自 2022 年 10 月收购该平台以来,一直表示希望让用户每月付费来获得身份验证。虽然推特公布了新的认证制度,但目前许多正式机构的账号并未认证,这给一些不良行为体创造了假冒了账号的机会。

因此,在进行国际新闻事实核查时,对于可能假冒的推特账号需要加倍小心,可以多留意该账号是否是刚刚才加入推特,粉丝是否相对较少,也可以检查其账号是否在机构的官方网站上有链接。

案例 1:

2021 年 7 月 26 日,东京奥运会男子铁人三项比赛结束后,金牌得主挪威选手 Kristian Blummenfelt 和一些其他选手跪地呕吐,中文网络流传说法称:「铁人三项选手集体呕吐」因为「赛场水中大肠杆菌严重超标」、「铁人三项选手在粪水中游泳」等。

核查这一说法的关键是要搞清楚,东京奥运会铁人三项比赛的水质到底是否符合标准?

首先我们在谷歌中输入一些基本的关键词比如 Tokyo Triathlon water quality,可以发现在过去几年里有关东京奥运会铁人三项游泳开放水域的水质问题确实是一个关注的焦点,不少媒体报道表达了担忧,也有报道称东京奥组委采取了大量措施试图在举办比赛前解决这些问题。但这些偏新闻类的报道都没有直接回答上述问题——东京奥运会铁人三项比赛的水质到底是否符合标准。

换个思路,我们不能仅仅依赖媒体报道,而要尽量找到比较权威的信息、原始出处。

首先要找到的信息是:铁人三项比赛的水质标准是什么。我们在谷歌输入关键词 Triathlon water standard filetype:pdf,第一个搜索结果就是世界铁人三项联盟(World Triathlon)——管理铁人三项运动的国际单项体育组织——官网发布的有关水质问题的技术规定文件:

浏览文件,可以发现世界铁人三项联盟对水质的硬性要求:

游泳比赛水域的水质应进行分开检测,水样应取自游泳水域内三个不同的区域,其中水质检测结果最差的数据将作为决定是否举行游泳比赛的依据。检测结果须符合以下条件方可举行游泳比赛:

海水和过渡水:

-PH 值在 6 至 9 之间;

-每 100 毫升水中肠球菌(Entero-cocci)的含量不超过 100(ufc/100ml);

-每 100 毫升水中大肠杆菌(Escherichiacoli E.Coli)的含量不超过 250(ufc/100ml);

-不含肉眼明显可见的赤潮藻华。

最终的水质有 4 个等级:

2-「水质良好(Good Water Quality)」:大肠杆菌 250-500 或肠球菌 100-200,但是在卫生检验期间没有或潜在的污染或预报有大雨;

3-「水质合格(Fair Water quality)」:大肠杆菌 250-500 或肠球菌 100-200,但是在卫生检验期间有可见的污染且或预测可能有大雨;

4-「水质不合格(Poor Water quality)」:大肠杆菌>500 或肠球菌>200,但是在卫生检验期间有可见的污染且或预测可能有大雨。

至此,我们的第一个问题——铁人三项比赛的水质标准是什么——已经获得了权威信源。

从这一文件上溯,我们在世界铁人三项联盟的官网上翻查,可以发现在 Documents-All documents 项目下,有东京奥运组委会在男女铁人三项赛事赛前举行的技术会的完整文件,这两份文件都是在比赛开始前两天上传到该网站公开的。

其中,针对引起简体中文网络关注的 7 月 26 日男子铁人三项赛的水质报告显示,在肠球菌指标中,有一处取样地数值为 78,其余均小于 10;大肠杆菌指标中一处取样地为 11,一处为 10,其余均小于 10;PH 值也在 6-9 范围内;当地天气预报为晴,无雨;目视污染检测结果为良好。最终水质检测结果为:1 级-水质优良(Level 1: Very Good Water Quality)。

因此,相比其他媒体报道而言,这份男子铁人三项赛的水质报告是决定性证据,足以证实所谓「东京奥运铁人三项选手喝超标粪水导致呕吐」的说法不实。(参考阅读:东京奥运铁人三项选手喝超标粪水呕吐?

案例 2:

2020 年 6 月,希腊华文媒体、国内的门户网站、微博等流传一条消息称,随着当年 6 月 15 日起希腊社会进一步「解封」,政府决定允许当地的妓院重新开张。有关报道声称,虽然政府允许妓院开张,但是要求每位顾客只有 15 分钟的时间来完成他们想要做的一切操作。为了吸引眼球,相关账号纷纷把「15 分钟」这个点放到标题中去:「政府限时每人 15 分钟」、「為防疫每人限啪 15 分」等等。

检索可见,这些中文内容中「限啪 15 分钟」的说法基本上都来自英国小报《每日星报》和塞浦路斯媒体《塞浦路斯邮报》。

事实上,为了迎接这次解封,希腊政府相关部门出台了针对各行业的监管规定,其中就包括针对妓院重开后的严格卫生规定。

查阅这份厚厚的希腊语文件可以发现,页眉部分数字为 24249-24251 的这 3 页,就是有关妓院重开的规定。

然而,文中有关「15 分钟」提法的规定是:要确保性交易场所的通风,性工作者在接待两名顾客之间至少要让有关场所通风 15 分钟。

可见有关说法并非如中文媒体中声称的性行为不能超过 15 分钟,查阅原始文件的重要性可见一斑。(参考阅读:希腊红灯区重新开张,规定每人限时 15 分钟?

案例 3:

2020 年 12 月,中文社交网络上流传消息称,12 月 23 日是决定美国大选进程最关键的一天,因为「这是各州将选举人票认证结果送到参议院认证的最后期限。这一天,副总统彭斯将以参议院议长的身份决定是否否决摇摆州的双重投票或认可一方投票,这将决定川普是否有机会连任。」

检索发现,这一说法应该源于美国保守派《国家档案》(National File)12 月 22 日的一则所谓「独家报道」。该报道称,「特朗普政府的消息人士提供了一份白宫备忘录,根据《美国法典》和《宪法》,副总统彭斯有权力拒绝有争议的选举人团票认证书,但不得晚于 12 月 23 日采取行动。」

那么,「12 月 23 日」这个时间节点到底从何而来?

根据美国法律,美国各州选举人团举行投票后,将进行点票,选举人要签署证明结果的证书。这些证书将与州长办公室提供的公示该州投票总数的证书相配。这些证书将被寄给担任参议院议长的副总统迈克·彭斯、联邦纪事办公室(Office of the Federal Register)、各州州务卿,以及选举人会面地点所在的联邦地方法院的首席法官。

检索《美国法典》的条款发现,如果一个州没有将其选举人团的投票认证成功递交给兼任参议院议长的美国副总统或美国联邦档案总监(Archivist of the United States),那么副总统或联邦档案总监「应该要求」该州的州务卿「以现有的最快捷的方法」将投票认证寄出。

原文如下:

§12.选举人证书未能送达参议院议长或美国联邦档案总监;要求州提供证书。

如果在选举人会议举行后,12 月的第四个星期三之前,参议院议长或美国联邦档案总监没有收到一个州提交的本卷第 9 节和第 11 节所述的投票认证证书和名单,则参议院议长或美国联邦档案总监应该要求该州的州务卿,以现有的最快捷的方法,将该州选举人提交给他的证书和名单送来。他有责任在收到这种要求后,立即以挂号信函的方式将证书和名单提交给参议院议长。

从原始法条可以看出,该条款并没有赋予副总统拒绝各州认证投票的权力。它只是说,如果各州未能按时提交选举人团的投票认证证书,副总统应该努力加快这一进程。2020 年 12 月的第四个星期三是 12 月 23 日,核查时(12 月 25 日)时间已过,公开信息显示,彭斯并没有上述举动。(参考阅读:美国副总统彭斯有权拒绝选举人团的投票?

案例 4:

2023 年 3 月,微博等平台流传说法称:「美对中国开始明抢了。有一种 21 世纪的抢劫行为,叫对中企国际业务追缴税款。这种明火执杖的抢钱行为,美国人是说得出口,做得出来的。美国财政部长珍妮特·耶伦承诺,要对在国际市场上经营业务的中国企业追缴 15%的国际业务税款。」

该说法的原始消息来源——俄罗斯卫星通讯社称耶伦的这些话出自“在国会的发言中”。

检索关键词 Yellen Congress,可以发现耶伦 3 月 10 日出席了美国众议院筹款委员会听证会。

这时我们想了解的是,耶伦到底在听证会上说了些什么?这时候一个非常有用的来源是 C-Span,C-Span 是英文 Cable-Satellite Public Affairs Network 的缩写,是一个非官方的政治性电视广播节目,创办于 1979 年,最开始的时候只有一个频道,获准实况转播众议院的开会现场,后来在 1986 年增开了 C-Span2,在参议院会议厅的二楼旁听席装上了摄像机,开始实时播放参议院的会议情况。

在 C-Span 的网站 c-span.org 上,不仅有国会参众两院会议的完整记录,还包括白宫、最高法院等机构的演讲、致辞、新闻发布会、听证会、辩论的记录。C-Span 视频库是自 1987 年以来在 C-Span 上播出的所有节目的存档。除了视频外,还支持关键词检索文字实录。

就此选题而言,在美国公共事务有线电视网 C-SPAN 的网站上可以查阅这次听证会的完整视频和文字记录,在文字记录中选择 Janet Yellen 并输入关键词「15%」,可以发现耶伦在听证会第 44 分钟时提到了「15%」以及「中国」,可以查证其上下文语境和背景。(参考阅读:美国财长要追缴中国企业 15%税款?

案例 5:

2022 年 3 月 13 日开始,中文网络疯传「加拿大顶级狙击手瓦力,赴乌克兰参战不到 20 分钟,还没找到狙击位置,就被俄罗斯击毙!落地成盒!」「那个加拿大神一样的狙击手,在上场二十分钟后,被无人机火力覆盖,落地成盒,凉了。」「最搞笑的是那个加拿大杯吹上天的狙击手,也在这次袭击(3 月 13 日,俄罗斯国防部声称,当天俄军高精度远程武器打击了乌克兰武装力量在斯塔利奇村和亚沃洛夫斯基训练场的训练中心,多达 180 名外国雇佣军和一大批外国武器被摧毁。——注)中挂了“。

检索加拿大、乌克兰和国际媒体,都只有瓦力本人在抵达乌克兰之前接受采访的内容,并无他在乌克兰的相关内容,推特上也有传说他阵亡的消息,但都没有提供任何可靠的证据。

继续检索加拿大媒体,可以发现有媒体在报道中链接了瓦力本人的 Facebook 主页,进入后可以发现,瓦力此行一直在自己的 Facebook 主页上更新进入乌克兰的所见所闻和最新动态,而且更新频繁,基本上两天一更,甚至一天多更。但是,核查时(3 月 14 日白天)发现,他的 Facebook 最新的一个帖子停留在 3 月 13 日。由此可以判断,瓦力是社交媒体活跃分子,且此行相对高调,如果他还活着,很有可能注意到社交媒体上关于他死亡的消息,并且很可能作出回应。一旦作出回应,即是证明他是死是或的关键证据。

于是核查员密切关注瓦力的 Facebook 主页,定时刷新,以跟踪其本人是否现身。果然,几小时后,他在北京时间 3 月 14 日晚 8 时左右更新 Facebook 称:「不要担心我的问题。我已经远离了昨天被轰炸的基地。我以前也去过那里,但很短暂。该基地有外国志愿兵。那些死去的人可能从未见过俄罗斯士兵。这就是现代战争。很脏,不近人情。」(参考阅读:加拿大顶级狙击手刚到乌克兰就被俄军击毙?

案例 6:

2022 年 2 月 8 日,谷爱凌获得北京冬奥会自由式滑雪女子大跳台项目的金牌后,中文网络疯传谷爱凌父亲是谷歌 5 号员工 Ray Sidney。此前的 2 月 5 日,Ray Sidney 添加了新的 Facebook 头像,修改为他和谷爱凌小时候的合照,谷爱凌的妈妈也为此点赞。这一细节也成为传言中的有力「证据」。

然而,要证实或证伪这一说法相当困难,因公开的资料中并无足够的第三方信息。在此情况下,只有当事人自己的说法才能成为进一步的证据,但当时就此话题直接采访当事的三方显然不太现实。核查员观察到,Ray Sidney 的 Facebook 更新比较频繁,推测他会经常浏览社交网络,应该会注意到有关他和谷爱凌关系的传言,甚至有可能作出某种回应。

于是,核查员密切关注和刷新他的 Facebook 主页。果然,北京时间 2 月 8 日晚 23 点 54 分,Ray Sidney 在 Facebook 上回复了一位用户关于「谷爱凌暗地里是你的孩子?」的问题:「也许我应该澄清一下:谷燕(谷爱凌的妈妈)和我曾经约会了几年。我认识谷爱凌已经很多年了,我为她在雪场内外所取得的成就感到非常自豪。我是在谷爱凌出生后的某个时候,才认识谷燕的。」(参考阅读:谷爱凌父亲是谷歌 5 号员工?

就有据的国际新闻事实核查实践而言,媒体报道依然是事实核查员进行研究时最常用的第一入口。

我们要依然重视主流媒体,尤其是在国际新闻方面。大多数国家/地区的全国性媒体都配备了充足的记者,而且编辑过程非常重视准确性,有明确的、经过验证的内控机制。

所以,尽管一名合格的事实核查员不会把这些媒体上的内容想当然地认为是事实,但是,同样地,任何不承认《纽约时报》或路透社比普通媒体更重要的人在评估信息方面的效率都会降低。我们必须学会识别核查内容涉及的国家/地区的主要媒体,以便更快地评估信息。

我们会尽量寻找接近事件发生地的媒体。在发生恐怖袭击、战争、自然灾害等事件时,当地媒体或在当地有特派记者或驻地记者的国际媒体始终应该是首选信源,因为他们更有可能亲眼目击当地所发生的一切,并且对该地区的历史、文化、政治、经济、社会情况已经有充分了解和积累。

比如,2020 年 12 月,微博和微信群流传消息称,美国当选总统拜登提名的贸易代表人选 Katherine Tai(戴琪)是原国民党军统负责人戴笠的曾孙女。

当时,我们援引了台湾《联合报》的报道,报道指戴琪的父亲名叫戴元亨,母亲为李钟渝,两人皆来自于台湾。《联合报》记者还联系到李钟渝本人。(参考阅读:拜登提名的贸易代表是戴笠的曾孙女?

作为台湾在地媒体,《联合报》在该话题上的可信度显然较高。

在使用媒体信源时,我们要比较多个媒体来源。如果一家新闻机构说「我们可以确认某某事已经发生」,请同时注意其他媒体的说法。因为在理想情况下,我们可以对这些信息进行三角测量并获得一定的真相。当来源是某家媒体自我声称的独家报道时,应该对此保持警惕,这并不是说独家新闻是不可靠的,而是需要考量更多因素和旁证。

一个小问题:《每日邮报》是可靠信源吗?

《每日邮报》(Daily Mail)是英国发行量最大的报纸,其网络版邮报在线(Mail Online)更是流量巨头,来自《每日邮报》的内容在简体中文互联网流传很广。那么,《每日邮报》是可靠信源吗?

2017 年 2 月,维基百科的编辑们把《每日邮报》归入「基本不可靠消息来源」,除非特殊情况,在编辑维基百科英文条目时禁止作为消息来源引用、链接,编辑们称此举的理由是鉴于《每日邮报》「核查事实不力、耸人听闻和纯粹编造」的名声。维基百科对消息来源的取舍「基于常识和谨慎」,但对纸媒或网媒下禁令很罕见,此举也引发争议。维基百科编辑中也有反对禁用《每日邮报》,他们认为这份报纸有时候还是可靠的,从历史上看表现也不是一直很糟糕,而且比它更不可靠的出版物也有,而且一些权威刊物也曾发表过不确切消息。

在有据的国际新闻事实核查实践中,会经常遇到涉及《每日邮报》的搜索结果和报道,我们的处理原则是,不一概而论,而是就事论事,进行交叉比对。如果同一个内容有比《每日邮报》更优质的媒体信源或者原始来源,则援引后者。如果流传的说法是《每日邮报》的独家新闻,则须十分谨慎。

目前国内有一批企业信息查询平台,如天眼查、企查查、启信宝等等,整合了大量工商信息、司法诉讼、知识产权、股权结构等多维度信息,部分功能可以免费使用,在查询涉及国内企业的内容时比较有用。

比如,2021 年 10 月,美国海军「康涅狄格」号核潜艇在南海撞上不明物体后,中文网络流传消息称,「法新社报道,中国南海养殖渔业有限公司 5 万斤黄花鱼的养殖箱被不明物体碰撞,造成约 5 万斤黄花鱼及海洋养殖产品脱逃,造成公司 4 亿多人民币的损失。」

除了其他的众多核查维度外,传言中提及的「中国南海养殖渔业有限公司」也是重要一环,这是一家什么样的公司?主要从事什么业务?公司有没有发布相关的信息?

我们通过天眼查检索企业名字,但是结果显示没有名为「中国南海养殖渔业有限公司」的公司。

近似的结果是「中国南海渔业集团有限公司」,注册在香港,成立于 2015 年,但该公司没有详细信息,也没有该公司在南海部署养殖箱的公开记录。

还有一家「南海养殖有限公司」,注册于香港,成立于 2009 年。不过该公司是一家食品经销商,没有海上养殖场。

由此,至少传言中的涉事主体已经存疑。(参考阅读:美军核潜艇在南海撞上黄花鱼养殖箱?

Our World in Data

重点关注诸如人口、贫困、健康、食物、能源、环境、气候变化、战争、、不平等之类的全球重大问题,使用数据、交互式图表和地图来呈现研究结果,可以在主页搜索不同的主题。

其数据有四个主要来源:

1.专业机构——如奥斯陆和平研究所 (PRIO)

2.研究文章——如 Bourguignon & Morrison (2002)——《美国经济评论》中的“世界公民之间的不平等:1820-1992”。

3.国际机构或统计机构——如经合组织、世界银行和联合国机构。

4.来自政府来源的官方数据——例如, 新冠疫苗接种和检测数据集汇集了全球政府和卫生部发布的最新官方数据。

在每个可视化产品中,该网站都清楚地指出了所呈现数据的来源,如果对合并数据源或对原始数据集进行更改(如区域聚合、人均转换等),也会注明。

该网站上的可视化内容和文本已根据 CC BY 获得许可,可以出于任何目的自由使用。网站上的数据也都可供下载。

Statista

Statista 是一家研究型数据统计公司,2007 年成立于德国汉堡,提供统计和调查数据与资料,目前有超过 200 万项数据统计,覆盖了全球主要的国家和经济体。Statista 拥有超过 22,500 个数据源,包括: 政府机构(各部委,部门,统计机构等)、国际组织、期刊和出版物、市场研究机构、科研机构等。Statista 会把所有信息可视化,每一张 Statista 图表均标注了其数据来源。

在有据的国际新闻事实核查实践中,有公信力的国际组织是最重要的信源,这些组织一般被认为相对中立且拥有权威资源。

比如联合国、联合国教科文组织、经合组织、世界银行、国际货币基金组织的相关网站,在涉及全球政治、经济、社会、文化方面,有大量完备、公开、免费的报告、调查、数据、法律、发言稿等材料。在有关新冠疫情方面,世界卫生组织(WHO)则是最重要的信源。

世界卫生组织、联合国等官网上,不少重要的文件、决议等都有不同的语言版本,包括中文版本,而且这些中文版本都符合国际组织严谨的翻译标准,可以很好地弥补核查员在翻译过程中可能造成的误解和信息流失问题,尤其是涉及法律、专有名词、国际关系等方面。

此外,在一些专业领域,某些国家的机构也被认为是权威信源,比如美国疾病预防控制中心(CDC)、食品药品管理局(FDA)、美国宇航局(NASA)等。

比如,2022 年 5 月底,第 75 届世界卫生大会刚刚闭幕,中文互联网流传说法称,会议修订的《国际卫生条例》将赋予世卫组织一系列强大的强制权力,包括拥有借疫情名义惩戒各国的能力。

检索 International Health Regulations,可以发现有不少的媒体报道,既包括美国保守派媒体称「世卫组织将通过条例修正案夺取各国医疗卫生决定主权」,也包括通讯社对于这次大会以及《国际卫生条例》修订的一般性报道。

我们可以通过阅读这些报道,快速了解有关事件、说法的背景。然后根据报道中提到的关键词检索,可以找到在世界卫生组织的官网上公开的修正案全文。(参考阅读:世卫修订《国际卫生条例》干涉各国内政?

在某一领域具有深厚积淀的研究机构、智库等,也是信源的重要来源。需要注意的是,这些机构最好具有独立性,不为利益集团代言。

案例 1:

2020 年美国大选投票结束后,有微信公众号声称,白宫宣布国家紧急状态,启动了针对国内恐怖主义之战,特朗普欲学林肯引 1807 年法案对抗「政变」。

确实,2020 年 11 月 12 日,白宫官网发布了特朗普署名的「关于继续维持有关大规模杀伤性武器扩散的国家紧急状态」的通告。

那么,到底什么是美国的国家紧急状态?美国总统是否有权宣布国家进入紧急状态?美国历届总统共宣布了多少次国家紧急状态?特朗普发布这一通告的时机是为应对选情失败而特意挑选的吗?

针对这些专业性极强的问题,核查员可以求助于专门的研究机构。比如在这一核查中,核查员就研究并援引了美国法律和公共政策研究机构布伦南司法研究中心(Brennan Center for Justice)的数据,自《国家紧急状态法》颁布以来,截至 2020 年 10 月 5 日,美国历届总统共宣布了 68 次国家紧急状态,其中 39 次国家紧急状态依然有效,持续时间最长的是 1979 年 11 月 14 日因人质危机对伊朗政府资产实施的制裁。(参考阅读:想翻盘,特朗普宣布进入国家紧急状态?

案例 2:

2020 年 11 月,有微博账号发文称,截至 11 月 4 日,美国大选注册选民 1.4 多亿人,目前特朗普 7300 万票,拜登 8000 万票,两者相加约 1.53 亿选票,比大选最后一天注册选民人数多 1000 万人,潜台词是投票率已超 100%。

要厘清这一问题,显然最关键的是要获得美国注册选民人数。美国法律规定,符合投票资格的选民(eligible voters)必须首先是年龄在 18 岁或以上的公民。但是美国没有全国性的合格选民名册。

这时我们援引的是美国佛罗里达大学「独立数据分析项目」(U.S. Elections Project)的数据:2020 年,美国有约 2.392 亿符合投票资格的选民。(参考阅读:美国大选总票数已反超注册选民数?

科学界公认的高质量学术期刊也是重要的高质量信源,比如《科学》(Science)、《自然》(Nature)、《细胞》(Cell)、《柳叶刀》(The Lancet)、《新英格兰医学杂志》(The New England Journal of Medicine,NEJM)、《美国医学会杂志》( The Journal of the American Medical Association,JAMA)、《英国医学期刊》(British Medical Journal,BMJ)等。

这些经过同行评议的学术期刊通常是寻找可信内容的好地方,尤其是涉及科学的主题。同行评议(peer review)是研究论文正式发表前的必要步骤,由多名匿名的同行对文章进行评审,再给出接受(accept),修改后接受(minor or major revision),或拒绝发表(reject)的意见。虽然同行评议流程有时遭到非议,也有其局限性,但它依然是保障期刊质量的公认标准。

在评估期刊和作者可信度时,可以参考几个维度:

该期刊是否已在学术数据库中被编入索引?

该期刊曾经不得不撤回很多文章吗?

期刊网站上关于版权和同行评议的政策是否清晰可见?

是否有可靠的「关于」页面详细说明他们发表的文章类型?

文章作者是否发表过其他文章?一个快速的谷歌学术搜索就会告诉你。

作者是否被其他学者引用过?Google Scholar 还有一个名为「Cited By」的功能,可以显示作者被引用的位置。大量的「被引用」结果通常可以衡量可信度。

但是,在一些特殊情况下,如新冠大流行期间,科学家和专业人士对于新冠病毒病毒的认知和研究是不断进步的,因此也出现了一些后来被证明是错误的或者是有缺陷的研究,以至于有些论文被从影响力很大的期刊上撤回了。

同时,警惕仅用来推广某个观点的期刊。还有一些期刊看起来很正规和可靠,但实际上付费就可以在这些期刊上刊登论文,导致其实际上是低质量的。

此外,在新冠病毒大流行期间,预印本(Preprint)论文非常流行。预印本是一份研究论文的完整草稿,在进行同行评审之前与公众分享。预印本可经过简单的编辑或筛选,但它们通常并未进行排版或内嵌到完整的网页中。在当今的学术出版领域,通常会给预印本分配一个数字对象标识符(DOI),以便其他研究论文对其进行引用。

比如 medRxiv,是由非营利研究和教育机构冷泉港实验室(The Cold Spring Harbor Laboratory,CSHL)、BMJ 出版集团(英国医学会下属专业医学出版机构,British Medical Journal)和耶鲁大学联合运营的免费的、非营利性服务平台。

从积极的角度看,预印本极大地提高了科学领域的知识管理和共享的速度,但预印本文章可能仍然包含错误,并且经常只经过有限的科学审查。在大流行期间,一些预印本论文甚至成为虚假信息的来源。因此,核查员对此必须非常小心。medRxiv 平台一般也会在论文标题下注明,此论文未经同行评议,可能包含错误,其结论未被科学界认可,不应作为临床实践的指导。

相对而言,一般的大众媒体对科学问题没有深入研究,对某些试验结果的报道也不全面,他们一般会夸大某些方面,例如某种新药刚刚完成一期试验就会被说成对一种疾病治疗的重大「新发现」。同样,大众媒体的报道也不太会涉及科学工作的方法和误差程度。所以对于科学领域的核查,一般来说,大众媒体的来源不是最佳信源。

但是,事实核查员可以从更加容易检索的大众媒体获得有关科学研究的信息入口,比如关于一项试验的主要负责人的姓名和工作单位名称,然后利用这些信息去查找这项研究的原始报告或论文,或者直接联系研究人员,并且最终在核查报告中加以引用,而不是直接引用大众媒体的报道。

当然,学术期刊也不仅仅指的是医学、物理、天文等自然科学类的学术期刊,也包括政治、经济、国际关系等社会科学类的期刊,其中的内容在进行国际新闻事实核查时也会频繁用到。

案例 1:

2022 年 4 月 27 日,中文媒体和网络流传说法:「德国最新临床研究:辉瑞 mRNA 疫苗可能引发自身免疫性肝炎」,引起极大关注,不少受众看到这一标题和微博热搜后开始质疑辉瑞 mRNA 疫苗是否可靠。有关的说法援引了一份发布在专业期刊《肝病学杂志》(Journal of Hepatology)上的论文,来自德国的这项临床研究披露了一起接种 2 剂辉瑞 mRNA 疫苗出现的急性肝炎的双峰发作(两次接种后均发作)。

有据核查员通过《肝病学杂志》上的论文署名页,直接联系到研究参与者、论文通讯作者——德国弗莱堡大学医学中心的伯特伦·本格希(Bertram Bengsch)博士,就有关研究的来龙去脉进行了详尽的访谈。

本格希博士不仅解释了研究成果,还提到了欧洲药品管理局药物警戒风险评估委员会的评估:现有证据不支持新冠 mRNA 疫苗与非常罕见的自身免疫性肝炎病例之间存在因果关系。

他在访问中还明确表示,疫苗接种的好处基本上会超过这些罕见的副作用,由病毒诱发的严重疾病的发生率肯定比接种疫苗后极少发生的严重肝炎的威胁更大,接种疫苗对个体和整个社会系统的好处肯定要大得多。

因此,就本案例而言,没有比研究当事人更坚实和更有说服力的信源了。(参考阅读:辉瑞 mRNA 疫苗引发自身免疫性肝炎?

案例 2:

2023 年 3 月,中文网络流传说法称,在中国领导人访俄之前,俄罗斯总统普京在俄罗斯的超前发展区给予中国投资者三大特权,其中之一是,在俄投资的中国企业可以享受「治外法权」的保护,意思就是不受俄罗斯境内的法规和管理体系制约,完全可以根据中国的规矩来往。

对于这个说法,我们首先厘出几个核查点:

1.什么是治外法权?虽然中国读者对这个词并不陌生,但其准确定义是什么?

2.俄罗斯的超前发展区是什么?

3.涉及超前发展区的法律规定是什么?其中是否涉及给中国投资者的治外法权?

对于第一个问题,有关「治外法权」的解释,中英文的来源林林总总,既包括教科书,也包括各种研究论文和官方表述。经过比较,我们可以选择来自《中国大百科全书》作为信源,该书的「治外法权」条目由中国政法大学国际法学院的杨凯撰写:

「『治外法权』(extraterritoriality)在当下有两种含义,一种是现实意义上的治外法权,另一种是历史意义上的『治外法权』。

现实意义上的治外法权,可理解为在一国的外国人不受所在国司法管辖的特权,即『外交豁免权』。具体而言是指部分外国人,依据双边条约和国际法的规定,免除驻在国的司法管辖,使其个人及家人不受当地的民事及刑事诉讼,不会遭受逮捕,其住所及财产不受侵犯,并且免征税款。外交豁免权通常由一国元首、使领馆官员、联合国官员等享有。享有外交豁免不等于不受制裁,若该类人在一国境内犯有罪行,该国可宣称该人为『不受欢迎的人』并予以驱逐。总体而言,现实意义上的治外法权是建立在双方平等互利基础上的国际法基本原则。

历史意义上的『治外法权』,最初同时表达『管辖外国人的法权』之属地主义和『治域之外的法权』之属人主义两层意思,例如:外国人在中国所犯罪行不受中国管辖,也被称为『领事裁判权』。该项权利源自近代以来列强同中国签订的一系列不平等条约,完全违背现代国际法平等互惠的基本宗旨。在中国近现代史上,治外法权的内涵和外延被各国随意扩大,使得外国人不遵守中国法律的情况十分严重,各国租界也成为实际上的国中之国,严重破坏了中国的司法主权。中国人民在反抗外来侵略、争取民族解放的过程中,逐步收回了治外法权。历史意义上的『治外法权』严重违反国际法基本原则,已经为国际社会所废止。「

对于第 2、3 问题,初步检索发现,涉及俄罗斯超前发展区的信息不少,但大多数是碎片化的新闻报道。

此时我们可以检索相关的研究论文,经过比较,我们发现两篇论文提供了比较重要的信息:俄罗斯科学院远东研究所高级研究员Л. В.诺沃肖洛娃的论文《俄罗斯远东超前发展区现状及特点》(《西伯利亚研究》2018 年第五期),其中涉及对超前发展区的来龙去脉和基本现状的介绍。

法律部分,黑龙江大学《俄罗斯学刊》主编靳会新的论文《对《俄罗斯社会经济超前发展区联邦法》及相关法律的解读》(俄罗斯学刊, 2015, (06): 51-56),介绍了超前发展区的建立涉及修改民事、城市建设、劳动、土地、森林等联邦法律的具体情况,列出了所有涉及到的需要修改的 22 条法律的名称。

相关内容显示,俄罗斯为了建设超前发展区而对部分俄联邦法律进行修订,并不涉及给予中国人或外国公民治外法权。

对有关论文内容的引述,提高了核查效率,避免了因为语言(俄语)、专业知识(涉及法律专业领域)方面的欠缺导致的不准确。(参考阅读:俄罗斯向中国人授予治外法权?

常用的英文文献工具包括:

常用的中文文献工具包括:

维基百科是维基媒体基金会运营的一个多语言的网络百科全书,并以创建和维护作为开放式协同合作项目,目前是全球网络上最大且最受大众欢迎的参考工具书。

维基百科在中立性、可靠性方面已经制定了严格的政策,这意味着很多维基百科页面的内容实际上相当可靠。对于事实核查员来说,维基百科是一个非常重要且高效的工具。如果正在核查一个复杂的问题,维基百科词条下面引用的参考资料(References)和外部链接(External links)会是一个很好的入口,可以提供有用的线索并节省大量时间。

但因为维基百科具有自由编辑的特性,对事实核查员来说,一般不能将其作为最终的可靠信源来直接引用,尤其是那些涉及有争议的主题或不断发展的事件的词条。就有据而言,我们一般不在核查报告中出现「据维基百科」的字样。

中文维基百科尤其需要警惕,其词条解释有时会引用有公信力的媒体来源,但有时也会引用普通用户生成的内容(如百度百家号)。

案例 1:

2022 年 6 月,中文维基百科编辑者「折毛」伪造古俄罗斯历史相关条目的行为被揭露。「折毛」自 2019 年 6 月在维基百科注册以来,在中文维基百科上创建了 206 个条目,进行了 4800 次编辑,写下上百万字,主要涉及古俄罗斯历史相关条目,内容主要关于中世纪斯拉夫国家间的政治交互。

这是折毛在伪造条目「鞑靼大起义」中绘制的形势地图,该图片不反映真实历史信息:

案例 2:

2021 年 8 月,塔利班夺取阿富汗政权,中文社交网络流传说法称,阿富汗副总统萨利赫拼死抵抗塔利班的重要原因之一是他「唯一的妹妹遭塔利班残酷迫害致死」。

微博上流传的说法称,萨利赫是在去年「接受《时代周刊》专访时」提到妹妹的事情。

经检索,萨利赫于 2020 年 2 月就职副总统后,在美国《时代周刊》(Time)发表了一篇署名文章,题为《我曾与塔利班战斗。现在,我准备好在选票箱与他们相遇》,其中一段文字讲述了 1996 年塔利班对他的姐姐和其他家人施以酷刑、强迫结婚等行径:「……几天后,恐怖降临到我身边。塔利班正发动对我的追捕,因我曾与之战斗数年。他们找到了我的姐姐玛丽姆,当时已五十多岁,殴打并残酷折磨她,试图强逼她透露我身处何处。姐姐拒绝这么做。接着,塔利班回到她住的社区,要求她将女儿们嫁给那些武装分子。最终她们成功摆脱了塔利班的控制,一起逃离了这座城市。我的姐姐一直挣扎在这段回忆中,直到 2016 年去世。」

那么,相关信息是如何被污染加工的?

2021 年 8 月 17 日,法新社报道了萨利赫誓言抵抗塔利班的新闻,其中提到 1996 年塔利班为追捕他而迫害其姐姐的事情,与《时代周刊》上的文章保持一致。

随后,英文维基百科的用户 Ominae 在修改萨利赫的词条时,尽管援引了法新社的报道,却将此表述为他有一个 sister(姐姐或妹妹)被塔利班武装人员折磨致死:

中文维基百科上萨利赫的词条延续了上述英文维基百科的错误。随后,有用户在修改过程中进一步将「萨利赫有一个妹妹……被塔利班武装分子折磨致死」改为「她惨遭塔利班武装分子奸杀」:

最终,微博平台上流传的说法是萨利赫「唯一的妹妹」被塔利班「折磨致死」或「残暴奸杀」,与萨利赫在《时代周刊》的自述相比,存在重大差异。

核查时,中英文维基百科已修正上述虚假信息:

(参考阅读:坚持抵抗的阿富汗副总统妹妹曾遭塔利班虐杀?

[事实核查] 图片反向搜索核查工具汇总,检测 AI 生成图像的真实性实战指南

DUN.IM BLOG

DUN.IM BLOG

在中文社交上,单纯以文字形式流传的虚假信息从比例上越来越少,以图片、截图形式流传的可疑信息则越来越多。

究其原因,一是「有图有真相」的观念深入人心,网络传言往往会附上图片来增加内容的可信度;二是图片形式更容易在群、朋友圈、微博等社交网络平台传播。

结果,有很多图片被抽离原有的背景和时间线流传,让受众对于该图片产生完全不同的认识和理解。还有的图片被软件加工篡改,完全改变了原有的意义。

因此,使用图片反向搜索(Reverse Image Search)工具,追溯图片的来源,在此基础上检查图片是否被修改或者挪用,是事实核查员最常处理的工作。

目前比较常用的图片反向搜索工具有谷歌、Yandex、Bing、TinEye、百度等,其中以前四个最为常用,各有优势和特点。

谷歌适合大多数基本的反向图像搜索,包括识别照片中的知名人物、查找已在网上大量共享的图像的来源、确定一件艺术品的名称和创作者等等。

使用方法:

1.在电脑上保存要核查的图片,或者复制该图片的网址

2.前往 Google 图片页面(https://images.google.com

3.点击搜索框的相机图标

4.可以选择直接上传图片、拖拽图片或粘贴图片的链接

比如核查以下图片(LIBKOS/AP):

在搜索结果中,可以看到页面右侧「图片匹配结果」中有两张完全一致的图片,点击图片即可找到这张图片的详细说明,包括时间、地点和拍摄者。

点击「查找图片来源」的选项,可以查看所有包含此图片的网页,从中选择可靠的信源,找到图片的详细说明:

还可以点击搜索框的「工具」按钮,进一步收窄搜索结果的范围,可以选择「按图片搜索」、「外观相似」或「更多尺寸」。

「工具」还有「时间」选项,可以选择从「过去 1 小时内」到「过去 1 年内」不同的时间范围,也可以自定义范围。通过这种设置,可以更容易找到图片初次发布的网页。

如果希望进一步搜索图片的局部,谷歌提供了裁剪工具,图片的四个圆角是可以移动的,用来调整搜图的范围,页面右侧会实时展示对裁剪后的画面进行图片搜素的结果。

对核查员来说,有时要核查的图片画面非常复杂,但有效信息只有其中的一部分,这时候裁剪功能就非常有用。

如果使用谷歌 Chrome 浏览器,可以直接在需要核查的图片上点击右键,选择「使用 Google 搜索图片」,搜索结果会在页面右侧显示。

也可以在页面空白处点击右键,选择「使用 Google 搜索图片」,页面会出现「选择要搜索的图片区域」的提示和截图用的图标,可以任意选择要搜索的图片区域,有关该区域的图片搜索结果会出现在页面右侧。

识别图片中的文字信息

在谷歌图片的搜索结果页中,点击「文字」按钮,谷歌可以识别图片上的文字信息,并且将其转换成可复制的文本。

这一功能非常实用,核查带有标语、路牌等元素的图片时,可以快速提取其中的文字,然后检索,以可能的线索。尤其是有关文字元素为俄语、阿拉伯语、韩语等语种时,核查员不必担心电脑输入法问题。

比如,查证一张带有俄语的图片(Alexander Ermochenko/Reuters):

在搜索结果中点击「文字」按钮,光标可以在图片上点击并拖动选择任意文字,也可以选择「选择所有文字」,这是页面右侧已经出现了标语上的文本,这时可以有 4 个选项:「复制文字」、「聆听」、「翻译」和「搜索」,可直接进行下一步的操作。选择「翻译」可知,这是俄罗斯在一个名为苏多普拉托夫的地点的征兵广告。

翻译图片中的文字信息

点击「翻译」按钮,谷歌可以直接在图片上将外语文字翻译成中文,可以大致明白图片上外语文字的意思,但受到识别度的限制,并不完整和准确,仅可提供快速的参考。

比如查证这张带有法语的图片(AFP):

在搜索结果中点击「翻译」,可大致知道这次示威的主题是关于养老金改革。

谷歌 lens 的特点是试图识别图像的主题,而非图像本身。不利的一面是,许多匹配项都侧重于图像中的主题。因此,如果图像搜索的主题不太清楚,可能不会获得高质量的结果。

比如搜索这张乌克兰总统泽连斯基的图片(EPA/UKRAINIAN PRESIDENTIAL PRESS SERVICE – HANDOUT):

返回的大部分却是与战术背心有关的结果:

「关于此图像」功能

2023 年 5 月 10 日,谷歌在 I/O 2023 开发者大会上宣布,将在接下来的几个月里添加一种新方法来帮助用户评估图像来源。

通过在搜索中的「About this Image」工具,用户将能够看到重要的背景信息,例如:

该图片和类似图片是什么时候首次被谷歌索引的,

这张图片可能首次出现的地方,

这张图片还出现在了网上的什么地方(例如新闻、社交或事实核查网站)

用户可以有三种方式来使用这一功能:点击 Google 图片搜索结果中的图片上的三个点;在 Google Lens 中使用图片或屏幕截图进行反向搜索;在使用 Google 的移动时,如果在一个页面上遇到想了解更多信息的图片,可以向上滑动。

按照谷歌的计划,2023 年晚些时候,用户还可以在桌面和移动端的 Chrome 浏览器中通过右键点击或长按图片来使用这一功能。

该功能将首先在美国以英语提供。

Yandex是一个俄罗斯的搜索引擎,检索有关俄罗斯、东欧、中亚等地区的内容时特别有优势,因此在俄乌战争期间很有价值。

使用方法:

1.在电脑上保存要核查的图片,或者复制该图片的网址

2.前往 Yandex 图片搜索页面(https://yandex.com/images/

3.点击搜索框的相机图标

4.可以选择直接上传图片、拖拽图片或粘贴图片的链接

5.单击搜索选项以在 Yandex 上查找相关图片。Yandex 将返回具有完全匹配或视觉相似图像的结果,包括使用这些图像的网页列表。

比如,2022 年 3 月 20 日,有微博用户称:「波兰铁路工人中断了与乌克兰的铁路连接,使装有英美武器的火车无法前往乌克兰。」有关博文还附有一张模糊的铁路照片,画面中有两列列车,但是没有显示地点的明显标记。(参考阅读:波兰铁路工人中断与乌克兰铁路连接?

在 Yandex 上反搜这张图片,可以找到大量的匹配结果:

在谷歌上反搜,首先出现的是一大批相似图片:

下拉数页后才能发现匹配的图像:

2023 年 4 月,中文网络流传一段视频,称「歌手席琳·迪翁参加她儿子的婚礼,因为罕见的僵硬人综合症已无法自己站立,看到的画面让人感伤」。

截取视频画面分别在谷歌、Yandex 和 TinEye 上反搜,可以发现,只有 Yandex 返回了包括大量相似图片的搜索结果,并且其中包含有意义的线索。

Yandex 还可以在搜索结果中显示其找到的核查图片的不同尺寸,如果核查的原图比较模糊,此时可以点击并保存更大尺寸的图片,然后继续反搜大尺寸的图片,一般而言可能更接近于找到图片的源头。

同样,Yandex 也具有识别图片中的文字,裁剪图片等与谷歌类似的功能。

案例 1:

2022 年 2 月,俄罗斯进攻乌克兰之前,中文网络广泛流传一张据称是乌克兰少女拿枪乘坐公交车的图片。

图片中,这位女孩头戴米色编织毛线帽,身穿带圆形拉链的黑色高领羽绒服,左手涂蓝色指甲油,右手涂红色指甲油。图片中没有明确可以提示时间、地点的元素。

有关图片被指拍摄于乌克兰,在俄罗斯和俄语区广泛使用的搜索引擎 Yandex 上反搜图片,可以发现该图片自 2020 年起就在俄罗斯社交网络 VK 上广泛流传。

在 VK 上进一步检索,可以发现能够找到的最早版本发布于 2020 年 3 月 27 日,发布者名为「寻找新西伯利亚的你」。从其主页内容看,这是一个寻人账号,slogan 是「连接命运」。账号介绍称:如果你在某个地方看到一个人,但由于某种原因无法接近和认识,那么你可以通过描述你的故事来尝试找到 Ta。

这张照片由名为 Karpov Sasha 的用户拍摄,配文是:「我一路坐在她旁边,我非常喜欢她,但很害怕打招呼。我在寻找你,美女。」

在帖子下方的评论中,一位名为 Ekaterina Gladkikh 的用户称,她就是照片中的女子。

她还在自己的 VK 页面上转发了这个帖子。

根据 Ekaterina Gladkikh 的 Instagram 账号,她是俄罗斯人,目前在新西伯利亚生活,是一位网红。

检索 Gladkikh 的 Instagram 账号,可以发现她在 2020 年 3 月 10 日发布的视频中,左手涂有红色指甲油、右手涂有蓝色指甲油,与网上流传的照片特征一致。

在 Gladkikh 于 2020 年 4 月 8 日发布的照片中,可以看到她穿戴着与网络流传照片中同款的毛线帽、黑色羽绒服,右手也涂有蓝色指甲油。

(参考阅读:乌克兰少女带枪坐公交?

案例 2:

2022 年 5 月,短视频平台抖音出现一批内容几乎一模一样的视频,文案是:「没有国哪有家,俄罗斯进入最困难时期,民众排队存钱救国!」

视频画面多是俄罗斯人在银行、ATM 取款机等处排长队的场景。

核查的关键之处在于找到每张图片的来源。

比如这张图片,使用谷歌和 Bing 都没有找到理想的结果:

使用俄罗斯搜索引擎 Yandex,裁剪截图的文字部分,可以找到一张同类结果:

点开网页发现,使用这张图片的文章发布于 2014 年 12 月 17 日,虽然可以断定此图与 2022 年俄乌局势无关,但是网页没有提供有关这张图片的详细信息,如图片说明、出处等。

不过,与最初的视频截图相比,这个网页上的照片尺寸较大,也更清晰,我们可以把这张大尺寸照片保存下来在 Yandex 上反搜,可以在第二个搜索结果中发现 Getty 图片社的网站包含了这张图片。

点击搜索结果中的 Getty 网站,可以发现该图片由彭博社记者安德烈·鲁达科夫(Andrey Rudakov)拍摄于 2014 年 12 月 17 日,图片说明是:俄罗斯圣彼得堡的一家 M-Video 商店内,顾客排队购买电子物品。在该国自 1998 年以来最严重的货币危机中,人们担心价格会进一步上涨而抢购消费品。

由此这张图片的身世就完全搞清楚了。(参考阅读:俄罗斯全民排队存钱救国?

Bing 是微软旗下的搜索引擎。在首页(bing.com)的搜索框旁边即有图像搜索的图标,可以直接进行反向图片搜索,而不必像谷歌和 Yandex 那样进入二级页面。

使用Bing 图片搜索时,可以将一张或多张图片拖到搜索框中、粘贴图像或 URL、从电脑上传图像,还可以用设备拍照——然后 Bing 将在网络上搜索匹配的图像。

Bing 也具有和谷歌、Yandex 类似的图片裁剪功能,在搜索结果页面点击「视觉搜索」按钮,可以裁剪照片的不同区域并查看实时搜索结果,这对于查找那些具有多个可识别主题的图像来说会非常有用。

Bing 另一特点是在搜索结果页,选择「具有此图像的页面」后,可以选择以「最新」或「最久」来对搜索结果进行排列。此功能与 TinEye 的按时间排序类似。

此外,与谷歌相比,Bing 会尝试识别照片中的不同元素,然后查找包含所有这些元素的图像。

比如,一张停在树旁的古董车的图片会触发包含一棵树和一辆古董车的相关匹配,而谷歌在这种情况下会选择其中一个更强烈的主题并寻找匹配。

TinEye创办于 2008 年,总部位于加拿大多伦多。TinEye 的最大优势是可以对搜索结果进行时间排序。

TinEye 使用图像识别技术来搜索图像,而不是关键字、元数据或水印。当用户提交要搜索的图像时,TinEye 会使用图像识别为其创建一个独特且紧凑的数字签名(「指纹」),然后将此指纹与其索引中的所有其他图像进行比较以查找匹配项。TinEye 会不断爬取网络并将图像添加到其索引库中。

使用方法:

通过单击上传(upload)按钮从电脑上传图像,也可以用拖曳方式把图片拖入搜索框。如果按 URL 搜索,可以把图像的 URL 地址复制并粘贴到搜索框中。

使用 TinEye 搜索图像时,可以通过几种不同的方式对这些结果进行排序和过滤:

最佳匹配(best match):首先显示视觉上最接近被搜索图像的图像。这也是默认的排序选项。

改动最大(most changed):首先显示对搜索图像改动最大的图像(经过大量编辑的图像)。

最大图像(biggest image):首先显示最高分辨率的图像。

最新的图像(newest):首先显示 TinEye 最新发现的图像。

最早的图像(oldest):首先显示 TinEye 最早发现的图像。

能够对搜索结果按照时间排序,是 TinEye 相比其他图片反搜工具的最大优势。对事实核查员来说,这一功能更容易破解挪用旧图片的传言,足以证明那些被形容为新闻的图片实际上已经有数月甚至数年之久。

以下图为例,2022 年 2 月 26 日,俄罗斯对乌克兰开战 2 天后,微信群流传一张据称是战场的新闻照片,两名儿童面对飘扬着乌克兰国旗的装甲车队敬礼,远处硝烟弥漫。

在 TinEye 上输入照片,排序选择 sort by oldest,可以发现出现在 TinEye 搜索结果第一位的是乌克兰网站 Gordonua 的页面,时间是 2016 年。

点击 Gordonua 的网络链接,可以找到 2016 年 3 月 23 日的一张图片与要核查的图片相同。

图片说明称,这是乌克兰国防部在其 Facebook 页面上发布的「战争之子」系列照片中的一张。

因此可以判定,这张图片至少拍摄于 2016 年,与 2022 年的俄乌战争无关。(参考阅读:乌克兰儿童向乌军车队敬礼?

可以在 TinEye 上搜索哪些类型的图像?

文件类型:TinEye 接受各种格式,包括但不限于 JPEG、PNG、GIF、BMP、TIFF 和 WebP 图像。

图像尺寸:最适合使用至少为 300 像素的图像,但也可以接受低至 100 像素的图像。

文件大小:最大为 20M。

为了获得最佳搜索效果,应尽量避免使用有明显水印的图像,因为 TinEye 可能会搜索水印而不是图像本身。

TinEye 的搜索结果会以域名分类,显示包含相关图片的网站;如果想知道搜索图片的版本是否出现在一个特定的网站上,可以在「按域名/集合过滤」(filter by domain/collection)的输入框里输入该网站的网址。TinEye 也会自动设置一些域名分类,主要包括主要的社交媒体平台和媒体,如 Twitter、Reddit、AFP 等。

如果搜索的图片属于图库里含有的图片,会标记为 stock;如果隶属于某一个系列的图片,则会标记为 collection。当 TinEye 确定一个网站已经无法访问时,会默认隐藏该网站的搜索结果。但如果用户对这些匹配结果感兴趣,可以勾选「包括不可用的结果」(include results not available),TinEye 就会显示该网页的存档。

TinEye 还有比较(compare)功能,可以将搜索结果与用于执行搜索的图片进行比较,这在识别裁剪过的、调整过大小的、倾斜过的或 PS 过的图片时非常有用。

但是,有些图像 TinEye 找不到:

大多数社交媒体网站,如 Facebook 和 Instagram,都限制 TinEye 抓取他们的图片。

受密码保护的页面或不可公开访问的页面上的图像。比如,如果要核查的图片最早发布在一个 WhatsApp 群组或微信群里,并且从来没有在网上被分享过,TinEye 就无法找到。

用户个人设备上的个人照片。

一些太小的或简单的图像,可能没有足够的细节让 TinEye 制作「指纹」。

与其他搜索引擎不同,TinEye 只能找到与我们搜索的图像完全匹配的图像(也包括经过裁剪、颜色调整、大小调整、编辑或轻微旋转的图像),但一般来说无法找到相似的图像。

注意:

TinEye 抓取到最旧的图片并不一定是该图片第一次出现在互联网上的日期。因此,TinEye 不能告诉我们一张图片首次出现在互联网上的时间,只能告诉我们 TinEye 首次发现它的时间。

一般而言,核查员在核查图片时会尝试使用多个反搜工具,而最方便的是下载安装 InVID Verification Plugin 插件,该插件集成了多种图片验证功能。

通过 Chrome 或 Firefox 浏览器下载安装插件后,在网页浏览图片时,可以直接右键点击图片,选择 Fake news debunker by InVID by WeVerify,进一步选择 Image Reverse Search-All,即可同时启动谷歌、Yandex、Bing、TinEye 等多种图片反搜工具,并在不同的新窗口展示搜索结果,极大地提高了效率。

另外一种使用方法是进入 InVID 系统。安装 InVID 后,Chrome 浏览器顶部会出现一个启动图标:

点击后选择「打开工具箱」(Open Toolbox)

进入 InVID 界面,选择图片处理(Image),即可看到 6 大功能:

1.图片分析(Image analysis):针对 Twitter 和 Facebook 上的图片,进行详细的数据分析。

输入图片的网址,点击提交,出现有关该图片的信息。

图片 ID、平台、创建时间、图片链接、点赞数、转推数,同时还抓取了推文下面所有的评论并且分类,包括带有链接的回复数。

比如我们分析 SpaceX 的这则推文图片:

2.放大镜(Magnifier):用户可以在图片上使用放大镜功能,以帮助解读和阅读图像中难以看到的细节——比如汽车牌照、飞机侧面的识别号码、徽章、标志、横幅等等。用户可以输入图片的网址,或者使用本地文件按钮(LOAD LOCAL FILE)从本地上传图像。

比如我们可以用放大镜检查这架战斗机涂装上的信息:

然后可以使用图片下方的谷歌、Google Lens、Yandex、Tineye、百度等按钮对图片进行反向搜索,或使用图像取证选项。

该功能还包括图片编辑(点击 EDIT IMAGE),可以对图片进行裁剪、翻转、锐化等。

3.元数据(Metadata):用户可以查看 jpg 和 tiff 格式的图片的 Exif 数据,可以输入图片链接或上传本地图片文件。

Exif (可交换影像档案格式,Exchangeable Image File Format) 档案会储存照片的重要资料,例如设备、曝光值、拍摄时间、地点以及使用的任何设置。每当用户拍摄新的照片时,几乎所有数码相机和智能手机都会建立这些资料档案。

4.取证(Forensic):帮助用户检测图片是否被篡改,比如是否被 Photoshop 软件编辑过。不过,使用者需要极其丰富的图像知识,且结果可能存在误差,所以,一般而言仅能作为参考,而非决定性证据。

5.OCR:可以将图片上的文字内容,智能识别成为可编辑的文本,不过有时无法识别。

6.检查 GIF 图片(CheckGif):可以对比原始图像和被篡改的图像(包括图像被裁剪过的情况),然后生成一个 GIF 并输出,可以更直观地展示篡改行为。不过,该功能目前仅对事实核查员、记者和研究人员开放。

2022 年 7 月 8 日,日本前首相安倍晋三遇刺后,中文网络流传一张照片称,被称为「日本第一女保镖」的石田萌美也在现场,却未能阻止杀手。

石田萌美此前在中文网络被形容为「日本第一女保镖」。她被指曾是安倍晋三最信任的贴身人员之一,因为外型靓丽和身份特殊受到关注。有文章指她是日本顶尖的武功高手,能够在 0.2 秒内拔枪制服袭击者,曾击退 10 名壮汉。

使用图片反搜工具搜索这张照片,可以确定照片本身是真实的,但是因为安倍身边的这位女士戴着口罩,也无其他明显的识别特征,所以依然很难判断她的身份。

这时我们仔细观察这张被指是石田萌美检查安倍伤势的照片,可以发现这位女士外表可供辨认的几大特征:长发束辫,黑色或深蓝色上衣,带有花卉纹样的裙装,低跟皮鞋。

由于安倍遇刺发生在公开场合,且现场媒体众多,因而有利的一面是,有大量现场照片可供检索。在《朝日新闻》网站上的安倍遇刺现场图片集中,我们可以发现大批同一场景的照片,能够较清晰地分辨出这位女士身穿的是一件罩衫,罩衫内是黄色 T 恤。

在美联社转发《读卖新闻》的一张照片中,安倍被送上救护车,救护车旁有一位女士的正面照片,放大后可见其发型、黄色 T 恤和蓝色罩衫、带花纹的裤装、黑色皮鞋,均与网传照片一致,可以判定她与被中文网络认为是石田萌美的那位女士是同一人。

大量现场视频和照片显示,安倍遭到枪击后,一批身穿黄色 T 恤的人员对其进行了心肺复苏等急救。这些人员的黄色 T 恤与这位女士的黄色 T 恤一致,因此,黄色 T 恤成为识别这位女士身份的最关键因素。

核查员用日语在推特、Facebook 平台上搜索「安倍 黄色衣服」关键词,发现有日本网民的推文中提供了线索,指出这是日本看护联盟的工作人员在急救。

据此线索,检索看护联盟的官方网站,了解到看护联盟是代表日本护理行业的组织,而且网站上的照片显示,看护联盟的成员在参加集体活动时一般均着黄色标志色衣服,有护理、急救知识和经验。

再用日语检索「看护联盟 安倍」,可以发现代表日本看护联盟参加众议院选举的友納理緒在有关安倍的讣告中提到,「在这次事件中,现场的看护联盟的各位在混乱中奋力救助」。

照片中的这位女士也穿着统一的黄色 T 恤,因此可以判定,她不可能是石田萌美,也不可能是安倍的保镖。

从这张照片的核查过程来看,以图搜图只是一个起点,更需要根据图片中的各种信息、图片外的各种新闻报道、社交媒体上的线索等等综合研判,得出结论。(参考阅读:安倍遇刺时网红女保镖就在身边?

2021 年 9 月,中文网络流传一张照片称,被加拿大扣押的华为公司首席财务官孟晚舟「困境中不忘支持国货,穿鸿星尔克出庭」,并附上孟晚舟穿运动鞋面带笑容的照片。不过,这双鞋上并无醒目的品牌 logo。

以「Meng Wanzhou+sneaker」为关键词在搜索引擎检索,可以在德国新闻图片社 IMAGO 的网站上发现一组照片,与中文网络流传的照片一致。

该组照片由加拿大新闻社记者 Darryl Dyck 拍摄,图片说明是:2021 年 8 月 6 日,华为公司首席财务官孟晚舟戴着脚踝监视器,穿跑鞋(running shoes)离开温哥华的家,前往位于温哥华的加拿大不列颠哥伦比亚省高等法院参加引渡听证。

此时我们已经找到了图片的来源,但是原图的图片说明中并未指出这双鞋是什么品牌。

不过,搜索结果很有利的一点是,摄影师拍了一组照片,尤其是有一张特写孟晚舟脚踝监视器的照片,孟晚舟的跑鞋也相比网传图片更加清晰。

这时我们使用 Google Lens 搜索这双鞋,因为 Google Lens 不仅可以搜索图片,还会试图提供图片中的信息,比如你扫描一张产品图片,可能会看到购物链接。果然,搜索结果指向了 HOKA 品牌。

核查员还使用了淘宝 APP 的拍照功能,拍下图片上的鞋子,然后淘宝快速识别出相似的结果,也指向了 HOKA 品牌。

据此线索进入 HOKA 官网的网络商店检索,可以发现孟晚舟所穿鞋款品牌为 HOKA ONE ONE,款式为 Clifton 8。

与此同时,核查员还登录了鸿星尔克官方商城、鸿星尔克淘宝旗舰店,没有发现类似商品。鸿星尔克淘宝旗舰店的客服也证实这款鞋子并非鸿星尔克。

由此可以得出结论,这张照片是孟晚舟于 2021 年 8 月 6 日离开住所前往加拿大不列颠哥伦比亚省高等法院参加引渡听证时拍摄的,她脚穿鞋款品牌并非鸿星尔克,而是法国品牌 HOKA ONE ONE。(参考阅读:孟晚舟穿鸿星尔克运动鞋在加拿大出庭?

2022 年 7 月 8 日,日本前首相安倍晋三遇刺后,中文网络流传一张照片,一位日本电视台的男性主播在咧嘴大笑,画面下方是一行日语字幕,可以辨认出与安倍遇刺有关——“安倍晋三元首相死亡確認”。

首先我们先从照片上的信息入手,这张截图的左上角有日文字样「イット」,在谷歌检索,找到节目的官网,可见这是日本富士电视台和富士新闻网(FNN)播放的一档新闻节目,全称为 Live News it!(日语片假名为:ライブ ニュース イット!),于 2019 年 4 月 1 日开播,一般直播时段为每周一至周五下午 3 点 45 分-7 点。

比对节目官网上的主持人形象,可以确认屏幕上的主播名叫榎並大二郎,毕业于庆应大学,2008 年加入富士电视台,从 2020 年 9 月 25 日起开始担任 Live News it!的主播。

这时我们要确认的是,榎並大二郎在播报安倍遇刺后确认死亡的新闻时是否大笑,所以最好要找到有关的节目视频。在 FNN 的 频道检索,可以发现该频道 2022 年 7 月 8 日上传的一则视频与中文流传截图的字幕、主持人衣着、背景均一致:「速报:安倍晋三元首相死亡確認 元海上自衛官に銃撃される」。

不过,在这则时长 44 秒的视频中,榎並大二郎并无大笑的表情。

那这张网传截图中大笑的表情从何而来?P 图能够如此自然吗?

事实上,随着 AI 技术的进步,常见的人脸编辑器或修图应用已经能很轻松地改变照片中的人物表情,比如国外的 FaceApp 和国内的醒图 App。

核查员从榎並大二郎播报安倍遇刺视频中截取照片,试图复现图片中的主持人大笑效果:

在醒图应用中选择「微笑」的特效选项后,应用自动处理完成后展示的效果如下,与网传图片非常接近:

核查至此,得到两个证据:一是检索到主持人播报该条新闻时的完整视频片段,主持人并无大笑;二是核查员使用修图软件,复现了网传图片中的主持人大笑效果。

但是,为了让结论更坚实,我们还就这张图片联络了富士电视台观众中心,工作人员回复查询时表示,当天紧急速报无异常,播报员榎並大二郎没有大笑的行为。

此时我们可以得出结论,主持人当天播报有关新闻时并未大笑。这一核查案例也提醒我们,随着 AI 技术的日益进步,对于图片的识别难度也在增加,必须借助更多信息加以综合研判。(参考阅读:日本主持人播报安倍遇刺时咧嘴大笑?

三星手机的 Space Zoom 功能可以让用户拍摄到美丽的月球图像,但也引发了由此产生的图像是否「真实」的争议。

2023 年 3 月,Reddit 上的一则帖子引发激烈的讨论,该贴清楚地拿出「证据」说明,指责三星的月球照片是「假」的。

Reddit 用户 ibreakphotos 先故意制作了一张模糊的月球照片,将其显示在电脑屏幕上,然后用三星 S23 Ultra 手机拍摄屏幕上这张模糊的月球照片,最终的照片显示了一张清晰的月球照片,增加了一些以前没有的细节。

制作过程:

1.从互联网上下载了这张高分辨率的月球图片

2.将图片尺寸缩小到 170×170 像素并使用高斯模糊,让月球上所有的细节都消失,这意味着它不可恢复,信息不存在,数字模糊

放大 4 倍的版本,以便更好地看清模糊效果:

3.在显示器上全屏显示该图像(尺寸为 170×170 像素,非常模糊),拍摄者移到房间的另一端,关掉所有灯光,开始拍摄

4.手机拍摄效果

5.对比

ibreakphotos 认为,用三星 Galaxy S23 Ultra 拍摄的月球图像,是通过应用「月球纹理」(Moon texture)来伪造的。 这名用户得出的结论是,三星的月球照片是假的,在没有细节的地方添加了细节,大部分工作是 AI 完成的,而不是光学器件。

对于图片造假指控,三星向著名的科技产品评测指南网站 Tom『s Guide回应称:「三星致力于在任何条件下提供最佳的拍照体验。当用户拍摄月亮时,基于 AI 的场景优化技术会识别出月亮是主要拍摄对象,并进行多帧合成,然后 AI 会增强图像质量和颜色细节。它不会对照片应用任何图像叠加(image overlaying)。用户可以关闭基于 AI 的场景优化功能,这将禁用对用户拍摄的照片进行自动细节增强。」

也就是说,三星否认了 Galaxy S23 Ultra 使用基于 AI 的图像叠加技术来增强月亮照片细节的说法。

科技网站 The Verge 就此评论称:「在这种情况下,『假』到底是什么意思?这是一个很难回答的问题,随着计算技术进一步融入摄影过程,这个问题将变得越来越重要和复杂。我们可以肯定地说,我们对照片造假的理解很快就会改变,就像过去对数码相机、Photoshop、Instagram 滤镜等的理解一样。

摄影正在发生变化,我们对什么是『真实照片』的理解也会随之改变。「

AI 图像生成工具在 2023 年呈现出爆发性应用趋势,可以通过利用海量数据库生成无限数量的图像。

Midjourney是一种使用生成 AI 从简单的文本提示创建图像的工具,2023 年 3 月推出了更先进的模型,能够生成更逼真的图像。

Stable Diffusion是一个文字转图片的生成模型,可以只用几秒钟时间就生成比同类技术分辨率、清晰度更高,更具「真实性」或「艺术性」的图片结果。

DALL-E 的出品方 Open AI 旗下的一个模型,接收文本和图像作为输入,以多种形式输出最终转换后的图像。升级版本 DALL-E 2 在生成用户描述的图像时具有更高的分辨率和更低的延迟。

Craiyon AI是一个免费的在线 AI 图片生成器工具,可以根据用户输入的任意文本生成独一无二的视觉艺术作品。

2023 年 3 月,微软 Bing 在线 AI 绘图功能Image Creator上线,由 Open AI 的 DALL-E 驱动,可通过文字描述生成图片内容。Bing 绘图目前仅支持英文,使用「形容词 + 名词 + 动词 + 风格」的格式可以生成高质量图片。每个由图像创建器生成的图像都会在左下角添加 Bing Logo。

Adobe 也在 2023 年 3 月发布了使用人工智能生成图像的新工具Adobe Firefly。Firefly 允许用户通过文字来描述其软件将创建的图像、插图或视频。

英伟达公司也推出了名为「毕加索「的自有服务,该服务使用人工智能技术从文本描述中生成图像、视频和 3D 应用程序。

虽然篡改图片和创建假图像的做法并不新鲜,但 、DALL-E、Stable Diffusion 的 AI 图像生成工具更易于使用。它们可以快速生成具有详细背景的逼真图像,只需来自用户的简单文本提示即可。这些技术如果被不良行为体利用,可能会大幅提高核查难度。

在过去,包括深度伪造(deepfake)在内的造假者会篡改一张已经存在的图片或一段已经存在的视频,此时尚且可以通过图片反搜等方式,追根溯源找到原图来进行核查。

但是,新时代的造假者已经不需要这么做,他们可以使用人工智能 技术,特别是文本生成图像的模型,创建完美支持其虚假叙述的全新图像,制造逼真的假证据。这种图像,无法通过图片反搜的方式直接追根溯源,因为它本身就是源头。

2023 年 3 月,在美国纽约检方可能因一起案件逮捕前总统特朗普之际,开源调查新闻机构 Bellingcat 创始人 Eliot Higgins 在一系列广为流传的推文中,用 Midjourney 工具的最新版本制作了特朗普虚构被捕的大量戏剧性画面。他在推文中明确表示这些图像是 AI 生成的,也说明了自己在 AI 生成过程中发布的指令:「特朗普在被捕过程中摔倒。新闻报道画面。」 随后 AI 给出了这些图片。

虽然推特的资深用户和人工智能爱好者可能第一眼就能认出这些假图片,但也有很多人并没有,甚至会提出疑问:「为什么特朗普被捕没有成为新闻」?在没有关键背景的情况下,这些视觉效果很快就会被其他人转发。一篇 Instagram 帖子分享了 Higgins 的一些特朗普照片,就好像它们是真的一样,获得了超过 79000 个赞。

虽然这些照片存在瑕疵,比如脸和手明显扭曲,警察制服上的文字乱七八糟,一张图片显示特朗普戴着警用腰带,等等。然而,这些线索没有那么简单被觉察,而且在现阶段可以很容易就被 Photoshop,或者一点动态模糊、像素化所掩盖。可以预见的是,随着技术的进步和迭代,这些瑕疵肯定也会消失,比如 Midjourney 的第五代版本已经可以较好地解决手部问题。

2023 年 4 月,德国摄影师鲍里斯·艾达格森(Boris Eldagsen)的黑白肖像摄影作品「电工」(The Electrician)不仅入围「Sony 世界摄影大奖」(Sony World Photography Awards)的创意类别,更获选为冠军,看起来是以传统摄影技术所拍摄的、两名来自不同世代的女性。

不过,艾达格森在 Facebook 发文坦承,这张其实是由 Open AI 的「DALL-E 2」工具生成的图像。事实上,「电工」是艾达格森 2022 年开始创作的「Pseudomnesia」系列作品之一;Pseudomnesia 在拉丁语中指的是「虚假记忆」,包括从未发生过的虚假事件,而不只是不准确的记忆。

艾达格森表示:「这是一个历史性时刻,这是第一张由 AI 生成的图像赢得了一个国际摄影大奖。」他声明称:「我想检验摄影比赛是否已经准备好接受 AI 生成图像。但事实上并没有明确的规定,关于 AI 图像是否合法,该组别允许编辑和合成图像。」

目前核查这些 AI 生成的图像并无非常有效的工具,只能综合各种信息研判。

人工智能创业公司 Hugging Face 开发了一个人工智能图像检测器(AI Image Detector),能检查图像的显著特征,并对图像是自然的还是假造的做出说明。

比如这张特朗普被「逮捕」的 AI 生成图片,检测器判断出 67%的图像是由人工智能创造的。

这张乌克兰总统办公室 3 月 23 日发布的泽连斯基视察赫尔松的真实照片,检测器判断出其 83%的图像是由人而非人工智能创造的。

但是这种检测只能作为一种参考,而无法成为唯一的决定性证据。

图像数据分析公司 Mayachitra 也有一个针对使用 GAN(Generative Adversarial Network,生成对抗网络)技术生成图像的检测工具,目前只有测试版,不过可靠性仍有待提高。

比如这张特朗普被「逮捕」的 AI 生成图片,Mayachitra 工具却认为它「很可能不是使用 GAN 技术生成的」(Probably not GAN generated)。

人工智能公司 Hive Moderation 也有一个AI 生成内容检测工具,既可以检测文字内容,也可以检测图像内容。图像检测方面,可以检测由 DALL-E、Midjourney 和 Stable Diffusion 等流行工具生成的图像。

上传图片后,Hive 的人工智能检测模型会进行处理,以确定图片是否由 AI 生成,然后给出一个分数结果。如果模型认定图片由 AI 生成,结果还会判断这张图片是由哪个引擎创建的。

比如这张火车站老人与孔雀的 AI 生成图片,Hive 判断其 99.9%由 AI 生成,并且是由 Midjourney 生成的。

这张法国总统马克龙官方推特 4 月 7 日发布的访问中国中山大学的图片,Hive 判断其只有 0.5%的可能性是由 AI 生成的。

另一个核查的线索是找到图片首次发布到网上的时间。在某些情况下,最初的创作者可能会明确表示图片是人工智能生成的,并指出使用的工具。反向图像搜索可以帮助查看图片是否已在搜索引擎中编入索引并查找包含相同照片的旧帖子。反向图像搜索也会找到相似的图片,这时可以将潜在的 AI 生成的照片与来自可靠来源的照片进行比较,发现有用的线索。

有时照片本身也隐藏着线索,例如某些 AI 创作工具使用的水印。

例如,DALL-E 会在其所有图像的右下角自动生成一个多色条。

Craiyon 在同一个地方放了一支小红铅笔。

但并非所有人工智能生成的图像都有水印——这些水印可以被移除、裁剪或隐藏。

2023 年 5 月 10 日,谷歌在 I / O 2023 开发者大会上宣布,将确保每一张由谷歌 AI 生成的图像在原始文件中都有一个标记。其他创作者和出版商将能够添加类似的标记,因此用户将能够在 Google 图像搜索结果中看到这些 AI 生成标签。

另外,尽管生成式 AI 取得了长足的进步,但截至 2023 年 3 月,AI 生成的内容中仍然会出现错误,这些缺陷是目前识别 AI 生成图像的重要方式。比如,逼真的手仍然很难生成。AI 图像也很难产生反射,发现人工智能的一个好方法是寻找阴影、镜子、水,也可以放大眼睛,分析瞳孔,因为拍照时通常会有反光。有时图像会出现眼睛大小不一,颜色不同。还可以查看照片的远景,元素离得越远,物体就越模糊、扭曲并且视角不正确。

但是,AI 生成图像的技术绝对会快速进步,这些视觉缺陷也绝对会被弥补。比如,2023 年 3 月月发布的 Midjourney 的最新版本能够描绘出逼真的手部。所以从长远来看,视觉线索也并不可靠。

为了应对深度伪造图像,科技公司、研究人员、新闻机构正在试图建立内容来源和所有权的标准,从源头出发对影像的创造和传播进行全程跟踪。或许未来我们核查图像时,首先要做的是查看其数字水印。

2021 年 2 月,多家具有影响力的科技和媒体公司结为伙伴,成立「内容来源和真实性联盟「(Coalition for Content Provenance and Authenticity,C2PA),制定媒体内容来源与历史或出处认证技术标准,试图解决虚假信息、错误信息和在线内容欺诈的扩散问题。联盟创始成员包括 Adobe、Arm、BBC、Intel、Microsoft 和 Truepic,着力建立一套标准化溯源解决方案,解决好误导性内容问题。

C2PA 成员将共同针对常见资产类型和格式制定内容溯源规范,让出版商、创作者和消费者能够追踪媒体内容(包括图像、视频、音频和文档)的来源和演变。这些技术规范明确各类资产应标示的相关信息内容、如何显示和存储该信息以及如何识别篡改的证据。

各平台能够通过 C2PA 开放标准保存和读取基于出处的数字内容。一项开放标准可供任何在线平台采用,因此对于在整个互联网上提升信任度至关重要。除了将各类媒体类型纳入其中,C2PA 还着力推动从捕获设备到信息消费者的端到端出处体验。与芯片制造商、新闻机构以及软件和平台公司合作对于促进出处标准和推动整个内容生态系统的推广采用至关重要。

C2PA 的成立将 Adobe 主导的内容真实性倡议(Content Authenticity Initiative,CAI)和 Microsoft 与 BBC 主导的项目溯源(Project Origin)的众创始成员召集在了一起,在一个联盟下统一技术规范。CAI 正在构建一套数字媒体出处与历史系统,创作者可通过该系统声明其作者身份,消费者则可以通过它来判断其所看到的内容是否值得信赖。「项目溯源」针对的是新闻制作与传播。其方向是将证明内容真实性的标示附加到内容上,并让用户能够看到该标示信息,由此来解决数字新闻生态系统中的虚假信息问题。C2PA 成立后,技术标准将统一,上述两个实体将继续在各自社区内进行推广、原型设计和教育。

2022 年 2 月,C2PA 联盟发布了用以对抗深度伪造技术的数字内容认证技术规范的第一版,包括实现指南、考虑因素、用户体验指南以及关于程序目标和基本原理的完整细节。

C2PA 称:「C2PA 规范将为平台提供一种方法,以定义与每种类型的资产(如图像、视频、音频或文档)相关的信息,以及这些信息如何呈现和存储,以及如何识别篡改证据。作为一个开放标准,它被设计用于任何软件、设备或在线平台,以及监管机构和政府机构建立数字来源标准。」

在理想状况下,未来视觉内容的生产、传播与消费可能是这样的链条:制造视频和照片生产工具的公司——包括手机和相机制造商——需要在一开始就纳入 C2PA 身份验证标准。用户需要主动将内容凭证包含在他们制作的视觉效果中。主流出版商和社交媒体公司需要先找到这些凭证,然后才在其平台上显示图像。观众在信任图像或视频之前,可能要先查看一个带有下拉菜单的小图标。

目前,C2PA 联盟的成员已经扩展到包括索尼、佳能、尼康、松下、加拿大广播公司、德国新闻社、纽约时报等等在内的 52 家科技公司、媒体以及其他机构。

从应用层面看,2022 年 10 月,Adobe宣布与徕卡和尼康建立合作关系,这将使这两家相机公司在两款相机中实施符合 C2PA 标准和 CAI 标准的图像证明技术:徕卡 M11 和尼康 Z9,该技术将允许摄影师在相机拍摄时安全地附上照片的来源信息,包括每张照片的拍摄时间、地点和方式。

Adobe 还推出了内容凭据 (Beta)功能,这是 Adobe Photoshop 中一项正在开发的功能,凭借此功能,创作者可向导出的图像中添加其归因详细信息。启用后,内容凭据会收集编辑、活动和制作者姓名等详细信息,然后在创作者导出其最终内容时将这些信息作为防篡改归因和历史数据(称为内容凭据)附加到图像。不过,目前该功能只提供英语、德语、法语和日语版本。

C2PA 联盟中,尤为值得一提的是Truepic 公司,该公司是 C2PA 联盟的创始成员,相比 Adobe 这样的巨头,Truepic 是一家位于美国加州的创业公司,但是 Adobe 的内容凭据功能有一部分就是 Truepic 提供技术支持的。

通过捕获、签名和密封任何照片或视频中的元数据,Truepic 的技术可以创建防篡改数字指纹,并可以在整个网络上进行跟踪。这一流程也被称为「镜对镜」(glass-to-glass)系统,在该系统中拍摄、存储和传输的图片和视频会向观看者发出关于内容已被修改的提醒,无论这些修改是在何时何地进入一则影像从镜头到屏幕的过程中的。

首先,Truepic 的安全相机技术可捕捉、标记和密封每张照片或视频中的关键细节,例如日期、时间、位置和捕捉到的真实像素。

随后,Truepic 对图像实施符合 C2PA 标准的签名并密封。

然后,Truepic 将可以通过 SDK 将数据集成到任何网站或数字服务中,让关注可以查看任何媒体文件的来源和历史记录。

2023 年 3 月底,Truepic 和微软宣布发起「普罗维登斯计划「(Project Providence),利用上述技术和标准帮助记录和保护乌克兰的文化遗产。

2023 年 4 月初,Truepic 和荷兰公司 Revel.ai 合作创造并发布了一段深度伪造的视频:人工智能专家尼娜·希克(Nina Schick)在视频中发出「真实与虚构之间的界限正在变得模糊」的警告。

然而,这并非她本人。视频以一条字幕结尾:「这个深度伪造作品是由 Revel.ai 在尼娜·希克的同意下创建的,并由 Truepic 加密签名」。

这两家公司将这一视频描述为「第一个数字透明的深度伪造」(first digitally transparent deepfake),视频右上角有一个带有 i 标志的水印,表明它是计算机生成的,数据被加密密封在文件中,如果篡改图像,就会破坏数字签名,并在使用可信软件时阻止该证书显示。

除了 Truepic 以外,位于伦敦的机构eyeWitness to Atrocities也开发了类似的系统。作为系统核心的应用有两个功能。首先,当安装有该应用的手机拍摄照片或视频时,它会记录下事件发生的时间和地点,而这些时间和地点是由 GPS 卫星、附近的手机基站和 Wi-Fi 网络等难以否认的「电子证人」报告的。这被称为元数据的受控捕获,它比从手机上收集这类元数据更可靠,因为手机时间和位置的设置是可以更改的。第二,该应用读取图像的整个数字序列(用 0 和 1 呈现),并使用标准数学公式计算出该图像独有的由字母和数字组成的数值,即哈希值。

然后,使用者将图片或视频发动到 eyeWitness 的服务器,eyeWitness 会创建一个受信任的监管链,此链表明原始信息未以任何方式更改。

随后,eyeWitness 收到的所有信息都将由律师,他们对这些视觉证据进行标记、分类和处理,以满足调查人员的需求。

C2PA 项目联合创始人兼主席安德鲁·詹克斯(Andrew Jenks)认为,身份验证标准应该被视为一项重要的数字素养工作,其最接近的类似应用是如今被广泛采用的保证网页安全的 SSL 证书。

网站 SSL 证书是一种遵守 SSL 协议的服务器数字证书,由受信任的根证书颁发机构颁发。SSL 证书采用 SSL 协议进行通信,SSL 证书部署到服务器后,服务器端的访问将启用 HTTPS 协议(超文本传输安全协议),网站将会通过 HTTPS 加密协议来传输数据,可帮助服务器端和客户端之间建立加密链接,从而保证数据传输的安全。

如果某个网站受 SSL 证书保护,其相应的 URL 中会显示 HTTPS。单击浏览器地址栏的挂锁图标,即可查看证书详细信息,包括颁发机构和网站所有者的公司名称。

「我们必须训练用户寻找你今天在每个浏览器中上看到的挂锁图标,」詹克斯说,「那是一个非常困难的问题,花了很长时间,但这与我们今天面临的媒体素养问题完全相同。」

1.工具很重要,但更重要的是常识和逻辑。

2.没有任何工具是完美的,每个搜索引擎都有其优点和缺点,核查员可以使用 InVid 插件,尝试多种工具,确保找到更准确的图片源头。

3.搜寻到相同的图片并非一定就是最终的答案,也不一定能确定图片的真伪。若要确定图片中所展现的原始事件,必须更加谨慎地检查搜索结果,反复比对不同搜索结果对图片的描述;检查图片的拍摄时间和地点;分析包含图片的网页的发布者身份,判断其是媒体、政府机构,还是普通网民,以评估其可信度等。综合考虑搜索结果、影像细节和信源可信度等要素,进行交叉验证,才可能揭示事件的真相。总之,必须全方位分析才能确认原始事件的来龙去脉。

4.仅仅因为反向搜索引擎得到的结果都是同一张图片,并不一定代表该图片是真实且未被修改的。因为,即使一张图片被广泛传播,它也可能会被进行过后期修改,反向搜索结果也可能是其修改后的版本而非原始版本。举个例子,如果某个用户修改了他所拍摄的照片 A 并将其改成了图片 B,然后只上传了经过修改后的图片 B,那么反向搜索引擎将无法搜索到原始的照片 A。因此,需要注意的是,反向搜索引擎仅仅是一种帮助我们找到类似图片的工具,需要进行进一步的验证和核实才能确定图片的真实性和完整性。

5.有时候对原始图片进行某些修改可以更容易地找到最佳结果。

例如,有些人会发布一张照片并声称它是原始图片,但实际上只是对现有照片进行了翻转。在这种情况下,通过对照片进行翻转并进行搜索,可能会找到更准确的搜索结果。

6.留意图片上不起眼地方的水印,有时会提供图片原始来源的线索。

7,搜索结果有时会受到算法的影响,因此出现在前几页或出现多次的信息并不一定代表可信度高或图片的源头,因此需要更耐心地翻查搜索结果。

Fotoforensics是一个检测图片是否被修改过的免费网络工具。

ELA 是其主要特殊功能,ELA 是 Error Level Analysis 的缩写,表示错误级别分析,它通过在图像上显示错误级别来帮助我们检测图像是否经过 处理。

数字图像修改过的地方以及对比度较高的边界,往往 ELA 值较高,即表现为比较醒目的白色;而大面积的同色或者背景,往往表现为暗沉的黑色。

JPEG%的意思是图片质量比,显示上次保存时的图像质量。 每修改一次质量都会下降,一般来说也可证明图片被软件修改过。

元数据显示有关该图片的可用信息,例如创建时间、修改时间以及用于拍摄该照片的相机。

需要注意的是,使用 Fotoforensics 需要专业的影像知识,一般仅作为参考证据之一,而不宜作为主要的或者唯一的证据;还需要利用图片反向搜索工具等方法,寻找图片的来源,作为最终判断的依据。

VerEXIF可以用来查看照片的 EXIF 资料,也可以用来删除照片的 EXIF。

EXIF 是可交换图像文件的缩写,它是一种使用 JPEG 压缩在数码摄影图像文件中存储交换信息的标准格式。几乎所有新的数码相机都使用 EXIF 注释,在图像上存储信息,例如快门速度、曝光补偿、光圈值、使用的测光系统、是否使用闪光灯、ISO 编号、拍摄图像的日期和时间、白平衡,使 用的辅助镜头和分辨率等。有些图像甚至可能存储 GPS 信息,可以查看图像的拍摄地点。

注意:EXIF 资料是可以修改、编辑和删除的,因此只应作为核查参考。

而且,不是所有互联网上的照片都有 EXIF 信息,有些人在将其个人影像上传到网站之前,会先移除 EXIF 档案,例如其 GPS 位置。很多社交网络平台也会移除 EXIF 数据。

用于识别不同旗帜的大型数据库,可以按照不同的维度检索。

LICENSE PLATES OF THE WORLD

Plates Mania

提供全球各国和地区的车牌样式资料,按大洲和国家分类。如果不确定图片是在哪个国家/地区拍摄的,图片上的车牌可能是线索之一。

比如,2022 年 1 月初,中文网络流传一则视频,几名武装分子乘坐三轮车,在街头伏击扫射一辆白色轿车,镜头一转,白色轿车内出现孩子和女性惨死的镜头。有关文字称视频内容是「阿富汗,女人开车,被塔利班全车射杀」。

在视频的后半部分画面中,可以比较清晰地看到受害者的车牌样式和号码「LEH 15 6840」及位于号码下的「PUNJAB」字样。

在搜索引擎中检索「PUNJAB」,可以发现这一般是指是跨越印度和巴基斯坦的旁遮普地区。在上述车牌资料库查询,可以发现视频中的车牌样式是巴基斯坦的。这样可以确认视频不是发生在阿富汗。(参考阅读:阿富汗女性开车遭塔利班全车射杀?

高速公路标志数据库,按照国家分类。当图片或视频没有其他线索的时候,这些信息可以成为一个核查的入口参考。

Elmo – 免费好用的 AI 浏览器助理工具,提升网页效率的 Chrome 扩展

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

Elmo 是一个免费的 Chrome 扩展,主要功能是利用 AI 技术快速建立摘要、观点和总结,当用户在浏览网站、 文件或 YouTube 时只要点击 Elmo 就会对当前内容进行摘要和重点整理,同时显示于的侧边栏,最大程度提升阅读上的速度和效率。它同时也是一个「可互动性」AI ,还能够对内容提问、指定关键词深入探索或洞察,非常强大。

Elmo is your AI companion to create summaries, insights and extended knowledge.

Elmo 背后使用的大型语言模型〔LLM〕API 是由 Lepton AI 提供,从 Chrome 程序商店后就能使用,不需要额外注册、也不会用到 / 账户,不仅免费、而且也支持多国语言,更重要的是能整合 PDF、Google 文件,就不用再手动将文件上传到 AI 服务。

另一个我觉得很好用的是 Elmo 兼具翻译功能,如果遇到英文、日文或其他语言,也能将摘要、重点、作者观点等输出为中文或指定语言,默认值是依照用户浏览器的主要语言而定〔也能手动选择〕,对于要阅读外文网站或文件来说 Elmo 是很好的 AI 助理哦!

Elmo is your AI web copilot to create summaries, insights and extended knowledge.

从 Elmo 官网会看到 Chrome 应用程序商店页面链接,进入后点击右上角「获取」将它下载到浏览器,不过当前在 Arc 浏览器还无法使用,如果是使用 Arc 浏览器就会显示 Not available for Arc 信息。

安装到浏览器后记得将 Elmo 固定于右上角,要启动 AI 功能时可以使用快捷键

或点击 Elmo 闪电图标。

使用方法很简单,在浏览网页时点一下 Elmo 右上角的按钮后会出现侧边栏,利用 AI 将网页内容进行总结、摘要和重点整理,默认情况下生成的内容会以用户浏览器的主要语言为主,这部分非常方便,不用手动输入提示词。

往下滑动后还会生成各种可能的相关问题,点击就能让 AI 继续帮你解答,Elmo 侧边栏最下方还能输入要询问的问题或输入 / 〔斜线〕选择操作指令。

要询问相关问题以外的内容也可以,Elmo 回答还蛮精确,排列方式很好阅读。

Elmo 设置选项里能够调整「偏好语言」,默认是使用浏览器语言,其他还有像「保持侧边栏进入」或设置快捷键功能,我觉得维持侧边栏打开很好用,否则在切换至其他分页后 Elmo 侧边栏就会自动关闭。

试着在英文网页点击 Elmo 就会在侧边栏显示总结、摘要和观点,直接翻译为中文。

还能使用中文进行提问,有助于用户更深入了解相关信息。

当遇到专有名词时选取后会出现选项,点击「Insight」可以对指定关键词生成更多说明〔包含相关网页链接〕。

在浏览时 Elmo 就很方便,不用从头到尾逐字阅读,只要生成总结、摘要后就能知道新闻大致内容。

Elmo 还能整合 PDF、Google 文件和 YouTube 视频,这个功能真的很好用,不过在遇到 YouTube 视频没有字幕时可能会出现不正确或幻觉问题。

Lessons I learned after completing the Google UX Design Professional Certificate

The image is a presentation slide with a dark green background and white text. The text reads “Lessons I learned after completing the Google UX Design Professional Certificate.” The logo “LRD.IM” is also displayed.

Recently, I heard that Coursera has a UX design course developed by Google’s design team. This course covers the entire design process and teaches us how to present our portfolio, prepare interviews, and the like.

It is necessary to enroll in this course even though it is designed primarily for beginners and fresh graduates. It would enhance my English skills on one hand, and deepen my understanding of Western design practices and culture on the other. Since the term “UX design” is called out by Western designers and I am eager to compare Western design cultures with those I’ve experienced in China.

So I enrolled in this online course, trying to spare my time on it. Such as during lunch and dinner breaks on weekdays, or parts of the weekend. I completed the whole certificate within two months. And now I’d like to write down what I learned from this course:

The image shows a dark green presentation slide with four text boxes labeled “New concepts,” “Listening and Reading Proficiency,” “Accessibility and equity,” and “Guidance for Job Hunting.” The text is in white and each box has a rounded edge.
  1. Introducing concepts I had never heard of. Despite my 5+ yoe in a wide range of companies, from startups to large corporations in China, those new concepts opened up a lot of room for me to explore.
  2. Enhancing my listening and reading skills. The course covers plenty of video and reading materials that include industry jargon that translators cannot provide. Moreover, certain phrases and sentence structures are repeatedly used throughout the course. I think my reading skills and speed are slightly improved.
  3. Pointing out concepts like accessibility and equity early throughout the course. I used to think only seasoned designers or well-developed products consider these aspects, however, they are mentioned early on and repeatedly. These concepts resonated with me and will truly influence my work.
  4. Elaborating comprehensive and detailed guidance for designers to prepare their portfolios, resumes, and interviews. They not only tell us what content should be included in our portfolios, but also how to prepare for interviews at different stages. I resonated with these instructions as well, since I did think those details over when looking for a new job.

Table of content

This is a wide banner-like image with a dark green background and the words “New concepts” in large, white text centered across the slide.

New concepts

I have consistently tried to think about and expand design boundaries through different aspects, which requires a breadth of knowledge. Here, I will share several new concepts along with my personal understanding.

Affinity diagram

This is a method of synthesizing that organizes data into groups with common themes or relationships. It can be used in different stages of the design process, such as during brainstorming or after collecting users feedback. The example below focuses on the latter.

After collecting a batch of user feedback, the design team condense each piece of feedback into a single sentence and write it on sticky notes. Then we post them up on a whiteboard or digital tools like Figma. Then the design team look for sticky notes that reference similar ideas, issues, or functionality and collaboratively organizes them into clusters representing different themes.

When I first learned about this approach in the course, I realized that this approach is similar to another method called “Card sorting” that was included in an article I translated earlier named [English to Chinese Translation] How we rebuilt Shopify’s developer docs. Both methods involve clustering sticky notes, naming these groups and summarizing the themes or relationships.

However, card sorting is implemented by external participants and aims to uncover users’ mental models to improve information architecture; Whereas affinity diagramming organizes a large amount of raw data to show the team which problems users are most concerned about and consider high priority.

* This concept is mentioned in Module 3 of Course 4 (Conduct UX Research and Test Early Concepts — Module 3 — Gather, organize, and reflect on data)

Digital literacy

This concept refers to an individual’s ability to gather, communicate, and create content using digital products and the internet. For example, senior adults or those living in areas with poor internet infrastructure may find it difficult to understand interfaces and functionalities, they are considered to have lower digital literacy.

In contrast, young people, especially those working in the information technology industries, are typically familiar with new software and concepts, and can quickly adapt to them.

This course does not dig deeply into this concept, rather, it emphasizes the importance of understanding our users. If our product targets a broad range of users, it is good to consider the needs of users with lower digital literacy. Moreover, this factor should also be considered when recruiting participants for usability tests.

* This concept is mentioned in Module 2 of Course 1 (Foundations of User Experience (UX) Design — Module 2 — Get to know the user)

Deceptive pattern

This concept refers to a group of UX methods that trick users into doing or buying something they wouldn’t otherwise have done or bought.

In the course, instructors clearly point out that this is an unethical and not a good practice. Businesses may lose their clients’ respect and trust once clients realize that they have fallen into deceptive patterns. I will share a few interesting examples that the course provided.

  1. Confirmshaming: Making users feel ashamed of their decision. For example, a subscribe button on a news website usually reads “Subscribe now / No thanks”. BBut if the service provider wants to manipulate readers’ emotions, the text might be changed to: “Subscribe now / No, I don’t care about things around me.”
  2. Urgency: Pushing users to make a decision within a limited time. For example, an e-commerce website might give you a coupon that is only available for 24 hours, prompting you to purchase items without a thoughtful consideration. The course doesn’t judge these marketing strategies or promotions; instead, it suggests that we should avoid putting pressure on users. As designers, we should try our best to balance business promotions and avoid manipulating users’ emotions.
  3. Scarcity: Making users very aware of the limited number of items. For example, a popup or attractive advertisement stating “Only 5 items left in stock.” The course suggests that designers should concentrate on helping users to understand products better, rather than using designs to encourage impulsive buying.

It is really interesting that these deceptive patterns are so common in the Chinese e-commerce industry that it might seem unusual if those strategies were to disappear.

This seems to reflect cultural differences between China and the West. In China, core team members, such as designers, product managers, and operators, collaboratively discuss how to induce and prompt users to make a hasty decision. Also, we regularly hold reflections to discuss and share insights on how to deeply incite users’ motivation.

In 2018, I landed my first job as a UI designer at an e-commerce company. One of my main tasks is designing promotions, such as “claim your vouchers”, “flash sales ending in N hours”, and creating illustrations of red pockets and flying coins, and the like. I didn’t really like these approaches at that time, so I eventually turned to the B2B and SaaS industry, focusing more on UX design.

Although I am not fond of these types of designs, these seem to really help companies grow and generate income. We could stabilize our employment only if our company were earning profits. Perhaps that is an inextricable cycle: obviously, deceptive patterns are unethical and bad as they are inducing and annoying our users, but we must continuously implement these approaches and think about how to make them more effective.

* This concept is mentioned in Module 3 of Course 3 (Build Wireframes and Low-Fidelity Prototypes — Module 3 — Understand ethical and inclusive design)

Biases

The course thoroughly explains a concept called “implicit bias”. It refers to the collection of attitudes and stereotypes associated, influencing our understanding of and decisions for a specific group of people.

For example, imagine you’re designing an app to help parents buy childcare. To personalize your onboarding process, you start by displaying bold text saying, “Welcome, moms. We’re here to help you…”

This is an example of implicit bias, since it excludes every other type of caregiver, like grandparents, guardians, dads and others.

In addition, here are some interesting biases the course introduced:

  1. Confirmation bias. Refers to the tendency to find evidence that supports people’s assumptions when gathering and analyzing information.
  2. Friendliness bias. Refers to the tendency to give more desirable answers or positive comments in order to please interviewers. This usually occurs in usability tests, where participants may not share their honest feedback because they are afraid that real answers or negative comments might offend interviewers and be considered unfriendly.
  3. False-consensus bias. Refers to the tendency that people tend to believe that their personal views or behaviors are more widely accepted than they actually are, and consider others’ opinions to be minor or marginal. For example, an optimist might think that most people around the world are optimistic; or designers can easily understand iconographies and illustrations they created, they might assume other users might easily to understand too.

I was shocked when I was learning this part. I strongly resonated with these biases which I had never perceived before. After all, the course lets us be aware of these biases and provides approaches to help us avoid falling into these pitfalls.

* This concept is mentioned in Module 3 of Course 3 (Build Wireframes and Low-Fidelity Prototypes — Module 3 — Understand ethical and inclusive design)

I listed some concepts above that I had barely encountered in my workspace. Becoming a UX designer appears to require a broad range of knowledge, such as design, the humanities, psychology, and sociology. I am now interested in psychology after completing this course.

This is a wide banner-like image with a dark green background and the words “Listening and Reading Proficiency” in large, white text centered across the slide.

Listening and Reading Proficiency

There are plenty of listening and reading materials involved in the course. Typically, each video lesson is accompanied by an article. If there are additional knowledge points, a single video might be accompanied by two or three articles.

Most instructors in the course speak with American accents. They also speak slowly and clearly, which makes me comfortable and usually allows me to understand without opening closed caption. Sometimes, I need to rewind a few seconds when they are speaking long sentences with many clauses or introducing new concepts, and I will open closed captions if I am still confused.

It is worth pointing out that the course contains lots of industry jargon, and I resonated with this because I used similar approaches or processes in my workspace by using Chinese. As a learner, I created a spreadsheet to record expressions that might be useful, such as:

  1. Above the fold, the content on a web page that doesn’t require scrolling to experience;
  2. Deliverable, final products like mockups or documents that can be handed over to clients or developers to bring designs to life.
  3. Digital real estate, space within the digital interface where designers can arrange visual elements;
  4. Firm parameters, refer to rigid design boundaries or limitations like time, project resources, and budget.

I think it is valuable to collect this industry jargon because it is authentically expressed, which can’t be translated by common translation tools. This will be helpful for me to read design articles and write blogs in English.

This is a wide banner-like image with a dark green background and the words “Accessibility and Equity” in large, white text centered across the slide.

Accessibility and Equity

Accessibility

The course introduces several assistive technologies, such as color modification, voice control, switch devices, and screen readers, which can help people with different types of disabilities to use our products easily.

Instructors also point out that even people who don’t have disabilities, or who do not perceive themselves as having disabilities might benefit from these assistive technologies. The course suggests that we think these factors over throughout the entire design process. For instance:

  1. Supporting color modification. Features that increase the contrast of colors on a screen, like high-contrast mode or dark mode;
  2. Supporting voice control. Allows users to navigate and interact with the elements on their devices using only their voice. They also mention a concept called “Voice User Interface (VUI)”;
  3. Supporting switch devices. This is a one-button device that functions as an alternative to conventional input methods such as the keyboard, mouse, and touch, allowing users to complete common tasks like browsing webpages and typing text;
  4. Supporting screen readers. Allows users with vision impairment to perceive the content. The course suggests that we write alternative text to images, add appropriate aria labels to interactive elements like buttons, and consider the focus order of elements.

Here is a website that demonstrates the color modification feature: HubSpot.com

On the top navigation of this website, it provides a switch for us to toggle a high-contrast mode. Moreover, it also supports reduced motion effects — if I enable the reduced motion setting on my device, this website will minimize motion effects as much as possible.

Equity

The course also introduces a concept called “equity-focused design.”

Instructors clearly define the difference between “equality” and “equity”:

  1. Equality: Providing the same amount of opportunity and support, everyone receives the same thing;
  2. Equity: Providing different amount of opportunity and support according to individual circumstances, ensuring everyone can achieve the same outcomes.

The course also points out that equity-focused design means considering all races, genders, and abilities, especially focusing on groups that have been historically underrepresented or ignored when building products.

They use a survey question as an example: when gathering participants’ demographic information like gender, it is not enough to provide three options: “Male”, “Female” and “Other”. To make our design more inclusive and equitable, we should offer additional choices, including “Male”, “Female”, “Gender-nonconforming”, “nonbinary” and a blank field. The latter provides non-conventional gender options, uplifting those who might be marginalized in conventional surveys. This approach also aims to balance the opportunities for all groups to express themselves, ensuring their voices are treated fairly and heard.

In this lesson, I clearly faced a culture gap from the West. In fact, I don’t really like to dig into this concept deeply, mainly because I can’t determine whether this approach is right. Sometimes I think it is unnecessarily complicated, but at other times, I recognize that there are people with non-traditional genders around us who may truly be eager to be treated fairly.

When I was learning this lesson, I realized that there was an opportunity to incorporate accessibility features into the project I was recently working on. I will write a new post if this project lands successfully.

* This concept is mentioned in Module 2 of Course 1 (Foundations of User Experience (UX) Design — Module 2 — Get to know the user)

This is a wide banner-like image with a dark green background and the words “Guidance for Job Hunting” in large, white text centered across the slide.

Guidance for Job Hunting

In the final course, instructors teach us how to lay out a portfolio and what content should be included. They also inform us the process of interviews and how to thoroughly prepare for interviews.

The guidance they mentioned is for the Western workplace, which may not seamlessly fit in the Chinese workplace. For example:

  1. They point out that designers should have a personal website and case studies regularly. However, Chinese designers prefer to publish their case studies on public platforms like ZCOOL and UI.CN;
  2. They also teach us how to build our digital presence and network through LinkedIn. However, these approaches are not common in the Chinese job market, where the most popular methods are directly submitting resumes and getting recommendations through acquaintances.
  3. They inform us how to handle panel interviews. I have interviewed with a wide range of companies, from startups to corporations, and never encountered panel interviews, which means that the panel interview is not popular in this industry.

I was deeply impressed by how they elaborated on the preparation and important considerations during the interview process. For example:

  1. Research the main business of the company you interview for beforehand, and clearly understand why you are a good fit for the company;
  2. Prepare answers to common interview questions beforehand, such as a personal introduction, your strengths, and descriptions of your case studies;
  3. We should learn how to answer difficult questions using the STAR method, and prepare well before starting an interview;
  4. Adapt the focus and questions according to the interviewer’s role to show you are a professional;
  5. During the interview process, you might be asked to complete a task. Therefore, we should practice the ability to think aloud and clearly define questions, since interviewers might pose vague questions on purpose.

I resonated with the approaches and tricks mentioned in the course that I had previously used, which gave me a strong feeling that I was on the right track.

Additionally, the course also provides detailed instructions on how to pursue freelance design work. For instance:

  1. Clearly identify your target audience and understand why they should choose your service;
  2. Know your competitors, identifying what they can’t provide but you can;
  3. Promote your service and build word-of-mouth by attending online and in-person events, and getting recommended through acquaintances;
  4. Calculate the business expenses, set fair prices for your services, and make financial projections — estimate what your finances will look like in the first month, the first 6 months, and the first year.

* This concept is mentioned in Module 3 of Course 7 (Design a User Experience for Social Good & Prepare for Jobs — Module 3)

To sum it up

Well, above are lessons I’ve learned from the Google UX Design Professional Certificate on Coursera over the past two months. I think that this is an interesting course, although not all content can be applied in my daily work, I’ve also learned the thinking processes and workplace cultures of designers in another part of the world.

I strongly recommend designers reading this post consider to enrolling in the Google UX Design Professional Certificate, by doing this, you might probably gain new insights. The course costs $49 monthly, which is not expensive. It is likely to complete the entire course over two or three months if you have a full-time job.

Things worked as I expected, and I will start my next project in the second half of the year.


Lessons I learned after completing the Google UX Design Professional Certificate was originally published in Bootcamp on Medium, where people are continuing the conversation by highlighting and responding to this story.

完成了 Google UX Design Professional Certificate 后的收获

最近了解到 Coursera 这个平台里面有一个 Google 设计团队出品的的 UX 设计课程,课程里会介绍完整的 UX 设计过程,并且教我们怎么写作品集和准备面试之类的。

即便这是一门面向初学者或应届生的课程,我觉得也有必要参加这个课程看看。一方面能锻炼下自己刚闭关修炼出来的的英语能力,更重要的是还能了解下西方职场的设计流程和设计文化(毕竟 “UX 设计” 这个概念是西方人创造出来的),我一直想对比看看老外的设计文化和自己这几年在国内职场的感受有没有什么异同。

于是就报名参加了这个网课,都是抽时间来学习的。比如工作日吃午饭和吃晚饭那段时间,或者周末的部份时间等等。总共花了 2 个月完成了所有课程。写这篇文章的目的也是记录下结课之后的感受:

图片中央展示四个方框,每个方框内部都用白色中文文字标识了不同的概念:“新的概念”,“听力、阅读能力”,“无障碍和公平”,“求职指引”。
  1. 里面提到的一些概念我没有听说过。即便我工作了 5 年,在小公司和大集团都呆过,里面有些概念仍然给了我很大的探索空间;
  2. 英文听力、阅读能力锻炼。里面有大量的视频和阅读材料,用词应该就是比较地道的行业术语,这些是翻译软件不能提供的。而且里面的材料都会不断重复一些短语或句型。我觉得我的阅读能力和速度是有所提升的;
  3. “无障碍” 和 “公平” 的概念被很早提及并贯穿全课程。我一直以为只有比较成熟的设计师或产品才会考虑到这些,但这些概念在课程中很早就被提及了,而且是反复提及。这触动了我,并真正地影响到了我的工作;
  4. 提供了全面且周到的指引帮助设计师准备作品集/简历/面试。这方面内容他们写得很细,告诉我们作品集里应该包含哪些,针对不同面试阶段所做的准备等。里面写到的东西我很有共鸣,因为我在找工作的时候也会去思考这些细节。
深绿色背景的宽幅 Banner,中间白色大字“新的概念”。

新的概念

工作这几年,我一直会尝试从更多不同的维度来思考和扩展原有的设计边界,做到这点需要有比较宽广的知识面。这里分享下我在课程里了解到的一些新概念,以及我的理解。

Affinity diagram 亲和图

这是一种组织数据的方法。从不同的反馈和数据中整理出他们的相似之处和关系。亲和图可以用在不同的设计阶段,比如在头脑风暴中,或者收集到用户反馈后,这里以后者为例子。

具体做法是在收集好一批用户反馈后,将每一个原始反馈浓缩成一句话,写在便利贴上并将它们都贴在白板上(当然,也可以用在线工具如 Figma 完成)。然后团队成员一起看这些内容,将提到相似概念/问题/需求的便利贴放在一起,并给这一堆便利贴起个名字概括他们的共同点。

根据分组结果,我们可以总结出一些趋势、痛点,了解到我们需要解决的问题也为后续的洞察报告提供了依据。

最开始在课程里了解到这个方法的时候,我突然想起来这与我两年前翻译的文章:【译文】我们如何重建 Shopify 的开发者文档 里提到的 “卡片分类法” 很像,都是将相似的卡片堆成一组,给该组命名,然后得出结论。

但卡片分类法里面 “分类” 的动作是由团队外部的人参与的,并且用于揭示用户的心智模型并为解决网站信息架构问题提供指引;而亲和图则是通过组织大量原始数据,告诉团队有哪些问题是用户关心的,亟待解决的问题。

*该概念在第四门课程的第三个模块中提及 (Conduct UX Research and Test Early Concepts — Module 3 — Gather, organize, and reflect on data)

Digital literacy 数字素养

这个概念大意是指人们对于数字产品、网络来获取信息、交流和创造内容的能力。比如一些年长的人、生活在网络没那么普及的环境中的人,他们对于使用电子设备和互联网就会有些障碍,理解功能和界面也会感到困难。而年轻人,特别是互联网行业的从业者则对这些就比较熟悉,各种新软件、新概念都能很快上手。

课程中对这个概念并没有展开太多,主要是提醒我们作为设计师,要了解到我们的用户是谁。如果是一个面向较宽广的用户群体,最好考虑也到对电子设备和互联网没那么熟悉的人。包括在做可用性测试时,招募的参与者最好也考虑到这个因素。

*该概念在第一门课程的第二个模块中提及 (Foundations of User Experience (UX) Design — Module 2 — Get to know the user)

Deceptive pattern 欺诈性设计模式

指的是一种设计方法:通过设计去诱导用户去做一些本来不想做的事情,或购买本来不想买的东西。

在课程中,明确指出这是不道德的事情,不是好的做法。一旦用户认为自己陷入了欺诈性设计模式当中,公司将会失去用户的尊重和信任。课程中列举了一些例子,我可以拿几个有意思的的分享出来。

  1. Confirmshaming (羞辱性确认): 让用户对自己作出的决定感到愧疚。比如一个新闻网站的订阅按钮,文案里原本可以写 “立即订阅 / 不了,谢谢”,但为了操纵用户的情绪,文案写上 “立即订阅 / 不了,我不关心身边的事情”。
  2. Urgency (急迫性): 引诱用户在 “有限的时间内” 作出决定。比如电商网站里给你送了一张仅限当天使用的优惠券,促使你赶紧付钱消费。课程里指出并重点不是限时促销这件事情,而是在这过程中给用户增加了消费的压力。作为设计师,我们应该在曝光公司的促销活动的情况下,尽量避免操纵用户情绪。
  3. Scarcity (稀缺性): 使用户感受到这件商品非常稀缺。比如一个弹窗推送或明显的广告写着 “商品仅剩 5 件”。课程中建议设计师聚焦于怎么帮助用户更好地了解该产品,而不是利用设计促使他们进行冲动型消费。

有意思的是这几种 “欺诈性设计模式” 在咱们国内电商环境中太常见了,以至于没有这些反而感觉不正常。

看起来这是国内外文化的差异的一种体现。在国内的环境中丝毫不会避讳这些东西,反而设计、产品、运营都会一起构思怎么做才能更好地 “诱导” 用户做某些事情。甚至还会在内部复盘、分享,看看过程中有哪些地方可以继续改进。

2018 年,我的第一份工作是在面向消费者的电商公司里做 UI 设计师,经常要在界面上做出 “领取优惠券”、“秒杀价剩余 N 小时” 和礼包、金币满天飞的插画等设计,正正是因为自己不喜欢做这种设计,之后才转向了更注重 UX设计的做 B 端、SaaS 行业。

虽然自己本身是一点都不喜欢这种设计方式,但这似乎能实打实地帮助到公司获取收入。公司有一份好的收入,大家的工作才能稳定。似乎陷入了一个无法走出的循环 —— 明知道这种设计方式是不对的,是有诱导性质且给用户带来烦扰的,但又不得不继续做,并想办法做得更好。

*该概念在第三门课程的第三个模块中提及 (Build Wireframes and Low-Fidelity Prototypes — Module 3 — Understand ethical and inclusive design)

Biases 偏见

课程里着重介绍了一个叫做 “隐性偏见 (implicit bias)” 的概念。“隐性偏见” 指的是我们潜意识里有一种态度或偏见,影响了我们对某一群体的理解或决定。

比如一个餐厅老板收到两份简历,求职者 A 是一个二十多岁的毕业生,没有餐饮行业经验;而求职者 B 则是一个 50 多岁的人,有 30 多年餐饮行业经验。但最终老板选择了求职者 A,因为他认为年轻人的体力更好,做事情会比 50 多岁的人要快。这就是一个 “隐性偏见” 的例子。

课程中还介绍了其他几种偏见,这里也分享一些我觉得有意思的:

  1. Confirmation bias (确认偏见)。指的是人们在收集信息和分析信息的过程中,倾向于寻找支持自己想法的证据。甚至尝试以更贴近自己预想结果的方式来解释数据;
  2. Friendliness bias (友善偏见)。指的是为了令其他人满意,受访者更倾向于做出访问者希望得到的答案或者做出积极评价。通常发生在可用性测试当中,受访者觉得说出真实答案或负面情绪的答案会被认为冒犯和不友善,不将自己的真正想法说出来;
  3. False-consensus bias (错误共识偏见)。指的是人们倾向于认为自己的观点或行为比实际情况更广泛地被认同,并且觉得其他人的观点或意见是被少数人接受的。比如一个人很乐观主义,就会认为世界上大多数人都是乐观主义;设计师能够很轻松地理解自己设计出来的图标、图像含义,就会认为其他用户也能轻易理解。

学到这里的时候我似乎被当头一棒,我似乎对里面提到的不少偏见都有共鸣,并且自己从来没意识到有这么一回事。总的来说,课程希望我们认识这些偏见,然后提供方法教我们怎么避免这些偏见。

以上列举了几个我在课程里了解到在日常工作中不怎么接触到的概念。可以看出来做一名 UX 设计师似乎得有宽广的知识背景,比如设计、人文、心理、社会学等等。通过这门课程,我觉得我对心理学产生了一些兴趣。

* 该概念在第三门课程的第三个模块中提及 (Build Wireframes and Low-Fidelity Prototypes — Module 3 — Understand ethical and inclusive design)

深绿色背景的宽幅 Banner,中间白色大字”听力、阅读能力”。

听力、阅读能力

课程里面的听力和阅读材料实在是太多了,基本上是一节视频课程,搭配一篇的阅读,如果有其他可以衍生出来的知识点,甚至会多篇阅读。

里面绝大多数老师都是美式口音,语速有刻意地减慢,我听着很舒适,绝大部分情况下不用看字幕。只是到了一些包含大量从句的长句子或新概念时可能会需要倒退一下多听几遍,再听不懂就会开字幕来看。

值得一提的是,里面有大量的行业术语,有很多我在国内日常工作中的用到的设计方法/流程等,这里都有出现到。作为学习者,我自己有做一个表格,把值得记录下来的表达方式都记下来,比如:

  1. Above the fold 指的是在首屏(不用滚动)就能看到的内容;
  2. Deliverable 设计的交付物;
  3. Digital real estate 大概是指视窗范围或可供设计师发挥的空间尺寸;
  4. Firm parameters 指一些设计过程中的限制,如时间,项目资源和预算等…

我觉得积累这种行业词汇有一个宝贵之处是,它的表达很地道,用通用的翻译软件是做不到的。这对我阅读设计经验文章,或者自己用英文写设计博客很有帮助。

深绿色背景的宽幅 Banner,中间白色大字”无障碍和公平”。

无障碍和公平

无障碍

课程中介绍了几种辅助技术 (Assistive Technology),如颜色模式、语音控制、Switch 设备和屏幕阅读器等帮助身体有障碍的人们更好地使用我们的产品。课程强调即便是健全人,或者认为自己是健全人的群体,也有可能会用到这些辅助技术。课程建议我们在设计的全流程都考虑这些因素。具体的做法,比如:

  1. 支持多种色彩模式。如亮色/暗色模式,支持增强对比度和减弱透明度等效果;
  2. 提供语音控制支持。允许用户通过声音来导航和与界面上的元素交互。另外,里面提到有个概念叫做 “VUI”;
  3. 支持一种叫做 “Switch” 的设备。这是一种代替键盘、鼠标或手指等常见输入方式的设备,通常只有一个按钮。用户就是通过一个按钮来实现浏览网页、输入文字等日常操作的;
  4. 支持屏幕阅读器。确保人们可以在看不见屏幕的情况下也能获取到主要内容。课程建议我们给图片添加替代文字,或者给按钮等控件加上合适的标签,并且留意元素的聚焦顺序。

这里分享一个在这方面有所体现的网站:HubSpot.com

这个网站提供了强对比的色彩模式,在顶部导航栏里有开关可以切换。同时也支持减弱动画的效果,如果我的设备在系统设置里设置了减弱动画,这个网站的大部份动效都会被移除。

公平

课程中介绍了一个概念叫做 “以公平为中心的设计” (equity-focused design),并厘清了 “平等” 和 “公平” 这两个概念:

  • 平等是每个人都有相同的机会和支持,即每个人都拿到了同样的东西;
  • 公平是根据每个人不同的情况而提供不同的机会和支持,最终大家都能有相同的结果。

课程中指明,面向 “公平” 的设计,需要考虑到所有种族、性别、能力,特别是一些曾经被忽视和排除的群体

他们以一个问卷问题作为例子:在收集受试者的性别信息时,如果只提供三个选项:“男”、“女” 和 “其他” 是不够的。如果想要更包容和公平我们应该提供:“男”、“女”、“非常规性别”、“非二元性别” 和 “请填写”。后者通过提供非传统性别选项和自定义选项,关注到了那些可能在传统问卷调查中被边缘化的群体。试图平衡不同群体间的表达机会,确保他们的声音被平等对待和听见。

从这门课程里我正面感受到了来自西方文化差异。实际上我不是很想太深入学这里面的门道,主要是我没法判断他们这种做法到底是对还是错,我有时候会认为这是在闲着没事干,有时候又认为我们身边确实也会有这种非传统性别的人,他们或许真的需要被 “平等对待”。

学到这里时,刚好公司的工作中有机会可以让我在设计中加入对无障碍的考量,我便抓紧机会在公司实施了一番。如果我的计划落地成功,我也会在这里分享出来的。

*该概念在第一门课程的第二个模块中提及 (Foundations of User Experience (UX) Design — Module 2 — Get to know the user)

深绿色背景的宽幅 Banner,中间白色大字”求职指引”。

求职指引

最后一课老师教授了我们怎么做作品集、一份作品集里要包含哪些东西、面试的流程、怎么准备面试等。

课程里讲述的都是西方世界的职场规则,有些未必在国内职场适用,比如:

  1. 比如他会提到设计师应该有一个自己的个人网站,里面需要及时更新自己的作品。但在国内大家似乎更喜欢将作品传上平台提高曝光度,比如站酷UI 中国
  2. 他会教我们怎么建立自己在互联网上的形象并通过 LinkedIn 去做 Networking。但似乎在国内的职场上没有这一步,身边的人多数都是直接在网站上投简历,或者有少量的人是熟人内推进去的;
  3. 里面有教我们怎么应对小组面试。我这几年在国内面试了大大小小公司,没试过有小组面试的情况,说明小组面试在我们的行业内不是特别流行。

印象比较深的是在课程里他提到了对于面试的准备,以及面试过程中的注意事项。课程里说得真的挺细的,比如:

  1. 面试前要了解好公司所做的业务,清楚自己为什么适合去那家公司;
  2. 提前准备好一些常用的问题,比如个人介绍、个人优势以及介绍设计案例等;
  3. 学会用 STAR 法则回答困难的问题,在面试前提前练习好;
  4. 根据面试官身份来改变面试的侧重点和要提问的问题,需要体现出自身的专业性;
  5. 面试时可能会有现场测试题。所以我们要练习好将自己的想法说出来的能力,也要有界定清楚问题的能力(因为有时候面试官特意给出很模糊的问题)

有时候刚看看到课程里提到的方法和技巧,正好是我有用过的,我会感到有共鸣,觉得自己的方向是对的。

另外,课程里还有教我们如果想走自由职业,要遵循怎么样的步骤。写得还比较详细,我这里列举几点:

  1. 明确目标用户是哪些群体,他们为什么要选择自己的服务;
  2. 了解自己的竞争对手,看看有没有东西是他们提供不了而自己是可以的;
  3. 通过参加线上推广、线下活动、熟人推荐等方式推销自己的服务和建立口碑;
  4. 计算开支,合理定价,并且制定财务计划 —— 构思第一个月、第六个月或第一年自己的财物状况是怎样的。

*该内容在第七门课程的第三个模块中提及 (Design a User Experience for Social Good & Prepare for Jobs — Module 3)

总结

以上就是我这两个月以来在 Coursera 平台里学习 Google UX 课程的一些收获。我觉得还是挺有意思的一门课程,即便不是所有内容都能在日常工作中应用,但至少知道在地球里的另一个世界,那边的设计师他们的思考习惯、职场文化是怎样的。

我很推荐看到这里的设计师们去这门课程 Google UX Design Professional Certificate 里瞧瞧,相信大部份人都是有收获的。收费不是很贵,是按月来收费。每个月 49 美刀,工作党每天抽点时间来看,一般 2~3 个月都能完成了。

事情按照预期发展,五一假期结束了这门课程,下半年又可以开始捣鼓另一件事情了。

在 Windows 平台开启 Netflix 4K + Dolby Vision + Dobly Atoms 支持

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

Netflix 4K 播放的必要条件:

一、显示器

至少支持 4K 60Hz 的显示器或电视机,且显示器上至少有 HDMI2.0 及以上接口、DP1.3 及以上接口或者雷电 3 及以上接口。

二、线材

至少支持 HDMI2.0/2.0a 或至少支持 DP1.4的传输线。现在推荐直接买HDMI2.1或者DP2.0的传输线。

三、独立显卡

如果想要在上使用独立显卡观看 Netflix 4K ,需要开启 Edge 浏览器的硬件加速设置(默认开启),关闭硬件加速之后浏览器渲染网页和播放视频都将使用

CPU

而不是独立显卡,的分辨率也会一直保持在 720P。

NVIDIA:需要至少 GeForce GTX 1050或更高版本显卡、3GB 或更高的显存和387.96更新的驱动程序

AMD:由于 AMD 对 DRM 防盗版机制的跟进非常缓慢,目前仅旗下Polaris系列显卡(例如RX470/480/570/580/590),或者Navi系列显卡(例如RX5500/5600/5700)支持 Netflix 4K,Vega系列所有显卡因为不支持Microsoft Playready3.0 DRM,所以全部不支持 Netflix 4K;对于支持的显卡,需要Adrenalin 2019 Edition 19.8.1或更新的驱动程序。

四、核心显卡

独立显卡已经达标可忽略此项。

Intel:虽然 Netflix 官网写的是需要至少Kaby Lake第 7 代或更新的酷睿 CPU。据我实测,带有UHD610的奔腾甚至赛扬这类低端处理器也能外接显示器看 4K,所以推测只要是比HD630出的晚的核显(即 2018 年或之后出的核显)应该都支持 Netflix 4K。AMD:带有核显的所有 AMD Ryzen CPU 都支持。

五、Windows 系统版本

NVIDIA 核显或独显:Windows10 1709 或更新系统版本(包含 Windows11)。

AMD 核显或独显:Windows10 1809 或更新系统版本(包含 Windows11)。

六、观看

使用 Windows 10/Windows 11 微软商店中的 Netflix App 或 Microsoft Edge 浏览器。 各浏览器支持的最高分辨率:

查看分辨率方法:

全屏时可能无法触发快捷键,需要退出全屏。

很遗憾,我的联想笔记本被 Netflix 认为不支持 4K。使用 Edge/Netflix App 播放时,一开始的最高分辨率为 1920*1080,播放数分钟后会切换到 2560*1440,但是始终无法达到 3840*2160

但是硬件应该是支持的,因此可以尝试在 Edge 浏览器上强制开启。

插件下载:

Netflix-4K-DDPlus https://github.com/lkmvip/netflix-4K-DDplus

插件 解压: 解压后文件夹 Edge 在 edge://extensions/ 中开启开发者模式:

开发者模式 导入: 成功导入 Edge 浏览器使用开发者模式导入的插件会导致 Edge 在启动时提示「处于开发者模式下的插件」,可以选择 「14 天内不再提醒」 或其他方法永久禁用此提示。

应用商店链接:

来自设备制造商的 HEVC 视频扩展 https://apps.microsoft.com/detail/9n4wgh0z6vhq?hl=zh-cn&gl=cn

HEVC 扩展 如果按钮为「打开」则表示已安装,可跳过此步骤,下同。 如果无法安装,可到:

Microsoft Store – Generation Project (v1.2.3) [by @rgadguard & mkuba50] https://store.rg-adguard.net/

输入应用商店链接,选择后缀为.appxbundle的文件下载安装。

应用商店链接:

Dolby Vision(杜比视界) https://apps.microsoft.com/store/detail/dolby-vision/9MVMZ93N61T9

Dolby Vision

应用商店链接:

Dolby Access(杜比全景声) https://apps.microsoft.com/store/detail/dolby-access/9N0866FS04W8

Dolby Access 耳机杜比全景声 在任务栏右键点击右下角的音量-空间音效,选择Dobly Atmos。杜比全景声尽量戴耳机使用,体验沉浸感。 Dolby Atmos

Netflix 自制片(封面左上角带有 N 字的)都支持 4K,例如:

尸战朝鲜 https://www.netflix.com/title/81312457

如果有此标识则以成功启用双杜比: 双杜比 播放时按上述快捷键查看分辨率: 调试信息 如有上述参数则为成功。

各分辨率网速要求:

可在 Fast.com 测试网速: Fast.com 2.1Gbps 当然,看 4K 并不需要这么快 XD。

在 更改流媒体套餐 处查看当前套餐: 各级别套餐和限制 需要高级套餐才能观看 Netflix 4K。 如果支持 4K,还需要在 账户-播放设置 中设置「每个屏幕的使用情况」为「高」或「自动」(默认): 设置每个屏幕的数据使用情况

Fast Stable Diffusion XL – 免费使用 Google Cloud TPU v5e 快速生成 AI 高清图片

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

Stable Diffusion XL〔简称 SDXL〕是一个高清、文字转模型,使用的是 StabilityAI 技术,但很多人可能不清楚这些专业名词或术语,只想知道「要使用一段描述提示词来建立想要的图片」,最快的方法是直接使用在线,就能在输入提示词后建立图片,还能设置图片风格、高度宽度尺寸。

接下来要推荐「Fast Stable Diffusion XL」是 建立于 Hugging Face 平台的示例模型,主要是展示自家 Google Cloud TPU v5e 运用在 SDXL 模型的效能,TPU 是经过最佳化调整的特制 加速器,对各种 AI 实例提供最好的速度效能。当然,用户也能运用 Fast Stable Diffusion XL on TPU v5e 工具生成 1024×1024 尺寸图片,几乎没有使用限制。

通过 Fast Stable Diffusion XL 输入要生成图片的提示词〔描述〕,在几秒钟内生成四张预览图,也能随时调整图片风格、negative prompts〔专门用来修复一些奇怪的图片〕或是强度指标。

Discover amazing ML apps made by the community

进入 Fast Stable Diffusion XL 在 Hugging Face 示范模型后,直接从上方字段输入 Prompt 也就是图片的提示词〔描述〕,点击「Generate」就能在几秒钟快速生成四张预览图片。

如果没有灵感,SDXL 页面下方也有一些示例描述词可快速带入,或是使用以下服务上传图片生成:

从示例模型可以感受到图片生成速度飞快,只要不用十秒时间就能生成四张预览图。

下方有进阶设置选项可预先指定要生成的图片样式,包括、摄影、日本卡通、漫画、数位艺术、像素艺术、奇幻艺术、霓虹庞克和 3D 模型,必要时还能输入 negative prompts〔负提示词〕或调整强度。

试着换了一个风格、重新生成图片,SDXL 很快就给出四张新的预览图,看得出来和之前的图片样式完全不同路线,比较可惜的是 SDXL 生成的图片都是 1024×1024 正方形,若需要长方形或不同尺寸的图片就要自己裁切、调整。

点击图片后会看到更大张的预览图,按下右上角小小的「Download」按钮就能、保存图片。

Flowith – AI 互动新形式,白板画布式 ChatGPT 体验

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

的交互,就像和朋友的聊天,你来我往,从上到下,线性的结构非常直观。

学生时期,我们应该都见过白板,老师用可以擦除的马克笔,在白色的平滑板面上写公式。

Canva、Figma 等设计平台,则提供了在线白板,它们沿袭了物理白板的特点,但画布是无限的,形式也更加自由,就像现实的办公桌一样,可以灵活地放置各种东西,很适合进行头脑风暴。

▲ 在线白板工具示意图. 图片来自:Canva

如果 ChatGPT 也以白板的方式和我们互动,会产生什么奇妙的化学反应?

Flowith 就是这样一款 内容生成工具,最近发布了公测,一周新增约 2 万名新用户。

Interact with the world's most powerful AI in a way from the future flowith is an AI productivity tool powered by GPT 4. Through innovative interaction, it allows you to collaborate smoothly with AI, with ideas flowing like a vibrant spring.

它在形式上最大的亮点是,把纵向的聊天记录,转变成了动态的画布,为人机交互提供了一种很新的方式。

Flowith 支持 GPT 4 Turbo、Claude 3 Opus 等模型,本质和 Perplexity 差不多,都是在他人的地基上搭建服务,但创新之处各有千秋。

通过邀请链接,都会获取一个月时间的无限次 GPT 3.5 查询以及有限次 GPT 4 查询(直接注册分别每个月只有 20 次和 5 次),GPT 4 奖励次数累积叠加。

Flowith 的底部仍然有输入框,但你是在一块类似在线白板的无限画布上,和 AI 互动。

这里还引入了一个新概念:节点。

每次提问产生新的节点,节点可以再发散和引用,串成很多不同的线。

举个例子更加直观,直接问 AI:「给我头脑风暴 5 个 AI 创业想法。」

Flowith 给出的答案是:AI 医疗影像诊断、AI 在线平台、AI 投资顾问、AI 智能家居可穿戴设备、AI 场景消费推荐。

然后,我们可以在「AI 智能家居和可穿戴设备」的分支下,追问目前有哪些主要玩家。

第一次看到答案以卡片的形式分叉和,心里会忍不住「哇」一声。

这个例子使用的是「思维导图发散模式」。除此之外,Flowith 还提供了自动决策模式、联网超级模式、生成图片模式,适合不同的问题和场景。

开放性的问题多半交给思维导图模式,联网搜索模式则像 Perplexity 的平替,能搜索、能总结,甚至还能开脑洞。

当我输入「国内 AI 搜索的发展情况如何」,Flowith 的输出分成三栏。

左边提供实时搜索结果和图片,可以进一步追问,让 AI 总结某个链接的内容;中间对几个 排名靠前的链接进行了总结,等于输出了一篇短小的「文献综述」。

但右边才是最有趣的一栏,AI 给出了知识图谱,帮我们拓展思路,搭建知识体系。

「AI 搜索发展现状」本身是一个非常宽泛的问题,Flowith 延伸出了不少细分的方向:AI 在搜索引擎功能中的集成、AI 搜索算法的进展、AI 搜索结果中的偏见……

好奇心强的人类,可以不断探索下去。选中知识图谱的动态效果也有些魔性,QQ 弹弹,像果冻的质感。

而在自动决策模式下,Flowith 会根据你的提示词,自动切换到最合适的 AI 模型,判断是否需要联网搜索,是否需要文生图,是选择速度优先的 GPT-3.5,还是更强的 GPT-4 和 Claude 3,可以窥见 Agent 的雏形。

比如,问问广州今天的天气如何,Flowith 就会进行实时搜索。

从整体来看,Flowith 的动态 UI 也很酷,整块画布可以拖拽、缩小、放大,节点可以引用、追问、删除、重新生成。

使用 Flowith,有些类似我们过去在草稿纸上涂涂画画思考问题,发散、延伸、删除,漫无边际,不像逻辑清晰的大纲,也不像和 ChatGPT 之间直观的聊天记录。

但这就是我们使用画布的目的,在发散创意的过程中,慢慢地把思路捋清,如同流水那样滔滔不绝。

画布式 AI 的可视化,本身就是思考的外显。

创新的形式,本质是为了实现人类和 AI 更高效的交互。

如果说 ChatGPT 是聊天式的 AI,Flowith 这类产品,可以简称为画布式的 AI。

类似地,设计平台 Figma 的在线白板工具 FigJam,也在去年 8 月提供了内置的 AI 部件 Jambot。Jambot 结合了 ChatGPT 的生成能力,可以进行头脑风暴、总结、改写等。

参与开发的产品设计师 Aosheng Ran 在发布时提到:

我想我们被困在聊天框里了。就像我们现在被困在 Zoom 中一样。

▲ Jambot

和聊天式的 AI 互动,确实存在局限性。

ChatGPT 等聊天机器人是基于线性的结构,但思考往往不是线性的,大模型又有一定的随机性,生成的内容,比如文案、翻译、代码,往往需要反复修改、对比和测试。

ChatGPT 纵然可以反复生成,但如果某个问题对话了几百次,聊天记录过长,我们可能也不知道自己聊到哪里了。

哪怕把一个问题研究清楚了,ChatGPT 无法直观地呈现从这个问题引发出去的不同分支。

但画布式的 AI 是不一样的烟火。

同一块画布上,我们可以反复修改提示词,或者用不同的大模型多试几次,答案全部保留;我们也可以同时完成多项任务并查看结果,搜索、头脑风暴、内容总结等需求并行不悖。

▲ 图片来自:X@DerekNee

比如,假期快到了,我先用了头脑风暴模式,让 Flowith 列出 AI 旅行助手应当具备的 5 个特点,再用了联网搜索模式,让它直接找出 3 个目前最主流的 AI 旅行助手应用。

以此类推,涉及到需要反复生成、对比内容的创作场景,以及发挥 AI 多项能力的工作流,画布式的 AI 往往比聊天式的 AI 更有趣、更直观,也更具互动性,不必新开很多的聊天页面,本身就是一块无限的创作土壤。

在线白板工具引以为傲的团队协作功能,也是画布式 AI 所擅长的,聊天式 AI 只能甘拜下风。

ChatGPT 支持共享聊天记录,但不能从分享的链接继续对话。

Perplexity 支持分享搜索结果,其他用户可以在原有的基础上追问,但追问后会创建新的链接,和我们分享的并不在同一个页面。

然而,Flowith 只要开了「可编辑」的,对方就可以参与团队协作,在输入框提出自己的问题。如果只是「可查看」,虽然没有输入框,对方也可以发表评论。

想象一下,我们分享一个「flow」给别人,直接在画布上进行实时多人生成和讨论,又不会干扰原有的痕迹,激情和甲方 Battle,有种在飞书文档挥斥方遒的感觉了。

类似 Notion 的模板,如果不知道怎么更高效地使用,Flowith 还提供了 Discover 页面,向你推荐别人的用法。验证可行的工作流,被加工成了一个个开箱即用的半成品。

之所以反复强调画布和聊天的不同,甚至隐隐有些把它们对立起来,是因为交互的方式,潜移默化地影响着我们思考的方式。

如果只是看到一个输入框,可能我们的思维也会陷入「对话模式」,像和人类交流一样和 AI 说话,向它问好,问它如何一夜暴富,或者向它倾诉自己的心情。

这样的用法也很好,但当使用 AI 的方式更多、更自由,内容生产也就有了更多的可能,AI 能力的边界也就离我们更近。

画布式的 AI 和聊天式的 AI,并非你死我活的替代,而是美美与共的互补。

聊天式 AI 固然有缺点,画布式 AI 也并非总是笑到最后。

如果只是找一个简单的问题、了解某个陌生的概念,还是求助 GPT-4 和 Perplexity 更快。

作为一个初出茅庐的产品,Flowith 也不是那么好用,短板肉眼可见。

生成图片模式支持的模型不多,目前只有 Stable Diffusion 和 DALL·E 3,之前支持 Midjourney,但现在不可选了。

同时,Flowith 调取的模型有 2 个梯队,高级的 T1 和基础的 T2。虽然 GPT-3.5 Turbo 等 T2 模型在邀请朋友后无限次免费,但 GPT-4 Turbo、文生图模型等 T1 模型有使用额度。

在个人的体验之中,Flowith 也出现了一些奇怪的状况,但不确定这些问题的普遍性。

用中文向 Flowith 提问,答案也可能是全英,有些影响用户体验。拿同样的提示词问 GPT-4 和 GPT-3.5,回答的都是中文。

虽然 Flowith 支持读取 PDF,但如果上传的文件过大,很可能不成功。

Flowith 的交互也不够流畅,输入新的问题时,其他节点和整体界面总会发生动态的变化,有时候会让人迷失视觉的重心。虽然效果酷炫,但新鲜感只是一时的。

另外,在对 Flowith 的某个节点进行追问时,上下文不一定连贯,出现过答非所问的状况。

尽管产品还不那么成熟,但 Flowith 做了和 Perplexity 类似的事情:在大语言模型的基础上,考虑怎么应用 AI 的能力,让 AI 更好地加入我们的工作流。

Flowith 开发者 @DerekNee,在 X 分享了他对产品的见解——不应该只把 Flowith 看作是一个白板 AI 工具。

他本身是 GPT-4 和 AI 产品的重度用户,但在写文案、写代码、搜索内容时,主流的聊天式 UI 不够高效,不适合反复的修改、对比和测试。

在他看来,白板是为了让大众理解二维画布、节点概念的一个代替词,Flowith 的核心依然是帮助用户生成内容,探索 Human-AI 新的、更有效的交互方式。

这和 Figma 的理念不谋而合。推出 Jambot 时,Figma 在博客写道,AI 是一种增强工作和协作的工具。与其说让 AI 为你做事,不如说 AI 在帮助你做得更好。

WPS、钉钉等办公 AI 化,听用户的指挥一键生成 PPT,让 AI 助理进行文档速读,其实也是这个道理。

Flow 的本意「流动」,某种程度上就是我们对 AI 工具的期许:帮助人类的思维流动起来。

其实,我们思考和解决问题的方式已经被 AI 改变了。

Perplexity 等 AI 搜索,渐渐变成了日常离不开的产品,人类提出问题,它们搜索、摘要、成文,自己已经是一个成熟的工作流了,我们付出更少,但效率更高。回想只用传统搜索引擎的日子,万古如长夜。

还没有和人类磨合得很好的 Flowith,无法代替 ChatGPT,但这不是问题。

Canva 等设计平台能在 Adobe 的领域闯出一条路,是因为搭建产品的底层与 Adobe 不同,前者是模板和部件,后者是对图片的像素级调整。

Canva 抢不走 Adobe 的忠实用户,但吸引了不会或者没法用 Adobe 的用户。

Flowith 也是类似,本质是在填补市场的空缺。Perplexity 不重复 Google,Flowith 不重复 Perplexity。

ChatGPT 引领了聊天式的 AI,用起来确实便捷又简单,在它之后,很多产品照做了,用户也默认接受了。

然而未来,我们与 AI 的协作,不会只是翻译、问答,应该允许更多有趣的想法发生,它们不一定成功,但足够带来惊喜。

毕竟,AI 的时代,变化总是很快,必然还有更新鲜的 AI 交互方式,提升效率、创新思维、改变工作流。

在玩过更多产品之后,我们才能归来仍是少年地惊呼:这才是我想要的 AI 应用。

❌