Normal view

There are new articles available, click to refresh the page.
Before yesterdayMain stream

OpenAI 发布最强推理模型 o1!打破 AI 瓶颈开启新时代,GPT-5 可能永远不会来了

By: Anonymous
7 September 2024 at 14:10

DUN.IM BLOG

DUN.IM BLOG

没有任何预警, 突然发布了 OpenAI o1 系列模型。按照官方技术博客说法,o1 在推理能力上代表了当前人工最强的推理水平。

OpenAI CEO Sam Altman 表示:「OpenAI o1 是一个新范式的开始:可以进行通用复杂推理的 。」

在复杂推理任务上,这款新模型是一次重要突破,代表了 AI 能力的新水平。基于此,OpenAI 选择将此系列重新命名为 OpenAI o1,并从头开始计数。

不知道这是否意味着,GPT-5 这个命名也不会出现了。

简单总结新模型的特点:

OpenAI 发布最强推理模型 o1!打破 AI 瓶颈开启新时代,GPT-5 可能永远不会来了

现在,该模型已经全量推送,你可以通过 网页端或者 API 进行访问。

其中 o1-preview 还是预览版,OpenAI 还会继续更新开发下一版本。目前使用有一定次数限制,o1-preview 每周 30 条消息,o1-mini 每周 50 条。

和传闻中的「草莓」一样,这些新的 AI 模型能够推理复杂任务,并解决科学、编码和数学领域中比以往更为困难的问题。官方表示,如果你需要解决科学、编码、数学等领域的复杂问题,那么这些增强的推理功能将尤为有用。

例如,医疗研究人员可以用它注释细胞测序数据,物理学家可以用它生成复杂的量子光学公式,开发人员可以用它构建并执行多步骤的工作流程。

此外,OpenAI o1 系列擅长生成和调试复杂代码。

为了给开发人员提供更高效的解决方案,OpenAI 还发布了一款更快、更便宜的推理模型 OpenAI o1-mini,尤其擅长编码。

作为较小版本,o1-mini 的成本比 o1-preview 低 80%,是一个功能强大且高效的模型,适用于需要推理但不需要广泛世界知识的应用场景。

在具体训练过程中,OpenAI 会训练这些模型在回答问题之前深入思考。o1 在回答问题前会产生一个内部的思维链,这使得它能够进行更深入的推理。

通过训练,OpenAI o1 模型能够学会完善自己的思维方式,并且随着更多的强化学习(训练时间计算)和更多的思考时间(测试时间计算)而持续提高。

OpenAI 研究员 @yubai01 也点出了 01 的训练路线:

我们使用 RL 来训练一个更强大的推理模型。很高兴能成为这段旅程的一部分,而且要走很长一段路!

据介绍,在测试中,这款模型在物理、化学和生物等任务中表现得如同博士生,尤其是在数学和编码领域表现突出。

在国际数学奥林匹克竞赛(IMO)的资格考试中,GPT-4o 只解决了 13% 的问题,而推理模型得分高达 83%。在 Codeforces 编程竞赛中,它的表现进入了前 89% 的队列。

不过,和传闻的爆料一样,作为一个早期版本,该模型还不具备一些 ChatGPT 的常用功能,比如网页浏览和上传文件或图像等多模态能力。

相比之下,GPT-4o 反而会更加胜任许多常见的应用场景。

为了确保新模型的OpenAI 提出了一种新的安全训练方法。

在最严苛的「越狱」测试中,GPT-4o 得分为 22(满分 100),而 o1-preview 模型得分为 84,在安全性方面堪称遥遥领先。

从下周开始,ChatGPT Enterprise 和 Edu 用户也可以访问这两款模型。符合条件的开发人员现在可以通过 API 使用这两款模型,每分钟速率也有所限制。

在这里划个重点,OpenAI 表示,未来将向所有 ChatGPT 免费用户提供 o1-mini 的访问权限。不过,大概率也会在次数上有所限制。

关于新模型 o1 更多细节,我们很快将在更详细的体验后与大家分享。如果你有感兴趣的问题,欢迎在留言区告诉我们。

官方也放出了更多 OpenAI o1 的更多演示

比如使用 OpenAI o1 来编写一个找松鼠的网页游戏。这个游戏的目标是控制一只考拉躲避不断增加的草莓,并在 3 秒后找到出现的松鼠。

与传统的经典游戏如贪吃蛇不同,这类游戏的逻辑相对复杂,更考验 OpenAI o1 的逻辑推理能力。

又或者,OpenAI o1 已经开始能通过推理,解决一些简单的物理问题,

演示列举了一个例子,一颗小草莓被放在一个普通的杯子里,杯子倒扣在桌子上,然后杯子被拿起,询问草莓会在哪里,并要求解释推理过程。这表明模型能够理解物体在不同物理状态下的位置变化。

落地到具体的应用中,OpenAI o1 还能成为医生的得力助手,比如帮助医生整理总结的病例信息,甚至辅助诊断一些疑难杂症。

热衷于将 AI 与科学相结合的量子物理学家马里奥•克莱恩(Mario Krenn)也向 OpenAI 的 o1 模型提出一个关于特定的量子算符应用的问题,结果,OpenAI o1 也轻松拿捏。

「Strawberry」里有多少个「r」,GPT-4o 会回答错误,但却难不倒 OpenAI o1,这一点值得好评

不过,经过实测,OpenAI o1 依然无法解决「9.11 和 9.8 哪个大」的经典难题,严重扣分。

对于 OpenAI o1 的到来,英伟达具身智能负责人 Jim Fan 表示:

我们终于看到了推理时间扩展的范式被推广并投入生产。正如萨顿(强化学习教父)在《苦涩的教训》中所说,只有两种技术可以无限制地与计算规模化:

学习和。是时候将重点转向后者了。

在他看来,大模型中的很多参数是用来记忆事实的,这的确有助于在问答的基准测试「刷分」,但如果将逻辑推理能力与知识(事实记忆)分开,使用一个小的「推理核心」来调用工具,如和代码器,这样可以减少预训练的计算量。

Jim Fan 也点出了 OpenAI o1 最强大的优势所在,即 o1 模型可以轻松成为数据飞轮的一部分。

简单来说,如果模型给出了正确的答案,那么整个搜索过程就可以变成一个包含正负奖励的训练数据集。这样的数据集可以用来训练未来的模型版本,并且随着生成的训练数据越来越精细,模型的表现也会不断改善。好一个通过自己博弈,实现自己训练自己的内循环。

不过网友的实测中也发现了一些问题,比如回复的时间长了不少,虽然花了更长时间思考,但在一些问题上也会出现答非所问输出不全等问题。

赛博禅心猜测,这次的 o1 有可能是 GPT-4o 在进行一些微调/对齐后的 agent,整体远低于预期,

Sam Altman 也承认 o1 仍然有缺陷,存在局限,在第一次使用时更令人印象深刻,而在你花更多时间使用后就没那么好了。

尽管如此,OpenAI o1 模型在整体的表现上还是可圈可点。

现在,OpenAI o1 模型的发布堪称下半年 AI 模型大战的导火索,如无意外,接下来,其他 AI 公司也不会藏着掖着了。

没错,我点的就是 Anthropic、Meta AI、xAI 等老对手、以及一些潜在深处的 AI 黑马。

并且,从 GPT-4 发布至今,OpenAI 每一次模型发布的最深层意义并不在于性能的强大,而是提供了一种技术路线的标杆,从而带领人们往未知的深水区迈进。

GPT-4 如此,OpenAI o1 也希望如此。

ChatGPT o1 会主动思考推理的 AI,新模型发布实测总结

By: Anonymous
8 September 2024 at 12:45

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

ChatGPT o1 会主动思考推理的 AI,新模型发布实测总结

今天发布「 ChatGPT o1-preview」,是会尝试主动思考的 语言模型, Plus 订阅用户现在就可使用。

根据 OpenAI 的说法:「我们训练这些模型〔ChatGPT o1-preview〕在回应前花更多时间思考问题,就像人类一样。通过训练,它们学会精炼思考过程、尝试不同策略,并能察觉自己的错误。」「如果您正在解决科学、程序设计、数学和相关领域的复杂问题,这些增强的推理能力可能特别有用。」

我自己在讲 ChatGPT 提升工作效率的相关课程时,常常强调一个设计指令的重点:「如果我们写 AI 指令〔 prompt、提示语〕时,可以让 AI 写出自己在想什么、怎么处理任务,通常生成的内容结果会相对更好。

从用户端的角度来看「ChatGPT o1-preview」,就是在 AI 生成内容前,会先展开一步一步的思考流程,它可能会选择思考的策略与切入点,有时会提出一些批判思考,也会更仔细的分析资料细节来做深入处理。

在这个过程中,ChatGPT o1-preview」生成内容的速度其实比 GPT-4o 要慢上不少,可能需要 30~60 秒的思考时间〔或者更久〕,才会开始一步一步的生成内容。

也因为这样的「思考」过程需要耗费更多运算,所以即使是 ChatGPT Plus 用户,在使用「ChatGPT o1-preview」时也有一些限制:

也就是说,目前「ChatGPT o1-preview」比较像是「GPT-4o」的辅助,在进行一些需要深入分析资料、产出有逻辑结果的任务,或者像是科学、数学、程序代码相关领域时,可以运用。

今天这篇文章,我就从自己日常惯用的几个 AI 辅助需求:翻译、摘要、企划思考、文案,以及有时用代码写个小的角度,以实际案例测试看看,「ChatGPT o1-preview」的效果如何,并和「GPT-4o」同样指令下的结果作比较。

当然,如果能从科学、数学与代码的角度来更好,不过从我个人常用角度出发,也想验证看看 ChatGPT o1-preview 是否能满足我的日常工作需求,也提供大家参考。

下面,先提供大家下面测试案例的快速心得比较表格。

翻译结果更简洁有力,文句白话流畅。

用语更符合台湾惯用词汇。

在「白话流畅度」与「专业用语」间平衡得更好。

翻译结果相对较弱,文句不如 o1-preview 流畅。

能计算分数并回馈对错。

无需修改即可使用。

需要多次反复调整才能达到可用程度。

提供具体、逻辑分明的建议步骤和文章架构。

深入分析资料细节。

缺乏深入的分析和明确的建议。

能整理出详细的步骤和操作要点。

细节完整程度略有不足。

缺乏社交贴文所需的流畅性和吸引力。

更注重性和准确性,避免使用版权材料。

可能在细节上不够精准。

首先来试试看翻译〔英翻中〕,我通常会用下面指令来要求 ChatGPT 翻译文章:「把下面这篇 XXX 主题的文章,翻译成中文,请一段一段翻译,尽量在维持原文语意,主题风格的情况下,让上下文的语句更自然通顺,遇到专有名词时附注英文原文,并在第一遍基本翻译后,用台湾惯用词汇与语气进行最后修饰。

下图「左方」,是「ChatGPT o1-preview」翻译的结果。下图「右方」,是「GPT-4o」翻译的结果。

结论是,「ChatGPT o1-preview」花了 57 秒完成一整篇文章的翻译〔文章是 OpenAIChatGPT o1-preview」官方公告〕,但是翻译的结果比「GPT-4o」优异不少。

例如,大多数时候,ChatGPT o1-preview」翻译的文句更加简洁有力〔相对「GPT-4o」〕,可以在许多段落看到这样的差别。

ChatGPT o1-preview」翻译的结果也更白话,相对流畅,用语更符合我指定的中文用语。

ChatGPT o1-preview」在「白话的流畅度」与「专业用语」之间也相对更能拿捏得当,会让人更容易看懂,但又保持专业用语的明确性。

我让「ChatGPT o1-preview」测试直接写一个九九乘法表小工具。o1 同样会先思考撰写工具的逻辑,然后才开始写出程序代码。

我提供的指令是:「我的小孩正在练习记忆数学的 99 乘法表 ,你可以设计一个协助她练习的小游戏吗?

请一步一步分析,从简单的 2 与 5 的乘法表开始,然后练习 3、4、6、7、8、9 的乘法表,根据每一个乘法表设计一个记忆游戏,游戏一开始可以选择要练习哪一个乘法表,进入后可以随机考验该乘法表的熟练度,最好设计有游戏机制。

下面是 ChatGPT o1-preview 第一次生成的 99 乘法表小游戏,我没有做任何的修改,但是正确性、界面美化、操作流畅度都已经达到可用的程度,还会计算分数与回馈对错。

下面是旧版 GPT-4o 第一次生成的小游戏,基本界面可操作,但有一些明显错误〔如下图〕,可能还需要多几次的反复问答,才能调整正确。

我也很常跟 ChatGPT 一起讨论沟通企划案,下面是新旧版本生成的结果比较。

我提供了许多参考资料,请 AI 帮我做产品的企划报告。

ChatGPT o1-preview」在生成过程中,会主动做一些反向思考,与探索不同的报告呈现方式,并且提供一些具体的、逻辑分明的建议步骤,这些不一定有出现在我的指令中。

下面是 ChatGPT o1-preview 生成的版本,我举出其中一部分,它提出了一个撰写初稿的建议方案,并指出了一些明确的试写步骤、文章架构方向。

下面是 GPT-4o 类似段落的版本,虽然也提出了撰写初稿的建议,但整体的说明就比较一般,少了一些明确的、深入的分析与建议。

我也测试了用两个版本去摘要同一篇文章。

下面是 ChatGPT o1-preview 的版本,可以看到文章细节整理得更深入、完整、有条理。

下面是 GPT-4o 版本摘要的结果,基本架构也相似,但细节的完整程度就有一点落差。

不过,ChatGPT o1-preview 也有他不擅长的内容,目前看起来它撰写流畅文案的效果,反而没有 GPT-4o 好〔现在写文案相对效果最好的可能是 Claude 3.5 Sonnet 〕。

下面我请 AI 根据参考资料写出社交贴文上的文案。

ChatGPT o1-preview 版本,AI 会思考撰写过程,撰写时会进行更多安全性、准确性的思考,例如避免使用版权材料

但是多次尝试后, ChatGPT o1-preview 版本目前的结果,比较像是把参考资料更有结构、更有逻辑的分析整理,不太像是社交贴文。

相较之下, GPT 4o 的版本,可能细节没有那么精准,但文案比较流畅。〔如下图〕

以上就是我的初步测试案例与心得,提供大家参考。

3 款 Chrome 插件,检查谁在用你的 Cookie

By: Anonymous
23 August 2024 at 12:09

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

等每个弹出一个 Cookie 弹窗让你选择给不给用 Cookie,倒不如用插件一举解决这个烦恼。

🏪 接受所有 Cookies – Chrome 应用商店

这个插件解决的不是 Cookie 本身, 而是减少 Cookie 弹窗给用户带来的影响。

这个插件安装完毕后无需任何配置,它会自动处理大部分情况。在大多数情况下,扩展功能会阻止或隐藏与 Cookie 有关的弹出式窗口。(比如装完插件后试试打开 StackOverflow,左下角的弹窗就消失了)

具体点讲,它把网站通常要求使用的 Cookie 分为三类:技术、分析和营销。

当网站需要正常工作时,这款插件会自动判断,是接受 Cookie 政策,还是接受所有 Cookie,或是只接受必要的 Cookie。以尽可能减少对你的干扰。

WhoUsesCookies 这个插件能够看到 Chrome 插件使用的 Cookie 范围,并允许立即将插件禁用。

🔗 WhoUsesCookies – Github

因为 Cookie 中存储的信息可能包括用户的登录状态、浏览偏好,甚至是敏感的加密货币钱包数据。如果某个恶意扩展插件获得了读取 Cookie 的权限,它可以轻松获取并滥用这些敏感信息。

这个插件目前没有在 Chrome 商店上架,你需要手动安装。

插件安装完毕后,只需点击浏览器工具栏中的「谁在用 Cookie」图标,即可查看哪些已安装的浏览器插件拥有 Cookie 访问权限。用户可以根据检测结果,决定是否禁用某些不必要或存在潜在风险的插件。

为了避嫌,插件还在 页面提供了「手动插件的性」的方法。用户可以自行检查插件的权限设置。以下是如何在 系统上手动检查插件权限的步骤:

通过这种手动检查的方法,用户可以进一步验证插件是否存在未授权的权限请求,从而确保使用安全。

在日常浏览网页的过程中,我们的浏览器会收集并存储站点数据,如 Cookie、IndexedDB 和 LocalStorage 等。这些数据虽然有助于提升浏览体验,但也会占用存储空间。

如果你想在离开某些网页的同时立即清除 Cookie,但又在常用的网站里保留 Cookie(因为 Cookie 通常还会被用于维持登录状态),可以试试 Cookie AutoDelete 插件

🏪 Cookie AutoDelete – Chrome 应用商店

🔗 Cookie-AutoDelete – GitHub

使用 Cookie AutoDelete 插件很简单,为了充分发挥它的功能,可以遵循它的使用文档做一些配置:

📄 插件使用文档

n.eko – 一键远程操作的多合一浏览器 Docker,支持 Firefox、Chrome、Edge、vivaldi、VLC

By: Anonymous
18 August 2024 at 12:38

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

n.eko 是一款多合一的工具,可以本地运行,也可以在 Docker 中运行。

n.eko 满足几乎一切都运行在浏览器里面的需求。因为运维需要,有些内部服务需要透传一下,单纯的服务没问题,但是一些厂商设备没有命令行。只可以用网页操作。这个项目甚至支持远程音,WebRTC 技术,还有登录。

Neko 可以让你在虚拟环境中运行功能齐全的浏览器,可以像在常规浏览器上一样浏览网页、运行程序,所有这些都在且隔离的环境中进行。

另外,还支持多用户同时使用。Neko 这样写着:

借助 Neko,您可以轻松、安全地与其他人共享浏览器的访问,而不必担心维护单独的配置或设置。无论您需要在项目上进行协作、访问共享,还是只是想与朋友或家人共享浏览器的访问权限,Neko 都能轻松实现。

听起来很不错啊:

Neko 也是举办观看派对和互动演示的绝佳工具。凭借其虚拟浏览器功能,Neko 允许您举办可从任何地方访问的观看聚会和演示,而无需亲自聚会。即使您无法亲自见面,也可以轻松地与朋友和同事保持联系。借助 Neko,您可以轻松举办观看聚会或进行互动演示,无论是休闲还是工作。只需邀请您的客人加入虚拟环境,您就可以共享屏幕并与他们实时互动

N.eko 针对不同浏览器提供了不同的镜像:

推荐配置为 1280×720@30、4 核、3gb 内存,当然越搞越好。

docker-compose.yml 文件:

然后 docker-compose up -d 运行即可,使用 IP:8080 访问。

N.eko 甚至还有一个 VLC 版本…可以用来看剧

详细的可阅读文档

全球 AI 产品 Top100 出炉!只有一个国产应用进前十

By: Anonymous
19 August 2024 at 13:18

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

8 月 21 日,硅谷知名投资机构 a16z,根据近半年的数据,选出了前 100 名 应用

大多数人在使用哪些 AI 产品?哪些类别更受欢迎?用户会坚持使用哪些 AI 产品,而不是转瞬即忘?接下来,我们一起来看看。

这已经是 a16z 第三次发布 AI 百强榜单了,第一次是 2023 年 9 月,第二次是 2024 年 3 月,半年一更,频率稳定。

a16z 的评选方法是,基于 Similarweb、Sensor Tower 的数据,每 6 个月排一次名,榜单分成 2 部分:

全球 AI 产品 Top100 出炉!只有一个国产应用进前十

▲网页端前 50

▲移动端前 50

网页端和移动端的 TOP10 里,美图秀秀国际版 Meitu 属于国产,靠粘土滤镜爆红的 Remini 最开始也是出海产品,后被一家意大利公司收购。

接下来我们分门别类地谈谈,首先是通用型 AI 助手。

第三次了,ChatGPT 还是遥遥领先,在网页和移动端都拿下第一,绝对的 killer app

与此同时,ChatGPT 不如对手们增长势头猛烈。谁才是最好的 AI 助理,尚且没有定论。

▲增长指数

黄仁勋爱用的 AI 搜索 Perplexity 在网页端排名第三,并首次入围移动端榜单,正好排在第 50 名,差点名落孙山。

Perplexity 超过 7 分钟的用户平均停留时间,甚至略胜于 ChatGPT

比起 等传统搜索,Perplexity 直接提供简洁、实时、相对准确、可以引用信息来源的答案。数据说明,AI 搜索的形式在一定程度上走通了。

OpenAI 的 Sam Altman 也对这种形式保持认可,然而,OpenAI 的 AI 搜索 SearchGPT 还在小范围地内测,用户比 CEO 更着急。

ChatGPT 定位最像、竞争更直接的产品是 Claude,来自前 OpenAI 员工创立的 Anthropic。这次,Claude 的排名有所提升,在网页端排名第四,好过上个榜单的第十。

今年 6 月,Claude 推出的新功能 Artifacts 突破了聊天窗口的限制,可以实现实时可视化、互动编程等,拓展了用户与 Claude 交互的方式,好评不少。

▲Artifacts

除了早已功成名就的一代目,通用助手的赛道也有一些后起之秀。

字节跳动这次一次性上榜了五个产品:教育应用 Gauth、开发平台 Coze、通用助手豆包、豆包英文版 Cici、照片和编辑 Hypic。

除了 Hypic,其他都是首次出现在榜单,其中,豆包移动端第 26 名、网页端第 47 名,Cici 也在移动端排到第 34 名。

豆包的功能发展得很全面,并且多端覆盖,使用门槛又低,日常场景够用,所以有这么大的用户量,也在情理之中。论做产品和商业化,还得看字节。

另外,AI 助手 Luzia 首次上榜移动端,一来就是第 25 名。

你可能没有听说过这款产品,它主要服务西班牙语环境,全球拥有 4500 万名用户。最初,Luzia 作为 WhatsApp 的聊天机器人出道,但 2023 年 12 月有了独立的 app

除了什么都能聊的通用助手,消费者对于 AI 还有哪些垂直的、特别的需求?

一个重要的趋势是,大家都在用 AI 搞创作,并且创作的形式越来越丰富了。

a16z 的网页端榜单里,52% 的公司支持图像、视频音乐、语音等的内容生成和编辑。

其中包括 7 家新上榜的公司,排名还不低,视频生成工具 Luma 排在第 14 名,音乐生成工具 Udio 排在第 33 名。

和 Udio 同一个赛道、被称为音乐界 ChatGPT 的 Suno,存在感更是暴涨,从今年 3 月的第 36 名,上升到今年 8 月的第 5 名。

榜单和榜单的纵向比较也很有意思,之前的榜单里,大多数内容生成工具围绕图像。

但现在,图像生成的占比降到了 41%,只有一个图片生成工具(SeaArt)首次上榜,视频生成工具出现了三个新面孔(Luma、Viggle 和 Vidnoz)。

端新增产品

Udio 上线于今年 4 月,6 月则是 AI 视频工具爆发的一月,快手可灵、Dream Machine 的 Luma AI、Runway 的 Gen-3 Alpha 接二连三发布。

可以看到,不过半年,AI 在音乐和视频上的输出质量,都卷出了成绩。

至于移动端,最常见的创作形式是编辑图像、视频。相关工具占到榜单的 22%,是移动端的第二大产品类别。

▲Adobe Express

虽然也有初创公司涌现,但排名更高的,是那些在生成式 AI 浪潮里转型、推出更多玩法的传统创意公司。

其中有我们比较熟悉的名字,美图秀秀国际版 Meitu 在第 9 名,字节跳动旗下的照片和视频编辑器、醒图国际版 Hypic,位列第 19 名。

另外,韩国互联网巨擘 Naver 旗下的相机应用 SNOW 第 30 名,内置了 Adobe Firefly 生成式 AI 的 Adobe Express 第 35 名。

之前 washingtonpost 做过一个调查:人们会和聊天机器人说什么?他们分析了数千次对话,第一是搞黄色,第二是完成家庭作业。

最近也有一款很火的 P 肌肉应用 Gigabody,让你提前看看增肌之后的模样。它会产出很多照骗,也会打击健身人群的自信心,因为很可能练了半天,还不如 Gigabody。

举出这两个例子,是为了佐证 a16z 的结论。

a16z 移动和网页端的榜单,都出现了一个很有意思的新类别:美学和约会。

其中包括三个新入围移动端榜单的工具:LooksMax AI(第 43 名)、Umax(第 44 名)和 RIZZ(第 49 名)。

▲移动端新增产品

LooksMax 和 Umax 采集用户的照片并评分,然后给出建议,提升你的魅力。Umax 甚至会给出一个「满分模板」,也就是 AI 眼里你的完美模样。

LooksMax 不仅照顾到了颜控的看脸需求,也会分析用户声音的吸引力。

但它们的用户规模并不大,LooksMax 超过 200 万,Umax 在 100 万左右。

可能和这个赛道太卷有关,上网随便搜搜能够找到大量身体美颜滤镜,减肥、增肌、健身、变胖、换衣服,AI 都能帮忙,我们不再需要在 B 站学习复杂的 PS 教程

但这些应用的套路又都很类似,靠订阅赚钱,能赚多少是多少,Umax 每周收费 4.99 美元,LooksMax 每周收费 3.99 美元。

如果说 LooksMax 和 Umax 是认识更多发展对象的敲门砖,下一步就该用 RIZZ 了。

笨嘴拙舌的用户,可以用它提升回复约会 app 消息的水平。上传对话截图、个人资料等,RIZZ 都可以教你说些高情商表达。

古代的邹忌问身边人「吾与徐公孰美」,童话里的皇后问魔镜谁是世界上最好看的人,现在的人们则在问 AI:我怎么变得更帅、更漂亮、更有魅力,怎么不算一种科技与狠活呢?

食色性也,情感关系未必在人和人之间,也可以是人机。这次,AI 伴侣应用 Character.AI 排在移动端的第十,上次是第十六。

其实,上榜的还有一些尺度更大的 AI 伴侣应用,包括 Janitor、SpicyChat、candy.ai、Crushon 等,但 a16z 没有特别强调出来。

拿 a16z 今年 8 月的榜单和今年 3 月相比,近 30% 的公司是新公司。

如果再拿今年 3 月和去年 9 月的榜单相比,那么这个数字是 40%。

可见 AI 产品竞争之激烈和残酷,新一代 AI 原生产品和公司的发展速度,前所未有地快。

下一个爆款的 AI 产品,可能会是什么?答案或许在社交产品 Discord 出现。

a16z 发现,Discord 的流量,能够体现一个产品有没有潜力,尤其在内容生成方面。

Discord 的好处是,提供了服务器和交流社区,开发者无需构建完整的前端产品,所以它很适合作为一个沙盒,用来验证 PMF(产品与市场契合度)。

很多产品都是从 Discord 起步,构建社区,测试功能,积累用户,然后才有自己的独立,比如 Suno 和

时至今日,Midjourney 还是所有 Discord 服务器邀请流量的第一名。

▲ 在 Discord 受欢迎的 AI 公司

截至 7 月,10 家 AI 公司在所有 Discord 服务器邀请流量中排名前 100,与 1 月相比,其中一半是新秀。

AI 继续发展下去,未来可能连 app 的概念都会消失,人手一个 agent,AI 主动帮我们解决需求,但现在,我们还是从被用户选择的 app 中,一窥 AI 的可用性如何被定义。

常言道「不要创造需求」,产品的成功不在于通过广告等人为方式制造需求和虚假繁荣,而是找到并满足已经存在的、真实的需求。

AI 也是这样,融资、刷屏、炒作之后,依然是沉默的大多数,做出最诚实也最落地的投票。其中,有没有你正在使用并欣赏的产品呢?

We crunched the data to find out: Which gen AI apps are people actually using? And which are they returning to, versus dabbling and dropping?


2024 年 3 月:

Thousands of new AI-native companies are vying for attention. We crunched the data to find out: Which generative AI products are people actually using?


2023 年 9 月:
https://a16z.com/how-are-consumers-using-generative-ai/

PicLumen – 免费好用的 AI 图片生成与编辑工具,支持免费商用

By: Anonymous
13 August 2024 at 13:26

DUN.IM BLOG

DUN.IM BLOG

PicLumen 提供一整套由 人工技术驱动的照片编辑和生成,用户在注册后从控制台输入提示词生成各种图片,选择不同的图片模型、长宽比、画质或进行各种细项的微调,此外,PicLumen 还整合 AI 抠图和编辑工具,可以说是非常先进、快速且方便易用的图片生成功能。

AI 生成的图片素材可自由使用于个人和商业用途,无需额外付费购买授权,生成的图片相当真实,任何类型的图片都能制作生成,不过要注意你只能将自己生成的图片使用于商业用途,其他人的图片可用作参考,但是不允许直接使用〔稍作修改即可〕。

如同大多数的 AI 图片生成器服务,PicLumen 也提供「探索」功能,查看其他用户生成的图片素材,也可以获取他们使用的提示词、反向提示词和各项参数,或是对图片进行「重混」〔Remix〕,如果没有什么灵感的话不妨在探索页面查看其他用户所使用的提示词和相关参数。

依照 PicLumen 支持中心提供的页面所述,PicLumen 生成的图片可以用于个人和商业用途,但要注意以下几点重要事项:

Create your unlimited AI images with PicLumen's AI image generator. Join the best AI image creator and turn your text to images freely.

进入 PicLumen 后点击首页「Generate for Free」按钮,来到登入注册页面,必须先注册账号才能使用,也可直接以 账户快速登入。

PicLumen – 免费好用的 AI 图片生成与编辑工具,支持免费商用

登入后会看到「探索」页面,也就是其他用户以 PicLumen AI 生成的图片,点击后会看到提示词和相关信息。

如果要自己生成图片,点击左上角「Create」进入图片制作工具。

生成器上方有几个可供调整的选项,包括 AI 图片模型、图片长宽比、画质和单次生成图片数〔最多四张〕。

长宽比〔Aspect Ratio〕功能很好用,预先选择要使用的图片比例后就不用后续编辑裁切。

将提示词输入后点击右边的「Generate」就能开始生成图片,速度很快,不到一分钟就会出现结果。

提示词右上角还有一个选项,可以设置反向提示词、CFG Scale、Steps 和 Seed。

PicLumen 一次可生成 1-4 张图片结果,看起来会有点像〔但又不太一样〕,如果不满意可微调提示词或切换为不同的图片 AI 模型,重新生成新的图片。

点击图片后会进入详细资料页面,从中间的按钮就能图片、AI 抠图或 AI 放大〔如下图红色圈选处〕。

PicLumen 还能将图片直接以 AI 去除背景,省去手动抠图的步骤,去除的效果也很优异!

前面有提到 PicLumen 本身也能查看其他人生成的图片,点击左上角「Explore」就能探索更多图片,很厉害的是利用 PicLumen 可以制作出各种风格的素材,从详细信息页面就能看到提示词和相关选项,稍微研究一下、修改后也能制作出很专业的图片哦!

在探索页面点击其他用户制作的 AI 图片,右下角会有一个「Remix」按钮能快速将相关信息带入 AI 生成器。

The Maps Express – 简单方便一键查询 Google 地图的 Chrome 扩展

By: Anonymous
9 August 2024 at 13:14

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

The Maps Express」是一款 扩展程序,支持各种常见浏览器例如 的 Safari、Chrome 上的 Edge、Chrome、Brave、Arc、Opera,安装后可在选取要查询的地点时通过鼠标右键菜单或快捷键快速查询 Maps,能保存最近查询的十条历史记录,还能将地点收藏〔支持导出、导入功能〕,非常方便!

值得一提的是 The Maps Express 有一项「 摘要」功能,通过 Google Gemini 对当前网页进行分析、快速找出可能的餐厅、咖啡店、商家或景点关键词,让用户以 Google Maps 快速查询相关结果。

No Description

进入 Chrome 程序商店页面,点击右上角「加到 Chrome」安装到浏览器后即可使用。

那么要如何进行查询呢?很简单,只要选取店家名称、右键菜单就有「通过 The Maps Express 查询」快速带入 Google Maps 查询地点,也可使用快捷键〔Ctrl+Shift+S/⌘+Shift+S〕进行操作。

如此一来就将好几个步骤的操作过程简化成一个动作。

The Maps Express 本身也具有查询功能,点击扩展按钮后会进入类似如下的窗口,最上方的查询字段就如同是 Google 地图查询功能,可以快速在地图查询指定地标,查询记录会保留近期查询的 10 条记录,这些信息只会存在用户的浏览器。

点击查询记录的地标会快速打开 Google 地图,将光标移到地标上可以「加入收藏」。

The Maps Express 收藏清单功能基本上可以算是更方便的 Google Maps 收藏功能,将地标加入收藏后还能利用下方的功能进行导出或导入〔格式为 .JSON〕。

再来介绍一下 The Maps Express 最有趣的「页面摘要,可以使用 AI 技术来摘要地点,第一次使用时需要设置一下 API 密钥,不过不会太难,只要有 Google 账户、几个步骤就能搞定。

点击 API 后会有设置说明,浅显易懂,先连接到 Google AI Studio 页面,第一次使用会有注意事项,勾选底下第一项同意使用条款,按下「Continue」继续到下一个步骤。

接着点击中间的「Create API key」建立一个 API 密钥。

按下「Create API key in new project」按钮,如下图箭头标示位置。

生成 API 密钥后按下「复制」获取这段代码,回到 The Maps Express 扩展贴上后即可进入 AI 功能。

The Maps Express 页面摘要工具是使用 AI 来摘要地点,简单来说,在网页点击「Gemini 摘要」后就会自动分析网页出现的地标,将相关结果自动加入、方便用户以 Google Maps 查询或是加入收藏。

下图就是使用 AI 页面摘要、分析上的文章后得出的相关地标,非常快速、准确!几乎把文章中列出来的所有咖啡店都呈现在列表,省去要一个一个复制查询的时间,如果平常会经常在网络上查询信息的朋友可以试试看这项功能〔只是前置需要几个设置步骤〕。

利用书签小工具,定制浏览器专属功能

By: Anonymous
27 July 2024 at 12:46

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

Bookmarklet 本质上只是一次性的 Javascript 代码,不能持续运行、实时监控,固然远不及正式的浏览器,且不论 上的添翼利器,即便是戴着镣铐蹒跚而行的 Safari 插件,当然也比 Bookmarklet 更强大。不过,普通人毕竟不太可能自己开发插件,然而制作一个 Bookmarklet 则很有可能。

易于制作只是一方面,在硬币的另一面,则深深刻印着通用二字。只要不用特别晦涩的代码,几乎所有现代浏览器都可以跑 Bookmarklet,Chrome 和 Edge 自不待言,Vivaldi、Arc 和 Brave 也可以,甚至常常被讥为「当 IE」的 Safari 都能用。我个人还特意先为 Safari 编写 Bookmarklet,由俭入奢易,通常写出来的东西在更先进的浏览器中可以直接运行。如果愿意,就连手机浏览器也可以用 Bookmarklet。

所有设备都能使用 Bookmarklet

在 2024 年重谈 Bookmarklet,还有着现实原因。一方面,Safari 和主流手机浏览器令传统插件生存艰难,这是 Bookmarklet 势在必行的历史背景;另一方面,GPT 拆除了代码——至少是简单代码——的门槛,让自制 Bookmarklet 不再显得凡尔赛。此外,即便在插件生态完善的浏览器中,若能借助最新的人工技术随意自制以供己用,也是一种对 Home Made Tool 的呼应。

某种程度上,本文所谓的 Bookmarklet 制作更像是用预拌粉制作蛋糕,技术难度不高,但原材料的压力就随之上升——必须先获得可以运行的 Javascript 代码。这曾经是 Bookmarklet 的阿喀琉斯之踵:既然某人有能力自己写 Javascript,他为何不再接再厉做个浏览器插件(并通过闭源大赚一笔)呢?Bookmarklet 不温不火,自然有这层原因。

好在 GPT 彻底颠覆了编程,至少是简短的代码。Nielsen Norman Group 精辟地指出,人工智能将交互范式从命令式推动到目的式,不少任务无需指挥计算机,只需告诉他你最终想要的效果,通常就能得到不优雅但有效的代码。而控制网页的 Javascript 通常都不会太复杂,非常适合让 GPT 去写,而且如果一次不行,大不了多生成几个回答,就像摇彩蛋一样——而且基本不花钱、不限量。我曾突发奇想把网页搞成灰色,免受花花绿绿图像的干扰,问了 GPT 后马上获得答案。

找 GPT 讨 Javascript 代码

此外,现成 Javascript 代码也是宝贵。例言之,Keyboard Maestro 论坛中有不少用 Javascript 控制网页的讨论,很多其实就是纯 Javascript 套壳,并不囿于 Keyboard Maestro,你可以复制过来当成 Bookmarklet 的素材。

一旦获得 Javascript 代码,之后的工作将势如破竹,各种 Bookmarklet 生成工具一抓一把。在技术上,从 Javascript 到 Bookmarklet 无非是一系列文本替换,把代码修整为超链接的形式。我考虑过编写本地自动化工具,不过也愿意直接用在线服务,最常用的是 Bookmarklet Creator。惟需注意,GPT 生成的代码中有大量双斜杠 // 开头的注释,转换为 Bookmarklet 前需要删除,否则 Bookmarklet 不生效。

用在线工具将 Javascript 转换为 Bookmarklet 注意:如需使用在线服务,建议确保您上传的 Javascript 代码中不包含敏感信息,例如个人信息或 Token。

转换成功的 Bookmarklet 应当以 javascript: 开头,呈现以下格式。

获得 Bookmarklet 的代码(链接),很多不熟悉 Bookmarklet 的人都卡在后续的安装步骤。不同于正式的插件,Bookmarklet 不是独立的按钮,而是一枚书签,使用时通常需要在浏览器地址栏或栏——在现代浏览器中,两者往往融合了——中启用,这种操作确实反直觉,毕竟点击一个书签时,第一反应肯定是跳到新页面。好在尝试几次之后,这种操作反而更有优势:连没有插件栏或工具栏概念的移动端浏览器,也能用 Bookmarklet。

安装 Bookmarklet,其实和添加普通网页书签无异。以 Safari 为例,首先随便收藏一个网页(快捷键是 ⌘Command-D,然后在新空白标签页中编辑它,换上 Bookmarklet 的代码。之后,这个书签就成了一颗轻量级的浏览器插件,浏览网页时按下去即可触发 Javascript 代码。

编辑书签并换上 Bookmarklet 代码

接下来的问题就是:如何在网页上使用 Bookmarklet?如果你一直显示收藏夹栏,就直接点击其中的 Bookmarklet;如果不习惯持续显示——可能是为了节省屏幕空间——则点击浏览器地址栏或搜索栏,在弹出的收藏夹项目中点 Bookmarklet,若没有看到,则可能需要在 Safari 设置中勾选“Show Favorites”。

在 Safari 浏览器设置中勾选「Show Favorites」

我常常需要裁判文书,而默认的打印效果非常差,夹杂了大量无关元素,而正文反而被压到一边了。最初我写了一段 Javascript 并包装成 Keyboard Maestro 解决此问题,结果同事见后都羡慕不已,于是我顺手做了一个 Bookmarklet 版,不仅不依靠 Keyboard Maestro,连操作系统和浏览器也没有什么要求,从 Safari、Chrome 到 360 用户都能正常下载裁判文书。

用 Bookmarklet 重新排版裁判文书

熟悉用户自动化的读者,大概也能想到替代方案,然而像 Bookmarklet 这样获于此而得于彼的通用工具,却不多见。在自制 Bookmarklet 难度骤降的当下,诸位也不妨将其作为备用方案。

尼卡果实并未令我失望

By: Steven
16 January 2023 at 22:34

问题来源:为什么大多数人不能接受《海贼王》橡胶果实变成尼卡果实?

我的观点:

因为尾田既坚持了热血王道漫的套路,又打破了读者既定的期待和幻觉。

无论你作为个人是否承认,但你无法否认一件事,人们喜欢看热血王道漫的一个基本心理预期是:把自己作为故事的主角代入进去,感受那种拼搏到最后,获得成功的痛快!但这个故事套路在大部分人的心中有一个基本模板,那必然是由下至上的成长与逆袭,因为这是绝对多数读者的真实愿望。人们知晓自己的渺小,但渴望成功,这才造就了这类题材的大热。不接受「尼卡」并非不接受这个名字,而是不接受「自己无法继续代入」,无法继续成为「由无名之辈进阶到封侯拜相的故事主角」。人们所失望的,是「那个王不是自己」。

想必很多人不同意这个观点,但我想提三个问题,请各位一起想一想:

1、艾斯死的时候,岩浆凌驾于火焰之上,可以接受吗?

2、获得了同一颗果实的萨博所打出的炎帝,和艾斯的是一回事吗?

3、香克斯能结束顶上战争,五老星也得给面子,真的是面子果实吗?

我的一些浅见是:

一、多数人并没有因为艾斯的死而质疑果实上下级的关系,最核心的原因在于,几乎没有读者会把自己代入到艾斯的角色里,不会觉得自己的愿望无法达成而失望和愤怒。因此可以比较冷静地从旁分析果实上下级的合理性,去理解这个设定的前因后果,甚至认为尾田这么画是故事推动到此处的必然,是故事的神来之笔。

但其实岩浆是高温融化的石头,火焰是氧化反应的表象,两者根本不在一个维度上,除了温度高低外并没什么关联,但没人会在乎这种类型的 bug,因为它不影响读者的阅读体验,没人会觉得自己是艾斯,给我个差不多的理由就行。

二、如果两个人拿到同一颗果实后,施展出的是不同的招式,那么我们可以说,个人对果实能力的开发至关重要;如果两个人施展出的是同一种招数,只是训练强度不同,造成的效果强弱有差异,那么,个人对果实的开发就不是那么关键的,而是训练的效率更为重要。

回到艾斯和萨博的例子上,这一招炎帝,是属于艾斯的,还是属于果实的?

很显然,既然萨博能够打出和艾斯差不多的炎帝,那就意味着,炎帝不是艾斯的专属,是任何一个拥有这个果实的能力者都可以训练出来的一门技术。那么,作为一门技术,它能否发挥出强大的效果,是取决于果实本身,还是使用果实的人?我相信黑胡子很清楚这个道理,否则他不会那么执着于获得白胡子的果实,更不会坚持要打造最强的全员能力者海贼团。因为他是懂得技术的价值与人的关系的人,不然他干嘛要隐藏那么多年,一心选定暗暗果实呢?尾田把手术果实安排给艾斯的话,合理吗?

再进一步,既然贝加庞克能够复制果实能力,能够把血统因子工程化,那就意味着无论是果实还是种族,在海贼世界的设定里就是科技树的一部分。但凡是科技,是刀杀人还是人杀人的争论就绝对不会停止,但无论怎么争论都必须正视一件事:没人使用的科技,啥也不是。

换句话说,尼卡这门技术可以交给任何人,但最好是路飞。

因为那么强大且令人发笑的能力,最好交给最纯真的那颗心来驾驭。这样的剧情安排才合理,否则这个从一开始就贯穿至今的「Joyboy」到底「Joy」在哪里?让巴基来 Joy 大家吗?一个胆小怕事的真小丑,你觉得能够让大家 Joy 起来吗?还是交给黑胡子这样的终极大恶,最后用橡胶锤打扁他?

我相信 Joy 不是那么肤浅的快乐。

它最好由一个没心没肺、吃人一口饭就念着报恩的傻子来实现。

三、比起路飞的宿命,这个红发男人的宿命就不值得失望和愤怒了吗?

这个男人串起了消失的一百年、月球文明、世界政府的巨型草帽这种超巨大的谜团,这样的人会因为一个村子的小孩吃了个橡胶果实不能游泳就舍弃一条手臂?已经把新世界的希望堵在这种事情上了,哪个脑回路清晰的作者会把解题的重点放在刻苦开发果实能力、卷赢其他能力者这个方向上啊?

大家都是东亚文化圈里熏陶出来的人,尾田会真心觉得卷是路飞的出路吗?香克斯和路飞一出场就把牛吹那么大,一个随意进出世界政府的面子人,咱们平心而论,他罩着的主角要只是个逆袭屌丝,你觉得这样的安排跟玛丽苏/杰克苏有什么区别?

宿命,不是原罪,无力面对宿命才是。

假如后期的剧情,路飞成为尼卡果实的表演者,失去了作为他自己的个性,没有主导和实现自己的想法,那么我会说很失望;如果接下来的路飞依然是那一千多话的没心没肺大笑、快意恩仇不拘小节的大傻子,做判断的依据仍然是他的纯真内心,那他就是尼卡的主人。

很多人觉得自己只要也拥有了一个亿,就也能干出一番伟业来。这是宿命论者们最喜欢相信的谎言,也是被宿命打击时最容易失望和放弃的原因。但事实上不是的,你拿着顶尖的武器,没有使用它的方法和能力,你什么也做不了。

海贼世界里,哪个能力者的果实和他的个性不是对应关系的?这就不是宿命了?这有一颗果实,无论什么属性,是它主宰你,还是你主宰它,这才是宿命与否的唯一判断。

我不认为随着剧情的推进,尾田一点点把世界观和科技树铺陈开,这有什么问题。尤其是当你知道,古代的科技远超今天,此时的科技全靠考古的时候,一切都说得通了。那么果实这种科技产品,作为一项工具被人使用,就一定不会是卷中之卷的通关秘籍。

路飞拿了一手好牌就令人失望么?

不是的,他把好牌打烂了才令人失望!如果没有前面一千多话的历练,那么尼卡果实就是个普通的橡胶球,路飞也不过是个不会游泳的普通人;为什么在打凯多的时候觉醒,恰恰是因为凯皇才配得起这个巨大的份量,只有被三番五次打败后的路飞,才有机会完成历练,让尼卡成为尼卡,让自己成为配得起尼卡的那个人。

路飞正在成为可以直面和挑战宿命的那个人,把自己代入到主角视角的读者,也应该有这份心情和觉悟,才能体会到「命运管不着老子」的热血王道漫之精髓!尾田是真懂的。

Ai 绘画将从何处开始进入日常生活?

By: Steven
10 January 2023 at 21:30

最近几个月 Ai 绘画这个话题很火,但基本上大家都只是看个热闹,跟普通人的生活没多大关系。或者说,大家感觉不到它和自己有什么关系。只有相关从业者,感受到了巨大的生存压力和身份危机。

但和当年支付大战的春晚红包类似,能让普通人都参与进来、玩起来的场景可能才能让大家感受到:Ai 绘画意味着什么,能做什么。

尽管众多以文生图的 Ai 工具已经大幅度降低了创作门槛,但是在那之前,各种咒术、法门终究是拦住不少普通人接触 Ai 绘画的一块巨石。我自己也曾在用过某些 Ai 工具后,在一条展示初次接触的创作成果的视频里提醒大家,不要忽视它,但也不要过分害怕它。它一定会给我们的生活带来巨大的变化,只是目前还没积累到那一刻,仅此而已。

如果说有什么场景,类似发红包那样简单明了,人人都可以参与,我觉得有一个非常合适的应用场景,那就是用 Ai 生成定制头像。对于不具备绘画能力、不懂念咒语、不会使用绘图软件的大多数人而言,Ai 画头像就是各类修图美容软件一级的场景,既有尝新和娱乐,也有充分的社交属性,和红包非常相似。

最近试用了一下漫镜,一个感觉是,神情抓得不错,风格也足够多,用它来探索自己不同造型的可能性,还是挺有启发的!因此中途我想到一件事,如果这类产品的效率再高一些,跟各大连锁发型屋合作,预约时就上传几张照片,生成几套发型方案,人到了现场就让托尼老师根据效果图来剪,这不是非常好的体验升级么?谁说 Ai 必然逼得人失业呢?还得是看人怎么用。

除了头像,你觉得还有哪些场景,适合普通人体验 Ai 绘画呢?

点解图片体验 AI 制作头像

DownloadYoutubeSubtitles – 免费快速下载 YouTube 字幕,无需登录支持多种格式和语言

By: Anonymous
6 July 2024 at 14:46

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

DownloadYoutubeSubtitles 字幕器,主要功能是将 YouTube 视频字幕下载为三种常见格式,包括 .SRT、.VTT 或 .TXT,不但很快速而且非常易于使用,无需额外下载,即使是手机或平板电脑一样可以操作,只要把视频网址贴上、选择要下载的字幕语言和文件格式后就能快速获取字幕文件。

要注意的是 DownloadYoutubeSubtitles 只支持公开视频,因为服务本身没有登入账户的机制,在下载视频字幕时会依照用户的浏览器语言提供适合的语言建议选项〔例如中文用户会看到繁体中文、简体中文和英文字幕〕。

当然也可选择所有 YouTube 视频支持的字幕语言,自动翻译字幕也能利用这项服务下载。

如果 DownloadYoutubeSubtitles 无法使用,也可以尝试其他 YouTube 视频字幕下载

Download YouTube Subtitles in .srt .vtt and .txt format with this free subtitle extractor tool online.

进入 DownloadYoutubeSubtitles 后从右上角切换语言,有「简体中文」可以选择。

YouTube 视频网址复制、贴上,点击右边「获取字幕」按钮。

如果 YouTube 视频有字幕的话就会看到结果画面,DownloadYoutubeSubtitles 会在左侧显示「为你选择的字幕」也就是最适合用户的语言,例如繁体中文、简体中文和英文,分别有 SRT、VTT 和 TXT 三种格式,点击后就能快速下载字幕文件。

要注意的是 DownloadYoutubeSubtitles 在下载文件时会同时打开另一个网页〔可能是〕,使用时请特别留意。

下方还会有视频的主要字幕、自动翻译的视频字幕,可以获取各种语言字幕文件或是自动翻译的视频字幕。

DownloadYoutubeSubtitles 无法下载有年龄限制的视频或是需要登入才能浏览的私人视频,除此之外,若视频不是使用字幕文件的功能载入,而是将字幕直接嵌入视频,也无法使用下载工具获取视频字幕文件。

loader.fo – 多平台在线视频下载器,支持 4K、格式齐全

By: Anonymous
30 June 2024 at 14:47

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

loader.fo 是一个、快速的在线器,主要用于保存 、SoundCloud、Vimeo、TikTok、IMDb、X〔前身为 Twitter〕和 Twitch 等平台视频,类似的网络服务太多,操作上都大同小异。

loader.fo 和其他网络视频下载一样都支持多种格式,主要分为视频和两种,视频有不同画质的 MP4 和 WEBM 格式,值得一提的是支持最多 4K 画质,而且还会有声音。不像一般下载器可能只能单独获取影像或音频,必须自行将两者合并;音频的话有 MP3、M4A、WEBM、AAC、FLAC、OPUS、OGG 和 WAV。

试试这款独特的工具,从 YouTube 快速无障碍地下载视频。使用这款可靠高效的下载工具,让你的离线视频收藏焕然一新。

进入 loader.fo 后先从网址字段右侧选择要下载的文件格式,分为音频和视频两种,视频从 360p、480p 到最高 1440p〔WEBM 支持 4K 画质〕,将视频网址贴上后点击下载就能获取文件。

loader.fo 能下载 YouTube、Twitter、Facebook、OK.ru、TikTok 等网络影音平台,如果遇到无法正确检测视频或出现问题,也能试试看其他下载服务

将视频网址贴上、选择要保存的格式后点击右边的「Download」下载按钮。

loader.fo – 多平台在线视频下载器,支持 4K、格式齐全

loader.fo 需要一段时间处理视频,当显示「Download in Progress…」时需要等待一段时间,有时候可能无法正常显示视频略缩图,但测试后还是能够正常获取文件。

完成后就会有下载按钮,点击「Download to Your Device」就能将视频保存到你的设备。

Removerized – 免费简单的 AI 图片背景离线去除工具

By: Anonymous
28 June 2024 at 14:14

DUN.IM BLOG

DUN.IM BLOG

Removerized」是 背景去除,可以快速删除背景,完全免费!在使用上没有限制,离线模式亦可使用,快速、准确且操作上相当简单,支持 PNG、JPG 和 WebP 图片格式,将图片拖曳到工具后就能自动处理,约几秒钟即可转为透明背景。

Removerized 是开放源码项目,除了自动抠图模式外没有提供手动编辑功能,不一定 100% 适合各种类型的图片,有需要的朋友可以自行试试看。

进入 Removerized 后点击上方「Click to upload」选取要抠图的图片,或是直接将图片文件拖曳到上传字段〔支持 PNG、JPG 或 WebP 格式〕,接着点击「Process」开始抠图处理。

Removerized – 免费简单的 AI 图片背景离线去除工具

第一次使用会跳出 AI 模型的提示信息,需等待一段时间。

完成后图片出现背景被清除的动画,利用网站中间拖曳轴查看抠图前后的图片差异。

点击下方「Download」按钮即可将去除背景、转为透明背景的图片下载保存。

拼字幕 – 免费上传图片,批量添加字幕,一键生成字幕拼图图片

By: Anonymous
20 June 2024 at 22:06

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

拼字幕」是一键生成字幕拼图的在线,操作方法简单,用户只要将拖曳到工具即可加入字幕文字,调整字幕呈现顺序、字号、主次字幕、调整字幕文字高度和样式,无论是使用于封面、媒体或是图文故事展示都能让图片更引人注目哦!

编辑完成后就能将图片、保存为 PNG 格式,不用额外注册账号,接下来就实际示范一下操作方式。

拼字幕是一个极致便捷的在线拼图工具,方便社交媒体运营快速生成用于小红书引流的字幕拼图。通过简单几步操作即可生成名人语录、字幕等拼图内容,完美适用于小红书、微博、视频号、抖音等平台,为你的内容引流增粉。无论是打造个人品牌,还是提升社交媒体曝光率,拼字幕都是你不可或缺的利器。拼字幕, 字幕拼图, 字幕生成, 字幕生成器, 字幕截图, 小红书, 小红书引流,小红书流量,字幕制作, 名人语录, 电影台词, 马斯克说, 罗翔说, 乔布斯说, 余华说, 董宇辉说, 字幕图片, 字幕拼接。

进入拼字幕后把要加入字幕的图片拖曳到网站,或是点击「选择图片文件」进行上传。

拼字幕 – 免费上传图片,批量添加字幕,一键生成字幕拼图图片

接着图片会显示于工具中,从右上角「字幕内容」输入要加入的字幕,可以新增行数、清空或调整顺序,加入字幕左侧预览就会即时更新。


从下方调整不同字幕样式、字幕高度和字体大小,因为拼字幕有部分样式是简体中文字型,套用在繁体中文可能有显示不正确的问题,看起来会有点不太一样,但不影响使用。


拼字幕有一个「进入主次字幕」功能很好用,可以同时显示中文和原文,如果加入字幕时想让原文一起显示,进入这个选项即可加入两种语言字幕,主字幕的字体会大一些,次要字幕或贴着主字幕,阅读距离很舒服。


完成后点击图片下方的「下载图片」按钮将它保存为 PNG 格式。


下图就是使用「拼字幕」制作的字幕图片。

Claude 3.5 VS ChatGPT-4o 生成 Web 小游戏实测对比

By: Anonymous
19 June 2024 at 20:57

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

经过了一年的时间,Claude 从 2.0 版陆续升级到 3.5 Sonnet 版本〔2024/6〕,在 Claude 3.5 Sonnet 中推出了几个显而易见的改进:

你只要免费注册登入一个「 Claude 」账户,就能开始使用最新的 Claude 3.5 Sonnet 模型,然后别忘了进入「Artifacts」功能,试试看直接在对话中生成你需要的网页小工具、小,乃至于简单的 PPT。

下面我会实际测试这些成果,并且与 制作出来的版本做对比,提供有兴趣的朋友参考。

我用下面这个共同指令,来测试看看 Claude 3.5 与 ChatGPT-4o 是否可以「直接」做出可用的乱序抽签网页小工具。

让我先来试试看 Claude 3.5 Sonnet 结合「Artifacts」的效果。直接输入上面的指令,Claude 就会分析我的需求,开始撰写源码,并立即生成可以预览、互动的 HTML 文件,而右边窗口可以直接进行操作。

看起来 Claude 3.5 Sonnet 只要简单的指令,就能很好的理解我的需求,并且可以自己设计需要的架构与源码,我并没有讲得太细,实际呈现出来的效果都是 Claude 3.5 Sonnet 自己分析出来的。

接着我们试试看 ChatGPT GPT-4o 做出来的成果如何?用同样的指令,ChatGPT 也可以根据我的需求自行分析网页需要的架构、逻辑,然后自行写出源码。

不过,ChatGPT 目前没办法像 Claude 那样在右方直接预览成果。

所以我请 ChatGPT 直接打包成 HTML 文件让我下载。

下载后,下面是 ChatGPT 制作出来的版本。界面与操作也很不错,并且自己加上了一个可以设置数字范围的额外字段。

和 Claude 3.5 Sonnet 版本对比,你觉得哪一个比较好呢?

接着,我测试了设计贪吃蛇网页小游戏,用下面的指令,直接套用在 Claude 和 ChatGPT 上。

把指令输入 Claude 3.5 Sonnet,同样的,AI 自动分析需要的架构、逻辑,一次问答,就生成出右方一个可以操作互动的贪吃蛇小游戏。

游戏中可以用键盘控制方向,有吃球长大的效果,也有失败的机制,是一个可玩的小游戏。

同样的指令输入 ChatGPT GPT-4oChatGPT 这次写出一串很长很长的源码,我同样请其直接打包成 HTML 文件给我,同样是一次生成,中间没有经过任何修改。

下面是 ChatGPT 制作出来的贪吃蛇小游戏,多出了一个「控制游戏快慢」的功能,而其他部分则和 Claude 的效果一样。

从前面两个实际测试案例来看, Claude 3.5 和 ChatGPT-4o 都能「一次生成」上述的网页小工具、小游戏,他们都会完整的分析我的需求,AI 自行进行需要的设计逻辑分析,然后自动写出完整的源码。

不过 Claude 3.5 Sonnet 多出了一个 Artifacts 功能,可以直接在右方预览效果,确实看起来很方便,如果要进一步修改,也会更加简单。

例如,我下面尝试让 Claude 3.5 Sonnet 制作 PPT,我先提供一些资料,请 AI 设计大纲并产出 PPT,Claude 3.5 Sonnet 就制作出一个可以在右方预览的版本,而且是真的可以翻页。

但我想调整风格,所以我上传一张风格图片,请 Claude 3.5 Sonnet 分析,并据此改变 PPT 风格,没想到效果居然非常好!〔如下图〕

看起来「 Claude 3.5 Sonnet」结合 Artifacts,确实值得要对源码、网页、文件有需求的朋友试试看。

Kill the Newsletter! – 免费好用的订阅邮件转 RSS Feed 源工具

By: Anonymous
16 June 2024 at 15:15

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

当想通过 RSS 订阅一些人的文章时,却只提供订阅和邮件订阅(News Letter)。为了解决这个问题,找到了一个 Kill the Newsletter! 服务,它可以替你接收邮件并转化为可供 RSS 阅读器订阅的地址。

Kill the Newsletter! 允许用户将订阅邮件转换为 Atom 订阅源。对于需要的订阅源,也会将确认邮件转换为订阅源条目,只要进入转换的地址,就可以获取并点击确认链接。

暂不支持通过回复邮件来验证订阅,可以尝试联系发布者手动验证,或使用邮件设置转发作为解决方案。

另外,有些 Newsletter 的发布者可能会将 Kill the Newsletter! 的电子邮件地址拉黑,同样需要转发之类的绕过。

由于订阅源包含用户的电子邮件标识符,因此不建议订阅源,以防止他人取消订阅或发送垃圾邮件。

通过以上步骤,你就可以把原本只能通过邮件接收的内容转化为 RSS 订阅,方便在各种 RSS 阅读器中统一管理和阅读。

Luma AI – 免费文字生成视频实测,支持中文和图片直接生成

By: Anonymous
9 June 2024 at 20:59

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

这几天很热门的 AI 是:「Luma dream machine」,一款 AI 生成 5 秒钟动态的在线服务,并且号称有逼真的物理反应、运镜和人物动作,可类比之前 Open AI 公布的 Sora ,不过 Sora 虽然效果惊人〔还可生成一分钟视频〕,却尚未对一般用户开放。而 「Luma dream machine」 已经可以让一般用户直接试用,提供每天最多生成 10 个短片,每个月最多生成 30 个视频的免费账号额度。

如果想要试试看 AI 直接生成逼真视频效果,那么「 Luma dream machine」会是目前能够让我们马上可以体验看看的选择,在电影运镜与真实物理效果上,也确实比 Pika 之类 AI 生成动态画面的成品更突出。

Luma AI – 免费文字生成视频实测,支持中文和图片直接生成

Luma AI 上宣称的几个特色为:

而我针对上面宣传的几个特色,实际去测试后,目前的心得是:

例如下面这个雨中场景的短片〔可点击这个链接,观看短片播放〕,就可以注意到背景与路人基本上稳定,但前景的两个主角虽然有拟真的跑步动作但也有明显的错误,而指令虽然是英文但也没有 100% 符合。

下面是我实际测试的几段短片的合辑,可以看看从一般用户角度出发,生成的视频可能出现的各种成功、失败情况。

无论如何,我们都可以注册一个免费账号,试试看「https://lumalabs.ai/dream-machine」。

接着在指令列,输入对于视频场景、动作的描述。可输入中文指令,也可输入英文指令。通过「Enhance prompt」可以帮助指令最佳化,但也可能是因为这样而对于中英文指令似乎都无法 100% 掌握。

等待一小段时间,就可以根据我们的文字指令,生成 5 秒中的短视频。

在视频上点击右键,选择,就能获得 MP4 文件。

下面这段山谷溪流小船的视频〔点击链接播放〕效果就不错。

另外一个很适合「Luma dream machine」的使用方式,是把经典、真实照片中的人物变成电影短片场景。

例如我可以在指令列先上传一张狮子照片,然后辅助指令描述,让 AI 根据照片来生成。

这时候 Luma AI 会根据照片内的实景、人物生成更多的影格,最后串联出一个电影短片。

例如这个狮子走过草地的照片变成的电影短片〔点击观看〕,草地的场景被自动延伸生成,狮子也从侧面多出了正面,虽然多少有些不自然的地方,但也足够让人惊艳。

我还下载了一张第一次世界大战时的黑白照片,尝试让 AI 把照片中的军队动起来。

最后,Luma AI 自动延伸了房屋后的场景,并让军队往前前进〔点击观看视频〕,虽然,视频一开始的动作还好,但很明显的视频后段前进的步伐非常不自然〔人物动作依然比较容易出错〕。

在 Open AI 的 Sora 尚未开放前,就让我们来试试看「 Luma dream machine」,体验一下 AI 生成视频的效果吧!

清理「内容农场」,让 Google 中文搜索再次伟大

19 October 2021 at 11:00

如果你习惯使用 Google 搜索中文关键词,想必早已发现,一段时间以来,排在搜索结果前列的总有那么几个东拼西凑、前言不搭后语的垃圾页面:前几天惹了众怒的小 X 知识、小 Y 百科;去年一度肆虐的兰州养生、热备资讯;甚至还包括国内几家头部互联网公司的那一堆云社区……

这些网站自己不产出内容,却凭借针对性的 SEO,极力提升在搜索引擎中的权重,并从中牟利。不论标题和风格如何,它们都有一个共同的名字:内容农场(Content farm)。

🖕

内容农场是什么意思?内容农场从何而来?请问在 Google 搜索时,频繁遇到内容农场是怎么回事?为什么一瞬间就有好多内容农场出现?大家可能会很惊讶,内容农场怎么会排在 Google 搜索结果第一页呢?但事实就是这样,小编也感到非常惊讶。如何在搜索结果中屏蔽内容农场,相信大家都很好奇要怎么做到。不少同学都很想了解内容农场,下面就让小编来为大家介绍一下内容农场的详细内容,快来一起看看吧!

内容农场是什么梗?让小编来告诉你

本文的上一段,是一种典型的内容农场文风,俗称「小编体」。其特征是通篇复读同一关键词,围绕热点话题,套用固定格式,车轱辘话扯上千字,以浪费读者时间为己任,往往还伴随着剽窃行为。自媒体平台的营销号们这么做,是为了使文章更容易被搜索,以提高阅读量,榨取更多收入。

将「小编」替换成「网站」,就是所谓的内容农场了:快速产出大量低质内容、不择手段吸引流量、借此牟取暴利的网站。放任甚至鼓励小编体营销号生长的部分国内平台,个人认为应当同样归类为内容农场。

让我们先从「快速产出大量低质内容」说起,点开一家内容农场的主页,往往只能看到少量正常文章,与普通网站无异,但若使用 site: 语法检索全站,Google 很可能会在几毫秒的时间内返回数百万条结果。

这是什么概念?

少数派开张九年有余,几百作者共同创作,迄今只有不到七万篇文章。而一个内容农场站群所掌握的域名数量可能数以千计,如果把每个页面都打印后连起来,内容农场的内容产出速度很可能会超越光速——但这并未推翻狭义相对论,因为其中不传递任何信息。

一二三四五六七位数

此等更新速度,显然不是因为雇了一个集团军的写手团队。内容农场的文章通常直接爬取自其它平台,用自动化程序实现从采集到发布的一整套流程。比较不讲究的,就是聚合下社交网络热门关键词,拼凑生成网页,主动推送至各大搜索引擎,能骗一个是一个;稍微先进点的,会扒下整篇文章,掐头去尾,再加上自己的水印,甚至直接复刻一个李鬼网站;技术力再高一点,可能从 Stack Overflow、GitHub 等外国网站搜刮热门内容,机器翻译后当成自家原创,或者干脆中翻英再翻中,让读者难以找到原文出处。

某机翻 Stack Overflow 的内容农场

辛辛苦苦搭建网站,维护爬虫,还要搭上不少直系亲属,显然不是为了普及百科知识或宣传兰州养生文化,从中榨取到的流量才是重头戏。在这方面,最具代表性的内容农场是屹立数年不倒、一般人根本察觉不了的「每日頭條」。据 SimilarWeb 数据,其在 2021 年 9 月的访问量超过三千万次,每位访客平均浏览 1.9 个网页,90% 的流量均来自站外搜索引擎。即使按最保守估计,仅凭借网站上的 Google AdSense 广告,站长也早就财务反复自由了。

五倍杀少数派

惊天内幕!内容农场总在前列的秘诀

内容农场罪大滔天,搞到网民怨声载道,各路搜索引擎何故视而不见?其中自有玄机。

还是以每日頭條为例,其绝大部分内容都直接抓取自微信公众平台、今日头条等致力于构建「生态闭环」的内地网站,而上述平台对通用搜索引擎极其不友好。因此,如果你发表了一篇公众号独占的原创文章,除搜狗外的搜索引擎只能索引到盗文的内容农场。在极端情况下,若原文被和谐,这些网站甚至可能成为唯一参考来源。

换句话说,在 Google 眼中,每日頭條的文章均属原创,而且量大管饱,精品频出,不排第一简直对不起作者。

这 就 是 原 创

内容钻了简中互联网信息孤岛的空子之外,每日頭條堪称一位守法公民。网站布局简洁,加载速度喜人,广告投放克制,文章交叉关联,HTML 头部标签齐全,AMP、响应式设计等对 SEO 有帮助的技术全不落下,哪家搜索引擎会不喜欢这样的好网站呢?当然,Google 在 版权常见问题解答 中明确指出,依据《数字千年版权法案》,所有侵犯版权的网页都会被移除,还提供了 移除向导申诉表单。然而,只有相应的版权拥有者或代理人才能提出申诉,并需要提供详细说明。

本表单具有法律效力哦

不过,千万被侵权的作者中,总有几个愿意花费大量时间和精力维权的。为了不留隐患,每日頭條早年间主动屏蔽了中国大陆的 IP 地址,专心做港台和其它华人地区的生意,而任何异常行为都可能导致你的 IP 被封禁,包括但不限于使用代理、开启浏览器隐身模式、访问频率过高等。此外,每日頭條还将 robots 属性设置为 noarchive,即允许搜索引擎收录但不允许快照。再加上严格的反爬策略,各种网页存档工具都很难获取正文,也让取证成为难事。

大陆 IP 禁止访问

更多的内容农场只是靠更新频率制胜,短时间内冲一波权重,捞够就换皮跑路,君不见小 X 知识的主域名现在就已经挂牌出售了。对于这种没有实质内容,意图操纵搜索排名的网站,Google 的打击力度一直比较大,直接访问 Google 垃圾网页举报工具,如实填写网址和被污染的搜索关键词即可。如果网站还展示了 Google 广告,不妨顺路 报告违反合作规范的情况,没准就把对方的广告联盟账户整没了。

Google 垃圾网页举报工具

净化搜索结果的妙招,地球人都哭了

内容农场往往手握众多域名,一个被降权,套娃立刻上线,-example.com搜索语法 也只能作为临时措施。而 蜻蜓计划 等重返大陆的方案被搁置后,Google 对中文搜索已经基本进入了放养状态,在桌面端优先展示移动版网页都是常有之事。

这两个结果都是移动版网页

短期内,我们很难指望 Google 优化相关算法,也不太可能通过人工手段干预搜索结果。如果你不想切换到其它搜索引擎(当然,其它搜索引擎也不会好到哪去),更实际的方案是设法将内容农场从搜索结果中剔除。

uBlacklist

眼不见为净,最直接的方式当然是避免搜索结果中出现内容农场。uBlacklist 这款浏览器扩展就能自动屏蔽 Google 搜索页面中出现的低质量结果,支持 ChromeFirefoxSafari 等主流平台。安装后,搜索结果的网址后面就会出现「加入黑名单」按钮,允许你通过域名、标题和正则表达式屏蔽不想看到的站点。例如,规则 /^https:\/\/www\.example\./ 将匹配所有以 https://www.example. 开头的 URL。规则的进阶用法,不妨参阅 MDN 文档对 匹配模式正则表达式 的讲解,uBlacklist 官网也给出了 部分范例

编辑屏蔽规则

成功创建规则后,下次搜索时,uBlacklist 便会帮你隐藏已屏蔽的域名,并在顶部显示屏蔽数量。如果没搜到想要的结果,也可以暂时取消屏蔽,检查是否有误伤,uBlacklist 会高亮展示这些条目。对了,在扩展的选项页中,能够自定义高亮的颜色模式,还可以单独高亮指定搜索结果。例如,规则 @1*://*.sspai.com/* 将以设置的「颜色 1」高亮所有少数派文章,一眼认出优质结果。

不要问我为啥转载比原文排名靠前

uBlacklist 默认仅为 Google 搜索结果启用,你可以在扩展的选项页中手动开启支持必应、DuckDuckGo、Ecosia 和 Startpage 四款搜索引擎,需要同意「存取相关网页数据」的额外权限。同页面还提供更多自定义选项,手动编辑、导入、导出规则,使用 Google 云端硬盘或 Dropbox 云端同步数据等功能。但最实用的,还属「订阅黑名单列表」,让我们在下一段详细道来。

uBlacklist 选项页

内容农场茫茫多,单靠自己添加,怕是得把这当成全职工作才行。这种时候,就有必要借助社区的力量了,一份由全球网友贡献并维护的优质规则列表可以极大地节约我们的时间。

目前,更新最及时、社区最活跃的中文项目是 Google Chinese Results Blocklist,自 2016 年不断完善至今,已覆盖数千网址,提供 精确匹配模糊匹配 两种规则,复制订阅链接后直接添加即可。uBlacklist subscription compilation 是一个较为激进的项目,整合网络上大部分订阅列表,通过 GitHub Actions 自动更新。如果你经常搜索编程关键词,我推荐尝试针对 机翻 Stack OverflowGitHub 采集站的规则列表。也欢迎你参与上述项目,分享遇到的垃圾站点,让更多人受益。

中文搜索结果黑名单项目

用户脚本

如果你正在使用 Tampermonkey 等用户脚本管理器,不妨试试 Google Hit Hider by Domain 这款脚本,支持 Google、百度、必应、DuckDuckGo、Yandex、Yahoo 等主流搜索引擎。其使用方式与 uBlacklist 类似,点击标题后的 block 按钮屏蔽相应域名,可选择最小化为一行灰色摘要或彻底移除。

尽管只是脚本,Google Hit Hider by Domain 却提供了不少定制选项,同样支持导入和导出规则,前文介绍的 Google Chinese Results Blocklist 也提供了相应格式的 配置文件,下载后在工具栏内点击 Import 按钮即可。

Google Hit Hider by Domain 屏蔽效果

主业是去除搜索结果重定向、美化网页样式的知名脚本 AC-baidu 也内置了「自主拦截域名」附加功能,只是需要手动启用,其屏蔽规则格式与 Google Hit Hider by Domain 一致,复制上述列表内容后手动粘贴保存即可。

Ban Bad Websites 脚本不仅能标记低质量博客、下载站等,而且适用于所有网站上的超链接,但要求用户手动编辑源代码修改配置,门槛较高。

翻译垃圾再利用」脚本则可以从机翻 Stack Overflow 的网站自动重定向至原文地址,省时省力。

AC-baidu 屏蔽效果

终结内容农场

只屏蔽搜索结果,有时还是难免一脚踏入陷阱,被某个看似无害的超链接带进内容农场的地盘。「终结内容农场」这款扩展就是对付它们的利器,不论身处何方,它都能在每个指向内容农场的链接前加上醒目的红色感叹号标志,与正常链接区分,并在进入农场前再次贴心提醒。

若依然执迷不悟,不妨点击「查看」按钮,浏览屏蔽多媒体内容和内嵌脚本后的纯净版页面,不让农场主骗取一分钱广告收益。想浏览完整网页,只能通过「解锁」按钮,但必须输入验证码,而且有冷却时间,避免频繁使用失去屏蔽的意义。

Judgment Day

「终结内容农场」扩展自然也支持订阅网络屏蔽列表,除了预设的 标准内容农场清单,在 GitHub 项目资料库,还提供了较为主观的 类内容农场清单、聚焦社交网站账户的 社群内容农场清单、报道罔顾事实的 假新闻网站清单 和谋财害命的 诈骗网站清单 等,可以根据自己的实际情况导入使用。

屏蔽名单的语法在扩展选项页有详细说明,支持正则表达式匹配和通用转换规则。用户还能填写 Google 表单,报告新发现的内容农场或被误杀的正规网站,让扩展更加完善。

「终结内容农场」选项页

除了专用扩展,uBlock OriginAdGuard 等现代广告过滤工具同样支持自定义拦截规则列表,亦可用来屏蔽内容农场。在 Android 设备上,将 内容农场检查器 设为默认浏览器,即可在打开内容农场前收到提示;不过我更推荐使用 FirefoxKiwi Browser 等支持安装扩展的浏览器,再借助上文介绍的方法提升搜索体验。自 iOS 15 开始,移动端 Safari 浏览器也支持安装扩展,目前 uBlacklist 已经适配,相信未来会出现更多实用工具。

uBlock Origin 屏蔽效果

以下就是结语了,希望能够帮助大家

个人抵制内容农场的最佳方法,是无视它。不点击、不阅读、不分享,不给对方贡献任何流量,唯有令运营者无利可图,才可能甘愿退出。如果你是内容创作者,可以开设属于自己的博客,或者在对搜索引擎友好的平台撰文,好内容不应当是微信公众号独享。

每个人都做力所能及之事,改善严峻的简中互联网环境,才是根绝弊病的治本之道。

以上就是关于内容农场的全部事情了,希望能够帮助到大家。喜欢本文的话,不要忘记点赞分享关注,您的支持就是小编继续前进的动力。更多更快更新精彩内容,尽在【🆂※🅷※🆈 Ⓢⓗⓤⓝⓨⓤ∘🅦🅐🅝🅖】。大家对内容农场又有什么想法呢,欢迎在评论区告诉小编一起讨论哦!

三星手机的「捷径」,如今更好用:Bixby 日常程序 +

13 May 2021 at 03:21

若想进阶 Power User,一款趁手的自动化工具必不可少,在移动设备上,iOS 快捷指令和 Android 平台的 Tasker 是个中翘楚,少数派已有数不清的文章介绍。对三星用户来说,其实还有另一个选择:Bixby 日常程序。它最初亮相于 2019 年的 Galaxy S10 系列发布会上,经过两年的迭代,易用性和功能性都有长足进步,覆盖了大部分日常情景。

四月底,三星旗下的另一款系统级增强工具 Good Lock 迎来家族新成员 Routine +,为 Bixby 日常程序添加了多项新特性,玩法更丰富的同时,也让它在生产力方面迈出一大步。这结论缘何而来,是否略显夸张,读罢本文,你应该会有答案。

日常程序,是什么?

鉴于 Bixby 日常程序的默认入口较深,也鲜有文章介绍,切入新功能前,我们不妨先熟悉下本体。如果你还不知道这是什么,请前往「设置 → 高级功能」启用「Bixby 日常程序」选项。为了方便日后查找和使用,我建议同时将其图标添加至应用程序屏幕。下拉通知栏,编辑按钮,还可以将开关添加至快捷面板,随时启用或停用。

启用 Bixby 日常程序

打开 Bixby 日常程序,三星已经为我们准备了数款预设的自动化流程,如在家时更改声音模式和快捷方式,连接耳机时读出特定应用的通知,运动时播放音乐并启用定位服务……点击即可预览具体操作,快速编辑或保存。滑至主界面底部,我们还能通过清晨、驾驶、睡前等推荐的生活情景,按提示一步步创建最适合自己的日常程序,掌握它的基础用法。

建议的日常程序

与可编程能力更强的 Tasker 相比,我更愿意将 Bixby 日常程序称为本地版 IFTTT:图形化用户界面,没有高昂的学习成本,逻辑也是最直观的「如果满足触发条件则执行指定操作」。作为一款预置应用,Bixby 日常程序主要覆盖 Android 系统功能,操作的分类和图标与「设置」一致,支持 Samsung DeX 等独占特性,还能与三星自家设备联动,控制智能家居,开启无线耳机的主动式降噪等。

if trigger then action

最简单的日常程序,也可能为我们省下不少时间。拿基础的「打开特定应用程序」触发条件来说,观影时启用杜比全景声、阅读时进入护眼模式、办公时解除屏幕方向锁定等常用操作,都可以交给 Bixby 日常程序处理。如果你始终开启眼睛舒适度保护,也可以设置为打开设计工具时还原屏幕色彩;在启用自适应旋转的平板电脑上,改成打开部分未适配手机应用时保持纵向显示更合适。最关键的是找准手机使用过程中的痛点,因地制宜。

如果应用程序打开

将多种操作组合,较为复杂的工作流程也不在话下,如:

  • 充电时,自动延长锁屏时间,并开启息屏提醒,不影响续航的同时随时查看通知;
  • 打开游戏,智能调整屏幕分辨率和刷新率,顺便开启无线耳机的游戏模式,降低音频延迟;
  • 连接车载蓝牙,则打开导航应用,读出短信通知,拒接来电并回信;
  • 借助「到达或离开指定地点」触发条件,可以在地铁站切换至 NFC 卡片模式或显示支付宝乘车码,在家和公司采用两套完全不同的手机配置方案。

一次触发,多种操作

当然,触发条件也不局限于一个,给我们更多施展空间。检测到睡眠状态且处于夜间,则开启免打扰模式并降低屏幕亮度;若是还忘记充电,再采取其它措施节省电量,以防关键时刻手机掉线。这种情况下,当日常程序结束时,就不必撤销所做的改动了。上课时段,若在教学区连接至校园 Wi-Fi,调整手机为静音,启动专注模式;想对自己更狠一点,「如果工作日打开摸鱼 App,则关闭摸鱼 App」的日常程序或许会有奇效。

更进一步

Bixby 日常程序的最大软肋,是仅支持预设动作。坐拥自定义 Bixby 快捷命令、读取 NFC 标签、过滤信息关键词等潜力巨大的触发条件,却不支持变量传递;「进入网站」操作离跳转 URL Scheme 只差一步,却必须以 http:// 开头,扩展性远不足以满足进阶用户的需求。

入门以上而专业未满,让 Bixby 日常程序的定位略显尴尬。即将介绍的 Routine +,则在维持易用性的前提下,一定程度上弥补了这个缺陷,我们不妨在下文见识一番。

不止多个加号 SAGA

Good Lock 是三星官方推出的系统定制工具,由功能各异的模块组成。从诞生初期的系统界面美化,到逐步添加的诸多实用特性,现已成为集定制主题、导航手势、通知过滤、多任务处理于一身的全能选手,是所有三星用户都值得安装的利器。如果你未曾听说,不妨阅读少数派的这两篇文章:

近期上线的 Routine + 模块,顾名思义,是 Bixby 日常程序专精,目前支持基于 Android 11 的 One UI 3.1。具体来说,它提供三种新触发条件和三种新操作,配合原有功能,实现更强大且精准的自动化流程。

条件

安装 Routine + 后,再次打开 Bixby 日常程序,你会发现触发条件最底部多出了相应分类,可以覆写指纹、按钮和 S Pen 的硬件设置。如遇熊孩子抢手机,兰花指一伸,直接进入与主系统隔离的儿童空间;S Pen 顺时针画个圈,设备便开始播放音乐,顺便启动番茄计时。按钮操作不妨与其它条件结合,例如上文提到的乘车码,改成在地铁站双击侧面按钮时打开,既方便又不用担心误触发。

新触发条件

操作

Bixby 日常程序的操作中,同样新增了 Routine + 类别,分别为触摸宏、模拟方向键和读出文字。后两者的应用面似乎较窄,需要方向键辅助的触屏应用本就少见,文字转语音也算不上高频操作。我暂时能想到的,只有用 S Pen 隔空玩贪吃蛇比较方便,以及收到催稿信息时能知会一声 TACTICAL NUKE INCOMING 了。触摸宏的画风则大不相同,有必要另起几段详细说明。

新操作

触摸宏的作用,是记录我们的点击、滑动等操作的时间、位置和次序,保存后随时调用,有点类似 Windows 平台的按键精灵。创建触摸宏时,需要先抵达目标界面,然后点击浮动工具栏的录制按钮,执行希望模拟的流程,测试成功后,点击保存即可。为规避 App 响应速度等因素带来的影响,我建议留出一定的容错空间;如果途中不慎误操作,可以回溯历史,依次删除上一步。

创建触摸宏

不用说,Bixby 日常程序自然能与 Bixby 快捷命令配合使用,触摸宏的出现,得以了却我长久以来的夙愿:用 Bixby 控制米家设备。提前录制好动作,创建相应的日常程序,指定一则合适的口令,就可以指挥 Bixby 替我们跑腿了。当然,不设置快捷命令,直接对 Bixby 说「启动 XX 日常程序」就行,Android 11 的电源菜单也远比这高效,但生活还是需要一点仪式感的,不是么?

君子动口即动手

触摸宏的真正价值在于重复的机械化行为,打开应用时点击跳过广告、接近公司时钉钉打卡、快速擦亮闲鱼宝贝、商城抢购热门商品、手机游戏挂机等高频操作,都可以用它轻松搞定。另一方面,导航手势也在触控操作范围内,进入其它 App 不影响触摸宏的录制。因此,只要图标的相对位置不变,一键签到多款 App 的日常程序并无理论障碍。实际运用中,需要保证 App 不会更新改版,可行性不高。

触摸宏的应用之一

纵有诸多限制,我仍将触摸宏视为能引发质变的新功能,跳出有限的预设命令,模拟脚本也难以完成的繁琐操作,极大地拓宽了 Bixby 日常程序的应用边界。由于以「录制」而非「编写」的形式呈现,使用门槛维持在较低水平,缺乏编程知识的普通用户也能掌握。如果在后续更新中,能引入简单的变量传递和识别文字点击特性,Bixby 日常程序将真正踏入专业范畴。

最后,有必要在这里提醒各位读者,借助触摸宏自动化抢券、挂机等行为有几率被判定为使用作弊脚本,导致账户遭到限制甚至封禁,还请谨慎设置,不要滥用。

分享

可能是由于此前的操作都比较简单,Bixby 日常程序并不支持同步,在设备间迁移数据成了麻烦事。新操作之余,Routine + 也带来了日常程序的导入与导出功能,分为二维码和 JSON 两种形式,与朋友分享自己的得意之作或者备份到云端都很方便。不过,导出的日常程序会丢失自定义图标信息,触摸宏也无法完整保留,必须在新设备上重新录制,期待进一步完善。

扫一扫,没惊喜

结语

目前来说,如果你有足够的动手能力和编程知识,Tasker 无疑更加强大,指纹解锁和 S Pen 手势等硬件触发条件也能通过 Logcat Entry 功能实现,可以说是 Bixby 日常程序的上位替代。

但对大多数普通三星用户来说,系统自带的 Bixby 日常程序无需另行付费,上手简单,直观易懂,功能也足以满足日常所需,是自动化工具入门的不二之选。

Routine + 和触摸宏的出现,赋予了 Bixby 日常程序更多可能,让它有能力满足一部分生产力需求。同时,得益于友好的录制方式以及对三星自家特性的充分利用,Bixby 日常程序实现了相较于 Tasker 的差异化亮点。两年间的多次改版与更新,证明了三星对它的重视程度,期待 Bixby 日常程序能维持现有的低门槛,加入更多专业功能,成为 One UI 不可不知的「必备应用」。

在 macOS 上离线识别文字,TextSniper 能帮你做到

8 December 2020 at 21:20

不论是阅读扫描版 PDF,还是在看社交网络上的一图流,从图片中提取文字都是难免会遇上的需求。在 macOS 上,少数派曾推荐过不少 OCR 工具,它们的原理通常是调用百度、腾讯等大厂接口,上传图片,返回结果。

这就带来了几个问题:一是我们很难保证时刻在线,但指不定什么时候就要用;二是图片经由第三方服务器处理,个人隐私无法得到完全保障;此外,接口按量计费,采用订阅制才有希望平摊成本,偶尔使用并不划算。

TextSniper 这款应用,就能解决你的这些顾虑。它采用离线识别算法,不联网也能工作,而且速度相当快。在近期更新中,它加入了对简繁中文等更多语言的支持,并优化了整体识别精度,我们不妨在本文中测试一下它的实际体验。

初次打开时,TextSniper 会请求屏幕录制权限,然后就会静静待在菜单栏一角,等待召唤。使用它捕捉文字的默认快捷键是 ⇧Shift-⌘Command-2,也就是 macOS 存储屏幕截图的快捷键数字减一。当然,你也可以通过菜单栏图标执行,或者修改为更顺手的键位。在设置中,我们可以选择主要识别语言,并配置其它快捷键。

按下快捷键,选择要捕捉的屏幕区域,就大功告成了,TextSniper 会将识别结果自动复制到剪贴板,无需其它操作。如果你正在做书摘,可以启用「追加剪贴板」功能,将多次识别结果合并在一起。此外,TextSniper 还能将文字转换为语音,自动朗读出来。

我也截取了几张比较有代表性的图片,交给 TextSniper 处理,结果还是挺不错的。对于畸变、模糊、纹理等比较复杂的情形,TextSniper 都得出了正确答案。不过,就像同类工具那样,它也远非完美,如果语段比较长,还是人工再核对一遍为妙。令我比较失望的是,TextSniper 完全没有针对竖排文本做优化,希望能在后续更新中解决。

你可以在 官网Mac App Store 花费 6.49 美元购买 TextSniper,它同时包含在 Setapp 订阅中。TextSniper 最低支持 macOS Catalina,但识别中文需要升级至 macOS Big Sur。

整合邮件、日历和 RSS,这次更新让 Vivaldi 不止于浏览器

1 December 2020 at 03:41

2013 年,Opera 15 正式放弃 Presto 引擎,转而采用 WebKit 构建,同时也剥离了众多既有特性,其中包括备受欢迎的 M2 邮件客户端。这一转变直接促成了 Vivaldi 浏览器的诞生,Opera 联合创始人兼前 CEO 谭咏文希望能借此延续 Opera 的精神,构建一款适应用户,而非相反的浏览器。

2015 年,Vivaldi 发布了首个测试版本,谭咏文承诺,它将在未来内置邮件客户端。对追求简洁的现代浏览器来说,这似乎有些离经叛道,但谭咏文觉得,这就是浏览器应有的功能。而且,不要忘了,许多 Opera 用户自千禧年就开始使用 M2,Opera 背离其原始设计理念后,很难找到一款同样灵活且强大的替代品,而 Vivaldi 正是为这些老朋友们打造的。

2020 年,历时数年开发,在众多志愿者们的支持下,Vivaldi 终于迈出了这一步。11 月 24 日,在感恩节前夕,提供 Vivaldi Mail 等特性的技术预览版本开放下载,它还有另一个名字,叫做 M3。除了管理邮件外,这一版本还整合了联系人、日历、任务和 RSS 阅读器等,听上去很棒,但它能否让你卸载现在的主力应用?我们不妨在本文中一探究竟。

全功能邮件客户端

目前,Vivaldi Mail 仍处于技术预览状态,因此,我们需要下载 最新桌面快照版本。出于稳定性考虑,如果你的默认浏览器是 Vivaldi,请慎重尝鲜。安装后,在地址栏输入 vivaldi://experiments/ 并回车,勾选「Calendar, Mail & Feeds」,然后重启浏览器,就能在侧栏面板中看到邮件、联系人和日历的图标了。

Vivaldi 实验性功能

现在,打开设置,你应当会发现多出了邮件、信息源和日历选项。Vivaldi Mail 支持 IMAP 和 POP3 协议,可以自动检测常见邮件服务器配置,免去手动填充的困扰。对了,如果你已经注册 Vivaldi 账号的话,还会自动拥有一个 @vivaldi.net 的免费邮件地址,验证手机号码即可开始使用。

邮件配置项

Vivaldi Mail 沿袭了 Vivaldi 一贯的高度可定制性,颜色主题、界面布局、工具栏按钮都随你心意。你可以按收件日期、邮件主题、发件人等属性排列自己的收件箱,也能决定要不要在列表中显示订阅邮件或垃圾邮件。进阶用户不要错过可完全自定义的键盘快捷键,Vivaldi 支持单键触发,工作更高效。不习惯敲键盘的话,所有操作都可以映射为鼠标手势,就是这么方便。

全键盘控制

同样可定制的,还有你的邮件工作流,用颜色旗标梳理邮件,或者添加自定义标签,然后创建智能过滤器并保存,用多重条件筛选邮件。值得一提的是,在 Vivaldi Mail 中,待处理邮件分为两种:「未览」和「未读」。前者是你尚未查看的邮件,后者则是已经阅读,却未进行后续操作的邮件。当然,Vivaldi 也允许你关闭这一功能,从而只显示「未读」计数。

未览与未读

我们都会订阅一堆邮件:新闻媒体的报道摘要,关注博客的最新动态,购物网站的折扣精选……Vivaldi Mail 会自动识别这些邮件列表,把它们整合在一起。你也可以手动将指定发件人视为邮件清单,并依照重要程度归类。不过,就我个人体验来说,这一功能还有待完善,许多完全不同的邮件都被归类在一起,而同一发件人的邮件又进了不同的列表,名称也难以辨识,可用性较低。

混乱的邮件列表

比收邮件更重要的,是发邮件。你不仅能用 Vivaldi Mail 创建一封格式丰富的邮件,还能将任意网页内容直接作为邮件发送,在一定程度上代替笔记应用的剪藏扩展。如果不想现在发送,Vivaldi 允许你将草稿暂存为队列,留待进一步处理。在侧栏中,我们可以管理自己的联系人和所有往来过的邮件地址,查看历史邮件记录或撰写新邮件。

不小心点了发送

个人隐私和数据安全,是 Vivaldi 的核心理念,它默认启用端到端加密,将全部数据存储在本地。在 Vivaldi Mail 中,你的所有邮件都拥有本地副本,即使服务器设置是 30 天后永久删除,也可以在 Vivaldi 的回收站中找到它,彻底杜绝误操作可能。

发布第一个版本后,Vivaldi Mail 不会就此停下。未来,它计划支持导入和导出本地邮件库副本,引入 PGP 加密,并进一步完善过滤器等功能,值得期待。

更简单的 RSS 订阅

用浏览器订阅 RSS,并不是件新鲜事。然而,2018 年 12 月发布的 Firefox 64 移除「实时书签」功能后,这一传统从此与主流浏览器无缘。不过,同是 Mozilla 旗下的 Thunderbird 邮件客户端 依然允许你订阅感兴趣的内容。Vivaldi Mail 同样整合了一款 RSS 阅读器,而且与浏览器集成,可以自动检测当前网站是否提供信息源,并一键订阅。

在地址栏的角落呼唤 RSS

订阅之前,不妨先看看它能提供什么内容。Vivaldi 可以将单调的 XML 文件转换为类似杂志的排版样式,可读性更高。自然,这不局限于在线网站,你还可以直接打开用其它 RSS 服务导出的 OPML 等格式文件,然后直观预览其中包含的信息源列表,一键订阅全部,或者只选择自己想看的部分。

RSS 文件预览

点击订阅,编辑信息源标题,配置刷新周期,然后就能在邮件面板中看到它了。借助旗标和标签,你可以像对付普通邮件一样处理文章,还能直接转发至稍后读服务的邮件地址,完善自己的工作流。这里还有一个小窍门:由于 RSS 被整合在 Vivaldi Mail 中,你创建的邮件过滤器也对它有效,在每天更新数千条的信息流中,只看感兴趣的关键词,这可是 Inoreader 的付费功能。

好看的

虽然没怎么做优化,但 Vivaldi 还可以成为一款泛用型播客客户端,方法也很简单,找到播客的 RSS 地址,点击订阅即可。Show Notes 会像普通文章一样渲染,音频则附在文末,点击即可收听。当然,我更推荐使用 Pocket Casts 等专业工具,但如果你只是偶尔听一期,又不是不能用,对吧。

禅修与浏览器开发技术

目前,RSS 阅读器与邮件客户端共享用户界面,但 Vivaldi 计划为其提供与邮件不同的 UI 设计,让阅读更舒心。

轻松规划你的生活

日历,是 Vivaldi 本次更新的另一重点,不仅常驻侧栏,还在开始页面拥有一席之地。Vivaldi 日历支持与自家的 Vivaldi.net、Google 日历、CalDAV 和其它网络日历同步。我本来想夸两句,却发现咕咕噜暂时停用了 Vivaldi 的登录权限,只能期盼尽快解决了。当然,这并不妨碍我创建几个本地账号,并试试它有什么特别之处。

您的设备未经 Play 保护机制认证.webp

一眼看过去,Vivaldi 日历的界面似乎和同行没有多大区别:中规中矩的格子间,熟悉的日、周、月、年和日程视图,要说哪里不一样,大概是可以同时拥有左右两个侧栏,从而在同一屏中纵览三种视图。仔细观察的话,你会发现,Vivaldi 会智能调整网格宽度,以适应当天事件的标题。如果每天都被日程塞满,你还可以调整布局密度,不错过任何约会。

更多好看的

Vivaldi 日历的另一特性,是行内编辑,点击任意空白处,或者按下配置的快捷键,输入事件标题,回车,便大功告成。如有需要,你也可以添加地点、链接、循环,并邀请其他人参加。觉得空间太小施展不开,打开日历设置,将编辑模式改为 Dialog,传统的弹出窗口就出现了。不要忘了,Vivaldi 还是浏览器,选中任意网页中的文字,也能将它添加为日历事件,只可惜不能识别日期,还需再接再厉。

两种编辑模式

日程规划和任务管理,本就如出一辙,不妨将日历事件标记为任务,督促自己按时完成。要做到这一点,通知提醒必不可少,打开设置,除了系统通知和浏览器内通知两个一看就懂的选项,还有「融入浏览器」和「燃烧浏览器」两种通知样式。不用多想,就是字面意思,前者会让屏幕如雪崩般瓦解,后者会直接升一团火,绝不会错过。

Inside my heart feelin’ the inferno

不要错过这些特性

除了这次添加的新功能,Vivaldi 的其它特性也值得称道。首先要说的,是用户界面,官网上「彻底的灵便性」不单是一句口号,地址栏要在顶部还是底部,右键菜单该有哪些命令,当前时间段要用哪种颜色主题,都由你做主。Vivaldi 甚至可以联动 Razer Chroma 外设和飞利浦 HUE 照明系统,家是什么样,浏览器就是什么样。

多样主题

Vivaldi 的标签管理同样堪称独门绝技,预览、休眠、锁定、克隆、分组、平铺,样样俱全。侧栏的 Web 面板允许你添加任何需要经常查看的网站,并通过移动视图打开,可以在查阅资料的同时做笔记,也可以忙里偷闲处理社交网络动态。Vivaldi 还单独适配了个别常用网站,直接把本地图片拖进 Instagram,不用安装扩展就能做到。

Web 面板

如果你是进阶用户,不要错过 Vivaldi 的快捷命令菜单。它类似 Alfred 和 Listary,可以执行多种指令,涵盖标签行为、书签历史、网页搜索等类别,还能进行简单的数学运算。Vivaldi 的全键盘操作和鼠标手势同样是提高效率的利器,内置的笔记工具支持 Markdown,能自动附加网页截图和链接,是快速记录的好选择。

快捷命令

如果你喜欢用少数工具解决多数需求,功能丰富、定制自由、不断迭代,且将用户的隐私安全放在首位的 Vivaldi 就是为你准备的。想体验它的特色功能,可以在官网下载其 最新正式版本,要提前用上 Vivaldi Mail,安装 桌面快照版本 即可。希望因「情怀」而生的 Vivaldi,也能成为你的朋友。

Google 相册取消无限容量备份,你还有这些优质选择

17 November 2020 at 16:20

2015 年 5 月发布后,Google 相册就成了我备份照片的首选。除了强大的智能分类和检索能力外,最吸引我的,当然是无限容量的高画质照片备份了。然而,在我备份了 24673 张照片和视频,把 AI 大军揭竿而起的日子往前推了好些天后,却突然传来噩耗。

11 月 12 日,Google 宣布,将 不再提供无限容量的高画质存储服务。2021 年 6 月 1 日起,高画质照片也将占用云端硬盘的存储空间,超出 15 GB 免费容量后,需要付费购买 Google One 套餐或删除部分内容,在这之前备份的照片和视频则不受影响。

除了个性化的 存储空间可用时长估算工具 外,Google 还表示,明年 6 月 1 日会推出一款全新的存储空间管理工具,可以智能筛选并删除过暗、模糊和其他不想要的照片,以节省存储空间。当然,如果你愿意掏钱购买 Google One 服务,自然是再好不过了。

如果你也是 Google 相册的老用户,却被一箭射中膝盖,不妨看看下面这些替代方案。

买一部 Pixel

不要笑,我是认真的。Google 承诺为初代 Pixel 手机提供终身原始画质备份服务,其他 Pixel 用户也依然享有无限高画质备份特权,不受此次变更影响。考虑到初代 Pixel 的市价早就跌到了千元以内,如果你是 Google 相册的重度用户,又能找到靠谱渠道,收一台来专门备份照片未尝不可。不过,新政策一出,Pixel 的价格也跟着水涨船高,还请多加考虑,尽快下手。

具体来说,你可以给 Pixel 接上充电器,放在家里,然后利用 SyncthingResilio Sync 等工具将所有设备上的照片都同步过去,让 Google 相册自动备份即可。除了充当备份工具人,一部时刻在线的 Android 设备还有不少有趣玩法,如离线下载终端、监控摄像头和虚拟女友等,待君发掘。

Amazon Photos

虽然在国内的知名度不高,但 Amazon Photos 是 Google 相册最直接的竞争对手之一。免费用户拥有 5 GB 基本存储空间,非国区 Amazon Prime 会员则享有无限容量的原始画质照片备份及 5 GB 视频存储空间,你也可以额外付费购买更多容量,起步价是每月 1.99 美元,100 GB 存储空间,和 Google One 相同。Amazon 会 默认启用图像识别技术,以提供智能分类、检索和回忆功能,你也可以在设置中手动禁用。

你可以前往 Amazon Photos 官网 了解更多信息,并下载其全平台客户端。关于 Amazon Prime 会员的权益、体验和订阅方式等信息,不妨参阅少数派的这几篇文章:

OneDrive

买 Office 送的 OneDrive,是备份照片的另一佳选。虽然没有无限容量,但 1 TB 存储空间对大部分同学来说都绰绰有余。如果你正在使用 Windows 电脑,直接打开照片应用就能看到自己上传的所有图片和视频,还有在本地进行的照片智能分类、个性化标签和人物识别等,体验如丝顺滑。此外,Microsoft 365 还提供了 3D、音乐和文本样式等高级效果,可以利用照片创建更精彩的视频项目。

你可以在 少数派正版软件商城 等渠道购买 Microsoft 365,提高生产力的同时,享受 OneDrive 高级版的诸多功能。

iCloud

只用苹果全家桶?iCloud 就是为你准备的。在设置中打开「iCloud 照片」选项,空间不足就买,还不足就加钱,享受 Apple 生态圈内的极致体验。即使不把所有照片都扔进 iCloud,照片流也允许你在任意设备上查看 30 天内拍摄的照片。你的设备还会在本地离线分析相册内容,帮助你按人物、地点、事物等筛选照片,提供与 Google 相册类似的体验。

其它主流品牌的手机通常也有相册云同步功能,小米云服务等部分尖子生还拥有网页端和全平台客户端,是相当出色的选择。

Yandex.Disk

作为俄罗斯最流行的搜索引擎,Yandex 在搜图方面相当有一手,许多时候都比 Google 更精准。在网盘方面,Yandex 也想更胜 Google 一筹,推出了免费无限容量的照片备份服务,而且是原始画质。不过,视频仍会占用你的 Yandex.Disk 存储空间,免费用户额度为 10 GB。购买任意档位套餐即可解锁无限容量的视频备份权限,最低每月 1.7 美元,100 GB 存储空间。

你可以在 Yandex.Disk 官网 看看它的其它卖点,决定长期使用的话,现在正好有活动,所有套餐八折优惠,11 月 22 日截止,不要错过了。

SmugMug

SmugMug 这名字或许有点陌生,最高光时刻似乎是买了 Flickr。这家公司专注于服务摄影师群体,提供图片托管、共享、印刷、销售等服务。对于个人用户和摄影爱好者来说,SmugMug 的 Basic 计划也是备份照片的好选择,除了无限容量的照片和视频上传外,还允许你创建自己的网站,与家人和朋友分享回忆。SmugMug 同时承诺保护你的隐私,绝不会窥探或销售个人数据,并提供完善的隐私权限控制。

趁着 Google 相册自毁长城之际,SmugMug 也推出了 针对性的促销活动,所有套餐首年六折,Basic 计划原价每年 55 美元,优惠后首年 33 美元。其子品牌 Flickr 的专业版计划 享受七五折优惠,同样提供无限容量的照片存储空间。

一刻相册

只要你在用百度网盘,就一定听说过一刻相册,毕竟百度已经使出各种招数,全方位推销了一年多时间,限量版无限码也基本做到了人手 3.14 个以上。就说现在,我刚搜索到一刻相册官网,打开主页,百度就恭喜我已经激活了专属无限空间,可以无限制备份原始画质照片和视频啦。如果你开启了百度网盘的自动备份功能,承诺永久免费、下载不限速,还支持一键导入和智能分类的一刻相册会是更出色的选择。

欲知详情,请前往 一刻相册官网,或者直接打开百度网盘,在醒目位置找到它的推广 Banner 即可。

时光相册

时光相册问世时,对标的就是 Google 相册,拥有智能分类和释放本地空间等功能,不过没有无限高画质备份,而是提供一定初始空间,通过任务获取更多容量。如果你是老用户,现在的容量估计已经相当可观,不过,新用户只有 5 GB,签到 7 天以上每天增加 50 MB。当然,时光相册也推出了会员计划,存储空间从 50 GB 到 2 TB 不等,可以上传的单文件体积、回收站保留时长和共享群人数也依次增加。

你可以前往 时光相册官网 或者在各应用商店搜索安装 App。

腾讯相册管家

腾讯相册管家稍微有点抠门,免费用户 500 MB 空间,而且安装后一张照片没上传,就开始 AI 自动分析本地相册了,不讲武德。免费用户也不能自动备份,需要开通 198 元的 SVIP 超级年费会员,享受 1 TB 空间和专属皮肤。那么,腾讯相册管家的优势是什么?拥有微信聊天、证件照等比较接地气的智能分类;和 QQ、微信集成的共享相册,与家人一起使用;还有不限量暂存七天的照片中转站,方便迁移。

感兴趣的话,你可以在 腾讯相册管家官网 了解更多信息。

阿里云盘

饱和式媒体通稿轰炸后,还没开放注册,也没有桌面端的阿里云盘已然成了「良心产品」的代表,只等着正式发布后干翻百度网盘。从目前的宣传来看,阿里云盘拥有超大存储空间、上传下载不限速、没有弹窗广告推送、企业级数据安全保护等特性,能保持多长时间就是另一回事了。具体到备份照片,阿里云盘还提供智能相册、AI 分类和视频倍速播放等功能,总之,百度网盘有的,它都要有。

你可以前往 阿里云盘官网 报名成为「个人云种子用户」,享受 1 TB 永久存储空间等特权,隔壁的 Teambition 网盘 也在招募公测用户,提供 2 TB 存储空间,不妨去看看。

自己动手

将数据托付给外人,心中难免有些忐忑,如果具备一定的动手能力,搭建一个专属于自己的云盘未尝不可。不论是 PlexKodi 等流媒体服务器,还是 群晖QNAP 等 NAS 解决方案,都可以帮助我们摆脱对科技巨头们的依赖。少数派此前也有多篇文章介绍,欢迎继续阅读:

iOS 上的全能文件管理利器:Documents by Readdle

30 September 2019 at 03:17

iOS 的发展史,也是一部开发者与苹果间斗智斗勇的历史。从小组件、色温调节到自动化操作,开发者们用自己的方式对抗 iOS 的封闭桎梏,并在多处细节上取得胜利,让原本的第三方功能被添加至正式版当中。

其中,一个里程碑式的事件是 iOS 11 引入了原生的文件 App,允许我们在手机上浏览各种来源的文件,更轻松地管理自己的工作和生活。而在此之前数年,知名 App 开发商 Readdle 就已经为我们带来了一款 iOS 上的文件管理工具,很直观地将其命名为 Documents。

在原生文件管理器功能不断得到强化的今天,我认为 Documents 仍有用武之地,不少特性甚至很难被取代。至于这样说的原因,我们不妨在本文探寻一二。

轻松浏览,来者不拒

Documents 的基础功能,当然是收纳及管理你的文件。它支持几乎所有常见格式,可以解压 ZIP 和 RAR 格式压缩包、播放 MP4、MKV、MOV 等格式视频、打开 Office、iWork 文档等。你可以通过文件夹层级整理文件,并打包压缩、通过邮件发送、添加星标或颜色标签等,与 macOS 上的访达无异。

管理文件

播放视频

浏览图片是我们日常工作生活中最高频的操作之一,而 Documents 不仅支持 PNG、JPG、GIF 等常用格式,还可以打开 SVG 等专业图像格式,甚至可以将图像转换为 PDF 格式(需要安装 PDF Converter),是设计师们的好帮手。

浏览图片

工作累了,不如听首歌放松一下吧。除了管理文档外,Documents 也是款优秀的媒体播放器,支持播放列表、循环播放、随机播放、隔空播放等诸多功能。稍显遗憾的是,Documents 的专辑封面识别功能似乎存在问题,部分在访达中可正常显示的封面无法在 Documents 中显示。

播放音乐

如果你喜欢读书的话,Documents 还可以成为你的最佳伴侣。除了我们最熟悉的 TXT 格式外,Documents 还支持 EPUB 这一专为电子书设计的格式文件。Documents 可以自动识别书籍的目录信息,还能够调整页面背景颜色、字体等,功能齐全。

阅读 EPUB 电子书

专业工具,高效办公

在上文中,我们曾提到,Documents 的支持格式涵盖 Office 和 iWork 两大平台,这一特性也使其在同类产品中脱颖而出。不论你的同事正在使用 macOS 还是 Windows,TA 发来的文件都能在你的手机上完美显示,团队协作更轻松。

浏览 Office 文档

除了阅读文档外,Documents 的另一项绝活是 PDF 批注。Documents 为你提供了画笔、放大镜、文本、形状、图章、高亮、下划线、删除线等数种标注工具,如果你同时安装了 Readdle 自家出品的 PDF Expert,还能解锁 PDF 编辑功能,文字图片随心插入。

批注 PDF

Scanner Pro 是 Readdle 的拳头产品之一,提供了高效准确的扫描功能,允许你将所有纸质文档永远保留。同为 Readdle 出品,Documents 也支持与 Scanner Pro 集成,让你在一个 App 内管理所有扫描文档,还能利用 OCR 技术识别图片中的文字,并自由复制使用。

管理扫描文档

下载上传,一站到位

下载是 iOS 原生缺失已久,大多数人又无法离开的功能。为此,Documents 专门开发了内置浏览器,可以从底栏快速切换,粘贴网址即可下载大部分类型的文件。你也可以在其它 App 中利用分享菜单快速发送网页至 Documents,省时省心。

Documents 内置的浏览器

到了 iOS 13,苹果终于给 Safari 加上了下载功能。只需要访问想要下载的链接,Safari 就会自动提示你是否要下载文件,并将其保存至 iCloud 云盘的「下载项」文件夹中,可以在其后拷贝到 Documents 使用。

Safari 下载管理器

除了访问本地和 iCloud 云盘中的文件外,Documents 还支持添加多种第三方服务,包括 Dropbox、Google Drive、OneDrive 等主流网盘及 WebDAV、FTP、SFTP 等传输协议,让你在一个 App 内统筹所有文件相关事宜。

连接第三方服务

此外,Documents 还推出了类似「隔空投送」的 Readdle Transfer 功能,只需要两部设备都安装有 Documents,就能快速端对端传输文件。如果你正在使用电脑,也可以通过浏览器访问 此网址 与移动设备建立连接,轻松管理手机文件。

Readdle Transfer

如果你已经心动,不妨打开 App Store,免费获取 Documents by Readdle,部分进阶功能需要安装同厂其它 App 才能使用。

近期上架的 Chrome 新扩展,这 10 款值得一试

20 September 2019 at 12:08

距离我上次推荐 Chrome 新扩展已经过去了四个月时间,商店里也出现了一大波新选手。在本文中,我将介绍其中 10 款实力玩家,包括新标签页、剪藏工具、外语学习、时间追踪、下载增强等,希望你能找到自己心仪的扩展。

DashOne

作为 Android 的特色亮点之一,桌面小部件(Widget)可以帮助我们在不打开应用的情况下了解最新动向、完成各种操作,而 DashOne 则将其搬到了你的 Chrome 新标签页上。它预置了天气、新闻、笔记、书签、快速启动及多种效率工具,允许你阅读 RSS 订阅文章、查看 Gmail 未读邮件、速览 GitHub 通知、处理 Todoist 任务,甚至玩一局打砖块或连连看,还支持自由排列和暗色模式。

你可以在 Chrome 网上应用店 获取 DashOne,免费用户仅可以添加 10 个 Widget,如果你想添加更多,需要订阅 3 美元/月的专业版。

几枝

不论是为了提高自己的姿势水平,还是单纯想在聊天时彰显文采,多背几首诗词总是没错的。而几枝这款扩展,就会在你每次打开新标签页时展示一句经典古诗词,配合层叠涌动的波浪或气泡背景,婉约如江南山水,让你的 Chrome 与众不同。如果你想了解更多,只需点击页面中间的词句,就可以调用 Google、百度等引擎搜索相关背景知识,探索古韵之美。

你可以在 Chrome 网上应用店Firefox Add-onsGitHub 免费获取几枝。

Web Clipper

正如其名,Web Clipper 的主要功能是将网页上的内容「剪辑」下来,并一键保存至数种云笔记服务。与印象笔记剪藏等工具相比,Web Clipper 支持智能提取、手动框选及自由编辑选中区域,还允许你将网页转换为 Markdown 格式,满足多种需求。目前,Web Clipper 已支持 Bear、GitHub、Notion、OneNote、有道云笔记和语雀 6 种在线笔记服务,值得一试。

你可以在 Chrome 网上应用店GitHub 免费获取 Web Clipper,Firefox 版本也正在开发中。

TenWords

我曾经介绍过不少划词翻译扩展,而 TenWords 可能是最特别的那个。只需点击工具栏上的图标进入学习模式,你就可以通过鼠标轻点查询不认识的单词释义,并标注生词为「已掌握」或「不认识」,在 TenWords 的练习页面中温习。TenWords 支持定时提醒、进度管理、单词卡片及学习成就统计等,帮助你快速掌握一门新语言。除了英语外,TenWords 还针对法语、德语、俄语等数种语言做了相应优化,适用范围更广。

你可以在 Chrome 网上应用店 免费获取 TenWords,由于网络原因,登录账户可能需要科学手段,敬请留意。

Dualsub

要想掌握一门新语言,观看外语原版视频是快速提升自己的好方法,为了兼顾初学者和进阶用户的需要,不少字幕组都会提供双语版本的字幕文件,便于对照学习。其实,不少 YouTube 视频也会提供多种语言版本的字幕,但默认只能显示一种,为了解决这一问题,Dualsub 诞生了。它支持同时显示两种不同语言的字幕,还允许你将字幕以 ASS 文件的形式保存至本地,啃生肉更轻松。

你可以在 Chrome 网上应用店Firefox Add-ons 免费获取 Dualsub。

Summary Box

在信息高度碎片化、呈爆炸式增长的今天,「一目十行」几乎成了快速汲取新知的必修课。不过,我们可以比较轻松地精炼母语文章的中心思想,却很难高效阅读外语新闻,往往需要一个个单词逐字在脑中翻译,效率低下。Summary Box 则利用 AI 技术,帮助你一键生成所选文章的要点梗概,还支持自动提取正文内容,是速览英语文章的好帮手。

你可以在 Chrome 网上应用店 免费获取 Summary Box。

Worklog Tracker

时间量化管理是一项容易被忽视、却相当重要的提升效率法门,可以帮助我们厘清工作时长分配,更好地安排自己的一天。Worklog Tracker 就是一款相当出色的时间记录扩展,它支持在本地创建并追踪工作动态,自动同步至 Toggl、Jira、Keen 和 Yandex.Tracker 等主流服务。你还可以利用它导入及导出不同时间追踪平台中的个人数据,在多种服务间自由切换。

你可以在 Chrome 网上应用店Firefox Add-ons 免费获取 Worklog Tracker。

DownThemAll!

DownThemAll! 是 Firefox 平台的老牌下载增强扩展,近期移植到了 Chrome 上。与原生下载管理器相比,DownThemAll! 支持自动嗅探网页上的元素,并按照预设规则进行分类。你可以轻松筛选当前页面上所有的链接、图片、音频、视频、文件等,并一键下载至本地。此外,DownThemAll! 还允许你创建自定义规则,利用正则表达式过滤要下载的项目。

你可以在 Chrome 网上应用店Firefox Add-ons 免费获取 DownThemAll!。

FasterChrome

Chrome 之所以能够在短短数年时间内超越 IE,独霸浏览器市场,很大程度上是凭借其无出其右的响应速度,而 FasterChrome 这款扩展想让它变得更快。其原理十分简单,当你的鼠标指针停留在一个链接上超过 65 毫秒时,FasterChrome 就会假定你即将点击它,并在后台预先加载。由于正常人从移动鼠标到手指按下间隔 300 毫秒以上,两者之间的时间差就会造成网速更快的错觉。

你可以在 Chrome 网上应用店 免费获取 FasterChrome。

ClearURLs

点击广告或其它链接跳转至第三方网站时,你或许会注意到地址栏后缀着一串看似无意义的字符,其主要作用是标识你的身份,包括设备信息、用户资料等,便于追踪和定位。如果你比较在意自己的隐私安全,或许会希望删去这些跟踪字段,而 ClearURLs 就能派上用场。它能够自动净化主流网站的追踪字段,还支持提交自定义模板,保护你的个人数据。

你可以在 Chrome 网上应用店Firefox Add-ons 免费获取 ClearURLs。

在 macOS 上处理图片,你有这些方便好用的选择

24 July 2019 at 15:14

每天,我们都要与形形色色的图片打交道,也不可避免地会产生诸多相关需求:压缩体积、提取文字、标注圈点……要解决这些问题,一款趁手的 App 必不可少。在本文中,我就为大家收集了 21 款各具特色的 macOS 图片处理 App,希望你也能有新收获。

压缩

在网上发贴或撰写文章时,你或许会遇到图片体积过大、无法上传的情况。这时,本节推荐的 5 款 App 就能助你一臂之力。

Squash

在本节即将介绍的图片压缩工具中,Squash 可能是设计最简洁优雅的那一个。只需将想要压缩的图片拖拽至 Squash 窗口中,它就会按照预设参数自动开始工作,UI 动效精致流畅,还支持自动保存和重命名文件。除了常见的 PNG、JPG 格式外,你还可以用 Squash 压缩 RAW 文件,并在完成后自动转换格式。

如果你正在寻找一款颜值高、操作简便的图片压缩工具,可以在 App Store 以 98 元的价格购买 Squash,应用同时包含在 Setapp 订阅中。

关联阅读:

Optimage

Optimage 是一款老牌 macOS 图片压缩工具,近期刚发布了 3.0 大版本更新,其采用了贴近原生的 UI 设计,支持黑暗模式。它最大的亮点之一,就是支持 GIF、MP4、HEIC、WebP 等多种小众文件格式,覆盖面广,且压缩率较高,满足多种场景需求。

如果你日常需要应对不同种类的图片文件,支持格式全面的 Optimage 会是个不错的选择。你可以在 官网 获取 Optimage,免费用户每天仅能压缩 24 张图片,解除限制需要购买 15 美元的高级版。

ImageOptim

ImageOptim 集成了 Zopfli、OptiPNG、JPEGOptim、svgcleaner 等十余款图片压缩算法,可以根据图片类型智能选择,保障压缩效率。你可以在设置中启用图片有损压缩,并调整压缩质量,进一步减小图片体积。需要注意的是, ImageOptim 会默认覆盖原图片,如果你希望同时保留两个版本,请提前做好备份工作。

如果你想尽可能榨干图片体积,或者只是偶尔需要压缩图片,完全免费的 ImageOptim 或许能帮到你。你可以在 官网 获取 ImageOptim,App Store 中的都是冒牌货,请注意防范。

PP鸭

PP鸭由国内独立开发团队出品,同样整合了多种图片压缩算法,支持自动选择压缩参数。其操作也十分简单,直接将图片拖拽进窗口即可,如果你对压缩后图片质量不满,还可以一键恢复原图。PP鸭的另一特点,则是支持图片处理前后对比,方便观察画质差别。

如果你希望拥有一款操作简便、设计优秀的图片压缩工具,可以在 官网 以 69.9 元的价格购买 PP鸭。

关联阅读:

Resize Master

除了想方设法压缩图片体积外,直接调整图片分辨率或许更为方便快捷,而 Resize Master 就能帮到你。只需事先设定压缩后的尺寸、格式、背景颜色,再将图片拖至 Resize Master 窗口内,就大功告成了。为了保护版权,你还可以保留图片元数据、添加版权声明标签和水印,杜绝盗图。

如果你需要批量调整图片尺寸、修改图片格式、添加水印,不妨在 App Store 免费获取 Resize Master。

关联阅读:

截图

尽管 macOS 的原生截图功能已十分强大,但仍难以兼顾所有需求。如果你曾期望过自动设置背景、录制屏幕、长截图等特性,不妨试试本节推荐的 4 款 App。

CleanShot

如果要评选出最贴近原生截图功能的第三方 App,CleanShot 可以说是当仁不让,它从交互设计到界面风格都与原生别无二致,甚至会默认占用系统截图快捷键。不过,CleanShot 在许多细节上都胜过原生功能,例如支持截图时自动隐藏桌面图标、截图时按 ⌘Command 键显示参考线、自定义截图背景填充图片等。

如果你希望拥有与原生无异的截图体验,或者想轻松截出一张赏心悦目的图片,可以在 官网 以 19 美元的价格购买 CleanShot,应用同时包含在 Setapp 订阅中。

Snipaste

自诞生以来,Snipaste 就收到了诸多关注与好评。它在截图时支持自动检测窗口元素、智能吸附边界,并提供了形状、折线、画笔、文本和马赛克等标注工具。为了方便对比,Snipaste 允许你将截取的图片或剪贴板内容「贴」在屏幕最上层,使用其它 App 时也能参考对照。

如果你需要经常标注截图、将其保留作为工作参考材料,可以在 官网 免费获取 Snipaste。

关联阅读:

Xnip

在 Snipaste 发布 macOS 公测版时,另一款国内独立开发者作品 Xnip 也悄然发布,而它的主打卖点,则是滚动截图。只需要鼠标选中可滚动区域,点击识别按钮,Xnip 就会自动记录滚动的页面,甚至可以保存聊天中的动态表情包。当然,截图工具必备的窗口截图、标注工具等自然也不会缺席。

如果你想要截出一张长图,可以在 App Store 免费获取 Xnip,去除水印需要订阅每年 12 元的高级版。

关联阅读:

Rotato

在制作产品宣传图片时,一张优秀的截图可以吸引不少用户的目光。有了 Rotato(原名 Design Camera),只需鼠标点一点,你也可以轻松做出 3D 效果的带壳截图,并浏览动态效果、修改背景颜色等,还能导出高达 4K 分辨率的 PNG 图片,适用于各种场合。

如果你是一位独立开发者,正在发愁如何制作产品宣传图片,不妨在 官网 免费获取 Rotato,部分功能需要内购 20 美元解锁。

关联阅读:

标注

为了与他人协作时帮助加深理解,在图片上做一些标注必不可少。不过,相对于百花齐放的 iOS 系统,macOS 上好用的图片标注 App 却比较少见。在本节,我将为大家介绍 4 款优秀的图片标注 App 和技巧,希望大家喜欢。

照片

没错,macOS 自带的照片 App 也可以轻松标注图片。只需将想要标注的图片拖拽至照片中,点击右上角的「编辑」按钮,再点击右上角的省略号,选择「标记」即可。其提供了文本、画笔、形状、箭头、裁剪等实用工具,使用轻松方便。

如果你不想多安装第三方 App,或者对图片标注需求不高,相信原生的照片 App 会成为你的好帮手。

预览

预览同样是 macOS 自带 App,历史悠久却常被忽视。你可以右键单击图片,选择用预览打开,再点击右上角的铅笔图标,即可进入图片标注模式。其布局与照片 App 类似,但增加了智能套索、签名、绘制等标注工具,功能更全面。

如果你只是偶尔需要标注图片,又不想打开笨重的专业软件,不妨右键直接用预览打开吧。

圈点

圈点由印象笔记出品,虽然现在疏于维护,但仍可正常使用。它所提供的标注工具虽然算不上多,但个个都精准击中了图片标注分享的痛点,如箭头图章、马赛克、马克笔、文字说明等,还支持屏幕截图、一键分享和保存至印象笔记。

如果你希望用图片与他人分享自己的观点,可以在 App Store 免费获取圈点。此外,印象笔记 Mac 客户端也集成了圈点功能,选中图片后右键标注即可。

Snagit

Snagit 是一款极其强大的截图、标注及管理工具,支持滚动截图、网页截图、全景截图、屏幕录制等特性。除了箭头、形状、文本、图章等标注基本功外,Snagit 还提供了对话框、高斯模糊、文本遮盖、智能选框、步骤标记等功能,自定义项目丰富,值得一试。

如果你正在寻找一款大而全、设计精美的图片标注工具,可以在 官网 以 49.95 美元的价格购买 Snagit。

关联阅读:

OCR

从图片中提取文字的需求古已有之,但近年来才涌现出一大波优秀 App,也吸引了不少大厂目光。在本节中,我将为大家介绍 4 款 OCR 文字识别 App,再也不用自己手打了。

iText

iText 是一款简约轻量的菜单栏 OCR 工具,内置了百度、腾讯和 Google 三大引擎,支持自动拼接和识别段落,结果准确高效。除了手动选取本地图片文件外,你还可以利用其内置的截图工具直接捕捉屏幕上的文字,并对照原图、一键翻译等。

如果你正在寻找一款小巧方便、效果出色的 OCR 工具,可以在 App Store 免费获取 iText。免费版限制每月识别 20 次,解除限制需花费 78 元/年订阅高级版。

关联阅读:

ABBYY FineReader

ABBYY 是全球领先的 OCR 技术服务商,由其出品的 ABBYY FineReader 也被许多评测誉为市面上最优秀的 OCR 解决方案。它支持多语言混合识别、跨页文字识别、段落结构识别等,可以打开、编辑与导出 PDF、Word 等文件,还提供了自动操作、AppleScript 自动化集成功能。

如果你需要一款功能丰富、效率更高的 OCR 工具,可以在 官网App Store 以 798 元的价格购买 ABBYY FineReader。

QQ

没错,我们熟知的 QQ 其实也支持 OCR 提取图片中的文字。只需要右键单击任意聊天中的图片,选择「识别图片中文字」即可。QQ 采用了腾讯 OCR 引擎,识别效果比较准确,你还可以手动修改识别结果,并一键复制全部文本或下载至本地。

如果你只是偶尔需要提取图片中的文字,直接使用 QQ 也是个不错的应急手段,不必下载其它 App。

白描

白描是一款小巧强大的移动端文字识别 App,在近期更新中,它带来了 Wi-Fi 传输功能,允许我们通过局域网连接至电脑。你可以点击白描主页面右上角的 Wi-Fi 图标,按提示访问相应网页,随后上传电脑上的本地图片,等待白描识别完成即可。

如果你想获得与移动端一致的识别体验,可以在 App StoreGoogle Play官网 免费获取白描,部分功能需要内购高级版解锁。

GIF 制作

所谓一图胜千言,如果图片会动的话,所能传达的信息也就更丰富了。不过,与比比皆是的图片后期 App 相比,能创建与编辑 GIF 的 App 却比较少见。在本节,我就为大家收集了 4 款 GIF 处理 App。

GIF Brewery

GIF Brewery 是一款集屏幕录制、视频转换、动图编辑于一体的全能型 GIF 处理工具,操作简便,易于上手。你可以直接录制或打开视频,并通过裁剪画面、增减帧数、设置延迟、调整播放速度、优化颜色等方式压缩 GIF 体积,还能设置循环模式、添加贴纸和文本等。

如果你希望在一款 App 内解决关于 GIF 的全部需求,可以在 App Store 免费获取 GIF Brewery。

关联阅读:

Gifox

Gifox 是一款常驻在 macOS 菜单栏上的 GIF 录制工具,它最大的特色之一,就是支持识别窗口录制,不用手动框选了。其设置选项也比较丰富,支持录制鼠标、显示阴影和桌面壁纸、调整帧率、颜色等,还可以一键分享至 Dropbox、Google Drive 和 Imgur。

如果你饱受手动调整录制区域之苦,不妨在 App Store 免费获取 Gifox,部分高级功能需要内购 30 元解锁,应用同时包含在 Setapp 订阅中。

GIPHY Capture

GIPHY Capture 由知名 GIF 分享网站 GIPHY 出品,是一款简约实用的 GIF 录制与编辑工具。打开 App 后,首先呈现的就是屏幕录制窗口,所有录制的片段都会被暂存在窗口底部,可以在稍后调整帧率、时长、循环方式等属性,还能添加文字说明。

如果你想把屏幕录制转换为 GIF 格式分享,不妨在 App Store 下载 GIPHY Capture 试试。

LICEcap

LICEcap 是一款仅有 2 MB 大小的 GIF 屏幕录制工具,但功能却一点不少。它支持调整帧率、显示鼠标动作、设置循环方式等参数,还可以在录制过程中移动窗口范围,并暂停分段、添加文字说明,涵盖大部分 GIF 录制需求。

如果你电脑储存空间较少,或者只是偶尔需要录制 GIF,可以在 官网 免费获取 LICEcap。

Stacher – 基于 yt-dlp 的免费跨平台视频下载工具,支持几乎所有视频音乐平台

By: Anonymous
22 May 2024 at 14:26

DUN.IM BLOG

DUN.IM BLOG

Stacher – 基于 yt-dlp 的免费跨平台视频下载工具,支持几乎所有视频音乐平台

Stacher 是最近新问世的免费网络视频下载,支持 和 Linux,本身也是知名开放源码项目 yt-dlp〔由 youtube-dl 分支〕图形化界面〔GUI〕版本,大家都知道 yt-dlp 是终端里的下载工具,使用上会有一定的门槛,将它套用图形化后操作界面后就会更符合大众使用,支持超过 1200 种网络服务,之前曾介绍过的类似软件还有「Hitomi Downloader 」和「Seal」。

Stacher 已经有针对 Windows 和 Linux 三大操作系统推出对应的版本,只要从官方找到需要的版本后下载即可使用,本身没有自带中文界面,但在操作上不会困难,只需要将视频网址复制、粘贴后就能获取文件,也能够选择各种常见视频、格式。

利用 Stacher 可以下载 YouTube、Twitter、Instagram、TikTok、Bilibili、Pornhub 等网站视频,在使用时没有太多复杂难懂的设置,也支持包括 3GP、AAC、FLAC、FLV、M4A、MP3、MP4、OPUS、VORBIS、WAV、WEBM 等格式,最简单的方法就是维持默认值「最佳画质 + 音频」,就能获取包含影像、声音的视频文件咯!

值得一提的是 Stacher 还能针对要下载的平台提前设置账号密码,也有设置浏览器 Cookie 选项,无论是遇到任何状况只要适当设置应该都能顺利获取视频,如果平时会需要从网络平台储存视频的话可以试试看。

其他 YouTube 网络视频下载工具整理:

Stacher. A youtube-dl frontend.

进入 Stacher 网站后跳到下载区,选择要下载的程序版本,支持 WindowsmacOS 和 Linux,要注意的是都只适用于 64 位操作系统。

我使用 Stacher 的 Mac 版本进行操作教程,Windows 版本应该大同小异,进入后会有说明画面,可以得知应用程序是一个图形化界面下载器,以 yt-dlp 作为内核,因此在使用时会自动安装 yt-dlp。

进入 Stacher 主画面后会自动更新相关元件,上方是网址列,将视频网址复制、粘贴后就能进行下载。

从右上角可选择要下载、保存的文件格式,视频格式有 3GP、FLV、M4A、MP4、WEBM,格式有 AAC、FLAC、MP3、OPUS、VORBIS、WAV,建议直接维持默认值「BEST」就会自动获取最佳画质和音频。

下载时会显示视频略缩图、标题、文件大小、下载速率和预计完成时间,试着下载 YouTubeFacebook 和 Instagram 都能正确获取视频,而且下载速度很快。

完成后在视频上方点击右键、从菜单找到「Open Download Location」就能进入下载路径并找到视频文件。

另外,在右上角也能提前设置视频下载后的保存路径。

下载视频的网址列右侧有一个提前设置账号、密码功能,如果要存取的视频需要账号密码可提前设置,另一个选项可以选择浏览器 Cookie 来源,若无法正确下载视频的话就试试看调整这两个选项。

在 Stacher 设置画面能提前调整下载保存的视频路径、视频文件格式等选项,还有像是字幕下载、网络速度限制或是音质等等,可设置的项目很多,不过如果没有特殊需求只需要维持默认值即可。

前面有提到 Stacher 是使用 yt-dlp 作为内核,支持的服务超过 1000+ 个〔支持列表〕,基本上所有常见常用服务应该都能够利用这个应用程序下载,在测试时除了 YouTube 也下载 Facebook、Instagram 视频,也都能够顺利获取视频文件。

Stacher 是一款功能强大、操作简单的免费网络视频下载工具,非常适合新手使用。如果有下载网络视频的需求,不妨试试看 Stacher。

[事实核查] 图片反向搜索核查工具汇总,检测 AI 生成图像的真实性实战指南

By: Anonymous
12 May 2024 at 14:30

DUN.IM BLOG

DUN.IM BLOG

在中文社交上,单纯以文字形式流传的虚假信息从比例上越来越少,以图片、截图形式流传的可疑信息则越来越多。

究其原因,一是「有图有真相」的观念深入人心,网络传言往往会附上图片来增加内容的可信度;二是图片形式更容易在群、朋友圈、微博等社交网络平台传播。

结果,有很多图片被抽离原有的背景和时间线流传,让受众对于该图片产生完全不同的认识和理解。还有的图片被软件加工篡改,完全改变了原有的意义。

因此,使用图片反向搜索(Reverse Image Search)工具,追溯图片的来源,在此基础上检查图片是否被修改或者挪用,是事实核查员最常处理的工作。

目前比较常用的图片反向搜索工具有谷歌、Yandex、Bing、TinEye、百度等,其中以前四个最为常用,各有优势和特点。

谷歌适合大多数基本的反向图像搜索,包括识别照片中的知名人物、查找已在网上大量共享的图像的来源、确定一件艺术品的名称和创作者等等。

使用方法:

1.在电脑上保存要核查的图片,或者复制该图片的网址

2.前往 Google 图片页面(https://images.google.com

3.点击搜索框的相机图标

4.可以选择直接上传图片、拖拽图片或粘贴图片的链接

比如核查以下图片(LIBKOS/AP):

在搜索结果中,可以看到页面右侧「图片匹配结果」中有两张完全一致的图片,点击图片即可找到这张图片的详细说明,包括时间、地点和拍摄者。

点击「查找图片来源」的选项,可以查看所有包含此图片的网页,从中选择可靠的信源,找到图片的详细说明:

还可以点击搜索框的「工具」按钮,进一步收窄搜索结果的范围,可以选择「按图片搜索」、「外观相似」或「更多尺寸」。

「工具」还有「时间」选项,可以选择从「过去 1 小时内」到「过去 1 年内」不同的时间范围,也可以自定义范围。通过这种设置,可以更容易找到图片初次发布的网页。

如果希望进一步搜索图片的局部,谷歌提供了裁剪工具,图片的四个圆角是可以移动的,用来调整搜图的范围,页面右侧会实时展示对裁剪后的画面进行图片搜素的结果。

对核查员来说,有时要核查的图片画面非常复杂,但有效信息只有其中的一部分,这时候裁剪功能就非常有用。

如果使用谷歌 Chrome 浏览器,可以直接在需要核查的图片上点击右键,选择「使用 Google 搜索图片」,搜索结果会在页面右侧显示。

也可以在页面空白处点击右键,选择「使用 Google 搜索图片」,页面会出现「选择要搜索的图片区域」的提示和截图用的图标,可以任意选择要搜索的图片区域,有关该区域的图片搜索结果会出现在页面右侧。

识别图片中的文字信息

在谷歌图片的搜索结果页中,点击「文字」按钮,谷歌可以识别图片上的文字信息,并且将其转换成可复制的文本。

这一功能非常实用,核查带有标语、路牌等元素的图片时,可以快速提取其中的文字,然后检索,以可能的线索。尤其是有关文字元素为俄语、阿拉伯语、韩语等语种时,核查员不必担心电脑输入法问题。

比如,查证一张带有俄语的图片(Alexander Ermochenko/Reuters):

在搜索结果中点击「文字」按钮,光标可以在图片上点击并拖动选择任意文字,也可以选择「选择所有文字」,这是页面右侧已经出现了标语上的文本,这时可以有 4 个选项:「复制文字」、「聆听」、「翻译」和「搜索」,可直接进行下一步的操作。选择「翻译」可知,这是俄罗斯在一个名为苏多普拉托夫的地点的征兵广告。

翻译图片中的文字信息

点击「翻译」按钮,谷歌可以直接在图片上将外语文字翻译成中文,可以大致明白图片上外语文字的意思,但受到识别度的限制,并不完整和准确,仅可提供快速的参考。

比如查证这张带有法语的图片(AFP):

在搜索结果中点击「翻译」,可大致知道这次示威的主题是关于养老金改革。

谷歌 lens 的特点是试图识别图像的主题,而非图像本身。不利的一面是,许多匹配项都侧重于图像中的主题。因此,如果图像搜索的主题不太清楚,可能不会获得高质量的结果。

比如搜索这张乌克兰总统泽连斯基的图片(EPA/UKRAINIAN PRESIDENTIAL PRESS SERVICE – HANDOUT):

返回的大部分却是与战术背心有关的结果:

「关于此图像」功能

2023 年 5 月 10 日,谷歌在 I/O 2023 开发者大会上宣布,将在接下来的几个月里添加一种新方法来帮助用户评估图像来源。

通过在搜索中的「About this Image」工具,用户将能够看到重要的背景信息,例如:

该图片和类似图片是什么时候首次被谷歌索引的,

这张图片可能首次出现的地方,

这张图片还出现在了网上的什么地方(例如新闻、社交或事实核查网站)

用户可以有三种方式来使用这一功能:点击 Google 图片搜索结果中的图片上的三个点;在 Google Lens 中使用图片或屏幕截图进行反向搜索;在使用 Google 的移动时,如果在一个页面上遇到想了解更多信息的图片,可以向上滑动。

按照谷歌的计划,2023 年晚些时候,用户还可以在桌面和移动端的 Chrome 浏览器中通过右键点击或长按图片来使用这一功能。

该功能将首先在美国以英语提供。

Yandex是一个俄罗斯的搜索引擎,检索有关俄罗斯、东欧、中亚等地区的内容时特别有优势,因此在俄乌战争期间很有价值。

使用方法:

1.在电脑上保存要核查的图片,或者复制该图片的网址

2.前往 Yandex 图片搜索页面(https://yandex.com/images/

3.点击搜索框的相机图标

4.可以选择直接上传图片、拖拽图片或粘贴图片的链接

5.单击搜索选项以在 Yandex 上查找相关图片。Yandex 将返回具有完全匹配或视觉相似图像的结果,包括使用这些图像的网页列表。

比如,2022 年 3 月 20 日,有微博用户称:「波兰铁路工人中断了与乌克兰的铁路连接,使装有英美武器的火车无法前往乌克兰。」有关博文还附有一张模糊的铁路照片,画面中有两列列车,但是没有显示地点的明显标记。(参考阅读:波兰铁路工人中断与乌克兰铁路连接?

在 Yandex 上反搜这张图片,可以找到大量的匹配结果:

在谷歌上反搜,首先出现的是一大批相似图片:

下拉数页后才能发现匹配的图像:

2023 年 4 月,中文网络流传一段视频,称「歌手席琳·迪翁参加她儿子的婚礼,因为罕见的僵硬人综合症已无法自己站立,看到的画面让人感伤」。

截取视频画面分别在谷歌、Yandex 和 TinEye 上反搜,可以发现,只有 Yandex 返回了包括大量相似图片的搜索结果,并且其中包含有意义的线索。

Yandex 还可以在搜索结果中显示其找到的核查图片的不同尺寸,如果核查的原图比较模糊,此时可以点击并保存更大尺寸的图片,然后继续反搜大尺寸的图片,一般而言可能更接近于找到图片的源头。

同样,Yandex 也具有识别图片中的文字,裁剪图片等与谷歌类似的功能。

案例 1:

2022 年 2 月,俄罗斯进攻乌克兰之前,中文网络广泛流传一张据称是乌克兰少女拿枪乘坐公交车的图片。

图片中,这位女孩头戴米色编织毛线帽,身穿带圆形拉链的黑色高领羽绒服,左手涂蓝色指甲油,右手涂红色指甲油。图片中没有明确可以提示时间、地点的元素。

有关图片被指拍摄于乌克兰,在俄罗斯和俄语区广泛使用的搜索引擎 Yandex 上反搜图片,可以发现该图片自 2020 年起就在俄罗斯社交网络 VK 上广泛流传。

在 VK 上进一步检索,可以发现能够找到的最早版本发布于 2020 年 3 月 27 日,发布者名为「寻找新西伯利亚的你」。从其主页内容看,这是一个寻人账号,slogan 是「连接命运」。账号介绍称:如果你在某个地方看到一个人,但由于某种原因无法接近和认识,那么你可以通过描述你的故事来尝试找到 Ta。

这张照片由名为 Karpov Sasha 的用户拍摄,配文是:「我一路坐在她旁边,我非常喜欢她,但很害怕打招呼。我在寻找你,美女。」

在帖子下方的评论中,一位名为 Ekaterina Gladkikh 的用户称,她就是照片中的女子。

她还在自己的 VK 页面上转发了这个帖子。

根据 Ekaterina Gladkikh 的 Instagram 账号,她是俄罗斯人,目前在新西伯利亚生活,是一位网红。

检索 Gladkikh 的 Instagram 账号,可以发现她在 2020 年 3 月 10 日发布的视频中,左手涂有红色指甲油、右手涂有蓝色指甲油,与网上流传的照片特征一致。

在 Gladkikh 于 2020 年 4 月 8 日发布的照片中,可以看到她穿戴着与网络流传照片中同款的毛线帽、黑色羽绒服,右手也涂有蓝色指甲油。

(参考阅读:乌克兰少女带枪坐公交?

案例 2:

2022 年 5 月,短视频平台抖音出现一批内容几乎一模一样的视频,文案是:「没有国哪有家,俄罗斯进入最困难时期,民众排队存钱救国!」

视频画面多是俄罗斯人在银行、ATM 取款机等处排长队的场景。

核查的关键之处在于找到每张图片的来源。

比如这张图片,使用谷歌和 Bing 都没有找到理想的结果:

使用俄罗斯搜索引擎 Yandex,裁剪截图的文字部分,可以找到一张同类结果:

点开网页发现,使用这张图片的文章发布于 2014 年 12 月 17 日,虽然可以断定此图与 2022 年俄乌局势无关,但是网页没有提供有关这张图片的详细信息,如图片说明、出处等。

不过,与最初的视频截图相比,这个网页上的照片尺寸较大,也更清晰,我们可以把这张大尺寸照片保存下来在 Yandex 上反搜,可以在第二个搜索结果中发现 Getty 图片社的网站包含了这张图片。

点击搜索结果中的 Getty 网站,可以发现该图片由彭博社记者安德烈·鲁达科夫(Andrey Rudakov)拍摄于 2014 年 12 月 17 日,图片说明是:俄罗斯圣彼得堡的一家 M-Video 商店内,顾客排队购买电子物品。在该国自 1998 年以来最严重的货币危机中,人们担心价格会进一步上涨而抢购消费品。

由此这张图片的身世就完全搞清楚了。(参考阅读:俄罗斯全民排队存钱救国?

Bing 是微软旗下的搜索引擎。在首页(bing.com)的搜索框旁边即有图像搜索的图标,可以直接进行反向图片搜索,而不必像谷歌和 Yandex 那样进入二级页面。

使用Bing 图片搜索时,可以将一张或多张图片拖到搜索框中、粘贴图像或 URL、从电脑上传图像,还可以用设备拍照——然后 Bing 将在网络上搜索匹配的图像。

Bing 也具有和谷歌、Yandex 类似的图片裁剪功能,在搜索结果页面点击「视觉搜索」按钮,可以裁剪照片的不同区域并查看实时搜索结果,这对于查找那些具有多个可识别主题的图像来说会非常有用。

Bing 另一特点是在搜索结果页,选择「具有此图像的页面」后,可以选择以「最新」或「最久」来对搜索结果进行排列。此功能与 TinEye 的按时间排序类似。

此外,与谷歌相比,Bing 会尝试识别照片中的不同元素,然后查找包含所有这些元素的图像。

比如,一张停在树旁的古董车的图片会触发包含一棵树和一辆古董车的相关匹配,而谷歌在这种情况下会选择其中一个更强烈的主题并寻找匹配。

TinEye创办于 2008 年,总部位于加拿大多伦多。TinEye 的最大优势是可以对搜索结果进行时间排序。

TinEye 使用图像识别技术来搜索图像,而不是关键字、元数据或水印。当用户提交要搜索的图像时,TinEye 会使用图像识别为其创建一个独特且紧凑的数字签名(「指纹」),然后将此指纹与其索引中的所有其他图像进行比较以查找匹配项。TinEye 会不断爬取网络并将图像添加到其索引库中。

使用方法:

通过单击上传(upload)按钮从电脑上传图像,也可以用拖曳方式把图片拖入搜索框。如果按 URL 搜索,可以把图像的 URL 地址复制并粘贴到搜索框中。

使用 TinEye 搜索图像时,可以通过几种不同的方式对这些结果进行排序和过滤:

最佳匹配(best match):首先显示视觉上最接近被搜索图像的图像。这也是默认的排序选项。

改动最大(most changed):首先显示对搜索图像改动最大的图像(经过大量编辑的图像)。

最大图像(biggest image):首先显示最高分辨率的图像。

最新的图像(newest):首先显示 TinEye 最新发现的图像。

最早的图像(oldest):首先显示 TinEye 最早发现的图像。

能够对搜索结果按照时间排序,是 TinEye 相比其他图片反搜工具的最大优势。对事实核查员来说,这一功能更容易破解挪用旧图片的传言,足以证明那些被形容为新闻的图片实际上已经有数月甚至数年之久。

以下图为例,2022 年 2 月 26 日,俄罗斯对乌克兰开战 2 天后,微信群流传一张据称是战场的新闻照片,两名儿童面对飘扬着乌克兰国旗的装甲车队敬礼,远处硝烟弥漫。

在 TinEye 上输入照片,排序选择 sort by oldest,可以发现出现在 TinEye 搜索结果第一位的是乌克兰网站 Gordonua 的页面,时间是 2016 年。

点击 Gordonua 的网络链接,可以找到 2016 年 3 月 23 日的一张图片与要核查的图片相同。

图片说明称,这是乌克兰国防部在其 Facebook 页面上发布的「战争之子」系列照片中的一张。

因此可以判定,这张图片至少拍摄于 2016 年,与 2022 年的俄乌战争无关。(参考阅读:乌克兰儿童向乌军车队敬礼?

可以在 TinEye 上搜索哪些类型的图像?

文件类型:TinEye 接受各种格式,包括但不限于 JPEG、PNG、GIF、BMP、TIFF 和 WebP 图像。

图像尺寸:最适合使用至少为 300 像素的图像,但也可以接受低至 100 像素的图像。

文件大小:最大为 20M。

为了获得最佳搜索效果,应尽量避免使用有明显水印的图像,因为 TinEye 可能会搜索水印而不是图像本身。

TinEye 的搜索结果会以域名分类,显示包含相关图片的网站;如果想知道搜索图片的版本是否出现在一个特定的网站上,可以在「按域名/集合过滤」(filter by domain/collection)的输入框里输入该网站的网址。TinEye 也会自动设置一些域名分类,主要包括主要的社交媒体平台和媒体,如 Twitter、Reddit、AFP 等。

如果搜索的图片属于图库里含有的图片,会标记为 stock;如果隶属于某一个系列的图片,则会标记为 collection。当 TinEye 确定一个网站已经无法访问时,会默认隐藏该网站的搜索结果。但如果用户对这些匹配结果感兴趣,可以勾选「包括不可用的结果」(include results not available),TinEye 就会显示该网页的存档。

TinEye 还有比较(compare)功能,可以将搜索结果与用于执行搜索的图片进行比较,这在识别裁剪过的、调整过大小的、倾斜过的或 PS 过的图片时非常有用。

但是,有些图像 TinEye 找不到:

大多数社交媒体网站,如 Facebook 和 Instagram,都限制 TinEye 抓取他们的图片。

受密码保护的页面或不可公开访问的页面上的图像。比如,如果要核查的图片最早发布在一个 WhatsApp 群组或微信群里,并且从来没有在网上被分享过,TinEye 就无法找到。

用户个人设备上的个人照片。

一些太小的或简单的图像,可能没有足够的细节让 TinEye 制作「指纹」。

与其他搜索引擎不同,TinEye 只能找到与我们搜索的图像完全匹配的图像(也包括经过裁剪、颜色调整、大小调整、编辑或轻微旋转的图像),但一般来说无法找到相似的图像。

注意:

TinEye 抓取到最旧的图片并不一定是该图片第一次出现在互联网上的日期。因此,TinEye 不能告诉我们一张图片首次出现在互联网上的时间,只能告诉我们 TinEye 首次发现它的时间。

一般而言,核查员在核查图片时会尝试使用多个反搜工具,而最方便的是下载安装 InVID Verification Plugin 插件,该插件集成了多种图片验证功能。

通过 Chrome 或 Firefox 浏览器下载安装插件后,在网页浏览图片时,可以直接右键点击图片,选择 Fake news debunker by InVID by WeVerify,进一步选择 Image Reverse Search-All,即可同时启动谷歌、Yandex、Bing、TinEye 等多种图片反搜工具,并在不同的新窗口展示搜索结果,极大地提高了效率。

另外一种使用方法是进入 InVID 系统。安装 InVID 后,Chrome 浏览器顶部会出现一个启动图标:

点击后选择「打开工具箱」(Open Toolbox)

进入 InVID 界面,选择图片处理(Image),即可看到 6 大功能:

1.图片分析(Image analysis):针对 Twitter 和 Facebook 上的图片,进行详细的数据分析。

输入图片的网址,点击提交,出现有关该图片的信息。

图片 ID、平台、创建时间、图片链接、点赞数、转推数,同时还抓取了推文下面所有的评论并且分类,包括带有链接的回复数。

比如我们分析 SpaceX 的这则推文图片:

2.放大镜(Magnifier):用户可以在图片上使用放大镜功能,以帮助解读和阅读图像中难以看到的细节——比如汽车牌照、飞机侧面的识别号码、徽章、标志、横幅等等。用户可以输入图片的网址,或者使用本地文件按钮(LOAD LOCAL FILE)从本地上传图像。

比如我们可以用放大镜检查这架战斗机涂装上的信息:

然后可以使用图片下方的谷歌、Google Lens、Yandex、Tineye、百度等按钮对图片进行反向搜索,或使用图像取证选项。

该功能还包括图片编辑(点击 EDIT IMAGE),可以对图片进行裁剪、翻转、锐化等。

3.元数据(Metadata):用户可以查看 jpg 和 tiff 格式的图片的 Exif 数据,可以输入图片链接或上传本地图片文件。

Exif (可交换影像档案格式,Exchangeable Image File Format) 档案会储存照片的重要资料,例如设备、曝光值、拍摄时间、地点以及使用的任何设置。每当用户拍摄新的照片时,几乎所有数码相机和智能手机都会建立这些资料档案。

4.取证(Forensic):帮助用户检测图片是否被篡改,比如是否被 Photoshop 软件编辑过。不过,使用者需要极其丰富的图像知识,且结果可能存在误差,所以,一般而言仅能作为参考,而非决定性证据。

5.OCR:可以将图片上的文字内容,智能识别成为可编辑的文本,不过有时无法识别。

6.检查 GIF 图片(CheckGif):可以对比原始图像和被篡改的图像(包括图像被裁剪过的情况),然后生成一个 GIF 并输出,可以更直观地展示篡改行为。不过,该功能目前仅对事实核查员、记者和研究人员开放。

2022 年 7 月 8 日,日本前首相安倍晋三遇刺后,中文网络流传一张照片称,被称为「日本第一女保镖」的石田萌美也在现场,却未能阻止杀手。

石田萌美此前在中文网络被形容为「日本第一女保镖」。她被指曾是安倍晋三最信任的贴身人员之一,因为外型靓丽和身份特殊受到关注。有文章指她是日本顶尖的武功高手,能够在 0.2 秒内拔枪制服袭击者,曾击退 10 名壮汉。

使用图片反搜工具搜索这张照片,可以确定照片本身是真实的,但是因为安倍身边的这位女士戴着口罩,也无其他明显的识别特征,所以依然很难判断她的身份。

这时我们仔细观察这张被指是石田萌美检查安倍伤势的照片,可以发现这位女士外表可供辨认的几大特征:长发束辫,黑色或深蓝色上衣,带有花卉纹样的裙装,低跟皮鞋。

由于安倍遇刺发生在公开场合,且现场媒体众多,因而有利的一面是,有大量现场照片可供检索。在《朝日新闻》网站上的安倍遇刺现场图片集中,我们可以发现大批同一场景的照片,能够较清晰地分辨出这位女士身穿的是一件罩衫,罩衫内是黄色 T 恤。

在美联社转发《读卖新闻》的一张照片中,安倍被送上救护车,救护车旁有一位女士的正面照片,放大后可见其发型、黄色 T 恤和蓝色罩衫、带花纹的裤装、黑色皮鞋,均与网传照片一致,可以判定她与被中文网络认为是石田萌美的那位女士是同一人。

大量现场视频和照片显示,安倍遭到枪击后,一批身穿黄色 T 恤的人员对其进行了心肺复苏等急救。这些人员的黄色 T 恤与这位女士的黄色 T 恤一致,因此,黄色 T 恤成为识别这位女士身份的最关键因素。

核查员用日语在推特、Facebook 平台上搜索「安倍 黄色衣服」关键词,发现有日本网民的推文中提供了线索,指出这是日本看护联盟的工作人员在急救。

据此线索,检索看护联盟的官方网站,了解到看护联盟是代表日本护理行业的组织,而且网站上的照片显示,看护联盟的成员在参加集体活动时一般均着黄色标志色衣服,有护理、急救知识和经验。

再用日语检索「看护联盟 安倍」,可以发现代表日本看护联盟参加众议院选举的友納理緒在有关安倍的讣告中提到,「在这次事件中,现场的看护联盟的各位在混乱中奋力救助」。

照片中的这位女士也穿着统一的黄色 T 恤,因此可以判定,她不可能是石田萌美,也不可能是安倍的保镖。

从这张照片的核查过程来看,以图搜图只是一个起点,更需要根据图片中的各种信息、图片外的各种新闻报道、社交媒体上的线索等等综合研判,得出结论。(参考阅读:安倍遇刺时网红女保镖就在身边?

2021 年 9 月,中文网络流传一张照片称,被加拿大扣押的华为公司首席财务官孟晚舟「困境中不忘支持国货,穿鸿星尔克出庭」,并附上孟晚舟穿运动鞋面带笑容的照片。不过,这双鞋上并无醒目的品牌 logo。

以「Meng Wanzhou+sneaker」为关键词在搜索引擎检索,可以在德国新闻图片社 IMAGO 的网站上发现一组照片,与中文网络流传的照片一致。

该组照片由加拿大新闻社记者 Darryl Dyck 拍摄,图片说明是:2021 年 8 月 6 日,华为公司首席财务官孟晚舟戴着脚踝监视器,穿跑鞋(running shoes)离开温哥华的家,前往位于温哥华的加拿大不列颠哥伦比亚省高等法院参加引渡听证。

此时我们已经找到了图片的来源,但是原图的图片说明中并未指出这双鞋是什么品牌。

不过,搜索结果很有利的一点是,摄影师拍了一组照片,尤其是有一张特写孟晚舟脚踝监视器的照片,孟晚舟的跑鞋也相比网传图片更加清晰。

这时我们使用 Google Lens 搜索这双鞋,因为 Google Lens 不仅可以搜索图片,还会试图提供图片中的信息,比如你扫描一张产品图片,可能会看到购物链接。果然,搜索结果指向了 HOKA 品牌。

核查员还使用了淘宝 APP 的拍照功能,拍下图片上的鞋子,然后淘宝快速识别出相似的结果,也指向了 HOKA 品牌。

据此线索进入 HOKA 官网的网络商店检索,可以发现孟晚舟所穿鞋款品牌为 HOKA ONE ONE,款式为 Clifton 8。

与此同时,核查员还登录了鸿星尔克官方商城、鸿星尔克淘宝旗舰店,没有发现类似商品。鸿星尔克淘宝旗舰店的客服也证实这款鞋子并非鸿星尔克。

由此可以得出结论,这张照片是孟晚舟于 2021 年 8 月 6 日离开住所前往加拿大不列颠哥伦比亚省高等法院参加引渡听证时拍摄的,她脚穿鞋款品牌并非鸿星尔克,而是法国品牌 HOKA ONE ONE。(参考阅读:孟晚舟穿鸿星尔克运动鞋在加拿大出庭?

2022 年 7 月 8 日,日本前首相安倍晋三遇刺后,中文网络流传一张照片,一位日本电视台的男性主播在咧嘴大笑,画面下方是一行日语字幕,可以辨认出与安倍遇刺有关——“安倍晋三元首相死亡確認”。

首先我们先从照片上的信息入手,这张截图的左上角有日文字样「イット」,在谷歌检索,找到节目的官网,可见这是日本富士电视台和富士新闻网(FNN)播放的一档新闻节目,全称为 Live News it!(日语片假名为:ライブ ニュース イット!),于 2019 年 4 月 1 日开播,一般直播时段为每周一至周五下午 3 点 45 分-7 点。

比对节目官网上的主持人形象,可以确认屏幕上的主播名叫榎並大二郎,毕业于庆应大学,2008 年加入富士电视台,从 2020 年 9 月 25 日起开始担任 Live News it!的主播。

这时我们要确认的是,榎並大二郎在播报安倍遇刺后确认死亡的新闻时是否大笑,所以最好要找到有关的节目视频。在 FNN 的 频道检索,可以发现该频道 2022 年 7 月 8 日上传的一则视频与中文流传截图的字幕、主持人衣着、背景均一致:「速报:安倍晋三元首相死亡確認 元海上自衛官に銃撃される」。

不过,在这则时长 44 秒的视频中,榎並大二郎并无大笑的表情。

那这张网传截图中大笑的表情从何而来?P 图能够如此自然吗?

事实上,随着 AI 技术的进步,常见的人脸编辑器或修图应用已经能很轻松地改变照片中的人物表情,比如国外的 FaceApp 和国内的醒图 App。

核查员从榎並大二郎播报安倍遇刺视频中截取照片,试图复现图片中的主持人大笑效果:

在醒图应用中选择「微笑」的特效选项后,应用自动处理完成后展示的效果如下,与网传图片非常接近:

核查至此,得到两个证据:一是检索到主持人播报该条新闻时的完整视频片段,主持人并无大笑;二是核查员使用修图软件,复现了网传图片中的主持人大笑效果。

但是,为了让结论更坚实,我们还就这张图片联络了富士电视台观众中心,工作人员回复查询时表示,当天紧急速报无异常,播报员榎並大二郎没有大笑的行为。

此时我们可以得出结论,主持人当天播报有关新闻时并未大笑。这一核查案例也提醒我们,随着 AI 技术的日益进步,对于图片的识别难度也在增加,必须借助更多信息加以综合研判。(参考阅读:日本主持人播报安倍遇刺时咧嘴大笑?

三星手机的 Space Zoom 功能可以让用户拍摄到美丽的月球图像,但也引发了由此产生的图像是否「真实」的争议。

2023 年 3 月,Reddit 上的一则帖子引发激烈的讨论,该贴清楚地拿出「证据」说明,指责三星的月球照片是「假」的。

Reddit 用户 ibreakphotos 先故意制作了一张模糊的月球照片,将其显示在电脑屏幕上,然后用三星 S23 Ultra 手机拍摄屏幕上这张模糊的月球照片,最终的照片显示了一张清晰的月球照片,增加了一些以前没有的细节。

制作过程:

1.从互联网上下载了这张高分辨率的月球图片

2.将图片尺寸缩小到 170×170 像素并使用高斯模糊,让月球上所有的细节都消失,这意味着它不可恢复,信息不存在,数字模糊

放大 4 倍的版本,以便更好地看清模糊效果:

3.在显示器上全屏显示该图像(尺寸为 170×170 像素,非常模糊),拍摄者移到房间的另一端,关掉所有灯光,开始拍摄

4.手机拍摄效果

5.对比

ibreakphotos 认为,用三星 Galaxy S23 Ultra 拍摄的月球图像,是通过应用「月球纹理」(Moon texture)来伪造的。 这名用户得出的结论是,三星的月球照片是假的,在没有细节的地方添加了细节,大部分工作是 AI 完成的,而不是光学器件。

对于图片造假指控,三星向著名的科技产品评测指南网站 Tom『s Guide回应称:「三星致力于在任何条件下提供最佳的拍照体验。当用户拍摄月亮时,基于 AI 的场景优化技术会识别出月亮是主要拍摄对象,并进行多帧合成,然后 AI 会增强图像质量和颜色细节。它不会对照片应用任何图像叠加(image overlaying)。用户可以关闭基于 AI 的场景优化功能,这将禁用对用户拍摄的照片进行自动细节增强。」

也就是说,三星否认了 Galaxy S23 Ultra 使用基于 AI 的图像叠加技术来增强月亮照片细节的说法。

科技网站 The Verge 就此评论称:「在这种情况下,『假』到底是什么意思?这是一个很难回答的问题,随着计算技术进一步融入摄影过程,这个问题将变得越来越重要和复杂。我们可以肯定地说,我们对照片造假的理解很快就会改变,就像过去对数码相机、Photoshop、Instagram 滤镜等的理解一样。

摄影正在发生变化,我们对什么是『真实照片』的理解也会随之改变。「

AI 图像生成工具在 2023 年呈现出爆发性应用趋势,可以通过利用海量数据库生成无限数量的图像。

Midjourney是一种使用生成 AI 从简单的文本提示创建图像的工具,2023 年 3 月推出了更先进的模型,能够生成更逼真的图像。

Stable Diffusion是一个文字转图片的生成模型,可以只用几秒钟时间就生成比同类技术分辨率、清晰度更高,更具「真实性」或「艺术性」的图片结果。

DALL-E 的出品方 Open AI 旗下的一个模型,接收文本和图像作为输入,以多种形式输出最终转换后的图像。升级版本 DALL-E 2 在生成用户描述的图像时具有更高的分辨率和更低的延迟。

Craiyon AI是一个免费的在线 AI 图片生成器工具,可以根据用户输入的任意文本生成独一无二的视觉艺术作品。

2023 年 3 月,微软 Bing 在线 AI 绘图功能Image Creator上线,由 Open AI 的 DALL-E 驱动,可通过文字描述生成图片内容。Bing 绘图目前仅支持英文,使用「形容词 + 名词 + 动词 + 风格」的格式可以生成高质量图片。每个由图像创建器生成的图像都会在左下角添加 Bing Logo。

Adobe 也在 2023 年 3 月发布了使用人工智能生成图像的新工具Adobe Firefly。Firefly 允许用户通过文字来描述其软件将创建的图像、插图或视频。

英伟达公司也推出了名为「毕加索「的自有服务,该服务使用人工智能技术从文本描述中生成图像、视频和 3D 应用程序。

虽然篡改图片和创建假图像的做法并不新鲜,但 、DALL-E、Stable Diffusion 的 AI 图像生成工具更易于使用。它们可以快速生成具有详细背景的逼真图像,只需来自用户的简单文本提示即可。这些技术如果被不良行为体利用,可能会大幅提高核查难度。

在过去,包括深度伪造(deepfake)在内的造假者会篡改一张已经存在的图片或一段已经存在的视频,此时尚且可以通过图片反搜等方式,追根溯源找到原图来进行核查。

但是,新时代的造假者已经不需要这么做,他们可以使用人工智能 技术,特别是文本生成图像的模型,创建完美支持其虚假叙述的全新图像,制造逼真的假证据。这种图像,无法通过图片反搜的方式直接追根溯源,因为它本身就是源头。

2023 年 3 月,在美国纽约检方可能因一起案件逮捕前总统特朗普之际,开源调查新闻机构 Bellingcat 创始人 Eliot Higgins 在一系列广为流传的推文中,用 Midjourney 工具的最新版本制作了特朗普虚构被捕的大量戏剧性画面。他在推文中明确表示这些图像是 AI 生成的,也说明了自己在 AI 生成过程中发布的指令:「特朗普在被捕过程中摔倒。新闻报道画面。」 随后 AI 给出了这些图片。

虽然推特的资深用户和人工智能爱好者可能第一眼就能认出这些假图片,但也有很多人并没有,甚至会提出疑问:「为什么特朗普被捕没有成为新闻」?在没有关键背景的情况下,这些视觉效果很快就会被其他人转发。一篇 Instagram 帖子分享了 Higgins 的一些特朗普照片,就好像它们是真的一样,获得了超过 79000 个赞。

虽然这些照片存在瑕疵,比如脸和手明显扭曲,警察制服上的文字乱七八糟,一张图片显示特朗普戴着警用腰带,等等。然而,这些线索没有那么简单被觉察,而且在现阶段可以很容易就被 Photoshop,或者一点动态模糊、像素化所掩盖。可以预见的是,随着技术的进步和迭代,这些瑕疵肯定也会消失,比如 Midjourney 的第五代版本已经可以较好地解决手部问题。

2023 年 4 月,德国摄影师鲍里斯·艾达格森(Boris Eldagsen)的黑白肖像摄影作品「电工」(The Electrician)不仅入围「Sony 世界摄影大奖」(Sony World Photography Awards)的创意类别,更获选为冠军,看起来是以传统摄影技术所拍摄的、两名来自不同世代的女性。

不过,艾达格森在 Facebook 发文坦承,这张其实是由 Open AI 的「DALL-E 2」工具生成的图像。事实上,「电工」是艾达格森 2022 年开始创作的「Pseudomnesia」系列作品之一;Pseudomnesia 在拉丁语中指的是「虚假记忆」,包括从未发生过的虚假事件,而不只是不准确的记忆。

艾达格森表示:「这是一个历史性时刻,这是第一张由 AI 生成的图像赢得了一个国际摄影大奖。」他声明称:「我想检验摄影比赛是否已经准备好接受 AI 生成图像。但事实上并没有明确的规定,关于 AI 图像是否合法,该组别允许编辑和合成图像。」

目前核查这些 AI 生成的图像并无非常有效的工具,只能综合各种信息研判。

人工智能创业公司 Hugging Face 开发了一个人工智能图像检测器(AI Image Detector),能检查图像的显著特征,并对图像是自然的还是假造的做出说明。

比如这张特朗普被「逮捕」的 AI 生成图片,检测器判断出 67%的图像是由人工智能创造的。

这张乌克兰总统办公室 3 月 23 日发布的泽连斯基视察赫尔松的真实照片,检测器判断出其 83%的图像是由人而非人工智能创造的。

但是这种检测只能作为一种参考,而无法成为唯一的决定性证据。

图像数据分析公司 Mayachitra 也有一个针对使用 GAN(Generative Adversarial Network,生成对抗网络)技术生成图像的检测工具,目前只有测试版,不过可靠性仍有待提高。

比如这张特朗普被「逮捕」的 AI 生成图片,Mayachitra 工具却认为它「很可能不是使用 GAN 技术生成的」(Probably not GAN generated)。

人工智能公司 Hive Moderation 也有一个AI 生成内容检测工具,既可以检测文字内容,也可以检测图像内容。图像检测方面,可以检测由 DALL-E、Midjourney 和 Stable Diffusion 等流行工具生成的图像。

上传图片后,Hive 的人工智能检测模型会进行处理,以确定图片是否由 AI 生成,然后给出一个分数结果。如果模型认定图片由 AI 生成,结果还会判断这张图片是由哪个引擎创建的。

比如这张火车站老人与孔雀的 AI 生成图片,Hive 判断其 99.9%由 AI 生成,并且是由 Midjourney 生成的。

这张法国总统马克龙官方推特 4 月 7 日发布的访问中国中山大学的图片,Hive 判断其只有 0.5%的可能性是由 AI 生成的。

另一个核查的线索是找到图片首次发布到网上的时间。在某些情况下,最初的创作者可能会明确表示图片是人工智能生成的,并指出使用的工具。反向图像搜索可以帮助查看图片是否已在搜索引擎中编入索引并查找包含相同照片的旧帖子。反向图像搜索也会找到相似的图片,这时可以将潜在的 AI 生成的照片与来自可靠来源的照片进行比较,发现有用的线索。

有时照片本身也隐藏着线索,例如某些 AI 创作工具使用的水印。

例如,DALL-E 会在其所有图像的右下角自动生成一个多色条。

Craiyon 在同一个地方放了一支小红铅笔。

但并非所有人工智能生成的图像都有水印——这些水印可以被移除、裁剪或隐藏。

2023 年 5 月 10 日,谷歌在 I / O 2023 开发者大会上宣布,将确保每一张由谷歌 AI 生成的图像在原始文件中都有一个标记。其他创作者和出版商将能够添加类似的标记,因此用户将能够在 Google 图像搜索结果中看到这些 AI 生成标签。

另外,尽管生成式 AI 取得了长足的进步,但截至 2023 年 3 月,AI 生成的内容中仍然会出现错误,这些缺陷是目前识别 AI 生成图像的重要方式。比如,逼真的手仍然很难生成。AI 图像也很难产生反射,发现人工智能的一个好方法是寻找阴影、镜子、水,也可以放大眼睛,分析瞳孔,因为拍照时通常会有反光。有时图像会出现眼睛大小不一,颜色不同。还可以查看照片的远景,元素离得越远,物体就越模糊、扭曲并且视角不正确。

但是,AI 生成图像的技术绝对会快速进步,这些视觉缺陷也绝对会被弥补。比如,2023 年 3 月月发布的 Midjourney 的最新版本能够描绘出逼真的手部。所以从长远来看,视觉线索也并不可靠。

为了应对深度伪造图像,科技公司、研究人员、新闻机构正在试图建立内容来源和所有权的标准,从源头出发对影像的创造和传播进行全程跟踪。或许未来我们核查图像时,首先要做的是查看其数字水印。

2021 年 2 月,多家具有影响力的科技和媒体公司结为伙伴,成立「内容来源和真实性联盟「(Coalition for Content Provenance and Authenticity,C2PA),制定媒体内容来源与历史或出处认证技术标准,试图解决虚假信息、错误信息和在线内容欺诈的扩散问题。联盟创始成员包括 Adobe、Arm、BBC、Intel、Microsoft 和 Truepic,着力建立一套标准化溯源解决方案,解决好误导性内容问题。

C2PA 成员将共同针对常见资产类型和格式制定内容溯源规范,让出版商、创作者和消费者能够追踪媒体内容(包括图像、视频、音频和文档)的来源和演变。这些技术规范明确各类资产应标示的相关信息内容、如何显示和存储该信息以及如何识别篡改的证据。

各平台能够通过 C2PA 开放标准保存和读取基于出处的数字内容。一项开放标准可供任何在线平台采用,因此对于在整个互联网上提升信任度至关重要。除了将各类媒体类型纳入其中,C2PA 还着力推动从捕获设备到信息消费者的端到端出处体验。与芯片制造商、新闻机构以及软件和平台公司合作对于促进出处标准和推动整个内容生态系统的推广采用至关重要。

C2PA 的成立将 Adobe 主导的内容真实性倡议(Content Authenticity Initiative,CAI)和 Microsoft 与 BBC 主导的项目溯源(Project Origin)的众创始成员召集在了一起,在一个联盟下统一技术规范。CAI 正在构建一套数字媒体出处与历史系统,创作者可通过该系统声明其作者身份,消费者则可以通过它来判断其所看到的内容是否值得信赖。「项目溯源」针对的是新闻制作与传播。其方向是将证明内容真实性的标示附加到内容上,并让用户能够看到该标示信息,由此来解决数字新闻生态系统中的虚假信息问题。C2PA 成立后,技术标准将统一,上述两个实体将继续在各自社区内进行推广、原型设计和教育。

2022 年 2 月,C2PA 联盟发布了用以对抗深度伪造技术的数字内容认证技术规范的第一版,包括实现指南、考虑因素、用户体验指南以及关于程序目标和基本原理的完整细节。

C2PA 称:「C2PA 规范将为平台提供一种方法,以定义与每种类型的资产(如图像、视频、音频或文档)相关的信息,以及这些信息如何呈现和存储,以及如何识别篡改证据。作为一个开放标准,它被设计用于任何软件、设备或在线平台,以及监管机构和政府机构建立数字来源标准。」

在理想状况下,未来视觉内容的生产、传播与消费可能是这样的链条:制造视频和照片生产工具的公司——包括手机和相机制造商——需要在一开始就纳入 C2PA 身份验证标准。用户需要主动将内容凭证包含在他们制作的视觉效果中。主流出版商和社交媒体公司需要先找到这些凭证,然后才在其平台上显示图像。观众在信任图像或视频之前,可能要先查看一个带有下拉菜单的小图标。

目前,C2PA 联盟的成员已经扩展到包括索尼、佳能、尼康、松下、加拿大广播公司、德国新闻社、纽约时报等等在内的 52 家科技公司、媒体以及其他机构。

从应用层面看,2022 年 10 月,Adobe宣布与徕卡和尼康建立合作关系,这将使这两家相机公司在两款相机中实施符合 C2PA 标准和 CAI 标准的图像证明技术:徕卡 M11 和尼康 Z9,该技术将允许摄影师在相机拍摄时安全地附上照片的来源信息,包括每张照片的拍摄时间、地点和方式。

Adobe 还推出了内容凭据 (Beta)功能,这是 Adobe Photoshop 中一项正在开发的功能,凭借此功能,创作者可向导出的图像中添加其归因详细信息。启用后,内容凭据会收集编辑、活动和制作者姓名等详细信息,然后在创作者导出其最终内容时将这些信息作为防篡改归因和历史数据(称为内容凭据)附加到图像。不过,目前该功能只提供英语、德语、法语和日语版本。

C2PA 联盟中,尤为值得一提的是Truepic 公司,该公司是 C2PA 联盟的创始成员,相比 Adobe 这样的巨头,Truepic 是一家位于美国加州的创业公司,但是 Adobe 的内容凭据功能有一部分就是 Truepic 提供技术支持的。

通过捕获、签名和密封任何照片或视频中的元数据,Truepic 的技术可以创建防篡改数字指纹,并可以在整个网络上进行跟踪。这一流程也被称为「镜对镜」(glass-to-glass)系统,在该系统中拍摄、存储和传输的图片和视频会向观看者发出关于内容已被修改的提醒,无论这些修改是在何时何地进入一则影像从镜头到屏幕的过程中的。

首先,Truepic 的安全相机技术可捕捉、标记和密封每张照片或视频中的关键细节,例如日期、时间、位置和捕捉到的真实像素。

随后,Truepic 对图像实施符合 C2PA 标准的签名并密封。

然后,Truepic 将可以通过 SDK 将数据集成到任何网站或数字服务中,让关注可以查看任何媒体文件的来源和历史记录。

2023 年 3 月底,Truepic 和微软宣布发起「普罗维登斯计划「(Project Providence),利用上述技术和标准帮助记录和保护乌克兰的文化遗产。

2023 年 4 月初,Truepic 和荷兰公司 Revel.ai 合作创造并发布了一段深度伪造的视频:人工智能专家尼娜·希克(Nina Schick)在视频中发出「真实与虚构之间的界限正在变得模糊」的警告。

然而,这并非她本人。视频以一条字幕结尾:「这个深度伪造作品是由 Revel.ai 在尼娜·希克的同意下创建的,并由 Truepic 加密签名」。

这两家公司将这一视频描述为「第一个数字透明的深度伪造」(first digitally transparent deepfake),视频右上角有一个带有 i 标志的水印,表明它是计算机生成的,数据被加密密封在文件中,如果篡改图像,就会破坏数字签名,并在使用可信软件时阻止该证书显示。

除了 Truepic 以外,位于伦敦的机构eyeWitness to Atrocities也开发了类似的系统。作为系统核心的应用有两个功能。首先,当安装有该应用的手机拍摄照片或视频时,它会记录下事件发生的时间和地点,而这些时间和地点是由 GPS 卫星、附近的手机基站和 Wi-Fi 网络等难以否认的「电子证人」报告的。这被称为元数据的受控捕获,它比从手机上收集这类元数据更可靠,因为手机时间和位置的设置是可以更改的。第二,该应用读取图像的整个数字序列(用 0 和 1 呈现),并使用标准数学公式计算出该图像独有的由字母和数字组成的数值,即哈希值。

然后,使用者将图片或视频发动到 eyeWitness 的服务器,eyeWitness 会创建一个受信任的监管链,此链表明原始信息未以任何方式更改。

随后,eyeWitness 收到的所有信息都将由律师,他们对这些视觉证据进行标记、分类和处理,以满足调查人员的需求。

C2PA 项目联合创始人兼主席安德鲁·詹克斯(Andrew Jenks)认为,身份验证标准应该被视为一项重要的数字素养工作,其最接近的类似应用是如今被广泛采用的保证网页安全的 SSL 证书。

网站 SSL 证书是一种遵守 SSL 协议的服务器数字证书,由受信任的根证书颁发机构颁发。SSL 证书采用 SSL 协议进行通信,SSL 证书部署到服务器后,服务器端的访问将启用 HTTPS 协议(超文本传输安全协议),网站将会通过 HTTPS 加密协议来传输数据,可帮助服务器端和客户端之间建立加密链接,从而保证数据传输的安全。

如果某个网站受 SSL 证书保护,其相应的 URL 中会显示 HTTPS。单击浏览器地址栏的挂锁图标,即可查看证书详细信息,包括颁发机构和网站所有者的公司名称。

「我们必须训练用户寻找你今天在每个浏览器中上看到的挂锁图标,」詹克斯说,「那是一个非常困难的问题,花了很长时间,但这与我们今天面临的媒体素养问题完全相同。」

1.工具很重要,但更重要的是常识和逻辑。

2.没有任何工具是完美的,每个搜索引擎都有其优点和缺点,核查员可以使用 InVid 插件,尝试多种工具,确保找到更准确的图片源头。

3.搜寻到相同的图片并非一定就是最终的答案,也不一定能确定图片的真伪。若要确定图片中所展现的原始事件,必须更加谨慎地检查搜索结果,反复比对不同搜索结果对图片的描述;检查图片的拍摄时间和地点;分析包含图片的网页的发布者身份,判断其是媒体、政府机构,还是普通网民,以评估其可信度等。综合考虑搜索结果、影像细节和信源可信度等要素,进行交叉验证,才可能揭示事件的真相。总之,必须全方位分析才能确认原始事件的来龙去脉。

4.仅仅因为反向搜索引擎得到的结果都是同一张图片,并不一定代表该图片是真实且未被修改的。因为,即使一张图片被广泛传播,它也可能会被进行过后期修改,反向搜索结果也可能是其修改后的版本而非原始版本。举个例子,如果某个用户修改了他所拍摄的照片 A 并将其改成了图片 B,然后只上传了经过修改后的图片 B,那么反向搜索引擎将无法搜索到原始的照片 A。因此,需要注意的是,反向搜索引擎仅仅是一种帮助我们找到类似图片的工具,需要进行进一步的验证和核实才能确定图片的真实性和完整性。

5.有时候对原始图片进行某些修改可以更容易地找到最佳结果。

例如,有些人会发布一张照片并声称它是原始图片,但实际上只是对现有照片进行了翻转。在这种情况下,通过对照片进行翻转并进行搜索,可能会找到更准确的搜索结果。

6.留意图片上不起眼地方的水印,有时会提供图片原始来源的线索。

7,搜索结果有时会受到算法的影响,因此出现在前几页或出现多次的信息并不一定代表可信度高或图片的源头,因此需要更耐心地翻查搜索结果。

Fotoforensics是一个检测图片是否被修改过的免费网络工具。

ELA 是其主要特殊功能,ELA 是 Error Level Analysis 的缩写,表示错误级别分析,它通过在图像上显示错误级别来帮助我们检测图像是否经过 处理。

数字图像修改过的地方以及对比度较高的边界,往往 ELA 值较高,即表现为比较醒目的白色;而大面积的同色或者背景,往往表现为暗沉的黑色。

JPEG%的意思是图片质量比,显示上次保存时的图像质量。 每修改一次质量都会下降,一般来说也可证明图片被软件修改过。

元数据显示有关该图片的可用信息,例如创建时间、修改时间以及用于拍摄该照片的相机。

需要注意的是,使用 Fotoforensics 需要专业的影像知识,一般仅作为参考证据之一,而不宜作为主要的或者唯一的证据;还需要利用图片反向搜索工具等方法,寻找图片的来源,作为最终判断的依据。

VerEXIF可以用来查看照片的 EXIF 资料,也可以用来删除照片的 EXIF。

EXIF 是可交换图像文件的缩写,它是一种使用 JPEG 压缩在数码摄影图像文件中存储交换信息的标准格式。几乎所有新的数码相机都使用 EXIF 注释,在图像上存储信息,例如快门速度、曝光补偿、光圈值、使用的测光系统、是否使用闪光灯、ISO 编号、拍摄图像的日期和时间、白平衡,使 用的辅助镜头和分辨率等。有些图像甚至可能存储 GPS 信息,可以查看图像的拍摄地点。

注意:EXIF 资料是可以修改、编辑和删除的,因此只应作为核查参考。

而且,不是所有互联网上的照片都有 EXIF 信息,有些人在将其个人影像上传到网站之前,会先移除 EXIF 档案,例如其 GPS 位置。很多社交网络平台也会移除 EXIF 数据。

用于识别不同旗帜的大型数据库,可以按照不同的维度检索。

LICENSE PLATES OF THE WORLD

Plates Mania

提供全球各国和地区的车牌样式资料,按大洲和国家分类。如果不确定图片是在哪个国家/地区拍摄的,图片上的车牌可能是线索之一。

比如,2022 年 1 月初,中文网络流传一则视频,几名武装分子乘坐三轮车,在街头伏击扫射一辆白色轿车,镜头一转,白色轿车内出现孩子和女性惨死的镜头。有关文字称视频内容是「阿富汗,女人开车,被塔利班全车射杀」。

在视频的后半部分画面中,可以比较清晰地看到受害者的车牌样式和号码「LEH 15 6840」及位于号码下的「PUNJAB」字样。

在搜索引擎中检索「PUNJAB」,可以发现这一般是指是跨越印度和巴基斯坦的旁遮普地区。在上述车牌资料库查询,可以发现视频中的车牌样式是巴基斯坦的。这样可以确认视频不是发生在阿富汗。(参考阅读:阿富汗女性开车遭塔利班全车射杀?

高速公路标志数据库,按照国家分类。当图片或视频没有其他线索的时候,这些信息可以成为一个核查的入口参考。

Elmo – 免费好用的 AI 浏览器助理工具,提升网页效率的 Chrome 扩展

By: Anonymous
8 May 2024 at 15:17

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

Elmo 是一个免费的 Chrome 扩展,主要功能是利用 AI 技术快速建立摘要、观点和总结,当用户在浏览网站、 文件或 YouTube 时只要点击 Elmo 就会对当前内容进行摘要和重点整理,同时显示于的侧边栏,最大程度提升阅读上的速度和效率。它同时也是一个「可互动性」AI ,还能够对内容提问、指定关键词深入探索或洞察,非常强大。

Elmo is your AI companion to create summaries, insights and extended knowledge.

Elmo 背后使用的大型语言模型〔LLM〕API 是由 Lepton AI 提供,从 Chrome 程序商店后就能使用,不需要额外注册、也不会用到 / 账户,不仅免费、而且也支持多国语言,更重要的是能整合 PDF、Google 文件,就不用再手动将文件上传到 AI 服务。

另一个我觉得很好用的是 Elmo 兼具翻译功能,如果遇到英文、日文或其他语言,也能将摘要、重点、作者观点等输出为中文或指定语言,默认值是依照用户浏览器的主要语言而定〔也能手动选择〕,对于要阅读外文网站或文件来说 Elmo 是很好的 AI 助理哦!

Elmo is your AI web copilot to create summaries, insights and extended knowledge.

从 Elmo 官网会看到 Chrome 应用程序商店页面链接,进入后点击右上角「获取」将它下载到浏览器,不过当前在 Arc 浏览器还无法使用,如果是使用 Arc 浏览器就会显示 Not available for Arc 信息。

安装到浏览器后记得将 Elmo 固定于右上角,要启动 AI 功能时可以使用快捷键

或点击 Elmo 闪电图标。

使用方法很简单,在浏览网页时点一下 Elmo 右上角的按钮后会出现侧边栏,利用 AI 将网页内容进行总结、摘要和重点整理,默认情况下生成的内容会以用户浏览器的主要语言为主,这部分非常方便,不用手动输入提示词。

往下滑动后还会生成各种可能的相关问题,点击就能让 AI 继续帮你解答,Elmo 侧边栏最下方还能输入要询问的问题或输入 / 〔斜线〕选择操作指令。

要询问相关问题以外的内容也可以,Elmo 回答还蛮精确,排列方式很好阅读。

Elmo 设置选项里能够调整「偏好语言」,默认是使用浏览器语言,其他还有像「保持侧边栏进入」或设置快捷键功能,我觉得维持侧边栏打开很好用,否则在切换至其他分页后 Elmo 侧边栏就会自动关闭。

试着在英文网页点击 Elmo 就会在侧边栏显示总结、摘要和观点,直接翻译为中文。

还能使用中文进行提问,有助于用户更深入了解相关信息。

当遇到专有名词时选取后会出现选项,点击「Insight」可以对指定关键词生成更多说明〔包含相关网页链接〕。

在浏览时 Elmo 就很方便,不用从头到尾逐字阅读,只要生成总结、摘要后就能知道新闻大致内容。

Elmo 还能整合 PDF、Google 文件和 YouTube 视频,这个功能真的很好用,不过在遇到 YouTube 视频没有字幕时可能会出现不正确或幻觉问题。

Flowith – AI 互动新形式,白板画布式 ChatGPT 体验

By: Anonymous
24 April 2024 at 12:23

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

的交互,就像和朋友的聊天,你来我往,从上到下,线性的结构非常直观。

学生时期,我们应该都见过白板,老师用可以擦除的马克笔,在白色的平滑板面上写公式。

Canva、Figma 等设计平台,则提供了在线白板,它们沿袭了物理白板的特点,但画布是无限的,形式也更加自由,就像现实的办公桌一样,可以灵活地放置各种东西,很适合进行头脑风暴。

▲ 在线白板工具示意图. 图片来自:Canva

如果 ChatGPT 也以白板的方式和我们互动,会产生什么奇妙的化学反应?

Flowith 就是这样一款 内容生成工具,最近发布了公测,一周新增约 2 万名新用户。

Interact with the world's most powerful AI in a way from the future flowith is an AI productivity tool powered by GPT 4. Through innovative interaction, it allows you to collaborate smoothly with AI, with ideas flowing like a vibrant spring.

它在形式上最大的亮点是,把纵向的聊天记录,转变成了动态的画布,为人机交互提供了一种很新的方式。

Flowith 支持 GPT 4 Turbo、Claude 3 Opus 等模型,本质和 Perplexity 差不多,都是在他人的地基上搭建服务,但创新之处各有千秋。

通过邀请链接,都会获取一个月时间的无限次 GPT 3.5 查询以及有限次 GPT 4 查询(直接注册分别每个月只有 20 次和 5 次),GPT 4 奖励次数累积叠加。

Flowith 的底部仍然有输入框,但你是在一块类似在线白板的无限画布上,和 AI 互动。

这里还引入了一个新概念:节点。

每次提问产生新的节点,节点可以再发散和引用,串成很多不同的线。

举个例子更加直观,直接问 AI:「给我头脑风暴 5 个 AI 创业想法。」

Flowith 给出的答案是:AI 医疗影像诊断、AI 在线平台、AI 投资顾问、AI 智能家居可穿戴设备、AI 场景消费推荐。

然后,我们可以在「AI 智能家居和可穿戴设备」的分支下,追问目前有哪些主要玩家。

第一次看到答案以卡片的形式分叉和,心里会忍不住「哇」一声。

这个例子使用的是「思维导图发散模式」。除此之外,Flowith 还提供了自动决策模式、联网超级模式、生成图片模式,适合不同的问题和场景。

开放性的问题多半交给思维导图模式,联网搜索模式则像 Perplexity 的平替,能搜索、能总结,甚至还能开脑洞。

当我输入「国内 AI 搜索的发展情况如何」,Flowith 的输出分成三栏。

左边提供实时搜索结果和图片,可以进一步追问,让 AI 总结某个链接的内容;中间对几个 排名靠前的链接进行了总结,等于输出了一篇短小的「文献综述」。

但右边才是最有趣的一栏,AI 给出了知识图谱,帮我们拓展思路,搭建知识体系。

「AI 搜索发展现状」本身是一个非常宽泛的问题,Flowith 延伸出了不少细分的方向:AI 在搜索引擎功能中的集成、AI 搜索算法的进展、AI 搜索结果中的偏见……

好奇心强的人类,可以不断探索下去。选中知识图谱的动态效果也有些魔性,QQ 弹弹,像果冻的质感。

而在自动决策模式下,Flowith 会根据你的提示词,自动切换到最合适的 AI 模型,判断是否需要联网搜索,是否需要文生图,是选择速度优先的 GPT-3.5,还是更强的 GPT-4 和 Claude 3,可以窥见 Agent 的雏形。

比如,问问广州今天的天气如何,Flowith 就会进行实时搜索。

从整体来看,Flowith 的动态 UI 也很酷,整块画布可以拖拽、缩小、放大,节点可以引用、追问、删除、重新生成。

使用 Flowith,有些类似我们过去在草稿纸上涂涂画画思考问题,发散、延伸、删除,漫无边际,不像逻辑清晰的大纲,也不像和 ChatGPT 之间直观的聊天记录。

但这就是我们使用画布的目的,在发散创意的过程中,慢慢地把思路捋清,如同流水那样滔滔不绝。

画布式 AI 的可视化,本身就是思考的外显。

创新的形式,本质是为了实现人类和 AI 更高效的交互。

如果说 ChatGPT 是聊天式的 AI,Flowith 这类产品,可以简称为画布式的 AI。

类似地,设计平台 Figma 的在线白板工具 FigJam,也在去年 8 月提供了内置的 AI 部件 Jambot。Jambot 结合了 ChatGPT 的生成能力,可以进行头脑风暴、总结、改写等。

参与开发的产品设计师 Aosheng Ran 在发布时提到:

我想我们被困在聊天框里了。就像我们现在被困在 Zoom 中一样。

▲ Jambot

和聊天式的 AI 互动,确实存在局限性。

ChatGPT 等聊天机器人是基于线性的结构,但思考往往不是线性的,大模型又有一定的随机性,生成的内容,比如文案、翻译、代码,往往需要反复修改、对比和测试。

ChatGPT 纵然可以反复生成,但如果某个问题对话了几百次,聊天记录过长,我们可能也不知道自己聊到哪里了。

哪怕把一个问题研究清楚了,ChatGPT 无法直观地呈现从这个问题引发出去的不同分支。

但画布式的 AI 是不一样的烟火。

同一块画布上,我们可以反复修改提示词,或者用不同的大模型多试几次,答案全部保留;我们也可以同时完成多项任务并查看结果,搜索、头脑风暴、内容总结等需求并行不悖。

▲ 图片来自:X@DerekNee

比如,假期快到了,我先用了头脑风暴模式,让 Flowith 列出 AI 旅行助手应当具备的 5 个特点,再用了联网搜索模式,让它直接找出 3 个目前最主流的 AI 旅行助手应用。

以此类推,涉及到需要反复生成、对比内容的创作场景,以及发挥 AI 多项能力的工作流,画布式的 AI 往往比聊天式的 AI 更有趣、更直观,也更具互动性,不必新开很多的聊天页面,本身就是一块无限的创作土壤。

在线白板工具引以为傲的团队协作功能,也是画布式 AI 所擅长的,聊天式 AI 只能甘拜下风。

ChatGPT 支持共享聊天记录,但不能从分享的链接继续对话。

Perplexity 支持分享搜索结果,其他用户可以在原有的基础上追问,但追问后会创建新的链接,和我们分享的并不在同一个页面。

然而,Flowith 只要开了「可编辑」的,对方就可以参与团队协作,在输入框提出自己的问题。如果只是「可查看」,虽然没有输入框,对方也可以发表评论。

想象一下,我们分享一个「flow」给别人,直接在画布上进行实时多人生成和讨论,又不会干扰原有的痕迹,激情和甲方 Battle,有种在飞书文档挥斥方遒的感觉了。

类似 Notion 的模板,如果不知道怎么更高效地使用,Flowith 还提供了 Discover 页面,向你推荐别人的用法。验证可行的工作流,被加工成了一个个开箱即用的半成品。

之所以反复强调画布和聊天的不同,甚至隐隐有些把它们对立起来,是因为交互的方式,潜移默化地影响着我们思考的方式。

如果只是看到一个输入框,可能我们的思维也会陷入「对话模式」,像和人类交流一样和 AI 说话,向它问好,问它如何一夜暴富,或者向它倾诉自己的心情。

这样的用法也很好,但当使用 AI 的方式更多、更自由,内容生产也就有了更多的可能,AI 能力的边界也就离我们更近。

画布式的 AI 和聊天式的 AI,并非你死我活的替代,而是美美与共的互补。

聊天式 AI 固然有缺点,画布式 AI 也并非总是笑到最后。

如果只是找一个简单的问题、了解某个陌生的概念,还是求助 GPT-4 和 Perplexity 更快。

作为一个初出茅庐的产品,Flowith 也不是那么好用,短板肉眼可见。

生成图片模式支持的模型不多,目前只有 Stable Diffusion 和 DALL·E 3,之前支持 Midjourney,但现在不可选了。

同时,Flowith 调取的模型有 2 个梯队,高级的 T1 和基础的 T2。虽然 GPT-3.5 Turbo 等 T2 模型在邀请朋友后无限次免费,但 GPT-4 Turbo、文生图模型等 T1 模型有使用额度。

在个人的体验之中,Flowith 也出现了一些奇怪的状况,但不确定这些问题的普遍性。

用中文向 Flowith 提问,答案也可能是全英,有些影响用户体验。拿同样的提示词问 GPT-4 和 GPT-3.5,回答的都是中文。

虽然 Flowith 支持读取 PDF,但如果上传的文件过大,很可能不成功。

Flowith 的交互也不够流畅,输入新的问题时,其他节点和整体界面总会发生动态的变化,有时候会让人迷失视觉的重心。虽然效果酷炫,但新鲜感只是一时的。

另外,在对 Flowith 的某个节点进行追问时,上下文不一定连贯,出现过答非所问的状况。

尽管产品还不那么成熟,但 Flowith 做了和 Perplexity 类似的事情:在大语言模型的基础上,考虑怎么应用 AI 的能力,让 AI 更好地加入我们的工作流。

Flowith 开发者 @DerekNee,在 X 分享了他对产品的见解——不应该只把 Flowith 看作是一个白板 AI 工具。

他本身是 GPT-4 和 AI 产品的重度用户,但在写文案、写代码、搜索内容时,主流的聊天式 UI 不够高效,不适合反复的修改、对比和测试。

在他看来,白板是为了让大众理解二维画布、节点概念的一个代替词,Flowith 的核心依然是帮助用户生成内容,探索 Human-AI 新的、更有效的交互方式。

这和 Figma 的理念不谋而合。推出 Jambot 时,Figma 在博客写道,AI 是一种增强工作和协作的工具。与其说让 AI 为你做事,不如说 AI 在帮助你做得更好。

WPS、钉钉等办公 AI 化,听用户的指挥一键生成 PPT,让 AI 助理进行文档速读,其实也是这个道理。

Flow 的本意「流动」,某种程度上就是我们对 AI 工具的期许:帮助人类的思维流动起来。

其实,我们思考和解决问题的方式已经被 AI 改变了。

Perplexity 等 AI 搜索,渐渐变成了日常离不开的产品,人类提出问题,它们搜索、摘要、成文,自己已经是一个成熟的工作流了,我们付出更少,但效率更高。回想只用传统搜索引擎的日子,万古如长夜。

还没有和人类磨合得很好的 Flowith,无法代替 ChatGPT,但这不是问题。

Canva 等设计平台能在 Adobe 的领域闯出一条路,是因为搭建产品的底层与 Adobe 不同,前者是模板和部件,后者是对图片的像素级调整。

Canva 抢不走 Adobe 的忠实用户,但吸引了不会或者没法用 Adobe 的用户。

Flowith 也是类似,本质是在填补市场的空缺。Perplexity 不重复 Google,Flowith 不重复 Perplexity。

ChatGPT 引领了聊天式的 AI,用起来确实便捷又简单,在它之后,很多产品照做了,用户也默认接受了。

然而未来,我们与 AI 的协作,不会只是翻译、问答,应该允许更多有趣的想法发生,它们不一定成功,但足够带来惊喜。

毕竟,AI 的时代,变化总是很快,必然还有更新鲜的 AI 交互方式,提升效率、创新思维、改变工作流。

在玩过更多产品之后,我们才能归来仍是少年地惊呼:这才是我想要的 AI 应用。

❌
❌