Normal view

There are new articles available, click to refresh the page.
Before yesterdayMain stream

Stirling PDF – 免费开源的 PDF 编辑工具,拥有超过 30 个的全面功能

By: Anonymous
16 October 2024 at 12:50

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

Stirling PDF 是一站式的 PDF 编辑,让用户能对 PDF 文件进行各种编辑操作,包括分割、合并、转换、重新组合、新增影像、旋转、压缩等等,特色是免费、开源GitHub〕,过程中文件只会存在用户的设备上,若在处理时有暂存于服务器的内容在下载后会即时从服务器删除,不会记录保存或追踪任何资料,相较于在线工具来说是更安全、的解决方案。

1 Locally hosted web application that allows you to perform various operations on PDF files – Stirling-Tools/Stirling-PDF

Stirling PDF 提供多元的 PDF 编辑功能,涵盖文件组织、格式转换、安全性、检视与编辑等工具,满足各类文件处理需求,用户无需额外下载、安装软件,只要通过即可进行操作,Stirling PDF 有中文在内等多国语言界面〔在我写这篇文章时中文字串翻译率已达 93%〕,进入、找到对应的功能后就能直接进行编辑。

这项服务目前可以做到的功能包括:

1. 文件组织

2. 格式转换

3. 签名与安全性

4. 检视与编辑

5. 进阶功能

顺带一提,Stirling PDF 还有提供 Windows 版本,可以在没有连上的情况下使用,如果有兴趣的朋友可以在 GitHub 找到下载链接,原则上两者功能差不多,无论在线版或 Windows 程序都不用付费、也无广告干扰。

Stirling PDF

进入 Stirling PDF 网站后先从右上角语言选择「中文」。

Stirling PDF – 免费开源的 PDF 编辑工具,拥有超过 30 个的全面功能

接着从上方「工具」就能看到完整功能,依照类型分为:组织、转换为 PDF、从 PDF 转换、签名与安全性、检视与编辑和进阶工具,也可以直接从首页输入功能名称列出相关工具。

有一个 PDF 万用工具是整合旋转、裁切、分割、移除、新增图片等功能,进入后先点击左下角新增要编辑的 PDF 文件。

加入后 PDF 页面预览就会显示于下方,每一页都可单独旋转、删除或调整页数,将光标到页面中间时还会出现其他编辑选项,例如裁切或是加入图片,其实操作上很直觉,稍微摸索一下就会。

编辑完成别忘记点击右上角「下载」保存新的 PDF 文件。

另一个压缩 PDF 也是很常在在线工具看到的功能,选择文件、设置压缩比或是自动模式〔自动调整质量以使 PDF 达到指定大小〕,就能快速压缩 PDF 以获得更小的文件容量。

点击压缩后就会开始处理,完成后自动跳出下载提示,我以大约 9 MB 的 PDF 文件、手动模式 3 级测试后获取一个约 2.5 MB 的新文件,压缩成效相当好,而且图片并没有失真或模糊等情形。

另一个也很常用到的功能是「分割 PDF」,可以将 PDF 指定页面删除、或只是留下需要的页面,使用方法也很简单就不多加赘述,Stirling PDF 会有预先设置的示例提示,用户照着格式稍作修改后就能完成相关编辑任务。

如果要说 Stirling PDF 有没有比较特殊、少见的功能,有一个「自动涂黑」工具很有用,用户只要输入要涂黑的文字,选择 PDF 后就会自动将识别到的文字涂黑,确保隐私和安全性,同时也省去手动编辑文件的时间,操作上更有效率哦!

下图就是使用自动涂黑工具识别、涂黑的 PDF 文件示例,指定文字就会被涂黑处理。

ChatGPT Canvas 全新 AI 写作、源码、文本编辑工具,功能测试

By: Anonymous
2 October 2024 at 14:47

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

最近推出会主动思考推理的「 o1-preview 」,以及更即时、自然的「高级语音对话模式」后,今天又再次推出新功能:ChatGPT Canvas」,这是基于 GPT-4o 架构开发的全新 写作、源码编辑界面。让 ChatGPT 不再只能对话,而可以进行更深入、准确的内容创作工作。

第一波更新中,ChatGPT Plus 和 Team 用户会先获得 Canvas 功能,而全球的企业和版用户将会在下周获得使用权限。并且 还计划在 Canvas 正式发布后,向所有 ChatGPT 用户开放这项新的人机协作界面。

实际测试后,我觉得可以把「ChatGPT Canvas」想象成一种 AI 文本、源码,在这个中,人和 AI 可以更有效率的协作,共同编辑更好的内容成果。

以前的 ChatGPT 是即时通,一切内容要在对话中生成,也只能用对话引导 AI 去生成、修改,这很多时候会有点麻烦,常常在问答的过程偏离主题,难以指定要修改的部分,容易愈改愈乱,再也回不去之前更好的版本。

但是「ChatGPT Canvas」能够解决上述问题,它让人与 AI 在一个类似文本编辑的界面中讨论,就像多人一起编辑一份在线文件那样,可以一起处理文字、源码内容,可以针对任何指定段落修改,能够整合人与 AI 各自编写的内容,最后一起合作完成一份文本。

于是, ChatGPT 不再只是「对话软件」,而可以当作真正的「AI 文本内容、源码内容编辑器」,你可以利用来处理下面的工作流程:

在这篇文章中,我通过一个完整的写作实测案例,带大家了解 Canvas 的操作流程、快捷功能以及它如何帮助创作者解决具体问题。

ChatGPT 的 AI 模型中切换到「GPT-4o with canvas」模式,下面我测试看看利用这个新界面编写一篇文章。

首先,我先利用原本常用的 AI 指令结构,结合我的想法草稿,请 ChatGPT 改写成一篇完整的文章内容。

ChatGPT Canvas 全新 AI 写作、源码、文本编辑工具,功能测试

当 AI 开始编写文章草稿,或是源码时,「GPT-4o with canvas」就会像是下图这样,进入独立的文件编辑界面。

进入独立的 Canvas 编辑界面后,最大的优点就是,我们甚至可以直接在上面修改 AI 生成的文章内容。

于是这样一来,可以实现更流畅的「人与 AI 的协同写作流程」。

以前 AI 生成的内容,我们有不满意的地方,无法人为的介入修改,只能让 AI 自己去改,而常常愈改愈乱。

现在, AI 生成的草稿,我可以直接在编辑界面介入,修改成我觉得更好的版本,然后再请 AI 接续调整,实现真正的人与 AI 协同合作。

「GPT-4o with canvas」不只可以修改内容,也可以调整粗体、标题样式,就像是一个结合 AI 功能的简易 Word 编辑器,还支持 markdown 编辑格式

以文章写作的 ChatGPT Canvas 界面为例,编辑界面右下方会出现一排「快捷功能菜单」,文章写作、源码编辑会有不同的对应菜单。

「快捷菜单」中有很多默认功能,可以快速修改整篇文章、源码的内容。

例如其中有一个「阅读等级」的调整按钮,可以把文章的内容改成从小孩子到博士等级的不同风格与深度。

下面是一篇我让 AI 改写的、文章,我让 ChatGPT 把原本相对专业的文章内容,改成适合小朋友阅读的版本。

而下面是同一篇第二大脑的教程文章,我让 ChatGPT 把原本相对口语的草稿,改成更精炼、专业的文章风格。〔可以跟上面的小朋友版本进行比较,都是同一篇草稿的不同阅读等级修改。

通过快捷功能,一个按钮就可以快速转换我们需要的文字深度与风格。

以文章编辑界面为例,具备下面几种快捷功能:

下图是按下「建议编辑」后,ChatGPT 针对不同段落提供的编辑建议,我只要按下允许,就可以让 AI 直接进行修改。

这是不是跟以前的对话生成内容有很大的不同?现在 ChatGPT 可以针对一篇长篇文章,提供各种分段的调整、建议与修改。

除了整篇文章的快捷修改、建议外,在「ChatGPT Canvas」的编辑界面中,我可以任意圈选一段觉得有问题的段落,这时候会浮现「Ask ChatGPT」的按钮,点击后,我可以输入这一段的修改建议,让 ChatGPT 去进行指定段落的调整。

这是不是很像我们在 Google 文件上提供伙伴文章修改建议?只是这一次,AI 成为我的伙伴,听从我的指令去修改。

更棒的事,在「ChatGPT Canvas」中不用再怕 AI 修改内容后,回不去之前可能更好的版本。

因为在编辑器中,自带了可以还原之前版本的功能,而且不只可以还原到前一个版本,也可以回到上上版、上上上版,或是跳回最新版本。

经过简单的文章写作实测,我们可以看到 ChatGPT Canvas 的可能性,它突破了传统 AI 对话生成文本的限制,将人机协同的创作流程无缝结合,无论是在写作还是程序设计的应用场景中,Canvas 以更灵活的编辑能力和快捷的功能,帮助用户实现了更精准、有效的工作流程。

对于我相对熟悉的文章创作者而言,ChatGPT Canvas 不仅提供了文稿即时的优化、编辑建议,还能调整文本的阅读等级和风格,帮助你快速针对不同的受众进行调整。而对于程序员,Canvas 的源码、注解添加与错误修正功能,让程序开发过程变得易于维护。

这样的功能让人与 AI 之间的互动变得更具深度,不再只是被动地接受 AI 的生成内容,而是能主动参与其中,实现真正的协同创作。

无论你是需要改进写作的创作者、需要帮助调试的程序员,还是想要在教育中使用 AI 辅助的教师或学生,ChatGPT Canvas 都是一个值得一试的工具。

OCRify – 免费快速 OCR 工具,识别转换图片和 PDF 文字内容

By: Anonymous
29 September 2024 at 16:10

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

OCRify 是一个在线,通过文字识别〔〕技术将 转换为可编辑的文字,有鉴于当今的型手机甚至 AI 人工智能都能做到类似功能,对于 OCR 工具的需求可能就没有那么强烈了,但如果手边恰巧没有合适的工具,临时有图片想要复制图片上的文字内容、转存到其他编辑器还是很有帮助。

OCRify 特色是不用安装,打开、把要识别的文件拖曳上去就能自动识别内容,有最大文件 10 MB 和格式限制,支持 PDF、PNG、JPEG、WEBP、TIFF、GIF 和 BMP,PDF 部分最多 10 个页面,对于大多数用户来说应该没什么问题。

OCRify 支持多种语言的文字识别,包括亚洲、欧洲、中东和非洲的语言,例如中文、阿拉伯语、俄语、法语、德语、日语、韩语等一共涵盖了 60 种语言,几乎所有内容丢上去 OCRify 都能正确被识别、转为纯文字,但类似的工具都有可能遇到无法 100% 正确识别的问题〔例如有错字或漏字〕,记得在使用时还是要自己手动检查。

进入 OCRify 网站后可先从右上角切换语言,自带中文界面。

接着直接把要识别的图片或 PDF 文件拖曳到网站上,单文件最大不能超过 10 MB〔PDF 最多不超过 10 页〕。

选好文件后按下「开始识别」,等待几秒钟就会显示结果。

OCRify – 免费快速 OCR 工具,识别转换图片和 PDF 文字内容

以下图的图片为例,OCRify 会标记出有正确识别的文字范围,以红色的框线标注。

点击一下后就会出现纯文字格式,按下右上角「复制」即可保存到剪贴板。

还可以点击上方「仅文字」切换为纯文字内容,这里会显示从图片或 PDF 识别到的所有文字。

前面介绍的是以 OCRify 识别图片的示例,下图是识别 PDF 文件的结果,一样会标注找到的文字内容,很棒的是有些文字如果是直式方式书写,OCRify 一样可以识别、同时转为一段文字内容,不会因为直式而出现错误。

Windows环境下 Maven 的安装以及代理设置

25 August 2024 at 17:52

访问 Maven 的下载页面:https://maven.apache.org/download.cgi (可能需要梯子)

点击 Link 下载 Binary 版本即可。此处我们下载的文件中包含了可执行文件。完成下载之后我们需要将这些文件放到一个较为固定的位置,然后设置环境变量以便于我们在命令行环境能够正常访问这些脚本。

Maven 具有包管理器的作用,这类应用在国内都面 GFW 的问题,因此需要需要将 Maven 接入代理以便其能够正常下载以来资源。设置方式是在当前用户目录下 .m2/settings.xml 文件(如果没有此文件需要手动创建),并在此文件中添加以下内容:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
<settings>
<proxies>
<proxy>
<id>local-proxy</id>
<active>true</active>
<protocol>http</protocol>
<host>localhost</host>
<port>port</port>
<!-- 如果你的代理需要身份验证,可以取消下面的注释并填写 -->
<!-- <username>your-username</username> -->
<!-- <password>your-password</password> -->
<nonProxyHosts>localhost</nonProxyHosts> <!-- 可选:不使用代理的主机 -->
</proxy>
</proxies>
</settings>

注意将其中的地址和端口设置替换成你自己的 HTTP 代理的地址和端口。

全球 AI 产品 Top100 出炉!只有一个国产应用进前十

By: Anonymous
19 August 2024 at 13:18

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

8 月 21 日,硅谷知名投资机构 a16z,根据近半年的数据,选出了前 100 名 应用

大多数人在使用哪些 AI 产品?哪些类别更受欢迎?用户会坚持使用哪些 AI 产品,而不是转瞬即忘?接下来,我们一起来看看。

这已经是 a16z 第三次发布 AI 百强榜单了,第一次是 2023 年 9 月,第二次是 2024 年 3 月,半年一更,频率稳定。

a16z 的评选方法是,基于 Similarweb、Sensor Tower 的数据,每 6 个月排一次名,榜单分成 2 部分:

全球 AI 产品 Top100 出炉!只有一个国产应用进前十

▲网页端前 50

▲移动端前 50

网页端和移动端的 TOP10 里,美图秀秀国际版 Meitu 属于国产,靠粘土滤镜爆红的 Remini 最开始也是出海产品,后被一家意大利公司收购。

接下来我们分门别类地谈谈,首先是通用型 AI 助手。

第三次了,ChatGPT 还是遥遥领先,在网页和移动端都拿下第一,绝对的 killer app

与此同时,ChatGPT 不如对手们增长势头猛烈。谁才是最好的 AI 助理,尚且没有定论。

▲增长指数

黄仁勋爱用的 AI 搜索 Perplexity 在网页端排名第三,并首次入围移动端榜单,正好排在第 50 名,差点名落孙山。

Perplexity 超过 7 分钟的用户平均停留时间,甚至略胜于 ChatGPT

比起 等传统搜索,Perplexity 直接提供简洁、实时、相对准确、可以引用信息来源的答案。数据说明,AI 搜索的形式在一定程度上走通了。

OpenAI 的 Sam Altman 也对这种形式保持认可,然而,OpenAI 的 AI 搜索 SearchGPT 还在小范围地内测,用户比 CEO 更着急。

ChatGPT 定位最像、竞争更直接的产品是 Claude,来自前 OpenAI 员工创立的 Anthropic。这次,Claude 的排名有所提升,在网页端排名第四,好过上个榜单的第十。

今年 6 月,Claude 推出的新功能 Artifacts 突破了聊天窗口的限制,可以实现实时可视化、互动编程等,拓展了用户与 Claude 交互的方式,好评不少。

▲Artifacts

除了早已功成名就的一代目,通用助手的赛道也有一些后起之秀。

字节跳动这次一次性上榜了五个产品:教育应用 Gauth、开发平台 Coze、通用助手豆包、豆包英文版 Cici、照片和编辑 Hypic。

除了 Hypic,其他都是首次出现在榜单,其中,豆包移动端第 26 名、网页端第 47 名,Cici 也在移动端排到第 34 名。

豆包的功能发展得很全面,并且多端覆盖,使用门槛又低,日常场景够用,所以有这么大的用户量,也在情理之中。论做产品和商业化,还得看字节。

另外,AI 助手 Luzia 首次上榜移动端,一来就是第 25 名。

你可能没有听说过这款产品,它主要服务西班牙语环境,全球拥有 4500 万名用户。最初,Luzia 作为 WhatsApp 的聊天机器人出道,但 2023 年 12 月有了独立的 app

除了什么都能聊的通用助手,消费者对于 AI 还有哪些垂直的、特别的需求?

一个重要的趋势是,大家都在用 AI 搞创作,并且创作的形式越来越丰富了。

a16z 的网页端榜单里,52% 的公司支持图像、视频音乐、语音等的内容生成和编辑。

其中包括 7 家新上榜的公司,排名还不低,视频生成工具 Luma 排在第 14 名,音乐生成工具 Udio 排在第 33 名。

和 Udio 同一个赛道、被称为音乐界 ChatGPT 的 Suno,存在感更是暴涨,从今年 3 月的第 36 名,上升到今年 8 月的第 5 名。

榜单和榜单的纵向比较也很有意思,之前的榜单里,大多数内容生成工具围绕图像。

但现在,图像生成的占比降到了 41%,只有一个图片生成工具(SeaArt)首次上榜,视频生成工具出现了三个新面孔(Luma、Viggle 和 Vidnoz)。

端新增产品

Udio 上线于今年 4 月,6 月则是 AI 视频工具爆发的一月,快手可灵、Dream Machine 的 Luma AI、Runway 的 Gen-3 Alpha 接二连三发布。

可以看到,不过半年,AI 在音乐和视频上的输出质量,都卷出了成绩。

至于移动端,最常见的创作形式是编辑图像、视频。相关工具占到榜单的 22%,是移动端的第二大产品类别。

▲Adobe Express

虽然也有初创公司涌现,但排名更高的,是那些在生成式 AI 浪潮里转型、推出更多玩法的传统创意公司。

其中有我们比较熟悉的名字,美图秀秀国际版 Meitu 在第 9 名,字节跳动旗下的照片和视频编辑器、醒图国际版 Hypic,位列第 19 名。

另外,韩国互联网巨擘 Naver 旗下的相机应用 SNOW 第 30 名,内置了 Adobe Firefly 生成式 AI 的 Adobe Express 第 35 名。

之前 washingtonpost 做过一个调查:人们会和聊天机器人说什么?他们分析了数千次对话,第一是搞黄色,第二是完成家庭作业。

最近也有一款很火的 P 肌肉应用 Gigabody,让你提前看看增肌之后的模样。它会产出很多照骗,也会打击健身人群的自信心,因为很可能练了半天,还不如 Gigabody。

举出这两个例子,是为了佐证 a16z 的结论。

a16z 移动和网页端的榜单,都出现了一个很有意思的新类别:美学和约会。

其中包括三个新入围移动端榜单的工具:LooksMax AI(第 43 名)、Umax(第 44 名)和 RIZZ(第 49 名)。

▲移动端新增产品

LooksMax 和 Umax 采集用户的照片并评分,然后给出建议,提升你的魅力。Umax 甚至会给出一个「满分模板」,也就是 AI 眼里你的完美模样。

LooksMax 不仅照顾到了颜控的看脸需求,也会分析用户声音的吸引力。

但它们的用户规模并不大,LooksMax 超过 200 万,Umax 在 100 万左右。

可能和这个赛道太卷有关,上网随便搜搜能够找到大量身体美颜滤镜,减肥、增肌、健身、变胖、换衣服,AI 都能帮忙,我们不再需要在 B 站学习复杂的 PS 教程

但这些应用的套路又都很类似,靠订阅赚钱,能赚多少是多少,Umax 每周收费 4.99 美元,LooksMax 每周收费 3.99 美元。

如果说 LooksMax 和 Umax 是认识更多发展对象的敲门砖,下一步就该用 RIZZ 了。

笨嘴拙舌的用户,可以用它提升回复约会 app 消息的水平。上传对话截图、个人资料等,RIZZ 都可以教你说些高情商表达。

古代的邹忌问身边人「吾与徐公孰美」,童话里的皇后问魔镜谁是世界上最好看的人,现在的人们则在问 AI:我怎么变得更帅、更漂亮、更有魅力,怎么不算一种科技与狠活呢?

食色性也,情感关系未必在人和人之间,也可以是人机。这次,AI 伴侣应用 Character.AI 排在移动端的第十,上次是第十六。

其实,上榜的还有一些尺度更大的 AI 伴侣应用,包括 Janitor、SpicyChat、candy.ai、Crushon 等,但 a16z 没有特别强调出来。

拿 a16z 今年 8 月的榜单和今年 3 月相比,近 30% 的公司是新公司。

如果再拿今年 3 月和去年 9 月的榜单相比,那么这个数字是 40%。

可见 AI 产品竞争之激烈和残酷,新一代 AI 原生产品和公司的发展速度,前所未有地快。

下一个爆款的 AI 产品,可能会是什么?答案或许在社交产品 Discord 出现。

a16z 发现,Discord 的流量,能够体现一个产品有没有潜力,尤其在内容生成方面。

Discord 的好处是,提供了服务器和交流社区,开发者无需构建完整的前端产品,所以它很适合作为一个沙盒,用来验证 PMF(产品与市场契合度)。

很多产品都是从 Discord 起步,构建社区,测试功能,积累用户,然后才有自己的独立,比如 Suno 和

时至今日,Midjourney 还是所有 Discord 服务器邀请流量的第一名。

▲ 在 Discord 受欢迎的 AI 公司

截至 7 月,10 家 AI 公司在所有 Discord 服务器邀请流量中排名前 100,与 1 月相比,其中一半是新秀。

AI 继续发展下去,未来可能连 app 的概念都会消失,人手一个 agent,AI 主动帮我们解决需求,但现在,我们还是从被用户选择的 app 中,一窥 AI 的可用性如何被定义。

常言道「不要创造需求」,产品的成功不在于通过广告等人为方式制造需求和虚假繁荣,而是找到并满足已经存在的、真实的需求。

AI 也是这样,融资、刷屏、炒作之后,依然是沉默的大多数,做出最诚实也最落地的投票。其中,有没有你正在使用并欣赏的产品呢?

We crunched the data to find out: Which gen AI apps are people actually using? And which are they returning to, versus dabbling and dropping?


2024 年 3 月:

Thousands of new AI-native companies are vying for attention. We crunched the data to find out: Which generative AI products are people actually using?


2023 年 9 月:
https://a16z.com/how-are-consumers-using-generative-ai/

PicLumen – 免费好用的 AI 图片生成与编辑工具,支持免费商用

By: Anonymous
13 August 2024 at 13:26

DUN.IM BLOG

DUN.IM BLOG

PicLumen 提供一整套由 人工技术驱动的照片编辑和生成,用户在注册后从控制台输入提示词生成各种图片,选择不同的图片模型、长宽比、画质或进行各种细项的微调,此外,PicLumen 还整合 AI 抠图和编辑工具,可以说是非常先进、快速且方便易用的图片生成功能。

AI 生成的图片素材可自由使用于个人和商业用途,无需额外付费购买授权,生成的图片相当真实,任何类型的图片都能制作生成,不过要注意你只能将自己生成的图片使用于商业用途,其他人的图片可用作参考,但是不允许直接使用〔稍作修改即可〕。

如同大多数的 AI 图片生成器服务,PicLumen 也提供「探索」功能,查看其他用户生成的图片素材,也可以获取他们使用的提示词、反向提示词和各项参数,或是对图片进行「重混」〔Remix〕,如果没有什么灵感的话不妨在探索页面查看其他用户所使用的提示词和相关参数。

依照 PicLumen 支持中心提供的页面所述,PicLumen 生成的图片可以用于个人和商业用途,但要注意以下几点重要事项:

Create your unlimited AI images with PicLumen's AI image generator. Join the best AI image creator and turn your text to images freely.

进入 PicLumen 后点击首页「Generate for Free」按钮,来到登入注册页面,必须先注册账号才能使用,也可直接以 账户快速登入。

PicLumen – 免费好用的 AI 图片生成与编辑工具,支持免费商用

登入后会看到「探索」页面,也就是其他用户以 PicLumen AI 生成的图片,点击后会看到提示词和相关信息。

如果要自己生成图片,点击左上角「Create」进入图片制作工具。

生成器上方有几个可供调整的选项,包括 AI 图片模型、图片长宽比、画质和单次生成图片数〔最多四张〕。

长宽比〔Aspect Ratio〕功能很好用,预先选择要使用的图片比例后就不用后续编辑裁切。

将提示词输入后点击右边的「Generate」就能开始生成图片,速度很快,不到一分钟就会出现结果。

提示词右上角还有一个选项,可以设置反向提示词、CFG Scale、Steps 和 Seed。

PicLumen 一次可生成 1-4 张图片结果,看起来会有点像〔但又不太一样〕,如果不满意可微调提示词或切换为不同的图片 AI 模型,重新生成新的图片。

点击图片后会进入详细资料页面,从中间的按钮就能图片、AI 抠图或 AI 放大〔如下图红色圈选处〕。

PicLumen 还能将图片直接以 AI 去除背景,省去手动抠图的步骤,去除的效果也很优异!

前面有提到 PicLumen 本身也能查看其他人生成的图片,点击左上角「Explore」就能探索更多图片,很厉害的是利用 PicLumen 可以制作出各种风格的素材,从详细信息页面就能看到提示词和相关选项,稍微研究一下、修改后也能制作出很专业的图片哦!

在探索页面点击其他用户制作的 AI 图片,右下角会有一个「Remix」按钮能快速将相关信息带入 AI 生成器。

The Maps Express – 简单方便一键查询 Google 地图的 Chrome 扩展

By: Anonymous
9 August 2024 at 13:14

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

The Maps Express」是一款 扩展程序,支持各种常见浏览器例如 的 Safari、Chrome 上的 Edge、Chrome、Brave、Arc、Opera,安装后可在选取要查询的地点时通过鼠标右键菜单或快捷键快速查询 Maps,能保存最近查询的十条历史记录,还能将地点收藏〔支持导出、导入功能〕,非常方便!

值得一提的是 The Maps Express 有一项「 摘要」功能,通过 Google Gemini 对当前网页进行分析、快速找出可能的餐厅、咖啡店、商家或景点关键词,让用户以 Google Maps 快速查询相关结果。

No Description

进入 Chrome 程序商店页面,点击右上角「加到 Chrome」安装到浏览器后即可使用。

那么要如何进行查询呢?很简单,只要选取店家名称、右键菜单就有「通过 The Maps Express 查询」快速带入 Google Maps 查询地点,也可使用快捷键〔Ctrl+Shift+S/⌘+Shift+S〕进行操作。

如此一来就将好几个步骤的操作过程简化成一个动作。

The Maps Express 本身也具有查询功能,点击扩展按钮后会进入类似如下的窗口,最上方的查询字段就如同是 Google 地图查询功能,可以快速在地图查询指定地标,查询记录会保留近期查询的 10 条记录,这些信息只会存在用户的浏览器。

点击查询记录的地标会快速打开 Google 地图,将光标移到地标上可以「加入收藏」。

The Maps Express 收藏清单功能基本上可以算是更方便的 Google Maps 收藏功能,将地标加入收藏后还能利用下方的功能进行导出或导入〔格式为 .JSON〕。

再来介绍一下 The Maps Express 最有趣的「页面摘要,可以使用 AI 技术来摘要地点,第一次使用时需要设置一下 API 密钥,不过不会太难,只要有 Google 账户、几个步骤就能搞定。

点击 API 后会有设置说明,浅显易懂,先连接到 Google AI Studio 页面,第一次使用会有注意事项,勾选底下第一项同意使用条款,按下「Continue」继续到下一个步骤。

接着点击中间的「Create API key」建立一个 API 密钥。

按下「Create API key in new project」按钮,如下图箭头标示位置。

生成 API 密钥后按下「复制」获取这段代码,回到 The Maps Express 扩展贴上后即可进入 AI 功能。

The Maps Express 页面摘要工具是使用 AI 来摘要地点,简单来说,在网页点击「Gemini 摘要」后就会自动分析网页出现的地标,将相关结果自动加入、方便用户以 Google Maps 查询或是加入收藏。

下图就是使用 AI 页面摘要、分析上的文章后得出的相关地标,非常快速、准确!几乎把文章中列出来的所有咖啡店都呈现在列表,省去要一个一个复制查询的时间,如果平常会经常在网络上查询信息的朋友可以试试看这项功能〔只是前置需要几个设置步骤〕。

PopPop AI – 免费 AI 音效生成器,文字描述转换为音效神器

By: Anonymous
17 July 2024 at 15:22

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

利用人工智能 技术制作已经不是,之前推荐过 Google MusicFXSuno AIStable Audio 都是 AI 音乐生成器,通过描述词或上传图片即可生成一段音乐,有些素材还能用于商业用途,相较于以往都要付费购买素材授权来说其实更实惠,而且利用机器生成的音乐又更不容易与其他人重复,以独特性来说略胜一筹。

PopPop AI」是一个免费 AI 音效在线生成器,用户输入一段文字描述后就快速生成相对应的音效素材,例如鼓掌声、下雨声、车流声或是餐厅、咖啡店吵杂的环境音,将文字在几秒钟内转换为各种类型的音效,亦可使用于、游戏制作或是各种情境。

PopPop AI 音效生成器没有使用限制,而且不用注册就可以立即使用,和同类型产品很不一样。

除此之外,PopPop AI 免费 AI 音效生成器的上也有提供不少音效示例,搭配上图片更有身历其境的感觉,很难想象这些都是以人工智能生成的音效,未来会不会转为付费服务还不得而知。

Create any sound from text effortlessly with our free online AI sound effect generator – the perfect, user-friendly sound maker for everyone.

进入 PopPop AI 音乐生成器后直接输入描述词,勾选右侧「智能模式」情况下可以使用简单的单词描述声音,该模式会自动修饰并填充相关的声音描述,也能输入中文,例如「交通、噪音、大城市」之类的关键词,按下「Generate」后就会开始生成音效。

PopPop AI – 免费 AI 音效生成器,文字描述转换为音效神器

PopPop AI 需要一段时间处理,过程需要排队,如果有其他人在前面的话就要等待更长时间。

完成后会给出两个选项,分别为 Option 0 和 Option 1,两个都可以试听、下载,略有差异。

点击音效前面的「播放」按钮就能预览播放。

点击后方的「下载」按钮就能获取 WAV 格式音效,没有下载限制,两个都能下载。

不过第一次点击下载时 PopPop AI 会跳出,询问用户是否将网站媒体,按下关闭再点击下载按钮就能获取音效文件。

PopPop AI 首页也有很多生成的音效示例,同时搭配上图片、关键词,想知道 AI 可以生成什么样的音效不妨去试听看看,也能从这里获取一些灵感哦!

DownloadYoutubeSubtitles – 免费快速下载 YouTube 字幕,无需登录支持多种格式和语言

By: Anonymous
6 July 2024 at 14:46

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

DownloadYoutubeSubtitles 字幕器,主要功能是将 YouTube 视频字幕下载为三种常见格式,包括 .SRT、.VTT 或 .TXT,不但很快速而且非常易于使用,无需额外下载,即使是手机或平板电脑一样可以操作,只要把视频网址贴上、选择要下载的字幕语言和文件格式后就能快速获取字幕文件。

要注意的是 DownloadYoutubeSubtitles 只支持公开视频,因为服务本身没有登入账户的机制,在下载视频字幕时会依照用户的浏览器语言提供适合的语言建议选项〔例如中文用户会看到繁体中文、简体中文和英文字幕〕。

当然也可选择所有 YouTube 视频支持的字幕语言,自动翻译字幕也能利用这项服务下载。

如果 DownloadYoutubeSubtitles 无法使用,也可以尝试其他 YouTube 视频字幕下载

Download YouTube Subtitles in .srt .vtt and .txt format with this free subtitle extractor tool online.

进入 DownloadYoutubeSubtitles 后从右上角切换语言,有「简体中文」可以选择。

YouTube 视频网址复制、贴上,点击右边「获取字幕」按钮。

如果 YouTube 视频有字幕的话就会看到结果画面,DownloadYoutubeSubtitles 会在左侧显示「为你选择的字幕」也就是最适合用户的语言,例如繁体中文、简体中文和英文,分别有 SRT、VTT 和 TXT 三种格式,点击后就能快速下载字幕文件。

要注意的是 DownloadYoutubeSubtitles 在下载文件时会同时打开另一个网页〔可能是〕,使用时请特别留意。

下方还会有视频的主要字幕、自动翻译的视频字幕,可以获取各种语言字幕文件或是自动翻译的视频字幕。

DownloadYoutubeSubtitles 无法下载有年龄限制的视频或是需要登入才能浏览的私人视频,除此之外,若视频不是使用字幕文件的功能载入,而是将字幕直接嵌入视频,也无法使用下载工具获取视频字幕文件。

loader.fo – 多平台在线视频下载器,支持 4K、格式齐全

By: Anonymous
30 June 2024 at 14:47

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

loader.fo 是一个、快速的在线器,主要用于保存 、SoundCloud、Vimeo、TikTok、IMDb、X〔前身为 Twitter〕和 Twitch 等平台视频,类似的网络服务太多,操作上都大同小异。

loader.fo 和其他网络视频下载一样都支持多种格式,主要分为视频和两种,视频有不同画质的 MP4 和 WEBM 格式,值得一提的是支持最多 4K 画质,而且还会有声音。不像一般下载器可能只能单独获取影像或音频,必须自行将两者合并;音频的话有 MP3、M4A、WEBM、AAC、FLAC、OPUS、OGG 和 WAV。

试试这款独特的工具,从 YouTube 快速无障碍地下载视频。使用这款可靠高效的下载工具,让你的离线视频收藏焕然一新。

进入 loader.fo 后先从网址字段右侧选择要下载的文件格式,分为音频和视频两种,视频从 360p、480p 到最高 1440p〔WEBM 支持 4K 画质〕,将视频网址贴上后点击下载就能获取文件。

loader.fo 能下载 YouTube、Twitter、Facebook、OK.ru、TikTok 等网络影音平台,如果遇到无法正确检测视频或出现问题,也能试试看其他下载服务

将视频网址贴上、选择要保存的格式后点击右边的「Download」下载按钮。

loader.fo – 多平台在线视频下载器,支持 4K、格式齐全

loader.fo 需要一段时间处理视频,当显示「Download in Progress…」时需要等待一段时间,有时候可能无法正常显示视频略缩图,但测试后还是能够正常获取文件。

完成后就会有下载按钮,点击「Download to Your Device」就能将视频保存到你的设备。

Removerized – 免费简单的 AI 图片背景离线去除工具

By: Anonymous
28 June 2024 at 14:14

DUN.IM BLOG

DUN.IM BLOG

Removerized」是 背景去除,可以快速删除背景,完全免费!在使用上没有限制,离线模式亦可使用,快速、准确且操作上相当简单,支持 PNG、JPG 和 WebP 图片格式,将图片拖曳到工具后就能自动处理,约几秒钟即可转为透明背景。

Removerized 是开放源码项目,除了自动抠图模式外没有提供手动编辑功能,不一定 100% 适合各种类型的图片,有需要的朋友可以自行试试看。

进入 Removerized 后点击上方「Click to upload」选取要抠图的图片,或是直接将图片文件拖曳到上传字段〔支持 PNG、JPG 或 WebP 格式〕,接着点击「Process」开始抠图处理。

Removerized – 免费简单的 AI 图片背景离线去除工具

第一次使用会跳出 AI 模型的提示信息,需等待一段时间。

完成后图片出现背景被清除的动画,利用网站中间拖曳轴查看抠图前后的图片差异。

点击下方「Download」按钮即可将去除背景、转为透明背景的图片下载保存。

Claude AI – 根据论文生成网页互动小游戏,进行学习教育

By: Anonymous
24 June 2024 at 14:19

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

有没有可能让 Claude 将枯燥的论文 PDF、科学研究资料,重新梳理、设计转换成一个比较有意思的互动小

于是找了几篇科学研究论文,例如海龟的研究、蓝鹊的介绍资料等等,将 PDF 上传给 Claude AI,请他用「儿童故事的方式」设计成问答冒险游戏,效果还不错

基本上一分钟内就可以生成一个基本版本,如果想要调整,在 Claude AI 中来回几次问答修改,也不会超过两、三分钟的时间,然后就有一个可用的故事问答冒险游戏,通过游戏互动,可以学会某种科学或自然知识。

这个「超短时间内可完成」的效果,或许离真正商用游戏的要求还很远,但当作老师、父母给学生孩子的有趣测验,而且课堂、生活中随时需要,立即可以生成,已经绰绰有余,值得试试看。

下面就来看看我实际测试的其中一个「海龟大冒险」的真实操作过程。

首先,我在「 Claude 」 先上传一篇海龟研究的科学论文 PDF,结合下面的指令,请其根据论文设计出一个适合小学生的冒险故事互动游戏〔查找论文可用:SciSpace 论文研究 AI 助手,中文文献问答、摘要引用与报告改写〕:

///

下面是 Claude AI 第一个回答中就做出来的版本,已经有一个简洁的互动界面,可以按下开始冒险进行问答计分,但还有题目数量还不够多。

于是我进一步追问,只是简单的请他设计出更完整的游戏过程,在第二个版本中题目数量开始增加,但总分还不是 100 分。

于是我再次追问,请他根据总分是 100 分来设计题目,于是完成了第三个版本的互动网页。

这个小海龟大冒险的互动网页,可以直接在 Claude 右方的 「 Artifacts 」预览中互动,也可以成 HTML 文件,在中直接进入并游玩。

下面是几张游戏过程截图,他根据论文资料,设计出了一些有效的问题,并提供有效的选项,勾选正确选项后会计算分数。

看起来中文内容等也都能正常分析与显示。

虽然没办法直接设计出图文搭配的视觉化内容,但这样基本的文字问答互动,是可行的,而且成功率高。

完成简单的故事冒险后,也会提供评分。

当然,如果你熟悉网页设计,你可以在这个版本的基础上进一步修改。

但如果不熟悉网页设计, Claude 几分钟内就可以做出来的这个游戏化学习互动版本,也已经可以让父母跟孩子做互动,老师给学生做简单测验了。

很多时候带小孩去一些博物馆、科学馆,也常常看到这类简单但有趣的、故事性的问答互动。

而现在用 AI 可以快速的制作出各种版本,只要给他一篇论文资料,就能快速产出有故事性的问答小游戏。

Claude AI – 根据论文生成网页互动小游戏,进行学习教育

下面是我利用蓝鹊研究资料的论文,设计的另外一个故事互动小游戏。指令如下,你可以复制其结构,只要换成你的主题,试试看生成你需要的学习小游戏:

如果你是使用 Claude 版本,要注意一些限制:

所以如果你是免费版本,更适合使用一篇短文,生成互动小游戏,作为自己临时的、随手的与问答互动需求。

拼字幕 – 免费上传图片,批量添加字幕,一键生成字幕拼图图片

By: Anonymous
20 June 2024 at 22:06

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

拼字幕」是一键生成字幕拼图的在线,操作方法简单,用户只要将拖曳到工具即可加入字幕文字,调整字幕呈现顺序、字号、主次字幕、调整字幕文字高度和样式,无论是使用于封面、媒体或是图文故事展示都能让图片更引人注目哦!

编辑完成后就能将图片、保存为 PNG 格式,不用额外注册账号,接下来就实际示范一下操作方式。

拼字幕是一个极致便捷的在线拼图工具,方便社交媒体运营快速生成用于小红书引流的字幕拼图。通过简单几步操作即可生成名人语录、字幕等拼图内容,完美适用于小红书、微博、视频号、抖音等平台,为你的内容引流增粉。无论是打造个人品牌,还是提升社交媒体曝光率,拼字幕都是你不可或缺的利器。拼字幕, 字幕拼图, 字幕生成, 字幕生成器, 字幕截图, 小红书, 小红书引流,小红书流量,字幕制作, 名人语录, 电影台词, 马斯克说, 罗翔说, 乔布斯说, 余华说, 董宇辉说, 字幕图片, 字幕拼接。

进入拼字幕后把要加入字幕的图片拖曳到网站,或是点击「选择图片文件」进行上传。

拼字幕 – 免费上传图片,批量添加字幕,一键生成字幕拼图图片

接着图片会显示于工具中,从右上角「字幕内容」输入要加入的字幕,可以新增行数、清空或调整顺序,加入字幕左侧预览就会即时更新。


从下方调整不同字幕样式、字幕高度和字体大小,因为拼字幕有部分样式是简体中文字型,套用在繁体中文可能有显示不正确的问题,看起来会有点不太一样,但不影响使用。


拼字幕有一个「进入主次字幕」功能很好用,可以同时显示中文和原文,如果加入字幕时想让原文一起显示,进入这个选项即可加入两种语言字幕,主字幕的字体会大一些,次要字幕或贴着主字幕,阅读距离很舒服。


完成后点击图片下方的「下载图片」按钮将它保存为 PNG 格式。


下图就是使用「拼字幕」制作的字幕图片。

引发 LTO 优化后续错误的一种可能及解决方法

31 May 2024 at 14:02

最近开发 C++ 的程序在链接阶段发生了一个 LTO 相关的错误。链接时优化(Link Time Optimization, LTO) 是一种编译优化技术,旨在通过在链接阶段执行全程序优化来提升代码性能和减少二进制文件大小。其主要原理是在链接阶段而不是在编译阶段进行更高级的优化,允许跨文件的全局优化。LTO 的基本原理和过程是:

  • 中间表示:在编译阶段,编译器将每个源文件编译为一种中间表示(如 LLVM bitcode),而不是直接生成目标代码。
  • 全局优化:在链接阶段,链接器将所有中间表示文件合并,生成一个完整的程序表示。此时,优化器可以进行跨文件的全局优化,如函数内联、去除冗余代码和跨模块优化。
  • 生成目标文件:优化完成后,链接器生成最终的可执行文件或库。

我遇到的错误信息中的管件一句是:

1
attempt to add bitcode file after LTO (htons)

可以看到错误信息提示我们链接系统试图在 LTO 优化之后添加 bitcode。并且在后面的括号中链接器提到了一个符号 htons,这是来自 libc 库的一个符号。基于的 https://github.com/emscripten-core/emscripten/issues/16836 这个链接中的启发,我发现了一个 LTO 优化可能面临的普遍性问题。这个问题是 LTO 会尝试移除一些它认为不需要的符号从而减少编译出来的程序的体积,但是这个判断可能会不准确。它可能将一些实际会被使用的符号删除。为了解决这个问题,我们可以为链接器指定链接输入,强制保留指定的符号以避免错误的移除。针对我遇到的情况,为链接器加上 -Wl,-u,htons 的配置即可解决问题。

  • -Wl: 这个标志告诉编译器将接下来的选项传递给链接器(ld)。-Wl,option 是传递给链接器的标准方法。
  • -u,symbol: 这个选项告诉链接器强制包含指定的符号 symbol。在这个情况下,-u,htons 和 -u,htonl 告诉链接器强制包含 htons 和 htonl 函数

Unraid: 解决 12 版本中网页界面无法打开的问题

17 August 2023 at 10:36

最近在 Unraid 升级 6.12.x 版本以后会偶发性的产生一个 Bug,其表现为 Unraid 网页无法打开(这里是指访问 Unraid IP 地址无法访问 Web 管理界面)。这个问题实际上是由于 Unraid 上的 Nginx 服务失去响应导致的。这种情况下我们只需要干掉 Nginx 进程并重启就可以了。

首先通过 ps -aux | grep nginx 找到 Nginx 主进程的 PID,然后通过 kill -9 <PID> 干掉进程。要再次启动 Nginx,可以运行

1
2
cd /etc/rc.d/
./rc.nginx start

注意通过 ./rc.nginx restart 在正常情况下可以重启 Nginx 服务,但是在 Nginx 处于无法响应的状态时,这个脚本无法杀死 Nginx 进程,必须要手动终止。

Ubuntu 中如何彻底删除一个用户

16 August 2023 at 18:51

在 Ubuntu 中彻底删除一个用户涉及到几个步骤,不仅仅是删除用户,还可能包括删除与用户相关的数据。以下是步骤指南:

  1. 确保用户未登录: 在删除用户之前,最好确保该用户未登录。你可以使用 who 命令来检查哪些用户当前已登录。

    1
    who
  2. 删除用户: 使用 userdel 命令删除用户。如果你还希望删除用户的主目录和邮件池,可以使用 -r 选项。

    1
    sudo userdel -r username

    其中,username 是你想删除的用户的用户名。

    注意:-r 选项会删除用户的主目录(通常是 /home/username)。确保你已经备份了所有重要的数据!

  3. 检查文件系统: 即使删除了用户和其主目录,可能仍然在文件系统上遗留一些属于该用户的文件。你可以使用 find 命令来搜索这些文件:

    1
    sudo find / -user username

    这将列出所有属于 username 的文件。根据你的需要,你可以手动删除这些文件或更改它们的所有权。

  4. 删除用户的 cron 作业: 如果用户配置了任何 cron 作业,你还需要手动删除它们。检查 /var/spool/cron/crontabs/username 是否存在,如果存在,删除它。

    1
    sudo rm /var/spool/cron/crontabs/username
  5. 其他服务或配置: 如果该用户有其他特定的配置,例如在 /etc/sudoers 中的条目或在其他服务中的特殊访问权限,你需要手动检查并删除它们。

请在进行任何删除操作之前确保备份所有重要数据。确保你明确知道正在执行的操作,避免意外删除重要文件或配置。

解决在 Openvpn 客户端中部署的 Web 服务不可用的问题

4 April 2023 at 17:32

遇到这样一个蛋疼的问题,我有一台服务器,上面部署了一个 web 服务,同时我也想把这个服务器作为客户端连入一个 OpenVPN 虚拟网络,并且我希望服务器上的程序能够通过 OpenVPN 的网关来访问外部网络,这主要是为了隐藏服务器的身份。但是在 OpenVPN 连接之后,原有的 Web 服务将无法访问。通过调试分析可以法线,造成这一现象的原因是 Web 服务的响应包也被路由配置路由到 OpenVPN 的 tun0 接口中。这导致响应无法返回给原来的请求服务器。如何解决这个问题呢?

如果你在网络上搜索这类问题你会发现各种文章给出的方案一般都是为 OpenVPN 的配置文件添加 route-nopull 选项来阻止 OpenVPN 设置客户端路由,但是这会导致客户端的对外访问无法通过 VPN 进行。事实上,从 IP 路由的角度来看,如果我的服务器是 A,而某个访问 Web 服务的 IP 是 B,同时 B 也可能是 A 试图访问的外部的目标服务提供者。对传输层路由而言,A 给 B 的 Web 服务响应和 A 主动发往 B 的请求是无法区分的。从这个角度来看,要达成 inbound 和 outbound 流量分别路由似乎是不可能的。

但是其实我们有一个突破点:那就是 Web 服务总是在本机使用固定的端口和请求者通信,我们可以通过端口来区分 inbound 和 outbound 流量。首先我们输入下面的命令:

1
iptables -t mangle -A OUTPUT -p tcp -m multiport --sports 80,443 -j MARK --set-mark 1

在这个命令中,我们会让路由表观察从本地的 80 和 443 端口发出的包,并给这些包打上一个特定的标签(--set-mark 1 的作用)。然后输入下面的命令:

1
ip route add default via [gateway addr of eth0] dev eth0 table 100

这个命令会创建一个新的路由表 table 100,然后在这个表中加入一个默认路由,将流量送往原有的网关。然后再运行下面的命令:

1
ip rule add fwmark 1 table 100

这个命令会让带有标记 1 的包使用 table 100 路由表进行路由。运行完上面的配置后,web 服务就可以正常访问呢了。


以上方法是在 ChatGPT 的协助下摸索出来的,我的提问是:

如何通过 iptables 或者 route 命令,让访问 80 与 443 端口的包使用 tun0 接口,而访问其他端口的包使用 eth0 接口?

GPT 的回答是

可以使用iptables和route命令结合起来实现此目的。具体操作如下:

首先需要添加一条规则,将访问80和443端口的包标记为一个特定的标记值(比如"1"),使用tun0接口发送出去。iptables规则如下:

1
iptables -t mangle -A OUTPUT -p tcp -m multiport --dports 80,443 -j MARK --set-mark 1

接着需要添加一条规则,将标记为"1"的包使用tun0接口发送出去。route命令如下:

1
2
ip route add default dev tun0 table 100
ip rule add fwmark 1 table 100

最后需要添加一条规则,将所有未被标记的包使用eth0接口发送出去。route命令如下:

1
ip route add default dev eth0

以上三个步骤分别实现了:将访问80和443端口的包标记,并使用tun0接口发送出去;将标记为"1"的包使用tun0接口发送出去;将所有未被标记的包使用eth0接口发送出去。这样就实现了访问80和443端口的包使用tun0接口,访问其他端口的包使用eth0接口的效果。

介绍一种"新"的隧道技术: spiped

2 April 2023 at 16:47

在之前的文章SSH隧道:访问翻墙服务器的临时性手段 的时候介绍了一种使用 SSH 隧道进行端口映射,进而进行手动的流量混淆的技术。就稳定性来说这个方案是经受了考验的。在过去几年里,无论任何时候 SSH 隧道都是能够提供稳定可靠的链接的。不过,SSH 隧道的性能是一个问题。根据 Stackoverflow 上的 这个问题下的回答 来说:“当你通过TCP隧道传输TCP时,性能问题就会出现,因为您有两个层执行自适应纠正”。在这篇文章里面我介绍一个较新的方案。

1 简介

新的方案设计一个新的工具:spiped(github)。spiped是一种安全的、轻量级的加密通信工具,可用于在不安全的网络中传输敏感数据。它的设计目标是提供简单、易于配置和使用的加密通信,而不需要复杂的密钥管理或公钥基础设施。spiped使用对称密钥加密算法,可以在客户端和服务器之间建立加密通道。它可以用于保护各种类型的数据流,包括SSH、Telnet、HTTP和SMTP等协议。spiped的另一个优点是它可以在不同的平台上使用,包括Linux、FreeBSD、OpenBSD和Windows等操作系统。

2 使用方法

spiped 的使用非常简单。在 Ubuntu 上可以通过 apt 来安装。也可以自行编译。在完成安装以后,我们首先进入服务端,运行下面的命令生成一个秘钥:

1
dd if=/dev/urandom bs=32 count=1 of=keyfile

其中 keyfile 是生成的秘钥文件,注意将其保管到合适的位置。然后用下面的服务启动 spiped 服务端服务:

1
spiped -d -s '[0.0.0.0]:8025' -t '[127.0.0.1]:25' -k /path/to/keyfile

注意,不同于 ssh 使用同一个 TCP 链接来走所有的隧道流量,spiped 会为每个流创建一个独立的 TCP 链接。因此在做代理中介使用时,spiped 可能会需要创建数量较多的 TCP 链接。spiped-n 配置可以指定最大链接数量,这个数值默认是 100,对于代理应用来说这是不够的。你可以将其设置为 10000。

其中 -s 后的地址是服务端的监听地址,-t 的转发的目标地址,-d 表示将加密的流量从 -s 后的地址解密后发往 -t 后面的地址。这里我们可以填写 Shadowsocks 服务监听的地址。注意 Host 可以保持成 127.0.0.1 的形式。这样,我们可以在防火墙中把 Shadowssocks 的公网监听端口关闭,仅允许从加密隧道访问,这样可以提升安全性。

上面的命令在输入后会自动进入 Daemon 模式运行。

然后我们来到客户端(一般是跳板机),将服务端生成的秘钥文件下载到客户端,运行

1
spiped -e -s '[127.0.0.1]:25' -t $SERVERNAME:8025 -k /path/to/keyfile

其中 $SERVERNAME 是服务端的 IP 地址。注意用 [] 包裹的形式来填写。如果这里说的客户端也是 Shadowsocks 的机器,那么这里的源地址(-s 后的地址)可以写 127.0.0.1,但是如果是跳板机,那么应该写成 0.0.0.0

在上面的设置中,方括号内可以写入 IPv6 地址,但是注意 IPv6 的全网段监听地址就不能写 [0.0.0.0] 了,而是要写 [::]

客户端的程序也是会自动进入 Daemon 模式运行。

完成设置之后,访问客户端(跳板机)的 25 端口就相当于直接访问服务器的 25 端口。

3 后记

请注意,spiped:

  • 需要一个强密钥文件:通过-k选项指定的文件应该具有至少256位的熵。(dd if=/dev/urandom bs=32 count=1是你的好朋友。)
  • 需要来自/dev/urandom的强熵。(确保您的内核的随机数生成器在引导时被种子化!)
  • 不提供任何防止通过数据包计时泄露信息的保护:在spiped上运行telnet会保护密码不会被直接从网络中读取,但不会掩盖输入节奏。
  • 对于交互式会话,可以显着增加带宽使用:它以1024字节的数据包发送数据,并将较小的消息填充到此长度,因此如果不能与相邻字节合并,则1字节的写操作可能会扩展到1024字节。
  • 使用对称密钥——因此,任何可以连接到spiped“服务器”的人也可以冒充它。

如何使用 Proxifier 来进行流量代理控制

30 March 2023 at 22:33

Proxifier 是一款网络工具软件,可以帮助用户通过代理服务器进行网络访问,实现匿名化、翻墙、加速等功能。支持多种代理协议,规则管理,流量监控和日志记录等功能,提高网络连接的灵活性和智能化。注意 Proxifier 本身并不是一个代理软件,也不是一个 VPN 软件,其作用是控制其他其他软件访问代理的方式。

上一篇文章我提到了可以试用 Proxifier 来解决通过 Shadowsocks 代理访问呢 ChatGPT 频繁出现 Something Went Wrong 的问题,在本文中我们来展开讲一下具体的做法。

1 准备工作

1.1 软件下载

Proxifier 的官方网站是 https://www.proxifier.com/,其正版价格较贵,约 40 美元。不过,较早的 2.x 版本存在破解版。读者可以根据自己的经济状况来选择。

1.2 代理准备

如同开头提到,Proxifer 本身不是一个代理程序,读者应该自己提前准备好代理。这些代理中,无论是 Shadowsocks、V2Ray 还是其他常见的代理程序,都会在客户端本地重建一个 Socks5 代理,这一般都可以在代理客户端程序的配置或者服务器设置中看到。下图给出的是 Shadowsocks-NG 客户端在 macOS 中的系统配置,可以看到程序在本地 (localhost) 的 1086 端口创建了一个 Socks5 代理。

这个代理会被进一步转成 http 代理,从而被浏览器使用,这个转换过程是导致 ChatGPT 链接不稳定的元凶。接下来我们要使用 Proxifier 让 ChatGPT 直接使用 Socks5 代理。

2 设置 Proxifier

2.1 添加代理

我们以知乎上这篇文章为范本简要讲一下设置过程。首先我们需要将现有代理软件提供的 Socks5 服务告知 Proxifier,这通过添加代理服务器实现。

注意一般各种代理软件在本地创建的代理都是无需验证的,我们可以取消验证启用。输入设置之后,可以点击检查确认设置是否正确。

3 设置规则

为了让 ChatGPT 的访问能够通过 Proxifier 访问代理,我们需要配置 Proxifier 的代理规则。

添加代理规则的页面如下:

我们有两种方法引导 ChatGPT 的网络访问:

  1. 我们可以选择下载 ChatGPT Desktop 客户端,然后通过代理规则中应用程序过滤规则找到 ChatGPT 程序,然后让目标主机为空(这意味着所有的目标主机都会服从本规则);
  2. 将应用程序部分置空,然后在目标主机中填入 ChatGPT 访问的域名。经过我的试验发现,填入 chat.openai.com; challenges.cloudflare.com; *.openai.com; 即可。

事实上,因为 Proxifier 能够全局性地处理所有网络访问,因此,第二种方法对于使用 ChatGPT Desktop 的用户来说同样有效。下图是完整代理规则。

至此我们就完成了设置,你可能需要重启浏览器才能能让 Proxifier 成功地引导 ChatGPT 的流量。

使用 Shadowsocks 访问 ChatGPT 频繁出现 Something Went Wrong 问题的解决方法

28 March 2023 at 18:16

update at 2023.4.27:

Github 上有人做了一个开源的油猴脚本 KeepChatGPT 可以解决这个问题。在浏览器上这个脚本可以正常使用,但是注入到客户端时(尽管内部仍然是一个浏览器)会出现错误。

update at 2023.4.12:

在 Windows 上这套方法存在一定的问题。可能的原因是 Proxifier 的代理权限有时候会被 Shadowsocks 客户端,也就是 Privoxy 争抢。

由于国情原因我们使用使用 ChatGPT 需要使用各种形式的代理,这时我们肯能会发现在与 ChatGPT 对话的过程中可能会出现下面的错误:

Something went wrong. If this issue presists please contact us through our help center at help.openai.com

这种错误一般在我们再让网页空闲一段时间(通常是一分钟)后再次提问时出现。当然,去 OpenAI 的帮助中心是不会搜到什么有用的信息的。如果你去检索这个问题,你能得到的最好答案是在出现这个页面之后刷新页面,然后回到对话窗口继续对话即可。但是刷新后如果再次出现空闲窗口的情况,这个问题会反复出现,因此你在对话中就不得不反复地刷新页面,再加上每次页面重载你都需要去勾选 Cloudflare 的机器人验证框,这就会极大程度上拖慢我们的速度,影响产品体验。

这个问题是否可能是由于我翻墙访问导致的呢?我使用的翻墙软件是 Shadowsocks,经过一番搜索,一个 Github Issue 的讨论给了我灵感。

讨论地址:https://github.com/shadowsocks/shadowsocks-libev/issues/2149

尽管讨论的题目和 ChatGPT 没有直接关系,但是这个回复提到,Shadowsocks 在构建代理管道时,会在客户端使用 Privoxy 来讲 Socks5 代理转换成 http 代理,进而被浏览器使用。Privoxy 的配置中包含了 Socket 连接时长方面的控制。于是我查看了我本地的 Shadowsocks 使用的 Privoxy 的配置文件,这个文件在 MacOS 中位于 /Users/lena/Library/Application Support/ShadowsocksX-NG/privoxy.config 文件。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
toggle  1
enable-remote-toggle 1
enable-remote-http-toggle 1
enable-edit-actions 0
enforce-blocks 0
buffer-limit 4096
forwarded-connect-retries 0
accept-intercepted-requests 0
allow-cgi-request-crunching 0
split-large-forms 0
keep-alive-timeout 5
socket-timeout 60

forward 192.168.*.*/ .
forward 10.*.*.*/ .
forward 127.*.*.*/ .
forward [FE80::/64] .
forward [::1] .
forward [FD00::/8] .
forward-socks5 / 127.0.0.1:1086 .

# Put user privoxy config line in this file.
# Ref: https://www.privoxy.org/user-manual/index.html

可以看到 keep-alive-timeoutsocket-timeout 这两个选项设定的超时时间都比较低。我做了下面两个尝试:

  1. 将这两个设置调高,并重启 Shadowsocks,但随后发现 Privoxy 重置了设置文件;
  2. 我手动 kill 掉正在运行的 Privoxy 并且手动使用更新后的 config 文件调起一个新的进程,但是仍然没有解决 Something went wrong 的问题;

至此,我也不想和 Privoxy 纠缠下去,既然问题出在 Socks5 代理转 Http 代理的环节,我们可以使用 Proxifier 这个软件直接使用 Shadowsocks 提供的 Socks5 代理,就可以很好地解决这个问题。

Proxifier 的教程网上非常多,我就不在这篇文章里赘述了。

Proxifier 的使用参加我的文章:如何使用 Proxifier 来进行流量代理控制

Kill the Newsletter! – 免费好用的订阅邮件转 RSS Feed 源工具

By: Anonymous
16 June 2024 at 15:15

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

当想通过 RSS 订阅一些人的文章时,却只提供订阅和邮件订阅(News Letter)。为了解决这个问题,找到了一个 Kill the Newsletter! 服务,它可以替你接收邮件并转化为可供 RSS 阅读器订阅的地址。

Kill the Newsletter! 允许用户将订阅邮件转换为 Atom 订阅源。对于需要的订阅源,也会将确认邮件转换为订阅源条目,只要进入转换的地址,就可以获取并点击确认链接。

暂不支持通过回复邮件来验证订阅,可以尝试联系发布者手动验证,或使用邮件设置转发作为解决方案。

另外,有些 Newsletter 的发布者可能会将 Kill the Newsletter! 的电子邮件地址拉黑,同样需要转发之类的绕过。

由于订阅源包含用户的电子邮件标识符,因此不建议订阅源,以防止他人取消订阅或发送垃圾邮件。

通过以上步骤,你就可以把原本只能通过邮件接收的内容转化为 RSS 订阅,方便在各种 RSS 阅读器中统一管理和阅读。

三星手机的「捷径」,如今更好用:Bixby 日常程序 +

13 May 2021 at 03:21

若想进阶 Power User,一款趁手的自动化工具必不可少,在移动设备上,iOS 快捷指令和 Android 平台的 Tasker 是个中翘楚,少数派已有数不清的文章介绍。对三星用户来说,其实还有另一个选择:Bixby 日常程序。它最初亮相于 2019 年的 Galaxy S10 系列发布会上,经过两年的迭代,易用性和功能性都有长足进步,覆盖了大部分日常情景。

四月底,三星旗下的另一款系统级增强工具 Good Lock 迎来家族新成员 Routine +,为 Bixby 日常程序添加了多项新特性,玩法更丰富的同时,也让它在生产力方面迈出一大步。这结论缘何而来,是否略显夸张,读罢本文,你应该会有答案。

日常程序,是什么?

鉴于 Bixby 日常程序的默认入口较深,也鲜有文章介绍,切入新功能前,我们不妨先熟悉下本体。如果你还不知道这是什么,请前往「设置 → 高级功能」启用「Bixby 日常程序」选项。为了方便日后查找和使用,我建议同时将其图标添加至应用程序屏幕。下拉通知栏,编辑按钮,还可以将开关添加至快捷面板,随时启用或停用。

启用 Bixby 日常程序

打开 Bixby 日常程序,三星已经为我们准备了数款预设的自动化流程,如在家时更改声音模式和快捷方式,连接耳机时读出特定应用的通知,运动时播放音乐并启用定位服务……点击即可预览具体操作,快速编辑或保存。滑至主界面底部,我们还能通过清晨、驾驶、睡前等推荐的生活情景,按提示一步步创建最适合自己的日常程序,掌握它的基础用法。

建议的日常程序

与可编程能力更强的 Tasker 相比,我更愿意将 Bixby 日常程序称为本地版 IFTTT:图形化用户界面,没有高昂的学习成本,逻辑也是最直观的「如果满足触发条件则执行指定操作」。作为一款预置应用,Bixby 日常程序主要覆盖 Android 系统功能,操作的分类和图标与「设置」一致,支持 Samsung DeX 等独占特性,还能与三星自家设备联动,控制智能家居,开启无线耳机的主动式降噪等。

if trigger then action

最简单的日常程序,也可能为我们省下不少时间。拿基础的「打开特定应用程序」触发条件来说,观影时启用杜比全景声、阅读时进入护眼模式、办公时解除屏幕方向锁定等常用操作,都可以交给 Bixby 日常程序处理。如果你始终开启眼睛舒适度保护,也可以设置为打开设计工具时还原屏幕色彩;在启用自适应旋转的平板电脑上,改成打开部分未适配手机应用时保持纵向显示更合适。最关键的是找准手机使用过程中的痛点,因地制宜。

如果应用程序打开

将多种操作组合,较为复杂的工作流程也不在话下,如:

  • 充电时,自动延长锁屏时间,并开启息屏提醒,不影响续航的同时随时查看通知;
  • 打开游戏,智能调整屏幕分辨率和刷新率,顺便开启无线耳机的游戏模式,降低音频延迟;
  • 连接车载蓝牙,则打开导航应用,读出短信通知,拒接来电并回信;
  • 借助「到达或离开指定地点」触发条件,可以在地铁站切换至 NFC 卡片模式或显示支付宝乘车码,在家和公司采用两套完全不同的手机配置方案。

一次触发,多种操作

当然,触发条件也不局限于一个,给我们更多施展空间。检测到睡眠状态且处于夜间,则开启免打扰模式并降低屏幕亮度;若是还忘记充电,再采取其它措施节省电量,以防关键时刻手机掉线。这种情况下,当日常程序结束时,就不必撤销所做的改动了。上课时段,若在教学区连接至校园 Wi-Fi,调整手机为静音,启动专注模式;想对自己更狠一点,「如果工作日打开摸鱼 App,则关闭摸鱼 App」的日常程序或许会有奇效。

更进一步

Bixby 日常程序的最大软肋,是仅支持预设动作。坐拥自定义 Bixby 快捷命令、读取 NFC 标签、过滤信息关键词等潜力巨大的触发条件,却不支持变量传递;「进入网站」操作离跳转 URL Scheme 只差一步,却必须以 http:// 开头,扩展性远不足以满足进阶用户的需求。

入门以上而专业未满,让 Bixby 日常程序的定位略显尴尬。即将介绍的 Routine +,则在维持易用性的前提下,一定程度上弥补了这个缺陷,我们不妨在下文见识一番。

不止多个加号 SAGA

Good Lock 是三星官方推出的系统定制工具,由功能各异的模块组成。从诞生初期的系统界面美化,到逐步添加的诸多实用特性,现已成为集定制主题、导航手势、通知过滤、多任务处理于一身的全能选手,是所有三星用户都值得安装的利器。如果你未曾听说,不妨阅读少数派的这两篇文章:

近期上线的 Routine + 模块,顾名思义,是 Bixby 日常程序专精,目前支持基于 Android 11 的 One UI 3.1。具体来说,它提供三种新触发条件和三种新操作,配合原有功能,实现更强大且精准的自动化流程。

条件

安装 Routine + 后,再次打开 Bixby 日常程序,你会发现触发条件最底部多出了相应分类,可以覆写指纹、按钮和 S Pen 的硬件设置。如遇熊孩子抢手机,兰花指一伸,直接进入与主系统隔离的儿童空间;S Pen 顺时针画个圈,设备便开始播放音乐,顺便启动番茄计时。按钮操作不妨与其它条件结合,例如上文提到的乘车码,改成在地铁站双击侧面按钮时打开,既方便又不用担心误触发。

新触发条件

操作

Bixby 日常程序的操作中,同样新增了 Routine + 类别,分别为触摸宏、模拟方向键和读出文字。后两者的应用面似乎较窄,需要方向键辅助的触屏应用本就少见,文字转语音也算不上高频操作。我暂时能想到的,只有用 S Pen 隔空玩贪吃蛇比较方便,以及收到催稿信息时能知会一声 TACTICAL NUKE INCOMING 了。触摸宏的画风则大不相同,有必要另起几段详细说明。

新操作

触摸宏的作用,是记录我们的点击、滑动等操作的时间、位置和次序,保存后随时调用,有点类似 Windows 平台的按键精灵。创建触摸宏时,需要先抵达目标界面,然后点击浮动工具栏的录制按钮,执行希望模拟的流程,测试成功后,点击保存即可。为规避 App 响应速度等因素带来的影响,我建议留出一定的容错空间;如果途中不慎误操作,可以回溯历史,依次删除上一步。

创建触摸宏

不用说,Bixby 日常程序自然能与 Bixby 快捷命令配合使用,触摸宏的出现,得以了却我长久以来的夙愿:用 Bixby 控制米家设备。提前录制好动作,创建相应的日常程序,指定一则合适的口令,就可以指挥 Bixby 替我们跑腿了。当然,不设置快捷命令,直接对 Bixby 说「启动 XX 日常程序」就行,Android 11 的电源菜单也远比这高效,但生活还是需要一点仪式感的,不是么?

君子动口即动手

触摸宏的真正价值在于重复的机械化行为,打开应用时点击跳过广告、接近公司时钉钉打卡、快速擦亮闲鱼宝贝、商城抢购热门商品、手机游戏挂机等高频操作,都可以用它轻松搞定。另一方面,导航手势也在触控操作范围内,进入其它 App 不影响触摸宏的录制。因此,只要图标的相对位置不变,一键签到多款 App 的日常程序并无理论障碍。实际运用中,需要保证 App 不会更新改版,可行性不高。

触摸宏的应用之一

纵有诸多限制,我仍将触摸宏视为能引发质变的新功能,跳出有限的预设命令,模拟脚本也难以完成的繁琐操作,极大地拓宽了 Bixby 日常程序的应用边界。由于以「录制」而非「编写」的形式呈现,使用门槛维持在较低水平,缺乏编程知识的普通用户也能掌握。如果在后续更新中,能引入简单的变量传递和识别文字点击特性,Bixby 日常程序将真正踏入专业范畴。

最后,有必要在这里提醒各位读者,借助触摸宏自动化抢券、挂机等行为有几率被判定为使用作弊脚本,导致账户遭到限制甚至封禁,还请谨慎设置,不要滥用。

分享

可能是由于此前的操作都比较简单,Bixby 日常程序并不支持同步,在设备间迁移数据成了麻烦事。新操作之余,Routine + 也带来了日常程序的导入与导出功能,分为二维码和 JSON 两种形式,与朋友分享自己的得意之作或者备份到云端都很方便。不过,导出的日常程序会丢失自定义图标信息,触摸宏也无法完整保留,必须在新设备上重新录制,期待进一步完善。

扫一扫,没惊喜

结语

目前来说,如果你有足够的动手能力和编程知识,Tasker 无疑更加强大,指纹解锁和 S Pen 手势等硬件触发条件也能通过 Logcat Entry 功能实现,可以说是 Bixby 日常程序的上位替代。

但对大多数普通三星用户来说,系统自带的 Bixby 日常程序无需另行付费,上手简单,直观易懂,功能也足以满足日常所需,是自动化工具入门的不二之选。

Routine + 和触摸宏的出现,赋予了 Bixby 日常程序更多可能,让它有能力满足一部分生产力需求。同时,得益于友好的录制方式以及对三星自家特性的充分利用,Bixby 日常程序实现了相较于 Tasker 的差异化亮点。两年间的多次改版与更新,证明了三星对它的重视程度,期待 Bixby 日常程序能维持现有的低门槛,加入更多专业功能,成为 One UI 不可不知的「必备应用」。

Stacher – 基于 yt-dlp 的免费跨平台视频下载工具,支持几乎所有视频音乐平台

By: Anonymous
22 May 2024 at 14:26

DUN.IM BLOG

DUN.IM BLOG

Stacher – 基于 yt-dlp 的免费跨平台视频下载工具,支持几乎所有视频音乐平台

Stacher 是最近新问世的免费网络视频下载,支持 和 Linux,本身也是知名开放源码项目 yt-dlp〔由 youtube-dl 分支〕图形化界面〔GUI〕版本,大家都知道 yt-dlp 是终端里的下载工具,使用上会有一定的门槛,将它套用图形化后操作界面后就会更符合大众使用,支持超过 1200 种网络服务,之前曾介绍过的类似软件还有「Hitomi Downloader 」和「Seal」。

Stacher 已经有针对 Windows 和 Linux 三大操作系统推出对应的版本,只要从官方找到需要的版本后下载即可使用,本身没有自带中文界面,但在操作上不会困难,只需要将视频网址复制、粘贴后就能获取文件,也能够选择各种常见视频、格式。

利用 Stacher 可以下载 YouTube、Twitter、Instagram、TikTok、Bilibili、Pornhub 等网站视频,在使用时没有太多复杂难懂的设置,也支持包括 3GP、AAC、FLAC、FLV、M4A、MP3、MP4、OPUS、VORBIS、WAV、WEBM 等格式,最简单的方法就是维持默认值「最佳画质 + 音频」,就能获取包含影像、声音的视频文件咯!

值得一提的是 Stacher 还能针对要下载的平台提前设置账号密码,也有设置浏览器 Cookie 选项,无论是遇到任何状况只要适当设置应该都能顺利获取视频,如果平时会需要从网络平台储存视频的话可以试试看。

其他 YouTube 网络视频下载工具整理:

Stacher. A youtube-dl frontend.

进入 Stacher 网站后跳到下载区,选择要下载的程序版本,支持 WindowsmacOS 和 Linux,要注意的是都只适用于 64 位操作系统。

我使用 Stacher 的 Mac 版本进行操作教程,Windows 版本应该大同小异,进入后会有说明画面,可以得知应用程序是一个图形化界面下载器,以 yt-dlp 作为内核,因此在使用时会自动安装 yt-dlp。

进入 Stacher 主画面后会自动更新相关元件,上方是网址列,将视频网址复制、粘贴后就能进行下载。

从右上角可选择要下载、保存的文件格式,视频格式有 3GP、FLV、M4A、MP4、WEBM,格式有 AAC、FLAC、MP3、OPUS、VORBIS、WAV,建议直接维持默认值「BEST」就会自动获取最佳画质和音频。

下载时会显示视频略缩图、标题、文件大小、下载速率和预计完成时间,试着下载 YouTubeFacebook 和 Instagram 都能正确获取视频,而且下载速度很快。

完成后在视频上方点击右键、从菜单找到「Open Download Location」就能进入下载路径并找到视频文件。

另外,在右上角也能提前设置视频下载后的保存路径。

下载视频的网址列右侧有一个提前设置账号、密码功能,如果要存取的视频需要账号密码可提前设置,另一个选项可以选择浏览器 Cookie 来源,若无法正确下载视频的话就试试看调整这两个选项。

在 Stacher 设置画面能提前调整下载保存的视频路径、视频文件格式等选项,还有像是字幕下载、网络速度限制或是音质等等,可设置的项目很多,不过如果没有特殊需求只需要维持默认值即可。

前面有提到 Stacher 是使用 yt-dlp 作为内核,支持的服务超过 1000+ 个〔支持列表〕,基本上所有常见常用服务应该都能够利用这个应用程序下载,在测试时除了 YouTube 也下载 Facebook、Instagram 视频,也都能够顺利获取视频文件。

Stacher 是一款功能强大、操作简单的免费网络视频下载工具,非常适合新手使用。如果有下载网络视频的需求,不妨试试看 Stacher。

VMware Fusion Pro、 Workstation Pro – 最佳系统虚拟机开放个人免费下载使用

By: Anonymous
13 May 2024 at 15:34

DUN.IM BLOG

DUN.IM BLOG

VMware Fusion Pro、VMware Workstation Pro 是 VMware 公司旗下的桌面虚拟机,主要用于现有系统额外安装其他操作系统,例如在 安装 、Linux 或不同版本的系统,多半会用于测试软件、跨平台运行程序或是等等,虚拟机软件也会影响到运行系统的性能,当前 最多人使用 Parallels Desktop for Mac 作为双系统,缺点是每次都要在 Mac 版本更新时重新付费升级。

美国芯片制造商博通〔Broadcom〕收购 VMware 公司后宣布将 Fusion Pro、Workstation Pro 两款知名的桌面虚拟机软件开放,提供给个人用户免费使用这也表示在 Parallels Desktop for Mac 以外终于有的替代方案选择,如果用户觉得每年都要付费更新授权是沉重的负担,不妨试试看 VMware Fusion Pro。

至于 VMware Fusion Pro 和 VMware Workstation Pro 有何差异呢?主要差别在于支持的操作系统,Fusion Pro 是 macOS 适用的版本,Workstation Pro 是 Windows、Linux 支持的产品。

要注意的是 VMware 只开放个人免费使用〔Free for Personal Use〕,如果使用在商业用途的话就必须要付费获取授权〔Paid for Commercial Use〕,个人版和商业版软件功能上完全相同,只差在于使用情境。

VMware 也在这次更新宣布调整产品线,原有 VMware Workstation Player、Fusion Player 将走入历史,个人用户直接选择「Personal Use」启用个人版本即可,原有产品依然可继续使用直到生命周期到期。

这篇新闻「VMware Fusion Pro: Now Available Free for Personal Use」发布在 VMware Fusion 官方博客,大意是 VMware Fusion Pro 和 Workstation Pro 免费开放个人使用,其中有产品调整、订阅价格、商业版等说明。

VMware Fusion Pro、 Workstation Pro – 最佳系统虚拟机开放个人免费下载使用

其中最重要的是有两个产品链接如下:

在下载前必须先注册 Broadcom 会员账号才能继续,点击右上角「LOGIN」后会有「REGISTER」注册会员按钮〔如下图右上角箭头所示〕。

先照着步骤注册一个 myBroadcom 账号,第一步输入 、验证码。

接着去邮箱收取验证码、填入后通过验证,最后输入姓名、国家、密码并勾选同意使用授权〔密码部分有点麻烦,需要高强度且具备特殊符号的组合〕。

完成注册登入后就会看到 VMware Fusion Pro 和 VMware Workstation Pro 下载链接,直接登入控制台很难找到这两项产品,建议回到本文前面从「步骤一」点击对应的链接进入。

个人使用请点击后方有「Personal Use」的产品名,Mac 用户下载 Fusion Pro,Windows、Linux 用户下载 Workstation Pro。

点击后会出现可供下载的版本,越靠近上方的版本越新。

勾选上方同意使用条款,再按下右侧「下载」按钮〔如下图箭头所示位置〕。

操作流程好像有多一个步骤,需要填入用户的地址、邮递区号,将有红色标记的字段输入送出。

以下是 VMware Fusion Pro 操作画面,在安装设置时选择「I want to license VMware Fusion 13 Pro for Personal Use」就能启用个人版的免费授权,如果要在工作或商业使用必须付费购买授权。

启用后就会看到安装操作系统的画面。

[事实核查] 图片反向搜索核查工具汇总,检测 AI 生成图像的真实性实战指南

By: Anonymous
12 May 2024 at 14:30

DUN.IM BLOG

DUN.IM BLOG

在中文社交上,单纯以文字形式流传的虚假信息从比例上越来越少,以图片、截图形式流传的可疑信息则越来越多。

究其原因,一是「有图有真相」的观念深入人心,网络传言往往会附上图片来增加内容的可信度;二是图片形式更容易在群、朋友圈、微博等社交网络平台传播。

结果,有很多图片被抽离原有的背景和时间线流传,让受众对于该图片产生完全不同的认识和理解。还有的图片被软件加工篡改,完全改变了原有的意义。

因此,使用图片反向搜索(Reverse Image Search)工具,追溯图片的来源,在此基础上检查图片是否被修改或者挪用,是事实核查员最常处理的工作。

目前比较常用的图片反向搜索工具有谷歌、Yandex、Bing、TinEye、百度等,其中以前四个最为常用,各有优势和特点。

谷歌适合大多数基本的反向图像搜索,包括识别照片中的知名人物、查找已在网上大量共享的图像的来源、确定一件艺术品的名称和创作者等等。

使用方法:

1.在电脑上保存要核查的图片,或者复制该图片的网址

2.前往 Google 图片页面(https://images.google.com

3.点击搜索框的相机图标

4.可以选择直接上传图片、拖拽图片或粘贴图片的链接

比如核查以下图片(LIBKOS/AP):

在搜索结果中,可以看到页面右侧「图片匹配结果」中有两张完全一致的图片,点击图片即可找到这张图片的详细说明,包括时间、地点和拍摄者。

点击「查找图片来源」的选项,可以查看所有包含此图片的网页,从中选择可靠的信源,找到图片的详细说明:

还可以点击搜索框的「工具」按钮,进一步收窄搜索结果的范围,可以选择「按图片搜索」、「外观相似」或「更多尺寸」。

「工具」还有「时间」选项,可以选择从「过去 1 小时内」到「过去 1 年内」不同的时间范围,也可以自定义范围。通过这种设置,可以更容易找到图片初次发布的网页。

如果希望进一步搜索图片的局部,谷歌提供了裁剪工具,图片的四个圆角是可以移动的,用来调整搜图的范围,页面右侧会实时展示对裁剪后的画面进行图片搜素的结果。

对核查员来说,有时要核查的图片画面非常复杂,但有效信息只有其中的一部分,这时候裁剪功能就非常有用。

如果使用谷歌 Chrome 浏览器,可以直接在需要核查的图片上点击右键,选择「使用 Google 搜索图片」,搜索结果会在页面右侧显示。

也可以在页面空白处点击右键,选择「使用 Google 搜索图片」,页面会出现「选择要搜索的图片区域」的提示和截图用的图标,可以任意选择要搜索的图片区域,有关该区域的图片搜索结果会出现在页面右侧。

识别图片中的文字信息

在谷歌图片的搜索结果页中,点击「文字」按钮,谷歌可以识别图片上的文字信息,并且将其转换成可复制的文本。

这一功能非常实用,核查带有标语、路牌等元素的图片时,可以快速提取其中的文字,然后检索,以可能的线索。尤其是有关文字元素为俄语、阿拉伯语、韩语等语种时,核查员不必担心电脑输入法问题。

比如,查证一张带有俄语的图片(Alexander Ermochenko/Reuters):

在搜索结果中点击「文字」按钮,光标可以在图片上点击并拖动选择任意文字,也可以选择「选择所有文字」,这是页面右侧已经出现了标语上的文本,这时可以有 4 个选项:「复制文字」、「聆听」、「翻译」和「搜索」,可直接进行下一步的操作。选择「翻译」可知,这是俄罗斯在一个名为苏多普拉托夫的地点的征兵广告。

翻译图片中的文字信息

点击「翻译」按钮,谷歌可以直接在图片上将外语文字翻译成中文,可以大致明白图片上外语文字的意思,但受到识别度的限制,并不完整和准确,仅可提供快速的参考。

比如查证这张带有法语的图片(AFP):

在搜索结果中点击「翻译」,可大致知道这次示威的主题是关于养老金改革。

谷歌 lens 的特点是试图识别图像的主题,而非图像本身。不利的一面是,许多匹配项都侧重于图像中的主题。因此,如果图像搜索的主题不太清楚,可能不会获得高质量的结果。

比如搜索这张乌克兰总统泽连斯基的图片(EPA/UKRAINIAN PRESIDENTIAL PRESS SERVICE – HANDOUT):

返回的大部分却是与战术背心有关的结果:

「关于此图像」功能

2023 年 5 月 10 日,谷歌在 I/O 2023 开发者大会上宣布,将在接下来的几个月里添加一种新方法来帮助用户评估图像来源。

通过在搜索中的「About this Image」工具,用户将能够看到重要的背景信息,例如:

该图片和类似图片是什么时候首次被谷歌索引的,

这张图片可能首次出现的地方,

这张图片还出现在了网上的什么地方(例如新闻、社交或事实核查网站)

用户可以有三种方式来使用这一功能:点击 Google 图片搜索结果中的图片上的三个点;在 Google Lens 中使用图片或屏幕截图进行反向搜索;在使用 Google 的移动时,如果在一个页面上遇到想了解更多信息的图片,可以向上滑动。

按照谷歌的计划,2023 年晚些时候,用户还可以在桌面和移动端的 Chrome 浏览器中通过右键点击或长按图片来使用这一功能。

该功能将首先在美国以英语提供。

Yandex是一个俄罗斯的搜索引擎,检索有关俄罗斯、东欧、中亚等地区的内容时特别有优势,因此在俄乌战争期间很有价值。

使用方法:

1.在电脑上保存要核查的图片,或者复制该图片的网址

2.前往 Yandex 图片搜索页面(https://yandex.com/images/

3.点击搜索框的相机图标

4.可以选择直接上传图片、拖拽图片或粘贴图片的链接

5.单击搜索选项以在 Yandex 上查找相关图片。Yandex 将返回具有完全匹配或视觉相似图像的结果,包括使用这些图像的网页列表。

比如,2022 年 3 月 20 日,有微博用户称:「波兰铁路工人中断了与乌克兰的铁路连接,使装有英美武器的火车无法前往乌克兰。」有关博文还附有一张模糊的铁路照片,画面中有两列列车,但是没有显示地点的明显标记。(参考阅读:波兰铁路工人中断与乌克兰铁路连接?

在 Yandex 上反搜这张图片,可以找到大量的匹配结果:

在谷歌上反搜,首先出现的是一大批相似图片:

下拉数页后才能发现匹配的图像:

2023 年 4 月,中文网络流传一段视频,称「歌手席琳·迪翁参加她儿子的婚礼,因为罕见的僵硬人综合症已无法自己站立,看到的画面让人感伤」。

截取视频画面分别在谷歌、Yandex 和 TinEye 上反搜,可以发现,只有 Yandex 返回了包括大量相似图片的搜索结果,并且其中包含有意义的线索。

Yandex 还可以在搜索结果中显示其找到的核查图片的不同尺寸,如果核查的原图比较模糊,此时可以点击并保存更大尺寸的图片,然后继续反搜大尺寸的图片,一般而言可能更接近于找到图片的源头。

同样,Yandex 也具有识别图片中的文字,裁剪图片等与谷歌类似的功能。

案例 1:

2022 年 2 月,俄罗斯进攻乌克兰之前,中文网络广泛流传一张据称是乌克兰少女拿枪乘坐公交车的图片。

图片中,这位女孩头戴米色编织毛线帽,身穿带圆形拉链的黑色高领羽绒服,左手涂蓝色指甲油,右手涂红色指甲油。图片中没有明确可以提示时间、地点的元素。

有关图片被指拍摄于乌克兰,在俄罗斯和俄语区广泛使用的搜索引擎 Yandex 上反搜图片,可以发现该图片自 2020 年起就在俄罗斯社交网络 VK 上广泛流传。

在 VK 上进一步检索,可以发现能够找到的最早版本发布于 2020 年 3 月 27 日,发布者名为「寻找新西伯利亚的你」。从其主页内容看,这是一个寻人账号,slogan 是「连接命运」。账号介绍称:如果你在某个地方看到一个人,但由于某种原因无法接近和认识,那么你可以通过描述你的故事来尝试找到 Ta。

这张照片由名为 Karpov Sasha 的用户拍摄,配文是:「我一路坐在她旁边,我非常喜欢她,但很害怕打招呼。我在寻找你,美女。」

在帖子下方的评论中,一位名为 Ekaterina Gladkikh 的用户称,她就是照片中的女子。

她还在自己的 VK 页面上转发了这个帖子。

根据 Ekaterina Gladkikh 的 Instagram 账号,她是俄罗斯人,目前在新西伯利亚生活,是一位网红。

检索 Gladkikh 的 Instagram 账号,可以发现她在 2020 年 3 月 10 日发布的视频中,左手涂有红色指甲油、右手涂有蓝色指甲油,与网上流传的照片特征一致。

在 Gladkikh 于 2020 年 4 月 8 日发布的照片中,可以看到她穿戴着与网络流传照片中同款的毛线帽、黑色羽绒服,右手也涂有蓝色指甲油。

(参考阅读:乌克兰少女带枪坐公交?

案例 2:

2022 年 5 月,短视频平台抖音出现一批内容几乎一模一样的视频,文案是:「没有国哪有家,俄罗斯进入最困难时期,民众排队存钱救国!」

视频画面多是俄罗斯人在银行、ATM 取款机等处排长队的场景。

核查的关键之处在于找到每张图片的来源。

比如这张图片,使用谷歌和 Bing 都没有找到理想的结果:

使用俄罗斯搜索引擎 Yandex,裁剪截图的文字部分,可以找到一张同类结果:

点开网页发现,使用这张图片的文章发布于 2014 年 12 月 17 日,虽然可以断定此图与 2022 年俄乌局势无关,但是网页没有提供有关这张图片的详细信息,如图片说明、出处等。

不过,与最初的视频截图相比,这个网页上的照片尺寸较大,也更清晰,我们可以把这张大尺寸照片保存下来在 Yandex 上反搜,可以在第二个搜索结果中发现 Getty 图片社的网站包含了这张图片。

点击搜索结果中的 Getty 网站,可以发现该图片由彭博社记者安德烈·鲁达科夫(Andrey Rudakov)拍摄于 2014 年 12 月 17 日,图片说明是:俄罗斯圣彼得堡的一家 M-Video 商店内,顾客排队购买电子物品。在该国自 1998 年以来最严重的货币危机中,人们担心价格会进一步上涨而抢购消费品。

由此这张图片的身世就完全搞清楚了。(参考阅读:俄罗斯全民排队存钱救国?

Bing 是微软旗下的搜索引擎。在首页(bing.com)的搜索框旁边即有图像搜索的图标,可以直接进行反向图片搜索,而不必像谷歌和 Yandex 那样进入二级页面。

使用Bing 图片搜索时,可以将一张或多张图片拖到搜索框中、粘贴图像或 URL、从电脑上传图像,还可以用设备拍照——然后 Bing 将在网络上搜索匹配的图像。

Bing 也具有和谷歌、Yandex 类似的图片裁剪功能,在搜索结果页面点击「视觉搜索」按钮,可以裁剪照片的不同区域并查看实时搜索结果,这对于查找那些具有多个可识别主题的图像来说会非常有用。

Bing 另一特点是在搜索结果页,选择「具有此图像的页面」后,可以选择以「最新」或「最久」来对搜索结果进行排列。此功能与 TinEye 的按时间排序类似。

此外,与谷歌相比,Bing 会尝试识别照片中的不同元素,然后查找包含所有这些元素的图像。

比如,一张停在树旁的古董车的图片会触发包含一棵树和一辆古董车的相关匹配,而谷歌在这种情况下会选择其中一个更强烈的主题并寻找匹配。

TinEye创办于 2008 年,总部位于加拿大多伦多。TinEye 的最大优势是可以对搜索结果进行时间排序。

TinEye 使用图像识别技术来搜索图像,而不是关键字、元数据或水印。当用户提交要搜索的图像时,TinEye 会使用图像识别为其创建一个独特且紧凑的数字签名(「指纹」),然后将此指纹与其索引中的所有其他图像进行比较以查找匹配项。TinEye 会不断爬取网络并将图像添加到其索引库中。

使用方法:

通过单击上传(upload)按钮从电脑上传图像,也可以用拖曳方式把图片拖入搜索框。如果按 URL 搜索,可以把图像的 URL 地址复制并粘贴到搜索框中。

使用 TinEye 搜索图像时,可以通过几种不同的方式对这些结果进行排序和过滤:

最佳匹配(best match):首先显示视觉上最接近被搜索图像的图像。这也是默认的排序选项。

改动最大(most changed):首先显示对搜索图像改动最大的图像(经过大量编辑的图像)。

最大图像(biggest image):首先显示最高分辨率的图像。

最新的图像(newest):首先显示 TinEye 最新发现的图像。

最早的图像(oldest):首先显示 TinEye 最早发现的图像。

能够对搜索结果按照时间排序,是 TinEye 相比其他图片反搜工具的最大优势。对事实核查员来说,这一功能更容易破解挪用旧图片的传言,足以证明那些被形容为新闻的图片实际上已经有数月甚至数年之久。

以下图为例,2022 年 2 月 26 日,俄罗斯对乌克兰开战 2 天后,微信群流传一张据称是战场的新闻照片,两名儿童面对飘扬着乌克兰国旗的装甲车队敬礼,远处硝烟弥漫。

在 TinEye 上输入照片,排序选择 sort by oldest,可以发现出现在 TinEye 搜索结果第一位的是乌克兰网站 Gordonua 的页面,时间是 2016 年。

点击 Gordonua 的网络链接,可以找到 2016 年 3 月 23 日的一张图片与要核查的图片相同。

图片说明称,这是乌克兰国防部在其 Facebook 页面上发布的「战争之子」系列照片中的一张。

因此可以判定,这张图片至少拍摄于 2016 年,与 2022 年的俄乌战争无关。(参考阅读:乌克兰儿童向乌军车队敬礼?

可以在 TinEye 上搜索哪些类型的图像?

文件类型:TinEye 接受各种格式,包括但不限于 JPEG、PNG、GIF、BMP、TIFF 和 WebP 图像。

图像尺寸:最适合使用至少为 300 像素的图像,但也可以接受低至 100 像素的图像。

文件大小:最大为 20M。

为了获得最佳搜索效果,应尽量避免使用有明显水印的图像,因为 TinEye 可能会搜索水印而不是图像本身。

TinEye 的搜索结果会以域名分类,显示包含相关图片的网站;如果想知道搜索图片的版本是否出现在一个特定的网站上,可以在「按域名/集合过滤」(filter by domain/collection)的输入框里输入该网站的网址。TinEye 也会自动设置一些域名分类,主要包括主要的社交媒体平台和媒体,如 Twitter、Reddit、AFP 等。

如果搜索的图片属于图库里含有的图片,会标记为 stock;如果隶属于某一个系列的图片,则会标记为 collection。当 TinEye 确定一个网站已经无法访问时,会默认隐藏该网站的搜索结果。但如果用户对这些匹配结果感兴趣,可以勾选「包括不可用的结果」(include results not available),TinEye 就会显示该网页的存档。

TinEye 还有比较(compare)功能,可以将搜索结果与用于执行搜索的图片进行比较,这在识别裁剪过的、调整过大小的、倾斜过的或 PS 过的图片时非常有用。

但是,有些图像 TinEye 找不到:

大多数社交媒体网站,如 Facebook 和 Instagram,都限制 TinEye 抓取他们的图片。

受密码保护的页面或不可公开访问的页面上的图像。比如,如果要核查的图片最早发布在一个 WhatsApp 群组或微信群里,并且从来没有在网上被分享过,TinEye 就无法找到。

用户个人设备上的个人照片。

一些太小的或简单的图像,可能没有足够的细节让 TinEye 制作「指纹」。

与其他搜索引擎不同,TinEye 只能找到与我们搜索的图像完全匹配的图像(也包括经过裁剪、颜色调整、大小调整、编辑或轻微旋转的图像),但一般来说无法找到相似的图像。

注意:

TinEye 抓取到最旧的图片并不一定是该图片第一次出现在互联网上的日期。因此,TinEye 不能告诉我们一张图片首次出现在互联网上的时间,只能告诉我们 TinEye 首次发现它的时间。

一般而言,核查员在核查图片时会尝试使用多个反搜工具,而最方便的是下载安装 InVID Verification Plugin 插件,该插件集成了多种图片验证功能。

通过 Chrome 或 Firefox 浏览器下载安装插件后,在网页浏览图片时,可以直接右键点击图片,选择 Fake news debunker by InVID by WeVerify,进一步选择 Image Reverse Search-All,即可同时启动谷歌、Yandex、Bing、TinEye 等多种图片反搜工具,并在不同的新窗口展示搜索结果,极大地提高了效率。

另外一种使用方法是进入 InVID 系统。安装 InVID 后,Chrome 浏览器顶部会出现一个启动图标:

点击后选择「打开工具箱」(Open Toolbox)

进入 InVID 界面,选择图片处理(Image),即可看到 6 大功能:

1.图片分析(Image analysis):针对 Twitter 和 Facebook 上的图片,进行详细的数据分析。

输入图片的网址,点击提交,出现有关该图片的信息。

图片 ID、平台、创建时间、图片链接、点赞数、转推数,同时还抓取了推文下面所有的评论并且分类,包括带有链接的回复数。

比如我们分析 SpaceX 的这则推文图片:

2.放大镜(Magnifier):用户可以在图片上使用放大镜功能,以帮助解读和阅读图像中难以看到的细节——比如汽车牌照、飞机侧面的识别号码、徽章、标志、横幅等等。用户可以输入图片的网址,或者使用本地文件按钮(LOAD LOCAL FILE)从本地上传图像。

比如我们可以用放大镜检查这架战斗机涂装上的信息:

然后可以使用图片下方的谷歌、Google Lens、Yandex、Tineye、百度等按钮对图片进行反向搜索,或使用图像取证选项。

该功能还包括图片编辑(点击 EDIT IMAGE),可以对图片进行裁剪、翻转、锐化等。

3.元数据(Metadata):用户可以查看 jpg 和 tiff 格式的图片的 Exif 数据,可以输入图片链接或上传本地图片文件。

Exif (可交换影像档案格式,Exchangeable Image File Format) 档案会储存照片的重要资料,例如设备、曝光值、拍摄时间、地点以及使用的任何设置。每当用户拍摄新的照片时,几乎所有数码相机和智能手机都会建立这些资料档案。

4.取证(Forensic):帮助用户检测图片是否被篡改,比如是否被 Photoshop 软件编辑过。不过,使用者需要极其丰富的图像知识,且结果可能存在误差,所以,一般而言仅能作为参考,而非决定性证据。

5.OCR:可以将图片上的文字内容,智能识别成为可编辑的文本,不过有时无法识别。

6.检查 GIF 图片(CheckGif):可以对比原始图像和被篡改的图像(包括图像被裁剪过的情况),然后生成一个 GIF 并输出,可以更直观地展示篡改行为。不过,该功能目前仅对事实核查员、记者和研究人员开放。

2022 年 7 月 8 日,日本前首相安倍晋三遇刺后,中文网络流传一张照片称,被称为「日本第一女保镖」的石田萌美也在现场,却未能阻止杀手。

石田萌美此前在中文网络被形容为「日本第一女保镖」。她被指曾是安倍晋三最信任的贴身人员之一,因为外型靓丽和身份特殊受到关注。有文章指她是日本顶尖的武功高手,能够在 0.2 秒内拔枪制服袭击者,曾击退 10 名壮汉。

使用图片反搜工具搜索这张照片,可以确定照片本身是真实的,但是因为安倍身边的这位女士戴着口罩,也无其他明显的识别特征,所以依然很难判断她的身份。

这时我们仔细观察这张被指是石田萌美检查安倍伤势的照片,可以发现这位女士外表可供辨认的几大特征:长发束辫,黑色或深蓝色上衣,带有花卉纹样的裙装,低跟皮鞋。

由于安倍遇刺发生在公开场合,且现场媒体众多,因而有利的一面是,有大量现场照片可供检索。在《朝日新闻》网站上的安倍遇刺现场图片集中,我们可以发现大批同一场景的照片,能够较清晰地分辨出这位女士身穿的是一件罩衫,罩衫内是黄色 T 恤。

在美联社转发《读卖新闻》的一张照片中,安倍被送上救护车,救护车旁有一位女士的正面照片,放大后可见其发型、黄色 T 恤和蓝色罩衫、带花纹的裤装、黑色皮鞋,均与网传照片一致,可以判定她与被中文网络认为是石田萌美的那位女士是同一人。

大量现场视频和照片显示,安倍遭到枪击后,一批身穿黄色 T 恤的人员对其进行了心肺复苏等急救。这些人员的黄色 T 恤与这位女士的黄色 T 恤一致,因此,黄色 T 恤成为识别这位女士身份的最关键因素。

核查员用日语在推特、Facebook 平台上搜索「安倍 黄色衣服」关键词,发现有日本网民的推文中提供了线索,指出这是日本看护联盟的工作人员在急救。

据此线索,检索看护联盟的官方网站,了解到看护联盟是代表日本护理行业的组织,而且网站上的照片显示,看护联盟的成员在参加集体活动时一般均着黄色标志色衣服,有护理、急救知识和经验。

再用日语检索「看护联盟 安倍」,可以发现代表日本看护联盟参加众议院选举的友納理緒在有关安倍的讣告中提到,「在这次事件中,现场的看护联盟的各位在混乱中奋力救助」。

照片中的这位女士也穿着统一的黄色 T 恤,因此可以判定,她不可能是石田萌美,也不可能是安倍的保镖。

从这张照片的核查过程来看,以图搜图只是一个起点,更需要根据图片中的各种信息、图片外的各种新闻报道、社交媒体上的线索等等综合研判,得出结论。(参考阅读:安倍遇刺时网红女保镖就在身边?

2021 年 9 月,中文网络流传一张照片称,被加拿大扣押的华为公司首席财务官孟晚舟「困境中不忘支持国货,穿鸿星尔克出庭」,并附上孟晚舟穿运动鞋面带笑容的照片。不过,这双鞋上并无醒目的品牌 logo。

以「Meng Wanzhou+sneaker」为关键词在搜索引擎检索,可以在德国新闻图片社 IMAGO 的网站上发现一组照片,与中文网络流传的照片一致。

该组照片由加拿大新闻社记者 Darryl Dyck 拍摄,图片说明是:2021 年 8 月 6 日,华为公司首席财务官孟晚舟戴着脚踝监视器,穿跑鞋(running shoes)离开温哥华的家,前往位于温哥华的加拿大不列颠哥伦比亚省高等法院参加引渡听证。

此时我们已经找到了图片的来源,但是原图的图片说明中并未指出这双鞋是什么品牌。

不过,搜索结果很有利的一点是,摄影师拍了一组照片,尤其是有一张特写孟晚舟脚踝监视器的照片,孟晚舟的跑鞋也相比网传图片更加清晰。

这时我们使用 Google Lens 搜索这双鞋,因为 Google Lens 不仅可以搜索图片,还会试图提供图片中的信息,比如你扫描一张产品图片,可能会看到购物链接。果然,搜索结果指向了 HOKA 品牌。

核查员还使用了淘宝 APP 的拍照功能,拍下图片上的鞋子,然后淘宝快速识别出相似的结果,也指向了 HOKA 品牌。

据此线索进入 HOKA 官网的网络商店检索,可以发现孟晚舟所穿鞋款品牌为 HOKA ONE ONE,款式为 Clifton 8。

与此同时,核查员还登录了鸿星尔克官方商城、鸿星尔克淘宝旗舰店,没有发现类似商品。鸿星尔克淘宝旗舰店的客服也证实这款鞋子并非鸿星尔克。

由此可以得出结论,这张照片是孟晚舟于 2021 年 8 月 6 日离开住所前往加拿大不列颠哥伦比亚省高等法院参加引渡听证时拍摄的,她脚穿鞋款品牌并非鸿星尔克,而是法国品牌 HOKA ONE ONE。(参考阅读:孟晚舟穿鸿星尔克运动鞋在加拿大出庭?

2022 年 7 月 8 日,日本前首相安倍晋三遇刺后,中文网络流传一张照片,一位日本电视台的男性主播在咧嘴大笑,画面下方是一行日语字幕,可以辨认出与安倍遇刺有关——“安倍晋三元首相死亡確認”。

首先我们先从照片上的信息入手,这张截图的左上角有日文字样「イット」,在谷歌检索,找到节目的官网,可见这是日本富士电视台和富士新闻网(FNN)播放的一档新闻节目,全称为 Live News it!(日语片假名为:ライブ ニュース イット!),于 2019 年 4 月 1 日开播,一般直播时段为每周一至周五下午 3 点 45 分-7 点。

比对节目官网上的主持人形象,可以确认屏幕上的主播名叫榎並大二郎,毕业于庆应大学,2008 年加入富士电视台,从 2020 年 9 月 25 日起开始担任 Live News it!的主播。

这时我们要确认的是,榎並大二郎在播报安倍遇刺后确认死亡的新闻时是否大笑,所以最好要找到有关的节目视频。在 FNN 的 频道检索,可以发现该频道 2022 年 7 月 8 日上传的一则视频与中文流传截图的字幕、主持人衣着、背景均一致:「速报:安倍晋三元首相死亡確認 元海上自衛官に銃撃される」。

不过,在这则时长 44 秒的视频中,榎並大二郎并无大笑的表情。

那这张网传截图中大笑的表情从何而来?P 图能够如此自然吗?

事实上,随着 AI 技术的进步,常见的人脸编辑器或修图应用已经能很轻松地改变照片中的人物表情,比如国外的 FaceApp 和国内的醒图 App。

核查员从榎並大二郎播报安倍遇刺视频中截取照片,试图复现图片中的主持人大笑效果:

在醒图应用中选择「微笑」的特效选项后,应用自动处理完成后展示的效果如下,与网传图片非常接近:

核查至此,得到两个证据:一是检索到主持人播报该条新闻时的完整视频片段,主持人并无大笑;二是核查员使用修图软件,复现了网传图片中的主持人大笑效果。

但是,为了让结论更坚实,我们还就这张图片联络了富士电视台观众中心,工作人员回复查询时表示,当天紧急速报无异常,播报员榎並大二郎没有大笑的行为。

此时我们可以得出结论,主持人当天播报有关新闻时并未大笑。这一核查案例也提醒我们,随着 AI 技术的日益进步,对于图片的识别难度也在增加,必须借助更多信息加以综合研判。(参考阅读:日本主持人播报安倍遇刺时咧嘴大笑?

三星手机的 Space Zoom 功能可以让用户拍摄到美丽的月球图像,但也引发了由此产生的图像是否「真实」的争议。

2023 年 3 月,Reddit 上的一则帖子引发激烈的讨论,该贴清楚地拿出「证据」说明,指责三星的月球照片是「假」的。

Reddit 用户 ibreakphotos 先故意制作了一张模糊的月球照片,将其显示在电脑屏幕上,然后用三星 S23 Ultra 手机拍摄屏幕上这张模糊的月球照片,最终的照片显示了一张清晰的月球照片,增加了一些以前没有的细节。

制作过程:

1.从互联网上下载了这张高分辨率的月球图片

2.将图片尺寸缩小到 170×170 像素并使用高斯模糊,让月球上所有的细节都消失,这意味着它不可恢复,信息不存在,数字模糊

放大 4 倍的版本,以便更好地看清模糊效果:

3.在显示器上全屏显示该图像(尺寸为 170×170 像素,非常模糊),拍摄者移到房间的另一端,关掉所有灯光,开始拍摄

4.手机拍摄效果

5.对比

ibreakphotos 认为,用三星 Galaxy S23 Ultra 拍摄的月球图像,是通过应用「月球纹理」(Moon texture)来伪造的。 这名用户得出的结论是,三星的月球照片是假的,在没有细节的地方添加了细节,大部分工作是 AI 完成的,而不是光学器件。

对于图片造假指控,三星向著名的科技产品评测指南网站 Tom『s Guide回应称:「三星致力于在任何条件下提供最佳的拍照体验。当用户拍摄月亮时,基于 AI 的场景优化技术会识别出月亮是主要拍摄对象,并进行多帧合成,然后 AI 会增强图像质量和颜色细节。它不会对照片应用任何图像叠加(image overlaying)。用户可以关闭基于 AI 的场景优化功能,这将禁用对用户拍摄的照片进行自动细节增强。」

也就是说,三星否认了 Galaxy S23 Ultra 使用基于 AI 的图像叠加技术来增强月亮照片细节的说法。

科技网站 The Verge 就此评论称:「在这种情况下,『假』到底是什么意思?这是一个很难回答的问题,随着计算技术进一步融入摄影过程,这个问题将变得越来越重要和复杂。我们可以肯定地说,我们对照片造假的理解很快就会改变,就像过去对数码相机、Photoshop、Instagram 滤镜等的理解一样。

摄影正在发生变化,我们对什么是『真实照片』的理解也会随之改变。「

AI 图像生成工具在 2023 年呈现出爆发性应用趋势,可以通过利用海量数据库生成无限数量的图像。

Midjourney是一种使用生成 AI 从简单的文本提示创建图像的工具,2023 年 3 月推出了更先进的模型,能够生成更逼真的图像。

Stable Diffusion是一个文字转图片的生成模型,可以只用几秒钟时间就生成比同类技术分辨率、清晰度更高,更具「真实性」或「艺术性」的图片结果。

DALL-E 的出品方 Open AI 旗下的一个模型,接收文本和图像作为输入,以多种形式输出最终转换后的图像。升级版本 DALL-E 2 在生成用户描述的图像时具有更高的分辨率和更低的延迟。

Craiyon AI是一个免费的在线 AI 图片生成器工具,可以根据用户输入的任意文本生成独一无二的视觉艺术作品。

2023 年 3 月,微软 Bing 在线 AI 绘图功能Image Creator上线,由 Open AI 的 DALL-E 驱动,可通过文字描述生成图片内容。Bing 绘图目前仅支持英文,使用「形容词 + 名词 + 动词 + 风格」的格式可以生成高质量图片。每个由图像创建器生成的图像都会在左下角添加 Bing Logo。

Adobe 也在 2023 年 3 月发布了使用人工智能生成图像的新工具Adobe Firefly。Firefly 允许用户通过文字来描述其软件将创建的图像、插图或视频。

英伟达公司也推出了名为「毕加索「的自有服务,该服务使用人工智能技术从文本描述中生成图像、视频和 3D 应用程序。

虽然篡改图片和创建假图像的做法并不新鲜,但 、DALL-E、Stable Diffusion 的 AI 图像生成工具更易于使用。它们可以快速生成具有详细背景的逼真图像,只需来自用户的简单文本提示即可。这些技术如果被不良行为体利用,可能会大幅提高核查难度。

在过去,包括深度伪造(deepfake)在内的造假者会篡改一张已经存在的图片或一段已经存在的视频,此时尚且可以通过图片反搜等方式,追根溯源找到原图来进行核查。

但是,新时代的造假者已经不需要这么做,他们可以使用人工智能 技术,特别是文本生成图像的模型,创建完美支持其虚假叙述的全新图像,制造逼真的假证据。这种图像,无法通过图片反搜的方式直接追根溯源,因为它本身就是源头。

2023 年 3 月,在美国纽约检方可能因一起案件逮捕前总统特朗普之际,开源调查新闻机构 Bellingcat 创始人 Eliot Higgins 在一系列广为流传的推文中,用 Midjourney 工具的最新版本制作了特朗普虚构被捕的大量戏剧性画面。他在推文中明确表示这些图像是 AI 生成的,也说明了自己在 AI 生成过程中发布的指令:「特朗普在被捕过程中摔倒。新闻报道画面。」 随后 AI 给出了这些图片。

虽然推特的资深用户和人工智能爱好者可能第一眼就能认出这些假图片,但也有很多人并没有,甚至会提出疑问:「为什么特朗普被捕没有成为新闻」?在没有关键背景的情况下,这些视觉效果很快就会被其他人转发。一篇 Instagram 帖子分享了 Higgins 的一些特朗普照片,就好像它们是真的一样,获得了超过 79000 个赞。

虽然这些照片存在瑕疵,比如脸和手明显扭曲,警察制服上的文字乱七八糟,一张图片显示特朗普戴着警用腰带,等等。然而,这些线索没有那么简单被觉察,而且在现阶段可以很容易就被 Photoshop,或者一点动态模糊、像素化所掩盖。可以预见的是,随着技术的进步和迭代,这些瑕疵肯定也会消失,比如 Midjourney 的第五代版本已经可以较好地解决手部问题。

2023 年 4 月,德国摄影师鲍里斯·艾达格森(Boris Eldagsen)的黑白肖像摄影作品「电工」(The Electrician)不仅入围「Sony 世界摄影大奖」(Sony World Photography Awards)的创意类别,更获选为冠军,看起来是以传统摄影技术所拍摄的、两名来自不同世代的女性。

不过,艾达格森在 Facebook 发文坦承,这张其实是由 Open AI 的「DALL-E 2」工具生成的图像。事实上,「电工」是艾达格森 2022 年开始创作的「Pseudomnesia」系列作品之一;Pseudomnesia 在拉丁语中指的是「虚假记忆」,包括从未发生过的虚假事件,而不只是不准确的记忆。

艾达格森表示:「这是一个历史性时刻,这是第一张由 AI 生成的图像赢得了一个国际摄影大奖。」他声明称:「我想检验摄影比赛是否已经准备好接受 AI 生成图像。但事实上并没有明确的规定,关于 AI 图像是否合法,该组别允许编辑和合成图像。」

目前核查这些 AI 生成的图像并无非常有效的工具,只能综合各种信息研判。

人工智能创业公司 Hugging Face 开发了一个人工智能图像检测器(AI Image Detector),能检查图像的显著特征,并对图像是自然的还是假造的做出说明。

比如这张特朗普被「逮捕」的 AI 生成图片,检测器判断出 67%的图像是由人工智能创造的。

这张乌克兰总统办公室 3 月 23 日发布的泽连斯基视察赫尔松的真实照片,检测器判断出其 83%的图像是由人而非人工智能创造的。

但是这种检测只能作为一种参考,而无法成为唯一的决定性证据。

图像数据分析公司 Mayachitra 也有一个针对使用 GAN(Generative Adversarial Network,生成对抗网络)技术生成图像的检测工具,目前只有测试版,不过可靠性仍有待提高。

比如这张特朗普被「逮捕」的 AI 生成图片,Mayachitra 工具却认为它「很可能不是使用 GAN 技术生成的」(Probably not GAN generated)。

人工智能公司 Hive Moderation 也有一个AI 生成内容检测工具,既可以检测文字内容,也可以检测图像内容。图像检测方面,可以检测由 DALL-E、Midjourney 和 Stable Diffusion 等流行工具生成的图像。

上传图片后,Hive 的人工智能检测模型会进行处理,以确定图片是否由 AI 生成,然后给出一个分数结果。如果模型认定图片由 AI 生成,结果还会判断这张图片是由哪个引擎创建的。

比如这张火车站老人与孔雀的 AI 生成图片,Hive 判断其 99.9%由 AI 生成,并且是由 Midjourney 生成的。

这张法国总统马克龙官方推特 4 月 7 日发布的访问中国中山大学的图片,Hive 判断其只有 0.5%的可能性是由 AI 生成的。

另一个核查的线索是找到图片首次发布到网上的时间。在某些情况下,最初的创作者可能会明确表示图片是人工智能生成的,并指出使用的工具。反向图像搜索可以帮助查看图片是否已在搜索引擎中编入索引并查找包含相同照片的旧帖子。反向图像搜索也会找到相似的图片,这时可以将潜在的 AI 生成的照片与来自可靠来源的照片进行比较,发现有用的线索。

有时照片本身也隐藏着线索,例如某些 AI 创作工具使用的水印。

例如,DALL-E 会在其所有图像的右下角自动生成一个多色条。

Craiyon 在同一个地方放了一支小红铅笔。

但并非所有人工智能生成的图像都有水印——这些水印可以被移除、裁剪或隐藏。

2023 年 5 月 10 日,谷歌在 I / O 2023 开发者大会上宣布,将确保每一张由谷歌 AI 生成的图像在原始文件中都有一个标记。其他创作者和出版商将能够添加类似的标记,因此用户将能够在 Google 图像搜索结果中看到这些 AI 生成标签。

另外,尽管生成式 AI 取得了长足的进步,但截至 2023 年 3 月,AI 生成的内容中仍然会出现错误,这些缺陷是目前识别 AI 生成图像的重要方式。比如,逼真的手仍然很难生成。AI 图像也很难产生反射,发现人工智能的一个好方法是寻找阴影、镜子、水,也可以放大眼睛,分析瞳孔,因为拍照时通常会有反光。有时图像会出现眼睛大小不一,颜色不同。还可以查看照片的远景,元素离得越远,物体就越模糊、扭曲并且视角不正确。

但是,AI 生成图像的技术绝对会快速进步,这些视觉缺陷也绝对会被弥补。比如,2023 年 3 月月发布的 Midjourney 的最新版本能够描绘出逼真的手部。所以从长远来看,视觉线索也并不可靠。

为了应对深度伪造图像,科技公司、研究人员、新闻机构正在试图建立内容来源和所有权的标准,从源头出发对影像的创造和传播进行全程跟踪。或许未来我们核查图像时,首先要做的是查看其数字水印。

2021 年 2 月,多家具有影响力的科技和媒体公司结为伙伴,成立「内容来源和真实性联盟「(Coalition for Content Provenance and Authenticity,C2PA),制定媒体内容来源与历史或出处认证技术标准,试图解决虚假信息、错误信息和在线内容欺诈的扩散问题。联盟创始成员包括 Adobe、Arm、BBC、Intel、Microsoft 和 Truepic,着力建立一套标准化溯源解决方案,解决好误导性内容问题。

C2PA 成员将共同针对常见资产类型和格式制定内容溯源规范,让出版商、创作者和消费者能够追踪媒体内容(包括图像、视频、音频和文档)的来源和演变。这些技术规范明确各类资产应标示的相关信息内容、如何显示和存储该信息以及如何识别篡改的证据。

各平台能够通过 C2PA 开放标准保存和读取基于出处的数字内容。一项开放标准可供任何在线平台采用,因此对于在整个互联网上提升信任度至关重要。除了将各类媒体类型纳入其中,C2PA 还着力推动从捕获设备到信息消费者的端到端出处体验。与芯片制造商、新闻机构以及软件和平台公司合作对于促进出处标准和推动整个内容生态系统的推广采用至关重要。

C2PA 的成立将 Adobe 主导的内容真实性倡议(Content Authenticity Initiative,CAI)和 Microsoft 与 BBC 主导的项目溯源(Project Origin)的众创始成员召集在了一起,在一个联盟下统一技术规范。CAI 正在构建一套数字媒体出处与历史系统,创作者可通过该系统声明其作者身份,消费者则可以通过它来判断其所看到的内容是否值得信赖。「项目溯源」针对的是新闻制作与传播。其方向是将证明内容真实性的标示附加到内容上,并让用户能够看到该标示信息,由此来解决数字新闻生态系统中的虚假信息问题。C2PA 成立后,技术标准将统一,上述两个实体将继续在各自社区内进行推广、原型设计和教育。

2022 年 2 月,C2PA 联盟发布了用以对抗深度伪造技术的数字内容认证技术规范的第一版,包括实现指南、考虑因素、用户体验指南以及关于程序目标和基本原理的完整细节。

C2PA 称:「C2PA 规范将为平台提供一种方法,以定义与每种类型的资产(如图像、视频、音频或文档)相关的信息,以及这些信息如何呈现和存储,以及如何识别篡改证据。作为一个开放标准,它被设计用于任何软件、设备或在线平台,以及监管机构和政府机构建立数字来源标准。」

在理想状况下,未来视觉内容的生产、传播与消费可能是这样的链条:制造视频和照片生产工具的公司——包括手机和相机制造商——需要在一开始就纳入 C2PA 身份验证标准。用户需要主动将内容凭证包含在他们制作的视觉效果中。主流出版商和社交媒体公司需要先找到这些凭证,然后才在其平台上显示图像。观众在信任图像或视频之前,可能要先查看一个带有下拉菜单的小图标。

目前,C2PA 联盟的成员已经扩展到包括索尼、佳能、尼康、松下、加拿大广播公司、德国新闻社、纽约时报等等在内的 52 家科技公司、媒体以及其他机构。

从应用层面看,2022 年 10 月,Adobe宣布与徕卡和尼康建立合作关系,这将使这两家相机公司在两款相机中实施符合 C2PA 标准和 CAI 标准的图像证明技术:徕卡 M11 和尼康 Z9,该技术将允许摄影师在相机拍摄时安全地附上照片的来源信息,包括每张照片的拍摄时间、地点和方式。

Adobe 还推出了内容凭据 (Beta)功能,这是 Adobe Photoshop 中一项正在开发的功能,凭借此功能,创作者可向导出的图像中添加其归因详细信息。启用后,内容凭据会收集编辑、活动和制作者姓名等详细信息,然后在创作者导出其最终内容时将这些信息作为防篡改归因和历史数据(称为内容凭据)附加到图像。不过,目前该功能只提供英语、德语、法语和日语版本。

C2PA 联盟中,尤为值得一提的是Truepic 公司,该公司是 C2PA 联盟的创始成员,相比 Adobe 这样的巨头,Truepic 是一家位于美国加州的创业公司,但是 Adobe 的内容凭据功能有一部分就是 Truepic 提供技术支持的。

通过捕获、签名和密封任何照片或视频中的元数据,Truepic 的技术可以创建防篡改数字指纹,并可以在整个网络上进行跟踪。这一流程也被称为「镜对镜」(glass-to-glass)系统,在该系统中拍摄、存储和传输的图片和视频会向观看者发出关于内容已被修改的提醒,无论这些修改是在何时何地进入一则影像从镜头到屏幕的过程中的。

首先,Truepic 的安全相机技术可捕捉、标记和密封每张照片或视频中的关键细节,例如日期、时间、位置和捕捉到的真实像素。

随后,Truepic 对图像实施符合 C2PA 标准的签名并密封。

然后,Truepic 将可以通过 SDK 将数据集成到任何网站或数字服务中,让关注可以查看任何媒体文件的来源和历史记录。

2023 年 3 月底,Truepic 和微软宣布发起「普罗维登斯计划「(Project Providence),利用上述技术和标准帮助记录和保护乌克兰的文化遗产。

2023 年 4 月初,Truepic 和荷兰公司 Revel.ai 合作创造并发布了一段深度伪造的视频:人工智能专家尼娜·希克(Nina Schick)在视频中发出「真实与虚构之间的界限正在变得模糊」的警告。

然而,这并非她本人。视频以一条字幕结尾:「这个深度伪造作品是由 Revel.ai 在尼娜·希克的同意下创建的,并由 Truepic 加密签名」。

这两家公司将这一视频描述为「第一个数字透明的深度伪造」(first digitally transparent deepfake),视频右上角有一个带有 i 标志的水印,表明它是计算机生成的,数据被加密密封在文件中,如果篡改图像,就会破坏数字签名,并在使用可信软件时阻止该证书显示。

除了 Truepic 以外,位于伦敦的机构eyeWitness to Atrocities也开发了类似的系统。作为系统核心的应用有两个功能。首先,当安装有该应用的手机拍摄照片或视频时,它会记录下事件发生的时间和地点,而这些时间和地点是由 GPS 卫星、附近的手机基站和 Wi-Fi 网络等难以否认的「电子证人」报告的。这被称为元数据的受控捕获,它比从手机上收集这类元数据更可靠,因为手机时间和位置的设置是可以更改的。第二,该应用读取图像的整个数字序列(用 0 和 1 呈现),并使用标准数学公式计算出该图像独有的由字母和数字组成的数值,即哈希值。

然后,使用者将图片或视频发动到 eyeWitness 的服务器,eyeWitness 会创建一个受信任的监管链,此链表明原始信息未以任何方式更改。

随后,eyeWitness 收到的所有信息都将由律师,他们对这些视觉证据进行标记、分类和处理,以满足调查人员的需求。

C2PA 项目联合创始人兼主席安德鲁·詹克斯(Andrew Jenks)认为,身份验证标准应该被视为一项重要的数字素养工作,其最接近的类似应用是如今被广泛采用的保证网页安全的 SSL 证书。

网站 SSL 证书是一种遵守 SSL 协议的服务器数字证书,由受信任的根证书颁发机构颁发。SSL 证书采用 SSL 协议进行通信,SSL 证书部署到服务器后,服务器端的访问将启用 HTTPS 协议(超文本传输安全协议),网站将会通过 HTTPS 加密协议来传输数据,可帮助服务器端和客户端之间建立加密链接,从而保证数据传输的安全。

如果某个网站受 SSL 证书保护,其相应的 URL 中会显示 HTTPS。单击浏览器地址栏的挂锁图标,即可查看证书详细信息,包括颁发机构和网站所有者的公司名称。

「我们必须训练用户寻找你今天在每个浏览器中上看到的挂锁图标,」詹克斯说,「那是一个非常困难的问题,花了很长时间,但这与我们今天面临的媒体素养问题完全相同。」

1.工具很重要,但更重要的是常识和逻辑。

2.没有任何工具是完美的,每个搜索引擎都有其优点和缺点,核查员可以使用 InVid 插件,尝试多种工具,确保找到更准确的图片源头。

3.搜寻到相同的图片并非一定就是最终的答案,也不一定能确定图片的真伪。若要确定图片中所展现的原始事件,必须更加谨慎地检查搜索结果,反复比对不同搜索结果对图片的描述;检查图片的拍摄时间和地点;分析包含图片的网页的发布者身份,判断其是媒体、政府机构,还是普通网民,以评估其可信度等。综合考虑搜索结果、影像细节和信源可信度等要素,进行交叉验证,才可能揭示事件的真相。总之,必须全方位分析才能确认原始事件的来龙去脉。

4.仅仅因为反向搜索引擎得到的结果都是同一张图片,并不一定代表该图片是真实且未被修改的。因为,即使一张图片被广泛传播,它也可能会被进行过后期修改,反向搜索结果也可能是其修改后的版本而非原始版本。举个例子,如果某个用户修改了他所拍摄的照片 A 并将其改成了图片 B,然后只上传了经过修改后的图片 B,那么反向搜索引擎将无法搜索到原始的照片 A。因此,需要注意的是,反向搜索引擎仅仅是一种帮助我们找到类似图片的工具,需要进行进一步的验证和核实才能确定图片的真实性和完整性。

5.有时候对原始图片进行某些修改可以更容易地找到最佳结果。

例如,有些人会发布一张照片并声称它是原始图片,但实际上只是对现有照片进行了翻转。在这种情况下,通过对照片进行翻转并进行搜索,可能会找到更准确的搜索结果。

6.留意图片上不起眼地方的水印,有时会提供图片原始来源的线索。

7,搜索结果有时会受到算法的影响,因此出现在前几页或出现多次的信息并不一定代表可信度高或图片的源头,因此需要更耐心地翻查搜索结果。

Fotoforensics是一个检测图片是否被修改过的免费网络工具。

ELA 是其主要特殊功能,ELA 是 Error Level Analysis 的缩写,表示错误级别分析,它通过在图像上显示错误级别来帮助我们检测图像是否经过 处理。

数字图像修改过的地方以及对比度较高的边界,往往 ELA 值较高,即表现为比较醒目的白色;而大面积的同色或者背景,往往表现为暗沉的黑色。

JPEG%的意思是图片质量比,显示上次保存时的图像质量。 每修改一次质量都会下降,一般来说也可证明图片被软件修改过。

元数据显示有关该图片的可用信息,例如创建时间、修改时间以及用于拍摄该照片的相机。

需要注意的是,使用 Fotoforensics 需要专业的影像知识,一般仅作为参考证据之一,而不宜作为主要的或者唯一的证据;还需要利用图片反向搜索工具等方法,寻找图片的来源,作为最终判断的依据。

VerEXIF可以用来查看照片的 EXIF 资料,也可以用来删除照片的 EXIF。

EXIF 是可交换图像文件的缩写,它是一种使用 JPEG 压缩在数码摄影图像文件中存储交换信息的标准格式。几乎所有新的数码相机都使用 EXIF 注释,在图像上存储信息,例如快门速度、曝光补偿、光圈值、使用的测光系统、是否使用闪光灯、ISO 编号、拍摄图像的日期和时间、白平衡,使 用的辅助镜头和分辨率等。有些图像甚至可能存储 GPS 信息,可以查看图像的拍摄地点。

注意:EXIF 资料是可以修改、编辑和删除的,因此只应作为核查参考。

而且,不是所有互联网上的照片都有 EXIF 信息,有些人在将其个人影像上传到网站之前,会先移除 EXIF 档案,例如其 GPS 位置。很多社交网络平台也会移除 EXIF 数据。

用于识别不同旗帜的大型数据库,可以按照不同的维度检索。

LICENSE PLATES OF THE WORLD

Plates Mania

提供全球各国和地区的车牌样式资料,按大洲和国家分类。如果不确定图片是在哪个国家/地区拍摄的,图片上的车牌可能是线索之一。

比如,2022 年 1 月初,中文网络流传一则视频,几名武装分子乘坐三轮车,在街头伏击扫射一辆白色轿车,镜头一转,白色轿车内出现孩子和女性惨死的镜头。有关文字称视频内容是「阿富汗,女人开车,被塔利班全车射杀」。

在视频的后半部分画面中,可以比较清晰地看到受害者的车牌样式和号码「LEH 15 6840」及位于号码下的「PUNJAB」字样。

在搜索引擎中检索「PUNJAB」,可以发现这一般是指是跨越印度和巴基斯坦的旁遮普地区。在上述车牌资料库查询,可以发现视频中的车牌样式是巴基斯坦的。这样可以确认视频不是发生在阿富汗。(参考阅读:阿富汗女性开车遭塔利班全车射杀?

高速公路标志数据库,按照国家分类。当图片或视频没有其他线索的时候,这些信息可以成为一个核查的入口参考。

Elmo – 免费好用的 AI 浏览器助理工具,提升网页效率的 Chrome 扩展

By: Anonymous
8 May 2024 at 15:17

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

Elmo 是一个免费的 Chrome 扩展,主要功能是利用 AI 技术快速建立摘要、观点和总结,当用户在浏览网站、 文件或 YouTube 时只要点击 Elmo 就会对当前内容进行摘要和重点整理,同时显示于的侧边栏,最大程度提升阅读上的速度和效率。它同时也是一个「可互动性」AI ,还能够对内容提问、指定关键词深入探索或洞察,非常强大。

Elmo is your AI companion to create summaries, insights and extended knowledge.

Elmo 背后使用的大型语言模型〔LLM〕API 是由 Lepton AI 提供,从 Chrome 程序商店后就能使用,不需要额外注册、也不会用到 / 账户,不仅免费、而且也支持多国语言,更重要的是能整合 PDF、Google 文件,就不用再手动将文件上传到 AI 服务。

另一个我觉得很好用的是 Elmo 兼具翻译功能,如果遇到英文、日文或其他语言,也能将摘要、重点、作者观点等输出为中文或指定语言,默认值是依照用户浏览器的主要语言而定〔也能手动选择〕,对于要阅读外文网站或文件来说 Elmo 是很好的 AI 助理哦!

Elmo is your AI web copilot to create summaries, insights and extended knowledge.

从 Elmo 官网会看到 Chrome 应用程序商店页面链接,进入后点击右上角「获取」将它下载到浏览器,不过当前在 Arc 浏览器还无法使用,如果是使用 Arc 浏览器就会显示 Not available for Arc 信息。

安装到浏览器后记得将 Elmo 固定于右上角,要启动 AI 功能时可以使用快捷键

或点击 Elmo 闪电图标。

使用方法很简单,在浏览网页时点一下 Elmo 右上角的按钮后会出现侧边栏,利用 AI 将网页内容进行总结、摘要和重点整理,默认情况下生成的内容会以用户浏览器的主要语言为主,这部分非常方便,不用手动输入提示词。

往下滑动后还会生成各种可能的相关问题,点击就能让 AI 继续帮你解答,Elmo 侧边栏最下方还能输入要询问的问题或输入 / 〔斜线〕选择操作指令。

要询问相关问题以外的内容也可以,Elmo 回答还蛮精确,排列方式很好阅读。

Elmo 设置选项里能够调整「偏好语言」,默认是使用浏览器语言,其他还有像「保持侧边栏进入」或设置快捷键功能,我觉得维持侧边栏打开很好用,否则在切换至其他分页后 Elmo 侧边栏就会自动关闭。

试着在英文网页点击 Elmo 就会在侧边栏显示总结、摘要和观点,直接翻译为中文。

还能使用中文进行提问,有助于用户更深入了解相关信息。

当遇到专有名词时选取后会出现选项,点击「Insight」可以对指定关键词生成更多说明〔包含相关网页链接〕。

在浏览时 Elmo 就很方便,不用从头到尾逐字阅读,只要生成总结、摘要后就能知道新闻大致内容。

Elmo 还能整合 PDF、Google 文件和 YouTube 视频,这个功能真的很好用,不过在遇到 YouTube 视频没有字幕时可能会出现不正确或幻觉问题。

DuckDuckGo AI Chat – 无需注册免费体验 GPT-3.5、Claude 3

By: Anonymous
3 May 2024 at 14:06

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

近期 DuckDuckGo 推出新产品「AI Chat」,用户在没有注册、登入下就能使用 GPT-3.5 和 Anthropic 的 Claude 聊天模型,对话内容不会被用来训练 模型,也不会储存任何聊天记录,想临时使用一下 AI 聊天就很推荐,而且具有中文界面。

目前 DuckDuckGo AI Chat 自带两种 AI 模型:OpenAI 的 GPT-3.5 Turbo、Anthropic 的 Claude 3 Haiku,用户可以在服务内自由切换不同模型,以获取不同的回答结果。

因为这项服务不会储存聊天记录,输入的内容也不会被用来训练 AI 模型,因此无法储存用户的内容,在每次进入新对话前都会清除对话,但也能够确保用户在使用 AI 对话时获得最高的保护。

DuckDuckGo. Privacy, Simplified.

进入 DuckDuckGo AI Chat 后会有简单的特色介绍,点击中间「开始使用」就会进入下一步。

接着选择要使用的 AI 模型,有 GPT-3.5 Turbo 和 Claude 3 Haiku 可用〔我在写这篇文章时是 Claude 1.2 Instant,看得出来在很短时间 AI Chat 就获得提升〕,选好模型后会有一个隐私权政策和使用条款,点击下方同意后就会进入聊天功能。

DuckDuckGo AI Chat 操作界面和一般对话 AI 类似,进入后会有欢迎信息,可以点击提示、带入各种默认的内容开始使用,或是从下方输入对话信息,目前 AI Chat 只支持文字,还无法上传或文件。

AI Chat 使用的模型都支持多国语言,如果使用中文输入的话也会得到中文回复。

因为不会记录对话、没有登入功能,对话内容就不会像 、Microsoft Copilot 等服务可以保留或在不同对话切换,要进入新的对话时点击聊天功能左侧「清除对话」按钮就会将对话清除、开始新的聊天室。

从左上角「设置」选择不同 AI 聊天模型,有 OpenAI GPT-3.5 和 Anthropic Claude 3 Haiku 可用。

整体来说,DuckDuckGo AI Chat 确实是很方便的工具,因为它最大程度保护用户的隐私和性,也整合多种不同的 AI 聊天模型,有点像「Poe 网页版」的感觉。

在 Windows 平台开启 Netflix 4K + Dolby Vision + Dobly Atoms 支持

By: Anonymous
26 April 2024 at 19:11

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

Netflix 4K 播放的必要条件:

一、显示器

至少支持 4K 60Hz 的显示器或电视机,且显示器上至少有 HDMI2.0 及以上接口、DP1.3 及以上接口或者雷电 3 及以上接口。

二、线材

至少支持 HDMI2.0/2.0a 或至少支持 DP1.4的传输线。现在推荐直接买HDMI2.1或者DP2.0的传输线。

三、独立显卡

如果想要在上使用独立显卡观看 Netflix 4K ,需要开启 Edge 浏览器的硬件加速设置(默认开启),关闭硬件加速之后浏览器渲染网页和播放视频都将使用

CPU

而不是独立显卡,的分辨率也会一直保持在 720P。

NVIDIA:需要至少 GeForce GTX 1050或更高版本显卡、3GB 或更高的显存和387.96更新的驱动程序

AMD:由于 AMD 对 DRM 防盗版机制的跟进非常缓慢,目前仅旗下Polaris系列显卡(例如RX470/480/570/580/590),或者Navi系列显卡(例如RX5500/5600/5700)支持 Netflix 4K,Vega系列所有显卡因为不支持Microsoft Playready3.0 DRM,所以全部不支持 Netflix 4K;对于支持的显卡,需要Adrenalin 2019 Edition 19.8.1或更新的驱动程序。

四、核心显卡

独立显卡已经达标可忽略此项。

Intel:虽然 Netflix 官网写的是需要至少Kaby Lake第 7 代或更新的酷睿 CPU。据我实测,带有UHD610的奔腾甚至赛扬这类低端处理器也能外接显示器看 4K,所以推测只要是比HD630出的晚的核显(即 2018 年或之后出的核显)应该都支持 Netflix 4K。AMD:带有核显的所有 AMD Ryzen CPU 都支持。

五、Windows 系统版本

NVIDIA 核显或独显:Windows10 1709 或更新系统版本(包含 Windows11)。

AMD 核显或独显:Windows10 1809 或更新系统版本(包含 Windows11)。

六、观看

使用 Windows 10/Windows 11 微软商店中的 Netflix App 或 Microsoft Edge 浏览器。 各浏览器支持的最高分辨率:

查看分辨率方法:

全屏时可能无法触发快捷键,需要退出全屏。

很遗憾,我的联想笔记本被 Netflix 认为不支持 4K。使用 Edge/Netflix App 播放时,一开始的最高分辨率为 1920*1080,播放数分钟后会切换到 2560*1440,但是始终无法达到 3840*2160

但是硬件应该是支持的,因此可以尝试在 Edge 浏览器上强制开启。

插件下载:

Netflix-4K-DDPlus https://github.com/lkmvip/netflix-4K-DDplus

插件 解压: 解压后文件夹 Edge 在 edge://extensions/ 中开启开发者模式:

开发者模式 导入: 成功导入 Edge 浏览器使用开发者模式导入的插件会导致 Edge 在启动时提示「处于开发者模式下的插件」,可以选择 「14 天内不再提醒」 或其他方法永久禁用此提示。

应用商店链接:

来自设备制造商的 HEVC 视频扩展 https://apps.microsoft.com/detail/9n4wgh0z6vhq?hl=zh-cn&gl=cn

HEVC 扩展 如果按钮为「打开」则表示已安装,可跳过此步骤,下同。 如果无法安装,可到:

Microsoft Store – Generation Project (v1.2.3) [by @rgadguard & mkuba50] https://store.rg-adguard.net/

输入应用商店链接,选择后缀为.appxbundle的文件下载安装。

应用商店链接:

Dolby Vision(杜比视界) https://apps.microsoft.com/store/detail/dolby-vision/9MVMZ93N61T9

Dolby Vision

应用商店链接:

Dolby Access(杜比全景声) https://apps.microsoft.com/store/detail/dolby-access/9N0866FS04W8

Dolby Access 耳机杜比全景声 在任务栏右键点击右下角的音量-空间音效,选择Dobly Atmos。杜比全景声尽量戴耳机使用,体验沉浸感。 Dolby Atmos

Netflix 自制片(封面左上角带有 N 字的)都支持 4K,例如:

尸战朝鲜 https://www.netflix.com/title/81312457

如果有此标识则以成功启用双杜比: 双杜比 播放时按上述快捷键查看分辨率: 调试信息 如有上述参数则为成功。

各分辨率网速要求:

可在 Fast.com 测试网速: Fast.com 2.1Gbps 当然,看 4K 并不需要这么快 XD。

在 更改流媒体套餐 处查看当前套餐: 各级别套餐和限制 需要高级套餐才能观看 Netflix 4K。 如果支持 4K,还需要在 账户-播放设置 中设置「每个屏幕的使用情况」为「高」或「自动」(默认): 设置每个屏幕的数据使用情况

Fast Stable Diffusion XL – 免费使用 Google Cloud TPU v5e 快速生成 AI 高清图片

By: Anonymous
25 April 2024 at 17:06

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

Stable Diffusion XL〔简称 SDXL〕是一个高清、文字转模型,使用的是 StabilityAI 技术,但很多人可能不清楚这些专业名词或术语,只想知道「要使用一段描述提示词来建立想要的图片」,最快的方法是直接使用在线,就能在输入提示词后建立图片,还能设置图片风格、高度宽度尺寸。

接下来要推荐「Fast Stable Diffusion XL」是 建立于 Hugging Face 平台的示例模型,主要是展示自家 Google Cloud TPU v5e 运用在 SDXL 模型的效能,TPU 是经过最佳化调整的特制 加速器,对各种 AI 实例提供最好的速度效能。当然,用户也能运用 Fast Stable Diffusion XL on TPU v5e 工具生成 1024×1024 尺寸图片,几乎没有使用限制。

通过 Fast Stable Diffusion XL 输入要生成图片的提示词〔描述〕,在几秒钟内生成四张预览图,也能随时调整图片风格、negative prompts〔专门用来修复一些奇怪的图片〕或是强度指标。

Discover amazing ML apps made by the community

进入 Fast Stable Diffusion XL 在 Hugging Face 示范模型后,直接从上方字段输入 Prompt 也就是图片的提示词〔描述〕,点击「Generate」就能在几秒钟快速生成四张预览图片。

如果没有灵感,SDXL 页面下方也有一些示例描述词可快速带入,或是使用以下服务上传图片生成:

从示例模型可以感受到图片生成速度飞快,只要不用十秒时间就能生成四张预览图。

下方有进阶设置选项可预先指定要生成的图片样式,包括、摄影、日本卡通、漫画、数位艺术、像素艺术、奇幻艺术、霓虹庞克和 3D 模型,必要时还能输入 negative prompts〔负提示词〕或调整强度。

试着换了一个风格、重新生成图片,SDXL 很快就给出四张新的预览图,看得出来和之前的图片样式完全不同路线,比较可惜的是 SDXL 生成的图片都是 1024×1024 正方形,若需要长方形或不同尺寸的图片就要自己裁切、调整。

点击图片后会看到更大张的预览图,按下右上角小小的「Download」按钮就能、保存图片。

❌
❌