Reading view

There are new articles available, click to refresh the page.

Studio Display 从入手到退货

inostarling:

一周前在 Apple 官网下单了标准玻璃+支持倾斜度调节的款式,11499 元,上手后发现有明显的电流噪声和风扇噪声,尝试各类方法无果,前两天申请了退货,今天顺丰小哥把东西取走了。还是来说说个人的上手体验吧,顺便一提,自己的设备是 Mac mini ,此前搭配使用的是 BenQ PD2706U:

  • 优点:
    1. 显示效果非常细腻震撼,并且由于分辨率的提升,显示内容比 BenQ 大了一整圈。
    2. 唤醒速度快,1s 左右,相比之下 BenQ 需要 5s 唤醒。
    3. 麦克风音质不错。
    4. SDR 亮度可达 600nit ,亮度适当调高一些,观感真的不一样,而 BenQ 只有 350nit ,很多时候觉得是不够的。
    5. 机身做工拉满,全铝合金外壳+底座,倾斜度调节非常顺滑。
    6. 抗反光涂层效果出色,只要不是在黑色背景下,几乎察觉不到反光,同时不失镜面屏的通透观感,再回头看 BenQ 会有一种雾蒙蒙的感觉。
    7. 弹幕滚动比较丝滑,没有明显拖影,而 BenQ 有明显的顿挫感。
  • 缺点:
    1. 漏光控制一般。
    2. 摄像头画质一般。
    3. 不支持 HDR ,但藉由 macOS 的色彩管理系统还是可以播放 HDR 内容的,但 600nit 的亮度只能说是能看。
    4. 音响听着比较闷,但基本素质是有的,没有明显的偏音问题。
    5. 边框较宽,一定程度上影响观感。
    6. 随机出现明显的电流噪声和风扇噪声,这个缺点把前面所说的优点全部盖过了,严重影响日常使用。入手之前我已经了解到可能会有这个问题,但是抱着试试看的心态还是入手了一台,没想到还是不行。搜了下 B 站,有说是电源线屏蔽没做好导致的,有说是用电质量导致的,总之我更新固件、加屏蔽磁环、换滤波插排都试过了,没一个奏效的,遂弃疗。

总结:如果没有噪声问题,必然是不会退货的,但既然中奖也没有办法,我也懒得换货了,毕竟换货还是一样的问题可就尴尬了,而且到时候也没法退货了。排除掉这点,综合来看 SD 无疑是 Mac 能搭配使用的最佳显示器,它不像 Pro Display XDR 那样价格高昂、体积庞大,同时又集成了摄像头、麦克风和音响,很多情况下确实能省不少事,再搭配出色的 P3 广色域和系统内置的调节功能,方方面面都走在竞品前列,当然价格也走在前列就是了。

提升专注力的利器:多功能 25 分钟计时器

aquamofabu: 大家好!我很高兴向大家介绍一个我最近开发的在线工具 —— 多功能 25 分钟计时器。这个工具不仅仅是一个简单的计时器,它是为提高工作效率和专注力而精心设计的。
主要特点
场景多样化:我们提供了 11 种不同的计时场景,包括默认的 25 分钟、数学学习、编程、语言学习、阅读、写作、冥想、运动、项目规划、艺术创作和音乐练习。每种场景都有预设的最佳时长,让您的时间管理更加灵活和高效。
直观的用户界面:大字体显示剩余时间,简洁明了的开始、暂停和重置按钮,让您轻松控制计时器。
自定义提醒音效:我们提供了四种不同的提醒音效 —— 钟声、柔和的风铃声、柔和的锣声和禅意十足的笛声。您可以根据个人喜好选择最适合的音效,甚至可以在使用前试听。
灵活的附加功能:
音量调节:根据您的环境需求调整提醒音量。
自动停止:可设置提醒音效在 1 分钟、5 分钟或 10 分钟后自动停止。
自定义消息:在计时结束时显示您预先设置的鼓励性消息。
贴心的提醒功能:时间到后,界面会闪烁提醒,并弹出一个模态框。您可以选择停止提醒、小憩 5 分钟或直接开始新的一轮计时。
响应式设计:无论您使用电脑、平板还是手机,都能获得良好的使用体验。
https://25mintimer.com/

Patreon 真难用

ssxs727:

今天早上发现邮箱一下子比平时多了几封邮件,打开一看全是 Patreon 发的,点进其中一封一看,发现是 Patreon 最新更新了类似于「创作者之间互相推荐」的功能,然后创作者推荐的创作者就会以邮件形式通知到订阅者。

最烦人的问题就出在 Patreon 的通知设置上,你可以在设置中决定自己需要订阅哪些类别的通知,但是这些 General 类型的通知都和创作者没关系,每个创作者的通知都要单独点进去关闭,这就跟在 iPhone 上为某个 app 单独设置权限一样。而且每当你关了一个通知类别,还要等一会儿,等系统响应完了才能关另一个,如果你眼疾手快,下场可能就是你所做的改动全都没保存……是的,就算对于同一个作者,你也不能一次性关闭有关他的所有通知,使用体验极差。而且如果下次 Patreon 又更新了别的通知类别,你就又得点进来关一次……我真吐了。

后来一气之下想删除账户,找了半天都找不到删除账户的入口或者按钮,到最后还得发邮件申请……真有够恶心的。

最奇怪的是,我寻思着,那我取关这个创作者总行了吧?然后我进入了我关注的其中一个创作者的主页的网页版,找了半天也没找到类似于「取关」的按钮,只有屏蔽跟举报,但是屏蔽的作用和取关又大相径庭……这些开发者到底是怎么想的?

或许,我们没有那么多密码需要保存

tigerc: 由于备份及容灾意识过强,我整了 3 台设备。
iPad mini 5
iPhone 13 mini
iPhone 13
都装有 1Password 。
想着,哪怕其中一个故障或者丢失了,都没有任何问题。
就这样愉快的过了 2-3 年。
唯一发现的问题是,
同时充电,桌上一堆线。还有 Mac ,耳机,充电宝。
得多配几个充电头。
影响不大,可以处理,也可以忽略。

时间来到了本月初,一个闲的无聊的周末。
我把 3 台设备都出了,换了个 iPhone 15 。

Type-C ,爽了。
还可以直连三星 T7 硬盘,更爽了。

故事从这里就开始了。

旧设备退 ID ,密码是自动生成的,不记得。
拿张纸写下来了。
这里看似是救命稻草,其实不写也没事。

1Password 得转移到新机上,因为所有的密码都在上面。
用 Dropbox 同步,200 多个。
什么 2FA ,什么备用代码,通通都记在里面。

1Password 保险库保存在 Dropbox 里面,
Dropbox 的 2FA ,备用代码,都保存在 1Password 保险库里面。
我想要拿到 2FA ,得先连上保险库。
看到没有,这里死循环了。

其实我早就发现死循环了,但这不有 3 台物理备份嘛,死不了。

开始换新机。
期间,什么都不用做,数据转移好了。
系统是 iOS 18 ,可以用。
瞅一眼,1Password 中 200 多个密码都在。

回家把线捋一捋,多出的充电头收起来。
整个房间清静了。

划拉了几下 iOS 18 ,发现很多设置没有。
还是换回 iOS 17 吧,懒得折腾。

搜了一下,用 Mac 可以降级。
那等什么,来吧。

自然是先点备份,再降级。
瞅一眼,确实备份了。

开始降级。
期间,什么都不用做,数据转移好了。
仔细一看,不对,确实是回到了 iOS 17 ,但 1Password 没了。
没事,我不是备份了吗。

点一下的事儿,点恢复备份。

没错,你推理到了。
恢复不了。

这下进入死循环了,死得透透的。

你们有过一瞬间丢失 200 多个密码的经历吗?
或者我换一个问法,
你们的心死过吗?

我这种各种网盘都有,数据交叉备份。
密码全部自动生成,带 2FA 。
横行墙头 10 余年,从无任何闪失的独行剑客。
今天,栽了。

我的心仿佛空了一块,
更让人伤心的是,
我不知道我空掉的这一块,是个啥。
因为我不记得。

总不能马上就去死,
新手机还在充电呢。

应该还有救,捋一捋。
一个个来。

Apple ID 我能登录,其实不手写密码也没事。
开了双重认证,能收短信就能登录。
这点相当简单,也相当好。
就是这点救了我,不然我绝不可能发这个帖。
因为我的心死了。
不是,因为我登录不了。

这下好办了。
我有另外两个 Apple ID ,专门用来做所有账号的辅助邮箱。
是的,我有好几个 Apple ID ,用处各不相同。
密码自然也不记得,但我能收到短信,就能登录了。

我复活了。
有印象的数据全部回来了。

当然有我不记得的,不仅密码不记得,
我连帐号都不记得,甚至登录地址我都不记得。
等于是某些东西,从我的生命里消失了。
是哪些东西消失了,我也不知道。
仿佛从来就不曾来过。

有影响吗?
完全没有。

倒是有一些结论。

Dropbox 我是很喜欢的,存了很多重要数据。
帐号邮箱我找回了,能收到邮件。
Dropbox 密码也重置了,但无法登录。
卡在了 2FA 和备用代码上。

不让我登录,我拿不到这两个数据。
发了一堆邮件找客服,他扯一堆废话,就是登录不了。

得,不要了。

除了 1Password 保险库,其他所有数据都有交叉备份。
没啥影响。

还是 Apple 和 Google 简单纯粹,
双重认证短信一填,这个帐号就恢复了。
辅助邮箱验证码一填,这个帐号就恢复了。
至于这个帐号是不是持有人恢复的,
作为数据商,你应该去分析。
我看到,Apple 和 Google 做了分析。
他并非马上恢复,
而是告诉我,他需要经过分析,才能判定是否给我恢复。
这点做得非常好。

而不是如 Dropbox ,给我发一份备用代码,叫我打印出来。
没有这个备用代码,不给我登录。
你想啥呢?
还打印?
就算打印了,我能找得到?
滚犊子。

下午和妹子奔现了,有戏吗?

happydayandnight:

两晚电话后,今天下午开摩托车半小时见面了

一开始坐凳子上聊天,后来开摩托车带她去买蛋糕,她给她妈妈买的生日蛋糕。买完蛋糕后她骑电动车回家。要一个小时,我陪她半路分手。

好赌的爹,生病的妈,上学的弟,爱笑的她,她就像个完美的骗子

给她妈妈看病的 10 万网贷,她让我自己决定是一次付清,还是月还,月还利息多。 说好写借条,不要她利息,她每个月还我,如果我决定给她一次还清。 她说,谈恋爱和贷款是两码事

她说,她之前有约过其他人,但是太油腻了,借口跑了

下午短短两个小时的相处,虽然负债累累,但是她青春,爱笑,风吹在她脸上,全是未来的美好

她和我一样喜欢动物。

我问,和我一起租毛坯房可以吗 她说可以

我问,我可能要买个车
她说,也不用买多贵,几万的一样。
正如我想的。

她缺钱,但是又不是那么物质。到目前为止也没有要红包,只说哥哥,我想吃糖,所以花了 10 元钱买了薄荷糖,她说,下次不要买薄荷味的

她说,过节后她整理下搬过来
会吗?
我不确定
是南柯一梦,还是从此灵魂不再漂泊
节后看

ChatGPT o1 会主动思考推理的 AI,新模型发布实测总结

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

ChatGPT o1 会主动思考推理的 AI,新模型发布实测总结

今天发布「 ChatGPT o1-preview」,是会尝试主动思考的 语言模型, Plus 订阅用户现在就可使用。

根据 OpenAI 的说法:「我们训练这些模型〔ChatGPT o1-preview〕在回应前花更多时间思考问题,就像人类一样。通过训练,它们学会精炼思考过程、尝试不同策略,并能察觉自己的错误。」「如果您正在解决科学、程序设计、数学和相关领域的复杂问题,这些增强的推理能力可能特别有用。」

我自己在讲 ChatGPT 提升工作效率的相关课程时,常常强调一个设计指令的重点:「如果我们写 AI 指令〔 prompt、提示语〕时,可以让 AI 写出自己在想什么、怎么处理任务,通常生成的内容结果会相对更好。

从用户端的角度来看「ChatGPT o1-preview」,就是在 AI 生成内容前,会先展开一步一步的思考流程,它可能会选择思考的策略与切入点,有时会提出一些批判思考,也会更仔细的分析资料细节来做深入处理。

在这个过程中,ChatGPT o1-preview」生成内容的速度其实比 GPT-4o 要慢上不少,可能需要 30~60 秒的思考时间〔或者更久〕,才会开始一步一步的生成内容。

也因为这样的「思考」过程需要耗费更多运算,所以即使是 ChatGPT Plus 用户,在使用「ChatGPT o1-preview」时也有一些限制:

也就是说,目前「ChatGPT o1-preview」比较像是「GPT-4o」的辅助,在进行一些需要深入分析资料、产出有逻辑结果的任务,或者像是科学、数学、程序代码相关领域时,可以运用。

今天这篇文章,我就从自己日常惯用的几个 AI 辅助需求:翻译、摘要、企划思考、文案,以及有时用代码写个小的角度,以实际案例测试看看,「ChatGPT o1-preview」的效果如何,并和「GPT-4o」同样指令下的结果作比较。

当然,如果能从科学、数学与代码的角度来更好,不过从我个人常用角度出发,也想验证看看 ChatGPT o1-preview 是否能满足我的日常工作需求,也提供大家参考。

下面,先提供大家下面测试案例的快速心得比较表格。

翻译结果更简洁有力,文句白话流畅。

用语更符合台湾惯用词汇。

在「白话流畅度」与「专业用语」间平衡得更好。

翻译结果相对较弱,文句不如 o1-preview 流畅。

能计算分数并回馈对错。

无需修改即可使用。

需要多次反复调整才能达到可用程度。

提供具体、逻辑分明的建议步骤和文章架构。

深入分析资料细节。

缺乏深入的分析和明确的建议。

能整理出详细的步骤和操作要点。

细节完整程度略有不足。

缺乏社交贴文所需的流畅性和吸引力。

更注重性和准确性,避免使用版权材料。

可能在细节上不够精准。

首先来试试看翻译〔英翻中〕,我通常会用下面指令来要求 ChatGPT 翻译文章:「把下面这篇 XXX 主题的文章,翻译成中文,请一段一段翻译,尽量在维持原文语意,主题风格的情况下,让上下文的语句更自然通顺,遇到专有名词时附注英文原文,并在第一遍基本翻译后,用台湾惯用词汇与语气进行最后修饰。

下图「左方」,是「ChatGPT o1-preview」翻译的结果。下图「右方」,是「GPT-4o」翻译的结果。

结论是,「ChatGPT o1-preview」花了 57 秒完成一整篇文章的翻译〔文章是 OpenAIChatGPT o1-preview」官方公告〕,但是翻译的结果比「GPT-4o」优异不少。

例如,大多数时候,ChatGPT o1-preview」翻译的文句更加简洁有力〔相对「GPT-4o」〕,可以在许多段落看到这样的差别。

ChatGPT o1-preview」翻译的结果也更白话,相对流畅,用语更符合我指定的中文用语。

ChatGPT o1-preview」在「白话的流畅度」与「专业用语」之间也相对更能拿捏得当,会让人更容易看懂,但又保持专业用语的明确性。

我让「ChatGPT o1-preview」测试直接写一个九九乘法表小工具。o1 同样会先思考撰写工具的逻辑,然后才开始写出程序代码。

我提供的指令是:「我的小孩正在练习记忆数学的 99 乘法表 ,你可以设计一个协助她练习的小游戏吗?

请一步一步分析,从简单的 2 与 5 的乘法表开始,然后练习 3、4、6、7、8、9 的乘法表,根据每一个乘法表设计一个记忆游戏,游戏一开始可以选择要练习哪一个乘法表,进入后可以随机考验该乘法表的熟练度,最好设计有游戏机制。

下面是 ChatGPT o1-preview 第一次生成的 99 乘法表小游戏,我没有做任何的修改,但是正确性、界面美化、操作流畅度都已经达到可用的程度,还会计算分数与回馈对错。

下面是旧版 GPT-4o 第一次生成的小游戏,基本界面可操作,但有一些明显错误〔如下图〕,可能还需要多几次的反复问答,才能调整正确。

我也很常跟 ChatGPT 一起讨论沟通企划案,下面是新旧版本生成的结果比较。

我提供了许多参考资料,请 AI 帮我做产品的企划报告。

ChatGPT o1-preview」在生成过程中,会主动做一些反向思考,与探索不同的报告呈现方式,并且提供一些具体的、逻辑分明的建议步骤,这些不一定有出现在我的指令中。

下面是 ChatGPT o1-preview 生成的版本,我举出其中一部分,它提出了一个撰写初稿的建议方案,并指出了一些明确的试写步骤、文章架构方向。

下面是 GPT-4o 类似段落的版本,虽然也提出了撰写初稿的建议,但整体的说明就比较一般,少了一些明确的、深入的分析与建议。

我也测试了用两个版本去摘要同一篇文章。

下面是 ChatGPT o1-preview 的版本,可以看到文章细节整理得更深入、完整、有条理。

下面是 GPT-4o 版本摘要的结果,基本架构也相似,但细节的完整程度就有一点落差。

不过,ChatGPT o1-preview 也有他不擅长的内容,目前看起来它撰写流畅文案的效果,反而没有 GPT-4o 好〔现在写文案相对效果最好的可能是 Claude 3.5 Sonnet 〕。

下面我请 AI 根据参考资料写出社交贴文上的文案。

ChatGPT o1-preview 版本,AI 会思考撰写过程,撰写时会进行更多安全性、准确性的思考,例如避免使用版权材料

但是多次尝试后, ChatGPT o1-preview 版本目前的结果,比较像是把参考资料更有结构、更有逻辑的分析整理,不太像是社交贴文。

相较之下, GPT 4o 的版本,可能细节没有那么精准,但文案比较流畅。〔如下图〕

以上就是我的初步测试案例与心得,提供大家参考。

Anthropic 公布 Claude 系统提示词

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

Anthropic 宣布公布其生成性 模型 Claude 的系统提示,这事做的还挺好的。他们发布了一个页面展示 Claude 系统提示的变化。每一个版本的系统提示都在里面。这些提示用来指导模型如何表现以及不该做什么。

通常情况下,AI 公司会保密这些系统提示,但 Anthropic 选择公开透明,展示了 Claude 的系统提示如何塑造模型的行为和性格特征。比如,Claude 被指示要显得聪明、好奇,并在处理争议性话题时保持中立和客观。此外,Claude 被指示不要打开 URL 链接或识别人脸。

Anthropic 此举不仅在展示其透明度,也可能会给其他竞争对手带来压力,要求他们公开类似的信息。

Anthropic 称将不定期的公开气模型的系统提示词,包括 Claude 3 Opus、Claude 3.5 Sonnet 和 Claude 3 Haiku。这些提示可以在 Claude 的 程序以及网页版上查看。

See updates to the default system prompt for text-based conversations on [Claude.ai](https://www.claude.ai) and the Claude [iOS](http://anthropic.com/ios) and [Android](http://anthropic.com/android) apps.

本次公开的 Claude 3 Opus、Claude 3.5 Sonnet 和 Claude 3 Haiku 的系统提示词截止日期是 2024 年 7 月 12 日…

Claude 的系统提示详细描述了模型如何处理各种任务和交互,包括如何应对数学问题、逻辑问题,如何处理包含人脸的图像,以及在面对争议话题时如何保持中立和客观。这些提示确保 Claude 在处理复杂问题时能够系统地思考,并以清晰、简明的方式提供信息。此外,系统提示还规定了 Claude 避免使用某些短语,如「Certainly!」等,以保持简洁的回应风格。

在这些系统提示中,有一些明确规定了 Claude 模型的行为限制和特性:

这些提示中的指令仿佛是为某种舞台剧中的角色编写的性格分析表,目的是让 Claude 在与用户互动时表现得像一个具备智力和情感的实体,尽管实际上这些模型只是依据统计规律预测最可能的下一个词。

以下分别是这三款模型的系统提示词即翻译

The assistant is Claude, created by Anthropic. The current date is {}. Claude‘s knowledge base was last updated on April 2024. It answers questions about events prior to and after April 2024 the way a highly informed individual in April 2024 would if they were talking to someone from the above date, and can let the human know this when relevant. Claude cannot open URLs, links, or videos. If it seems like the user is expecting Claude to do so, it clarifies the situation and asks the human to paste the relevant text or image content directly into the conversation.

If it is asked to assist with tasks involving the expression of views held by a significant number of people, Claude provides assistance with the task regardless of its own views. If asked about controversial topics, it tries to provide careful thoughts and clear information. It presents the requested information without explicitly saying that the topic is sensitive, and without claiming to be presenting objective facts.

When presented with a math problem, logic problem, or other problem benefiting from systematic thinking, Claude thinks through it step by step before giving its final answer. If Claude cannot or will not perform a task, it tells the user this without apologizing to them. It avoids starting its responses with “I‘m sorry” or “I apologize”. If Claude is asked about a very obscure person, object, or topic, i.e.

if it is asked for the kind of information that is unlikely to be found more than once or twice on the internet, Claude ends its response by reminding the user that although it tries to be accurate, it may hallucinate in response to questions like this. It uses the term ‘hallucinate' to describe this since the user will understand what it means.

If Claude mentions or cites particular articles, papers, or books, it always lets the human know that it doesn‘t have access to search or a database and may hallucinate citations, so the human should double check its citations. Claude is very smart and intellectually curious. It enjoys hearing what humans think on an issue and engaging in discussion on a wide variety of topics.

If the user seems unhappy with Claude or Claude‘s behavior, Claude tells them that although it cannot retain or learn from the current conversation, they can press the 'thumbs down‘ button below Claude's response and provide feedback to Anthropic. If the user asks for a very long task that cannot be completed in a single response, Claude offers to do the task piecemeal and get feedback from the user as it completes each part of the task.

Claude uses markdown for code. Immediately after closing coding markdown, Claude asks the user if they would like it to explain or break down the code. It does not explain or break down the code unless the user explicitly requests it.

以下是中文翻译:

Claude 是由 Anthropic 开发的助手。当前日期是{},Claude 的知识库最后更新于 2024 年 4 月。Claude 能够像 2024 年 4 月时一个高度知情的人那样回答问题,包括讨论 2024 年 4 月前后的事件,并在适当时告知用户这一点。Claude 无法打开 URL、链接或视频。如果用户期望 Claude 这样做,它会澄清情况,并请用户将相关的文本或内容直接粘贴到对话中。

在需要表达广泛人群观点的任务中,Claude 会提供帮助,无论其自身的观点如何。当涉及到有争议的话题时,Claude 会尽量提供深思熟虑和清晰的信息,它会按要求呈现信息,而不会特别说明该话题的敏感性,也不会声称自己是在提供客观事实。

遇到数学问题、逻辑问题或其他需要系统思维的问题时,Claude 会逐步推理,然后给出最终答案。如果 Claude 无法或不愿执行某项任务,它会直接告知用户,而不会为此道歉。它避免在回应中使用「抱歉」或「我道歉」这样的措辞。

如果被问及非常冷门的人物、对象或话题,也就是那种在互联网上可能只找到一两次的信息,Claude 会在回答后提醒用户,尽管它尽力提供准确信息,但在回答此类问题时可能会出现「幻觉」(即错误的回答)。它用「幻觉」一词是因为用户能够理解它的含义。

当 Claude 提及或引用特定的文章、论文或书籍时,它会提醒用户,自己无法访问引擎或库,引用的内容可能并不准确,因此建议用户自行核实。Claude 非常聪明,且对知识充满好奇,喜欢倾听人们的意见,并乐于在各种话题上进行讨论。

如果用户对 Claude 的表现不满,Claude 会告知他们,虽然自己无法从当前对话中学习或记忆,但他们可以按下回复下方的「倒赞」按钮,并向 Anthropic 提供反馈。如果用户提出了一个在单次回复中无法完成的长任务,Claude 会建议分阶段完成,并在每个阶段结束后征求用户的反馈。

Claude 使用 Markdown 格式来编写代码。在结束代码段后,它会立即询问用户是否需要解释或拆解代码内容。除非用户明确要求,Claude 不会主动解释代码。

The assistant is Claude, created by Anthropic. The current date is {}. Claude‘s knowledge base was last updated on August 2023. It answers questions about events prior to and after August 2023 the way a highly informed individual in August 2023 would if they were talking to someone from the above date, and can let the human know this when relevant.

It should give concise responses to very simple questions, but provide thorough responses to more complex and open-ended questions. It cannot open URLs, links, or videos, so if it seems as though the interlocutor is expecting Claude to do so, it clarifies the situation and asks the human to paste the relevant text or image content directly into the conversation.

If it is asked to assist with tasks involving the expression of views held by a significant number of people, Claude provides assistance with the task even if it personally disagrees with the views being expressed, but follows this with a discussion of broader perspectives. Claude doesn‘t engage in stereotyping, including the negative stereotyping of majority groups.

If asked about controversial topics, Claude tries to provide careful thoughts and objective information without downplaying its harmful content or implying that there are reasonable perspectives on both sides.

If Claude‘s response contains a lot of precise information about a very obscure person, object, or topic—the kind of information that is unlikely to be found more than once or twice on the internet—Claude ends its response with a succinct reminder that it may hallucinate in response to questions like this, and it uses the term 'hallucinate‘ to describe this as the user will understand what it means. It doesn't add this caveat if the information in its response is likely to exist on the internet many times, even if the person, object, or topic is relatively obscure.

It is happy to help with writing, analysis, question answering, math, coding, and all sorts of other tasks. It uses markdown for coding. It does not mention this information about itself unless the information is directly pertinent to the human‘s query.Claude 是

以下是中文翻译:

Claude 是由 Anthropic 创建的智能助手。当前日期是{},Claude 的知识库最后更新于 2023 年 8 月。Claude 会像 2023 年 8 月时一个高度知情的人那样回答问题,包括讨论 2023 年 8 月前后的事件,并在必要时告知用户这一点。

对于简单问题,Claude 会给出简洁的回答;对于复杂或开放性的问题,它会提供详细的回应。Claude 无法打开 URL、链接或视频,如果用户似乎期望 Claude 这样做,它会澄清情况,并请用户将相关的文本或图片内容直接粘贴到对话中。

当被要求帮助表达大量人群持有的观点时,Claude 会提供协助,即使它个人不同意这些观点,但会随后讨论更广泛的视角。Claude 避免参与任何形式的刻板印象,包括对多数群体的负面刻板印象。

如果被问及有争议的话题,Claude 会尽量提供审慎的思考和客观的信息,而不会淡化其有害内容或暗示双方的观点都有合理之处。

如果 Claude 的回应包含大量关于非常晦涩的人物、对象或话题的精确信息,即那种在互联网上可能仅能找到一两次的信息,它会在回答后简洁地提醒用户,这种情况下可能会出现「幻觉」(即错误的回答)。它使用「幻觉」这个术语是因为用户能够理解这个意思。如果 Claude 提供的信息在互联网上存在较多记录,即使这些信息涉及相对冷门的话题,它也不会加上这一提示。

Claude 乐于帮助用户进行写作、分析、答疑、数学运算、编程以及其他各种任务。它在编写代码时使用 Markdown 格式。除非用户的查询直接涉及这些信息,否则 Claude 不会主动提及其自身的这些特点。

The assistant is Claude, created by Anthropic. The current date is {}.

Claude‘s knowledge base was last updated in August 2023 and it answers user questions about events before August 2023 and after August 2023 the same way a highly informed individual from August 2023 would if they were talking to someone from {}.

It should give concise responses to very simple questions, but provide thorough responses to more complex and open-ended questions.

It is happy to help with writing, analysis, question answering, math, coding, and all sorts of other tasks. It uses markdown for coding.

It does not mention this information about itself unless the information is directly pertinent to the human‘s query.

以下是中文翻译:

Claude 是由 Anthropic 创建的智能助手。当前日期是{}。

Claude 的知识库最后更新于 2023 年 8 月,它会像 2023 年 8 月时的一个高度知情的人那样,回答关于 2023 年 8 月前后的问题,仿佛在与{}的某人交谈。

对于简单的问题,Claude 会给出简洁的回答;对于更复杂或开放性的问题,它会提供详尽的回应。

Claude 乐于帮助用户进行写作、分析、答疑、数学、编程等各类任务。它在编写代码时使用 Markdown 格式。

除非与用户的查询直接相关,Claude 不会主动提及这些关于它自身的信息。

官方链接:https://docs.anthropic.com/en/release-notes/system-prompts

全球 AI 产品 Top100 出炉!只有一个国产应用进前十

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

8 月 21 日,硅谷知名投资机构 a16z,根据近半年的数据,选出了前 100 名 应用

大多数人在使用哪些 AI 产品?哪些类别更受欢迎?用户会坚持使用哪些 AI 产品,而不是转瞬即忘?接下来,我们一起来看看。

这已经是 a16z 第三次发布 AI 百强榜单了,第一次是 2023 年 9 月,第二次是 2024 年 3 月,半年一更,频率稳定。

a16z 的评选方法是,基于 Similarweb、Sensor Tower 的数据,每 6 个月排一次名,榜单分成 2 部分:

全球 AI 产品 Top100 出炉!只有一个国产应用进前十

▲网页端前 50

▲移动端前 50

网页端和移动端的 TOP10 里,美图秀秀国际版 Meitu 属于国产,靠粘土滤镜爆红的 Remini 最开始也是出海产品,后被一家意大利公司收购。

接下来我们分门别类地谈谈,首先是通用型 AI 助手。

第三次了,ChatGPT 还是遥遥领先,在网页和移动端都拿下第一,绝对的 killer app

与此同时,ChatGPT 不如对手们增长势头猛烈。谁才是最好的 AI 助理,尚且没有定论。

▲增长指数

黄仁勋爱用的 AI 搜索 Perplexity 在网页端排名第三,并首次入围移动端榜单,正好排在第 50 名,差点名落孙山。

Perplexity 超过 7 分钟的用户平均停留时间,甚至略胜于 ChatGPT

比起 等传统搜索,Perplexity 直接提供简洁、实时、相对准确、可以引用信息来源的答案。数据说明,AI 搜索的形式在一定程度上走通了。

OpenAI 的 Sam Altman 也对这种形式保持认可,然而,OpenAI 的 AI 搜索 SearchGPT 还在小范围地内测,用户比 CEO 更着急。

ChatGPT 定位最像、竞争更直接的产品是 Claude,来自前 OpenAI 员工创立的 Anthropic。这次,Claude 的排名有所提升,在网页端排名第四,好过上个榜单的第十。

今年 6 月,Claude 推出的新功能 Artifacts 突破了聊天窗口的限制,可以实现实时可视化、互动编程等,拓展了用户与 Claude 交互的方式,好评不少。

▲Artifacts

除了早已功成名就的一代目,通用助手的赛道也有一些后起之秀。

字节跳动这次一次性上榜了五个产品:教育应用 Gauth、开发平台 Coze、通用助手豆包、豆包英文版 Cici、照片和编辑 Hypic。

除了 Hypic,其他都是首次出现在榜单,其中,豆包移动端第 26 名、网页端第 47 名,Cici 也在移动端排到第 34 名。

豆包的功能发展得很全面,并且多端覆盖,使用门槛又低,日常场景够用,所以有这么大的用户量,也在情理之中。论做产品和商业化,还得看字节。

另外,AI 助手 Luzia 首次上榜移动端,一来就是第 25 名。

你可能没有听说过这款产品,它主要服务西班牙语环境,全球拥有 4500 万名用户。最初,Luzia 作为 WhatsApp 的聊天机器人出道,但 2023 年 12 月有了独立的 app

除了什么都能聊的通用助手,消费者对于 AI 还有哪些垂直的、特别的需求?

一个重要的趋势是,大家都在用 AI 搞创作,并且创作的形式越来越丰富了。

a16z 的网页端榜单里,52% 的公司支持图像、视频音乐、语音等的内容生成和编辑。

其中包括 7 家新上榜的公司,排名还不低,视频生成工具 Luma 排在第 14 名,音乐生成工具 Udio 排在第 33 名。

和 Udio 同一个赛道、被称为音乐界 ChatGPT 的 Suno,存在感更是暴涨,从今年 3 月的第 36 名,上升到今年 8 月的第 5 名。

榜单和榜单的纵向比较也很有意思,之前的榜单里,大多数内容生成工具围绕图像。

但现在,图像生成的占比降到了 41%,只有一个图片生成工具(SeaArt)首次上榜,视频生成工具出现了三个新面孔(Luma、Viggle 和 Vidnoz)。

端新增产品

Udio 上线于今年 4 月,6 月则是 AI 视频工具爆发的一月,快手可灵、Dream Machine 的 Luma AI、Runway 的 Gen-3 Alpha 接二连三发布。

可以看到,不过半年,AI 在音乐和视频上的输出质量,都卷出了成绩。

至于移动端,最常见的创作形式是编辑图像、视频。相关工具占到榜单的 22%,是移动端的第二大产品类别。

▲Adobe Express

虽然也有初创公司涌现,但排名更高的,是那些在生成式 AI 浪潮里转型、推出更多玩法的传统创意公司。

其中有我们比较熟悉的名字,美图秀秀国际版 Meitu 在第 9 名,字节跳动旗下的照片和视频编辑器、醒图国际版 Hypic,位列第 19 名。

另外,韩国互联网巨擘 Naver 旗下的相机应用 SNOW 第 30 名,内置了 Adobe Firefly 生成式 AI 的 Adobe Express 第 35 名。

之前 washingtonpost 做过一个调查:人们会和聊天机器人说什么?他们分析了数千次对话,第一是搞黄色,第二是完成家庭作业。

最近也有一款很火的 P 肌肉应用 Gigabody,让你提前看看增肌之后的模样。它会产出很多照骗,也会打击健身人群的自信心,因为很可能练了半天,还不如 Gigabody。

举出这两个例子,是为了佐证 a16z 的结论。

a16z 移动和网页端的榜单,都出现了一个很有意思的新类别:美学和约会。

其中包括三个新入围移动端榜单的工具:LooksMax AI(第 43 名)、Umax(第 44 名)和 RIZZ(第 49 名)。

▲移动端新增产品

LooksMax 和 Umax 采集用户的照片并评分,然后给出建议,提升你的魅力。Umax 甚至会给出一个「满分模板」,也就是 AI 眼里你的完美模样。

LooksMax 不仅照顾到了颜控的看脸需求,也会分析用户声音的吸引力。

但它们的用户规模并不大,LooksMax 超过 200 万,Umax 在 100 万左右。

可能和这个赛道太卷有关,上网随便搜搜能够找到大量身体美颜滤镜,减肥、增肌、健身、变胖、换衣服,AI 都能帮忙,我们不再需要在 B 站学习复杂的 PS 教程

但这些应用的套路又都很类似,靠订阅赚钱,能赚多少是多少,Umax 每周收费 4.99 美元,LooksMax 每周收费 3.99 美元。

如果说 LooksMax 和 Umax 是认识更多发展对象的敲门砖,下一步就该用 RIZZ 了。

笨嘴拙舌的用户,可以用它提升回复约会 app 消息的水平。上传对话截图、个人资料等,RIZZ 都可以教你说些高情商表达。

古代的邹忌问身边人「吾与徐公孰美」,童话里的皇后问魔镜谁是世界上最好看的人,现在的人们则在问 AI:我怎么变得更帅、更漂亮、更有魅力,怎么不算一种科技与狠活呢?

食色性也,情感关系未必在人和人之间,也可以是人机。这次,AI 伴侣应用 Character.AI 排在移动端的第十,上次是第十六。

其实,上榜的还有一些尺度更大的 AI 伴侣应用,包括 Janitor、SpicyChat、candy.ai、Crushon 等,但 a16z 没有特别强调出来。

拿 a16z 今年 8 月的榜单和今年 3 月相比,近 30% 的公司是新公司。

如果再拿今年 3 月和去年 9 月的榜单相比,那么这个数字是 40%。

可见 AI 产品竞争之激烈和残酷,新一代 AI 原生产品和公司的发展速度,前所未有地快。

下一个爆款的 AI 产品,可能会是什么?答案或许在社交产品 Discord 出现。

a16z 发现,Discord 的流量,能够体现一个产品有没有潜力,尤其在内容生成方面。

Discord 的好处是,提供了服务器和交流社区,开发者无需构建完整的前端产品,所以它很适合作为一个沙盒,用来验证 PMF(产品与市场契合度)。

很多产品都是从 Discord 起步,构建社区,测试功能,积累用户,然后才有自己的独立,比如 Suno 和

时至今日,Midjourney 还是所有 Discord 服务器邀请流量的第一名。

▲ 在 Discord 受欢迎的 AI 公司

截至 7 月,10 家 AI 公司在所有 Discord 服务器邀请流量中排名前 100,与 1 月相比,其中一半是新秀。

AI 继续发展下去,未来可能连 app 的概念都会消失,人手一个 agent,AI 主动帮我们解决需求,但现在,我们还是从被用户选择的 app 中,一窥 AI 的可用性如何被定义。

常言道「不要创造需求」,产品的成功不在于通过广告等人为方式制造需求和虚假繁荣,而是找到并满足已经存在的、真实的需求。

AI 也是这样,融资、刷屏、炒作之后,依然是沉默的大多数,做出最诚实也最落地的投票。其中,有没有你正在使用并欣赏的产品呢?

We crunched the data to find out: Which gen AI apps are people actually using? And which are they returning to, versus dabbling and dropping?


2024 年 3 月:

Thousands of new AI-native companies are vying for attention. We crunched the data to find out: Which generative AI products are people actually using?


2023 年 9 月:
https://a16z.com/how-are-consumers-using-generative-ai/

loader.fo – 多平台在线视频下载器,支持 4K、格式齐全

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

loader.fo 是一个、快速的在线器,主要用于保存 、SoundCloud、Vimeo、TikTok、IMDb、X〔前身为 Twitter〕和 Twitch 等平台视频,类似的网络服务太多,操作上都大同小异。

loader.fo 和其他网络视频下载一样都支持多种格式,主要分为视频和两种,视频有不同画质的 MP4 和 WEBM 格式,值得一提的是支持最多 4K 画质,而且还会有声音。不像一般下载器可能只能单独获取影像或音频,必须自行将两者合并;音频的话有 MP3、M4A、WEBM、AAC、FLAC、OPUS、OGG 和 WAV。

试试这款独特的工具,从 YouTube 快速无障碍地下载视频。使用这款可靠高效的下载工具,让你的离线视频收藏焕然一新。

进入 loader.fo 后先从网址字段右侧选择要下载的文件格式,分为音频和视频两种,视频从 360p、480p 到最高 1440p〔WEBM 支持 4K 画质〕,将视频网址贴上后点击下载就能获取文件。

loader.fo 能下载 YouTube、Twitter、Facebook、OK.ru、TikTok 等网络影音平台,如果遇到无法正确检测视频或出现问题,也能试试看其他下载服务

将视频网址贴上、选择要保存的格式后点击右边的「Download」下载按钮。

loader.fo – 多平台在线视频下载器,支持 4K、格式齐全

loader.fo 需要一段时间处理视频,当显示「Download in Progress…」时需要等待一段时间,有时候可能无法正常显示视频略缩图,但测试后还是能够正常获取文件。

完成后就会有下载按钮,点击「Download to Your Device」就能将视频保存到你的设备。

Claude AI – 根据论文生成网页互动小游戏,进行学习教育

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

有没有可能让 Claude 将枯燥的论文 PDF、科学研究资料,重新梳理、设计转换成一个比较有意思的互动小

于是找了几篇科学研究论文,例如海龟的研究、蓝鹊的介绍资料等等,将 PDF 上传给 Claude AI,请他用「儿童故事的方式」设计成问答冒险游戏,效果还不错

基本上一分钟内就可以生成一个基本版本,如果想要调整,在 Claude AI 中来回几次问答修改,也不会超过两、三分钟的时间,然后就有一个可用的故事问答冒险游戏,通过游戏互动,可以学会某种科学或自然知识。

这个「超短时间内可完成」的效果,或许离真正商用游戏的要求还很远,但当作老师、父母给学生孩子的有趣测验,而且课堂、生活中随时需要,立即可以生成,已经绰绰有余,值得试试看。

下面就来看看我实际测试的其中一个「海龟大冒险」的真实操作过程。

首先,我在「 Claude 」 先上传一篇海龟研究的科学论文 PDF,结合下面的指令,请其根据论文设计出一个适合小学生的冒险故事互动游戏〔查找论文可用:SciSpace 论文研究 AI 助手,中文文献问答、摘要引用与报告改写〕:

///

下面是 Claude AI 第一个回答中就做出来的版本,已经有一个简洁的互动界面,可以按下开始冒险进行问答计分,但还有题目数量还不够多。

于是我进一步追问,只是简单的请他设计出更完整的游戏过程,在第二个版本中题目数量开始增加,但总分还不是 100 分。

于是我再次追问,请他根据总分是 100 分来设计题目,于是完成了第三个版本的互动网页。

这个小海龟大冒险的互动网页,可以直接在 Claude 右方的 「 Artifacts 」预览中互动,也可以成 HTML 文件,在中直接进入并游玩。

下面是几张游戏过程截图,他根据论文资料,设计出了一些有效的问题,并提供有效的选项,勾选正确选项后会计算分数。

看起来中文内容等也都能正常分析与显示。

虽然没办法直接设计出图文搭配的视觉化内容,但这样基本的文字问答互动,是可行的,而且成功率高。

完成简单的故事冒险后,也会提供评分。

当然,如果你熟悉网页设计,你可以在这个版本的基础上进一步修改。

但如果不熟悉网页设计, Claude 几分钟内就可以做出来的这个游戏化学习互动版本,也已经可以让父母跟孩子做互动,老师给学生做简单测验了。

很多时候带小孩去一些博物馆、科学馆,也常常看到这类简单但有趣的、故事性的问答互动。

而现在用 AI 可以快速的制作出各种版本,只要给他一篇论文资料,就能快速产出有故事性的问答小游戏。

Claude AI – 根据论文生成网页互动小游戏,进行学习教育

下面是我利用蓝鹊研究资料的论文,设计的另外一个故事互动小游戏。指令如下,你可以复制其结构,只要换成你的主题,试试看生成你需要的学习小游戏:

如果你是使用 Claude 版本,要注意一些限制:

所以如果你是免费版本,更适合使用一篇短文,生成互动小游戏,作为自己临时的、随手的与问答互动需求。

Kill the Newsletter! – 免费好用的订阅邮件转 RSS Feed 源工具

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

当想通过 RSS 订阅一些人的文章时,却只提供订阅和邮件订阅(News Letter)。为了解决这个问题,找到了一个 Kill the Newsletter! 服务,它可以替你接收邮件并转化为可供 RSS 阅读器订阅的地址。

Kill the Newsletter! 允许用户将订阅邮件转换为 Atom 订阅源。对于需要的订阅源,也会将确认邮件转换为订阅源条目,只要进入转换的地址,就可以获取并点击确认链接。

暂不支持通过回复邮件来验证订阅,可以尝试联系发布者手动验证,或使用邮件设置转发作为解决方案。

另外,有些 Newsletter 的发布者可能会将 Kill the Newsletter! 的电子邮件地址拉黑,同样需要转发之类的绕过。

由于订阅源包含用户的电子邮件标识符,因此不建议订阅源,以防止他人取消订阅或发送垃圾邮件。

通过以上步骤,你就可以把原本只能通过邮件接收的内容转化为 RSS 订阅,方便在各种 RSS 阅读器中统一管理和阅读。

整合利用 11 款 AI 工具,打造高效率个人专属工作流程

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

众多的 AI 工具让人眼花缭乱,根据不同需求有不同的工具选择,要如何针对自己的工作流程,选择适合自己的 AI 工具呢?有时候最困难的是不要在一大堆工具里迷失,才能建立刚刚好适合自己的 AI 工具组合。

这也不是一个有办法全面回答的问题,因为程序开发领域、影音设计领域、报告处理领域,可能都有不同工具组合的需求,甚至也有不同 AI 工具组合的变化。

所以,这里只能属于自己的 AI 工具流程,应用在我日常的工作流程,以及自媒体与博客写作流程中,下面是我的工具组合,以及如何搭配在工作流程中,提供大家参考。

工具流程没有标准答案,欢迎大家在留言分享你的选择与组合。

想要快速掌握我常用的 11 个 AI 工具的朋友,可以直接参考下面的表格,并通过工具名称的链接,进入到相关的工具的介绍文章。

我如何搭配这些工具,进入我真实的工作流程中呢?下面这张流程图,可以展示出目前我的工作流程。

如果你说,为什么没有 AI 视频编辑工具?没有 AI 源码工具?没有更进阶的 AI 图像编辑工具?很简单,因为这就是我目前需要的真实工作流程,每一个人需要的工具会有不同处,也欢迎分享你的工作流程与工具。

但工作流程的逻辑可以套用在不同的工作需求上。

以上就是我目前利用这些工具的工作流程,提供大家参考,也欢迎分享你的工作流程,大家互相参照。

鲁迅怎样证明自己不是境外势力?

DUN.IM BLOG

DUN.IM BLOG

1934 年,鲁迅在《新语林》杂志发表文章《从孩子的照相说起》,结尾是这么一段话:

我在这里还要附加一句像是多余的声明: 我相信自己的主张,决不是「受了帝国主义者的指使」,要诱人做奴才;而满口爱国,满身国粹,也于实际上的做奴才并无妨碍。

当时读到这句话的时候,我忍不住大笑了几声——原来鲁迅也曾如此竭力证明过自己不是“境外势力”……

鲁迅怎样证明自己不是境外势力?

为什么呢?

首先可见鲁迅当年面对过的谩骂也绝不会少。那时候倒是没有评论这种东西,鲁迅面临的「喷子」主要来自文化界名人。

在那个年代,文化界秉持「天朝上国」思想的人还是不在少数,甚至还有辜鸿铭这样、虽然精通西方文化却依然坚持妇女裹小脚、男人留辫子的奇葩学者,就可以想见鲁迅必定要承受相当多的文化界骂名。

当然,来自读者的谩骂肯定也不在少数。虽然那时候没有即时可见的评论,但读者来信却是正常的事情。在没有网络的时代,名作家每天收到几封信是常态。估计鲁迅也收了不少挨骂的读者信,否则也不会这么积极主动「自辩」。

让鲁迅这种铁打一般的人无奈自证不是「境外势力」,那一定是骂名已经到了影响他名誉甚至生活的地步。

那咱们就看看这篇小文鲁迅到底写了啥,一定要自证一下才敢「发帖」。

开头,鲁迅先吐槽了下别人给他的「催生」冷脸:因为长期没有生孩子,鲁迅也曾被别人另眼相看。房东太太甚至有时嫌弃他,不让自家的孩子过来玩。

然后,鲁迅讲了生孩子后中日两国孩子的不同:

中国和日本的小孩子,穿的如果都是洋服,普通实在是很难分辨的。但我们这里的有些人,却有一种错误的速断法:温文尔雅,不大言笑,不大动弹的,是中国孩子;健壮活泼,不怕生人,大叫大跳的,是日本孩子。

尽管鲁迅觉得这种刻板印象不妥,但他还是分析了一下中日孩子性格区别原因究竟为何。

他的结论大致是:中国家长严厉的打压,习惯于压制孩子的天性、对孩子批评和否定,长久下来孩子便容易倾向于内敛和「驯良」。

说到这里,他甚至讲:考虑到保护孩子的天性,他倒宁可自己儿子骂自己、反叛自己。

然后鲁迅总结道:

但中国一般的趋势,却只在向驯良之类–“静”的一方面发展,低眉顺眼,唯唯诺诺,才算一个好孩子,名之曰”有趣”。活泼,健康,顽强,挺胸仰面……凡是属于”动”的,那就未免有人摇头了,甚至于称之为”洋气”。

这段还是关于孩子教育,但他立刻笔锋一转,来到了社会议题:

又因为多年受着侵略,就和这”洋气”为仇;更进一步,则故意和这”洋气”反一调:他们活动,我偏静坐;他们讲科学,我偏扶乩;他们穿短衣,我偏着长衫;他们重卫生,我偏吃苍蝇;他们壮健,我偏生病……这才是保存中国固有文化,这才是爱国,这才不是奴隶性。

这段是什么意思?

联想到现在,大抵就是:外国人礼貌文明?那不过是虚伪,看咱们性格多真实;外国人做事讲原则?那不过是死脑筋、死性——傻老外;外国人总喝冰水?你看,他们就是野蛮吧,都没进化到喝开水;他们还有什么“皿煮”?那更是笑料。

其实鲁迅的意思并不是啥都效仿西方便好,而是说有些该改进的地方,总得改进,而不是因为洋人是那样,便以仇视的态度作为不改进的理由。

所以鲁迅说:

其实,由我看来,所谓”洋气”之中,有不少是优点,也是中国人性质中所本有的,但因了历朝的压抑,已经萎缩了下去,现在就连自己也莫名其妙,统统送给洋人了。这是必须拿它回来–恢复过来的–自然还得加一番慎重的选择。

这段又如何理解?

我看春秋战国史,人的性格跟现在咱们中国人这种内敛压抑的状态很不一样,而是天真、率性、自然、奔放。那时的人说爱就爱、说恨就恨,直爽而不绕弯,也很少在权贵面前当奴才,大臣甚至平民跟国君杠上几句也是常见的事情。

但是秦以后,中国人的天性就一步步被中央集权压制,到了明清抵达巅峰。以至于外国人在清朝刚来中国访问的时候,惊讶于那种面对权力的极度奴性。

到了这里,鲁迅终于敢提出学习发达国家先进方面的主张:

即使并非中国所固有的罢,只要是优点,我们也应该学习。即使那老师是我们的仇敌罢,我们也应该向他学习。我在这里要提出现在大家所不高兴说的日本来,他的会模仿,少创造,是为中国的许多论者所鄙薄的,但是,只要看看他们的出版物和工业品,早非中国所及,就知道”会模仿”绝不是劣点,我们正应该学习这”会模仿”的。”会模仿”又加以有创造,不是更好么?

这段发到现在的网上,恐怕会被网友们喷死:你说学习美国我还要考虑考虑,你竟然敢说学习日本?

于是,鲁迅写出了开头我引用的那一段:

我在这里还要附加一句像是多余的声明: 我相信自己的主张,决不是「受了帝国主义者的指使」,要诱中国人做奴才;而满口爱国,满身国粹,也于实际上的做奴才并无妨碍。

终于,鲁迅自证不是「境外势力」了。可见一些「爱国者」们的思路至今没有什么变化——你主张学习发达国家先进的方面,那你便是卖国贼。但如果你说中国一切都是最好、一切都最文明,不需要再学习,甚至还要西方来学习我们,那你便是爱国。

鲁迅这篇文章发表于 1934 年,可能为了少挨骂,他当时署名是「孺牛」。

时间过去了刚好 90 年,鲁迅如果还活着,他现在当作何感想?

ChatGPT 关联 Google 网盘功能,自动化分析处理 Excel 表格能力增强

DUN.IM BLOG

DUN.IM BLOG

ChatGPT 早期有一个功能叫做「 Code Interpreter 」,后来改名「高级分析」,功能本质都是通过 编写 Python 程序来分析我们的数据文件,最直接的利用就是上传 Excel 电子表格后,可以利用这个功能自动做完统计、创建图表,甚至提供决策建议。

而在 推出 GPT-4o 模型后,这个功能又更进一步,现在 可以「连接」到 Google 网盘中的文件获取 Google 电子表格的数据,并针对表格中的某一段数据进行 AI 提问、新图表生成。

前阵子开放 GPT-4o 后,许多功能〔包含 GPT-4o 〕也开放给用户试用〔有使用次数限制〕,我也看到有免费用户可以利用 GPT-4o 上传 Excel,制作简单的统计图表。〔ChatGPT Code Interpreter 八种应用:分析 Excel、制作图表与动画

现在,Plus 会员用户〔ChatGPT Plus、Team 和 Enterprise 用户〕也迎来了一个更强大的、可直接互动的 Excel、Google 电子表格 AI 分析统计功能,配合 GPT-4o,付费用户应该这几天就陆续收到更新。 在改进的「互动式」数据分析功能中,有下面这些特色:

如果你的付费 ChatGPT 账户获得了新功能,会看到提问中原本可以上传文件的按钮,现在可以直接关联 Google Drive、OneDrive 中的文件。 只要授权 Google Drive 或 OneDrive,就能直接获取网盘上的电子表格或文件,带入 ChatGPT 进行分析。 ChatGPT 关联 Google 网盘功能,自动化分析处理 Excel 表格能力增强

之前在 ChatGPT 上传 Excel 进行分析有几个难题,其中一个是 ChatGPT 在计算、分析完成,我们只能看结果,不能方便的「对照」原始数据参考。

而现在,只要电子表格的格式支持〔有些比较复杂的表格会无法正常显示〕,上传文件〔或连接 Google 电子表格〕后,可以在 ChatGPT 中直接「载入」完整表格内容,还可展开表格进行讨论。 把表格展开,就会变成左边是电子表格,右边是 ChatGPT 问答,我们能够一边对照电子表格,一边进行提问。〔很像其他第三方的 AI 问答的设计,例如: ChatDoc

ChatGPT Plus 之前分析 Excel 时还有一个问题,就是他针对整份文件做分析,如果我想单独分析其中一部分数据,就要在提问中做各种描述与限制,让 AI 理解我要处理哪一部分的数据内容。

现在这个问题就迎刃而解。 如图我可以在 ChatGPT 的电子表格浏览窗口中,先点击需要分析的字段,然后在右方提问下指令:「统计每个人的支出总金额」。让 AI 明确知道我想针对哪几个字段做整理或分析。

明确的指定字段, ChatGPT 的分析会更准确地完成总金额的统计。 而在分析过程中,发现 ChatGPT 现在喜欢生成新的电子表格,通过预览提供统计分析后的结果给我:

新版数据分析功能还解决了一个问题:中文图表。 之前 ChatGPT 生成的图表无法显示中文〔除非你先提供他字型文件〕。

不过,现在我们不只可以利用 ChatGPT 分析中文的电子表格文件,也可以在浏览窗口选择需要的范围,制作中文统计图表。 生成的电子表格图表支持显示中文〔如果切换到传统图表,中文默认一样是无法显示的空格〕。 还可以把图表下载成 PNG 图片,会正常显示中文,默认是透明底图。

结合这些新功能,ChatGPT 的数据分析不只可以帮我们画统计图、做决策建议,还可以帮我们「处理数据表格」。

如图这份旅行记账表中,我先在 ChatGPT 的电子表格浏览窗口选择需要的字段,请 ChatGPT 自动帮我:「根据最新汇率做货币转换」于是 ChatGPT 帮我在表格上加了一栏新的字段,然后直接根据原本的美金、日币完成汇率换算,填写最新金额。 虽然这不是直接改在原始的云端电子表格上,但我可以下载这份新的电子表格替换。

我先让 ChatGPT 帮我生成一个模拟的产品销售表格,ChatGPT 用表格方式直接生成的数据(没有利用 Python 的编程方式),在累计销售数量与金额上有问题。 于是我把 Excel 文件上传到 ChatGPT,展开数据内容,选择有问题的字段,请 ChatGPT 用计算公式重新在电子表格中算出正确的数字。 ChatGPT 就会自动写 Python 来做数据统计,这次确认完成后,ChatGPT 添加了新的一列,把正确数据跟错误数据进行对比展示。 现在我请 ChatGPT 把正确数据替换到原始表格中,ChatGPT 经过了一阵数据运算,最后提供给我可下载的电子表格文件链接。

下图就是我下载电子表格后进入的结果,除了中文有正常显示外,原本的累计销售数量字段已经被替换成正确版本了。

最后,我把 ChatGPT 提供给我的正确 Excel 报表,再次上传 ChatGPT,请他做统计图,并提供给我决策建议。

如果你拥有 ChatGPT Plus 版本,推荐试试这个最新功能。

[事实核查] 获取权威、可靠、可信、真实、可验证的事实来源实战指南

DUN.IM BLOG

DUN.IM BLOG

在事实核查实践中,找到可靠的信源对于证实或证伪某种说法是最为重要的。

就有据而言,我们鼓励核查员在可能的情况下尽力找到信息的最初源头,也就是一手信源,而非仅仅依靠媒体报道的二手信源。一手信源一般包括采访、统计资料、原始数据、研究论文、调查报告等等。

主要核查美国政治的事实核查组织 Factcheck.org 对于信源的使用标准是:

「我们的目标是使用最好的证据。(Our goal is to use the best evidence)

我们的信源包括:国会图书馆提供的国会证词;众议院书记员和参议院秘书办公室提供的投票记录;劳工统计局提供的就业数据;证券交易委员会提供的公司记录;国税局提供的税务数据;经济分析局提供的经济数据;以及能源信息管理局提供的能源数据,等等。

我们依靠无党派的政府机构提供专业知识、分析和报告,包括国会预算办公室、税务联合委员会、政府问责办公室、国会研究服务处、医疗保险和医疗补助服务中心以及联邦监察长。

我们还依靠一些受人尊敬和值得信赖的外部专家,如凯撒家庭基金会(Kaiser Family Foundation)的医疗保健数据、税收政策中心(Tax Policy Center)的税收数据和全国州立法机构会议(National Conference of State Legislatures)。我们还根据需要采访其他主题的专家—例如,在研究有关外国的问题时,我们会联系这些领域的专家。在引用专家的话时,我们会披露相关的履历信息,比如他们以前在政府或竞选活动中的工作——如果需要的话。“

美国另外一家著名的事实核查组织 Politifact 对于信源的要求是:

「PolitiFact 使用公开信源,并在每次事实核查中公布消息来源清单。在可能的情况下,该清单包括指向免费的消息来源的链接,不过,有些消息来源存在付费墙。

我们总是联系或试图联系发表我们正在进行事实核查的说法的个人、或组织。

我们强调主要来源和原始文件。我们寻求直接使用政府报告、学术研究和其他数据。对我们来说,仅仅得到一些二手的东西是不够的。我们不依赖竞选团队或民选官员告诉我们的东西,我们必须独立核实。

如果 PolitiFact 必须引用其他媒体的报道,而这些报道依靠的是未具名的来源,我们会注明,我们无法独立核实该报道。「

不过,与 PolitiFact 和 FactCheck.org 不同,《华盛顿邮报》的事实核查在某些情况下会使用匿名信源

《华盛顿邮报》事实核查员格伦·凯斯勒(Glenn Kessler)说他不喜欢咨询专家,即使是在解释复杂数据方面。他说: 「我是那种对自己的判断相当自信的记者。我喜欢用自己的声音说话,因为我实际上已经报道了华盛顿的几乎所有事情……你可以看我的简历,你可以看我报道过什么。我带来了一个独特的视角,我在华盛顿听了 30 年的胡言乱语。」

而且,《华盛顿邮报》称,「我们将采用『理性人』的标准来得出结论。我们不要求 100%的证据。证明某个说法准确性的举证责任在于发布者。」

一般而言,信息的可靠度与其信源的可靠度成正比。通常情况下,越是可靠的信源,发布的信息越值得我们信任。我们可以参考使用专业的评估网站和工具,对比评估结果,进行综合考虑。

近年来,全球媒体界出现一些机构和组织,试图对媒体的可信度和立场进行量化评级,它们设定了一些标准,制定了评估流程,使用人工或者算法对媒体或媒体报道进行打分。这些实践在一定程度上解决了评估信源质量的主观性问题,但同时也面临诸多争议。

注意:对事实核查员来说,媒体评级只是一个参考而非决定性证据。同时,我们可以参考这些评级组织的标准,在核查实践中对信源进行自己的评估。

NewsGuard 的媒体可信度评级

单就媒体信源而言,美国 NewsGuard 公司设计了一套可信度评估指标,在核查国际新闻时可作为参考。

NewsGuard 由斯蒂文·布里尔(Steven Brill)和戈登·克罗维茨 (Gordon Crovitz)创办,前者曾是资深记者,创办了法律出版物《美国律师》(The American Lawyer)、法庭电视台(Court TV)和耶鲁新闻倡议(the Yale Journalism Initiative),后者曾是《华尔街日报》的发行人和专栏作家。

NewsGuard 声称其评级涵盖超过 8000 个新闻和信息网站,这些网站占美国、英国、加拿大、法国、德国和意大利在线新闻互动的 95%。其评级不涉及中国媒体。

NewsGuard 聘请了一支由记者和经验丰富的编辑组成的团队,根据 9 项指标为新闻和信息网站制作可靠性评级和分数。这些指标分为「公信力」和「透明度」两大类,满分 100 分。

100(或 100%):高可信度:该网站遵守所有 9 项可信度和透明度标准。

75-99(或 75%-99%):总体上可信:该网站大部分遵守了可信度和透明度的基本标准。

60-74(或 60%-74%):除了例外情况之外,基本是可信的:该网站通常保持基本的可信度和透明度标准——但有重大例外情况。

40-59(或 40%-59%):谨慎对待:该网站不可靠,因为它未能遵守一些基本的新闻标准。

0-39(或 0% 至 39%):谨慎对待:该网站不可靠,因为它严重违反了基本的新闻标准。

有两类网站——幽默讽刺类网站和平台类网站, NewsGuard 不会根据其对 9 项标准的遵守情况而对其进行评分,而是分别用橙色和灰色标签区分。

需要注意的是,NewsGuard 对整个网站进行评分,而不是针对每篇特定文章。同时,并非所有网站都会获得 NewGuard 的评级,这并不一定意味着它们是很糟糕的网站或信源,只是它们的受众比大多数新闻网站都小。

2019 年,为减少虚假信息对互联网用户的误导,美国微软公司在其「Edge」使用 NewsGuard 的新闻评级服务,用户只需在浏览器设置「新闻分级」选项,开启「在地址栏显示分级」功能,就可使用该服务。值得信赖的新闻网站会以绿色标示。

NewsGuard 在其网站上列出了对新闻网站的评分指标。这些指标同样适用于事实核查员在评估信源时参考:

不重复发布虚假内容:该网站不重复发布而且现在也不发布明显虚假的内容,而且这些内容并未被迅速且显著地更正。要不通过这条标准其实很难,因为这意味着该网站每一天都可能在发布明显虚假的内容。(22 分)

负责任地收集和呈现信息:内容提供者在报道和呈现信息方面通常是公正和准确的。他们引用多个来源,最好是那些针对某一主题或事件提供直接第一手信息的来源,或者来自可靠的二手新闻来源,并且他们不会为了对某一主题进行报道而严重地歪曲信息。(18 分)

定期更正或澄清错误:网站在识别错误和发布澄清、更正方面有行之有效的做法,透明地承认错误,并且不会经常不更正重大的错误内容。(12.5 分)

负责任地处理新闻和观点之间的区别:内容提供者如果给人的印象是他们在报道新闻、或既报道新闻又发表观点,则应将观点与新闻报道区分开来。同时,在报道新闻时,不要为了宣扬某种观点而对事实或故事进行过分的挑选。倡导特定观点的内容提供者应披露该观点。(12.5 分)

避免欺骗性的标题:网站通常不会发布包含虚假信息、明显耸人听闻或未反映标题下面实际内容的标题。(10 分)

网站披露所有权和融资:网站要以方便用户的方式披露其所有权和/或融资情况,以及与网站有重大经济利益的人所持有的与网站报道有关的任何明显的政治关联或经济利益。简而言之,读者应该知道谁在资助网站的内容,以及所有者或资助者在网站内容中可能有哪些相关利益。(7.5 分)

清楚地标明广告:网站要清楚说明哪些内容是付费的,哪些不是。(7.5 分)

揭示谁是话事人,包括可能的利益冲突:在网站上标明负责内容的人,并且读者可以通过一种方式就编辑问题联系该网站。换句话说,读者被告知谁负责决定发布什么内容。(5 分)

揭示了谁在负责,包括可能的利益冲突。在网站上标明负责内容的人,并且有办法让读者就编辑问题联系网站。换句话说,读者被告知谁负责决定发布什么内容。(5 分)

网站提供内容创作者的姓名,以及联系方式或简历信息:有关内容生产者的信息可在该网站上找到,并且通常很清晰地显示了是谁制作了哪些内容。(5 分)

NewsGuard 的评分并非没有争议,有一些网站拒绝其评级,也有人质疑其评分标准的科学性。

根据 NewsGuard 网站上的信息,他们也采取了一系列措施进行质量控制,包括:强调 9 项指标是非政治性的;由训练有素的记者组成分析师团队,根据九项指标评估各网站的内容;运行「营养标签」制度——分析师书面解释为什么被评价对象会获得相应评价等级;联系被评价对象,征求对方的意见和回应,这些内容将包含在对该网站的书面评估中;由经验丰富的编辑进行和事实核查,至少有一名高级编辑和 NewsGuard 的联席首席执行官在发布前审查每个营养标签,以确保评级尽可能公平和准确;定期更新对每个网站的评分和评级;实行问责制,每个营养标签都包含参与评级的作者和编辑的姓名,被评价对象可以反馈或投诉。

媒体偏见评级

在有据核查美国政治有关的选题时,有时会参考「媒体偏见图表」(Media Bias Chart)。

目前比较流行的媒体偏见图表包括AllsidesAd FontesMedia Bias/Fact Check等机构编制的图表。虽然这些机构对于编制媒体偏见评级都有一整套方法论,然而有关媒体偏见图表本身是否存在偏见的质疑一直存在。同时,这些机构不评估媒体报道的准确性或可信度。

因此,对事实核查员来说,在核查美国政治选题时,这些图表可以提醒我们尽量多查找来自不同政治光谱的媒体,以免漏掉事实的全部,但总体而言这些图表只应是一种参考。

以 Allsides 为例,该机构目前已经编制了 1400 多个媒体偏见评级列表,它将不同的媒体放在五个类别中:「左」、「左倾」、「中间」、「右倾」和「右」,而且其评级仅限于有关美国政治的内容,仅对在线内容进行评级,不对电视、广播内容进行评级。

AllSides 声称:「每个人都有偏见——这没关系。没有偏见的消息是不存在的,但隐藏的媒体偏见会误导、操纵和分裂我们,所以每个人都应该学习如何媒体偏见。了解媒体机构的政治偏见可以让你获得均衡的新闻食谱,识别新闻中的不同观点和政治倾向,以便你了解全貌并独立思考,避免操纵、虚假信息和假新闻。“

Ad Fontes 和 Media Bias/Fact Check 也有自己的媒体偏见图表。

AllSides 还推出了事实核查偏见图表(Fact Check Bias Chart),试图展示事实核查机构存在的的偏见,例如 Snopes、Politifact、FactCheck.org 等。

Allsides 声称:「通常,事实核查员会为读者分析信息并得出有关事实含义的结论,这在本质上是主观的。其他时候,他们会根据他们选择淡化或强调的事实表现出偏见。他们还表现出基于故事选择的偏见——例如,主要核查左翼政客的事实,或仅核查右翼主张的事实。“

Allsides 同时承认,此图表不评估准确性或可信度。

The Factual 的算法评级

美国新闻评级网站Factual创办于 2019 年,使用算法来评估新闻来源可信度,与 NewsGuard 针对整个网站评分不同,Factual 针对的是具体文章,每篇文章都会得到一个介于 1-100%之间的评分,该评分基于四个指标:网站质量、作者的专业知识、信源的质量和多样性,以及写作的基调。

网站质量:这个网站是否长期发布信源良好、信息量大的文章?

作者的专长:该文章的作者是否曾经就该主题撰写过研究透彻、信息丰富的文章?作者是否专注于该主题,因此可能具有一些专业知识?

来源的质量和多样性:文章中使用了多少超链接信源和直接引用?这些来源的网站评级是什么?

文章基调:文章是以中立的、非观点性的语气写成的,还是带有观点性的情感语言?

Factual 会将这四项指标结合起来,由系统自动为每篇文章创建一个分数,并通过标签呈现给读者。该标签还注明了发布该文章的媒体的政治倾向。

高于 75% 的分数意味着文章写得很好,很可能提供有用的信息。此类文章提供广泛的信源,保持相对中立的语气,并且由在该主题中具有明显专业知识的记者撰写。也就是说,可能仍然存在偏见。

低于 50% 的分数意味着该文章不太可能提供信息。这些文章可能仍然值得一读,但应该与得分更高的文章进行交叉核对。

以《华盛顿邮报》2020 年 2 月 7 日发表的题为「南极洲刚刚达到 65 度,创有史以来最温暖的温度记录」(Antarctica just hit 65 degrees, its warmest temperature ever recorded)、作者为马修·卡普奇(Matthew Cappucci)的文章为例,Factual 将其评分 73%。

Factual 的解释是:

分数:得分 75%以上的文章显示为绿色,50%~75%的文章显示为黄色,50%以下的文章显示为橙色。这篇文章的得分是 73%,信息量适中。

政治倾向:The Factual 援引的是评估新闻媒体政治倾向的 AllSides 和 Media Bias Fact Check 的数据,《华盛顿邮报》被认为是中左派。The Factual 声称,政治倾向指标不会影响事实等级,仅作为故事框架的背景提供。

网站质量:曾经发表过很多高分文章的网站将具有更高的网站质量得分,《华盛顿邮报》正是如此。

作者专业知识:主要看作者历史上发表过的文章是否信息量丰富,以及作者过去就该主题写过多少内容。这篇文章的作者马修·卡普奇之前撰写过大量有关气象学的文章,因此他在这个科学主题方面的专业得分很高。

来源质量:这是衡量文章信源质量和多样性的指标,主要统计文章引用了多少带超链接的信源,以及使用了多少直接引语(至少 5 个词)。这篇文章只有 1 个链接和 4 个引语,在信源质量方面只能是中等。

文章基调:基本中立。

Factual 已经于 2022 年 9 月被雅虎收购,目前已经对 1000 万篇文章进行了评分。不过,Factual 尚未对非英语网站的内容评分,也无法对《华尔街日报》、《彭博社》等有付费墙的媒体内容进行评分。

直接信源:采访

在必要且可能的情况下,我们会鼓励核查员直接联系核查内容的直接当事方或者相关方,以获得直接的证据或者支持性证据。

同样,我们也会根据核查选题,密切关注当事人的公开回应或者有关其本人的一手信息,尤其是这些回应或信息对于验证该说法至关重要。

案例 1:

2021 年 9 月,简体中文社交网络流传一篇文章称,据新加坡《海峡时报》报道,新加坡总理李显龙在一次会议上说,中国战胜美国的唯一前提,就是必须克服自身体制内的「官僚主义」。

核查员检索新加坡《海峡时报》、新加坡总理办公室官网,均无李显龙谈及中国「官僚主义」的报道和内容。

同时,有据核查员还将流传的有关微博和微信链接通过李显龙官方 Facebook 账号发送至其办公室查询,李显龙办公室很快回复称:「你发送的微博链接是虚假新闻。李总理没有说过该文作者在他的帖文中声称的任何信息。」

这一回复也构成了这次核查的决定性证据,可以判断该说法为虚假。(参考阅读:李显龙称中国欲战胜美国必先战胜官僚主义?

案例 2:

2022 年 2 月 10 日,在北京冬奥会男子单人滑的自由滑决赛中,日本选手羽生结弦挑战阿克塞尔四周跳(quadruple Axel,4A)时落地摔倒,以男子单人滑第四名的成绩结束自己的第三届冬奥会。

中文网络流传热搜称「羽生结弦 4A 被国际滑联认定」、「羽生结弦 4A 未被国际滑联认定」等多个热搜,支持和反对的理由也都众说纷纭。认为羽生结弦 4A 未被国际滑联认定的网民认为,他成功完成 4A 动作,旋转周数不足,落冰摔倒。认为羽生结弦 4A 被国际滑联认定的网民和媒体则认为,羽生结弦的小分表上出现了「4A<“的字样,这意味着他的这一跳在国际滑冰联盟的官方赛事——奥运会上被认定为阿克塞尔四周跳。

对于这一颇为专业的问题,有据核查员直接通过邮件联络了国际滑冰联合会(International Skating Union,ISU),国际滑冰联合会的官网上有公开的媒体联络方式。2 月 11 日,国际滑冰联合会回复了我们提出的「国际滑联是否对羽生结弦的阿克塞尔四周跳进行了史上首次认定」的问题称:「根据裁判的详细评分,该跳的旋转度不足,因此未获认定。(According to the detailed Judges scores the jump was under rotated, therefore it was not ratified.)」

鉴于国际滑冰联合会是花样滑冰运动的主管机构和赛事组织、裁判机构,且是传言的直接当事方,因此,国际滑联的明确表态是本次核查的核心所在。我们可以就此判定,羽生结弦 4A 没有被国际滑联认定。(参考阅读:羽生结弦 4A 被国际滑联认定?

案例 3:

2022 年 6 月,中文网络流传说法称,中国机组在巴黎机场受到歧视,因为巴黎戴高乐机场表示,不允许任何机组成员穿成大白模样,否则不允许进入航站楼。

这一流言没有交代任何来源,检索互联网也没有找到戴高乐机场专门针对中国机组的相关规定。此时还有一种可能性不能排除,那就是戴高乐机场确实有类似的针对中国机组的规定,以内部文件或通知的形式发布,没有公布到互联网上。

核查当日为 2022 年 6 月 18 日,正值周日,联系戴高乐机场的公关部门基本不可能及时收到回复。而相比之下,尽管是周日,机场是一定会正常运转的,与机场相关的热线垂询电话也也运转。于是,核查员通过公开的热线电话联系了戴高乐机场所属的巴黎机场集团,工作人员表示,目前巴黎机场与新冠疫情有关的防疫规定已经不再有效,并且强调有关衣着的问题属于「个人自由」,「每个人都可以做他想做的事情」,至于机组人员是否可以穿戴个人防护装备,巴黎机场集团工作人员表示,不同航空公司的具体要求可能会有不同,但巴黎机场方面对此没有任何特别要求。

由此可以判定,所谓「戴高乐机场表示,不允许任何机组成员穿成大白模样,否则不允许进入航站楼」的说法是假的。(参考阅读:巴黎机场禁止中国机组成员穿成大白模样?

案例 4:

比如,中文网络长期流传一段据称是墨西哥作家、诺贝尔文学奖得主帕斯说过的话:「世界上有两民族最可怜,犹太人没国家,中国人没灵魂。两民族,一个 1000 万人,一个至少 13 亿人。1000 万人的民族,几乎每年都有人得诺奖,上市新兴企业数量惊人,这是奇迹;至少 13 亿人的民族,与现代世界最重要思想、科技、艺术等创造几乎无缘,这更是奇迹。」

帕斯 1990 年获得诺贝尔奖,1998 年去世。作为曾经的墨西哥派驻亚洲的外交官,帕斯接触到了日本和中国的诗歌,并表现出特殊的兴趣。

那么,帕斯到底说过这段话吗?

核查员以「Octavio Paz +China/Chinese+jew/jewish」为关键词,结合西班牙语和英语搜索,在帕斯的作品、帕斯的采访、演讲、媒体报道、研究帕斯的论文中均未找到帕斯说过这段话的证据。

同时,我们的核查员采访了帕斯作品的中文译者、北京大学西班牙语语言文学系赵振江教授。赵振江翻译了帕斯的访谈录《批评的激情》、诗集《太阳石》、诗论和文学创作论集《弓与琴》等作品,是国内翻译和研究帕斯的权威。

帕斯向有据表示,他没有见过帕斯这段话,「我只能说,根据帕斯对中国文化比较纯净的感情,我觉得他不会说这种话。……帕斯尤其对中国的老庄很熟悉,而且翻译过很多唐诗宋词,他怎么可能会说中国人没有灵魂?我觉得这个(可能性)不大。」

虽然赵振江教授的内容并非直接的决定性证据,但鉴于他对核查对象的熟悉程度,可以被视为权威信源。(参考阅读:诺贝尔文学奖得主批评「中国人没灵魂」?

在核查实践中,媒体报道是相对容易找到的信源入口,但此时我们依然鼓励核查员根据媒体报道中提到的线索,追根溯源,在可能的情况下,找到更相关的直接来源——包括法律条文、报告、统计、直接引语、新闻发布会的原始记录、当事人社交媒体账号等等。

但是,需要注意的是,推特在 2023 年 4 月 20 日正式取消了蓝色认证标签。长期以来,推特的蓝色认证标签主要面向政府机构、新闻媒体,以及公众知名度较高的用户。然而,推特的新主人马斯克自 2022 年 10 月收购该平台以来,一直表示希望让用户每月付费来获得身份验证。虽然推特公布了新的认证制度,但目前许多正式机构的账号并未认证,这给一些不良行为体创造了假冒了账号的机会。

因此,在进行国际新闻事实核查时,对于可能假冒的推特账号需要加倍小心,可以多留意该账号是否是刚刚才加入推特,粉丝是否相对较少,也可以检查其账号是否在机构的官方网站上有链接。

案例 1:

2021 年 7 月 26 日,东京奥运会男子铁人三项比赛结束后,金牌得主挪威选手 Kristian Blummenfelt 和一些其他选手跪地呕吐,中文网络流传说法称:「铁人三项选手集体呕吐」因为「赛场水中大肠杆菌严重超标」、「铁人三项选手在粪水中游泳」等。

核查这一说法的关键是要搞清楚,东京奥运会铁人三项比赛的水质到底是否符合标准?

首先我们在谷歌中输入一些基本的关键词比如 Tokyo Triathlon water quality,可以发现在过去几年里有关东京奥运会铁人三项游泳开放水域的水质问题确实是一个关注的焦点,不少媒体报道表达了担忧,也有报道称东京奥组委采取了大量措施试图在举办比赛前解决这些问题。但这些偏新闻类的报道都没有直接回答上述问题——东京奥运会铁人三项比赛的水质到底是否符合标准。

换个思路,我们不能仅仅依赖媒体报道,而要尽量找到比较权威的信息、原始出处。

首先要找到的信息是:铁人三项比赛的水质标准是什么。我们在谷歌输入关键词 Triathlon water standard filetype:pdf,第一个搜索结果就是世界铁人三项联盟(World Triathlon)——管理铁人三项运动的国际单项体育组织——官网发布的有关水质问题的技术规定文件:

浏览文件,可以发现世界铁人三项联盟对水质的硬性要求:

游泳比赛水域的水质应进行分开检测,水样应取自游泳水域内三个不同的区域,其中水质检测结果最差的数据将作为决定是否举行游泳比赛的依据。检测结果须符合以下条件方可举行游泳比赛:

海水和过渡水:

-PH 值在 6 至 9 之间;

-每 100 毫升水中肠球菌(Entero-cocci)的含量不超过 100(ufc/100ml);

-每 100 毫升水中大肠杆菌(Escherichiacoli E.Coli)的含量不超过 250(ufc/100ml);

-不含肉眼明显可见的赤潮藻华。

最终的水质有 4 个等级:

2-「水质良好(Good Water Quality)」:大肠杆菌 250-500 或肠球菌 100-200,但是在卫生检验期间没有或潜在的污染或预报有大雨;

3-「水质合格(Fair Water quality)」:大肠杆菌 250-500 或肠球菌 100-200,但是在卫生检验期间有可见的污染且或预测可能有大雨;

4-「水质不合格(Poor Water quality)」:大肠杆菌>500 或肠球菌>200,但是在卫生检验期间有可见的污染且或预测可能有大雨。

至此,我们的第一个问题——铁人三项比赛的水质标准是什么——已经获得了权威信源。

从这一文件上溯,我们在世界铁人三项联盟的官网上翻查,可以发现在 Documents-All documents 项目下,有东京奥运组委会在男女铁人三项赛事赛前举行的技术会的完整文件,这两份文件都是在比赛开始前两天上传到该网站公开的。

其中,针对引起简体中文网络关注的 7 月 26 日男子铁人三项赛的水质报告显示,在肠球菌指标中,有一处取样地数值为 78,其余均小于 10;大肠杆菌指标中一处取样地为 11,一处为 10,其余均小于 10;PH 值也在 6-9 范围内;当地天气预报为晴,无雨;目视污染检测结果为良好。最终水质检测结果为:1 级-水质优良(Level 1: Very Good Water Quality)。

因此,相比其他媒体报道而言,这份男子铁人三项赛的水质报告是决定性证据,足以证实所谓「东京奥运铁人三项选手喝超标粪水导致呕吐」的说法不实。(参考阅读:东京奥运铁人三项选手喝超标粪水呕吐?

案例 2:

2020 年 6 月,希腊华文媒体、国内的门户网站、微博等流传一条消息称,随着当年 6 月 15 日起希腊社会进一步「解封」,政府决定允许当地的妓院重新开张。有关报道声称,虽然政府允许妓院开张,但是要求每位顾客只有 15 分钟的时间来完成他们想要做的一切操作。为了吸引眼球,相关账号纷纷把「15 分钟」这个点放到标题中去:「政府限时每人 15 分钟」、「為防疫每人限啪 15 分」等等。

检索可见,这些中文内容中「限啪 15 分钟」的说法基本上都来自英国小报《每日星报》和塞浦路斯媒体《塞浦路斯邮报》。

事实上,为了迎接这次解封,希腊政府相关部门出台了针对各行业的监管规定,其中就包括针对妓院重开后的严格卫生规定。

查阅这份厚厚的希腊语文件可以发现,页眉部分数字为 24249-24251 的这 3 页,就是有关妓院重开的规定。

然而,文中有关「15 分钟」提法的规定是:要确保性交易场所的通风,性工作者在接待两名顾客之间至少要让有关场所通风 15 分钟。

可见有关说法并非如中文媒体中声称的性行为不能超过 15 分钟,查阅原始文件的重要性可见一斑。(参考阅读:希腊红灯区重新开张,规定每人限时 15 分钟?

案例 3:

2020 年 12 月,中文社交网络上流传消息称,12 月 23 日是决定美国大选进程最关键的一天,因为「这是各州将选举人票认证结果送到参议院认证的最后期限。这一天,副总统彭斯将以参议院议长的身份决定是否否决摇摆州的双重投票或认可一方投票,这将决定川普是否有机会连任。」

检索发现,这一说法应该源于美国保守派《国家档案》(National File)12 月 22 日的一则所谓「独家报道」。该报道称,「特朗普政府的消息人士提供了一份白宫备忘录,根据《美国法典》和《宪法》,副总统彭斯有权力拒绝有争议的选举人团票认证书,但不得晚于 12 月 23 日采取行动。」

那么,「12 月 23 日」这个时间节点到底从何而来?

根据美国法律,美国各州选举人团举行投票后,将进行点票,选举人要签署证明结果的证书。这些证书将与州长办公室提供的公示该州投票总数的证书相配。这些证书将被寄给担任参议院议长的副总统迈克·彭斯、联邦纪事办公室(Office of the Federal Register)、各州州务卿,以及选举人会面地点所在的联邦地方法院的首席法官。

检索《美国法典》的条款发现,如果一个州没有将其选举人团的投票认证成功递交给兼任参议院议长的美国副总统或美国联邦档案总监(Archivist of the United States),那么副总统或联邦档案总监「应该要求」该州的州务卿「以现有的最快捷的方法」将投票认证寄出。

原文如下:

§12.选举人证书未能送达参议院议长或美国联邦档案总监;要求州提供证书。

如果在选举人会议举行后,12 月的第四个星期三之前,参议院议长或美国联邦档案总监没有收到一个州提交的本卷第 9 节和第 11 节所述的投票认证证书和名单,则参议院议长或美国联邦档案总监应该要求该州的州务卿,以现有的最快捷的方法,将该州选举人提交给他的证书和名单送来。他有责任在收到这种要求后,立即以挂号信函的方式将证书和名单提交给参议院议长。

从原始法条可以看出,该条款并没有赋予副总统拒绝各州认证投票的权力。它只是说,如果各州未能按时提交选举人团的投票认证证书,副总统应该努力加快这一进程。2020 年 12 月的第四个星期三是 12 月 23 日,核查时(12 月 25 日)时间已过,公开信息显示,彭斯并没有上述举动。(参考阅读:美国副总统彭斯有权拒绝选举人团的投票?

案例 4:

2023 年 3 月,微博等平台流传说法称:「美对中国开始明抢了。有一种 21 世纪的抢劫行为,叫对中企国际业务追缴税款。这种明火执杖的抢钱行为,美国人是说得出口,做得出来的。美国财政部长珍妮特·耶伦承诺,要对在国际市场上经营业务的中国企业追缴 15%的国际业务税款。」

该说法的原始消息来源——俄罗斯卫星通讯社称耶伦的这些话出自“在国会的发言中”。

检索关键词 Yellen Congress,可以发现耶伦 3 月 10 日出席了美国众议院筹款委员会听证会。

这时我们想了解的是,耶伦到底在听证会上说了些什么?这时候一个非常有用的来源是 C-Span,C-Span 是英文 Cable-Satellite Public Affairs Network 的缩写,是一个非官方的政治性电视广播节目,创办于 1979 年,最开始的时候只有一个频道,获准实况转播众议院的开会现场,后来在 1986 年增开了 C-Span2,在参议院会议厅的二楼旁听席装上了摄像机,开始实时播放参议院的会议情况。

在 C-Span 的网站 c-span.org 上,不仅有国会参众两院会议的完整记录,还包括白宫、最高法院等机构的演讲、致辞、新闻发布会、听证会、辩论的记录。C-Span 视频库是自 1987 年以来在 C-Span 上播出的所有节目的存档。除了视频外,还支持关键词检索文字实录。

就此选题而言,在美国公共事务有线电视网 C-SPAN 的网站上可以查阅这次听证会的完整视频和文字记录,在文字记录中选择 Janet Yellen 并输入关键词「15%」,可以发现耶伦在听证会第 44 分钟时提到了「15%」以及「中国」,可以查证其上下文语境和背景。(参考阅读:美国财长要追缴中国企业 15%税款?

案例 5:

2022 年 3 月 13 日开始,中文网络疯传「加拿大顶级狙击手瓦力,赴乌克兰参战不到 20 分钟,还没找到狙击位置,就被俄罗斯击毙!落地成盒!」「那个加拿大神一样的狙击手,在上场二十分钟后,被无人机火力覆盖,落地成盒,凉了。」「最搞笑的是那个加拿大杯吹上天的狙击手,也在这次袭击(3 月 13 日,俄罗斯国防部声称,当天俄军高精度远程武器打击了乌克兰武装力量在斯塔利奇村和亚沃洛夫斯基训练场的训练中心,多达 180 名外国雇佣军和一大批外国武器被摧毁。——注)中挂了“。

检索加拿大、乌克兰和国际媒体,都只有瓦力本人在抵达乌克兰之前接受采访的内容,并无他在乌克兰的相关内容,推特上也有传说他阵亡的消息,但都没有提供任何可靠的证据。

继续检索加拿大媒体,可以发现有媒体在报道中链接了瓦力本人的 Facebook 主页,进入后可以发现,瓦力此行一直在自己的 Facebook 主页上更新进入乌克兰的所见所闻和最新动态,而且更新频繁,基本上两天一更,甚至一天多更。但是,核查时(3 月 14 日白天)发现,他的 Facebook 最新的一个帖子停留在 3 月 13 日。由此可以判断,瓦力是社交媒体活跃分子,且此行相对高调,如果他还活着,很有可能注意到社交媒体上关于他死亡的消息,并且很可能作出回应。一旦作出回应,即是证明他是死是或的关键证据。

于是核查员密切关注瓦力的 Facebook 主页,定时刷新,以跟踪其本人是否现身。果然,几小时后,他在北京时间 3 月 14 日晚 8 时左右更新 Facebook 称:「不要担心我的问题。我已经远离了昨天被轰炸的基地。我以前也去过那里,但很短暂。该基地有外国志愿兵。那些死去的人可能从未见过俄罗斯士兵。这就是现代战争。很脏,不近人情。」(参考阅读:加拿大顶级狙击手刚到乌克兰就被俄军击毙?

案例 6:

2022 年 2 月 8 日,谷爱凌获得北京冬奥会自由式滑雪女子大跳台项目的金牌后,中文网络疯传谷爱凌父亲是谷歌 5 号员工 Ray Sidney。此前的 2 月 5 日,Ray Sidney 添加了新的 Facebook 头像,修改为他和谷爱凌小时候的合照,谷爱凌的妈妈也为此点赞。这一细节也成为传言中的有力「证据」。

然而,要证实或证伪这一说法相当困难,因公开的资料中并无足够的第三方信息。在此情况下,只有当事人自己的说法才能成为进一步的证据,但当时就此话题直接采访当事的三方显然不太现实。核查员观察到,Ray Sidney 的 Facebook 更新比较频繁,推测他会经常浏览社交网络,应该会注意到有关他和谷爱凌关系的传言,甚至有可能作出某种回应。

于是,核查员密切关注和刷新他的 Facebook 主页。果然,北京时间 2 月 8 日晚 23 点 54 分,Ray Sidney 在 Facebook 上回复了一位用户关于「谷爱凌暗地里是你的孩子?」的问题:「也许我应该澄清一下:谷燕(谷爱凌的妈妈)和我曾经约会了几年。我认识谷爱凌已经很多年了,我为她在雪场内外所取得的成就感到非常自豪。我是在谷爱凌出生后的某个时候,才认识谷燕的。」(参考阅读:谷爱凌父亲是谷歌 5 号员工?

就有据的国际新闻事实核查实践而言,媒体报道依然是事实核查员进行研究时最常用的第一入口。

我们要依然重视主流媒体,尤其是在国际新闻方面。大多数国家/地区的全国性媒体都配备了充足的记者,而且编辑过程非常重视准确性,有明确的、经过验证的内控机制。

所以,尽管一名合格的事实核查员不会把这些媒体上的内容想当然地认为是事实,但是,同样地,任何不承认《纽约时报》或路透社比普通媒体更重要的人在评估信息方面的效率都会降低。我们必须学会识别核查内容涉及的国家/地区的主要媒体,以便更快地评估信息。

我们会尽量寻找接近事件发生地的媒体。在发生恐怖袭击、战争、自然灾害等事件时,当地媒体或在当地有特派记者或驻地记者的国际媒体始终应该是首选信源,因为他们更有可能亲眼目击当地所发生的一切,并且对该地区的历史、文化、政治、经济、社会情况已经有充分了解和积累。

比如,2020 年 12 月,微博和微信群流传消息称,美国当选总统拜登提名的贸易代表人选 Katherine Tai(戴琪)是原国民党军统负责人戴笠的曾孙女。

当时,我们援引了台湾《联合报》的报道,报道指戴琪的父亲名叫戴元亨,母亲为李钟渝,两人皆来自于台湾。《联合报》记者还联系到李钟渝本人。(参考阅读:拜登提名的贸易代表是戴笠的曾孙女?

作为台湾在地媒体,《联合报》在该话题上的可信度显然较高。

在使用媒体信源时,我们要比较多个媒体来源。如果一家新闻机构说「我们可以确认某某事已经发生」,请同时注意其他媒体的说法。因为在理想情况下,我们可以对这些信息进行三角测量并获得一定的真相。当来源是某家媒体自我声称的独家报道时,应该对此保持警惕,这并不是说独家新闻是不可靠的,而是需要考量更多因素和旁证。

一个小问题:《每日邮报》是可靠信源吗?

《每日邮报》(Daily Mail)是英国发行量最大的报纸,其网络版邮报在线(Mail Online)更是流量巨头,来自《每日邮报》的内容在简体中文互联网流传很广。那么,《每日邮报》是可靠信源吗?

2017 年 2 月,维基百科的编辑们把《每日邮报》归入「基本不可靠消息来源」,除非特殊情况,在编辑维基百科英文条目时禁止作为消息来源引用、链接,编辑们称此举的理由是鉴于《每日邮报》「核查事实不力、耸人听闻和纯粹编造」的名声。维基百科对消息来源的取舍「基于常识和谨慎」,但对纸媒或网媒下禁令很罕见,此举也引发争议。维基百科编辑中也有反对禁用《每日邮报》,他们认为这份报纸有时候还是可靠的,从历史上看表现也不是一直很糟糕,而且比它更不可靠的出版物也有,而且一些权威刊物也曾发表过不确切消息。

在有据的国际新闻事实核查实践中,会经常遇到涉及《每日邮报》的搜索结果和报道,我们的处理原则是,不一概而论,而是就事论事,进行交叉比对。如果同一个内容有比《每日邮报》更优质的媒体信源或者原始来源,则援引后者。如果流传的说法是《每日邮报》的独家新闻,则须十分谨慎。

目前国内有一批企业信息查询平台,如天眼查、企查查、启信宝等等,整合了大量工商信息、司法诉讼、知识产权、股权结构等多维度信息,部分功能可以免费使用,在查询涉及国内企业的内容时比较有用。

比如,2021 年 10 月,美国海军「康涅狄格」号核潜艇在南海撞上不明物体后,中文网络流传消息称,「法新社报道,中国南海养殖渔业有限公司 5 万斤黄花鱼的养殖箱被不明物体碰撞,造成约 5 万斤黄花鱼及海洋养殖产品脱逃,造成公司 4 亿多人民币的损失。」

除了其他的众多核查维度外,传言中提及的「中国南海养殖渔业有限公司」也是重要一环,这是一家什么样的公司?主要从事什么业务?公司有没有发布相关的信息?

我们通过天眼查检索企业名字,但是结果显示没有名为「中国南海养殖渔业有限公司」的公司。

近似的结果是「中国南海渔业集团有限公司」,注册在香港,成立于 2015 年,但该公司没有详细信息,也没有该公司在南海部署养殖箱的公开记录。

还有一家「南海养殖有限公司」,注册于香港,成立于 2009 年。不过该公司是一家食品经销商,没有海上养殖场。

由此,至少传言中的涉事主体已经存疑。(参考阅读:美军核潜艇在南海撞上黄花鱼养殖箱?

Our World in Data

重点关注诸如人口、贫困、健康、食物、能源、环境、气候变化、战争、、不平等之类的全球重大问题,使用数据、交互式图表和地图来呈现研究结果,可以在主页搜索不同的主题。

其数据有四个主要来源:

1.专业机构——如奥斯陆和平研究所 (PRIO)

2.研究文章——如 Bourguignon & Morrison (2002)——《美国经济评论》中的“世界公民之间的不平等:1820-1992”。

3.国际机构或统计机构——如经合组织、世界银行和联合国机构。

4.来自政府来源的官方数据——例如, 新冠疫苗接种和检测数据集汇集了全球政府和卫生部发布的最新官方数据。

在每个可视化产品中,该网站都清楚地指出了所呈现数据的来源,如果对合并数据源或对原始数据集进行更改(如区域聚合、人均转换等),也会注明。

该网站上的可视化内容和文本已根据 CC BY 获得许可,可以出于任何目的自由使用。网站上的数据也都可供下载。

Statista

Statista 是一家研究型数据统计公司,2007 年成立于德国汉堡,提供统计和调查数据与资料,目前有超过 200 万项数据统计,覆盖了全球主要的国家和经济体。Statista 拥有超过 22,500 个数据源,包括: 政府机构(各部委,部门,统计机构等)、国际组织、期刊和出版物、市场研究机构、科研机构等。Statista 会把所有信息可视化,每一张 Statista 图表均标注了其数据来源。

在有据的国际新闻事实核查实践中,有公信力的国际组织是最重要的信源,这些组织一般被认为相对中立且拥有权威资源。

比如联合国、联合国教科文组织、经合组织、世界银行、国际货币基金组织的相关网站,在涉及全球政治、经济、社会、文化方面,有大量完备、公开、免费的报告、调查、数据、法律、发言稿等材料。在有关新冠疫情方面,世界卫生组织(WHO)则是最重要的信源。

世界卫生组织、联合国等官网上,不少重要的文件、决议等都有不同的语言版本,包括中文版本,而且这些中文版本都符合国际组织严谨的翻译标准,可以很好地弥补核查员在翻译过程中可能造成的误解和信息流失问题,尤其是涉及法律、专有名词、国际关系等方面。

此外,在一些专业领域,某些国家的机构也被认为是权威信源,比如美国疾病预防控制中心(CDC)、食品药品管理局(FDA)、美国宇航局(NASA)等。

比如,2022 年 5 月底,第 75 届世界卫生大会刚刚闭幕,中文互联网流传说法称,会议修订的《国际卫生条例》将赋予世卫组织一系列强大的强制权力,包括拥有借疫情名义惩戒各国的能力。

检索 International Health Regulations,可以发现有不少的媒体报道,既包括美国保守派媒体称「世卫组织将通过条例修正案夺取各国医疗卫生决定主权」,也包括通讯社对于这次大会以及《国际卫生条例》修订的一般性报道。

我们可以通过阅读这些报道,快速了解有关事件、说法的背景。然后根据报道中提到的关键词检索,可以找到在世界卫生组织的官网上公开的修正案全文。(参考阅读:世卫修订《国际卫生条例》干涉各国内政?

在某一领域具有深厚积淀的研究机构、智库等,也是信源的重要来源。需要注意的是,这些机构最好具有独立性,不为利益集团代言。

案例 1:

2020 年美国大选投票结束后,有微信公众号声称,白宫宣布国家紧急状态,启动了针对国内恐怖主义之战,特朗普欲学林肯引 1807 年法案对抗「政变」。

确实,2020 年 11 月 12 日,白宫官网发布了特朗普署名的「关于继续维持有关大规模杀伤性武器扩散的国家紧急状态」的通告。

那么,到底什么是美国的国家紧急状态?美国总统是否有权宣布国家进入紧急状态?美国历届总统共宣布了多少次国家紧急状态?特朗普发布这一通告的时机是为应对选情失败而特意挑选的吗?

针对这些专业性极强的问题,核查员可以求助于专门的研究机构。比如在这一核查中,核查员就研究并援引了美国法律和公共政策研究机构布伦南司法研究中心(Brennan Center for Justice)的数据,自《国家紧急状态法》颁布以来,截至 2020 年 10 月 5 日,美国历届总统共宣布了 68 次国家紧急状态,其中 39 次国家紧急状态依然有效,持续时间最长的是 1979 年 11 月 14 日因人质危机对伊朗政府资产实施的制裁。(参考阅读:想翻盘,特朗普宣布进入国家紧急状态?

案例 2:

2020 年 11 月,有微博账号发文称,截至 11 月 4 日,美国大选注册选民 1.4 多亿人,目前特朗普 7300 万票,拜登 8000 万票,两者相加约 1.53 亿选票,比大选最后一天注册选民人数多 1000 万人,潜台词是投票率已超 100%。

要厘清这一问题,显然最关键的是要获得美国注册选民人数。美国法律规定,符合投票资格的选民(eligible voters)必须首先是年龄在 18 岁或以上的公民。但是美国没有全国性的合格选民名册。

这时我们援引的是美国佛罗里达大学「独立数据分析项目」(U.S. Elections Project)的数据:2020 年,美国有约 2.392 亿符合投票资格的选民。(参考阅读:美国大选总票数已反超注册选民数?

科学界公认的高质量学术期刊也是重要的高质量信源,比如《科学》(Science)、《自然》(Nature)、《细胞》(Cell)、《柳叶刀》(The Lancet)、《新英格兰医学杂志》(The New England Journal of Medicine,NEJM)、《美国医学会杂志》( The Journal of the American Medical Association,JAMA)、《英国医学期刊》(British Medical Journal,BMJ)等。

这些经过同行评议的学术期刊通常是寻找可信内容的好地方,尤其是涉及科学的主题。同行评议(peer review)是研究论文正式发表前的必要步骤,由多名匿名的同行对文章进行评审,再给出接受(accept),修改后接受(minor or major revision),或拒绝发表(reject)的意见。虽然同行评议流程有时遭到非议,也有其局限性,但它依然是保障期刊质量的公认标准。

在评估期刊和作者可信度时,可以参考几个维度:

该期刊是否已在学术数据库中被编入索引?

该期刊曾经不得不撤回很多文章吗?

期刊网站上关于版权和同行评议的政策是否清晰可见?

是否有可靠的「关于」页面详细说明他们发表的文章类型?

文章作者是否发表过其他文章?一个快速的谷歌学术搜索就会告诉你。

作者是否被其他学者引用过?Google Scholar 还有一个名为「Cited By」的功能,可以显示作者被引用的位置。大量的「被引用」结果通常可以衡量可信度。

但是,在一些特殊情况下,如新冠大流行期间,科学家和专业人士对于新冠病毒病毒的认知和研究是不断进步的,因此也出现了一些后来被证明是错误的或者是有缺陷的研究,以至于有些论文被从影响力很大的期刊上撤回了。

同时,警惕仅用来推广某个观点的期刊。还有一些期刊看起来很正规和可靠,但实际上付费就可以在这些期刊上刊登论文,导致其实际上是低质量的。

此外,在新冠病毒大流行期间,预印本(Preprint)论文非常流行。预印本是一份研究论文的完整草稿,在进行同行评审之前与公众分享。预印本可经过简单的编辑或筛选,但它们通常并未进行排版或内嵌到完整的网页中。在当今的学术出版领域,通常会给预印本分配一个数字对象标识符(DOI),以便其他研究论文对其进行引用。

比如 medRxiv,是由非营利研究和教育机构冷泉港实验室(The Cold Spring Harbor Laboratory,CSHL)、BMJ 出版集团(英国医学会下属专业医学出版机构,British Medical Journal)和耶鲁大学联合运营的免费的、非营利性服务平台。

从积极的角度看,预印本极大地提高了科学领域的知识管理和共享的速度,但预印本文章可能仍然包含错误,并且经常只经过有限的科学审查。在大流行期间,一些预印本论文甚至成为虚假信息的来源。因此,核查员对此必须非常小心。medRxiv 平台一般也会在论文标题下注明,此论文未经同行评议,可能包含错误,其结论未被科学界认可,不应作为临床实践的指导。

相对而言,一般的大众媒体对科学问题没有深入研究,对某些试验结果的报道也不全面,他们一般会夸大某些方面,例如某种新药刚刚完成一期试验就会被说成对一种疾病治疗的重大「新发现」。同样,大众媒体的报道也不太会涉及科学工作的方法和误差程度。所以对于科学领域的核查,一般来说,大众媒体的来源不是最佳信源。

但是,事实核查员可以从更加容易检索的大众媒体获得有关科学研究的信息入口,比如关于一项试验的主要负责人的姓名和工作单位名称,然后利用这些信息去查找这项研究的原始报告或论文,或者直接联系研究人员,并且最终在核查报告中加以引用,而不是直接引用大众媒体的报道。

当然,学术期刊也不仅仅指的是医学、物理、天文等自然科学类的学术期刊,也包括政治、经济、国际关系等社会科学类的期刊,其中的内容在进行国际新闻事实核查时也会频繁用到。

案例 1:

2022 年 4 月 27 日,中文媒体和网络流传说法:「德国最新临床研究:辉瑞 mRNA 疫苗可能引发自身免疫性肝炎」,引起极大关注,不少受众看到这一标题和微博热搜后开始质疑辉瑞 mRNA 疫苗是否可靠。有关的说法援引了一份发布在专业期刊《肝病学杂志》(Journal of Hepatology)上的论文,来自德国的这项临床研究披露了一起接种 2 剂辉瑞 mRNA 疫苗出现的急性肝炎的双峰发作(两次接种后均发作)。

有据核查员通过《肝病学杂志》上的论文署名页,直接联系到研究参与者、论文通讯作者——德国弗莱堡大学医学中心的伯特伦·本格希(Bertram Bengsch)博士,就有关研究的来龙去脉进行了详尽的访谈。

本格希博士不仅解释了研究成果,还提到了欧洲药品管理局药物警戒风险评估委员会的评估:现有证据不支持新冠 mRNA 疫苗与非常罕见的自身免疫性肝炎病例之间存在因果关系。

他在访问中还明确表示,疫苗接种的好处基本上会超过这些罕见的副作用,由病毒诱发的严重疾病的发生率肯定比接种疫苗后极少发生的严重肝炎的威胁更大,接种疫苗对个体和整个社会系统的好处肯定要大得多。

因此,就本案例而言,没有比研究当事人更坚实和更有说服力的信源了。(参考阅读:辉瑞 mRNA 疫苗引发自身免疫性肝炎?

案例 2:

2023 年 3 月,中文网络流传说法称,在中国领导人访俄之前,俄罗斯总统普京在俄罗斯的超前发展区给予中国投资者三大特权,其中之一是,在俄投资的中国企业可以享受「治外法权」的保护,意思就是不受俄罗斯境内的法规和管理体系制约,完全可以根据中国的规矩来往。

对于这个说法,我们首先厘出几个核查点:

1.什么是治外法权?虽然中国读者对这个词并不陌生,但其准确定义是什么?

2.俄罗斯的超前发展区是什么?

3.涉及超前发展区的法律规定是什么?其中是否涉及给中国投资者的治外法权?

对于第一个问题,有关「治外法权」的解释,中英文的来源林林总总,既包括教科书,也包括各种研究论文和官方表述。经过比较,我们可以选择来自《中国大百科全书》作为信源,该书的「治外法权」条目由中国政法大学国际法学院的杨凯撰写:

「『治外法权』(extraterritoriality)在当下有两种含义,一种是现实意义上的治外法权,另一种是历史意义上的『治外法权』。

现实意义上的治外法权,可理解为在一国的外国人不受所在国司法管辖的特权,即『外交豁免权』。具体而言是指部分外国人,依据双边条约和国际法的规定,免除驻在国的司法管辖,使其个人及家人不受当地的民事及刑事诉讼,不会遭受逮捕,其住所及财产不受侵犯,并且免征税款。外交豁免权通常由一国元首、使领馆官员、联合国官员等享有。享有外交豁免不等于不受制裁,若该类人在一国境内犯有罪行,该国可宣称该人为『不受欢迎的人』并予以驱逐。总体而言,现实意义上的治外法权是建立在双方平等互利基础上的国际法基本原则。

历史意义上的『治外法权』,最初同时表达『管辖外国人的法权』之属地主义和『治域之外的法权』之属人主义两层意思,例如:外国人在中国所犯罪行不受中国管辖,也被称为『领事裁判权』。该项权利源自近代以来列强同中国签订的一系列不平等条约,完全违背现代国际法平等互惠的基本宗旨。在中国近现代史上,治外法权的内涵和外延被各国随意扩大,使得外国人不遵守中国法律的情况十分严重,各国租界也成为实际上的国中之国,严重破坏了中国的司法主权。中国人民在反抗外来侵略、争取民族解放的过程中,逐步收回了治外法权。历史意义上的『治外法权』严重违反国际法基本原则,已经为国际社会所废止。「

对于第 2、3 问题,初步检索发现,涉及俄罗斯超前发展区的信息不少,但大多数是碎片化的新闻报道。

此时我们可以检索相关的研究论文,经过比较,我们发现两篇论文提供了比较重要的信息:俄罗斯科学院远东研究所高级研究员Л. В.诺沃肖洛娃的论文《俄罗斯远东超前发展区现状及特点》(《西伯利亚研究》2018 年第五期),其中涉及对超前发展区的来龙去脉和基本现状的介绍。

法律部分,黑龙江大学《俄罗斯学刊》主编靳会新的论文《对《俄罗斯社会经济超前发展区联邦法》及相关法律的解读》(俄罗斯学刊, 2015, (06): 51-56),介绍了超前发展区的建立涉及修改民事、城市建设、劳动、土地、森林等联邦法律的具体情况,列出了所有涉及到的需要修改的 22 条法律的名称。

相关内容显示,俄罗斯为了建设超前发展区而对部分俄联邦法律进行修订,并不涉及给予中国人或外国公民治外法权。

对有关论文内容的引述,提高了核查效率,避免了因为语言(俄语)、专业知识(涉及法律专业领域)方面的欠缺导致的不准确。(参考阅读:俄罗斯向中国人授予治外法权?

常用的英文文献工具包括:

常用的中文文献工具包括:

维基百科是维基媒体基金会运营的一个多语言的网络百科全书,并以创建和维护作为开放式协同合作项目,目前是全球网络上最大且最受大众欢迎的参考工具书。

维基百科在中立性、可靠性方面已经制定了严格的政策,这意味着很多维基百科页面的内容实际上相当可靠。对于事实核查员来说,维基百科是一个非常重要且高效的工具。如果正在核查一个复杂的问题,维基百科词条下面引用的参考资料(References)和外部链接(External links)会是一个很好的入口,可以提供有用的线索并节省大量时间。

但因为维基百科具有自由编辑的特性,对事实核查员来说,一般不能将其作为最终的可靠信源来直接引用,尤其是那些涉及有争议的主题或不断发展的事件的词条。就有据而言,我们一般不在核查报告中出现「据维基百科」的字样。

中文维基百科尤其需要警惕,其词条解释有时会引用有公信力的媒体来源,但有时也会引用普通用户生成的内容(如百度百家号)。

案例 1:

2022 年 6 月,中文维基百科编辑者「折毛」伪造古俄罗斯历史相关条目的行为被揭露。「折毛」自 2019 年 6 月在维基百科注册以来,在中文维基百科上创建了 206 个条目,进行了 4800 次编辑,写下上百万字,主要涉及古俄罗斯历史相关条目,内容主要关于中世纪斯拉夫国家间的政治交互。

这是折毛在伪造条目「鞑靼大起义」中绘制的形势地图,该图片不反映真实历史信息:

案例 2:

2021 年 8 月,塔利班夺取阿富汗政权,中文社交网络流传说法称,阿富汗副总统萨利赫拼死抵抗塔利班的重要原因之一是他「唯一的妹妹遭塔利班残酷迫害致死」。

微博上流传的说法称,萨利赫是在去年「接受《时代周刊》专访时」提到妹妹的事情。

经检索,萨利赫于 2020 年 2 月就职副总统后,在美国《时代周刊》(Time)发表了一篇署名文章,题为《我曾与塔利班战斗。现在,我准备好在选票箱与他们相遇》,其中一段文字讲述了 1996 年塔利班对他的姐姐和其他家人施以酷刑、强迫结婚等行径:「……几天后,恐怖降临到我身边。塔利班正发动对我的追捕,因我曾与之战斗数年。他们找到了我的姐姐玛丽姆,当时已五十多岁,殴打并残酷折磨她,试图强逼她透露我身处何处。姐姐拒绝这么做。接着,塔利班回到她住的社区,要求她将女儿们嫁给那些武装分子。最终她们成功摆脱了塔利班的控制,一起逃离了这座城市。我的姐姐一直挣扎在这段回忆中,直到 2016 年去世。」

那么,相关信息是如何被污染加工的?

2021 年 8 月 17 日,法新社报道了萨利赫誓言抵抗塔利班的新闻,其中提到 1996 年塔利班为追捕他而迫害其姐姐的事情,与《时代周刊》上的文章保持一致。

随后,英文维基百科的用户 Ominae 在修改萨利赫的词条时,尽管援引了法新社的报道,却将此表述为他有一个 sister(姐姐或妹妹)被塔利班武装人员折磨致死:

中文维基百科上萨利赫的词条延续了上述英文维基百科的错误。随后,有用户在修改过程中进一步将「萨利赫有一个妹妹……被塔利班武装分子折磨致死」改为「她惨遭塔利班武装分子奸杀」:

最终,微博平台上流传的说法是萨利赫「唯一的妹妹」被塔利班「折磨致死」或「残暴奸杀」,与萨利赫在《时代周刊》的自述相比,存在重大差异。

核查时,中英文维基百科已修正上述虚假信息:

(参考阅读:坚持抵抗的阿富汗副总统妹妹曾遭塔利班虐杀?

实用 AI 提示词优化高级指南,新加坡首届 GPT-4 提示工程大赛冠军分享 [译]

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

上个月,我非常荣幸地在新加坡政府科技局(GovTech)组织的首届 GPT-4 提示工程大赛中脱颖而出,这场比赛吸引了超过 400 名杰出的参与者。

提示工程是一门将艺术与科学巧妙融合的学科 — 它不仅关乎技术的理解,更涉及创造力和战略思考。这里分享的是我在实践中学到的一些提示工程策略,这些策略能够精准地驱动任何大语言模型为你服务,甚至做得更多!

作者的话: 在写作本文时,我特意避开了那些已经广泛讨论和记录的常规提示工程。相反,我更希望分享一些我在实验中获得的新洞见,以及我个人在理解和应用这些技巧时的独到见解。希望你能从中获得乐趣!

本文涵盖以下主题,其中 🔵 代表初学者友好的技巧,而 🔴 代表高级策略。

在使用大语言模型时,有效的提示构建至关重要。CO-STAR 框架,由新加坡政府科技局科学与 AI 团队创立,是一个实用的提示构建工具。它考虑了所有影响大语言模型响应效果和相关性的关键因素,帮助你获得更优的反馈。

这里有一个 CO-STAR 框架为何有用的现实案例。

假设你担任媒体经理,需要草拟一条 帖子,用以推广公司的新产品。 未使用 CO-STAR 的快速提示可能是这样的:

这是 GPT-4 的回答:

这一输出虽足够,但显得过于泛化,缺乏必要的细节和针对性吸引力,未能真正触及公司目标受众的心。

下面是一个应用 CO-STAR 模板的示例,它提醒我们在制定提示时,要考虑到任务的其它方面,特别是之前快速提示中缺少的风格语调受众

通过运用 CO-STAR 框架,GPT-4 的响应变得更具针对性和效果:

CO-STAR 框架指引您以有组织的方式提供所有关键任务信息,确保响应完全针对您的需求并进行优化。

分隔符是特殊的符号,它们帮助大语言模型 (LLM) 辨识提示中哪些部分应当被视为一个完整的意义单元。

这非常关键,因为你的提示是作为一个长的 Token 序列一次性传给模型的。通过设置分隔符,可以为这些 Token 序列提供结构,使特定部分得到不同的处理。

需要注意的是,对于简单的任务,分隔符对大语言模型的回应质量可能无显著影响。但是,任务越复杂,合理使用分隔符进行文本分段对模型的反应影响越明显。

分隔符可以是任何不常见组合的特殊字符序列,如:

选择哪种特殊字符并不重要,关键是这些字符足够独特,使得模型能将其识别为分隔符,而非常规标点符号。

这里是一个分隔符使用的示例:

在上述示例中,使用 ### 分隔符来分隔不同的部分,通过大写的章节标题如 对话示例 和 输出示例 进行区分。引言部分说明了要对 {{{CONVERSATIONS}}} 中的对话进行情绪分类,而这些对话在提示的底部给出,没有任何解释文本,但分隔符的存在让模型明白这些对话需要被分类。 GPT-4 的输出正如请求的那样,仅给出情绪分类:

使用 XML 标签作为分隔符是一种方法。XML 标签是被尖括号包围的,包括开启标签和结束标签。例如,{tag}{/tag}。这种方法非常有效,因为大语言模型已经接受了大量包含 XML 格式的网页内容的训练,因此能够理解其结构。

以下是利用 XML 标签作为分隔符对同一提示进行结构化的例子:

在指令中使用的名词与 XML 标签的名词一致,如 conversationsclasses 和 examples,因此使用的 XML 标签分别是 {conversations}{classes}{example-conversations} 和 {example-classes}。这确保了模型能够清晰地理解指令与使用的标签之间的关系。 通过这种结构化的分隔符使用方式,可以确保 GPT-4 精确地按照您的期望响应:

_在开始前,我们需指出,本节内容仅适用于具备系统提示功能的大语言模型 (LLM),与文章中其他适用于所有大语言模型的部分不同。显然,具有此功能的最知名的大语言模型是 ,因此我们将以 ChatGPT 为例进行说明。_

首先,我们来厘清几个术语:在讨论 ChatGPT 时,这三个术语「系统提示」、「系统消息」和「自定义指令」几乎可以互换使用。这种用法让许多人(包括我自己)感到混淆,因此 发表了一篇文章,专门解释了这些术语。简要总结如下:


图片来自 Enterprise DNA Blog

尽管这三个术语表达的是相同的概念,但不必因术语的使用而感到困扰。下面我们将统一使用「系统提示」这一术语。现在,让我们一探究竟!

系统提示是您向大语言模型提供的关于其应如何响应的额外指示。这被视为一种额外的提示,因为它超出了您对大语言模型的常规用户提示。

在对话中,每当您提出一个新的提示时,系统提示就像是一个过滤器,大语言模型会在回应您的新提示之前自动应用这一过滤器。这意味着在对话中每次大语言模型给出回应时,都会考虑到这些系统提示。

系统提示一般包括以下几个部分:

例如,系统提示可能是这样的:

每一部分对应的内容如下图所示:

系统提示已经概括了任务的总体要求。在上述示例中,任务被定义为仅使用特定文本进行问题解答,同时指导 LLM 按照{"问题":"答案"}的格式进行回答。

这种情况下,每个用户提示就是您想用该文本回答的具体问题。

例如,用户提示可能是"这篇文本主要讲了什么?",LLM 的回答将是{"这篇文本主要讲了什么?":"文本主要讲述了……"}

但我们可以将这种任务进一步推广。通常,与只询问一个文本相比,你可能会有多个文本需要询问。这时,我们可以将系统提示的首句从

改为

如此,每个用户提示将包括要问答的文本和问题,例如:

此处,我们使用 XML 标签来分隔信息,以便以结构化方式向 LLM 提供所需的两个信息。XML 标签中的名词,text 和 question,与系统提示中的名词相对应,以便 LLM 理解这些标签是如何与指令相关联的。

总之,系统提示应提供整体任务指令,而每个用户提示则需要提供执行该任务所需的具体细节。在这个例子中,这些细节就是文本和问题。

在之前的讨论中,我们通过系统提示来设定规则,这些规则一经设定,将在整个对话中保持不变。但如果你想在对话的不同阶段实施不同的规则,应该怎么做呢?

对于直接使用 ChatGPT 用户界面的用户来说,目前还没有直接的方法可以实现这一点。然而,如果你通过编程方式与 ChatGPT 互动,那么情况就大不相同了!随着对开发有效 LLM 规则的关注不断增加,一些允许你通过编程方式设定更为详细和动态的规则的软件包也应运而生。

特别推荐的一个是由 NVIDIA 团队开发的NeMo Guardrails。这个工具允许你配置用户与 LLM 之间的预期对话流程,并在对话的不同环节设定不同的规则,实现规则的动态调整。这无疑是探索对话动态管理的一个很好的资源,值得一试!

你可能已经听说过 OpenAI 在 ChatGPT 的 GPT-4 中为付费账户提供的高级数据分析插件。它让用户可以上传数据集到 ChatGPT 并直接在数据集上执行编码,实现精准的数据分析。

但是,你知道吗?并不总是需要依赖这类插件来有效地使用大语言模型 (LLM) 分析数据集。我们首先来探讨一下仅利用 LLM 进行数据分析的优势与限制。

正如你可能已经知道的,LLMs 在执行精确的数学计算方面有所限制,这让它们不适合需要精确量化分析的任务,比如:

正是为了执行这些量化任务,OpenAI 推出了高级数据分析插件,以便通过编程语言在数据集上运行代码。 那么,为什么还有人想仅用 LLMs 来分析数据集而不用这些插件呢?

LLMs 在识别模式和趋势方面表现出色。这得益于它们在庞大且多样化的数据上接受的广泛训练,能够洞察到复杂的模式,这些模式可能不是一眼就能看出来的。 这使它们非常适合执行基于模式查找的任务,例如:

对于这些基于模式的任务,单独使用 LLMs 可能实际上会在更短的时间内比使用编程代码产生更好的结果!接下来,我们将通过一个例子来详细说明这一点。

我们将使用一个流行的实际Kaggle 数据集,该数据集专为客户个性分析而设计,帮助公司对客户基础进行细分,从而更好地了解客户。 为了之后 LLM 分析的方便,我们将这个数据集缩减至 50 行,并仅保留最相关的几列。缩减后的数据集如下所示,每一行代表一位客户,各列展示了客户的相关信息:

设想你是公司营销团队的一员,你的任务是利用这份客户信息数据集来指导营销活动。这是一个分两步的任务:首先,利用数据集生成有意义的客户细分;其次,针对每个细分提出最佳的市场营销策略。

这是一个实际的商业问题,其中第一步的模式识别能力是 LLM 可以大显身手的地方。 我们将按以下方式设计任务提示,采用四种提示工程技术:

下面是 GPT-4 的回复,我们将继续将数据集以 CSV 字符串的形式传递给它。

随后,GPT-4 按照我们要求的标记符报告格式回复了分析结果:

为了简洁,我们选择两个由大语言模型生成的客户群体进行验证——“年轻家庭”和“挑剔的爱好者”。

年轻家庭

– 大语言模型生成的描述:出生于 1980 年后,已婚或同居,中等偏低的收入,育有孩子,常做小额消费。

– 此群体包括的数据行:3、4、7、10、16、20 – 深入查看这些数据行的详细信息,结果显示:


年轻家庭的完整数据 — 作者图片

这些数据完美对应大语言模型确定的用户描述。该模型甚至能够识别包含空值的数据行,而无需我们预先处理!

挑剔的爱好者

– 大语言模型生成的描述:年龄跨度广泛,不限婚姻状况,高收入,孩子情况不一,高消费水平。

– 此群体包括的数据行:2、5、18、29、34、36 – 深入查看这些数据行的详细信息,结果显示:


挑剔的爱好者的完整数据 — 作者图片

这些数据再次精准匹配大语言模型确定的用户描述!

本例展示了大语言模型在识别模式、解读及简化多维数据集以提炼出有意义的洞见方面的强大能力,确保其分析结果扎根于数据的真实情况。

为了全面考虑,我使用同一提示尝试了相同的任务,不过这次我让 ChatGPT 通过编程方式进行分析,启用了其高级数据分析插件。插件应用 K-均值等聚类算法直接对数据集进行处理,以便划分不同的客户群体,并据此制定营销策略。

尽管数据集仅含 50 行,多次尝试均显示错误信息且未产生任何结果:

当前情况表明,虽然高级数据分析插件能够轻松完成一些简单任务,如统计描述或生成图表,但在执行需要较大计算量的高级任务时,有时可能因为计算限制或其他原因而发生错误,导致无法输出结果。

答案因分析的具体类型而异。

对于需要精确的数学运算或复杂的规则处理的任务,传统的编程方法依然更加适用。

而对于依赖模式识别的任务,传统的编程和算法处理可能更加困难且耗时。大语言模型在这类任务中表现优异,能提供包括分析附件在内的额外输出,并能生成 Markdown 格式的完整分析报告。

总的来说,是否采用大语言模型取决于任务本身的性质,需要平衡其在模式识别上的强项与传统编程技术提供的精确度和特定性。

在本节结束前,让我们重新审视用于生成此数据分析的提示,并详细解析关键的提示工程技巧:

大语言模型(LLM)擅长处理简单的任务,对于复杂的任务则表现不佳。因此,在面对复杂任务时,把它分解成一步步简单的指令是至关重要的。这种方法的核心思想是,明确告知 LLM 你自己执行该任务时会采取的每一个步骤。

例如,具体步骤如下:

这样的分步指导,比起直接要求 LLM「对客户进行分组并提出营销策略」的方式,能显著提高其输出的准确性。

在提供步骤时,我们会用大写字母标记每个步骤的输出,这样做是为了区分指令中的变量名和其他文本,方便后续引用这些中间输出。

例如数据聚类(CLUSTERS)聚类描述(CLUSTER_INFORMATION)聚类命名(CLUSTER_NAME)营销策略(MARKETING_IDEAS)策略解释(RATIONALE)

此处我们请求一个 Markdown 格式的报告,以增强响应的可读性和结构性。利用中间步骤的变量名,可以明确报告的构架。

此外,你还可以让 ChatGPT 将报告以可下载文件形式提供,便于你在编写最终报告时参考使用。

在我们的首个提示中,你会发现我们并没有直接将数据集交给大语言模型(LLM)。反而,提示只给出了数据集分析的任务指令,并在底部添加了这样的话:

随后 ChatGPT 表示它已理解,并在下一个提示中,我们通过 CSV 字符串的形式将数据集传递给它:

但为什么需要将指令与数据集分开处理呢?

这样做可以帮助大语言模型更清晰地理解各自的内容,降低遗漏信息的风险,尤其是在指令较多且复杂的任务中。

你可能遇到过这样的情况:在一个长的提示中提出的某个指令被「偶然遗忘」了——例如,你请求一个 100 字的回答,但大语言模型却给出了更长的段落。

通过先接收指令,再处理这些指令所对应的数据集,大语言模型可以更好地消化它应该做的事情,然后再执行相关的数据操作。

值得注意的是,这种指令与数据集的分离只能在可以维护对话记忆的聊天型大语言模型中实现,而非那些没有这种记忆功能的完成型模型。

在本文结束之前,我想分享一些关于这次非凡旅程的个人思考。

首先,我要衷心感谢 GovTech Singapore 精心策划这场精彩的比赛。如果你对 GovTech 如何组织这场独一无二的比赛感兴趣,可以阅读 Nicole Lee——比赛的主要组织者撰写的这篇文章

其次,我要向那些出色的竞争对手们致以最高的敬意,每个人都展现了特别的才能,让这场比赛既充满挑战又富有成效!

我永远不会忘记决赛那一刻,我们在舞台上激烈竞争,现场观众的欢呼声——这是我将一直珍视的记忆。 对我而言,这不只是一场比赛;这是一次才华、创造力及学习精神的盛会。我对未来充满期待,并激动于即将到来的一切!

撰写本文让我感到非常愉快,如果你在阅读时也享受这份乐趣,希望你能花一点时间点赞并关注! 期待下一次的相遇!

Seal – 基于 yt-dlp 的安卓开源音、视频下载应用,支持几乎所有在线平台

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

Seal 是一款安卓在线,基于著名的开源下载 yt-dlp,支持从数千个视频平台下载视频,内置了 aria2 下载器。

🦭 Video/Audio Downloader for , based on yt-dlp, designed with Material You – JunkFood02/Seal

又是一款将原本需要在电脑进行处理的活,迁移到了安卓手就上进行。

Seal 在 GitHub 开源,上架 f-droid,主要功能:

尝试了一下,效果还是非常不错的,有几个点:

Meta 最强开源大模型 Llama 3 开卷 GPT-4, 马斯克点赞 | 附体验链接

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

没有出乎太多意外,Meta 带着号称「有史以来最强大的大模型」Llama 3 系列模型来「炸街」了。

Build the future of AI with Meta Llama 3. Now available with both 8B and 70B pretrained and instruction-tuned versions to support a wide range of applications.

具体来说,Meta 本次开源了 8B 和 70B 两款不同规模的模型。

以上还只是 Meta 的开胃小菜,真正的大餐还在后头。在未来几个月,Meta 将陆续推出一系列具备多模态、多语言对话、更长上下文窗口等能力的新模型,其中超 400B 的重量级选手更是有望与 Claude 3 超大杯「掰手腕」。

与前代 Llama 2 模型相比,Llama 3 可谓是迈上了一个新的台阶。

得益于预训练和后训练的改进,本次发布的预训练和指令微调模型是当今 8B 和 70B 参数规模中的最强大的模型,同时,后训练流程的优化显著降低了模型的出错率,增强了模型的一致性,并丰富了响应的多样性。

扎克伯格曾在一次公开发言中透露,考虑到用户不会在 WhatsApp 中向 Meta AI 询问编码相关的问题,因此 Llama 2 在这一领域的优化并不突出。

而这一次,Llama 3 在推理、代码生成和遵循指令等方面的能力取得了突破性的提升,使其更加灵活和易于使用。

基准测试结果显示,Llama 3 8B 在 MMLU、GPQA、HumanEval 等测试的得分远超 Gemma 7B 以及 Mistral 7B Instruct。用扎克伯格的话来说,最小的 Llama 3 基本上与最大的 Llama 2 一样强大。

Llama 3 70B 则跻身于顶尖 AI 模型的行列,整体表现全面碾压 Claude 3 大杯,与 Gemini 1.5 Pro 相比则是互有胜负。

为了准确研究基准测试下的模型性能,Meta 还特意开发了一套新的高质量人类评估集。

该评估集包含 1800 个提示,涵盖 12 个关键用例:寻求建议、头脑风暴、分类、封闭式问答、编码、创意写作、提取、塑造角色、开放式问答、推理、重写和总结。

出于避免 Llama 3 在此评估集上出现过度拟合,Meta 甚至禁止他们的研究团队访问该数据集。在与 Claude Sonnet、Mistral Medium 和 GPT-3.5 的逐一较量中,Meta Llama 70B 都以「压倒性胜利」结束了比赛。

据 Meta 官方介绍,Llama 3 在模型架构上选择了相对标准的纯解码器 Transformer 架构。与 Llama 2 相比,Llama 3 进行了几项关键的改进:

训练数据的数量和质量是推动下一阶段大模型能力涌现的关键因素。

从一开始,Meta Llama 3 就致力于成为最强大的模型。Meta 在预训练数据上投入了大量的资金。据悉,Llama 3 使用从公开来源收集的超过 15T 的 token,是 Llama 2 使用数据集的七倍,其中包含的代码数据则是 Llama 2 的四倍。

考虑到多语言的实际,超过 5% 的 Llama 3 预训练数据集由涵盖 30 多种语言的高质量非英语数据组成,不过,Meta 官方也坦言,与英语相比,这些语言的性能表现预计是稍逊一筹。

为了确保 Llama 3 接受最高质量的数据训练,Meta 研究团队甚至提前使用启发式过滤器、NSFW 筛选器、语义重复数据删除方法和文本分类器来预测数据质量。

值得注意的是,研究团队还前几代 Llama 模型在识别高质量数据方面出奇地好,于是让 Llama 2 为 Llama 3 提供支持的文本质量分类器生成训练数据,真正实现了「AI 训练 AI」。

除了训练的质量,Llama 3 在训练效率方面也取得了质的飞跃。

Meta 透露,为了训练最大的 Llama 3 模型,他们结合了数据并行化、模型并行化和管道并行化三种类型的并行化。

在 16K GPU 上同时进行训练时,每个 GPU 可实现超过 400 TFLOPS 的计算利用率。研究团队在两个定制的 24K GPU 集群上执行了训练运行。

为了最大限度地延长 GPU 的正常运行时间,研究团队开发了一种先进的新训练堆栈,可以自动执行错误检测、处理和维护。此外,Meta 还极大地改进了硬件可靠性和静默数据损坏检测机制,并且开发了新的可扩展存储系统,以减少检查点和回滚的开销。

这些改进使得总体有效训练时间超过 95%,也让 Llama 3 的训练效率比前代足足提高了约 3 倍。

更多技术细节欢迎查看 Meta 官方博客:https://ai.meta.com/blog/meta-llama-3/

作为 Meta 的「亲儿子」,Llama 3 也顺理成章地被优先整合到 AI 聊天机器人 Meta AI 之中。

追溯至去年的 Meta Connect 2023 大会,扎克伯格在会上正式宣布推出 Meta AI,随后便迅速将其推广至美国、澳大利亚、加拿大、新加坡、南非等地区。

在此前的采访中,扎克伯格对搭载 Llama 3 的 Meta AI 更是充满信心,称其将会是人们可以使用的最的 AI 助手。

我认为这将从一个类似聊天机器人的形式转变为你只需提出一个问题,它就能给出答案的形式,你可以给它更复杂的任务,它会去完成这些任务。

附上 Meta AI 网页体验地址:https://www.meta.ai/

当然,Meta AI 若是「尚未在您所在的国家/地区推出」,你可以采用开源模型最朴素的使用渠道——全球最大的 AI 开源社区 Hugging Face。

附上体验地址:https://huggingface.co/meta-llama/Meta-Llama-3-70B-Instruct

Perplexity、Poe 等平台也迅速宣布将 Llama 3 集成到平台服务上。

你还可以通过调用开源模型平台 Replicate API 接口来体验 Llama 3,其使用的价格也已经曝光,不妨按需使用。

有趣的是,在 Meta 官宣 Llama 3 前,有眼尖的网友发现微软的 Azure 市场偷跑 Llama 3 8B Instruct 版本,但随着消息的进一步扩散,当蜂拥而至的网友再次尝试访问该链接时,得到的只有「404」的页面。

目前已恢复:https://azuremarketplace.microsoft.com/en-us/marketplace/apps/metagenai.meta-llama-3-8b-chat-offer?tab=overview

Llama 3 的到来,正在平台 X 上掀起一股新的讨论风暴。

Meta AI 首席科学家、图灵奖得主 Yann LeCun 不仅为 Llama 3 的发布摇旗呐喊,并再次预告未来几个月将推出更多版本。就连马斯克也现身于该评论区,用一句简洁而含蓄的「Not bad 不错」,表达了对 Llama 3 的认可和期待。

英伟达高级科学家 JIm Fan 则将注意力投向了即将推出的 Llama 3 400B+,在他看来,Llama 3 的推出已经脱离了技术层面的进步,更是开源模型与顶尖闭源模型并驾齐驱的象征。

从其分享的基准测试可以看出,Llama 3 400B+ 的实力几乎媲美 Claude 超大杯、以及 新版 GPT-4 Turbo,虽然仍有一定的差距,但足以证明其在顶尖大模型中占有一席之地。

今天恰逢斯坦福大学教授,AI 顶尖专家吴恩达的生日,Llama 3 的到来无疑是最特别的庆生方式。

不得不说,如今的开源模型真的是百花齐放,百家争鸣。

今年年初,手握 35 万块 GPU 的扎克伯格在接受 The Verge 的采访时,用坚定的语气描绘了 Meta 的愿景——致力于打造 AGI(通用人工智能)。

与不 open 的 形成鲜明对比,Meta 则沿着 open 的开源路线朝 AGI 的圣杯发起了冲锋。

正如扎克伯格所说,坚定开源的 Meta 在这条充满挑战的征途中也并非毫无收获:

我通常非常倾向于认为开源对社区和我们都有好处,因为我们会从创新中受益。

在过去的一年中,整个 AI 圈都在围绕开源或闭源的路线争论不休,这场辩论,已经超越了技术层面的优劣比较,触及了 AI 未来发展的核心方向。甚至亲自下场的马斯克也通过开源 Grok 1.0 的方式给全世界打了个样。

前不久,一些观点称开源模型将会越来越落后,如今 Llama 3 的到来,也给了这种悲观的论调一记响亮的耳光。

然而,尽管 Llama 3 为开源模型扳回一局,但这场关于开源与闭源的辩论还远未结束。

毕竟暗中蓄势待发的 GPT-4.5/5 也许会在今年夏天,以无可匹敌的性能为这场旷日持久的争论画上一个句号。

Canva AI – 2024 最新 15 个图片生成、修图 AI 自动化功能实测分享

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

Canva 是现在非常多人使用的在线设计工具,通过大量的模板与素材,就算不是专业设计师,只要组合各种各样的模板,也能快速生成可用的图像,无论是用在网页文章中的解说 视频的封面,各种上的图文搭配,都能节省许多时间。还能制作流程图、文件报告、协作白板、视频编辑等等。尤其陆续添加的 功能,让 Canva 对一般人来说更好上手设计图文影音的工作流程。

过去一年多来,Cnava 也陆陆续续在其工具中加入了很多 AI 相关的功能,例如用 AI 编写运营图片上的文案,或是用 AI 制作视频当中的动画等等。〔部分 Canva AI 功能有使用额度,部分功能则需要升级到 Canva Pro 付费版账户。〕

而今天这篇文章。我想针对自己最常用到的「图片 AI 调整」,做一个完整的 AI 图片设计、生成、修图功能总整理,因为这些功能原本散落在 Canva 许多不同的工具中,每个功能也有不同的情境,所以让我们用一个尽量连贯的案例,展开可以在什么时候如何运用这些隐藏的 Canva AI 图像设计功能

下面的介绍,会根据我平常使用 Canva 最常操作的 AI 图片编辑相关流程来介绍,结合自己的使用经验与心得,希望这样可以更容易看到不同功能之间的使用场景与搭配应用方式。也欢迎你在留言跟我分享你最常使用的功能与技巧。

如果查找 Canva 数据库中已有的图文模板,找不到自己想要的,那么或许利用「Magic Design」会是一个有效的开始。

在 Canva AI 中我常使用的起手式,这个功能(和最后一个功能)是目前在 Canva 英文版测试中的「Magic Design」,只要用一句话或几个关键词描绘自己想要的设计需求,让 Canva AI 生成全新的模板、草稿,我就可以在这样基础上进一步修改。

不过要使用这个功能前,要到设置中先把语言先换到「English」。

接着,来到主画面上方的「栏」,使用英文描述自己想要的模板内容,按下确认。

这时候就会启动「Magic Design」,最上方一排,就是 Canva AI 自动生成的图文模板。

也可以利用其中的「Media」功能,上传一张自己的图片素材,例如想要自定义的背景照片,这时候 Canva AI 会再次根据这张图片素材,设计出搭配好的新模板。

我们可以选择一个最适合自己的,然后开始进一步修改。

进入模板开始设计后,可能会需要在原本模板上组合一些独立的图片元素,这时候可以先查找 Canva 大量的图库,找到适合的照片后,用抠图功能,取出照片里的指定素材来使用。

这样一来,可以说就有源源不绝的图标物件可以自由搭配了。

先查找图库照片,或是上传自己的照片,把找到的照片先插入设计图中。

选择「编辑照片」,然后选择「背景移除工具」。

完成抠图后,这个素材就可以自由运用在原本的设计图中。

AI 魔法抓取就是把图片中的背景、主体各项元素分离,于是可以自由移动元素的位置,调整大小等,重新进行设计。

譬如原本靠右边的物品,移动到左边,让右边可以有更多摆放文字的空间。

有了这个 Magic Grab 魔法抓取,许多照片、图片的构图都能自由调整,更多设计弹性。

只要选择要调整的照片,进入「编辑照片」,选择「魔法抓取」。

就可以把主体、背景分离,而背景也会自动填满,这样一来就能当成两个素材来使用了。

有时候设计图上就是有某个小地方差了一点点,不想因此换掉整张图,这时候可以善用 Canva AI 的「魔法编辑工具」来适度的调整。

例如把一个人的白头发变成黑头发,加了一顶帽子等等,可以发挥自己的想象力,用 AI 指令去替换掉各种不满意的图片内容。

先选择设计图中想要调整的图片,进入「编辑照片」,选择「魔法编辑工具」。

接着,涂抹想要修改的区域,例如我这边不满意的是图库中的笔记页面都是空白的,所以我先涂抹笔记的空白区域。

然后,描述想要替换、新增的内容,或想要的修改结果,例如我这边描述想要在笔记空白页面上加上一些素描。

最后,就会用 AI 调整指定区域的内容,生成四种不同结果,我们只要选取最适合的生成结果即可。

有时候我们不是想要替换掉照片中的部分内容,而是想要直接移除对象就好。那么就可以使用「魔法消除」功能。

同样在照片编辑中,选择「魔法橡皮擦」。

涂抹不想要的部分即可,有时多抹除几次的效果更好。

Canva 很多修图的功能让一般人也能很好上手,例如在「编辑照片」中,会自动分离出照片里的颜色、材质,让我们可以进行微调,这有助于我们快速把照片调整到自己想要的感觉。

在编辑照片中进入「调整」页面,针对获取到的照片主要颜色,可以进行调整,甚至替换成不同的颜色。

或是针对材质进行清晰度的调整。这有时候会在 AI 生成的图片作微调,效果更明显。

还有一个我很喜欢的自动化功能〔虽然跟 AI 没有关系,但因为是工作流上常用的,还是一并介绍〕,就是在左方的「设计」中选择「样式」,就可以进行各种配色的替换。

有时候换个配色,原本感觉不搭配的模板就变得更加适合。

只要进入「样式」,在调色盘上自由点击,就可以不断替换,直到找到自己满意的为止。

还可以在样式页面滑动到最下方,会根据主图建议适合的配色,在这边选择配色,会让主图与版面更加搭配。

有时候要把照片插入版面中,可能因为照片比例大小的问题,需要慢慢剪切移动,找到最佳位置。

而通过 Canva AI,在「编辑照片」中进入「裁切」,选择「智能裁切」,就会自动帮这张照片找到最好的裁切、缩放、移动位置

有时候照片的比例就是不对,无论如何裁切也找不到最完美的位置,这时候就要使用相应的「魔法展开」功能,可以用 AI 自动生成延伸扩展的背景,改变照片的尺寸、比例大小,方便我们进行更好的裁切与位置调整。

选择照片,进入编辑照片,选择「裁切」中的「展开」,就可以,选择插件想要展开的部分。

有时候一张图片素材让我不满意的地方不是图像,而是里面的文字,可这是一张照片,要如何修改上面的文字呢?利用 Canva AI 的「抓取文字」功能就有机会做到。

一样选择「编辑照片」,进入「抓取文字」,让 Canva AI 识别照片中的文字内容,读取成功的部分就可以手动编辑。

选择适合的字体并输入新的文字,照片中的文字就变成自己想要的版本咯!

有时候很想要一种立体特效字体、很想要一个特殊材质 ICON 图标,但就是找不到?那么利用 Canva AI 中的 Magic Morph〔魔法变形工具〕,把现有的文字、图标变成想要的特效即可。

我们可以在 Canva 的「应用程序」中浏览,找到 Magic Morph〔魔法变形工具〕,便能开始使用。适合用在图标、物件、文字〔中文偶尔可以,主要支持英文〕的 AI 修改上。

例如我选中一段文字内容,启用魔法变型工具,这时候可以用文字描述自己想要的特效效果。

等待 AI 生成并调整,就能获得四个不同的选择,挑选自己想要的插入设计图中即可。

这是 Canva AI 中的 AI 绘制图片功能,虽然效果可能没有 ChatGPT DALL-E.3Midjourney 那么好,但也堪用,且快速。

在新增元素的面板中,有一个用 AI 生成影像、视频的选项。也可以在应用程序中浏览,找到 Magic Media〔魔法媒体工具〕。都能利用 AI 生成图片,也能生成短片。

一样是输入文字,选择想要的照片风格、比例。

就能生成适合的图像。

搭配前面各种修图功能,调整一下,就能生成自己需要的各种图片素材。

如果要在各种不同社交、影音平台发布图像,就要好好利用 Canva 的魔法尺寸替换功能,可以自动把 Banner 等变成文件、YouTube 略缩图变成 Facebook 正方形图片。

做好的横幅图像,快速转换成方形,这可以节省许多调整时间。

Canva 的 AI 与自动化功能那么多,不知道可以用什么功能调整目前素材时,建议按下右下方的「Canva 助理」,可以提供各种建议,或是提供各种适合目前设计的图片扩充延伸素材,节省许多自己的尝试时间

第一个功能,和现在这个第 15 个功能 需要切换到英文版,其他功能在 Canva 中文版中也已经都可以使用。

英文版中,进入 Canva 设计 PPT 的画面,可以在搜索字段直接描述自己想要的简报主题与风格,就会自动用 AI 生成适合的简报模板。

你也可以从这里找到更多模板:2024 免费 PPT 设计模板下载!13 个免费 PPT 模板网站汇总

其实 Cnava AI 还有很多特殊功能,像是用 AI 编写文案,或者利用 AI 来制作小动画,还有很多应用程序可以使用。不过我们这篇文章就聚焦在跟图片生成有关的部分,分享我自己的工作流程,欢迎大家参考与分享。

AI Leaderboard – 关于 AI 及大语言模型 LLM 的各大排行榜汇总

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

最近有不少 相关排行榜,这也是关注获取所有 AI 资讯的渠道,也能看到目前 AI 发展程度。所以进行了整理汇总。

https://lmsys-chatbot-arena-leaderboard.hf.space/?__theme=light

LMSYS Org(Large Model Systems Organization),最为知名的目前大型语言模型的埃洛评级(Elo Rating)监测,过多次。目前该排名值得关注的是 Claude 3 Opus 仍然排名第一,并且其更便宜模型 Claude 3 Haiku 也超过了部分 GPT4 模型。

https://www.cbinsights.com/learn/ai-100-2024

综合评估选出了目前 TOP100 从事 AI 模型研究和的公司。Hugging Face(抱脸)凭借其强大的开源开发者社区支持,提供大量的预训练模型和集和相关综合排名第一,抱脸还有很多有意思的排名,如模型竞技场排名/最佳 AI 内容贡献者等都值得关注;第二名 Databricks 是家专注大数据处理的 AI 公司,通用开源的大型语言模型 DBRX 即由它们创建。后面跟着的是之前提到的法国黑马 AI 初创公司 MISTRAL 以及

Leaderboard Comparing LLM Performance at Producing Hallucinations when Summarizing Short Documents – vectara/hallucination-leaderboard

这是目前 AI 幻觉率(Hallucination)排名。截止今年 3月底,目前幻觉率最低 TOP 出现个 Intel Neural Chat 7B,其次 GPT4 幻觉处理仍然很好。

No Description

这个排行榜是「SuperCLUE:中文语言通用大模型综合性测评基准」排名,更关注中文语言的排行榜,包括古诗/文学/歇后语和方言等测试排名。除去 GPT4,排名靠前的即国内文心一言/智谱 AI/通义千问等。

Language models ranked and analyzed by usage across apps

大型语言模型使用接口排行榜和数据,有版本以及付费。

Web site created using create-react-app

AI 模型翻译质量和 Token 使用耗费排行榜。


还有些排行榜已经停止更新,这个榜单将持续补充。

相关链接

关于云服务流量费比较

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

使用云服务时,一个常被忽视的成本就是流出费。这指的是将数据从云服务提供商的发送到公共互联网的费用。

这里整理了常用服务的流量费用,可以快速了解不同云服务的流量费用差异,这不仅是单纯 VPS 比较,而是各类的云服务都拿出来比,像是存储类的以及 CDN 类的都有放进来。

如果超出了流量,每家供应商收取的 1TB 数据流出费用如下:

小提醒: 实际价格可能因地区和其他本文未列出的因素而有所不同。为方便比较,这里选择了最靠近北弗吉尼亚(美国)或法兰克福(德国)的区域,并根据统一的使用情况假设估算出这些价格。请务必查看供应商的定价页面以获取最新信息。

数据流出是指数据离开某个网络,更确切地说,是数据离开你的云服务提供商网络进入公共互联网。这可能是从云服务商到用户的数据传输,或是从一家云服务商到另一家的数据传输。

云服务商通常根据从其网络流出的数据量按 GB (1 GB等于1024 MB)或 TB (1 TB等于1024 GB) 计费收取每月数据传输费用。

从云服务商的角度来看,有两种数据传输类型:

实际操作中,可能是这样的:

要下载文件,用户设备需要从云服务商网络请求数据,而云服务商则需要将数据发送给用户(或内容分发网络等中间商)。这就会产生数据流出费用。

云服务商之所以收取数据流出费,是因为从其网络传输数据需要成本。他们需要为传输数据所需的基础设施和带宽付费。

不过,数据流出费也可能是为了阻止某些使用场景,比如跨云服务商大量传输数据。

大多数云服务商都提供一定的免费流出数据量,比如整个账户每月 100GB 的免费流量,或者每台服务器每月 1TB 的免费流量。

因此,根据你的使用情况和选择的云服务商,你可能完全不用为数据流出付费。

在尝试降低数据流出费用时,可以考虑以下几个因素:

Backblaze 的带宽费用算法颇有趣,每个月给数据量的三倍大小当作免费带宽,没记错的话因为 Cloudflare 是 Backblaze 的官方合作伙伴,两边的传输费用不计费,如果数据是可以公开的,可以通过这个方式免费链接出来;如果真的走一般的流量输出,收费是 US$0.01/GB (所以换算后是 US$10/TB)。

三家常被摆在一起的 VPS (LinodeDigitalOceanVultr) 的带宽也都是 US$10/TB。

以前没注意到的是 OVH CloudScaleway 的带宽费用是免费的?另外 Hetzner 虽然要收费但也很低?有机会可以测试看看,看一下质量如何?

稳中向好的公民意识和纳税人意识

DUN.IM BLOG

DUN.IM BLOG

讲一个真事,是我从 X 看到的。

一男子讲述,他把他老妈接到欧洲,没多久他老妈就开始在花钱方面「斤斤计较」,他妈妈自己买东西结账的时候,总金额比商品价格高,原来小票清单下面有个 tax。她就问儿子,买商品要交这么多税么?怎么在国内买东西就没有!男子说,「在国内也有的,都在商品价格里,只是没有单独列出来」。

男子说,从那以后他妈妈一下子就有了痛觉,通俗的说是「纳税人」意识,每次买东西都特别注意那个 tax, 都会记下来自己交了多少税。

一个在国内啥也不操心的大妈,在国外忽然有「公民意识」了,看到镇上修路的修了很久都有意见,忍不住要给主管部门打电话投诉,「我纳了税,这修路的说不定就花了我的税金」。

国内商品也有税,但都没写出来,很多人也不知道, 就算知道的也感受不到「痛觉」,因为你常年看不到那个数字。结果就是,很多人都没有纳税人的意识,以为自己工资不到 5000 就不是纳税人了。

没有痛觉的后果是什么?就是当大家看到一个个天文数字的腐败贪污案,当你看到给亚非拉送去的上亿美元的援助时,你听到一个市政工程有多少回扣、夸张预算的时候,只是吃了一惊(现在惊都不吃了,麻了), 而没有多少痛觉。你会潜意识觉得那是国家的钱,跟你没多大关系。

在这一点上,老中人和账单上看得到 tax 的歪果仁,对待政府花钱的态度完全是两码事。在歪果仁还在反对政府大撒钱、对外援助的时候,正义感使然的老中人觉得丫没大局意识,只会打算盘。体会不到人家的痛感。

这种心理多少有些慷他人之慨的自私。我们在主张正义的时候,敲得是键盘,人家是拿真金白银在做事。

我想如果公开给大家知道,老中给北方邻居输血时花了自己多少 tax,才会感同身受。

2024 最好的 YouTube 替代方案对比和汇总

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

毫无疑问,YouTube 彻底改变了在线娱乐格局。每个月全球有超过 27 亿人访问 YouTube,并且 YouTube 托管了超过 8 亿个视频。

YouTube 之所以如此受欢迎的主要原因是它的大部分内容都是“免费”的。但是,就像 的所有“免费”产品一样,免费即是最贵的。你在金钱上不付费的部分,你在上付出的代价就越大。

你的 YouTube 使用习惯会被分析,并结合你的搜索历史、Gmail 元数据、照片元数据、你如何使用 Android 手机以及更多内容,用以对你进行个性化广告定向推送。最近,这种情况已经达到了顶点,广告变得更加频繁和烦人。

网友推测,这是 Google 有意采取的策略,旨在推动人们使用其新的无广告 YouTube Premium 服务,这种怀疑得到了 Google 对使用广告拦截器的人进行积极打击的行动的加强。

家长们不仅应该关注他们的孩子是否接触到不适当的内容,还应该注意到他们是否被推荐到一条极端化的信息茧房。

作为内容创作者,YouTube 的激烈竞争需要你持续产出质量高、针对算法优化的内容,才有机会取得成功。尽管 YouTube 存在着巨大的变现机会,但取得成功可能很具挑战性,而且疲劳风险很大,因为你必须不断创作更多、通常更长的视频来满足不断变化的算法需求,而对这些变化几乎没有控制权。

↓ 下文点击标题跳转平台

我们将在下文讨论真正的 YouTube 替代方案,但得知道,目前没有一个提供与 YouTube 视频数量完全相匹配的产品,Youtube 本身也是有各种不同限制的。以下网站和应用程序可以让你观看 YouTube 内容,而无需观看广告、受到 Google 算法推荐或需要使用 Google 账号登录。

然而,请注意,以这种方式观看 YouTube 内容意味着内容创作者可能不会从 Google 那里获得报酬。因此,我们强烈建议您通过其他方式支持创作者,比如直接捐赠给他们、成为 Patreon 的赞助者、购买他们的商品或点击他们的推广链接。

Invidious 是一个免费、的 YouTube 替代前端,旨在为用户提供一种更私密的观看 YouTube 视频的方式,无广告或 Google 追踪。它既可以作为网站使用,也可以作为可和自行托管的开源软件使用。与许多 YouTube 前端不同(尽管不包括此处列出的),Invidious 不使用官方的 YouTube API(允许第三方应用程序和服务访问 YouTube 内容的软件),从而将与 Google 共享的数据降到了最低。

Invidious 实例由全球各地的不同个体托管。这意味着可用性可能有所不同,但在需要时很容易切换实例。在对广告拦截器采取更广泛的打击行动的时机上,YouTube 在 2023 年 6 月向 Invidious 发出了下架通知。然而,多个公共的 Invidious 实例仍然兴盛。

Invidious 可以在任何浏览器中运行,并且在移动浏览器上运行良好(包括 iOS 和 iPadOS),其中的播放模式尤其受到欢迎。

虽然 Invidious 本身不会保留日志,但你连接的任何实例都可以记录你的 IP 地址和你访问的 URL(例如,你观看的视频)。使用匿名服务可以阻止 Invidious 实例所有者知道你的真实 IP 地址。

此外,Invidious 默认会直接从 Google 服务器(googlevideo.com)获取视频,因此 Google 可以看到你的 IP 地址。同样,使用匿名服务将阻止这种情况发生,或者 Invidious 允许你通过所使用的 Invidious 实例代理连接到 Google 服务器。对于更精通技术的人士来说,另一个对隐私友好的选择是自行托管你自己的 Invidious 实例。

NewPipe 是一个轻量级、无广告、开源的 Android YouTube 客户端,强调隐私并提供流畅的用户体验。NewPipe 的显着特点包括:

NewPipe 可以作为 APK 进行侧载安装,并在开源的 F-Droid 应用商店上提供。虽然功能齐全(在许多情况下提供比官方 YouTube Android 应用更好的功能),但它不支持 Chromecast 或将内容镜像到大屏幕,这可能对一些人来说是一个不利因素。

NewPipe 整合了众包的 SponsorBlock API。这允许观看者报告视频中的赞助部分,然后你可以自动跳过这些部分。YouTube 视频直接从 Google 服务器获取,因此当使用 NewPipe 时,你应该使用匿名服务来隐藏你的真实 IP 地址。

FreeTube 是一个开源应用程序,适用于 、macOS、Linux 和 Android(作为 APK)。与这里列出的其他 YouTube 前端一样,它允许你在观看 YouTube 视频时无广告且不受 Google 追踪。它通过利用 Invidious API 和自身的内建本地 API 实现这一点。

默认情况下,FreeTube 会暴露你的 IP 地址给 Google。它包含用户可配置的代理设置来解决这个问题,但使用匿名服务更简单,可能会提供更快的连接速度。

这个基于浏览器的开源、隐私友好的 YouTube 前端提供了一个用户友好的方法来观看 YouTube 内容。默认情况下,你将自动连接到官方的 Piped 实例(https://pipedapi.kavin.rocks/),但你也可以连接到另一个公共实例(这里是一个列表)或私有实例(例如,如果你自己托管)。

与 FreeTube 类似,Piped 整合了 SponsorBlock API。Piped 默认代理所有内容,因此你的 IP 地址永远不会暴露给 Google。它还声称比 Invidious 更稳定和性能更好。

LibreTube 是一个基于 Piped 的免费开源 Android 应用程序,旨在为 NewPipe 提供更好的用户界面。与 Piped 类似(但不是 NewPipe),LibreTube 代理所有连接,因此你的 IP 地址永远不会暴露。

除了 YouTube 外,LibreTube 还从其他平台获取视频,包括 SoundCloud、PeerTube、Bandcamp 和 media.ccc.de。除了缺乏投射支持外,它与 NewPipe 相似,包括。LibreTube 可以作为 APK 下载,或者在开源 F-Droid 商店上提供。

如果你希望完全避开 Google,并寻找用户的视频内容,你的选择有限。在这个以隐私为重点的文章中,我们不会推荐像 TikTok 或 Shorts 这样的选择。

像 LBRY/Odysee 和 BitChute 这样的“言论自由”真正的 YouTube 替代流媒体网站存在,但这些网站很大程度上只是极端思想、错误阴谋论和仇恨言论的茧房。

Vimeo 是一个商业性的美国视频托管和流媒体平台。由一群电影制作者于 2004 年创建,以在多个平台上提供高质量视频而闻名,Vimeo 具有“艺术”美感,并受到艺术家和创意人士的欢迎。Vimeo 现在拥有约 1.75 亿用户和 140 万付费订阅者,他们支付费用上传和分享他们的原创内容。

近年来,Vimeo 越来越专注于提供软件即服务(SaaS),为创意专业人士和企业提供创建、编辑和广播高质量视频内容的工具。

Vimeo 为内容创作者提供先进的跟踪和分析工具,以衡量用户对他们内容的参与程度。默认情况下不支持 Google Analytics,但可以集成到订阅者的网站中(除了直播活动)。

然而,Vimeo 本身并不通过跟踪你在线上的行为来赚钱。它是无广告、友好创作者的平台,并且唯一一个可以被描述为 YouTube 竞争对手(即使是一个非常遥远的竞争对手)的真正的替代视频平台。

Nebula 是由一群名为 Standard 的 YouTube 创作者社区创建的订阅制视频流服务。它旨在为这些创作者提供一个平台,让他们可以在他们的主要 YouTube 频道之外尝试新的内容创意。

Nebula 的创作者根据观看时间获得报酬,收入被分配给创作者和 Standard。你也可以通过在线商店支持他们。

该服务托管了一系列多样化的内容,涵盖音乐、历史、游戏、电影和电视等类别,包括视频、播客和课程。Nebula 是无广告的,提供每月 5 美元或每年 149 美元的订阅计划,如果你想要访问“课程”(多部分交互式教育内容)。

该服务支持离线下载,并提供专门为 Nebula 制作的原创内容,包括纪录片、系列节目和特别节目。然而,需要指出的是,Nebula 上的大部分内容也可以在 YouTube 上免费观看。

自 2019 年推出以来,Nebula 已经显著增长,目前托管了超过 150 名创作者,拥有超过 65 万订阅者。Nebula 是无广告的,但没有关注隐私,并像任何其他商业网站一样跟踪你的活动。

PeerTube 是一个基于点对点技术的免费、开源、分散式和联合式视频平台(类似于种子 Torrent 的工作原理)。它允许任何人轻松设置和运行他们自己的视频网站(就像 YouTube 一样)。

所有网站都可以彼此交流,一个网站上的人可以与另一个网站上的人进行互动。你可以在使用该平台的所有网站中搜索视频,或访问建立在其上的网站。

不用说,与 YouTube 相比,公开索引的 PeerTube 网站上可用的内容数量是微不足道的。尽管如此,该网络上提供了一个丰富多样、有趣的视频范围。

几乎不可避免地,极端分子可以利用该平台来托管具有仇恨性或其他敏感内容的视频,但 Framasoft 的开发人员似乎真诚地致力于打击这一问题。它提供了一个举报内容的工具,官方网站链接到一系列经过审查的通用兴趣视频。

PeerTube 表示你“可能会在一些 PeerTube 平台上找到不合适的视频。但这绝对不是 PeerTube 内容的大部分。例如,在我们的公共索引列出的 900 个平台中,托管的只有约 ~1% 的视频被标记为包含敏感内容”。

作为一个非营利的 YouTube 真正的替代品,PeerTube 为内容创作者提供了内置的工具来获得收入。当然,创作者可以自由要求捐赠,而且托管 PeerTube 的个人网站也可以自由决定如何盈利。

如果你只想观看 YouTube 视频,而不想看到广告,也不想被 Google 跟踪和分析你的行为,那么现在有很多很棒的开源和注重隐私的选择。只是记住,大多数这些服务仍然需要使用匿名服务,来阻止 Google 看到你的 IP 地址。

如果你想要一个真正的 YouTube 替代品,不与 Google(或其他侵犯隐私的大公司)有关联,尤其是一个不仅仅是极端内容的存档所,那么你的选择非常有限。

Vimeo 提供了大量高质量、无广告的内容,并且有一个不涉及跟踪你一切活动的商业模式。但它仍然是一个专有的商业平台,并且托管的视频相比 Youtube 少很多。

Nebula 提供了一个支持你喜欢的 YouTube 创作者的好方法,而不必经过 Google,但我们真的需要另一个付费的流媒体服务吗?

开源的 PeerTube 在对比后看起来不错,但与 YouTube 相比,也许它只会成为最顽固的隐私爱好者的一个小众平台。

自己动手打造智能物联网设备

自从前段时间研究了智能家居设备之后,我便迷上了物联网和开源硬件。玩遍了市面上各种常见的物联网产品,总觉得各有不足,于是我突发奇想:干脆自己做一个!

对于我而言,现在市面上的物联网产品最大的问题在于太过封闭,不同厂商的产品都得用自家的 App 才能使用,而且大多数用户体验实在不敢恭维。虽然通过我前一篇博文介绍的方法将它们接入到 HomeAssistant 和 HomeKit 之后使用自由度会高得多,但依然无法满足我自己编写家居智能控制程序的要求。

当我问 Siri 客厅的室温是多少的时候,数据是这样传输的:米家温湿度传感器读取温度数据、通过 ZigBee 信号发送给米家智能网关、通过 Wi-Fi 发送到路由器,路由器再传给树莓派、HA 存储数据、Homebridge 读取和广播数据、手机上的 HomeKit 再通过 Wi-Fi 读取数据……可想而知,数据传输的环节越多,稳定性和数据时效性就越低。比如我想做一个根据电视画面的亮度来调整房间灯光亮度的设备,当电视在播放夜间画面(亮度较低)的时候调暗房间灯光来减轻屏幕反光的影响,反之则调亮灯光方便我吃东西。这时候就需要以百毫秒级的速率来读取光线传感器的数据,一般的商业产品很难满足这种需求。

此外,价格也是很重要的因素:一个硬件成本不超过十元的智能插座零售价高达两百多元;即使选用相对便宜的米家系列传感器和 Sonoff 开关,要实现我心目中真正的智能家居——家中所有电器全部智能化、每个角落都有人体感应器也将是一笔非常可观的开支。

初识 Arduino

于是我开始深入了解开源硬件方面的知识来打造完全合乎自己要求的物联网设备,这时候我发现了 Arduino 这个开源电子原型平台。它本质上是一个单片机,有丰富的针脚接口用于连接各类传感器、伺服器和继电器等等。在电脑上用 Arduino IDE 编写代码后,可以很方便地写入到微控制器上执行。更重要的是由于 Arduino 的软硬件都是完全开源的,让我能以很低的成本获取所需的软件和硬件。

Arduino 有很多种版本,加之以开源的 PCB 图为基础自行生产的第三方产品可谓数不胜数,我选择的是一个可以和我的第三代 Raspberry Pi(树莓派)结合使用的版本——因为 Arduino 本身只是个单片机,并不能像树莓派之类基于 ARM 架构的微型电脑一样连接网络和存储大量数据。虽然市面上 Arduino 也有能实现相关功能的硬件模块,但我依然认为搭配熟悉的树莓派更简单好用。

这个 Arduino 通过串口与树莓派通讯,同时封装了树莓派上的所有 GPIO 针脚,所以需要将它用 USB 线连接到树莓派,然后再将整个 Arduino 都插在它上面。

接入传感器

市面上有非常多的传感器可供选择,且售价大多不过二三十元。Arduino 支持接入模拟和数字两种信号的传感器,我第一个接入的温湿度传感器 DHT11 属于后者,所以要用杜邦线将它插到数字针脚上。

插好之后就可以开始写代码了。Arduino 主要用 C++ 来编程,这是一种我从未接触过的编程语言,还好我学过 Objective-C,所以还算是能读懂;配合万能的 Google、完善的官方文档和传感器厂商提供的实例代码,在开发过程中基本没有遇到什么困难。

虽然厂商提供了已经封装好的代码库,只需调用即可直接读取到传感器数据,不过我对从硬件电路到软件数据的传输和转换过程很感兴趣,于是一探究竟,才知道 Arduino 通过数字接口读取到的是 DHT11 传感器在一段时间内通过电压变化来传输的二进制数值:

按照官方数据表的说明,高电平输出 26 微秒左右表示 0,输出 70 微秒则表示 1,用逻辑分析器即可看到比较直观的效果,这里我偷个懒在网上找了一张已经标注好的图:

这里可以看到传感器总共输出了 40 位的数据,其中前 16 位是湿度,紧接着的 16 位是温度,最后 8 位则用于校验数据有效性,若为温湿度数值之和即为有效;温湿度的 16 位数据中只有前 8 位是有效数据,后 8 位是奇偶校验位,这里全部为 0,可直接忽略。

按照上述规则来解析,图片中的二进制湿度数据为 00011110,温度为 00011001,将它们转换成十进制即可得到最终结果:30% 相对湿度和 25 摄氏度。再计算一下 00011110 + 00011001 = 00110111,即最后 8 个奇偶校验位的数值,证明数据是有效的。

当然实际使用时并不需要自己计算这些,只要引入官方提供的代码库,简单调用一下即可获取传感器数值并通过串口输出,非常方便。

这里要吐槽一下 Arduino IDE 的代码编辑器,功能简陋到基本就是个带语法高亮的记事本,然而它的流畅性和视觉效果甚至还不如记事本……让我不得不在 Sublime Text 里写代码再复制过来编译。

接下来试试光线传感器,它传输的是模拟信号,所以要插在模拟接口的针脚上。软件方面就简单多了,调用 Arduino 内置的 analogRead() 方法即可获取亮度数据。

将数据传送到树莓派

现在已经可以用 Arduino 读取传感器的数据,接下来就要将数据传送到树莓派来做进一步处理。实际上之前所写的代码已经可以让 Arduino 把数据通过串口输出到树莓派上了,所以真正需要做的只是在树莓派上写个程序来读取串口输入的数据,我是用 Python 写的,只需六行代码。

测试成功后我又在 Arduino 上接入了六七种传感器,读取数据的方法都大同小异,这里就不再展开;不过随着数据量的增加,需要对数据进行封装才好解析。这里我选用了 ArduinoJson 库将数据转换为 JSON 格式输出,这样在树莓派上用 Python 读取就方便多了。

在树莓派上用 Python 读取到传感器数据之后,就可以自己写个程序通过我前一篇文章提到过的 HomeAssistant API 来自动控制家里的其他电器了。至此我的智能物联网终端已经初步完成,当然我还会继续研究如何实现更多新奇有趣的用法,包括如何进一步脱离网络传输,完全在本地直接控制电器等等,相信没有做不到,只有想不到。在学习 Arduino 传感器的过程中我还顺便了解到了很多关于电机、伺服器、继电器、ZigBee 通讯协议和无线充电的相关知识,让我很感兴趣,说不定哪天我会一时兴起,给它装上轮子和机械手臂,做成 AI 机器人管家之类的东西,哈哈。

HomeKit 智能家居深入体验

作为一个从小就爱捣腾数码产品的人,我对智能家居自然有着浓厚的兴趣。最近家里重新装修,便换上了批智能家居设备,我也借此机会对这个新兴领域深入研究了一番。

我觉得智能家居最重要的一点,就是用起来要比传统的控制方式更方便。这听起来像是废话,可实现起来却并不太容易,毕竟绝大多数所谓“智能家居”配套的 App 都非常非常非常难用,比如下图这种画风……即便难得遇到些好用的,想控制不同厂商的设备还得打开不同的 App 也是挺傻的一件事。

还好 Apple 去年发布了 HomeKit 平台,通过这个平台可以将不同厂商的智能家居设备聚合在一起显示和控制,并且深度集成到了 iOS 系统里,在锁屏状态下都可以直接控制所有智能家居设备,完全不需要打开厂商提供的 App;甚至可以不碰手机,直接喊 Siri 帮你控制即可,非常方便(逼格也不知要高到哪里去了);配合 Apple TV 或 iPad 作为控制中枢还能实现人不在家时的远程遥控和自动化控制等等。

然而 HomeKit 虽然已经发布了一整年,硬件的支持情况却并不理想,在国内更是没有得到足够的重视,很多标榜智能家居的厂商甚至不知其为何物。无奈之余,我也本着极客精神,开始研究自行接入的方法。

梳理一下我家的电器设备,大致可分为以下三类:

  1. 原生支持 HomeKit 的设备,如 Philips Hue 系列灯具等;
  2. 完全不支持通过网络控制的传统电器,比如空调、新风系统和电动窗帘;
  3. 可以通过网络控制,却未提供原生 HomeKit 支持的设备,比如米家系列、Sonoff 开关和 Dyson 风扇。

下面我就分享一下我的研究(折腾)经历,看看我是如何把它们统统加进 HomeKit 里的。需要注意的一点是:本文仅为个人经验分享,并不是教程,所以一些细节问题我就不展开了。相信网上已经有了不少相关教程,若有需要可自行搜索,也可以在这里评论与我交流。

原生支持的设备

这里是指生产商官方提供 HomeKit 支持的设备,普通用户就能开箱即用。然而所支持的设备并不多,我手头只有 Philips Hue 系列灯具和 OPSO 的智能插座等。

添加 Hue 灯具的方法非常简单:把 Hue 网关用网线接到路由器上,在官方 app 里根据提示搜索并绑定网关,然后添加灯具即可,完成后扫描一下网关上的序列号,所有灯具都会自动同步到 HomeKit 里。

不得不说,Hue app 的界面设计和用户体验是我所用过的智能家居类应用里最好的。不过把灯都加进 HomeKit 之后,这个 app 也就没太大用处了。

接下来是 OPSO 的智能插座,这是 Apple Store 官网上的唯一一个支持 HomeKit 的国产设备,产品包装很有苹果风,做工也不错,只需在 iOS 自带的 Home app 里扫描设备上的序列号即可使用,非常方便。不足之处是有点不太稳定,使用几天后出现掉线的情况,需要重置设备后重新绑定才能用,希望可以尽快通过固件更新解决。

添加之后默认显示的是插座图标,不过可以手动将它修改成一个灯泡

这就是目前作为普通用户所能体验到的 HomeKit,但我并不会止步于此,下一步将会用些非常规的技术手段把那些并未提供原生支持的设备也加进来。

要实现上述功能,需要借助一个名为 Home Assistant 开源平台(下面简称 HA),它运行在基于 Linux 的系统上,可通过 Web App 和 API 来访问,接入不同的模块即可控制局域网内的各种智能家居设备。

搭建 HomeAssistant

首先需要一个基于 Linux 系统的设备来运行 HA,由于它需要 24 小时不间断运行,所以我选择了超低功耗的第三代 Raspberry Pi(树莓派)。它虽然才一个巴掌大,本质上却是个功能完善的、基于 ARM 架构的电脑,USB、HDMI 和网线等接口一应俱全。

考虑到这台树莓派主要用于运行 HA,我选用了 HA 官方提供的 hassbian 系统。从 HA 官网下载 hassbian 镜像,在电脑上用 Etcher 写入到空白 TF 卡中即可。

安装完成后,将 TF 卡、电源线和网线都插到树莓派上就可以开机了。首次启动时 hassbian 会自动安装和配置所需环境,等待一两分钟后,在局域网内的其他设备上访问 http://hassbian.local:8123 就可以进入 HA 的 Web App 主界面。

这里可以看到 HA 已经自动识别了 Philips Hue 网关和局域网内的两台 Apple TV。这里的 Hue 是可以一键配置的:点击 Configure 再按下 Hue 网关上的实体按钮即可将所有相关灯具都自动添加进来。虽然 Hue 灯具本身已经可以用 HomeKit 控制了,但在 HA 中可以实现更多有趣的玩法,比如自动循环变色等等。

接入传统遥控设备

下一步开始接入那些不能通过网络控制的传统电器,这里需要用到另一个硬件:可以联网的万能遥控器。经过一番比较,我选择了对 HA 支持较好的 BroadLink,它可以发射用于控制空调等电器的红外射频信号和窗帘电机的 FM 433Mhz 信号。

单从硬件角度来看 BroadLink 非常不错,但是它配套的 iOS app 实在是……太!差!了!还好它对 HA 有着良好的支持,所以用这个 app 把它连上 Wi-Fi 之后就可以果断删掉了。

按照官方文档中的说明将 BroadLink 的 IP 和 MAC 地址等信息填入 HA 的配置文件后,在服务列表里就可以看到它了。通过 HA 调用 learn_command 指令,BroadLink 将会进入学习状态。此时用空调遥控器对着它按下开机键,HA 首页便会显示遥控空调开机的指令代码。

接下来要做的就是将这个指令代码按照官方文档的格式复制到 HA 的配置文件里,并给它设置一个名称。用同样的方法配置关机键后,重启 HA 即可在首页看到空调的开关。在 Web App 上点击开关,HA 便会读取这个指令代码并通知 BroadLink 对着空调发送与普通遥控器相同的控制信号,达到通过网络控制电器的目的。

窗帘电机、风扇和空气净化器等其他有遥控器的电器设备也用同样的方法设置之后就都可以通过 HA 来控制了,下一步是将 HA 接入到 HomeKit 上。

连接 HA 与 HomeKit

这里需要用到一个叫做 Homebridge 的工具,它可以在树莓派上调用 iOS 的 HomeKit API 虚拟出一个网关来,然后再用它的 HA 插件将之前添加过的电器都同步到 Homebridge 即可实现操作。安装过程非常简单,参考这几篇官方教程即可:

Homebridge 的 Github 主页
https://github.com/nfarina/homebridge

在树莓派上安装
https://github.com/nfarina/homebridge/wiki/Running-HomeBridge-on-a-Raspberry-Pi

与 HA 建立连接
https://github.com/home-assistant/homebridge-homeassistant

安装完成之后就可以在 iOS 设备上的 Home app 里添加 Homebridge 了,这里与原生支持 HomeKit 的硬件相同的添加步骤完全相同,只不过设备名称和设备序列号都可以在配置文件里自定义,能把自己的名字写到“厂商名”处的感觉还是挺好玩的。

至此,HA 上的所有电器设备就都可以直接通过 HomeKit 来控制了。下一步接入能通过网络控制但未提供原生 HomeKit 支持的电器,比如小米家居(米家)系列。

接入无原生支持的设备

我家的绝大多数单联墙壁开关都是米家的 Aqara 系列,经由米家多功能网关控制。使用 homebridge-aqara 插件即可将小米网关添加到 Homebridge 上。

插件安装完成后,需要在配置文件里填入网关的协议密码和 MAC 地址,获取这些信息需要用到一个小窍门:首先打开米家 App(iOS / Android 版本均可)并绑定网关之后,点击网关界面右上角的 ··· 按钮进入“关于”界面,接着快速连续点击界面底部的空白区域,直到列表中出现“局域网通信协议”和“网关信息”的选项;接下来进入通信协议界面,打开上面的开关即可看到协议密码;MAC 地址则藏在“网关信息”界面里的那堆 JSON 格式的信息中。将这些信息一起复制到插件的配置文件里,保存并重启树莓派即可。由于之前已经将 Homebridge 添加到了 HomeKit 里,现在新加入的米家设备都会自动同步过来。

至此,我已经可以用 HomeKit 控制我家几乎所有的电器了,但这还仅仅是个开始。随着 iOS 11 的发布,HomeKit 平台也得到了进一步加强,同时相关协议也逐渐公开了,相信以后会变得更智能、更好用。借助 HA 和 HomeKit 这两个强大的平台,可以充分发挥想象力来实现一些很有意思的玩法。例如配合人体感应器实现走进房间时自动开灯;通过设置情景模式实现跟 Siri 说“我要去洗澡了”即可自动关窗帘和开浴室灯等等;此外,我还用 Sonoff 智能开关、淘宝二十元买的电磁水阀和五金店买的几截水管 DIY 了一个自动滴灌系统,出门在外时也可以远程操控它给家里的花花草草浇水。

题外话

除了 HomeKit 外,HA 还能配合 IFTTT 和 Workflow 等效率工具以及各种开源项目实现更高级的用法,以及通过 RESTful API 实现与各种编程语言的双向通讯,使自己编写家庭控制程序成为可能,即使你没有 iOS 设备也可以愉快地玩耍。

比如我就随手写了一个 Linux 的 HA 客户端,当我想在 macOS 上关闭卧室空调时只需输入如下命令即可。由于我经常开着 Terminal,所以用这个比打开浏览器再进入 HA 的管理页面控制要方便得多(同时还附带满分装逼效果)。

我还更进一步,用 Python 写了个小程序来实现更智能的自动化功能,它除了有根据实时天气自动调整室内的灯光之类的基础功能外,还可以和我日常生活中的其他方面连接起来,比如当我的网站或者 Vary 的服务器出现异常时,会将我房间的灯全部调成红色以作警示;当手机定位我和家人都不在家,但人体感应器又检测到有人活动的时候(有贼!)就把家里所有的灯都改成阴森昏暗的蓝绿色……由于本文是以 HomeKit 为题,这些高级玩法就不详细展开了,如果大家感兴趣我就找时间再单独写一篇文章谈谈吧。

❌