Windows 10 11, 2019 2022,开机一段时间后资源管理器剧卡,操作延迟
服务器系统没有什么第三方软件
共同点是都挂载了 SMB 硬盘 4-10 个,大小 14T-60T 不等
主要为配置文件之类的大量小文件,但仅存在,实际上并没有使用
开机前 1 小时很丝滑,打开,复制,重命名等都十分迅速,
随着开机时间越长,以上操作就会变得越卡,哪怕复制个 1KB 的文件,甚至会卡个两三秒
一但开始卡了,重启资源管理器或杀掉全部第三方进程也无效,必须重启系统才恢复
有大佬知道怎么回事吗
按:本文原作者为 Chris Wellons,最初于 2024 年 11 月 10 日发表在其个人网站 null program 上,并声明归属公有领域。我们据此制作译文,以便中文读者阅读。
本文在 Hacker News 发表后的相关讨论也非常值得一读,有兴趣的朋友可前往查阅。
过去一个月以来,我一直在研究日新月异的大语言模型(Large Language Models,下称 LLM),尝试一窥其中奥妙。如今,一台树莓派就能运行比初版 ChatGPT(2022 年 11 月版本)还聪明的 LLM,换成一台普通的台式电脑或者笔记本电脑的话,运行更聪明的 AI 也不在话下。除了方便以外,本地化运行的 LLM 隐私有保障、数据不联网、不需要注册、也没有诸多限制。大模型正以前所未有的速度发展,现有的知识可能用不了几个月就过时了。我写这篇文章是为了记录我在上手 LLM 时积累的的实用经验和心得,希望这些必备知识能够帮你少走弯路。不过归根结底我也只是一个 LLM 菜鸟,文章中未必有什么独到之处,而且有些地方我可能也没弄明白。一想到一年之后这篇文章大概率就会成为历史的注脚,激动之余我自然也会有些惶恐。
就让我这个刚入门的菜鸟带你们入个门吧:LLM 是一种基于神经网络的技术;2022 年,人们在训练 LLM 进行「聊天」式对话方面取得了突破性进展,使得用户能够与这些人工智能自然地互动。这些模型不仅可以轻松通过图灵测试,与真人对话几乎无异,还展现出令人惊叹的创造力。如果这是你第一次接触这种大模型,感受到的不安可能一连几天都挥之不去。回想一下上次你买电脑的时候,你大概没想过人可以和机器有来有回地对话吧。
这让我回想起上世纪 90 年代桌面电脑快速革新的时候,新买的电脑刚刚送到家里就感觉已经过时了。而到如今,LLM 的发展速度更是快得出奇,几乎每周都有新变化,所以对于那些一年前发布的信息我基本上看都不看。想要掌握最新的资讯的话,可以关注 Reddit 的 LocalLLaMa 板块,但是这里的帖子个个吹得天花乱坠,所以记得别轻信其中的一面之词。
正是因为曾经经历过服务关闭、变更、或者因为其他原因导致我的服务器实例被停用的情况,我才对厂商绑定格外警惕。换新的服务提供商对我来说并非无法接受,但得让我能继续用下去才行。正因如此,过去几年内我对 LLM 并未抱有太大兴趣,因为那些所谓「封闭」的模型只能作为第三方提供的一项服务而存在,几乎涉及了所有上述的锁定问题,其中就包括模型的静默劣化(silent degradation)。直到某天,我了解到可以将接近顶尖的模型运行在自己的设备上,从而彻底摆脱这些束缚,这才让我改变了对 LLM 的看法。
这篇文章讲的是 LLM 的运行,并不涉及针对模型的微调和训练。而且这篇文章也只涉及文本,并不涉及图像、声音,或者其他任何「多模态」能力,因为就我来说还用不太到这些。
具体而言,想要在你自己的设备上运行 LLM,你需要的是分别是软件和模型。
llama.cpp 令人惊叹,也是我的唯一选择。原因在于,在基本的 CPU 推理这方面,也就是使用 CPU 而不是 GPU 来产生 token 时,llama.cpp 仅需一个 C++ 工具链,不像其他大多数方案那般都需要繁琐的 Python 配置,这点让它在众多可选项中脱颖而出。在 Windows 系统上,只需要一个 5MB 大小的 llama-server.exe
文件,不需要其他运行时依赖(runtime dependency)。更重要的是,由于 EXE 和 GGUF(模型)这两个关键文件都采用内存映射方式加载,所以很有可能即便过了几十年,你也可以在未来某个版本的 Windows 上以同样的方式运行同样的 LLM,且同样不需要额外配置。
我就直说了,我喜欢它是因为官方提供的 Windows 版本编译程序用的是 w64devkit。这些人真的是有点品味的!话虽如此,如果能用 GPU 做推理的话,就别用 CPU 做推理。虽然在台式或笔记本电脑上对 10B1 左右参数的模型的效果还不错,但是速度还是会更慢。我的主要用例并不是使用 w64devkit 构建的,因为我用的是 CUDA 来推理,而这需要用到 MSVC2 工具链。为了好玩,我曾把 llama.cpp 移植到了 Windows XP 上,并且成功在一台 2008 年的笔记本电脑上运行了一个 360M 参数的模型。能够在那台老旧的笔记本上运行这项技术的感觉真的太神奇了,毕竟在那会儿,这项技术的价值恐怕得值个几十亿美元吧。
GPU 推理的瓶颈在于显示内存(VRAM,下称显存)。因为这些模型真的相当大,而为了能够使用更大的模型,处理更长的上下文窗口(context window),对内存的要求也就更高。模型越大就越智能,上下文窗口也就越长,一次性可以处理的信息也就更多。VRAM 不足 8GB 的时候,使用 GPU 推理就不划算了。如果遇到「GPU Poor」的情况,就请用 CPU 来推理,这样的好处一是更简单,二是更容易上手。
llama.cpp 中提供了很多工具,但是本文只重点讲其中的 llama-server
。它本质上就是一个 HTTP 服务器(默认端口为 8080),并提供了一个聊天 UI,以及供程序(包括其他用户界面)使用的 API。一个典型的调用命令如下:
上下文大小(context size)是将输入和输出计算在内,一个 LLM 一次可以处理的最大 token 数量。上下文 token 的数量通常在 8K 到 128K 之间,具体取决于模型的 tokenizer3。普通英语文本使用 wc -w
来统计的话,每个词大约 1.6 个 token。如果模型支持较大的上下文,内存可能会先一步告急。此时应该把上下文大小调低一些,比如 --ctx-size $((1<<13))
(即 8K 个 token)。
我还没完全理解 flash attention 是做什么的,也不知道为什么 --flash-attn
或者 -fa
不是默认开启的(也许是因为精度较低?),但你无论如何都应该加上它,因为启用它可以减少内存需求,即便会降低精度也值了。
如果服务器成功地启动了,可以尝试访问(http://localhost:8080/)来先试一试。虽然你还是得先有个模型才可以。
Hugging Face(下称 HF)被誉为「LLM 界的 GitHub」,这是因为它提供了卓越的模型托管服务:无论是数 GB 的「小」模型,还是动辄数百 GB 的「大」模型,HF 都免费托管,获得此殊荣可谓实至名归。此外,大多数模型无需注册即可下载(个别例外),也就是说,你随时都可以下载我接下来提到的模型,自己试试。如此慷慨的服务让我十分震撼,以至于连我这种平日精打细算的人也在几天后开通了 Pro 账号。
如果你现在去 HF 逛一逛的话,你可能想问:「这里什么都有,那我到底要选哪个呢?」我一个月也和你有同样的疑问。对于 llama.cpp 来说,搜索 GGUF 即可。虽说 GGUF 并不是模型在创建或存储时的原生格式4,但你只需要找名字里面带有「GGUF」的仓库(repository)的话就好。这些仓库通常都是由更新频繁、助人为乐的第三方「量化器」(quantizer)提供的。
(官方文档里也没有明确解释「GGUF」究竟是什么意思,习惯了就好了。这就是走在技术最前沿的感觉:无论是什么,要么需要费很大劲才能找到,要么干脆就没有。你可能会想把 LLM 运行起来之后问问它,但我很快就会告诉你这样也行不通。至少据我所知,「GGUF」目前没有官方定义(更新:「U」代表「统一」(Unified)),但其他三个字母的含义仍未确定5。)
虽然以 Meta 最强模型命名的 llama.cpp 确实表现不俗,但并非我的最爱。最新版本是 Llama 3.2,但现在6能用在 llama.cpp 上的模型只有只有约 10 亿参数的 1B 和约 30 亿参数的 3B 版本。这两个模型有点太小了,实用性较为有限,而且只要你不是在树莓派上运行,即便用的是 CPU 推理,也可以有更好的选择,比如说 Llama 3.1 8B(如果你有至少 24GB 显存的话你没准还能试试 Llama 3.1 70B)。
搜 Llama 3.1 8B 时你会发现两个版本,其中一个标注了「instruct」,而另一个没有。instruct 表示该模型经过训练,能够依据指令完成任务,也就是用来聊天的,一般来说你要的就是这个。而没有标注的版本是「基础」(base)模型,只能续写文本(从技术上讲,instruct 模型同样也只是文本补全而已,但这个我们稍后会详细讨论)。如果基础模型也能标上「base」就好了,但是因为某些路径依赖问题,通常都不会这样去标注。
在 instruct 模型的「文件」一列中你是找不到 GGUF 文件的,如果你想要下载这些模型,你需要注册一个账号然后同意社区许可。这时我们回到搜索栏,在后面加上 GGUF,找相对应的 GGUF 模型就可以了:例如 bartowski/Meta-Llama-3.1-8B-Instruct-GGUF。bartowski 更新频繁,而且名声在外,这不但是 llama.cpp 专用的格式,而且无需注册即可下载。
你现在可以在「文件」页面里看到许多 GGUF 格式的文件了,这些是同一模型的不同量化版本。原始模型使用的是 bfloat16 张量,但如果只是为了把模型跑起来,我们可以舍弃大部分精度,同时将损失控制在最小。模型确实会变笨一点,懂得少一点;但是这样做可以大幅减少其所需资源。推荐的最多的是用 Q4_K_M
这种 4 位量化的版本,从我个人体验来看,这确实是个不错的选择。一般来说,一个大模型的 4 位量化比一个小模型的 8 位量化效果更好。一旦你把基本概念搞清楚了,就可以尝试不同的量化方式,看看哪种最适合你!
不同的模型在训练时有不同的权衡,所以没有哪个模型是最优的,在 GPU 性能不足时更是如此。我的电脑装了一块 8GB 显存的 RTX 3050 Ti,所以这方面的限制也影响了我对模型的选择。对于大约 10B 参数的模型,运行起来相对轻松;而若是想测试有着 30B 参数的模型的能力的话则稍显力不从心;运行 70B 参数的模型时我就会用第三方托管的方式了。以下我列出的「t/s」数据都是在这个系统上运行 4 位量化模型得到的。
表中省略了模型名字中的 instruct 字样,除非另有说明,否则这些列出的都是 instruct 模型。部分模型,至少在 LLM 能开源的范围内,是真正的开源项目,我已在后面标明了它们的许可证。其余的模型则对使用和分发都有限制。
这是 Mistral AI 和英伟达合作的模型(代号 Nemo),是我用过的最为均衡的 10B 模型,同时也是我的首选。其推理速度从 30 t/s 起步,令人十分舒适。它的强项在于写作和校对,并且在代码审查方面几乎能与 70B 的模型相媲美。虽然该模型训练的上下文长度为 128K,但是根据我的实际使用经验,其有效的上下文长度更接近 16K。
模型名称中「2407」表示它的发布日期是 2024 年 7 月,我个人很支持将日期写入版本号的这种命名方式,这样一来,你就知道这个模型的知识更新日期和技术水平,找起来也方便。如果不是这样做,版本管理就是一团糟。AI 公司搞不懂版本管理,就像开源项目不会起名字一样。
这是由阿里云推出的 Qwen 模型,其在不同规模的表现都超出了我的预期。14B 模型的推理速度从 11 t/s 起步,能力与 Mistral Nemo 相当。如果我的硬件跑得动 72B 模型的话,我可能就会选这个了,但目前我都是通过 Hugging Face 的推理 API 来试用这个模型。Qwen 同样提供了一个 32B 的版本,但是因为我的硬件跑不动,所以我也没花太多时间研究它。
谷歌推出的模型很受欢迎,大概是因为它有趣的特性吧。对我来说,2B 模型很适合快速翻译。和谷歌翻译相比,尽管 LLM 更耗费资源,并且如果遇到了它觉得冒犯的文本就罢工,像是科幻电影一样——但是在 LLM 面前,谷歌翻译就像是老古董了,更不必提 LLM 还可以离线运行。在我的翻译脚本中,我给它一段带有 HTML 标记的文本,并且要求 Gemma 保留标记,它执行得简直完美!9B 模型效果更好但会慢一些,我会选择用它来翻译自己的消息。
微软的特色是使用合成数据训练。而结果是,该模型在测试中表现不错,但在实际应用中效果不如预期。对我来说,它的强项是文档评估。因为它是一个 4B 模型,我曾加载过最多 40K token 的文档,并成功地获取到了准确的摘要和数据列表。
Hugging Face 可不仅仅是托管模型这么简单,就同等体量的模型而言,他们自家的 360M 模型同样异常出色。我那台赛扬处理器、1GB 内存、32 位系统的 2008 年的笔记本电脑也能用,在一些旧款树莓派上也可以跑起来。这个模型有创意、速度快、能沟通、会写诗,适合在资源有限的环境中使用,算是一个有趣的玩具。
这是另外一个 Mistral AI 模型,但其表现稍逊一筹。48B 听起来相当大,但这是一个 Mixture of Experts(MoE)模型,进行推理时只会用到 13B 的参数。这使得它非常适合在至少有 32G 内存的配置上进行 CPU 推理。该模型更像一个数据库,保留了更多的训练输入数据,但它在应用中可能不如预期,其中缘由我们很快就会说明。
又是两个我没法在自己的电脑上运行的模型,所以我会通过远程托管的方式来使用这两个。后者名字里的 Nemotron 代表这个模型经过英伟达的微调。如果我能跑得动 70B 模型的话,可能 Nemotron 就是我的首选了。我还是要花更多时间把它和 Qwen2.5-72B 做对比评估。
这些模型大多数都有特殊编辑过(abliterated)的「去审查」版本,消除操作可以减少模型的拒绝行为,但是也会以模型的性能下降作为代价。拒绝行为是很讨厌的,比如说 Gemma 就不愿意翻译它不喜欢的文字。可能是因为我比较无聊吧,我遇到的拒绝的次数不多,所以我还没必要做出这样的取舍。另外,似乎上下文的长度增长之后,拒绝行为就会变少,感觉有点「既然开始了,那就做到底」的意思。
接下来的一组是专为编程而训练过的「写码用」模型。具体来讲,他们进行了中间填充(fill-in-the-middle,FIM)训练,使得模型可以在现有程序内部插入代码——我稍后会解释这是什么意思。但是依我看来,这些模型不论是在代码审查还是其他指令导向的任务上都没有更出色,实际情况正好相反:FIM 训练是在基础模型上进行的,指令训练是在此基础上进行的,因此指令训练反而与 FIM 不兼容!换句话说,基础模型的 FIM 输出要明显更好,尽管你无法与这些模型进行对话。
我会在后文进行更详细的评估,但在此我想先提一点:即便是目前最顶尖的 LLM 生成的代码,其质量也相当一般。以下排名是基于与其他模型的对比,并不是它们在整体能力上的排名。
这是 DeepSeek 自己命名并推出的模型。推理时它只使用 2B 参数,所以它既和 Gemma 2 的 2B 版本一样快,又像 Mistral Nemo 一样智能,堪称一个完美的平衡。尤其是在代码生成方面,它的表现超越了 30B 的模型,如果我想要鼓捣 FIM 的话,这就是我的首选了。
Qwen Coder 的排名紧随其后。论输出结果的话和 DeepSeek 不分伯仲,但是因为并不是 MoE 模型,所以速度会稍慢些。如果你的内存是瓶颈,那么它就是比 DeepSeek 更好的选择。在写这篇文章的时候,阿里云发布了新的 Qwen2.5-Coder-7B,但是令人迷惑的是,其版本号并没有更新。社区里已经在用 Qwen2.5.1 来称呼这个版本了。刚才我还在说 AI 公司搞不懂版本管理来着……(更新:在发布一天后,14B 和 32B 的 Coder 模型也发布了,我两个都试了,但是都不如 DeepSeek-Coder-V2-Lite,所以我的排名没有变。)
IBM 推出的系列模型名为 Granite。总体来说,Granite 无法令人满意,唯独在 FIM 中表现异常优秀。以我的体验来说,它和 Qwen2.5 7B 并列第二。
我同样也测试了 CodeLlama、CodeGemma、Codestral、StarCoder 这四个模型。这些模型在 FIM 任务上的表现非常差,几乎毫无价值,我想不到任何使用这些模型的理由。指令训练所导致的负面效果在 CodeLlama 上最为明显。
我在前文提过,llama.cpp 是自带 UI 的,其他 LLM 中的 UI 我也用过,我感觉都大差不差。但是我本来就不喜欢 UI,尤其是在生产力环境下,所以我为我自己量身定制了 Illume。这是一个命令行程序,它能将标准输出转换成 API 查询,并在查询过后将响应转换回标准输出。把它集成到任何一个支持拓展的文本编辑器中应该都不成问题,但是我只需要它支持 Vim 就够了。因为 Vimscript 太烂了,估计在我接触过的最烂的编程语言里能排上第二,所以我的目标是尽量少写代码。
创建 Illume 的初衷是为了解决我自己的痛点,为了让我更好地探索 LLM 的世界。我总是会把东西搞崩,然后再去添加新功能来补救,所以稳定性方面我没法保证(大概你还是不要尝试使用它比较好)。
以 !
开头的行是 Illume 解释后的指令,这样写是因为正常文本中很少有这种写法。在一个缓冲区(buffer)中,!user
和 !assistant
交替进行对话。
这些仍然在文本缓冲区之内,所以在继续对话之前,我可以编辑 assistant 的回复,也可以修改我的原始请求。如果我想要它来创作小说的话,我可以要求它补全(completion)一段文本(而这并不需要指令训练就可以完成):
我可以打断它的回复,进行修改或添加一段自己写的内容,然后让它继续生成;这方面我还得多练练。LLM 也会识别出你添加的注释语法,这样你就可以用注释来引导 LLM 写你想要的内容。
虽然 Illume 主要是为 llama.cpp 设计的,但我也会使用不同 LLM 软件实现的 API 进行查询,且由于各个 API 之间存在不兼容性(例如一个 API 所需的参数被另一个 API 禁止),所以 Illume 的指令需要足够灵活和强大,因此指令可以设置任意的 HTTP 和 JSON 参数。Illume 并不会试图将 API 抽象化,而是会直接呈现出其较低层级的设置,所以要对远程 API 有所了解才能有效地使用它。比如说,与 llama.cpp 进行通信的「配置文件」(Profile)是长这样的:
其中 cache_prompt
是一个 llama.cpp 所特有的 JSON 参数( !:
)。大多数情况下启用提示缓存(prompt cache)会更好,但可能是因为某些原因,它默认是没有启用的。其他 API 会拒绝带有此参数的请求,所以我需要将其删除或禁用。Hugging Face 的「配置文件」是这个样子的:
为了兼容 HF,Illume 允许将 JSON 参数插入到 URL 中。因为 HF API 会过于频繁地进行缓存,所以我提供了一个 HTTP 参数( !>
)来将其关闭。
llama.cpp 独有一个用于 FIM 的 /infill
端点(endpoint)。该端点需要一个拥有更多元数据并进行过特定训练的模型,但是这种情况比较少见。因此,尽管 Illume 支持使用 /infill
,我还是添加了 FIM 配置,这样在读过该模型的文档,把 Illume 为该模型的行为配置好之后,我可以在任何为 FIM 训练的模型上通过正常补全 API 实现 FIM 补全,甚至是在非 llama.cpp 的 API 上也是如此。
该是讨论 FIM 的时候了。为了彻底弄懂什么是 FIM,我就必须追溯到知识的源头,也就是最原始的讨论 FIM 的论文:Efficient Training of Language Models to Fill in the Middle。这篇论文帮助我理解了这些模型是如何针对 FIM 训练的,至少足够让我也将这种训练方法应用到实际中。即便如此,在模型的文档中关于 FIM 的说明通常也很少,因为它们更希望你去直接运行他们的代码。
从根本上讲,LLM 只能预测下一个 token。所以 FIM 的方法是在大型训练语料库(corpus)中选取一些会在输入中出现的特殊 token,用它们来区隔前缀(prefix)、后缀(suffix),和中段(middle)部分(三者合称 PSM,有时也称「后缀-前缀-中段」,即 SPM)。在之后的推理中,我们可以用这些 token 来提供前缀和后缀,并让模型「推测」出中段内容。听起来很离谱,但这真的很有效!
比如在填补 dist = sqrt(x*x + y*y)
中括号里的内容时:
为了让 LLM 填补括号中的内容,我们在 <MID>
停下,并且让 LLM 从这里开始预测。注意到 <SUF>
起到的效果就好比一个光标。顺带一提,指令训练的方法差不多也是这样,但是在指令训练中,使用特殊标记分隔的是「指令(instructions)」和「对话(conversation)」,而并非前缀和后缀。
有些 LLM 开发者严格按照论文所写,直接使用 <PRE>
等作为 FIM 标记,并不在乎这些标记和模型的其他标记看起来完全是两个样子。更用心的训练者则会使用类似 <|fim_prefix|>
的标记。Illume 支持 FIM 模板,我也为常见的模型编写了相应的模板,例如针对 Qwen (PSM) 的模板如下:
Mistral AI 的习惯则是使用方括号、SPM 格式,并且省略「中段」token:
有了这些模板,我就可以在不被 llama.cpp 的 /infill
API 支持的模型中进行 FIM 训练了。
我在使用 FIM 时遇到的第一大问题是无法生成正确的内容,而第二大问题就是 LLM 不知道什么时候该停下。比如在我要求模型填充以下函数时(如给 r
赋值):
(补充一点:静态类型(static types)提示(包括这里的)可以帮助 LLM 更好地生成代码,起到防护栏的作用。)得到这样的结果并不奇怪:
原本的 return r
变成了 norm4
函数的返回值。得到这样的结果固然没问题,但显然这不是我想要的内容。所以当结果开始跑偏的时候,最好做好狂按停止按钮的准备。我推荐的三个 coder 模型较少出现这种情况,而更保险的做法是将其与一个能够理解代码语义的非 LLM 系统结合,这样在 LLM 开始生成超出范围的代码时可以自动停止。这种做法可以让更多 coder 模型变得更实用,但这就不是我折腾的范围了。
对于 FIM 的摸索和实践让我意识到 FIM 仍处在其早期阶段,也几乎没有人用 FIM 来生成代码。或许大家还是在用普通的补全方法?
LLM 好玩归好玩,但是它们能为提高生产力提供什么帮助呢?过去的一个月以来我一直在思考这个问题,但始终没有找到一个令我满意的答案。我们不如先划清一些界限,明确一下有哪些事情是 LLM 无能为力的。
首先,如果结果的准确性无法被轻易验证,那么使用 LLM 就毫无意义。LLM 会产生幻觉(hallucination),这也让它们变得并非绝对可靠。很多时候,如果你能够验证 LLM 的输出是否正确的话,你其实也就没必要用它了。这也就解释了为什么 Mixtral 如此庞大的「数据库」反而没什么用。同时这也说明,把 LLM 输出的结果投放到搜索结果里有多么的危险且不负责任,说难听点就是不道德。
然而即便是那些对 LLM 了如指掌的爱好者们也还是会踩这个坑,并且去传播这些虚构的内容。这使得针对 LLM 的讨论更为不可信,看 LLM 给我提供的信息的时候我得多留几个心眼。举例说:还记得我说过 GGUF 没有一个官方定义吗?你去搜一下就能搜得到一个明显是幻觉的结果,结果它还进了 IBM 的官方文档。我在这儿就不再提了,免得问题变得更严重。
其次,LLM 都是金鱼脑,「过目就忘」。也就是说,较短的上下文长度限制了它们的发挥。虽然有些模型使用了更大的上下文长度来训练,但是其有效上下文长度通常小的多。实际上,一个 LLM 一次只能在它的「大脑」中记住相当于一本书里几章的内容,如果是代码的话则是 2000 到 3000 行(因为代码的 token 密集度更高),一次性能够处理的也就这么多了,这和人类相比简直微不足道。当然也可以通过微调或者使用检索增强生成这类的工具来尝试改善,但是只能说……收效甚微。
第三,LLM 写代码的能力很差。往好了说,它们的写码能力也只不过是一个读过大量文档的本科生的水平。这话听起来还行,但实际上,很多毕业生在进入职场时几乎对软件工程一无所知,第一天上班才是他们的真正学习的开始。从这个角度看,现在的 LLM 甚至还没开始「学习」这一步呢。
但是说实话,LLM 写代码能有如今的水准已经很不错了!即便是把带有我强烈个人风格的代码丢给它,LLM 也能顺利理解并使用其中的自定义接口(但是需要说明的是:我自己的的代码和写作也是大部分 LLM 的训练数据中的一部分)。因此,只要是不超出有效上下文长度的限制,上下文长度越大越好。问题在于训练 LLM 写代码似乎并不比我自己写更省时间。
其实,单纯去写新的代码都算简单的了。困难的地方在于维护代码,以及在考虑到维护代码的同时再去写新的代码。即便 LLM 确实能写出可以运行的代码,也考虑不到维护问题,或者说,它根本没办法去思考这些问题。生成代码的可靠性与代码长度通常成反比平方关系,一次生成十几行代码就已经很不靠谱了。无论我怎么试,LLM 输出的能让我觉得还凑合的代码根本就超不过三行。
代码质量在很大程度上受到编程语言的影响。LLM 在 Python 上表现好过 C 语言;C 语言的表现又好过汇编语言。我觉得这多半取决于语言难度和输入质量:给大模型做训练的 C 语言素材多半都很烂,毕竟烂资源网上一抓一大把;而大模型对汇编语言的唯一了解就是糟糕的新手教程。当要求大模型使用 SDL2 时,它也不出所料地犯了常见的错误,毕竟它就是这样训练出来的嘛。
那训练大模型去写标准化代码(boilerplate)7呢?大概 LLM 在这方面会犯更少的错误,可能还有一定的价值,但处理标准化代码最快的方式其实就是——避免编写它。去简化问题,不去依赖标准化代码就是了。
不必只轻信我一家之言,看看大模型在赚钱方面怎么样就明白了:如果 AI 公司真的能够实现他们所宣传的生产力提升,他们就不会出售 AI 技术,反而会独自利用其技术去吞并整个软件行业。你也可以看看位于 AI 科技最前沿的公司的软件产品,和其他公司的产品一样,是同样的老旧、同样的臃肿、同样的垃圾。(而浏览这些糟糕的网站也是研究 LLM 的环节之一,一想到这里我就感觉很不爽。)
在生成代码时,「幻觉」造成的影响会小一些。因为你在提出需求时就知道自己想要什么,因此可以检查生成结果,同时还有编辑器来帮你检查你漏掉的问题(比如调用了虚构的方法)。然而,有限的上下文和不佳的代码生成仍然是障碍,我至今尚未能有效地解决这些问题。
那么,我可以用 LLM 做什么呢?我们列个表吧,毕竟 LLM 最喜欢列表了:
尽管有用的应用场景不多,但是这已经是近些年来我对新技术最兴奋的一次啦!
Everything 的长期测试版本 Everything 1.5a 发布新版本 1.5.0.1385a,推出全新的 Everything SDK3 平台,开发者可以将 Everything 的搜索功能集成到自己的应用程序中。并且进行了性能优化、稳定性增强,以及一些小的 bug 修复。针对拼音搜索,目前已经支持全拼、首字母两种方式,推荐更新。
No Description
虽然目前可以同时安装两个版本的 Everything(1.4 和 1.5a),但推荐直接使用 1.5a,因为有全文搜索。以及喜闻乐见的深色模式,也只有 1.5a 拥有。
根据上图设置。
Everything 1.5a 的拼音搜索有两种方式:
目前只能二选一:
具体方式:
今年 6 月,高通正式发布了骁龙 X Elite 和 X Plus 处理器,号称其拥有「全球最快的笔记本电脑 NPU」,并且能「为 Copilot 个人电脑注入强劲 AI 动力」。
高通技术公司的移动、计算和 XR 部门总经理亚历克斯·卡图西安(Alex Katouzian)对 X 系列芯片寄予厚望,表示这是个人电脑进入 AI 的新时代,与 Microsoft 的合作将骁龙 X 系列的力量与 Copilot+ 的力量相结合,提供突破性的 AI 功能,重新定义个人计算体验。
Microsoft Windows+ 设备部门企业副总裁帕万·达武鲁里(Pavan Davuluri)则认为「这是 Windows 个人电脑生态系统的一个转折点,由我们与高通的深度合作促成」。
同时,达武鲁里表示他「很高兴能够推出创新的 Copilot+ 个人电脑体验和设备,包括 Surface,这些设备具有领先的性能和能源效率」。
▲图源:nomusica
骁龙 X 系列处理器的呼声如此之高,其销量却并不尽如人意。
2024 第三季度是骁龙 X 系列处理器自推出以来的第一个完整季度。数据显示,尽管搭载该系列处理器的笔记本电脑出货量环比增长 180%,但其市场占有率相当有限,总销量还不到 72 万台。
这一出货量仅占 Windows 市场的 1.5% 不到,甚至低于第三季度全球 PC 出货总量的 0.8%。也就是说,每 125 台设备中只有不到一台使用了骁龙 X 系列芯片。
市场研究和分析公司 Canalys 则指出,搭载骁龙 X 系列平台的产品「仍然非常小众」,并且出货量最大的供应商是微软,该公司已将其大部分 Surface 系列产品转移到该平台,其次是戴尔、惠普、联想、宏碁和华硕。
Canalys 还表示「从 SKU(Stock Keeping Unit,库存进出计量单位)数量来看,戴尔对新平台的接受程度相当高」。
▲Surface(图源:Microsoft)
即使是在高通主打和引以为豪的「AI PC」领域,骁龙本也并未获得优势。
三季度,支持 AI 的 PC 出货量达到 1330 万台,环比增长 49%,占该季度所有 PC 出货量的 20%,而其中骁龙本仅占 5%。
值得一提的是,根据 Canalys 的数据,本季支持 Windows AI 的 PC 设备首次引领了「AI PC」市场,占据了 53% 的市场份额,出货量环比增长 93%,占 Windows PC 总出货量的 12%。
▲图源:Canalys
造成骁龙本销量低迷的主要原因,可能是其软件优化问题。
和苹果 M 系列芯片一样,骁龙 X 系列芯片也采用 Arm 架构而非传统的使用复杂指令集的 x86 架构。然而微软迟迟没有发布适用于 Arm 设备的官方 Windows 11 ISO,Linux 对骁龙 X 系列的支持也不如现有的 x86 替代方案。
▲图源:YouTube
此外,「性价比」不高也是造成其销量不佳的原因之一。
相较于定位高端市场的 X Elite 处理器,X Plus 面向大众主流市场,核心数量少,GPU 性能和 AI 处理能力略低,当然价格也更加便宜。然而,即使是主打「入门」的骁龙 X Plus 笔记本,其售价竟也在 700 美元左右,国内售价更是达到 6000 元。
据某测评室测评,一台售价 7199 元的骁龙 X Plus 笔记本,其核显性能只有 X Elite 的一半左右,甚至无法流畅播放 4K 视频,并且「无法完成影音娱乐的需求」。测评人员对这台设备的定语是「幽默」。
不过,高通透露将在明年开发、推出一款更便宜的骁龙 X 芯片,该芯片将面向入门级 Windows PC,售价约为 600 美元,以提振销售情况。
▲图源:太平洋电脑
尽管目前 AI PC 市场需求正盛,但人工智能电脑仍然有很长的一段路要走。
Canalys 的数据表明,消费者和渠道合作伙伴对采用这些产品仍然保持犹豫和观望态度。例如微软的 Copilot+ PC 需要至少 40 个 NPU TOPS 和其他高性能的规格,但尚未完全说服买家相信其价值。
今年 11 月,一项针对渠道合作伙伴的调查显示,31% 的合作伙伴不打算在 2025 年销售 Copilot+ PC,而 34% 的合作伙伴预计这些设备将占其销售额的 10% 不到。
为了打破这一现状,让自家产品「脱颖而出」,各个厂商都在绞尽脑汁想办法:惠普与独立软件供应商合作增强 AI 体验;联想投资了其产品内置的 AI 工具「Creator Zone」和「Lenovo AI Now」;苹果则专注于整合其 AI 生态。
AI PC 的赛道如此之卷,如果高通的「降价策略」也行不通的话,可真得好好想想办法了。
#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。
Stirling PDF 是一站式的 PDF 编辑工具,让用户能对 PDF 文件进行各种编辑操作,包括分割、合并、转换、重新组合、新增影像、旋转、压缩等等,特色是免费、开源〔GitHub〕,过程中文件只会存在用户的设备上,若在处理时有暂存于服务器的内容在下载后会即时从服务器删除,不会记录保存或追踪任何资料,相较于在线工具来说是更安全、隐私的解决方案。
1 Locally hosted web application that allows you to perform various operations on PDF files – Stirling-Tools/Stirling-PDF
Stirling PDF 提供多元的 PDF 编辑功能,涵盖文件组织、格式转换、安全性、检视与编辑等工具,满足各类文件处理需求,用户无需额外下载、安装软件,只要通过浏览器即可进行操作,Stirling PDF 有中文在内等多国语言界面〔在我写这篇文章时中文字串翻译率已达 93%〕,进入网站、找到对应的功能后就能直接进行编辑。
这项服务目前可以做到的功能包括:
1. 文件组织
2. 格式转换
3. 签名与安全性
4. 检视与编辑
5. 进阶功能
顺带一提,Stirling PDF 还有提供 Windows 版本,可以在没有连上网络的情况下使用,如果有兴趣的朋友可以在 GitHub 找到下载链接,原则上两者功能差不多,无论在线版或 Windows 应用程序都不用付费、也无广告干扰。
Stirling PDF
进入 Stirling PDF 网站后先从右上角语言选择「中文」。
接着从上方「工具」就能看到完整功能,依照类型分为:组织、转换为 PDF、从 PDF 转换、签名与安全性、检视与编辑和进阶工具,也可以直接从首页输入功能名称列出相关工具。
有一个 PDF 万用工具是整合旋转、裁切、分割、移除、新增图片等功能,进入后先点击左下角新增要编辑的 PDF 文件。
加入后 PDF 页面预览就会显示于下方,每一页都可单独旋转、删除或调整页数,将光标移动到页面中间时还会出现其他编辑选项,例如裁切或是加入图片,其实操作上很直觉,稍微摸索一下就会。
另一个压缩 PDF 也是很常在在线工具看到的功能,选择文件、设置压缩比或是自动模式〔自动调整质量以使 PDF 达到指定大小〕,就能快速压缩 PDF 以获得更小的文件容量。
点击压缩后就会开始处理,完成后自动跳出下载提示,我以大约 9 MB 的 PDF 文件、手动模式 3 级测试后获取一个约 2.5 MB 的新文件,压缩成效相当好,而且图片并没有失真或模糊等情形。
另一个也很常用到的功能是「分割 PDF」,可以将 PDF 指定页面删除、或只是留下需要的页面,使用方法也很简单就不多加赘述,Stirling PDF 会有预先设置的示例提示,用户照着格式稍作修改后就能完成相关编辑任务。
如果要说 Stirling PDF 有没有比较特殊、少见的功能,有一个「自动涂黑」工具很有用,用户只要输入要涂黑的文字,选择 PDF 后就会自动将识别到的文字涂黑,确保隐私和安全性,同时也省去手动编辑文件的时间,操作上更有效率哦!
下图就是使用自动涂黑工具识别、涂黑的 PDF 文件示例,指定文字就会被涂黑处理。
copyparty 是一款功能非常丰富的多功能文件服务器,主要用来分享你电脑、服务器、设备里的文件,并通过浏览器、WebDAV、FTP 等方式访问,还支持播放音乐、上传文件、权限设置等功能。
几乎可以在任何有 Python 环境的地方运行,还支持 Docker 托管,以及 windows 系统下的单可执行程序,甚至可以在 android 中运行。虽然运行很容易,但我不敢说它简单易用。
Portable file server with accelerated resumable uploads, dedup, WebDAV, FTP, TFTP, zeroconf, media indexer, thumbnails++ all in one file, no deps – 9001/copyparty
copyparty 给自己的定位是「便携式文件服务器,具有断点续传、重复数据删除、WebDAV、FTP、TFTP、零配置网络、媒体索引器、缩略图++,全部集成在一个文件中,无依赖。」
所有的功能集中在一个 .py 文件中,718 KB,直接运行就可以了。Windows 系统有编译好的 .exe 单可执行文件,双击也即开机用。其他平台直接 python copyparty-sfx.py
就行了。
就是文档太啰嗦了…看不下去。
直接运行就可以在浏览器访问 http://127.0.0.1 了,默认会使用 80/443 端口,打开就是这样的:
可以上传、下载、播放视频、听歌、看图片…非常纯粹的文件分享工具。有一种 Alist 的感觉,不过它不支持网盘。
只需要在启动的时候添加一个用户,就能设置权限了,包括只读、文件夹限制等等:
这一行的意思是创建了三个用户:u1/u2/u3,为它们挂载文件夹 music,对 u1/u2 两个用户只读,u3 用户可以写。
但注意有参数后,访问端口就变化了(3923)。
copyparty 默认开启了 WebDAV,只需要在你的 WebDAV 客户端里直接连 http://ip:3923 就行了。
甚至,你可以通过 WebDAV 把这个文件夹映射为 Windows 的网络磁盘,不过 Windows 默认需要 https,改一下注册表就好了。
而 FTP 则需要在启动的时候添加 --ftp 21
参数,用户名密码和上面的设置相同,不设置就支持匿名访问。
很多人都会依赖 iCloud 云端储存服务来备份 iphone 照片和视频,要是哪天 Apple 的 iCloud 云端不够用,打算想将 iPhone 原始照片下载到电脑备份,那可以通过本文会教大家如何轻松将 iCloud 照片一次性下载到电脑,并确保原始文件的完整性。
不管是通过 iPhone、mac、windows 电脑都可以直接通过官方网页下载 iCloud 照片原始文件,通过浏览器进入后,并且登录 Apple ID 和进行双重认证。
登录后会看见管理您的文件页面,以繁体页面为例,点击「要求拷贝你的资料」。
在获取文件页面中,往下拉到底勾选「iCloud 照片」选项后,点击「继续」。
选择导出 iCloud 照片后,可以选择压缩文件分割大小,能够设置照片备份文件超过多大就会自动分卷,最小 1GB 最大 25GB,最后可点击「完成要求」。
页面就会显示正在准备打包您的文件,时间最长需要七天,甚至还会要求验证是否为本人发出,如打包完成就会通过 email 通知,就可以通过电脑下载 iCloud 打包的备份文件。
最后 iCloud 照片文件准备完成后,再次登录隐私页面页面后,右侧就会看见文件已经准备完成,点入就能直接通过电脑将备份文件全部下载。
就在刚刚,openai 宣布推出 windows 桌面应用,向 chatgpt Plus、Enterprise、Team 和 Edu 用户开放 。
不过,官方表示,目前开放的只是早期版本,将在今年晚些时候向所有 ChatGPT 用户推出「完整的体验」。
例如,它还不支持高级语音模式,并且 GPT Store 的部分集成功能暂时也无法使用。
用户可以在微软应用商店搜索 ChatGPT,接着下载安装即可,安装包大约 110MB,附上下载地址:
The Windows app is currently only available to ChatGPT Plus, Team, Enterprise, and Edu users. This is an early version, and we plan to bring the full experience to all users later this year. With the official ChatGPT desktop app, you can chat about files and photos.
系统要求:Windows 10(x64 和 arm64)版本 17763.0 或更高版本。
在具体的使用过程中,OpenAI 提出了一个名为「Companion Chat」的辅助聊天功能,它允许你在不离开当前应用程序的情况下,快速访问和使用 ChatGPT。
这个功能类似于一个快捷方式或者浮动窗口,你可以通过特定的快捷键(Alt + Space)来调出这个聊天窗口。
借助这个聊天窗口,你可以快速地向 ChatGPT 提问、上传文件、生成图片或者开始一个新的对话。它还具有记住上次位置的功能,并且当主应用程序重置时,它会回到屏幕底部中心的位置。
此外,你还可以通过点击窗口顶部的「New chat」来清除聊天内容,或者通过点击「Open in Main Window」按钮将对话转移到 ChatGPT 的主应用程序窗口中继续。
如果不小心关闭了这个聊天窗口,你也可以通过查看侧边栏的聊天记录来在主应用程序中继续对话。
需要注意的是,如果这个快捷键已经被其他 Windows 应用程序占用,那么它将会不起作用,并且也不支持更改快捷键。
目前 ChatGPT 已经向 mac、Windows 两大操作系统开放桌面版本,但 Linux 却没有给出明确的时间表,也惹得不少网友在线催更。
另外,前不久 OpenAI 推出了 ChatGPT Canvas 功能,允许用户与 ChatGPT 合作处理写作或编程任务。
今天 ChatGPT Canvas 也更新了一个比较实用的功能,你可以点击右上角的「Show changes」图标来查看文章或代码的更改。
▲ Window 的 ChatGPT Canvas 功能,图片来自 @test_tm7873
如下文所示,我使用 ChatGPT Canvas 将朱自清的《背影》改写成文言文版本,点击图标,所做的更改一目了然。
实际上,今天更新的功能也算是补上了 ChatGPT 生态的重要一环。
不过,正如开篇所说,这个桌面版本本质上还是个阉割版,食之无味弃之可惜,尽管快捷键调用方式简单,但网页版所带来的体验明显会更好。
有人说 windows 11 适合大多数普通用户,即便个人需求不同,也可以在此基础上进一步调整(折腾)。仔细一想,更新使用 Windows 11 这段时间我确实进行了不少调整,稳定使用好一阵子之后,许多折腾过程被我逐渐淡忘。
于是想着写下本文作为记录,以便回顾,顺带给也有意深入调整 Windows 11 的朋友一些参考。
Windows 10 在初次使用的时候可以跳过网络连接设置,选择「离线账户」。这样可以避免微软账户的一些设置,但也会导致一些功能无法使用。而 Windows 11 在安装时──至少从 UI 来看──会强制要求连接网络并登录 Microsoft 账户。
如果你只想通过离线账户使用,或碰上微软服务抽风偏偏又无法登录的情况,在这一步可通过 Shift + F10
调出命令行,输入 oobe\BypassNRO
。命令执行后系统将自动重启,此后初始化过程中的网络配置会额外出现「我没有 Internet 连接」选项,再点击「继续执行受限设置」后续即可配置离线账户。而如果你已经联网,看到强制要求登录 Microsoft 账户界面后才寻找使用离线账户账户的方法,此时只通过上面的命令是不够的——至少从我唯一的一次经历来看输入命令后重启后仍然会自动配置好网络,此时则需要先输入 devmgmt
打开设备管理器、禁用无线网卡,然后再输入 oobe\BypassNRO
。
截至目前通过这些额外的手段还是能够使用离线账户,但微软如此收窄用户选择的空间,很难不让人揣测其意图,甚至给人留下一种不断侵蚀用户隐私和选择权的糟糕印象,毕竟在线账户只会让微软更轻松地收集各种用户数据,包括使用习惯、偏好设置等个人信息,而这些收集行为也不只在本设备,通过在线账户,微软也能更轻松地跟踪用户在不同设备间的行为,构建更完整的用户画像……收集到的数据则可以用于精准投放广告、出售给第三方广告商、通过与其他微软服务的集成二次扩大数据共享范围。
要知道 Microsoft 账户隐私设置界面着实复杂,迈过离线账户的坎,后面想要完全控制自己的隐私选项难度就不低了。
除了预装系统的 OEM 设备,新设备至少第一次的完整的更新是必要的,这些更新包含正常使用的驱动等。如果 Windows 更新无法为你下载安装特定版本的驱动,你也可以前往对应设备厂商的官网手动下载安装,如:
至于特殊的「鸡生蛋」情况──无线网卡驱动──没有无线网卡驱动无法联网、无法联网就无法通过 Windows 更新升级无线网卡驱动,可以通过 USB 网卡或者手机共享网络连接,或者直接下载驱动到 U 盘,然后在设备管理器中手动更新。对于 OEM 设备可以去对应官网寻找驱动支持,对于个人 DIY PC 主要前往主板官网下载最新驱动,当然如果你知道具体网卡型号(例如常用的 Intel AX210)也可以直接去对应官网下载。
说到 OEM 设备,OEM 厂商关于硬件的支持性应该优于更广泛的 Windows。倘若 OEM 厂商有提供完整的硬件驱动管理工具,这些工具优先级应该高于 Windows Update。为避免 OEM 驱动管理与 Windows 更新工作重复、覆盖乃至冲突,可以按照如下流程操作:
说回 Windows 更新本身。对于目前桌面端主要使用的三大(类)系统──Windows、macOS、各 Linux 发行版──相较于更加专用的各 Linux 发行版和产品线单一又严格由 Apple 控制淘汰周期的 macOS,兼容性最好的 Windows 在更新上也更容易受兼容性带来的多样性所困,从而很难实现更新行为和质量的一致性。这也是为什么每每听闻 Windows 更新问题时,总有人说「从来没遇到过」,也总有另一些人抱团抱怨仿佛 Windows 都快完全不可用了那般。
其实如今没必要过于抵制 Windows Update,更新内容本身带来的问题几乎没法举例,更多主要是更新过程中的意外。如果你很清楚自己在做什么,也可以尝试推迟 Windows 更新。除了在更多选项中至多推迟五周外,还可以通过修改注册表推迟任意长度时间:
你可以填写一个很大的天数,然后在需要更新的时候点击 Windows 更新中点「继续更新」即可方便地跳过更新推迟,在此之前不会收到任何更新检测或提示,更不会自动更新。
上述通过注册表推迟更新的操作可以通过脚本完成:
再配合任务计划程序实现自动化。这样就可以根据自己的节奏推迟更新、累计更新,例如每六周推迟五周等。
至于彻底禁止 Windows 更新,其实上文提到的通过注册表推迟到一个不可能的天数便可达到类似效果,除此以外还可以通过编辑组策略、修改更新服务器到一个空地址、借助诸如 Windows Update Blocker 等第三方工具等。这里不再一一赘述。
本篇围绕 Windows 11 系统本身的设置调整展开,尽量不涉及第三方软件、工具,若非要涉及也是主要是在辅助调整设置(例如把隐藏的系统设置项调出来)而不提供额外功能。
任务栏、开始菜单最直接的调整在「设置 > 个性化」中。
在任务栏设置中,我们要做的第一件事就是把塞满广告和各种无用信息的小组件整体关闭,然后根据个人习惯调整其他设置,比如我会将搜索仅显示图标、任务栏左对齐、永远合并任务栏按钮。
在开始菜单设置中,记得关掉第一面的所有推荐内容,并在「文件夹」中打开设置方便快速进入。
搜索栏在任务栏中的开始菜单附近,但是它的设置项目却在「隐私和安全性 > 搜索权限」中。而微软也往此处插入了一些「推荐内容」,需要在关闭设置项目最后的「显示搜索要点」。
在 Windows 11 中,即便解锁任务栏,我们也不能像 Windows 10 那般将任务栏拖动到屏幕左右侧,只能在底部。虽然通过修改注册表可以强行改动任务栏位置,但是会导致 UI 错位。更推荐的方法是使用第三方工具将整个任务栏回退到 Windows 10 模式,例如后面会介绍的 ExplorerPatcher。
除了任务栏和开始菜单,很多人在 Windows 11 中最先接触到的变化可能是右键菜单。其实如果不带成见来看,Windows 11 的右键菜单在设计上更加简洁、更符合整体设计语言,且按钮排布更加宽松,没有按钮增多时密密麻麻的视觉压迫感,也更适合触摸操作等非精确点击。
问题是,宽松的按钮排布,代价是并非所有功能都能直接在右键菜单中找到,部分功能被隐藏在「显示更多选项」中,且这些更多选项并非像「新建」那样以二级菜单展开,而是完全退回到类似 Windows 10 的右键菜单。在桌面/文件资源管理器按住 Shift 右键也能直接唤出这种经典风格的右键菜单,除了真的需要考虑触摸可用性,为什么不一开始就显示完全呢?
倘若你不想节外生枝使用复杂插件,其实直接修改注册表的方法也并不繁琐。
注销或重启文件资源管理器即可生效,右键菜单将恢复到 Windows 10 风格。
在我自己的日常使用习惯中,无论在 Windows 还是 macOS,虚拟桌面都是高频使用的功能。对于临时被打断或者由于时间问题没有完成的工作,在确保保存后我会将其原封不动放在原位置并新建一个虚拟桌面继续其他工作。同时在处理多个任务时候,我也会尽可能保证一个虚拟桌面内是一个相对独立的任务,相当于在标签页、窗口之上再加一层桌面维度,检索时更加快捷。
如此频繁的使用,自然容易在 Windows 10 升级到 Windows 11 感受到一些细微的变化。对于单次虚拟桌面切换来说动画是更加丝滑了——Windows 11 非线性动画的加速、减速比起 Windows 10 更加自然。但多次切换就有点灾难了,在 Windows 10 按住 Ctrl + Win
并多次按左右方向键时,滑动动画经历「加速 > 连续的桌面滑动(哪怕有来回)> 减速」停到目标桌面,而在 Windows 11 中,多次切换时,每次都会经历完整的「加速 > 减速」动画,相当于把单次切换简单的拼接起来,这样的动画在频繁切换时会显得有些拖沓。
以上都是针对快捷键切换虚拟桌面的情况,对于触控板切换来说动画都是尽量跟手的,而连续切换之间的停顿也符合直觉(毕竟触控板没法像快捷键那样连续多次按方向键,中间肯定也有停顿对应)。
网络上暂时没有找到将动画回退到 Windows 10 版本的方法,所以我简单粗暴地关闭了这个动画——在「设置 > 辅助功能 > 视觉效果 > 动画效果」开关可以关闭虚拟桌面切换动画,但是这样也会波及其他动画效果;在高级系统设置(cmd/Win + R: sysdm.cpl
)中的性能设置中视觉效果页关闭「对窗口内的控件和元素进行动画处理」也可以关闭虚拟桌面切换动画,但同样也会波及诸如 Win + Tab 窗口动画效果,不过从描述来看想必波及的范围更小。
我个人有个癖好是桌面不出现任何图标、任务栏只留一个文件资源管理器、所有应用在开始菜单以磁帖排布。在注意力有些散漫的时候 Win + D
回到桌面欣赏下壁纸休息——不得不承认 Windows 11 背景设置中的「Windows 聚焦」挺好看,同时又不会过分吸睛,应该是和 Bing 每日壁纸同源的。
在「设置 > 个性化 > 主题 > 桌面图标设置」中可以关闭桌面图标。遗憾的是当清空桌面图标后,角落「Learn about this picture」更加显眼,且没有显式关闭设置,除了再次借助 ExplorerPatcher,也可以通过修改注册表实现:
这样桌面就只剩下壁纸了。如果你第一次这么设置会发现有一尴尬之处──回收站怎么进?确实一般情况下回收站都是放在桌面的。这时可以通过在文件资源管理器的地址栏中输入 shell:RecycleBinFolder
打开回收站,然后将其固定到快速访问中,这样就可以在文件资源管理器的侧边栏方便访问回收站。
硬件部分关于屏幕、缩放、渲染等内容会占用太多篇幅且涉及技术原理部分可操作性不强。这里直接给结论:
在 Windows 10 之时我还能接受通过 noMeiryoUI 软件方式修改默认系统字体为更纱黑体,配合 MacType 软件实现更好的字体渲染效果(一定程度上抵消 ClearType 在高分屏的负优化)。虽然 noMeiryoUI 依然兼容 Windows 11,Windows 11 上更多的系统组件、官方应用并不默认遵守该设置,导致字体修改效果十分有限。
因此在 Windows 11 上我选择一种比较 dirty 但是好用的手段──将其他字体(例如更纱黑体)重新打包成伪装的「微软雅黑」并移动至 Windows 字体文件夹下以欺骗系统。chenh96/yahei-sarasa 提供了一个截止本文修改时仍运行良好的 Python 脚本自动将更纱黑体伪装为微软雅黑和宋体。
目前主要有三种方法将伪装字体替换系统默认字体:
这里仅展示第一种方法,不需要任何额外工具。在 Windows 恢复模式中的命令行使用 xcopy
将伪装的微软雅黑移动到相应文件夹下:
覆盖后重启即可。请特别注意不要在任何有用于演示、汇报用途的 Windows 设备上进行此操作,以免一些不必要的麻烦。
Windows 的色彩管理仍是一个相对混乱的领域,短期内是不指望能和 macOS 相提并论。但是 Windows 11 还是比前代 Windows 10 在 HDR 支持上有 明显改进,至少算是过了及格线。
在开启 HDR 之前,还请确保屏幕至少支持 HDR 600 标准,HDR 400 可以当作不支持看待(注意区别于 HDR true black 400,这是 OLED 标准,甚至严格过 HDR 1000)。OLED 和 MiniLED 屏幕往往效果更好。
全局开关在「设置 > 系统 > 显示 > HDR」。开完先别急,点击下面的「HDR Display Calibration」,这里可以矫正 HDR 显示效果。
「自动 HDR」功能可以将仅支持 SDR 的游戏转化为 HDR 输出,效果挺不错。但如果你的设备使用较新的 N 卡,那更推荐关闭此功能 Windows 11 的自动 HDR,用 NVIDIA app 内的 RTX HDR 替代。由于 HDR 会尽可能用尽显示器硬件性能,不能通过调整显示器亮度来改变内容整体亮度,在开启 HDR 显示时只能通过设置「SDR 内容亮度」将桌面调整至不开 HDR 相近效果。
在开启 HDR 模式下就是纯 HDR 信号输出,不存在区域渲染,原本 SDR 内容也会通过算法转化为 HDR 输出,这其中必然是会丢失信息的。目前消费级 HDR 显示器素质良莠不齐。如果在开启 HDR 模式看 SDR 内容时发现颜色「寡淡」,有可能是眼睛已经被各种「鲜艳模式」惯坏了,毕竟在开启 HDR 后系统会自动对 SDR 内容做 sRGB 限缩,从某种意义上这才是「正确」的颜色,除此以外就是显示器还跟不上,前者可以尝试常驻 HDR 模式适应,后者建议常用 Win + Alt + B
快捷开关 HDR 仅在消费 HDR 内容时开启。
「Wintel 联盟」现在似乎已经很少提起,当初意图取代 IBM 公司在个人计算机市场上的主导地位,直至现在 Microsoft 和 Intel 的合作依然紧密。Intel 新大小核处理器在 Windows 10 上有许多调度问题促使其用户不得不选择 Windows 11。
如果你在电源设置中发现缺少某些设置项目,除了一个个查注册表,更方便的方法是通过 PowerSettingsExplorer
这个仅调用 Power Management Functions 接口的小工具来调出那些被隐藏的选项。在 Windows 11 中与大小核调度策略有关的隐藏高级电源设置有:
在「高性能」电源计划中,这三个的设置按顺序是「0 – 自动 – 自动」,调度策略是「大核 > 小核 > 大核超线程」;如果将后两个设置同时设为「高性能处理器」,那么调度策略变为「大核 > 大核超线程」。总体而言异类策略 0 优先使用大核,对应的异类策略 1 优先使用小核。异类策略 4 比较奇怪,它是「节能」电源计划的默认设置,但是在烤鸡、游戏挂机等测试场景大小核调度策略几乎和「高性能」一致,怀疑是高负载场景积极调度、中低负载再节能的策略。
其实预设的几种电源计划均挺符合直觉的,没必要过于纠结。即便有极端省电需求也不建议完全小核优先,其实该设置中的所谓「高效处理器」也就是小核还真未必比限制后的大核能效比高。看看对功耗更加敏感的移动端,都有越来越多大核的势头,乃至天玑的全大核构想。当然移动端大核甚至还没够到桌面端的小核,不能简单横向比较。不过时至今日我依然对桌面端异构架构持保守态度。
以上都是针对 Intel 新处理器的情况,对于 AMD 全大核处理器,Windows 11 的大小核调度反而引入额外问题导致游戏场景表现甚至不如 Windows 10。众所周知,锐龙 CPU 各核心都有成为 CPPC 属性,代表各个核心的「体质」,在 AMD 官方工具 Ryzen Master 中可以查看的金、银核心分别就是 CPPC 最高的两个核心,而 Windows 11 会将 CPPC 最低核心视为小核(高效处理器)进行调度。通过上述真正大小核的 Intel 处理器上观测的不同异类调度策略并在 AMD 全大核处理器上对应测试,发现 Windows 11 对 AMD 处理的调度的确遵循 N-1 个高性能处理器和 1 个高效处理器的策略。这样默认的调度策略会更不倾向调用所谓的小核,这种不对称可能会导致更多的跨核行为、特别是游戏场景频繁地 L3 缓存争用造成无端性能损失。
之前的民间偏方,在 BIOS 开 PBO、XMP/EXPO 的同时顺手把 CPPC 关掉,或许也是由此而来。
早在去年 UP 主 @开心的托尔酱
在视频 关于 Windows 系统对 AMD 的负优化—异类线程调度 就有提到这个问题。而在最近 AMD 在社区更新 关于 Zen 5 游戏性能提升远不及理论的回应,宣布 Windows 11 24H2 将通过优化「branch prediction」 来提升 AMD Zen3/4/5 系列处理器的性能表现,部分游戏甚至有 10% 以上提升,要知道 Zen 5 由于相较于前代提升过于微妙有被戏称「Zen 5%」,更有特例 5700X3D 在 Windows 11 上性能表现比 Windows 10 差 15%……该说锐龙 CPU 首发一如既往地一言难尽呢、还是说与 Windows 合作不够紧密呢?
当然,尽管 Windows 几个电源设置的预设符合直觉无需额外调整,电源设置里还是有很多可玩性的,例如不用重启调整 CPU 睿频参数等。具体不再展开,感兴趣可以参阅 Windows 电源设置注释。
Windows 11 在「设置 > 账户 > Windows 备份」中可以设置包括文件、设置等备份选项,但似乎必须绑定微软账户使用,对于离线账户并不友好。且这种方法不支持备份系统。
个人认为更好用的还属控制面板中的「备份和还原(Windows 7)」,不仅支持对系统分区全量备份,还支持制作系统镜像和系统恢复盘。虽然 Windows 在 知识库 中鼓励大家尽可能使用设置取代控制面板,无奈前者体验还偏偏不如后者。
此外,Dism++ 也提供系统备份功能,同时支持不添加文件的增量备份(不算快照)。Dism(Deployment Imaging and Management)是 Windows 自带的一个工具,用于安装和维护 Windows 映像,Dism++ 只是将常用命令封装成 GUI 便于操作,并没有额外单独实现,这种备份也算是半官方方法。
还有两个系统功能看似很好用但是我不推荐:一是系统检查点,它本意主要用于系统更新失败的回滚,很难说胜任纯粹的系统备份,对个人文件的行为很奇怪经常在回滚的时候搞得一团糟;而文件历史,它默认备份整个用户目录,需要自己一个个排除,且该功能仅放置于控制面板,微软对此也并不算上心,一个 bug 三五年不修。
话说回来,目前单独备份系统的意义远不如备份文件,通过链接把一些应用的数据文件夹(例如微信保存的文件)link 到其他分区、外置存储乃至云端上,更多链接操作留到后续关于快捷创建链接的工具那一部分。
Windows 11 正常要求硬件支持 TPM 2.0。TPM 芯片是一种安全加密处理器,包含多个物理安全机制以防篡改。BitLocker 会将专用密钥存储在 TPM 芯片内,在除了更改 TPM、BitLocker 检测到 BIOS 或 UEFI 配置、关键操作系统启动文件或启动配置的更改之外的情况下,BitLocker 会自动解锁,用户登录无需进行任何额外交互即可解锁。无其他加密手段建议对系统盘开启 BitLocker,这已经是 Windows 集成最高、最无感的方式。
关于几个关键问题:
如果真有换设备需求,但是事先忘记解锁 BitLocker,会导致无法访问数据吗?
不会。在创建加密的时候 BitLocker 同时会创建恢复密码,可以将其打印或存在安全位置。检测到硬件更改后 BitLocker 进入恢复模式,用户输入恢复密码可以重新访问数据。
备份工具是否支持 BitLocker 加密盘?
对于基于文件系统的备份方式来说,理论上解锁后 BitLocker 是透明的,先解锁再备份即可。对于分区的备份方式,理论上可以不解锁整个区拷走,但是加密后不知道哪一部分是空的会导致备份文件更大且不好压缩,虽说 BitLocker 通过长长一串恢复密码也可以离线挂载,但不建议盲目还原。
BitLocker 是否会影响性能?
理论上会,但实际上体感不明显。别单看开 BitLocker 后硬盘读写速度有的下降超 10%,解密过程应是压力越大损耗越明显,所以不能根据硬盘测速这一极端压力情况下的性能损耗来界定 BitLocker 的性能损耗。
BitLocker 闭源,微软可以添加后门,如何保证安全?
你说得对,可以尝试开源方案 VeraCrypt,支持 Windows 11 系统加密,在普通分区加解密上还提供更好的跨平台支持,但是 VeraCrypt 不支持 TPM 且由于理念不合永远不会支持,在和 Windows 集成上肯定也不如 BitLocker 无感。看你愿不愿意拿所谓的安全换便利了。
平心而论,这个软件本身并没有什么问题,但是大陆用户对「电脑管家」的 PTSD、早期仅在中国区推送和不事先提醒地静默安装才是其被人诟病的原因。
后来,我的区域美国、语言英语的 Windows 11 也被推送,Reddit、Discord 也有相关讨论,才得知微软打算全球推送。单看软件本身,清理、加速、系统保护项、应用管理、常用小工具(截图、字幕、翻译、词典、以图搜图等)还有快捷修复建议,其实就是可能原本在设置里藏很深的 Windows 已有功能的拿出来,不需要联网也没有广告,不像小组件和 Office Plus 那样尽塞垃圾。
如果抛开前两点,静默安装也确实不厚道,用户的诟病并非完全无端。不过实现手段其实不是 Windows 更新而是 Edge 后台下载安装包安装。所以它就单纯是个软件,看不惯直接卸载就好。Edge 自从某次我重装系统后,在搜索 Chrome、进入 Chrome 官网时用大半个页面阻挠我安装 Chrome 我就已经心留芥蒂,出了这一茬直接让我彻底禁用 Edge,还不能简单卸载,留到后面 Remove MS Edge
插件部分。
除了深入设置、注册表、组策略等方法调整系统外,还有一些第三方插件可以帮助我们更好地使用 Windows 11。当然这里提到的插件依然主要针对系统调整,不发散到更广泛的效率提升上。
Windows 本身其实一直缺乏一个好用的包管理器,不提不如 Linux 各发行版的,就连 HomeBrew 类似产品都没有。微软官方推行的 WinGet 严格意义上称不上包管理器,它并没有提供统一的包格式,而是依赖于各个软件的安装程序下载下来静默安装,正如 HomeBrew Cask。Scoop 才稍微有些包管理器的感觉,安装同时也能自动配置环境变量,在迁移时备份还原更方便。如果不介意添加多余的工具,用 UniGetUI 可以一次性管理 WinGet, Scoop, Chocolatey, Pip, Npm, .NET Tool 和 PowerShell Gallery 多个包管理器。
仅关于 Scoop 的安装,在 PowerShell 中输入以下命令即可:
倘若你还希望使用 UniGetUI,可以在 PowerShell 中输入以下命令通过 Scoop 安装:
Windows 并不像 macOS 通过三个应用分别控制桌面、Dock 栏、Finder,而是通过一个「资源管理器」一并控制。而 Windows 11 相较于 Windows 10 许多令人不满的改动──任务栏、开始菜单、右键菜单──都可以通过介入资源管理器来调整。
虽然前面系统设置部分已经提到部分调整手段,但是这些调整往往需要手动修改注册表等隐藏更深的手段。如果你不想折腾,亦或是觉得这些调整不够全面,可以尝试 ExplorerPatcher 这款开源插件,不仅可以将任务栏、开始菜单、右键菜单一并调回 Windows 10 风格,还有许多诸如屏蔽 Office Key、禁止文件高级搜索、取消窗口圆角等功能。
虽然在部分时刻,例如系统更新后,ExplorerPatcher 偶有失效,但考虑到开源插件能做到这种程度,完全配得上其自称的「增强 Windows 上的工作环境」宗旨,无需吝啬赞美。
开源项目 Power plan switcher 可以在系统托盘中切换电源计划,支持快捷键、自动切换等功能。
一般来说对于长期接通电源或者没有续航焦虑的设备可以常驻「高性能」或「卓越性能」电源计划,这些计划的默认设置已经十分符合直觉,无需额外微调。
而对于笔记本电脑,它有时接通电源有时使用电池,前往控制面板翻出电源计划设置十分麻烦。PowerPlanSwitcher 可以不仅在系统托盘中切换电源计划,还支持在电源状态变化(从 AC 供电到电池供电)时自动切换对应电源计划。
官方称该软件支持 Windows 10,但实际上在 Windows 11 上也能正常使用。
Microsoft PowerToys 是一组实用工具,可帮助高级用户调整和简化其 Windows 体验,从而提高工作效率。
作为一款出现在 Microsoft 知识库的官方工具,可能考虑到不用像 Windows 那样背负沉重的历史包袱,PowerToys 工具箱中的绝大多数功能都轻量、专一且直击用户需求,被誉为 Windows 用户必备瑞士军刀,且在 GitHub 上完全开源,算是微软给我留下正面印象的产品之一。
早在 Windows 95 时代,PowerToys 就集成了包含了 Tweak UI 在内的共计 15 个小工具,Tweak UI 可以调整 Windows 中原本需要修改注册表才能访问的较为晦涩的设置。微软在 2019 年接管并重新推出 PowerToys,目前也已经有如下我认为很好用的功能:
同时还有诸如 Color Picker、Image Resizer、Text Extractor 等一众小工具,让你免去管理一堆小工具的烦恼、也减少众多工具中出现某几个断更的风险。PowerToys 也有丰富的 第三方插件,例如 PowerTranslator 在 PowerToys Run 中直接翻译文本、
EverythingPowerToys 在 PowerToys Run 中通过 Everything 检索文件、
ChatGPTPowerToys 在 PowerToys Run 中调用 chatgpt、
PowerToys-Run-Spotify 在 PowerToys Run 中让 Spotify 放歌等等。
各个工具具体用法这里不再赘述,PowerToys 每个工具页面都有详尽的描述。
单看 PowerToys Run 中的文件搜索功能其实比较孱弱,而 Windows 资源管理器的搜索效果更是惨不忍睹。Everything 通过访问 NTFS 文件系统的 USN 日志,在数秒内检索 TB 级别硬盘,并实时监测所有文件的增改情况,同时支持通过正则表达式进行文件精确匹配,还可通过插件与 PowerToys Run 联动。
自从某次我重装系统后,Edge 在搜索 Chrome、进入 Chrome 官网时用大半个页面阻挠我安装,反而彻底让我将 Edge 定位明确为 Chrome 下载器。更改默认浏览器后某些链接还是会给我跳转到 Edge 打开,之后还闹出自动下载静默安装微软电脑管家一事。
不过 Edge 是不能够简单直接卸载的,可能会导致一些依赖系统 WebView 的应用出问题,而且可能在某次重启后惊觉 Edge 又回来了。
Remove MS Edge 这个工具旨在通过可执行文件或批处理脚本以静默方式彻底卸载 Microsoft Edge,并提供保留 WebView 选项。
虽然 PowerToys 的 Keyboard Manager 也能完成一些键盘映射的工作。但是 AutoHotKey 作为完整脚本语言,功能更加强大,可以实现更多的自定义功能。
例如我对于大写锁定键的需求很小,但是却又有频繁的中英文输入法切换和自定义快捷键需求。自定义快捷键时一般会引入 Hyper 键 的概念,在 Windows 上即同时按下 Ctrl
、Shift
、Alt
、Win
四个键,这样可以避免与系统快捷键冲突。
我希望产生下述行为:
这种行为仅通过 PowerToys Keyboard Manager 是难以实现的,但是通过 AutoHotKey 可以轻松实现:
同样的,在 macOS 中文输入法会自动将 Shift
+ [
/]
映射为部分中文排版更推荐的直角引号「/」
,而 Windows 自带输入法并没有这个功能。除了更换输入法、全局替换掉某个键、设置字典打出一对引号等方法,通过 AutoHotKey 识别当前输入法状态并映射不同的按键不失为一种更优雅的解决方案。
在 Windows 上也有自带的 Win
+ V
的高级剪贴板功能,甚至可以和微软账户绑定实现云同步。但是这个功能对我而言比较花里胡哨,UI 确实更加现代化也与系统保持一贯风格。不过系统自带的剪贴板历史过于循规蹈矩,保存的历史条目太少不说,在隐身浏览器模式下乖乖不记录。Ditto 作为一款开源剪贴板增强工具,UI 更加简洁紧凑,可以保存更多历史记录、支持搜索、支持自定义快捷键、同时还有清除格式等高级粘贴功能。
配合 AutoHotKey 设置的 Hyper 键,我一般通过 Hyper
+ V
调出 Ditto 剪贴板历史记录。
C++ 编写的小工具具有不俗的性能,在保存 300 条目且不随时间清空的情况下,调出和检索都察觉不到卡顿,且占用极低只用个位数 MB 内存。
在 macOS Finder 中,Quick Look 赋予空格快速预览文件夹属性或者多种文档内容功能——俗称「一指禅」。Windows 用户一直垂涎这种功能,虽然 Windows 资源管理器也可以通过侧边栏预览,但是这种方式开启后任何选中都会预览,占用大量资源,同时支持的文件内容类型也有限,还会有反馈带来奇怪 bug。
这催生了 Windows 同名第三方开源插件 QuickLook,行为几乎与 macOS Quick Look 一致,通过空格快速预览,同时支持通过 引入插件的插件 形式支持预览 markdown、jupyter notebook、电子书等更多格式文件,并且支持在 Directory Opus、Files、OneCommander 等第三方文件管理器中使用。
MacBook 触控板和妙控板凭借着超大的触控面积、以假乱真的震动体验和 macOS 软硬结合,造就了曾经以及当下最优秀的触控板体验。许多 macOS 用户或许和我一样并不愿意使用鼠标,而是更倾向于触控板。其中稍微有些弯弯绕绕就属 macOS 的三指拖拽,如此好用的功能就藏在辅助功能里。
当然随着微软给出精确式触控板的驱动和建议硬件规格,也体现出 Windows 对于触控板的上心,目前绝大多数 Windows 设备触控板也都支持精确式触控板,相当一部分产品日用体验已足够优秀。可惜的是即便系统对于多点触控的支持已经覆盖从二指到四指,但是三指和四指滑动手势略有重合且使用频率不高,Windows 也没有给出类似 macOS 的三指拖拽功能。
好在可以通过插件 ThreeFingerDragOnWindows 在 Windows 上实现 macOS 的三指拖拽,依赖 .NET
运行环境实现。使用前请确保通过触摸板设置中禁用「轻点两次并拖动以多选」行为和所有默认的三指轻扫行为,这样拖动操作才不会受到干扰。
相较于 Windows 10 主题色、背景和明暗模式的割裂设置,Windows 11 将更统一、更完善的「个性化 – 主题」设置提到更优先位置,并提供若干预设主题。但是 Windows 11 仍然没有 macOS 那样的自动切换深色模式功能。Windows Auto Dark Mode 支持通过设定固定时间或跟随该定位的日出日落时间自动切换深色模式,同时可以自定义深色、浅色模式对应主题。
在前文提到:
目前单独备份系统的意义远不如备份文件,通过链接把一些应用的数据文件夹(例如微信保存的文件)link 到其他分区、外置存储乃至云端上……
所谓「链接」,在文件系统中指的是软链接(符号链接)和硬链接──两种创建文件引用的方法。软链接(符号链接)是指向另一个文件或目录的路径,可以跨文件系统,类似于快捷方式;如果原文件被删除,软链接会失效。硬链接是直接指向文件数据的引用,两个文件共享相同的物理数据块,它们的内容完全一致,删除一个硬链接并不会影响到文件的实际数据,只有所有硬链接都删除时,数据才会被清除。硬链接只能在同一文件系统中创建,其实文件管理器上的几乎所有文件都可以被看作是硬链接。
更详细关于链接的介绍可以参阅少数派文章 符号链接、硬链接及其在 Windows 上的应用举例。我对 Link Shell Extension 的初识也正是在这篇文章中。一个最常见的案例是,对于 小而美 微信可以将其 Files 文件夹移动至 OneDrive,然后通过符号链接将其链接回原位置,这样既可以保证微信正常运行,又可以实现微信保存的文件备份。该插件的智能多版本硬链接功能会自动分析和前一次的差异并对不变的内容创建硬链接,实现增量备份,但该功能不能链接到外部存储,仅适合在同盘做备份版本管理。
特别注意,少数派文章中介绍的「中键拖动」快速创建链接操作不适用于 Windows 11,正确操作应当修改为使用右键拖动。
虽然 Windows 自带输入法对于绝大多数用户已经足够好用。但是我有跨设备需求,特别是需要兼容 macOS 和 Windows 双系统,这导致明明两者的系统自带输入法都可圈可点我都率先排除。而高度自由、高度定制的 RIME 进入我考虑范围。在 Windows 上通过 Weasel、在 macOS 上通过 Squirrel 实现 RIME 输入法的部署,在 Linux 上还有诸如 ibus-rime
等多种版本。
但 RIME 的高度自由伴随的也是较高准入门槛。好在开源项目 oh-my-rime
及其 配套配置教程 算是相当程度上降低这种门槛。但这种打包配置并未限制你设置自由度,你依然可以根据自己的需求自行修改配置文件,例如取消 Shift
切换中英文、更改翻页快捷键和以词定字快捷键等等。
许多功能和其他配置在 oh-my-rime
项目教程中也有提及,这里单独展开讲一下多设备同步。虽然该教程中也完整提到同步设置,但是同步行为是要用户手动触发的,而平时工作中很可能忘记触发。更优雅的方案是通过 Windows 的计划任务触发同步:
LM Studio 是一款将目前主流大模型 LLM 元素打包在一起的工具,可以让你在自己的电脑上,“0 门槛”运行本地大语言模型 LLM,并且用起来就像 ChatGPT 那样。支持 windows、macos、Linux。
LM Studio is an easy to use desktop app for experimenting with local and open-source Large Language Models (LLMs). The LM Studio cross platform desktop app allows you to download and run any ggml-compatible model from Hugging Face, and provides a simple yet powerful model configuration and inferencing UI.
傻瓜、一站式部署本地大语言模型,大概就是打开电脑 > 双击运行程序 > 开始提问 > 获得 ai 回答这样三步走。
我觉得 LM Studio 就是这样的软件,它长这样:
你唯一需要操心的事情,就是挑选模型,然后下载使用,就好了。
直接在目前的主流模型托管网站 huggingface 搜索你需要的模型,比如 Meta-Llama-3.1-8B-Instruct-GGUF
,然后找到对应的 Files 页面,挑选你需要的模型,点击那个下载按钮
最终,你将得到一个类似 Meta-Llama-3.1-8B-Instruct-Q4_K_M.gguf
的文件,很大,一般都好几个 GB。
LM Studio 默认的模型保存路径在 C:\Users\appinn.cache\lm-studio\models
,可以更换:
不过这里注意,你需要使用 ${Publisher}/${Repository}/${ModelFile}
这样的路径结构,如上图第二个红色框框,需要将手动下载的 .gguf 模型文件保存在路径的两级文件夹下才能正确识别。
然后,就能提问了。会自动使用你的 CPU、GPU…
LM Studio 也支持 openai 类的服务器,即可以在第三方服务器上使用这个 LLM,就像使用 OpenAI API 一样,只不过这里的 API 服务器是你自己的。
和 OpenAI 一样,使用过 /v1/chat/completions
、 /v1/completions
、 /v1/embeddings
即可。
「The Maps Express」是一款 chrome 浏览器扩展程序,支持各种常见浏览器例如 mac 的 Safari、Chrome 和 windows 上的 Edge、Chrome、Brave、Arc、Opera,安装后可在选取要查询的地点时通过鼠标右键菜单或快捷键快速查询 google Maps,能保存最近查询的十条历史记录,还能将地点收藏〔支持导出、导入功能〕,非常方便!
值得一提的是 The Maps Express 有一项「ai 摘要」功能,通过 Google Gemini 对当前网页进行分析、快速找出可能的餐厅、咖啡店、商家或景点关键词,让用户以 Google Maps 快速查询相关结果。
No Description
进入 Chrome 应用程序商店页面,点击右上角「加到 Chrome」安装到浏览器后即可使用。
那么要如何进行查询呢?很简单,只要选取店家名称、右键菜单就有「通过 The Maps Express 查询」快速带入 Google Maps 查询地点,也可使用快捷键〔Ctrl+Shift+S/⌘+Shift+S〕进行操作。
如此一来就将好几个步骤的操作过程简化成一个动作。
The Maps Express 本身也具有查询功能,点击扩展按钮后会进入类似如下的窗口,最上方的查询字段就如同是 Google 地图查询功能,可以快速在地图查询指定地标,查询记录会保留近期查询的 10 条记录,这些信息只会存在用户的浏览器。
点击查询记录的地标会快速打开 Google 地图,将光标移到地标上可以「加入收藏」。
The Maps Express 收藏清单功能基本上可以算是更方便的 Google Maps 收藏功能,将地标加入收藏后还能利用下方的功能进行导出或导入〔格式为 .JSON〕。
再来介绍一下 The Maps Express 最有趣的「页面摘要」工具,可以使用 AI 技术来摘要地点,第一次使用时需要设置一下 API 密钥,不过不会太难,只要有 Google 账户、几个步骤就能搞定。
点击 API 后会有设置说明,浅显易懂,先连接到 Google AI Studio 页面,第一次使用会有注意事项,勾选底下第一项同意使用条款,按下「Continue」继续到下一个步骤。
接着点击中间的「Create API key」建立一个 API 密钥。
按下「Create API key in new project」按钮,如下图箭头标示位置。
生成 API 密钥后按下「复制」获取这段代码,回到 The Maps Express 扩展贴上后即可进入 AI 功能。
The Maps Express 页面摘要工具是使用 AI 来摘要地点,简单来说,在网页点击「Gemini 摘要」后就会自动分析网页出现的地标,将相关结果自动加入、方便用户以 Google Maps 查询或是加入收藏。
下图就是使用 AI 页面摘要、分析网络上的文章后得出的相关地标,非常快速、准确!几乎把文章中列出来的所有咖啡店都呈现在列表,省去要一个一个复制查询的时间,如果平常会经常在网络上查询信息的朋友可以试试看这项功能〔只是前置需要几个设置步骤〕。
windows 沙盒是微软为 Windows 10 专业版/企业版或者 Windows 11 中提供的功能,可以安全地在隔离状态下运行应用程序。不过默认并没有安装,需要使用 Windows 功能来安装,支持在 Hyper-V 虚拟机中使用。
Windows 沙盒 的主要用途就是在隔离的环境下,运行一些你认为不可靠的程序,这样不会影响本地系统安全性。当关闭沙盒之后,所有数据都会被删除(从 Windows 11 版本 22H2 开始支持沙盒内重启保存数据,但关闭依旧是删除)
安装 Windows 沙盒至少需要 Windows 10 专业版/企业版(18305 以后版本),或者 Windows 11,以及:
也就是说,太久的电脑就不要用啦
然后在开始菜单搜索打开或关闭 Windows 功能,勾选 Windows 沙盒,并重启电脑,即可。
在 Hyper-V 虚拟机之中想要启动沙盒,需要在本地主机中打开 PowerShell 然后输入:
然后就可以回到虚拟机中安装 Windows 沙盒 功能了。
启动 Windows 沙盒后的样子,看起来就是一个全新的 Windows 系统:
你可以直接将文件粘贴到沙盒里面,也可以通过沙盒里的 edge 浏览器从网络上下载。
如果想要禁用网络链接,需要创建一个 .wsb 的文件,内容为:
然后双击这个 .wsb 文件,就能打开一个不联网的 Windows 沙盒了。
另外通过配置文件,还能设置等 vGPU、映射本地文件夹、启动命令、共享麦克风、共享摄像头、RDP 协议、打印机、剪贴板、内存等功能。
最后就可以愉快的在沙盒中进行一次性操作了。
注意 1:每次关闭沙盒,里面的东西就没了。
注意 2:只有在 Windows 11 中,才支持沙盒中重启
官方文档在这里。
苹果在 2023 年的 WWDC 中推出了 GamePorting Toolkit(简称 GPTK)。GPTK 是一个让游戏开发者可以将他们的 PC 游戏直接在 macos 上运行的工具。GPTK 通过提供一个兼容层,模拟 windows 环境,让游戏可以在 macOS 上运行。它支持 DirectX 12,使得游戏在图形处理方面可以达到与 Windows 系统相当的水平。
这不仅方便了开发者评估游戏的运行效果,也大大减少了将游戏从 PC 移植到 mac 上所需的时间。有了 GPTK,Mac 用户终于有机会体验到更多的 PC 游戏。
尽管 GPTK 是一个强大的工具,但苹果提供的操作指南对普通用户来说有些复杂。因此,社区开发者们迅速行动,将这一配置过程简化成更易操作的工具。其中,Whisky 相对用起来最容易。
A modern Wine wrapper for macOS built with SwiftUI – Whisky-app/Whisky
Whisky 的使用步骤
6 月 1 日,Firefox 89 进入稳定版推送通道,带来了自 2017 年 Firefox Quantum 问世以来最大的界面改动,以及众多细节改进。Mozilla 在博客中写道,设计师们权衡并简化了 Firefox 的交互体验,使其更易于在每台设备上使用,帮助用户提高效率、减少干扰。[1]
这一版本究竟带来了哪些新功能,有何亮点与不足?我们不妨在这篇文章中一探究竟。
注意:本文撰写于 6 月 1 日前,基于 Firefox Nightly 测试版本介绍。
2017 年发布的 Firefox Quantum 采用了被 Mozilla 称为 Photon 的设计语言,Firefox 89 的界面设计则被命名为仅一字之差的 Proton。这可能与新版的重构思路有关,Firefox 设计团队调研了广大用户的日常使用习惯,绘制了如下图所示的交互热力图[2],希望在一次大版本更新中重新设计 UI 组件,并解决长期遗留的问题。因此,Firefox 产品高级总监 Mikal Lewis 表示,这次改版更像是在原版的基础上,由数不清的细节改进构成的整体。而最终呈现的效果,却大不相同。
从上图中,我们不难发现,在原版设计中,地址栏右侧的几个按钮利用率极低,更不用说二级菜单中的项目了。因此,Mozilla 已经在 Firefox 88 中将「截图」操作转移至右键菜单,89 则更进一步,移除了整个「页面动作」菜单。别担心,里面的老朋友都还在,右键单击标签页,选择发送到其它设备,也是更符合直觉的方法。Mozilla 力推的稍后阅读工具 Pocket 优先级再度提升,于主工具栏上占据一席之地。
当然,不使用 Pocket 的同学大可点击「定制工具栏」,将 Firefox 改造为自己理想中的模样。图标重绘之外,这一功能与以前没多大差别,标题栏、工具栏与书签栏均支持高度自定义。「选项」、「附加组件」更名为更常见的「设置」、「扩展和主题」,从上个版本开始,截图也能添加到工具栏了。将视线转向底部,依然是熟悉的工具栏选项和主题管理。然而,点开密度菜单,问题就来了:我那么大一个紧凑布局呢?
年初开始测试的 Proton 早期版本中,Mozilla 本打算完全移除 Firefox 的紧凑布局,原因你大概也能猜到:切换入口过深,难以被用户发现。[3]为了确保新版的默认配置适合大多数人,Mozilla 决定将其与普通布局合并,但仍为触屏设备用户保留触控布局。不用说,这一决策激起了社区的强烈抗议,妥协结果是只对新用户隐藏相关选项,并且可以自行配置显示。
如果你全新安装了 Firefox,想试试紧凑布局,只需在地址栏键入 about:config
,选择接受风险并继续,然后搜索 browser.compactmode.show
,将值切换为 true
,即可在「定制工具栏」界面自由切换布局。但这并不代表万事大吉,Proton 的界面元素间距比旧版更宽,紧凑布局也只是略窄于原来的普通布局,对显示面积就是生产力的网页浏览器来说,着实有些倒退。
抛开些许不快,让我们来看看 Proton 设计语言的整体效果吧。简化工具栏布局、去除分隔线、收窄图标线条等措施多管齐下,Firefox 89 给我留下了更加清爽的印象,设计的一致性也更强。尽管在其它地方竭力减少 UI 层级,塑造扁平化体验,活动标签页却采用了浮动设计,与背景区分,直观明了。此外,后台标签的音频控件已合并至网站图标,不会多占一个位置了。
菜单也得到了重新梳理,工具栏最右侧的应用程序菜单中,选项前的图标已不见踪迹,排序也有所变化。「我的足迹」被拆分为书签、历史、下载三项;编辑控制成为了工具栏中的独立按钮;定制工具栏等不常用功能统一收纳进「更多工具」;所有按钮均依照用途组织分类。在 Windows 平台,右键菜单由系统样式改为更美观的 Proton 风格;macOS 恰好相反,从带有 Firefox 特色的自定义样式换成了不加修饰的原生风格。
除了桌面客户端,Firefox 移动版应用也迎来同步更新,为全平台换上 Proton 界面设计。Android 客户端将「受同步的标签页」从菜单栏调整至标签管理界面,新增手动同步按钮,使用更方便。Mozilla 还与 WebCompat 合作,允许用户报告无法正常渲染的网页,由志愿者请求网站所有者修复。iOS 客户端同样改进了标签页逻辑,并提升搜索体验,在地址栏添加搜索引擎图标,打开新标签页时自动弹出键盘。比较可惜的是,Android 版 Firefox 重构至今,仍未针对平板设备优化,希望 Mozilla 能在日后带来接近 iPadOS 的体验。
一望即知的设计革新之外,Firefox 89 还提供了例行的问题修复及功能改进,我们不妨在本节发掘这些潜藏于水面下的改动。
作为 Firefox 的主打卖点之一,Mozilla 一直在实践个人隐私保护领域的前沿技术。在 Firefox 89 中,隐私浏览模式会强制启用 Total Cookie Protection 特性,阻止所有跨网站 Cookie,包括但不限于跟踪性内容。你也可以在「隐私与安全」设置中启用增强型跟踪保护的严格模式,将它应用到所有窗口。Firefox 89 还带来了第二代 SmartBlock 功能,使用本地组件替换第三方脚本,拦截在线跟踪器的同时,保证网站正常运作。
Firefox 89 解决了 macOS 客户端的诸多历史问题,在广色域显示器上,网页颜色将不再过饱和;未标记的图像将被视为 sRGB,标记为 sRGB 的图像颜色将与 CSS 匹配;全屏浏览时,将鼠标指针移动至屏幕顶部不会导致标签栏被系统菜单栏遮挡,并提供隐藏工具栏的选项。更振奋人心的是,滑动至页面底端将触发弹性滚动效果,在触控板上两指双击还能缩放聚焦的内容。
Firefox 89 介绍了一种 Web 表单控件的非本机实现,提供全新的现代设计,改善了网页加载性能。在开发者方面,Firefox 89 已支持 Event Timing API 和 CSS 强制颜色查询,前者允许页面测量从用户首次交互到浏览器实际处理事件的延迟,后者将在操作系统启用高对比度等特殊配色方案时激活,确保更好的无障碍兼容性。
近些年来,Firefox 的几乎每次界面改版,都会招致社区的巨大争议。虽然我同样对 Proton 砍掉紧凑布局感到不满,但 Mozilla 的不断探索却不应被否定。在微软「叛逃」Chromium 阵营后,独立的 Firefox 的存在更显得弥足珍贵,我也由衷希望为自由而生的 Firefox 能越来越好。
Firefox 89 正式版已于 6 月 1 日面向全球用户推送,如果正使用其它浏览器的你也跃跃欲试,可以前往 Firefox 官方网站 下载使用。
随着 Windows 10 的普及,越来越多的设备制造商开始将自家驱动、专用软件等放到 Microsoft Store 上,便于集中管理和更新。为了避免兼容性问题,这些应用通常仅限特定品牌的设备安装,但有时,我们或许想在自己的电脑上试试,而本文介绍的技巧就能帮到你。
让我们以三星笔记为例,作为众多 Android 手机和平板的预装应用,它提供了完善的 S Pen 支持、PDF 批注和录音回放等高级功能,然而,仅支持移动端却让人难以放心使用。其实,三星还为自家电脑开发了笔记应用的全功能 UWP 版本,兼容大部分 Windows 设备,只是限制了其它品牌安装。
现在,让我们打开 网页版 Microsoft Store,登录自己的账户,搜索并切换至 Samsung Notes 的页面。你应当会发现「兑换代码」按钮变成了「获取」,点击它右侧的三点省略号,选择「添加到购物车」。
之后的步骤想必无需多言,打开购物车,遵照页面指示下单,将应用添加至自己的软件库中。需要注意的是,如果显示语言为简体中文,在结账时可能出现白屏等状况,将地址栏中的 zh-cn
改为 en-us
即可。
订单完成后,让我们回到应用商店,之前的「兑换代码」已经变成了灰色的「安装」。再次点击右侧的三点省略号,选择「在我的设备上安装」,然后在弹窗中选择安装位置。
稍憩片刻,你的下载会自动开始,安装完成后,就可以在自己的设备上使用了。这一技巧同样适用于其它限定型号的应用,如 Dell Mobile Connect 和 Nebo for LG 等,祝你使用愉快。
提示:此次活动已结束。
如果你曾读过我此前写的大促推荐文章,对 BundleHunt 这个名字想必不会感到陌生。作为最知名的 macOS 应用促销网站之一,它总能说服几款大牌应用,开出让你无法拒绝的价格。本月中旬,BundleHunt 也推出了其最新 Bundle,包含 46 款 App,优惠幅度可达 90%。
与以往不同的是,本 Bundle 取消了祖传的 5 美元解锁费用,挑选的 App 总价格是多少,结账时就支付多少,而且每款 App 依然可以添加最多 3 份授权,相当良心。此外,BundleHunt 还首次涉足 Windows 应用,没有 Mac 的同学也可以放心选购。
话不多说,接下来,就让我们一起来了解一下部分值得购买的应用吧。
💰一年订阅价格:$49.92 → $7.00, 86% Off
作为一款键盘效率利器,TextExpander 曾被少数派多次推荐,并被誉为 macOS 深度用户必备生产力工具之一。TextExpander 最基础的功能是文本替换,如果你日常生活中经常需要输入重复内容或特殊字符,就可以借此节省时间,如输入 @@
自动替换为邮箱地址、输入 tm
自动替换为 ™
商标符号等。在此基础上,TextExpander 的自动化能力还允许我们制作带变量模板、一键填充表格、转换 Markdown 格式等,输入快人一步。
关联阅读:
💰价格:$11.99 → $6.00, 50% Off
iStatMenus 6 同样是一款被少数派多次推荐的工具应用,它可以将 macOS 的菜单栏变为系统监测中心,除了 CPU、电池、网速、硬盘和内存状态等标配功能外,你还可以用它来查看天气、日程安排和世界时间等,功能和界面样式都相当丰富。此外,iStatMenus 6 的可定制项目也诚意满满,可以自由组合多种传感器数据,合并为一种工具,随时获知系统状态变化。
关联阅读:
💰价格:$39.95 → $5.00, 87% Off
即使对死忠果粉来说,iTunes 的移动设备管理体验也难以称得上优秀,macOS Catalina 拆分到访达后也不甚圆满。Waltr 2 则致力于解决跨设备文件传输这一吐槽重灾区,它将用 Mac 向 iPhone 传输文件的过程简化为三步:打开 Waltr 2,将文件拖进去,然后在手机上查看。除了傻瓜式的操作体验外,Waltr 2 还支持上百种音视频格式,智能选择接收应用,并自动转换 iOS 不支持的文件,小白也能轻松上手。
关联阅读:
💰价格:$19.95 → $3.00, 85% Off
尽管名字里带着 YouTube,但 SYC 2 支持的网站可远不止这一家,只需直接粘贴链接,你就可以一键下载 Vimeo、Instagram 和 YouTube Music 等超过 60 个流媒体网站的音视频文件。由于与 Waltr 2 师出同门,SYC 2 还允许你直接保存至 iPhone 和 iPad 中,流程也和 Waltr 2 一样省心,下载传输一气呵成。需要提醒大家的是,SYC 2 并未适配 B 站和爱奇艺等国内主流平台,请明确自己的需求后购买。
关联阅读:
💰价格:$29.99 → $6.00, 80% Off
作为 macOS 的默认文件管理器,访达界面简洁、操作友好、易于上手。但对深度用户来说,访达着实有些简陋,只有搭配第三方工具才能勉强使用这样子。Commander One PRO 则是一款相当强大的访达替代品,它支持双栏视图和全键盘操作,所有快捷键支持自定义,还拥有强大的搜索和替换功能,支持多种压缩格式及文件预览方式。你还可以建立 FTP、WebDAV、Google Drive 和 OneDrive 等远程连接,并在应用内管理系统进程,是一位全能型选手。
💰价格:$99.99 → $7.00, 93% Off
没有编程基础,又想搭建一个网站?试试界面友好、易于上手的 Flux 7.0 吧。它利用所见即所得的可视化设计,让你无需关注代码,就能通过拖拽等操作搭建页面,配合预设的精美模板,是初学者的佳选。Flux 原生支持 Bootstrap 和 Skeleton 等主流前端框架,可以通过 FTP 和 SFTP 管理远程项目,还提供强大的调试工具,帮助你轻松创建响应式网页。
💰价格:$5.99 → $2.99, 50% Off
电子设备一多,如何管理就成了难事,稍不注意,就可能出现七八个设备电量不足,充电线却只有一根的尴尬情况。而 Batteries 这款小工具就可以在控制中心、菜单栏或 Touch Bar 上展示所有设备的剩余电量,并在电量不足时通知提醒,避免需要用时电池只剩 2%。Batteries 支持 iPhone、iPad、AirPods 及所有连接到 Mac 的蓝牙设备,在后台保障你的工作进度不受影响。
💰价格:$5.00 → $2.00, 60% Off
作为公认的真无线耳机标杆,AirPods 的工业设计和硬件配置都首屈一指,与之配套的软件体验也出类拔萃,弹窗动画让人总想多看几遍,无缝切换的过渡也十分自然。然而,如果你正在使用 Mac,就只能点击菜单栏上的音频图标手动切换,还可能出现图书馆外放的尴尬。而 AirBuddy 不仅为 macOS 带来了与 iOS 相仿的动画效果,还能帮助你快速切换输出设备,并在控制中心查看已连接设备的电量,值得一试。
按照惯例,详细介绍以上 8 款 App 后,我会推荐本 Bundle 中其它值得购买的应用。但今天我准备反过来,说说我认为本 Bundle 中不太划算的应用:
以上,就是本文的全部内容了。你可以 点击这里 前往 BundleHunt 官网,如果愿意支持我继续创作,也欢迎你点击此 返利链接 购买,我会得到你支付金额的 25% 作为回报,在此诚表谢意。
如果你还在使用 64 GB 的手机,可能会时常面临存储空间不足的窘境。这时,除了忍痛清理相册和聊天记录外,还可以试试用系统自带的 App 代替部分第三方应用,节省空间的同时享受原生的丝滑体验。
在本文中,我就为大家整理了 14 款各系统平台的优秀自带 App 和使用技巧,希望你也能有新发现。
许多 iOS 用户的主屏幕角落都会有一个名为「删不掉」的文件夹,专门用来安置蒙尘的系统自带 App 们。如果你也曾这样做过,不妨再给它们一次机会,试试本章提到的使用技巧吧。
近几年来,每次 iOS 大版本更新都会为备忘录添加新特性,也让它从纯粹的便签工具逐渐演变为了现在的全功能笔记应用。就像苹果官方介绍的那样,备忘录可以「轻松添加几乎任何内容」,无论是图片、文字、链接,还是表格、清单、手绘,它都来者不拒,还能直接扫描文稿,并自动裁边。
备忘录的一大优势,就是与 iOS 系统的深度整合。除了 iCloud 多端同步外,你还可以从主屏幕 3D Touch 菜单、通知中心小组件、控制中心快捷方式等位置快速创建新笔记,或者直接召唤 Siri 帮忙,这也是第三方笔记 App 难以做到的。
在即将正式推送的 iOS 13 中,苹果还大幅强化了备忘录的搜索功能,并进一步加入了 OCR 文字识别功能。简单来说,你可以直接搜索图片附件及手绘中的文字,准确率也相当高,甚至成功匹配了带连笔的潦草字符,可谓课堂笔记整理利器。
关联阅读:
在 iOS 13 中,提醒事项也得到了有史以来最重大的更新,加入了智能列表、自然语言识别诸多新特性。在本文中,我也将以 iOS 13 为基础介绍提醒事项的优势,帮助你在正式版发布后快速上手。
让我们从智能列表说起,iOS 13 的提醒事项加入了今天、计划、全部和旗标四个任务筛选维度,将任务按提醒日期、重要程度等分类。此外,提醒事项还支持创建子列表和子任务,通过简单的拖拽手势即可高效归纳日程。
iOS 13 的提醒事项还在键盘上方为我们安置了快捷工具栏,可以一键设置提醒日期、位置、旗标和图片附件等,不用手动点选或跳转至其它 App。此外,iOS 13 的提醒事项还支持简单的自然语言识别,如「明天上午 9 点」等,可以通过键盘选字栏填充。
使用提醒事项安排任务还有一项好处,那就是关联手机联系人,并获得智能提醒。你可以在任务详细信息设置页添加指定联系人,并在与 TA 通过短信或 iMessage 联系时收到通知提醒,不再遗忘任务。
关联阅读:
随着时代的变迁,听播客这一小众的习惯也逐步走向大众视野。如果你还不确定要买 Pocket Casts 还是 Castro,不妨先试试 iOS 自带的播客 App。它支持调整播放速度、插播、待播、新单集提醒等功能,设计语言与 iOS 高度一致,简洁易用。
依托 iTunes 商店、品类齐全的内容资源是 iOS 原生播客 App 的另一长处。它不仅汇聚了全球优秀播客资源,还支持按听众人数、出品方等分类查询,并在详情页面底部提供了相似播客推荐,寻觅新欢更容易。
关联阅读:
尽管 iOS 无法设置默认浏览器,打开链接时始终使用 Safari,但许多用户还是会选择安装一个第三方浏览器备用。其实,掌握一定技巧后,Safari 浏览器已经能满足我们的绝大部分需求。
Safari 技巧之一,是「长按」。出于简洁考虑,Safari 将不少功能选项都藏了起来,需要通过长按来唤醒。举例来说,长按多标签页界面下方的「加号」,可以查看最近关闭的标签页;长按网页浏览工具栏上的「前进」或「后退」按钮,可以查看操作历史记录;长按「书签」按钮,可以批量添加收藏、加入阅读列表;长按「多任务」按钮,则可以关闭全部标签页或新建无痕浏览标签页。
Safari 技巧之二,是「重按」,即 3D Touch。你可以在支持阅读模式的网页中重按地址栏左侧按钮,快速进入和退出阅读模式;也可以重按任意链接,进行预览和添加至阅读列表等操作;还可以重按 Safari 浏览器的桌面图标,执行快捷操作。
Safari 技巧之三,是「分享」,这也可以说是解决 Safari 痛点的不二法门。你可以将网页分享为 PDF 以添加标注;也可以分享给第三方 App 实现长截图、翻译等功能,最大限度地弥补原生功能的不足。
关联阅读:
与被苹果直辖的 iOS 系统相比,开放的 Android 各 ROM 之间差异相当大,系统自带的 App 也各不相同。在本章中,我将介绍 4 款打着 Google 标的 App,希望它们的表现能胜过 MIUI 自带的竞争对手。(笑
由于众所周知的原因,Gboard 在云词库方面远逊于国内竞品,但我仍将其作为心目中的最佳 Android 输入法。究其原因,首先是支持数百种输入方式,包括你或许根本没听说过的阿斯图里亚斯语、巴塔克曼特宁语等当地人都不一定常用的语言;也包括全拼、九键、手写、笔画等中文模式,还提供了 6 种主流双拼方案。如果你需要多语言混合输入,Gboard 很可能是唯一选择。
Gboard 的另一优势,是与 Google 的深度整合。你可以点击键盘左上角的 Google 图标,直接搜索网页,并在键盘内获知结果,无须跳转至其它 App。同样的,你也可以在网络中搜索表情包、GIF 动图等,并一键分享至聊天工具的输入框中,发送给好友。
此外,Gboard 还提供了不少实用功能,如剪贴板管理、文本编辑工具、悬浮键盘、单手模式、Google 翻译等。你还可以在 Gboard设置中更换键盘的主题背景,让它更适合你。
关联阅读:
iOS 有备忘录,Android 当然要用 Google Keep。作为一款轻量级的笔记工具,它可以添加文字、图片、绘图、录音、清单和提醒,并支持语音自动转文字。与备忘录不同的是,在 Keep 中添加的图片会统一安置在笔记正文上方,不支持图文混排,但更加醒目。
除了标签外,Keep 还支持自定义笔记的背景颜色,不同类别的笔记间互不干扰,一眼扫过就能找到想要的笔记。如果你已经参考完毕,还可以通过滑动手势将其归档,或者发送至 Google 文档进行下一步处理。
关联阅读:
与其使用课程格子、超级课程表等第三方 App 记录上课时间,我更偏向于使用日历来管理一切。在 Android 上,Google 日历可能是最佳选择之一。它采用了标准 Material Design 设计,还会为不同月份和特殊节日展示精美插画,别有一番趣味。
新建事件时,Google 日历支持活动、提醒和目标 3 种类型,分别对应日程安排、待办事项和习惯养成,均支持多设备同步。其中,在设定目标时,Google 日历会智能建议频率、持续时间等信息,并通过提问一步步引导完成设置。
不论从哪个角度来看,Google 相册都称得上同类应用中的翘楚。除了基础的本地相册管理外,它还提供了高画质照片无限容量上传、(已取消)强大的照片后期编辑、影集在线分享等功能。其中,照片后期编辑允许你添加滤镜、调整曝光、对比度、饱和度、色温等,还能在应用内调用其它修图工具。
得益于 Google 雄厚的 AI 技术积累,Google 相册可以智能识别照片中的面孔、事物、地点等,个人体验准确率高于 iOS 和 Windows 10 的自动分类功能。此外,Google 相册还会智能建议你归档屏幕截图、旋转照片方向、回顾往年今日等,甚至可以自动优化带瑕疵照片。
如果你想留住回忆,不妨利用 Google 相册的内建功能创建影集、影片、动画和拼贴,上传至云端,以供随时观看。Google 相册的影集功能支持添加文字说明和地点标记,用来记日记也毫无违和感;动画和影片功能支持将多张照片组合为动图或短视频;拼贴功能则是发朋友圈或微博的好帮手。
关联阅读:
如果你经常浏览少数派,或许对 macOS 上的知名效率工具都如数家珍。其实,不少 macOS 自带应用都传承着苹果优良传统,设计精美、功能够用,我们不妨在本章认识一下其中几位。
预览可能是最被低估的 macOS 原生应用之一,你或许只把它当作鸡肋的图片查看器,却忽视了其强大的编辑功能。以图片为例,预览提供了画笔、形状、文本、签名等标注工具和调整颜色曲线、曝光、对比度、饱和度等后期处理工具;如果你正在阅读 PDF,预览还允许你添加高亮、下划线、删除线等,足以应付日常所需。
预览的另一项技能,是压缩、转换和合并图片及 PDF。你可以方便地调整图片尺寸、格式,达到压缩体积的目的。借助预览,你还可以轻松拼接合并多张图片,首先用预览打开想要添加上去的图片,随后按下 ⌘Command-C
复制,接着打开背景图片,按下 ⌘Command-V
即可,还能自由调整大小、位置等。
此外,你还可以用预览编辑 GIF 动图。打开 GIF 后,其包含的帧会依序展示在左侧边栏中,可以拖拽移动顺序、删除指定帧等。同样,如果你想给 GIF 添加图片,只需要直接把它拖进来进行了,预览会自动保存更改。
关联阅读:
在 macOS 上查询单词释义,最简单的方式莫过于三指轻点触控板,召唤自带的词典应用。但由于词库较少、入口较隐蔽,许多人还是会选择安装欧路词典、有道词典等第三方应用。
其实,经过一番调教,macOS 原生词典 App 也可以很好用。比如饱受诟病的词库,就可以通过安装网络上的第三方词典文件来解决。以使用最广泛的 MDX 格式为例,你可以通过 GitHub 上的 PyGlossary 项目来转换为 macOS 格式;StarDict 文件则可以使用 DictUnifier 转换。完成后,将得到的词典文件移动至 /Library/Dictionaries
即可正常使用。
除了三指点击触控板外,你还可以在设置中将触发手势更改为单指用力点按,或者选中单词后右键查询,也可以通过聚焦搜索直接查询生词。当然,更直观的方法是打开词典 App,在上方的搜索框内输入单词或短语。
关联阅读:
iOS 上有快捷指令(Shortcuts)这一自动化效率利器,macOS 上则有自动操作(Automator)发挥相似的功效。它可以帮助我们创建应用程序、工作流程、工具插件、听写命令等,通过简单的拖拽即可设计出完整的自动化流程,并保存以供日后使用。
选定要创建的脚本类型后, 你应该会看到下图所示的界面。其中,左侧是操作库,表示自动操作可以执行的命令种类;右侧是编辑区域,可以将左侧的操作拖拽组合进去,与快捷指令操作方法类似。自动操作支持包括 Shell、JavaScript、AppleScript 脚本等在内的近百种操作,还能够与第三方 App 集成。
活用自动操作,你就可以实现图床上传、解压缩、自动整理文件夹、批量重命名、提取 PDF 中文字、合并 PDF、转换图片格式、拼接截图等进阶玩法,不妨前往 少数派 Automator 标签 下了解更多。
关联阅读:
曾经,Windows 的自带系统应用还是被人嫌弃、被各修改版精简的存在。但在 Windows 10 发布后,基于UWP 架构的全新系统应用走入了我们的视线,其中也不乏精品,比如本章将介绍的 3 款应用。
从 Outlook 到 畅邮 折腾一圈后,我最终还是用回了 Windows 10 的原生邮件应用。要问原因,首先是颜值过关,半磨砂的流畅设计语言、可随心定制的主题颜色和布局、精美的背景图片选择等都令它从一众竞品中脱颖而出。
颜值之下,Windows 10 邮件应用的功能也令我满意。智能分类重要邮件、优雅高效的滑动手势、多账户聚合管理、与日历、人脉、待办集成,都让它成为了不输 Outlook 的邮件客户端。如果你的邮箱地址较多,还可以将主账户单独固定在「开始」菜单,即时获知新动态。
今年三月,微软宣布将 Windows 10 自带计算器开源,并将代码完整上传至了 GitHub,一时间吸引了各路开发者目光。这一项目不仅收获了近 1.8 万 star,还被移植到了 iOS、Android 等平台上,从侧面可以看出其质量之高。
那么,Windows 10 计算器究竟高在何处?除了流畅设计和精致的交互效果外,它还支持全键盘操作、科学模式、进制转换、日期推算等,并提供了货币、体积、长度、重量、温度、能量、面积、速度、时间、功率、数据、压力和角度等十余种进制转换工具。如果发布在 App Store 中,至少可以收费 30 元了。(逃
经过数次迭代与重构,在 Windows 10 五月版更新中,系统自带的截图功能已经成为了可与第三方应用一较高下的存在。除了基础的全屏截图、窗口截图外,Windows 10 原生截图还允许你绘制任意形状的截图区域,并占用 PrtSc
键,使用更友好。
截图完成后,自然要标注。点击截图成功的通知后,你就能够进入草图绘制窗口。微软为你准备了铅笔、记号笔、荧光笔和直尺等工具选择,虽然缺失了我们常用的形状、马赛克等工具,但应急使用还是绰绰有余的。
经常上少数派的用户容易养成这样一种习惯:遇到需求,先搜索有没有合适的第三方 App,并愿意为之付费。其实,在很多情况下,系统自带的 App 已经提供了针对性的功能,而且占用内存更低、使用门槛也更简单。下次遇到这种问题,不妨试试给原生应用一次机会,让系统功能物尽其用。
快速搜索和效率启动,是大多数用户的刚需,为此也诞生了一大波启动器应用,如 macOS 平台的 Alfred、LaunchBar,Windows 平台的 Wox、Listary 等。其实,随着 Windows 10 系统更新,时常被忽略的原生搜索功能也得到了逐步完善,不逊色于第三方工具。
在本文中,我将为大家介绍一些 Windows 10 原生搜索功能的技巧,将它打造为快速启动利器。
要想使用 Windows 10 的搜索功能,最直观的方式,当然是点击任务栏上的「放大镜」图标,随后在搜索框中键入文字。其实,除此之外,微软还准备了数种更方便的唤醒方式,供我们随心挑选。
举例来说,如果你正在使用具有精确式触控板的笔记本电脑,可以使用三根手指点击触控板,搜索窗口便会应声而出。想了解更多关于触控板的小技巧,可以参阅我此前的 这篇文章。
如果你是键盘党,可以按下 Win-S
快捷键,等效于按下任务栏上的搜索按钮。懒得动两根手指按快捷键?直接按 Win
键召唤「开始」菜单,然后输入想要搜索的内容,再使用方向键和回车键选定结果即可。
与大多数通用搜索引擎相似,Windows 10 的原生搜索功能也支持使用语法来缩小结果范围,或实现更多功能。举例来说,你可以直接在 Windows 10 搜索框内输入数学表达式,并利用必应搜索直接获得运算结果。
如果你想搜索特定类别的项目,可以使用如下语法:docs:
匹配文档、folders:
匹配文件夹、email:
匹配电子邮件、photos:
匹配照片、music:
匹配音乐、videos:
匹配视频、web:
搜索网络、apps:
搜索本地应用等。
总是搜索不到想要的结果?这或许是因为 Windows 并未索引相应文件。让我们打开「设置-搜索」,在「搜索 Windows」板块中,将索引范围由「经典」改为「增强」,再等待 Windows 自动更新索引列表即可。如果你在索引期间使用过电脑,索引速度会减慢,推荐夜间挂机完成操作。
为了进一步提高索引准确性,不妨点击「在此自定义搜索位置」,打开索引选项窗口。你可以使用勾选框选定要索引的本地文件夹,并在高级设置中选择是否索引加密文件、文件属性和内容。
如果你的硬盘中有一些不想为人所知的文件夹,可以在「设置-搜索-搜索 Windows」中添加要排除的文件夹,Windows 索引时便会自动跳过这些项目,保护自己的隐私安全。
如果你认为自己已经不再是个宝宝,可以在「设置-搜索-权限和历史记录」中关闭「安全搜索」功能。这样,在使用 Windows 10 搜索在线网页时,部分少儿不宜的内容也会出现在结果中。(虽然必应一般也搜不出来这种东西)
Windows 10 搜索的另一大特性,则是与云端联动。举例来说,打开「Windows 云搜索」选项后,你就可以直接搜索 OneDrive 文件夹和 OneNote 笔记中的内容等,即使未同步至本地也可。此外,你也可以将本地历史记录同步至所有设备中,让搜索结果更懂你。
如果你尝试了上述技巧后,还是无法正常搜索到本地硬盘中的文件,本节提供的几种方法或许会有帮助。最简单的方式,是重启电脑检查 Windows 搜索服务状态。让我们从「开始」菜单中找到并打开服务管理器,定位到 Windows Search 服务,右键选择「重新启动」即可。
若启动搜索服务后仍不正常,你可以试试重建 Windows 索引。让我们打开「控制面板-索引选项」,点击下方「高级」按钮,再选择「删除和重建索引」。由于重新索引需要耗费大量时间,建议在空闲时段操作。
要问 MacBook 哪方面体验优于 Windows 笔记本,触控板绝对名列前茅,不论是系统本身优化还是硬件综合体验,MacBook 都足以干趴一大波 Windows 厂商。为了弥补这一不足,微软也进行了许多尝试,如果你只用触控板来移动光标,不妨试试本文介绍的手势,或许会有新发现。
优秀的交互设计应该符合用户的直觉,方便大多数初学者快速上手,触控板也不例外。单指轻扫移动光标、单指点击选择项目(等效于鼠标左键)、双指点击显示更多选项(等效于鼠标右键)、双指滑动滚动页面、双指捏合收缩和拉伸等,都是从鼠标时代就有的习惯延续,在 Windows 和 macOS 上通用,无须多言。
同时打开了一堆窗口,如何才能高效管理?答案依然是神奇的触控板手势。你可以通过三指向外轻扫查看所有打开的窗口(等效于 Win-↹Tab
),并向里轻扫以回到桌面(等效于 Win-D
)。如果你想在打开的窗口间切换,可以使用三指向右或向左轻扫,等效于 Alt-↹Tab
。
在 Windows 10 中,微软还为我们带来了原生的虚拟桌面功能,便于将工作和生活应用分区,提高使用效率。尽管我们无法使用触控板快速创建新的虚拟桌面,但可以通过四指向右或向左轻扫切换已打开的虚拟桌面,等效于 Win-Ctrl-→/←
快捷键。
除了以上触控板手势外,多指点击也被微软赋予了不同功能。你可以用三指点击快速唤起搜索(等效于 Win-S
),并通过四指点击打开操作中心(等效于 Win-A
),至于五根手指一起上,微软似乎还没考虑过。
如果你的笔记本无法使用上文提到的部分手势,可能是不支持精确式触控板所致。这一概念由微软联合英特尔、Elan 和 Synaptics 三家主流供应商提出,在系统而非第三方驱动层面进行控制,支持多点触控和多种自定义选项,带来近似 macOS 的体验。
OpenAI 今年 5 月 13 日宣布推出适用于 macOS 的 chatgpt 桌面应用程序〔来源〕,可以将 ChatGPT 整合到电脑上运行各种操作,不再受限于浏览器,还能通过快捷键快速进入 ChatGPT 发送信息,其中最引人注目的是语音模式,受益于 GPT-4o 模型提供更快的回应速度,达到用户和 AI 双向几乎没有延迟,犹如跟真人对话,如果有关注 OpenAI 发表会 Live Demo 应该会非常期待这个新功能。
虽然 OpenAI 表示 ChatGPT mac 应用程序会在发表会后先向 ChatGPT Plus 会员推出,最终免费用户一样可以使用该应用程序〔不过使用限制较严格〕,但从国外讨论来看目前还无法从官网找到 Mac 应用程序的下载链接,不过有抢先使用的攻略,有兴趣的朋友可以试试看。
当然 ChatGPT 应用程序未来还会推出 windows 版本。
ChatGPT Mac 桌面应用程序要求必须为 macOS 14 以上,只支持 Apple Silicon 内核〔M1、M2 或 M3〕,较早之前的 Intel Mac 无法使用,我本身是 ChatGPT 免费用户,依然可以使用 Mac 应用程序。
先从以下链接获取 ChatGPT 的 Mac 版应用程序,oaistatic.com 是 OpenAI 公司用于托管静态文件的域名〔可在 ChatGPT 网站源码找到该域名〕,安全性是没有问题的。
下载后运行、将 ChatGPT 拖曳到应用程序资料夹即可使用。
进入 ChatGPT Mac 应用程序,第一步是先登入 OpenAI 账户,可使用 google 账户登入或使用电子邮件注册账号。
目前在登入时会跳出下面「即将推出」错误信息,会有「你尚无桌面版应用程序的存取权。你仍可以在 https://chatgpt.com 使用 ChatGPT」,这个错误和免费或付费用户无关,是官方仍在灰度提供给用户应用的使用权限。
绕想要过限制使用很简单,只要重新登录应用程序,在登入后跳出错误信息前立刻以快捷键〔Command + Q〕推出应用,重新进入应用程序后就能绕过并进入主画面,强制关闭应用程序的时间点大概就是按下登入后跳出一个大窗口时,可以多试两回,时间点不会太难抓。
第一次进入 ChatGPT 应用程序后就会有一个启动工具介绍,简单来说就是快捷键组合,默认情况可以在按下「Option + Space」后快速打开 ChatGPT 聊天工具。
如此一来就能利用快速键进入聊天对话框,发送信息至 ChatGPT。
如果你想将快捷键设置成其他按键组合,在 ChatGPT 应用程序设置选项可以找到键盘快捷键设置功能。
顺带一提,在写这篇文章时 ChatGPT 已有 GPT-4o 模型,从下方选项就能切换 GPT-4o 或 GPT-3.5,GPT-4o 的反应速度更快,免费用户也能使用,但问答次数有限。
ChatGPT 应用程序另一大特色就是可以抢先进入非常强大的「语音交谈」功能,点击右下角耳机图案就会看到相关介绍,可以通过语音方式和 ChatGPT 进行口语对话,不需查看屏幕,也几乎能够在口说后即时获得答复,整个对话过程会被转为文字内容,事后也能利用文字回顾和 AI 的对话记录。
进入新语音模式后会有几种不同的声音可以选择,不过语音 Sky 和好莱坞女星史嘉蕾乔韩森声音雷同引发争议,已从原先放出来的五种声音选项中移除,剩下 Ember、Cove、Breeze 和 Juniper。
通过全新的语音模式就能以口说方式和 ChatGPT AI 对话,我试着使用中文一样听得懂!搭配上 GPT-4o 回应速度真的很厉害,在很短时间就能获得回应,对话内容也会转为文字显示于聊天记录中,有兴趣想要体验一下最新技术的朋友可以去玩玩看。
Stacher 是最近新问世的免费网络视频下载工具,支持 windows、macos 和 Linux,本身也是知名开放源码项目 yt-dlp〔由 youtube-dl 分支〕图形化界面〔GUI〕版本,大家都知道 yt-dlp 是终端里的下载工具,使用上会有一定的门槛,将它套用图形化后操作界面后就会更符合大众使用,支持超过 1200 种网络服务,之前曾介绍过的类似软件还有「Hitomi Downloader 」和「Seal」。
Stacher 已经有针对 Windows、mac 和 Linux 三大操作系统推出对应的版本,只要从官方网站找到需要的版本后下载即可使用,本身没有自带中文界面,但在操作上不会困难,只需要将视频网址复制、粘贴后就能获取文件,也能够选择各种常见视频、音频格式。
利用 Stacher 可以下载 YouTube、facebook、Twitter、Instagram、TikTok、Bilibili、Pornhub 等网站视频,在使用时没有太多复杂难懂的设置,也支持包括 3GP、AAC、FLAC、FLV、M4A、MP3、MP4、OPUS、VORBIS、WAV、WEBM 等格式,最简单的方法就是维持默认值「最佳画质 + 音频」,就能获取包含影像、声音的视频文件咯!
值得一提的是 Stacher 还能针对要下载的平台提前设置账号密码,也有设置浏览器 Cookie 选项,无论是遇到任何状况只要适当设置应该都能顺利获取视频,如果平时会需要从网络平台储存视频的话可以试试看。
其他 YouTube 网络视频下载工具整理:
Stacher. A youtube-dl frontend.
进入 Stacher 网站后跳到下载区,选择要下载的应用程序版本,支持 Windows、macOS 和 Linux,要注意的是都只适用于 64 位操作系统。
我使用 Stacher 的 Mac 版本进行操作教程,Windows 版本应该大同小异,进入后会有说明画面,可以得知应用程序是一个图形化界面下载器,以 yt-dlp 作为内核,因此在使用时会自动安装 yt-dlp。
进入 Stacher 主画面后会自动更新相关元件,上方是网址列,将视频网址复制、粘贴后就能进行下载。
从右上角可选择要下载、保存的文件格式,视频格式有 3GP、FLV、M4A、MP4、WEBM,音乐格式有 AAC、FLAC、MP3、OPUS、VORBIS、WAV,建议直接维持默认值「BEST」就会自动获取最佳画质和音频。
下载时会显示视频略缩图、标题、文件大小、下载速率和预计完成时间,试着下载 YouTube、Facebook 和 Instagram 都能正确获取视频,而且下载速度很快。
完成后在视频上方点击右键、从菜单找到「Open Download Location」就能进入下载路径并找到视频文件。
另外,在右上角也能提前设置视频下载后的保存路径。
下载视频的网址列右侧有一个提前设置账号、密码功能,如果要存取的视频需要账号密码可提前设置,另一个选项可以选择浏览器 Cookie 来源,若无法正确下载视频的话就试试看调整这两个选项。
在 Stacher 设置画面能提前调整下载保存的视频路径、视频文件格式等选项,还有像是字幕下载、网络速度限制或是音质等等,可设置的项目很多,不过如果没有特殊需求只需要维持默认值即可。
前面有提到 Stacher 是使用 yt-dlp 作为内核,支持的服务超过 1000+ 个〔支持列表〕,基本上所有常见常用服务应该都能够利用这个应用程序下载,在测试时除了 YouTube 也下载 Facebook、Instagram 视频,也都能够顺利获取视频文件。
Stacher 是一款功能强大、操作简单的免费网络视频下载工具,非常适合新手使用。如果有下载网络视频的需求,不妨试试看 Stacher。
Cygwin 是一个 Windows 下的 Linux POSIX 模拟器,通过它我们可以直接运行一个 Linux 终端,非常好用。
网络上关于如何添加一个 “在当前目录打开 Cygwin” 的右键菜单的教程有很多,但是这些方法都有一个问题,那就是不能在中文目录下正常工作,于是研究了一番,修复了这个问题。
既然英文路径可以但中文不行,我最先想到的是使用 Cygwin 自带的 base64 命令,将 encode(path) 后的非中文字符串传给 Cygwin 之后,再 decode 得到包含中文的路径。然而不行,正确的 base64 传递到 Cygwin 之后 decode 却是乱码。
问题的原因很容易想到,那就是编码的问题。经过几次输出中间变量后验证了这个猜想:Windows 采用的是 GB2312 编码,而 Cygwin 采用的是 UTF-8. Windows 将当前路径作为参数传递给 Cygwin 主程序时,Cygwin 不能正确读取路径。
修改 Windows 或者 Cygwin 的默认编码肯定是下下之策。解决该问题最终还是绕不开编码转换。我最终的思路为:
我的 Cygwin 安装目录为 C:\cygwin64,Shell 为 ZSH,如果你使用的是 Bash,有的地方与我的不同。具体步骤如下:
导入注册表文件 cygwin.reg:
Windows Registry Editor Version 5.00 [HKEY_CLASSES_ROOT\Directory\Background\shell\cygwin64_bash] @="打开 Cygwin 终端" "icon"="C:\cygwin64\Cygwin.ico" [HKEY_CLASSES_ROOT\Directory\Background\shell\cygwin64_bash\command] @="C:\cygwin64\run_by_right_click.bat \"%V\""
我们的入口程序 C:\cygwin64\run_by_right_click.bat
@echo off SET dir=%1 REM 双引号删除 SET dir=%dir:"=% C: chdir C:\cygwin64 rem del /Q chere.path set /p="%dir%">chere.path bin\zsh.exe -li
bat 代码是真的难写。。。写这段代码我便踩了无数的坑。
在 Cygwin 内编写 ~/.zshrc,在末尾添加目录跳转命令:
if [ -e /chere.path ];then /usr/bin/enca -L zh_CN -x utf-8 /chere.path CPWD=/usr/bin/cat /chere.path
rm /chere.path cd/bin/cygpath "$CPWD"
fi
这里用到了 enca 用于自动编码转换,所以需要在 Cygwin 包管理器中安装这个软件。
over! 现在便可以在中文文件夹中右键打开 Cygwin 了。
最后最后。你可能会说,为啥都新世纪了,你还在用 Cygwin 这种… 模拟器?原生 Linux/ 虚拟机 不好用嘛?WSL 不香吗?甚至 Powershell 不也不错?
那我还真觉得 Cygwin 秒杀上述所有的方案。首先,我只是想在 Windows 上安装一个代替 cmd 的 Shell 环境用于日常操作,并不需要高性能什么的,所以原生 Linux 系统、虚拟机、Docker 就不是解决同一个问题的东西。
至于 Powershell,虽说是比 cmd 好多了,但毕竟是另一套语法和体系,我不想学它也对它不感兴趣。Bash+GNU tools 那才是世界通用法则。ZSH 作为日常使用的终端也确实美观好用!
而 WSL 这东西确实很吸引人,性能比 Cygwin 强太多,几乎就是原生系统。然而!WSL 运行于内核态,与 Windows 平级,就算有文件系统的映射,WSL 也并不能直接当作 Windows 的 Shell 来使用的。看下面的图你就知道我在说啥了。
图中,npm 和 git 是我在 Windows 中安装的 exe 包,而 ssh、tail、md5sum 是 Cygwin 中提供的 Linux 命令,直接相互调用无压力,这才是 Windows 中我想要的 Shell 的样子。可是 WSL 是不能这么做的,两个系统是隔开的。
Windows虽名叫“窗子”。
可它默认的“窗口分屏”功能却简陋到了异常:
——Windows也因此完全没法实现一步“上下二分屏”。
——而三分屏乃至各种花式分屏,属于想都别想。
——因为就连基本的四分屏,都必须借助 Win+方向键
的快捷键才能实现。
在小屏幕+横屏下使用尚能凑合。
可对于带鱼屏/大屏用户,乃至竖了一块24寸屏幕当作副屏的我而言——
仅仅是在竖屏下进行一次“上下分屏”,都需要整整四步+两次快捷键+一次手动调整窗口尺寸的“曲线救国”:
win+←
快捷键将窗口分为半屏;win+↑
将窗口进一步分为1/4屏;——这已经完全没法用了。
既然系统自带不给力,那就得靠万能的第三方想想办法。
——子曰:“你已经是个成年人了,该学会自己装软件了。”
在试用了一大堆分屏软件后,我最终选择了PowerToys,原因无他:
——是的,你没看错。
点进软件的Gayhub主页,开发者的名字竟神TM写着“Microsoft”。
来自巨硬带着爱。
——这是一款由微软亲自部署,亲自开发的”合集“性质软件,作用是扩展自家系统的高级功能。
且扩展的功能远不止一个“分屏”,堪称丰富:
“WTF????”
合着巨硬也TND知道自己那破“窗子”功能残缺,甚至自己做了个合集工具来补全。
还开源在了Gayhub——
——而不是通过Windows更新,直接把这些功能整合进系统??
——成年人如我,面对如此风骚操作,也不得不一脸懵逼。
正文开始之前必须提醒:
如果你对软件的其他功能感兴趣,又看不懂鸟语,请参考/对照这篇文章提供的UI翻译,摸索使用。
在项目页面下载并安装PowerToys。
打开软件的第一页,这里有每一项扩展功能的总开关。
如果你只需要分屏功能(FancyZones ),那最好将Available PowerToys
下不需要的功能全部关闭。
往下滚动会看到General
项,翻译如图:
推荐照图配置,完成配置后点击右上角的Save
保存。
完成基础设置后,点击左侧列表的FancyZones
,进入分屏功能的相关设置。
FancyZones
的重点功能翻译如图:
推荐照图配置(全部关闭),完成配置后点击右上角的Save
保存。
部分功能请根据自身习惯,酌情开启。
完成以上设置后,回到这一页的顶部。
点击Edit zones
,打开“分屏区块编辑器”窗口配置你的分屏方式,翻译如下:
注意:
Edit zones
,这样才能为每块屏幕进行分别的设置。软件默认提供了五种窗口排列模式。
根据你的自身需求选择,点击Apply
保存即可开始使用。
效果如图:
而PowerToys为每一块屏幕都提供了最多40个的分屏区块:
即是说——
——只要你的屏幕够大,你甚至可以分屏数框框:
哪怕你对自带的窗口排列方案不满意。
也可以进入“分屏区块编辑器”,点击左下角的Edit selected lgyout
进行自定义布局。
就像这样:
可以自由调整每个区块的大小,以及添加/删除区块。
保存即可开始使用。
这里就请各位按照需求,自由发挥了。
PowerToys的分屏教程至此结束。
以我个人为例,需求如下:
所以我在32寸的主显示器上,进行了如下配置:
这样在32寸的主屏上拖拽窗口,将不会调用PowerToys分屏,而是windows默认。
至于24寸的副屏,则直接以默认的“Rows”排列方式建立了“上下三分屏”。
最终效果如图:
拖动窗口进目标屏幕即可触发分屏。
而这个“上下三分屏”,实际也并不是单纯的分三个屏幕——
——当你将窗口拖到两个分屏区块之间时,会合并两个区块形成一个2/3屏的大窗口,变成一大一小的上下二分屏。
而当进行多窗口的细碎任务时,自然也能进行三分屏。
这个意料之外的功能不仅令人惊喜,更实用到了异常。
——而触发这一切,只需要简单的动动鼠标,一气呵成!
这一刻,我不由得湿了,
眼眶。
——谁能想到,最终完美解决Windows下竖屏“上下分屏”难题的,居然是Microsoft自身。
只有魔法才能击败魔法。
——也只有巨硬才能完善巨硬本身。
而PowerToys项目附带的功能,早已包括但不限于“分屏”。
引用wiki,项目的定义如下:
Microsoft PowerToys是一组免费的系统工具软件,由微软为Windows操作系统上的高级用户设计。
这些程序为了使生产力达到最高,加入或变更了一些功能,或加入更多自定义选项。
希望未来某天。
PowerToys项目里的实用功能稳定完善,并最终内置进bug10。
毕竟比起印度咖喱翻来覆去为了KPI瞎几把魔改UI,这些真正提高工作效率和使用体验的东西,才是Windows迫切需要的“更新”。
倒杯凉水,坐和放宽。
近期完成了桌面硬件升级的我,现在终于完成了软件上的进化。
——完美解决双屏下分屏难的痛点。
看着屏幕里纸片美少女几乎“等身大”1:1的紧致大腿与丰满胸部。
——不由得嘴角上扬。
“啊!爽到!”
关于桌面硬件”升级“的东西,近期会单独写几篇东西骂街。