Reading view

There are new articles available, click to refresh the page.

Google 重塑搜索框，进化 50 亿人的上网习惯

爱范儿

马扶摇

20 May 2026 at 16:00

在品尝过「会前甜点」Android Show 之后，真正的重头戏谷歌开发者大会 Google I/O 2026 正式揭开了帷幕。

不出所料，在时长接近两个小时的活动中，Gemini 占据了绝对的 C 位。

图｜Google

除了更新基础模型和周边能力之外，Gemini 也更加深入的集成到了谷歌 app 全家桶里面，甚至还给 iOS 和 macOS 带来了一些更新。

比较可惜的是，上周亮相的 Googlebook 和 Android 17，在本次 I/O 开场活动上都没有被提及。

我们唯一看到的硬件产品，是与三星联合开发的智能眼镜：

图｜Google

总之，谷歌借助本次 I/O 大会传达的信息已经很明确了：

Gemini 的能力将会越来越强、存在感将会越来越高，与全球十几亿谷歌产品用户的「物理生活」的集成也会越来越紧密。

从夸张的角度想—— Gemini 距离接管大部分人的日常工作，似乎就只差一个人形机器人了。

底层模型更新

整场活动里最重磅的，就是围绕着 Gemini 的几款底层模型的更新了。

首先是正式的 Gemini 3.5 版本发布，用户最先可以体验到的版本则是 Gemini 3.5 Flash。

它在多个维度上展现出媲美之前 2.5 Pro 的能力，并且保持了 Flash 系列的速度：

图｜Google

得益于速度和性能的平衡，Gemini 3.5 Flash 最擅长的场景之一就是处理长期、大规模的智能任务，同时还能省下大量 token 开销。

同时，最新的 Antigravity 集成也让 Gemini 3.5 Flash 拥有了更丰富的输出形式——

执行分类代码、根据论文编写游戏、转换上古代码库、构建 3D 场景、交互式 Web 界面等等。

将遗留代码库转换成 Next.js｜Google

此外还有规模最大的「世界模型」Gemini Omni，用谷歌的宏愿来描述 Gemini Omni 则是：

它可以根据任何输入内容，输出任何你想要的东西（Generate any output with any input）。

Omni 的首款模型产品则是 Gemini Omni Flash，除了 Gemini app，它也集成到了 Google Flow 和 YouTube Shorts 里面，支持用户使用自然语言生成「最像真的」的视频。

图｜Google

相对应的，谷歌也调整了自己的 Google One 订阅模式，在原本最高等级的 AI Ultra 方案里新增了一个 100 美元/月的分类。

这个新的订阅同属于 AI Ultra 级别，包含 Gemini 3.5 Flash、Antigravity 2.0 和其他新功能的优先访问权等等。

当然，传统的 20TB 云空间和 YouTube Premium 权限也同样包含，主要面向开发者和高级创作者之类的群体。

图｜Google

同时，原本 250 美元的最高等级 AI Ultra 订阅则迎来了降价，现在只需要 200 美元/月就能享受到包括最高 20 倍于 AI Pro 的使用额等等特权。

另一个重大的收费模式变革则是 Gemini app 本身。

图｜Google I/O

在新闻稿里，谷歌宣布将 Gemini 的每日限额从「提示词额度」改成了「使用量计算」。

这样算下来，图片、视频和代码的消耗变多、文本任务消耗量则变少，整体是一种更灵活的算力计费模式。

实际业务落地

与 OpenAI、Anthropic 之类的公司不同，谷歌最大的特点在于，它真的有一套能够直达全球十几亿用户的产品生态。

在上述基础模型之外，谷歌本次展示的策略，重点是将这些「抽象」的 AI 模型能力，整合进普罗大众每天都在使用的 app 里面。

图｜SlashGear

而这种整合大体上分成三步：传统搜索业务变革、手机系统智能化、视觉智能融合。

「搜索引擎」作为谷歌的起家业务，在今年的 I/O 上迎来了一次彻头彻尾的 AI 改造，谷歌称之为「AI 搜索的新时代」。

这种业务转变背后的逻辑很简单：相比 20 年前，人们只在搜索框里输入单词或短语，现在的人更习惯在里面输入复杂的复合指令。

图｜Google

换言之：谷歌把传统的搜索框（search box）变成了一个通用对话框（chatbox）。

除了搜索，用户可以在里面要求任何形式的内容。

这刚好也是本次 I/O 活动的重点更新内容——具有智能体能力的搜索。

首先，AI Mode 的基础模型会升级到 Gemini 3.5，你的搜索框会自动推荐和补全输入的内容，让你的关键词变得更详细或者更广泛。

图｜Google

此外还有全新的生成式 UI（Generative UI）回答，谷歌会根据你询问的东西智能生成最合适的回答形式。

比如搜索股票走势，回答里不仅有文本，还会生成折线图；问装修灵感，回答里就生成图片……

甚至你搜索物理问题，它还能调用 Antigravity 快速编写一个互动式的 Web 演示：

图｜Google

使用了这么多年的「多模态搜索」之后，我们终于进入了「多模态回答」的时代。

谷歌搜索结合 Antigravity 的能力不止于此，它还可以更进一步，根据你在搜索框里输入的内容实时生成 Web 形式的仪表盘或追踪器。

用人话来说，就是谷歌搜索框为你的需求直接编写了一个专门的 app。

这种多模态能力是非常恐怖的，甚至有可能彻底改变人们检索信息的方式——

毕竟我们搜东西，大多是为了将搜索结果用在别的任务里面，而新的谷歌搜索可以直接帮你做完下一步操作。

图｜Google

至于这种「代办」的具体方式，则是 Gemini Spark。

简单来说，Gemini Spark 本质上是类似 OpenClaw 的「语义理解-自动执行」功能，一个谷歌 Claw。

其中 Gemini Spark 基于最新的 Gemini 3.5 模型，支持 7 天 24 小时不间断运行。

并且由于运行载体是 Google Cloud，还可以执行跨端代理操作——在手机上布置任务，在电脑上查收结果。

图｜Google

Gemini Spark 目前支持所有谷歌套件 app，后续则会拓展 MCP 平台以兼容第三方 app 的内部功能，同时支持用户自己上传 Skill。

谷歌还宣布 Gemini Spark 后续会集成到 Chrome 和 Android Halo 中，为浏览器和手机带来智能体自动操作的功能。

Android Halo｜Google

最后一步棋，则是 Gemini 与视觉智能的融合。

在本次 I/O 活动上，谷歌发布了首个与三星联合开发的「纯音频智能眼镜」产品，分别使用 Gentle Monster 和 Warby Parker 镜架：

图｜Google

单纯从功能上讲，这个纯音频眼镜与市面上已经有的智能眼镜相差不大，主要优势是可以直接调用 Gemini 的多模态功能，用来调用前面提到的其他复杂能力。

另一方面，XREAL 与谷歌合作的那款带屏幕的智能眼镜 Project Aura 在本次活动上又有了更新。

根据介绍，Project Aura 搭载了 XREAL 自研的 X1S 空间计算芯片，并为了佩戴舒适采用了分体式的设计。

也就是说，Project Aura 的眼镜部分只负责显示，真正的处理芯片、电池包和触控板需要通过数据线连接到一个外置的随身单元上：

图｜TheVerge

至于实际的生活功能方面，Project Aura 将会支持 Google Maps 沉浸式导航、巨幕/窗口化视频播放、YouTube VR 视频、WebXR 三维绘画、DP 拓展笔记本屏幕等等用法。

图｜TECHEBLOG

总体来说，Android XR 是一套完全基于空间计算的视觉化的操作系统，与 Gemini 的能力搭配起来，为我们画出了一套未来智能眼镜的线路图。

更重要的是，虽然现在 Android XR 和 Android 17 是两个完全独立的系统，但就像 Android 和 ChromeOS 融合那样，它们未来大概率也会合二为一、变成一个「视觉智能系统」类似物。

Gemini 能接管一切吗

熬夜看完整场 Google I/O 之后，除了 Gemini 3.5 和它的小伙伴们带来的惊讶之外，我们难免也诧异于 AI 对于人类基础行为的革命。

无论是 Gemini 3.5 Flash、Antigravity、Gemini Spark，它们都隐藏在了一个简洁的「搜索对话框」背后，将搜索这一行为从「获取信息」进化成了「完成任务」。

图｜Google Search

我们很难说这种进化在长期来看会对我们使用网络和人工智能产生什么影响，但我们至少可以从里面看到谷歌的野心——

为一套强悍的 AI 模型赋予前所未有丰富的功能，并且将这些功能集成进自己覆盖全球几十亿用户的网络产品里，共同提升这几十亿人的效率。

Gemini 同时切进所有这些网络产品，副作用是「应用」这个概念正在变薄——

Agent 越能办事，应用内部和搜索结果页的存在价值就越被稀释。

至于这层智能会把多少旧规则一起重写，现在没人能答，谷歌自己也答不上来。

#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。

谷歌发布安卓 AI 系统，这就是苹果想象中的自己

爱范儿

马扶摇

13 May 2026 at 12:00

和去年一样，在正式的 Google I/O 开发者大会之前，谷歌为 Android 单独开了一次小型发布会。

本次 Android Show 上，谷歌几乎是一股脑将未来一年有关 Android 和整个 AI 产品生态的「宏愿」抖了出来。

除了作为基底的 Android 17 之外，我们这次还迎来了一些意料之外的平台更新和几款硬件产品的发布。

重点在于：虽然产品不多、距离 Android 17 广泛推送还有一段时间，但我们已经足以看到谷歌未来五年甚至十年，对于人工智能生态的计划了。

更要命的是，今晚的谷歌，刚好是苹果梦想里进入 AI 时代之后的自己。

操作系统到智能系统

活动刚开场，谷歌就宣布了一项意义重大的举措：

Android 将不再是一个单纯的操作系统（Operating System），而是一个智能系统（Intelligence System）。

图｜Google

换句话说，曾经以「用户手动操作」为绝对主流的软硬件使用方式，在谷歌看来已经是上一个时代的符号了。

从今天起，Android 作为一个智能功能的集群，会更加主动地介入到用户操作流程的更前端，想你所想、做你所做。

图｜Google

这也是为什么在本次活动上，Android 17 这个具体的系统版本出现的次数屈指可数，Gemini Intelligence 却成为了系统的代名词。

首先，Gemini Intelligence 作为谷歌 Gemini 在手机硬件上的最新形态，极大强化了它多模态、跨环境、高度整合的运行模式。

比如作为系统输入的第一入口，默认键盘 Gboard 就得到了一次功能强化。

基于 Gemini Intelligence 的多模态能力，原本在键盘功能中存在感不高的「自动填入」功能极大地拓展了它的信息来源：

图｜Google

除了手动保存的各种密码之外，Gboard 还将会支持自动填入图库里面的证照信息、聊天提到的地址信息、邮件撰写的日程信息等等。

更直白地说：Gemini Intelligence 已经远超「帮忙记住密码」的水平，而是真正像个助理一样帮你记住和建议各种来源、各种类型的信息。

另一种有效利用这些多模态信息的方式，则是 Android 的桌面小组件（widget）。

在 Android 17 中，Gemini Intelligence 将会支持一项名为「Create my widget」的功能，但不是第一时间上线、而是目标今年晚些时候。

图｜Google

这个新功能主要做的，就是用类似 vibe coding 的模式，根据你的指令在桌面上创建新的小组件，打破了小组件只能是 app 预置的那些。

举例来说，相比功能单一的记录卡路里的 app，我可以和 Gemini 说：做一个每周工作日向我推荐两次高蛋白餐的小组件。

图｜Google

这样一来，桌面小组件就真正变成了一项复合任务的入口，本质上和人 vibe coding 一个 app 的性质是完全相同的。

此外，喜欢语音输入的用户也有福了——新版 Gboard 将会支持类似 Typeless 的高智能化语音输入功能，名字叫做 Rambler。

相比以前要亲口说「逗号…句号…」，Rambler 可以将一整段充满了「嗯嗯啊啊」的口述转译、清洗、整理成一段整洁的文字：

图｜Google

另一方面，Gemini Intelligence 的自动执行功能也得到了进一步加强。

去年的 Google I/O 和发布会上，谷歌演示过给 Gemini 下命令，让它自动帮你点外卖、叫车、订票之类的操作，正式上线之后反响不错。

而在 Android 17 中，Gemini 升级成 Gemini Intelligence，这种「代操作」也支持多步骤任务了。

比如以前只支持简单的「帮我订一张票」，你现在可以在 Gemini 对话框里直接拍下旅游宣传册，和 Gemini 说「在携程上帮我找一个类似的双人团行程」：

图｜Google

重点不在于 Gemini 能够执行什么任务，而是它拥有了更强大的「多做一步」的能力，有时候就是多的这一步，让 AI 从「能用」变成了「有用」。

当然 Android 17 的更新也不是 Gemini 的独角戏，谷歌同样对很多「Android 核心体验」进行了优化。

在 Android 17 中，谷歌和 Meta 达成了合作，在 Facebook、Instagram 等等 app 里支持了调用原生相机功能，比如 Ultra HDR、超级防抖、夜景视频等等。

而谷歌使用了好多年的平面风格 emoji 也迎来了一次更新——从原本的纯 2D 变成了 2.5D，在风格上更接近 iOS 使用的 emoji 了：

图｜Google

而我们此前介绍过的 QuickShare 兼容 AirDrop 的功能，也将在 Android 17 上支持更多厂商的设备。

除了三星和 Pixel 之外，（国际版）OPPO、Vivo、一加和荣耀的较新机型也将在今年下半年陆续更新兼容 AirDrop 的固件：

图｜Google

谷歌的 AI PC

在 Gemini Intelligence 之外，谷歌也没有忘记给这些更复杂、更强大的 AI 功能打造一套量身定制的硬件。

这个新硬件的形态，既不是吊坠，也不是耳机，更不是手表手环——而是曾经的 Chromebook。

没错，在 AI 时代，谷歌又双叒给自己的笔记本改名了。

从 Pixelbook，到 Chromebook，再到最新的 Googlebook：

图｜Google

和 Chromebook 一样，Googlebook 并不是某一款具体的笔记本电脑，而是同样和第三方厂商合作、只要符合标准的都可以叫这个名字。

而 Googlebook，就是「第一款为 Gemini Intelligence 量身打造」的硬件产品。

除了上面的全新 Gemini Intelligence 功能之外，Googlebook 在日常使用最频繁的基础人机交互层面，做出了堪称革命性的创新——

在 Googlebook 上呼出 Gemini 功能，既不需要说话、也不需要按键、更不是右键菜单，只需要「摇一摇光标」就行。

图｜Google

基于 Gemini Intelligence 的多模态能力，推荐的 AI 指令甚至可以根据光标下面的内容、选中的内容、屏幕上可以进行的操作等等因素自动调整。

在如今电脑端 AI 功能越来越密集、笔记本键盘空间不够充裕的情况下，Googlebook 的「魔法指针」无疑是最直观且优雅的解决方案之一。

此外，Googlebook 还解决了 ChromeOS 历史上的老大难问题：它是谷歌的产品，却跑不了 Android app。

换句话说，所有 Android 手机里面的 app，在 Googlebook 上都可以直接运行，基本看齐了如今 macOS 跑 iOS 软件的水平。

这一切的基础，就是爱范儿之前文章中提到的谷歌大力推行的 GKI（通用内核镜像）计划，正在让 Android 脱离手机的桎梏、无缝衔接到更多形态的设备上。

虽然谷歌目前没有提到这个功能的兼容情况，但我们猜测，依据处理器规格和网络状态，Googlebook 应该同时支持本地运行和画面投屏手机 app 两种方式。

图｜Google

根据活动消息，首批 Googlebook 的生产厂商还是那几个熟悉的身影：宏碁、华硕、戴尔、惠普、联想等等，首批产品预计在今年内上市。

图｜Google

除了笔记本电脑，Android 17 同样更新了一部分 Android Auto 车机系统的功能。

比如更像 OpenClaw 能力的 Gemini Intelligence 代操作、优化的 3D 道路画面、更加智能化的流媒体播放功能等等。

当然也支持把手机上自创的自定义 widget 显示在车机上。

图｜Google

同时，原生支持 Android Auto 的品牌范围也在增加，部分型号甚至支持记忆当前车辆信息，类似后备箱尺寸、仪表盘规格等等。

这样一来，用户在使用 Gemini 问答的时候，车机就能给出具体回答，比如「能不能同时放俩 27 寸旅行箱？」或者「那个像是刺客的警示灯是什么意思」之类的。

可惜的是，这项功能目前也不会立即上线，同样预计为「今年晚些时候」才会有产品搭载。

总的来说，本次活动只是今年 Google I/O 的开胃菜，但它涉及到的理念变革却是非常根本性的——

其实在活动的开头，谷歌就指出了：好用的人工智能技术，就应该是让人感受不到的，它会融入进每一层软件和硬件的体验。

图｜Google

而这正是 Gemini Intelligence 在做的。

无论是 Pixel 手机、Android Auto 车机还是 Googlebook，这些硬件最终都只是 Gemini 智能的一种体现方式而已。

值得玩味的是——谷歌今天晚上所做的，刚好就是苹果削尖脑袋想要实现的那套 AI 生态。

让 iPhone、手表和 Mac 共用一套智能体系，用户无论在哪里使用，功能和体验都是高度相似的，硬件只区分交互方式、不影响智能水平。

图｜Apple

可惜的是，苹果挣扎了这么久，也没有搞定「模型」的部分，反而让自己的硬件成了别家模型的嫁衣。

将来的智能系统（Intelligence System），形式比现在更多样、但核心却比现在更加统一。

#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。

完成了 Google UX Design Professional Certificate 后的收获

Stories by 李瑞东 on Medium

李瑞东 Ruidong Li

4 May 2024 at 15:45

最近了解到 Coursera 这个平台里面有一个 Google 设计团队出品的的 UX 设计课程，课程里会介绍完整的 UX 设计过程，并且教我们怎么写作品集和准备面试之类的。

即便这是一门面向初学者或应届生的课程，我觉得也有必要参加这个课程看看。一方面能锻炼下自己刚闭关修炼出来的的英语能力，更重要的是还能了解下西方职场的设计流程和设计文化（毕竟 “UX 设计” 这个概念是西方人创造出来的），我一直想对比看看老外的设计文化和自己这几年在国内职场的感受有没有什么异同。

于是就报名参加了这个网课，都是抽时间来学习的。比如工作日吃午饭和吃晚饭那段时间，或者周末的部份时间等等。总共花了 2 个月完成了所有课程。写这篇文章的目的也是记录下结课之后的感受：

图片中央展示四个方框，每个方框内部都用白色中文文字标识了不同的概念：“新的概念”，“听力、阅读能力”，“无障碍和公平”，“求职指引”。

里面提到的一些概念我没有听说过。即便我工作了 5 年，在小公司和大集团都呆过，里面有些概念仍然给了我很大的探索空间；
英文听力、阅读能力锻炼。里面有大量的视频和阅读材料，用词应该就是比较地道的行业术语，这些是翻译软件不能提供的。而且里面的材料都会不断重复一些短语或句型。我觉得我的阅读能力和速度是有所提升的；
“无障碍” 和 “公平” 的概念被很早提及并贯穿全课程。我一直以为只有比较成熟的设计师或产品才会考虑到这些，但这些概念在课程中很早就被提及了，而且是反复提及。这触动了我，并真正地影响到了我的工作；
提供了全面且周到的指引帮助设计师准备作品集/简历/面试。这方面内容他们写得很细，告诉我们作品集里应该包含哪些，针对不同面试阶段所做的准备等。里面写到的东西我很有共鸣，因为我在找工作的时候也会去思考这些细节。

新的概念

工作这几年，我一直会尝试从更多不同的维度来思考和扩展原有的设计边界，做到这点需要有比较宽广的知识面。这里分享下我在课程里了解到的一些新概念，以及我的理解。

Affinity diagram 亲和图

这是一种组织数据的方法。从不同的反馈和数据中整理出他们的相似之处和关系。亲和图可以用在不同的设计阶段，比如在头脑风暴中，或者收集到用户反馈后，这里以后者为例子。

具体做法是在收集好一批用户反馈后，将每一个原始反馈浓缩成一句话，写在便利贴上并将它们都贴在白板上（当然，也可以用在线工具如 Figma 完成）。然后团队成员一起看这些内容，将提到相似概念/问题/需求的便利贴放在一起，并给这一堆便利贴起个名字概括他们的共同点。

根据分组结果，我们可以总结出一些趋势、痛点，了解到我们需要解决的问题也为后续的洞察报告提供了依据。

最开始在课程里了解到这个方法的时候，我突然想起来这与我两年前翻译的文章：【译文】我们如何重建 Shopify 的开发者文档里提到的 “卡片分类法” 很像，都是将相似的卡片堆成一组，给该组命名，然后得出结论。

但卡片分类法里面 “分类” 的动作是由团队外部的人参与的，并且用于揭示用户的心智模型并为解决网站信息架构问题提供指引；而亲和图则是通过组织大量原始数据，告诉团队有哪些问题是用户关心的，亟待解决的问题。

*该概念在第四门课程的第三个模块中提及 (Conduct UX Research and Test Early Concepts — Module 3 — Gather, organize, and reflect on data)

Digital literacy 数字素养

这个概念大意是指人们对于数字产品、网络来获取信息、交流和创造内容的能力。比如一些年长的人、生活在网络没那么普及的环境中的人，他们对于使用电子设备和互联网就会有些障碍，理解功能和界面也会感到困难。而年轻人，特别是互联网行业的从业者则对这些就比较熟悉，各种新软件、新概念都能很快上手。

课程中对这个概念并没有展开太多，主要是提醒我们作为设计师，要了解到我们的用户是谁。如果是一个面向较宽广的用户群体，最好考虑也到对电子设备和互联网没那么熟悉的人。包括在做可用性测试时，招募的参与者最好也考虑到这个因素。

*该概念在第一门课程的第二个模块中提及 (Foundations of User Experience (UX) Design — Module 2 — Get to know the user)

Deceptive pattern 欺诈性设计模式

指的是一种设计方法：通过设计去诱导用户去做一些本来不想做的事情，或购买本来不想买的东西。

在课程中，明确指出这是不道德的事情，不是好的做法。一旦用户认为自己陷入了欺诈性设计模式当中，公司将会失去用户的尊重和信任。课程中列举了一些例子，我可以拿几个有意思的的分享出来。

Confirmshaming (羞辱性确认): 让用户对自己作出的决定感到愧疚。比如一个新闻网站的订阅按钮，文案里原本可以写 “立即订阅 / 不了，谢谢”，但为了操纵用户的情绪，文案写上 “立即订阅 / 不了，我不关心身边的事情”。
Urgency (急迫性): 引诱用户在 “有限的时间内” 作出决定。比如电商网站里给你送了一张仅限当天使用的优惠券，促使你赶紧付钱消费。课程里指出并重点不是限时促销这件事情，而是在这过程中给用户增加了消费的压力。作为设计师，我们应该在曝光公司的促销活动的情况下，尽量避免操纵用户情绪。
Scarcity (稀缺性): 使用户感受到这件商品非常稀缺。比如一个弹窗推送或明显的广告写着 “商品仅剩 5 件”。课程中建议设计师聚焦于怎么帮助用户更好地了解该产品，而不是利用设计促使他们进行冲动型消费。

有意思的是这几种 “欺诈性设计模式” 在咱们国内电商环境中太常见了，以至于没有这些反而感觉不正常。

看起来这是国内外文化的差异的一种体现。在国内的环境中丝毫不会避讳这些东西，反而设计、产品、运营都会一起构思怎么做才能更好地 “诱导” 用户做某些事情。甚至还会在内部复盘、分享，看看过程中有哪些地方可以继续改进。

2018 年，我的第一份工作是在面向消费者的电商公司里做 UI 设计师，经常要在界面上做出 “领取优惠券”、“秒杀价剩余 N 小时” 和礼包、金币满天飞的插画等设计，正正是因为自己不喜欢做这种设计，之后才转向了更注重 UX设计的做 B 端、SaaS 行业。

虽然自己本身是一点都不喜欢这种设计方式，但这似乎能实打实地帮助到公司获取收入。公司有一份好的收入，大家的工作才能稳定。似乎陷入了一个无法走出的循环 —— 明知道这种设计方式是不对的，是有诱导性质且给用户带来烦扰的，但又不得不继续做，并想办法做得更好。

*该概念在第三门课程的第三个模块中提及 (Build Wireframes and Low-Fidelity Prototypes — Module 3 — Understand ethical and inclusive design)

Biases 偏见

课程里着重介绍了一个叫做 “隐性偏见 (implicit bias)” 的概念。“隐性偏见” 指的是我们潜意识里有一种态度或偏见，影响了我们对某一群体的理解或决定。

比如一个餐厅老板收到两份简历，求职者 A 是一个二十多岁的毕业生，没有餐饮行业经验；而求职者 B 则是一个 50 多岁的人，有 30 多年餐饮行业经验。但最终老板选择了求职者 A，因为他认为年轻人的体力更好，做事情会比 50 多岁的人要快。这就是一个 “隐性偏见” 的例子。

课程中还介绍了其他几种偏见，这里也分享一些我觉得有意思的：

Confirmation bias (确认偏见)。指的是人们在收集信息和分析信息的过程中，倾向于寻找支持自己想法的证据。甚至尝试以更贴近自己预想结果的方式来解释数据；
Friendliness bias (友善偏见)。指的是为了令其他人满意，受访者更倾向于做出访问者希望得到的答案或者做出积极评价。通常发生在可用性测试当中，受访者觉得说出真实答案或负面情绪的答案会被认为冒犯和不友善，不将自己的真正想法说出来；
False-consensus bias (错误共识偏见)。指的是人们倾向于认为自己的观点或行为比实际情况更广泛地被认同，并且觉得其他人的观点或意见是被少数人接受的。比如一个人很乐观主义，就会认为世界上大多数人都是乐观主义；设计师能够很轻松地理解自己设计出来的图标、图像含义，就会认为其他用户也能轻易理解。

学到这里的时候我似乎被当头一棒，我似乎对里面提到的不少偏见都有共鸣，并且自己从来没意识到有这么一回事。总的来说，课程希望我们认识这些偏见，然后提供方法教我们怎么避免这些偏见。

以上列举了几个我在课程里了解到在日常工作中不怎么接触到的概念。可以看出来做一名 UX 设计师似乎得有宽广的知识背景，比如设计、人文、心理、社会学等等。通过这门课程，我觉得我对心理学产生了一些兴趣。

* 该概念在第三门课程的第三个模块中提及 (Build Wireframes and Low-Fidelity Prototypes — Module 3 — Understand ethical and inclusive design)

听力、阅读能力

课程里面的听力和阅读材料实在是太多了，基本上是一节视频课程，搭配一篇的阅读，如果有其他可以衍生出来的知识点，甚至会多篇阅读。

里面绝大多数老师都是美式口音，语速有刻意地减慢，我听着很舒适，绝大部分情况下不用看字幕。只是到了一些包含大量从句的长句子或新概念时可能会需要倒退一下多听几遍，再听不懂就会开字幕来看。

值得一提的是，里面有大量的行业术语，有很多我在国内日常工作中的用到的设计方法/流程等，这里都有出现到。作为学习者，我自己有做一个表格，把值得记录下来的表达方式都记下来，比如：

Above the fold 指的是在首屏（不用滚动）就能看到的内容；
Deliverable 设计的交付物；
Digital real estate 大概是指视窗范围或可供设计师发挥的空间尺寸；
Firm parameters 指一些设计过程中的限制，如时间，项目资源和预算等…

我觉得积累这种行业词汇有一个宝贵之处是，它的表达很地道，用通用的翻译软件是做不到的。这对我阅读设计经验文章，或者自己用英文写设计博客很有帮助。

无障碍和公平

无障碍

课程中介绍了几种辅助技术 (Assistive Technology)，如颜色模式、语音控制、Switch 设备和屏幕阅读器等帮助身体有障碍的人们更好地使用我们的产品。课程强调即便是健全人，或者认为自己是健全人的群体，也有可能会用到这些辅助技术。课程建议我们在设计的全流程都考虑这些因素。具体的做法，比如：

支持多种色彩模式。如亮色/暗色模式，支持增强对比度和减弱透明度等效果；
提供语音控制支持。允许用户通过声音来导航和与界面上的元素交互。另外，里面提到有个概念叫做 “VUI”；
支持一种叫做 “Switch” 的设备。这是一种代替键盘、鼠标或手指等常见输入方式的设备，通常只有一个按钮。用户就是通过一个按钮来实现浏览网页、输入文字等日常操作的；
支持屏幕阅读器。确保人们可以在看不见屏幕的情况下也能获取到主要内容。课程建议我们给图片添加替代文字，或者给按钮等控件加上合适的标签，并且留意元素的聚焦顺序。

这里分享一个在这方面有所体现的网站：HubSpot.com

这个网站提供了强对比的色彩模式，在顶部导航栏里有开关可以切换。同时也支持减弱动画的效果，如果我的设备在系统设置里设置了减弱动画，这个网站的大部份动效都会被移除。

公平

课程中介绍了一个概念叫做 “以公平为中心的设计” (equity-focused design)，并厘清了 “平等” 和 “公平” 这两个概念：

平等是每个人都有相同的机会和支持，即每个人都拿到了同样的东西；
公平是根据每个人不同的情况而提供不同的机会和支持，最终大家都能有相同的结果。

课程中指明，面向 “公平” 的设计，需要考虑到所有种族、性别、能力，特别是一些曾经被忽视和排除的群体。

他们以一个问卷问题作为例子：在收集受试者的性别信息时，如果只提供三个选项：“男”、“女” 和 “其他” 是不够的。如果想要更包容和公平我们应该提供：“男”、“女”、“非常规性别”、“非二元性别” 和 “请填写”。后者通过提供非传统性别选项和自定义选项，关注到了那些可能在传统问卷调查中被边缘化的群体。试图平衡不同群体间的表达机会，确保他们的声音被平等对待和听见。

从这门课程里我正面感受到了来自西方文化差异。实际上我不是很想太深入学这里面的门道，主要是我没法判断他们这种做法到底是对还是错，我有时候会认为这是在闲着没事干，有时候又认为我们身边确实也会有这种非传统性别的人，他们或许真的需要被 “平等对待”。

学到这里时，刚好公司的工作中有机会可以让我在设计中加入对无障碍的考量，我便抓紧机会在公司实施了一番。如果我的计划落地成功，我也会在这里分享出来的。

*该概念在第一门课程的第二个模块中提及 (Foundations of User Experience (UX) Design — Module 2 — Get to know the user)

求职指引

最后一课老师教授了我们怎么做作品集、一份作品集里要包含哪些东西、面试的流程、怎么准备面试等。

课程里讲述的都是西方世界的职场规则，有些未必在国内职场适用，比如：

比如他会提到设计师应该有一个自己的个人网站，里面需要及时更新自己的作品。但在国内大家似乎更喜欢将作品传上平台提高曝光度，比如站酷和 UI 中国；
他会教我们怎么建立自己在互联网上的形象并通过 LinkedIn 去做 Networking。但似乎在国内的职场上没有这一步，身边的人多数都是直接在网站上投简历，或者有少量的人是熟人内推进去的；
里面有教我们怎么应对小组面试。我这几年在国内面试了大大小小公司，没试过有小组面试的情况，说明小组面试在我们的行业内不是特别流行。

印象比较深的是在课程里他提到了对于面试的准备，以及面试过程中的注意事项。课程里说得真的挺细的，比如：

面试前要了解好公司所做的业务，清楚自己为什么适合去那家公司；
提前准备好一些常用的问题，比如个人介绍、个人优势以及介绍设计案例等；
学会用 STAR 法则回答困难的问题，在面试前提前练习好；
根据面试官身份来改变面试的侧重点和要提问的问题，需要体现出自身的专业性；
面试时可能会有现场测试题。所以我们要练习好将自己的想法说出来的能力，也要有界定清楚问题的能力（因为有时候面试官特意给出很模糊的问题）

有时候刚看看到课程里提到的方法和技巧，正好是我有用过的，我会感到有共鸣，觉得自己的方向是对的。

另外，课程里还有教我们如果想走自由职业，要遵循怎么样的步骤。写得还比较详细，我这里列举几点：

明确目标用户是哪些群体，他们为什么要选择自己的服务；
了解自己的竞争对手，看看有没有东西是他们提供不了而自己是可以的；
通过参加线上推广、线下活动、熟人推荐等方式推销自己的服务和建立口碑；
计算开支，合理定价，并且制定财务计划 —— 构思第一个月、第六个月或第一年自己的财物状况是怎样的。

*该内容在第七门课程的第三个模块中提及 (Design a User Experience for Social Good & Prepare for Jobs — Module 3)

总结

以上就是我这两个月以来在 Coursera 平台里学习 Google UX 课程的一些收获。我觉得还是挺有意思的一门课程，即便不是所有内容都能在日常工作中应用，但至少知道在地球里的另一个世界，那边的设计师他们的思考习惯、职场文化是怎样的。

我很推荐看到这里的设计师们去这门课程 Google UX Design Professional Certificate 里瞧瞧，相信大部份人都是有收获的。收费不是很贵，是按月来收费。每个月 49 美刀，工作党每天抽点时间来看，一般 2～3 个月都能完成了。

事情按照预期发展，五一假期结束了这门课程，下半年又可以开始捣鼓另一件事情了。

PageSpeed：来自谷歌的服务器终极加速神器

中原驿站

胡中元

23 March 2017 at 23:40

今晚给服务器装上了一个神器：PageSpeed，事实上这是一个 Nginx 的模块，使用它需要重新编译 Nginx，于是我顺便也将 Nginx 更新到了最新稳定版。最终效果相当给力，网站加速效果很好。心里非常的激动。

网站加速

给网站加速，请问有多少种方法？

压缩 JS、CSS，雪碧图，前端静态资源缓存，gzip，合并请求。。。

这些方法要多少有多少，作为一名合格的 web 开发人员，能在我服务器上运用的技术我都给运用上了。在开发前端页面时，各种强大的插件来保障资源的有效压缩。

不过，这始终还得让开发者来进行这样的工作，不开心~ :(

而 PageSpeed 就是这么的一个工具： 在服务器端安装之后，自动对用户请求的 HTML 页面进行语义化分析，智能的为其进行加速，加速途径涵盖了我能想到的一切~

图片所示的功能仅为部分

使用原因

WebP 是 Google 在 2010 年发布的一种新型图片格式，支持无损和有损压缩。在无损压缩方面，同质量的 WebP 图片比 PNG 的体积小 26%，而在有损压缩方面，同质量的 WebP 图片比 JPEG 小 25-34%。WebP 在不降低图片质量的同时，减少了约三分之一的体积。详细可参考谷歌官方。

哎呀，又是谷歌？！是的，我现在越来越喜欢这家公司了，非常酷。

我对 webp 是挺有兴趣的，因为图片一直都是流量的大头，降低了图片体积直接能影响到页面的加载速度。于是最开始，我是在寻找 WordPress 中别人开发的相关插件，可惜并没能找到合适的。

寻找中，我变找到了 PageSpeed，我勒个去，太强大了！作为一个 Nginx 模块，可以通过分析请求头，对支持 webp 的现代浏览器返回转换后的 webp 图片，而其他浏览器则依旧使用 jpg 等旧格式，太符合我的要求了~！

重新编译安装

跟随着教程 https://modpagespeed.com/doc/build_ngx_pagespeed_from_source 将 Nginx 重新编译了一遍，顺便将服务器中的旧版 Nginx 给更新到了 v1.10.3。

要说麻烦的话，那就是由于服务器运行在阿里云机房中，不能运行翻墙软件，谷歌的某个依赖库下载不下来。

另外在配置的时候，对于 HTTPS 也需要进行额外的适配，因为就算作为 Nginx 的模块，也是不能直接读取 HTTPS 协议下的内容的。

效果展示

PageSpeed 这个可爱的模块已经完全担当了服务器 Nginx 端的缓存控制角色，对于 jpg 转 webp 这样的耗时操作会在后台自动执行，下一次相同的请求过来时才会命中缓存，相当的给力！

顺便值得一说的是我的网站使用的是 HTTP/2 协议，速度当然比 20 年前的 HTTP/1.1 要更快啦！

上面的图可以看到，网页中原本的 jpg 资源已经被自动转换为 webp，而这一切都是自动的。

超开心！