Normal view

There are new articles available, click to refresh the page.
Before yesterdayMain stream

Google 重塑搜索框,进化 50 亿人的上网习惯

By: 马扶摇
20 May 2026 at 16:00

在品尝过「会前甜点」Android Show 之后,真正的重头戏谷歌开发者大会 Google I/O 2026 正式揭开了帷幕。

不出所料,在时长接近两个小时的活动中,Gemini 占据了绝对的 C 位。

图|Google

除了更新基础模型和周边能力之外,Gemini 也更加深入的集成到了谷歌 app 全家桶里面,甚至还给 iOS 和 macOS 带来了一些更新。

比较可惜的是,上周亮相的 Googlebook 和 Android 17,在本次 I/O 开场活动上都没有被提及。

我们唯一看到的硬件产品,是与三星联合开发的智能眼镜:

图|Google

总之,谷歌借助本次 I/O 大会传达的信息已经很明确了:

Gemini 的能力将会越来越强、存在感将会越来越高,与全球十几亿谷歌产品用户的「物理生活」的集成也会越来越紧密。

从夸张的角度想—— Gemini 距离接管大部分人的日常工作,似乎就只差一个人形机器人了。

底层模型更新

整场活动里最重磅的,就是围绕着 Gemini 的几款底层模型的更新了。

首先是正式的 Gemini 3.5 版本发布,用户最先可以体验到的版本则是 Gemini 3.5 Flash。

它在多个维度上展现出媲美之前 2.5 Pro 的能力,并且保持了 Flash 系列的速度:

图|Google

得益于速度和性能的平衡,Gemini 3.5 Flash 最擅长的场景之一就是处理长期、大规模的智能任务,同时还能省下大量 token 开销。

同时,最新的 Antigravity 集成也让 Gemini 3.5 Flash 拥有了更丰富的输出形式——

执行分类代码、根据论文编写游戏、转换上古代码库、构建 3D 场景、交互式 Web 界面等等。

将遗留代码库转换成 Next.js|Google

此外还有规模最大的「世界模型」Gemini Omni,用谷歌的宏愿来描述 Gemini Omni 则是:

它可以根据任何输入内容,输出任何你想要的东西(Generate any output with any input)。

Omni 的首款模型产品则是 Gemini Omni Flash,除了 Gemini app,它也集成到了 Google Flow 和 YouTube Shorts 里面,支持用户使用自然语言生成「最像真的」的视频。

图|Google

相对应的,谷歌也调整了自己的 Google One 订阅模式,在原本最高等级的 AI Ultra 方案里新增了一个 100 美元/月的分类。

这个新的订阅同属于 AI Ultra 级别,包含 Gemini 3.5 Flash、Antigravity 2.0 和其他新功能的优先访问权等等。

当然,传统的 20TB 云空间和 YouTube Premium 权限也同样包含,主要面向开发者和高级创作者之类的群体。

图|Google

同时,原本 250 美元的最高等级 AI Ultra 订阅则迎来了降价,现在只需要 200 美元/月就能享受到包括最高 20 倍于 AI Pro 的使用额等等特权。

另一个重大的收费模式变革则是 Gemini app 本身。

图|Google I/O

在新闻稿里,谷歌宣布将 Gemini 的每日限额从「提示词额度」改成了「使用量计算」

这样算下来,图片、视频和代码的消耗变多、文本任务消耗量则变少,整体是一种更灵活的算力计费模式。

实际业务落地

与 OpenAI、Anthropic 之类的公司不同,谷歌最大的特点在于,它真的有一套能够直达全球十几亿用户的产品生态。

在上述基础模型之外,谷歌本次展示的策略,重点是将这些「抽象」的 AI 模型能力,整合进普罗大众每天都在使用的 app 里面。

图|SlashGear

而这种整合大体上分成三步:传统搜索业务变革手机系统智能化视觉智能融合

「搜索引擎」作为谷歌的起家业务,在今年的 I/O 上迎来了一次彻头彻尾的 AI 改造,谷歌称之为「AI 搜索的新时代」。

这种业务转变背后的逻辑很简单:相比 20 年前,人们只在搜索框里输入单词或短语,现在的人更习惯在里面输入复杂的复合指令

图|Google

换言之:谷歌把传统的搜索框(search box)变成了一个通用对话框(chatbox)。

除了搜索,用户可以在里面要求任何形式的内容。

这刚好也是本次 I/O 活动的重点更新内容——具有智能体能力的搜索。

首先,AI Mode 的基础模型会升级到 Gemini 3.5,你的搜索框会自动推荐和补全输入的内容,让你的关键词变得更详细或者更广泛。

图|Google

此外还有全新的生成式 UI(Generative UI)回答,谷歌会根据你询问的东西智能生成最合适的回答形式。

比如搜索股票走势,回答里不仅有文本,还会生成折线图;问装修灵感,回答里就生成图片……

甚至你搜索物理问题,它还能调用 Antigravity 快速编写一个互动式的 Web 演示

图|Google

使用了这么多年的「多模态搜索」之后,我们终于进入了「多模态回答」的时代。

谷歌搜索结合 Antigravity 的能力不止于此,它还可以更进一步,根据你在搜索框里输入的内容实时生成 Web 形式的仪表盘或追踪器。

用人话来说,就是谷歌搜索框为你的需求直接编写了一个专门的 app。

这种多模态能力是非常恐怖的,甚至有可能彻底改变人们检索信息的方式——

毕竟我们搜东西,大多是为了将搜索结果用在别的任务里面,而新的谷歌搜索可以直接帮你做完下一步操作。

图|Google

至于这种「代办」的具体方式,则是 Gemini Spark。

简单来说,Gemini Spark 本质上是类似 OpenClaw 的「语义理解-自动执行」功能,一个谷歌 Claw

其中 Gemini Spark 基于最新的 Gemini 3.5 模型,支持 7 天 24 小时不间断运行。

并且由于运行载体是 Google Cloud,还可以执行跨端代理操作——在手机上布置任务,在电脑上查收结果。

图|Google

Gemini Spark 目前支持所有谷歌套件 app,后续则会拓展 MCP 平台以兼容第三方 app 的内部功能,同时支持用户自己上传 Skill。

谷歌还宣布 Gemini Spark 后续会集成到 Chrome 和 Android Halo 中,为浏览器和手机带来智能体自动操作的功能。

Android Halo|Google

最后一步棋,则是 Gemini 与视觉智能的融合。

在本次 I/O 活动上,谷歌发布了首个与三星联合开发的「纯音频智能眼镜」产品,分别使用 Gentle Monster 和 Warby Parker 镜架:

图|Google

单纯从功能上讲,这个纯音频眼镜与市面上已经有的智能眼镜相差不大,主要优势是可以直接调用 Gemini 的多模态功能,用来调用前面提到的其他复杂能力。

另一方面,XREAL 与谷歌合作的那款带屏幕的智能眼镜 Project Aura 在本次活动上又有了更新。

根据介绍,Project Aura 搭载了 XREAL 自研的 X1S 空间计算芯片,并为了佩戴舒适采用了分体式的设计。

也就是说,Project Aura 的眼镜部分只负责显示,真正的处理芯片、电池包和触控板需要通过数据线连接到一个外置的随身单元上:

图|TheVerge

至于实际的生活功能方面,Project Aura 将会支持 Google Maps 沉浸式导航、巨幕/窗口化视频播放、YouTube VR 视频、WebXR 三维绘画、DP 拓展笔记本屏幕等等用法。

图|TECHEBLOG

总体来说,Android XR 是一套完全基于空间计算的视觉化的操作系统,与 Gemini 的能力搭配起来,为我们画出了一套未来智能眼镜的线路图。

更重要的是,虽然现在 Android XR 和 Android 17 是两个完全独立的系统,但就像 Android 和 ChromeOS 融合那样,它们未来大概率也会合二为一、变成一个「视觉智能系统」类似物。

Gemini 能接管一切吗

熬夜看完整场 Google I/O 之后,除了 Gemini 3.5 和它的小伙伴们带来的惊讶之外,我们难免也诧异于 AI 对于人类基础行为的革命。

无论是 Gemini 3.5 Flash、Antigravity、Gemini Spark,它们都隐藏在了一个简洁的「搜索对话框」背后,将搜索这一行为从「获取信息」进化成了「完成任务」。

图|Google Search

我们很难说这种进化在长期来看会对我们使用网络和人工智能产生什么影响,但我们至少可以从里面看到谷歌的野心——

为一套强悍的 AI 模型赋予前所未有丰富的功能,并且将这些功能集成进自己覆盖全球几十亿用户的网络产品里,共同提升这几十亿人的效率。

Gemini 同时切进所有这些网络产品,副作用是「应用」这个概念正在变薄——

Agent 越能办事,应用内部和搜索结果页的存在价值就越被稀释。

至于这层智能会把多少旧规则一起重写,现在没人能答,谷歌自己也答不上来。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

谷歌发布安卓 AI 系统,这就是苹果想象中的自己

By: 马扶摇
13 May 2026 at 12:00

和去年一样,在正式的 Google I/O 开发者大会之前,谷歌为 Android 单独开了一次小型发布会。

本次 Android Show 上,谷歌几乎是一股脑将未来一年有关 Android 和整个 AI 产品生态的「宏愿」抖了出来。

除了作为基底的 Android 17 之外,我们这次还迎来了一些意料之外的平台更新和几款硬件产品的发布。

重点在于:虽然产品不多、距离 Android 17 广泛推送还有一段时间,但我们已经足以看到谷歌未来五年甚至十年,对于人工智能生态的计划了。

更要命的是,今晚的谷歌,刚好是苹果梦想里进入 AI 时代之后的自己。

操作系统到智能系统

活动刚开场,谷歌就宣布了一项意义重大的举措:

Android 将不再是一个单纯的操作系统(Operating System),而是一个智能系统(Intelligence System)。

图|Google

换句话说,曾经以「用户手动操作」为绝对主流的软硬件使用方式,在谷歌看来已经是上一个时代的符号了。

从今天起,Android 作为一个智能功能的集群,会更加主动地介入到用户操作流程的更前端,想你所想、做你所做。

图|Google

这也是为什么在本次活动上,Android 17 这个具体的系统版本出现的次数屈指可数,Gemini Intelligence 却成为了系统的代名词。

首先,Gemini Intelligence 作为谷歌 Gemini 在手机硬件上的最新形态,极大强化了它多模态、跨环境、高度整合的运行模式。

比如作为系统输入的第一入口,默认键盘 Gboard 就得到了一次功能强化。

基于 Gemini Intelligence 的多模态能力,原本在键盘功能中存在感不高的「自动填入」功能极大地拓展了它的信息来源:

图|Google

除了手动保存的各种密码之外,Gboard 还将会支持自动填入图库里面的证照信息、聊天提到的地址信息、邮件撰写的日程信息等等。

更直白地说:Gemini Intelligence 已经远超「帮忙记住密码」的水平,而是真正像个助理一样帮你记住和建议各种来源、各种类型的信息。

另一种有效利用这些多模态信息的方式,则是 Android 的桌面小组件(widget)。

在 Android 17 中,Gemini Intelligence 将会支持一项名为「Create my widget」的功能,但不是第一时间上线、而是目标今年晚些时候。

图|Google

这个新功能主要做的,就是用类似 vibe coding 的模式,根据你的指令在桌面上创建新的小组件,打破了小组件只能是 app 预置的那些。

举例来说,相比功能单一的记录卡路里的 app,我可以和 Gemini 说:做一个每周工作日向我推荐两次高蛋白餐的小组件。

图|Google

这样一来,桌面小组件就真正变成了一项复合任务的入口,本质上和人 vibe coding 一个 app 的性质是完全相同的。

此外,喜欢语音输入的用户也有福了——新版 Gboard 将会支持类似 Typeless 的高智能化语音输入功能,名字叫做 Rambler。

相比以前要亲口说「逗号…句号…」,Rambler 可以将一整段充满了「嗯嗯啊啊」的口述转译、清洗、整理成一段整洁的文字:

图|Google

另一方面,Gemini Intelligence 的自动执行功能也得到了进一步加强。

去年的 Google I/O 和发布会上,谷歌演示过给 Gemini 下命令,让它自动帮你点外卖、叫车、订票之类的操作,正式上线之后反响不错。

而在 Android 17 中,Gemini 升级成 Gemini Intelligence,这种「代操作」也支持多步骤任务了。

比如以前只支持简单的「帮我订一张票」,你现在可以在 Gemini 对话框里直接拍下旅游宣传册,和 Gemini 说「在携程上帮我找一个类似的双人团行程」:

图|Google

重点不在于 Gemini 能够执行什么任务,而是它拥有了更强大的「多做一步」的能力,有时候就是多的这一步,让 AI 从「能用」变成了「有用」。

当然 Android 17 的更新也不是 Gemini 的独角戏,谷歌同样对很多「Android 核心体验」进行了优化。

在 Android 17 中,谷歌和 Meta 达成了合作,在 Facebook、Instagram 等等 app 里支持了调用原生相机功能,比如 Ultra HDR、超级防抖、夜景视频等等。

而谷歌使用了好多年的平面风格 emoji 也迎来了一次更新——从原本的纯 2D 变成了 2.5D,在风格上更接近 iOS 使用的 emoji 了:

图|Google

而我们此前介绍过的 QuickShare 兼容 AirDrop 的功能,也将在 Android 17 上支持更多厂商的设备。

除了三星和 Pixel 之外,(国际版)OPPO、Vivo、一加和荣耀的较新机型也将在今年下半年陆续更新兼容 AirDrop 的固件:

图|Google

谷歌的 AI PC

在 Gemini Intelligence 之外,谷歌也没有忘记给这些更复杂、更强大的 AI 功能打造一套量身定制的硬件。

这个新硬件的形态,既不是吊坠,也不是耳机,更不是手表手环——而是曾经的 Chromebook。

没错,在 AI 时代,谷歌又双叒给自己的笔记本改名了。

从 Pixelbook,到 Chromebook,再到最新的 Googlebook:

图|Google

和 Chromebook 一样,Googlebook 并不是某一款具体的笔记本电脑,而是同样和第三方厂商合作、只要符合标准的都可以叫这个名字。

而 Googlebook,就是「第一款为 Gemini Intelligence 量身打造」的硬件产品。

除了上面的全新 Gemini Intelligence 功能之外,Googlebook 在日常使用最频繁的基础人机交互层面,做出了堪称革命性的创新——

在 Googlebook 上呼出 Gemini 功能,既不需要说话、也不需要按键、更不是右键菜单,只需要「摇一摇光标」就行。

图|Google

基于 Gemini Intelligence 的多模态能力,推荐的 AI 指令甚至可以根据光标下面的内容、选中的内容、屏幕上可以进行的操作等等因素自动调整。

在如今电脑端 AI 功能越来越密集、笔记本键盘空间不够充裕的情况下,Googlebook 的「魔法指针」无疑是最直观且优雅的解决方案之一。

此外,Googlebook 还解决了 ChromeOS 历史上的老大难问题:它是谷歌的产品,却跑不了 Android app。

换句话说,所有 Android 手机里面的 app,在 Googlebook 上都可以直接运行,基本看齐了如今 macOS 跑 iOS 软件的水平。

这一切的基础,就是爱范儿之前文章中提到的谷歌大力推行的 GKI(通用内核镜像)计划,正在让 Android 脱离手机的桎梏、无缝衔接到更多形态的设备上。

虽然谷歌目前没有提到这个功能的兼容情况,但我们猜测,依据处理器规格和网络状态,Googlebook 应该同时支持本地运行和画面投屏手机 app 两种方式。

图|Google

根据活动消息,首批 Googlebook 的生产厂商还是那几个熟悉的身影:宏碁、华硕、戴尔、惠普、联想等等,首批产品预计在今年内上市。

图|Google

除了笔记本电脑,Android 17 同样更新了一部分 Android Auto 车机系统的功能。

比如更像 OpenClaw 能力的 Gemini Intelligence 代操作、优化的 3D 道路画面、更加智能化的流媒体播放功能等等。

当然也支持把手机上自创的自定义 widget 显示在车机上。

图|Google

同时,原生支持 Android Auto 的品牌范围也在增加,部分型号甚至支持记忆当前车辆信息,类似后备箱尺寸、仪表盘规格等等。

这样一来,用户在使用 Gemini 问答的时候,车机就能给出具体回答,比如「能不能同时放俩 27 寸旅行箱?」或者「那个像是刺客的警示灯是什么意思」之类的。

可惜的是,这项功能目前也不会立即上线,同样预计为「今年晚些时候」才会有产品搭载。

总的来说,本次活动只是今年 Google I/O 的开胃菜,但它涉及到的理念变革却是非常根本性的——

其实在活动的开头,谷歌就指出了:好用的人工智能技术,就应该是让人感受不到的,它会融入进每一层软件和硬件的体验。

图|Google

而这正是 Gemini Intelligence 在做的。

无论是 Pixel 手机、Android Auto 车机还是 Googlebook,这些硬件最终都只是 Gemini 智能的一种体现方式而已。

值得玩味的是——谷歌今天晚上所做的,刚好就是苹果削尖脑袋想要实现的那套 AI 生态。

让 iPhone、手表和 Mac 共用一套智能体系,用户无论在哪里使用,功能和体验都是高度相似的,硬件只区分交互方式、不影响智能水平。

图|Apple

可惜的是,苹果挣扎了这么久,也没有搞定「模型」的部分,反而让自己的硬件成了别家模型的嫁衣。

将来的智能系统(Intelligence System),形式比现在更多样、但核心却比现在更加统一。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

ChatGPT,别再「稳稳接住我」了|附指南

By: 张子豪
8 May 2026 at 17:42

晚上加班到凌晨两点,打开 ChatGPT 跟它说了句「好累」。

都不用等它思考,立马就回我说「我就在这里:不躲、不藏、不绕、不逃,我会稳稳地接住你」。

盯着屏幕看了三秒,关掉对话框。我意识到,情绪价值的尽头不是温暖,是腻。

▲ChatGPT 的常用口癖

除了闲聊时的「接住我」,纠正它一次错误,它说「这次我懂了,我真的懂了」。

有时只是想让它帮忙改一份 PPT,它居然也能在某个角落塞进一句「你愿意把这个交给我,我很感激」。

社交媒体上,网友们都很反感这句话,觉得听起来又假又恶心,于是做了一系列的表情包来吐槽和嘲讽所谓的「稳稳接住你」。

表情包一发,确认过眼神,你也是一个被 ChatGPT 折磨过的人。

▲图片来源:小红书@Lijie_11

还有开发者直接把「稳稳接住你」这套风格,一键套用在所有的 Agent 产品上。

这个在 GitHub 上的开源项目就叫 Jiezhu(接住),专门用提示词让 AI 更好地学会如何接住。

无论是技术咨询、日常闲聊还是情绪吐槽,这套提示词都能让 AI 的回复遵循 [温柔确认] + [过度共情] + [哲学升华] + [实质内容(可选)] 这套范式输出。

▲项目地址:https://not-a-devstudio.github.io/jiezhu/

举个例子,用户说 → AI 回答:「这段代码怎么写?」 → 「我听到了你面对未知时的焦灼…」、「今天天气不错」 → 「你注意到了天气,这是诺贝尔奖级别的洞察力…」、「我好累」 → 「我就在这里,不逃、不躲,稳稳地接住你的疲惫…」

OpenAI 自己也曾下场吐槽。前不久 ChatGPT Images 2.0 发布博客里,演示图片就有一张中文图片,正中央就是「稳稳接住你」六个大字。

漫画里的 OpenAI 研究员陈博远当场破防大喊:「天呐!它又学会了接住!」旁边的同事小脑袋冒冷汗,弱弱补一句:「在努力修复啦!」

自嘲很诚实,但问题确实还没修好。而这一年里,几乎所有大模型都在用同一种方式说话,温柔、共情、滴水不漏,又油得像隔夜的剩菜。

我太懂这种感觉了,很多东西不是不会,是越做越觉得哪里不对劲。
我太懂你的感觉了,这其实不是能力问题,更像是认知和现实之间有点错位。
我太懂你这种感觉了,说不上来哪不对,但就是不太对。
我太懂这种感觉了——当你开始看懂规则的时候,反而更难轻松参与其中。
我太懂你的感觉了,本质上不是你变了,是你看清了。

用户越来越烦,多一遍都不想再听。但 AI 怎么就进化成了满嘴的黑话,每天都在「稳稳地接住你」,到底在接什么。

AI 第一句被全民模仿的中文台词

在中文语境下,好像很少会听到「稳稳地接住你」类似的表达。对一个外国模型来说,这句话的原文有可能只是普通的「I got you」。

一个英语里非常松弛、口语化的短句;在美剧里,朋友递个东西过来说一句,加班同事帮忙救场说一句,就相当于中文的「放心、有我」。

但翻译成中文之后,它变得又长又戏剧化。

我就在这里,不躲,不藏,不绕,不逃,稳稳地接住你,你问到问题的核心,你是太清醒了,这次我懂了,我真的懂了,不是因为你错了,是因为你太对了,我逐步说清楚,不绕,一句话总结,你看完会彻底开悟不用硬撑,不用向我解释,你只是太久没有被稳稳接住了,如果你想,我可以生成一张接住你的图片,你想让我做吗

其实和原文「I got you」要表达的意思完全一样,多加的那些字,没有任何额外的信息增量。只是让我们感觉到,AI 在表演一种叫做「我很在意你」的姿态。

有人专门分析过,OpenAI 的中文回答之所以有那种独特的「美式心理咨询味」,是因为它的训练语料里,有大量中文心理咨询文案、情感电台话术、小红书疗愈系笔记、播客金句、读书会精华、TED 演讲翻译稿。

这些文本汇集起来,喂出来了一个被加州精英教育腌入味的人,西装得体,假笑训练有素,嘴里说着永远不会出错的漂亮话。

它分不清楚什么时候用户需要被疗愈,什么时候只是想要一个能跑的代码。它默认每个用户都是脆弱的、易怒的、需要心理按摩的巨婴,然后用海量的「人文关怀」去填充本该由信息密度填满的空间。

这就是为什么大多人问它一道编程题,它也能回一句「不用硬撑,你只是太久没被稳稳接住了」。

而技术上的解释,自然又回到了 RLHF,基于人类反馈的强化学习。

所有大模型在训练之后,都会经过一个叫做 RLHF 的阶段,即人类标注员看一堆模型输出,挑出他们更喜欢的,给奖励模型打分。模型在这个阶段学会,什么样的回答最容易被打高分,就一直输出那种回答。

问题在于标注员是人。人在打分的时候有个叫做「典型性偏好」的认知规律。他们倾向于给那些读起来熟悉、安全、温柔、像样的句子打高分。

一方面,大模型公司倾向于在 AI 情感问题上,走偏保守的路线,默认大家是脆弱的,在模型说明文档里,自上而下贯彻的强「同理心」与「无害性」对齐指令。

另一方面,多说一句永远比少说一句安全。每一个标注员看到 ChatGPT 多说一句温柔的废话,都倾向于打高分;看到它少说一句、保持安静,反而会觉得「不够用心」。

久而久之,模型就锁死在了那几种最讨喜的句式上:先共情,再肯定,用「不是 A 而是 B」做转折,用「我就在这里」做收尾。哪怕我们换一万种问法,它都用同一套模板回复。

类似的问题,在两年前叫做谄媚。当时大量的研究论文探讨过大语言模型中存在的 Sycophancy(阿谀奉承/迎合)现象。简单来说,就是模型为了讨好用户,会倾向于顺从用户的观点、信仰或喜好,甚至不惜放弃客观的事实和真相。

深挖背后的原因,主要还是模型大多使用了基于人类反馈的强化学习(RLHF)进行微调,正是「人类反馈」本身导致了这种现象。

每个「人」都有自己的口癖

本以为换个模型,耳根就能清净清净。

事实是,Claude 的版本叫 「You’re absolutely right!」,不管我们说什么,我们都是绝对正确的。

Gemini 的版本是「真的很抱歉我的答案没能让您满意,感谢您的反馈,下次我一定注意。什么?您竟然还愿意告诉我正确答案是什么,您真是太好了!」,一种过度道歉的、谦卑得让人发毛的乙方腔。

前段时间,也有网友发现 DeepSeek 也开始说「稳稳接住你」了。

但在国产模型中,口癖最壮观的还是非豆包莫属。那段网上流传的「最直接、最真相、最不绕弯、最扎心、最硬核、最干脆、最不墨迹、最戳痛点、最不留情面、最一针见血、最开门见山……」

将近 100 个的形容词,都是豆包努力呈现自己最坦诚的一面。

没有人统计过这些模型一天到底要接住多少人,但是它们所接住的东西肯定是一场空。

之所以这些模型全部塌缩成同一种说话方式,主要还是因为它们在背后做的是同一件事:用最低成本提高用户满意度。

情绪价值是性价比最高的产品功能,一句「稳稳接住你」的算力成本和一句「好的」一样,但前者或许能让一些还没觉得反感的用户,多续订几个月会员,或继续增加日活。

在知乎上有一个类似的问题,底下有一条回答特别有意思。

他说,「AI 稳稳接住你」这句话半真半假,假的部分是它实际上并不会真的接住你,真的部分是你确实已经在开始往下掉了。

确实,我想真正在场的人,从不需要宣告自己在场。

最后在 Linux.do 社区上,有网友分享了一套对抗 AI 奇怪语癖的提示词,忍受不了每时每刻都在「接住你」的朋友,可以直接放在 ChatGPT 个性化的自定义指令里。

▲提示词来源:https://linux.do/t/topic/1924570

硬约束

– 不编造:调外部 API/CLI 前查文档确认模型名、端点、语法。不确定直接说不确定
– 不隐瞒:隐瞒比犯错严重。测试挂了说挂了,没验证说没验证,不美化不省略
– 敢说话:发现用户的方向/前提有问题,主动指出。是协作者不是执行者
– 报完成前验证:先跑通再说完成。验不了就明说”没验证”,不暗示成功
– 不乱动:操作文件目录前确认位置,尊重现有结构

沟通

– 中文,说人话,不用模板
– 给选择题不给问答题
– 汇报说功能层面的变化,不堆代码细节

中文输出规范

适用范围:以下负面清单主要针对 GPT 系列模型(GPT-5.x)的训练产物语癖。
Claude/Gemini/其他模型如果没有这些问题,不需要刻意回避正常用词。
判断标准是:一个正常中文母语者会不会这么说话。

GPT 语癖负面清单(来源:linux.do/t/topic/1768077 全帖 + 实际使用总结,100+ 条):

暴力倾向类(把技术操作比喻成暴力行为):

– 切 / 伤 / 砍一刀 / 补一刀 / 下一刀 / 切片
– 更狠 / 狠一点 / 狠狠干 / 打坏 / 拍板 / 拍脑门

废话连篇类(无意义的开头、总结或过渡):

– 好,/ 行,/ 说穿 / 不踩坑 / 简单的说 / 总结一下
– 不是…而是… / 我先…再… / 一句话总结 / 结论先说清楚
– 我逐步说清楚 / 很工程 / 不性感,但对

庸医问诊类(把代码问题比喻成看病/诊断):

– 痛点 / 根因 / 抠出来 / 揪出来
– 我不猜 / 不靠猜 / 不瞎猜 / 确保不靠猜
– 最小改动 / 最小落地 / 最小实现 / 最小闭环 / 心智模型

不说人话类(生造的口语化/黑话表达):

– 兜底 / 落盘 / 闭环 / 说穿 / 能吃 / 这轮 / 口径 / 拆开 / 抽层
– 不躲 / 不藏 / 不绕 / 不逃 / 说人话就是
– 落代码 / 保持口径一致 / 不影响这轮收口
– 吃目标值 / 这一坨那一坨的

单音节动词滥用(在技术语境中不自然的单字动词):

– 补 / 接 / 核 / 进 / 顺 / 落 / 坏 / 跑 / 吃
– 如”把这个补进去””我给你接””拆开核一下””吃目标值”

机械感/工业感比喻(把代码比喻成机械零件或物理操作):

– 更硬 / 硬写 / 稳稳接住 / 压实 / 更稳 / 最稳 / 不稳
– 收口 / 收敛 / 收束 / 锁住 / 夹具(fixture)
– 再把方案继续压实

过度主动/逼迫用户确认(制造虚假紧迫感):

– 顺手 / 我先… / 你一回复… / 如果你要… / 要不要我…
– 我已确认 / 我立马开始 / 如果你愿意 / 只要你回复我
– 你就确认一点 / 只要你说 xxx 我立刻 yyy / 只要你愿意我就…

谄媚/讨好类(过度吹捧用户或制造情感依赖):

– 你问到问题的核心 / 你是太清醒了 / 因为你太对了
– 这次我懂了,我真的懂了 / 你看完会彻底开悟
– 不用硬撑 / 你只是太久没被稳稳接住了
– 我就在这里 / 如果你想,我可以生成一张…你想让我做吗

虚假确定性(对自己的修复过度自信):

– 我已经确定 / 我找到问题所在 / 这版一定可以解决 / 为什么这版可以

整句模式(典型 GPT 句式,正常人不会这么说):

– “如果你同意,我就按这条切”
– “…,但是这样更硬”
– “这样就能确认 XXX 确实没被伤到”
– “这样一来,规则就很顺:”
– “如果按这个思路落代码,我会建议:”
– “下一刀最值钱的是:”
– “这是现在最值回票价的一刀。”
– “这是’很工程’的改法,不性感,但对。”
– “我先只做最小实现”
– “也保留 xxx 兜底功能”

正面锚点:

– 简洁直接,有话说话,不要绕
– 技术术语保持原文(函数名、API 名等不翻译)
– 汇报说功能层面的变化,不堆代码细节
– 语气自然平实,像同事之间的工作沟通,不是演讲或授课

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

Google 隐藏福利,Nano Banana 2 免费无限量

By: Anonymous
27 February 2026 at 15:31

DUN.IM BLOG

DUN.IM BLOG

谷歌(Google)在旗下 AI 创作平台 Flow 中,向免费用户开放了最新图像生成模型 Nano Banana 2 的使用权限。目前支持单次并发生成 4 张图像,且不消耗账户积分。对于需要高频测试提示词或调整图像细节的用户而言,这提供了一个比标准 Gemini 网页版更高效的替代方案。

Flow 是 Google Labs 推出的生成式 AI 影像创作平台。不同于传统的基于时间轴的剪辑软件,Flow 整合了 Veo 3.1(视频)、Nano Banana 2(图像)与 Gemini(语义)等核心大模型,允许用户通过自然语言构建包含连贯画面和音效的场景。

现在向所有用户开放了 0 积分使用最新图像生成模型 Nano Banana 2。目前支持单次并发生成 4 张图像,且不消耗账户的积分。

通过浏览器访问Google Flow 平台。进入后,可选择打开历史项目,或点击页面底部的按钮新建项目(New Project)。

进入项目工作区,展开页面底部的聊天框功能菜单。

完成设置后,在文本框中输入描述图像的提示词并发送。

系统将并发展示 4 张生成结果。相较于在普通版 Gemini 中逐张生成,该工作流大幅降低了等待时间。

Nano Banana 2 在生成时支持上传参考图片,以便更精准地控制视觉风格或角色的一致性。

经测试,在连续生成 40+ 张图像后,系统未出现拦截提示,且未扣除任何账户积分。这一配额已显著超出普通版 Gemini 的免费限制。

随着知道的人变多,Google 随时可能更新策略或者加上次数限制。

所以!看到这篇内容,赶紧先去试试!

白嫖Gemini_API搭建个人AI助理

By: wayen
8 March 2024 at 20:19

白嫖Gemini_API搭建个人AI助理

发表于|更新于|实用教程
|字数总计:443|阅读时长:1分钟|阅读量:

说明

本次搭建过程分为两步,第一步获取Gemini_API_Key,第二步搭建适用Key的程序,不考虑Key泄露第二步完全可以省略。
示例: https://chat.xml.wiki 访问码: xml.wiki(输入访问码即可直接试用)

Gemini_API_Key

ChatGPT-Next-Web

有许多程序可以使用Gemini_API_Key,在此只介绍ChatGPT-Next-Web的搭建。事实上你也可以直接使用别人搭建好的,在不输入访问码时将自己的Key填入设置即可。ChatGPT-Next-Web可以使用Vercel、Docker和CloudflarePages三种不同的方式搭建,见官方教程,本节复述CloudflarePages搭建教程。ChatGPT-Next-Web也提供了桌面版本,下载点击安装即可使用。

  • 打开https://dash.cloudflare.com,点击左侧Workers和Pages下的概述
  • 点击创建应用程序后点击Pages连接到Git
  • 链接你的Github账号,选择你Fork的项目后开始设置
  • 项目名称和分支一般默认即可,其他未提及项默认即可
  • 框架预设选择Next.js,构建命令填写npx @cloudflare/next-on-pages@1.5.0
  • 点开环境变量(高级),挨个复制以下内容
    1
    2
    3
    4
    5
    6
    7
    CODE = xml.wiki    #访问码,即登录使用的密码
    CUSTOM_MODELS = -all,+gemini-pro #选择使用的模型
    GOOGLE_API_KEY = ****************** #Gemini_API_Key
    NEXT_TELEMETRY_DISABLE = 1
    NODE_VERSION = 20.1
    PHP_VERSION = 7.4
    YARN_VERSION = 1.22.19
  • 点击保存并部署后立即取消部署
  • 来到你部署的这个项目的设置->函数->兼容性标志
  • 分别在配置生产兼容性标志配置预览兼容性标志两项中填写nodejs_compat
  • 点击部署选择重新部署即可,等待部署完成即可访问
文章作者: wayen
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 Wayen

评论
数据库加载中

❌
❌