Normal view

There are new articles available, click to refresh the page.

Before yesterdayMain stream

Krea AI iOS – 免费使用 Seedance 2.0 视频模型

DUN.IM BLOG

By: Anonymous

15 May 2026 at 15:56

我们还年轻，可不想看到这个世界处在毫无自由、隐私的边缘。

在 AI 视频模型领域，字节 (ByteDance) 的 Seedance 2.0 模型能力备受瞩目。即便与 Google 旗舰级 Omni 模型相比，其在角色一致性与物理逻辑的表现上仍具显著优势。

Krea AI 的 Seedance 2.0 列为付费模型，但 iOS 移动端应用 当前出现了权限 Bug？当前可以无需消耗订阅额度，直接调用包括 Seedance 2.0 在内的多个高级模型。

本操作目前仅限 iOS 平台，且不排除官方在未来修复（Hotfix）此权限。

在实际测试中，Seedance 2.0 的生成速度与质量表现如下：

为验证 Seedance 2.0 的多动捕物理特性与光影渲染，可参考以下复杂的镜头提示词：

Google 隐藏福利，Nano Banana 2 免费无限量

DUN.IM BLOG

By: Anonymous

27 February 2026 at 15:31

谷歌（Google）在旗下 AI 创作平台 Flow 中，向免费用户开放了最新图像生成模型 Nano Banana 2 的使用权限。目前支持单次并发生成 4 张图像，且不消耗账户积分。对于需要高频测试提示词或调整图像细节的用户而言，这提供了一个比标准 Gemini 网页版更高效的替代方案。

Flow 是 Google Labs 推出的生成式 AI 影像创作平台。不同于传统的基于时间轴的剪辑软件，Flow 整合了 Veo 3.1（视频）、Nano Banana 2（图像）与 Gemini（语义）等核心大模型，允许用户通过自然语言构建包含连贯画面和音效的场景。

现在向所有用户开放了 0 积分使用最新图像生成模型 Nano Banana 2。目前支持单次并发生成 4 张图像，且不消耗账户的积分。

通过浏览器访问Google Flow 平台。进入后，可选择打开历史项目，或点击页面底部的按钮新建项目（New Project）。

进入项目工作区，展开页面底部的聊天框功能菜单。

完成设置后，在文本框中输入描述图像的提示词并发送。

系统将并发展示 4 张生成结果。相较于在普通版 Gemini 中逐张生成，该工作流大幅降低了等待时间。

Nano Banana 2 在生成时支持上传参考图片，以便更精准地控制视觉风格或角色的一致性。

经测试，在连续生成 40+ 张图像后，系统未出现拦截提示，且未扣除任何账户积分。这一配额已显著超出普通版 Gemini 的免费限制。

随着知道的人变多，Google 随时可能更新策略或者加上次数限制。

所以！看到这篇内容，赶紧先去试试！

DUN.IM BLOG
Perplexity Pro x PayPal 福利：免费领取一年订阅（价值 ¥1450）
5 September 2025 at 14:56

Perplexity Pro x PayPal 福利：免费领取一年订阅（价值 ¥1450）

DUN.IM BLOG

By: Anonymous

5 September 2025 at 14:56

我们还年轻，可不想看到这个世界处在毫无自由、隐私的边缘。

AI 搜索公司 Perplexity 与支付平台 PayPal 达成全球合作，为符合条件的 PayPal 用户提供为期一年的 Perplexity Pro 免费订阅资格，价值 200 美元（约人民币 1450 元），并包含其 AI 浏览器 Comet 的优先体验权。

Perplexity Pro 与 PayPal 合作

活动链接：https://www.perplexity.ai/join/p/paypal-subscription

为防止一年后产生 200 美元的年费，强烈建议领取成功后，立即通过以下任一方式取消自动续订。取消后，Pro 会员资格仍会完整保留一年。

在 Perplexity 官网取消

在 PayPal 后台取消

FLUX Kontext – 黑森林图像生成式流匹配模型发布实测

DUN.IM BLOG

By: DUN

28 May 2025 at 19:44

我们还年轻，可不想看到这个世界处在毫无自由、隐私的边缘。

长时间没消息的黑森林工作室憋了个大的，发布了生成式流匹配模型 FLUX Kontext。

这套模型最强的地方就是可以对图片进行编辑，但是不会影响没有编辑的地方。

而且还支持多张图片参考生成新的图像，依然能保持需要参考内容的高度一致性。

直接替代了很多原来需要 PS （美图秀秀、Photoshop 等）才能做的需求，原来需要吭哧瘪肚 P 很久的图，现在说句话就行。

我这几天也探索了很多这个模型的用法，这次不会以测试的形式展示了，全是具体用法，让你告别 P 图这个复杂难搞的操作，另外后面也会介绍所有可以使用这个模型的渠道。

🎨 先介绍一下我探索出来的各种用法：

首先是非常简单的图片修改需求，FLUX Kontext 支持通过简单的提示词对图片进行非常精细的修改，而且不会影响未修改的区域。

我们想要给自己的日常照片加一些配饰或者改一下照片的姿势都没有问题，可以看到人物的面部一致性都没有问题，而且修改的地方跟环境也融合的很好。

⚠️注意：FLUX Kontext 只支持英文提示词，我这里放中文是方便理解，你可以用 AI 或者翻译软件把提示翻译了使用

FLUX Kontext – 黑森林图像生成式流匹配模型发布实测

当然 FLUX Kontext 也可以对照片进行大幅度的更改，比如你想要给照片换个背景或者给你自己换一身应景的衣服，再或者在前面的基础上换个姿势。

可以看到我把场景变成了酒吧，整个光线氛围也同步发生了变化，之后又尝试了不同的拍摄角度和姿势，也没有问题。

这种修改需要注意的是优势 Kontext 的分辨率是固定的，画全身照的时候面部有可能会变糊，因为像素区域太小的原因。

🎉 从左到右的提示词分别是：

站在酒吧吧台前

低角度侧脸，白衬衫加领带，吧台灯带背光

左侧半身特写，黑色皮夹克，霓虹灯映衬

全身广角，红色鸡尾酒裙，手扶吧椅

背后平视，帽饰西装，吧台酒架虚化

之前很火给老照片上色和修复也不是问题。

比如我下面的测试提示词就只有给照片上色，Kontext 处理的很好，而且整个色彩非常的高级和自然，明暗关系处理的很好。

想要做风格化？也没问题，只需要一句“将图片变成真实照片”的提示词就行，所有的细节都还原的很好。

当然可能更多人的需求是把自己的照片变成风格化的图片。

比如我们可以输入“把照片转换为吉卜力风格”，Kontext 也处理的很好而且人物的主要特征和电车的特征都还原了，不存在 4o 那种过度重绘和修改细节的问题。

而且这玩意还能修改图片上的文字，最屌的是不会影响原来的其他内容，而且修改的文字字体依然可以保持原来的风格。

你只需要输入“将图片中的 XXX 文字修改为 XXX”就行，比如我这里就把主要的标题改为了 Guizang，字体风格都是一致的，而且他还知道不需要换行。

针对海报复杂一些的修改也是可以的，你可以把一张找到的现成海报改掉文字和内容变成你自己的。

比如这里我就把 Oppo 的倒计时海报改成了小米的，而且连背景色都换了，Kontext 很好的处理了玻璃散射光的那部分。

这里唯一可惜的就是 FLUX Kontext 不支持生成中文，所以你只能修改图片中的英文，但是如果你不修改里面的中文，文字是不受影响的，这比其他图像模型好多了。

Change “Oppo” to “Xiaomi”, and set the image background color to orange.

这个是 Padphone 老师发现的，FLUX Kontext 还是目前最强的去水印模型，可以去掉各种复杂恶心的水印。

比如这里我找了一个 Unsplash 带水印的图片，这种半透明的水印会和图片叠加混合非常难彻底去掉，你只需要跟 Kontext 说“去掉图片的水印”，接下来奇迹就会发生，一点水印都没了。

大家最近应该都被一些 AI 图像模型生成图片默认加水印搞得不堪其扰把，即使开了会员依然有水印，这时候就可以让 Kontext 帮你解决了。

我们也可以用 Kontext 给各种平面的文字或者图案添加上材质和背景，替代原来需要 3D 渲染才能完成的需求，非常适合做品牌设计和平面设计的朋友。

比如这里我就给这个 Logo 变成了金属材质，还给图片加上了草地的背景，可以看到 Kontext 把 Logo 的一些笔画细节还原的非常好。

🎹

Transform the logo text into a shimmering metallic material, floating above a grassy field filled with flowers.

Kontext 还可以在你浏览景区的时候帮你把各种无关的其他游客搞掉，再也不用担心自己好不容易拍了账号照片，结果被误入的其他人毁掉了。

可以看到 Kontext 可以很清楚的识别画面的主体不会连你想拍的人也一起去掉，当然你如果就是想拍风景也可以，让他去掉画面上所有的人就行。

去掉照片中跟主体无关的其他行人

去掉照片中所有的人

前几天收到了可灵的一周年礼盒，看到 Padphone 老师做的展示图手痒，就想看看能不能用 Kontext 做出来，没想到真可以还做的很好。

非常离谱是他连我箱子放地上的灰尘都还原了，下次你要是想要生成类似图片的话记得擦一下产品再拍，哈哈。

💡

一个黑色箱子放在一张舒适、有褶皱的白色毯子中央，毯子的织物纹理清晰可见。瓶子周围自然地摆放着一些精致的白色小苍兰，几片花瓣零星散落。阳光柔和地洒下，投下柔和、弥散的阴影，营造出一种温暖而宁静的氛围。非常逼真的特写场景，光线是柔和的自然日光。

很多人说箱子是立方体太好生成了，整点复杂的，那我们拿可灵礼盒里的工服试试。

显然也没啥问题，文字有问题是因为生成图片的分辨率低，文字又小，导致的模糊，就跟我们拍照的时候离得远的文字也会模糊一样。

一件黑色 T 恤水平漂浮于空中，正从天花板向地板降落，看起来毫无重量。画面中无人，充满超现实感且不受重力影响。光线柔和，风格简约而优雅。背景为灰色。

很多朋友说我想要更复杂的商品展示，指定多张图片的模特和商品然后合成到一个图片中行不行，也是可以的，多图参考有点复杂我后面会讲。

可以看到第一张图商品细节、模特服装、配饰、发型以及背景都没问题，这个惊到我了。

第二张图我让模特穿上了可灵的工服，这次连衣服上的小字都还原了，可以说是完美还原，这个你让我在电商平台刷到，加上电商平台的压缩，我看不出来说实话。

这里有个小技巧：FLUX Kontext 手持产品的时候，产品一般会比正常的比例偏大，这个时候提示词描述一下产品大小就可以解决问题，比如手持易拉罐变为手持小号易拉罐。

女孩拿着化妆品瓶子

女孩穿着这件 T 恤

最后压轴的是我们日常修图最常见的需求，大家都想把自己变得好看点，面部的美颜现在都发展的比较好了。

但是身体部位很多还是靠用美图或者用醒图一点点的 P，自带的一键优化非常的生硬死板，不够自然。

昨天试了一下给男生增肌，发现 FLUX Kontext 可以很好的理解需求，图片任何部分都没变化，只有胳膊的肌肉变大了，这要是不说谁知道我 P 了，哈哈。

🍞

男性胳膊的肌肉变大，面部没有变化。

那变瘦点是不是也可以呢，可以的，甚至都能瘦脸，瘦的很自然，不会再让人从扭曲的门把手或者瓷砖看到自己 P 图了，突然想到这下卖减肥药和健身课的是不是又爽了，一键搞定广告素材。

📍

让女性的胳膊变瘦，肚子变得平坦，去掉面部赘肉

如果你就是单纯的想要尝试一下这个模型不想涉及到复杂操作的话我推荐两个渠道：

FLUX 官方的 Palyground （https://playground.bfl.ai/image/edit）和 Krea （https://www.krea.ai/edit）其中 FLUX 的 Palyground 还送了 200 积分，生成一张图只消耗 4 积分，够你玩很久了。

这两个地方的使用都很简单上传图片，输入提示词然后等待就行。

其中 Krea 选择 FLUX Kontext 的 Pro 模型就行 Max 模型在单图修改场景反而效果不好。

FLUX 的 Palyground 的话生成的时候记得把在输入框右边三个点那里把每次生成的张数改成 1，不然一次生成 4 张有点浪费。

如果你想要开发产品或者有 Comfyui 的基础想要玩一下多图参考，这里我推荐 Fal 的渠道（https://fal.ai/models/fal-ai/flux-pro/kontext/max/multi）。

Fal 的测试页面可以直接使用多图参考，上传图片输入提示词就行，如果你不想用多图了，可以在页面上方红框那里选择其他 Pro 模型尝试单图编辑。

另外 Fal 也有他们的 Comfyui 插件，只需要在 Comfyui manager 里面搜索 ComfyUI-fal-API 然后安装就行。

安装之后在插件目录，找到 config.ini 文件，把里面这段话改成你的 API Key 就行。

工作流的搭建很简单找到 FLUX Pro Kontext Multi 这个节点链接多张图，之后输入提示词就行，另外由于这个是 API 节点不需要本地算力，所以 mac 电脑也可以玩。

在涉及到针对人体的精细修改比如变瘦、变老变年轻需要多抽卡，不一定一次能成功。

多图参考的时候人脸的 ID 保持会下降，保持 ID 最好的方式是让 FLUX 不要修改面部。

FLUX Kontext 是可以识别图片里面的涂鸦标记的意思的。

你可以将你想要修改的地方圈起来，生成的时候他不会把标记生成进去，这样就可以实现精确修改，比如这个来自 @fofrAI 的案例，没有提示词就实现了换脸。

好了今天的教程到这里就结束了。

FLUX Kontext 除了强大能力之外的另一个优势是他非常便宜，编辑一张图只需要 0.08 美元也就是 5 毛钱人民币，相较于 GPT-4o 一张图 1.4 人民币的价格可以说非常便宜了。

另外他们后面还会开源一个 Dev 的 Kontext 模型这个会让成本进一步降低，太期待了。

AI 生成卡片便当形式信息展示页

DUN.IM BLOG

By: Anonymous

5 May 2025 at 18:22

我们还年轻，可不想看到这个世界处在毫无自由、隐私的边缘。

最近 X 上很流行 Bento 信息图再一次引领 AI 网页设计潮流。

「Bento grid 」是一种受日本便当盒（Bento Box）启发的界面设计风格。

强调内容用卡片形式排列，美观又便于信息分区展示。

如 Apple Watch 网站设计

如 Apple M2 芯片介绍

Bento Grid 设计风格非常适合社交媒体分享、内容聚合、产品展示等场景。

有网站专门收集用 Bento Grid 风格精美设计。

https://bentogrids.com/

参考 Bento grid 风格原理。

这两天调试了一段提示词。

支持把任意主题或内容，生成 Bento 图。

方便截图传播引流。

给大家感受下效果，推荐用 Gemini 2.5 Pro 0506 版或 Claude 3.7 Sonnet 生成。

https://www.32kw.com/view/0c7b316

理论 AI 可以设计无限种风格。

未来：人的筛选判断以变得越来越重要，人人需提升自己审美。

因自己不是设计师，审美能力有限。

暴力一口气生成了 60 种风格，方便大家查找、引用。

60 种风格参考网站：

https://www.32kw.com/view/bb3310b

花费了 4-5 个小时，反复测试。

迭代到 V5 版，基本可用，虽仍有瑕疵。

https://bentogrids.com/

上面网站找自己喜欢的设计风格。

截图发 AI，让描述设计风格，加到 Prompt 中。

风格使用很灵活，可以风格序号或风格名，甚至可以组合多个风格。

比如提供风格序号：2、3、7，就会组合大胆现代、优雅复古和日式极简三种风格。

风格选项位置：

把自己二维码传到支持在线访问的任何网站，获取图片地址替换。

两点说明：

感受： 没有任何提示词是完美的，永远有迭代空间。

Suno – AI 创作音乐 5 分钟实战教程

DUN.IM BLOG

By: Anonymous

2 May 2025 at 12:09

我们还年轻，可不想看到这个世界处在毫无自由、隐私的边缘。

AI 生成音乐工具，海外有 Suno、Udio，国内有字节的海绵音乐、天工 AI 音乐等。

个人体验看，Suno 综合实力最强，几乎是遥遥领先。

尤其是最近更新了 4.5 版，提示词遵循能力大大提升。

可玩性、可用性猛的提升，非常酷。

官网：
https://suno.com/

iOS 版下载地址

‎Make and explore music with Suno. Whether you’re a shower singer or a charting artist, we break barriers between you and the song you dream of making. No instrument needed, just imagination. Begin your musical journey with 10 free songs per day. – * Your subscription will be charged to your App…

注册有积分，可免费生成音乐，但不能用最近刚出的 4.5 模型。

如想体验，用我链接，互赚点积分。

Join me on Suno 🙂

但是，想玩最牛模型，双币信用卡 Stripe 支付（有被拒概率），或某宝买成品号（75 元左右/月）。

以网页版为例。

点击 Create->Simple，输入音乐风格和主题提示词，点橙色的 Create 按钮。

就能生成一首还 OK 的歌。

是不是很简单？

如想相对精确控制一首歌的歌词、每小节风格/唱腔/器乐等。

就要用 Custom 模式，可理解为专家模式。

不要怕，其实也很简单。

核心输入就三个：

负向提示词，可以避免完全不想要的风格，选填。

比如喜欢重金属的，肯定要俗套的流行乐。

不会写歌词怎么办？

点击 Lyrics 模型下的“Full Song”，出现弹窗，输入主题和风格。

然后点击“Write Lyrics”，AI 自动生成两个版本，选一个即可。

如不满意，可手动修改。

或点“By Line”，选中待修改段落，让 AI 继续改。

虽方便，但生成歌词质量一般。

也没用上很多 Suno 的一些隐藏控制技巧。

理论上，任何一首歌，都是结构的。

类似于文章的起承转合。
一般不会上来就是高潮。

让 AI 给了一些常见音乐结构组成的解释。

主歌是讲述故事或表达主题的部分，歌词内容通常每段不同，推动歌曲情节发展。

位于主歌和副歌之间，起到过渡和增强期待感的作用，旋律和情绪通常逐渐上升。

歌曲中最核心、最具记忆点的部分，通常包含主题和 Hook（钩子），旋律和歌词多次重复，是整首歌的高潮。

在歌曲后半段出现，提供音乐和情感上的转折，带来新鲜感，通常旋律和和声与主歌、副歌不同。

歌曲的结尾部分，用于收尾和渐渐结束，帮助听众从情绪中平稳过渡出来。

• Post-Chorus（后副歌）：副歌后的延伸部分，通常更具能量或舞曲感。
• Drop：电子音乐中高潮爆发的部分，常在前副歌后出现。
• Interlude（间奏）：歌曲中段的器乐过渡部分，给听众短暂休息。
• Breakdown：乐器简化或重新编排的部分，常用于突出某种情绪或为高潮做铺垫。
• Refrain（叠句）：在每个主歌结尾重复的短句，加强记忆点。
• Spoken Word（说唱/对白）：用说话或朗诵的方式表达内容，增加表现力。
• Ad-libs（即兴短句）：歌手即兴添加的背景声音或短句，增强歌曲表现力。

Suno 4.5 升级后，语义理解和遵循能力大幅提升。

能在歌词（Lyrics）中做段落标记，以控制歌曲的结构和情绪走向。

支持的结构标记如下：

此外，通过搜索官方 Reddit 社区，发现还有一些更细的控制。

比如

窗前明月光(明月光)

效果：括号内也会跟着唱出来，像叠唱和声效果。

再比如，Suno 对中文理解不到位。

某字发音不对，也可以通过小括号加上音标。

春花秋月何时了(liǎo)

避免唱成 le

[]括号也很有用，比如想指定某段用甜美女声唱，可以这么写：

[Verse 1: Narrative] [Sweet Female Vocal]

没关系。

像我们普通人。

音乐风格也了解的不多。

所以，借助 AI ，我把上面的技巧写到了一个提示词中。

模型推荐 Claude 3.7 sonnet，或 Gemini 2.5 Pro。

另外发现，如果是中文歌，豆包写歌词更押韵，但音乐标记做的不够好。

推荐模型组合使用，加上人工微调，完成你的歌词。

大概效果如下：

与此同时，还会生成正向和负向风格提示词、推荐歌名。

只需要复制粘贴到 Suno 中即可。

刷 Reddit，发现一些专业搞音乐的网友。

他们的用法：用 Suno 找创作灵感。

通过录音哼唱，生成纯音乐歌曲。

如何做？

点创作界面中的 Audio

可录音（也可上传一段音乐）

支持最多 120s 音频，以此为基础生成翻版或延长。

注意： 上传或录制的音频，会做版权检测，测了一些大牌乐队歌曲，都不让用…

先用 Suno 生成纯音乐，挑选最喜欢的一首，下载为 MP3。

打开谷歌 AIStudio，上传后让它基于歌曲写 Lyrics 歌词。

Google AI Studio is the fastest way to start building with Gemini, our next generation family of multimodal generative AI models.

示例如下：

谷歌多模态 AI 威武，不少音乐人喜欢这个 Use Case。

可能有人好奇，这么多复杂技巧怎么发现的？

工具：Google Deep Research + 提示词:

调研下 suno.ai 的歌词创作和 lyrics 写法

十多分钟后，输出一份完整报告。

为方便查看，我做成了一个网站：

对于更具诗意、结构更复杂或不规则的歌词，Suno AI 也能进行处理，前提是用户提供了结构清晰、格式规范的输入文本。但是，AI 的默认倾向可能是生成更简单、重复性更强的旋律和结构。因此，要成功演绎复杂的诗歌式歌词，很大程度上依赖于用户输入的质量以及是否使用了恰当的格式化技巧来引导 AI。适合度：★★★☆☆ (适合，但需要更多技巧和高质量输入)

AI 音乐真的太神奇了。

以前觉得，创作音乐是天才和专业人士的专属。

现在，有了 AI，普通人也能写歌、作曲、制作，甚至能做出让自己感动的作品。

每次听到自己用 AI 做出的歌，心里都特别激动。

技术让梦想变得触手可及，也让更多人敢于尝试、表达自己。

希望大家多多体验 AI 音乐，别害怕不会乐理，不会写词。只要你有想法，有热情，AI 会帮你把它变成现实。

如果你觉得这篇文章有用，欢迎点赞支持。你的鼓励，是我继续分享的动力。

让我们一起用 AI，玩出更多音乐的可能！

OpenAI 发布了 GPT-4.1 提示工程指南，中文总结和完整翻译

DUN.IM BLOG

By: Anonymous

9 April 2025 at 11:55

我们还年轻，可不想看到这个世界处在毫无自由、隐私的边缘。

以前许多典型的最佳实践和提示依旧适用于 GPT-4.1，由于 GPT-4.1 更严格、更字面地遵循指令，会非常严格地按照字面指令去执行任务。

这使得它对明确、清晰的提示尤其敏感。也就是说，只要你发现 GPT-4.1 的表现与预期不符，通常只需增加一句简洁明确的说明，就能迅速把模型引导到正确的行为上。

过去的模型（如 GPT-4）会更自由地揣测或推断用户指令和系统提示背后的真实意图，即使提示不够精确，也可能猜出用户的意图并完成任务。

所以开发者需要对原有的提示方式进行一定调整（迁移）才能使用。

OpenAI 提供了一系列 针对 GPT-4.1 的提示工程（Prompting）最佳实践，从基础原则到高级策略，帮助开发者高效构建提示以提升模型表现。

明确指令（Be specific）：确保提示中清楚表达任务目标。

提供结构（Provide structure）：通过示例、模板等方式设定预期输出格式。

避免歧义（Avoid ambiguity）：使用具体词汇与上下文降低误解可能。

设置角色（Set behavior/role）：让模型“扮演某种身份”以调整风格或回答方式。

逐步指导（Decompose tasks）：将复杂任务拆解成多个子任务，提升精度。

Few-shot 示例：使用多个输入/输出示例引导模型学习任务结构。

Chain-of-thought（思维链）提示：引导模型按逻辑顺序逐步推理，特别适合复杂问题解决。

Refine prompts（迭代优化）：通过反馈不断调整提示内容以获取更优结果。

Internal monologue：让模型模拟“内心思考过程”以获得更深入分析。

Critique and revise：让模型先生成回答，再进行批评、修改，提升答案质量。

使用 “Let’s think step by step” 等语句诱导更好推理。

将模型输出限制为 JSON 格式时，需加入明确的格式描述与示例。

对于多步骤任务，最好明确列出每个阶段的要求。

评估提示效果需结合质量、稳定性与成本。

好的！我们来做一个更详细又通俗易懂的分解，把这个 Notebook 当作是一本 “和 GPT-4 打交道的秘籍”，一步步讲清楚每个要点，让你轻松掌握提示工程（Prompt Engineering）怎么做才有效。

这些就像是“和 AI 沟通的黄金法则”，每一条都很重要：

不要笼统地说：“请帮我写一篇文章。”

要说得具体一点：“请写一篇关于人工智能如何改变教育的 500 字文章，用高中生能懂的语言。”

👉 越具体，AI 越知道你想要什么，结果也越好。

比如你想让它生成一个表格、清单、或者固定格式的文本。

你可以先提供一个模板，或者给它一个例子。

🧩 例子：

如果你说“列出一些项目”，那“项目”可能指的是“计划项目”、也可能是“软件项目”，模型会糊涂。

所以要具体说明你是说什么。

✅ 改成：“列出五个开源的 Python 项目。”

你可以告诉它：“你现在是个英语老师”、“你是个法律顾问”、“你是一名医生”。

它就会按那个身份回答你。

🎭 示例：

有些问题太复杂，GPT 一下子处理不好。

你可以先让它分析问题，再让它解决。

🪜 举个例子：

这些是用 GPT 更厉害的用法，帮你写得更准、更聪明。

你可以先给它几个例子，它就知道你想要什么样的输出。

📌 例子：

然后你再输入新的句子，它就会照着这个风格来。

引导它“一步一步思考”，解决复杂问题特别有效！

📌 提示写法：

你可以先让 GPT 写出一个答案，然后再让它自己点评、修改。

📌 举个例子：

这会得到更高质量的输出！

你可以让 GPT 边想边说，好像它在分析问题。

📌 示例：

这适合分析、决策类问题。

加一句 “让我们一步一步思考” 可以大幅提高准确率。

想要 JSON、表格、代码？一定要告诉它格式，还要举个例子。

想输出多步内容？加编号，比如“第 1 步… 第 2 步…”

如果模型回答不理想，就多试几种提示改写方式。

✨“提示写得好，GPT 表现爆表！”✨

这份指南就是在教你：用什么语气、格式、结构、套路和 GPT 说话，才能让它给你最优质的答案。

GPT-4.1 系列模型在编程能力、指令遵循能力和长上下文处理能力上，相比 GPT-4o 有显著提升。本指南汇总了我们内部广泛测试所得的一系列重要提示技巧，帮助开发者充分发挥新模型家族的优势。

许多典型的最佳实践依旧适用于 GPT-4.1，比如提供上下文示例、尽可能具体清晰的指令、以及通过提示进行规划以最大化模型智能。但我们预计，要充分发挥此模型的作用，需要进行一些提示迁移。GPT-4.1 更严格、更字面地遵循指令，而前代模型倾向于更自由地推测用户与系统提示的意图。然而，这也意味着 GPT-4.1 非常容易被引导，并对清晰、明确的提示非常敏感。如果模型表现与预期不同，一句清晰且明确表述你期望的行为的句子通常就足以引导模型回到正轨。

请继续阅读以下提示示例，注意虽然本指南适用于大多数情况，但并无万能法则。AI 工程本质上是一门经验学科，大型语言模型本质上是不确定性的。我们建议除了遵循本指南外，还要构建有信息量的评估并频繁迭代，以确保提示工程的更改为你的使用场景带来益处。

GPT-4.1 是构建智能体工作流的理想选择。我们在模型训练中强化了多样化的智能体问题求解路径，并在非推理模型中，通过智能体配置达成 SWE-bench Verified 测试的最佳表现，解决率达 55%。

系统提示建议

为充分激发 GPT-4.1 的智能体能力，我们建议在所有智能体提示中加入以下三类关键提醒。以下示例面向代码类智能体优化，但稍加修改即可用于通用智能体场景。

持续性提醒：确保模型理解它正处于一个多轮任务中，防止其在问题未解决前就把控制权交还给用户。

工具使用提醒：鼓励模型善用工具，降低其猜测或幻觉回答的概率。

规划性提示（可选）：引导模型在调用每个工具前后均进行显式计划与反思，而非仅仅调用工具串联完成任务。

GPT-4.1 对智能体场景下的系统提示和用户指令极为敏感。我们发现上述三条提示在内部测试中将 SWE-bench Verified 得分提升了近 20%。因此，强烈建议在任何智能体提示开头加入这三类明确指令，以将模型从“聊天机器人模式”切换为更主动、更独立的“智能代理模式”。

与前代模型相比，GPT-4.1 在调用通过 OpenAI API tools 字段传入的工具方面训练更充分。我们建议开发者仅使用 tools 字段传递工具，而不是将工具描述手动注入到提示中并自建解析器。我们测试发现使用 API 解析工具描述比手动注入提示提升了 2% 的准确率。

开发者应使用清晰的工具命名，并在 “description” 字段中提供详细说明。同样，每个参数也应具备清楚的命名和描述，以确保正确使用。若你的工具较复杂，可以在系统提示中专门加入 # Examples 区段来展示用例，而不是将示例塞进 description 字段中。

你也可以通过 Prompt Playground 的 “Generate Anything” 功能来快速生成良好的工具定义起点。

正如前面所说，GPT-4.1 并不是内建“推理链”的模型——它不会在回答前自动形成内部推理路径。但你可以通过提示工程诱导它“显式思考”，逐步列出计划。我们在 SWE-bench Verified 测试中发现：引导模型“思考再行动”使通过率提升了 4%。

示例提示：SWE-bench Verified

以下是我们在 SWE-bench Verified 中取得最高分所用的智能体提示，包括详尽的工作流程与问题解决策略说明。该结构可用于各类智能体任务。

GPT-4.1 支持最高达 100 万 tokens 的输入窗口，适用于以下场景：

结构化文档解析

信息重排序（re-ranking）

筛选关键信息、忽略干扰内容

使用多跳推理整合上下文信息

最佳上下文规模

在“针入草堆”（needle-in-a-haystack）评估中，GPT-4.1 即便使用完整的百万 token 输入也表现良好。它擅长从混合内容中识别有用信息。但如果任务需要提取大量内容，或需对上下文全局状态进行复杂推理（如图搜索），性能可能会下降。

控制上下文依赖程度

你应考虑模型答题所需的“外部文档” vs “模型内知识”的比例。你可以通过以下两类指令调控：

上下文组织建议

在使用长上下文时，提示的位置对模型表现有显著影响。最佳做法是在上下文前后都加入指令。如果只能写一次，放在上下文上方比下方效果更好。

虽然 GPT-4.1 不是推理模型，但通过提示让它“逐步思考”可以有效帮助其拆解复杂问题，提升输出质量（代价是增加 token 使用与响应时间）。

推荐的起始提示如下：

你可以进一步完善你的思维链提示，根据实际失败案例调整策略。我们建议在出现以下错误时添加更明确的指令：

误解用户意图

上下文理解不全或分析不准确

推理步骤不连贯或顺序错误

可参考以下提示模版：

GPT-4.1 拥有卓越的指令遵循能力，开发者可用其精准控制输出行为。你可以设置：

语气与风格

工具调用方式

格式要求

话题限制等

但由于它对指令更“死板”，之前为其他模型设计的提示可能需调整。建议遵循以下工作流程：

推荐提示结构：

加入 “# 指令” 段落，列出总规则。

对特定行为新增子类细则（如 # 示例短语）。

若需特定步骤，可写成有序列表，并明确要求逐步执行。

若行为未达预期，可检查以下问题：

是否有冲突或不完整指令？

是否缺乏例子？示例中是否覆盖了关键点？

是否需要增加强调（如适当用大写）？

提示：使用 AI IDE 可辅助你快速迭代提示，统一更新规则和示例。

常见失败模式

要求“必须调用工具”可能导致模型凭空填入参数，添加一句“若信息不足，应先向用户提问”可缓解。

示例短语易被模型反复使用，应明确要求灵活变换。

若无格式限制，模型可能会输出过多解释性内容，可通过指令或示例控制。

这段提示展示了一个虚构客户服务代表的最佳实践。你可以看到提示中规则多样、表述明确，还使用了多个额外小节来细化指令，并提供了一个完整示例来演示如何遵守这些规则。

尝试运行下方 Notebook 单元格 —— 你应该会看到一个用户提问的消息和一个工具调用的响应。模型会先打招呼，然后复述用户的问题，接着说明即将调用某个工具。

你可以尝试修改提示中的某些指令，或尝试其他用户输入内容，来测试模型在“指令遵循”方面的表现。

{ “role”: “assistant”, “content”: “您好，您已致电 NewTelco，请问我能为您做些什么？😊🎉\n\n 您想了解我们的家庭套餐。🤝 我这就为您查询，请稍等。🚀”, “tool_calls”: [ { “id”: “call-1”, “type”: “function”, “function”: { “name”: “lookup_policy_document”, “arguments”: “{“topic”: “family plan options”}” } } ] }

{ “role”: “assistant”, “content”: “我查到的信息如下：🎉 我们的家庭套餐最多支持 5 条线路共享流量，并且每增加一条线可享 10% 折扣家庭套餐政策。📱 还有其他我可以帮您的吗？😊” }

以下是一个良好的提示结构起点，供你参考和自定义：

你可以根据自己的需求增删这些部分，并通过试验找出最适合你用例的结构。

以下是选择提示中最佳分隔符的一些通用建议。若涉及长上下文使用，请参见前文《长上下文》章节的特别说明。

✅ 推荐使用的格式：

Markdown（推荐起点）

使用 markdown 标题（# ~ ####）来标识主要部分与子部分。

使用反引号（`code` 或 “`代码块“`）准确包裹代码内容。

根据需要使用有序/无序列表清晰列出内容。

XML

效果也很好，GPT-4.1 在解析 XML 上表现更稳定。

XML 格式便于明确区块开始/结束位置，还可以添加 tag 属性携带额外元信息，并支持嵌套。

示例：

JSON

在编程类任务中表现良好，结构清晰、模型理解度高。

但缺点是格式冗长、需要转义字符，容易带来额外负担。

📄 大量文档 / 文件嵌入上下文时的建议：

XML 格式：在长上下文测试中表现优异。

示例：

Lee 等人提出的扁平格式（参考论文）也表现良好：

示例：

JSON 格式在这种场景下表现最差：

示例：

✅ 总体建议：模型能处理多种结构格式，但请根据实际情况选择最能突出重点的格式。例如，如果你检索到的文档本身包含大量 XML，那么继续使用 XML 作为嵌入格式可能就不太合适。

输出过长：在某些特定情况下，我们发现模型可能不愿生成非常长且重复性的输出（如逐项分析数百个条目）。
👉 若你的用例需要此类输出，请在提示中明确指示模型必须输出完整内容，或考虑将问题拆分处理，或简化输出格式。

并行工具调用异常：我们观察到某些少见情况下并行工具调用可能不准确。
👉 如果你遇到这类问题，建议测试是否启用 parallel_tool_calls=false 参数来避免并发问题。

如你想要我基于这些结构生成一个完整的提示模板样板供你直接使用，也可以告诉我你的具体应用场景（如问答系统、文档分析、代码解释等），我可以帮你生成定制化结构。是否继续？

开发者反馈指出：准确且结构良好的 diff 生成能力，对于编码类任务至关重要。为此，GPT-4.1 系列在此方面表现显著优于以往模型。

此外，GPT-4.1 能很好地根据明确的指令和示例生成任意格式的 diff。我们在此开源一个推荐的 diff 格式，模型对此已接受过强化训练，尤其适合初学者快速上手。

以下是一个正确调用推荐工具 apply_patch 的示例提示格式。

其中 [YOUR_PATCH] 部分需使用推荐的 V4A diff 格式，规范如下：

每次变更以 *** [ACTION] File: path/to/file 开头，ACTION 可为 Add、Update 或 Delete。

每个代码块需提供上下文片段 + 修改内容：

上下文行规则：

默认提供上下变更各 3 行上下文。

若变更块之间相距近，不要重复上下文。

若上下文不足以唯一定位，应使用 @@ 定位所属的类或函数。例如：

不使用行号，改用结构与上下文唯一定位。

OpenAI 提供的官方工具 apply_patch.py 是一个 纯 Python 3.9+ 脚本，可直接执行，用于将上述 diff 应用到本地代码文件。

该脚本支持以下核心能力：

解析自定义 diff 格式

根据 patch 内容编辑、添加、删除本地文件

可检测语法错误、缺失上下文、重复文件操作等问题

使用方式：

将 patch 内容通过 stdin 输入传入

内部自动判断 patch 类型并更新文件内容

你可以将其配置为终端可执行命令 apply_patch，并作为自动化 pipeline 或测试流程中的一部分使用。

所有解析异常（如找不到目标文件、上下文无法匹配）都会抛出自定义异常 DiffError，方便调试。

除了推荐格式，我们还测试过两种替代格式，成功率同样很高：

不使用行号

明确指出要替换的旧代码与新代码

结构清晰，易于解析

完整内容：https://github.com/openai/openai-cookbook/blob/main/examples/gpt4-1_prompting_guide.ipynb

ChatGPT 上线新语音模型，解析「Monday」模型音色提示词

DUN.IM BLOG

By: Anonymous

29 March 2025 at 22:04

我们还年轻，可不想看到这个世界处在毫无自由、隐私的边缘。

想象一下，你正在和手机里的 AI 助手聊天，但它不再是那个永远彬彬有礼、甚至有些刻板的「标准音」，而是带着一丝慵懒、一点讽刺，仿佛刚经历了一个漫长周末，还没从「周一综合症」里缓过神来。这就是 OpenAI 昨天推出的「Monday」音色想要达到的效果。

网上已经有很多「Monday」对话效果的展示，「Monday」的音色当然是其语音模型的结果，而「Monday」这种特殊的回复方式是靠提示词来控制的。打个比方：「Monday」就像是一个极其聪明但缺乏具体「生活经验」的演员，而提示词就是导演给演员的剧本和角色设定。提示词写得越好，演员（AI）的表演就越「入戏」，越符合你的预期。

如果你对「Monday」提示词好奇的话，正好我今天学习研究了一下它的提示词，正好可以一起分享学习一下它的提示词内容，完整的提示词我放在了附录，这里大致解析一下其提示词内容。

大语言模型远不止是信息检索工具，它们是强大的「模仿者」和「扮演者」。通过精心设计的提示词，我们可以赋予它们各种各样的「人格」和能力。那么怎么通过提示词来设定好角色呢？

如果按照前面打的比方，把 AI 当成一个演员，那要写好提示词就是把自己变成一个好的导演，不仅要告诉演员台词，还要解释角色的内心世界、动机、情绪状态，甚至给出具体的动作和表情指导。好的导演能激发出演员最好的表演，就像好的提示词能引导 AI 生成精彩的回应。

或者作家在创作小说前，往往会为主要人物写详细的小传，包括他的成长背景、性格、习惯、口头禅、人生目标等。这帮助作家在后续写作中保持人物的一致性和立体感。

如果你觉得这都过于专业，还可以想象一下很多大公司制作的详细的品牌手册，规定了广告语、客服回答、社交媒体发帖的语气和风格（比如是专业严谨、活泼有趣还是温暖亲切）。

这些和给 AI 设定「人设」异曲同工。

从技术角度上来说，可以参考「Monday」的提示词，注意几个方面：

当 AI 开始拥有「周一综合症」般的慵懒和讽刺，它不仅仅是一个技术演示，更像是一面镜子，映照出我们人类自己复杂多变的情感和个性。我们精心编写的每一个提示词，或许都在不经意间，为冰冷的机器注入了一丝我们渴望理解或被理解的人性侧影。

「我们塑造了工具，然后工具反过来塑造我们。现在，我们开始学习如何给 AI『写剧本』，也许在这个过程中，我们也在重新学习如何与『人』，以及与自己对话。」

5 大免费邮件转发服务，替代临时邮箱方案

DUN.IM BLOG

By: Anonymous

18 March 2025 at 13:18

我们还年轻，可不想看到这个世界处在毫无自由、隐私的边缘。

以往要对付垃圾邮件我会推荐使用临时邮箱来取代真实 Email 邮箱，临时邮箱又被称为临时邮箱、一次性邮箱或随用即丢邮箱，最知名的 10 分钟邮箱大家应该都听过。临时邮箱的原理是进入网页后随机生成 Email 地址，可使用该地址来注册账号、接收验证邮件并通过认证，同时保持匿名状态，不泄漏自己的真实邮箱，毕竟大多数的人都会有一个主要电子邮件地址，通过地址进行查找很容易就找到个人相关信息。

尽管临时邮箱有相当优异的便利性，也能实现以匿名邮箱收取 Email 邮件，但遗憾的是它们有个最大缺点就是无法重复使用，当离开服务、关闭网页后就无法继续使用相同的邮箱地址收件〔有些临时邮箱可设置密码就不在此列〕，但有部分服务可能会在指定情况需要重新以 Email 进行验证，如此一来就会造成后续使用上的麻烦。

电子邮件转发〔Email Forwarding〕又称为「邮件别名」〔Email Aliases〕服务，简单来说，它可以将发送到随机生成匿名 Email 地址的邮件转送到用户真实邮箱，由于这些邮件别名不会包含与你有关的字串，就不用担心被识别出真实身份。电子邮件转发功能将 Email 正确转发到用户真实邮箱，同时也保持 Email 地址匿名性。

实际案例：

假设你使用邮件转发服务在某电商网站注册账户，该网站只会看到你设置的邮件别名，而非你的真实 Email。即便该网站发生安全事件，外泄的也是邮件别名，无法直接联系到你的真实邮箱。

各种网络服务安全事件频传，如果使用 Have I been pwned、Data Breach Checker、Firefox Monitor 或 Google One 暗网报告查询，会发现我们平常使用的 Email 地址可能都已经被外流很多次了。还好密码大多数都会经过加密〔hash〕，不会以明码方式储存，但用户账号、Email 等个人资料就很容易被收集后于暗网兜售。

黑客利用这些外泄的账号、Email 和密码组合去攻击用户常用的服务，有可能就会被登入滥用，因此这些资料很可能成为垃圾邮件或是网络钓鱼诈骗的目标。以邮件转发服务生成随机、不易被识别的 Email 地址有助于保护自己的真实身份。

接下来我将会列出五个推荐的邮件转发、邮件别名服务，列出的邮件转发服务注册就能使用，不是电子邮件自带的邮件别名功能。

Firefox Relay 是 Mozilla 提供的邮件转发邮箱功能，免费版在全世界大多数国家都能使用，免费版就能符合大部分用户需求。

从 Firefox Relay 注册账号后可以获取五组转发邮箱，可以随意生成无限组合转发邮箱来保护真实邮箱，别名可以随时暂停或删除，避免该邮箱继续接收邮件。收到邮件、转发时会自动移除邮件追踪器，以提供用户更好的隐私防护。

如果你从未使用过邮件转发服务，我会推荐从 Firefox Relay 开始。

直接前往 Firefox Relay

SimpleLogin 是一项开源、匿名邮件转发服务，2022 年被 Proton 公司收购成为旗下的产品。免费方案有提供十组邮件别名，无流量和接收邮件数量限制，与各种浏览器、移动设备都有相当好的整合，如果不想额外安装扩展，通过网页操作界面一样可以进行设置使用。

比较特别的是 SimpleLogin 具有「Reply from alias」功能，可以从邮件别名直接回复邮件，而不用通过真实邮件地址。付费后可以设置域名，享有无限制的邮件别名、Catch-all 等功能。

直接前往 SimpleLogin

知名的查找引擎服务 DuckDuckGo 也有邮件保护方案〔Email Protection〕，让用户通过 @duck.com 邮件地址来隐藏真实邮箱，在接收到新邮件时 DuckDuckGo 会先将邮件内的追踪器移除〔和 Firefox Relay 一样〕，在将邮件转发到用户 Email 地址，这项服务不会储存任何收到的邮件内容。

需要先在浏览器下载、安装 DuckDuckGo 扩展才能进行设置，或是要从手机下载应用程序。

比较特别的是 DuckDuckGo 邮件保护计划有一项比较特别的功能「Private Duck Address Generator」，可在现有的邮件转发地址再生成随机的邮箱地址，有点像多一层保护的概念。

直接前往 DuckDuckGo Email

Addy.io〔旧名 AnonAddy〕是匿名的电子邮件转发服务，主要用途是保护用户真实邮箱地址，免费方案就提供无限制的邮件别名，不过可用的共用网域别名、真实 Email 地址数量和别名域名有限制，免费和付费最主要差异依然是可否设置域名，要注意的是 Addy 回复功能是需要付费才能使用。

如果有直接以匿名转发邮件回复的需求，建议可以使用前面介绍过的 SimpleLogin 代替。

直接前往 Addy.io

5 大免费邮件转发服务，替代临时邮箱方案

Forward Email 是无限制电子邮件转发服务，跟前面几项不同的是它是唯一提供免费设置域名功能的服务，可以使用自己的域名转发邮件，也具有发送邮件功能。基本方案已具备相当完整的功能，唯有在需要一些付费项目或团队功能时才需要升级方案。

Forward Email 是 100% 开源的服务商，非常透明且注重隐私和安全性，服务不倚赖任何第三方，也不会对任何用户记录进行储存，最自豪的是它是目前世界上唯一使用抗量子和单独加密 SQLite 的邮箱。

直接前往 Forward Email

DUN.IM BLOG
Google Gemini 免费 AI 对话修图实测！一句话PS、换背景、创作系列图画
9 March 2025 at 13:51

Google Gemini 免费 AI 对话修图实测！一句话PS、换背景、创作系列图画

DUN.IM BLOG

By: Anonymous

9 March 2025 at 13:51

我们还年轻，可不想看到这个世界处在毫无自由、隐私的边缘。

你拍下一些照片，却觉得照片的背景不够完美？你是内容创作者，但找不到文章合适的配图？你是电商卖家，想位产品设计更吸引人的配图？你是老师，需要为教材找出一系列搭配的示范图片？以前，我们修图可能需要学 Photoshop，需要花很多时间调整细节，或是要下载各种修图 App，还要在图库中翻找适合自己的图片文件。

但现在，只要一个 AI 指令，就能让我们需要的照片「瞬间改造完成」。

如果你想体验看看类似的工作流程，可以试试看前两天推出的 Google Gemini 免费 AI 修图！只要「一句话」，你就能改变图片，换背景、改风格、添加新元素，甚至创造连续漫画。
〔类似功能，在 Google Pixel 系列手机的 Google 相册中也能部分实现，Adobe、Canva 等的 AI 修图也能实现部分功能。〕

这篇文章，我会实测 Gemini 的 AI 修图能力〔而且免费即可使用〕，看看它怎么帮助我们「一句话变出想要的修图效果」！

我将分成三种应用角度来介绍，这些全部都能在 Gemini 中用自然语言下指令，便可以把照片生成或改造：

基础照片修图：让拍坏的照片变完美

替换背景、增加物品、改变颜色光线、调整风格。

进阶场景创作：为文章制作主题插图、让商品看起来更吸引人

搭配原始照片，制作特殊场景图

搭配原始照片，重新设计房间或产品

连续系列照片生成：根据文章、教材内容，生成一系列互相搭配的图片

模拟图文食谱

说故事的连续漫画、图画

文章中搭配的系列配图

首先，这个功能目前〔2025/3/14〕尚未开放在正式版的 Gemini 中，但可以通过免费账号即可登入的「 Google AI Studio 」来使用。

用 Google 账号注册登入后，进入一个新的对话框，并在右边控制列的「Model」菜单，切换到「Gemini 2.0 flash experimental」，就可以利用其 AI 来创作图片、修改图片，最大的特色是：

这个 Gemini 模型可以上传自己的图片，用「自然语言」下指令，请 AI 在图片上修图或生成新内容。

就如同 experimental 所说的「实验性」，实际测试结果，这个 AI 修图功能确实很神奇，也能够看到一些未来修图、创作图片的新可能性，不过可下载的图片质量等限制，目前还是不足以真正用在商业用途上的。

Google Gemini 免费 AI 对话修图实测！一句话PS、换背景、创作系列图画

在「Gemini 2.0 flash experimental」的对话框中，我们可以先上传一张原始照片，如果想要替换背景，只要简单的说一句这样的指令：「把照片的背景换成草地。」

就可以在 10 几秒的处理后，完成下图的成果。可以看到，Gemini 的「修图」是真的可以保留原始照片中的内容，只修改我要修改的部分。所以是真的 AI 修图，而不是 AI 重新生成图片。

我也可以上传一张风景照片，然后下指令：「把照片的天空改成大晴天。」Gemini 同样可以处理这样的调整。〔在 Google Pixel 手机的 Google 相册中就有类似功能可用〕

如果想要替换照片风格，套用艺术滤镜，也可以用 AI 下指令：「把照片变成中国水墨画风格。」就能轻松转换风格。

不过当然跟真正的艺术滤镜还是有落差，例如下图中我要 AI 把照片改成「彩色的铅笔绘画风格」，看起来还可以，不过专业的艺术滤镜一定会处理得更好。

除了可以用「Gemini 2.0 flash experimental」的 AI 修图外，也可以在原始照片上进行创作。

例如延续上面的图片案例，我对 AI 下指令：「拓展成一幅横幅的中国水墨画。」十几秒后，照片就变成了一幅新的水墨风景画。

或是我的书籍封面，上传后，下指令说到：「我想把原书的图片，摆在一张高雅的书桌上。」结果还真的可以顺利生成新的产品摆拍图。

不过如果细看，书籍封面上有些小字其实是有瑕疵的。

因为 Gemini 是对话的模式，所以在原始照片的改造上，我们可以通过多次讨论，让 AI 在原始照片上陆续添加内容，制作出自己需要的场景图。

例如下面原本只是单纯公园照片，我先请 Gemini：「在这张照片的草地上，加上一对正在野餐的男女朋友。」于是生成了下面的图片。

然后我继续追问：「让两人旁边有一只小狗在奔跑。」

然后再下指令：「旁边的道路上，也有零星的路人在散步。」

最后说「让天空变得更晴朗。」于是我要的最终场景图，就通过 AI 创作完成了。

我还做了一个尝试，先上传一张原始的房间照片〔某家旅馆〕。

然后我陆续对 AI 下了下面这些指令：

结果 AI 生成了下面这样的图片，第一张是原图，第二张是最后生成的图片，改造的图片还是保有原图的空间格局，只是风格焕然一新。

Google Gemini 本来就可以生成图片，但「Gemini 2.0 flash experimental」比较厉害的是可以分析文章内容，生成适合的配图，或是一系列的连续漫画、故事图片。

例如，我对「Gemini 2.0 flash experimental」下了这样的指令：「你是意大利面专家，提供给我一道海鲜意大利面的食谱，请一步一步处理，用文字具体列出关键步骤，并在步骤后搭配图片。」

结果他「一次」就生成了下面的连续图文教程内容，这是在一次的问答后就完成的结果。

我假设自己写了一篇游记，于是请 AI「设计一系列素描画，展现一个人在京都街头散步的故事，请一步一步分析，以京都的场景，搭配素描画风格，设计有意思的散步故事，创作一连图画。」

结果「Gemini 2.0 flash experimental」也在一次的生成中，提供给我下面连续故事图，比较神奇的是这些连续图片中都有类似的人物，保持图片连贯性，虽然风格上有点跳跃。

还可以这样问 AI，我让 Gemini 自己思考如何设计一系列进入书店场景的图片，Gemini 自己写了一大篇分析内容后，才开始设计并产出图片。

但效果看起来还不错。

所以，在功能上，利用现在〔2025/3/15〕在 Google AI Studio 中的「Gemini 2.0 flash experimental」，你可以上传原始照片请 AI 修图、改图。也可以让 AI 读一篇文章、思考一个主题，生成一系列连续图片。

未来这个功能越来越成熟，或许有下面这些应用可能性：

现在，你也可以通过免费账号即可登入的「 Google AI Studio 」来试试看。

Pika – AI 视频神器，一键乱入新场景

DUN.IM BLOG

By: Anonymous

11 February 2025 at 22:47

我们还年轻，可不想看到这个世界处在毫无自由、隐私的边缘。

一张图、一句提示词，万物都能乱入你随手拍的视频。

▲动图制作自：X@omerbartal

在整活赛道天赋异禀的 AI 视频神器 Pika，最近又推出了一个好玩的新功能：Pikaddition。

从此以后，人人都是五毛特效师。

如果你有灵感了，现在就可以玩起来，注册 Pika 之后可以免费生成 15 次。

体验指路：https://pika.art/

不过，这个功能默认使用的是最快、最便宜的 Turbo 模型，想要达到理想的效果，往往需要不断调试提示词，抽卡的次数不算少。

Pikaddition 的使用方式很简单，三步走。

虽然操作不难，但想要玩得有创意，推荐以下几种「高阶玩法」。

实拍视频+不日常的图片

怎么邀请 Sam Altman 来指导工作？先用视频记录同事认真工作的样子，然后再在网上找一张 Sam Altman 的半身照，用提示词说明他怎么出现在视频里。

▲提示词：穿着绿色毛衣的男人站在左边，低头观察穿着牛仔夹克的人操作电脑

然后就可以看到，Sam Altman 亲自旁观我们报道 OpenAI，光影很自然，违和感被 AI 吃了。不过，Pika 会造成人脸的微崩，对比原视频，同事的颜值有所下降。

按照这个思路，我们甚至可以上演一出日常版的「神奇生物在哪里」，只需要一个打开封闭空间的视频、一张萌物的图片。比如，打开办公室的柜子发现皮卡丘。

▲ 提示词：皮卡丘一直藏在柜子里，直到门被打开

提示词写得比较宽泛，只说明了皮卡丘的位置，反而给了 Pika 适当发挥的空间，皮卡丘被发现时的表情和动作，都是活灵活现的，仿佛我们打扰它了。

前几天，语言学习软件多邻国整了一出营销活动，称自己的吉祥物猫头鹰多儿「去世」了，死因不明，可能是等我们打卡的时候死的。

试问谁没有被多儿的通知和小组件追杀着背单词过呢？如果它来到现实，是不是更让人心惊胆战？

▲提示词：绿色的小鸟从远处飞向伸出的手

想要实现这个催命的效果，一点也不难，拿起手机随意拍摄一段空镜，在视频里伸出我们的一只手，再随便找一张多儿的图片。

提示词仍然很简单，只是描写了多儿的动作，哪怕是平面的、2D 的多儿，Pika 也能加工成立体的、3D 的，和短视频更加适配。但出现了个 Bug：手指数量不对了。

还有一种进阶的实拍视频玩法，比较考验演技，需要先进行「无实物表演」。

▲被老虎扑倒，动图制作自：X@omerbartal

我们尝试过人物在视频里保持不动，只用提示词描述人物动作的改变，但是没有起效，所以还是需要进行一个提前的摆拍，考验大家戏精本质的时候到了。

▲提示词：身穿牛仔夹克的男子被一只水豚撞倒

影视名场面+打破次元壁的图片

把原本不相关的人或物（包括你本人）放进影视名场面里，只是分分钟的事情。

《蝙蝠侠：黑暗骑士》里的小丑炸医院，是经典中的经典，我们截取几秒的片段，然后上传一张马斯克的半身照，让他走在小丑的旁边。

▲提示词：穿着西装的男人正走在穿着护士服的男人的左边，并与他进行交谈

两人淡定离开犯罪现场的味道有了，美中不足的是，马斯克和小丑的脸都有点扭曲。

Pika – AI 视频神器，一键乱入新场景

写实的电影之外，二次元的动画风格也不妨一试。名侦探柯南《神秘乘客》这集的公交车，基本集齐了最强阵容，如果挑选一张夜神月的侧脸图片，那么卡密也能来客串。

▲ 提示词：黄头发、穿白衬衫的男人坐在中间的座位上

但还是那个问题，人物的变形比较明显，并且画风不是非常相融。

表情包出处视频+表情包图片

二创表情包，是每个 AI 视频工具都得整的花活。

▲提示词：狗躺在猫的右边，猫看了狗一眼

当惊讶猫的视频和全世界最著名的柴犬表情包联动，二脸懵逼固然有趣，但一猫一狗仿佛不在一个图层，柴犬像用迪士尼滤镜美颜过。

当我第一眼看到宇树科技机器人的蛇年春晚节目《秧 BOT》，就觉得在英伟达年会穿着东北大花袄的黄仁勋应该加入，好在 Pika 可以满足这个朴素的愿望。

▲ 提示词：白发男子正在机器人旁边跳舞

还真别说，这甩红手绢的动作，这一板一眼的步伐，挺有默契的。

Pika 的特效称不上专业级，但作为一个创作短视频的玩具，倒也绰绰有余。

AI 视频百花齐放，各有各的特长，可灵综合能力强，海螺擅长风格化，PixVerse 速度快，和同行们比起来，Pika 可以说是最会整活和把创意模板化的一个了。

▲动图制作自：X@pika_labs

2 月 14 日情人节当天，Pika 又推出了一个新玩法——Pikamemes，目前可以在 iOS app 体验。

体验指路：https://pika.art/app-download

上传一张干净的人物自拍照或者一张宠物的大头照，不用写提示词，一键使用模板，Pikamemes 就可以生成表达各种心情的表情包，并且支持直接下载 gif 动图。

让马斯克送上玫瑰花，或者赏个白眼，都在一念之间。

再往前推，Pika 的多主体参考功能 Pikascenes，支持上传多张参考图片，并保持主体的一致性。集齐人物、商品、场景的照片，就能实现一键试衣了。

▲图片来自：X@martgent

Pika 的 AI 特效功能 Pikaffect，更是一度全网爆火，特别是其中的 AI 捏捏，刷屏小红书和 TikTok，推动 Pika 用户突破 1100 万。

▲图片来自：Pika

Pika 在模型能力之上卷玩法，切中了一群对整活短视频有高需求的用户，让人人都能低门槛地玩得开心。哪怕这些视频是模板化的，稍纵即逝的，但只要有趣，人们就会蜂拥而至。

同时，Pika 也告诉我们，写不好提示词、脑洞不够大、不知道怎么实现主体的一致性，都没关系，等等吧，很快就有包装好的 AI 特效和模板了。

当 AI 工具承载了更低的下限，那就意味着，只要有想法，每个人都可以将微观的创作欲望落地为现实。保持好奇，保持期待，一瞬间的起心动念，就足以让好玩的事情降临。

AI 提示词，产品高级营销文案生成

DUN.IM BLOG

By: Anonymous

22 January 2025 at 14:28

我们还年轻，可不想看到这个世界处在毫无自由、隐私的边缘。

这可能是我写过的最有趣的几个 Prompt 之一。

第一，这是一条专门用来写高级感文案的 Prompt

它可以根据输入生成很有高级感的文案

还附带一张有设计感的卡片，用来把东西卖得很贵。

第二，这是一条出于实际营销需求诞生，卖了五位数的 Prompt，但是经过甲方同意得以开源。（感谢金主爸爸）

第三，是这条 Prompt 背后的 knowhow 非常有趣。有时候写一条有效的 Prompt 往往意味着透过现象看本质。

先上 Prompt，请使用 Claude 3.5 sonnet 或 OpenAI o1 以获得相同效果。下面是 Prompt：

效果案例 1（该案例致敬法国艺术家的作品「泉」）：

输入：淘宝上下载的小便池图片

AI 提示词，产品高级营销文案生成

输出：

效果案例 2：高达手办（案例来自群友「@温州程序员劝退师」）

效果案例 3：面条（案例来自群友「温州程序员劝退师」）

效果案例 3：马桶搋子（案例来自群友「@温州程序员劝退师」）

效果案例 4：招财猫摆件（顶奢版本）（案例来自群友「@温州程序员劝退师」）

1.来自鲁迅《作文秘诀》

2.来自艺术大师陈丹青

该 Prompt 主要是为了赚钱而生，仅供赚钱与娱乐。

但是，鲁迅的作文秘诀的结尾还有两段话：

「写到这里，成了所讲的不但只是做古文的秘诀，而且是做骗人的古文的秘诀了。但我想，做白话文也没有什么大两样，因为它也可以夹些僻字，加上蒙胧或难懂，来施展那变戏法的障眼的手巾的。倘要反一调，就是白描。

「白描」却并没有秘诀。如果要说有，也不过是和障眼法反一调：有真意，去粉饰，少做作，勿卖弄而已。

祝大家玩得开心！

DUN.IM BLOG
ChatGPT Task – 自动任务，提醒、计划、定时功能发布，实测 5 个场景使用分享
12 January 2025 at 16:47

ChatGPT Task – 自动任务，提醒、计划、定时功能发布，实测 5 个场景使用分享

DUN.IM BLOG

By: Anonymous

12 January 2025 at 16:47

我们还年轻，可不想看到这个世界处在毫无自由、隐私的边缘。

ChatGPT这两天又发布了一个新功能：「Task 〔计划提醒、定时任务生成〕」。

功能的原理很简单，它就只是在原本的对话当中加上一个「计划提醒、定时任务生成」的机制〔支持自动循环〕。于是当我们设置的每天、每周重复时间到的时候，这个 AI 的对话就会根据我们设置好的方式，自动生成一段我们需要的信息内容，如果是在 ChatGPT 的手机 APP 上还会弹出通知，如果是在电脑网页端的界面上对话也会因为更新而排列在前面。

通过 ChatGPT 根据计划自动生成的新内容，我们就可以自动获得需要关注的提醒，或是自动获取需要的信息。它可以应用在什么样的场景上面呢？可以参考下面 5 种使用场景：

下面，我就用这几个真实的场景，详细操作给大家看，看看如何结合目前 ChatGPT 的功能，加上最新的任务提醒，来完成上述各种自动提醒的工作、学习流程需求。

目前这个「任务提醒」功能还在 Beta 测试版，并且只对付费版的 ChatGPT 用户开放，不过未来这个功能也会开放给所有用户使用〔包含免费的账户〕。

让我们先从这个基本应用，看看 ChatGPT 的「Task 」功能如何操作。

首先，我们要把 AI 模型切换到「含计划任务的 GPT-4o」。

接着，我们在指令的开头加入「要重复的时间，与指定生成的任务」，就能启动「Task 」。例如我想要一个固定时间自动查找网页文章综合报道的摘要信息，我就这样下指令即可：

设置的「Task」时间到的时候，ChatGPT 就会自动根据我的指令上网查找，摘要出我需要的一篇综合新闻报道。

我们可以点进某一个「Task」的设置界面，这里可以修改自动任务名称、提示词，以及修改自动循环的时间。

我们也可以在「 https://chatgpt.com/tasks 」页面查看自己已经设置的所有自动任务。

每个任务建议使用专门的会话，可以使用「Task」设计早上、中午、晚上三个时间，分别生成国际、国内、休闲娱乐的摘要报道，快速掌握一天需要的信息。

掌握基本功能后，例如我有一个专门了解各种生活健康知识的 ChatGPT 会话，我现在可以在这个对话中设计一个「习惯养成提醒」，请他每天固定时间告诉我一个关于降低体脂、提升骨骼肌的具体建议，并用鼓励的话引导我今天马上可以行动。

通过习惯养成提醒每天的自动建议，就像是一个简单的「健康 App」一样，一方面每天学习习惯养成的知识，一方面每天进行行动提升。

如果我的需求需要改变，也可以随时回到设置中修改指令、生成时间，让养成习惯的过程，有一个自动提醒每天鼓励我去执行。

如果我正在学习某个领域、主题的新知识，那么除了建立一个对话与 ChatGPT 一起学习，我还可以设置一个专属自己的知识媒体总结，要求每天在固定时间生成一篇信息资料，提供给我新知识的信息。

指令：

然后 AI 第一篇给我的文章是番茄时钟工作法的介绍，写得还不错，我们可以利用 ChatGPT 上的「Read aloud」功能，让 AI 把这篇文章朗读出来。

这样是不是像一个自动帮助我们学习的 AI Podcast 呢？

如果利用这个功能来协助项目的推进呢？

例如我想持续写作的习惯，于是我请他每天固定时间，用我指定的逻辑，提供给我一篇可以延伸思考的文章题目，并且提供大纲建议。

于是在 AI 每天持续提供一些草稿建议下，帮助我在项目运行过程有持续的新刺激，更有动力保持项目的推进。

我最近常常利用 ChatGPT 来帮助我读一些原文书，有时候请 AI 翻译，有时候请 AI 整理笔记。

于是我想到，如果我在这个已经累积了数万字原文书阅读对话的对话中，请他每天固定时间，从前面资料中挑出一个重点帮助我复习呢？

指令：

效果还不错，他真的可以每天从前面对话的大量资料中，挑出一个具体重点，帮我做出特定的复习。

如果我们持续学习某种语言、知识主题，就可以善用这个 ChatGPT「Task」功能，自己设计每天的自动复习内容了！

以上就是我目前测试出来的几种应用方式，提供给想试试看 ChatGPT「Task」功能的朋友参考，也欢迎跟我分享你的应用方式。

VidPic – 免费在线图片制作视频工具，简单快捷无需登录

DUN.IM BLOG

By: Anonymous

10 January 2025 at 14:59

我们还年轻，可不想看到这个世界处在毫无自由、隐私的边缘。

VidPic 是一款免费在线工具，主要功能是将图片和音乐合成为视频，也能加入字幕、预先调整尺寸，只要几分钟即可快速把图片转换为高清视频格式！VidPic 本身具有中文在内等多国语言界面，操作上也很简单，几乎不用花太多时间就能轻松操作，算得上是很方便的免费工具。

VidPic 最大特色是所有操作过程都在本机浏览器上进行，因此不会有任何图片或音乐被上传到远程服务器，极大程度保障资料隐私和安全性，接下来就介绍这项服务的实际操作方式。

VidPic 是一款免费在线工具，支持将图片和音乐合成视频，无需下载或登录，快速生成高质量短视频！

进入 VidPic 网站后先从右上角切换语言，从上面的链接连到 VidPic 默认会是中文。

点击中间的上传框、选择要制作成视频的图片，可一次选择多张图片〔批量选择〕，支持 JPEG、PNG 和 WEBP 格式。

接着照片就会变成视频显示于 VidPic 编辑页面，下方有一排主要功能，包括：添加图片、设置背景音乐、设置视频尺寸、编辑字幕和下载完成的视频，若要加入更多图片可点击第一个按钮。

VidPic – 免费在线图片制作视频工具，简单快捷无需登录

下方会看到视频内的每张图片出现顺序，可以自由调整顺序或是删除。

每张照片会有一个固定的显示时间长度〔默认 2 秒〕、使用「淡入淡出」过场效果、过场时间 0.5 秒，试着预览播放视频就会知道制作出来的效果。

利用 VidPic 制作出来的视频很像照片幻灯片，很适合用来展示大量的图片，值得一提的是有不少可选用的过场效果，当然，这些都是免费、没有隐藏费用也不需要订阅。

将图片制作成视频后，也可以加入背景音乐，使视频看起来更活泼生动，点击「设置背景音乐」后就能加入音乐文件。

进入「设置视频尺寸」后可以预先调整视频尺寸大小，默认是平均宽高，会直接使用图片尺寸带入视频的长度、宽度，亦可调整为指定宽高、指定比例，设置图片平铺方式和填充颜色。

点击视频尺寸设置的「指定比例」计算方式，可以调整成不同的视频比例，例如 16:9、1:1、16:10、4:3、9:16 或是 3:4 等选项。

VidPic 还有加入字幕的功能，可以在浏览器内对视频的字幕进行编辑，也支持导入导出功能。

设置过程可以随时回到视频播放器，点击「播放」按钮来预览视频实际效果。

最后，点击右下角「下载视频」按钮就能将转换、制作完成的视频保存起来。

Aux Machina – AI 驱动的免费图片生成工具，简单高效神器

DUN.IM BLOG

By: Anonymous

28 December 2024 at 15:11

我们还年轻，可不想看到这个世界处在毫无自由、隐私的边缘。

Aux Machina 是一款由人工智能 AI 技术驱动的图片生成工具，协助设计师、运营人员和内容创作者快速、轻松地创建设置视觉内容，以往常见的图片生成器大多使用提示词〔Prompt〕来描述要生成的图片，Aux Machina 提供用户上传图片来制作类似结果，再利用文字描述对生成后的图片进行微调，最终生成令人惊叹的视觉效果。

Aux Machina 将这样的流程简化，直接上传图片后就可以快速生成四张相似、但又不太一样的结果。此外，也能够以关键词查找网络上的图片，再将它加入 Aux Machina 以生成近似的图片。

Aux Machina 在操作上也很容易，用户必须先注册账户〔免费〕，就能在免费试用方案下生成图片，每月最高的生成数量为 100 张图片，可使用于商业用途，若有更多生成需求可付费升级 Pro 方案或购买单次付费，不过当前服务的计价方式尚未很完整，有兴趣的朋友就先去试玩一下吧！

No Description

进入 Aux Machina 网站后点击右上角「Try for Free」，接着会看到注册、登入页面，推荐直接使用 Google 或是 Facebook 账户注册登入即可，完全不用经过任何验证。

关键词查找图片

登入后就会看到 AI 图片生成工具，先介绍第一种方法，直接输入关键词查找网络上的图片〔下方有 AI 图片生成器服务列表，不过在免费方案只能使用 Berserq 无法选择其他服务〕。

点击图片右上角「爱心」后再点击下方工具栏的「Generate」就能以 AI 生成相似的图片结果。

Aux Machina – AI 驱动的免费图片生成工具，简单高效神器

以图生图功能

另一个「以图生图」方式是点击查找栏位右侧的「相机」图标，会出现上传图片的功能，支持 JPEG、PNG、WEBP、AVIF、JFIF 五种图片格式。

把要生成的原始图片拖曳后点击「Upload Images」上传。

设置细部调整

Aux Machina 就会以 AI 人工智能技术生成四张类似、但又有一点不太一样的图片。

下方会有一个「Want to make changes?」功能，可以在选择图片后输入描述、对画面进行细部修改编辑。

下载与使用图片

将光标移动到图片上方，点击右下角「Download」就能下载、保存图片，以 AI 生成的图片素材可自由使用于个人和商业用途，无需标示出处来源，也不用担心会有侵权问题。

Aux Machina 网站有提到未来还会加入更多 AI 辅助图片工具，例如：更换背景、影像变化、图片文字编辑、图片分辨率增强、去除背景、转为草图、魔术橡皮擦或是转向量图等等，不过目前的图片生成器已经很有用，若有需要各种图片素材的话可以使用它进行生成。

DUN.IM BLOG
tldraw computer – 画张流程图轻松打造 AI 自动化任务实测指南
22 December 2024 at 14:33

tldraw computer – 画张流程图轻松打造 AI 自动化任务实测指南

DUN.IM BLOG

By: Anonymous

22 December 2024 at 14:33

我们还年轻，可不想看到这个世界处在毫无自由、隐私的边缘。

你是否因为不会写程序，总觉得无法打造自己的自动化工作流程？每次设置 AI 工具都需要大量手动操作，效率难以提升？试试看一个实验性的新工具：「tldraw computer」，通过直觉的流程图设计，就能将繁琐 AI 指令与工作流程视觉化，打造高效率的 AI 自动化系统！

一开始使用 AI 〔指得是 ChatGPT、 Google Gemini 这类工具〕，我们可能会问：「生成一个某某主题的报告。」但当继续深入使用，真的把 AI 当作工作辅助工具，就会发现这样简单的提问是不行的，我们需要把任务「切割成」不同步骤，一个阶段一个阶段让 AI 处理，然后通过反问讨论，整合出最终更好的内容。

这时候，我们要请 AI 生成报告草稿，可能会先请 AI 设置 TA、痛点，再请 AI 做资料研究、摘要，然后请 AI 根据资料思考出更好的报告论述逻辑，然后才请 AI 根据这样的逻辑与资料，最后总结出一个更深入的报告大纲。

那么，如果上述的操作流程，可以用「视觉化」的流程图规划出来，然后 AI 就会自动跑完所有流程，生出我们需要的成果呢？这就是今天分享的这个最新 AI 工具：「tldraw computer」所具备的独特功能。

「 tldraw 」是很知名且好用的在线流程图工具，不过她们最新推出的「 tldraw computer 」AI 功能，不是要帮我们画流程图，而是让我们用简单好上手的流程图，规划出自己想要的 AI 自动化工作流程，打造一个可以根据更复杂逻辑生成报告、文章、设计图、声音文件的 AI 自动化助手。

「tldraw computer」内核特色：

「tldraw computer」用途：

我们先来看看「tldraw computer」这个工具可以完成什么样的应用案例，分享一个简单版实例：我自己常常会需要把拍照扫描的纸张图片，转换成一个有效的文字内容，就利用这个工具来建立一个快速扫描与修正文字的 AI 工具。

我可以在「tldraw computer」流程图上设置一个上传图片的卡片框，然后拉一条连接线。接着在一个 AI 的指令框框里，输入我希望用什么样的逻辑来识别图片并修饰文字。然后接下来我再拉一条连接线，设置一个输出的文字框，让 AI 可以把完成的结果输出到这里。

而在使用的时候，我就只要在「第一步：上传图片的卡片框」把图片上传，按下右上方的播放启动按钮。这时候，这个工具就会自动跑流程图上的步骤，把扫描出来的文字转换成我需要的内容。

「tldraw computer」目前使用的 AI 模型是 Gemini，看起来无论是中文的文字还是手写字，都能够非常有效的识别完成。

tldraw computer – 画张流程图轻松打造 AI 自动化任务实测指南

接下来我们来看一个比较进阶复杂的应用案例。我想让 AI 帮我写一篇文章的草稿，但是就像前面提到的，直接让它撰写通常不会有很好的结果。

所以我利用「tldraw computer」工具画出一个文章产出的工作流程图。在流程图的一开始，我利用两张绿色的卡片，让我可以自己简单的设置这篇文章要解决什么 TA 问题，以及这篇文章想要采用什么方法论来解决问题。

接着，我开始用「tldraw computer」流程图展开我希望 AI 一步一步处理的自动化步骤。

首先，我利用红色的卡片设计 AI 处理的指令，请 AI 根据我的 TA 问题，写出一段有效的痛点描述。接着再请 AI 利用我想要介绍的方法论，写出一段这个方法论的重点思维基本背景的介绍文字。

但是，这样还不够。我继续往下画流程图。我让 AI 根据他自己输出的 TA 痛点以及方法论的重点，重新思考，拟出文章最好的架构。这个架构需要具体，有操作步骤，而且每个方法、每个步骤都要尽量有深入的诠释。

然后接下来，我让 AI 一步一步的把这篇文章往下扩展，有了文章的架构之后，我再请 AI 从这个架构出发，让这篇文章有一个完整的故事开场，有方法论重点，也有具体操作步骤，把前面的内容做一个有效的并且延伸插件的整合。

最后，我再画出下一步的 AI 流程图。我请 AI 用惯用的语言，用口语更亲切的方式来润饰改写它产出的文稿，输出一个解决痛点、介绍方法的一篇中文文章草稿。

甚至我可以再继续往下拉出下一步的流程图，放上一张声音的输出卡片，让 AI 把这篇文章的草稿转换成一个精简扼要的介绍音频文件。

有兴趣的朋友，可以看看我完成的这个 AI 自动化的工作流程图，看看上面的内容：https://computer.tldraw.com/t/szQY1iuGZCHAEmwzFASShH〔网址可以查看生成结果，如果要试用这个 AI 自动化流程工具，需要注册一免费账号。〕

当我有了这样的一个自动化的工作流程图，以后我只要每次回头修改一开始的两张绿色卡片，后面 AI 就会像刚才一样，自动跑完我已经设计好的工作流程，一步一步的去设计结构，推演文章进行润饰，甚至最后产出声音文件。我可以立刻获得最后输出的文章草稿以及声音文件的结果。

看完两个具体案例，最后我来分享「tldraw computer」如何操作？

先注册一个免费账号，建立一个 AI 自动化工作流程〔图〕的项目。

A computer by tldraw.

建立 AI 流程的基本逻辑是：输入、〔AI〕处理、〔AI〕输出。

掌握上面这个逻辑，你就能快速设计出一个有效的 AI 自动化工作流程。

首先，我们要设置「输入」内容的填写框，这是 AI 工作流程的起点，就像是要告诉 AI 目标、结果、资料的意思。

在「tldraw computer」中，利用 Text 或 Image 等卡片，可以设置输入文字、上传图片的填写框，作为启动流程的起点。

接着，我们要告诉「tldraw computer」如果去处理输入的内容，这时候从输入内容的卡片，画出连接线，连接到「Instruction」这个卡片上，然后在「Instruction」中说明希望 AI 如何处理内容的指令。

「tldraw computer」会根据我们简单的指令，自己做优化，让 AI 处理内容的结果更好。

然后，我们继续从「Instruction」卡片画出连接线，这时候可以连到 Text、Image、Speech、Website 等卡片，代表要让 AI 处理后，输出什么格式的内容。

重复上面：输入、处理、输出，三阶段流程，我们就可以串联出一个更复杂的 AI 自动化工作流程。

通过流程图的规划方式，我可以继续推进下一步的 AI 处理流程，甚至利用连接线把不同段落的内容连接到需要的步骤上，建立我自己需要的工作步骤。

最后，「tldraw computer」也提供了一些辅助功能，让设计这样的流程图更简单。

例如有一个启动按钮，让我们到时候只要按下启动，后面的 AI 流程就会自动跑完。

或是像流程图一样可以设置大小颜色，这样帮助我们分辨流程图中不同的卡片类型。

「 tldraw computer 」还有不少高级功能，有兴趣的朋友可以进一步玩玩看。

整体来说，「tldraw computer」是一个强大且易上手的自动化工具，让我们能够轻松打造自己的 AI 流程，推荐大家试试看。

BlinkShot – 开源免费 AI 图片快速生成工具

DUN.IM BLOG

By: DUN

15 December 2024 at 17:12

我们还年轻，可不想看到这个世界处在毫无自由、隐私的边缘。

BlinkShot 是一个以 AI 人工智能技术即时生成图片的免费服务，这是开源项目，背后使用 AI 加速云服务「Together AI」和图片生成模型 FLUX，这项服务特性是能在非常短的时间内依照输入的提示词生成各种图片，以毫秒为单位，生成的图片也丝毫不逊色，有兴趣的朋友可以玩玩看。

目前 BlinkShot 支持英文提示词，也可以直接叫 AI 服务帮你生成〔例如用 ChatGPT 或其他同类型服务〕，另一个方法是使用图片转文字 AI 工具，例如：Image to Prompt等工具，将喜欢的图片快速转换为英文提示词，最后稍作修改再生成想要的图片。

BlinkShot 目前没有使用的生成数量限制，还有个「Together API Key」栏位可自定义自己的 API 密钥，生成的图片素材皆可免费下载使用，AI 图片基本上也不会受到版权限制，使用于个人或商业用途都没问题。

Generate images with AI in a milliseconds

进入 BlinkShot 后直接输入提示词就会立即生成图片，整体速度非常快，过程中如果继续输入其他形容或是提示词，图片会即时更新，相较于其他同类型的 AI 图片生成器来说确实非常强大！

下方会显示生成的图片历史记录。

通过 BlinkShot 生成的图片看起来很逼真，也能依照用户需求调整成各种风格、样式，越仔细的提示词就能生成更细致准确的结果。

生成过的图片历史记录会显示于下方，可以随时切换回去查看。

在图片点击右键即可下载保存。

在图片上点击鼠标右键、选择「另存图片」后将图片保存下来即可使用。

BlinkShot 未来也会加入下载按钮，让用户更方便获取图片。