Reading view

There are new articles available, click to refresh the page.

ChatGPT Canvas 全新 AI 写作、源码、文本编辑工具，功能测试

2 October 2024 at 14:47

chatgpt 最近推出会主动思考推理的「 o1-preview 」，以及更即时、自然的「高级语音对话模式」后，今天又再次推出新功能：「ChatGPT Canvas」，这是基于 GPT-4o 架构开发的全新 ai 写作、源码编辑界面。让 ChatGPT 不再只能对话，而可以进行更深入、准确的内容创作工作。

第一波更新中，ChatGPT Plus 和 Team 用户会先获得 Canvas 功能，而全球的企业和教育版用户将会在下周获得使用权限。并且 openai 还计划在 Canvas 正式发布后，向所有 ChatGPT 免费用户开放这项新的人机协作界面。

实际测试后，我觉得可以把「ChatGPT Canvas」想象成一种 AI 文本、源码软件，在这个工具中，人和 AI 可以更有效率的协作，共同编辑更好的内容成果。

以前的 ChatGPT 是即时通，一切内容要在对话中生成，也只能用对话引导 AI 去生成、修改，这很多时候会有点麻烦，常常在问答的过程偏离主题，难以指定要修改的部分，容易愈改愈乱，再也回不去之前更好的版本。

但是「ChatGPT Canvas」能够解决上述问题，它让人与 AI 在一个类似文本编辑的界面中讨论，就像多人一起编辑一份在线文件那样，可以一起处理文字、源码内容，可以针对任何指定段落修改，能够整合人与 AI 各自编写的内容，最后一起合作完成一份文本。

于是， ChatGPT 不再只是「对话软件」，而可以当作真正的「AI 文本内容、源码内容编辑器」，你可以利用来处理下面的工作流程：

在这篇文章中，我通过一个完整的写作实测案例，带大家了解 Canvas 的操作流程、快捷功能以及它如何帮助创作者解决具体问题。

在 ChatGPT 的 AI 模型中切换到「GPT-4o with canvas」模式，下面我测试看看利用这个新界面编写一篇文章。

首先，我先利用原本常用的 AI 指令结构，结合我的想法草稿，请 ChatGPT 改写成一篇完整的文章内容。

ChatGPT Canvas 全新 AI 写作、源码、文本编辑工具，功能测试

当 AI 开始编写文章草稿，或是源码时，「GPT-4o with canvas」就会像是下图这样，进入独立的文件编辑界面。

进入独立的 Canvas 编辑界面后，最大的优点就是，我们甚至可以直接在上面修改 AI 生成的文章内容。

于是这样一来，可以实现更流畅的「人与 AI 的协同写作流程」。

以前 AI 生成的内容，我们有不满意的地方，无法人为的介入修改，只能让 AI 自己去改，而常常愈改愈乱。

现在， AI 生成的草稿，我可以直接在编辑界面介入，修改成我觉得更好的版本，然后再请 AI 接续调整，实现真正的人与 AI 协同合作。

「GPT-4o with canvas」不只可以修改内容，也可以调整粗体、标题样式，就像是一个结合 AI 功能的简易 Word 编辑器，还支持 markdown 编辑格式。

以文章写作的 ChatGPT Canvas 界面为例，编辑界面右下方会出现一排「快捷功能菜单」，文章写作、源码编辑会有不同的对应菜单。

「快捷菜单」中有很多默认功能，可以快速修改整篇文章、源码的内容。

例如其中有一个「阅读等级」的调整按钮，可以把文章的内容改成从小孩子到博士等级的不同风格与深度。

下面是一篇我让 AI 改写的、文章，我让 ChatGPT 把原本相对专业的文章内容，改成适合小朋友阅读的版本。

而下面是同一篇第二大脑的教程文章，我让 ChatGPT 把原本相对口语的草稿，改成更精炼、专业的文章风格。〔可以跟上面的小朋友版本进行比较，都是同一篇草稿的不同阅读等级修改。〕

通过快捷功能，一个按钮就可以快速转换我们需要的文字深度与风格。

以文章编辑界面为例，具备下面几种快捷功能：

下图是按下「建议编辑」后，ChatGPT 针对不同段落提供的编辑建议，我只要按下允许，就可以让 AI 直接进行修改。

这是不是跟以前的对话生成内容有很大的不同？现在 ChatGPT 可以针对一篇长篇文章，提供各种分段的调整、建议与修改。

除了整篇文章的快捷修改、建议外，在「ChatGPT Canvas」的编辑界面中，我可以任意圈选一段觉得有问题的段落，这时候会浮现「Ask ChatGPT」的按钮，点击后，我可以输入这一段的修改建议，让 ChatGPT 去进行指定段落的调整。

这是不是很像我们在 Google 文件上提供伙伴文章修改建议？只是这一次，AI 成为我的伙伴，听从我的指令去修改。

更棒的事，在「ChatGPT Canvas」中不用再怕 AI 修改内容后，回不去之前可能更好的版本。

因为在编辑器中，自带了可以还原之前版本的功能，而且不只可以还原到前一个版本，也可以回到上上版、上上上版，或是跳回最新版本。

经过简单的文章写作实测，我们可以看到 ChatGPT Canvas 的可能性，它突破了传统 AI 对话生成文本的限制，将人机协同的创作流程无缝结合，无论是在写作还是程序设计的应用场景中，Canvas 以更灵活的编辑能力和快捷的功能，帮助用户实现了更精准、有效的工作流程。

对于我相对熟悉的文章创作者而言，ChatGPT Canvas 不仅提供了文稿即时的优化、编辑建议，还能调整文本的阅读等级和风格，帮助你快速针对不同的受众进行调整。而对于程序员，Canvas 的源码审查、注解添加与错误修正功能，让程序开发过程变得易于维护。

这样的功能让人与 AI 之间的互动变得更具深度，不再只是被动地接受 AI 的生成内容，而是能主动参与其中，实现真正的协同创作。

无论你是需要改进写作的创作者、需要帮助调试的程序员，还是想要在教育中使用 AI 辅助的教师或学生，ChatGPT Canvas 都是一个值得一试的工具。

Google NotebookLM 更新：用 AI 研究英文 YouTube，批量获取整理视频、音频内容

DUN.IM BLOG

Anonymous

30 September 2024 at 13:12

我们还年轻，可不想看到这个世界处在毫无自由、隐私的边缘。

Google NotebookLM 是一个强大的工具，可以让我们上传各种不同内容，建立属于自己的 ai 数据库。通过这个工具，我们可以用自己专属的文件、PPT、网页、文章，让 AI 生成各种新的报告、文案、文章，甚至是客服解答。

这个工具让很多团队和公司都觉得非常实用。比起从别人的数据库中生成内容，直接从自己的专业文件与专属知识中获得 AI 回应，对工作的应用性来说更有效。

google NotebookLM 推出了一个全新的升级，比前阵子推出的生成英文 Podcast 更实用！

现在它可以支持上传「youtube 视频」，和上传自己的「录音文件」，让你用更多不同的内容建立属于自己的 AI 数据库。AI 会自动分析 YouTube 视频的字幕，并将录音文件转成各种语言的字幕，从而帮助你生成所需的内容。

这次升级带来了许多新的应用可能性，例如：

Google NotebookLM 原本已经支持上传 pdf、Google 文件、简报和网址进行分析，而现在更加入了 YouTube 视频和录音文件的支持。无论是中文、英文、日文等多国语言，NotebookLM 都能进行高效的 AI 整理与生成。

接下来，我通过图文介绍，分享这些新功能的实际使用方式。

打开「 Google NotebookLM 」，建立一个新的笔记本，然后就可以上传各种文件、文件、影音内容。

而在这次更新中，上传的内容增加了「YouTube」与「录音文件」两种选项。

Google NotebookLM 更新：用 AI 研究英文 YouTube，批量获取整理视频、音频内容

上传 YouTube 时，其实就是贴上 YouTube 视频的网址即可。

Google NotebookLM 不支持某些视频，例如没有字幕、不公开、最近才上传的视频，都可能导入失败。

我把自己收集的大量跟「个人知识管理系统」有关的英文 YouTube 视频，全部上传到 Google NotebookLM，立刻整理成「中文」的第二大脑学习笔记内容。

看起来效果还算是精准有效。

也可以把 YouTube 视频，跟其他的文件、网页文章，全部一起上传到同一个数据库。

AI 生成的内容与回答，也会从数据库的不同视频、不同文章多种不同内容，整理出答案，引用不同形式的参考资料。

也就是说，现在文字、视频、声音内容，都可以在 Google NotebookLM 的同一个数据库中进行解析，让 AI 同时分析多种内容形式，生成更有效地回答。

AI 问答时，针对 YouTube 视频，AI 会抓出视频的字幕进行解析与诠释，回答时也会引用视频内容，我们可以看到视频完整的字幕稿，以及跟答案有关的引用部分。

另外这次升级，Google NotebookLM 还推出了一个更实用的更新，就是可以上传录音文件，解析出完整字幕〔中文也支持〕，并进行知识问答或整理。

下面是我把一个 40~50 分钟的录音文件上传，解析出的完整字幕内容。

字幕本身不算很完美，但理解内容没问题，更重要的是，这些录音字幕，就可以变成 AI 未来生成我需要的内容的素材。

例如我上传很多次很长时间的会议录音文件，问他会议中的某个重点：

Google NotebookLM 就可以正确的挑出示哪一个会议录音文件的哪一段内容，提供回答，也可以在引用中直接让我跳到该次会议的录音字幕段落！

我也可以汇整一个项目多次的会议录音文件，请 AI 根据会议录音文件撰写报告、文案，Google NotebookLM 也表现得还不错。

或者，我之前常常提到，我喜欢用说的把想法讲出来，再看怎么语音转文字，变成报告或文章的草稿。

在 Google NotebookLM 中，我现在可以更自在地先把想法完成的录音下来，把录音文件上传，让 NotebookLM 整理杂乱想法，引用原文，改写成通顺文章。

Google NotebookLM 的最新升级让它成为学习与工作上的强大工具，特别是支持 YouTube 视频和录音文件的上传与解析！

无论是学习英文视频、整理会议录音，还是将录音内容转换成报告和文章，Google NotebookLM 都能以有效帮助我们处理繁琐的资料，并生成实用的 AI 回应。

通过整合多种语言与多形式内容〔文章、PDF、简报、网页、视频、录音等等〕，Google NotebookLM 这个工具让学习和工作流程变得更聪明，无论你是学生、老师、职场专业人士，还是创作者，NotebookLM 都是一个值得试试看的 AI 助手。

Claude 3.5 VS ChatGPT-4o 生成 Web 小游戏实测对比

DUN.IM BLOG

Anonymous

19 June 2024 at 20:57

我们还年轻，可不想看到这个世界处在毫无自由、隐私的边缘。

经过了一年的时间，Claude 从 2.0 版陆续升级到 3.5 Sonnet 版本〔2024/6〕，在 Claude 3.5 Sonnet 中推出了几个显而易见的改进：

你只要免费注册登入一个「 Claude 」账户，就能开始使用最新的 Claude 3.5 Sonnet 模型，然后别忘了进入「Artifacts」功能，试试看直接在对话中生成你需要的网页小工具、小游戏，乃至于简单的 PPT。

下面我会实际测试这些成果，并且与 chatgpt 制作出来的版本做对比，提供有兴趣的朋友参考。

我用下面这个共同指令，来测试看看 Claude 3.5 与 ChatGPT-4o 是否可以「直接」做出可用的乱序抽签网页小工具。

让我先来试试看 Claude 3.5 Sonnet 结合「Artifacts」的效果。直接输入上面的指令，Claude 就会分析我的需求，开始撰写源码，并立即生成可以预览、互动的 HTML 文件，而右边窗口可以直接进行操作。

看起来 Claude 3.5 Sonnet 只要简单的指令，就能很好的理解我的需求，并且可以自己设计需要的架构与源码，我并没有讲得太细，实际呈现出来的效果都是 Claude 3.5 Sonnet 自己分析出来的。

接着我们试试看 ChatGPT GPT-4o 做出来的成果如何？用同样的指令，ChatGPT 也可以根据我的需求自行分析网页需要的架构、逻辑，然后自行写出源码。

不过，ChatGPT 目前没办法像 Claude 那样在右方直接预览成果。

所以我请 ChatGPT 直接打包成 HTML 文件让我下载。

下载后，下面是 ChatGPT 制作出来的版本。界面与操作也很不错，并且自己加上了一个可以设置数字范围的额外字段。

和 Claude 3.5 Sonnet 版本对比，你觉得哪一个比较好呢？

接着，我测试了设计贪吃蛇网页小游戏，用下面的指令，直接套用在 Claude 和 ChatGPT 上。

把指令输入 Claude 3.5 Sonnet，同样的，AI 自动分析需要的架构、逻辑，一次问答，就生成出右方一个可以操作互动的贪吃蛇小游戏。

游戏中可以用键盘控制方向，有吃球长大的效果，也有失败的机制，是一个可玩的小游戏。

同样的指令输入 ChatGPT GPT-4o，ChatGPT 这次写出一串很长很长的源码，我同样请其直接打包成 HTML 文件给我，同样是一次生成，中间没有经过任何修改。

下面是 ChatGPT 制作出来的贪吃蛇小游戏，多出了一个「控制游戏快慢」的功能，而其他部分则和 Claude 的效果一样。

从前面两个实际测试案例来看， Claude 3.5 和 ChatGPT-4o 都能「一次生成」上述的网页小工具、小游戏，他们都会完整的分析我的需求，AI 自行进行需要的设计逻辑分析，然后自动写出完整的源码。

不过 Claude 3.5 Sonnet 多出了一个 Artifacts 功能，可以直接在右方预览效果，确实看起来很方便，如果要进一步修改，也会更加简单。

例如，我下面尝试让 Claude 3.5 Sonnet 制作 PPT，我先提供一些资料，请 AI 设计大纲并产出 PPT，Claude 3.5 Sonnet 就制作出一个可以在右方预览的版本，而且是真的可以翻页。

但我想调整风格，所以我上传一张风格图片，请 Claude 3.5 Sonnet 分析，并据此改变 PPT 风格，没想到效果居然非常好！〔如下图〕

看起来「 Claude 3.5 Sonnet」结合 Artifacts，确实值得要对源码、网页、文件有需求的朋友试试看。

Stacher – 基于 yt-dlp 的免费跨平台视频下载工具，支持几乎所有视频音乐平台

DUN.IM BLOG

Anonymous

22 May 2024 at 14:26

Stacher – 基于 yt-dlp 的免费跨平台视频下载工具，支持几乎所有视频音乐平台

Stacher 是最近新问世的免费网络视频下载工具，支持 windows、macos 和 Linux，本身也是知名开放源码项目 yt-dlp〔由 youtube-dl 分支〕图形化界面〔GUI〕版本，大家都知道 yt-dlp 是终端里的下载工具，使用上会有一定的门槛，将它套用图形化后操作界面后就会更符合大众使用，支持超过 1200 种网络服务，之前曾介绍过的类似软件还有「Hitomi Downloader 」和「Seal」。

Stacher 已经有针对 Windows、mac 和 Linux 三大操作系统推出对应的版本，只要从官方网站找到需要的版本后下载即可使用，本身没有自带中文界面，但在操作上不会困难，只需要将视频网址复制、粘贴后就能获取文件，也能够选择各种常见视频、音频格式。

利用 Stacher 可以下载 YouTube、facebook、Twitter、Instagram、TikTok、Bilibili、Pornhub 等网站视频，在使用时没有太多复杂难懂的设置，也支持包括 3GP、AAC、FLAC、FLV、M4A、MP3、MP4、OPUS、VORBIS、WAV、WEBM 等格式，最简单的方法就是维持默认值「最佳画质 + 音频」，就能获取包含影像、声音的视频文件咯！

值得一提的是 Stacher 还能针对要下载的平台提前设置账号密码，也有设置浏览器 Cookie 选项，无论是遇到任何状况只要适当设置应该都能顺利获取视频，如果平时会需要从网络平台储存视频的话可以试试看。

其他 YouTube 网络视频下载工具整理：

Stacher. A youtube-dl frontend.

进入 Stacher 网站后跳到下载区，选择要下载的应用程序版本，支持 Windows、macOS 和 Linux，要注意的是都只适用于 64 位操作系统。