Normal view

There are new articles available, click to refresh the page.
Before yesterdayMain stream

扣子空间网页设计,是在挑战 V0 吗?

24 July 2025 at 14:16

一、

扣子(coze.cn)大概是字节旗下最不好定义的产品。

它的定位是智能体(AI agent)平台,可以开发/运行各种 AI 应用。这意味着,AI 可以干的事情,它都能做。

但是,AI 一直在进化,所以扣子的形态也一直在变。

一开始,扣子是面向程序员的开发平台。它有工作流模式,在图形界面上拖拉节点,定义 AI 工作流,生成应用。

但是不久后,它又推出了"扣子空间",面向普通用户,使用自然语言,调用它内置的各种智能体。

我写过测评,把它当成办公助手,完成各种任务(PPT 生成、旅游地图规划、写研究报告等),完全是傻瓜式操作。

可是没有想到,昨天我发现,扣子空间加入了网页设计,又变成了 UI 工具,很像内置了一个 V0。

二、

V0 是最早的、也是目前最有名的网页设计/生成方面的 AI 工具。用户描述想要什么网站,它来实现。

这一次,扣子空间引入了这个功能,让自己又多了一种产品形态----网页设计工具。

现在,你完全可以在扣子里面,进行网页开发。而且,它是免费服务,并有安卓客户端(已发布)和 iOS 客户端(待发布),可以在手机上操作。

这听上去很吸引人。我试了一下,比如截图还原和网站生成,尤其是 Figma 设计稿的还原,看看它到底行不行。

下面就是我的试用体会。

三、截图还原

我首先测了截图还原,上传一张网页截图,让它把页面写出来。

扣子的网页设计功能,必须打开扣子空间的"网页"按钮。

我上传了 airbnb 的首页截图(下图),并输入"把这个截图还原成网页"。

系统提示,需要3到5分钟思考,代码在页面右侧滚动生成。

几分钟后,代码生成完毕,切换到预览页,下面就是它生成的页面。

这是第一次生成的结果,没有经过调整,我觉得还原度还可以,页面结构和每个区域都正确复刻出来了。

分享出来了,这个页面和整个 AI 对话,大家点击进去,可以看清晰效果。

值得一提的是,扣子生成的是 React + Tailwind 项目,可以整个下载到本地,用 npm 运行。这样的话,后期的手工处理比较方便。

四、Figma 设计稿还原

扣子空间的真正杀招是从 Figma 设计稿生成网页

具体做法是先在提示框,点击下方的 Figma 按钮。

网页会提示你,输入 Figma 链接。

这个链接怎么得到呢?在 Figma 网站的工作区,选中一个页面,打开右键菜单"复制粘贴/复制选区链接"(下图),就可以了。

我选了一个 Figma 官网的示例文件,把链接发到扣子空间。大家看看扣子的还原度

基本上,跟设计稿很接近,还原度非常高。所以,如果有设计稿原始文件,通过 AI 工具,完全可以替代手工开发。

这属于高级功能,国内其他 AI 工具,我好像没见过,在 V0 也是需要付费的。

五、可视化编辑

预览生成后,扣子空间提供了可视化编辑,修改起来相当方便。

先在预览界面,打开"编辑"按钮。

然后,选中页面元素,就会跳出 AI 对话框,你可以用自然语言编辑。

选中按钮后,我要求 AI 将按钮的背景色改成绿色(上图),提交后就会重新生成代码(下图)。

六、零基础生成网站

下面我直接用自然语言,跟 AI 描述需求,让它生成网站。

我让它生成一个待办事项(Todos)应用。

"生成一个蓝色主题的待办事项列表应用,并实现编辑功能,可以编辑列表任务。"

扣子空间就开始自动完成页面设计、代码编写、服务器部署,最后给出了下面的效果

这个页面还可以部署成可访问的链接,向外部用户公开。

我觉得,效果相当不错,各项操作(添加任务、编辑任务、删除任务)都没报错,一次生成就能运行,该有的按钮也都有。

这真的超出了我的预料,是不是扣子对常见任务做过特别训练?

理论上,网站生成不需要专业知识,零基础用户就能生成全站。实际操作也确实是这样,就算出现报错,也可以交给 AI 处理。但前提是只限于简单互动的网站,如果需要 JS 脚本处理复杂交互,就很可能出现 AI 解决不了的报错。

七、总结

上面就是初步的使用感受。

我感到,扣子空间的网页设计功能虽然刚上线,但是完成度很不错

它的三个重点功能----设计稿/截图还原、可视化编辑、网站生成----相当好用,生成质量完全可以接受,加上免费,我觉得很有竞争力。

它同样也有一些使用限制。

(1)没有命令行窗口。如果你不需要 UI,只让它生成后端代码,它没有提供命令行,无法测试。

(2)未集成 GitHub。它无法将代码直接跟 GitHub 同步,只能先下载到本地,再手动推送到 GitHub。

(3)不适合复杂的状态管理。它的强项是 UI 生成,不适合复杂的状态管理和交互逻辑。

总体上,这次更新让扣子空间变得更有用了,除了早先的聊天功能、办公功能,现在又增加了网页设计,实用性更强,常见的 UI 开发任务(生成网页和组件、完成原型设计),完全可以考虑用它。

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年7月24日

国产 AI 网页开发工具:豆包 AI 编程简单测评

24 June 2025 at 10:49

一、引言

AI 编程(AI coding)是眼下的热点,但它其实不是单一功能,而是分成不同的方向。

其中的一个方向,就是 UI 生成,尤其是生成网页的 UI。

UI 生成涉及到视觉设计,需要专门的 AI 工具。国外已经有不少这类产品,比如 v0.devlovable.devbolt.new

它们能够根据你的文字描述,自动设计和生成网页,并部署上线。

我一直想来测评,这些 UI 生成器到底好不好用,可惜只有开通付费版,才有完整体验(包括最新、最强的模型)。

二、豆包

上周,我发现字节旗下的豆包,也上线了 UI 生成功能,能够直接生成网页应用了。

官方还特别加注"应用创作 1.0",唯恐你没注意到。

原因好像是底层的豆包大模型发了1.6版,代码生成能力大大加强。官方宣传,它在多个测试集上,得分属于国际第一梯队。

出于好奇,我就对它做了简单测评。它是完全免费的,而且对于国内用户,这种国产工具要比国外竞品更易上手。

三、基本功能

点击菜单的"AI 编程"选项,就进入了编程界面,就是一个大的输入框,下面有几个示例。

废话少说,我直接输入:

生成一个电商网站。

系统立刻转入代码生成页面,左侧是 AI 对话栏,右侧是不断滚动生成的网页代码(下图)。

等到代码生成完毕,右侧就会切换为生成的网页预览。

为了便于展示,我把这个页面分享出来(点击右上角的"分享"按钮)。

大家自己看效果吧(点击这里)。

声明一下,这是系统直接生成的,我没做任何修改。

我觉得,不足10个字的输入,能生成这样的网页,算可以了,反正是超过了我的预期。

虽然这个页面看上去能用,但许多细节需要修改。

四、可视化编辑

修改的时候,我发现,豆包的编辑功能做得挺好,完全是可视化编辑,不懂代码的人也能上手,其他竞品好像都没有做到这种程度。

豆包的可视化编辑,分成 AI 编辑和手工编辑。

4.1 AI 编辑

AI 编辑就是在左侧的 AI 框,直接输入指令,让 AI 帮你编辑。

编辑过程就像下图,选中标题,输入指令"优化表述,同时改为艺术字",就立刻生效了。

一条指令可以修改多处,每次修改系统都会实时保存,不用手动保存。

4.2 手工编辑

手工编辑就是直接在前端,自己动手修改文字和图片。

先点击上方的"编辑"按钮,进入编辑状态。

然后,选中要修改的元素,进行编辑。

举例来说,AI 生成的网页,配图往往不匹配,需要更换。

上图中,图片应该是蓝牙耳机,AI 却配了一张笔记本电脑的图片,需要更换。

在编辑状态下,选中这张图片,下方会出现一个编辑框。

里面有三个选项。

  1. 智能生图:AI 生成图片。
  2. 一键搜图:搜索系统图库。
  3. 本地替换:上传本地图片。

选中第一项"智能生图",输入"蓝牙耳机",就会得到 AI 生成的蓝牙耳机图片。

五、文本秒变网页

豆包的这一次更新,还有一个"文本秒变网页"的功能,我觉得很实用。

它能把长文本(会议记录、旅行攻略、新闻报道、论文等等)经过 AI 解读,自动变成网页

具体来说,对话框底下,有一排功能按钮,第一个就是这次新增的"文本秒变网页"。

点击它,输入框就会出现一句系统提示:

"分析以下内容,并将其转化为清晰美观的可视化 HTML 网页。"

你把长文本贴在这段提示下面,就可以了。比如,你贴一篇研究报告,AI 就会进行内容总结,然后将总结的内容生成网页。

更实用的是,长文本还可以通过 AI 生成。具体做法是在聊天界面,让 AI 生成长文本,然后切换至 AI 编程,输入指令"把上述内容转化成 html 网页"。

举例来说,先跟 AI 聊天,"帮我制定三天两晚的6月杭州旅游攻略"。

AI 会滔滔不绝,生成一大段文字(点击查看)。然后,你切换到 AI 编程,输入"帮我把上述信息转化为可交互的 html 网页"。

网页就生成好了(点击查看)。

有了这个功能,AI 的内容生成与网页生成,就一体化了。

于是,玩法就无穷无尽了。比如,上传会议的录音文件,生成会议记录网站;上传文献,生成内容介绍网站;让 AI 分析财务报表,生成折线图、流程图的分析网站。

六、总结

试用下来,我对豆包这次的网页生成功能,印象很好,觉得很实用,完成度也高,是一个有用的工具

首先,模型生成的页面效果,比我想象的好,是可用的。

其次,可视化编辑很好用,操作方便,上手门槛低,适合新手和不懂编程的项目经理、设计师等。

豆包团队重点打造这个功能,表明他们对 AI 编程现状有清醒的认识:AI 生成的页面,还无法一次就达到理想的状态,所以要把编辑功能做好,方便修改调优。

最后,对比国外的竞品,它有更好的本土化。除了中文界面和用法提示,它生成的网页风格,明显就是用了本土化的模版,而不是国外设计师的风格。

如果要说缺点,大概是 JS 脚本能力还不够令人满意,有一些页面的互动效果,不能一次成功,需要跟 AI 纠正多次。

总之,在前端应用生成这方面,豆包的 AI 编程是一个有生产力的产品,美观度和可用性都比较强,又是免费的,大家可以自己动手试试看

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年6月24日

谷歌的 NotebookLM 能生成中文播客了

1 May 2025 at 12:26

两天前,谷歌发了一个公告

它旗下的 AI 笔记产品 NotebookLM,现在支持50种语言生成播客了(原来只支持英文)。

我一定要分享这个消息,终于能生成中文播客了。这是我一直想要的功能,相信也是很多朋友想要的。

我演示一下,大家听听效果,会惊到你的。

首先,访问它的官网,点开右上角的设置,选择"Output Language"(输出语言)。

切换到"中文(简体)"。

然后,在首页新建一个笔记本。一般来说,一个学习主题,对应一个笔记本。

作为演示,我新建了一个"中国小说"的笔记本。进入后,在 Source(原始材料)标签页上传了鲁迅的《阿Q正传》。

注意,上传的文件格式目前只限于 PDF、TXT 和 Markdown。

另外,经过我测试,如果是图片扫描的 PDF 文件,它会自动进行文字识别。

接着,切换到 Studio(工作室)标签页,点击 Generate(生成)按钮,它就开始生成播客。

几分钟以后,播客就生成了,里面是一男一女在谈论你上传的资料。

大家听听看,是不是很像那些精心准备的真人播客。

NotebookLM 不仅可以上传文本材料,还可以针对网站和 Youtube 视频,生成播客。

我随便找了一个 Youtube 的英文视频,内容是国产旗舰手机的摄影能力比较。

下面是生成的播客

我听了以后,觉得都不必看视频了。而且,中文播客比英文视频,更容易抓住重点。

总之,有了中文播客以后,任何枯燥的学习资料,都能变成平易近人的播客节目。走路、休息、锻炼、开车的时候都能听,学习时间和途径都变多了。

需要注意的是,免费账户一天只能生成三个播客,更多需要付费。

除了播客,NotebookLM 的 AI 笔记功能,也非常好用。

你可以上传自己的学习材料,也可以用它搜索某个主题的学习材料。

下面是我用它搜索 PostgreSQL 数据库的学习材料。

指定学习材料以后,你可以跟这些材料聊天。

它还会自动生成各种笔记:学习指导、内容摘要、常见问题、时间线等等。

以上就是 NotebookLM 的基本用法。

我的评价是,NotebookLM 是一款革命性的笔记工具,属于少数几个真正有重大用处的 AI 产品。

它会改变做笔记的方式和学习方式,每个学习者都应该知道有这样一个工具。

它属于谷歌的产品,似乎还没有竞品,希望国内的厂商能够做出替代品。

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年5月 1日

巨头的新战场:AI 编程 IDE(暨 字节 Trae 调用 MCP 教程)

22 April 2025 at 15:08

一、引言

本周,我要加写一篇文章。

因为 AI 编程 IDE 突然成了热门,国内外都有大事发生。

先说国外,OpenAI 要用30亿美元收购 Windsurf

这个消息太惊人。Windsurf(前身叫做 Codeium)的历史很短,发布至今两年多,市场份额也不高,居然值这么多钱!

OpenAI 最新一轮融资(今年3月)不过400亿美元,现在一下子要拿出30亿去收购,看中 Windsurf 哪一点呀!

OpenAI 自己没有编程助手,所以唯一的解释是,它要收购 IDE 打入 AI 编程市场,这个市场对它很重要。

二、MarsCode 更名 Trae

再看国内,字节也有大动作。

它旗下的编程助手,最早是 MarsCode 插件,后来又多了一个独立的 AI IDE 产品 Trae

本周,MarsCode 宣布改名为 Trae 插件,不再作为独立品牌发展了。

以后,字节的 AI 编程助手,将只有 Trae 这一个品牌,分成两种产品形态。

习惯传统 IDE 的用户,可以加装 Trae 插件;想要更好 AI 体验的用户,可以安装独立的 Trae IDE。

这个消息公布的同时,Trae 新版本也一起发布,加入了重磅的新功能(后面会详谈)。

可以看出,字节是下了决心,整合了产品,准备在 AI 编程工具上发力了。

三、AI IDE + MCP

为什么国内外的巨头,在同一个时间,不约而同都看上了 AI IDE?

我猜想,答案是 MCP 的出现。

有了 MCP 以后,AI IDE 可以扩展外部能力,从而无所不能,这让它成为巨头的必争之地。

下面,我来解释 MCP 是什么,怎么在 Trae 里面调用。大家看了,就会理解为什么 MCP 这么重要。

四、Trae 的简介

我选择 Trae 来演示,主要因为它是国产软件,有中文界面和文档,并且完全免费(国外产品都需要付费)。

前面说过,Trae 分成插件和 IDE 两种形态,它的 IDE 又分成国内版和海外版。这些产品的功能基本一致,就是内置的 AI 模型不一样。

国内版:内置 deepseek R1、V3、v3-0324 和 doubao 1.5 pro 模型

海外版:内置 Claude 3.5、3.7,Gemini 2.5 pro,GPT-4o、GPT-4.1 模型

我建议使用国内版,因为海外版的内置模型经常需要排队,很浪费时间,而且可能还会通信不畅。

不过,这两个版本都支持自定义模型,你可以提供密钥,接入你指定的模型。所以,版本的差别也不算很重要。

顺便提一下,Trae 这个词的意思是"The Real AI Engineer"(真正的 AI 工程师)。我以前总是以为 Trae 的意思是 True Ai。

五、Trae 的新版本

Trae 的 MCP 调用功能,是从新版本 v0.5.0 开始加入的。

没安装的朋友,可以去官网下载新版。已经安装的朋友,请检查一下版本。

它的界面这一次简化了,聊天框和 Builder(项目生成)合并成一个对话框(下图)。所有跟 AI 的对话,都在这里输入。

上图中,左下角多了两个按钮:"@智能体"和"#上下文"。这就是本次新增的核心功能。

至于 Trae 的基本用法,这里就不提了,可以看以前的文章

六、调用智能体

MCP 调用的入口,就是上图左下角的"@智能体"按钮。

如果想要扩展 AI 的功能,就要使用这个按钮。因为 AI 模型的本质只是语言模型,自身的功能是有限的,必须通过外部应用(智能体)来扩展功能。

点击"@智能体"(或者输入@),就会弹出一个对话框,显示目前可用的智能体(下图)。

可以看到,Trae 内置了两个智能体:"@Build" 和 "@Builder with MCP"。

其中,"@Build"用来让 AI 生成一个可运行的新项目。

@Build 俄罗斯方块网页小游戏

输入上面的命令,就会生成一个 HTML 文件,打开就是俄罗斯方块小游戏。

另一个内置的智能体"@Build with MCP",就是用来连接 MCP 服务器。

七、MCP 是什么

我先解释一下,MCP 是什么,很容易理解。

我们知道,AI 模型通过连接外部应用,来扩展功能。每个外部应用的接口,都不一样,如果要接入10个应用,就要写10种接入代码,非常麻烦。而且,要是换一个模型,可能所有接入代码都要重写。

有鉴于此,Anthropic 公司在2024年11月提出了 MCP 协议。外部应用只需要支持这个协议,提供一个 MCP 接口(又称 MCP 服务器),那么 AI 模型就可以用统一的格式接入,不需要了解外部应用的接入细节。

所以,MCP 可以理解成一个 AI 与外部应用之间的适配层。对于 AI 来说,只要安装某个应用的 MCP 服务器,就能接入该应用,不用写任何代码(除了少数的配置项)。

由于 MCP 解决了 AI 应用的接入痛点,诞生至今仅半年,已经变得极其流行,就连 Anthropic 的竞争对手 OpenAI 公司都公开支持,网上开源的 MCP 服务器项目已经有上万个。

八、调用 MCP

现在就来看 Trae 怎么调用 MCP。

点击 AI 标签栏右上角的齿轮图标,弹出一个菜单,选择菜单项 MCP。

它会跳出一个 MCP 的标签页(下图),点击底部的"+ 添加 MCP Servers"。

Trae 内置了 MCP 市场,提供一些常用的 MCP 服务器。如果里面没有你需要的,可以点击"手动配置",添加你自己的 MCP。

为了便于演示,我选择第一个服务器 Puppeteer,让 AI 可以调用无头浏览器。

鼠标点击 Puppeteer 的名字,会进入该开源项目的主页,可以查看一下它提供的内部命令(即能力)。

上图中可以看到,这个 MCP 服务器提供 puppeteernavigator(打开指定网址)、puppeteerscreenshot(截图)、puppeteer_select(选中页面元素)等内部命令,供 AI 模型调用。

用户不需要记住这些命令,只需了解它有哪些能力就可以了。

接着,点击它后面的加号,添加该 MCP 服务器。

这个 MCP 带有"轻松配置"标签,表示不需要任何设置,可以直接运行。

所有自己添加的 MCP,默认都放在内置的智能体"@Build with MCP",所以可以通过这个智能体来使用。

在 AI 对话框里面,选中智能体"@Build with MCP",然后输入下面的命令"打开 https://www.baidu.com",试试看新安装的 Puppeteer 服务器。

正常情况下,Trae 会让你选择一个项目文件夹,然后就会打开一个浏览器窗口,显示百度的首页。

这就是 MCP 的作用。AI 本来没有能力控制浏览器,但是现在就可以通过 MCP 来控制。

接着,可以给出一些更复杂的命令,比如生成截图,也能顺利完成。

这就是调用 MCP 的基本流程。你还可以把添加的 MCP 服务器保存成智能体(下图)。

然后,通过你起的名字,调用该智能体(下图),从而连接指定的 MCP 服务器。

九、上下文功能

除了 MCP 调用,Trae 的本次更新,还加强了上下文功能,这里也简单提一下。

所谓上下文,就是额外提供的信息,帮助 AI 模型思考,来完成任务。

通过#号,可以调出上下文菜单。

从上图可以看到,可以提供的上下文,包括额外的代码(code)、文件(file)、目录(folder)、工作区(workspace)。

本次更新多了两个选项,"Doc"表示额外的文档。

点击"添加文档集",就可以添加文档目录,作为 AI 模型的上下文。

另一个选项"Web",表示用网上信息作为上下文。这为 AI 提供了实时联网能力。

上图的实时天气问题,AI 只有具有联网能力,才能回答。

十、总结

有了 MCP 调用和联网能力,AI IDE 就具备了巨大的想象空间,不仅仅是编程工具,而成了一个无所不能的 AI 控制台。

那些大公司一定是看到了这一点,所以才愿意投入大量资源,去做这个产品。

我认为,在 AI IDE 里面调用 MCP 服务器,将成为近期软件业的热点,值得大家重点关注。

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年4月22日

办公类 AI 初探:扣子空间

21 April 2025 at 10:50

一、AI 的风口

问问大家,AI 产品的风口是什么?

我的意思是,什么样的产品有最大的机会。

现在的 AI 多如过江之鲫,大部分都是昙花一现,走不远。

在我看来,最有机会的产品,既不是面向普通大众的问答类 AI,或者内容生成 AI,也不是面向开发者(API 用户)的编程 AI。

真正的风口是办公类 AI

企业和个人的办公市场巨大无比,而且有真金白银。

谁能把 AI 引入文档、会议、决策......,谁就会吃到肉。就像 Office 软件是商业软件之王一样,企业级办公 AI 也一定会是 AI 的销售之王。

二、办公类 AI 的现状

不过,办公类 AI 眼下寥寥无几。不要说赢得市场,就连想得起名字的产品都不多。

究其原因,一是 AI 现阶段的能力,还达不到企业级软件的安全、稳定、准确、高效。

二是办公类 AI 到底是什么样的产品形态,大家还在摸索。

我一直非常关注这个领域,对于新出现的办公类 AI 有着强烈的兴趣。

下面介绍一个新产品"扣子空间",我这些天一直在试用。大家看看,它怎么用 AI 完成办公任务。

三、扣子空间

先说一下,扣子(coze.cn)是一个国内的平台,提供基于浏览器的低代码环境,来搭建 AI 应用,有免费额度。

我一直是它的用户,以前还写过文章,介绍它的工作流模式:在图形化界面上,用鼠标编排 AI 工作流,生成独立应用。

工作流模式号称不需要编码,小白也能用,但用户最好有编程基础,所以还是有一点点门槛。

于是,扣子现在又推出了"扣子空间",真正零基础,无门槛完成任务。

它的最大特点是,内部自动调用各种 Agent(智能体),不需要用户介入,就能完成各种任务。你可以把它想象成一个"Agent 的自动调用器"。

对于用户来说,因为有了底层的 Agent 能力,它不仅可以回答问题,还能解决问题(任务),从而成为你的办公助手和工作搭子。

正如它的宣传语:"和 Agent 一起开始你的工作"。

注意,它现在需要邀请码,可以去扣子公众号和扣子空间官网(space.coze.cn)领取。

四、界面

扣子空间的网址是 space.coze.cn,点进去就可以使用。

界面很简单,左侧是任务列表,右侧是一个对话框,用来输入新任务。

执行任务要求时,默认是"探索模式",AI 自动完成各个步骤,速度较快。

你也可以改成"规划模式",显示 AI 思考的中间步骤,便于随时调整。

除此以外,就没有需要设置的地方了,很符合直觉。

五、任务示例

下面是我的一些使用实例,都是办公类的任务。

大家看看,它完成得怎么样,像不像一个精通各种技能的实习生。

5.1 撰写研究报告

最常见的办公任务,肯定是撰写文档。我让 AI 撰写下面的研究报告。

我需要一篇研究报告,关于上海茶饮行业近几年的发展情况,以及投资机会的分析,包括行业发展、热门产品等信息。

注意,文档类的任务最好指定输出格式,否则生成的内容以 Markdown 格式展示在对话页上,不方便利用。

我一般是在提示词最后,加上这样一句。

同时做一个可视化的网页。

开始运行后,它就会分解任务,按步完成。

最后,它给出生成的 markdown 文件和网页文件。

你可以在新窗口打开网页预览。下面就是它生成的网页,图文并茂,有数据也有论述。

整个报告分成四个部分,可以根据需要增减,自己使用或交差,总体上没有问题。

5.2 多种输出格式

前面说过,扣子空间内置了各种 Agent。

除了生成网页的 Agent,还有生成 Office 文档、PDF、飞书文档的 Agent,都可以用,下面是一个例子。

帮我比较一下T3、滴滴出行、高德,作为新手网约车司机,在重庆跑,哪个平台最推荐,并说明详细原因,输出一份飞书文档。

由于飞书文档是带有布局的,实际生成时,也是从文字报告生成网页,然后系统提示你将网页内容复制到飞书。

如果输出 PDF 文件或幻灯片 PPT 文件,系统会直接给出文件下载。

我正在编排行程,目的是安徽皖南地区,包括黄山和当地的其他风景点,请详细研究行程、交通路线、景点介绍、门票、住宿和当地饮食等信息,形成一份完整的行程安排,以 PPT 形式展示。

它生成了一个28页的 PPT 文件,下载后,完全可以直接上台演示。

5.3 表格能力

办公类的 AI,一定要有表格处理能力。

请生成一个表格,包含上证50指数成分股,及其最新的收盘价。

默认情况下,表格生成后,会显示在网页上。

系统还会给出一个 csv 文件,供下载。

如果想要完备的电子表格功能,可以把 csv 文件导入电子表格软件。

5.4 其他功能

扣子空间内置的 Agent 很多,还可以调用高德地图、生成网页游戏等等。

请生成一个互动式的学习网站,帮我学习 CSS 的 oklch 颜色函数。

上面是网页小游戏的例子,下面是调用地图的例子。

用高德地图分析一下上海外滩地区所有瑞幸咖啡的门店选址,做成一个可视化的网页给我。

如果内置的 Agent 不足以满足需求,你还可以设置让它接入各种 MCP,扩展能力。

5.5 专家系统

最后,它还自带了专家系统,也就是高级的专业知识库,提供深度的分析能力。

目前,内置了两个专家系统:用户研究专家和 A 股观察助手。

前者用来用户问卷调查、访谈、生成分析报告;后者用来分析自选股和大盘,提供研究分析报告。

深度的分析和处理任务,需要特定的专业知识,可以试试它们。

六、总结

经过初步的试用,我对扣子空间评价很好,非常好用的办公助手和 AI 实习生,确实能够提高办公效率。

我觉得,它的设计思路很正确,自动调用各种 Agent,既能扩展各种能力,又能消除了上手难度,同时具备深度研究(deep research)能力。

更难得的是,它的完成度相当不错,没遇到明显的 bug,可以用于实际的办公。

总之,作为办公类的 AI 产品,它的"工作搭子"的模式,我觉得可用也可行。

后面,办公类 AI 产品相信会大量涌现,鉴于它的重要性,我还会介绍和评测更多。

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年4月21日

Trae 国内版出来了,真的好用吗?

3 March 2025 at 16:00

年初一月份,我就看到新闻,字节面向海外发布了一款 AI IDE,叫做 Trae

我心想,现在的 IDE 都有 AI 插件,功能完备,字节自己也有 MarsCode 插件,有必要再做一款单独的 IDE 吗?

我就没有特别关注这个工具。

上周,我遇到字节的同学,得知 Trae 国内版就在本周发布,我还提前拿到了内测版,这可是国内市场的首个 AI 原生 IDE。

今天,就来说说我的使用心得,顺便也探讨一个更大的问题:AI 工具已经这么多了,该不该造新的轮子?

先透露一下结论:Trae 国内版值得用。它作为一个 AI IDE,整体比插件好用,而且内置的大模型----豆包 1.5 pro、DeepSeek 满血版----无限量免费使用。

一、国外版与国内版

介绍使用体会之前,我先解释一下,两个版本的区别,主要是模型的差异。

Trae 国外版使用国外的模型,对于国内用户来说,存在连接不上、等待时间长、网速较慢等问题。

Trae 国内版使用国内的模型,连接可以保证稳定快速,界面也根据国内用户的习惯进行了定制。

我也问了字节的同学,Trae 国内版和 MarsCode 是什么关系。回答是,它们是同一个团队的作品,适用于不同场景

如果你想保留原来使用的 IDE,只增加 AI 编程相关功能,那就用 MarsCode 插件。如果想体验一个全新的围绕 AI 设计的原生 IDE,那就试试 Trae。

这两个产品后续都会长期开发,可以根据自己的需要选择。

二、安装

Trae 国内版需要去官网 trae.com.cn下载。

目前,有三个版本:Windows 版、macOS Intel 芯片版、macOS M 系列芯片版。

安装启动后,会出现下面的画面。

接着,让你选择亮色/暗色主题,以及语言(简体中文)。

它还会问你,要不要导入原来 IDE(VS Code/Cursor)的配置,算是很贴心的设计了。

最后,问你要不要登录。不登录也可以用,只是某些功能会受到限制。登录的话,就跳转到 Trae 官网,用你的手机号登录。

一切完毕,就会进入使用界面。

三、使用界面

Trae 的使用界面,相当简洁。左侧就是 VS Code 的界面,熟悉的话,上手没有任何难度。

界面的右侧是 AI 区域。可以看到,它分成两个模式:Chat 和 Builder。

Chat 模式是默认模式,也就是问答模式。AI 回答问题,也可以生成代码,但不会生成项目,需要自己手动把代码复制过去。

Builder 模式是项目模式,你给出文字描述,让 AI 一键生成项目。

下面,就来试试这两个模式。

四、Chat 模式

Chat 模式的主体就是一个对话框,右下角按钮可以选择底层模型。

国内版目前有三个模型可供选择。

  • 豆包 1.5 pro
  • DeepSeek R1
  • DeepSeek V3

这三个模型都是免费无限量使用,DeepSeek 系列模型都是满血版。我实测,速度令人满意,能够较快地给出回答,没有遇到"服务器繁忙"的提示,包括最耗时的 DeepSeek R1 模型都是如此。

至于,回答问题的质量,老实说,现阶段领先的大模型,这方面已经没有太多可挑剔的了。

任何问题都可以问,包括非技术类的问题。

我直接让它生成代码,回答的格式非常友好。

大家注意,上图中,第一个代码块是终端代码,右上角有三个按钮(下图)。

上图右上角的三个按钮,分别是"复制"、"添加到终端"和"运行"。如果点击后两个按钮,会直接把代码传入 Trae 内置的终端,就像下面这样。

这部分,我感觉用起来比插件版流畅,整体感更强,这大概就是把 AI 做成 IDE 的好处了。

五、Builder 模式

再看 Builder 模式,它可以一键生成项目。

点击上方的标签页,切换到该模式。可以看到,第一次进入,会有一个"启动 Builder"按钮(下图)。

系统会提示你(下图),这里可以从零到一完成项目构建,并且所有修改会自动保存,并显示两个示例项目:贪吃蛇和 Todo List。

为了测试正常的流程,我就直接在下方的对话框输入:"请用 React 生成一个 Todo List 应用。"

系统会提示你指定一个目录,作为项目目录。然后,它不断给出操作步骤(下图)。

上图中,需要执行具体的命令时,它会附有"运行"按钮,要你点击确认。

点击后,Trae 会自动打开内置的终端,执行该命令(下图)。

然后,它会一个个生成所需的文件,要求你审查。

所有文件生成完毕,就出现了启动本地预览服务器的命令。

运行后,Trae 会启动一个内置的 webview 页面,展示渲染效果,实时更新。

这个很赞,任何修改都可以马上看到结果。

但是我必须说,不知道是不是内测版的缘故,Builder 模式目前还不完善,只适合为项目生成架构,做不到一步到位,离理想状态有些差距。我试了多次,如果需求复杂一点,生成的代码很难一次就跑起来,需要多次修改。大家对它要抱有合理期待,这个模式后续还需要不断完善。

六、其他功能

除了两大模式,Trae 的其他功能也可圈可点。

(1)代码智能补全。

这是 AI 编程助手的基本功能,就不多说了。只要按回车键换行,Trae 会阅读并理解当前代码,然后自动补全后续代码。

如果有注释,它会根据注释,生成缺少的代码。

(2)指定上下文。

Trae 允许指定对话的范围(上下文)。具体方法是在对话框输入#号。

上图中,在对话框输入#后,系统就会自动弹出一个菜单,让你选择上下文(context),一共有四种。

  • Code(代码)
  • File(文件)
  • Folder(文件夹)
  • Workspace(工作区)

默认的上下文是当前工作区(Workspace,即目前打开的项目),也可以指定为某个函数或类(Code)、某个文件(File)、某个文件夹(Folder)。

一旦指定了上下文,AI 的回答会更有针对性。比如生成代码时,就会结合上下文的场景。

(3)一键转对话。

为了方便地将代码编辑框的内容,传送给 AI,Trae 提供"一键转对话"按钮,省去了复制粘贴的麻烦。

上图中,选中某段代码,系统就会弹出"添加到对话"的浮动菜单,一键复制到 AI 对话框,便于提问。

终端窗口的报错信息,也有这个功能(下图),这就很方便让 AI 来 debug。

(4)模型自定义功能。

我听字节的同学说,Trae 后面会支持模型自定义功能,用户可根据自己的喜好,接入对应的模型API。

七、总结

我试用 Trae 国内版后,感到它有几个显著优点。

(1)产品设计周全,最常用的场景都考虑到了,用户体验比较流畅。

(2)界面友好,交互设计良好,开发者容易上手。

(3)AI 模型(包括满血版 DeepSeek)无限量免费使用,响应始终稳定快速。

不足之处是 Builder 模式还不够强,生成的程序有 bug,第一次生成往往跑不起来,需要不断调整,耗时较多。

总结就是,一个完整的 AI IDE 还是比 AI 插件,用起来更容易,有"一体感",达到了更大的定制程度。

随着 AI 的能力进一步发展,AI IDE 的想象空间会更大,也许会成为未来 IDE 发展的主要方向。

Trae 国内版刚刚上线,开发团队希望大家下载试用,多提宝贵意见。

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年3月 3日

AI 搞定微信小程序

16 January 2025 at 08:23

一、前言

AI 生成代码,早不是新鲜事了,但是 AI 生成微信小程序,似乎还不多见。

究其原因,大概是小程序的开源项目较少,模型训练不好搞。

上周,我遇到腾讯的同学,得知"腾讯云开发"最近有一个大的版本更新,大幅加强了小程序的 AI 能力。我还挺期待的,腾讯自己搞小程序 AI,要比其他人更合适。

后来,我试用了本次更新的 AI 功能,有一个强烈的感觉,微信小程序可能很快就会成为国内 AI 应用(又称"智能体")的主要载体

因为本次更新以后,小程序调用 AI 模型,以及生成智能体,变得非常方便。并且,小程序从 API 到开发工具,都把 AI 整合进去了,整个开发过程都有 AI 辅助,不仅开发效率提高了,而且大量代码可以通过 AI 生成。

下面就是我的试用过程的介绍和记录。这些功能都是公开的,大部分已经上线,剩下的也即将发布,大家现在就可以跟着做,体验 AI 生成小程序。

二、云开发助手:进入方法

我的第一步是体验小程序的"云开发助手"(又称云开发 Copilot)。它的作用是通过 AI 加快小程序的开发

它的全功能版,目前要通过"腾讯云开发平台"网站使用。

此外,还有一个游客版的小程序,可以体验部分功能。如果你手边只有手机,可以先试试游客版。

手机上,点击"从 AI 开始探索云开发",就能进入。

手机版看一下就可以了,正式的开发还是要使用网站。本文下面的内容,都是基于网站的全功能版。

首先,登录"云开发平台"后,页面右下角就会出现小助手图标。

点击它,就能打开"云开发助手"。

它的右上角有一个"全屏"图标(下图)。

点击进入完整界面。

三、云开发助手:文档功能

"云开发助手"的主要功能如下图。

这些功能可以分成两大类,一类是文档相关的功能,另一类是代码生成。

先看看文档功能。

(1)Copilot

这个功能是 AI 问答引擎,任何关于小程序的问题,都可以向它提出。

这大大减少了文档查阅,有些简单的函数,可以让它生成,还能让它教你如何开发小程序。

(2)AI 识图

这个功能是通过上传页面截图(或者设计稿),生成需求文档。

我上传了一张抽奖的转盘。

它生成了如下的需求文档,用文字详细复述了这个页面的界面布局、设计细节、功能需求等。

大公司的程序员,一般都是根据产品需求文档(PRD)进行开发,所以这个功能可以简化产品经理的工作,需求文档也可以作为 AI 代码生成的文字记录保存下来。

生成的需求文档,下一步可以传入"云开发助手",来生成页面代码,所以它也是 AI 生成小程序的中间步骤。

(3)写需求高手

这个功能跟"AI 识图"作用相同,都是生成需求文档,区别是它输入文字描述。

由于不需要截图,它适合只有功能需求、没有设计稿的场景,即让 AI 来设计页面。

四、云开发助手:生成小程序前端代码

接着,我们就来试试,让"云开发助手"生成小程序的前端代码。

选择左侧菜单的 "AI 生成可视化应用",这个功能就是根据截图或者文字描述,直接生成应用(Web 或者小程序)。

上传一张微信页面的截图。

它会自动生成该截图的页面代码,可以预览效果(下图)。

可以看到,生成的页面还原了原始布局,但是有许多细节差异。

目前阶段,好像还做不到100%还原,比较适合当作代码基础,在它生成的页面基础上,进行手动细节调整。

除了上传截图,还可以输入文字描述(或者上一节的需求文档),也能生成应用。

让它生成程序员的个人小程序,效果还是可以的。

预览初步效果后,你可以在云开发平台上,直接线上编辑代码。

编辑完这个页面以后,还可以反复这个过程,向小程序添加更多页面(下图)。

有了多个页面,就能设置页面之间的跳转,这样就基本是一个可用的小程序了。

调整小程序的样式时,云开发助手还提供了一个贴心的功能"AI 编辑组件样式",也就是根据指令,自动修改样式。

上图就是让 AI 为页面添加渐变背景,这样修改样式,就方便了很多。

大家可能看到了,左侧菜单栏还有一个"AI 生成组件"的功能。该功能用来生成页面的组件,适合为现有的页面添加功能。但是,它暂时只支持 Web 应用,不支持小程序,所以这里就忽略不介绍了。

完成前端开发以后,云开发平台可以直接发布小程序。当然,你也可以复制或者下载代码,通过微信开发工具发布。

五、云开发助手:生成小程序后端代码

小程序除了前端 UI 代码,还需要后端的业务逻辑和数据库读写。"云开发助手"也能生成后端代码,主要用到下面两个功能。

(1)AI 生成云函数

云函数是微信平台在云端执行的函数,可以用来获取各种后端能力。

"云开发助手"可以帮我们生成云函数。下图就是让 AI 生成获取小程序 OPENID 的云函数。

AI 在给出示例代码的同时,还会展示各个文件的写法(下图)。

如果你觉得可以接受,就点击"创建云函数"按钮 ,代码就会进入新打开的云 IDE 环境,用来编辑和调试。

编辑完成后,点击"部署"按钮,就可以将云函数部署到线上了。

(2)AI 生成数据模型

这个模型用来生成数据库的数据模型(也就是"表结构")。

比如,生成一个博客的数据模型,包括文章、作者和评论。

点击"查看",显示一个 JSON 数组,表示数据结构。

点击"确认生成",数据结构就会以表格形式呈现,确认没有问题,就可以保存。

六、AI 大模型接入

上面都是介绍"云开发助手",即 AI 辅助小程序开发。下面介绍 AI 开发的另一个重头戏:如何做出 AI 智能体的小程序,也就是让小程序本身具有 AI 功能。

还是在"云开发平台",左侧菜单选择 AI+。

这时,页面会让你选择,接入大模型还是开发智能体(下图)。

(1)开发智能体(AI Agent)

这里可以简单把"智能体"想象成一个 AI 对话应用,用户输入要求,AI 给出响应。

腾讯云开发平台将"智能体"的后端大模型,默认指定为腾讯的混元模型。

你自己需要定制开场白、提示词、知识库(你自己的训练材料)。

然后,定制前端界面(对话组件)。

基本流程就完成了:用户在前端界面,根据开场白的提示,输入他的要求,系统收到后,传给后端模型,再将回复展示给用户。

是不是很简单?一个智能体就这样做好了。

(2)AI 大模型接入

如果选择自己接入大模型,页面会根据开发类型(Web/小程序/云函数),给出接入指引。

小程序 API 已经对大模型做了适配,按照指引,只要几行代码就能接入。

具体来说,从小程序基础库3.7.1开始,新增了wx.cloud.extend.AI对象,专用于 AI。

  • wx.cloud.extend.AI.createModel():用来接入大模型
  • wx.cloud.extend.AI.bot:用来调用智能体

用了这个 API,就不需要任何 SDK,也不需要后端服务器,系统直接负责 AI 接入,同时处理好鉴权、加密、流式传输,不需要用户介入。

下面是示例代码,详见官方文档

七、总结

以上就是我试用的全部内容,我的总体感觉是,这些已经做好的部分,对小程序的开发有巨大的助力。如果你正在开发小程序,一定要试试这些功能。

小程序的 AI 能力,后面还会持续扩展。腾讯希望把云的基础设施、微信小程序、AI 大模型都打通,从而让小程序开发的门槛更低,效率更高。

我听腾讯的同学说,下一阶段有几个开发重点。

(1)用 AI 生成前后端完整的小程序,进一步与微信开发环境打通。

(2)加强 AI 的代码生成能力,搭配小程序模版和低码编辑器,快速生成小程序。

(3)在 AI 的帮助,无痛接入数据库和调用云函数。

(4)客户端、服务端、大模型三者之间数据交互的标准化和统一接口。

上面的每一点,都能解决目前小程序开发的痛点,期待早日看到突破。

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年1月16日

AI 应用无代码开发教程:工作流模式详解

2 December 2024 at 18:39

一、引言

一个月前,我写了一篇《AI 开发的捷径:工作流模式》,引起了很多读者的兴趣。

大家都认同,AI 应用是开发者的机会,而图形化、低代码/无代码、不需要编程基础的"工作流模式",正是 AI 应用开发的入门捷径。

但是,我的那篇文章只介绍概念,没有操作步骤。很多读者实际上手时,遇到了困难,有些地方不理解,做不下去。

今天就是后续,我详细演示,一步步图解,没有编程基础,如何搭建一个最简单的 AI 应用。只要你跟着做,就能做出来。

二、开发工具

这篇教程使用的开发工具是扣子(Coze),所有操作都在它的浏览器 IDE(集成开发环境)中完成,

选择扣子(Coze),主要原因有三个。

(1)它是国产的 AI 应用开发平台,字节跳动的产品,界面、文档、客服都是中文。

(2)它有无代码编辑器 Project IDE,包含组件拖拽的 UIBuilder,可以生成全功能的前端界面,上手门槛相对低。

同时,它也提供后端数据库,可以数据读写。

(3)它免费使用(只要不超过使用额度),发布上线也不收费,适合新手练习。

三、示例项目

我们的示例项目,是一个最简单的"AI 文言文生成器"。

大家先看成品,可以点进去试用。(建议 PC 访问,UI 还没有适配手机。)

输入一段汉语白话文,点击按钮,AI 就会自动生成文言文。

架构上,它非常简单:前端是一个网页表单,将用户的输入发送给后端的 AI 模型,并展示后端的返回结果。

它的开发只需要两步,第一步先让后端的 AI 模型跑起来,第二步做一个网页,连接后端即可。

扣子的方便之处在于,前后端的生成都是图形化操作:后端是编排工作流的节点,前端是 UIBuilder 的界面拖拽组件。

下面就是开发步骤。为了保证大家跟得上,我写得比较详细,看起来有点长,但是实际操作是很快的,熟练的话,10分钟就能完成。

四、创建项目

首先是开发的准备工作,先创建 AI 应用。

(1)访问扣子官网,点击右上角的"基础版登录"。(基础版只比专业版少一些企业级功能,普通用户完全够用。)

(2)登录后,自动跳转到个人主页,点击左侧菜单的"工作空间"。

工作空间里面,有"项目开发"和"资源库"两个页面。进入"项目开发",可以看到你所有的项目。

(3)点击右上角的"创建"按钮,跳出一个弹框。

上面有两个选项,"创建智能体"是创建一个传统的 AI 聊天,"创建应用"则是创建一个自定义界面的 AI 应用。

(4)选择"创建应用",这时会让你选择应用模版,点击"创建空白应用"。

接着,输入项目的名称,这里是"AI 文言生成器"。

至此,项目创建完毕,系统会自动进入"AI 文言生成器"的应用主页(下图),正式的开发工作就要开始了。

五、业务逻辑

应用主页的最上方,有"业务逻辑"和"用户界面"两个分页,默认是"业务逻辑"页面。

这一节就讲解如何创建业务逻辑,也就是后端的 AI 模型。

我们采用工作流模式,即将业务逻辑编排成一个个节点。

(1)点击左侧菜单的"工作流"后面的"+"号,选择"新建工作流"。

输入工作流的名称和描述。(注意,名称只能是英文字母、数字和下划线,本例是 classicalchinesecreator。)

(2)工作流创建成功后,名称会出现在左侧菜单的"工作流"标签下方。点击它,就进入该工作流的"节点编排"画布。

画布上,默认有"开始"和"结束"两个节点。

(3)点击下方的"添加节点",添加一个新节点,类型设为"大模型"。

然后,将这三个节点连起来(通过拖动边框上的控制点)。

(4)配置"开始"节点。双击该节点,在配置框增加一个 content 变量,表示用户的输入内容。

(5)配置"大模型"节点。

配置窗口的各个选项,填写如下。

模型:可以按自己的需要选择,这里保持默认值"豆包 Function call 模型"。

输入:将原来的 input 参数改名为 content,并跟"开始节点"的 content 变量连接起来。

系统提示词:输入以下内容,用来设定大模型的行为。

角色

你是一个专业的汉语文言文作者,能够准确地将用户输入的汉语白话文内容改写为文言文,不进行随意扩写。

技能

技能 1:文言文写作

  1. 当用户提供一段汉语白话文时,迅速将其改写成文言文。
  2. 确保改写后的文言文的准确性和完整性。

限制:

  • 只进行文言文改写,不回答与文言文改写无关的问题。
  • 严格按照用户提供的汉语白话文进行改写,不得擅自增加内容。

用户提示词:输入以下内容,作为给系统的直接命令。

将用户输入的汉语白话文{{content}}改写成文言文。

上面文本中的{{content}},表示此处系统将插入 content 变量的内容。

输出:将输出格式改为"文本"。

(6)配置"结束"节点。首先点击配置框上部的"返回文本"。

输出变量:将 output 参数关联"大模型"节点的 output 变量。

回答内容:输入{{output}}(表示插入 output 变量的内容),并打开"流式输出"(即打字机效果)。

至此,整个工作流的搭建全部完成,可以单击画布右上角绿色的"试运行"按钮,测试工作流是否正常运行。

在 content 输入框,输入测试内容,比如"今天天气很好"。

然后,点击下方的运行按钮,就可以得到运行结果(今日,天善)。

如果一切正常,就可以开始搭建用户界面。

六、用户界面的搭建:页面布局

(1)点击进入画布上方的"用户界面"分页。

(2)在左侧菜单的组件面板,找到布局组件 > 容器组件,将其拖入中间的画布,作为页面的标题区域。

系统自动将这个容器命名为 Div1,双击进行配置。

尺寸:宽度为100%,高度为 60px。

布局:排列方向为"横向"。

样式:去除背景色,将边框设为灰色(#E2E8F0)。

(3)在 Div1 下方,再拖入一个容器组件,系统自动命名为 Div2,用作功能区域。

配置基本一样:尺寸部分,宽度和高度都设为填充容器;布局部分,排列方向为横向;样式部分,去除背景色。

(4)在 Div2 内部的左侧部分,拖入一个容器组件 Div3,用作用户输入区域。

宽度设为50%,高度设为 550px,样式删除背景色。

(5)在 Div2 内部的右侧部分,拖入一个容器组件 Div4,用作展示结果区域。

宽度设为50%,高度设为 550px,样式删除背景色。

至此,页面布局如下图。

七、用户界面的搭建:页面细化

做好布局后,下一步完善页面细节。

(1)在 Div1 内部,拖入推荐组件 > 文本组件,作为标题文本。

标题内容设为"AI 文言文生成器",字号改成24,字重为粗体。

(2)在 Div3 中拖入一个表单组件,删除不需要的元素,只剩下文本输入框和按钮。

表单组件:宽度和高度都设为填充容器,并删除边框。

文本输入框:拉伸高度,宽度设为填充容器,标签和占位文案设为"输入汉语白话文"。

按钮:文本改为"生成文言文"。

完成后的表单效果如下图。

(3)在 Div4 中拖入一个展示组件 > Markdown 组件,作为展示文言文区域。

删除 Markdown 组件的已有内容,改成"###### 生成结果"。高度和宽度改为填充容器,圆角设为10,内边距设为20,边框设为灰色(#CBD5E1)。

至此,页面细化完成,单击属性面板上方的预览,查看效果。

八、用户界面的搭建:配置事件

页面外观做完后,要配置事件,将后端的业务逻辑与用户界面连接起来。

(1)点击"生成文言文"按钮,在配置面板切换到"事件",点击"新建"。

事件类型设为"点击时",执行动作设为"调用 Workflow",workflow 设为已经创建好的"classicalchinesecreator",并将工作流的入参content设为文本输入框的值 {{ Textarea1.value }}。

(2)配置生成结果区域,展示工作流的返回结果。

选中 Markdown 组件,点击"内容"栏的扩展按钮。

扩展面板中,在###### 生成结果后面添加一行,插入工作流的返回结果{{ classical_chinese_creator.data }}

完成所有配置后,单击右上角"预览"按钮,测试整体效果。

如果一切正常,这个 AI 应用就算开发完成了。

九、应用发布

开发完成后,就可以发布该应用,让其他人也可以使用。

点击右上角"发布"按钮,版本号设为 v0.0.1,发布平台设为发布到扣子商店。

至此大功告成,"AI 文言生成器"就登录扣子商店,向世界公开了。

十、总结

大家可以根据这个示例,改变输入 AI 模型的提示,让它做不同的任务,就能变化出很多不同功能的应用。

比如,官方的"AI 翻译"示例,就是让 AI 把用户输入的中文译成其他语言,跟"AI 文言文生成器"异曲同工。

除了文本生成,扣子还提供许多其他能力,比如抓取外部数据、数据库读写等,从而可以做出更强大的 AI 应用。

总之,"工作流模式"使用图形化界面搭建一个 AI 应用,简单而便捷,随时查看效果,一键发布,值得大家尝试。

(此处有分割线。)

最后是一个活动预告。

扣子邀请我,参加12月19日在上海举行的"扣子开发者日",也欢迎大家参加。

届时,字节的 AI 工程师会跟大家面对面交流,如何开发和推广 AI 应用。这是很好的学习交流、获取资源的机会,点击这里了解详情。

扫描下方海报二​维码,或者点击链接现在就可以线下报名参加,或者线上预约直播

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年12月 2日

AI 开发的捷径:工作流模式

31 October 2024 at 03:24

一、引言

大部分人使用 AI,大概都跟我一样,停留在初级阶段。

平时,就是向 AI 提问(又称聊天),偶尔也用一些现成的服务:生成图片、生成代码、翻译文章等等。但是,时间久了,就觉得不够用,很多个性化需求,根本找不到工具,需要自己想办法。

我想,这是很多人面临的问题:如果深入使用 AI,就必须自己做开发

今天,我就介绍一种 AI 开发的简单方法,没有那么高的门槛,普通人也可以上手。

二、AI 开发的三种模式

按照从难到易,我把 AI 开发分成三种模式。

(1)自建模型:自己搭建 AI 模型,并寻找数据进行训练。

这种模式难度高,成本大,必须是 AI 专业人士或大公司,才会使用。

(2)API 调用:自己编写脚本,去调用他人运行的模型 API。

这种模式要求使用者必须会编程,优点是适应性强,什么需求都能编程解决,缺点是编写和调试脚本要花不少时间,还要自己部署服务端。

(3)工作流模式采用 AI 服务商提供的工作流(workflow),编排每个步骤,形成自动化操作。

这种模式最简单,不懂编程的人也能上手,可以不编写脚本,有现成的服务端,省时省事。缺点是受限于 AI 服务商提供的能力,对方不提供,就做不了。

我是 AI 新手,就选择了最后这种模式,尝试 AI 开发。

三、GPT 商店和 Copilot 模板

很多 AI 大厂都提供"工作流模式",允许开发者在他们的模型上,定制自己的应用。

最有名的大概就是 OpenAI 公司的 GPT 商店

它开放 ChatGPT 的底层能力,让开发者定制某个领域的专用 GPT,比如学术论文的 GPT、处理 Excel 文件的 GPT 等等。

微软的 Copilot 也有类似的功能,叫做"模板"(template)。

不过,这些都是国外的服务,需要收费,服务器在境外。好在国内有免费的替代品,我就选择了国内产品。

四、工作流演示

我先演示一下,工作流的操作界面。大家就能明白,它是怎么回事了。

工作流其实就是把一个 AI 应用,分成若干个步骤。每个步骤是一个节点,你在上面设置这一步的操作,然后所有节点按照流程,完成任务。

上图是扣子 AI(coze.cn)的工作流编排界面,包含四个节点。

扣子是字节跳动旗下、免费的 AI 应用开发平台。使用过程非常直观,就是在网页画布上,通过图形化操作,一步步创建 AI 应用。我就用它来演示。

它的开发页面左侧是不同类型的节点,下图是其中一部分。

新建节点时,点击对应类型就可以了。一般来说,第一步总是新建"模型节点"或"插件节点"。

新建模型节点后,如果你想用自己的数据训练模型,可以在项目管理页面上,新建一个知识库,上传数据文件。然后在工作流里面,创建一个"知识库节点"。

如果你想启用持久记忆能力,记住用户的历史对话,那么可以新建数据库,保存用户数据,然后在工作流创建"数据库节点"。

所有节点设置完毕,这个 AI 应用就可以运行了。最后一步,就是发布该应用。

扣子会让你选择发布渠道(上图),目前支持发布到商店(在扣子平台使用)、第三方平台(在飞书、抖音、微信使用),以及 API 和 SDK(在用户自己的软件使用)。

以上就是工作流模式的使用界面,只是一个简单介绍,大家有一个大概的理解就可以了,具体操作可以看文档

它还是很容易上手的,熟练以后,开发一个 AI 应用,一两个小时就可以搞定。

五、工作流开发的例子

为了加深理解,我举一个实际开发的例子。某餐饮企业想要搭建一个 AI 应用,用来分析用户的点评。

为此新建一个工作流,基本功能只需要三个节点----输入节点、分析用户点评的 AI 模型节点、输出节点。

然后,把这个工作流发布成 API。用户的点评传入这个 API,它就会返回一段 JSON 数据,里面有 AI 模型识别出的用户评价(正面、负面、中性),以及点评关键词(环境/服务/菜品)。

上图是这个工作流的预览调试界面,输入了一段真实的点评,运行结果以 JSON 格式返回。

可以看到,AI 识别出该用户对产品是中评,对环境是差评,对上菜速度是好评。

六、模板功能

工作流除了自己使用,还可以保存成模板(template),发布到模板商店,让别人使用和借鉴。

在模板商店,你可以看到官方和其他用户搭建好的工作流,目前已经有上千个,还在快速增长。

这些工作流可以直接使用,也可以作为模板复制。用户复制模板后,对它们进行学习和修改,将其改造为适合自己的应用。

对于模板作者来说,可以对模板设置价格,实现变现。

很多模板提供非常有意思的功能,值得一看。比如,"抖音转小红书"的模板。

你输入一个抖音的短视频链接,AI 自动生成10个可用标题和一段文案,你可以把它们连同视频一起发到小红书。

七、教程:情感故事爆文专家

网上已经有不少工作流模板的开发教程,大家可以去搜一下。

我看到一篇"情感故事爆文专家"的模板教程,非常有趣。情感类的网文现在流量很好,作者就开发了一个 AI 应用,专门生成这类文章。

先看成品,点击这个模板链接,体验一下它的效果。你输入一个文章主题,比如

一对情侣在大学里认识,毕业后分手,10年后再次相遇。

这个 AI 应用会输出文章的大纲和正文。

还带有配图,可以直接发布。

它背后的工作流,大致分成六个节点。

  1. 开始节点:接收用户输入的文章主题
  2. AI 模型节点:通过 AI 模型,根据文章主题,生成文章的大纲。
  3. 扩写节点:根据文章大纲,进行内容扩写,生成正文。
  4. 内容总结节点:根据正文,生成文章的内容总结。
  5. 文生图节点:根据内容总结,生成文章配图。
  6. 结束节点:汇总所有内容,输出结果。

设置完成后,点击"发布"按钮,这个 AI 应用就可以直接使用了。

八、结束语

工作流模式相比自己从头写,容易和快捷很多,服务端也一起解决了。如果你有 AI 开发的需求,可以试试这种模式。

下一步不妨就从文档开始,做出你的第一个工作流节点,发布到模板商店。

任何开发问题(估计肯定会遇到),可以加入官方咨询群去问,下面是微信群二维码。

我遇到问题,就咨询扣子的同学。他们告诉我,现在正好有两个活动,有大量的奖品,建议我参加。

我看了觉得很不错,下面把活动信息转发出来。如果你正好做了模板,就不要错过。

(1)模板比赛

工作流开发完成后,上架到模板商店,现在可以获取奖励

你可以对模板设置价格(官方审核通过后),实现模板变现,他人复制模板需要付费。在活动期间,官方根据模板复制的数量,会发放1000元到10000元的奖金,以及随机抽取的50个无线充电器的纪念奖。

(2)万圣节抽奖

官方现在有一个万圣节抽奖,在那里上传你的照片,会得到一张万圣节主题照,以及一次抽奖机会。

抽奖的奖品有 iPhone 16 Pro Max、Switch、咖啡机。

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2024年10月31日
❌
❌