Reading view

There are new articles available, click to refresh the page.

界面文化|维系系统运转的人,往往最没有话语权

CDT 档案卡
标题:维系系统运转的人,往往最没有话语权 | 专访
作者:界面文化组
发表日期:2026.3.12
来源:微信公众号-界面文化
主题归类:OpenClaw
CDS收藏:公民馆
版权说明:该作品版权归原作者所有。中国数字时代仅对原作进行存档,以对抗中国的网络审查。详细版权说明

file

撰文 | 徐鲁青

编辑 | 李欣媛

OpenClaw热潮下,人们纷纷排队安装龙虾。总有人告诉我们,算法将高速处理信息,把人带进一个更轻松的世界,龙虾热潮点燃的也是这一熟悉的承诺:自动化最终会让我们不用工作。

然而在特雷博尔·朔尔茨看来,自动化从不解放劳动者,正因此,他在《归我们》一书中着重讨论了“所有权”,也是后工作时代急需回答的问题,当 AI 接管越来越多任务,这套系统究竟归谁所有,又由谁来决定它如何运转?

朔尔茨是“平台合作主义”(platform cooperativism)概念最早的提出者之一,他反问:如果政治领域需要民主,为什么工作场域可以例外?在《归我们》一书中,他把目光移向平台的所有权与治理,并写下了过去十多年间已经发生、却很少进入主流叙事的尝试。在一些平台合作社里,有的配送员试着共同拥有配送平台,有的社区自己决定数据如何使用,也有一些照护和出行行业的劳动者,正在摸索更公平的组织方式。

合作社与企业不同的是,后者的所有权和决策权,通常掌握在少数合伙人手中,而合作社强调的是由成员共同拥有,通常实行“一人一票”,并让收益更多回到实际参与劳动的人手中。这种形式并不像想象中那么边缘,根据国际合作社联盟的数据,全球目前有约300万个合作社,覆盖全球约十分之一的就业人口。西班牙的蒙德拉贡合作社就拥有两百多家企业和超过七万名员工,是西班牙第十大企业集团。

朔尔茨试图追问当下被视作理所当然的经济秩序是否真的“别无选择”?在生成式AI迅速扩张,数据权力进一步向少数公司集中的今天,这个问题显得更加迫切了。对此,界面文化与特雷博尔·朔尔茨谈了谈平台合作社的现实实践、AI时代愈发集中的技术权力,以及在平台资本主义之外,人们是否还能重新想象另一种经济方式?

img

01 从“别无选择”到另一种制度想象

界面文化: 为什么会写《归我们!》这本书?

特雷博尔·朔尔茨:这本书并不是从一个抽象理念出发,是来自我长期的实践经验。过去十多年里,我持续参与并推动“平台合作主义”的具体项目,在不同国家与数百个合作组织一起工作,不断经历失败和重新尝试,《归我们!》正是写于这些现实过程之中 。

我与大约一千个合作组织有过直接合作,希望借此重新梳理数字经济中关于所有权、治理与劳动的讨论。更重要的是,我想反对一种被反复灌输的观念,仿佛现有的经济结构是一种“别无选择”。

在很多地方,我看到人们正在极其有限的条件下,努力搭建不同的路径。比如开普敦那些不断重新组织起来的出租车司机,或是墨西哥沿海一些渔业社区,他们在思考,数据究竟能不能真正服务本地家庭,而不是只被外部平台抽走。这样的实践也许并不宏大,却真实存在,而且长期没有被看见。

界面文化: 你提到人们总觉得主流的政治经济想象是“别无选择”,你觉得哪些假设最常被视为理所当然?

特雷博尔·朔尔茨:一个被默认的前提是,好像只要谈到规模,就一定要中心化。似乎大型系统只有依靠自上而下的层级治理,才能高效运转。分布式或联邦式治理,往往还没被认真讨论,就先被视为低效,或者过于理想。我担心正是这种想法,让我们过早放弃了别的可能性,比如合作社式、或者多中心的制度设计,它们未必不能在大规模条件下运转。

第二个常被默认的前提,是创新主要依赖资本配置,尤其是风险投资。久而久之,“获得风投支持的公司”就成了技术发展的标准答案。但我们很少认真去想,互助社、合作社是否也可能带来另一种创新路径,以及另一种分配结果。

还有一个更隐蔽的前提,是主流想象总倾向于把人理解成消费者、雇员或股东,而不是制度的设计者。这种限制是认知性的,当我们对自身能改变什么的想象不断缩小,制度的多样性也会随之萎缩。

img

”[德

界面文化: 大多数读者都不太清楚你说的”平台合作社“是什么,可以解释一下吗?

特雷博尔·朔尔茨:平台合作社也是一种数字平台。表面上看,它和我们熟悉的打车软件、外卖平台没有那么不同,同样有 App、算法和撮合系统。真正不同的地方在于“所有权”,也就是谁拥有它,以及由谁决定它怎么运转。传统平台通常由外部股东控制,平台合作社则更多掌握在真正使用它的人手里,比如劳动者和用户,或者两者共同参与。 

这些年,全球的平台合作社已经覆盖大约120万名劳动者,尤其在清洁、照护和配送这些行业。它不只是一个理想化的想法,在一些案例里,劳动者的收入可以达到主流平台的两倍,还拥有更稳定的排班、以及对平台规则的发言权。劳动者不再只是被管理的人,而是可以直接参与决定平台怎么运行,比如价格、数据,以及未来往哪个方向发展。他们不是只能等待政府来改革平台规则,而是在现实中先把另一种更民主的经济关系实践出来。

举个例子,西班牙格拉纳达的Givit配送合作社(Givit Delivery Cooperative),是一家由工人共同拥有的配送平台,已经可以在较大规模上提供“最后一公里”快递服务。到2025年,它每月配送订单超过20万单,拥有900多名活跃工人社员。和典型的零工劳动不同,这里的工人是雇员身份,有社会保障,收入也更稳定。 

合作社之所以在公共视野里显得“不起眼”,并非因为它们真的无足轻重,是因为它们很少进入商学院、法学院和主流商业叙事,用葛兰西的话说,这是“常识”被塑造的结果:某些经济形式被不断讲述、被视为天然合理,另一些可能性则慢慢退出了人们的想象。 

但不显眼不等于边缘。全球大约有10%的劳动力在合作社中就业,它们也一直在现实中改善着数以百万计人的生活,之所以经常被描述为“缺乏竞争力”,更多说明的是一种主流叙事的成功,而不一定是事实本身。

界面文化: 听起来是很理想的组织方式,但它们在现实中具体是怎么真正实现的?

特雷博尔·朔尔茨:这就涉及一个很关键的问题,平台合作社在法律上并没有一种放之四海而皆准的固定形式。它更像是一组还在不断摸索中的法律和组织实验,会根据所在行业、不同国家或地区的法律环境,以及具体使用的技术而调整。 

在一些地方,它就是比较传统的工人合作社;在另一些地方,它会把合作社所有权和LLC(有限责任公司)这样的公司结构结合起来。还有一些会同时设立非营利机构,引入“托管式所有权”机制、基金会,或者和公共部门合作。也就是说,它并不是只有一种标准答案,是在现实条件中不断寻找可行的组合。 

到了数据和AI治理领域,这种混合形态会更加明显。我们已经看到“数据合作社”开始出现:成员把自己的数据汇集起来,把它当作一种共享资源,集体决定这些数据如何被管理和使用。瑞士的MIDATA就是一个例子。在这个体系里,公民可以在民主监督下,共同决定自己的健康数据如何被用于科研和AI开发。

与此同时,围绕去中心化自治组织(DAO)的实验也在继续。它是一种基于区块链的治理形式。的确,有些 DAO 带有很强的投机色彩,但也有一些在认真探索:能不能把合作社的原则,比如共同治理、成员控制,写进代码之中。

所以今天我们看到的是,各种所有权结构正在相互交织。合作社原本强调的“一人一票”、民主控制、盈余返还成员等原则,正在和新的技术工具结合起来,比如密码学治理、联邦式云基础设施,以及数据托管机制。换句话说,平台合作社并非一张静态蓝图,是仍在展开中的创新现场。

当地时间2026年2月5日,印度新德里,印度内政与合作部长阿米特·沙阿在 Vigyan Bhawan 推出印度首个合作制网约车平台 Bharat Taxi,印度合作国务部长克里尚·帕尔·古尔贾尔、合作与民航国务部长穆尔利达尔·莫霍尔等人出席活动。(图片来源:视觉中国)当地时间2026年2月5日,印度新德里,印度内政与合作部长阿米特·沙阿在 Vigyan Bhawan 推出印度首个合作制网约车平台 Bharat Taxi,印度合作国务部长克里尚·帕尔·古尔贾尔、合作与民航国务部长穆尔利达尔·莫霍尔等人出席活动。(图片来源:视觉中国)

界面文化:你在十多年前就提出“平台合作主义”的概念,今天再提这个概念,你觉得它有了什么变化? 

特雷博尔·朔尔茨:早年很多人相信,合作社平台可以成长为下一个谷歌或苹果,今天看,这样的期待已经不现实了。真正重要的问题不是神话为什么破灭,是神话退场之后,人们在现实里还能做什么。

过去十年,成千上万的组织一直在尝试不同的平台合作模式,其中逐渐沉淀出一些相对稳定的实践。真正可行的路径,往往不是纯粹的理想模型,是各种混合型方案。比如在印度,由合作部推动的Bharat Taxi,依托社区所有的平台技术,已经吸纳了大约十万名司机。类似的尝试,在里约热内卢的市属网约车项目中也能看到,即便有些合作社仍以分包商形式存在,它们依然尽力保留集体所有、民主治理和劳动者保护这些核心原则。 

另一个经常被忽视的问题是,平台合作社不能被孤立来看。它们只有被放进一个更大的支持系统里,才更有可能长期存续。比如共享的数字基础设施、技术支持、制度资源,都会影响它能走多远。这也意味着,合作不能只停留在平台表面,要延伸到它背后的供应链和更广泛的协作网络中。 

02 AI基础设施背后,真正的问题是所有权

界面文化: “所有权”是你在书中反复强调的核心问题。互联网平台往往被看成是中立的平台,为什么它背后的“所有权结构”,长期没有被当作一个核心问题来讨论?

特雷博尔·朔尔茨: 技术从来不是中立的。互联网本身就起源于美国的军事项目,它从一开始就不只是工具,也是一种治理方式。数字系统看上去只是帮助人们行动,但实际上,它们会把一些政治选择写进代码里,进而影响人们如何行动。

朗登·温纳在《技术物具有政治性》中很早就指出了这一点。到了今天,这个判断已经变得更加直观。少数大型科技公司高度集中的权力,正在决定数字世界的规则。比如,一些AI系统会系统性地过滤某些政治议题,这往往是治理逻辑本身的体现。也正因为如此,所有权问题不能再被绕开,因为一个人不可能真正改变一套自己既不拥有、也不控制的系统。 

到了人工智能时代,这种集中趋势只会更明显。今天,全球约三分之二、几乎所有AI系统所依赖的云基础设施,掌握在亚马逊、微软和谷歌三家公司手中。当像英伟达这样的企业开始在全球范围内塑造人们获取算力的方式时,所有权就不再只是一个抽象概念,是基础设施层面的直接权力。

界面文化:说到这一点,你觉得现在的生成式AI会不会改变平台劳动?

特雷博尔·朔尔茨:生成式AI并没有真正改变平台劳动,它只是让这套结构变得更难被看见了。

早期的众包劳动者无论身在何处,时薪通常只有一到两美元。今天这种模式并没有消失,只是更系统地转移到了全球南方——大量数据工人仍以相近的报酬,支撑着今天被称为“人工智能”的系统运转。换句话说,AI经济依旧建立在大规模、低报酬、分散且隐形的劳动之上,只不过外面套上了一层更新、更具未来感的技术叙事。 

界面文化:你觉得未来的AI基础设施,有可能由合作社或公共机构来拥有和治理吗? 

特雷博尔·朔尔茨:这是我现在最关心的问题之一。现在的情况是,技术资源和决定权大多集中在少数大公司手里。从算力、数据到平台系统,真正掌握这些东西的人很少,但成本和风险,却不断被转嫁给下面的人,比如劳动者、数据工人,或者那些依赖平台生活的人。维系整个系统运转的人,往往最没有话语权,也最不容易被看见。

所以我提的“团结堆栈”,并不是某一个具体平台,更像是一种重新组织AI的思路。比如,算力设施可不可以由社区共同拥有?数据可不可以不再被平台单方面提取,是由使用者共同决定怎么管理?AI产业链上的工人,能不能拥有更多权利,甚至拥有一部分所有权?

这里最重要的是不同机构能不能协同起来,形成一种更稳定的合作关系。这些尝试现在还在早期阶段,但已经有一些实践在出现了。它们至少说明,AI并不一定只能按照今天这条路来发展。

比如,瑞士的Apertus很能说明“公共AI基础设施”这条路的可能性。这个模型由苏黎世联邦理工学院、洛桑联邦理工学院和瑞士国家超级计算中心共同开发,它被明确定位为一种面向公共利益的开放模型:模型架构、权重、训练数据和方法都尽可能公开,运行也依托公共研究基础设施,不是完全建立在商业闭源体系之上。还有法国的LESTAC,它代表的是“地方治理型 AI”的方向,并非由全球平台统一提供,而是在城市或地区尺度上,由公共机构和本地伙伴共同试验、共同管理。

这些条件其实并不是完全不存在。真正难的是怎么把它们连起来,变成一个能长期运转的整体。这也是我接下来想继续思考的问题。

界面文化:如果从平台合作主义倡导者的视角出发,反思当今主导性的经济体系,你认为最核心的问题是什么?

特雷博尔·朔尔茨:平台往往在策略上把自己定义为“科技公司”,而非“劳动公司”。它们将自身描绘成中立的技术中介,以此规避劳动法约束,也回避本应承担的社会责任。

与此同时,平台资本主义不断把本应由企业承担的成本向外转嫁。过去十年间,不少与劳动和交通相关的法律都被重写,以适应Uber这类平台公司的扩张。传统工会面对这种由App中介的劳动关系,也很难找到有效的组织杠杆,更难建立起持久的团结。平台劳动的一大特征,就是将劳动者不断个体化、彼此隔离:他们没有共享的工作空间,班次彼此错开,算法管理机制本身也在压制同伴之间的交流。久而久之,孤立会侵蚀信任,集体行动自然也更难持续。

最终带来的,不只是收入不平等,更是能动性的不平等,人们正在失去共同塑造日常技术系统的能力。

本文为独家原创内容,撰文:徐鲁青,编辑:李欣媛,未经授权不得转载。

时代改变了什么

Sol 他不喜欢朋友在微信里给他发语音、发起音频或视频通话,等等。这应该能引起很多人的共鸣:

现在我们手机不离手,社交通讯软件的普及,也让彼此之间的联系更加紧密了。说实话,这真是有利有弊。今天想聊聊关于这件事我讨厌什么,主要聊的是和朋友之间,不是那种陌生人,对,即使是好朋友,用社交软件找我,我也有几个讨厌的地方。

每个人的个性不同,无意评判是非对错,但这恰让我想到,问题的关键或许并不在此;我不觉得问题的关键是,这个时代里,朋友容易做什么让我们不舒服的事。或许我们该思考,是不是因为活在这个时代,而多了许多不是朋友的「朋友」?我是说,当我们浏览自己的联系人列表,难道没有哪个人,即便她深夜来电,我们也只会更好奇她要说什么,而不是感到厌烦?为什么她要挤在那么多不相干的人里面?

我们可以对比一下旧时光景。我一直是很内向的人,但我无法想象在我年幼的时代里,会讨厌我的朋友不先写个纸条,就直接在我家楼下大声喊我出去玩,也无法想象家里的电话响了,我会厌恶而不是兴奋地去接听。

这个时代改变了什么呢?当然,它让彼此之间的联系更加紧密了。好在选择和谁紧密连结的权利还在,做好自己的取舍,每次通知响起就都是妳期待的声音。

fin.

不是在国内,上个网就容易的

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

最近几天我上网的挫败感很强。

先是想分享我用 AI 绘制的两张高清大图,上传网盘设置好了一切之后,纷纷报告说「资源失效」,无法下载。而我自己访问没有问题,切换电脑,切换浏览器,一切都正常,但其他人就是不行。

然后是之前用这些图成功打印做成画框的读者分享网店,她先是写出网店的名字,其他读者说搜索不到。她放出订单截图,的确就是那个名字,大家依然搜索不到。我也去试过,指定搜索店铺,不行,减少几个字,不行,引号强制搜索,还是不行。

以前不是这样的。要分享什么资料,那就上传网盘,甩出一个链接,事情结束。要找什么网店,才输入头里几个字,后面的全称就自动联想出来,点一下就可以跳过去。怎么现在会变成了这幅模样?

我去搜索:网盘为什么会显示资源失效?网上给出的答案五花八门,可能是因为我没有开会员,可能是因为平台对图片内容敏感(无论穿没穿衣服),可能是因为短时间内访问流量太大……

这件事情的玄妙之处在于并没有官方解释,没有系统反馈,反正就是资源失效,具体的理由么,只能靠自己去意会。

我去搜索:为什么网店搜索不到?这一次答案更多:因为店铺新开,因为店铺成交不足,因为店铺违规限权,因为店铺没买关键词,因为店铺品名类目设置不当……

同样的,平台也没有任何解释,给了我一堆类似服务的店铺,感觉是有人在服务器那一头无所谓地笑着说:又不是只有这一家?

网盘限制这件事最后我貌似是解决了,那就是把图打包压缩成 Zip 文件,然后 Zip 文件再加密,起了个名字叫做「工程图纸」。反正这一次发布之后再没有读者嚷嚷无法访问,我猜测平台没有那么多资源来破解我的 Zip 文件密码,就只好听之任之。

网店搜索不到这件事现在对于我都还是一个谜,我是不大理解,为什么我输入了指定的关键词,却不能返回给我正确的结果。

然后也让我很震惊,因为之前我认为在电商平台上,我可以在无限家店里自由做选择,现在看来店铺既不是无限的,我也不是自由的。

联想到之前我的一些经历,我甚至都怀疑平台其实根据每个客人的消费数据,为每个人度身定做了一个网店圈,让人只能在这个范围内选择店铺,因为在这个范围内成交率最高。

想超出这个范围?除非是你朋友私下分享给你店铺网址,否则你搜都搜不到。

如果真是这样,这种圈养感未免也太强烈了一些。我希望事情并非如此,否则实在是太可怕了。

接连遇见这些让人感觉挫败的事情,直接影响到了我的心情和行为。上网那么多年来,现在是我分享欲最低的时候,因为我没有预料到如今在网上想分享几张图都那么麻烦,还要专门去做研究找方法。

与此同时,我在那个网购平台上的购买几乎立即就停滞了,因为我产生了深深的疑惑:如果我要搜索的店铺都搜索不到,那么我能搜索到的是什么?那些结果对于我是真有用还是对平台真有用?

所有这些经历和想法,在我这里归结为一个词,叫做:个人的网络处境。

我认为今天的个人网络处境并不乐观,受到的限制和盘剥太过严重。

比如说最近我就打算买硬盘和光驱,用硬盘和 CD 来储存我喜欢的音乐。原因是我虽然身为网易云音乐和 Tidal 的付费会员,结果当我想把音乐下载到本地方便离线收听的时候,我发现这些音乐文件全都是加密的特定格式。我下载了网易云音乐的音乐,那么就必须用网易云音乐播放器才能看见和播放。Tidal 也是同样,系统都看不见这些储存下来的音乐文件,更不用说用其他音乐播放器去播放了。

而且,这些音乐的访问权限和会员身份绑定。会员过期了,照样不能读取访问。得知这一点,我突然意识到我花钱买会员,购买到的只是个使用音乐文件的租赁权,而不是可以买一个音乐文件的数字拷贝。这样一来,如果我想听音乐,意味着我就要永远续费,因为我不曾真正拥有什么数字资产,我只是在租赁而已。

那我为什么不去自己购买高清数字音乐,自己购买 CD,自己在硬盘上做个私人音乐库呢?那起码是买了拷贝,算是我个人的数字资产,想怎么听怎么听,想转到什么设备就转到什么设备去。

总体上来说,我认为今天在网络上的每一个人在逐渐失去互联网早期自由民的身份,变成了平台的长期佃农或者是长工。平台更多是售卖服务而不是产品,即便是产品也有很多限制,用户不能获得完整的权限。于是,所有人能做的事情就是不断买服务,不断买完整功能。

一切又好像回到了 30 年前:每个人都需要一台自己的本地服务器,东西放在自己兜里才是最放心的。

FLUX Kontext – 黑森林图像生成式流匹配模型发布实测

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

长时间没消息的黑森林工作室憋了个大的,发布了生成式流匹配模型 Kontext。

这套模型最强的地方就是可以对进行编辑,但是不会影响没有编辑的地方。

而且还支持多张参考生成新的图像,依然能保持需要参考内容的高度一致性。

直接替代了很多原来需要 PS (美图秀秀、Photoshop 等)才能做的需求,原来需要吭哧瘪肚 P 很久的图,现在说句话就行。

我这几天也探索了很多这个模型的用法,这次不会以测试的形式展示了,全是具体用法,让你告别 P 图这个复杂难搞的操作,另外后面也会介绍所有可以使用这个模型的渠道。

🎨 先介绍一下我探索出来的各种用法:

首先是非常简单的图片修改需求, Kontext 支持通过简单的提示词对图片进行非常精细的修改,而且不会影响未修改的区域。

我们想要给自己的日常照片加一些配饰或者改一下照片的姿势都没有问题,可以看到人物的面部一致性都没有问题,而且修改的地方跟环境也融合的很好。

⚠️注意: Kontext 只支持英文提示词,我这里放中文是方便理解,你可以用 或者翻译软件把提示翻译了使用

FLUX Kontext – 黑森林图像生成式流匹配模型发布实测

当然 FLUX Kontext 也可以对照片进行大幅度的更改,比如你想要给照片换个背景或者给你自己换一身应景的衣服,再或者在前面的基础上换个姿势。

可以看到我把场景变成了酒吧,整个光线氛围也同步发生了变化,之后又尝试了不同的拍摄角度和姿势,也没有问题。

这种修改需要注意的是优势 Kontext 的分辨率是固定的,画全身照的时候面部有可能会变糊,因为像素区域太小的原因。

🎉 从左到右的提示词分别是:

站在酒吧吧台前

低角度侧脸,白衬衫加领带,吧台灯带背光

左侧半身特写,黑色皮夹克,霓虹灯映衬

全身广角,红色鸡尾酒裙,手扶吧椅

背后平视,帽饰西装,吧台酒架虚化

之前很火给老照片上色和修复也不是问题。

比如我下面的测试提示词就只有给照片上色,Kontext 处理的很好,而且整个色彩非常的高级和自然,明暗关系处理的很好。

想要做风格化?也没问题,只需要一句“将图片变成真实照片”的提示词就行,所有的细节都还原的很好。

当然可能更多人的需求是把自己的照片变成风格化的图片。

比如我们可以输入“把照片转换为吉卜力风格”,Kontext 也处理的很好而且人物的主要特征和电车的特征都还原了,不存在 4o 那种过度重绘和修改细节的问题。

而且这玩意还能修改图片上的文字,最屌的是不会影响原来的其他内容,而且修改的文字字体依然可以保持原来的风格。

你只需要输入“将图片中的 XXX 文字修改为 XXX”就行,比如我这里就把主要的标题改为了 Guizang,字体风格都是一致的,而且他还知道不需要换行。

针对海报复杂一些的修改也是可以的,你可以把一张找到的现成海报改掉文字和内容变成你自己的。

比如这里我就把 Oppo 的倒计时海报改成了小米的,而且连背景色都换了,Kontext 很好的处理了玻璃散射光的那部分。

这里唯一可惜的就是 FLUX Kontext 不支持生成中文,所以你只能修改图片中的英文,但是如果你不修改里面的中文,文字是不受影响的,这比其他图像模型好多了。

Change “Oppo” to “Xiaomi”, and set the image background color to orange.

这个是 Padphone 老师的,FLUX Kontext 还是目前最强的去水印模型,可以去掉各种复杂恶心的水印。

比如这里我找了一个 Unsplash 带水印的图片,这种半透明的水印会和图片叠加混合非常难彻底去掉,你只需要跟 Kontext 说“去掉图片的水印”,接下来奇迹就会发生,一点水印都没了。

大家最近应该都被一些 AI 图像模型生成图片默认加水印搞得不堪其扰把,即使开了会员依然有水印,这时候就可以让 Kontext 帮你解决了。

我们也可以用 Kontext 给各种平面的文字或者图案添加上材质和背景,替代原来需要 3D 渲染才能完成的需求,非常适合做品牌设计和平面设计的朋友。

比如这里我就给这个 Logo 变成了金属材质,还给图片加上了草地的背景,可以看到 Kontext 把 Logo 的一些笔画细节还原的非常好。

🎹

Transform the logo text into a shimmering metallic material, floating above a grassy field filled with flowers.

Kontext 还可以在你浏览景区的时候帮你把各种无关的其他游客搞掉,再也不用担心自己好不容易拍了账号照片,结果被误入的其他人毁掉了。

可以看到 Kontext 可以很清楚的识别画面的主体不会连你想拍的人也一起去掉,当然你如果就是想拍风景也可以,让他去掉画面上所有的人就行。

去掉照片中跟主体无关的其他行人

去掉照片中所有的人

前几天收到了可灵的一周年礼盒,看到 Padphone 老师做的展示图手痒,就想看看能不能用 Kontext 做出来,没想到真可以还做的很好。

非常离谱是他连我箱子放地上的灰尘都还原了,下次你要是想要生成类似图片的话记得擦一下产品再拍,哈哈。

💡

一个黑色箱子放在一张舒适、有褶皱的白色毯子中央,毯子的织物纹理清晰可见。瓶子周围自然地摆放着一些精致的白色小苍兰,几片花瓣零星散落。阳光柔和地洒下,投下柔和、弥散的阴影,营造出一种温暖而宁静的氛围。非常逼真的特写场景,光线是柔和的自然日光。

很多人说箱子是立方体太好生成了,整点复杂的,那我们拿可灵礼盒里的工服试试。

显然也没啥问题,文字有问题是因为生成图片的分辨率低,文字又小,导致的模糊,就跟我们拍照的时候离得远的文字也会模糊一样。

一件黑色 T 恤水平漂浮于空中,正从天花板向地板降落,看起来毫无重量。画面中无人,充满超现实感且不受重力影响。光线柔和,风格简约而优雅。背景为灰色。

很多朋友说我想要更复杂的商品展示,指定多张图片的模特和商品然后合成到一个图片中行不行,也是可以的,多图参考有点复杂我后面会讲。

可以看到第一张图商品细节、模特服装、配饰、发型以及背景都没问题,这个惊到我了。

第二张图我让模特穿上了可灵的工服,这次连衣服上的小字都还原了,可以说是完美还原,这个你让我在电商平台刷到,加上电商平台的压缩,我看不出来说实话。

这里有个小FLUX Kontext 手持产品的时候,产品一般会比正常的比例偏大,这个时候提示词描述一下产品大小就可以解决问题,比如手持易拉罐变为手持小号易拉罐。

女孩拿着化妆品瓶子

女孩穿着这件 T 恤

最后压轴的是我们日常修图最常见的需求,大家都想把自己变得好看点,面部的美颜现在都发展的比较好了。

但是身体部位很多还是靠用美图或者用醒图一点点的 P,自带的一键优化非常的生硬死板,不够自然。

昨天试了一下给男生增肌, FLUX Kontext 可以很好的理解需求,图片任何部分都没变化,只有胳膊的肌肉变大了,这要是不说谁知道我 P 了,哈哈。

🍞

男性胳膊的肌肉变大,面部没有变化。

那变瘦点是不是也可以呢,可以的,甚至都能瘦脸,瘦的很自然,不会再让人从扭曲的门把手或者瓷砖看到自己 P 图了,突然想到这下卖减肥药和健身课的是不是又爽了,一键搞定素材。

📍

让女性的胳膊变瘦,肚子变得平坦,去掉面部赘肉

如果你就是单纯的想要尝试一下这个模型 不想涉及到复杂操作的话我推荐两个渠道:

FLUX 官方的 Palyground (https://playground.bfl.ai/image/edit)和 Krea (https://www.krea.ai/edit)其中 FLUX 的 Palyground 还送了 200 积分,生成一张图只消耗 4 积分,够你玩很久了。

这两个地方的使用都很简单上传图片,输入提示词然后等待就行。

其中 Krea 选择 FLUX Kontext 的 Pro 模型就行 Max 模型在单图修改场景反而效果不好。

FLUX 的 Palyground 的话生成的时候记得把在输入框右边三个点那里把每次生成的张数改成 1,不然一次生成 4 张有点浪费。

如果你想要开发产品或者有 Comfyui 的基础想要玩一下多图参考,这里我推荐 Fal 的渠道(https://fal.ai/models/fal-ai/flux-pro/kontext/max/multi)。

Fal 的测试页面可以直接使用多图参考,上传图片输入提示词就行,如果你不想用多图了,可以在页面上方红框那里选择其他 Pro 模型尝试单图编辑。

另外 Fal 也有他们的 Comfyui 插件,只需要在 Comfyui manager 里面 ComfyUI-fal-API 然后安装就行。

安装之后在插件目录,找到 config.ini 文件,把里面 这段话改成你的 API Key 就行。

工作流的搭建很简单找到 FLUX Pro Kontext Multi 这个节点链接多张图,之后输入提示词就行,另外由于这个是 API 节点不需要本地算力,所以 电脑也可以玩。

在涉及到针对人体的精细修改比如变瘦、变老变年轻需要多抽卡,不一定一次能成功。

多图参考的时候人脸的 ID 保持会下降,保持 ID 最好的方式是让 FLUX 不要修改面部。

FLUX Kontext 是可以识别图片里面的涂鸦标记的意思的。

你可以将你想要修改的地方圈起来,生成的时候他不会把标记生成进去,这样就可以实现精确修改,比如这个来自 @fofrAI 的案例,没有提示词就实现了换脸。

好了今天的教程到这里就结束了。

FLUX Kontext 除了强大能力之外的另一个优势是他非常便宜,编辑一张图只需要 0.08 美元也就是 5 毛钱人民币,相较于 -4o 一张图 1.4 人民币的价格可以说非常便宜了。

另外他们后面还会一个 Dev 的 Kontext 模型这个会让成本进一步降低,太期待了。

从全球流量排名看中文信息茧房

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

截止 2025 年 3 月 1 日,根据 Similarweb 网站排名, 当全球网民在 Google 检索知识、在 YouTube 观看视频、在 Facebook 分享生活时,中国互联网用户正困守在一个由百度(第 15 位)、淘宝(跌出前 100 位)和微信构筑的数字孤岛。

Alexa 数据显示,全球前 15 大流量平台中,仅百度(第 15 位)、俄罗斯 Yandex(第 12 位)和部分受限的雅虎(第 10 位)能在境内正常访问。

这种物理层面网络隔绝,造就了人类文明史上最吊诡的景观:14 亿人口的市场与全球 60%的英语信息之间,横亘着无形的数字柏林墙。

搜索引擎的对比尤为刺眼:Google853 亿月访问量统治着全球信息分发,而百度虽在中国市场独占鳌头,其国际影响力却仅限于中文世界。

更令人深思的是,即便在被封锁的状态下,Google 仍以断层优势稳居榜首,这种”缺席的统治力”印证了开放生态的顽强生命力。

正如三星退出中国仍保持全球销量第一,谷歌被屏蔽 13 年依然傲视群雄,这些现象都在叩问:我们引以为傲的”市场规模”,是否只是温水煮青蛙的幻象?

当英语世界创造着占全球 60%的互联网内容,中文信息仅贡献 1.3%的微小份额,这种悬殊对比揭开了残酷真相:每个中文网民本质上都生活在经过三重过滤的”楚门世界”。

在抖音推送的娱乐至死中,在微博热搜的议程设置里,在微信朋友圈的信息茧房内,人们接触的所谓”海量信息”,不过是浩瀚知识海洋中的涓滴之水。

这种认知局限在学术领域尤为致命。

维基百科(第 8 位)作为全球最大的知识共享平台,其英文词条数量是中文版的 15 倍。

当中国学生还在百度百科检索被阉割的知识时,国际学术界早已在 arXiv、PubMed 等开放平台实现知识共享。

更可怕的是,那些呼吁”取消英语教育”的喧嚣,正在将阶层固化推向深渊——精英阶层通过匿名服务突破封锁获取全球 60%的信息,而普通民众却被永久禁锢在 1.3%的围城之中。

中国互联网企业看似辉煌的流量数据,实则暴露出结构性危机。

淘宝虽在国内电商市场称雄,其全球排名却已跌出前 100;腾讯视频坐拥庞大用户群,但内容创新力远逊于 Netflix(第 18 位);即便是引以为傲的短视频平台 TikTok(第 14 位),也因地缘政治风险在多个市场遭遇封杀。

这种”内卷式繁荣”折射出中国互联网经济的致命伤:过度依赖封闭市场,缺乏真正的全球竞争力。

反观亚马逊(第 13 位)的全球化布局,其日本、德国、印度站点同步跻身全球百强,这种”多点开花”的生态正是中国企业欠缺的。

当我们的电商平台还在为”二选一”垄断沾沾自喜时,Booking.com 已通过全球化运营实现月访问量飙升。这种对比残酷地揭示:在温室里培育的巨头,终究难敌旷野中生长的猛兽。

打破困局需要三重觉醒:

首先,必须承认中文信息生态的先天不足,1.3%的占比不仅是数量劣势,更是质量危机——当百度百科充斥着商业软文,当知网沦为空壳论文的仓库,我们拿什么参与全球知识生产?

其次,要正视语言壁垒带来的认知断层,英语不应是特权的通行证,而应成为公民的基础素养。

最后,需要重建开放包容的互联网精神,正如 B 站通过引进国际优质内容实现破圈,真正的文化自信从来不是闭关锁国。

那些叫嚣”取消英语”的愚昧,那些沉醉”市场规模”的虚妄,那些迷信”信息管控”的短视,终将被证明是文明进程中的逆流。

当俄罗斯 Yandex 都在努力突破语言边界时,我们是否该反思:困守 1.3%的信息孤岛,真的能孕育出引领人类文明的力量吗?答案,早已写在谷歌 853 亿月访问量的星辰大海里。

笨还是蠢

DUN.IM BLOG

DUN.IM BLOG

面对错误,面对失败,人们经常会自责:「我真蠢」。通常我不会劝慰,因为我理解,这种自我惩戒能带来一种另类的爽,和挠发痒的伤口一个道理,不让挠就是不人道。但我的确认为这里的中文有一点小问题,「蠢」不是合适的那个字眼,「笨」才是。蠢和笨有很大区别吗?这两个字不是经常连在一起用的么?在我的理解里,蠢和笨是两回事,蠢人和笨人也是两种人。

过几天就要到二十四节气的惊蛰了,据说惊蛰会打雷,把蛰伏在泥土里的小虫子唤醒。虫子在泥土里蠕动,东北方言所谓的「蛄蛹」,就是「蠢」字的来源—意思是笨拙迟缓,看字型就很清楚了,蠢就是春天的虫子嘛。重点在于虫子,虫子这种形态局限了虫子的可能。换句话来说,虫子的问题不在于笨拙迟缓,而是它没有办法认识这个世界,甚至也无法认知自己。当然,虫子肯定不会觉得自己笨拙迟缓,每一刻都蛄蛹得很自信,不信你随手捡起一条感受一下它蛄蛹的气力。

笨在我理解里是思维慢的意思。别人花 5 分钟想明白的事情,笨人可能需要半小时。别人听一次就能理解的东西,笨人也许要反反复复许多次才成。

但是和蠢不同,笨人是有光明未来的,他只是慢,又不是根本不会去想,根本不会去做。无非是聪明人通常早到,笨人会晚点。笨人知道自己是谁,也知道自己在做什么、怎么做,这是和蠢人最大的区别。

而且,笨也不是什么多大的坏事。「笨」字有个竹字头,它最早的字意是竹子的内膜。所谓「竹其表曰笢(mǐn),其里曰笨,谓中之白质者也。其白如纸,可手揭者」,竹子的表皮叫做笢,内里叫做笨,就是其中白色部分,它白得就像是纸,可以用手揭下来。用来形容人的时候,意思是纯洁清白。后来不知道怎么转成了笨重的意思,形容一个人的身量,最后又转成了今天的头脑迟钝不聪明的意思。所以,有人说自己笨,不妨理解为自己因为纯洁清白因而显得有些头脑简单,那是不懂欣赏而已。

所以,当有人自责或评价的时候说蠢,我就要仔细看一下,但通常看下来,人们只是笨而已,也就是思虑的周全,或者事情的完整。不过是个过程中临时的困境,调整一下,重新尝试几次,也许就能做全或者完成,无非是多了一些周折罢了。

笨没有问题的,比别人多废一点时间是多么了不起的事情,最终能抵达就行。而蠢是绝计不能的,笨人起码会承认自己笨,而蠢人对自己的蠢不知不认毫无觉察,这就是问题所在。

了解我的人说我有「厌蠢症」,我会常常反思一下,的确是有这个问题。看到一个人的一句话,看他怎么选择中文词组,看他怎么组织句子,怎么交流沟通,我就可以推断这个人是怎么想的,为什么会那么想。如果我认为对方会在自己的这种想法里怎么都出不来,那我就会瞬间失去耐心,因为那是蠢,蠢因为无自知无自省,所以是无药可救的,继续交流完全是在浪费时间精力。

事实上,当一个人会自责的时候,就只能是笨。因为蠢人不知不认不改,是不需要自责,更不需要反思,自己永远是对的,错的是全世界。如果一个人还能自省,说明并不蠢,还有找到出路的希望。别做「蠢人」,多少为自己的未来保留一点希望,保留一点光明。有这一点点光亮在,可以和任何人事物友好相处,人就可以继续前进,也就依然有可能最终抵达。此外,出于人道主义精神考虑,谁也不希望每天醒来,满眼看到的都是浪潮一样的蛄蛹而来吧?那我还过什么个劲儿呢?

话都说不清楚

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

最近有很多人假装关心,问我是如何更好的使用 AI 的,那我也就假装解答一下。我认为任何人都应该学习利用 AI,我分享自己利用 AI 工具经验和技巧思考,信息量已经足够多了。但是想要做到,可能还需要自己去探索,去做大量尝试。

很多人希望我直接出个教程,甚至最好是个视频教程,自己好按图索骥,照猫画虎。但我没兴趣,讲述起来太麻烦,我不想自己太累。这样一来,就会有人说我傲慢冷漠,说我小气藏私,说我老登加爹味,诸如此类的酸话。其实我是真的累,心累,很早就把自己的期待降到了最低。比如说如何在国内使用 AI 的话题,我早分享过,甚至还贴出了链接。但是总有人不断来问,所以我说他们是「假装关心」,连提问前先搜索一下都做不到。

对此我能理解,因为我没期待。我不期待每个人都会关心我的分享,我也不期待每个人在提问前会主动搜索信息,我习惯了张嘴就问,所以我相信 AI 更能满足他们的需求。

现在国内也普及了 AI,我又发现了一个更加致命的问题:很多人连话都说不清楚。

对,我说了,你只需要像是和人说话一样吩咐 AI 去做事就好。我观察了几百条和 AI 之间的互动,看完内心充满了同情。

很多人的确是用和人说话方式来和 AI 交流,我仔细看了,他们平常可能就是这样和人说话的,所以看完我极度同情那些不得不和他们对话的人。他们所面对的,是混乱含糊,逻辑不清,而且相当粗鲁无礼的对话内容。

事实上,人类让 AI 去做什么事,这是在下达指令、请求。为了便于大众接受和实用,这里抹去了指令、咒语、提示语、Prompt 一类的术语,而是用大白话说:你像是和一个人说话那样,去吩咐 AI 做事。但它本质上就是个指令请求,这一点不会因为描述方式改变而改变。

那么,无论对面是一个人还是一个 AI,你给出的指令请求应该清晰明了,好让对方明确知道自己应该怎么去做—让我吃惊的是,很多人根本做不到这一点,他们连话都讲不清楚。

我看到,很多人上来张嘴就是:「给我分享」「给我照片」。什么图片?关于什么的分享?具体是要给你建议还是帮助解决需求?谁知道你心里想着的具体是什么?

还有人上来就问:「送什么好」。谁送,送谁,为什么送,双方什么关系,什么地区,什么当地风俗?一概没有。于是,AI 弄了一些关于赠送礼物的片汤话回复。看完马上不高兴了:「我要的是送礼的推荐,东西呢?!」。

人可能真的是生来就有不同。我朋友的女儿,我管她叫小妹,小学生一个。有天发来语音问我 AI 绘画的事情,说是让 AI 画了一张仓鼠的图,很不满意,问我应该怎么弄。我让她把自己给 AI 的指令/请求/咒语/提示语/Prompt 发来让我看看,看完之后,我重新构造了一条发还给她,跟她讲:

AI 要知道画什么,你就得给出一系列明确的指示—什么载体、什么材质、什么风格、什么角度、什么镜头、什么光线,然后角色是什么神态、什么姿势、什么动作、什么状态、什么地点、什么空间、什么氛围,你得清晰地指定了,才不会出现你想要 AI 画一张油画,它给你一张照片或者漫画的悲剧。小妹当场就能理解,高高兴兴蹦蹦跳跳自己去尝试了。

我一点都不担心小妹,多余的一句叮咛都没有。为什么?因为我见过她提出请求,我们一起吃饭的时候,她说:「我能不能要两个冰淇淋球,一个香草的,一个巧克力的」。停顿了一下,又补充说:「我可以和妈妈一起分着吃」。

要求非常清晰非常明确,所有人都能听懂她要什么。甚至她还考虑到对方用吃太多不好作为反对理由,预先把补丁给打上了—不是自己一个人全吃掉。

许多人活几十岁,不如一个孩子。我朋友的一任失败前女友就是如此,一开口所有人都想跳上去打。每次她一开口,就是盯着你娇憨地一句:「要」「想要」「我要」「想吃」。她是说什么,你要什么?为什么要?有什么必要?他妈的宾语呢?要煎饼呢要要要!

把话说清楚,把请求把要求把指令一二三四说清楚,让人能听懂,知道你的意图,可以明确根据你所说的去执行,我真的没有想到这其实是一项极高的要求,有那么多人居然做不到,更别说与人真诚的讨论/交流/商量/沟通。这样说起来,我先前的期待其实还不足够低,人们不单不会主动搜索找寻答案,人们连把话说清楚都有相当困难。

总听人在讨论 AI 替代人类的话题。我现在觉得这种讨论都多余,说什么人类和 AI 竞争呢?很多人连话都说不清楚,无法表达自己的意图,无法表达自己的想法,无法表达自己的情感,这本身在人类社会里就会被交际和工作所排斥,因为不知道他在说什么,想要表达什么,如何与其相处,哪里还需要等到被 AI 替代的一天?现在就是高度可替换的。

我以前说,将来的人们可能写不清楚,只能拍个视频出来。现在我担心视频怕是也不成,因为你都不知道他在视频里颠三倒四、莫名其妙说了些什么,世界上就找不出几个人来能听懂。

认错要快,感激要慢

DUN.IM BLOG

DUN.IM BLOG

有人问我,怎样才是最好的认错时机?说是一直在热身,但始终下不定决心向对方「低头」。

这个问题问我可能没什么用,因为我早就过了那个阶段,我现在的原则是有错当场就认了,绝不过夜。认错要快,这就是我的态度。在网上,有时候我因为理解错误,或者过度自信,结果错怼了人。我的做法是立即认错,有时候还要把留言置顶,让更多人看到。

站在我的角度,我有更为充分的理由不能向网上的一位陌生人「低头」,我也有足够的语言技巧可以把问题搅得天翻地覆,反正大多数读者都会无条件站在我那一边。那我为什么认错得如此爽脆?

因为从心理上来说,因为我的过错而对他人造成了伤害,每多过一秒钟对方的愤怒都会上升一个等级。人在一开始是会期待认错的,如果认错准点到达,那么一切都好说。

最可怕的是人等待到一定时间没有得到任何错意,那么这个人就不再期待认错,而是转向去想着报复,这就会把小矛盾变成私人恩怨,伤害就一定要用伤害来弥补

所以,准点认错都是不够的,最好提前认错,越早越好

至于说自己的面子,或者说是虚荣心,我是这么看的:世间最不值得投入时间精力金钱的就是这类东西,没有一次维护是成功的,没有一次维护从长远上看是有价值的。

尤其是为了面子而坚持不认错,最后很可能连面子带里子全部都会失去,自己会成为错误本身,也会成为错误的代价,而且会是高价。

有错当场就认了,对于自己而言,无论自我感觉多么难堪,认完错后对方表示原谅的一瞬间,事情就可以放下了。我认为这就是认错的福利,人从此不再需要自我折磨,也无需活在后悔或者懊恼之中。

问我什么是合适的认错时机,问我究竟要不要认错,这不是提问,这是人在受折磨。折磨是从哪里来的呢?都是自己找的。

与此对应的,感激要慢,类似的话我说过不止一次。但我觉得值得多说几次,因为人们认错的机会少,但是需要感激的场合多。

收到他人的礼物,得到他人的帮助,受了他人的恩义,有些人坚持当场就要回报,就要感激,觉得不那么做就是占别人便宜。在我看来,这要比坚持不认错还要糟糕。

人际关系不是去小超市买东西。别人送你个礼物帮你个忙,就是老板给你一瓶水,你当场刷过去 3 块钱,大家就算是两清了。清不了的,别人帮助你,你首先得承情

承认这是个人情,是一份情意,然后接受这一份人情,珍惜这一份情意。立即感激,那是要两清的意思,效果和直接打脸差不多—不承认礼物的心意,不承认得到帮助,不承认有任何恩义的存在,大家彼此之间就是个交易,不要有任何羁绊,不要有任何因果。

「蒙此大恩,容后再报」这不是单纯的客气话,「容后再报」的意思就是承情。

去年,我大学好友的遗孀和女儿想去母校看看,但是找不到门路进去,问到我这里来。后来,经我在网上求助,许多老师校友伸出援手,非常妥帖地解决了参观的所有手续。接下来,我做了三件事:

这就是我的个人做法。认错要从重从快,这样对方才会从不痛快变成痛快。认个错还要分步骤,讲策略,那就是自找麻烦,每过一分钟都会让你的错意贬值一大截。迟到的认错就和迟到的正义一样,是一种羞辱。

感激要慢要审慎,要考虑对方的想法,要考虑对方的接受程度。不好把人际关系变成生意或者是借贷,除非你的确不想承这份情,那么当场还礼就算是含蓄地拒人于千里之外。

现代人的习惯刚好相反,认错的时候很慢,很审慎,开口索要帮助的时候很快,很频繁,得到帮助之后感激更快,更干脆。

总体上来说,给人一种不值得相处的感觉,一切都是一笔交易货到付款的感觉。不过,如果现在人人都如此,也是一种新型的人际关系,主打一个短平快,主打一个不粘锅,也不是不可以,反正人间是所有人的人间。

❌