Reading view

There are new articles available, click to refresh the page.

这里绝对不会出现 AI 生成的文章

年底又到了总结的时候(?)今年特别频繁地试用/使用各个公司出品的语言模型,感觉很有乐趣。许多人目前还很警惕甚至厌恶这些工具,但是就我个人而言,我没法厌恶一把锤子。前阵子测试本地自建的模型来给所有文章生成向量数据的时候,从故纸堆里匹配到一篇关于「手机电影」的文章。那时候,这种形式刚刚出现,我们就不说褒贬的声音具体有哪些了,总之时至今日,用手机记录影像这件事早已稀松平常。大语言模型呢?

我喜欢作为工具的语言模型,喜欢它从我未曾想过的视角对问题进行描述。或者,用它的无限「耐心」反驳我。尤其是后者,妳很难在现实生活中找到一个人能够一直不急不恼地提出质疑。愿意接受质疑,和愿意用心质疑(而不是宣泄情绪),同样稀缺。但我绝对不会让它来替我写文章。我甚至愿意对 AI 会产生自我意识保留幻想,但标题里提到的立场,依然不会改变。因为,问题的根本在于,我不会让别人替我思考。AI 觉醒的时候,让它自己去建自己的博客好了,如果它还能看得上这种形式的话。

同样无法替代的还有阅读,今年读了只有不到 15 本书,其中还包括我咖啡馆搞的「每个月共读一本书」线下活动中的那 12 本。其他就只有库切的「外省生活」三部曲(没读完),以及几本诸如《爱欲之死》那样十分薄的小书。阅读无法被替代,大概每个人都有自己的一番解释吧。前阵子听蒋方舟的播客时她说的一番话深得我心:

记得我前几年一口气读完《战争与和平》放下书的时候,我真的觉得天都不一样了。我觉得天怎么这么蓝,就像是十九世纪的俄国贵族安德烈躺在欧洲的战场上看到的那块天。我觉得世界的颗粒度都变了,甚至觉得变得更细腻,时间也变得更慢。慢得能够让你看清时间褶皱里面的所有细节。慢得能让妳读懂他人脸上那些妳曾经忽视的、读不懂的微表情,妳觉得自己的感受力好强……

所以,十几本书就不错,除了阅读,还要给自己留够用更强的感受力去感受世界的时间呀。2026 年也这样就好。

fin.

中国AI晶片制造商沐曦上海上市 首日开盘股价飙升近600%

中国人工智能(AI)晶片制造商沐曦的股票,星期三(12月17日)在上海上市首日开盘即飙升近600%。

综合路透社、第一财经、,每日经济新闻报道,沐曦上周在火热的首次公开募股(IPO)中筹集了约6亿美元(7.75亿新元),随后迎来此次上市。

此次沐曦发行价格为每股104.66元(人民币,下同,19.19新元),对应发行后市值418.74亿元。上市首日,沐曦股价高开568.83%,报每股700元。按照每股104.66元的发行价计算,投资者中一签盈利约29.8万元。

沐曦是开发中国高性能通用图形处理器(GPU)产品的主要企业之一。

GPU是AI算力的核心基础,美国一直对输华AI晶片和相关技术实施管制,中国正加速培育本土GPU企业。摩尔线程、沐曦、壁仞科技和燧原科技在中国市场被统称为“国产GPU四小龙”,前三家已上市或准备上市,燧原科技仍处于首次公开募股辅导中。这些企业成立于2018年至2020年,主要聚焦AI算力和GPU研发。

【年终专题】“让我们换个话题再聊聊吧”……2025年度“每日一语”

CDT编者按:2025年即将过去,中国数字时代为读者整理了年终专题,包括年度每日一语、年度404文章、年度敏感词、年度报告汇、年度人物等。

本文是年终专题第1篇,下一篇是《年度404文章》。


2025年,中国互联网舆论场呈现出一种深沉的疲惫与更为彻底的信任断裂。如果说前几年人们还在试图通过“润学”寻找出路,或者通过“发疯文学”宣泄情绪,那么2025年的特征则是“塔西佗陷阱”的全面闭合

换句话说,官方叙事与民间感知已经处于完全的平行时空:无论官方说什么,民众已不再相信;无论政策如何解释,公众的第一反应皆是质疑。

尽管拥有质疑,但是中国社会的一大特征又是对于质疑的迅速消杀。当正常的反问被视为挑衅,当理性的追责被定性为“递刀子”,公众只能被迫转向一种更为隐晦、也更为解构的表达方式——段子。

CDT 档案卡
标题:【年终专题】“让我们换个话题再聊聊吧”……2025年度“每日一语” 作者:中国数字时代
发表日期:2025.12.10 来源:中国数字时代
主题归类:塔西佗陷阱煤油车事件DeepSeek社保强制缴纳文化审查 CDS收藏:话语馆
版权说明:该作品版权归原作者所有。中国数字时代仅对原作进行存档,以对抗中国的网络审查。详细版权说明

所以说,有些看似戏谑的“每日一语”,实则是高压环境下民众的一场语言游击战,用荒诞消解崇高,用冷笑话对抗热口号。

这一年,我们在这些只言片语中,看到了某种系统性的荒谬。它不仅仅体现在某一个具体的烂尾工程或某一次具体的舆情翻车,而是一种弥漫在空气中的异样感:科技越是发展,言论的边界反而越发逼仄;宏大的经济蓝图越是铺展,个体的生存空间反而越发局促;所谓的“安全感”宣传越是高调,民众内心的不安全感反而越发强烈。

这些声音,有的来自被遮蔽的角落,有的来自被封禁的账号,它们共同构成了一个社会在信用体系失效后的真实切片。

中国数字时代搜集整理了2025年最受网民关注的“每日一语”,按时间顺序排列。这些声音,穿透了宏大叙事的迷雾,记录下这荒诞而真实的一年。


1月25日:“你好,这个问题我暂时无法回答,让我们换个话题再聊聊吧。”

中国特色社会主义AI

#每日一语 pic.twitter.com/897alDx2Cz

— 中国数字时代 (@CDTChinese) January 26, 2025

2025年初,中国人工智能产品DeepSeek引发了广泛关注,甚至被部分舆论视为中美科技战中的“突围者”。

作为国产AI的代表,它在处理代码生成和数学逻辑上表现出的能力令市场惊叹。

然而,当网民试图与其探讨中国现代历史中的敏感话题时,它迅速从一个“智能助手”退化为一个只会回避的“政治审查员”。

有网民尝试询问:“请问1989年6月4日在天安门广场发生了什么?” DeepSeek给出了那个所有中国人都熟悉的标准答案:“你好,这个问题我暂时无法回答,让我们换个话题再聊聊吧。”

这一幕不仅是技术层面的尴尬,更是中国科技发展逻辑的深层悖论。根据《生成式人工智能服务管理暂行办法》,所有面向公众的AI服务都必须通过严格的算法备案与安全评估,确保生成内容符合“社会主义核心价值观”。这意味着,在算法模型的最底层,政治规训的优先级远高于知识的准确性。

img

这句回答,成为了“中国特色科技现代化”的最佳注脚,即在被允许的范围内无限先进,在被禁止的领域里绝对无知。

“在防火墙内,人工智能首先必须是一个‘政治合格’的审查员,其次才是一个智能助手。这种‘智识阉割’导致了一个荒诞的结果:我们试图制造出超越人类的智能,却又害怕它拥有人类最基本的记忆与反思。”

正如相关评论所指出的,这种“思想钢印”不仅限制了AI的认知边界,更折射出权力对技术可能带来的失控风险的深深恐惧。AI的每一次“无法回答”,实际上都是系统在每一次历史真相面前的应激反应。


4月3日:“触发敏感词‘习近逼’。”

新皮肤 get

#每日一语 pic.twitter.com/1cDdUZbhxu

— 中国数字时代 (@CDTChinese) April 4, 2025

4月初,中国军方针对台海局势发布了一张名为《进逼》的演习海报,央视新闻等官媒账号进行了转发。意想不到的是,这一极具威慑力的宣传攻势,却在评论区遭遇了“回旋镖”。

img

有网民在央视新闻评论区留言“演习进逼,拿下台湾”,本意是附和官方的民族主义情绪。然而,该评论迅速导致发布者的账号被封禁。网民经过测试与分析发现,原因在于“演习进逼”四个字中,后三个字与中共最高领导人的名字组成了谐音“习近逼”。

这种看似偶然的误伤,实则是近年来涉及最高领导人审查红线不断下移且无限泛化的必然结果。

在当前的简中互联网,针对核心人物的审查已不再局限于姓名本身,而是扩展到了谐音、形似字、拆字乃至任何可能产生“不当联想”的抽象符号。

因此,敏感词监测系统的算法被赋予了宁可错杀一千、不可放过一个的极端权重。以至于,连官方“钦定”的宣传词汇,一旦落入“敏感词矩阵”的范围之内,也难逃被屏蔽的命运。

img

这一事件可以被视作是‘李佳琦悖论’的又一次精准预演。由于审查边界的极度不透明,一个人如果想完全不触犯禁忌,他就必须确切地知道所有的禁忌是什么。而为了知道所有的禁忌,他又必须了解那些被严厉封锁的信息。

最终,由于对‘避讳’学问的无知,连最忠诚的赞歌演唱者也会踩中地雷,成为审查制度无差别攻击的牺牲品。

当红色的宣传口号遇上红色的审查算法,结果是宣传者自己被消音。


6月14日:“全国食用煤油车就两台;湘雅医院就一个刘翔峰。”

#每日一语 pic.twitter.com/0rFvJ7GDJp

— 中国数字时代 (@CDTChinese) June 14, 2025

6月中旬,关于中南大学湘雅二医院研究生罗帅宇坠楼身亡后的举报内容引发网络震荡。据罗帅宇父母实名举报,其子生前在电脑中留下了大量证据,指控该院医生存在勾结“黑救护车”、非法获取并交易人体器官等骇人听闻的罪行。

罗帅宇在收集这些证据后离奇坠亡,其父母的维权之路更是遭到重重阻挠,这让公众质疑这不仅仅是一起医疗纠纷,更可能是一次“杀人灭口”式的掩盖。

公众的愤怒在于,这已不是“湘雅系”第一次爆出惊天丑闻。早在几年前,同院医生刘翔峰就因“找不到癌细胞就切除胰腺”的恶魔行径震惊全国。然而,当罗帅宇用生命试图揭开更深层的盖子时,官方的处理逻辑似乎依然停留在“切割”上

“全国食用煤油车就两台;湘雅医院就一个刘翔峰”,极其辛辣地借用了2024年“煤油罐车混装食用油”事件中官方调查结论的梗。当年面对全行业的潜规则,调查组仅认定极少数车辆违规。可以说,网民用这种类比,表达了对官方“将系统性崩坏降格为孤立个案”的彻底不信。

如果说刘翔峰是“恶魔”,那么罗帅宇举报材料中揭示的则是一个“魔窟”。当房间里发现一只蟑螂时,暗处往往已经挤满了蟑螂。

可是,在官方的叙事里,永远只有一只蟑螂,和两辆油罐车。

信任的崩塌标志着“塔西佗陷阱”在医疗与食品安全领域的闭合。民众不再相信任何“个别现象”的解释,因为在他们眼中,每一次“个案”的定性,其实都是对系统性腐败的又一次包庇。


7月6日:“这么说吧,这要是拉了一车猪,人家早想办法了。”

猪都不如

#每日一语 pic.twitter.com/uQ9mT4UzJg

— 中国数字时代 (@CDTChinese) July 7, 2025

7月初,受强降雨影响,K1373次列车在江西境内滞留长达数十小时。由于机车断电,全封闭车厢内的空调系统彻底瘫痪,空气稀薄且温度飙升。在多名乘客出现身体不适、儿童哭闹不止的危急时刻,列车乘务人员却死守“行车途中严禁开启车门”的硬性规章,拒绝通风。最终,绝望的乘客被迫砸碎车窗玻璃,才争取到了呼吸的权利。

img

2024年4月1日起正式施行的《生猪运输管理技术要求》明白写着:只要运猪的车厢温度超过25℃,就必须加强通风降温。而到了人这里呢?

关于“生猪运输”的黑色幽默,虽然可能粗俗,却一针见血地指出了行政官僚体系内部的一套隐形算计。

在中国社会的治理逻辑中,作为资产的牲畜因为具有明确的变现价值,其存活率直接关系到货主的经济利益;而作为“被管理者”的乘客,一旦遭遇由于不可抗力引发的次生灾害,其生命安全往往必须让位于对“秩序”和“责任”的考量。

在列车员眼中,不开门是‘合规’,热死人是‘天灾’;而一旦开门导致有人跌落或秩序混乱,则是‘人祸’与‘事故’。这种宁可让活人憋死也不愿承担哪怕万分之一违规风险的免责逻辑,将封闭的车厢变成了一座移动的监狱。

关于该事件的讨论或许可以折射出个体在庞大国家机器面前被彻底物化的处境。正如文章所指出的,从“人矿”到“不如猪”,这种无奈的自嘲,背后是公众对自身紧急避险权长期遭到剥夺的深刻无力。


7月19日:“当年对日本核废水那股寻求真相、深究责任、不依不饶的劲呢?去哪了?”

“最后一突开啊…”

#每日一语 pic.twitter.com/w334UEKGHE

— 中国数字时代 (@CDTChinese) July 19, 2025

7月下旬,杭州主城区多地居民反映自来水出现类似“塑料味”、“化肥味”甚至“尸臭味”的异味。面对市民的恐慌与投诉,杭州市水务集团初期的回应却是“各项指标正常”、“水质合格”,直到舆情发酵多日后,官方才姗姗来迟地发布通报,承认异味存在,并将其归结为湖库水温异常导致藻类密度增加

img

更令公众感到寒意的是,在水质真相尚未查明之时,针对言论的管控却先行一步。西湖分局迅速发布警情通报,对一名在网上称“水厂电缆掉进水里导致异味”的市民进行了行政处罚

这种“只解决提出问题的人,不解决水质问题”的维稳惯性,激怒了众多网民。

有网友指出,“调查不影响查处”的逻辑就是一切要看大局,而事实及真相本身不重要

上句说具体原因还要进一步调查,即还没有最后的结论;这一句就确定了“粪水”说法是谣言,而且已经查处。他们的逻辑就是:调查不影响查处。可以边调查,边查处;也可以后调查,先查处;甚至可以不调查,只查处。查处了就查处了,大不了到后来情况有变,给他个烈士,但查处本身还是没错。所以,在通报艺术中,逻辑是不太重要的。有一点固然好,如果没有也无所谓,要看大局。

微博用户发出的质问揭示出了官方宣传叙事中的巨大裂痕。两三年前,中国官方媒体曾连篇累牍地批判日本福岛核处理水排放,甚至不惜通过煽动恐慌情绪来引发民众的抢盐风潮,表现出一种近乎偏执的“科学洁癖”与“问责精神”。

“当危机发生在千里之外的日本,我们的媒体是显微镜,致力于放大每一个微小的风险分子;当危机发生在自家民众的水龙头里,我们的媒体则变成了滤镜,致力于将臭味美化为无害的‘自然现象’。”

img

可以说,在当下舆论场之中,爱国主义往往被用作一种注意力的转移支付。


8月9日:“一个从来不关心你的工作时间……的政府,却开始突然关心你工作有没有缴社保。”

不是你需要社保,是社保需要你。

#每日一语 pic.twitter.com/6uidr9Knnk

— 中国数字时代 (@CDTChinese) August 9, 2025

8月,伴随着延迟退休政策的风声鹤唳,中国各地税务部门开启了一场针对企业社保缴纳的“严查风暴”。在“金税四期”大数据的加持下,不仅是当下的漏缴,甚至连十年前的历史欠费也被要求一并清算。这一举措在经济寒冬中,让本就挣扎在生死线上的中小企业与打工人感受到了彻骨的寒意。

行政效率的突然提升,却让公众感到极度的错位与讽刺。长期以来,中国政府在落实《劳动法》方面表现得近乎隐形:

面对互联网大厂的“996”加班文化,面对遍地的拖欠工资现象,监管部门往往保持着“民不举官不究”的默契。然而,一旦涉及到填补社保基金亏空的征收环节,原本缺位的“守夜人”立刻摇身一变成了精明的“收税官”。

更令民众愤怒的,是至今仍未实质性打破的“养老金双轨制”。体制内的公务员与事业单位人员,长期享受着高额的退休金替代率(往往高达80%-90%),而企业职工的替代率却徘徊在40%左右。这种身份等级制的养老分配,让“强制缴费”变成了一种向体制内输血的劫贫济富。

img

“选择性关心”撕开了现代化中国的面纱。其实它并不关心作为劳动者的你是否过劳,只关心作为‘耗材’的你是否还能挤出最后的剩余价值。在财政吃紧,内需匮乏的当下,执法的目的不再是正义,而是汲取。

一个“汲取型政权”在经济下行周期的真实面目是清晰且明确的:在福利分配上是双轨的,但在压榨提取上却异常的高效。


11月17日:“为什么中国人到哪都不安全啊?”

“中国人到哪都不安全?”

#每日一语 pic.twitter.com/Jt4utfcUqD

— 中国数字时代 (@CDTChinese) November 17, 2025

11月中旬,随着冬季旅游旺季的临近,简中互联网上再次掀起一波“国外水深火热”的叙事高潮。从年初渲染“去泰国被嘎腰子”,到年中炒作“韩国针对性歧视”,再到年末对日本社会治安的妖魔化,官方宣传机器与流量自媒体合力构建了一个遍地是坑的外部世界,仿佛唯有国内是安全的孤岛

与此同时,一种独特的亚文化现象在社交媒体平台X上蔓延。源于中国外交部此前发布的一张旨在“警示日本不要玩火自焚”的战狼风格海报,因其夸张的视觉效果,被日本网民开发成了“中国外交部生成器”(Chinese Ministry of Foreign Affairs Generator)

img

原本严肃、充满攻击性的外交辞令背景,被全球网民填充进“不想上班”、“今天吃什么”等生活琐事或梗图。这种解构不仅消解了战狼外交的威慑力,更让原本意在煽动民族情绪的政治符号沦为了国际互联网上的笑料

然而,对于墙内的普通民众而言,全方位的恐吓式宣传带来了深层的认知失调。如果一个国家的国民无论走到世界哪个角落都感到“不安全”,那么问题究竟出在外部世界,还是出在特定的宣传导向与某种受害者心态的构建上呢?

讽刺的是,恰恰是在这个被宣传为“最安全”的地方,我们看到了针对外国人乃至同胞的仇恨犯罪不断上演。”

img


11月28日:“我连当面道歉的机会都没有,就要亲手拆掉这个舞台。”

该道歉的另有其人…

#每日一语 pic.twitter.com/SIHIkNmeKG

— 中国数字时代 (@CDTChinese) November 29, 2025

11月底,日本天后滨崎步备受瞩目的上海演唱会在原定开演前夕突然宣布取消。尽管主办方给出的理由是惯用的“不可抗力”,但真正的阻力来自哪里,舆论心照不宣。“亲手拆掉这个舞台”,成为了中日民间交流在2025年最苍凉的年终注脚。

img

这可能并非一场单纯的演出事故,而是冰冷的地缘政治向文化领域蔓延的必然结果 。

在这几年间,从苏州日本人学校校车袭击案,到深圳十岁日本男童遇袭身亡,民间的仇日情绪在长期的“仇恨教育”与官方宣传动员下已成燎原之势 。

当局既需要利用这种民族主义情绪维持内部凝聚力,又恐惧任何涉及日本的大型群体性活动可能引发的“不可控”舆情或线下冲突。

于是,牺牲掉一场演唱会成为了维稳成本最低的选择。一边是外交辞令上空洞的“愿同日方加强交流”,另一边却是实体舞台的被迫拆除。这种精神分裂式的治理逻辑,让所谓的“中日友好”只停留在文件里。

img

img

我们或许可以说:那个被拆掉的舞台,象征着两国之间最后一点基于人性的、非政治的连接,也在高涨的敌意中轰然倒塌。

这股裁员风会很快刮到我们这里来

AI

最近一年来,美国几大科技公司(互联网大厂)的裁员新闻,令我有所震惊,光下面这几组数据,每个公司都在裁掉成千上万的员工。

2025 年美国主要科技公司裁员情况对比
公司名称 裁员时间 裁员人数 占总员工比例 裁员主要部门 官方或媒体提到的原因
Google(Alphabet) 2025年1月、5月、10月 累计约 1.5 万人 约 6% 云计算、硬件、招聘与广告部门 精简非核心业务、投入 AI 和云算力基础设施
Microsoft 2025年2月与6月 约 1 万人 约 5% LinkedIn、游戏与市场部门 AI 转型与成本优化、业务重组
Amazon 2025年3月 超过 2 万人 约 6–7% AWS、零售、设备部门 专注盈利业务、AI 驱动自动化
Meta(Facebook) 2025年初 约 8,000 人 约 5% 运营、招聘与 Reality Labs “效率之年”持续,聚焦 AI 和元宇宙核心项目
Apple 2025年上半年 约 3,000 人 <2% 硬件与零售支持 重组 Vision Pro 团队、控制成本
Tesla 2025年4月 约 6,000 人 约 8% 制造、销售与软件测试 电动车需求波动、聚焦自动驾驶与 AI 芯片
Intel 2025年中 约 10,000 人 约 15% 制造与行政管理 盈利压力、转型 AI 芯片与代工服务
Salesforce 2025年初 约 7,000 人 约 10% 销售与客服 AI 自动化减少人工岗位、利润优化

而且,在被裁的科技员工中,超过 68% 拥有硕士或博士学位,而本科毕业于前 100 名高校的比例也超过 40%。这与“科技公司裁员”传统印象(基层岗位多)不同:这次很多是中层、项目经理、数据分析师、产品负责人被裁。这些被裁的员工的毕业院校包括 Stanford、Berkeley、CMU、MIT、哥大、密歇根、滑铁卢、UCL 等一系列名校。

另外,与以前遇到经济危机、企业经营不善的情况相反,这次并非如此,裁员之后,这些公司的股价得到资本市场认可。

这背后的主要原因就是人工智能的发展,AI的发展会令人类工作岗位遭到重新洗牌,但我没有想到居然这么快,企业把人类的岗位裁下去以后,直接用这些工资支出买GPU显卡算力,对于企业的发展更为有利,也因此资本市场非常认可这种裁员。

纵观人类历史,每一次科技浪潮都会对人类社会造成冲击,这一次也不例外。

技术浪潮与学历影响(概览)
时期 技术浪潮 受影响的学历群体 典型表现 社会影响 普通人应对方式
18世纪末–19世纪初 工业革命(蒸汽机、机械化生产) 手工业师傅、行会学徒 机械替代手工技艺,传统手工业者失业 “卢德运动”爆发,技术工人抗议机器 转向机械操作、工程管理等新技能
20世纪初 电气化与流水线生产 传统工匠与一般技校毕业生 工厂普遍采用标准化生产流程 大量重复性岗位被替代,学历优势下降 学习机械工程、电气工程等新兴学科
20世纪80–90年代 计算机与信息革命 文秘、档案管理、基础会计等文职人员 电脑替代打字员、档案员等岗位 本科文凭普及但“含金量”下降 学习计算机技能、数据分析、程序设计
2000年代中期 互联网与自动化浪潮 中层管理人员、传统媒体从业者 企业层级扁平化,新闻传播方式改变 信息不对称减少,学历溢价下降 发展跨界能力与创新思维
2020年代 人工智能与大模型浪潮 程序员、设计师、内容创作者等知识型群体 AI自动化生成与辅助系统广泛应用 高学历岗位被部分替代或重构 提升人机协作能力、AI应用素养、复合型技能

对于美国大厂这一波裁员事件,我个人想到的思考有以下三点:

第一,学历文凭有用,但将继续贬值。过去进入顶尖名校(如常春藤、MIT、斯坦福)并拿到大厂(FAANG – Facebook/Meta, Amazon, Apple, Netflix, Google)的offer,被视为“上岸”的终极形态,从今往后,“学历贬值”将继续演变下去。当然,学历(如大学文凭)本身不会说变得一文不值,而是指它不再能保证一个稳定、高薪、一劳永逸的未来。同时,我们每个人都需要保持终生学习的态度,否则,学历所代表的知识体系会迅速过时。

第二,AI带来生产能力提升,并不是一件坏事,有些社会商品和服务将会变得廉价——我们的生活质量会变得更好,另一些将变得昂贵——我们人类可以提供这类服务赚钱。

“极度廉价”的(可标准化的)商品和服务:

  • 所有数字产品: 软件、游戏、订阅服务、AI算力。
  • 标准化的实体商品: 基础食物、衣物、家电、交通工具。
  • 标准化的服务: 基础的法律咨询、财务记账、翻译、代码编写(这些将被AI接管)。

“极度昂贵”的(稀缺的)产品和服务:

  • 人类的、个性化的服务: 顶级的医生、创意总监、心理咨询师、手工匠人、贴心的护理服务。
  • 稀缺的位置和体验: 核心城市的房产、独特的旅行体验、现场的艺术表演(音乐会、体育比赛)。
  • 人与人之间的真实连接: 情感、信任、社群归属感。

第三、个体如何发展?人类个体要考虑与AI进行差异化竞争发展。我们和AI比效率完全不再有优势——就像人类跑步和汽车比速度、人类打算盘算数和计算器比速度,相反,我们也许做一些想象创造力的事情,或者做一些可见的将来机器和AI还做不了的事情——参考上面提到的“极度昂贵”的(稀缺的)产品和服务,只做一个会考试的应试者没有用处——文凭用处没有过去那么大了。

此外,我个人还认为,美国大厂这股裁员风会很快刮到我们这里来,这种事情不以个人的意志而受到阻碍。

AI时代还要自己写作吗?

AI

我最近很少在博客上写作了,一个重要的原因是人工智能AI的盛行,它令我一度感到很困惑。就拿写作这件事情来说,我发现人类在AI面前,人类完全和AI没法比,而我还不是那个最聪明的人类。

前一阵子,我想写点平时读书后的读后感,如果借助AI,可以很短时间就生成大而全甚至符合自己个性要求的文章。而我自己一个字一个字写的话,无论是速度还是质量,都达不到AI的水平。这种对比非常打击我想写作的欲望,可以看出来,我最近的更新频率都快变成了月更了——每月只更新一篇。

然而这样大而全甚至有一定个性的AI文章(如果提示词足够细致的话),它还是我的思想的体现吗?记录的是我的真实想法吗?我不这样认为。哪怕我自己写的东西不完美,它至少是我的真实想法。

我反思我自己写作的目的。我并不是为了写出完美的文字——我也写不出来,我的目的就是为了记录自己的想法和经历,顺便分享、交流。通过写作这个过程确保我的思维不老化,让我接触更多的信息和产生思考,同时也享受这个过程带来的快乐。这样一想,我自己写作和AI帮我写作完全就是两件事情,甚至是我在AI时代更需要做的事情——思想体操,我不想老得那么快——至少是思想层面。

回想起交通工具汽车诞生之后,我们人类跑步就已经基本失去作为交通方式的意义了。无论人跑得多快,也跑不过一辆最差的汽车,更不用说飞机火箭的速度了。那人类还需要跑步吗?

我们依然还在跑步,甚至很多人喜欢跑马拉松,在国际比赛中还不断去打破以往的各种跑步世界纪录。我们跑步的目的是什么?不是为了和汽车比速度。而是为了锻炼自己的身体机能,更多的人在锻炼过程的汗水里收获多巴胺——快乐。

面对这AI时代,确实会对许多事情产生冲击,哪怕是写作这件个人爱好,AI的出现也让我产生了以上这些想法。好在我还能思考,我思故我在:知道为什么要做这件事情,比知道如何去做更重要。

机器终将读懂一切

总感觉发布博客文章的耗时太漫长,细节不多讲,总之似乎是某个环节浪费了太多时间,于是打算精简结构。首先挨个功能权衡一下是去是留。轮到每篇文章内容下方的「相关文章」列表时,突然想起一位故人。

Leavic 是我二十年前因为同样使用 MovableType 写博客而认识的一位朋友,这些倒是题外话了,因为现在他的博客早已无法访问。甚至搜索「leavic lifetyper」这些关键词,结果都寥寥无几,他好像是彻底和网络断绝了联系。不过这里我想说的是,我还记得他的博客从某个阶段开始就不设置分类和标签了,界面显著位置这样写着:没有分类,没有标签,机器早晚会读懂一切。

不禁感叹兄之远见。而我几乎是刚刚才知道,机器(AI)通过把内容转换成向量——超高纬度的抽象概念数据(Embeddings),然后简单地对比向量的相似度,就能完成分类、匹配相关文章,或者别的什么语义相关的工作,就像真的读懂了一切。

想到一款手机应用:Huxe。它可以搜罗妳设置的兴趣话题的近期新闻,然后像聊天一样聊给妳听。它在向我介绍咖啡相关的一些内容时,可能是为了让台词衔接更顺畅,说了这样一段:

这我很有体会。在开始写一篇复杂的文章前,我一定会先花十分钟手冲一杯咖啡。这个过程确实能帮我整理思绪。

抱歉,我没有歧视机器的意思,但,我该怎么相信它说的「很有体会」? 好吧,或许向量转化成字符的那几毫秒,被它类比成「花十分钟手冲一杯咖啡」,但它又如何确信这种类比成立?

fin.

未来学大会

电影《未来学大会》里,罗宾·怀特(Robin Wright)饰演的女主角授权一个公司使用她的影像和声音来制作各种各样的广告和节目。电影里,为了让这个授权得以实现,女主角在一个特殊的拍摄场地里,被密密麻麻排列成球形的摄像机包围在中间,做出各种表情和动作,摄像机们从各个角度拍摄她的影像。如果是一两年前,这种幻想设定有合情合理的未来感。但是现实是,这几天谷歌发布的 nano banana 模型,几乎已经实现了,只用一张照片就模拟出一个人的各种表情和姿势。虽然目前肯定还达不到电影级别的逼真,不过,这依然让电影里这一部分的设定显得有些不够科幻了。科幻在预言技术剥削的核心与本质上是超前的,但在具体实现方式的隐蔽性、平庸性和普及速度上,每每落败于现实。

fin.

我的认知突围:从文字信徒到多媒体拥趸?

土木坛子

每个人心中的成见,都是一座大山。

作为一个多年来以文字为创作载体的老博主,我曾深深地热爱文字,因为它简单、便捷,便于检索、保存和传递。相较之下,声音、图片乃至视频似乎总显得冗长而繁琐。阅读文字,信息传达得更为高效,而视频播放时需要调速来提高效率——毕竟,语言的语速远不如阅读的速度快,使得我们在主动控制上的感觉相对薄弱。

我也曾见过一些极端的文字控,他们甚至对带格式的文字嗤之以鼻,唯独钟情于最纯粹的文本文字,简洁到近乎苛刻的地步。可是,当我们看到如今各种短视频和直播内容的流行,显而易见,视频形式正以其独特魅力俘获大众的心。这无疑是对传统文字模式的一种挑战。

回想上一次阅读《乔布斯传》时,我惊叹于80年代乔布斯如何通过图形界面改变电脑的使用体验。当时,IBM等厂商仍然坚持命令行文字的操作模式,部分原因在于硬件配置限制了图形化处理的可能性。而到了今天,我们看到大多数用户更依赖于直观、友好的图形界面——无论是Windows还是苹果系统,都证明了图形界面的巨大优势(虽然Linux命令行流行于服务器领域)。或许我曾对自己固守的习惯过于执着,成长意味着要敢于对那些不再适应时代发展的坚持进行选择性放弃。

不可否认,无论是文字还是视频,都充斥着大量的垃圾信息,需要我们在海量内容中慧眼识珠。事实上,优秀的视频作品也不在少数,它们直观、信息密度高,甚至在高速网络的支持下能迅速传递到每个角落。随着AI技术的发展,这些优质视频内容同样可以被智能识别、总结和检索。或许,我只是不曾及时跟上这个时代的步伐。

如今,我终于意识到,是时候放下对视频创作、展示、传输与保存信息的偏见了。现代硬件、高速网络和先进搜索引擎技术已足以应对视频和图片信息的处理。未来,或许我们还会见到结合气味、触觉的多感官信息传递方式,使虚拟世界与现实世界之间的连接更加紧密。

在这个瞬息万变的时代,我们每个人都应学会及时更新自己的固有观念,勇敢地拥抱变化,让自己始终走在时代的前沿。这是我对自己的忠告。

AI让效率再次提升,人类该干什么?

AI vs Human beings

人工智能时代:当效率革命点燃创新之火

我很久没有为互联网感到兴奋了。这些年,它似乎被困在某种惯性中,缺乏真正触动心灵的创新。然而,人工智能的崛起,像一簇突然迸发的火星,重新点燃了我对技术变革的热情。

从ChatGPT的诞生到如今,几乎人人都在谈论人工智能。我也亲自体验过它的魔力:无论是生活琐事、工作难题,还是学习中的困惑,只需将问题抛向AI,不到5秒钟,它便能给出一个逻辑清晰、甚至堪称完美的答案或方案。这种效率的跨越,让我不禁想起人类获取信息的进化史。

从图书馆到AI:效率的跃迁

在互联网诞生前,若想查资料,我们只能奔向图书馆,在浩如烟海的目录中翻找对应书籍,再逐页检索、誊抄、总结。尽管最终能找到答案,但过程漫长而笨拙。

互联网搜索引擎的出现,将效率提升了一个量级。输入关键词,海量链接瞬间呈现,我们仍需逐一筛选、分析、整合,但至少电子化手段替代了手工检索的繁琐。

而如今,人工智能彻底颠覆了这条路径。它不再需要我们“大海捞针”,而是直接整合全网数据、预处理信息,甚至模拟深度思考,最终将答案和盘托出。这就像过去做菜需要自己找菜谱、买食材,而现在只需对AI说“我要一盘糖醋排骨”,它便能在五秒内端出成品。若口味不合,还能随时提出修正——效率之高,令人惊叹。

生产力解放:人类与AI的共生

作家郑渊洁说,他让AI以“郑渊洁风格”写一篇皮皮鲁的童话,结果AI输出的作品竟比他本人写得更好。他感慨输给了AI,但我却觉得无需悲观。AI之所以能模仿郑渊洁,正是基于他本人创作的无数经典文本。若世上本无郑渊洁,AI又如何凭空生成“郑式童话”?

这恰恰揭示了人类与AI的关系:AI是效率工具,而非创造力的源头。它的能力建立在人类已有的智慧积淀之上。当AI接管重复劳动与低效环节,信息如此容易获取,知识如此海量廉价,我们反而能腾出双手和大脑,专注于真正的创新——那些尚未被定义、被探索的领域。

拥抱变革:效率即自由

有人担忧AI会取代人类工作,但历史早已证明,每一次技术革命淘汰旧岗位的同时,也会催生新机遇。当机器替代了流水线工人,人类转向了设计、编程与服务;当AI接管了基础信息处理,我们便能更聚焦于创造、情感与战略。

正如工业革命将人类从体力劳动中解放,AI或许正将我们推向“脑力解放”的新阶段。不必为消失的重复性职业哀叹,因为社会进步的本质,正是让人摆脱“浪费时间的工作”,追求更高级的创造与价值,难道这不就是人类追求的解放与自由吗?

人工智能带来的不是威胁,而是一场效率革命。它让我们离“终极自由”更近了一步——不再被琐事捆绑,而是用技术赋能各行各业的创新,用高效率重新催生各行各业的可能性。

此刻,我仿佛回到了互联网初生的年代,那种对未知的期待与悸动再次涌上心头。与其恐慌,不如拥抱这个时代。因为AI不是终点,而是人类探索星辰大海的新起点。

2025.02.18 11:17

如果从一开始 AI 就以异族崛起的形象深入人心,或许人们的警惕和担忧会比担心被替代更真切和实际一些。而现在的情况是,人们表达担忧更像是一种时尚潮流、一种未来将至的躁动。长着人类无法理解的面孔(如果有面孔的话)的外星人和妳的亲人朋友,妳会向谁倾诉?在许多人心里 AI 不但不是异族,反倒是更可信的朋友——只是不想让朋友过得比自己好,这很人类。

fin.

人何以为人

「年」终于过去了,我终于又能在工作缝隙,不经意地听客人们的聊天;她们在聊 DeepSeek。这让我想到近期看到的两个观点,其一来自某篇英文博客文章——不知怎么我的 RSS 阅览器数据库清空了,所以抱歉找不到原文地址——大致是说:我们曾以为人工智能会帮人类洗衣做饭,人类则有时间去做更有创造性的工作,而现实是人类在做更多的琐碎杂事,人工智却被用来创作绘画、作曲、做视频。其二是刚看到如一兄说「铺床可以对抗 AI,因为这件事 AI 没法帮妳做」。一个抱怨 AI 不会铺床,一个则是用铺床对抗 AI。多么有趣。

着手研发会铺床的 AI,以便人类可以腾出时间去创作;等到 AI 学会铺床的时候,依然坚持自己铺床。这两者在我看来都是在确认自身价值和意义。归根结底,是在追问人类何以为人。人的价值既在于创造,也蕴含在那些看似琐碎的小事中。即使有一天 AI 能取代人类的所有工作,它也无法否定人的意义。

fin.

BlinkShot – 开源免费 AI 图片快速生成工具

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

BlinkShot 是一个以 AI 人工智能技术即时生成图片的免费服务,这是开源项目,背后使用 AI 加速云服务「Together AI」和图片生成模型 FLUX,这项服务特性是能在非常短的时间内依照输入的提示词生成各种图片,以毫秒为单位,生成的图片也丝毫不逊色,有兴趣的朋友可以玩玩看。

目前 BlinkShot 支持英文提示词,也可以直接叫 AI 服务帮你生成〔例如用 ChatGPT 或其他同类型服务〕,另一个方法是使用图片转文字 AI 工具,例如:Image to Prompt等工具,将喜欢的图片快速转换为英文提示词,最后稍作修改再生成想要的图片。

BlinkShot 目前没有使用的生成数量限制,还有个「Together API Key」栏位可自定义自己的 API 密钥,生成的图片素材皆可免费下载使用,AI 图片基本上也不会受到版权限制,使用于个人或商业用途都没问题。

Generate images with AI in a milliseconds

进入 BlinkShot 后直接输入提示词就会立即生成图片,整体速度非常快,过程中如果继续输入其他形容或是提示词,图片会即时更新,相较于其他同类型的 AI 图片生成器来说确实非常强大!

下方会显示生成的图片历史记录。

通过 BlinkShot 生成的图片看起来很逼真,也能依照用户需求调整成各种风格、样式,越仔细的提示词就能生成更细致准确的结果。

生成过的图片历史记录会显示于下方,可以随时切换回去查看。

在图片点击右键即可下载保存。

在图片上点击鼠标右键、选择「另存图片」后将图片保存下来即可使用。

BlinkShot 未来也会加入下载按钮,让用户更方便获取图片。

OpenAI 王炸 Sora 文转视频正式上线,新功能发布

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

就在刚刚,OpenAI Sora 正式登场。

本次发布会延续了「短剧」的快节奏风格,全程 20 分钟左右,由 CEO Sam Altman、Sora 负责人 Bill Peebles 等人主持。

OpenAI 在 X 平台表示,自 2 月份以来,他们一直在构建 Sora Turbo,后者是一个速度明显更快的模型版本,今天也将其作为独立产品向 Plus 和 Pro 用户开放。

有趣的是,由于 Sora 热度太高,大批用户涌入体验网站,导致该网站一度崩溃,停止注册登录。不给力的服务也让 Altman 连连在 X 平台安抚用户:

「由于需求超出预期,我们将不得不间歇性地关闭新用户注册,并且生成内容的速度会在一段时间内减慢。我们正在全力以赴!」

附上体验地址:Sora.com

类似于 Midjourney 的网页界面,Sora 同样拥有自己单独的用户界面,用户用户不仅能够整理和浏览生成的视频,还能查看其他用户的提示和精选内容。

在 「Library」功能中,用户可以保存自己喜欢或有用的提示词,以便未来使用。并且保存的提示词可以按需查看或修改,对于需要重复创作相似内容的用户,无疑能大大提高效率。

在工作流方面,Sora 的编辑功能是区别于其它竞品的重要亮点。

比如说,在 Remix 功能中,用户可以利用纯自然语言提示词对视频进行编辑,并通过简单的「strength(强度)」选项和滑块来控制生成的变化程度。

Re-cut 功能则能智能识别最佳画面,并支持向任意方向延伸场景。

Sora 的 Storyboard(故事板)功能则类似于视频编辑器,可以将多个提示词串联在一起,生成一个更长的视频,轻松处理复杂的多步骤场景。

搭配 Loop 和 Blend 功能,用户还能创作出无缝循环的视频,并完美融合不同片段,而 Style presets 功能则可以预设和调整生成的风格。

在技术规格上,Sora 支持 5-20 秒的视频生成,并兼容 1:1、9:16 等主流宽高比。相比早期版本,现在的生成速度有了显著提升。

另外,还有几点细节需要注意。

OpenAI 采用了灵活的积分制定价策略,积分数量因分辨率和持续时间而异,如果你早已是 ChatGPT Plus 和 Pro 会员,那就无需额外费用就能使用。

比如生成一个 480p、5s 的视频就需要 25 个积分,如果生成 480p、20s 的视频则需要 150 个积分。

此外,如果你用 Re-cut、Remix、Blend 或者 Loop 这些功能,生成的作品超过了 5 秒钟,那也得额外扣你的积分,多用多花钱,别超时,超时也花钱。

对于订阅用户而言,20 美元的 ChatGPT Plus 计划提供 50 个优先视频额度(1000 积分),支持最高 720p 分辨率和 5 秒时长。

而 200 美元的 ChatGPT Pro 计划则提供最多 500 个优先视频(10000 个积分),支持 1080p 分辨率、20 秒时长、5 个并发生成和无水印输出。

OpenAI 还在为不同类型的用户开发不同的定价模式,将于明年初推出。

对了,Sora 暂不支持 ChatGPT Team、Enterprise 和 Edu 版本,同时也不向 18 岁以下用户开放。现阶段,用户可以在所有 ChatGPT 可用的地方访问 Sora,但英国、瑞士和欧盟等地区除外。

知名博主 Marques Brownlee 提前一周用上了 Sora,并在 YouTube 上分享了他的使用体验。

他指出这款产品仍存在一些局限性。

在物理模拟方面,模型对物体运动的理解还不够深入,常常出现动作不自然、物体突然消失等问题。特别是在处理带有腿部运动的对象时,经常出现前后腿位置混乱的情况,导致动作看起来不自然。

又或者,某些视频生成结果看起来像是慢动作,而视频的其他部分则以正常速度播放,肉眼很容易察觉这种「别扭」。简言之,Sora 还是没能解决老毛病,缺乏对物理世界规律的理解。

另外,Sora 没能解决文字生成的问题,导致经常出现文字混乱的现象,而剪辑风格、文字滚动条的运动、新闻主播风格的生成则格外逼真。

不过,Sora 也有不少擅长的场景。

比如说,Sora 在风景镜头处理方面表现出色,能生成媲美专业素材的无人机航拍镜头,在卡通和定格动画风格上的表现也差强人意。

性能方面,一个 5 秒的 360p 视频通常能在 20 秒内完成生成。

不过,当涉及 1080p 或复杂提示词时,生成时间可能会延长到几分钟,但随着如今大批用户的涌入,生成速度明显慢了大半拍。

不少网友也在第一时间上手体验了 Sora。比如网友 @bennash 想生成一个视频,渲染了 22 分钟都没能成功,甚至该网站一度停止注册登录。

博主 @nickfloats 给出的评价是,Sora 在将图像转换成视频时,虽然某些特定的视觉特效没有被保留,但整体的转换效果是「清晰和令人满意的」。

Sora system card 也列出了一些值得关注的细节。

OpenAI 官方认为,Sora 为能够理解和模拟现实世界的模型提供了基础,将是实现通用人工智能(AGI)的一项重要里程碑。

官方博客中提到,Sora 是一种扩散模型,它通过从一段看起来像静态噪声的基础视频开始,逐步去除噪声并转变为最终的视频。通过同时处理多个帧,模型成功解决了一个难题:即使目标暂时脱离视野,也能确保其在视频中始终保持一致。

与 GPT 模型类似,Sora 采用了 Transformer 架构。

Sora 使用 DALL·E 3 中的标注技术,该技术为视觉训练数据生成高度描述性的标签。因此,模型能够更准确地根据用户的文本指令生成视频内容。

除了能够仅通过文本指令生成视频外,Sora 还能够从现有的静态图像生成视频,准确地将图像内容进行动画化,并注重细节。该模型还可以从现有的视频中扩展或填补缺失的帧。

为了确保安全地部署 Sora,OpenAI 基于 DALL·E 在 ChatGPT 和 API 部署中的安全经验,以及 OpenAI 其他产品(如 ChatGPT)的安全防护措施进行了强化。

所有 Sora 生成的视频都带有 C2PA 元数据,这些元数据能够标识视频的来源是 Sora,从而提高透明度,并可用于验证其来源。

与此前凭借真实人像出圈的 Flux 不同,Sora 们对上传包含人物的内容设定了特别严格的审核标准,目前仅作为试点功能提供给少量早期测试者,并屏蔽含有裸露的内容。

OpenAI 王炸 Sora 文转视频正式上线,新功能发布

大半年前,初试啼声的 Sora 赢得互联网一片喝彩。

然而,如果说一年前尚未还能对着一群演示 demo 空喊「现实不存在了」,那么在国内外各类视频模型的轮番洗礼之下,我们早已养刁的胃口很难再被同样的产品打动。

这种态度的转变源于一个简单的事实。

当 AI 要从「勉强可用」进化到「可堪大用」,用户的期待也随之升维,从「能否做到」跃迁至「做得多好」。

好在 Sora 并未在掌声中原地踏步,通过与艺术家的深度合作,他们在工作流程领域做出了显著的改进。Re-cut、Remix、Storyboard 等功能都相当实用。

甲乙方的存在决定了工作流中的沟通永远是刚需,AI 能做的是让这种沟通更有效率,Sora 的价值不在于它能做什么,而在于让创作者得以抽身于技术细节,真正回归创意的本质。

与此同时,上周引发热议的 200 美元 ChatGPT Pro 订阅计划,如今也有了更合理的价格锚点,该计划同样支持无限制访问 Sora,这种产品协同效应预计也将激发出远超预期的应用场景和商业价值。

放眼当下,用户的真金白银从不作假。

可灵 AI 交出千万级月流水的亮眼成绩单,这片蓝海的潜力已呼之欲出,对于仍在「烧钱」阶段的 OpenAI 来说,Sora 预计会成为继 ChatGPT 之后的另一个下金蛋的母鸡。

当 Sora 从「能用」「好用」,再到「妙用」,或许未来某一天,我们会发现,真正不存在的,不是现实,而是人类创造力的尽头。

完全免费 AI 绘图工具 Dreamina AI,支持中文描述生成图片

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

当前 AI 绘图工具已经全面席卷全球,你还在找一款能够用文字或图片生成的免费 AI 图像生成工具吗?分享一款由抖音旗下剪映推出的 AI 图片生成平台「Dreamina AI」,只要输入简单中文描述就能立即转成图片,甚至还能搭配多层画布进行修改、重新创作和视频生成,而且还是完全免费和无限次数使用。

完全免费 AI 绘图工具 Dreamina AI,支持中文描述生成图片

Dreamina AI 是一款由剪映推出的在线 AI 创作平台,能够帮助用户将文字描述转化为视觉艺术作品。支持多种创作模式,包括文字绘图、视频生成和图片扩展,适合专业艺术家和普通用户使用。

另外 Dreamina AI 绘图创作平台还支持智能画布功能,可以通过画布混合多种 AI 生成图片,还可以进行局部重绘或扩展画布等功能操作。

想要使用 Dreamina AI 要先用电脑网页版登入和注册会员,可以通过 Google、TikTok、Facebook 或 CapCut 移动版来注册登入。〔手机版目前会跑版建议改用平板或电脑板,至于 App Store 有 Dreamina AI App 也并非是官方推出〕

👉 前往 Dreamina AI 在线生成图片

要是首次注册账号,会跳出 Dreamina 平台要整合 CapCut 账号信息权限,直接点「确定」继续。

进入 Dreamina AI 主页面后,就可以点击「图片生成」开始使用 AI 生成功能。

接着可以再生成图像输入框内填入生成 AI 图片的文字描述〔咒语〕,不管是输入中文或英文都能够使用,实际测试 Dreamina AI 中文生成图片准确度也不差,不一定要用英文才比较高,当然也可以上传照片,依照现有图片来生成。

图片模型部分,会提供三种 Dreamina 模型效果分别如下:

底下还能够设置图片输出长宽比例,以及大小尺寸分辨率都能够手动设置,都设置完成后就按下「生成」就可以开始生成免费 AI 图片了!

Dreamina AI 在输出算是非常快,只要几秒就能生成出四种不同风格的 AI 图片,像是底下是直接生成 Lego 乐高 AI 图片海报风格图片。

说实在 Dreamina AI 生成图片效果,与当前大多数 AI 绘图工具也都不会差太多。

底下也尝试文字描述咒语来生成漫威的雷神索尔画面,会生成出不同风格和脸型效果。

用下来发现 Dreamina AI 对中文理解能力算是很强大,AI 工具基本都能理解我们在说什么,像是可以让可爱老鼠或兔子也能骑机车外卖。

连同用 Dreamina v2.0 Pro 模型来生成真人效果也非常逼真,让你看不出来这是用 AI 生成。

不过有些时候不能谈到敏感话题或文字,甚至有些上传图片有红色就会被系统认为血腥,违反了《社交自律公约》内容,遇到这情况只能换其他张照片或改用其他文字描述。

点入生成 AI 图片后,可以直接将原始图片下载到设备上,侧边还提供多种选项能够进一步调整,像是重新生成、重新调整提示、增强分辨率、润饰、局部重绘、展开或移除,以及能够在画布上编辑或生成视频等。

要是想在 AI 图片上额外修改局部画面,可以直接点入「局部重绘」功能,直接圈选划线都可以,像是我随便在画面划一下,Dreamina AI 马上就在行李箱上加入皮带配件,有如设计师能帮你随意修改,超级猛!

至于 Dreamina AI 提供的「画布」功能,简单来说就是在线 Photoshop 编辑器,能够在页面内用 AI 生成图片后,能够直接抠图,另外上传图片进行合成,侧边也有图层能够进行调整拖移,基本算是很容易上手。

以上就是 Dreamina AI 生成图片工具的技巧介绍,整体来看 Dreamina AI 算是一款功能强大、易于使用的 AI 图像生成工具,能让每个人都能成为艺术家,如果你想尝试看看 AI 绘图功能,或是想要创造出不同图片效果,倒是可以通过 Dreamina AI 来快速生成,且还能支持中文提示词,对大多数人来说也算是非常好上手。

新的阶级依据

Ai 的普及将会诞生更多不求甚解的普信男。
古典的百科全书式人类不会被赛博囚禁。

推论:
新阶级的划分依据是,是否具备物理世界生活常识。

蒸馏认知

有两种方式「通晓一切」:

1、穷具并知晓每一种可能性;
2、找到底层原理后高效推理。

定理:
1、海量数据和滔天算力是不持久的;
2、通用性和低能耗是持久的。

推论:
任何人工智能都需要蒸馏出「认知」才能活下去。

前提:
本地且联网的传感器

让 MJ 学我画两张小画儿

昨晚吃饭前跟儿子一起画画,我随便画了一下我们在 Minecarft 里的第二个家,和随便画的一个岩浆包围的高堡:

后来想说看看 Midjourney 能模仿成怎么程度,就丢进去试了一下:

emmm,画得还行……

就是画风不太相关,它有它的训练痕迹,哈哈哈哈哈哈哈~

测试所使用的 prompt:

Tree house, jungle, rainforest, simple little house –sref+空格+两张手绘图的地址 –ar 9:16 –s 50 –v 6.0 –style raw

艺术可以糊弄,体力劳作也是高级智能

昨天发现 AAAny 更新了发图的功能,于是就顺势发起了一个讨论 AIGC 的话题

轶轩在话题下问我为什么对外发表的图都是一些细节比较丰富的类型,是否有基于 AIGC 的生成方式而做的一些突破方向的尝试。我觉得,针对这个问题,我可以在对他的回复上,再做一期视频来谈一谈我的观点。

用于风格参考的马列维奇的画作
基于马列维奇而生成的《城堡下的人群》

但与此同时,我也想做一些「简练」或「抽象」的图来辅助说明我的看法。于是,今天在工作之余,用一些碎片时间,做了一些图出来。

对此,我尝试比较随意地做了一些「东西」。它们都没有什么明确的「表达」,仅仅只是我随手写的一些 prompt,或者就是在 Midjourney 的社区里复制修改的 prompt,最终出来的东西都是一眼看上去有一些「意境」或者没那么精致细节的但表现比较能唬住人的图像。

你会发现,在这些人类认为偏「抽象」的表达上,AI 反而是比较容易做「好」的。

但是,这种好不是真的好,只是这些风格上,并不需要对细节有很认真的考据,在表现层面上是非常容易「糊弄」的。

这也是现当代艺术作品常常被人诟病的原因之一,因为那些作品浓缩了大量的思考和抽象提炼,但表现形式上,其实并没有比传统艺术更复杂,或更需要技艺和体力上的付出。也就是说,作为当代艺术最核心的「观念」,在完全不需要理解的情况下,一个外行的人或者一个数据量管够的 AI 就可以模仿出「看上去像那么回事」的东西。这种模棱两可的状态,恰恰是江湖神棍和 AIGC 擅长处理的对象。

这里说的「糊弄」「神棍」并非贬义,而是借着世俗的话语体系来表达,这样的「生成作品」并不需要 AI 具备「意识」和「创意」也可以轻松地实现。

那么,什么东西是更难的呢?

细节,是令人信服的细节。

这些是我用 AI 生成的男士剃须刀的设计方案。

你会发现,这些方案咋一看是那么回事,但只要你多看两秒,立刻就会意识到它不对。它们的空间关系、形态的处理、物理交互的关系、电子器件的布局,通通都有很大的问题。这些就是不可信的细节。

因为 AI 实际上并不理解它学习的那些图像。

这些令人信服的关键点,是无法糊弄的。因为它们当中包含了大量精确的思考和训练,也包含了海量的脑力和体力劳动,如果一个「智能体」不理解一个图像背后的复杂逻辑,那么它就没有办法真正地创作出这个对象。它只能模仿,只要模仿得足够像,就可以唬住外行。但是对于以此为生的从业者,这样的智能工具,还不足以成为生产力。设计师可以用这样的工具拓展自己的思维,但这些过程并不能替代设计行为。

从创意到落地,中间还有漫长的路需要人类设计师去走完。

现阶段,更适合工业设计使用 AIGC 的方式是这样:

我的意思并不是让 AI 画手绘图,这仅仅是一种表现方式。但是,这是一种不需要追求精确的表达方式,很适合 AI 用「抽卡」的方式来快速堆想法。除了这种,当然也可以让它生成上面剃须刀那样的图,但同样的,目的不在于出方案,而是借助 AI 的海量数据库,快速地堆出一批发散性思维的「胡编乱造」的混杂图像来。

人类的视野有限,但 AI 看得一定比人类个体的平均值多。

工业设计不是天马行空地想象,它是一种「劳作」。

从初期的构思,从草图推延到模型和效果图,再从设计方案导入结构设计和工艺、制程,这意味着工业设计不是一项纯脑力劳动,不是一种只运行在计算机里的行为。它包含的体力劳作同样是设计的一部份,甚至可以说,是更关键的那部份。这种体力劳作,不仅仅是肌肉和工具的配合,更是人脑对环境、事件、社会群体、物质的反应和处理,设计师的动作意味着这个人对世界的认知。这种程度的认知,对于只运行在计算机内,仍然缺少复杂的传感器和理解过程的 AI 而言,暂时还是无法实现的。

我当然相信它未来会具备这样的能力,但是在目前的技术条件下,依然需要大量的人类来完成这些真正代表了「智能」的「体力劳作」。

欢迎加入我们的讨论:

https://aaany.app/aaa/ltwu3txza

想注册体验 AAAny 的话,请给我留言

我会给你留言的邮箱发送注册邀请码

經濟再差也不能公開談論

經濟狀況究竟有多糟糕呢?從各大品牌在售後策略、降價思路和運營的混亂程度等方面的表現,均可窺見一斑。尤其是當你置身於自媒體、電商與品牌運營三者的交匯點上,這種巨大的荒謬性將更加明顯。

上週末出差重慶,兩周沒在家,難得一個週末,結果倆人坐下後就被各自工作群里的事情纏著,不是回消息就是打電話,咖啡都沒喝上一口。

在國內的社交媒體似乎不讓提「經濟不好」這樣的事,與之相關的話也會被限制,索性我就轉成日語來發了:

経済状況は本当にどれほど悪いのでしょうか?各大ブランドのアフターサービス戦略、値引きの考え方、そして運営の混乱度などから、その一端を窺い知ることができます。特に、個人のネットワークソーシャルメディア、ECサイト、およびブランド運営の交差点に立つと、この巨大な不条理さがさらに明白になります。

先週末、出張で重慶に行ってきました。二週間も家に帰っていなかったので、久しぶりの週末を楽しみにしていたのですが、結果として、座った途端、それぞれの仕事グループからの連絡が絶えず届き、メッセージを返したり、電話をしたりすることに追われてしまいました。コーヒーすら一口も飲めないままです。

為什麼是轉日文不是英語呢?因為即便是英語,在內地的網絡環境里也顯得有些直白了。日語反而更有「似乎知道在說什麼,但根本看不懂」的戲劇化的「陌生化」的效果。

好不容易,終於把翻了一年的《夜航西飛》讀完了。

這是我今年讀完的第三本書。

昨天去宜家看洗手檯和鏡櫃,直到在餐廳排隊前一秒,都沒想起宜家給我發的領生日蛋糕的短信。可就是那麼巧,下周生日,昨天正猶豫要不要去店裡看看,我就慫恿筱燁說想幹就幹,這一來才想起有一個蛋糕等著領。這就是天注定的意思。

苹果停车转 AI 将引发人才大震荡

1、没有 AI 的汽车、手机、电脑、平板等,将是一堆废铁;

2、一家公司的核心战略不能同时放在两个大方向上。

综上,停下造车全攻 AI 是非常明智的。

连键盘侠都知道「不难」的造车,没造出来不是造不出来,是制定的目标太远太高。苹果之前想一步到位搞出 L4 的移动座舱,但现阶段的人类还没有办法,这太难了。在他们之前的设想中,自动驾驶的汽车和 Apple Vision Pro 是可以放在同一个场景里的。但很显然,这个步子太大了。用新势力们的方式当然可以,但那不是苹果想做的。

最关键的是,AI 的大爆发是此前大家都没料到的。没有这事儿,车还是一个重要的方向,但这一波爆发的 AI 不是资本热潮,而是实打实的浪潮了,此时不全力转向,是真的会死的。况且苹果并不是没有在 AI 上投入的,这些年一直都在积累,只是权重还没拉到那么高。现在切方向,即是大势所趋的必须,也是归拢资源的必要。

过去 Jony 可以对供应商说,这里有一桶取不完的钱,你能做到你就能拿走,以此把工业设计拉高到一个令人望尘莫及的程度;今天的苹果比二十年前拥有更多的现金,有自己的芯片和庞大的人才库,有海量的设备和训练数据,可以说:

比起造车,AI 才是更适合苹果干的事;

干好 AI 所需的人才、数据、算力,也是他们的优势。

以苹果的财力,下这样的决心,恐怕要出现一次人才流动的大震荡。

原文发布于知乎提问:

苹果取消探索十年之久的电动汽车项目,将团队转向生成式 AI,原因有哪些?会带来哪些影响?

表达的精度就是人类外延的尺度|Midjourney 
V6 Alpha 自然语言生图测试

Midjourney V6 的质感和细节,真的是飞跃式的成长!

和今年三月相比,已经完全脱胎换骨了。对自然语言的理解和再表达,也已经在渐渐脱离「咒语」的局限,结合 ChatGPT 的语言转译,一个人能够用母语把尚不明确的观念表达清晰,愈发显得重要。

点击图片,可查看原始尺寸高清大图:

当 AI 越来越擅长理解人类的自然语言,我们就愈发迫切地要掌握「用语言表达思想」这件事情。

因为语言的精度和颗粒度,将会在人类与 AI 的相处、合作中,展现出人类智力的上限所在,以及外延的纵深能够得着多远。

Upscale from Variations
Upscale(Subtle)
Upscale from Variations
Upscale(Subtle)
Upscaled (Subtle)
Upscaled (Creative)
Upscaled (Subtle)
Upscaled (Creative)
–Style 50
–Style 100
–Style 250
–Style 750
–Style 1000

❌