Reading view

There are new articles available, click to refresh the page.

被时间拉长的人

丢了一批人物标签给 AI 写人物小传,让它模仿某位小说家的笔法,来给演员交代角色。

你觉得这像谁的手笔?

————

南方的空气里常常有潮湿的味道,像是雨下过以后残留的影子,久久不散。城市白天拥挤喧嚣,夜晚却显得空旷,好像光亮突然被抽走,留下无数未完的句子。在这样的环境里,一个男人行走。他的脚步从不急躁,像对时间有着自己的节奏感,和别人不太一样。

年少的时候,他把自己交给了工业设计。形状、光影、比例,这些东西比人群更让他安心。六年在公司,十年在创业,那些日子像一张张被翻阅过的旧画册,色彩褪去了,但线条还在。产品的生与死,像车站里人群的来去。大多数人只看见成功或失败,他却更在意其中被忽略的细节。

别人眼中的他冷静得过分,总是习惯提前几步想好方向,就像棋局上的布局。但在那层冷静的外壳下,常常闪现一些不合逻辑的柔软时刻。比如一段旋律,随便一盏灯的影子,甚至一个不经意的眼神,足以让他停下手里的笔。理性和浪漫在心里不停打架,谁也没有赢过谁。

他知道自己带着黑暗生活。抑郁的日子像一条看不见的走廊,没有尽头。他学会了靠药物维持稳定,像有人随身带着一块怀表,偶尔瞥一眼,提醒自己仍然存在。那段经历让他对痛苦格外敏感,也让他在与人相处时多了一层隐秘的温柔。他不会轻易表现出来,但在内心深处,对别人的脆弱始终心知肚明。

夜晚经常独自坐在桌前,电脑屏幕的光照在脸上,桌上散落着草图和未完成的文字。那些想法有时像城市里的霓虹一样闪烁不定,无法全部抓住。他清楚其中大部分不会被记住,就像梦醒时遗落的片段。但仍旧一遍一遍画下去,像一种执念,也像是一种呼吸。

在喧闹的城市里,他习惯保持慢半拍的步伐。人群汹涌,他的节奏却像潜水时的心跳,缓慢、克制,不慌不忙。他看似与周围保持着距离,其实心里始终怀有一种模糊的渴望——不是要成为谁,也不是要得到什么,而是想在梦与现实之间找到某种入口。梦与梦之间,总有裂缝。裂缝里偶尔透进光。

对很多人来说,他是个不好接近的人。但真正靠近以后会发现,那些冷漠与安静只是表层,像水面下覆盖着的冰。深处的水仍然温热,流动着。理性、浪漫、痛苦和温柔同时存在,没有谁能完全把它们分开。

这样的人物,像一个在现实里造梦的旅人。他的路从不喧哗,却留下清晰的痕迹。

(*正文及标题均由 AI 完成)

《时代》公布 AI 100 人:任正非梁文锋王兴兴入选,还有OpenAI最恨的两个人

今天,《时代》周刊发布了 2025 年度 AI 领域最具影响力的 100 人名单。

当中像 Sam Altman、黄仁勋、马斯克这些几乎天天霸占头条的 AI 明星自不必说,而 OpenAI 、Meta、Google 这些大厂还有多位员工入选。

今年也有多了不少中国面孔,包括DeepSeek CEO 梁文锋,华为创始人任正非、宇树科技 CEO 王兴兴、小马智行 CEO 彭军等等。

值得一提的是,在一众技术背景强大的大神中,也有并非 AI 行业内的,比如华人记者 Karen Hao ,她花了 7 年调查,在新书中揭开了 OpenAI 的大量内幕。

Karen Hao 和马斯克,可能是奥特曼最恨的两个人了。

比起谁上榜了,谁没上榜可能更值得玩味。比如前 OpenAI 首席科学家 Ilya Sutskever,他创办的公司 SSI ,在没有推出任何产品的情况下,估值已经达到 320 亿美元。

▲Ilya Sutskever 刚换了新头像.

此外,机器学习之父 Hinton 和 DeepMind CEO 、诺奖得主 Demis Hassabis,也没出现在这份榜单。

APPSO 节选部分上榜人物和《时代》的评语跟大家分享,完整名单也放在下面了👇

《时代》公布 AI 100 人🔗
https://time.com/collections/time100-ai-2025/

任正非

任正非从不畏惧自我革新,一个退伍基建工程兵,成长于中国贵州省一个有七个孩子的贫困家庭,自幼饱尝饥饿。1987 年,他创立了华为,最初只是一家倒卖香港制造的电话交换机的小公司。不久之后,公司便开始自主研发电信设备、手机和笔记本电脑,随后又涉足了云计算,甚至是电动汽车领域。

如今,任正非领导着全球举足轻重的 AI 巨头之一。据报道,华为最新的昇腾 910C AI 芯片,在推理任务上的性能已能达到英伟达最新 H100 芯片的 60%,这一成就也让华为一跃成为中国挑战美国技术霸权的核心力量。此外,华为还拥有 CloudMatrix 384——一个使用国产芯片构建的本土 AI 系统,以及自家的鸿蒙操作系统。

梁文锋

1 月 20 日,中国 AI 初创公司 DeepSeek) 发布了 R1,这是首个向 OpenAI 当时最新发布成果发起挑战的开源模型。这也创造着了一则强有力的叙事——中国仅凭极小部分的算力,便足以与美国的顶尖水平相抗衡。

这让 OpenAI 耗资 5000 亿美元、名为「星际之门」(Project Stargate) 的超级开发项目备受质疑。恐慌的投资者们纷纷抛售英伟达及美国科技股的股票,引发了短暂却惊人的 万亿美元市值蒸发。

王兴兴


今年 1 月,当数十台机器人在春晚上整齐划一地同步起舞时,这让它们的制造商宇树科技 (Unitree Robotics) 大放异彩。但创始人兼 CEO 王兴兴看到的,是超越浮华、更具实用价值的未来。他告诉《时代》周刊 :「我们的希望是,机器人能够真正帮助人们应对生活中的方方面面——无论是在家庭、工业还是农业场景中。」

尽管王兴兴表示宇树的核心是一家硬件公司,但他相信,人工智能的进步将让机器人无需预先编程就能处理更多任务,例如清扫一个它们从未见过的房间。「若想让 AI 真正发挥作用,帮助人类解决现实世界的问题,我们就需要机器人技术这个载体,」他说,「这正是我坚信 AI 与机器人技术密不可分的原因。」

萨姆·奥特曼

他是人工智能领域权势最盛之人,但并非什么履历光鲜的程序员。他连本科学位都没有,更别说那张在他所在领域日益成为「入场券」的计算机博士文凭。然而,萨姆·奥特曼在学术资历上的短板,都由他纵横捭阖的交易手腕、敏锐的政治嗅觉和超凡的个人魅力所弥补,甚至有过之而无不及。

因为 Open AI 在2025年面临的挑战,早已超越了编写代码的范畴。它需要一位领袖,既能驾驭特朗普治下的波诡云谲,与世界领袖谈笑风生,又能管理巨型数据中心的建设,并抵御来自内部的权力威胁——与此同时,还要以惊人的速度发布产品,这种频率对于一家规模大十倍的公司来说才算正常。

正是因为奥特曼在所有这些任务上都游刃有余,他如今作为 CEO 的权势,已然达到了OpenAI 历史上的巅峰。

马斯克

即便以埃隆·马斯克本人的标准来看,这也是不平凡的一年。2024 年,他的公司 xAI 仅用 122 天,就将孟菲斯一座废弃的伊莱克斯工厂改造成了名为 Colossus 的全球最大超级计算机,随后又迅速将其内部的英伟达图形处理器 (GPU) 数量翻倍至 20 万个。今年 2 月,xAI 发布了 Grok 3,紧接着在 7 月又推出了 Grok 4,并称其为全球最聪明的 AI。

黄仁勋

创造一款人人都想要的产品,是大多数 CEO 的梦想。然而,对于英伟达的黄仁勋而言,当这个梦想成真时,却演变成了一场地缘政治的挑战。市场对英伟达 AI 芯片永无止境的需求,不仅催生了全球首家市值突破 4 万亿美元的公司,更将其推入了那个令人不安的风暴眼。

扎克伯格

中国公司已经取代 Meta 成为开源 AI 领导者,而 Meta 自己的 Llama 4 又未能收复失地时,马克·扎克伯格掏出了他的支票簿。这场行动始于一笔 143 亿美元的交易,旨在挖角 28 岁的 Scale AI 联合创始人 Alexandr Wang 及其几位顶尖工程师——此举被批评者视为其追赶对手的最后一搏。

那仅仅是扎克伯格数十亿美元人才招揽狂潮的开始。据报道,该公司在 8 月冻结招聘前,已成功招揽了至少 50 名研究员,但最近随着 Meta 内部的调整,不少跳到 Meta 的 AI 人才开始陆续离开。

李飞飞

被誉为「AI 教母」的李飞飞 (Fei-Fei Li) 在 21 世纪初为 AI 图像识别系统的创建发挥了奠基性作用,并由此推动了深度学习革命的浪潮。

2024 年 9 月,李飞飞与三位同事为 World Labs 筹集了 2.3 亿美元资金,投资者中包括杰弗里·辛顿 (Geoffrey Hinton)。她领导的这家初创公司旨在创建「大型世界模型」(Large World Models),使其能像 ChatGPT 等大语言模型理解语言一样,去感知和分析 3D 世界。该团队希望,这些模型能让人们想象并创造出可以像电子游戏一样漫游和探索的 3D 空间——其潜在应用包括飞行训练模拟、物理实验或城市规划。

Karen Hao

华人记者 Karen Hao 早在 ChatGPT 风靡全球的数年前,就开始报道人工智能——尤其是 OpenAI。她将这些报道汇集成Empire of AI 一书,这本引人入胜的畅销书不仅在硅谷,更是在全球范围内掀起了波澜。

她揭示了OpenAI 这家明星公司背后鲜为人知的一面,尽管没有点名该书或作者,但 OpenAI CEO 萨姆·奥特曼曾在 X 平台上发帖阴阳:「没有哪本书能把所有事情都说对,尤其是当有些人一心想要歪曲事实的时候。」

Alexandr Wang

年仅 28 岁的亚历山大·王 (Alexandr Wang)成为了 Meta AI 的掌门人。旨在创造超级智能——一个假设中比人类更聪明的 AI 系统。

在加入 Meta 前不久共同撰写的一份政策报告中,王曾写道,超级智能 AI 可能「是自原子弹诞生以来最危险的技术发展」。如今,他和 GitHub 的前 CEO Nat Friedman 正在一家拥有超过 30 亿全球用户的公司内部,帮助打造这项技术。

爱范儿,让未来触手可及。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


镜头的变幻就是故事|Midjourney V5.2 Zoomout 测试

➡阅读更多 AIGC 相关内容

最近一直都非常忙,所以连续 20 来天都没有碰过 Midjourney 了。前两天在社交媒体上看到,新推出的 V5.2 中有一个向外扩写的功能,因为此前已经在 PS+SD 的组合中见过这类拓展画面的应用思路,所以很想看看 MJ 的 Zoomout 能做出什么样的东西来。趁着端午假期这个空档,我集中跑了几波测试,有一些小小的心得,在此记录一下。

总体结论有三个:

1、Zoomout 可以无限次数地向外扩展,但随着镜头的拉远,Midjourney 自身的联想能力并不足以做出任何有意思的画面,不刻意控制地放大出来的画面,到了第 3~5 步之后,就会明显变得乏味和缺乏美感。

2、通过刻意地控制画幅比例、扩张倍数,以及针对性地调整 prompt 的描述,可以利用这个功能讲出有意思的故事。关键在于,使用者对于「镜头语言」的理解,以及对运镜和故事之间联系的掌控程度。

3、对工业设计的辅助甚微,做点「花活儿」可以,一旦涉及到逻辑,依旧不行。

Zoomout 功能的主交互界面

测试内容目录:

1、通过默认的 Zoomout X2 按钮连续放大 3 次

2、通过默认的 Zoomout X2 按钮连续放大 15 次

3、通过自定义 Zoomout 微调构图

4、通过自定义 Zoomout 构建人物画像

5、通过自定义 Zoomout 构建人物性格

6、通过自定义 Zoomout 完善场景氛围

7、在 niji 中应用自定义 Zoomout 构建人物和场景

8、自定义 Zoomout 构建情绪与故事

9、通过焦点变化构建故事的场景

10、通过镜头变化,构建故事的起承转合

以下为部分测试过程记录:

test case no.1:通过默认的 Zoomout X2 按钮连续放大 3 次

⬆ 点击以全屏查看图片 Click to view the image in full screen

操作方式:连续 3 次放大图像两倍,不对 prompt 进行修改,也不对画幅做设置。

输出成果:在奔跑的场景中增加了后方的人,有一点点故事性,但继续放大后会明显失焦,花面焦点始终在最开始的小女孩身上,继续放大生成的场景和人物都是模糊的。

test case no.2:通过默认的 Zoomout X2 按钮连续放大 15 次

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:连续 15 次放大图像两倍,不对 prompt 进行修改,也不对画幅做设置。

输出成果:外围拓展的场景越宏大,有效信息和故事性就越低,除了在阴影中无意间冒出的人影,没有任何惊喜和意料之外,拓展的画面也很单调乏味。

test case no.3:通过自定义 Zoomout 微调构图

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:不对 prompt 进行修改,按 1.1 和 1.2 的拓展比例小幅度调整画幅。

输出成果: 初始图像是近景特写,根据图像本身的特点,对画幅进行小幅度地微调来获得完整的全景镜头,以及合适的构图比例。

test case no.4:通过自定义 Zoomout 构建人物画像

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:先生成一个黄色漩涡图案,然后拓展时改写 prompt 为一只眼睛,进而生成一个带特征的面部局部画面,再次拓展时修改描述词为一个洞穴中的原始部落男性。

输出成果: 成功构建了一个有目标特征「黄色漩涡瞳孔」的男性角色,通过控制拓展比例以达到最终效果—-人物整体和局部特征均得以完整呈现的画面。

test case no.5:通过自定义 Zoomout 构建人物性格

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:先生成一个红色皮夹克的女性胸像,再改写 prompt 获得其坐在摩托车上的局部画面,再改写画幅比例获得完整的人物与车辆的全景照。

输出成果: 成功构建了一个有目标特征「红色皮衣+摩托车」的女性角色,通过控制拓展比例以达到最终效果—-人物细节和整体氛均衡的画面。

test case no.6:通过自定义 Zoomout 完善场景氛围

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:在初次生成的几批图像中,选择合适的画风和画面主体,再根据已有画面特征修改画幅比例。

输出成果: 在选定风格和主体后,将竖幅主体拓展为气势更足的全景影像。关键是拓展比例并非默认的 2 倍或 1.5 倍,而是根据实际需求来控制比例,同时也需要关注怎样的画幅比例可以传达对应的氛围。最终图像画幅比例是 3:1,适合展现有足够细节的宽幅场景。

test case no.7:在 niji 中应用自定义 Zoomout 构建人物和场景

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:

step 1、使用 niji 5 的 style original 生成一个细节丰富的初始人物;

step 2、以 1.2 的 Zoomout 比例纵向拓展出人物的半身画像,画幅比例是 1:2;

step 3、以 1.1 的 Zoomout 比例和 2:1 的画幅比例重构画面,得到外围场景;

step 4、以 1.2 的 Zoomout 比例和 3:4 的画幅比例重构画面,生成人物全身像;

step 5、改写 prompt 添加「宫殿」关键词,以 1.65 的 Zoomout 比例和 3:2 的画幅比例重构画面,生成人物在场景中的全景画面。

输出成果: 虽然人物细节和场景氛围的融合程度还不错,但因为漫画角色的细节较多,在多次 Zoomout 的过程中,场景的丰富会逐渐抢掉中心人物的视觉焦点。因此在每一次修改画幅比例与关键词的时候,需要多加注意对视觉元素的控制。

test case no.8:自定义 Zoomout 构建情绪与故事

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:

step 1、生成一个情绪和神情符合目标的初始人物;

step 2、改写 prompt 同时添加「马」关键词,以 2 的 Zoomout 比例和 3:4 的画幅比例重构画面,生成后续画面的基础,此时需要注意人物与马的位置关系,否则后续生成的画面会非常扭曲怪异;

step 3、以 1.05 的 Zoomout 比例和 2:1 的画幅比例重构画面,生成完整的马匹造型与部份环境信息;

step 4、对比改写 prompt 产生的变化,黑发组不改描述词,以 1.1 的 Zoomout 比例和 3:4 的画幅比例重构画面;白发组添加「巨大镜子」关键词,以 1.6 的 Zoomout 比例和 3:4 的画幅比例重构画面。

输出成果:通过控制 Zoomout 的幅度、画幅比例和 prompt 的调整,可以生成指定场景的画面,且人物的神态到位、情绪饱满,整体画面焦点清晰。但美中不足是,构图不够自由。

test case no.9:通过焦点变化构建故事的场景

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:

step 1、生成一个在河岸上的粽子;

step 2、修改 prompt 为「熊宝宝正准备吃粽子」,以 2 的 Zoomout 比例和 3:4 的画幅比例重构画面;

step 3、修改 prompt 为「小熊一家在野餐」,以 1.2 的 Zoomout 比例和 4:3 的画幅比例重构画面。

输出成果:通过对 prompt 的修改,控制 Zoomout 的幅度、画幅比例,可以改变画面中的焦点和表达主题,适合不同文化元素之间的混搭。

test case no.10:通过镜头变化,构建故事的起承转合

⬇ 点击以全屏查看图片 Click to view the image in full screen

操作方式:

step 1、生成一幅鲜花山谷的画面,人物要明显;

step 2、修改 prompt 为「一面巨大的镜子在草地上」,以 2 的 Zoomout 比例和 3:4 的画幅比例重构画面,此处竖构图是为了生成较高的全身落地镜;

step 3、修改 prompt 为「少女站在镜子前」,以 1.5 的 Zoomout 比例和 3:2 的画幅比例重构画面,改为横构图是为了囊括少女全身以及环境信息。

输出成果:通过改变画面中的焦点和增加元素,在镜头逐渐拉远的过程中,故事缓缓托出。

➡阅读更多 AIGC 相关内容


我的整体感受是:

通过 Midjourney V5.2 的 Zoomout 无限拓展,一次次修改画幅比例、提示词内容,可以用镜头语言的变化来讲故事了,也可以基于一些初始的「点子」延展成有意思的融合作品。但越是这样,越发显得对话式、指令式的交互界面( SD 那种也不算图形交互 )的局限太大了,我很希望今年之内能发展出图形交互界面。

没错,今年 AI 的爆发指向了一个新的趋势:对话式交互界面。但人类之所以发明绘画,开始通过设计图来制作各式各样的新工具,恰恰就是因为语言本身的效率太低。这个逻辑其实也可以从媒体形态上找到端倪:文字–> 图像–> 视频。仅仅依靠对话,我们无法构建出一个一把剪刀;仅仅通过语言表达的播客,也无法传达任何需要视觉才可以精准理解的信息。对话指令的交互界面与图形交互界面之间的关系,并非只是 dos 和 windows 之间的差异,更重要的点在于,后者可以更直观地完成交互,以及精准地进行创作行为。AIGC 的重点不仅仅只是 AI,而是我们如何使用 AI 进行「Generative Content」。

我说一句话,AI 给我一个东西,这不是创作。

创作是一个生命在主观意志的驱使下,刻意的、有目的地表达其心中所想。

因为 GPT 的爆发而说对话式交互是未来,这样的断言是过于冲动的。只要是一个严肃的创作者,就会立刻意识到,真正的创作一定需要多纬度的交互界面。这其中不仅仅包含对话指令,同样更需要图形界面以及在数字虚拟空间中的三维交互。AIGC 工具与 PS、表格、PPT、思维导图等已有工具的结合,就是这类多维交互的雏形。

那一刻,我们不会等太久。

➡阅读更多 AIGC 相关内容

❌