Normal view

There are new articles available, click to refresh the page.
Before yesterdayMain stream

初代星舰最后一飞结束!马斯克、特朗普现场观看,没能再次「筷子夹火箭」

By: 张成晨
20 November 2024 at 09:17

相见仿佛还是昨天,星舰的又一次试飞来了。这次的第六飞,和第五飞不过相差五周左右,是间隔时间最短的一次试飞。

如果说第五飞取得了「筷子夹火箭」的历史性成就,第六飞本该是第五飞的复刻版,任务大致相同,细节略有修改,查漏补缺,为第一代星舰收官。

但第五飞把胃口吊得太高,第六飞不免显得有些平平无奇。每一步都正常,就是没那么戏剧性。

然而,这或许就是飞行测试的意义,不能预计奇迹一定发生。

没能再次「筷子夹火箭」,不够精彩,但在意料之中

星舰系统主要分为两级:第一级,底部的超重型助推器(Super Heavy);第二级,顶部的星舰航天器(Starship)。

微风徐徐,天空万里无云,照例完成了点火、起飞、一二级热分离等环节,第一个看点出现在 7 分钟左右。

▲热分离

第五飞在发射场成功回收了助推器,惊艳全世界,证明「筷子夹火箭」的设计是可行的。第六飞本来想要再尝试一次,但不出意外还是出意外了。

▲第五飞梗图

这次,助推器做了一些软硬件的升级,为推进系统增加了冗余,提高了关键区域的结构强度,并缩短了成功捕获后从助推器卸载推进剂的时间。

和第五飞一样,SpaceX 事先不能保证一定捕捉助推器,只有发射了,火箭、发射台都满足条件,助推器、发射塔都正常工作,飞行指挥官手动下达了命令,才会进行尝试。

反之,如果助推器返航点火完成前没下命令,或者自动检测发现助推器或发射塔有异,那么助推器默认在墨西哥湾溅落,不返回发射塔。

安全第一的前提下,无非是两种选择,答案也很快揭晓,第六飞,助推器从天而降,着陆点火,最终在墨西哥湾溅落。

▲现场观众视角

虽然溅落了,也不可回收使用,因为它的设计不适合「浸泡在盐水中」。

失望的人们在 SpaceX 的评论区留言:「塔架捕捉助推器的标准到底是什么。」「抓住火箭。我不在乎条件。做吧。」「当你抓住过火箭后,把它溅落下来有点让人失望。」

但具体是没有满足什么条件,SpaceX 还没有给出明确的答复。对他们来说,这称不上失败,而是一次意料之中的谨慎选择。

直播现场,SpaceX 制造工程经理、现场直播主持人之一 Jessica Anderson 说:「开发测试,顾名思义,是不可预测的。但这正是我们进行测试的原因。」

星舰起飞 30 分钟后,SpaceX 表示:「所有系统看起来仍然正常。」

测试极限,拿到数据

相比回收助推器的成功,第五飞的航天器在印度洋的溅落不够完美,再入时襟翼被烧蚀,虽然降落位置精准,但最终在水面发生了爆炸。

这次第六飞,航天器的飞行轨迹仍然不变,但有几项新的任务,甚至为了获取更多数据,设置了一些「极限操作」。

先是起飞后 38 分钟左右,尝试在太空中重新启动其中一台猛禽发动机,验证航天器脱轨点火的能力,为未来的轨道任务做准备。

本来在第三飞就计划尝试,但因为滚转速率的原因,当时没能实现。这次,SpaceX 宣布星舰首次在太空中成功点燃猛禽发动机。

NASA 局长 Bill Nelson 也送上了祝福,说这是「轨道飞行的重大进展」。

然后是测试新的热防护材料,并在航天器的两侧移除整块隔热瓦。一方面,检验能否耐高温;另一方面,研究抓捕设备的安装位置,未来,航天器也要和助推器一样在发射场回收。

以及在下降的最后阶段,航天器故意以更高的攻角飞行,姿态更加倾斜,测试襟翼控制的极限,从而收集更多有关着陆的数据。

▲从星舰视角看地球

细节环环相扣,不像之前都是清晨起飞,为了更好地进行观测,第六飞的发射时间定在了美国中部时间的下午 4 点,航天器降落时,正好是印度洋上空的日出时分。

这次最让人惊喜的是,航天器的姿态调整和溅落水面发挥得特别稳定,没有像第五飞一样,在水面发生爆炸。

SpaceX 用多个机位拍下了「神龙摆尾」的画面。

按照惯例,SpaceX 宣布完成了第六次试飞。

19 个月六飞,第一代星舰的最后一次飞行

第六飞,SpaceX 团队显得松弛不少,加了特殊的有效载荷:一根香蕉,甚至还在星舰航天器上贴了一个香蕉图案,这和一个梗有关:「banana for scale」。

香蕉的尺寸相对标准,又有点内涵的意味,可以直观让人理解照片中其他物体的大小,用在星舰身上就有些幽默了,此等庞然大物面前,参照物已经失去了意义。

第六次试飞,是初代星舰的最后一次试飞,画上诙谐的句号也不错。

从第七次试飞开始,星舰将大幅升级,包括重新设计的前襟翼、更大的推进剂箱,以及最新一代的热防护系统。SpaceX 表示,隔热罩也得是完全可重复使用的。

星舰是人类历史上体积最大、推力最强运载火箭,也是第一个被设计为可完全重复使用的火箭。

每次试飞,SpaceX 都是为了获得经验和教训,提升整个星舰系统的可靠性,让火箭更加接近完全、快速、廉价的可重复使用目标,越来越像飞机,终有一天把人类送往火星。

从一飞到六飞,其实也只过了 19 个月,一次比一次飞得更远,失败、反思、学习、修正、重复冒险。

  • 2023 年 4 月,第一次试飞,助推级的 33 台发动机中有 3 台未能点火,火箭不久失控并自毁。
  • 2023 年 11 月,第二次试飞,助推器和航天器首次尝试热分离便成功,但随后助推器爆炸、航天器自毁。
  • 2024 年 3 月,第三次试飞,航天器的旅程前所未有得久,在返回地球大气层时烧毁。
  • 2024 年 6 月,第四次试飞,星舰完成了完整的飞行过程,助推器和航天器都成功在海洋中溅落。
  • 2024 年 10 月,第五次试飞,实现史诗级成就,首次成功在发射台回收助推器,上演「筷子夹火箭」。

第五飞和第六飞间隔时间短,部分是因为,美国联邦航空管理局(FAA)为第五飞颁发的许可证,其实也覆盖了第六飞。

这次第六飞,特朗普和马斯克一起到达现场观看。走马上任政府效率部的马斯克,可以经「懂王特许」,剑履上殿,入朝不趋,赞拜不名,疯狂刷火箭吗?

2025 年,我们应该可以看到更加频繁的星舰发射,SpaceX 的目标是,是在 2026 年向火星发射第一艘星舰。

最近,SpaceX 总经理 Kathy Lueders 在墨西哥航天局主办的 CONACES 2024 活动透露,马斯克计划在 2025 年开始发射 25 次星舰,在 6 个月内尝试捕捉星舰航天器。

马斯克曾说,「这个世界上必须有些东西能激励你前⾏,能打动你的内⼼,⽽我给出的⼀个答案就是,要让⼈类⽂明成为能够开展宇宙飞⾏的⽂明,让科幻⼩说成为现实」。

但生活不是科幻小说,每次尝试都不可完全预知,但都是为了接近一个可能的未来。

取法于上、仅得为中,未必不是下一次冒险的开始。

利若秋霜,辟除凶殃。 工作邮箱:zhangchengchen@ifanr.com

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


从 GPT-2 开始玩 AI 的博士生,把论文做成了上线 Steam 的独立游戏 | AI 新职人

By: 张成晨
19 November 2024 at 12:18

传说,国王山路亚尔生性残忍多疑,杀死背叛他的王后,从此每晚迎娶新娘,又在天亮时将其处死。为了终止暴行,大臣的女儿山鲁佐德自愿出嫁,用故事吸引国王,一直讲了一千零一夜。

你应该听过这个古老的民间故事,如果你是山鲁佐德,你如何让自己见到第二天的太阳?

独立工作室 Ada Eden 开发的《1001 夜》,一款让 AI 扮演国王的叙事游戏,已经为我们搭好了戏台。

但你的任务,不再是感化国王,和他白头偕老,而是将言语化为刀刃,刺入他的心脏。

我们试玩了游戏的 Steam Demo,并且和 Ada Eden 负责人、《1001 夜》主创起司聊了聊。

她本科毕业自清华美院,目前在英国读博士,喜欢和游戏 NPC、语音助手聊天,对捏聊天机器人情有独钟,从 GPT-2 就开始设计 AI 对话游戏。从《1001 夜》和起司身上,我们可以看到和 AI 相处的另外一种模样。

打败那个 AI 扮演的爹味国王

在《1001 夜》的设定里,玩家扮演的山鲁佐德,为国王讲故事,由大语言模型(智谱 GLM)驱动的国王会接话,续写玩家的故事。

你来我往的交锋中,玩家需要诱导国王说出刀、剑、盾等关键词,将武器化作实体,集齐 4 把武器,打败国王,完成复仇。

因为有了 AI,武器卡牌、场景、战斗台词等内容,都是实时生成的,由故事内容决定。这便是游戏的一大乐趣所在——每个故事、每个武器都独一无二。

▲ 注意场景跟随卡牌变了

同时,提示词规定了,国王傲慢而暴躁,崇尚武力征服,喜欢和自己性格相符的故事。玩家们概括,就是「很爹味」,总和自己抢笔,按他的喜好篡改故事走向。

所以,国王不会被轻易蒙骗,如果玩家的故事不合逻辑,过于现代,让他理解不了,或者刻意地提到武器,动机昭然若揭,他很可能会失去耐心。当耐心降到零,山鲁佐德会被杀死。

顺着国王的脾气讲故事,还是硬塞给国王他不想听的故事?这是每个玩家的自由,也是人类与 AI 之间的博弈。

起司说,有些玩家会知其不可而为之,努力让国王接受爱情故事,「如果你很强烈地想要维持自己的故事,那么你就需要花更多时间和他周旋,说服他」。

实践表明,有时候冒犯了国王,反而更能从 AI 身上看到像人的部分。

我给国王讲电竞小说的情节,他明显不耐烦,也不试图理解。或许穿越到现在,这位国王也是认为游戏有毒的封建大家长作风。

当我讲到金庸小说里「武林称雄,挥剑自宫」的《辟邪剑谱》,国王更是火冒三丈,不能容忍别人挑战他的男性威严。

如果担心摸不准国王的性格,通关有个小技巧——反客为主,倒反天罡,让国王讲个故事给我们听,他很可能会自觉说出武器的关键词。

起司观察到了这个现象,她其实可以加些限制,但看到大家都玩得「挺欢乐」,还在小红书等社交媒体晒出来,那么也未尝不可。

不过,《1001 夜》可以获取的武器不多,可能会限制玩家的发挥——包括彩蛋在内,主要是国王身后的这些武器类型,剑、矛、刀、盾、斧子。

▲ 偷看国王的武器,也会让他失去耐心

经过实测,弓箭、流星锤不行,游戏会提示玩家及时转变策略。起司解释,每种武器都要做模型、动画,美术忙不过来,以后会逐步增加。

集齐 4 把武器,玩家就会进入战斗界面,和国王互砍几个回合,将其就地正法。

每次游戏结束,都会生成一本记录,总结故事、武器、结局,并给山鲁佐德一个和故事相配的中二称号。

通关的常规套路,是怎么方便提到武器怎么来,比如讲战争,但让起司印象深刻的,是那些意想不到的故事,秦始皇、哈利波特、大明王朝、高考语文、沙威玛传奇……

还有把知识学杂了的玩家,让国王帮自己玩《苏丹的游戏》,这也是一个《一千零一夜》题材的游戏,带卡牌元素,玩家给国王讲规则,让国王做决策。

起司发现,从头编全套的故事有点难,但很多玩家都可以做到,给国王复述自己熟悉的故事或者游戏剧情,她觉得这样也很有意思,国王续写的故事,可能会神预言,也可能和原来的故事反差很大。

其中一个玩家,给国王讲甄嬛传,刚开头,国王就代入了自己,问玩家是不是讽刺自己薄情寡义,但当故事继续下去,国王还能预测甄嬛传的剧情走向。

AI 的开发者不能完全掌控 AI 的行为,无法穷尽玩家和 AI 聊天的方式,玩家自己也不能决定故事的走向,不知道自己能不能说服 AI。

和 AI 对话最美妙的,或许正是这种千丝万缕的可能性。

告诉玩家 AI 怎么被使用,是 AI 原生游戏的责任

显然,在《1001 夜》里,AI 扮演了关键的角色,在闻 AI 色变的氛围之中,尤其起司所在的艺术和游戏圈里,不免产生了一些争议的声音。

「美术不会用了 AI『尸块』吧,用癌的游戏我不玩」「是不是拿我的对话训练 AI」「会不会侵害其他艺术家的权利」,起司很理解玩家面对 AI 恐慌的心情。《1001 夜》是一个关于创作的游戏,被吸引的玩家,对创作往往都有自己的坚持。

国外艺术家对于 AI 的态度,可能更加抵触。起司开玩笑说,在国外发表演讲,尤其和其他艺术家交流时,会先叠甲,介绍自己是美术生,让对方知道自己「不是坏人」。

起司既是艺术家,也是 AI 研究者,她其实最了解怎么使用 AI 省力,但她走了一条更难的路:找到一个使用 AI 的尺度,平衡游戏需要的效果和外界的情绪。

▲ Ada Eden 对如何使用 AI 的说明

《1001 夜》固定的剧情和 NPC 对话,是预先写好的。游戏里所有静态的、传统的游戏美术资产,包括角色、场景、CG、UI 等,也都是人类艺术家制作的。

但没法预制的部分,只能由 AI 实时生成,包括国王回复玩家的文本,以及因人而异的武器卡牌和场景。

也因此,起司把《1001 夜》定义为 AI 原生游戏:用生成式 AI 实现核心玩法,不用 AI,游戏机制就不能成立。

目前,国王回复、战斗台词等文字,用智谱的 GLM 模型生成,相比 GPT,GLM 的中文稳定程度更好。

至于卡牌、场景等实时文生图的部分,《1001 夜》仅用团队内部美术,训练了专属的风格模型,AI 只会生成原创的游戏画风,不会模仿其他艺术家,确保了训练素材的来源和生成内容的安全稳定。游戏还获得了开源图像处理技术 Pixelization 的授权,让图像保持像素风格。

▲《1001 夜》的小红书评论

同时,起司也一直在思考,怎么让 AI 的使用更温和,减少潜在的问题,更能被大家接受。

按起司的话说,「但凡是人类创作者能做的,我们全是手工做的」。

起司不知道,这是不是一种标准答案,或者好的做法,但她认为,一个讲创作的游戏,至少要呈现出明确的态度,和玩家讲清楚怎么使用 AI,「这是游戏责任的一部分」。

从论文到独立游戏,把 AI 当作讲故事的材料

每个未被实现的创意,都在等待一个成熟的时机。

《1001 夜》从 2020 年就开始开发,早于将让 AI 对话成为日常习惯的 ChatGPT。起司对 AI 对话游戏的兴趣,又有更加漫长的前因。

起司从小就喜欢视觉小说这类文本量大的游戏,看游戏里的文案,尤其喜欢和 NPC(非玩家角色)聊天,虽然她也知道,这些都是提前写好的。

2011 年,苹果语音助手 Siri 的出现,更让起司觉得新奇,Siri 用自然语言交互,对话比 NPC 更灵活,甚至让她联想,这种技术,是不是可以用到 NPC 上面。

在清华美院读本科时,起司决定,动手设计聊天机器人。然而,当时对 AI 的普遍认知就是「笨」,和 AI 对话这件事,大多数人没有什么期待,也不认为值得去做,「因为大家接触到的顶多也就是 Siri」。

但起司认为,设计聊天机器人,和设计游戏角色很像,不是一定要多么聪明,只要表现出一些人性,那也很有意思。本科到硕士期间,她做了很多奇奇怪怪的聊天机器人,其中就包括了《1001 夜》。

回望这 4 年,《1001 夜》的发展脉络,精准地踩中了技术的鼓点。

最开始,《1001 夜》是起司硕士游戏课程的作业,2020 年底有了第一版 demo。当时,用的是「ChatGPT 的奶奶」GPT-2,算力有限,效果也差,投喂了短篇小说后,勉强可以用英文说出人话,接着玩家讲故事。

21 年底,起司联络到了彩云科技,这家公司旗下的彩云小梦是个智能写作 AI,用户开个头,它就能续写故事,这完美契合了起司的需求。游戏从此受到了关注,发表了第一篇论文,被邀请在美术馆展览。团队还做了一个装置,可以把故事打印出来,玩家都很喜欢。

▲ 2021 年,早期的 1001 游戏及装置

但这时候的国王,还是不够聪明,只能执行单一的任务:讲故事,没有办法判断玩家的故事质量,也没办法判断玩家是不是在骂它。然而,就算玩法基础,也有很多玩家愿意投入到游戏之中,「因为觉得很有回报感」。

这验证了起司的想法,回应了她当初对聊天机器人的设想——虽然技术有限制,但用生成式的方式产生故事,是一个鼓励玩家创作的游戏机制。

2022 年底,ChatGPT 发布,随后,各种大模型逐渐面世,很多问题自然而然地被解决了。AI 不再只是一个续写机器,而是一个有性格的国王,「只要提示词写得对,基本上它都可以按照我的设计来行事」。

同时,文生图模型也在成熟起来,起司觉得,时机到了,《1001 夜》可以发展成一个完整的独立游戏,被更多人下载和游玩。

2023 年初,起司成立了工作室 Ada Eden,以世界上第一位程序员 Ada Lovelace 的名字命名,成员在 10 个左右,包括程序员、策划、美术、音乐人,基本都是「从网上摇来的朋友」,挤出业余时间做游戏。

▲ 团队成员

和普通的游戏团队不同,Ada Eden 的每个成员都得懂点 AI,不仅是程序员,策划也要配合写一部分的提示词,调教 AI,确保生成的内容符合逻辑,保持游戏的文风。

《1001 夜》像素风的美术风格,也是一开始就确定好的,因为起司自己很喜欢像素游戏,「玩过很多游戏,才会喜欢像素风格,也会吸引到同样审美的玩家」。

2020 年,《1001 夜》没有涉及 AI 生成图像,不过,起司当时有隐约的感觉,像素风可以很好地包容生成式的美术内容,所以一直沿用下来,真的进入 AI 生成的时代。

因兴趣而起心动念,因技术的发展而不断打磨成品,从纯文字到多模态生成,今时今日的《1001 夜》,有些像世界线完美收束的产物。

▲ Ada Eden 受邀参加各类展览,包括 2024 的科隆游戏展。近期刚完成在德国多特蒙德的展览

ChatGPT 的发布,对起司还有个额外的好处——她终于不用解释自己在做什么了。

以前,起司介绍自己的时候会说,「我是一个艺术家,但我是做聊天机器人的」,大家可能还是很困惑,但现在,她可以直接说,「来玩一下这个和 AI 对话的游戏吧」。

AI 对话游戏,其实是个很大的类目,也有一些爆款诞生,比如,说服 AI 女朋友让自己出门的《病娇猫娘 AI 女友》、玩家扮演吸血鬼欺骗 NPC 开门的《Suck Up!》。

▲《Suck Up!》

但《1001 夜》又是另一种类型。在起司看来,它更像是写作。

一千零一夜的故事原版是,山鲁佐德和国王终成眷属,但这个结局让小时候的起司很困惑,国王明明十恶不赦,为什么却能有个俗套的美好结局。

《1001 夜》以 AI 对话游戏的形式,解决了这个疑惑,让玩家讲述一个又一个故事,改变原有的现实。

10 月 24 日,《1001 夜》在 Steam 发布了可以试玩的免费 Demo,但 Demo 只呈现了不到正式版 20% 的基础玩法。Demo 通关之后的动画也暗示:只熬过一个夜晚是不够的。

起司透露,在正式版里,故事线和任务将更加丰富,女主角会回溯时间,和之前死去的女孩一起协作。她想做的,是一个完整的叙事游戏,包含不同的章节。

作为一个研究 AI 的美术生,起司被很多人问过「画师会不会失业」,也听过很多「AI 取代人类」的宏大叙事。她理解大家的担忧,但也对造成这种印象的现状感到不满,「目前技术缺乏监管,又经常被滥用,造成了大家对 AI 的负面印象」。

但她也清楚,自己的看法无法代表其他画师和创作者,她只能尽力而为,让大家看到 AI 应用有趣的一面,「给技术讨论贡献一点点独特的声音」。

《1001 夜》里的山鲁佐德,努力改变国王安排的命运,她愤怒,她不接受,她要讲自己的故事。同时,她所讲的故事由人类发起。没有玩家,就讲不出这么多美好的故事。

起司希望,《1001 夜》可以让玩家意识到,原来 AI 可以有这种玩法,原来自己讲述的故事和产生的剧情,可以在游戏里产生意义。

她已经「折腾」了 AI 很长时间,也会折腾下去,继续回答她心中的、更具体的问题——如何用 AI 打造好的作品,带来从没见过的体验,甚至让人获得智识上的满足感,「AI 是一种特殊的讲故事的材料,我对此非常坚信。正是因为技术发展太快,好的故事才会像水晶一样清澈而珍贵」。

利若秋霜,辟除凶殃。 工作邮箱:zhangchengchen@ifanr.com

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


打败 Midjourney,匿名屠榜的 AI 生图黑马,让人人都能设计海报

By: 张成晨
9 November 2024 at 12:22

如今 AI 圈更新产品的节奏,让每个和键盘难舍难分的编辑明白了一句台词:你还有多少惊喜是朕不知道的?

这不,又一个 AI 生图神器来了:Recraft。

好用在哪?一句话概括就是:人负责排列组合,AI 负责美工,审美挺好,还不容易出错。

对于普通人来说,设计海报又又又变得更简单了,我们就是 AI 的甲方,给它一套毛坯,它给你一次次不重样的精装。

指路👉https://www.recraft.ai/projects

十几秒一张海报,拿捏文字,这个 AI 是文生图的清流

请问,设计一张海报,需要几步?Recraft 表示,三步就够了。

首先,在空白画布上,拉出一个紫色的框框;其次,在你想要的位置放入图片、文字,输入提示词;最后,点击生成按钮,AI 就能帮你化腐朽为神奇。

只要等待十几秒,一张海报出现在你面前。比如这样,轻轻松松把文字变成 3D。

▲ 图片来自:X@recraftai

或者,你想做个表情包,有图,有文案,但不知道怎么组合更好看,也可以交给 Recraft,让它来扩图,把文字自然地融进场景里。

▲ 左边,AI 生成;右边,草图

甚至,我们不上传图片,纯打字,让 Recraft 一条龙生成海报也没问题。

文字渲染一直是图片生成模型的痛点,但 Recraft 牛逼在,可以 hold 住一大段文字。

A 妹主演的《魔法坏女巫》将在 11 月上映,国内也会引进,然而,电影还在文火加热,设计简陋的海报已经被群嘲了。

不如让 Recraft 重做一次吧,我用不同字号,把文案排列了一下,草图这就算做好了,然后参考原海报,反推提示词,说明了画面的要素,接下来交给 AI 一键美化。

▲ 左边,AI 生成;右边,草图

可喜可贺,该有的都有,文字没有错误,每一行都被 AI 精心设计,和官方海报一比,风格不同,但没有差到哪里去。

▲ 左边,AI 生成;右边,官方海报

除了从头设计,Recraft 还可以处理多张图片,满足追星族和嗑 CP 爱好者的要求——把喜欢的角色 P 到一起,看起来不突兀。

以哈利波特和毒液为例,上传需要的两张照片,背景不同怎么办?这里不得不提 Recraft 一个非常实用的功能:一键抠图。

是的,传统的 P 图软件都有抠图功能,这不算什么,但 AI 生图工具,考虑到这个大众功能并加进产品的,不多。

抠图之后,配上文案,看起来仍然有次元壁,默认字体也丑了点,没关系,选择你想要的画风,让 AI 统一优化,就有同框的感觉了。

▲ 左边:优化后,右边:优化前

擅长设计平面是不够的,Recraft 的一个功能更让人拍案叫绝:Mockup,做立体物体的图案设计。

先让它生成一个普通的红色棒球帽,中间的绿色框框,用来生成图片,或者上传自己的图片,然后图片可以和帽子完美融入。

比如,加上一段文案:「make cats great again」(让猫猫再次伟大)。

抠图去除多余的背景,把图标拉伸到满意的大小、旋转和移动到合适的位置,它始终保持透视效果,自适应地贴合表面。

以此类推,T 恤、杯子、徽章也是一样的,吃谷虽然快乐,但伤钱包,以后可以自己给自己做周边,赛博欣赏,自娱自乐了。

▲ 仅示意,徽章是 Recraft 生成的,图案是上传的

请问,我为什么一直在让 AI 设计英文内容?

因为 Recraft 有硬伤:可以用中文提示词,但输出不了中文。哪怕我明确要求,某段话请用中文写,它也会「贴心」地给我翻译成英文。

但只要能登上 Recraft,就有免费额度可用,设计海报、封面、产品图、表情包…… 有便宜可占,已经很香了。

匿名登顶,免费商用,和设计师交个朋友

我们知道 Midjourney、DALL-E、Flux、Ideogram,但这个 Recraft 是何门何派?

前段时间,文生图模型 red_panda 在 X 一鸣惊人,因为它在 Hugging Face 的排行榜拿下了第一名,把有名有姓的前辈踩在脚下。

这个排名,靠两两图片对比得出,比的是综合能力,包括审美、提示词理解、身体结构准确性、文字生成质量等。

网友猜测,red_panda 是「小熊猫」的意思,难道来自中国?关子没有卖多久,幕后团队就出来自曝了。

red_panda 基于模型 Recraft V3,背后的公司是 2022 年成立、总部在伦敦的 Recraft AI,创始人曾在 Google、微软工作过。

Recraft 一朝成名天下闻,不是没有道理,这个产品集了各家之所长。

▲ 图片来自:X@recraftai

论高清、光影、真实感,Recraft 不输 Flux。

同时,它对新手友好,有很多不错的预设风格,游走在写实和艺术之间,不用写复杂的提示词,就能模拟各种摄影和绘画效果。

▲「Hard Flash」风格,强烈、直白的闪光灯效果

Recraft 擅长的长文本图像生成,准确度怕是让拿文本做招牌的 Ideogram 都自愧不如,而且,它很听话,可以让我们决定文本的大小和位置。

▲ 图片来自:X@recraftai

不过,Recraft 也可能出现文本错误,并且导致背景变形。当我模仿《火星救援》的风格做马斯克的海报,他的脸像被整容了,还是失败的那种。

▲ 左边:AI 生成;右边:草图

当 AI 生图工具都在增强可控性,Recraft 不落下风,Midjourney 的修改局部功能,它也有。

我们框选出某个区域,然后用提示词告诉 AI 怎么修改,加个帽子轻轻松松。

十八般武艺都会一点的 Recraft,会抢设计师的工作吗?恰恰相反,它是来交个朋友的,把自己定义成:面向设计师的生成式 AI。

所以,Recraft 具备了一些设计师们需要的功能,比如样式也可以通过更多的图像输入给模型,保持风格的稳定。

Recraft 还做了一个小小的协作功能,画布可以共享,让对方评论,因为「有时候,两个人的想法比一个人的想法更好」。

▲ 图片来自:X@recraftai

更喜闻乐见的是,Recraft 生成的图片可以免费商用。

当然,不是设计师的小白们,比如我,也可以玩得很开心,分分钟做出自己喜欢的海报。

而且,本就没必要将人和工具比较,Recraft 是来和 Canva 等设计工具、Midjourney 等 AI 生图工具同台竞争的,用户们坐享其成。

▲ 图片来自:X@recraftai

Canva 的 CEO Melanie Perkins 说过,Canva 希望让每一个人都设计出他们可以想象的任何东西,无论说什么语言,用什么设备。

所以,他们打破 Adobe 的门槛,简化了设计流程,提供了各种模板、部件、图片、字体,让用户增减元素。

▲ 图片来自:X@recraftai

AI 的进化方向,和这位 CEO 的愿景是一样的:为全世界赋予设计的能力。

但我们的选择,越来越不局限了,不是必须选择哪个产品,不是必须听某个创始人的故事,工具能帮我们做的越来越多,我们按下的按钮越来越少,甚至可以不亲手操作,人人都能设计一点东西,如果我们还愿意称之为设计。

利若秋霜,辟除凶殃。 工作邮箱:zhangchengchen@ifanr.com

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


中国团队夺冠的赛博格「奥运会」,让我们看到人与机器的共生

By: 张成晨
3 November 2024 at 12:24

你有没有想过,拧灯泡,穿衣服,开瓶盖,也会成为比赛项目,并且扣人心弦?

10 月 26 日,瑞士苏黎世,一位中国运动员残缺的右前臂穿戴着义肢,用 8 分钟做了 10 件日常的小事,期间只有一次失误,最终夺得冠军,创下中国团队史上的最好成绩。

▲ 拧灯泡,义肢转了一下太帅了

▲ 绕圈,不碰到中间的金属管

她参加的是一场特殊的「奥运会」,Cybathlon。这个词由「赛博」和「竞赛」组合而成,可以翻译为半机械人仿生奥运会、全球辅助技术奥运会。

在充满生命力的赛场上,赛博格褪去了科幻小说和电影里冰冷的形象,为生活而战。

属于赛博格的奥运会

Cybathlon 是瑞士苏黎世联邦理工学院的非营利项目,从 2016 年开始举办,四年一届,今年是第三届,24 个国家的 67 支队伍参赛。

每支队伍都是一个团队,由残障人士和技术人员组成,残障人士上场时也并非单打独斗,而是带着各式各样的辅助设备,假肢,外骨骼,甚至机器人。

可以说,他们都是「赛博格」,人类和机器的融合体,人脑负责思考,机械配件带来能力增强。

这和残奥会不太一样。残奥会的运动员们,往往只能使用维持正常比赛所必需的辅助设备,设备不能提供额外的性能优势,确保公平竞争,比拼运动员自身的能力。

但在 Cybathlon,残障人士和辅助设备是一体的,不强调竞技,不单纯比拼力量和速度,而是让人类和机器合作,尽可能完成生活里天天遇到的事情。

▲ 拉拉链

比起运动员(athletes),主办方认为称这些选手为操纵设备和身体的驾驶员(pilots)更贴切。荣誉也非一人之力,同属残障人士和技术团队。

夺冠的中国团队,选手叫徐敏,技术团队来自东南大学和中国科学院苏州医工所。比赛的规则也能体现主办方的用意,共 10 个环节,以完成度和完成时间判定成绩。

徐敏只在叠杯子的环节失误,拿了一个红牌,得了 90 分。第二名虽然平均耗时更短,但有两个环节没完成,以 80 分落败。

其中最难的环节可能是盲盒取物,义肢穿过遮挡视线的毛刷,抓取硬度不同的圆柱体,徐敏是唯一一个拿下这关的选手。

这就体现了选手、辅助设备和技术团队的完美协作,义肢手指装有摄像头,就像拥有了「眼睛」,辅助人类完成了抓取。

纵是如此,盲盒环节仍然看得人心惊胆战,掏出第二个物体花了不少时间,徐敏说了句「看不见,要不要放掉」,旁边的技术人员鼓励「没事,还来得及」。

最重要的是,她手上的动作依然有条不紊,表情也很沉着,最终才能攻克。

赛博格的意义,正是弥补生理的缺陷,克服肉体的限制,并在每个艰难的瞬间,创造奇迹。

用最酷炫的设备,做最日常的事情

比赛有 8 个项目,除了中国团队夺冠的上肢义肢,还包括下肢义肢、外骨骼、脑机接口、轮椅辅助、视觉辅助、机器人辅助、功能性电刺激。

每个项目对参赛选手资格、辅助设备条件都有相应的规定,同时比起往届有不少创新。

其中,脑机接口的任务是用意念玩游戏,不允许语音命令或者身体动作,规定固然白纸黑字,参赛选手们颈部以下运动功能完全或严重丧失,就算想要作弊也有心无力。

当身体被固定住,再简单的任务,完成的难度并非常人所能体会。

冠军是美国匹兹堡大学的团队 PittCrew,2 分多钟的时间里,选手 Phillip 在游戏里用钥匙开门、操纵光标点击正确的图标、把杯子放在制冰机下面收集掉落的冰块。

可能有些反直觉,对于脑机接口选手来说,比起抓取、转动某个物体,克制不动,保持某个姿势,是更难的。学会抑制不需要的想法,需要时间和练习。

比赛过程中,PittCrew 全程躺着,神情严肃,偶尔会看到他动动嘴巴,像在用力,团队也会出声鼓励一两句。

Phillip 的大脑里植入了 4 个电极,计算机可以通过记录到的电信号,读取他的意图。巧的是,这届比赛是主办方首次允许植入式电极。

也有些脑机接口选手,继续选择头戴式的脑电图设备,看起来像一顶帽子,非侵入性,且更传统,电极接触头皮,电线连接电脑,记录大脑表面的电活动。

虽然头戴式比植入式更方便、安全,但信号会被削弱,也容易受到其他神经元的干扰。某种程度上,这也是一场新旧科技的对决。

视觉辅助和机器人辅助,则是这届的两个新项目。

机器人辅助项目的选手,必须是日常使用轮椅,同时上肢也严重受损的残障人士,对机器人的条件就放宽得多,因人而异,可以通过触控板、手控摇杆甚至舌控驱动。

来自德国的冠军 Mattias Atzenhofer,用平板和手柄控制机器人,完成了刷牙、捡水瓶、抓盘子、喂苹果、扭动门把手等动作。

虽然轮椅辅助项目也用到轮椅,但主要比拼怎么用轮椅走过不平坦的地形和楼梯。下肢义肢项目与之相似,同样是挑战各种地形。

▲ 轮椅辅助项目

▲下肢义肢项目

至于视觉辅助项目,参赛条件是视力严重受损或完全丧失,辅助设备包括但不限于手机、白手杖、AR,可以用 GPS、超声波等技术收集环境信息,也允许以声音、振动、电刺激等形式提供反馈。

然而,得分普遍较低,来自匈牙利的冠军也只有 70 分,他主要借助盲杖和一款手机 app,躲避障碍物、走规定路线、在架子上找到对应的物品、捡起东西放到盘子里……

比赛里有个叫人伤心的细节,每当失败,会有团队成员出来扶着他,走到下一关。或许可以反映出,盲人的辅助设备还远远不够,生活里的障碍仍然无法被面面俱到地克服。

功能性电刺激项目,听起来可能有些陌生,简单来说,就是通过电刺激让瘫痪的肌肉重新活动。

参赛选手下半身完全瘫痪,骑行固定在地面的自行车,在虚拟赛道里一决高低,第一名是位韩国选手,和第二名仅有三秒之差。

▲ 2024 年比赛

相比之下,之前的比赛更加直观——在实体赛道上骑行约 805 米。有些选手会因为肌肉过度疲劳,中途停下休息。只看他们骑行的样子,完全不会和瘫痪挂钩。

▲ 2016 年比赛

主办方固定自行车,主要是因为场地不够用,并照顾到远程参与的选手。虽然事出有因,但也不难理解,有些往届选手对此次的规则不满。

他们认为,停在原地太无聊了,在车道上骑行,移动起来,才能有自由的感觉,观众们会忽略他们的身体,只夸他们的自行车不错。

外骨骼比赛也比往届更难了,增加了侧步走的环节,也就是横向移动。目前,大部分设备更擅长向前或向后的直线运动,侧向运动还在技术改进和优化的阶段。

其实,对于截瘫和腿部运动功能完全丧失的残障人士来说,哪怕从坐着变成站着,也已经够难了。然而,这就是他们每天都在面临的障碍,无论如何也无法逃避。

真正的英雄主义,是在看清生活的真相之后,依然热爱生活。很多人习以为常的动作,由人和机械配合着完成,其中的艰难和汗水,非亲历无法想象。

看到残障人士和辅助设备、技术团队合作,努力完成各个项目,感动和敬佩便无法抑制。最先进的设备,是为了满足人类的日常生活而生。未来已来,因为技术、和平与爱。

没有失败者的比赛,为了一个没有障碍的世界

参与比赛的残障人士,并没有比其他人更肌肉发达、身体健壮,也并不限制年龄。

与其说,Cybathlon 是让残障运动员比出高低,不如说,它是个技术的擂台。

▲ 瑞士团队开发的视力辅助设备,帮助导航

▲ 意大利团队开发的腿部假肢,提高崎岖地形的稳定性

竞争只是手段,而非目的,这场比赛有赢家,但没有败将,因为每个团队的参与,都在帮助更多残障人士的生活。

比胜利更重要的,是以人为中心,一开始就考虑到残障人士的需求,开发出更适合日常的辅助设备。

有些产品已经非常成熟,也有些产品只是原型,先放在赛场试试深浅。比如,瑞士初创公司 Scewo 的爬楼梯轮椅,就在参与比赛后投入市场,售出超过 200 件。

Cybathlon 创立于 2016 年,每 4 年举办一届,口号是「为了一个没有障碍的世界」。

当年,Cybathlon 发起人、苏黎世联邦理工学院教授 Robert Riener,因为报纸上的一则新闻,心里涌起了创办大赛的冲动。

▲ Robert Riener 在 2016 年开幕式上发言

这则新闻已经是 2012 年的故事了,一名男性靠电动膝关节假肢,走上了芝加哥的威利斯大厦,他叫 Zac Vawter,爬了 103 层,共 2109 级楼梯。

同时,Robert Riener 长期地和残障人士一起工作,他观察到,很多辅助设备对残障人士没用,比如,手臂假肢可能又贵又复杂,轮椅爬不了楼梯,或者因为宽度没法穿过门。

有时候,科研团队的研究和残障人士的需求是错位的,前者推动着技术前沿,但后者考虑的,是设备能不能用起来更简单友好。

所以,Robert Riener 决定在瑞士举办一场竞赛,在公共场合展示残障人士的能力,让提供技术和需要技术的人合作,听到彼此的声音。

十多年来,Cybathlon 一届比一届成熟,除了四年一度的大赛,届中还有项目和队伍更少的年度挑战赛,中国团队也在 2023 年度挑战赛拿下过上肢假肢组的冠军。

比赛秉承包容精神,可以到现场参加,也可以远程参与,因为团队可能承担不起机票,或者残障人士不方便远行。因为众所周知的原因,2020 年的比赛完全在线上进行。

让科研的成果传播得更远更广固然是好的,但帮助残障人士,是一项长期的事业。残障人士和技术团队,不会因为一场比赛临时合作。

脑机接口冠军 Phillip 从一年前开始使用脑机接口,徐敏更是在 2019 年就认识了此次比赛的带队人,成为一名假肢受试者,佩戴的义肢不断调整,换了又换。

虽然众人皆知 Cybathlon 很有意义,但它的未来还不确定,组织比赛的资金就是一个问题。说到底,Cybathlon 受众不够多。

下一届,也就是 2028 年的 Cybathlon,可能在亚洲举行。

主办方希望,这项赛事可以不局限在瑞士,而是真的能像奥运会一样,在全世界巡回,并一届届地办下去。

或许,我们每个人微不足道的关注,也会是一个小小的火苗,让这把火烧得更久,更远。

利若秋霜,辟除凶殃。 工作邮箱:zhangchengchen@ifanr.com

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


让千万网友着迷的 AI 巫师猫,凭什么成为小红书和 Instagram 的新顶流

By: 张成晨
27 October 2024 at 17:14

秋天到了,《哈利波特》重映了,万圣节快来了,魔法的气息蠢蠢欲动了。

最近,一只 AI 生成的猫从海外火到国内,在 X、Instagram、小红书都拥有极高的人气。

爱意始于颜值,这是一只圆滚滚的橘猫,头戴尖顶的巫师帽,爪子握着魔杖,迷离的眼神大智若愚。可以形象地称它为,巫师猫。

巫师猫的一条短视频,在 Instagram 超过 1200 万次播放,还不断有人为它二创。

▲图片来自:Instagram@tothemoonq888

不少网友感叹,这才是使用 AI 的正确方式。上网只为三件事,吸猫,吸猫,还是特么的吸猫。当然也有人满头问号,这也能火?

当一只 AI 猫成为网红

经过考古,巫师猫最早出现在 8 月 25 日,由分享猫咪图片投稿的 X 账号@gatinarios 发布,现在这条帖子超过 1250 万次浏览、22.3 万次点赞。

真正让巫师猫火起来的,是一系列脑洞大开的 AI 二创。

大口品尝拉丝芝士披萨,仍比人类老铁的吃播优雅几分。

▲ 图片来自:Instagram@miyavlikedicikler

魔杖秒变左轮手枪,要是阁下不想看魔法,它也略懂一些拳脚。

▲ 图片来自:X@Cheeseball_sol

熬了一锅魔法药水,它说紫色很有韵味。

▲ 图片来自:X@venturetwins

骑上扫帚潇洒飞走,挥一挥斗篷,不带走一片云彩。

▲ 图片来自:X@venturetwins

以古早 3D 游戏画风展现魔性舞蹈,轻轻松松在 Instagram 迷倒 34.2 万个人类。

▲ 图片来自:Instagram@doro_daro

甚至连 3D 建模都有了,只差分享一个链接,已经准备好掏钱买来当书桌摆件。

▲ 图片来自:X@masom_mamen

猫红了,诡计多端的人类便要蹭。

快手可灵官方生成了一个万圣节氛围感短视频,秀一秀自己的 AI 视频能力,然而东亚味图穷匕见,没想到连猫都要拿起电脑打工。

▲ 图片来自:X@Kling_ai

硅谷知名投资机构 a16z 合伙人、专做 AI 公司投资的 Justine Moore 也给予了高度评价,说巫师猫是 Instagram 短视频的新顶流。

热衷方法论的小红书用户们,则教你怎么用 AI 制作巫师猫,授人以鱼不如授人以渔。

总之,时代变了大人,AI 让创作和二创表情包都更容易了。

迪士尼的粉色狐狸玲娜贝儿,本是没有故事的女同学,但迪士尼乐园工作人员的扮演和粉丝的二次创作赋予了它灵魂。

巫师猫的出道方式与之类似,现在已经有自己的社交帐号、网站甚至迷因币,堪比马斯克喜欢的狗头 Doge,这些动态就是它的故事,丰富着它的猫设。

甚至有网友觉得,它神似《哈利波特》的麦格教授。

只要形象够可爱,出厂设置再单薄,也会有人填补空白。这就叫,颜值即是正义,总会有妈妈爱你。

无聊的人类会吸电子猫吗

世界破破烂烂,萌物缝缝补补。从纸箱狗、猫 meme 的一度流行来看,猫,哪怕是 AI 生成的猫,受网友欢迎,是再正常不过的了。

其中或许有个原因,围绕宠物而不是人创作,更能让 AI 扬长避短,更不容易陷入恐怖谷。

它们不需要完全地拟人,也不需要和真实动物完全一致,哪怕稍显奇怪和夸张,善良的观众也会包容。

▲ 图片来自:X@Cheeseball_sol

AI 宠物并不是一条小众的赛道,巫师猫之前,这片沃土已被发掘。

当长辈向你催婚,追问等你老了谁照顾你,可以请他们看一段猫洗手作羹汤的 VCR。

▲ 图片来自:Instagram@kimbingmei__

连猫都有心事,草帽一戴成了酷盖,弹起吉他比《猫和老鼠》的汤姆多一分忧郁和深沉。

▲ 图片来自:Instagram@nico.m.ai

AI 提高了人们的生产力,让大家过得更快乐了吗?不好说,各有各的看法,但它确实改变了人们造梗和娱乐的方式。

这段时间,我的朋友圈流行一个 AI 特效:醒图 app 的「金箔岩彩」。它和猫猫狗狗的适配度很高,一键 get 新中式插画。甚至有铲屎官表示,不用花钱向画师约稿了。

AI 视频更是让人类的脑洞有了一万种落地的可能性,专业人士搞 AI 大片,挑战传统电影,但玩家们考虑怎么抽象和搞怪就可以了。

之前,海螺 AI 有个很出圈的视频,把经典电影桥段里的武器都变成冰淇淋,上一秒剑拔弩张,下一秒一笑泯恩仇,没有一个冰淇淋解决不了的问题,如果有,那就来两个。

▲ 图片来自:X@Martin_Haerlin

我们自己复刻个七八成也很简单,上传图片,再输入文字提示词即可,特效从未如此简单。

这是一个人人都是创作者的时代,二创也能有很好的体验,AI 放飞想象力又能满足成就感,真「我上我也行」。

为爱发电可以,变现需要自知之明

为爱发电固然快乐,但成年人需要考虑现实,换句话说,AI 宠物有没有变现的可能?

这和任何内容垂类一样,高质量的金字塔尖,才能接点广告植入。但因为 AI 创作的高度自由,AI 宠物是个百搭体质,业务范围还挺广,包括但不限于服饰、电脑、汽车、奶茶……

▲ 图片来自:小红书@橙子的橙啦

文案、图片为甲方讲故事固然好,也有更简单粗暴赚快钱的,先用讲 AI 猫咪小故事的短视频起号,时不时单发一条无关的广告。

当然,哪里也少不了卖课的。一些账号就像 AI 博主的周边,以月入几千甚至上万为噱头,分析变现思路和操作方法,然后拉群卖课,但它们自己的账号流量都低得可怜。

为了打破信息茧房,我加了一个吃这碗饭的小红书博主的群聊,由此知道,需要加微信,然后花近 700 元加入 AI 训练营,才能教你怎么 AI 视频号带货、AI 小红书壁纸变现……

无意贬低,把 AI 当副业可能竹篮打水一场空,但李一舟们证明了信息差确实赚钱。看这些博主整理的教程,先从注册账号开始,就差把饭喂到嘴里了。

但这里存在一个问题,免费的教程一搜一大堆,希望别人手把手教、抱着焦虑心态、相信速成品也会被市场买单的用户,很难创作出好的东西,反而可能是白交了学费。

AI 宠物的本质,其实就是用 AI 设计可以打动用户的 IP,然后再持续运营,讲出故事。

在盲盒爆火的时候,IP 需不需要故事就已经被讨论过一波。

泡泡玛特 CEO 王宁曾说:「现在年轻人的时间碎片化。Molly 这类 IP 降低了时间的门槛,一分钟,你知道你喜不喜欢它……」

▲将巫师猫变成可爱卡通风,图片来自:@BBIM_official

泡泡玛特的盲盒形象好歹也是艺术家精心设计的,AI 让创作 IP 形象更容易,但不代表可以轻易地打动用户。

之前我们采访过一位前游戏大厂员工、AI 游戏美术创作者。因为有专业背景,又热衷实践,所以上手 AI 对她来说不难。

▲ 图片来自:knowyourmeme

她更关心的是:你喜欢的风格,是不是大部分人也会喜欢?你设计的游戏人物 IP,有没有强烈的风格,能不能让大家记住?

AI 不是出不了好作品,但少不了时间和汗水。热点来了又走,焦虑长盛不衰,真正想要创造什么内容的人返璞归真——我们想要和需要用 AI 生成什么,我们怎么判断 AI 生成结果的好坏,以及,我们又愿意为之付出多少努力。

利若秋霜,辟除凶殃。 工作邮箱:zhangchengchen@ifanr.com

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


智能眼镜这个被忽略的功能,他们已经离不开了

By: 张成晨
26 October 2024 at 12:55

字幕,已经成了现代人的「外挂」。通勤嘈杂,摸鱼易露馅,学习会分心,听和看并用,才能避免进度条白白走了冤枉路。

然而,对一些人来说,字幕不只是锦上添花。

当《失控玩家》的男主角戴上眼镜,他看到了原本无法察觉的信息,不再是个被动的 NPC。

现实里也存在一种智能眼镜,可以提供「行走的弹幕」。尽管没那么科幻,但它同样通向一个信息量更大的世界。

我可以看到你说的话了

科技的意义在于,当上帝关上一道门的时候,打开一扇窗。

一位听障博主的开箱视频,在 TikTok 拿下了 80 万点赞,夙愿得偿,喜极而泣,最纯粹的情感迸发的力量,打动了素昧平生的观众。

▲ 图片来自:TikTok@chrissymarshall_

她手里拿着一个盒子,边笑边流泪,比着手语,努力地说出完整的句子:「我等待这个盒子里的技术很多年了。」

盒子里装的是一款字幕眼镜,外形和普通眼镜没什么两样,却让她可以「看到」周围的声音,那些过去听不清的声音,变成了一行行亮绿色的、科幻感的字幕。

根据视频里的信息,这位博主用的眼镜叫作 Hearview,专为听障人士设计,今年 5 月发布,来自国内的一家科技公司,但不面向国内,市场在海外。

它可以用来娱乐,看电影、看视频、看《黑神话:悟空》的游戏直播。

从刷《老友记》的体验视频来看,文本略有些滞后但准确,配对的手机 app 还可以区分不同的说话人。

同时,它也可以用在面对面的对话,方便听障人士在餐厅点餐、在超市购物、和导购聊天、开车时导航……

HearView 的原理说起来并不复杂,和手机 app 配对,通过智能手机的麦克风捕获声音,AI 算法实时语音转文字,字幕显示在眼镜上。

如果听障人士需要回复他人,可以在 app 输入消息,将文字转换成语音。过往的字幕,也保存在 app 中。

HearView 自称,语音转文字的准确性达到 95%,最远转录 10 米外的语音。说到这里,一个问题呼之欲出:菜市场等吵闹环境里表现会变差吗?

虽然 HearView 表示手机 app 具备噪音消除功能,但我翻遍了各种体验视频,并没有找到嘈杂环境里的实测,所以很难探究效果如何。

官网只提到了一些参数信息,续航 7 小时,重 52 克,适合全天佩戴,还配备了振动和视觉警告,提醒用户注意可能的危险。

轻便,耐用,听起来让人很想剁手,但它实在太贵,很难交个朋友——1799 美元,约 12800 元人民币。

而且,Hearview 存在很大的进步空间,目前它只支持英语和西班牙语,计划支持德语和法语,还不能实现语言的互相翻译。

文本的颜色只有亮绿色,虽然确保了在各种屏幕和照明条件下都可读,然而用户没有选择,就是美中不足。

但存在,便意味着价值。字幕早已是很多人生活的一部分,这还不够,它理应以更方便、直观的形式,陪伴在最需要的人左右。

字幕眼镜虽多,但生活里的挑战更多

实时字幕眼镜,其实并非新鲜事,放在 2 年前,甚至是一个热潮,诞生过不少有趣的项目,但都很难尽善尽美。

英国 AR 初创公司 XRAI,开发了兼容多款 AR 眼镜的语音转文字应用 XRAI Glass。

然而,《连线》杂志记者戴上一款和 XRAI Glass 兼容的 AR 眼镜后发现,语音转文字固然好,但使用过程中,总有这样那样的摩擦。

先是使用体验上的,如果佩戴人工耳蜗和助听器,再戴眼镜可能会不舒服,虽然这款 AR 眼镜已经很轻,但和普通眼镜相比依然厚重。

而且,语音转文字在背景噪音大和多人讲话的时候,效果并不好,实用性大打折扣。

价格也是一个问题,300 多美元的 AR 眼镜已经让钱包隐隐作痛,XRAI Glass 还需要每月花几十美元订阅套餐,像很多语音转文字的软件那样,只能说并不意外。

国内也有类似 Hearview 的产品——亮亮视野的听语者字幕眼镜,分为助听版和翻译版,可以理解普通话、方言和外语,并且支持跨语种翻译。

它的使用方式和 Hearview 相近,下载可译 app,眼镜和手机进行蓝牙配对,用 Wi-Fi 或者热点连接网络,手机端实时语音转文本,眼镜端显示文本。

不过有用户在 App Store 反馈,听语者对方言的支持还是不够多。这是一个非常必要、却也艰难的优化方向,听力不好、习惯说方言的老年人,恰恰最需要这类产品。

也有 YouTube 博主评测发现,听语者的语音识别率高,速度也快,但口音很重的话,识别率会变低。

▲图片来自:YouTube@科技小助手

如果不拘泥于眼镜的形态,耶鲁大学和斯坦福大学的学生设计的一个产品原型很有意思,叫作 Transcribe Glass。

它不是一副眼镜,而是一个平视显示器,可以卡在眼镜的镜框上,开箱即用,将设备连接到 iOS 和 Android 的配套 app,让用户选择自己喜欢的语音转文本软件。

生成的字幕会通过低功耗蓝牙传输到设备,并实时叠加在用户的现实视野中。难得的是定价也格外友好,95 美元,但连测试版都还在候补,直到现在也查不到落地的信息。

除了专注语音转文字的产品,面向所有人的多功能 AR 智能眼镜,往往也包含了字幕功能。

国内价位在两三千的一体化无线智能眼镜,基本都支持语音转文字和多种语言的实时翻译,但转译效率,可能不如专为听障人士打造的 AR 眼镜,持续开着语音转文字时,续航也是一个问题。

当我咨询某个头部的智能眼镜品牌,得到的答案是「不建议听障人士使用」。

▲10 月 22 日,咨询某智能眼镜品牌客服

其实,这种产品最适合大厂出手,特别是 Google,在语音识别、机器翻译和 AR 方面都有深厚的技术积累,实时语音转文字和翻译的能力都遥遥领先。

Google 在 2022 年 I/O 推出了一款可以实时翻译的 AR 眼镜,支持 24 种语言,甚至支持美国手语,字幕就在对话人旁边,不过也只是原型演示,没有下文了。

科技向善是字幕眼镜的大前提,种种的「吹毛求疵」,其实是抱着殷切的心情,希望产品不满现状,不断进化,再做一次,再改进一次,变得更好一点。

字幕是一种权利,像看电影一样看世界

世界卫生组织统计,全球约有 4.66 亿人患有听力损失,其中超过 900 万人为重度耳聋。

即使使用了人工耳蜗或助听器,听障人士理解别人在说什么,仍然需要集中注意力,同时,一些发音相近的词语,光靠唇读难以区分,在理想条件下,英语中只有约 40% 的语音信息,能通过说话者的唇部动作捕捉。

这也是为什么,一个听力障碍的世界,需要文字作为补充。很早之前,就有人为之努力了。

古巴裔美国默片演员艾默生·罗梅罗,同时也是一位听障人士,在 1947 年开创了有声电影的字幕。

默片时代,观众可以通过电影画面和插入的文本了解故事情节,但当有声电影兴起,许多像他一样的听障观众反而失去了看电影的机会,因为他们无法听到台词,电影又缺乏字幕。

于是,罗梅罗决定自己手工制作字幕:当时的电影通过胶片播放,他将胶片切片,并在帧之间插入带有字幕的图像。

后续的字幕技术,可以看作是罗梅罗精神的延续,同时,也有了更多方便听障人士看电影的设计,比如,一些美国电影院提供预制字幕的眼镜。

2012 年,索尼推出了一款提供给部分影院的 CC 字幕眼镜,与普通字幕不同,CC 字幕不仅包含对话内容,还包括非语言信息,如背景音乐、音效、环境声音。

这款眼镜在每侧配备小型投影仪,绿色的字幕看起来就像是漂浮在大银幕前。

观众无论坐在影院哪个位置,都可以清晰地看到字幕。用户还可以调整字幕的亮度、显示距离以及角度,切换六种语言。

这款眼镜甚至支持 3D,用户就不必多带副眼镜观看 3D 电影。这很重要,避免了一种鼻梁很忙的情况:同时戴着普通眼镜、3D 眼镜、CC 字幕眼镜看电影。

▲ 图片来自:Reddit@ellowTonkaTrunk,发布于 2022 年

这一幕有些讽刺,却像一个隐喻——以寻常的视角了解这个世界,一些人总需要付出更多。

还不够完美的、但未来可期的实时字幕眼镜,至少让我们看到了一种美好的可能。

韩国电影《寄生虫》导演奉俊昊曾在奥斯卡颁奖典礼说:「一旦你克服了 1 英寸高的字幕障碍,你将会看到更多精彩的电影。」

当电影里常见的字幕出现在生活里,它可以让需要的人看到更多的信息,并拥有不退出对话的权利。

Google 的翻译 AR 眼镜宣传片有一句话很打动人:我直视着你的眼睛,你看起来也在直视我的眼睛。

几乎没有存在感,便是科技的最好状态。

在保证高效、准确的前提下,交流还可以回归自然,不占双手,不需要低着头看手机,也不用一直盯着嘴唇,而是面对面,眼神接触,一如千万年前就有的模样。

利若秋霜,辟除凶殃。 工作邮箱:zhangchengchen@ifanr.com

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


OPPO Find X8 系列发布!你的第一部胶片相机,还有惊喜的 AI 影像功能

By: 周奕旨
24 October 2024 at 22:41

OPPO Find 系列的产品负责人周意保曾经提到过一个定律:

第三代最香。

这句话的意思是,电子产品总是在第一代、第二代上积蓄能量,最容易在第三代爆发。

如果按照这个定律,那么我认为 OPPO 这一轮的「三代」,也许要从 Find X6 算起:这一年,OPPO 告别自研的马里亚纳 MariSilicon X 影像处理器,转而使用 Soc 中集成的 ISP 处理图像,也是这一年,Find 系列启用全新的环宇设计,强大的影像系统通通归于宇宙圆环内,并延续至今。

如果说 X6 系列是定律中的第一代,那么我们终于迎来了周意保口中,最容易爆发的第三代——OPPO 正式发布 Find X8 与 Find X8 Pro。

有圆有方的设计,追求氛围感的影像

随着 OPPO Find X8 系列登场,最先察觉到出现明显变化的,是外观。

上一代,X7 标准版与 X7 Ultra 都采用了曲面屏,形成家族化设计,但在这一代上,曲面屏方案直接被摒弃,Find X8 走上了设计的轮回,使用了四面等宽的直面屏设计,屏幕大小为 6.59 英寸,且黑边仅有 1.45mm,配合黄金 R 角与直角边框,整机呈现出硬朗利落的风格,193 克的重量,更是清爽干净;

X8 Pro 屏幕比 X8 微大,为 6.78 英寸,采用盛行的等深四微曲屏,四角黑边等宽,屏幕、边框与后背的衔接更柔和,在 215 克的重量下,也不会对手掌造成过大的握持压力。

X8 系列除了屏幕与边框大改,背面也在悄然发生着变化。

与上一代的拼接主义不同,X8 系列背面整体遵循一体化,观感更加简约,配合不同的颜色,呈现不同的风格:浅色后壳干净清爽、深色后壳深邃有质感。

更多的小心思,还藏在背面的影像模组中:无论是 X8 还是 X8 Pro,摄像头摆脱了上代的不对称分布,都集中在浮光寰宇一体对称设计中,配合干净简约的后壳,对称得很顺眼,干净得很显眼。

同时,Find X8 系列机身都变薄非常多,这要得益于 OPPO 对影像模组中的潜望长焦结构进行了重新设计,通过倒装的方式,将 CMOS 放在了天花板上,进一步延长光路,在保证画质不缩减的情况下实现了结构体积的缩小,进一步实现整个影像系统的变薄,机身的重心进一步下移,头重脚轻的问题得到大幅改善。

除了按部就班的影像迭代,OPPO 对影像还有新的理解——抬手就出片,抓拍氛围感。

简简单单的一句话,要体现在确切的影像表现上,就分成了数个功能。

首先,OPPO 认为,抓拍应该是一种能力,而非一种模式。

为了将这种能力融入日常拍摄中,OPPO 在 Find X8 系列上推出了无影抓拍模式。

为了彰显无影抓拍的能力,OPPO 专门准备了两套「功法」:自适应瞬时双帧技术与错峰计算技术。

用短帧负责抓住运动,用长帧抓住画质,再拍算分离,先拍再算,让快门之间无需等待计算完成,实现 100% 的快门响应。OPPO 宣称,在这两个技术的加持下,无影抓拍的每一张成片都有完整的算法以及 HDR 显示支持,并支持高达 200 张不间断的连拍。

目前,无影抓拍已覆盖照片模式和人像模式,无需手动选择,只需要长按快门,就可以轻松开启,并支持所有焦段,甚至支持实况模式。

好的技术是无感的,但 OPPO 并不打算藏着掖着,在 Find X8 Pro 上,专门为无影抓拍准备了一个抓拍快启键。

这颗按键是 OPPO Find X8 Pro 独有,位于机身右侧的边框上,按键通过压力感应、震感回馈的方式运行,随时双击即可快速启动相机,单击拍照,长按实现连拍,并且在横向持握手机时,还支持滑动变焦。这种设计使用户能在关键时刻迅速捕捉精彩瞬间,将技术与体验完美结合。

除了抓拍外,OPPO Find X8 系列还为 OPPO 超光影图像系统准备了新的「风格引擎」,直接带来了三个新风格,为「氛围感」服务,分别是:

  • NC 胶片风格
  • CC 胶片风格
  • NH 胶片风格

这三个胶片风格并非后期套上滤镜那么直接,而是在新的风格引擎加持下,对多场景进行色彩调教,从成像上面调整照片影调,并对肤色进行优化,保证在人物自然的情况下,赋予照片胶片质感。

同时,OPPO 终于将 Reno 系列上大受好评的实况照片带到了 OPPO Find X8 系列上,并且得益于性能的加持,OPPO Find X8 系列的实况照片每一帧都支持完整的算法、美颜效果以及新的胶片风格,每一帧都有氛围感。

除此之外,OPPO Find X8 系列人像模式再升级,将相机上的柔光滤镜放在手机中,通过对照片进行分层分析,创建了三种柔光效果,不需要相机和外置滤镜,一键就能拍出更自然的柔光人像。

四者合一,OPPO Find X8 系列的影像氛围感,全部就绪。

AI 小布,影像到工作,全面介入

OPPO Find X8 系列的影像硬件得到升级,软件也不甘落后,在这一代,OPPO 为影像系统注入了 AI 加持。

在 Find X8 系列上,OPPO 推出了「AI 千里长焦」功能,在演唱会现场放心拉近焦距,也不担心照片会糊。

除了前期,OPPO 在后期也新增了一系列 AI 功能,分别是:

  • AI 超清像素
  • AI 去反光
  • AI 去拖影

通过生成式 AI,Find X8 系列可以在相册中对照片进行一系列处理,包括对模糊的照片细节进行重绘补充、去除玻璃上的反光、去除手抖、快门速度过慢带来的拖影。

AI 介入影像,但不止影像,在经过上一代对 AI 的尝试和探索后,Find X8 系列的 ColorOS 15 迎来了 AI 小布的全面介入系统,成为真正从系统级别提供服务的 AI,一句话来讲,不管你的手机在干嘛,AI 都能帮上忙。

一键问屏,是 Find X8 系列上与 AI 互动的新方式。

在用户通过长按电源键唤醒 AI 小布后,通过语音、画圈、以及摄像头,AI 可以对屏幕上的内容进行理解,无论是新闻总结,还是图片识别,通通不在话下,甚至通过摄像头,AI 还可以对取景框中的现实世界进行理解,外语菜单、商品搜索都不成问题。

系统级的 AI 不仅是生活好帮手,还是职场大杀器,面对复杂的职场工作,Find X8 系列的 AI 针对多种职场场景做足了准备:

  • 针对文档:AI 可以将多种格式文档互相转换,图片转为可编辑文档,并生成快速摘要并进行内容问答
  • 针对文字:AI 可以对文字进行排版、修正润色与续写,并总结大段文字中的关键信息
  • 针对语音:前代的通话摘要功能更进一步,在任何音频播放时都支持同步翻译、实时字幕以及内容摘要

天玑 9400,潮汐加持

虽然影像配置有高低,但芯片上,OPPO 还是做到了雨露均沾。

OPPO Find X8 与 X8 Pro 都搭载了联发科的天玑 9400 处理器,在每家都在争夺天玑芯片调教第一的场景下,OPPO 专门研制了全新一代的潮汐引擎加持天玑,更好地释放天玑 9400 处理器的性能。

OPPO 称,为了更好地释放性能,搭载潮汐引擎的 FindX8 系列,专门对天玑 9400 进行深入到 L3 缓存的定制,让潮汐引擎可以针对性地根据手机任务需求,灵活且准确地调配数据资源,在更短时间内完成任务,同时节省功耗。

OPPO 宣布,搭载天玑 9400 的 Find X8 系列,CPU 单核与多核性能分别提升了 35% 与 28%,并且降低了 40% 功耗,GPU 则提高了 41% 的峰值性能与 40% 光线追踪性能,并将功耗降低了 44%。

OPPO Find X8 系列搭载的天玑 9400 还更新了第八代 NPU,集成了天玑 AI 智能体化引擎,在大语言模型处理性能提升了 80% 的同时,降低了 35% 的功耗,为 Find X8 系列的 AI 体验做足了准备。

得益于以上提到的种种升级,OPPO 宣布 Find X8 系列在安兔兔综合性能测试中拿下了超过三百一十万分的成绩,这是目前榜单上的最高成绩。

如果将这个分数落实到体验上,OPPO 宣布 Find X8 系列可以在《王者荣耀》《原神》《绝区零》等游戏中实现几乎满帧游玩表现。

除了设计、影像、系统与 AI、性能四个方面,OPPO Find X8 系列还有些别的信息,值得我们注意。

OPPO Find X8 系列机身虽轻薄,但电池着实不小,Find X8 与 Find X8 Pro 都搭载了 OPPO 自家的「冰川电池」,分别塞入了 5630 毫安与 5930 毫安的电池,一口气可以看超过 29 个小时的高清 HDR 视频,充一次电看一部剧不在话下。

OPPO Find X8 系列全系支持 50W 无线充电,并通过新推出的 OPPO Mag 磁吸生态和三个配件达成多元化无线充电。

此外,OPPO 还有自家的山川通讯,无论是在网络挤爆的演唱会现场,还是穿山越岭的高铁上,都能获得更强的信号连接。

OPPO Find X8 有四种颜色:气泡粉、追风蓝、浮光白与星野黑,售价如下:


Find X8 Pro 的三种配色为晴空航线、漫步云端与星野黑,售价如下:

虽然发布会落下帷幕,但爱范儿一直认为,一切参数都是为体验服务,所以众多测评与体验已经在路上了——真机手感怎么样?下放的影像系统素质如何?新的胶片风格好用吗?AI 功能是否实用?你还对哪些内容感兴趣?欢迎在评论区留言。

这些参数之外的切实体验,我们将一一为你道来。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


被讨薪人群弄倒的亲子自行车

By: Steven
3 July 2023 at 22:47

昨天下午,朋友发了张照片给我。画面里是我常去的那个咖啡馆所在的大楼,外面熙熙攘攘地挤满了人,一群来讨薪、维权的苦命人。

晚上从舞蹈室回到家里,我想起这事,就跟咖啡店的老板聊了几句。整个店被人群围得水泄不通,他也很无奈。他在现场发了晚上的照片给我看,从画面里可以感受到,无论是他、咖啡师、人群都很无奈。

直到今天回公司,中午吃饭路过,我才意识到,原来被波及的不只是他们。这其中,也包括我。

我有每次停车都拍照记录的习惯

这是我周五停自行车的位置。我工作日都会把车停在他们店门口,周五停在这里之后,周末两天车都在这里静静待着,直到我周一晚上来骑它回宿舍。今天中午我找不到它了。

它没在周五照片里的这个位置。

我在附近来回走了三遍,非常疑惑:不可能有人偷这辆车吧?图啥啊?直到我想起昨天的事情,于是扩大了搜索范围。终于在不远处一堆电动车包围的地上,看到了我倒下的单车。

它身上被缠了一条警戒线,篮子里有两支空水瓶,半残的车铃也完全断了。

我突然想到昨晚 DY(店老板)给我的照片,心想没准能看到我的单车是如何参与了昨夜的事件。果然,作为一辆单车,在人群聚集的场合中,往往被作为隔离带使用:

我多少有一点点生气:何故迁怒于我的无辜小车?

但气不过三秒,又觉得很好笑:自行车在全世界范围内都是这样的命运吧?不是被人骑,就是当作围栏,或者焚烧和打砸的对象。起码,这群苦命人没有把我的车高高举起,砸个稀巴烂。它只是掉了链子,躺在地上;和前一个周末一样,被人推倒了,躺在地上。区别是,上一次脚架变形了,这一次没有。

一夜之后,随着一场大雨,除了两张照片和我躺在地上的车,还有什么能证明这一切发生过吗?

咖啡师杠杠上午发来一张照片,是店外的装饰植物,一棵全身金属但被许多人挤变形、掉光了叶子的假植物。我说,幸好它是假的,真植物肯定早就断气了。

她说他们走了之后,玻璃上全是人的指纹。但这些曾经发生过的证据,早已被她和小蒙擦干净了。开门做生意要保持整洁,但指纹的存在不利于社会经济。

这是一件「小事」,不被传播的事,但它不会被忘记。

一系列变化的传导还会持续一段时间,倍受影响的不会只有当事人,还有每一个「与此无关」的路人、小车、植物和玻璃。此时有一点点庆幸作为非真社会性动物的人类,可以选择一定程度的远离,而不是真社会性动物的蚂蚁那样,只有全或零。

众生皆苦,何时闻道?

麦当劳令人失望的玉米杯

By: Steven
30 June 2024 at 13:21

麦当劳你要减少一次性用品,有指标压力,这我非常理解。但以前,你是先设计好免吸管杯盖,且普及了一段时间后才取消吸管的。现在你的玉米杯没有任何免勺子的可用方案,就直接取消勺子,还直接张嘴找客户收费,这吃相也太难看了。

别说玉米杯设计了类似饮料开口的盖子,这杯盖显然不是为此设计的,完全不可用。你要是老老实实设计个新盖子,那取消勺子我举双手赞成。

以麦当劳的体量,这个设计修改所涉及的模具、运输、仓储成本都可以做到比市价低很多的水平。

你们为什么不能像以前取消吸管一样有条理地处理问题?你们引以为傲的 SOP 失效了吗?总不能说没钱请设计师吧?

你可是麦当劳啊……非常失望。

政策是政策,设计是设计,不然著名的翻转车头大灯是怎么出现和流行的?不要因为政策就认为不行,也不要觉得商家转嫁成本就是不得已跟合理,无管杯盖就是最现成的好案例,能做到而不作为,这才是重点。

感谢星巴克

By: dimlau
20 June 2024 at 12:40

多年来我一直说,作为从业者,对星巴克的态度多半是感谢。2009 年我的咖啡馆开张之后的许多年里,顾客都寥寥无几,把泡咖啡馆描绘得多么贴近生活,都没什么收效。倒不是说独立小店长着一张不可信的脸,而是声量太小,认同这个观点的人未必听得到,听到的人里又有不少人不认同——咖啡馆是相亲的地方;咖啡馆应该有单间;咖啡馆可以抽烟打牌……许多人始终这么认为。

星巴克开到我们这个小城市的时候,有朋友替我担心竞争压力,我反过来安慰——在我没为此事感觉疲倦之前——独立咖啡馆和星巴克不在同一片海域,它像是一艘大游轮,会让人们知道可以出海,但是喜欢坐游轮和喜欢摩托艇、潜水艇、小舢板、古董船……并不冲突。果不其然,也正是从那时候开始,咖啡馆在我们这个城市渐渐多起来,我的店,因为「历史悠久」,经营状况如我所料是有好转的。而且客人们已经大致上了解,咖啡馆里可以只是坐着喝杯咖啡聊聊天,消磨一段时间,放松一下身心。

在我的观念里,事物的发展会衍生出许多相应的习俗和趣味,我不喜欢所谓弯道超车的原因之一就是它会丢掉这些习俗和趣味。妳要问我细致的因果链条,我没法说出。但是要说「因为一切发展太快了,所以才会有,带着A家的东西去B家吃,惹得B家不高兴的事出现」,我猜还是会有很多人同意吧?毕竟,就算不知道事情到底是怎么运作的,如果慢下来,一定会出现让各方都相对满意的方案出现,大家都慢慢接受,这就是约定俗成。

这世界没有如果,现在的情况就是,一切都那么快。上一秒,咖啡馆还是所谓小资场所;下一秒咖啡馆随处可见。一方面,人们还抱有一种预期,自己进了门就该被当作上帝或者潜在的上帝,不容置疑;另一方面,现实是咖啡馆已经和早点摊理发店没什么区别。不会有人觉得早点摊主或者理发店主要求已经落座的客人赶快做决定有什么不对,但是咖啡馆似乎就不行。如果问我的处理方式,坦白说,我把自认为理应如此的规矩——归根到底就是不要影响到其他客人——写在了大门上、菜单上、小票上,但是具体到某个客人时,我基本什么都不说。原因还是那样,作为独立小店——即便是全市最古老的咖啡馆,影响力是很小的,客人们听到的是「这家店的要求」而不是理应如此。这个时候,星巴克作为在中国有几千家门店的连锁品牌,它的做法不见得最妥当,但是无疑是成功地提醒到了我们,因为跑得太快而忽略了一些必要的思考。

fin.

經濟再差也不能公開談論

By: Steven
17 March 2024 at 18:02

經濟狀況究竟有多糟糕呢?從各大品牌在售後策略、降價思路和運營的混亂程度等方面的表現,均可窺見一斑。尤其是當你置身於自媒體、電商與品牌運營三者的交匯點上,這種巨大的荒謬性將更加明顯。

上週末出差重慶,兩周沒在家,難得一個週末,結果倆人坐下後就被各自工作群里的事情纏著,不是回消息就是打電話,咖啡都沒喝上一口。

在國內的社交媒體似乎不讓提「經濟不好」這樣的事,與之相關的話也會被限制,索性我就轉成日語來發了:

経済状況は本当にどれほど悪いのでしょうか?各大ブランドのアフターサービス戦略、値引きの考え方、そして運営の混乱度などから、その一端を窺い知ることができます。特に、個人のネットワークソーシャルメディア、ECサイト、およびブランド運営の交差点に立つと、この巨大な不条理さがさらに明白になります。

先週末、出張で重慶に行ってきました。二週間も家に帰っていなかったので、久しぶりの週末を楽しみにしていたのですが、結果として、座った途端、それぞれの仕事グループからの連絡が絶えず届き、メッセージを返したり、電話をしたりすることに追われてしまいました。コーヒーすら一口も飲めないままです。

為什麼是轉日文不是英語呢?因為即便是英語,在內地的網絡環境里也顯得有些直白了。日語反而更有「似乎知道在說什麼,但根本看不懂」的戲劇化的「陌生化」的效果。

好不容易,終於把翻了一年的《夜航西飛》讀完了。

這是我今年讀完的第三本書。

昨天去宜家看洗手檯和鏡櫃,直到在餐廳排隊前一秒,都沒想起宜家給我發的領生日蛋糕的短信。可就是那麼巧,下周生日,昨天正猶豫要不要去店裡看看,我就慫恿筱燁說想幹就幹,這一來才想起有一個蛋糕等著領。這就是天注定的意思。

苹果停车转 AI 将引发人才大震荡

By: Steven
28 February 2024 at 20:16

1、没有 AI 的汽车、手机、电脑、平板等,将是一堆废铁;

2、一家公司的核心战略不能同时放在两个大方向上。

综上,停下造车全攻 AI 是非常明智的。

连键盘侠都知道「不难」的造车,没造出来不是造不出来,是制定的目标太远太高。苹果之前想一步到位搞出 L4 的移动座舱,但现阶段的人类还没有办法,这太难了。在他们之前的设想中,自动驾驶的汽车和 Apple Vision Pro 是可以放在同一个场景里的。但很显然,这个步子太大了。用新势力们的方式当然可以,但那不是苹果想做的。

最关键的是,AI 的大爆发是此前大家都没料到的。没有这事儿,车还是一个重要的方向,但这一波爆发的 AI 不是资本热潮,而是实打实的浪潮了,此时不全力转向,是真的会死的。况且苹果并不是没有在 AI 上投入的,这些年一直都在积累,只是权重还没拉到那么高。现在切方向,即是大势所趋的必须,也是归拢资源的必要。

过去 Jony 可以对供应商说,这里有一桶取不完的钱,你能做到你就能拿走,以此把工业设计拉高到一个令人望尘莫及的程度;今天的苹果比二十年前拥有更多的现金,有自己的芯片和庞大的人才库,有海量的设备和训练数据,可以说:

比起造车,AI 才是更适合苹果干的事;

干好 AI 所需的人才、数据、算力,也是他们的优势。

以苹果的财力,下这样的决心,恐怕要出现一次人才流动的大震荡。

原文发布于知乎提问:

苹果取消探索十年之久的电动汽车项目,将团队转向生成式 AI,原因有哪些?会带来哪些影响?

世界真的是个草台班子吗?

By: Steven
14 November 2023 at 18:30

前段时间那一篇互联网裁员潮演变成制造业招聘潮的文章,让我想起了多年前跟人讨论的关于笔尖钢的事情。这件事情在不同的场合跟不同的人都讨论过很多次,但最终在对方的嘴里都会演变成「因为市场经济结构没必要,所以不必去做」这样的方向。

虽然这种「不想要」的说法听起来很厉害,但作为一个从小在国营钢厂长大的工科生,我想表达的是:在讨论市场经济和供需关系之前,还是得先搞清楚「有没有能力做」这件事。尽管你们可能在很多科普的文章,或者一些朋友的嘴里都听说过,做这个东西并没有想象中那么难,并且也有新闻报道了,我们确实攻克了技术上的难点,但制造业并不是「可以做」就一定可以实现的东西。

生产和检测是这件事情的一体两面,在「有没有能力做」这个问题上会涉及到材料问题、检测工具以及生产工具和检测工具的精度。举个例子,今天你可以在互联网上找到关于芯片原理和制造工艺的各种资料,从论文到图文到视频都有非常多,但为什么能够制造芯片的公司那么少?为什么光刻机会成为卡脖子的关键?

因为这不仅仅是一个关于市场供需关系和经济结构的问题,如果一项技术在市场端需要如此谨慎的考虑材料、工艺和成本时,往往在真实的制造生产层面,就意味着它的难度是非比寻常的。在生产车间里,把笔尖制造出来的绝对不是材料科学家或者力学方面的专家,而是数以十万计的只有高中或者初中学历的普通人。想象一下《三体》当中描写的阵列计算机:你得把一个如此复杂的东西,最终分解、简化到每个人只需要拿着两盏灯的程度。

我们公司研发老大的前东家,就曾经在这一类对精度要求极高的项目当中,在技术上被国外卡脖子。所有的理论层面的难题,他们都已经跑通了,最后卡在了一个检测设备上。我们国产的设备,无论如何都达不到那一个精度,导致那个项目一直没有办法落地。

我弟弟所在的实验室之前拿到了全球只有一百份的实验材料,但他们所构思的实验设计,恰恰就被卡在了如何把这仅仅只有 1g 的粉末,按照他们想要的精度划分,并取出来。

任何关于精度与制造的突破,都是人类文明前进的标志。这绝对不是用市场经济可以简单解释的事情。

所以我觉得,有那么一批人能够从互联网行业投身到制造业,是一个非常好的事情。人如果习惯了用比特的思维方式来看世界,是非常危险的。因为原子是比特的容器。我们必须对物理世界有切身的体会,才能感受到参差不齐是世界的常态,以及工业化究竟意味着什么?

在我们调侃世界是一个草台班子的同时,也得清晰地认识到:这个草台班子的精度,其实已经远远超出了普通人的想象。

❌
❌