Normal view

There are new articles available, click to refresh the page.
Before yesterdayMain stream

“社交媒体成瘾”诉讼:Meta和YouTube被判有责

26 March 2026 at 11:04

简繁中文
纽约时报 出版语言
字体大小

“社交媒体成瘾”诉讼:Meta和YouTube被判有责

CECILIA KANG
这些诉讼首次将矛头直指社交媒体公司,追究其制造有害产品的责任,使其面临新的法律问责。
这些诉讼首次将矛头直指社交媒体公司,追究其制造有害产品的责任,使其面临新的法律问责。 David Gray/Agence France-Presse — Getty Images
周三,洛杉矶的一个陪审团裁定,Meta和YouTube应对它们的平台具有成瘾性并伤害年轻用户的指控承担责任,并责令两家公司合计赔偿600万美元。
该判决是今年一系列审判中的首个结果,原告律师在这些审判中正在测试一种新的法律理论,即Meta、YouTube、Snap和TikTok因其有缺陷的产品造成了人身伤害。
数以千计的个人、学区以及州检察长已经提起类似诉讼。本周的这一胜诉可能为大量类似索赔打开大门。
以下是需要了解的情况。
广告
这些案件主要涉及什么?
这些案件试图论证,社交媒体的设计本身就带有成瘾性,就像香烟或老虎机一样。
这些诉讼称,无限滚动、算法推荐、通知提醒以及自动播放的视频等社交媒体功能导致了强迫性使用。原告认为,由此产生的成瘾已经引发了抑郁、焦虑、饮食失调以及包括自杀在内的自残行为等问题。
这些案件被拿来与上世纪90年代针对烟草巨头的诉讼相提并论,当时菲利普莫里斯和雷诺烟草等公司被指控隐瞒了香烟危害的相关信息。
第一起诉讼是什么案件?
首位原告是一名来自加州的20岁女性,在洛杉矶县高等法院的诉讼文件中被称为K.G.M.。
K.G.M.在八岁时创建了一个YouTube账户,九岁时又加入了Meta旗下的Instagram。她在诉讼中称,自己从小就对这些社交媒体网站成瘾,并因此经历了焦虑、抑郁和身材焦虑问题。
K.G.M.的律师在开庭陈述中表示,Instagram和YouTube的应用被设计成类似“数字赌场”,通过用户的成瘾行为获利。
该审判持续了五周,陪审团审议了超过一周时间。
周三,除两名陪审员外,其余陪审员均裁定Meta和YouTube在平台设计上存在疏忽,其产品对K.G.M.造成了伤害。
广告
还会有更多审判吗?
会的。法官已从数千起已提起的诉讼中挑选出一些最有代表性的案件,作为标杆案件进行审理。预计在洛杉矶的这一系列审判中将审理共九起案件,其中就包括K.G.M.的案件。
今年夏天,另一组联邦案件将在加利福尼亚州奥克兰的美国北加州联邦地区法院开庭审理。在这一系列案件中,学区和各州计划提出社交媒体构成了公害,而学区和州政府不得不承担治疗一代因沉迷社交媒体而受害的年轻人的费用。
在另一起由新墨西哥州总检察长提起的案件中,该州的一个陪审团周二裁定,Meta因未能保护应用程序的用户免受儿童性侵犯者的侵害,违反了州法律,应承担相应责任。
这些公司是如何为自己辩护的?
Meta、Snap、TikTok以及谷歌旗下的YouTube均辩称,目前尚无明确的科学证据表明科技产品的使用与成瘾之间存在关联,并强调必须要有确凿证据证明它们的产品对年轻用户造成了显著伤害。
广告
这些社交媒体公司援引了一项联邦保护性法律——1996年《通信规范法》第230条,该条款使其无需对用户在平台上发布的内容承担责任。
旗下拥有Snapchat的Snap公司以及TikTok已与K.G.M.达成和解,具体金额未披露。
Meta在K.G.M.的庭审中表示,她的健康问题源于家庭中的虐待和动荡。该公司出示的医疗记录显示,社交媒体成瘾并非她治疗过程中的重点。
Meta首席执行官马克·扎克伯格和Instagram负责人亚当·莫塞里在庭审中为公司辩护。两位高管均否认Instagram可以被描述为“临床意义上的”成瘾性产品。
YouTube则表示,自己并非一家社交媒体公司,其功能也并非为让人上瘾而设计。
两家公司周三均表示对判决结果感到失望。Meta称正在评估法律应对选项,YouTube则表示计划提出上诉。
广告
此案有哪些重大影响?
原告正在要求赔偿,并可能推动平台进行设计上的改变,以防止成瘾行为。
在K.G.M.一案中,Meta须支付总计420万美元的补偿性赔偿和惩罚性赔偿,YouTube则须支付180万美元。
在新墨西哥州的案件中,陪审团判令Meta支付3.75亿美元。该州总检察长劳尔·托雷兹表示,他还将寻求更多赔偿,并要求对平台设计进行调整。
虽然这些金额对这些年收入数十亿美元的公司来说只是九牛一毛,但鉴于全球舆论风向正转向对社交媒体公司不利,这些败诉的象征意义重大。原告的胜诉也为社交媒体用户提出数以百万计的其他索赔打开了大门。
如果这些公司被迫对其产品作出改变,可能会对其整体商业模式造成冲击。

免费下载 纽约时报中文网
iOS 和 Android App

点击下载iOS App 点击下载Android App
© 2026 The New York Times Company.

【CDT报告汇】自由之家报告:全球自由度连续20年下降,中国排名倒数十八,西藏专制程度超越朝鲜(外二篇)

23 March 2026 at 06:00
CDT 档案卡
标题:【CDT报告汇】自由之家报告:全球自由度连续20年下降,中国排名倒数十八,西藏专制程度超越朝鲜(外二篇)
作者:中国数字时代
发表日期:2026.3.22
主题归类:CDT报告汇
主题归类:西藏
主题归类:台湾
主题归类:中美关系
CDS收藏:公民馆
版权说明:该作品版权归原作者所有。中国数字时代仅对原作进行存档,以对抗中国的网络审查。详细版权说明

编者按:《CDT报告汇》栏目收录和中国言论自由及其他人权问题相关的报告资讯。这些报告的来源多种多样,包括机构调查、学术研究、媒体报道和网民汇集等等。也欢迎读者向我们推荐值得关注的报告。

中国数字时代本周推荐媒体:

大聲- Dasheng:一个95后中国汉族女孩为何走上“挺藏”之路?她在藏区看到的一切|段荆棘对话(上)| 华语青年挺藏会|汉藏关系|阿坝自焚|3月10日纪念日|“314” 敏感三月|达赖喇嘛

一、自由之家:中国是世界上最不自由的国家之一,审查与专制持续强化

3月19日,自由之家 (Freedom House) 发布了最新的2026世界自由度报告。结果指出,全球政治权利与公民自由已连续第20年出现下滑,民主制度正面临持续性压力。其中,中国得分仅为9分(满分100分),继续被列为“不自由国家”。

img

报告封面

自由之家发现,2025年共有54个国家出现自由度下降,仅35个国家有所改善。与此同时,全球超过40%的人口所在国家经历了自由状况恶化。报告指出,这种长期恶化主要由四类因素推动:“武装冲突、政变、民主体制的瓦解,以及威权政府镇压的加剧”。

在最新的自由度排名中,最自由的国家分别为芬兰、新西兰、挪威、瑞典和爱尔兰,而最不自由的国家和地区则为俄罗斯占领的乌克兰领土、南苏丹、西藏、苏丹、土库曼斯坦、加沙地区、厄立特里亚和朝鲜等。据悉,自由之家将西藏单独列为一个研究地区,其自由度得分为0分,甚至低于朝鲜,更低于中国其他地区。其中,西藏的政治权利得分更是为负数,只有-2分。

在中国方面,报告指出:“中国共产党 (CCP) 继续对中国民众的政治权利和公民自由施加重大控制”,并列举了包括“起诉记者、镇压规模虽小但日益增多的抗议活动,以及限制国际旅行”在内的多种控制手段。

在具体案例方面,报告提到了公民记者张展的遭遇:“活动人士兼公民记者张展……被判处四年监禁”。自由之家指出,中国长期处于高度审查体系之下:“中国共产党长期以来对中国媒体格局施加了重大控制……审查力度自此不断加强”,特别是在互联网领域,审查机制日益“技术化”。报告引用数据表示,中国媒体自由度已经“在2018年降至4分制中的0分”,表明其新闻环境已处于最低水平。

不过,报告也提到在高压环境下仍存在有限的社会反应空间:“即使在中国,公民也一直在寻找途径发布独立报道并表达异议。”数据显示,这种表达与抗争在近年有所增加:“自由之家 (Freedom House) 的中国异议监测项目记录了近1,400起抗议活动……增长了45%”,且已连续六个季度同比上升。

而在民主国家方面,自由之家指出,美国、保加利亚和意大利出现明显倒退。比如,美国因“立法失能与行政主导”以及对表达自由的压力增加而下降3分。

此外,报告总结称,在过去二十年中,多项基本权利遭到侵蚀,其中“媒体自由、个人表达自由和正当程序受到的冲击最为严重”。在媒体领域,各国通过“法律骚扰……审查……逮捕和监禁记者”等手段削弱新闻自由;在言论领域,“数字监控”与刑事指控产生了“寒蝉效应”;在司法层面,政府加强对法院和执法系统的控制,使其成为打压异议的工具。

最后,自由之家警告称,随着民主国家减少对外援助、削弱国际合作并回避对不公正选举的批评,“世界可能会面临一个由日益嚣张的独裁者主导的危险未来”。

二、美国国家情报总监:暂无证据显示中国计划2027年攻台,但仍持续强化对台军事压力

3月19日,美国国家情报总监办公室 (ODNI) 发布了《2026年度威胁评估报告》。报告指出,中国虽持续强化对台军事能力,但“尚未显示出将在2027年发动入侵台湾的明确计划”。

img

报告封面

报告强调,中国仍将台湾问题视为核心利益,但更倾向通过非军事方式推进统一。同时,中国也“保留使用武力的选择”,并持续进行军事准备。在具体手段上,美国情报界指出,北京正在加强“该岛周边的军事行动和灰色地带行动”,包括军演、空海巡航以及其他非直接冲突形式的压力。

报告同时指出,攻台行动本身具有高度风险,“两栖突击被视为风险较高”,尤其是在美国可能介入的情况下,这也是中国暂未采取行动的重要原因之一。

在更广泛的安全评估中,美方认为中国仍是美国面临的主要战略挑战之一,特别是在网络、太空及人工智能领域的竞争不断加剧。报告提到,中国正持续发展相关能力,并试图在多个关键技术领域扩大影响力。

与此同时,区域安全环境仍在持续紧张。报告指出,中国对日本等周边国家的“胁迫性压力……预计将加剧”,并可能在2026年继续升级。

对此,中国官方回应则称,有关“攻台时间表”的说法属于夸大威胁,并强调台湾问题属于中国内政。

最后,报告仍将台湾问题视为未来最可能引发大国冲突的核心风险之一,依然需要持续关注和警戒。

三、昆西研究所:切断中美科研合作可能适得其反,美国或削弱自身创新优势

3月12日,昆西研究所 (Quincy Institute) 发布了一份报告《中美人才竞争与美国国家利益》。报告发现了一个“反直觉的”结论:近年来美国试图限制与中国的科研合作,但这种“去合作化”政策很可能会削弱美国自身的科技优势。

img

报告封面

“当前华盛顿将美国科学与中国隔绝开来的努力是建立在一个错误的前提之上的”,作者警告称,这一政策“可能正在悄然瓦解美国最强大的战略资产之一”。

报告的核心观点是,美国的决策者应该将中美“人才竞争”理解为制度竞争,而非零和博弈。“对个体科学家而言,这并非一场零和竞赛,而是不同体系之间的角逐”。在这一体系中,美国长期优势来源于其开放性。报告指出,美国科研体系具有独特的“捕获效应”,即“吸引高素质的外国留学生,使其融入……留住其中许多人……并将他们的贡献转化为国内的科研成果”。

这一机制在中美关系中尤为明显。文章特别指出,中国学生和学者“自20世纪80年代以来,一直处于美国科研能力的核心地位”,在实验室、研究项目以及科研产出中发挥关键作用。比如,美国国家科学基金会 (NSF) 的数据就显示,“85%至95%的中国STEM博士毕业生在美国停留了至少五年”,形成了稳定的人才输送管道。报告特别强调,这种开放并非“善意施舍”,而是美国竞争力的重要来源。

此外,中国留学生不仅支撑科研体系,还带来显著经济效益。文章指出,他们“每年通过学费和当地消费为当地经济贡献数十亿”,并在劳动力市场中填补关键技术岗位空缺。

然而,作者指出,近年来的政策变化正在削弱这一优势。报告认为,以国家安全为名实施的广泛限制措施“适得其反”,不仅削弱美国科研能力,还可能加速中国的“自力更生”。

尽管报告承认部分领域确实存在风险,例如“先进半导体”与“军用人工智能”等敏感技术需要加强管控,但其同时强调,针对国籍的全面限制并非有效手段,而需要更多有针对性的政策。

最后,作者总结道,美国当前政策一方面会减少高端人才流入,另一方面则会促使中国加快构建自主科研体系,从而削弱美国长期依赖的创新模式。

中国就Meta收购Manus处罚相关人员

简繁中文
纽约时报 出版语言
字体大小

中国就Meta收购Manus处罚相关人员

ANA SWANSON, MEAGHAN TOBIN, 孟建国, ELI TAN
Meta于去年12月宣布,已收购源于中国的新加坡人工智能初创公司Manus。
Meta于去年12月宣布,已收购源于中国的新加坡人工智能初创公司Manus。 Alex Plavevski/EPA, via Shutterstock
据两位知情人士透露,中国政府正在采取行动,对与Meta以20亿美元收购源于中国的新加坡人工智能初创公司Manus的交易关联人员进行处罚,此举显然是为了阻止中国人工智能高管将业务迁至海外。
上述人士称,上周晚些时候,中国国家发展改革委的官员——该机构是负责包括人工智能领域的经济规划的高级部门——召集Meta和Manus的高管开会,对这项于去年12月宣布的交易表达了关切。由于涉及敏感话题,上述知情人士要求匿名。
其中一名知情人士称,目前中国政府采取措施的具体范围尚不清楚,但似乎包括限制Manus高管离开中国前往新加坡。过去,北京方面曾对接受审查的企业高管实施出境限制。
Meta发言人安迪·斯通在声明中表示:“该交易完全符合适用法律。Manus这支优秀的团队现已已经深度整合进Meta。”
广告
他还补充说:“我们预计调查将得到妥善解决。”
中国驻华盛顿大使馆表示不了解此事的具体情况。Manus以及白宫方面均未回应置评请求。
Manus由中国的工程师创办,在迁至新加坡之前曾有一家中国母公司。去年,这家初创公司凭借一款无需人工干预即可执行复杂任务的人工智能应用,在硅谷引起了广泛关注。
Meta收购Manus成为一笔罕见的交易,它将来自美国和中国的人才联系在一起——两国正争夺前沿人工智能领域的主导地位。这也是Meta在数月内进行的第二起收购,此前这家拥有Facebook和Instagram的硅谷企业在去年11月被认定未违反美国反垄断法。Meta正投入数十亿美元用于人工智能研究人员和数据中心建设,以争夺技术领先地位。
今年1月,中国官员表示,他们正在调查该交易是否违反了中国关于企业出口某些技术(包括交互式人工智能系统)需获得批准的规定。他们还在评估这笔交易是否违反了中国关于对外投资的相关规定。
由于收购已经完成,目前尚不清楚中国政府将采取何种行动。专家表示,除了出境禁令,中国当局可能试图收回已出口的数据,或宣布Manus迁往新加坡的行为不合法。
广告
事态发展向人工智能行业发出了一个明确信号——尽管中美关系紧张,但该行业一直以两国间人才和技术的流动为特征。这种摩擦可能会堵死Manus所走的路径,即中国高管在海外注册公司,以规避来自华盛顿和北京双方的监管。
任何更严厉的惩罚都将凸显北京日益加深的担忧,即人工智能人才和业务流向美国。出境禁令可能会引发中国顶尖工程师的担忧——他们不仅担心是否还能赴美工作,也担心是否还能继续留在那些他们担任要职的美国企业里。
这些举措也可能在华盛顿引发反应。近期,美国官员才刚刚开始放宽限制,允许更多高端人工智能芯片流向中国企业。
这一事件发生在美中关系的敏感时刻。美中官员已于周日和周一会面,为特朗普总统本月晚些时候访华与中国国家主席习近平会晤做准备。但特朗普周一表示,由于伊朗战争,他已要求中国政府推迟此次访问。周二他又称,预计会面将在“五到六周内”举行。
周三周四,美国启动了两项分别针对中国及其他多个国家的贸易调查,预计它们将导致更高的关税。
这些调查针对外国制造业的“产能过剩”以及涉及强迫劳动商品的贸易——这两个问题美国通常都与中国联系在一起。过去,北京方面曾通过针对美国公司采取报复性行动来回击华盛顿的贸易举措。
广告
亚洲协会政策研究所中国分析中心研究助理王晟宇(音)表示,中国政府对Meta的审查可能是为了在与美国即将举行的贸易谈判中“增加一些谈判筹码”,同时也是向中国的人工智能研究人员发出信号,告诫他们不要试图效仿Manus的路径。
王晟宇说,如果北京方面容忍这笔交易,其他中国人工智能研究人员可能会尝试利用中国的研发生态系统开发应用,然后再离开并被美国公司收购。
Meta收购Manus的交易可能会成为中美官员会谈的议题,同样有可能被提及的,还有美国政府正在进行的对中国互联网巨头腾讯持有Epic Games少数股权的审查。Epic Games是美国公司,开发了热门电子游戏《堡垒之夜》。中国电动汽车公司也一直希望北京方面能施压,为其争取更多进入美国市场的机会。
许多中国科技初创公司的创始人都渴望推出风靡全球的产品,并吸引硅谷投资者的资金。为了避开华盛顿和北京的审查,包括Shein和TikTok在内的一些中国科技公司已将总部迁至新加坡等地。
天普大学政治学教授薛媖月表示,这种做法被称为“新加坡洗白”(Singapore washing)。她解释说,这个说法指的是中国公司通过迁往第三国,“洗掉自己的中国身份”。
她说:“你看到越来越多的公司正在这样做,或者有这种打算。出于多种原因,它们希望规避监管,尤其是在像人工智能这样更敏感的领域。”

Tony Romm自华盛顿对本文有报道贡献。

Ana Swanson报道贸易和国际经济新闻,常驻华盛顿。她从事新闻工作已超过十年。

Meaghan Tobin是时报科技记者,常驻台北,报道亚洲地区的商业和科技新闻,重点关注中国。

孟建国(Paul Mozur)是时报全球科技记者,常驻台北。此前,他自香港、上海和首尔报道亚洲科技与政治的交叉议题。

Eli Tan自旧金山为时报报道科技业新闻。

翻译:纽约时报中文网

免费下载 纽约时报中文网
iOS 和 Android App

点击下载iOS App 点击下载Android App
© 2026 The New York Times Company.

中国 AI 视频赛道最大单笔融资,为什么给了爱诗科技

By: 李超凡
13 March 2026 at 10:00


APPSO 获悉,爱诗科技近日完成 3 亿美元 C 轮融资,创下国内 AI 视频生成赛道单笔融资的最高纪录。

领投方鼎晖香港基金联合鼎晖 VGC、鼎晖百孚重金押注;产业资本中国儒意、三七互娱紧随入场;国内政府引导基金、险资、家族办公室,还有 UOB Venture Management、Lion X 基金。参投名单横跨两个半球,不同领域的资本默契涌向了同一个方向。

3 亿美元融资放在当下 AI 行业似乎没有什么好惊讶的,这还不到 OpenAI 融资的零头。但你得把这个数字放进 AI 视频赛道的坐标系里看:成立于 2018 年的 Runway,花了七年才在上个月完成 3.15 亿美元的 E 轮融资。而爱诗科技从种子轮走到同等量级的 C 轮,只用了不到三年。

A 轮,达晨财智领投,蚂蚁集团跟进;B 轮,阿里巴巴领投逾 6000 万美元,彼时已是国内视频生成赛道最大的一笔钱;C 轮,3 亿美元,纪录再次被自己改写。

每一轮都有新的顶级机构首次入场,每一轮金额都在翻倍。节奏越来越快,筹码越押越重

实际上,这笔融资反映出的信号大于数字本身:AI 视频不再是大模型叙事的配角,资本已经把它当作一条独立的、值得重仓的赛道来押注

爱诗科技创始人王长虎曾在 2024 年表示,视频生成一定是被低估的。爱诗科技用不到三年时间,将这个非共识变成了资本共识。

非共识的起点:2023 年,为什么是视频

「我不会创业,但没关系,创业就是边做边学。」2023 年 4 月,爱诗科技创始人王长虎决定创业时,就是带着这句话出门的。

2023 年 4 月,爱诗科技创始人王长虎带着一个在当时看起来相当「偏科」的判断出来:当所有人都在追大语言模型,他要押注视频生成。

要知道一年之后 OpenAI 的 Sora 才正式亮相,可以想象当时王长虎这个选择有多么反常识。

在微软亚洲研究院待了 8 年、在字节跳动做了 4 年 AI Lab 总监之后,王长虎比大多数人更清楚视频 AI 的技术节奏。「2023 年初很多人都不认同做视频这件事,大家都在看大语言模型,」他后来回忆,「但这就有了非共识:我们觉得视频生成是大事,而我们过去在视频和 AI 方面有经验,能赢在全球。」

这个判断在当时要承受不小的压力。相比语言模型,视频生成的算力消耗更大,生成质量更难控制,产品化路径也更模糊。早期的投资人需要相信的,不是现在能看到什么,而是三年后那张尚未成型的蓝图。

2024 年 3 月,达晨财智率先领投 A1 轮,完成了第一次押注。随后一个月,蚂蚁集团以逾 1 亿元人民币跟投,是彼时国内 AI 视频领域单笔最大机构投资。至此,爱诗科技基本完成了从「技术方向」到「资本方向」的验证。

王长虎在创业之初就明确了愿景:「帮助每个人成为生活的导演」。海外产品 PixVerse 和国内产品拍我 AI,都是在这个方向上的落地——前者于 2024 年 1 月上线,后者于 2025 年 6 月推出,两款产品针对不同市场独立运营。

DiT 架构:那个没人看好的选择

要理解这笔 3 亿美元的 C 轮,需要先看懂爱诗科技的技术路线。

把爱诗科技的技术路线从头捋一遍,会发现 DiT(Diffusion Transformer)架构这个选择,是整个故事的原点,也是很多结果的前提。

2023 年,国内主流视频生成方案普遍采用 U-Net 架构。这也没问题,U-Net 经过了图像生成领域多年实践的充分验证,稳定、成熟,调参经验相对成熟,可以较快地跑出效果。对大多数想先做出来再说的团队,这是理所当然的选择。

可以爱诗科技选了 DiT,成为国内首家将这一架构用于视频生成的创业公司

DiT 是 Diffusion(扩散模型)与 Transformer 的组合架构。Transformer 的核心优势在于注意力机制(Attention Mechanism)——它让模型在处理数据时,能够同时「感知」序列中任意位置的信息,而不是像卷积网络那样只能处理局部区域。

对于视频生成这个任务来说,这种能力的价值是决定性的:视频的本质是时间轴上的连续帧,每一帧的内容与上下帧存在复杂的时空依赖关系。人物的动作要连贯,物体的运动轨迹要符合物理规律,光影变化要在跨帧时保持一致——这些要求,需要模型能够捕捉「跨帧的长程时空关联」,而这正是 Transformer 天然擅长的事。

但这个选择在 2023 年要付出不小代价:DiT 在训练初期对算力和数据量的要求更高,起步阶段几乎必然要经历「效果不如成熟 U-Net」的阵痛期。对一家刚起步的创业公司,这是不小的风险,钱可能在效果变好之前就烧完了。

事实证明,这个判断是对的。2024 年 Sora 发布时,OpenAI 公开的技术路线正是 DiT。在视频生成这个方向上,DiT 架构确实是更接近正确答案的那条路。

当 Sora 发布时,爱诗已经在 DiT 架构上积累了一年多的训练经验、数据处理流程、工程优化方案。这种时间差,在技术迭代速度极快的 AI 领域,十分关键。

模型产品两手抓,被低估的核心逻辑

在 AI 视频领域,大多数公司的做法是先把模型训练好,再去想产品怎么做。这是一条看起来稳妥的路,模型成熟了,产品化的风险就小得多。

但这种路线有个致命问题:等模型「训练好」的时候,你已经错过了最关键的反馈窗口。用户真正需要什么样的生成效果?哪些场景的需求最强烈?模型应该在哪些维度上优先优化?这些问题,只有产品跑起来、用户用起来,才能得到真实答案。

爱诗从一开始就把模型训练和产品迭代放在同一个循环里。

PixVerse 网页版 2024 年 1 月上线时,模型还远未到「完美」状态,但产品已经可以让用户生成视频、给出反馈。每一个版本的模型升级,都直接来自上一个版本用户的真实使用数据,哪些 Prompt 成功率低、哪些特效最受欢迎、哪些场景容易出错,这些信号实时回流到训练流程,指导下一轮模型优化的方向。

更重要的是,这种模型-产品的协同进化,会随着时间推移形成复利效应:用户越多,反馈越密集,模型优化越精准,产品体验越好,又吸引更多用户——这是一个正向飞轮,而不是单向的技术推进。

「这就是创业公司的优势所在,没那么复杂,所以效率高,」爱诗联合创始人谢旭璋说。这句话听起来轻描淡写,但背后是对技术路线、产品节奏、组织能力的高度整合。大厂可以投入更多算力、更大团队,但很难做到这种模型与产品的深度结合,流程太长,部门太多,反馈链条一旦拉长,速度优势就会被稀释。

这种效率优势最终体现在成本结构上。谢旭璋在接受晚点采访时透露,爱诗「平均每月用的训练资源不到千卡,成本大概只有同行的 10%」。

这是一种结构性的成本优势,而不是靠压缩预算换来的短期节省。用谢旭璋的话说,模型架构、算法、工程、产品能力的综合优势

当模型优化方向始终贴着真实需求在走,就能减少在错误的方向上浪费算力;产品反馈能实时指导训练策略,每一次迭代的投入产出比都会更高。

从 2024 年 1 月 PixVerse 网页版正式上线,到 2026 年初 V5.6 发布,爱诗科技连续更新 8 个主要版本,平均每两个月就有一次大的模型升级。

这种迭代密度的背后,正是模型与产品一起训练的方法论在起作用:

  • V2(2024 年 7 月):多段视频生成与局部重绘笔刷上线,用户从单纯「生成一段」开始走向「编辑与创作」;
  • V3(2024 年 10 月):特效模式上线,「抽卡概率」从随机提升至接近确定性,这是 PixVerse 从创作工具迈向大众产品的真正节点;
  • V3.5(2024 年 12 月):生成时间压缩至 10 秒内,极大降低用户等待成本;
  • V4(2025 年初):「准实时生成」能力出现,5-7 秒生成 5 秒视频;
  • V4.5(2025 年 5 月):参数量与训练数据集指数级扩张,全球用户达 6000 万;
  • 拍我AI (2025 年 6 月):PixVerse 国内版「拍我AI」发布,同步上线网页端及移动端应用;
  • V5(2025 年 8 月):Agent 创作助手上线,用户不再需要学习 Prompt 语法,口语化意图自动转化为模型指令,API 生态同步开放;
  • V5.5(2025 年 12 月):「分镜 + 音频」一键生成,国内首次实现画面与声音的同步协同,完整叙事能力成型;
  • V5.6 (2026 年 1 月 26 日 ):模态大模型,支持分镜和音画同步生成。

在权威 AI 评估机构 Artificial Analysis 最新发布的视频生成模型排行榜中, PixVerse V5.6 位列全球第 2 位,持续领跑全球视频生成模型第一梯队。


这种迭代密度在 AI 视频行业里相当罕见,爱诗跟很多同类产品的策略不同:持续往前推,每一版解决真实用户在当下遇到的真实问题,同时在架构层面为下一次跃升保留余量

背后的可行性,恰恰是 DiT 架构的可扩展性所赋予的,每次模型升级,不需要推倒底层重来,而是在既有基础上加宽加深。

3 亿美元,押注不只是 AI 视频

但鼎晖最终决定领投这次 C 轮,押注的不只是 V5 的榜单排名,可能还有 2026 年 1 月刚刚发布的 PixVerse R1。

R1 可以说是爱诗科技迄今最激进的一次产品技术迭代。

过去的视频生成,无论做得多精致,本质上都是「把指令翻译成一段视频文件」,是一次性的、离线的渲染过程。用户输入指令,等待生成,拿走一段固定的视频文件。这像是在冲洗胶卷,你拍完就拍完了,要等冲洗出来才能看,看完也无法再改。

R1 不是这个逻辑,它不再只是「生成一段视频」,是一个能实时响应用户交互指令的「世界模型」:用户可以在视频播放中输入指令,改变光影、替换背景、控制角色走向,系统响应延迟约 2 秒,输出为 1080P 超高清实时视频流。

背后依赖的是爱诗自研的「瞬时响应引擎(IRE)」,它将计算步骤从数十步压缩至 1-4 步,实现从「离线渲染」到「实时交互」的重要升级。

谢旭璋判断,未来视频和游戏的边界一定会越来越模糊。一旦视频变得能交互了,全新的内容、用户和创作机会就会涌现。

谢旭璋在采访中透露,R1 发布后,游戏行业的 B 端客户来得最多,「以后的游戏开发不用再像过去那样熬漫长的大周期了,无论是玩法、画面还是剧情,AI 都能让它变得更轻量、更具想象力。更重要的是,它能帮那些不懂代码但有创意的人,把点子变成真正的游戏。」

R1 的潜在价值,已经超出了「更好的视频生成工具」这个范畴。如果说 PixVerse V5 是在争视频生成工具的头部位置,R1 是在定义是一个完全不同的品类——实时交互式内容体验的操作系统。它的竞争对手,不再是 Runway 或可灵,是 Unity、Unreal Engine,甚至是尚未出现的内容消费形态

回看爱诗科技这笔 C 轮的投资人结构,其实本身就是一个信号。

鼎晖三支基金联合领投,背后是对这家公司进入规模化阶段的系统性判断。产业资本中国儒意(影视内容)和三七互娱(游戏)的入场,指向了 R1 要重构两个行业:互动影视制作和 AI 原生游戏开发。

进入 2026 年,整个 AI 视频赛道也在加速进入下半场。前有 Seedance 2.0 风靡全球,现在爱诗科技成为新的独角兽。

目前,PixVerse 全球注册用户突破 1 亿,MAU 超过 1600 万;国内版拍我 AI 与 PixVerse 形成双轨并行格局;爱诗科技也是 2025 年联合国「人工智能向善全球峰会」上唯一入选的中国 AI 视频应用,并于同年正式加入联合国大学全球人工智能网络。

这笔 3 亿美元融资,可以理解为资本对一个即将到来的时代的投票。AI 视频的下一个战场,不在参数量,不在榜单排名,关键在于谁先把视频从一个「消费品」变成一个「交互界面」

不过,知道技术路线在哪里会拐弯,和相信这条路最终走得通,是两件事。

在 AI 这个行业,「选对了方向」本身并不稀缺。稀缺的是,在方向被主流认可之前那段空白期里,有没有足够具体、足够扎实的东西,支撑你不摇摆

三年里爱诗科技在这条路线没有在中途断裂,很难说是提前预见了终点的全知视角,而是每走一步,下一步的方向都从上一步的技术现实中自然长出来。

视频正在从被观看的内容,变成被触碰的世界。因此,这三亿美元所押注,远不止 AI 视频的未来,而是那个「」万物皆可交互」的时代。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

不要被荒野覆盖

By: Steven
7 March 2026 at 13:32

生成式算法就是不加判断和效利优先的,把创作权利和控制权托付给它,只能得到一片荒野。建造文明的第一步就是开垦荒野,是斩断枝枝蔓蔓,是割开一片区域,是界定各自的空间,是一步一步地在荒野里搭建起一座座楼阁。

你停下来,很快就会被荒野覆盖;建造需要很久,可绝不敢停歇。再过些时日,治理因 AI 而起的荒漠化,怕是要提上议程了。

这就是播客《荒野楼阁 WildloG》的意思。

Anthropic指控深度求索等中国公司不当获取其数据

By: CADE METZ
24 February 2026 at 11:47

简繁中文
纽约时报 出版语言
字体大小

Anthropic指控深度求索等中国公司不当获取其数据

CADE METZ
深度求索是三家被指控利用Anthropic人工智能系统数据训练自身模型的中国初创企业之一,该过程被称为知识蒸馏。
深度求索是三家被指控利用Anthropic人工智能系统数据训练自身模型的中国初创企业之一,该过程被称为知识蒸馏。 Cfoto/Future Publishing, via Getty Images
旧金山人工智能初创企业Anthropic指控三家中国公司通过不当手段大量抓取其人工智能技术数据,以加速自研系统开发。
Anthropic周一在一篇博客文章中表示,中国三家知名初创企业深度求索、月之暗面和稀宇科技利用约2.4万个虚假账号,与Anthropic的Claude聊天机器人产生了超过1600万次对话,这些数据可用于训练三家公司自己的聊天机器人。
利用一个人工智能系统的数据训练另一个系统的过程被称为知识蒸馏,在人工智能领域较为常见。但Anthropic的服务条款禁止任何人以秘密方式抓取数据用于蒸馏,同时不允许其技术在中国境内使用。
Anthropic的主要竞争对手OpenAI也指控中国公司从其聊天机器人ChatGPT中大量提取数据用于类似目的。
广告
在上周致美国国会众议院中国问题特设委员会的一份备忘录中,OpenAI称,深度求索等中国初创企业正采用新型的“混淆式”蒸馏手段,“持续搭便车”使用OpenAI及其他美国公司开发的技术。
与OpenAI一样,Anthropic称此类行为构成国家安全风险,并表示这可能让中国得以开发用于制造生物武器或大规模监控工具的人工智能技术。Anthropic已为其技术设置安全防护机制,防止被用于此类用途,但这些防护措施在蒸馏过程中可能被剥离。
Anthropic呼吁政府官员及其他人工智能企业共同阻止中国公司对美国模型进行蒸馏。
“此类行动正变得愈发激烈且手段更趋复杂,”Anthropic在文章中表示,“可供采取行动的时间窗口正迅速缩小,且威胁已超出单一企业或地区范围。应对这一问题,需要行业参与者、政策制定者及全球人工智能界迅速采取协同行动。”
深度求索、月之暗面、稀宇科技三家公司暂未回应置评请求。
此文发布之际,Anthropic与美国国防部就五角大楼对其技术的使用陷入争执。五角大楼已批准将Anthropic的技术用于涉密任务,但因该初创公司不希望其技术被应用于自主武器或国内监控领域五角大楼威胁要终止双方的合作关系
广告
去年,深度求索推出了性能与全球市场同类产品相当的人工智能技术,令硅谷科技企业震惊,并引发美国金融市场剧烈震荡。
在此之前,硅谷的普遍观点是:没有数十亿美元的专用计算机芯片,就无法打造出最强大的人工智能系统。但深度求索表示,打造其技术所耗费的资源远少于此
与美国企业一样,深度求索、月之暗面、稀宇科技均通过从互联网搜集的计算机代码和数据构建人工智能技术。全球人工智能企业都高度依赖开源模式——即免费共享支撑其技术的代码,并复用他人分享的代码。它们认为这是加速技术发展的一种途径。
人工智能企业还需要海量网络数据来训练系统。顶尖人工智能系统通过分析互联网上几乎所有文本习得相关能力。
知识蒸馏常被用于训练新系统,开源技术通常允许这一做法。但如果一家公司从专有技术中提取数据,则可能涉嫌违法。
目前估值达3800亿美元的Anthropic正面临多起诉讼,它被控非法使用受版权保护的网络数据训练系统。去年9月,在一桩具有里程碑意义的法律和解中,法官裁定Anthropic非法下载并存储数以百万计受版权保护的书籍,该公司同意向一批作者和出版商支付15亿美元赔偿金。这是美国版权案史上金额最高的赔偿。
广告
OpenAI及其他人工智能企业也面临类似诉讼,其中包括《纽约时报》对OpenAI及其合作伙伴微软提起的诉讼。该诉讼称,《纽约时报》数以百万计的文章被用于训练自动聊天机器人,而这些机器人如今已成为一个与时报构成竞争关系的可靠信息来源。OpenAI和微软均否认相关指控。

免费下载 纽约时报中文网
iOS 和 Android App

点击下载iOS App 点击下载Android App
© 2026 The New York Times Company.

他们语言不通却爱意不减:翻译软件里的现代婚姻故事

简繁中文
纽约时报 出版语言
字体大小

他们语言不通却爱意不减:翻译软件里的现代婚姻故事

KASHMIR HILL, Oliver Farshi
戴维·杜达与梁红在康涅狄格州纽黑文的家中。他们于2019年秋季在中国西安相识。
戴维·杜达与梁红在康涅狄格州纽黑文的家中。他们于2019年秋季在中国西安相识。
对于很多夫妻而言,使用智能手机是引发矛盾的导火索。但对于康涅狄格州纽黑文市的戴维·杜达与梁红(音)夫妇来说,这项技术却至关重要——他们足足备了八个外接移动电源。一旦手机没电,他们就彻底无法交流。
62岁的杜达只说英语,57岁的梁红只讲普通话。他们依靠微软公司一款名为“翻译”的免费手机应用将彼此的话语转换成文字翻译,就像电影字幕,却是应用于实时的生活中。
去年12月的一个下午,尽管已经结婚三年,两人仍挽着胳膊走在街上,宛如新婚夫妇。这既是出于爱意,也是出于必要:一人说话、引路,另一人则紧盯手机阅读译文。
杜达讲笑话时,总会忍住笑等上几秒,直到梁红看完翻译。
广告
这种交流方式需要全神贯注。杜达和梁红不能心不在焉地听对方说话,也不能边说话边走开;没法淋浴时大声交谈。想要真正交流时,他们会在沙发上或床上,一聊就是几个小时,反复确认彼此完全理解对方的意思。
“翻译工具会让你更关注当下,因为你既要阅读又要倾听,”杜达说。“你必须更专注,这对夫妻相处来说显然是好事。”
“没有人这么细心地观察过我,或者是为我考虑过任何事情,所以他的很多细节方面打动了我,”梁红用中文说道,人类口译员这样翻译。(机器翻译版本则是:他替我想得很周全,许多细节都令我感动。)
近年来,自动翻译技术已足够先进,开始被杜达、梁红这样这样超越语言障碍的恋人使用,也服务于海外旅行者,以及希望开拓新市场、吸引新受众的企业。
采访梁红时,我使用了支持实时语言翻译的苹果AirPods和微软翻译软件。尽管延迟让对话变得困难,但我仍能大致听懂她的话。不过对话中出现了几处关键误解,直到后来我请专业译员回看对话内容才发现。
“人们现在能和比以往更广泛的人群交流,这是件了不起的事情,”加州大学圣迭戈分校认知科学教授莱拉·博罗迪茨基说。“这些翻译并不完美,但是有接触总比完全无法交流要好。”
万能翻译工具的构想早已存在于科幻作品中——不然《星际迷航》里企业号的船员要怎么和外星物种交流?微软等公司推出的现实版翻译工具能覆盖全球7000种语言中的约100种,似乎实现了令数十亿人相互理解的梦想,至少能令人们彼此勉强沟通。
广告
靠手机应用维系一段亲密关系,听起来更加令人难以置信。法国作家安德烈·莫鲁瓦曾写道:“幸福的婚姻是场总嫌太短的漫长对话。”杜达和梁红的交谈,恰逢技术工具足以支撑交流的时代,而他们也拥有使用这些工具的耐心。
“对我们来说这还挺有趣的,”杜达说。“如果不是在恋人之间,那就会让人沮丧得多。”
 翻译里的爱情
微软的免费翻译应用让杜达与梁红得以流畅交流,尽管翻译并非总是准确。
微软的免费翻译应用让杜达与梁红得以流畅交流,尽管翻译并非总是准确。
苹果AirPods如今可支持包括中文在内的十几种语言实时翻译,杜达与梁红一直在对其进行测试。
苹果AirPods如今可支持包括中文在内的十几种语言实时翻译,杜达与梁红一直在对其进行测试。
杜达和梁红于2019年秋天在中国西安相识。
当时杜达的兄弟要去西安出差,他便一同前往,想去看看当地著名的兵马俑和佛教寺庙。他兄弟的生意伙伴提议,让她的朋友梁红开车带杜达四处逛逛。一周行程结束时,杜达已对梁红倾心。
“她是世上最开朗快乐的人,”杜达说。他觉得两人之间有化学反应。临别前,他试图吻别梁红。她猝不及防,侧过脸去。
广告
但她其实对杜达颇有好感。因此,当杜达回到纽黑文经营他在当地的书店后,两人通过中国即时通讯应用微信保持联系。他们用英文打字聊天,梁红则把消息复制粘贴到英汉翻译工具里翻译。
相识数月后,新冠疫情让世界停摆。当时杜达和梁红都是离异人士,子女均已成年,两人都陷入了隔离状态。他们开始每天发消息,聊各自的人生经历、失败的婚姻,还有他们的家人。疫情管控迫使零售商关门,杜达的工作转为整理书籍用于线上发货,他开始在夜间工作,这让他的作息和梁红刚好同步。
“接下来的两年,我们天天靠手机互相了解,”杜达说。
杜达与梁红对翻译技术的依赖程度极高,为此他们备着八个外接移动电源。
杜达与梁红对翻译技术的依赖程度极高,为此他们备着八个外接移动电源。
2022年9月,中国放宽疫情旅行限制,梁红订了一张单程机票飞往美国。她心中很忐忑:杜达说的一切,真的和她理解的一样吗?
杜达在机场接她,手里举着一块牌子,上面用汉字写着:“我生命中的挚爱”。
“我觉得这是一个非常非常浪漫的事情,而且是在机场当着那么多人的面,”梁红回忆。(机器翻译:我觉得这是非常非常浪漫的事,在机场那么多人面前。)
广告
 “你快要死了?”
至少从20世纪50年代起,自动语言翻译就已是计算机科学家的目标——当时乔治城大学的研究人员设计出一套系统,能将几百个俄语单词翻译成英语。但是有意义的翻译远不止逐字替换。不同语言的语法和结构千差万别,单词含义随语境变化,更不用说“it’s a piece of cake”(小菜一碟)这类无法直译的习语。
这些棘手的难题吸引了机器学习研究者:计算机能否吸收语言,并学会解读它?
21世纪初,谷歌和微软利用预测性软件开发了网页翻译服务,但重大突破出现在十年后。谷歌研究人员在一篇论文中介绍了一种处理海量数据集的新技术,开启了人工智能的新时代,催生出ChatGPT等聊天机器人。这项技术的核心是语言处理,论文还展示了它在英译法、英译德方面的出色表现。
从那以后,自动翻译系统不断进步,文本翻译的准确率已相当可观。但用AI翻译人们的口语,效果仍然略逊一筹。
在微信上聊天时,杜达和梁红有时甚至会忘记两人说不同的语言。可面对面交流时,难度却大了不少。
广告
起初,他们试过一台600美元的手持翻译机,又试过可将译文传入耳中的耳机。但这些设备必须连接Wi-Fi,背景里稍有噪音就彻底失灵。最终,他们选择用微软翻译,对着手机说话就能生成文字翻译。他们还没试过用生成式AI聊天机器人翻译,尽管ChatGPTClaude的开发者都将翻译列为产品的热门应用场景。
杜达和梁红婚姻生活的对话记录如今由一家巨头公司持有,但杜达表示自己并不介意。他甚至授权微软调阅他的语音片段,以改进技术。
但“翻译”这款应用程序确实有待改进。我请明德学院的中英翻译与口译教授陈瑞清审阅了我与这对夫妇的交谈。他说,面对简短交流,人工智能表现尚可,但在处理较长的句子时,它就开始力不从心了。
比如梁红描述杜达去机场接机的情景时提到,自己抵美后不久便感染新冠,病得厉害,甚至以为自己快要死了。
但我当时在屏幕上看到的并不是这些。应用程序的翻译是她得到了一个“新皇冠”,并认为自己快要死了。我当时一头雾水,还问她是不是想说他举着爱心牌迎接她的举动浪漫得要死。
“不是不是不是,”她连声否认。她又重复了一遍,但我们仍如坠五里雾中。
一个月后,陈瑞清在回看这段对话视频时道出原委:这款应用将中文的“新冠”直译成英文的“new crown”(新皇冠)。梁红说,患病期间杜达始终相伴在侧,那份体贴令她情意愈笃——这正是她提及此事的缘由。
沟通失败的情况还不止于此。梁红作答稍长时,语音转文字功能就跟不上了,会漏遗漏字词乃至整句话。这就像通话信号中断,最后出来的全是莫名其妙的话。
曾在微软参与“翻译”开发二十余载的前项目经理克里斯·温特表示:“讲话者必须确认自己的发言已被准确识别。”
这意味着你在说话时得盯着这款应用程序,以确保它准确记录了你的话,而不是盯着你的交流对象。
这对夫妇闻之愕然。“两年前他们怎么不告诉我们?”杜达叹道。
即便不涉及语言翻译,将语音转化为文字也极具挑战性。约翰斯·霍普金斯大学机器翻译领域的先驱菲利普·科恩指出,麦克风的音质、环境噪音或多人同时说话都会干扰语音识别的准确性。
口语比书面语更为庞杂多样。它包含口音、方言、还有意味深长、无法传达的停顿,以及易于流失的情感和语调。人们说话时可能语速飞快,或者东拉西扯,或思绪未竟便渐无声息。
家中墙上贴着一张英语字母发音表,用来帮助梁红练习英文字母的发音。
家中墙上贴着一张英语字母发音表,用来帮助梁红练习英文字母的发音。
明德学院教授、译员陈瑞清提醒,在“每个字都很重要”的场合,使用自动翻译务须审慎。
杜达和梁红深知翻译工具经常误解他们的意思。每当这种情况发生时,他们会就会说“bù bù hǎo”,这是在玩中文“不好”的谐音梗。遇到这种翻译翻车的时候,他们会再次尝试,或者使用肢体语言,又或者在网上找张图片来示意。文字有时会让他们感到词不达意,正如我们所有人都会遇到的那样。
宏愿
微软婉拒采访,但我询问了前项目经理温特,他的团队在开发“翻译”时初衷是什么。他们是否想过,有朝一日它能支撑一段婚姻?
“那正是我们的本意,”他说。“我们相信这是可能的。”
他与同事们怀抱宏愿:他们认为可以通过打破语言障碍来连接世界。2014年,微软通过两名女学生(分别在西雅图和墨西哥城)之间的Skype通话展示了同步翻译能力。当电脑生成的声音将她们的话语转化为西班牙语或英语时,女孩们和她们同学的脸上都绽放出惊奇的笑容。
据市场情报公司Slator称,自那时起,翻译已发展成为一个价值310亿美元的产业。去年,包括YouTube和Instagram在内的社交媒体平台都发布了工具,供创作者自动翻译其视频并进行配音。亚马逊正在测试用“AI辅助配音”将外语电影转为英语和西班牙语对白,并允许作者在Kindle上利用AI翻译自出版书籍。Reddit已将其网站上的所有内容翻译成了30种不同的语言。许多视频通话服务也向付费用户提供实时翻译功能。
温特将AI翻译比作驱动手机导航应用程序的GPS。
“有了GPS,你就不再害怕迷路,”温特说道。他在旅行时也会使用“翻译”应用,“它能让你勇敢地进入那些通常不敢涉足的境地。”
梁红抵美不到两个月,杜达就认定自己想让她留下来。感恩节家宴上,他单膝跪地,尝试用中文向她求婚。
梁红没听懂他的话,但跪下的意思再明白不过。一个月后,他们结为夫妻。
他们的生活与寻常夫妻并无二致:外出用餐、骑车兜风、海边漫步、看带中文字幕的剧集(《足球教练》是他们的心头好)。但有一点或许与众不同:结婚三载,他们从未吵过架。夫妻间的激烈争执往往在双方的唇枪舌剑中火上浇油,而通过“翻译”应用程序,这太难了。
“或许,长久婚姻的秘诀就是说不同的语言,”杜达打趣道。
他们表示,两人相遇时都已较为年长且有过离异经历,这反而有助于沟通。他们都经历过婚姻如何触礁,因此更懂得幸福婚姻的经营之道。同时,他们对肢体语言格外留意。梁红说,比起“翻译”应用程序,杜达的面部表情和动作更能让她读懂他的情绪。
“这些翻译应用程序在隐喻、幽默感、语气分寸、文化典故等诸多方面都表现得不尽如人意,”麻省理工学院全球语言项目主任、教授珀·乌尔劳布指出。但他也表示,对杜达和梁红而言,这类应用“是有意义且实用的”。
“技术让原本不可能的亲密关系成为可能,”他说。“从这个案例看,我觉得事实胜于雄辩。”
《真爱至上》……但现实中……
结婚三年,杜达与梁红各自掌握了对方语言中的约200个词汇。他们发现,技术为他们提供了一种更好的沟通方式。
结婚三年,杜达与梁红各自掌握了对方语言中的约200个词汇。他们发现,技术为他们提供了一种更好的沟通方式。
但凡看过《真爱至上》的人,大约都会为这类故事预设一个走向:那部浪漫喜剧里的男女主角产生了化学反应但存在语言障碍,于是双双埋头苦学,终至精通对方语言。
杜达也在尝试靠儿童绘本和多邻国之类的应用学习基础的汉语普通话。梁红从事按摩针灸工作,初到纽黑文时上过英语课,也用语言学习应用程序。但据他们估算,两人掌握对方语言的词汇量仅约200个。杜达说,自己这把年纪,怕是没法流利掌握一门新语言了。
杜达与梁红说,对彼此的热恋让这段关系得以维系。杜达也承认,待激情褪去,使用翻译软件的种种不便恐怕会令人抓狂。
梁红的双眼紧盯着手机,仔细读着杜达那句被译成中文的话。随即她抬起头,接过话头。
“其实这跟中国人说的差不多,”我的AirPods里传来了翻译后的声音。“我们说两个人在一起是因为彼此不了解。我们想要探索对方的秘密。”
她说,一旦真正读懂了他,或许便没那么多好奇了。她看着杜达低头凑近手机,等他读完那句译文才笑出声。

免费下载 纽约时报中文网
iOS 和 Android App

点击下载iOS App 点击下载Android App
© 2026 The New York Times Company.

中国国产新型无人机彩虹YH-1000S成功首飞

3 February 2026 at 12:37
彩虹YH-1000S星期天(2月1日)在重庆梁平首飞成功。 (央视新闻截图)

全球首款混合动力无人运输机在中国重庆市首飞。

据央视新闻报道,由中国航天科技集团十一院研制的彩虹YH-1000S星期天(2月1日)在重庆梁平首飞成功。

该机型是继2025年5月彩虹YH-1000无人运输机首飞成功之后,又一款面向全球市场客户需求快速迭代的新机型。

首飞挂载了与新能源汽车头部企业联合研发的大功率混合动力总成,大幅缩短了起降距离、提升了载重和航程,圆满完成空中飞行性能验证。

彩虹YH-1000S机型是中国航天科技集团十一院面向适航标准设计研制的大型无人运输机,可在国际物流运输投送、应急救援减灾、人工影响天气、海洋监测、海事监管等领域发挥重要承载作用。

中国巨头AI产品重演11年前红包大战 微信群掀再抢红包潮

2 February 2026 at 09:15
被外界认为在人工智能(AI)产品竞争中掉队的中国科技巨头腾讯和百度,率先发起春节红包大战,试图复制11年前微信支付凭借红包功能逆袭支付宝的流量争夺策略,微信群组再度掀起抢红包潮。 (互联网)

被外界认为在人工智能(AI)产品竞争中掉队的中国科技巨头腾讯和百度,率先发起春节红包大战,试图复制11年前微信支付凭借红包功能逆袭支付宝的流量争夺策略,微信群组再度掀起抢红包潮,舆论评价却两极。

综合《中国证券报》、《解放日报》和红星新闻报道,腾讯旗下AI应用“元宝”的春节10亿元(人民币,下同,1.83亿新元)红包活动在星期天(2月1日)开启。当天一早,“元宝派红包”链接就在各大微信群刷屏。在苹果应用商店免费应用排行榜上,元宝很快超过了字节跳动旗下竞品“豆包”,升至第一名。

据报道,用户下载元宝后需授权绑定微信,除了常规现金,元宝还设计了“分享红包”,支持用户转发到腾讯旗下通讯软件微信、QQ等,具有明显的流量争夺意味。

腾讯是在1月25日宣布此次元宝红包活动的。创始人马化腾对此寄予厚望,还在腾讯年会上放话,希望元宝能重现11年前微信红包的盛况。

2015年春节,腾讯通过微信“摇一摇”发放了5亿元红包。数据显示,除夕当晚2000万用户参与活动,收发红包总量超过10亿个,三个月内绑定2亿张银行卡,改变了阿里巴巴旗下支付宝在中国支付市场一家独大的格局。

百度的AI产品文心助手1月25日也宣布加入“红包大战”,用户在百度使用文心助手,就有机会瓜分5亿现金红包,活动从1月26日持续到3月12日。

当前,豆包是中国最火的AI应用,月活已达1.63亿,阿里巴巴旗下AI产品“千问”也实现了1亿月活,腾讯、百度则被外界认为在AI竞争中掉队。

《财经天下》报道,字节跳动旗下火山引擎不久前宣布成为央视春晚AI云独家合作伙伴,豆包也将作为春晚的核心AI互动平台,提供各种玩法。随着豆包“上春晚”,双方间的差距或许还将拉大。

上海市人工智能行业协会秘书长钟俊浩告诉《解放日报》,春节期间发红包推广,沿袭了移动互联网时代的增长模式,但AI应用依靠红包一次性引流并不够,通常需深度任务交互用户才能形成使用习惯,否则巨大的红包投入,可能只换来一批迅速消失的“僵尸用户”。

网易科技也刊文称,这场豪掷千金的战役正面临着“流量易得、留存难求”的巨大拷问:“这究竟是腾讯通往AI时代的入场券,还是会沦为下一个‘微视式’的短暂狂欢 ?”

微信是腾讯几年前在与抖音的短视频竞争中“撒钱”失败的案例。微视在2018年春节前后投入重金,邀请50多位明星通过视频拜年引流,并打通微信、QQ社交链,日活一度冲上4500万,但最终这些用户并未能留下来。

文章称,中国舆论对于元宝红包活动,已经逐步形成两极分化的评价。许多用户热情参与,通过分享链接、完成任务等方式获取现金奖励的同时,批评声音则认为,微信一向严厉打击诱导分享链接,但此次对元宝“网开一面”,“监守自盗”直接导致微信群环境恶化。

据报道,由于大量红包链接造成信息过载,元宝已经引发一些群主集体抵制,出现“发元宝链接即踢出群聊”的群规。

《中国证券报》则引述花旗最新研报报道,此次红包大战并非一次简单春节促销,更像是中国AI助手迈向全民级应用拐点的重要验证窗口。“这是第一次全国范围、真实用户密度的压力测试,能否在节后维持高日活、高使用频次,将成为区分工具型AI和平台级AI的分水岭。”

【开源】告别臃肿和散乱|日历支架设计方案

By: Steven
17 December 2025 at 19:05

这是一款为砖型日历设计的支架。

旨在用更小的体积和占地面积,完成摆放、收纳整理。

这是一个为我个人需求设计的模型,如果你有更好的想法,欢迎改良它!

🟢 模型及打印配置文件在这里:https://makerworld.com.cn/zh/models/1903991

🔵 设计讲解的视频看这里:https://www.bilibili.com/video/BV1XLqgBkESW/

另外再说一些没在视频里分享的技术细节吧,因为我觉得这些细节直接看图文会比视频更合适、更高效。

主体零件底座那一块的料厚我设置了 5 层,也就是 2 mm 厚;但上面围墙的部分,我只设置了 2 层墙。一方面是为了把重心下移,底部的密度要大于上半截;另一方面也通过更厚的墙减少了大量填充。

不同的墙厚 + 降低填充,让整体消耗量从 230+g 下降到 125g,也保证了强度和重心。

然后,我通过添加修改器,加强了后端凸出的结构特征的填充密度。

一者,强化受力部分的强度;二者,进一步把重心拉向下后侧。

但这里我特意把修改器往上挪了一点,避免出现从底部开始和主体部分墙分开的情况。从切片里可以看到,最底部的基层是一整块连在一起的完整结构,往上几层才开始有密度上的变化。

再有一处细节是,尾部的撑脚其实本来可以和主体做一体的,但我为了能在色彩上玩一些小心思,就拆了一件。拆出来的这一件和主体之间,是采用凸点和凹坑来过盈配合去固定的。

这一处的小心思在于,我没有用两侧对称的方式来做,而是左边的凸点全部朝右,右边的凸点全部朝左。这样装上去之后,两边会形成互相对抗的力,完全顶死没用松动,很牢固。

好吧!最后祝你打印愉快 😛

大师之钥补完计划 :||

By: Steven
6 November 2025 at 23:26

在 2.0 版本的基础上增加了剑尖的胶塞,形态上组成了一把完整的大师之剑。

当它没有作为鼓钥匙来使用的情况下,可以作为项链或者包包的挂饰来使用。

大师之钥 2.0 全新版本!

By: Steven
29 October 2025 at 12:19

很早就想改良了,但是一直懒得做结构。自从上次给小红书网友定制了小樱和皮卡丘的鼓钥匙,终于对改良大师之钥有了具体的思路。这两天趁着设计项目进度慢下来,就赶紧测试了三四个版本,终于确定下来了!

相比二月份做的版本,2.0 有更好的外观 + 更强的结构:

1、从一体打印改为分件设计;
2、提升关键结构的强度和耐久;
3、更接近原作的配色与质感;
4、可量产的打印配置;
5、可拓展/定制的设计架构。

我真是无所不能啊 :p hiahiahia~

相比初代,可以说是质的飞跃了!

当然,2.0 也可以有丝光版本。

在同一种材质下对比,就更能看出不同的工艺和拆件设计,对成品质量的影响有多大了。虽然会增加两条拆件线,但所有外观面的品质都提升了相当多。

通体丝光,咋一看是非常讨好眼球的,但就像美颜过度的照片,既会显得成品油,又会导致视觉失重没有焦点。剑柄没有抢宝石和剑身的戏,这个节奏更恰当一些。不过,具体的颜色和材料,未来还可以再继续试。

二月做初版的时候,还没尝试过什么其他材料,这种图新鲜和拿锤子找钉子的心情,和二十年前刚认识设计的时候很像:

堆料就是好!More is gooooood!

这个过程或许真的很难完全省略或者跳过,但可以随着自我成长,缩短每一次进入的时间和路程。

「不存在」的「写真」

By: Steven
7 September 2025 at 21:50

这组照片我发给太太看,问她「像不像我?」
她问「是你自己拍的吗?」

没有,没有一张是实拍的。
全部都是 AI 生成的。

我提供了五张照片给它,然后描述了一些简单的要求,他给我「拍摄」了这些照片。当然,抽卡还是要抽的。但是,主要集中在审美层面的选择上,或者是,有点儿不太像。最后选的这几张,儿子也觉得像,唯一的例外是觉得侧身背影的气质不像我。但哪里不像,他也说不清楚。

语言是关于思维的。写真是把真用光线记录下来,但这些图片都没有真实存在过,还算写真吗?照片是把影像照射在感光底片上的画面,印在纸片上,可没有存在过的光线和场景还算照片吗?这是文字游戏,也是思想实验。

眼见不为实的时代里,什么才是真实?

鼓钥匙:小樱魔杖

By: Steven
5 September 2025 at 18:19

之前给朋友做过一款赛尔达大师之剑的鼓钥匙,发出来以后陆续收到不少私信问能不能定制其他款式。

说实话,鼓钥匙这个形态它还是限制比较多的。因为要跟架子鼓本身的结构配合,所以很多造型没有办法做。

这一把小樱的钥匙,磨磨蹭蹭也做了将近三个月。当然,并不是说做这把钥匙需要花那么长时间,只是因为我是用身体状态正常的间隙时间,抽空一点一点弄的。当中也测试验证了很多轮不同的结构、拆件和打印方式,最终才找到了一个比较合适的方案。回头我再整理一下过程,发出来给大家看看。

我有 AMS 也不是说不能一体打印,但一体打印的话,由于打印本身的工艺限制,在 Z 轴的方向是比较脆弱的,所以在拧的时候稍不注意就会拧断。因此在设计结构的时候也尝试了蛮多种思路,最后这一版算是把结构强度跟外观质感平衡得还算满意的了。

这次尝试用 nano banana 做了两张效果图,就是粉红沙滩那两张。其实很简单,就是先拍摄实物的定妆照,再放进去修改背景和光线。效果确实相当好,省了不少事!

亲自抓个精力独角仙吧!

By: Steven
24 July 2025 at 17:42

为了给旷野之勇者套装升级,需要给大精灵忒拉提供 15 只精力独角仙,但这家伙神出鬼没,抓是不难,但遇到它可就太难了。

于是,我们决定自己做一只,放进游戏里,想抓就抓:

倒也不是什么新鲜事儿,但是吧,当 AI 参与进来之后,这个过程就大大缩短了。

从想法到落地,也就一天。

拆掉旧镜腿,换上新镜腿。

By: Steven
4 July 2025 at 10:55

原先那副眼镜腿前两天被我掰坏了,硬是晃晃荡荡地用了两三天。这两天一边工作一边做新眼镜腿,总算弄好了!

意外收获是,测试验证设计过程中发现,打印眼镜腿这种曲线长造型所形成的树形支撑特别好看:

在 iPad 上运行 macOS? (with Jump Desktop)

By: James Guo
25 October 2024 at 07:00

在读了 Will Apple EVER consider macOS for iPads? 后,我觉得我应该分享一下我在 iPad 上使用 macOS 的经验(kind of)。

这是因为我发现,在 iPad 上使用远程桌面应用(在我的情况下,是 Jump Desktop)并且在家里有一台 Mac mini,我就不再需要 MacBook Pro 了。让我解释一下:

我的 iPad 支持蜂窝网络。使用无限的 5G 蜂窝计划(每月 $11.5-16.5)。当我在家时,我使用 Mac mini 和 Studio Display。当我离开家时,我只带 iPad。如果我需要做一些 iPad 无法处理的事情,我可以直接 “Jump” 到家里的 Mac mini。

为什么这个组合比 MacBook 更好?

蜂窝网络

iPad 支持蜂窝网络,它始终保持联网。而 Mac 可能没有这种功能,尤其当我不在家时。

  1. 当我打开邮件/信息应用时,iPad 上的邮件已经全部下载完毕。然而在 Mac 上,我需要先连接到 iPhone 的热点或 Guest Wi-Fi,然后等待邮件下载。这可能需要 30 秒到几分钟。
  2. 我可以随时随地通过蜂窝网络将 iPad 备份到 iCloud。然而在 Mac 上,除非我带着 USB 硬盘或者连上家里的 Wi-Fi,否则我无法通过 Time Machine 备份 Mac。(不过,我仍然可以通过第三方应用将 Mac 备份到云端。)
  3. 我还可以通过蜂窝网络备份 Lightroom 照片。使用 USB 3,我可以将所有照片导入 iPad,然后通过 5G 上传到 Lightroom。然后我 Jump 到 Mac mini 上,这些照片已经在 Mac mini 的 Lightroom 中了。Jump 到 Mac 后,我可以做 AI 降噪等处理。完成 AI 去噪后,我可以返回 iPad 的 Lightroom 进行更多操作。
  4. 流媒体、应用体验等。有了蜂窝网络,这些事情都变得更加方便。

娱乐应用

  1. Netflix for iPad(或者其他许多流媒体应用)。在飞行前,我可以在 iPad 上下载一堆节目。Mac 上无法做到这一点。有些流媒体网站甚至无法在 Mac 上播放 4K HDR,但可以在 iPad 应用中做到(比如 Paramount,至少曾经是这样)。
  2. 在 iPad 的 OLED 显示屏上流媒体播放效果更好,而且更方便。它更小、更轻,我可以在观看节目时取下键盘。这比 Vision Pro 还要简单。
  3. 阅读书籍。用 iPad 读书比用 MacBook 更自然。

其他

  1. 触摸屏和 Apple Pencil。Mac 没有这些功能。而且,当我 Jump 到 macOS 时,我还可以使用触摸屏和 Pencil。
  2. 我家里的 Mac mini 连接了许多外设:两个 4TB 的 SSD 和超过 10TB 的硬盘。它还有千兆网速。当我 Jump 到我的 Mac 时,所有这些外设都可以访问。如果不使用远程桌面,我就必须带上这些外设,而这有丢失的风险,数据安全得不到保障。

它比 iPad + MacBook Pro 还好:

  1. iPad 比 MacBook Pro 更轻便。带着 iPad 和 MacBook Pro 一起旅行太重了。
  2. 在旅行中拥有更多设备也很难管理。比如还要给额外的设备充电,我得带更多的线,有时还会忘记给其中一个设备充电。此外,跨两个设备同步也很麻烦。

我使用的具体配置

我使用 Jump Desktop,因为它也支持流式传输扬声器和麦克风。如果你想通过流体协议传输音频,还需要安装 Jump Desktop Connect

SwitchResX

我使用 SwitchResX 来为我的 Mac 添加新的自定义 iPad 分辨率。当我的 iPad Jump 到我的 Mac 时,Mac 可以切换到 iPad 的分辨率以匹配 iPad 的屏幕。

首先,截取你 iPad 的屏幕截图。然后,打开照片应用,读取分辨率。我的 iPad 分辨率为 2420 × 1668:

iPad 截图详细信息

然后,水平方向减去 50 像素。在我的情况下,1668 - 50 = 1618,所以新的分辨率为 2420 × 1618。

在 SwitchResX 中,添加该新分辨率。记得选择缩放分辨率。

给 Mac 添加自定义分辨率

然后保存(Command + S),并重启。在 iPad 上,打开 Jump Desktop,使用这个配置:

Jump Desktop Host Machine 配置

为什么要减去 50 像素?

这是因为默认情况下,Jump 不会使用 Home 指示器区域。如果你想使用 Home 指示器区域,你可以在 iPad 上的 Jump Desktop 设置中启用“外观 - 使用 Home 指示器区域”,并且不用减去这 50 像素。

我发现我不想使用这个区域,因为我的 Mac 的 Dock 在底部。使用这个区域会影响我点击 Mac 的 Dock。

蒸馏认知

By: Steven
17 October 2024 at 09:50

有两种方式「通晓一切」:

1、穷具并知晓每一种可能性;
2、找到底层原理后高效推理。

定理:
1、海量数据和滔天算力是不持久的;
2、通用性和低能耗是持久的。

推论:
任何人工智能都需要蒸馏出「认知」才能活下去。

前提:
本地且联网的传感器

先答应

By: Steven
16 September 2024 at 23:58

最近有几件事,给我了一些触动。

因为确诊抑郁症后,我向公司请了长假来休息,所以忽然多了很多大片的空闲时间。可是吃药的感觉很不好,昏沉、嗜睡、动力低下且多屁。我觉得这不是适合我的方式。于是有了健身,有了我的理智告诉我:

先答应,强迫自己出去。

第一件事是汉洋跟我说他们计划九月初去一趟东北,给辽塔扫描建模,问我要不要一起。其实前几年他问过我好多次,每一次我都因为忙于工作,婉拒了,有时呢,是因为懒得动,也婉拒了。这次我心中有个声音:你先答应,然后就不得不去了。我就这么把自己推了出去,跟汉洋、Tim、夫聪去辽西走了一趟。

一上车,汉洋就问我,为什么这次有空来了?我说,重度抑郁症休病假了。他和 Tim 很自然地说,哦,这个咱们身边搞创作的朋友很多,然后就开始直奔沈阳。汉洋还给我拿着一台他刚从日本淘回来的 Mamiya 645 1000s,这是我第一次正经使用一台胶片相机,并且是一台 120 画幅的腰平取景器的机械单反。

这台相机在这一趟,教会我一些事。回头我再把整理好的照片陆陆续续发出来,有些照片我还是很喜欢的。这一趟时间虽然不长,但它不仅让我这个广东仔第一次对东北有了清晰的体会,也触动了我心中的一些东西。

出发前,脑放电波的 Nixon 问我要不要在苹果发布会之前合作一期节目。我下意识地想婉拒,但另一个声音说:

先答应,又不用你操心,你说就好,答应了再说。

这样,我又一次把自己推向了「不得不做」的位置上。

那一期节目似乎很不错,反响挺好。甚至一些路人都留言表示很喜欢这一期,说很有收获和启发。这对我是一种鼓舞。

在东北的路上,我们在车里聊起理想 mega、小米 SU7 的设计,汉洋说我们回去之后录一期节目吧。我其实不太想,毕竟工业设计这个母题太大了,轮不到我这个在设计领域里并无建树的人来说。但是,可以先答应吧,万一能聊出什么来呢?后来回到深圳,汉洋跟轶轩一起,我们仨在汉洋的酒店房间里聊了两个小时,在轶轩那些简单、外行、尖锐的问题的触动下,我觉得那一期节目剪出来之后应该不会太差。虽然可能只是很基础的科普,但大体上应该值得一听。

结束后我问轶轩,这样聊下来,你现在知道工业设计是做什么的了么?他说,虽然不能简单地描述出来,但确实理解了。

这又是一次把自己推出去,但不差的体验。尽管那天我们被突如其来的大雨浇透了,但也因此在轶轩家里打了几把《黑神话·悟空》,能算是好事吧。而且,就在临出门吃晚饭前,辽塔之行的大部分胶片都扫出来了,全部看下来,有几张还是不错的。他俩纷纷表示,作为第一次用胶片,算是很成功了。

也许有鼓励的成份,但有几张我很喜欢,回头要找 Tim 用飞思精扫再制作出来。

和创作有关的事情,我都不觉得累。

最后一天我在 Tim 的工作室里问他:经常接触不一样的项目,你会觉得疲惫吗?他的回答是,如果经常做一样的事,我就会觉得非常疲惫。

我也一样。

那天还偶遇了梁源,他们在楼下录了一下午节目,聊黑悟空里的佛教文化和文物。我旁听了几小段,挺有意思的。节目这两天也陆续上线了,虽然我说很感兴趣,但也确实提不起劲儿去点开它们,只能先 Mark 在列表里。

去找 Tim 的前一天,跟汉洋去了他们现在的工作室。养伤的 JT 在做日常的康复力量训练,看上去也很迷茫。晚上跟重轻一起吃饭,他看着也挺疲惫,疲于应付白天无聊活动的倦怠。我似乎向来都很喜欢这般真性情的人,嬉笑怒骂都可以自然流露。依稀记得也曾有人这样评价我,但又似乎是很遥远的故事碎片。

今天早上突然想看看苹果新品,手欠翻了翻图纸,看着看着就似乎琢磨出一些线索……截图往群里一放,两颗皮蛋就来问我要不要一起做一期节目。

好吧,虽然我原本可能想搞一期《设以观复》的,但我可能做不动了,如果有他们一起搞的话,是不是我自己的节目真的无所谓,但起码算是对一直关注我的人们有一个交待吧。他俩八月份就问过我和 Toby 要不要在发布会后一起录一期播客,没曾想居然还凭空出来期视频。

且不管能出来什么,先答应吧。

答应了就得不得不面对,不能偷懒。

我是病了,但不是傻了,如果说这段时间我发现了什么之前没注意到的事情的话,那就是「先答应」吧。

我过去很紧张,要有安排,要有预期,要有 planB 和后手,但渐渐发现有这些也不怎么管用,突发状况永远层出不穷,它们总能在预想之外的地方出现。先答应,硬着头皮上,反而似乎并没有我以为的那么多阻力。

例如这两天跟着筱烨去了音乐教室,学了十分钟,阿吉就让我弹贝斯,和小柒筱烨合了一首曲子,最简单几个位置就能出来很棒的旋律。今晚的中秋活动,虽然我们都不太想参加,不想去人多的地方,但为了给阿吉捧场,还是一家人都去了。躲在人群里的感觉并不放松也不自在,但音乐本身能令我感到舒服。

如果把抑郁症看作是太上老君的炼丹炉,似乎可行。

升级版的「用户路径」

播客的收听数据似乎很符合我的期待

By: Steven
7 June 2024 at 00:30

其实有点出乎我意料,除了 Apple Vision Pro 那期,最受欢迎的居然是聊《九龙城寨》和《暗恋桃花源》的这两期。而且,刚发的《谈判专家》这期的收听量也在稳定上涨。聊 AI 那期尽管内容很多,但收听量比这些都少得多。

从博客后台数据能看到,最近一周的主要收听量中,三分之二都来自这三期聊戏聊剧的节目。

我原本以为,收听我节目的主要人群,是过去在知乎和 B站看我讲设计的读者和观众。

这么看下来,我有一个猜测:收听我播客的人群当中,有很大一部分比例,可能是此前并不认识我的路人,他们对科技类话题的兴趣,没有对娱乐类型的话题高。

挺好的,这也挺符合我最初对播客的预期,这样我就可以不用老聊设计和产品了!

荒野楼阁 WildloG:https://suithink.me/zlink/podcast/

小宇宙: https://suithink.podcast.xyz

Spotify:荒野楼阁 WildloG

YouTube:荒野楼阁 WildloG

Apple Podcast 在中国大陆地区目前只支持通过 URL 订阅:

https://suithink.me/category/podcast/feed/

科技是由人文驱动的:体验后再谈 Apple 空间计算机_1.ylog

By: Steven
1 May 2024 at 20:03

前几天我去找一位科技媒体的朋友,体验了一晚上 Apple Vision Pro(苹果新推出的空间计算机),我将那晚体验的感受以及我们讨论的内容,整理出了这一期节目。本期节目为单人讲述。如果你遇到网络环境波动问题,加入列表缓存后,即可正常收听。

在这一期,你会听到:

—- 交互设计很优秀,但为什么说它不完整且反直觉?

—- 你的眼睛是你的注意力,你的手是你的行动,日常生活中我们这两个部份是分工协作,分头行动的,但在 Apple Vision Pro 的交互体验中,这俩完全没法分开;

—- 空间沉浸感一流,彩透效果超群,但多任务体验并不好;

—- 这种立体感,和在电影院里看 3D 电影是很不同的。Apple Vision Pro 这个恐龙的应用所展示出来的,是一种大脑完全相信的,是一个空间,而不是把前后景处理得很好的分层的画面;

—- 眼动追踪像魔法,但也很脆弱:

—- 当我刚设置完的时候,他非常的准,极其的精准,真的就是魔法一样,指哪打哪,很爽,但是在我用了一段时间以后,他会稍微有一些偏移,就对不准了;

—- 眼动追踪矫正流程中的色彩细节,为什么?

—- 最喜欢的两个应用:看星星,火星车;

—- 这就好比你画画的时候,需要用笔,但你一旦需要在三维的空间里去做雕塑,你需要的是雕刻刀和铲子;

—- 太顺理成章的工业设计:苹果的行活儿;

—- 缺少思考后的冲突感,仿佛设计部门和工程部门都没有怎么吵过架就落地了;

—- 预言:什么时候能普及?

—- 普及的好产品 = 渣男喜欢的类型

—- 强制性 vs 超越感官

—- 不要抽象地谈论科技:科技是由人文驱动的

|登场人物|

苏志斌:工业设计师,车联网智能硬件产品经理/联创,《设以观复》作者

|相关链接|

若你所使用的播客客户端未能完整显示插图,或遇网络问题未能正常播放,请访问:

荒野楼阁 WildloG 的地址:https://suithink.me/zlink/podcast/

阅读设计相关的各类文章:https://suithink.me/zlink/idea/

|其他社交网络媒体|

苏志斌 @ 知乎|SUiTHiNK @ 即刻 / 微博

苏志斌SUiTHiNK @ Bilibili / YouTube / 小红书

|联络邮箱|

suithink.su@gmail.com

欢迎在 小宇宙、Spotify、YouTube、Apple Podcast 收听本节目,期待你的留言。

💾

让 MJ 学我画两张小画儿

By: Steven
7 April 2024 at 12:58

昨晚吃饭前跟儿子一起画画,我随便画了一下我们在 Minecarft 里的第二个家,和随便画的一个岩浆包围的高堡:

后来想说看看 Midjourney 能模仿成怎么程度,就丢进去试了一下:

emmm,画得还行……

就是画风不太相关,它有它的训练痕迹,哈哈哈哈哈哈哈~

测试所使用的 prompt:

Tree house, jungle, rainforest, simple little house –sref+空格+两张手绘图的地址 –ar 9:16 –s 50 –v 6.0 –style raw

苹果停车转 AI 将引发人才大震荡

By: Steven
28 February 2024 at 20:16

1、没有 AI 的汽车、手机、电脑、平板等,将是一堆废铁;

2、一家公司的核心战略不能同时放在两个大方向上。

综上,停下造车全攻 AI 是非常明智的。

连键盘侠都知道「不难」的造车,没造出来不是造不出来,是制定的目标太远太高。苹果之前想一步到位搞出 L4 的移动座舱,但现阶段的人类还没有办法,这太难了。在他们之前的设想中,自动驾驶的汽车和 Apple Vision Pro 是可以放在同一个场景里的。但很显然,这个步子太大了。用新势力们的方式当然可以,但那不是苹果想做的。

最关键的是,AI 的大爆发是此前大家都没料到的。没有这事儿,车还是一个重要的方向,但这一波爆发的 AI 不是资本热潮,而是实打实的浪潮了,此时不全力转向,是真的会死的。况且苹果并不是没有在 AI 上投入的,这些年一直都在积累,只是权重还没拉到那么高。现在切方向,即是大势所趋的必须,也是归拢资源的必要。

过去 Jony 可以对供应商说,这里有一桶取不完的钱,你能做到你就能拿走,以此把工业设计拉高到一个令人望尘莫及的程度;今天的苹果比二十年前拥有更多的现金,有自己的芯片和庞大的人才库,有海量的设备和训练数据,可以说:

比起造车,AI 才是更适合苹果干的事;

干好 AI 所需的人才、数据、算力,也是他们的优势。

以苹果的财力,下这样的决心,恐怕要出现一次人才流动的大震荡。

原文发布于知乎提问:

苹果取消探索十年之久的电动汽车项目,将团队转向生成式 AI,原因有哪些?会带来哪些影响?

Vision Pro 首发体验

By: James Guo
5 February 2024 at 03:00

美东时间 2.2 日早上 8:00 自提的设备,本人不佩戴眼镜,因此已经使用了完整两天,这里更新下自己的一些发现。

配置选择

我选择的是 512GB 的版本,主要考虑是 Vision Pro 上的一些软件/游戏可能会有更多的 3D 场景,会更消耗存储空间。但大多数时候又是在 Wi-Fi 环境下使用,所以 1TB 版本又没有那么有必要。

UI 显示效果

本人之前没有使用过其他 VR/AR 类产品(排除 Google Cardboard😂),所以并没有感觉到 Vision Pro 有多么的好。相反,我的感觉是 Vision Pro 的显示效果其实完全无法代替 Studio Display。与其它类型的显示器相比,它有这些特点

清晰度:5K 显示器有着明显锐利的多的画面,并且能肉眼感觉到显示器的色彩空间也更好。目前看来 Vision Pro 的显示清晰度大约相当于 2.5K 的水平,显示效果:高端显示器 >> Vision Pro > 高端投影。仔细观察,我是可以看到 Vision Pro 中的像素的。我的视力也并非完美水平,处于轻微近视,在不配矫正镜片的时候依然能察觉到像素。

**HDR 效果:**得益于 micro-LED,HDR 效果还是相对突出的,好于显示器和投影,但高光的亮度又比不过 iPhone 的 OLED 或者是 MacBook Pro 的 miniLED。

**自适应的渲染:**之前的清晰度是我将窗口调整到我平时操作显示器的大小时进行的比较。但 Vision Pro 的窗口是可以调节的,包括远近和大小。此外,眼镜在物理世界里的位移也会影响到显示:当你贴近时,可以看到更清晰的画面。如果说视网膜屏幕是 @2x-@3x,那么 Vision Pro 则是 @1x-@9x(9x是打个比方)。Vision Pro 中的所有系统UI(包括网页上的SVG/文字)都是矢量渲染的,不需要 Zoom In,只需要人走进显示区域,就会发现每一个小字/矢量图都会变的无限清晰。

**亮度:**感觉达不到 500nits,如果在白天摘下眼镜,会明显感觉到真实世界更亮。但这一点不是特别影响体验。

透视效果

透视的清晰度则是远差于 UI 显示的清晰度,摄像头的分辨率其实不高,看真实世界完全到不了 4K 水平。但可以感觉到其曝光控制非常优秀,画面里没有过曝或者欠曝,是可以戴着它生活的(如吃饭)。但无法使用它阅读小一点的文字(过于模糊,无法阅读;比如食品配料表或者手机上的小字都是看不清的)

透视效果属于能用的水平,在家里时我佩戴并四处走动是没有任何问题的。

舒适度和重量

一开始使用 Solo Band 的时候用久了还是挺不舒服的,但我现在换用 Dual Loop 并仔细调整后,发现比刚开始戴的时候舒服了非常多,感觉用个一两小时是没问题的。Dual Loop 有两个地方可以调整,建议多试,太紧或者太松都会导致不舒服。躺着用反而不舒服,比较压脸颊。重量肯定是能感知到的,希望有一天可以做到跟眼镜一样轻。

操控

操控总体而言比较方便,如果Mac的触摸板操控是 10/10 分,iPad 算 9/10 分的话,Vision Pro 现阶段已经能达到 8.5/10 分(除打字外)。滚动非常跟手,滚动是有高刷的感觉的,明显好于 60Hz。但有时候手放在了摄像头看不见的位置(比如桌子下面),这种神奇的体验就没了,然后就会想起:啊,原来是摄像头捕捉的我的手势。

除了捏合 🤌 控制,直接点击按钮也是可以交互的,把窗口“拉近”,然后像iPad那样拿食指直接点空中屏幕就可以操作,对电脑版网站按钮很小的还是很有用的。YouTube 网页版就属于适配的不那么好的网站之一,有一些按钮之间离得近,用点击的方式会更方便。

对于 iPad compatible 应用,操控体验也还不错。非常多软件(包括苹果曾经宣传过支持 Vision Pro 的 Apps),其实都只是 iPad compatible 版。试了 iPad 版的:Lightroom 、Paramount+、Maps 等,会发现 iPad 版的 App 体验已经惊人的好了。最大问题还是 Typing 体验差。细想起来,苹果在 iPad 上加的前台调度、鼠标指针、Apple Pencil 的 Hover 功能,都跟 Vision Pro 的交互惊人的相似,所以支持了以上功能的 iPad Apps 在 Vision Pro 上体验很好。

打字的话现在我最喜欢的方式是用双手食指点键盘。现在已经逐渐习惯了,但还是差于iPhone的小屏幕键盘。蓝牙键盘还有待尝试。

用久了 Vision Pro 后,每当我在现实世界里看到个屏幕觉得离我远/位置不对,就想要 🤌 把它调整下,但却发现不行 😂。感觉这会是未来人下意识的一种手势,类似刘慈欣三体里描述的情形。

软件体验

软件我感觉只做到了苹果的后期 Beta 水平,还算不上正式版。首先就是目前只能输入英文,其他任何语言的输入(比如中文)都不支持,包括键盘和 Siri 语音。其次就是我发现 visionOS 1.0.2 并不支持 iOS 17.2 推出的 iMessage 信息联系人密钥验证。这点其实 Xcode 也已经暗示了:如果在 Xcode 15.2 中将软件的 Minimum Deployment 设置为 17.2,那软件将无法在 visionOS 1.0.2 中运行。因此得出结论:visionOS 1.0.2 = iOS 7.1。这点就可以看出 Apple 发布 Vision Pro 还是很急的,或许是苹果觉得 visionOS 1.1 的 Bug 太多了,所以苹果就没有发布,导致了现在功能不匹配。顺便一提:iOS 17.1 发布时间是 2023 年 10 月 25 日,iOS 17.2 发布时间是 2023 年 12 月 11 日。

IMG_0002 2.jpeg

外接 USB 设备

没有任何外接 USB 的能力,这点比 iPhone 和 iPad 都差。因此 Vision Pro 也不支持 YubiKey 5C NFC,因为既没有 USB 口,也没有 NFC。如果你想登录一个网站但你只配置了 YubiKey,那抱歉,登录不了。当然 Passkey 是支持的。

Mac 扩展屏幕

很多人对扩展 Mac 屏幕很感兴趣。个人觉得扩展屏幕体验还是远差于真正的显示器的。同样价格可以买到比 Vision Pro 显示效果好得多的显示器。但如果你主打的是便携,比如希望在飞机上、酒店里也有显示器,或者希望隐私,比如不想让其他人看到你的屏幕,那它还有点用。

个人感觉 Vision Pro 显示效果是略差于中端 4K 显示器($1000 美元左右)的。延迟也还是有的,具体体验可以参考 iPad 作为扩展屏的延迟。我个人不会拿 Vision Pro 主要作这个用途。

Persona (Beta)

属于能用,但只还原了人脸的 90-95%。已经有点恐怖谷效应了。有总是比没有强的,我觉得我使用它参加视频会议不会特别尴尬。

坐车体验

坐车使用完全不可行,哪怕启用了 Travel Mode,至少小汽车是不行的。首先Vision Pro会错误定位,因为窗户的存在,有时会认为你在快速移动,有时则定位失败。但这个其实好说,属于软件问题,但下一个问题就是物理问题了:就是因为它比较重,在有颠簸车上受加速度影响脸部会异常难受。因此起飞/降落/Taxiing/气流颠簸时都不建议用,小心脸疼。

因此坐车时还是 iPhone/iPad 体验更好。我以后不会在坐车时使用 Vision Pro。

其他缺点

EyeSight 非常鸡肋,亮度很低并且分辨率也很低。iFixit 的拆解也得出了原因,是为了还原眼镜的 3D 效果不得不做出的妥协。眼睛的还原必须是立体的,不然外人将无法知道你在看谁。

总结

我认为 Vision Pro 已经接近成熟了,软件上已经达到了最后一个 Beta 版本的可用性。软件上相对欠缺,但我觉得未来几个月内会迅速弥补上。

毫米波 5G 有多快? 2000Mbps! 快来看看你的 iPhone 是否支持毫米波

By: James Guo
20 February 2022 at 23:59

本文对比了中频 5G 和毫米波 5G 的速度差异,提供了判断 iPhone 是否使用毫米波的方法,讲述了 5G 不同图标的含义,对比了 5G 的低频、中频和毫米波,并列举了 iPhone/iPad 不同型号对毫米波支持的情况。

最近分别使用手头上的国行和美版 iPhone 对比了一下中频和毫米波 5G。都是相同运营商 (Verizon Prepaid) 的相同套餐 (Unlimited Plus),使用实体 SIM 卡,在完全相同的地理位置进行的测试。

毫米波 5G (28 GHz)

可以看到,毫米波 5G (高频,mmWave) 轻松跑到了 2000Mbps。

最高也可以跑到 4000Mbps

如上图所示,也有人在 Reddit 上跑出了接近理论峰值的 4000Mbps。但我试了多次最高 “也就” 2000Mbps。

中频 5G (3.7 GHz)

中频 5G (Mid-Band) “只” 跑到了 929Mbps。

就本次测试看来,毫米波 5G 要比中频 5G 快 2 倍左右。在各自的理想情况下,毫米波 5G 可以比中频 5G 快 2-3 倍。

如何判断 iPhone 是否使用毫米波?

在系统的通话页面输入 *3001#12345#*,然后点击呼叫。随后我们就可以看到下方视频所示的 Field Test Mode。选择 5G 中的 Nr ConnectionStats。若看不到 5G 相关选项,则说明当前没有 5G 信号,或机型/运营商不支持 5G。然后看 Band 中的数字。该视频中 band 数字为 78,为中频 5G。

查询当前使用的 5G 频段

若数字小于 200 (如上图),则说明没有使用毫米波。若显示大于 200 (常见的有 257-262),则说明已经连接到了毫米波 5G。具体使用的频率可以参考这个表格

并非所有支持 5G 的 iPhone 都支持毫米波 5G。目前只有在美国购买的 iPhone 12、13、14 系列在美国才能使用毫米波 5G 网络。

5G 图标

根据苹果官网,5G 是有多种图标的。如果只显示 5G,则是连接到了最普通的 5G,速度比较慢。若看到了 5G+、5G UW 和 5G UC,则说明可能连接到了毫米波 5G,速度更快。但实际上,显示 5G+、5G UW 和 5G UC 并不代表使用了毫米波 5G (也可能只是中频 5G)。此外,在美国之外的其他国家即使连接到了中频 5G,也只显示 5G。

5G 图标一览

5G 常见的三种频段:低频、中频、毫米波

低频的范围在 1 GHz 以内,中频在 1-6 GHz,毫米波则在 24-40 GHz。

低频 5G,也叫 5G Nationwide (Verizon)、Extended Range 5G (T-Mobile)、5G (AT&T)。是覆盖最广的 5G,但速度也不是很理想,有的时候甚至不如 4G/LTE 的速度。目前现有的很多 4G 基站都可以比较轻松的升级为低频 5G。在我看来只是准 5G 网络。

中频和毫米波 5G,也叫 5G Ultra Wideband (Verizon)、Ultra Capacity 5G (T-Mobile)、5G+ (AT&T)。是真正意义上的 5G 网络。

目前在中国,所有运营商的 5G 均使用中频。相比毫米波,中频在相同的基站数量情况下,覆盖的更广。这是因为中频的波长更长,传播时相比毫米波更不容易被障碍物遮挡。

LTE-Advance,也叫 5G Evolution (AT&T)。是指使用了载波聚合、4x4 MIMO 和 256 QAM 等技术的 4G 网络。这种网络根本不是 5G 网络,只是比较快的 4G 网络。

iPhone 不同型号支持的 5G 一览

苹果官网搜索你的手机型号(如 A2629、A2634、A2639、A2644 则为中国大陆及港澳地区的 iPhone 13 系列的型号),然后查看是否支持 n257-262 中的任何一个频段。截止到目前,只有在美国销售的 iPhone 12/13/14 支持了毫米波。你可以在机身背面看到型号。目前支持毫米波的型号有:

  • A2650: iPhone 14 Pro
  • A2651: iPhone 14 Pro Max
  • A2649: iPhone 14
  • A2632: iPhone 14 Plus
  • A2483: iPhone 13 Pro
  • A2484: iPhone 13 Pro Max
  • A2482: iPhone 13
  • A2481: iPhone 13 mini
  • A2341: iPhone 12 Pro
  • A2342: iPhone 12 Pro Max
  • A2172: iPhone 12
  • A2176: iPhone 12 mini

还有一个更简单的方法:看 iPhone 右侧是否有毫米波天线的开口(图源 Apple)

支持毫米波的 iPhone 的毫米波天线位置不支持毫米波的 iPhone 则没有毫米波天线

这个毫米波天线开口很像 iPad 系列 Apple Pencil 的无线充电开口,但他们确实不是一个东西,不要混淆。

其次,如果你手持 iPhone 14,判断方法更为简单,只要没有实体 SIM 卡槽,就是支持毫米波的美版。

iPad 不同型号支持的 5G 一览

同样的,你可以在苹果官网搜索你的 iPad 型号。你可以在机身背面看到型号。目前支持毫米波的型号有:

  • A2379: 12.9 英寸 iPad Pro (第五代)
  • A2301: 11 英寸 iPad Pro (第三代)

Mac mini 有什么用?组建家庭服务器!

By: James Guo
27 November 2021 at 22:00

最近我从闲鱼上购入了一个二手 Mac mini,2020 年 M1 版。我选择的是配有 8GB 内存和 256GB 存储空间的最低配置,当时大约花了 CN¥3,600 左右。目前已经使用有一个月左右,用它组建了旁路由、远程时间机器(Time Machine)备份、SMB 文件共享、远程桌面连接、内网穿透等功能,可以说是物超所值了。

谈谈 2020 M1 Mac mini 的配置

Mac mini 是苹果的小主机,类似 Intel® NUC 这种迷你 PC。它不配备键盘、鼠标、显示器,因此相比 iMac 也更加实惠。

这一代 Mac mini 是首款搭载 Apple Silicon 的 Mac mini,基于 ARM 架构的它拥有更优秀的能耗比以及更好的性能。它的 Geekbench 4 跑分为 7422,高于基于 Intel 芯片的最高配 Mac mini 的 5488 分。不过,受 M1 芯片限制,它只有两个雷电 3 接口,而不是 4 个,而且它只支持连接最多两个显示器。不过,相比搭载 M1 芯片的 MacBook Air 和 MacBook Pro,它的接口要更丰富——它额外有一个 HDMI 2.0、千兆网口(可升级到 10Gb 网口)和两个 USB-A 接口。

个人认为 Mac mini 的定位大于等于 MacBook Air,小于等于 iMac、MacBook Pro 系列。所以在未来,苹果也有可能推出搭载 M1 Pro/M1 Max 芯片的 Mac mini。

作为服务器需要修改的一些设置

自动登录

自动登录是非常重要的一个功能。启用自动登录可以实现在更新 macOS、重启电脑后,不需要输入密码即可自动登录到用户界面,并启动相关的服务。可以说是将 Mac mini 作为服务器,尤其是远程服务器所必须要打开的一个功能。具体的操作方式请参考这个文档。需要停用文件保险箱才可以启用这个功能。

配置防火墙和路由器

macOS 的共享功能会监听所有的网络接口。如果你的运营商提供了公网 IPv4,则可以通过端口转发或者 DMZ 主机的方式将 SMB 暴露在公网即可。如果需要 IPv6 访问,则需要关闭光猫以及路由器上的防火墙,允许外部传入的 IPv6 连接。

远程登录和远程管理

开启远程登录和远程管理不仅可以方便的远程管理 Mac mini,还可以直接使用 macOS 环境去执行应用程序。开启远程登录后可以使用 SSH 连接。开启远程管理后可以进行远程屏幕连接。

远程登录配置截图

在 macOS/iOS 上,我使用 Screens 去远程连接 Mac mini。如果你在 iPad 上使用,我推荐安装 SwitchResX 来自定义屏幕分辨率,实现完美适配 iPad 的效果。需要注意的是,iPad 底部可能会留有部分安全距离,这在设置分辨率时需要减去。在我的 11-inch iPad Pro 上,底部有 40 像素的安全距离。除了分辨率之外,我还将刷新率降低到了 30Hz,以减少网络传输上的压力。

远程屏幕连接完美适配 iPad

需要注意的是,开启远程登录和远程管理前,一定要为你的 Mac 设置强密码,否则极有可能密码被暴力破解。

通过远程连接,甚至可以在 iPad 上使用 Final Cut Pro。经过本人实际体验,在同城市通过互联网连接操控时,感觉不到明显卡顿,完全可用。需要注意的是,使用 Final Cut Pro 时屏幕宽度必须大于 1280px(HiDPI 时为 2560 个像素点)。可以使用 SwitchResX 根据应用程序自动切换分辨率。下面这张截图是在 11-inch iPad Pro 上缩放显示的,因此有些许模糊。

在 iPad 上使用 Final Cut Pro(通过远程连接)

Mac mini 作为 NAS 使用

macOS 的文件共享功能可以直接将 Mac mini 变成一个 NAS。只需要打开系统偏好设置——共享,然后启用 “文件共享”,就可以实现 NAS 了。Mac 使用的是 SMB 协议。建议使用有线网络以确保稳定性。

启用 “文件共享”

注意,你可能需要进入高级选项,然后启用 “Windows 文件共享”,才能在某些客户端上连接 SMB。

启用 “Windows 文件共享”

如果你想允许访客访问,你不仅需要在用户里添加 “任何人”,还需要在高级选项里打开 “允许客人用户”。此外,还需要在系统偏好设置——用户与群组——客人用户中启用 “允许客人用户连接到共享文件夹”。这时候,可以以用户名 “Guest”,密码空的方式连接 SMB。

高级选项打开 “允许客人用户”启用 “允许客人用户连接到共享文件夹”

共享外部硬盘

Mac mini 的雷电 3 和 USB Type-A 接口很适合用于连接外部硬盘,连接的外部硬盘也可以通过文件共享去分享,只需要在添加外部硬盘到 “共享文件夹” 中即可。

组建 RAID 和 Fusion Drive

我为我的外部硬盘配置了 RAID 和 Fusion Drive。我使用了 4 个 3TB 3.5 英寸 HDD 和一个 1TB SSD。其中 4 个 HDD 是通过四盘位硬盘盒的方式使用 USB Type-A 口连接到 Mac mini,SSD 使用雷电 3/USB 4 硬盘盒连接到 Mac mini。我在硬盘盒上做了 RAID5,将 4 个 3TB HDD 变成了 9TB 的存储空间。然后在此之上又使用 Fusion Drive 将其与 SSD 融合,最终达到了 10TB 的容量。Fusion Drive 配置方法我参考的是这篇文章

我选择使用 APFS 作为文件系统。主要是因为新版本 macOS 已经不支持新建 HFS+ 加密分区,而且由于有 SSD 的加持,并不是很担心性能下降。

作为时间机器(Time Machine)备份目的位置

同样是在高级选项中,打开 “共享为时间机器备份目的位置” 即可。在需要进行备份的 Mac 上,使用访达(Finder)菜单栏中的前往——连接服务器(⌘K)连接到这台 Mac,然后就可以在系统偏好设置中的 “时间机器” 里找到通过文件共享的文件夹了。

连接服务器

我目前是通过 Internet 的方式连接到 Mac mini 实现异地备份的,首次备份花了大约 6 小时,之后每次备份都能在半小时内完成。我还添加了一个通过 USB 连接的 HDD,系统会使用两个磁盘轮流备份,成功实现了一个异地备份、三个存储介质和三份拷贝,符合备份 3-2-1 原则

时间机器设置

对 NAS 上的数据进行备份

为了更好的安全性,还可以对 NAS 上的数据进行备份。我选择使用 Mac mini 上安装的 Carbon Copy Cloner,将 NAS 上部分重要数据再次备份到本地局域网的 AirPort Time Capsule 上。我选择备份到 APFS 文件系统的 Sparse Bundle 上以实现快照和加密。

Carbon Copy Cloner 的配置

同步照片——Lightroom Classic CC

由于有了这个 10TB 的 NAS,我果断将我的 Adobe 订阅从 Lightroom (1TB) 换到了 Photography (20GB)。Photography (20GB) 相比 Lightroom (1TB) 多了 Photoshop CC 和 Lightroom Classic CC。其中 Lightroom Classic CC 使用的是本地的照片库,同时还可以与 Lightroom CC 进行同步。我在 Mac mini 上安装了 Lightroom Classic CC,并打开了同步功能,将之前所有的 Lightroom CC 图片均存储在了本地,然后在 Lightroom Classic CC 上对这些图片取消同步。很快,我的云空间就全部释放了。然后,我再将这些照片重新添加到同步文件夹中。此时,Lightroom Classic CC 只会上传这些照片的智能预览(就是相对低分辨率的 RAW 格式),这些照片不占用云端存储空间。以后,当 Lightroom CC 的空间再次不足时,我依然可以使用这个方法释放 Lightroom CC 的空间。

不占用云空间的同步

现在,我可以在我的任何安装了 Lightroom CC 的设备上对照片进行编辑。不过,如果需要导出原图,则仍需要在 Mac mini 上的 Lightroom Classic CC 操作。为了能够在其他桌面设备上导出原图,我需要在其他设备上拥有——1. 原图文件、2. 资料库。我选择使用 ChronoSync Express 对原图文件进行双向定时同步,使用 iCloud 云盘同步资料库(包括标准预览、1:1预览、智能预览)。经过我实际测试,发现 iCloud 是支持增量同步的,即每次修改资料库后只会同步资料库文件中改动的文件块。

需要注意的是,Lightroom Catalog* 文件必须在同一个目录下。如有必要,可以使用软链接的方式实现在不同位置存储它们的原始文件。我一般会将原始文件存储在外置硬盘中,这样可以节省本机空间。当外置硬盘不可用时,依然可以使用智能预览进行编辑。

旁路由

我使用 Surge 这个软件的 DHCP 服务器实现旁路由。Surge 可以接管局域网设备上的请求,对其重写、抓包、解密、代理等,十分方便。需要关闭路由器/光猫上的 DHCP 服务器。

Surge 的 DHCP

打开 Surge 的增强模式,然后在 DHCP 页面中右键选择设备,然后开启 “使用 Surge 作为网关”。将那台设备重新连接到网络,其流量就会被 Surge 接管。

内网穿透

同样是使用 Surge,在其配置文件中加入如下内容:

1
2
3
4
5
6
[Snell Server]
interface = ::
port = 6160
psk = SOME_RANDOM_PASSWORD
obfs = off
ipv6=true

然后,在其他设备上的 Surge 加入如下代理配置:

1
2
3
4
5
[Proxy]
Mac mini = snell, mac-mini.sgddns, 6160, psk=SOME_RANDOM_PASSWORD, udp-relay=true, tfo=true

[Rule]
IP-CIDR, 192.168.1.0/24, Mac mini

需要更改 SOME_RANDOM_PASSWORD 为一段随机字符串,更改 192.168.1.0/24 为你的内网 IP 段。现在,就可以实现内网穿透了。

下载器——qBittorrent

我推荐使用 qBittorrent 作为下载器。其内置的 Web UI 可以方便的在其他设备上控制 qBittorrent.

配置 qBittorrent 的 Web UI在其他设备上通过 Web UI 控制 qBittorrent

Mac mini 的替代品

有些人可能觉得使用树莓派就行了。实际上,树莓派确实可以实现大多数功能,但是它却没有 macOS 环境,无法安装 Lightroom Classic CC、Final Cut Pro 等软件。

当然也可以使用 Intel® NUC 等 Windows 主机来代替 Mac mini,可以实现类似的效果。

❌
❌