Normal view

There are new articles available, click to refresh the page.
Before yesterdayMain stream

他们把宇树的网红机器狗「剥皮拆骨」,发现了它倒立行走的秘密

By: 莫崇宇
7 April 2025 at 13:34

这,是蛇年春晚的顶流机器人 H1,凭借一手丢手绢的绝活,火遍了大江南北。

这,是一款能侧空翻、会鲤鱼打挺的人形机器人 G1,十八般武艺无一不精。

他们都来自同一家公司——宇树科技(Unitree),但其实在这些人形机器人声名鹊起之前,宇树便靠着机器狗狠狠出圈一波,比 H1 更早些时候上过春晚,也曾亮相于超级碗、冬奥会、亚运会等盛会。

宇树旗下的机器狗种类繁多,有面向消费级的 Go 系列,也有科研级的 A 系列和工业级的 B 系列。

其中,在主流电商平台,Go2 目前起售价接近 1 万块,与一张普通显卡的价格相当,这个价位也让其更像是一款面向市场的、相对高端的消费电子产品:

  • Go2 Air:适合轻型应用和家庭使用。
  • Go2 Pro:增强功能可满足更高的任务要求。
  • Go2 Edu:作为学习和实验平台,服务于教育目的

或许正是因为 Go2 价格相对「亲民」且定位贴近大众,知名维修网站 iFixit 也将目光投向了这款机器狗,并特别邀请了机器人专家 Marcel Stieber 对其进行了一次深入的拆解。

机器狗上「手术台」,得先断电

上「手术台」前,安全措施必不可少。

卸电池是标准流程,拿出机器狗侧腰处的电池组,拧开几颗 Torx 螺丝并取下电池仓盖后,便能看到内部用于连接顶部电量指示灯的 Pogo Pin 接口。

将电池组从塑料外壳中滑出,其结构一目了然:包含主接口、充电端口接口,以及若干用于导电的大铜条,这点用料还算扎实,能减少发热。

电池管理系统(BMS)则位于电池组后部,并通过 Pogo Pin 与外部的电量指示灯相连。这种接口可以方便地将 BMS 的信号传递到电量指示器,从而让用户能够直观地看到电池的剩余电量。

Unitree Go2 的标配电池电量为 8000mAh,续航时间约为 1–2 小时,最长可选 15000mAh,日常玩玩还行,真要干活可能不太够。电池组的核心由 32 节 18650 电芯阵列组成,也是比较成熟和常见的电芯类型。

根据标识,其生产日期为 2024 年 3 月 6 日。

移除固定 BMS 电路板的螺丝并小心将其翻开,可以看到下方的充电管理芯片以及一块连接各电池串(标记为 BT1 至 BT8)的子电路板。不过,BMS 芯片上的型号标记似乎被激光蚀刻掉了,无法识别具体型号。

耐用的幕后功臣,是这些「便宜货」

卸掉顶盖的螺丝并取下外壳。

首先映入眼帘的则是一个小型的散热风扇,左上方是一块无线通信板,标有 GNSS(全球导航卫星系统)连接点和另一个天线接口,由同轴电缆的连接方式,专家推测,这可能集成了 Wi-Fi 功能。

此外,我们可以看到一个以太网接口,但这并未为用户专门设计,它更可能主要是用于工厂调试、故障排除或内部维护。

另一个发现则是 XT30 连接器。

这是一种小型、高电流电源连接器,广泛应用于需要大电流传输的场景,如无人机、航模、电动工具、户外电源等。在硬件调试过程中,可以作为一种备用电源输入途径,允许在没有电池的情况下为主板供电进行调试。

主处理单元区域清晰可辨,其外观及配备的散热管和散热片都与英伟达 Jetson 板有相似之处。此外,还可以看到多个预留的风扇接口和一些调试端口。

主板上还集成了多个用于连接电机或执行器的高功率连接器。

事实上,在这款机器狗内部,这种布基胶带的使用相当普遍,目的也很明确,机器狗磕磕碰碰很正常,而胶带可以固定线缆,防止连接器松脱。

拆解进行到前部传感器,需要先小心地剥离覆盖在其上的布基胶带,然后使用撬棒谨慎地断开两个电缆连接器,由于这种细小的连接器比较脆弱,撬棒下手必须稳、准、轻。

在检查前部头部模块时,塑料外壳上明显存在裂缝,显然,这款机器狗平时没少摔,好在这种损伤多数不影响功能,用环氧树脂填充一下就可以,成本也不高。

在视频的结尾,专家继续对主板区域进行更深入的拆解。

又是一顿拆拆拆等常规操作,依次小心拔出连接 GNSS 模块(接收全球导航卫星系统信号)、MCU(推测为微控制器)等部件的连接器,并细心地贴上标签以防后续混淆。

继续移除连接电机的高功率连接器(标有 C-, C+ 等)、连接电池的主电源连接器以及一个小的电池通信连接器。

移除主板上的另一个散热风扇后发现,该区域还预留了更多风扇安装位。

这么设计的好处是,更高配的机器狗版本由于配置更高,(比如有更强的处理器),它就会产生更多的热量,这时候就需要更多的风扇来散热。

不过,装更多风扇也有坏处:风扇多了,就会吸进更多灰尘,还会用更多的电。这样一来,要么需要更大的电池来供电,要么机器狗的续航时间就会变短。

接着,移除两个 RF (射频) 连接器,同样做好标记,以确保后续正确连接。

拧下所有固定主板的螺丝,小心地将其从底盘上取下。移除主板后,便可看到固定底盘上下两部分的螺丝,将它们全部拧下后,即可分离底盘,一览无余。

最贵,但也最安全

激光雷达(Lidar)是 Go2 感知环境的关键。

其工作原理通过发射激光并测量反射光的回波时间来绘制周围环境地图,实现障碍物检测。简单来说,机器人利用预设的光速信息和高精度计时器,计算激光从发射到接收反射信号的时间差,从而判断物体的距离和形状。

Go2 搭载的是宇树自家的 Unitree 4D LiDAR-L1。

这是一款 4D 激光雷达(3D 位置+1D 灰度),它具有实现每秒 21600 次的高速激光测距采样能力,可探测最近 0.05 米、最远距离 30 米的物体(90% 反射率)。

L1 内置 IMU(惯性测量单元),工作温度范围为 -10℃ 至 60℃,其通过转接模块连接 Type-C 接口进行数据传输和供电,视场角(FOV)扩展至水平 360°,竖直 90°,可实现半球形视场角的三维空间探测。

在拆卸 Lidar 模块之前,需要拧下固定模块保护笼的四颗螺丝。

这个由厚实焊接钢材制成的保护笼,显然是为了在机器人跌倒或撞击时保护内部昂贵的传感器——要知道,仅这颗 LiDAR-L1 的成本就可能占到整机售价的五分之一以上。

随后,移除隐藏在腿部下方的一颗额外螺丝,断开连接线缆,以释放并拆下整个 Lidar 模块。

Lidar 模块的结构包含两个旋转轴:外圈的主旋转轴由下方电机驱动,实现水平扫描;内部的次级旋转轴(带有一个反射镜)快速旋转,实现垂直方向的扫描切片。两者结合,提供环境的 3D 视图。

在这里,需要补充一个细节。

在学术和工业领域,4D 通常指的是在三维空间(X、Y、Z 轴)的基础上增加时间维度(T)。例如,在自动驾驶领域,4D 激光雷达不仅要提供物体的三维位置信息,还要能够追踪物体在时间上的运动变化。

虽然 Unitree 4D LiDAR-L1 自称为 4D 激光雷达,但这里的 4D 是指 3D 位置信息加上 1D 灰度信息,传统意义上的 4D(3D + 时间)并不完全一致,所以也难怪专家认为这个命名多少有些营销的噱头。

倒立行走的秘密,藏在这里

Unitree Go2 机器狗全身共有 12 个关节电机。

这些电机分布在机器狗的四肢关节处,使其能够实现灵活的动作,如跳跃、伸懒腰、握手,甚至倒立行走、自适应翻身起立、翻越攀爬等复杂步态。

根据观察,专家判断每条腿包含三个电机:分别控制髋关节、膝关节(大腿部分),还有一个驱动小腿伸缩。

拧下固定外侧腿部电机组件的螺丝,将其与上部腿部分离,可以看到电机和连接器。一个有趣的设计是螺丝孔之间交替放置了多个电容器。

关节连接处采用了互锁齿轮机制,接触面是 CNC 加工的金属表面,以确保力传导的强度,外部的塑料「领圈」则主要起到将两部分固定在一起的作用。

这种设计可能是故意而为之,当受到极端外力时,塑料件或某个连接点会先断裂,从而保护更昂贵的核心部件(如电机和主板)免受损坏,降低维修成本。

再次被胶水折腾完,断开连接电机的三个连接器。

好在连接器本身带有防呆设计,后续可以避免插错。通过手动伸缩腿部,可以观察到内部电机通过齿轮减速器驱动小腿运动,提供了相当大的扭矩。

iFixit 的拆解并未深入到腿部内部,但他们利用 Lumafield CT 扫描仪进行了透视观察。在腿部与髋关节连接的地方,两个部件通过金属与金属的接合方式互相连接。

连接方式很结实,主要的力量(比如机器狗跑跳或者负重时产生的力量)就是通过这个连接点传递的,这也印证了之前的判断。

遛「Go」也是遛狗,好用也有趣

拆解完毕后,专家给出的结论是,这款机器狗集成化程度很高。

模块化设计也是个优点,理论上坏了哪个模块换哪个。所有东西都连到一块主板上,简化了布线,但也意味着主板一旦出问题,影响范围可能很大。

胶水问题前面吐槽过了,虽然能够加固,但也确实给第一次维修添堵,但熟悉上手后,倒也能接受,更重要的是,由于大量使用连接器而不是硬焊接,大大降低了维修门槛。

▲图片来自宇树科技官网

腿部(尤其是易磨损的足端,可通过螺丝更换)设计考虑了可替换性,甚至可能支持现场维修。部件(如同侧或对角线的腿部)之间可能存在通用性,便于更换或使用回收部件。

整体架构则相对简单明了(主板、传感器、电池),所有部件和接口并算复杂,有助于故障排查。拆解还发现了为 Pro 版和教育版预留的空间,可安装更强大的计算模块和额外风扇。

可以说 ,基于模块化和连接器的设计,Go2 具备一定的可维修性。至少理论上,你不需要为了换个小零件就把整个机器狗拆得稀巴烂。不过,实际操作难度是另一回事。

当然,Go2 也并非没有设计上的缺点。

专家也指出,激光雷达埋得太深,更换麻烦;颈部结构看着单薄。机器狗的使用环境决定了它必然会摔、会撞。这些看似脆弱的部分,能否扛得住这些日积月累的摔倒碰撞?都值得打个问号。

最后,如果你正考虑入手一台 Go2,希望这份拆解报告能给你提供一些参考。而作为一款万元级的四足机器狗,Go2 的确是个不错的起点。

它不完美,比如续航和耐用性还有提升空间,但它已经足够好用、足够有趣。毕竟,遛「Go」也是遛狗,还没有狗毛满地飞的烦恼。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


做减法,成就了宇树

By: 肖凡博
22 February 2025 at 14:00

这个月 17 号召开的民营企业家座谈会,可以说是众星云集、话题爆炸,大家的关注度包括但不限于:

许久不露面的马云重新回归公众视野,把 SU7 卖爆的雷军照常出席,给外卖员配齐五险一金的刘强东不见身影……然而这次把风头占尽的,当属「浙江代表团」,7 位来自浙商的企业家携手参会,当中除了马云,还有两位年轻人的身影。

▲ 图片来自:央视新闻

一位是从节前到今天,每天都能上热搜和官宣合作的 DeepSeek 创始人梁文锋,另一位则是宇树科技创始人王兴兴。作为座谈会上最年轻的 90 后新星,他也成为了企业家代表,在这次大会上发言。

「老夫聊发少年狂,左宇树,右大疆」,从这句网友改变的词句不难看出,宇树科技在这些年的突飞猛进,以及大家对它的认可。

或许你早就听说过这家机器人公司, 或许这是它的名字第一次进入你的视野,不过没关系,因为宇树科技去年发布的最后一条视频,引爆了机器人的圈内圈外,也让更多人知道了这家来自中国的黑马。

两分钟不到的视频,你几乎能在每一帧里找到高光时刻。从高难度的 Breaking 地板动作,旋转跳跃倒立,到「华夏血脉觉醒」的武术特级侧空翻。

穿越复杂地形如履平地,载重载人前行毫无压力,路见坎坷直接起跳,高楼飞跃不带犹豫,好像根本难不倒它。

说实话,刚看到视频时,在惊讶之余我也在怀疑:这应该是合成的吧?毕竟在生成式 AI 泛滥的当下,一切皆有可能。当确认了视频的真实性后,除了惊讶,更多的还是惊讶,因为无论从哪方面来看,宇树的这台机器狗所展现出来的综合运动能力,都是比较罕见的。

宇树的下一个高光时刻,出现在春晚的舞台上。一群人形机器人 Unitree H1,和真人舞蹈演员一起,来了一场人机共舞的扭秧歌大赛。

春节之后,宇树机器人也是一刻没停,直接从 CCTV-1 干到了 CCTV-5,科比的后仰跳投、詹姆斯的霸王步还有 C 罗进球后的标志性庆祝动作,它们的机器人都能有模有样地复刻。

▲ 图片来自:YouTube

宇树每次发布的高难度动作演示,看起来都不简单,实际上背后的技术原理也挺复杂,但这些逐渐逼近碳基生物行为活动的成果,都是在宇树科技创始人王兴兴的「减法思维」下诞生的。

扒光了的 H1,兼具骨感和灵活

春晚舞台上的人形机器人 Unitree H1 跳的很欢,花样很多,而从幕后故事里我们得知,这场集新奇、惊讶与尴尬的表演,也做了不少细节上的减法。

所有上台表演的机器人,和平时的样子都不太一样,去掉了很多外包围的覆盖件,一是为了穿上舞台表演服装会更好看,二是更精瘦的外观可以和真人演员产生反差,突出「机器人」的机械感,成为舞台的焦点。

在春晚后台,宇树工程师拆除了 H1 的所有非必要外壳,原本覆盖着光滑塑料的机械臂、关节电机直接暴露在聚光灯下,这种设计看似简单,甚至有点简陋的设计,其实是在为功能让步。

去除装饰性外壳后,机器人的关节活动范围能直接提升 15%,动作灵活了,幅度更大了,甩手绢更精准,杂技动作也就更容易完成。

宇树 H1 的减法不仅在外观上有所体现,也深入到了每个机器的骨子里。传统的机器人要想完成一次多设备联动的舞台表演,需要在前期的编程和训练上下足功夫,软硬件工程师要精确到表演的每一秒、机器人的每一个动作以及走位,连舞台上的坑洼都要考虑到整个排练方案中,做到「无微不至」的关怀。

而此次春晚上的宇树 H1,一改常态,帮助团队省了不少力气,最重要的原因还是和 AI 的结合。通过 AI 对秧歌舞动作的理解,加上其本身强大的学习和重现能力,工程师可以把主要经历放在整体把控上,像是手部动作是否到位、舞台走位是否准确等细节,用上了 AI 的宇树 H1 自己就能搞定。

▲ 图片来自:Unitree

AI 和机器人的结合,让宇树团队的工作量也做了减法,这次之所以能让 AI 技术在表演中大展拳脚,究其根本,还是因为技术的积累。

拥有 43 个关节的宇树 H1 非常灵活,加上 3D 激光 SLAM 自主定位导航,和 360° 全景深度感知技术,它们能自己根据现场的音乐、队友的走位来实时调整动作,其中也包括了让十几个机器人同时接住被抛在空中的手绢。

▲ 图片来自:Google

你几乎能在宇树的每一个产品里,看到它们的减法思维,而用减法做产品,其实有着更多的深层思考。比如在前期制作过程中,能否找到所有可以降低产品成本的细节,让最终的量产产品价格,落在大众市场可接受的区间;再比如做减法能否减少产品的冗余成分,例如一些不影响性能的部件。

如果每个环节都能自洽,也能在实践中实现,那机器人的成本就可以得到进一步的控制,同时也不会影响到机器人在真实场景中的功能。

对于很会做减法的宇树来说,最有代表性的一件产品,应该非 G1 人形机器人莫属。2024 年 5 月,宇树宇树推出了这台「小个子但很灵活」的产品。

最便宜的机器人,也最灵活

宇树 G1 人形机器人虽然个子不高,只有 1.3m 左右,但它「五脏俱全」,全身共有 43 个关节点击,特别是腿部、腰部以及手臂的自由灵活度非常高。

▲ 图片来自:Unitree

验证一台人形机器人是否灵活,最好的办法就是看它动起来,有几分像人。虽然验证过程有些简单粗暴,但效果很直观。从一段发布于一月份的官方演示视频就能看出,G1 的确能算得上目前宇树最为灵活的人形机器人之一。

G1 在行走和奔跑时,运动姿态很稳定,特别是跑步时的动态平衡保持得很好,各个部位的协同也非常到位,要是穿一身紧身运动衣,再带个帽子,混进跑步队伍,一时间还真分不清它是真人还是机器人。

从外观上就能看出,宇树在 G1 上做了不少减法:少了很多肉眼可见的复杂结构,乍眼一看只有关键部位的大关节结构,一体性很强,整体比例也很接近真人。

依靠数十个活动自如的关节,以及 3D 激光雷达、深度相机等感知硬件,G1 在一些拟人运动上,能极大程度地还原出真人动作,在某些瞬间,竟会有一种真人套着机械皮壳的感觉。

宇树在 G1 上做的减法,除了外观,也包括它的制造成本和售价,甚至可以说这是最能体现宇树减法成功的一款产品,因为 G1 人形机器人目前的起售价是 9.9 万元,已经探到了全球量产机器人的地板价。

要知道,当下人形机器人行业内的产品均价约为 50 万元上下,G1 的 9.9 万直接砍至平均水平的五分之一,这个性能不凡、价格平凡的产品,实际上是宇树八年技术积累的结晶。

宇树能把 G1 的售价定到「行业地板价」,和它们一直坚持的全栈自研战略有很大的关系。通过对供应链的垂直整合,和在前期对自研硬件技术的投入,让宇树机器人上的自研电机成本,比外购降低 68%,而且激光雷达适配性优化,也使采购成本下降 42%。

▲ 图片来自:Unitree

售价低和成本挂钩,也和它们的量产思维有关,从一开始,王兴兴想要做的就不是一台概念展示机——只能出现在科学馆和新闻里——而是一批真正能走进大众市场的四足机器狗,和人形机器人。宇树机器人的产线在采用汽车工业的柔性制造技术后,单条产线年产能从 300 台跃升至 5000 台,摊薄了边际成本,售价下探就有了更多空间。

四年前四足机器狗 Go1 发布时,售价仅有 1.6 万元,单款产品的年出货量能达到 1000 台;两年后的 Go2 更是把价格又砍了一刀,直接来到万元左右。

没有对比就没有伤害,同类型的士顿动力 Spot 机器人的售价为 7.45 万美元(约合人民币 54 万),而售价 1600 美元(约合人民币 11.6 万)的宇树 Go2 机器狗,用 1/5 的价格,实现了前者 90% 的功能。

这种定价策略彻底打破行业规则,也极大程度推动了机器人市场化的进程。相较于高成本、高技术、高售价的行业传统,宇树用减法思维做出的低成本高性能产品,也得到了市场的正反馈:

  • 2023 年全球四足机器人市场份额超 40%,稳居第一;
  • 2024 年全球四足机器人市场份额 69.75%,海外销售占比达 50%。

选择,也是一种创新

减法做在价格上,能让产品卖得好;减法做在功能上,能让好卖的产品更好用。

回到 G1,在官网的演示视频里,它在完成一些精细化操作,如电焊、抓取物体、敲击和开可乐瓶时,并没有用上拟人的五指关节,而是装上了三指结构。

这套三指装置名为 Dex3-1 力控灵巧手,是 G1 机器人的一大技术亮点,看起来少了两根手指,和追求人形背道而驰,但其实经过了精心设计。

王兴兴确认为,三指结构是小型人形机器人的最优解,因为 G1 本身只有 1.3m 多一点,如果装上了五个手指,会有点太多了,而且太大了,在外观上略显突兀。

从结果来看,三根手指不仅在体积上减少了 37%,且能满足大部分的使用场景,抓东西完全够有,也很牢固。Dex3-1 力控灵巧手通过混合控制算法,三指抓握力达到 5kg,可轻松完成演示中的焊接、开瓶等精细化操作,八成以上的动作需求都能靠三指完成。

从成本来看,手部组件的成本可以压缩至竞品的 1/3;按照后期维护费用来算,每减少一个指节,故障率就能降低 12%,维修时间也能缩短 25%。因此出于实用的角度,机器人的手在满足功能性的同时,其实越简单越好。

减法思维几乎运用在了宇树的每一个工作实践中,特别是硬件上。它们拒绝采用特斯拉 Optimus 使用的行星滚柱丝杠,转而优化传统谐波减速器,在保持同等精度下将成本压缩至 1/5。

「很多人觉得新技术一定更好,但我们更关注投入产出比。」王兴兴在采访中比喻道:

就像 iPhone 用一块屏幕取代键盘,减法不是妥协,而是更高级的解决方案。

其实做减法并不是宇树成立后的一时兴起,而是在王兴兴刚开始决定做机器人时,就已经形成的默认原则。

时间倒回 2015 年,上海大学实验室里的王兴兴正面临抉择:是跟随主流研发液压机器人,还是冒险尝试电驱动方案?当时全球四足机器人领域被波士顿动力的液压技术垄断,但王兴兴发现液压系统存在致命缺陷——结构复杂、维护困难、成本高昂。

▲ 图片来自:上海大学

他带领团队转向电驱动,用 2 万元经费造出 XDog 原型机,这款去掉液压泵、简化传动结构的产品,最终在国际大赛斩获二等奖。

▲ 图片来自:Unitree

这次选择奠定了宇树的基因。如今,宇树机器人平均零部件数量比竞品少 43%,电机直驱技术使动力传输效率提升至 92%(液压系统仅 65%)。从结果来看,减法成就了宇树,但一开始就决定做减法的王兴兴,其实需要很大的勇气,因为他面临的和对抗的,是当时整个行业的规则,也是行业一以贯之的原则。

颠覆是叛逆者的标签,也是后来者的机会。现在,从产品的市占率、与竞品的同台较量以及未来的发展空间看,宇树的减法思维和简化战略已然成功,并且很有可能,成为四足机器人和人形机器人行业内的通用准则。

当科技行业沉迷于堆砌参数时,宇树用减法开辟出一条新路径。从 XDog 到 H1,从实验室到春晚舞台,这家公司始终在证明:真正的创新不在于做加法,而在于做选择。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


AR 眼镜,正在迎来它的 iPhone 时刻

By: 肖凡博
25 February 2025 at 19:52

一副来自未来的眼镜,应该长什么样子?

在《王牌特工》里,它可以开启 AR 功能,看见每一个不在场的与会者;在《钢铁侠》中,它能将斯塔克体内钯元素含量,准确投射在眼前;在《龙珠》里,它又能测算出对手当前的战斗力。

总之在科幻电影和动画片中,未来的眼镜不仅是医疗器械,更是一个挂在眼前的显示屏,而且从外看起来就只是一副普通眼镜,功能性和隐藏性都做到了极致。

而现在,这样的幻想也正在走进现实,智能眼镜似乎正在迎来它的「iPhone 时刻」。

光波导,一种存在很久的新技术

最近,在杭州市余杭区举办经济高质量发展大会上,灵伴科技 CEO 祝铭明成为了焦点,网友讨论最多的不是他的演讲内容,而是他戴着的眼镜。

这副眼镜表面上看起来很普通,和一般的板材眼镜没什么区别,祝铭明边讲边介绍说「我自己的发言稿就在我这个眼镜上」,所有的演讲逐字稿都能通过眼镜直接在眼前显示,不用像放在演讲台上的传统纸质版文字稿那样,频繁低头看稿。

而翻页则可以通过手上的智能戒指操控,相当于在眼镜里架了一台提词器。虽说介绍的和真的一样,但毕竟没有现场试戴,因此在社交媒体的评论区,还是出现了一些质疑的声音。

Rokid 的回应也很迅速,立马在官方账号公布了 Rokid Glasses 的第一人称视角,不难发现这副眼镜里的确内藏玄机,和祝铭明讲的并无二致。

戴上眼镜后,绿色的字体悬浮在眼前,按压戒指可以翻到下一页,眼镜显示区域的最下方,还有页码标注,让发言人能更好地把握演讲的节奏以及进度。看完这段实机演示,有网友大胆锐评:

好想带着重生回高考的时候,加上 ds(DeepSeek),我能在北大和清华之间抖脚。」

这项把提词器搬到眼前的技术,名叫光波导,看起来很高级,有点「未来味儿」,但其实它并不算一项新技术,例如铺设在大洋底部的海底光缆,里面用来传输信号、比面条还便宜的光纤,就是一种波导技术。只是和大众市场的消费级产品结合,是最近几年才开始的事儿。

▲ 图片来自:Google

光波导是一种通过全反射原理引导光波在透明介质中传输的技术,其核心在于利用不同折射率材料的界面限制光线传播路径。

在 AR 眼镜中,光波导技术通过将微型显示屏生成的图像耦合到玻璃基底中,再通过扩瞳技术将光线传递至人眼,实现虚拟信息与现实场景的叠加。

▲ 图片来自:Google

光波导技术可以大致分为两种:几何光波导和衍射光波导,Rokid Glasses 用的是后者。我们把复杂的技术原理稍作总结梳理,其实当中的技术原理也很好理解。

我们在眼前看到的内容并不是直接显示的,而是由内嵌在眼镜边框/镜腿处的微型显示屏发出的。

光源将光线发出后,经过拥有特殊结构的镜片后,会通过一系列的反射/衍射过程,最后投入我们的眼睛,因此戴上 AR 眼镜后,才能在眼前看见漂浮的文字,却不见显示光源在哪里。

屡败屡战

Rokid Glasses 在大会上的亮相,让更多人知道了光波导,以及 AR 眼镜目前的发展进度,但其实这些年,已经有不少智能眼镜,用上了这项技术。

我印象最深的一款产品,是 OPPO 在 2021 年底发布的 OPPO Air Glass,主要原因有三。

▲ 图片来自:OPPO

一来因为外观,第一代 OPPO Air Glass 只有一般眼镜的 1/2,单边佩戴又酷又怪,看到的第一眼很容易让人联想到龙珠里面的战斗力眼镜,贝弗利、贝吉塔同款,中二且超前。

而且,OPPO Air Glass 的佩戴方式和当下的 AR 眼镜又有一些区别,它不是直接挂在耳朵和鼻梁上的,而是要吸附在右侧镜腿上,也就是说平常用不到、或者没电时,可以单独把它取下,不会对本身近视的人造成影响。

▲ 图片来自:OPPO

采用外挂式的 OPPO Air Glass,非常像早些年的蓝牙商务耳机,和眼镜分开使用互不干扰。最后一点新奇点在于,它能让传统眼镜秒变智能 AR 眼镜,有音响能变成蓝牙耳机,有麦克风能语音交互,有显示功能演讲题词和实时翻译。

智能眼镜的概念很空泛,但 OPPO Air Glass 通过一个挂件,变成了具体的智能工具。

光波导技术除了能给消费市场,带来一些全新的技术展示,它还能成为一部分人的特种设备。去年五月,Hearview 智能眼镜在海外发布,它面向的人群非常精准,功能也很单一:专为听障人士而生,将他人的讲话内容,通过手机麦克风和 AI 算法,实时转录成文字,并且在眼镜上显示。

▲ 图片来自:Google

以前听不见的声音,现在全都可以通过 Hearview 这个全新的媒介,让听障人士获取更多的外界信息,它不仅可以拿来和人对话,包括刷剧、玩游戏、买东西等等,任何需要有声语言的场景,Hearview 就能让听障人士看见声音。

它的优势很明显:语音转文字的准确性达到 95%;最远转录距离 10 米左右;续航 7 小时,重量只有 52 克……不过缺点也显而易见,支持的语言太少;1799 美元(约合人民币 13000 元)的售价,虽说比人工耳蜗便宜了很多,但也只能是小部分人的玩物。

▲ 图片来自:Google

根据 IDC 的数据,2024 全年中国 AR/VR 市场预计出货 53.5 万台,同比下滑 26.3%。虽说去年市场整体表现一般,但他们仍然非常看好 AR/VR 设备市场。

首先是因为此类产品技术在这两年迎来了比较大的升级,加入这个赛道的厂商和产品也越来越多。如果你现在去淘宝搜索「AR 眼镜」「光波导」几个关键词,会跳出来一大堆相关产品,例如和 Rokid Glasses 同类型的 INMO GO2,也有光波导技术,比起 Hearview,它支持的语言更多(40 种),而且价格也更便宜(¥3999)。

▲ 图片来自:Google

另外,星纪魅族旗下也有此类 AR 智能眼镜,去年九月发布的 StarV Air2,重量更轻 44g,价格优惠完后,不到 3000 就能入手。

▲ 图片来自:Google

而且,从去年开始,AI 落地千万行业也成了常态,拥有了更多功能的新技术眼镜,也会从根本上拉开与传统眼镜的使用体验。所以 IDC 预计 2025 年中国 AR/VR 市场将迎来期待已久的回暖,出货量同比 2024 年将增长 114.7%。

从短期来看,以 Meta Rayban 为代表的 AI 眼镜会更受青睐,因为功能相对较少、价格相对较低,更容易让大众消费市场接受,但是从长期发展来看,功能更加丰富、拥有显示屏的 AR 眼镜,可能才是未来。

丰满的理想,残酷的现实

新技术的畅想总是美好的,但回到现实,还是有点残酷。

穿戴设备的「iPhone 时刻」,的确有可能发生在 AR 眼镜上,因为眼镜的形态很容易让人接受,而且越靠近人体感官的穿戴设备,越容易与人产生交互,也更容易从人的第一人称视角,收集外部环境的信息。

但不得不承认的是,AR 眼镜目前还算不上成熟。什么时候我们都司空见惯了,那什么时候才算成熟,并且能经过市场的认可。

▲ 图片来自:Google

比如在高峰期的地铁站、公交站和人流密集的场所,我们看见没有实体键盘的手机不会感觉奇怪,因为人人都是全面屏;我们看见一个人的手表有彩色显示屏也不会觉得奇怪,因为智能手表也成了许多人的出门必备;我们看见一个人突然对着空气讲话,也不会觉得奇怪,因为 TWS 耳机随处可见,人耳一个。

不过,AR 眼镜还没有这样的普及率,它的确处在爆发的前夕,但也只是在前夕,属于 AR 眼镜的时代,还没到来。

过去的一年多,我们也体验和评测了各种 AR/AI 眼镜,究其还未能大规模铺开的原因,大致可以总结为以下几点。

最先要说的是,光波导技术本身的限制。仔细看上面我们提到的所有消费级 VR 眼镜,不难发现他们都有一个共性——显示内容都是绿色的,且都以文字显示为主:颜色和显示内容都太单一。

▲ 图片来自:Rokid

这是为什么呢?问题就出在光波导技术本身。

由于光波导的设计和材料特性,某些颜色的光在传输过程中会有更高的效率和更好的表现。绿色光波长较短,传输效率较高,因此在光波导 AR 眼镜中,绿色光的显示效果通常会更好。

▲ 图片来自:Google

虽说可以针对 RGB 色彩,给镜片上设置不同的衍射光栅,来改善最终在出瞳位置的颜色均匀性,减小彩虹效应,然而这只能起到缓解作用,并不能完全消除。

更何况,在一个消费级别的产品上,必须要考虑体积和成本。因此,目前大部分需要长时间佩戴的 AR 眼镜,都采用了最保险的方式,也就是用绿色显示一切。

另外,光波导的光学效率较低,在整个传播耦合过程中,光损失可达 70-80%,因此需要高亮度的光源进行补偿,不然在白天的室外,即使上面有显示字体,也很难看清。

▲ 图片来自:Google

光源亮度补偿,也意味着更高的能耗,这给本就不富足的镜腿上的小电池雪上加霜,要是用得多,一天三充甚至四充都会成为常态,严重影响了使用体验,特别是对近视的人群很不友好,没电最多会影响使用体验,但摘下眼镜会影响生活体验。

加上纳米压印工艺对公差的要求,1 微米就可能导致 10 微米的成像偏差,还有光波导技术成本几乎占到了眼镜总成本的三到四成,各种各样的原因,让光波导 AR 眼镜从生产到售卖的全过程,都充满着各种各样的绊脚石。

最后,即便真的做了出来、上了架,三千往上走的价格并不美丽,在传统眼镜以及 AI 眼镜面前,它们似乎没有太大的竞争力。

从生不逢时,到恰逢其时

Rokid Glasses 以及一众 AR 眼镜的优劣势,都很明显,那它还有机会么?我觉得有,而且刚好处在最好的风口。

1987 年,一个打着「革命性个人电脑」旗号的项目正式启动,其设计理念是彻底改变人与计算机的交互方式,通过手写输入取代键盘。6 年后初代产品正式问世——MessagePad 100,它还有个更让人熟知的名字:Apple Newton。

▲ 图片来自:Google

「牛顿」一出生,就搭载苹果自主研发的 Newton OS 操作系统,采用 ARM 610 RISC 处理器,在个人电脑还是一件稀罕物的时代,「牛顿」就支持手写识别、红外通信、触控笔输入,并具备联系人管理、日程安排、笔记记录等功能,被视为当时的技术先驱。

研发费用总共耗费 5 亿美元,首发售价 699 美元(约合人民币 5000 元)的划时代产品,最终因为价格昂贵、手写体验极差、性能尴尬等各种各样的问题,让梦想败给了现实。

▲ 图片来自:Google

它到底有多失败呢?乔布斯在 97 年回归苹果后,直接取消了这条产品线。无论从乔布斯本人,还是「牛顿」的市场表现来看,它和成功都没有一点沾边,但「牛顿」真的一无是处吗?其实不然。

首先,「牛顿」的 ARM 芯片合作奠定了苹果在移动设备芯片领域的优势,后续 iPod、iPhone、iPad,均采用 ARM 架构,到现在,有 90% 的智能手机,都搭载的是 ARM 架构。

▲ 图片来自:Google

而且,「牛顿」的手写输入和触控笔技术,为 iPhone 的多点触控和 iPad 的触控界面提供了早期经验,也间接影响到了当下的手写平板技术。

前苹果 CEO 约翰·斯卡利也曾为「牛顿」辩护:产品之所以未成功是因为太超前,太有野心。

而智能眼镜,也有着类似的经历。2012 年的 Google I/O 上,智能眼镜 Google Glass 成为压轴戏,当时许多人都认为它会成为「定义未来十年科技走向的产品」。

▲ 图片来自:Google

和 Apple Newton 殊途同归,两个被寄予无限期望的跨时代产品,最终都脱离了时代的正轨。续航与硬件设计缺陷,软件生态匮乏,高价与实用性失衡,让 Google Glass 亮相两年后,就宣布停产。

▲ 图片来自:Google

它们预测对了大方向,却没遇上一个可以支撑起超前技术的时代。我们要看到这些跨时代产品失败的原因,同时我们也要看到这些当年的坎儿,也正在被一个个地解决。

语音交互在这十多年里从被人嘲笑,变成了生活里一句句的「小爱同学」「小艺小艺」「Siri」;软件生态的丰富度如指数爆发般增长,要知道十多年前「互联网+」还是个很新的词;人工智能在两年的进步飞速,大模型从年更、周更,进化到了今天的日更,甚至不同公司的产品每小时的排名,都会发生变化;同样体积的电池,容量大幅增长……

▲ 图片来自:Google

在这个技术疯狂迭代的交接点,IDC 也大胆地预测了 2025 年中国 AR 市场,将同比 2024 年,增长 143.9%,迎来新兴穿戴设备的拐点。

前段时间,博主@元宇宙小灰发布了一段概念视频,畅想 Rokid Glasses 有了与外界环境互动的能力:骑车导航时行进路线会标在路面,也能识别街边店铺的名字,并一句话下单买杯咖啡。

▲ 图片来自:@元宇宙小灰

而这些技术,其实都已经在汽车上的 AR HUD、手机的智慧助手上实现了,把所有功能汇集到鼻梁的眼镜上,也只是时间问题。

▲ 图片来自:Youtube

最后,我再来说说比较看好 Rokid Glasses 的另一个原因:AR 智能眼镜,首先是一个眼镜。这件事儿已经在 Meta Rayban 上验证为真,Rokid Glasses 和暴龙眼镜的合作,走的也正是「实用+科技」的路线。

当它没电了、Meta 不起作用的时候,Rayban 依然是一副不掉价,也挺好看的眼镜。

新技术的发明总是以超越当下、超越时代的姿态出现;而科技的成熟,最终都会以我们最熟悉的样子,融入日常生活。在人们使用它、习惯它,并将它当作一件理所当然和稀松平常的事儿时,技术的意义与价值,也就在此刻展开。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


OpenAI称中国使用人工智能打造监控工具

By: CADE METZ
24 February 2025 at 09:14

简繁中文
纽约时报 出版语言
字体大小

OpenAI称中国使用人工智能打造监控工具

CADE METZ
研究人员表示,他们发现了一种中国监控工具,因为开发该工具的人使用了OpenAI技术调试计算机代码。
研究人员表示,他们发现了一种中国监控工具,因为开发该工具的人使用了OpenAI技术调试计算机代码。 Kevin Frayer/Getty Images
OpenAI于周五表示,它发现了证据,表明中国一个安全行动建立了由人工智能驱动的监控工具,用于收集西方国家的社交媒体服务上反中帖子的实时报告。
该公司的研究人员表示,他们之所以能发现这个被他们称为“同行评审”的新活动,是因为开发该工具的人使用了OpenAI的技术来调试支撑它的部分计算机代码。
OpenAI的首席调查员本·尼莫说,这是该公司首次发现由人工智能驱动的此类监控工具。
“有时候,威胁行为者使用我们的人工智能模型的方式可以让我们看到他们在互联网其他地方正在做什么,”尼莫说。
人们越来越担心,人工智能可能被用于监视、计算机黑客攻击、造谣活动和其他恶意目的。虽然像尼莫这样的研究人员表示,这项技术肯定会助长这类活动,但他们也指出,人工智能也可以用来帮助识别和阻止这类行为。
OpenAI首席调查员本·尼莫。
OpenAI首席调查员本·尼莫。 Alexander Coggin For The New York Times
尼莫和他的团队认为,中国的监控工具基于Llama,这是Meta开发的一种人工智能技术,该公司将其技术开源,这意味着它与全球的软件开发人员共享自己的工作成果
在一份关于人工智能用于恶意和欺骗目的的详细报告中,OpenAI还表示,它发现了另一个他们称之为“受资助的不满”的中国活动,该活动利用OpenAI的技术生成批评中国异见人士的英文帖子。
广告
OpenAI表示,同一个组织使用其技术将文章翻译成西班牙语,然后在拉丁美洲传播。这些文章批评美国的社会和政治。
另外,该报告称,OpenAI的研究人员发现了一个据信以柬埔寨为基地的活动,该活动利用该公司的技术生成和翻译社交媒体评论,帮助推动一种名为“杀猪盘”的骗局。人工智能生成的评论被用来在互联网上吸引男性,使他们陷入投资骗局。
(《纽约时报》起诉OpenAI和微软侵犯与人工智能系统相关的新闻内容的版权。OpenAI和微软否认了这些指控。)

免费下载 纽约时报中文网
iOS 和 Android App

点击下载iOS App 点击下载Android App
© 2025 The New York Times Company.

DeepSeek是如何把构建AI的价格“打下来”的

By: CADE METZ
13 February 2025 at 02:32

简繁中文
纽约时报 出版语言
字体大小

DeepSeek是如何把构建AI的价格“打下来”的

CADE METZ
深度求索使用了一些技术手段,大大降低了构建系统的成本。
深度求索使用了一些技术手段,大大降低了构建系统的成本。 Caroline Brehman/EPA, via Shutterstock
上个月,一家名为“深度求索”(DeepSeek)的中国初创公司表示,它用比许多专家认为的最低限度要少得多的芯片打造出世界上最强大的人工智能系统之一随后美国金融市场出现暴跌
人工智能公司通常使用装有1.6万枚或更多专用芯片的超级计算机来训练聊天机器人。但深度求索表示,该公司只用了大约2000枚芯片。
正如深度求索工程师在圣诞节甫一过后发表的一篇研究论文中详细说明的那样,这家初创公司使用了一些技术手段,显著降低了系统构建成本。它的工程师只需要约600万美元的纯算力,大约是Meta在构建其最新人工智能技术时所花费的十分之一。
深度求索到底做了什么?这里是一些介绍。
广告
AI技术是如何构建的?
领先的人工智能技术基于科学家所说的神经网络,即通过分析大量数据来学习技能的数学系统。
最强大的系统需要花费数月时间分析互联网上几乎所有的英文文本,以及许多图像、声音和其他多媒体内容。这需要庞大的运算能力。
大约15年前,人工智能的研究者意识到,一种被称为图形处理单元(GPU)的专用计算机芯片是进行这种数据分析的有效方式。像硅谷芯片制造商英伟达这样的公司最初设计这些芯片是为了在电脑游戏中渲染图形。但GPU也擅长运行推动神经网络的数学运算。
随着各家公司将更多的GPU集成到计算机数据中心,它们的人工智能系统可以分析更多的数据。
但最先进的GPU每块售价在4万美元上下,而且需要大量的电力。在芯片之间传输数据比运行芯片本身更耗电。
广告
深度求索是如何把成本降下来的?
它做了很多工作。其中最值得注意的是,它采用了一种所谓的“混合专家”法。
公司通常会创建一个单一的神经网络,学习互联网上所有数据的所有模式。这样做的成本很高,因为它需要大量的数据在GPU芯片之间传输。
如果一枚芯片正在学习如何写一首诗,而另一枚芯片正在学习如何编写计算机程序,它们还是需要相互交流,以防诗歌和编程之间出现某种重叠。
研究人员尝试通过混合专家法来解决这个问题,他们将系统拆分成许多神经网络:一个用于诗歌,一个用于计算机编程,一个用于生物学,一个用于物理学,等等。这样较小的专家系统可能多达100个。每个专家都可以专注在特定领域。
许多公司在尝试这种方法时并不顺利,但深度求索能够很好地做到这一点。它的诀窍是将那些较小的“专家”系统与一个“通才”系统配对。
广告
专家系统仍然需要相互交换一些信息,而通才系统可以帮助协调专家系统之间的互动。通才系统对每个主题都有不错的理解,但比较粗略。
这有点像一个主编负责一个全是专业记者的新闻编辑室。
这样做的效率更高吗?
高很多。但深度求索做的不仅仅是这些。它还掌握了一个涉及小数的简单技巧,只要你还记得小学数学,就能理解。
这里涉及数学?
还记得你的数学老师讲过的π吗?圆周率,也就是π,是一个无限数字:3.14159265358979……
广告
你可以用π来做一些有用的计算,比如确定圆的周长。当你做这些计算时,你会把π缩短到仅几位小数:3.14。使用这个更简单的数字,你就能很好地估算出一个圆的周长。
深度求索在训练它的人工智能技术时做了类似的事情,不过规模要大得多。
让神经网络识别文本模式的数学实际上只是乘法——很多很多很多的乘法。我们说的是数千枚计算机芯片进行持续数月的乘法运算。
通常,芯片会将能放入16位存储器的数字相乘。但深度求索将每个数字压缩到只有八位的存储器中,节省了一半的空间。实际上就是在每个数字中删掉了几位小数。
这意味着每次计算的准确性都会降低。但这并不重要。这些计算准确度足以产生一个非常强大的神经网络。
就这么简单?
广告
这个嘛,他们另外还有一招。
在将每个数字塞进八位存储器后,深度求索在将这些数字相乘时采取了不同的方法。在确定每个乘法问题的答案时——进行有助于决定神经网络将如何运作的关键计算——它将答案扩展到32位存储器中。换句话说,这样就保留了更多的小数,使得答案更为精确。
所以高中生都能做到这一点吗?
当然不是。深度求索的工程师在论文中表明,他们也非常擅长编写非常复杂的计算机代码,告诉GPU该做什么。他们知道如何从这些芯片中榨取更高的效率。
具备这种技能的人不多。但一个人工智能实验室只要有心成事,就能找到与深度求索所做的事情相匹配的优秀工程师。
那为什么他们没有早些做到这一点呢?
一些人工智能实验室可能已经在使用相同的技巧了,至少是其中的一部分。像OpenAI这样的公司并不总是透露他们在幕后所做的事情。
但显然还是有人对深度求索的工作感到惊讶。要做到这家初创公司所做的事情,并不简单。找到这样的突破点所需的实验,需要用到数百万甚至数十亿美元的电力。
换句话说,需要冒巨大的风险。
西雅图艾伦人工智能研究所的研究员蒂姆·德特默斯说,“你必须投入大量资金来尝试新事物——而且它们往往会以失败告终。”德特默斯从事构建高效人工智能系统的探究,之前曾在Meta担任人工智能研究员。
“这就是为什么我们看到的创新没有那么多的原因:人们害怕大量投入都打了水漂,”他补充道。
许多专家指出,深度求索的600万美元只涵盖了这家初创公司在训练系统最终版本时的费用。深度求索的工程师在论文中表示,他们在最终的训练运行之前,还在研究和实验上花费了额外的资金。但任何尖端人工智能项目都是如此。
深度求索进行了尝试,并取得了成功。现在,由于这家中国初创公司已经与其他人工智能研究人员分享了方法,它所采用的技术手段有望显著降低构建人工智能的成本。

免费下载 纽约时报中文网
iOS 和 Android App

点击下载iOS App 点击下载Android App
© 2025 The New York Times Company.

微软和英伟达为何不向特朗普“献媚”

简繁中文
纽约时报 出版语言
字体大小

微软和英伟达为何不向特朗普“献媚”

KAREN WEISE, TRIPP MICKLE
微软首席执行官萨蒂亚·纳德拉和英伟达创始人黄仁勋悄然与美国总统特朗普进行了会面。
微软首席执行官萨蒂亚·纳德拉和英伟达创始人黄仁勋悄然与美国总统特朗普进行了会面。 Grant Hindsley for The New York Times; Patrick T. Fallon/Agence France-Presse — Getty Images
西雅图——最近一个周五的下午,芯片制造商英伟达的首席执行官黄仁勋悄然进入白宫,与特朗普总统首次会面。没有大张旗鼓的宣传,他离开时,两人也没有公开合影。
两周前,微软首席执行官萨蒂亚·纳德拉与特朗普在佛罗里达州的马阿拉歌庄园共进了长时间的午餐。他们的用餐没有引起太多关注,也几乎没有成为新闻。
在特朗普的就职典礼上,这两位高管没有像其他大型科技公司高管那样,笔直地站在他身后。实际上,他们两人当时身处完全不同的大陆:纳德拉正在前往瑞士达沃斯参加世界经济论坛,而黄仁勋正结束在台湾和中国对供应商和员工的拜访。
全球最有价值的两家公司的首席执行官缺席就职典礼,这或许是最直观的迹象,表明在特朗普返回华盛顿后,一些公司正试图采取低调的做法,即使一些同行采取浮夸的方式示好。
广告
不同于许多科技公司,微软和英伟达并没有激怒特朗普,对它们这样的公司来说,“几乎是一切照旧,”微软前高管、现任职于马德罗纳创业集团的索马塞加说,他经常与纳德拉交谈。
虽然微软和英伟达与特朗普打交道的方式都比较低调,但它们在华盛顿的足迹却截然相反。微软即将迎来成立50周年,在二十多年前的反垄断斗争中积累了丰富的经验,可以说是科技界在政策问题上最精明的参与者,拥有强大的游说力量,以及在两党都有人脉关系的高管。
而英伟达则是华盛顿的新秀。在过去几年里,它的知名度迅速提升,这得益于它对专用芯片的强大控制,这些芯片是其他科技公司用来构建大型人工智能系统所必需的。
这两家公司都与新政府利益攸关。新政府必须敲定有关英伟达芯片销售和微软在海外建设数据中心的规定。微软还面临一系列其他问题,包括网络安全、人工智能系统的监管以及数据中心的电力需求。在初创公司DeepSeek取得突破性进展后,英伟达还面临政府可能进一步限制其芯片对华销售的风险。
“每个人都必须参与进来,他们会以不同的方式这样做,因为俗话说得好,如果你不坐在桌前,你就在菜单上,”全球战略公司Penta Group高级合伙人、米特·罗姆尼2012年总统竞选活动前高级策略师凯文·马登说。
他们的低调战略在就职典礼前后展现出来。微软主席布拉德·史密斯出席了副总统JD·万斯为内阁成员举办的招待会。一周后,史密斯和纳德拉参加了苜蓿草俱乐部举办的正式晚宴,出席的还有内阁提名人霍华德·卢特尼克、琳达·麦克马洪和北达科他州前州长、纳德拉在微软的昔日导师道格·伯格姆。英伟达负责对外事务的副总裁内德·芬克尔和该公司的一些政策工作人员也出席了就职庆祝活动。
广告
与其他科技公司一样,微软也向特朗普的就职基金捐赠了100万美元,但它是在其他公司之后捐赠的。微软向特朗普首届政府的就职基金以及2021年乔·拜登的就职基金捐赠了50万美元。(英伟达没有向就职基金捐款。)
12月中旬,亚马逊创始人杰夫·贝索斯和未婚妻劳伦·桑切斯在备受瞩目的马阿拉歌庄园之旅期间共进晚餐,Instagram上的帖子记录了这一过程,并登上了八卦版面。
在纳德拉与特朗普会面之前,微软高管已与特朗普的幕僚、内阁任命人员和技术顾问有过会面。当纳德拉等高管抵达马阿拉歌时,他们已经事先了解了特朗普的优先事项和关注点。
纳德拉与特朗普在佛罗里达州的马阿拉歌庄园共进了长时间的午餐。
纳德拉与特朗普在佛罗里达州的马阿拉歌庄园共进了长时间的午餐。 Maddie McGarvey for The New York Times
据一位知情人士透露,他们谈到了安全和投资基础设施的问题,特朗普对核电的安全性表示担忧——作为数据中心的电力供应来源,核电越来越受欢迎——纳德拉、史密斯和参加午餐会的埃隆·马斯克试图打消他的顾虑。
黄仁勋没有前往马阿拉歌,而是在就职典礼结束近两周后才拜访白宫。
当他本月抵达华盛顿时,已经很明显,特朗普政府可能对英伟达的业务构成威胁。
广告
鲁特尼克是特朗普的一位富有捐赠者,被任命为商务部部长,几天前他在提名听证会上对国会说,他认为包括英伟达在内的美国科技公司“需要停止帮助”中国。
“如果他们要和我们竞争,那就让他们来,但别再利用我们的工具和我们竞争,”他说。
这番话打破了英伟达对特朗普可能带来比前任更宽松监管环境的希望。
拜登执政期间,美国限制向中国出售英伟达芯片,并对英伟达人工智能芯片向其他100多个国家的销售设置了上限。这些规则的扩大和执行将由特朗普政府实行。
在那天下午黄仁勋与特朗普的首次会面中,黄仁勋谈到了人工智能政策和半导体。但事后,特朗普告诉记者,他不能确定是否会禁止更多英伟达芯片销往中国。他还说,虽然“这是一次很好的会面”,但政府仍计划对海外制造的芯片征收关税,这将削减英伟达的利润,因为其芯片是在台湾制造的。
面对白宫的压力,英伟达一直在加强其在华盛顿的影响力。上周一,据两位熟悉英伟达办公室、要求匿名讨论人事问题的人士透露,该公司聘请了共和党政府事务执行官斯图尔特·巴伯,他此前曾担任伊万卡·特朗普的顾问。英伟达去年在华盛顿开设了第一个办公室。
广告
该公司已申请成为信息技术产业委员会的成员,这是一个代表大多数领先科技公司的政策团体。公司还聘请了美国全球战略公司,这是一个由罗伯特·奥布莱恩领导的地缘政治咨询集团,奥布莱恩曾在特朗普执政时期担任过两年的白宫国家安全顾问。
英伟达在华盛顿开展迟来的扩大影响力行动也是因为它认识到,该公司新获得的显著地位要求它更多地参与。在一年多一点的时间里,英伟达的市值猛增了2万亿美元,使其成为与微软和苹果并列的全球三大最有价值上市公司之一。

免费下载 纽约时报中文网
iOS 和 Android App

点击下载iOS App 点击下载Android App
© 2025 The New York Times Company.

DeepSeek的成功是否意味着美国技术控制的失败?

简繁中文
纽约时报 出版语言
字体大小

DeepSeek的成功是否意味着美国技术控制的失败?

ANA SWANSON, MEAGHAN TOBIN
美国试图限制中国获取先进的人工智能技术,尤其是英伟达生产的芯片。
美国试图限制中国获取先进的人工智能技术,尤其是英伟达生产的芯片。 Christie Hemm Klok for The New York Times
在过去三年里,美国一直在稳步采取措施,限制中国获取尖端计算机芯片的能力,这些芯片为先进人工智能系统提供动力。美国的目的是放慢中国在研发先进人工智能模型上的进步速度。
现在,一家名为DeepSeek的中国公司已开发出了这种先进技术。DeepSeek在最近几周发布了各种各样的人工智能模型以及一个聊天机器人,它们的性能可与美国公司生产的最佳产品相媲美,但DeepSeek使用的价格高昂的人工智能芯片数量比美国公司通常需要的少得多。发布后的那个周末,随着世界各地的人们下载DeepSeek的聊天机器人,该应用在苹果应用商店的下载量已跃居榜首。
这一进展已在人们心中引发了重大质疑:美国近年来逐渐加强出口管制是否有效?拜登政府建立了一套全球规则体系,并稳步地将其适用范围扩大到阻止先进的人工智能技术(尤其是英伟达生产的芯片)落入中国人手中。美国政府担心,人工智能技术不仅会让中国在经济上获得优势,也会让其在军事上获得优势
DeepSeek研发的成果已引发了一场关于美国的技术控制是否已经失败的激烈争论。以下是需要了解的内容。
广告
DeepSeek的创新暗示,拜登政府行动可能太慢,无法跟上私营企业规避政府控制的步伐。
DeepSeek表示,训练其最新模型的计算机用的是英伟达H800芯片。这款人工智能芯片是英伟达在美国最初对中国实行出口管制后专门为中国市场开发的,英伟达的做法曾在华盛顿引起了相当大的戏剧性反应。
美国政府2022年对英伟达最尖端的芯片实施出口限制后,该公司很快采取了应对措施,把出口给中国的芯片略微降级到刚好低于政府设定的门槛之下。严格地说,让中国公司用上这些芯片是合法的,但这也使得它们能获得与采用更高端芯片几乎相同的结果。
这激怒了拜登政府的官员,他们开始采取行动限制略微降级芯片的出口。但政府的行动缓慢,他们花了大约一年时间才禁止了H800和其他降级芯片的出口。与此同时,中国公司已囤积了大量芯片。
目前尚不清楚DeepSeek的英伟达H800芯片是从什么渠道获得的,但如果公司是在2022年底或2023年购买了这些芯片的话,那就是合法的。但这种购买现在已经不合法。
“无法控制那里已经有的东西,”在兰德公司做技术分析的高级顾问吉米·古德里奇说。“如果拜登政府更快地做出了反应,限制了H800进入中国的话,毫无疑问,DeepSeek在推出其大模型上会面临更大的挑战。”
广告
早在华盛顿的出口管制生效之前,DeepSeek就已经花了好几年时间储备自己的芯片供应。据中国媒体36氪发表的一篇对DeepSeek创始人梁文锋的采访,到2021年,DeepSeek是少数几家购买了至少一万枚英伟达A100(英伟达在2020年发布的先进芯片)的中国公司之一。
美国在打击芯片走私上也困难重重。
虽然没有证据表明DeepSeek使用了走私芯片,但许多中国AI公司都在这样做。人工智能训练巨头Scale AI公司的首席执行官亚历山卓·王(音)对《纽约时报》说,中国公司拥有的高端芯片数量远远高于美国的出口限制所允许的水平,DeepSeek可能拥有约五万块英伟达的高端H100芯片,“他们显然不能提这个。”
英伟达和美国政府都认为,走私的规模有限。但《纽约时报》去年曾报道,受限制的人工智能技术在中国有十分活跃的市场。在中国南方城市深圳,一个繁忙市场的芯片供应商称,他们经手过数百或数千枚受限制芯片的买卖。
11家公司的代表称,他们销售或转运过被禁的英伟达芯片,包括公司当时最先进的A100和H100芯片。《纽约时报》发现,还有数十家企业在网上提供这些芯片。深圳的一家供应商给记者展示了有关安排交付装有2000多枚英伟达最高端芯片的服务器的短信交流,这笔交易的总额高达1.03亿美元。
时报进行报道之后,还出现了更多记述大规模走私的报道,尤其是通过亚洲其他国家的走私。
广告
拜登政府已在今年1月发布了旨在解决走私问题的全面法规,对英伟达向世界上每个国家销售的芯片数量设定了上限。
特朗普政府将在限制芯片出口上采取什么措施还有待观察。但在上任第一天签署的一项贸易行政命令中,特朗普总统要求官员对美国的出口管制制度进行审查,包括“如何识别和消除现有出口管制中的漏洞”。
虽然美国的出口管制似乎已激发了中国人的创造力,但也显然阻碍了中国人工智能的发展。
美国的技术限制似乎加速了中国研究人员试图用更少的资源做更多事情的努力。
DeepSeek大模型最值得注意的一点是,据该公司的说法,它只使用了西方公司用于研发同类技术的高价芯片的一小部分。DeepSeek的工程师说,他们只用了约2000枚英伟达芯片,而大多数主要的西方AI公司训练聊天机器人使用了1.6万 枚或更多的芯片。上周一,英伟达的股价大跌,因为人们担心科技公司将来在研发尖端人工智能上使用更少的芯片,让英伟达能赚到的钱大幅减少。
乔治华盛顿大学研究新兴技术的教授杰佛里·丁(音)说,全球大多数公司一直在使用越来越多的计算能力和数据来提高人工智能的性能。但DeepSeek和其他中国公司已“被迫走上了另一条道路,它们在探索我们是否能以更低的训练成本和更少的计算量来获得足够好的性能”,他说。
广告
像DeepSeek这样的便宜大模型带来的影响可能是深远的。因为DeepSeek已公开分享了其大模型的细节,中国和世界各地的公司都将能够复制这种低成本方法。
这意味着“从美国的超大企业到中西部的小企业,从朝鲜的黑客到俄罗斯军队,任何人都将能更便宜地构建和运行人工智能系统,其能源消耗也将大幅减少”,彼得森国际经济研究所高级研究员马丁·乔泽姆帕说。
尽管如此,如果没有出口管制的话,中国在人工智能领域可能会走得更远。DeepSeek的创始人在采访中承认,缺乏计算能力对公司来说是一种局限。
与美国的人工智能公司不同,DeepSeek将无法合法地购买英伟达正在推出的最新一代人工智能芯片,这种芯片的速度和性能是以前芯片的几倍。
“任何担心DeepSeek今天能做什么的人,如果该公司能使用其美国竞争对手拥有的更优越的计算资源的话,就会更加担心了,”乔泽姆帕说。
DeepSeek的成功已表明,尽管美国政府努力限制中国获得高端芯片,但硅谷在人工智能方面的领先地位已经缩小。但值得注意的是,DeepSeek仍在使用英伟达的芯片构建大模型,而不是用中国科技企业华为试图开发的与英伟达竞争的人工智能芯片。
广告
一些中国计算机工程师暗示,尽管华为的人工智能芯片性能要低得多,但有可能在数量更多的不太先进的芯片(包括华为制造的芯片)上运行最新的DeepSeek大模型。
但目前还没有一家中国公司能够制造出与英伟达芯片竞争的先进人工智能芯片,或制造高端芯片所需的复杂机器。“美国此刻唯一仍比中国有优势的东西是硬件,”古德里奇说。

免费下载 纽约时报中文网
iOS 和 Android App

点击下载iOS App 点击下载Android App
© 2025 The New York Times Company.

在 iPad 上运行 macOS? (with Jump Desktop)

By: James Guo
25 October 2024 at 07:00

在读了 Will Apple EVER consider macOS for iPads? 后,我觉得我应该分享一下我在 iPad 上使用 macOS 的经验(kind of)。

这是因为我发现,在 iPad 上使用远程桌面应用(在我的情况下,是 Jump Desktop)并且在家里有一台 Mac mini,我就不再需要 MacBook Pro 了。让我解释一下:

我的 iPad 支持蜂窝网络。使用无限的 5G 蜂窝计划(每月 $11.5-16.5)。当我在家时,我使用 Mac mini 和 Studio Display。当我离开家时,我只带 iPad。如果我需要做一些 iPad 无法处理的事情,我可以直接 “Jump” 到家里的 Mac mini。

为什么这个组合比 MacBook 更好?

蜂窝网络

iPad 支持蜂窝网络,它始终保持联网。而 Mac 可能没有这种功能,尤其当我不在家时。

  1. 当我打开邮件/信息应用时,iPad 上的邮件已经全部下载完毕。然而在 Mac 上,我需要先连接到 iPhone 的热点或 Guest Wi-Fi,然后等待邮件下载。这可能需要 30 秒到几分钟。
  2. 我可以随时随地通过蜂窝网络将 iPad 备份到 iCloud。然而在 Mac 上,除非我带着 USB 硬盘或者连上家里的 Wi-Fi,否则我无法通过 Time Machine 备份 Mac。(不过,我仍然可以通过第三方应用将 Mac 备份到云端。)
  3. 我还可以通过蜂窝网络备份 Lightroom 照片。使用 USB 3,我可以将所有照片导入 iPad,然后通过 5G 上传到 Lightroom。然后我 Jump 到 Mac mini 上,这些照片已经在 Mac mini 的 Lightroom 中了。Jump 到 Mac 后,我可以做 AI 降噪等处理。完成 AI 去噪后,我可以返回 iPad 的 Lightroom 进行更多操作。
  4. 流媒体、应用体验等。有了蜂窝网络,这些事情都变得更加方便。

娱乐应用

  1. Netflix for iPad(或者其他许多流媒体应用)。在飞行前,我可以在 iPad 上下载一堆节目。Mac 上无法做到这一点。有些流媒体网站甚至无法在 Mac 上播放 4K HDR,但可以在 iPad 应用中做到(比如 Paramount,至少曾经是这样)。
  2. 在 iPad 的 OLED 显示屏上流媒体播放效果更好,而且更方便。它更小、更轻,我可以在观看节目时取下键盘。这比 Vision Pro 还要简单。
  3. 阅读书籍。用 iPad 读书比用 MacBook 更自然。

其他

  1. 触摸屏和 Apple Pencil。Mac 没有这些功能。而且,当我 Jump 到 macOS 时,我还可以使用触摸屏和 Pencil。
  2. 我家里的 Mac mini 连接了许多外设:两个 4TB 的 SSD 和超过 10TB 的硬盘。它还有千兆网速。当我 Jump 到我的 Mac 时,所有这些外设都可以访问。如果不使用远程桌面,我就必须带上这些外设,而这有丢失的风险,数据安全得不到保障。

它比 iPad + MacBook Pro 还好:

  1. iPad 比 MacBook Pro 更轻便。带着 iPad 和 MacBook Pro 一起旅行太重了。
  2. 在旅行中拥有更多设备也很难管理。比如还要给额外的设备充电,我得带更多的线,有时还会忘记给其中一个设备充电。此外,跨两个设备同步也很麻烦。

我使用的具体配置

我使用 Jump Desktop,因为它也支持流式传输扬声器和麦克风。如果你想通过流体协议传输音频,还需要安装 Jump Desktop Connect

SwitchResX

我使用 SwitchResX 来为我的 Mac 添加新的自定义 iPad 分辨率。当我的 iPad Jump 到我的 Mac 时,Mac 可以切换到 iPad 的分辨率以匹配 iPad 的屏幕。

首先,截取你 iPad 的屏幕截图。然后,打开照片应用,读取分辨率。我的 iPad 分辨率为 2420 × 1668:

iPad 截图详细信息

然后,水平方向减去 50 像素。在我的情况下,1668 - 50 = 1618,所以新的分辨率为 2420 × 1618。

在 SwitchResX 中,添加该新分辨率。记得选择缩放分辨率。

给 Mac 添加自定义分辨率

然后保存(Command + S),并重启。在 iPad 上,打开 Jump Desktop,使用这个配置:

Jump Desktop Host Machine 配置

为什么要减去 50 像素?

这是因为默认情况下,Jump 不会使用 Home 指示器区域。如果你想使用 Home 指示器区域,你可以在 iPad 上的 Jump Desktop 设置中启用“外观 - 使用 Home 指示器区域”,并且不用减去这 50 像素。

我发现我不想使用这个区域,因为我的 Mac 的 Dock 在底部。使用这个区域会影响我点击 Mac 的 Dock。

蒸馏认知

By: Steven
17 October 2024 at 09:50

有两种方式「通晓一切」:

1、穷具并知晓每一种可能性;
2、找到底层原理后高效推理。

定理:
1、海量数据和滔天算力是不持久的;
2、通用性和低能耗是持久的。

推论:
任何人工智能都需要蒸馏出「认知」才能活下去。

前提:
本地且联网的传感器

先答应

By: Steven
16 September 2024 at 23:58

最近有几件事,给我了一些触动。

因为确诊抑郁症后,我向公司请了长假来休息,所以忽然多了很多大片的空闲时间。可是吃药的感觉很不好,昏沉、嗜睡、动力低下且多屁。我觉得这不是适合我的方式。于是有了健身,有了我的理智告诉我:

先答应,强迫自己出去。

第一件事是汉洋跟我说他们计划九月初去一趟东北,给辽塔扫描建模,问我要不要一起。其实前几年他问过我好多次,每一次我都因为忙于工作,婉拒了,有时呢,是因为懒得动,也婉拒了。这次我心中有个声音:你先答应,然后就不得不去了。我就这么把自己推了出去,跟汉洋、Tim、夫聪去辽西走了一趟。

一上车,汉洋就问我,为什么这次有空来了?我说,重度抑郁症休病假了。他和 Tim 很自然地说,哦,这个咱们身边搞创作的朋友很多,然后就开始直奔沈阳。汉洋还给我拿着一台他刚从日本淘回来的 Mamiya 645 1000s,这是我第一次正经使用一台胶片相机,并且是一台 120 画幅的腰平取景器的机械单反。

这台相机在这一趟,教会我一些事。回头我再把整理好的照片陆陆续续发出来,有些照片我还是很喜欢的。这一趟时间虽然不长,但它不仅让我这个广东仔第一次对东北有了清晰的体会,也触动了我心中的一些东西。

出发前,脑放电波的 Nixon 问我要不要在苹果发布会之前合作一期节目。我下意识地想婉拒,但另一个声音说:

先答应,又不用你操心,你说就好,答应了再说。

这样,我又一次把自己推向了「不得不做」的位置上。

那一期节目似乎很不错,反响挺好。甚至一些路人都留言表示很喜欢这一期,说很有收获和启发。这对我是一种鼓舞。

在东北的路上,我们在车里聊起理想 mega、小米 SU7 的设计,汉洋说我们回去之后录一期节目吧。我其实不太想,毕竟工业设计这个母题太大了,轮不到我这个在设计领域里并无建树的人来说。但是,可以先答应吧,万一能聊出什么来呢?后来回到深圳,汉洋跟轶轩一起,我们仨在汉洋的酒店房间里聊了两个小时,在轶轩那些简单、外行、尖锐的问题的触动下,我觉得那一期节目剪出来之后应该不会太差。虽然可能只是很基础的科普,但大体上应该值得一听。

结束后我问轶轩,这样聊下来,你现在知道工业设计是做什么的了么?他说,虽然不能简单地描述出来,但确实理解了。

这又是一次把自己推出去,但不差的体验。尽管那天我们被突如其来的大雨浇透了,但也因此在轶轩家里打了几把《黑神话·悟空》,能算是好事吧。而且,就在临出门吃晚饭前,辽塔之行的大部分胶片都扫出来了,全部看下来,有几张还是不错的。他俩纷纷表示,作为第一次用胶片,算是很成功了。

也许有鼓励的成份,但有几张我很喜欢,回头要找 Tim 用飞思精扫再制作出来。

和创作有关的事情,我都不觉得累。

最后一天我在 Tim 的工作室里问他:经常接触不一样的项目,你会觉得疲惫吗?他的回答是,如果经常做一样的事,我就会觉得非常疲惫。

我也一样。

那天还偶遇了梁源,他们在楼下录了一下午节目,聊黑悟空里的佛教文化和文物。我旁听了几小段,挺有意思的。节目这两天也陆续上线了,虽然我说很感兴趣,但也确实提不起劲儿去点开它们,只能先 Mark 在列表里。

去找 Tim 的前一天,跟汉洋去了他们现在的工作室。养伤的 JT 在做日常的康复力量训练,看上去也很迷茫。晚上跟重轻一起吃饭,他看着也挺疲惫,疲于应付白天无聊活动的倦怠。我似乎向来都很喜欢这般真性情的人,嬉笑怒骂都可以自然流露。依稀记得也曾有人这样评价我,但又似乎是很遥远的故事碎片。

今天早上突然想看看苹果新品,手欠翻了翻图纸,看着看着就似乎琢磨出一些线索……截图往群里一放,两颗皮蛋就来问我要不要一起做一期节目。

好吧,虽然我原本可能想搞一期《设以观复》的,但我可能做不动了,如果有他们一起搞的话,是不是我自己的节目真的无所谓,但起码算是对一直关注我的人们有一个交待吧。他俩八月份就问过我和 Toby 要不要在发布会后一起录一期播客,没曾想居然还凭空出来期视频。

且不管能出来什么,先答应吧。

答应了就得不得不面对,不能偷懒。

我是病了,但不是傻了,如果说这段时间我发现了什么之前没注意到的事情的话,那就是「先答应」吧。

我过去很紧张,要有安排,要有预期,要有 planB 和后手,但渐渐发现有这些也不怎么管用,突发状况永远层出不穷,它们总能在预想之外的地方出现。先答应,硬着头皮上,反而似乎并没有我以为的那么多阻力。

例如这两天跟着筱烨去了音乐教室,学了十分钟,阿吉就让我弹贝斯,和小柒筱烨合了一首曲子,最简单几个位置就能出来很棒的旋律。今晚的中秋活动,虽然我们都不太想参加,不想去人多的地方,但为了给阿吉捧场,还是一家人都去了。躲在人群里的感觉并不放松也不自在,但音乐本身能令我感到舒服。

如果把抑郁症看作是太上老君的炼丹炉,似乎可行。

升级版的「用户路径」

两年内 Apple Vision Pro 不会出现杀手级应用|设以观复 番外篇 Vol.2

By: Steven
9 June 2023 at 19:05
点击封面到 YouTube 观看视频

点击这里到 bilibili 观看视频

这期视频是一期比较随性的闲聊,主要从产品、设计、混合现实三个角度,谈谈我对 Apple Vision Pro 这款产品的看法。因为几乎都是独白,所以也可以当作一期 podcast 来收听。

以下为文字大纲:

先说我的观点:苹果选择了一条更艰难的路线。但只要「不做缸中脑」的价值观继续贯彻,这款产品的生态和迭代就是非常值得期待的。但是,它不会取代iPhone,它的目标也不在此。从它的产品定义来看,恐怕还有一个更大的 one more thing 在等待发布。

关于产品

1、不是VR!太好了!

2、之前的预测基本都对了:一体机、眼手控制、层与深度的交互、空间建模、空间音频、LiDAR 人脸建模。技术路径的连贯性。我之前说 M2 芯片单独划出了图形引擎,可能是有手势操作的考虑。但当时我还觉得,可能得要到 M3 才会实装,那是我低估了苹果,从各方体验的反馈看,M2 处理手部操作已经非常强悍了。这样子的话,M3 就真的不着急了。

3、从各方体验的反馈来看,初代产品的完成度非常高。但第一代产品很显然不是面向消费者的,从售价和硬件配置来看,都是给开发者的入场券:「想在下一个时代展示你的才华吗?加入我们的开发平台吧!」所以,买不起没关系,因为不用买。虽然,它有初代 iPhone 的感觉了,但很多人不免怀疑是不是要等三四代以后才堪可用?我到觉得不用那么久,因为软硬件的完成度已经是接近 iPhone 4 的状态了,也就是说,它先奠定了空间交互的完整逻辑和操作体验,硬件也足够强大。要知道,iPhone 初代除了大屏幕和多点触控,几乎没有一样拿得出手的东西,但它的交互设计改变了整个时代。所以 avp 剩下需要做的,就是把软件生态做起来。以苹果今天的开发者号召力,软件神态会比 iPhone 初代更快达到 4 代的状态,这个过程会更短。

4、发布会时,我第一处惊讶的地方,外部屏幕显示实时的眼神:你看着它,它也在看着你,实时计算双方关系。之前的观点:空间重建,让设备认识世界。因此设备下方有大量摄像头,用于捕捉用户手部的精细动作,这种程度的认识现实世界,是 avp 空间交互的基础。

5、我之前说过,头显设备不会替代手机,它的续航、应用场景、对空间的要求以及使用方式,都不会是一台手机这样的随身电子设备。这一点,我们从后续的官方设计原则上也能看到苹果对这件事的理解。人是在室内、坐着使用的。因此续航在现阶段并不是问题,它可以连接常电来使用,和我们的任何一台桌面显示器一样。苹果甚至不建议开发者去设计界面还原的操作,因为它们直接在系统内处理好这件事,你换个座位、换张沙发、换张床后,设备自己识别环境来让你视野内的界面回到合适的位置上。

6、官方设计建议,移动时从沉浸空间中淡出,稳定下来后再回到沉浸空间,这也是官方在主动表达,坐下来、在固定的空间内使用。一方面,这是创造沉浸感的条件,另一方面也是考虑到人身安全,在虚实结合的环境里快速地移动或手舞足蹈是很容易弄伤自己的。因此,我们在用现有的 vr 产品时都会有划定安全区这个操作。

7、杀手级应用?很多人说「3D照片/视频」,但我不觉得这个有足够的吸引力。它确实可以提供新的、生动的体验,但要成为「杀手级应用」,需要足够的便利条件。手机摄影之所以可以动摇传统摄影,是随身携带和随时按下快门。但 avp 的拍摄,更类似无人机视角,是一个你需要这样的视角时,才会需要的东西,它不够便利,不够快。avp 真正的的杀手级应用一定不会在一年内出现,甚至是上市后的一年内也不一定有,它需要开发者和时间一起酝酿和探索。况且,比特与原子的融合,还需要很多后台的工作来完善,比如更大的世界模型,或者催生出新的需求场景。总之,独属于这个平台的杀手级应用,一定诞生在基础建设更完善的时机。

工业设计和交互设计

1、现有产品的大融合吗?在我看来,它更像加大号的 aw:如出一辙的曲面玻璃盖板,复杂的曲面贯穿铝合金机身和玻璃,有机的整体轮廓搭配编织物绑带,贴身部分全部由织物和硅胶材质构成。这就是苹果这几年做手表和耳机的过程中总结下来的,穿戴数字产品的设计原则。avp 上的所有细节,都能在 aw 和 app 上找到对应的处理方案。

2、可以说,继铝合金后,另一个材料探索的方向:织物。亲和力、强韧、富于变化,很适合穿戴式计算设备的设计。这类材料是传统工业设计师并不熟悉的,通常只有部分家具设计师和家纺类产品的设计师会接触到。但是要注意一点,编织物是一种复合材料,它不仅不是塑料、金属这类单一实体材料,它甚至可以是不同种类材料的混合编织,因此可探索的边界,以及可变化的范围,是具有很大想象空间的。这类材料师师会比我了解,看看她有没时间出些视频给大家讲一下这类材料的设计。许多年前的宝马概念车和“大白”,都是柔性材料在科技领域很好的启发。我觉得,这是苹果在工业设计上的进一步探索,也将会带来产业链上的变化,类似氧化铝合金的普及,设计师和产品经理可以关注。

3、所有界面片层化、小组件化,所以小组件可以交互了。在分析灵动岛那条视频里我就说,它是中间交互层在 Face ID 上的具体结合。现在再看 avp 的交互,尤其是应用边缘的交互菜单,是不是很自然地从已有的交互习惯转移到新的空间交互里来了?

4、与 iPhone 初代的拟物化界面类似,AVP 采用了和现在 Mac 一致的界面布局和风格,帮助用户和开发者尽快适应新的空间交互。但是,界面风格其实从 iOS7 开始就固定了,毛玻璃一方面是让界面与环境保持良好的光照、氛围的互动,也能让更多层的展开显得自然。值得注意的是,在设计时,设计师和开发者不需要自己做出立体的分层效果,只需要做好平面的分层,毛玻璃的立体分层效果,是系统来处理的。这些协助和预设不起眼,用户也不会注意到,但对于开发者来说是非常有帮助的,它们不仅规范了所有应用的整体品质,也减轻了开发工作量,让更多人愿意为这个生态去做更多的尝试和探索。这也是护城河的一部分。

5、一个细节:设计原则中建议,层窗口不应跟随视线,而是锚定在现实中的固定位置。换言之,作为设计师和开发者,是可以选择跟随或锚定的。据我了解,把虚拟物品和界面锚定在现实中,是一项比较复杂且难度较大的技术,非常容易因为抖动而破坏沉浸感。这是由于细微误差的累积造成的技术问题。我们目前不知道苹果的技术实现方式,但如果明年上市时看到的确实是稳稳锚定的界面,那这背后的技术储备其实是相当深厚的。

6、观看的内容放大放在远处,操控的部件放在近处并且较小。这里用到了一个符合直觉的设计逻辑:电影、模型、网页这些被观察的对象,应该与人保持距离,和显示屏一样,而操控部件应该在离手较近的地方,方便你的视野锁定并操作,和键盘鼠标触控板一样。

7、苹果对层级的设计有建议,新元素出现时,已有界面和元素应该向后退一些,确保主次关系,保证良好的视觉重心体验。但这个尺度所以所有开发者来说都是比较难把控的,后续的设计规范中应该会有系统层面的自动化方案,不需要设计和开发去重新考虑。

8、设计建议中有一项比较值得注意的,是声音。苹果说你可以让界面的声音从前方传来,也可以四面八方,或者某个指定的角度,这取决于你的应用怎么使用、怎么设计。这一点之所以要重点关注,不仅仅是它有空间音频,更重要的是在空间计算的设备中,声音其实已经是整个UI的一部分了。你对应用的体验、理解,以及交互,都将与空间中的声音紧密相关。因此,参与了这款产品开发的苹果前员工也在推上强调,声音的体验是极少人关注、但极为重要的事情,而这款产品会给人巨大的惊喜。我想,所有设计师和开发者都应该注意这件事。

9、通过最简短、清晰的标签和符号,指引人离开、退出。这不仅仅是 UI 规范的事。因为在沉浸空间内,指引不明确是会比操作电脑、手机,更容易感到困惑、惊慌或愤怒的。在你想离开时,眼睛看向标签,锁定,确定,这种确认方式既符合直觉,也给了人可以随时退出的安全感。

10、因为选定完全依靠眼球追踪,所以为了确保准确度,苹果在设计规范中也提到,按钮的实际可控面积是比按钮本身的面积更大一些的。这里我要补充一点,人眼的活动本身并不是完全线性的,在慢速运动时,其实是一顿一顿的,只是大脑算法弥补了这种抖动。因此,在盯着界面看的时候,人眼实际上就处于这种慢速抖动的状态,眼动追踪也会检测到这种眼球抖动。所以,无论是因为算法矫正,还是优化选择容错率,这种选定范围大于实际面积的设计原则都是必须的。这在触摸屏的交互上,也是很常见的规范。但苹果规定一个按钮至少要保证 60 像素的面积,那就是说,它的眼动锁定范围的极限,大概就是在 60 像素这个区间左右。这一点,在推远玻璃面板时,会自动放大的轮廓也有所体现。因为如果跟随距离缩小,会导致后层界面的交互精度下降,造成系统不可用的问题。至于选定具体文字的精准操作,根据前员工的披露信息,我个人猜测,是由传言中的「眼部脑机接口」的「读心术」来辅助完成的。这件事可以以后再跟进确认。

疑惑

1、交互的力反馈怎么处理?对体感游戏很重要。会有单独的游戏配件吗?

2、混合现实游戏的玩法:不是复原现实游戏,应该是现实中玩不到的玩法,比如巫师棋、游戏王。这样的话,其实也不需要力反馈了。

我对于 XR 的一些看法

1、选择了「不做缸中脑」的价值观,很棒!

2、增强现实和人的链接,是融合,不是制造一个虚拟世界代替。iPhone X 发布的时候,我曾写文章说,需要有边框来界定虚拟和现实的边界,因为沉浸感越强越需要清晰的退出机制,人才会有安全感,才更愿意用。这是交互设计要死守的底线。果然,苹果选择用数码表冠来切换融合程度,而且,这是一个实体旋钮,是唯二的实体操控部件之一。可想而知,其优先级和对交互体验的重要程度。

3、因此,是「多一个」,不是替代关系。但说实话,我对人性没有那么乐观,当其生态足够完善后,肯定会有多数人主动选择待在里面的世界。届时,不仅仅是手机被替代,而是连同电视、电脑、大房子、电影院、足球场这些东西,统统都会被吸引这个黑洞里。

AIGC 和 VIS 的类比

By: Steven
16 February 2023 at 12:06

大概是2016-2018年间,我曾经和我司两任平面设计师说:

你们现在的技能在将来用处不大,但不代表平面设计就到头了。本质上 VIS 和 AI(那会还没有 AIGC 这个说法)是差不多的事情,前一个是你设定好规则,然后在不同的应用场景下不断组合复制,后一个是它学会你教它的规则,它来组合复制。一个是手工活,一个是工业化,他俩只是效率的差别。你们未来需要教会这些 AI 什么是好设计、如何做设计,让它释放你的体力劳动,你把时间腾出来考虑更复杂的事情。

那时候,我判断这个事情就是十年左右,没想到,事实上只用了五六年。

当然,以上只是高度简化的说法,但大意如此。

* 拓展阅读:https://mp.weixin.qq.com/s/pv6ECT8WR4tdNhsYiATt2w

人类的定义正在重构的历史开始了

By: Steven
13 February 2023 at 14:02

上周在即刻看到一个话题:

ChatGPT vs. iPhone 两种技术有何异同? 就它们制造产业变革和影响来说,对比思考能否启发对未来的想象?

我目前的看法是:

iPhone 为代表的技术,拓展了人的外延。人是技术网的中心,是作为生物人抛向空中的一块大腿骨。

ChatGPT 为代表的技术,更新了人的定义。信息和意识不是人的特权,是否只有生物人才是人,需要被认真严肃地对待。

前者的产业革新是建立在人脑上限之中的,超过脑容量的部分,推进速度非常缓慢。

后者不存在理论上限,对自身的推进速度远大于前者。但由于前者高度依赖人这个不确定因素,因此,在后者产生革新的同时,会同时产生大范围的剧烈冲突。前者脆弱,但作为后者的基建,这种大范围冲突可能导致两败俱伤,拖累后者进化速度。但因为发展不平均,所以后者会衍生出全新的社会形态。

AI 不需要代替人才能更新「人」的定义,更不必达到硅基生命的程度,只需要在表达方式上像人(即便它根本不理解自己在说什么),就自然会在生产方式和伦理上产生大量冲击。这些冲击会更新人对自身的认识,配合其自身的效率属性,人会主动更新对自身的定义描述。

在此基础上,设计师将来的工作会和今天大不相同。因为我们在思考人与物的关系时,中间的媒介可能不会再是物理交互和界面交互,而是面向 AI 的交互。这种交互可能是有形的,也可能是无形的。另一种更有可能发生的情况是,你所设计的产品不是给人类使用的,而是面向 AI 的中间件,这会改变很多约定俗成的非物理/生物层面的规则。

我们有幸站在了这段历史的开端之中。

第三次接触 VR 环境

By: Steven
20 January 2023 at 01:05

小柒第一次进入 VR 环境,是十月份。那时显济约我喝咖啡聊天,他带来了新买的 pico 4 过来玩,并借我玩了一周。期间我带回家,给小柒体验了两天。

那次他体验的项目是拳击运动,感受身临其境的虚拟现实,与软硬件配合的击打手感。

第二次上手玩,是上周末在附近的商场里,他在一个体验 VR 游戏的空间看了很久。我看他想玩,就让他去找工作人员聊天,搞清楚每个项目的费用、时长,然后自己选定一个去玩。他最后选了一个 ¥68 玩十分钟的模拟厨房的游戏。

其实,他已经很多次在旁观摩别人玩 VR 游戏了。不同的商场里,几乎都能看到那些自助游戏机和这些 VR 体验项目。每次他都会看一阵子,那对他来说,是一个新的世界。尽管,这个真实的世界对他而言也是新的,但那个虚拟现实的空间,是一种连我们这些大人都觉得新鲜的事物,他怎么可能不好奇。

临走前我和他说,我们算笔账:你 ¥68 玩十分钟,如果我花差不多的钱,能一直玩,哪个划算?于是我找显济再次借来他的 pico 4,转了 ¥69.9 给他,买了《爆裂厨房》这款游戏,作为这个春节的新增娱乐项目。

这是第三次接触,他将连续体验至少十天。

今晚,我先给他示范了一次,把新手教程做了一遍。

然后,他靠着自己认识的字阅读任务书,独立完成了新手教程的七套任务。凭着对前期任务教会的那些动作的理解,在后面的过程里,他甚至自己尝试了一些非规定但符合直觉的动作。这很关键,这种举一反三的直觉交互,对产品设计很重要,对将来的人也很重要。

小柒此时六岁,他们这代人的世界观将会和我们八零年代的这批人很不一样。

对于未来的世界,我虽然持着比较悲观的态度吧,但看着他,我还是觉得有希望的。对他,我觉得比较有信心会是个不错的人;对他这代人,我觉得他们会比我们强得多。

现实 vs 虚拟,客观 vs 主观,个体 vs 集体,他和我们所经历的先建立再打碎再重建的过程会不太一样,他会从小就体验、观察和思考这些问题,会有他的理解。当然他会面对更复杂的世界,但任何混乱,都是生机。

尼卡果实并未令我失望

By: Steven
16 January 2023 at 22:34

问题来源:为什么大多数人不能接受《海贼王》橡胶果实变成尼卡果实?

我的观点:

因为尾田既坚持了热血王道漫的套路,又打破了读者既定的期待和幻觉。

无论你作为个人是否承认,但你无法否认一件事,人们喜欢看热血王道漫的一个基本心理预期是:把自己作为故事的主角代入进去,感受那种拼搏到最后,获得成功的痛快!但这个故事套路在大部分人的心中有一个基本模板,那必然是由下至上的成长与逆袭,因为这是绝对多数读者的真实愿望。人们知晓自己的渺小,但渴望成功,这才造就了这类题材的大热。不接受「尼卡」并非不接受这个名字,而是不接受「自己无法继续代入」,无法继续成为「由无名之辈进阶到封侯拜相的故事主角」。人们所失望的,是「那个王不是自己」。

想必很多人不同意这个观点,但我想提三个问题,请各位一起想一想:

1、艾斯死的时候,岩浆凌驾于火焰之上,可以接受吗?

2、获得了同一颗果实的萨博所打出的炎帝,和艾斯的是一回事吗?

3、香克斯能结束顶上战争,五老星也得给面子,真的是面子果实吗?

我的一些浅见是:

一、多数人并没有因为艾斯的死而质疑果实上下级的关系,最核心的原因在于,几乎没有读者会把自己代入到艾斯的角色里,不会觉得自己的愿望无法达成而失望和愤怒。因此可以比较冷静地从旁分析果实上下级的合理性,去理解这个设定的前因后果,甚至认为尾田这么画是故事推动到此处的必然,是故事的神来之笔。

但其实岩浆是高温融化的石头,火焰是氧化反应的表象,两者根本不在一个维度上,除了温度高低外并没什么关联,但没人会在乎这种类型的 bug,因为它不影响读者的阅读体验,没人会觉得自己是艾斯,给我个差不多的理由就行。

二、如果两个人拿到同一颗果实后,施展出的是不同的招式,那么我们可以说,个人对果实能力的开发至关重要;如果两个人施展出的是同一种招数,只是训练强度不同,造成的效果强弱有差异,那么,个人对果实的开发就不是那么关键的,而是训练的效率更为重要。

回到艾斯和萨博的例子上,这一招炎帝,是属于艾斯的,还是属于果实的?

很显然,既然萨博能够打出和艾斯差不多的炎帝,那就意味着,炎帝不是艾斯的专属,是任何一个拥有这个果实的能力者都可以训练出来的一门技术。那么,作为一门技术,它能否发挥出强大的效果,是取决于果实本身,还是使用果实的人?我相信黑胡子很清楚这个道理,否则他不会那么执着于获得白胡子的果实,更不会坚持要打造最强的全员能力者海贼团。因为他是懂得技术的价值与人的关系的人,不然他干嘛要隐藏那么多年,一心选定暗暗果实呢?尾田把手术果实安排给艾斯的话,合理吗?

再进一步,既然贝加庞克能够复制果实能力,能够把血统因子工程化,那就意味着无论是果实还是种族,在海贼世界的设定里就是科技树的一部分。但凡是科技,是刀杀人还是人杀人的争论就绝对不会停止,但无论怎么争论都必须正视一件事:没人使用的科技,啥也不是。

换句话说,尼卡这门技术可以交给任何人,但最好是路飞。

因为那么强大且令人发笑的能力,最好交给最纯真的那颗心来驾驭。这样的剧情安排才合理,否则这个从一开始就贯穿至今的「Joyboy」到底「Joy」在哪里?让巴基来 Joy 大家吗?一个胆小怕事的真小丑,你觉得能够让大家 Joy 起来吗?还是交给黑胡子这样的终极大恶,最后用橡胶锤打扁他?

我相信 Joy 不是那么肤浅的快乐。

它最好由一个没心没肺、吃人一口饭就念着报恩的傻子来实现。

三、比起路飞的宿命,这个红发男人的宿命就不值得失望和愤怒了吗?

这个男人串起了消失的一百年、月球文明、世界政府的巨型草帽这种超巨大的谜团,这样的人会因为一个村子的小孩吃了个橡胶果实不能游泳就舍弃一条手臂?已经把新世界的希望堵在这种事情上了,哪个脑回路清晰的作者会把解题的重点放在刻苦开发果实能力、卷赢其他能力者这个方向上啊?

大家都是东亚文化圈里熏陶出来的人,尾田会真心觉得卷是路飞的出路吗?香克斯和路飞一出场就把牛吹那么大,一个随意进出世界政府的面子人,咱们平心而论,他罩着的主角要只是个逆袭屌丝,你觉得这样的安排跟玛丽苏/杰克苏有什么区别?

宿命,不是原罪,无力面对宿命才是。

假如后期的剧情,路飞成为尼卡果实的表演者,失去了作为他自己的个性,没有主导和实现自己的想法,那么我会说很失望;如果接下来的路飞依然是那一千多话的没心没肺大笑、快意恩仇不拘小节的大傻子,做判断的依据仍然是他的纯真内心,那他就是尼卡的主人。

很多人觉得自己只要也拥有了一个亿,就也能干出一番伟业来。这是宿命论者们最喜欢相信的谎言,也是被宿命打击时最容易失望和放弃的原因。但事实上不是的,你拿着顶尖的武器,没有使用它的方法和能力,你什么也做不了。

海贼世界里,哪个能力者的果实和他的个性不是对应关系的?这就不是宿命了?这有一颗果实,无论什么属性,是它主宰你,还是你主宰它,这才是宿命与否的唯一判断。

我不认为随着剧情的推进,尾田一点点把世界观和科技树铺陈开,这有什么问题。尤其是当你知道,古代的科技远超今天,此时的科技全靠考古的时候,一切都说得通了。那么果实这种科技产品,作为一项工具被人使用,就一定不会是卷中之卷的通关秘籍。

路飞拿了一手好牌就令人失望么?

不是的,他把好牌打烂了才令人失望!如果没有前面一千多话的历练,那么尼卡果实就是个普通的橡胶球,路飞也不过是个不会游泳的普通人;为什么在打凯多的时候觉醒,恰恰是因为凯皇才配得起这个巨大的份量,只有被三番五次打败后的路飞,才有机会完成历练,让尼卡成为尼卡,让自己成为配得起尼卡的那个人。

路飞正在成为可以直面和挑战宿命的那个人,把自己代入到主角视角的读者,也应该有这份心情和觉悟,才能体会到「命运管不着老子」的热血王道漫之精髓!尾田是真懂的。

播客的收听数据似乎很符合我的期待

By: Steven
7 June 2024 at 00:30

其实有点出乎我意料,除了 Apple Vision Pro 那期,最受欢迎的居然是聊《九龙城寨》和《暗恋桃花源》的这两期。而且,刚发的《谈判专家》这期的收听量也在稳定上涨。聊 AI 那期尽管内容很多,但收听量比这些都少得多。

从博客后台数据能看到,最近一周的主要收听量中,三分之二都来自这三期聊戏聊剧的节目。

我原本以为,收听我节目的主要人群,是过去在知乎和 B站看我讲设计的读者和观众。

这么看下来,我有一个猜测:收听我播客的人群当中,有很大一部分比例,可能是此前并不认识我的路人,他们对科技类话题的兴趣,没有对娱乐类型的话题高。

挺好的,这也挺符合我最初对播客的预期,这样我就可以不用老聊设计和产品了!

荒野楼阁 WildloG:https://suithink.me/zlink/podcast/

小宇宙: https://suithink.podcast.xyz

Spotify:荒野楼阁 WildloG

YouTube:荒野楼阁 WildloG

Apple Podcast 在中国大陆地区目前只支持通过 URL 订阅:

https://suithink.me/category/podcast/feed/

科技是由人文驱动的:体验后再谈 Apple 空间计算机_1.ylog

By: Steven
1 May 2024 at 20:03

前几天我去找一位科技媒体的朋友,体验了一晚上 Apple Vision Pro(苹果新推出的空间计算机),我将那晚体验的感受以及我们讨论的内容,整理出了这一期节目。本期节目为单人讲述。如果你遇到网络环境波动问题,加入列表缓存后,即可正常收听。

在这一期,你会听到:

—- 交互设计很优秀,但为什么说它不完整且反直觉?

—- 你的眼睛是你的注意力,你的手是你的行动,日常生活中我们这两个部份是分工协作,分头行动的,但在 Apple Vision Pro 的交互体验中,这俩完全没法分开;

—- 空间沉浸感一流,彩透效果超群,但多任务体验并不好;

—- 这种立体感,和在电影院里看 3D 电影是很不同的。Apple Vision Pro 这个恐龙的应用所展示出来的,是一种大脑完全相信的,是一个空间,而不是把前后景处理得很好的分层的画面;

—- 眼动追踪像魔法,但也很脆弱:

—- 当我刚设置完的时候,他非常的准,极其的精准,真的就是魔法一样,指哪打哪,很爽,但是在我用了一段时间以后,他会稍微有一些偏移,就对不准了;

—- 眼动追踪矫正流程中的色彩细节,为什么?

—- 最喜欢的两个应用:看星星,火星车;

—- 这就好比你画画的时候,需要用笔,但你一旦需要在三维的空间里去做雕塑,你需要的是雕刻刀和铲子;

—- 太顺理成章的工业设计:苹果的行活儿;

—- 缺少思考后的冲突感,仿佛设计部门和工程部门都没有怎么吵过架就落地了;

—- 预言:什么时候能普及?

—- 普及的好产品 = 渣男喜欢的类型

—- 强制性 vs 超越感官

—- 不要抽象地谈论科技:科技是由人文驱动的

|登场人物|

苏志斌:工业设计师,车联网智能硬件产品经理/联创,《设以观复》作者

|相关链接|

若你所使用的播客客户端未能完整显示插图,或遇网络问题未能正常播放,请访问:

荒野楼阁 WildloG 的地址:https://suithink.me/zlink/podcast/

阅读设计相关的各类文章:https://suithink.me/zlink/idea/

|其他社交网络媒体|

苏志斌 @ 知乎|SUiTHiNK @ 即刻 / 微博

苏志斌SUiTHiNK @ Bilibili / YouTube / 小红书

|联络邮箱|

suithink.su@gmail.com

欢迎在 小宇宙、Spotify、YouTube、Apple Podcast 收听本节目,期待你的留言。

💾

让 MJ 学我画两张小画儿

By: Steven
7 April 2024 at 12:58

昨晚吃饭前跟儿子一起画画,我随便画了一下我们在 Minecarft 里的第二个家,和随便画的一个岩浆包围的高堡:

后来想说看看 Midjourney 能模仿成怎么程度,就丢进去试了一下:

emmm,画得还行……

就是画风不太相关,它有它的训练痕迹,哈哈哈哈哈哈哈~

测试所使用的 prompt:

Tree house, jungle, rainforest, simple little house –sref+空格+两张手绘图的地址 –ar 9:16 –s 50 –v 6.0 –style raw

苹果停车转 AI 将引发人才大震荡

By: Steven
28 February 2024 at 20:16

1、没有 AI 的汽车、手机、电脑、平板等,将是一堆废铁;

2、一家公司的核心战略不能同时放在两个大方向上。

综上,停下造车全攻 AI 是非常明智的。

连键盘侠都知道「不难」的造车,没造出来不是造不出来,是制定的目标太远太高。苹果之前想一步到位搞出 L4 的移动座舱,但现阶段的人类还没有办法,这太难了。在他们之前的设想中,自动驾驶的汽车和 Apple Vision Pro 是可以放在同一个场景里的。但很显然,这个步子太大了。用新势力们的方式当然可以,但那不是苹果想做的。

最关键的是,AI 的大爆发是此前大家都没料到的。没有这事儿,车还是一个重要的方向,但这一波爆发的 AI 不是资本热潮,而是实打实的浪潮了,此时不全力转向,是真的会死的。况且苹果并不是没有在 AI 上投入的,这些年一直都在积累,只是权重还没拉到那么高。现在切方向,即是大势所趋的必须,也是归拢资源的必要。

过去 Jony 可以对供应商说,这里有一桶取不完的钱,你能做到你就能拿走,以此把工业设计拉高到一个令人望尘莫及的程度;今天的苹果比二十年前拥有更多的现金,有自己的芯片和庞大的人才库,有海量的设备和训练数据,可以说:

比起造车,AI 才是更适合苹果干的事;

干好 AI 所需的人才、数据、算力,也是他们的优势。

以苹果的财力,下这样的决心,恐怕要出现一次人才流动的大震荡。

原文发布于知乎提问:

苹果取消探索十年之久的电动汽车项目,将团队转向生成式 AI,原因有哪些?会带来哪些影响?

Vision Pro 首发体验

By: James Guo
5 February 2024 at 03:00

美东时间 2.2 日早上 8:00 自提的设备,本人不佩戴眼镜,因此已经使用了完整两天,这里更新下自己的一些发现。

配置选择

我选择的是 512GB 的版本,主要考虑是 Vision Pro 上的一些软件/游戏可能会有更多的 3D 场景,会更消耗存储空间。但大多数时候又是在 Wi-Fi 环境下使用,所以 1TB 版本又没有那么有必要。

UI 显示效果

本人之前没有使用过其他 VR/AR 类产品(排除 Google Cardboard😂),所以并没有感觉到 Vision Pro 有多么的好。相反,我的感觉是 Vision Pro 的显示效果其实完全无法代替 Studio Display。与其它类型的显示器相比,它有这些特点

清晰度:5K 显示器有着明显锐利的多的画面,并且能肉眼感觉到显示器的色彩空间也更好。目前看来 Vision Pro 的显示清晰度大约相当于 2.5K 的水平,显示效果:高端显示器 >> Vision Pro > 高端投影。仔细观察,我是可以看到 Vision Pro 中的像素的。我的视力也并非完美水平,处于轻微近视,在不配矫正镜片的时候依然能察觉到像素。

HDR 效果:得益于 micro-LED,HDR 效果还是相对突出的,好于显示器和投影,但高光的亮度又比不过 iPhone 的 OLED 或者是 MacBook Pro 的 miniLED。

自适应的渲染:之前的清晰度是我将窗口调整到我平时操作显示器的大小时进行的比较。但 Vision Pro 的窗口是可以调节的,包括远近和大小。此外,眼镜在物理世界里的位移也会影响到显示:当你贴近时,可以看到更清晰的画面。如果说视网膜屏幕是 @2x-@3x,那么 Vision Pro 则是 @1x-@9x(9x是打个比方)。Vision Pro 中的所有系统UI(包括网页上的SVG/文字)都是矢量渲染的,不需要 Zoom In,只需要人走进显示区域,就会发现每一个小字/矢量图都会变的无限清晰。

亮度:感觉达不到 500nits,如果在白天摘下眼镜,会明显感觉到真实世界更亮。但这一点不是特别影响体验。

透视效果

透视的清晰度则是远差于 UI 显示的清晰度,摄像头的分辨率其实不高,看真实世界完全到不了 4K 水平。但可以感觉到其曝光控制非常优秀,画面里没有过曝或者欠曝,是可以戴着它生活的(如吃饭)。但无法使用它阅读小一点的文字(过于模糊,无法阅读;比如食品配料表或者手机上的小字都是看不清的)

透视效果属于能用的水平,在家里时我佩戴并四处走动是没有任何问题的。

舒适度和重量

一开始使用 Solo Band 的时候用久了还是挺不舒服的,但我现在换用 Dual Loop 并仔细调整后,发现比刚开始戴的时候舒服了非常多,感觉用个一两小时是没问题的。Dual Loop 有两个地方可以调整,建议多试,太紧或者太松都会导致不舒服。躺着用反而不舒服,比较压脸颊。重量肯定是能感知到的,希望有一天可以做到跟眼镜一样轻。

操控

操控总体而言比较方便,如果Mac的触摸板操控是 10/10 分,iPad 算 9/10 分的话,Vision Pro 现阶段已经能达到 8.5/10 分(除打字外)。滚动非常跟手,滚动是有高刷的感觉的,明显好于 60Hz。但有时候手放在了摄像头看不见的位置(比如桌子下面),这种神奇的体验就没了,然后就会想起:啊,原来是摄像头捕捉的我的手势。

除了捏合 🤌 控制,直接点击按钮也是可以交互的,把窗口“拉近”,然后像iPad那样拿食指直接点空中屏幕就可以操作,对电脑版网站按钮很小的还是很有用的。YouTube 网页版就属于适配的不那么好的网站之一,有一些按钮之间离得近,用点击的方式会更方便。

对于 iPad compatible 应用,操控体验也还不错。非常多软件(包括苹果曾经宣传过支持 Vision Pro 的 Apps),其实都只是 iPad compatible 版。试了 iPad 版的:Lightroom 、Paramount+、Maps 等,会发现 iPad 版的 App 体验已经惊人的好了。最大问题还是 Typing 体验差。细想起来,苹果在 iPad 上加的前台调度、鼠标指针、Apple Pencil 的 Hover 功能,都跟 Vision Pro 的交互惊人的相似,所以支持了以上功能的 iPad Apps 在 Vision Pro 上体验很好。

打字的话现在我最喜欢的方式是用双手食指点键盘。现在已经逐渐习惯了,但还是差于iPhone的小屏幕键盘。蓝牙键盘还有待尝试。

用久了 Vision Pro 后,每当我在现实世界里看到个屏幕觉得离我远/位置不对,就想要 🤌 把它调整下,但却发现不行 😂。感觉这会是未来人下意识的一种手势,类似刘慈欣三体里描述的情形。

软件体验

软件我感觉只做到了苹果的后期 Beta 水平,还算不上正式版。首先就是目前只能输入英文,其他任何语言的输入(比如中文)都不支持,包括键盘和 Siri 语音。其次就是我发现 visionOS 1.0.2 并不支持 iOS 17.2 推出的 iMessage 信息联系人密钥验证。这点其实 Xcode 也已经暗示了:如果在 Xcode 15.2 中将软件的 Minimum Deployment 设置为 17.2,那软件将无法在 visionOS 1.0.2 中运行。因此得出结论:visionOS 1.0.2 = iOS 7.1。这点就可以看出 Apple 发布 Vision Pro 还是很急的,或许是苹果觉得 visionOS 1.1 的 Bug 太多了,所以苹果就没有发布,导致了现在功能不匹配。顺便一提:iOS 17.1 发布时间是 2023 年 10 月 25 日,iOS 17.2 发布时间是 2023 年 12 月 11 日。

IMG_0002 2.jpeg

外接 USB 设备

没有任何外接 USB 的能力,这点比 iPhone 和 iPad 都差。因此 Vision Pro 也不支持 YubiKey 5C NFC,因为既没有 USB 口,也没有 NFC。如果你想登录一个网站但你只配置了 YubiKey,那抱歉,登录不了。当然 Passkey 是支持的。

Mac 扩展屏幕

很多人对扩展 Mac 屏幕很感兴趣。个人觉得扩展屏幕体验还是远差于真正的显示器的。同样价格可以买到比 Vision Pro 显示效果好得多的显示器。但如果你主打的是便携,比如希望在飞机上、酒店里也有显示器,或者希望隐私,比如不想让其他人看到你的屏幕,那它还有点用。

个人感觉 Vision Pro 显示效果是略差于中端 4K 显示器($1000 美元左右)的。延迟也还是有的,具体体验可以参考 iPad 作为扩展屏的延迟。我个人不会拿 Vision Pro 主要作这个用途。

Persona (Beta)

属于能用,但只还原了人脸的 90-95%。已经有点恐怖谷效应了。有总是比没有强的,我觉得我使用它参加视频会议不会特别尴尬。

坐车体验

坐车使用完全不可行,哪怕启用了 Travel Mode,至少小汽车是不行的。首先Vision Pro会错误定位,因为窗户的存在,有时会认为你在快速移动,有时则定位失败。但这个其实好说,属于软件问题,但下一个问题就是物理问题了:就是因为它比较重,在有颠簸车上受加速度影响脸部会异常难受。因此起飞/降落/Taxiing/气流颠簸时都不建议用,小心脸疼。

因此坐车时还是 iPhone/iPad 体验更好。我以后不会在坐车时使用 Vision Pro。

其他缺点

EyeSight 非常鸡肋,亮度很低并且分辨率也很低。iFixit 的拆解也得出了原因,是为了还原眼镜的 3D 效果不得不做出的妥协。眼睛的还原必须是立体的,不然外人将无法知道你在看谁。

总结

我认为 Vision Pro 已经接近成熟了,软件上已经达到了最后一个 Beta 版本的可用性。软件上相对欠缺,但我觉得未来几个月内会迅速弥补上。

毫米波 5G 有多快? 2000Mbps! 快来看看你的 iPhone 是否支持毫米波

By: James Guo
20 February 2022 at 23:59

本文对比了中频 5G 和毫米波 5G 的速度差异,提供了判断 iPhone 是否使用毫米波的方法,讲述了 5G 不同图标的含义,对比了 5G 的低频、中频和毫米波,并列举了 iPhone/iPad 不同型号对毫米波支持的情况。

最近分别使用手头上的国行和美版 iPhone 对比了一下中频和毫米波 5G。都是相同运营商 (Verizon Prepaid) 的相同套餐 (Unlimited Plus),使用实体 SIM 卡,在完全相同的地理位置进行的测试。

毫米波 5G (28 GHz)

可以看到,毫米波 5G (高频,mmWave) 轻松跑到了 2000Mbps。

最高也可以跑到 4000Mbps

如上图所示,也有人在 Reddit 上跑出了接近理论峰值的 4000Mbps。但我试了多次最高 “也就” 2000Mbps。

中频 5G (3.7 GHz)

中频 5G (Mid-Band) “只” 跑到了 929Mbps。

就本次测试看来,毫米波 5G 要比中频 5G 快 2 倍左右。在各自的理想情况下,毫米波 5G 可以比中频 5G 快 2-3 倍。

如何判断 iPhone 是否使用毫米波?

在系统的通话页面输入 *3001#12345#*,然后点击呼叫。随后我们就可以看到下方视频所示的 Field Test Mode。选择 5G 中的 Nr ConnectionStats。若看不到 5G 相关选项,则说明当前没有 5G 信号,或机型/运营商不支持 5G。然后看 Band 中的数字。该视频中 band 数字为 78,为中频 5G。

查询当前使用的 5G 频段

若数字小于 200 (如上图),则说明没有使用毫米波。若显示大于 200 (常见的有 257-262),则说明已经连接到了毫米波 5G。具体使用的频率可以参考这个表格

并非所有支持 5G 的 iPhone 都支持毫米波 5G。目前只有在美国购买的 iPhone 12、13、14 系列在美国才能使用毫米波 5G 网络。

5G 图标

根据苹果官网,5G 是有多种图标的。如果只显示 5G,则是连接到了最普通的 5G,速度比较慢。若看到了 5G+、5G UW 和 5G UC,则说明可能连接到了毫米波 5G,速度更快。但实际上,显示 5G+、5G UW 和 5G UC 并不代表使用了毫米波 5G (也可能只是中频 5G)。此外,在美国之外的其他国家即使连接到了中频 5G,也只显示 5G。

5G 图标一览

5G 常见的三种频段:低频、中频、毫米波

低频的范围在 1 GHz 以内,中频在 1-6 GHz,毫米波则在 24-40 GHz。

低频 5G,也叫 5G Nationwide (Verizon)、Extended Range 5G (T-Mobile)、5G (AT&T)。是覆盖最广的 5G,但速度也不是很理想,有的时候甚至不如 4G/LTE 的速度。目前现有的很多 4G 基站都可以比较轻松的升级为低频 5G。在我看来只是准 5G 网络。

中频和毫米波 5G,也叫 5G Ultra Wideband (Verizon)、Ultra Capacity 5G (T-Mobile)、5G+ (AT&T)。是真正意义上的 5G 网络。

目前在中国,所有运营商的 5G 均使用中频。相比毫米波,中频在相同的基站数量情况下,覆盖的更广。这是因为中频的波长更长,传播时相比毫米波更不容易被障碍物遮挡。

LTE-Advance,也叫 5G Evolution (AT&T)。是指使用了载波聚合、4x4 MIMO 和 256 QAM 等技术的 4G 网络。这种网络根本不是 5G 网络,只是比较快的 4G 网络。

iPhone 不同型号支持的 5G 一览

苹果官网搜索你的手机型号(如 A2629、A2634、A2639、A2644 则为中国大陆及港澳地区的 iPhone 13 系列的型号),然后查看是否支持 n257-262 中的任何一个频段。截止到目前,只有在美国销售的 iPhone 12/13/14 支持了毫米波。你可以在机身背面看到型号。目前支持毫米波的型号有:

  • A2650: iPhone 14 Pro
  • A2651: iPhone 14 Pro Max
  • A2649: iPhone 14
  • A2632: iPhone 14 Plus
  • A2483: iPhone 13 Pro
  • A2484: iPhone 13 Pro Max
  • A2482: iPhone 13
  • A2481: iPhone 13 mini
  • A2341: iPhone 12 Pro
  • A2342: iPhone 12 Pro Max
  • A2172: iPhone 12
  • A2176: iPhone 12 mini

还有一个更简单的方法:看 iPhone 右侧是否有毫米波天线的开口(图源 Apple)

支持毫米波的 iPhone 的毫米波天线位置不支持毫米波的 iPhone 则没有毫米波天线

这个毫米波天线开口很像 iPad 系列 Apple Pencil 的无线充电开口,但他们确实不是一个东西,不要混淆。

其次,如果你手持 iPhone 14,判断方法更为简单,只要没有实体 SIM 卡槽,就是支持毫米波的美版。

iPad 不同型号支持的 5G 一览

同样的,你可以在苹果官网搜索你的 iPad 型号。你可以在机身背面看到型号。目前支持毫米波的型号有:

  • A2379: 12.9 英寸 iPad Pro (第五代)
  • A2301: 11 英寸 iPad Pro (第三代)

Mac mini 有什么用?组建家庭服务器!

By: James Guo
27 November 2021 at 22:00

最近我从闲鱼上购入了一个二手 Mac mini,2020 年 M1 版。我选择的是配有 8GB 内存和 256GB 存储空间的最低配置,当时大约花了 CN¥3,600 左右。目前已经使用有一个月左右,用它组建了旁路由、远程时间机器(Time Machine)备份、SMB 文件共享、远程桌面连接、内网穿透等功能,可以说是物超所值了。

谈谈 2020 M1 Mac mini 的配置

Mac mini 是苹果的小主机,类似 Intel® NUC 这种迷你 PC。它不配备键盘、鼠标、显示器,因此相比 iMac 也更加实惠。

这一代 Mac mini 是首款搭载 Apple Silicon 的 Mac mini,基于 ARM 架构的它拥有更优秀的能耗比以及更好的性能。它的 Geekbench 4 跑分为 7422,高于基于 Intel 芯片的最高配 Mac mini 的 5488 分。不过,受 M1 芯片限制,它只有两个雷电 3 接口,而不是 4 个,而且它只支持连接最多两个显示器。不过,相比搭载 M1 芯片的 MacBook Air 和 MacBook Pro,它的接口要更丰富——它额外有一个 HDMI 2.0、千兆网口(可升级到 10Gb 网口)和两个 USB-A 接口。

个人认为 Mac mini 的定位大于等于 MacBook Air,小于等于 iMac、MacBook Pro 系列。所以在未来,苹果也有可能推出搭载 M1 Pro/M1 Max 芯片的 Mac mini。

作为服务器需要修改的一些设置

自动登录

自动登录是非常重要的一个功能。启用自动登录可以实现在更新 macOS、重启电脑后,不需要输入密码即可自动登录到用户界面,并启动相关的服务。可以说是将 Mac mini 作为服务器,尤其是远程服务器所必须要打开的一个功能。具体的操作方式请参考这个文档。需要停用文件保险箱才可以启用这个功能。

配置防火墙和路由器

macOS 的共享功能会监听所有的网络接口。如果你的运营商提供了公网 IPv4,则可以通过端口转发或者 DMZ 主机的方式将 SMB 暴露在公网即可。如果需要 IPv6 访问,则需要关闭光猫以及路由器上的防火墙,允许外部传入的 IPv6 连接。

远程登录和远程管理

开启远程登录和远程管理不仅可以方便的远程管理 Mac mini,还可以直接使用 macOS 环境去执行应用程序。开启远程登录后可以使用 SSH 连接。开启远程管理后可以进行远程屏幕连接。

远程登录配置截图

在 macOS/iOS 上,我使用 Screens 去远程连接 Mac mini。如果你在 iPad 上使用,我推荐安装 SwitchResX 来自定义屏幕分辨率,实现完美适配 iPad 的效果。需要注意的是,iPad 底部可能会留有部分安全距离,这在设置分辨率时需要减去。在我的 11-inch iPad Pro 上,底部有 40 像素的安全距离。除了分辨率之外,我还将刷新率降低到了 30Hz,以减少网络传输上的压力。

远程屏幕连接完美适配 iPad

需要注意的是,开启远程登录和远程管理前,一定要为你的 Mac 设置强密码,否则极有可能密码被暴力破解。

通过远程连接,甚至可以在 iPad 上使用 Final Cut Pro。经过本人实际体验,在同城市通过互联网连接操控时,感觉不到明显卡顿,完全可用。需要注意的是,使用 Final Cut Pro 时屏幕宽度必须大于 1280px(HiDPI 时为 2560 个像素点)。可以使用 SwitchResX 根据应用程序自动切换分辨率。下面这张截图是在 11-inch iPad Pro 上缩放显示的,因此有些许模糊。

在 iPad 上使用 Final Cut Pro(通过远程连接)

Mac mini 作为 NAS 使用

macOS 的文件共享功能可以直接将 Mac mini 变成一个 NAS。只需要打开系统偏好设置——共享,然后启用 “文件共享”,就可以实现 NAS 了。Mac 使用的是 SMB 协议。建议使用有线网络以确保稳定性。

启用 “文件共享”

注意,你可能需要进入高级选项,然后启用 “Windows 文件共享”,才能在某些客户端上连接 SMB。

启用 “Windows 文件共享”

如果你想允许访客访问,你不仅需要在用户里添加 “任何人”,还需要在高级选项里打开 “允许客人用户”。此外,还需要在系统偏好设置——用户与群组——客人用户中启用 “允许客人用户连接到共享文件夹”。这时候,可以以用户名 “Guest”,密码空的方式连接 SMB。

高级选项打开 “允许客人用户”启用 “允许客人用户连接到共享文件夹”

共享外部硬盘

Mac mini 的雷电 3 和 USB Type-A 接口很适合用于连接外部硬盘,连接的外部硬盘也可以通过文件共享去分享,只需要在添加外部硬盘到 “共享文件夹” 中即可。

组建 RAID 和 Fusion Drive

我为我的外部硬盘配置了 RAID 和 Fusion Drive。我使用了 4 个 3TB 3.5 英寸 HDD 和一个 1TB SSD。其中 4 个 HDD 是通过四盘位硬盘盒的方式使用 USB Type-A 口连接到 Mac mini,SSD 使用雷电 3/USB 4 硬盘盒连接到 Mac mini。我在硬盘盒上做了 RAID5,将 4 个 3TB HDD 变成了 9TB 的存储空间。然后在此之上又使用 Fusion Drive 将其与 SSD 融合,最终达到了 10TB 的容量。Fusion Drive 配置方法我参考的是这篇文章

我选择使用 APFS 作为文件系统。主要是因为新版本 macOS 已经不支持新建 HFS+ 加密分区,而且由于有 SSD 的加持,并不是很担心性能下降。

作为时间机器(Time Machine)备份目的位置

同样是在高级选项中,打开 “共享为时间机器备份目的位置” 即可。在需要进行备份的 Mac 上,使用访达(Finder)菜单栏中的前往——连接服务器(⌘K)连接到这台 Mac,然后就可以在系统偏好设置中的 “时间机器” 里找到通过文件共享的文件夹了。

连接服务器

我目前是通过 Internet 的方式连接到 Mac mini 实现异地备份的,首次备份花了大约 6 小时,之后每次备份都能在半小时内完成。我还添加了一个通过 USB 连接的 HDD,系统会使用两个磁盘轮流备份,成功实现了一个异地备份、三个存储介质和三份拷贝,符合备份 3-2-1 原则

时间机器设置

对 NAS 上的数据进行备份

为了更好的安全性,还可以对 NAS 上的数据进行备份。我选择使用 Mac mini 上安装的 Carbon Copy Cloner,将 NAS 上部分重要数据再次备份到本地局域网的 AirPort Time Capsule 上。我选择备份到 APFS 文件系统的 Sparse Bundle 上以实现快照和加密。

Carbon Copy Cloner 的配置

同步照片——Lightroom Classic CC

由于有了这个 10TB 的 NAS,我果断将我的 Adobe 订阅从 Lightroom (1TB) 换到了 Photography (20GB)。Photography (20GB) 相比 Lightroom (1TB) 多了 Photoshop CC 和 Lightroom Classic CC。其中 Lightroom Classic CC 使用的是本地的照片库,同时还可以与 Lightroom CC 进行同步。我在 Mac mini 上安装了 Lightroom Classic CC,并打开了同步功能,将之前所有的 Lightroom CC 图片均存储在了本地,然后在 Lightroom Classic CC 上对这些图片取消同步。很快,我的云空间就全部释放了。然后,我再将这些照片重新添加到同步文件夹中。此时,Lightroom Classic CC 只会上传这些照片的智能预览(就是相对低分辨率的 RAW 格式),这些照片不占用云端存储空间。以后,当 Lightroom CC 的空间再次不足时,我依然可以使用这个方法释放 Lightroom CC 的空间。

不占用云空间的同步

现在,我可以在我的任何安装了 Lightroom CC 的设备上对照片进行编辑。不过,如果需要导出原图,则仍需要在 Mac mini 上的 Lightroom Classic CC 操作。为了能够在其他桌面设备上导出原图,我需要在其他设备上拥有——1. 原图文件、2. 资料库。我选择使用 ChronoSync Express 对原图文件进行双向定时同步,使用 iCloud 云盘同步资料库(包括标准预览、1:1预览、智能预览)。经过我实际测试,发现 iCloud 是支持增量同步的,即每次修改资料库后只会同步资料库文件中改动的文件块。

需要注意的是,Lightroom Catalog* 文件必须在同一个目录下。如有必要,可以使用软链接的方式实现在不同位置存储它们的原始文件。我一般会将原始文件存储在外置硬盘中,这样可以节省本机空间。当外置硬盘不可用时,依然可以使用智能预览进行编辑。

旁路由

我使用 Surge 这个软件的 DHCP 服务器实现旁路由。Surge 可以接管局域网设备上的请求,对其重写、抓包、解密、代理等,十分方便。需要关闭路由器/光猫上的 DHCP 服务器。

Surge 的 DHCP

打开 Surge 的增强模式,然后在 DHCP 页面中右键选择设备,然后开启 “使用 Surge 作为网关”。将那台设备重新连接到网络,其流量就会被 Surge 接管。

内网穿透

同样是使用 Surge,在其配置文件中加入如下内容:

[Snell Server]interface = ::port = 6160psk = SOME_RANDOM_PASSWORDobfs = offipv6=true

然后,在其他设备上的 Surge 加入如下代理配置:

[Proxy]Mac mini = snell, mac-mini.sgddns, 6160, psk=SOME_RANDOM_PASSWORD, udp-relay=true, tfo=true[Rule]IP-CIDR, 192.168.1.0/24, Mac mini

需要更改 SOME_RANDOM_PASSWORD 为一段随机字符串,更改 192.168.1.0/24 为你的内网 IP 段。现在,就可以实现内网穿透了。

下载器——qBittorrent

我推荐使用 qBittorrent 作为下载器。其内置的 Web UI 可以方便的在其他设备上控制 qBittorrent.

配置 qBittorrent 的 Web UI在其他设备上通过 Web UI 控制 qBittorrent

Mac mini 的替代品

有些人可能觉得使用树莓派就行了。实际上,树莓派确实可以实现大多数功能,但是它却没有 macOS 环境,无法安装 Lightroom Classic CC、Final Cut Pro 等软件。

当然也可以使用 Intel® NUC 等 Windows 主机来代替 Mac mini,可以实现类似的效果。

Magic Keyboard (妙控键盘) for iPad Pro 使用体验

By: James Guo
20 April 2020 at 15:43

刚刚收到了 Magic Keyboard (妙控键盘) for iPad Pro (11-inch)。Apple 在今年年初悄无声息的发布了配备双摄的 iPad Pro 2020 款,性能变化不大,主要是起配 128GB、价格下调。最主要的更新就是适配鼠标和触摸板的 iPadOS 13.4 以及刚刚开卖的 Magic Keyboard for iPad Pro。新的键盘同时支持 2018 和 2020 款 iPad Pro。这一代有着更好的支撑模式,改进了键盘,新增了 Type-C 充电,并增配了类似 Mac 的多点触控板。

功能概述

  • 可以无极的调整倾斜角度
  • 使用最新的的剪刀式结构键盘
  • 支持键盘背光
  • 多点触控触摸板(物理按压,非 Haptic Feedback)
  • 为 iPad 增加一个 USB-C 充电口(不支持数据传输)

需要注意的是,该键盘使用专门的协议与 iPad 通信,不支持蓝牙。也就是说,只能给 iPad Pro 使用

重量:论重量,该键盘重量远大于 Magic Keyboard for Mac 加上 Magic Trackpad for Mac 的重量。因此便携度还是 Mac 所配的键盘和触摸板更优。11-inch 键盘的重量为 600g 左右。作为参考,11-inch iPad Pro 重量为 471g;11-inch 智能键盘夹(Smart Keyboard Folio)为 300g 左右;Magic Keyboard for Mac 加上 Magic Trackpad for Mac 的重量为 231g + 231g = 462g,何况后者比 iPad 的触摸板还要大很多,并支持 Haptic Feedback。安装上该键盘会使设备增重一倍多,实在有点夸张。主要问题是双面保护的问题,如果能够省去背面的保护,重量应该能轻不少。

类别 型号 重量
iPad 11-inch Magic Keyboard 593g
机身 471g
Smart Keyboard Folio 297g
机身 + Magic Keyboard 1.06kg
iPad 12.9-inch Magic Keyboard 699g
机身 641g
Smart Keyboard Folio 407g
机身 + Magic Keyboard 1.34kg
Mac Magic Keyboard 231g
Magic Trackpad 231g
MacBook 13-inch Air 1.29kg
13-inch Pro 1.37kg
16-inch Pro 2.0kg

* Magic Keyboard for iPad Pro 和 Smart Keyboard Folio 的重量均不是官方数据

图片

外包装,非常紧凑很简洁的使用说明悬浮高度实测为 10mm - 23mm新的凹陷 Apple Logo 设计keyboard-5.jpeg与 15-inch MacBook Pro 和 Magic Trackpad for Mac 对比(无标注)与 2018 15-inch MacBook Pro 对比(标注后可以清晰看出,iPad 版本大致小四倍)背光对比,均开启最大亮度,亮度相近。

功能配置

三指手势配置

我的触摸板默认没有开启三指切换多任务的手势。需要进入设置、主屏幕与程序坞、多任务中找到 “手势” 开关开启。开启后在屏幕上四指也会出发多任务。

三指手势配置屏幕截图
三指手势 屏幕录制

指针动画和触摸板惯性

两个设置位于辅助功能、指针控制中

若开启指针动画,当移动到按钮上方时,指针会消失,取而代之的是按钮高亮的吸附效果。此功能可以关闭,关闭后更接近在 macOS 上的使用体验。

开启指针动画
关闭指针动画

同样的,默认 iPadOS 会开启触摸板惯性,关闭此功能会更接近在 macOS 上的使用体验。

开启触摸板惯性
关闭触摸板惯性

辅助点按

类似 Mac,iPad 也推出了辅助点按功能,可以代替 Haptic Touch,非常好用。

两指按下辅助点按

使用体验

根据我的个人体验以及网上的说法,该触摸板明显比第三方的好用,效果与 Magic Trackpad for Mac 相当。似乎苹果目前对第三方触摸板在多点触控以及移动光标的流畅度上有 Bug(也可能是有意而为)。

该键盘使用最新的的剪刀式结构,介于最新的 16-inch MacBook Pro 和 Magic Keyboard for Mac 的手感。相比智能键盘夹(Smart Keyboard Folio)打字体验好太多。

尽管触摸板不支持 Haptic Feedback,但整个触摸板均可物理按压,不存在某一个角不好用一说。

两个角度控制的地方阻尼足够,无论什么角度放置,仅凭借 iPad 自身重量均无法使其自己转动。可放在腿部使用。

总体使用体验尚可,唯一缺点就是太重且两个面都很厚(背面由于支持充电和角度调整,也远大于普通双面夹)。此外就是似乎本次外壳材质较上一代没有变化,使用久了会严重变质。

购买方式

可以前往 Apple Store 实体店或者在线商店购买。使用教育优惠可以便宜 ¥200,学生教师均可使用。购买时注意选择键盘样式,我购买的是美式英语。国内实体店可能只有简体拼音版

SSD U盘、Windows To Go 与 Mac

By: James Guo
26 February 2019 at 16:49

最近,我先后购买了 SSD U盘和 SSD 硬盘。我在我的 SSD U盘上安装了 Windows To Go,并在 Mac 设备上良好使用。本文将分享一下我的体验。

SSD U盘/移动硬盘

SSD VS HDD

TL;DR:固态硬盘(SSD)的性能比机械硬盘(HDD)高 10 倍左右,体积与重量也明显小于 HDD,但单位容量的价格也高了近 10 倍。

固态硬盘(SSD)已经成为了一个比较流行的概念。通常,固态硬盘的各个性能要好于传统机械硬盘(HDD),包括但不限于读写速度、IOPS 等指标。一个普通的机械硬盘的读写速度大概在 100Mbyte/s 左右,而固态硬盘则能达到 1000Mbyte/s 以上,速度比移动硬盘快了近 10 倍。SSD 的 IOPS 性能相比 HDD 可以提升近 100 倍。这些性能提升体现在各个方面:拷贝文件、打开存储在硬盘上的文档和软件软件、启动系统等,最高能有十几倍的速度提升(如果瓶颈是在硬盘读写的话)。当然 SSD 的价格也能比 HDD 高近 10 倍。此外,HDD 相比 SSD 噪音要大很多,SSD 基本是无声的。

市面上销售的移动硬盘多数都是低速的 HDD,因为普通消费者最常关心的是容量和价格,HDD 的每 GB 价格更低,SSD 则贵很多,所以 SSD 的销量也相对的低很多。花 300 块可以买到一个 1TB 的 HDD,而 1TB 的 SSD 可能需要 3000 块。

我是否需要 SSD?要看是否有高性能需求。比如,操作系统和软件就适合安装在 SSD 上,这样启动时间会大大缩短。一些文档、图片和视频等数据则可能不是那么需要 SSD。如果你是图像/视频工作者,需要存储高画质的图像/视频,那么 SSD 就会很有用,它可以大大缩短文件的加载时间;当然很多软件也为低性能设备做了优化,比如 Lightroom Classic CC 可以生成预览(Preview)以减少文件大小;Final Cut Pro 和 Premiere CC 可以为原始素材生成代理(Proxy)以减少文件大小,你可以将预览或代理存储在 SSD 上,原始文件存储在 HDD 上以节省成本。此外,一些访问频率很低的数据也可以存储在 HDD 上以节省成本,如数据备份、监控视频、日志等。

mSATA mini 型的 SSD(来自 amazon.com)3.0cm * 2.7cm * 0.4cm

此外,SSD 能有更轻的重量,更小的体积,以至于 SSD 可以做成 U 盘大小。而 HDD 就会大很多。以现在常用的最小的 2.5英寸 HDD 为例,其长度为 10cm,宽度为 7cm,这还不包含外壳部分。上图所示的 SSD 的长宽高仅有 3.0cm * 2.7cm * 0.4cm,重量也不到 40g。其长度不到 HDD 的三分之一。

SSD 也可以做到很大的容量,比如 15英寸 MacBook Pro 甚至可以选择高达 4TB 容量的 SSD。但由于 SSD 的价格过于昂贵,导致大容量的 SSD 并不流行。

SSD U盘与移动硬盘

SSD 外设有着如此之高的读写速度,以至于只有使用 5Gbps 的 USB3.0 和 USB3.1 Gen1,或者 10Gbps USB3.1 Gen2 才能体现出它的性能,这些接口的速度对于 SATA SSD 已经够了。然而,若要发挥出其全部性能,则需要使用 20Gbps Thunderbolt 2 或者 40Gbps Thunderbolt 3 接口,因为多数的 NVMe SSD 读写性能大于 10Gbps 而不超过 20Gbps。使用 480Mbps USB2.0 的 SSD 几乎是无意义的,所以你也很难找到这种产品。不同接口的 SSD 外设价格也区分的很明确,使用的接口越高端就越贵。使用 Thunderbolt 接口的移动 SSD 价格会比使用 USB 接口的贵 23 倍(速度快 24 倍)。

接口协议对比图(来自 thunderbolttechnology.net)

Thunderbolt3 接口的外形与 USB Type-C 外形完全一样,有些移动硬盘使用了 Type-C 接口,但不代表它就是 Thunderbolt3。你可能需要通过观察其是否有 Thunderbolt 的 ⚡️标志来判断是否支持 Thunderbolt。此外,使用 Thunderbolt3 接口的移动硬盘未必支持 USB 协议,例如我购买的 HP P800 移动硬盘,就不支持 USB 协议,且不能转接成 USB,同时也不能转接成 Thunderbolt2,所以其兼容性就大打折扣。而 USB3.x 的设备通常兼容 USB2.0,且 USB Type-A 与 Type-C 也能相互转接,所以 USB 设备有着更好的兼容性。

SSD 移动硬盘类似与普通的移动硬盘(基于 HDD),但有着更高的性能。通常,SSD 移动硬盘的体积也会更小。

SSD U盘相当于更小的 SSD 移动硬盘,其体积可能和普通的 U 盘相近。由于体积的减小,SSD U盘读写性能与散热性能通常不如 SSD 移动硬盘。且更少有支持 Thunderbolt 的 U 盘。

从左到右依次为 iPhone XS、HP P800 Thunderbolt3 SSD、CHIPFANCIER USB3.1 Gen2 Type-C SSD
HP P800 SSDCHIPFANCIER SSD
接口Thunderbolt3USB3.1 Gen2 Type-C
类型移动硬盘U 盘
大小(毫米)141x72x1972x18x9
读取速度2400Mbyte/s
约 500Mbyte/s
写入速度1200Mbyte/s约 450Mbyte/s
容量256GB/512GB/1TB/2TB
(2TB 版本尚未发布)128GB/256GB/512GB/1TB
在 MacBook Pro 上,即使一个接口安装上了 CHIPFANCIER 的 SSD U盘,其旁边的接口仍然有空间连接其他 Type-C 设备。

磁盘格式的选择

通常硬盘需要格式化后再使用。在格式化硬盘时,你就需要选择磁盘格式。在这里比较一下四种格式:APFS、NTFS、exFAT 和 FAT32。(某些软件和文档只能安装或存储到特定的磁盘格式中,就不再表里列举了)

APFSNTFS (v3.1)exFATFAT32
发布年份2017200120061977
适用介质建议 SSD
不限不限不限
Windows 兼容支持7+****
支持
macOS 兼容10.12+
(Sierra)支持*支持支持
Linux 兼容支持*支持
移动兼容支持支持
快照SnapshotsShadow Copy**
加密FileVaultBitLocker**
Copy-on-Write支持
空间共享支持
最大文件大小***4GB
最大分区大小***32GB
  • * macOS 和 Linux 默认只能读取 NTFS 磁盘数据,而不能写入。Mac 可以通过调整系统设置实现读写,Mac 与 Linux 也均通过第三方软件实现 NTFS 的读写。
  • ** Shadow Copy 和 BitLocker 通常只支持 Windows
  • *** 这里使用字节数而非比特数。大于 1000TB 的这里就当作 ∞。FAT32 在部分操作系统中可以有更大的分区大小(如 2TB)。
  • **** 尽管原始版本的 Windows XP 和 WIndows Vista,但 Windows XP 在安装 KB955704 后,Windows Vista 在安装 SP1 或 SP2 更新后,也可部在某种程度上支持 exFAT。

关于操作系统兼容,若该操作系统绝大多数主流版本都支持,则算作 “支持”。_移动兼容_只要同时兼容 iOS 和安卓就算 “支持”。

关于 iOS,目前 iOS 系统仅支持导入外置存储的图片和视频,且外置存储的图片和视频必须按照相机文件结构命名;尽管 iOS 内置存储使用的是 APFS,但还不支持基于 APFS 的外部存储。

磁盘格式对硬盘性能影响不大,主要看其兼容性与功能。但兼容性好的功能少,功能多的兼容性差。

进阶: Windows To Go

通过使用 SSD 外设,可以在保证较高的性能的同时扩展电脑的储存。然而,你甚至可以把电脑操作系统安装在 U 盘上,这样你不用分区也能使用目标操作系统开机。如果你将操作系统安装到 HDD 移动硬盘上,其启动速度就会很慢;如果安装到普通 U盘上,其启动速度几乎是不能忍受的。因此建议将操作系统安装到 SSD 外设上

macOS、Windows 和 Linux 都可以被安装在 U盘或者移动硬盘上。但 Windows 对各种硬件兼容的最好,如果你需要在 PC 机上使用,那么只推荐 Windows 系统。Windows 10 企业版支持 Windows To Go 功能,专门为安装在 U 盘或移动硬盘上时进行了优化。

要安装 Windows To Go(WTG) 需要有 Windows 环境,可以是安装 Windows 的 PC、使用 BootCamp 的 Mac,或者是运行有 Windows 的虚拟机。如果你恰好使用 Windows 10 企业版,那么你可以使用系统控制面板中的 WTG 工具(然而我用系统自带的工具安装失败了)。否则你只能使用第三方工具安装 WTG。这里推荐这个 WTG 辅助工具

安装成功后,你可以在电脑启动时选择从 U 盘启动,或者在虚拟机里从 U 盘启动。这里展示一下在 Mac 上启动 WTG 以及 macOS 上的 VMware Fusion 中启动 WTG。

MacBook Pro 开机启动到 Windows To Go。

以上视频是在 Mac 上开机直接进入 WTG。如果你的 Mac 配备了 T2 安全芯片,那么你需要关闭启动安全性检查(无安全性、允许从外部介质启动)才能够从外部设备启动 Windows。你可以考虑开启固件密码以继续保证安全性(没有 T2 芯片的 Mac 也可以开启固件密码)。提示:请牢记固件密码,固件密码一旦忘记只能返厂修。

刚安装完的 Windows 可能没有 Mac 的鼠标和触摸板的驱动。你需要通过 USB 鼠标和触摸板来完成安装工作(Magic Keyboard 2 和 Magic Trackpad 2 连线后也可作为 USB 外设)。

你需要为 Windows 安装 Mac 的驱动。在 Mac 的 “启动转换”(Boot Camp)软件中的 “操作” 菜单里可以手动 “下载 Windows 支持软件”(驱动)。注意,不同型号的 Mac 的驱动不同,建议使用系统的软件下载。如果你需要在多个 Mac 上使用一个 WTG,你需要安装多个驱动。启动转换助理是帮助用户在 Mac 本地硬盘上安装 Windows 双系统的,不能用来安装 Windows To Go,这里只是用它安装驱动

BootCamp 下载 Windows 支持软件截图

建议将驱动保存在另一个 Windows 可以识别的 U盘上(见本文的 “磁盘格式的选择”)。然后再次开机进入 WTG 后就能安装了。

macOS 使用 VMware Fusion 进入 WTG。

如果你有虚拟机,你也可以在虚拟机里从 U 盘启动。

BitLocker

如果不启用 BitLocker,那么 U盘上所有用户文档都是明文存储的,也就是说只要有了你的 U盘,就能读取所有的用户数据。若启用了 BitLocker,那么磁盘数据安全性就能得到保证。然而 Mac 没有 BitLocker 的相关硬件支持,默认无法启动 WTG 中的 BitLocker,需要修改 Windows 下的配置文件。

启用 BitLocker 后会些许增加系统的 CPU 占用,略微降低磁盘性能。此外,启动了 BitLocker 的磁盘 macOS 无法识别,意味着在 macOS 系统上无法读取开启了 BitLocker 的 Windows 分区。建议谨慎开启。

使用体验

将 Windows 安装到 U盘不但节省了电脑内的磁盘空间,还有了一个可以随身携带的操作系统,可以在 Mac 和 PC 机上使用。我没有开启 BitLocker。我在 macOS 上开启了 NTFS 读写,所以其 Windows 分区还可以被当作 U盘共享数据使用。

我在 WTG 上安装了一些常用软件,在其他 PC 机上未必需要进入 WTG 系统以使用这些软件,而直接进入 WTG 根目录下 Program Files 文件夹里访问这些软件就行了。

我将 Windows 安装到了 CHIPFANCIER 出的 SSD U盘上,其特色是使用了 USB3.1 Gen2 Type-C 接口,这样不需要转接就能够在新 Mac 上使用。然后我又购买了绿联的 Type-C 转 Type-A 的转接头(USB 3.0),可以将此 U 盘转接到 Type-A 设备上。

绿联 Type-C 转 Type-A绿联 Type-C 转 Type-A 连接后

Azure DNS、NS1、Constellix,三家海外 GeoDNS 服务商对比

By: James Guo
15 November 2018 at 11:45

最近 DNSPod 的解析服务器宕机了一段时间,导致许多 DNSPod 用户的网站无法访问。本文将推荐几个提供 100% SLA 的海外 GeoDNS 服务,可用于替代不稳定的 DNSPod。并介绍一下使用多家 DNS 提供商来提高服务可用性的方法。

本文包括 Azure DNS、NS1、Constellix 的全面对比。

简介

这次推荐的三家 DNS 均是海外的支持 GeoDNS 的服务商,并都支持 Anycast。其中的 Azure DNS 和 NS1 在国内的速度都非常好,是直接走的香港/亚洲线路,平均延迟能够在 50ms 以内,不输国内 DNS 服务商。而这三家的海外速度都是极快的,可以秒杀 DNSPod、CloudXNS、阿里云解析等国内提供商。

关于 GeoDNS,精细度最好的是 Constellix:支持国家、省、市(包括中国的省、市),甚至是 AS 号(可以实现分运营商解析)、IP 段。NS1 支持国家、美国的州,也支持 AS 号、IP 段。至于 Azure DNS,通过使用 Traffic Manager,可以支持国家、部分国家的州、IP 段。由于都支持 IP 段,所以理论上支持任意精度的 GeoDNS 了。

至于价格,NS1 提供了免费额度(每月 500k 请求),对于小流量网站而言是够用的,可一旦超出这个免费额度,那么收费是很高的:**$8/百万个请求**。相比而言,Azure DNS 和 Constellix 的价格都很便宜了,其中 Constellix 有 $5/月 的起价。

使用多家 DNS 服务商

同时使用多家 DNS 服务商是可行的,只要使用服务商的 DNS 记录保持相同即可。这要求所使用的服务商能够配置主域名的 NS 记录(建议但不是必须)。这次介绍的 Azure DNS、NS1、Constellix 三家,以及以前介绍过的 Route 53、Google Cloud DNS、Rage4、阿里云解析均可配置主域名的 NS 记录(其中阿里云解析和 Azure DNS 只能额外添加第三方记录;其他几家可以完全自定义 NS 记录)。而 Cloudflare 以及国内的 DNSPod、CloudXNS、阿里云解析由于不能配置主域名下的 NS 记录,意味着你不能很好的进行 DNS 混用。

要使用多家 DNS,有两种实现方法:主服务商和从服务商方式以及两个主服务商方式。完成配置后,将多家的 NS 服务器配置到权威 NS 记录以及域名注册商下的 NS 列表。

使用两家服务商会增加配置难度,但可以提高 DNS 服务的稳定性。如最近的 DNSPod 宕机以及 2016 年的 Dyn 宕机所导致的众多网站无法访问,均是因为众多网站仅使用了一家 DNS 提供商。如果使用了多家 DNS 提供商,则网站仅会在所使用的所有服务商均发生宕机事故时才会无法访问,而这显然发生概率很小。

主服务商和从服务商

要想这样配置,需要从服务商支持使用 AXFR 从主服务商获取记录,还需要主服务商也支持 AXFR 传输。其中,NS1、Constellix 均可作为主服务商或从服务商,意味着你可以同时使用这两家,并选择任何一家作为主服务商,另一家作为从服务商。

两个主服务商

你也可以使用两个主服务商,并保持所有的记录(包括主域名下的 NS 记录)相同(建议,但不是必须)。建议也将 SOA 的序列号同步。

样例

github.com. 这个域名就同时使用了 Route 53 和 DYN 的服务。这可以使用 dig 工具验证。

$ dig github.com ns +short  ns1.p16.dynect.net.  ns2.p16.dynect.net.  ns3.p16.dynect.net.  ns4.p16.dynect.net.  ns-1283.awsdns-32.org.  ns-421.awsdns-52.com.  ns-1707.awsdns-21.co.uk.  ns-520.awsdns-01.net.

经检验,在两家 DNS 服务商也配置了相同的记录。

$ dig @ns1.p16.dynect.net. github.com a +short  13.229.188.59  13.250.177.223  52.74.223.119  $ dig @ns-1283.awsdns-32.org. github.com a +short  13.229.188.59  13.250.177.223  52.74.223.119  

下面逐个介绍一下这三家 DNS 提供商。

所有 DNS 测评一览(还包括 CloudXNS、Route 53、Cloudflare、Google Cloud DNS、Rage4 以及阿里云解析)

Azure DNS

微软 Azure 产品线下的 DNS 服务。使用 Anycast 技术,并且国内能够直接连接到香港/亚洲节点,所以速度很快。

值得注意的是,类似 Route 53,Azure 所分配的四个服务器使用的是不同的网段、不同的线路,可能有更高的可用性。

注意:Azure 的 DNS 的分区解析可能不兼容 IPv6,这意味的解析结果可能会被 Fallback 到默认线路。

  • 国外速度:★★★★☆,36 ms
  • 北美速度:★★★★☆,27 ms
  • 亚洲速度:★★★★☆,39 ms
  • 欧洲速度:★★★★☆,29 ms
  • 国内速度:★★★★☆,49 ms
  • 最短 TTL:0s
  • 国内分区解析:★★★★★,支持配置到中国,支持 IP 段配置(配合 Traffic Manager)
  • 国外分区解析:★★★★★,支持配置到大州、国家以及部分国家的州,支持 IP 段配置(配合 Traffic Manager)
  • DNSSEC:不支持
  • IPv6:支持
  • 记录类型:支持 A、AAAA、CNAME、NS、MX、TXT、SRV、CAA、PTR。
  • 根域名 CNAME 优化:不支持
  • 优先级:支持(配合 Traffic Manager)
  • 自定义 NS:仅支持添加额外的 NS
  • 价格:每个域名 $0.5/月,**$0.4/百万个请求**
  • 用例 A 价格:**$0.90**
  • 用例 B 价格:**$10.50**
  • SLA:100%

NS1

NS1 也使用了 Anycast 技术,并且国内能够直接连接到香港/亚洲节点,所以速度很快。

  • 国外速度:★★★★★,23 ms
  • 北美速度:★★★★★,9 ms
  • 亚洲速度:★★★★☆,40 ms
  • 欧洲速度:★★★★★,20 ms
  • 国内速度:★★★☆☆,65 ms
  • 最短 TTL:0s
  • 国内分区解析:★★★★★,支持配置到中国,支持 IP 段配置。
  • 国外分区解析:★★★★★,支持配置到大州、国家、美国的州,支持 AS 号、IP 段配置。
  • DNSSEC:支持
  • IPv6:不支持
  • 记录类型:支持 A、AAAA、AFSDB、CAA、CERT、CNAME、DS、HINFO、MX、NAPTR、NS、PTR、RP、SPF、SRV、TXT。
  • 根域名 CNAME 优化:支持
  • 优先级:支持(配合 Traffic Manager)
  • 自定义 NS:仅支持添加额外的 NS
  • 价格:每月前 500k 请求免费,超出部分 $8.0/百万个请求
  • 用例 A 价格:**$4**
  • 用例 B 价格:**$156**
  • 用例 C 价格:**$156**
  • SLA:100%

Constellix

此 DNS 以 GeoDNS 优势著称,使用了 Anycast 保证最低的延迟。

Constellix 三组有六个 DNS 服务器,每一组使用了不太相同的线路。

  • 国外速度:★★★★☆,31.51 ms
  • 北美速度:★★★★★,9.81 ms
  • 亚洲速度:★★★★☆,48.87 ms
  • 欧洲速度:★★★★★,23.77 ms
  • 国内速度:★★☆☆☆,108.9 ms
  • 最短 TTL:0s
  • 国内分区解析:★★★★★,可以精确到每一个省、市,可以配置 ASN 以实现运营商分区解析。
  • 国外分区解析:★★★★★,精确到了各个国家、省、市
  • DNSSEC:不支持
  • IPv6:支持
  • 记录类型:更加齐全,只支持 A、AAAA、CNAME、NS、MX、TXT、SRV、HINFO、NAPTR、CAA、CERT、PTR、RP、SPF。
  • 根域名 CNAME 优化:支持
  • 优先级:支持
  • 自定义 NS:支持
  • 价格:第一个域名 $5/月,此后每个域名 $0.5/月。**$0.4/百万个请求**。分区解析 $0.6/百万个请求
  • 用例 A 价格:**$5.39**
  • 用例 B 价格:**$14.90**
  • 用例 C 价格:**$19.30**
  • 统计功能:支持,可以看到每个国家、城市的请求数。甚至还可以启用日志,看到每一个请求的客户端 IP、IP 数据包类型等等。
  • SLA:100%

谈谈数据备份

By: James Guo
25 August 2018 at 14:05

谁也不希望丢失数据,但这很难避免:文件误删除、意外停电、硬盘损坏、硬盘丢失、自然灾害……以上这些都会导致数据丢失,并且很可能无法直接恢复。相信很多人都有过这样的苦恼。本文将简单介绍备份的 321 原则,以及云端备份和本地备份的最佳实践。

典型的数据丢失案例

  • 比如 GitLab.com 的运维人员就曾经误删除过数据:2017 年 2 月 1 日,运维人员使用了 root 账户错误登录到了主服务器上删除了核心服务数据。更严重的是,其中有五种备份方式都失效了。但幸好还留存着一个六小时前的备份,尽管网站在几个小时内无法访问,并且丢失了在备份之后产生的的很多数据,但最终还是恢复了绝大部分的数据,事件详情
  • WannaCry 病毒导致的数据丢失:WannaCry 是一种勒索病毒,针对 Windows 系统的一个漏洞去加密系统上的用户文件,导致用户无法访问这些文件,除非向一个比特币账户转账 $300 ~ $600(相当于几千人民币)。据报道有超过 30 万台电脑受到此病毒的感染。众多企业,包括银行、医院、铁路系统因病毒而无法正常运转。在中国,众多使用教育网的高校学生电脑受此病毒攻击,导致文件丢失。

以上的数据丢失都给人们带来了巨大的损失,但倘若我们能够提前做好数据备份,那么就能够降低数据后的损失。

最佳备份原则:321 原则

在进行备份的过程中,我们应该施行 321 原则,这样才能保证备份的可靠性与有效性。

  • 三份数据拷贝:除了原始的数据之外,要另存两份数据的备份。倘若这三个拷贝丢失的概率相互独立(均为 1%),那么三份拷贝同时丢失的概率就仅有 0.0001% 了,这比两个拷贝同时丢失的概率更低。
  • 两种存储介质:在同一种类型的存储介质上的数据更有可能同时丢失。比如你在电脑的内置存储器上存了三份数据拷贝,但如果电脑的磁盘彻底损坏、误格式化磁盘或者丢失了电脑,那么这些数据便一同丢失了。在上述案例中,另一种类型的存储介质可以是移动硬盘、SD 卡、U 盘、CD、DVD 等。
  • 一个异地备份:多个备份间的物理隔离是很重要的。如果这些备份都放在一个房间里,那么一场火灾就足以毁掉所有的备份。如果条件允许,跨城市(间隔 100km 以上)存储备份就已经很安全了。在家和公司分别存放备份也算作异地备份。

此外也应该注意备份的时效性,如果可能,要尽量缩短备份周期。比如每分钟备份的时效性就强于每小时备份。在数据丢失时,前者只会丢失最近 1 分钟的工作,而后者会丢失最近 1 小时的工作。

云端备份

通常,云端备份是非常可靠的。云端服务器都会帮你做好 321 原则,你只需要选择一家云存储服务商并将要备份的文件上传上去即可。

建议选择提供了自动化备份功能的服务商,这样可以省去手动选择文件上传的步骤。通常自动备份还会对文件进行增量备份,即每次备份只上传上一次备份后有改动的文件,这样能大大节省上传时间。

一个典型的云端备份的例子是 iOS 中的 iCloud 备份功能,开启该功能后,iOS 设备会自动将图片、通讯录、文档、聊天记录、软件存档等个人数据上传到云端。在购买新的 iOS 设备后,这些数据都能够从云端自动恢复到新设备上。

使用对象存储进行简单的备份

定期将服务器上的重要文件打包上传到对象存储,即可实现简单的备份。可以直接使用 Amazon S3、Google Cloud Storage、阿里云 OSS、腾讯云 COS 的对象存储,上述服务均提供 99.999999999% 的持久性,即文件一旦上传完毕,几乎不可能意外丢失。云服务中的对象存储通常是在一个区域内的多个可用区(通常至少三个)进行存储,每个可用区内也包含文件的多个副本。各个可用区之间有一定的距离,所以这实现了异地关于区域和可用区,可以详细参考 AWS 的这篇文章

云服务的对象存储一般都可以选择地区。通常选择地理位置最近的地区以获得最低的延迟。这些服务通常是按照使用量计费的,主要包括在一定时间内占用的存储空间以及传输数据所用的流量费用。比如你要备份 1GB 的数据,那么每月可能只需要几块钱或几毛钱,甚至是免费的。(不同服务商收费不一)

很多服务器上的软件已经集成了使用对象存储进行备份的功能:在服务提供商开通了对象存储后,只需要在软件中配置好授权密钥,就可以使用对象存储进行备份了。如果软件没有集成这种备份功能,那么也可以手动实现简单的备份。比如,使用 mysqldump 导出数据库文件,使用 gziptar 命令压缩、打包要备份的文件。通常对象存储的提供商也有提供命令行工具,使用这些工具可以简单的将文件上传到对象存储中。如 AWS 有 aws,支持 S3 操作;Google Cloud Storage 有 gsutil;阿里云 OSS 有 ossutil;腾讯云有 tccli,支持 COS 操作。

使用快照对服务器进行全磁盘备份

通常快照可以备份服务器磁盘上的所有数据。从快照中恢复也十分方便。这甚至都不需要服务器上的软件支持备份功能。不管是服务器磁盘损坏、系统文件丢失,还是文件删除,都可以从快照中恢复。

如果条件允许,建议同时使用对象存储备份和快照备份。

本地备份

尽管云端备份简单、持久性高,但备份大容量的数据的速度与带宽成正比。何况备份所需要的是上行带宽,这通常是运营商所标称的下行带宽的几分之一。而仅仅是使用普通的机械硬盘进行备份,其速度就已经达到了千兆网络的速度,而千兆网络普及率低且价格极其昂贵。所以,遇到数据量大、带宽受限、备份/恢复时间有限等一种或几种情况时,本地备份也许更为合适。

在本地备份则需要自己做好 321 原则。你需要将数据备份到两个硬盘上(通过局域网或有线连接),并将其中一个硬盘存放在异地。很多桌面操作系统都支持了备份,你可以在最新的 Windows 系统的控制面板中找到备份功能,在 macOS 上使用时间机器(Time Machine)进行备份。建议配置好自动备份。

如果条件允许,建议在本地备份的同时,将较重要的文件再备份到云端。

历史版本的保留

我们应该保留文件的早期版本,以便不时之需。保留多个历史版本的文件使用增量备份有助于节省存储空间。如果条件允许,应保留尽可能多的历史版本。

早期的版本可以有相对更长的时间间隔,以便节省空间:像 macOS 中的时间机器(Time Machine),它会保留过去 24 小时的每小时备份、过去一个月内的每日备份、以及过去一个月以上的尽可能多的每周备份,直到磁盘空间填满。

一些网络存储会自动保留历史版本,比如 Dropbox、Google 云端磁盘、iCloud 等。一些软件也会在本地磁盘里保留历史版本。比如 Git 就会保留每一次提交的历史。

建议首先对重要文件保留历史版本,如果可能对所有文件保留历史版本。

其他

对象存储的存储类别(Storage Class)

通常对象存储提供多种存储类别,不同存储类别有不同的定价和使用场景,合理的使用多种存储类别可以节省支出。

Amazon S3 的主要存储类型

按存储价格由高到低排序,持久性均为 99.999999999%,均为多个可用区。

  • STANDARD:默认,适合频繁访问的文件
  • STANDARD_IA:存储单价更低(默认的 54%),但有额外的检索费用。此外,此类型至少存储 30 天,至少 128kb。
  • GLACIER:存储单价最低(默认的 17%),不可实时访问,也有额外的检索费用

大于 128kb 的且不经常访问的备份建议存储到 STANDARD_IA,几乎不会再访问的早期的历史版本可以存储到 GLACIER。

Google Cloud Storage 的主要存储类型

按存储价格由高到低排序,持久性均为 99.999999999%,均为多个可用区。

  • Multi-Regional:多地区存储(比多可用区更强),此存储类型会在一个洲内的多个城市/国家存放文件。按照官网说法上传后的文件会在至少间隔 160 公里的至少两个数据中心存储。适合存放在全球频繁访问的文件
  • Regional:对应 S3 的 STANDARD
  • Nearline:对应 S3 的 STANDARD_IA,是 Regional 价格的 50%,没有最低文件大小限制
  • Coldline:对应 S3 的 GLACIER,且至少存储 90 天,但支持实时访问,是 Regional 价格的 35%,检索费用比 Nearline 更高。

同样的,不经常访问的备份建议存储到 Nearline,几乎不会再访问的早期的历史版本可以存储到 Coldline

阿里云 OSS 的主要存储类型

按存储价格由高到低排序,持久性均为 99.999999999%,均为多个可用区。

  • 标准型:对应 S3 的 STANDARD
  • 低频访问型:对应 S3 的 STANDARD_IA,是标准型价格的 67%,至少存储 30 天,至少 64kb。
  • 归档型:对应 S3 的 GLACIER,是标准型价格的 28%,至少 64kb。至少存储 60 天,检索费用比低频访问型更高。

同样的,不经常访问的备份建议存储到低频访问型,几乎不会再访问的早期的历史版本可以存储到归档型

Cloudflare Argo 与 Railgun 对比测试,CDN 加速的黑科技

By: James Guo
20 May 2017 at 19:52

本网站曾经一直将国外解析到 CloudFront 实现为国外加速,最近看到 Cloudflare 支持了 Argo 这一新功能,于是就把国外的 CDN 从 CloudFront 换到了 Cloudflare 并开启了 Argo 来试一下效果,官方宣称无缓存时能明显降低 TTFB(首字节延迟),有缓存时也能提高缓存命中率。本文还会将其与 Cloudflare 的另一个企业级的 CDN 加速黑科技——Railgun 进行对比。

Cloudflare Argo

提升缓存命中率,Argo Tiered Cache

Cloudflare 的节点很多,但是节点太多有时不是一件好事——大多数 CDN 之间的节点是相对独立的。首先要先明白 CDN 的工作原理,CDN 通常不会预先缓存内容,而是在访客访问时充当代理的同时对可缓存的内容缓存。就拿本站来说,本站用的是香港虚拟主机,如果有英国伦敦的访客访问了我的网站,那么由于我的网站是可被缓存的,他就会连接到伦敦的节点并被缓存在这个节点。那么如果是英国曼彻斯特的访客访问了呢?由于 CDN 在曼彻斯特另有节点,访客会直接连接到曼彻斯特节点,然而曼彻斯特上并没有缓存,所以该节点会回源到香港。而显然的是,如果曼彻斯特回源到伦敦,使用伦敦的缓存会更快。 综上,如果能选择性的从其他节点上获取资源,TTFB 会更低,缓存命中率也会相应提高。但是一般的 CDN 不会去这样做,因为节点相互独立,节点之间并不知道对方是否已经缓存。一般的解决方法是节点与源站之间先经过为数不多的几个节点,这几个节点可能只是分布在几个州,比如整个欧洲就只有一个这种节点。这样的话,伦敦的访客访问后,同时也被欧洲的那个节点缓存。这样,当再有欧洲其他地区的访客连接到一个没有缓存的节点时,这些节点会直接提供欧洲的那个节点的缓存。CloudFront 和 KeyCDN 就利用了这样的技术。 Cloudflare 是如何实现的他们官方没有详细说明。然而在实际测试时,并没有观察到缓存率上有明显提升,远比不过 CloudFront 的效果。下图是通过这些节点测试的 TTFB,请求是逐个发起的。

Cloudflare 上可被缓存的内容的首次访问测试,启用了 ArgoCloudFront 对比,比 Cloudflare 要强

降低 TTFB,Argo Smart Routing

通常情况下,节点与源站的连接是直接的,这之间的网络很大程度上取决于主机的网络接入。然而,有了 Argo Smart Routing,Cloudflare 会使用自己的线路。图片来自 Cloudflare.com。

Argo Smart Routing 动态图

国外请求测试地址,其中的 via 字段就是 Cloudflare 与本站建立的连接的 IP 地址。通过 GeoIP 服务查询,发现是香港的 IP。Cloudflare 将自己的节点之间都建立了长连接,并在离源站最近的服务器上与源站也提前建立了连接。这样,就能大大降低首次连接所需要的时间。如果回源是 HTTPS 的,那么效果更明显。我的另一个测试地址是没有开启这个功能的,用来对比,它的回源与本站建立的 IP 就不是香港的。

使用 Flexible SSL 的 TTFB 对比

没有启用 Argo启用了 Argo

使用 Full SSL 的 TTFB 对比

没有启用 Argo 并且是 Full SSL启用了 Argo 并且是 Full SSL

速度的确有一定的提升,但是不是特别明显,而且似乎开启了之后一些节点反而更不稳定——原本都是比较稳定的一个速度,开了这个之后一些节点反而忽快忽慢。看来提速的最佳方法还是半程加密。

Cloudflare Railgun

Railgun 是 Cloudflare 专门为 Business 和 Enterprise 企业级客户提供的终极加速方案。要使用它,先需要升级网站套餐为 Business 或 Enterprise,然后还需要在服务器上安装必要软件并在 Cloudflare 上完成配置。这相当于是一个双边加速的软件,其实现原理是让服务器与 Cloudflare 建立一个长久的 TCP 加密连接,使用 Railgun 独有协议而不是 HTTP 协议,这样显然能减少连接延迟。此外,它还会对动态页面缓存:考虑到大多动态页面都包含了大量相同的 HTML 信息,在用户请求一个新的页面时,服务器将只发送那些变化了的内容。这相当于一种多次的 Gzip 压缩。

开启 Railgun 截图

官方宣称,使用 Railgun 能够实现 99.6% 的压缩率,并实现两倍的速度。实际体验也确实如此:

启用了 Railgun 并且是 Full SSL

Railgun 的加速效果还是非常之明显的,明显强于 Argo。

总结

Argo 并没有想象中的那么好用,而且 $5/mo 的起步价和 $0.10/GB 的流量并不便宜。当然也有可能需要一段时间 Argo 去分析线路延迟才能更好的进行优化。本文预计将在一个月后补充更新。 Railgun 效果还是极其显著的,但是它需要企业版套餐才能够使用,并不亲民。

动态内容

延迟:Google Cloud CDN 延迟最低,Cloudflare Railgun 仅次。 流量:对于普通的动态 CMS,Cloudflare Railgun 大约能节省 10 倍以上流量,Google Cloud CDN 是做不到的。 我在国内外几家全站 CDN 对比中测试 Google Cloud CDN 时,其极低的 TTFB 令我惊讶,仔细研究后发现节点是与主机之间建立长连接,而且会保持很长一段时间,此外所有网络都走 Google 内网,本质上与 Argo 和 Railgun 类似。所以目前服务动态内容最快的应该还属 Google Cloud CDN 了,Railgun 基本与之相当。

静态内容

CloudFront 自带的 Regional Edge Caches 在缓存静态内容提高缓存命中率上要比 Argo Tiered Cache 和 Railgun 好,但是 Argo Smart Routing 在服务于动态的不可缓存的内容上更显出优势。Railgun 和 Google Cloud CDN 除了会在边缘节点缓存之外没有其他专门的优化。

关于本站的分区解析

本站的解析没有使用 Cloudflare 而是 自建的 DNS,因为我的 Cloudflare 域名是通过 CNAME 接入的。Cloudflare 分配的 IP 在很长时间内都不会变动,所以我直接把其 IP 设置为了海外线路。使用自建的DNS是为了在备案后,为国内分区解析配置 CDN 线路。 PS: 大家应该都知道启用这个功能后并不会提升国内连接 Cloudflare 的速度,如果想要用 Cloudflare 并且希望国内快一点,源站最好就用美国西岸的。

2017 年,再看 SSL 和 HTTPS

By: James Guo
24 January 2017 at 15:46

一年之前,我发表过一篇文章:全面 HTTPS 时代即将到来。到现在,HTTPS 又有什么新变化呢?本文就来一起探索 HTTPS 在 2016 年的变化以及今后的发展可能。

SSL 和 HTTPS 简介

HTTPS 是加密了的 HTTP 协议,网址以 https:// 开头,就代表是使用了这个协议。 HTTPS 相比 HTTP,拥有全部的以下特性:

  • 传输数据加密:与网站之间的通讯无法被中间人(如无线路由器所有者、运营商、在之间线路上的监听者)获取。
  • 数据完整性:保证所传输数据没有被篡改。
  • 身份验证:保证数据是网站所有者提供,而不是第三者提供。

由于 HTTPS 要完成身份验证,所以若需要配置 HTTPS,就必须要取得被公认的证书颁发商颁发的证书。

2016 年

Let’s Encrypt,首个真正免费的证书颁发商

部署 HTTPS 必须要拥有 SSL 证书,而 SSL 证书的价格区间在每年几百甚至上万元不等,高昂的证书价格成为了部署 HTTPS 的一个重大负担。2015 年末,Let’s Encrypt 正式开始公测,可以免费签发多域名的证书,此类证书原先的价格在百元到千元左右。即使是在测试阶段,仅仅 3 个月时间就签发了 100 多万张证书! Let’s Encrypt 的证书使用自动化部署,验证、签发过程均通过 API 自动实现,大大缩短了申请证书所需要的时间;同时各种服务提供商也纷纷提供了自动签发 Let’s Encrypt 证书的渠道。由于 Let’s Encrypt 的出现,确实大大加快了 HTTPS 的普及。

HTTP/2,SPDY 的升级版

在 2015 年初,HTTP/2 正式成为标准,紧接着各大浏览器和操作系统纷纷支持:Firefox 36、Chrome 41、iOS 9 & macOS 10.11(Safari 9)、Windows 10(IE 11 & Edge)。紧接着,Cloudflare、CloudFront、UPYUN 这些 CDN 提供商也纷纷支持了 HTTP/2,HTTP 服务器 Nginx 和 Apache 也对其做了支持。 HTTP/2 的出现是为了取代 HTTP 1.1 和 SPDY。HTTP/2 主要是支持了多路传输,原本需要合并 CSS 和 JS 文件、为众多的图片准备多个域名的做法,使用了 HTTPS/2 之后就没什么必要了。相比 HTTP 1.1 的每一个数据需要单独的一个连接,HTTPS/2 中网站的所有数据只需要一个连接。

HTTP 1.1 与 HTTP/2 对比

由于浏览器会限制连接数量,这就会导致在 HTTP 1.1 中,每次只能同时下载几个文件。多路传输可以让这些文件一块儿传输,大大减少加载时间。

HTTP 1.1 传输时间轴

HTTP/2 多路传输时间轴

然而,这些浏览器里只是针对 HTTPS 站点做了 HTTP/2 的实现。于是想到让网站提高加载速度,又不得不用 HTTPS。所以,HTTP/2 的出现也推进了 HTTPS 的发展。

2017 年

Google Chrome 放大招,对有无 HTTPS 的网站区别显示:

现在,Chrome 已经开始对使用了 HTTPS 的网站显示 “安全” 字样(EV 证书这个地方则显示企业名称):

Chrome 对 HTTPS 网站显示安全字样

在未来的某一个版本中,对于无 HTTPS 的网站,最终将会这样显示(对于所有 HTTP 网站,未来不同的版本显示的过程是:灰色叹号、红色警报叹号、红色警报叹号 + “不安全字样”;有信用卡或密码提交的会先进行这类显示。下图是最终的第三阶段):

Chrome 对 HTTP 网站显示不安全字样

你也可以在 Chrome 设置页面将其调整为 “一律将 HTTP 网页标为不安全”。我推荐所有人都这样设置,因为 HTTP 确实是毫无安全可言! 相信没有公司愿意让用户看到自己的网站被标记为 “不安全” 吧?浏览器的推进起到至关重要的作用。

更新 1

在最新的 Chrome 58 版本里,非 HTTPS 的密码输入处已经显示这样的信息(此处为 weibo.com 的网站登陆窗口):

Chrome 对 HTTP 网站额外的警告

经测试,只要主站是 HTTP,即使表单是提交到 HTTPS 页面,也会显示此信息。

Apple 强制要求使用 HTTPS 加密(ATS)

2015 年末的时候,苹果就开始实施 ATS,然而开发者仍能找到选项去关闭这个功能。而在 2017 年或之后某个时刻后(具体 deadline 苹果尚未明确给出,不过可以确定的是不开 ATS 审核会逐渐变严格,并要求提供更多的理由),所有新提交的 APP 必须开启 ATS,也就是说新提交的 APP 必须全部使用 HTTPS 内容了。这促使着众多国内厂商去做 HTTPS 支持。

cPanel 虚拟主机自动获取免费 SSL 证书方法

本站特别推荐的虚拟主机提供商 TlOxygen 现在就支持申请免费 SSL 证书了。整个过程十分简单,并且会自动续签!实现方式:自动为虚拟主机安装 acme.sh 软件,然后自动执行安装流程。此外,TlOxygen 的虚拟主机支持 SSH 访问,所以你也可以自行使用 acme.sh 或者任何其他工具操作。

关于建站和服务选购的一些建议

By: James Guo
7 January 2017 at 07:00

建立网站、建立软件(或游戏)的服务器等,可能会有很多纠结的地方,也有很多坑,这篇文章根据我个人的经验来帮助大家选择最适合自己的方案,以及一些建议,在最后列出来一些我推荐的服务。

服务的三种类型

一般的,建站所需要购买的服务也是属于这三种服务之间的。从 SaaS、Paas 到 IaaS,依次从使用简便到复杂,从可拓展性低到高。了解这三种服务类型有助于选择合适的服务。

  • SaaS,软件即服务:比如 WordPress.com 等提供了一整套服务(包括了域名、主机、平台和软件)的,就算是 SaaS,这种服务对于初学者使用起来最方便,专业人士也能玩出不少花样,但可拓展性受到软件的限制,通常这种服务都有较高的可用性,并且是分布式的。
  • PaaS,平台即服务:比如基于 cPanel、Plesk 面板的虚拟主机,你可以在平台上安装已有的开源软件,或者将自己软件代码上传,总体使用几乎和 SaaS 一样简单,使用特定的操作系统和代码语言,安装各种程序。PaaS 有普通的也有分布式的,后者的在可用性和数据保障,以及可拓展性上都要好于前者。
  • IaaS,基础设施即服务:包括 VPS、独立服务器、云 VPS 和共有/私有云服务器。VPS 和独立服务器相比主要差距是在配置上,包括 CPU、内存、硬盘等,后者的配置会高很多,可用性方面没有太大区别。云 VPS 和共有/私有云实际上是基于云端分布式的 VPS 和独立服务器,一样的,他们的在可用性和数据保障,以及可拓展性上都要好于 VPS 和独立服务器。IaaS 需要自己选择操作系统,所有的服务和软件都是自己配置,通常都给你 root 权限。

服务的选择

  • 位置选择之国内:首先需要考虑的是国内还是国外?如果选择国内,首先你得域名需要经过备案,这可能需要将近一个月时间,这无疑为建网站增加了不少成本。而且国内的服务器普遍较贵。不过如果要选择国内,我比较推荐的主机是新浪的 SAE,它价格很低,是按需付费,并且还有免费额度,它属于分布式的 PaaS,提供高可用率的服务,支持 Docker 容器、DDOS 防御。不过 SAE 对于非企业用户不提供 CDN 和自定义域名 HTTPS,我推荐你使用 UPYUN 来实现 CDN 和自定义域名 HTTPS 功能。国内的优点:可以保证网络延迟低,并能符合目前的一些法律政策。
  • 位置选择之国外:不少亚洲的主机(包括但不限于香港、日本、新加坡)从大陆连接会 “绕道”,导致延迟很高,购买前需要先了解清楚,香港便宜的共享主机推荐 TlOxygen。亚洲的主机普遍网络带宽不大,流量比较少,如果不选择亚洲的,那就建议先选北美的。国外的主机通常会有比国内很多主机更低的价格,更好的国际带宽。 如果有条件,可以配置多个服务器,两个服务器推荐的解决方案是亚洲 + 北美东岸,并将亚洲和大洋洲都指向亚洲,其余的都指向北美。如果有条件配置更多服务器,那么可以同时配置北美东岸 + 北美西岸 + 欧洲 + 亚洲的四个服务器并分区解析,就我的实际测试而言,把非洲指向欧洲,把大洋洲指向北美西岸能达到最快的速度。

一些可能需要的特性:基于要实现的不同功能,可能需要在以下方面有要求,在选择服务的时候需要优先考虑。

  • 高数据可靠性:几乎所有的网站或是和网络相关的软件,都需要存储用户的数据,所以高数据可靠性是十分重要的。所以磁盘阵列为 RAID1 和 RAID10 是首选。而且用户数据的备份也是十分重要的,可以存储在第三方如 AWS S3。一些服务提供商提供了备份功能,其实也是能够保证高数据可靠性。
  • 防御攻击的能力:攻击的成本已经越来越低,种类也很多。通常最难防御的攻击种类是 DDOS,其余的几乎都可以通过软件实现。建议在选择服务器时就要选择有 DDOS 防御的服务器,或者直接使用 CloudFlare 之类的基于第七层的防御。
  • 可伸缩,按需付费:最简单的例子就是网络的计费方式不是按照带宽计费,而是按照每 GB 多少钱计费,不限带宽,能够避免不必要的支出的同时还会让用户享受最快的速度。同样的道理,按照系统资源的使用来计费的模式是最好的选择。一般的,基于云端的 PaaS 都是这种计费方式,IaaS 则需要自行配置来实现资源不够时升级配置,资源过剩时回收配置(也可以是 Auto Balancing),所以按小时(或分钟、秒种)级别的计费 IaaS 计费方式最适合这样伸缩以达到按需付费的目的。
  • 网络可靠性:网络可靠性也十分重要,如果服务的网络不好,那么将极大的影响用户体验,导致用户不可以使用服务。
  • SLA:重要的服务都需要 SLA,SLA 能给你承诺服务的可用率,当服务没有满足承诺时,服务提供商会给你赔偿。
  • IPv6:就目前来看,如果不支持 IPv6 也没什么问题。但是能有原生的 IPv6 支持总比没有好,而且现在正在有越来越多的运营商支持 IPv6,使用 IPv6 有可能会有更低的网络延迟,同时配置 IPsec 也有优势。

其他

  • 域名相关:不管你是选择使用虚拟主机、VPS 或是独立服务器,通常你还需要自己买一个域名,配置 DNS 解析等等,推荐免费的 DNS 解析有 CloudFlare、Rage4,国内还有 CloudXNS,一些虚拟主机商以及域名注册商也提供免费的解析,但不如前面介绍的那几个(详细关于 DNS 的介绍请见此)。如果选择使用 CloudFlare,那么你还可以在 DNS 后台选择开启 Proxy(CDN),这样能为你的网站缓存并加速(但实际上对于国内来说有可能反而减速),并获得一些基础的 DDOS 防护,并隐藏你的源站 IP 地址。
  • 域名注册商的选择:首先,要保证总的域名保有量大;其次,要域名后缀种类齐全;第三,最好能附加免费的企业邮箱和高级的隐私保护;第四,域名注册后要能删除并退款,防止手抖注册错了;第五,价格不能太贵。在我做的 TlOxygen 这个公共域名注册服务上,使用的域名注册商是全球前十大域名注册商;有 500 多种域名后缀,数量超过 GoDaddy;赠送企业邮箱,可以配置无限个转发邮箱,甚至还可以配置子域名邮箱,还支持 DKIM;大多数种类域名删除可以拿到退款;价格比 Godaddy 便宜很多,续费价格没那么坑,基本上是 7 折;域名隐私保护只有 5 元,但功能比很多免费的高级:即使开了域名隐私保护,别人给你发邮件时,会收到表格,还能继续填写表格与你联系。

一些服务商的推荐

排列的顺序只是与添加在这个列表里的时间有关,新添加的会被放在后面。此处添加的服务商全是个人的推荐的,以后还会持续更新。 标注列表:

  • (6):全面支持 IPv6
  • (6):部分支持 IPv6
  • (D):支持免费 DDOS 防御

SaaS

建立网站

CDN

以下 CDN 都支持 HTTPS 与 IPv6

DNS

数据存储

代码托管

SaaS 还有很多,太多的东西都是 SaaS 了,所以这里只能算举几个例子。

PaaS

虚拟主机

云主机

或者说是分布式的虚拟主机,但是有独立的 CPU 和内存资源。

可自选软件语言的/Docker 容器

IaaS

VPS/Cloud

标注列表:

备注

  1. SAE 的 IPv6 的激活需要额外的月付
  2. OVH 的 SSD VPS 暂时不支持 IPv6
  3. 在购买某种配置时,若告知你是共享 CPU,那么还是共享 CPU
  4. OVH 只有 Cloud VPS 是基于云端的 VPS
  5. Google 官方并没有明确说明提供 DDOS 防御,但实际上是有能力防御的
  6. Vultr 的 DDOS 防御需要额外购买,且仅部分地区支持,最大防御仅 10Gbps
❌
❌