Normal view

There are new articles available, click to refresh the page.
Yesterday — 31 August 2025Main stream

【CDT月度视频】八月之声(2025)——“不要谎言要真相,不要奴役要自由”

31 August 2025 at 21:53

谨以此片向《四月之声》致敬。本项目将持续更新,直到《四月之声》及同类影片在中国解禁。

2025年8月,中国数字时代搜集整理了过去一个月(2025.7.31—2025.8.29)期间反映国内热点事件的网络视频,以时间为序进行混剪制作了本月月度视频——《八月之声(2025)》。

在内容上,该片揭示了当局的言论审查、权利打压,也记录了民间疾苦、民众呐喊与抗争;在形式上,该片模仿了2022年4月22日发布、随即风行全网并遭到审查的抗议上海封城的短片《四月之声》。

我们谨以此片向这部匿名作品致敬。本项目也将持续更新,直到《四月之声》及同类影片在中国解禁。

同时,在中国数字空间更新有该作品的彩色版本。相关链接:https://youtu.be/B3-Ss6dJm2o

CDT 档案卡
标题:【CDT月度视频】八月之声(2025)——“不要谎言要真相,不要奴役要自由”
作者:中国数字时代
发表日期:2025.8.31
主题归类:四月之声
CDS收藏:大事记
版权说明:该作品版权归中国数字时代所有,欢迎个人、媒体和研究机构在注明来源的前提下免费使用。详细版权说明

致谢:感谢 @李老师不是你老师 、@YesterdayBigcat 对中国相关事件素材的收集与分享。

  • 2025.7.31 北京暴雨致44人死亡,31人来自太师屯镇养老照料中心
  • 2025.8.1 广东网友称发热病人在医院需隔离检测为阴性才能离开
  • 2025.8.1 广西防城港“亮证姐”用丈夫的消防员执法证威胁他人让路
  • 2025.8.1 日本记者报道最新一起日本母子遇袭事件遭到工作人员干预
  • 2025.8.2 某影院观众在《南京照相馆》放映结束后集体高喊口号
  • 2025.8.2 9岁男孩看《南京照相馆》后一夜无眠剪毁300多张奥特曼卡片
  • 2025.8.2 网友嘲讽电影《731》的炒作风潮是转移国内矛盾
  • 2025.8.2 一货车司机吐槽内蒙某国道40公里有三个收费点
  • 2025.8.4 四川江油校园霸凌事件引发大规模抗议,警方强力镇压
  • 2025.8.6 “全民社保”政策引发强烈争议,网友吐槽强制缴费成为负担
  • 2025.8.7 河南郑州再次因集中降雨发生内涝
  • 2025.8.7 湖南一男子发12字评论被行拘,两年三审一路告到省高院终翻案
  • 2025.8.7 江苏连云港一老人因房子倒塌住进墓地,诉生活艰辛收养病婴
  • 2025.8.7 昆明抗战胜利纪念堂门口,男子举横幅”习近平走人“
  • 2025.8.8 湖北武汉网友曝左岸大道地砖下仅铺沙子质疑工程质量
  • 2025.8.9 广州马岗顶南街发现基孔肯雅热确诊病例,有关人员强行入户消杀
  • 2025.8.9 苏州万象城一男子背白板留言呼吁:中国人民需要选举权
  • 2025.8.9 网友实拍骑行者路过北京长安街被警察搜身检查
  • 2025.8.10 广东某地上演就地隔离防疫情场景网民感叹”新冠重演“
  • 2025.8.12-13 广东多地为开展灭蚊消杀,现场“烟雾缭绕”
  • 2025.8.12 江西赣州外卖员被城管拖走电动车
  • 2025.8.12 山东市政工人为赶进度在马路上睡觉
  • 2025.8.12 一年3600元平均9.9元/日的生育补贴,网友实测能买多少婴儿用品
  • 2025.8.13 网传的澳洲“天龙人”杨兰兰躲避记者追问
  • 2025.8.13 广东为防止基孔肯雅热疫情传播给多地下水道装纱窗
  • 2025.8.13 湖南一名失去双臂的外卖小哥骑电动平衡车送餐
  • 2025.8.14 湖北网友拍到白发老奶奶挑担卖水果,轮椅老伴在前
  • 2025.8.14 山东聊城东昌府区南关村遭政府强拆
  • 2025.8.14 郑州网友因佳田未来新城项目烂尾“鞠躬道歉”
  • 2025.8.15 安徽淮南新泰瓜果农民专业合作社遭政府强拆
  • 2025.8.15 北京,访民遭截访人员强制带走
  • 2025.8.15 江西南昌新力城业主维权遭抓捕
  • 2025.8.16 广东网友吐槽社区防疫作秀,未清理滋生蚊子的天台积水
  • 2025.8.16 广东湛江霞山出动民兵开展灭蚊消杀行动
  • 2025.8.17 网友在参加2025Google开发者大会后感叹中国脱钩
  • 2025.8.16 网友创作歌曲调侃“强制社保”政策
  • 2025.8.17 佛山网友展示自家菜地灭蚊消杀后被水泥封住
  • 2025.8.17 广东茂名一人感染基孔肯雅热后,全村除草、验血
  • 2025.8.17 广西北海网友称交警逐利式执法,被拖走的电动车成“车海”
  • 2025.8.17 贵州贵阳一外卖小哥横卧在拖车前阻止电动车被拖走
  • 2025.8.18 东莞网友称下水道防蚊网致路面积水,变人造蚊子培养皿
  • 2025.8.18 湖南市民发布视频质疑当地乡政府上班时间人员缺岗
  • 2025.8.18 江西景德镇大面积停水近40个小时
  • 2025.8.18 四川传媒学院公众号发文《这是一张白纸》,后改名《这是一片空白》
  • 2025.8.18 网友批评广东灭蚊运动期间有关人员毁坏阳台花草
  • 2025.8.18 在印尼的博主质疑基孔肯亚热病例多于中国却未见大规模灭蚊
  • 2025.8.19 广东网友拍摄“带孩子送餐的外卖员们”
  • 2025.8.19 广东惠州医护人员和警察上门强制给市民抽血检查
  • 2025.8.19 广东深圳龙岗区中国建筑第七工程局有限公司工人讨薪
  • 2025.8.19 网友记录下中国外卖员的艰辛现状
  • 2025.8.19 网民发现一中成药含对乙酰氨基酚
  • 2025.8.20 安徽阜阳一老人未去世被要求火化
  • 2025.8.20 广西桂林永福县苏桥比亚迪工人罢工,抗议工资问题
  • 2025.8.20 贵州建工集团工人讨薪遭暴力对待
  • 2025.8.20 海南见乐东尖峰镇农场村干部暴力强占村民土地
  • 2025.8.20 陕西西安一工人抱老板大腿讨薪
  • 2025.8.20 台湾网红馆长直播抱怨因身份问题无法在大陆平台开展业务
  • 2025.8.20 网友发现湖北恩施大峡谷评价系统只能点赞不能吐槽
  • 2025.8.21 河北邯郸第二中学工人拉横幅讨薪
  • 2025.8.22 川青铁路在建的尖扎黄河特大桥断裂致10人死亡
  • 2025.8.22 广东一工地有人感染基孔肯雅热整个宿舍区遭封控
  • 2025.8.22 广西桂林市全州县两河镇水污染严重
  • 2025.8.22 陕西西安市民测试环卫工4元时薪的购买力
  • 2025.8.23 编程随想妻子贝女士称时隔四年终于见到阮晓寰
  • 2025.8.22 广东阳江上洋镇政府暴力强征土地
  • 2025.8.23 广东佛山开展“灭蚊行动”,夜间砍伐道旁树木
  • 2025.8.23 广东省潮州市饶平县联饶镇赤坑村村民抗议政府强占土地,村书记广播威胁
  • 2025.8.23 广东珠海拱北口岸重启疫情时期的红外体温检测设备
  • 2025.8.23 云南绍通镇雄县场坝村副镇长带队暴力强占农民放牧地
  • 2025.8.23 海南三亚凌晨3点有人在路边掏取地沟油
  • 2025.8.24 湖北访民前往北京上访在动车上被便衣警察拦截
  • 2025.8.24 贵州毕节网友质疑当地安置房质量墙体松软如泥块
  • 2025.8.24 河北孟村杀妻嫌犯家门口被挂上“杀人偿命”的横幅
  • 2025.8.24 云南六个公共洗手台仅一个能用引发“面子工程”质疑
  • 2025.8.25 北京地铁10号线有大量士兵
  • 2025.8.25 广州天河区访民凌晨仍排队等待巡视组
  • 2025.8.26 山东聊城冠县网友称沿街商铺普遍空置出租
  • 2025.8.26 广州网友制作视频:《丰收的喜悦》
  • 2025.8.27 深圳城管扣押商户早餐车却未兑现还车承诺
  • 2025.8.29 四川广汉一拉人力车的老人疑持械反抗遭警察殴打
  • 2025.8.29 有抗议者在重庆大学城熙街投屏下巨幅标语,持续50多分钟
  • 结尾歌曲:《Crazy 老张|九三•最后一次阅兵》
Before yesterdayMain stream

秒级出片的 AI 视频来了!我用它做出最魔性的 Labubu,不会写提示词的小白也秒上手

By: 张子豪
28 August 2025 at 14:03

今年几乎天天都能看到各路 AI 视频大神刷屏,什么奥特曼对波马斯克,雪王大战东方明珠,切金属切玻璃 ASMR……看得人心痒痒。

但真轮到自己上手,你就会发现,这玩意儿纯属「开盲盒」,而且是成本巨高的那种。排队几小时是家常便饭,积分烧得比纸快,结果出来的视频要么人物畸变、画风诡异,要么干脆就把你的提示词当成耳旁风。

面对「AI 视频刺客」,还真有「卷王」站了出来

去年靠「毒液特效」出圈的 PixVerse,今天悄咪咪地放了个大招——PixVerse V5

他们这次号称搞了一套「准实时生成」的狠活,全面优化了动态、清晰度、一致性和指令理解能力。

▲ PixVerse 国内版首页

PixVerse V5 这次不光是小修小补,他们直接端出了三个硬菜:

1. 快速生成
这一直是 pixVerse 最大亮点, 他们通过极致的技术蒸馏,把视频生成压缩到了「秒级」。5秒钟出一段360p短片,1 分钟搞定 1080p高清视频

2. 更少 AI 味儿
V5 通过扩展美学数据和人类偏好拟合(RLHF),让模型更懂「好看」和「真实」。无论是复杂的人物运动,还是光影的真实感,都大幅提升,生成效果更接近真实拍摄。

3. 指哪打哪
最让人头疼的「AI听不懂人话」问题,他们用「统一特征空间」技术来解决。简单说,就是不管你喂给它的是一句话、一张图,还是一段参考视频,它都能更准确地理解你的意图,实现图、文、视频多模态的复杂创意,让你真正做到精准控制。

话是这么说,是不是吹牛还得拉出来遛遛。我第一时间搞到了内测资格,替大家给它上上强度。

快到离谱,价格感人

快,是 V5 给我的第一印象。

实测下来,一段 8 秒带声音的 360p 视频,从排队到生成完毕,基本都在 30 秒以内,包含排队时间和生成时间;而 1080p 的超高清视频,所需要的时间会长一点,但是基本上也在 2 分钟左右。

▲ 拿可灵生成视频来对比下,排队的时间是 3 个小时

除了快到离谱,V5 也便宜到感人。每天登录就送 60 积分(生成一段 5 秒 360p 无声视频仅需 20 积分),会员选项也很多,让「抽卡」的成本大大降低。

作为对比,可灵是每个月提供 166 积分,生成一段 5s 标准模式的视频也是 20 积分。目前可灵添加音效是限免,PixVerse 需要再加 10 积分。

时间和金钱这两大核心痛点,PixVerse V5 算是给出了一个相当漂亮的解决方案。 那么,最重要的质量如何?

强度实测:从「开盲盒」到「半开卷考试」

我们直接上硬菜,用几个热门案例来测试它的真实水平。

先来个简单的,生成广州塔的航拍镜头。

▲ 提示词:电影般的航拍无人机镜头,聚焦广州塔。使用柯达 35 毫米胶片拍摄,带有胶片颗粒感。动态航拍镜头,摄像机环绕移动。保留参考图像的构图、框架和结构细节。

PixVerse 做的确实很好,而且速度还快。此外,不像 Veo 3 目前还是只能生成 16:9 的视频,PixVerse 则可以根据上传的图片自动适应生成视频的比例。

接下来,上点难度,测试它的人物一致性和场景理解能力。

最近 nano-banana 非常火,我们前几天用它生成了非常多有意思的照片,社交媒体上也很多人用它来实现一个完整的故事,凭借着它强大的人物、环境、照片风格内容等一致性保持。

我们找了几组有意思的照片,看看 PixVerse V5 是否有能力可以生成一个视频。

首先是这两个打台球的女生,他们先是站在前面自拍,然后我想让他们走到后面,拿着台球杆开始玩。

结果有点意外。 场景保持得很好,走路动作和表情也到位。但……它莫名其妙给我多塞了一个路人女孩进来!

看来在理解复杂的双人交互和空间关系上,AI 还是会犯迷糊。不过对比 V4.5(之前会生成一些意义不明的慢镜头),V5 至少更懂「走路」这个意图了。

还有最近非常火的用 nano banana 来做手办图片,有了图片之后,我们又可以生成非常多有意思的视频。

▲ 提示词:将这张照片制作成一个角色模型。其后放置一个印有该角色图像的盒子,以及一台屏幕显示Blender建模过程的电脑。在盒子前方添加一个圆形塑料底座,角色模型站立在上面。使PVC材质看起来透明,并尽可能设置为室内场景。

我们先用 nano banana 制作了一个像是自己 3D 打印出来的 labubu,接着把这张图片丢给 PixVerse。

▲ 提示词:棕色的实体手办开始在桌面上探险,它左边走走,右边看看,最后跳回到了原来它旁边的盒子里面;盒子上的 labubu 不要动,保持静态的;电脑上显示的 3d 手办动画处于预览的状态,自动的旋转播放。

还有最近非常火,以假乱真的 AI 夜视镜头视频,我们也用 PixVerse 检验了一下。不得不说,这个效果很真实,小猫趴在熊背上,小心翼翼地跳来跳去,和熊的接触、跳跃的动作,都像是真的。

如果是处理这种简单的动作还不够上难度,我们直接给他一张滑板的脚步特写,让他完成这些复杂的滑板动作。

PixVerse V5 也能精准地生成脚部动作,并且不出现差错。 我们用 V4.5 试了一下,有时候是会出现鞋子反穿,还有一些很搞笑的是,看起来滑板很烫,不知道怎么下脚的奇怪动作。

可以说,PixVerse 确实在生成质量上有了很多方面的提升。整体感觉是,V5 版本在一致性和写实感上的提升非常明显,看起来更像真实拍摄,而不是带着浓重 AI 味的画面。

One More Thing,还有 Agent 创作助手

除了图生视频,PixVerse V5 还提供了续写、多主体、Agent 智能体等一堆花哨但实用的功能。

我最喜欢的是「续写」。目前大部分 AI 视频一次只能生成几秒,想做长视频就得手动截取最后一帧再生成,非常繁琐。

而续写功能可以相对丝滑地延长视频,支持 30s 内长度的视频,我用它做了个「猫猫做梦当大厨」的短片,效果很萌。

看这小猫最后满足的笑容!

而为了解决「不会写提示词」这个终极难题,V5 还上线了 Agent 智能体。这玩意儿就像个创意模板库,你只需要找到喜欢的模板,填入关键词,它就能自动完成意图理解、脚本生成、视频生成等一系列流程。

目前在 PixVerse 的智能体里面,提供了超过十个的项目。有前段时间很火的兔子蹦床、给角色或物体更换材质、结合多个物体生成一个新物种、甚至还有给宠物穿上蟑螂套装跳芭蕾这样的智能体。

我就把之前我们用的那张 Labubu 的照片上传给它,智能体的流程和模板还是不太一样,模板只是单纯的套用一套提示词,而 PixVerse 的智能体就像我们用 ChatGPT agent 一样,自动化全部的操作,像是省去了我们先去 nano banana 里面生成图片的流程。

虽然它偶尔也会犯傻,比如把我的 Labubu 手办识别成「穿着棕色蟑螂服装的形象」(我对不起 Labubu!)

但这跳得还不错的芭蕾舞,确实展示了 Agent 功能的潜力——大大降低了普通人的创意实现门槛。

目前,PixVerse V5 和 Agent 创作助手已经在国际版 PixVerse(https://app.pixverse.ai/)与国内版拍我 AI(https://pai.video/)的网页端、App 及开放平台 API 全面上线。

AI 视频,终于从「豪赌」变成了「刮刮乐」

综合体验下来,PixVerse V5 的这次更新可以清晰地总结为两个词:更快、更好

它或许还不是最完美的视频模型,处理复杂的多人交互时依然会犯迷糊。但这让我想起了豆包生图,质量可能不如 Midjourney,但它免费、量大、管饱,你可以随便试。

▲ 豆包一次性能生成 20 张图

PixVerse V5 走的也是这条路。它用「准实时」的生成速度和极低的试错成本,彻底改变了创作的心态。

过去,花几小时排队,烧掉大把积分,最后开出一个不满意的「盲盒」,那种感觉是痛苦和沮丧的。现在,几十秒就能看到结果,不满意就立刻重来,这种体验更像是「刮刮乐」——轻松、高频,且总期待着下一张能中奖。

从这个角度看,PixVerse V5 的核心竞争力,或许不是生成了多么惊艳的视频,而是在于提供了一种无负担、高频率的创作体验

当开盲盒的成本变得足够低,当 AI 的不稳定不再让你心疼时间和金钱时,AI视频创作,才算真正从少数大咖的神坛,走到了我们每个人的日常里。

文|李超凡、张子豪

原文链接:https://mp.weixin.qq.com/s/Q0_1JM-2tJa9VyMP0LYUBQ

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


戴上眼镜,起飞!影翎 A1 全景无人机首发评测

By: Lin
14 August 2025 at 21:00

你大概率见过这样一幕——一台航拍无人机,身上绑着一部全景相机。早在 2022 年,影石就嗅到了这股创意的风,推出了适配大疆 Air2 系列的全景相机套件「瞳 Sphere」,让无人机玩家第一次尝到了 「全景飞行」 的滋味。

▲ 为了给无人机挂上全景相机,用户和品牌都绞尽了脑汁

而今天,故事迎来了升级版:全球首款全景无人机—— 影翎 A1 登场。毫不意外,背后那双最熟悉的推手,依然来自影石。

品牌中文名叫「影翎」,英文名是「AntiGravity」,直译为「反重力」,这个词一听就是来搞无人机的,它是由影石和第三方团队共同孵化的品牌,全景无人机 A1 是他们的第一个产品。

▲套装包含:无人机本体、体感遥控手柄、飞行眼镜及电池

无人机本体的外观非常科幻。正面竖向排列的视觉避障模组就像电影中的外星生物,而上下两边的半球形凸起就是全景相机模组,一上一下的镜头放置方式和「瞳 Sphere」相同。

▲ 开机自动展开起落架,避免底部的全景镜头接触地面

让我成为一只鸟,在空中自由探索

既然是影石孵化的品牌,身上自然也流淌着影石的血液,尤其是全景合成技术。

影翎 A1 能够在飞行过程中实时合成全景影像,结合经特别设计的镜头布局,它能够实现出色的「隐形」效果,在飞行眼镜中环顾四周也不会看到机身和螺旋桨的踪迹。

▲ 戴着飞行眼镜转头可以轻松变换视线方向

想象你正在北京环球影城的哈利波特禁忌之旅上,飞车极速前进时,四周的景象尽收眼底。即便飞车在前进,你的视角却可以任意转动,就像是身临其境,飞车的方向并不限制你的视野。

影翎 A1 带给我的就是这种自由的体验,仿佛化身为一只在天空中翱翔的鸟,一边飞行,一边自由探索眼前的美景。这样的飞行体验,非常适合在各大景区应用——工作人员摇身一变成为无人机驾驶员,游客则可以「坐」在无人机上,随心所欲地欣赏四周的风光。

全景飞行的模式使其操作方式有别于传统 FPV 无人机——飞行方向只由手柄控制,不再与头显的视角同步。当你的视角与飞行方向不一致时,头显屏幕上会自动弹出一个悬浮窗,实时显示无人机前方的影像。而你只需轻轻转动手柄上的滚轮,就能迅速回到飞行器前方的视角并调整飞行方向,避免盲飞的风险。

其实对于新手来说是很好上手的,但如果你以前就飞过 FPV,那我建议你放下所有的经验,像个新手一样享受这份空中飞行的自由感。

很好玩,也很好拍

在这次体验的前半部分,我完全沉迷在自由的观光感受里了,直到我想起它还是一部能够拍摄全景视频的生产力工具,然后马上就发现了全景无人机的妙处——先专心飞,再随意构图。

影翎 A1 能够录制最高 8K@30fps 规格的全景视频(可惜由于是早期工程样机,我们只体验到了 5.7K@50fps 的视频规格),然后在后期软件里自由调整视角,设置关键帧打点实现一些高难度的镜头运动。

这意味着,在前期拍摄时飞手无需纠结构图与运镜。只要专注于操控飞行,确保无人机与拍摄对象的距离与相对位置即可。

以前,拍摄这些镜头时需要操控 FPV 无人机进行翻转、甩尾等高难度动作,还要冒着很大的炸机风险。但现在,只需在后期软件中拖动画面、设置关键帧,便能轻松重现这些效果。

也难怪早就有玩家们在无人机上绑全景相机了,确实好用。

让航拍过程成为一种享受

爱范儿觉得影翎 A1 会是一款彻底改变过往飞行体验的产品。

作为全球首款一体式全景无人机,影翎 A1 融合了手势体感控制摇杆、实时合成全景视频和全方位观测的飞行眼镜,为飞行者带来一种前所未有的体验。它让每个人都能在空中自由探索,尽情欣赏大自然的鬼斧神工。

对于影像创作者来说,这样的一体化设计也比曾经专机专用的外挂式配件来得更加可靠,无论是飞行操控还是拍摄体验都更上一层。

最重要的是,影翎 A1 突破了传统飞行的束缚,它解放了创作者们 「机不可失,失不再来」 的焦虑,将他们的飞行体验提升到全新的高度,让航拍的飞行过程本身也成为一种享受

给创作者们提供了大胆飞行、自由创作的底气,这才是影翎 A1 的独特魅力所在。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


实测大疆 ROMO 扫地机器人:这就是贴地飞行?

By: Lin
6 August 2025 at 20:00

做稳定器、做无人机和运动相机的大疆,终于还是杀进了扫地机器人赛道,惊讶的同时又觉得有些合理。

从技术上来看,大疆有做 RoboMaster 机器人,无人机上的避障系统也可以直接用,这么一想,太合理了。

于是,大疆就做出了他们的第一款扫地机器人—— DJI ROMO。

超前的透明外观,保守的清扫配置

按照配置由低至高分别叫 ROMO S、ROMO A和 ROMO P,爱范儿猜测是代表 Standard、Advanced 和 Professional。

▲ DJI ROMO 系列配置参数及价格一览表,由爱范儿制作。

它的外观让我眼前一亮,这应该是第一个用透明设计的扫地机器人吧。

通透圆润的外壳、充满机械感的内部、整齐清楚的管线和纹理,基站和主机的组合就像一个空间站和太空飞船,无论放在家里哪个位置都是一个很特别的装置。

手机 App 的设计也同样很有品质感,尤其是动画——我太喜欢这个应用的动画了,录了两个给你们看一下,立体的、会动的,非常炫酷。按钮的图标都是像素风,有点像 Nothing 手机的 UI,不知道他们两家是不是有过联系。

扫地机器人这个行业已经卷出了很多新形态,年初还有产品内置了可以伸缩的机械臂,能把鞋子和垃圾给你夹走,这太离谱了。

对大疆来说,真要做个机械臂也不难,悟系列无人机就能在空中自由变形。不过这次他们比较保守,选择基于主流的方案做优化,保留了常见的边刷、拖布双机械臂方案,可以向外伸出提高覆盖率。

两段式防缠绕主刷配合大疆自研的风机和优化的直通式风道设计,吸力高达 25000Pa,洒在地毯上的咖啡粉也能被直接吸走。类似的方案经过了众多消费者的验证,大疆用自己的研发和设计去进一步提升性能。先守正再出奇,这话好像有点耳熟。

把避障系统从天空中带到沙发底

避障就是大疆的主场了。说到这,你知道你家里的扫地机器人是怎么检测障碍物的吗?

  • 市面上最简单的方案是机械碰撞,就像个碰碰车,不撞南墙不死心;
  • 主流的 LDS 方案,里头有这么高速运转的激光雷达,精度高建图快 360 度覆盖,但它只能探测固定的高度,地面上的物体还得靠撞;
  • 比较新的双目视觉方案,通过视差计算深度,再用 AI 识别障碍物的种类,但是需要算力更强的芯片,暗光下还得开灯;

那大疆是怎么做的呢?用四个字来形容那就是——力大砖飞

ROMO 在紧凑的体积里塞进了一组双目视觉传感器和三组双光源固态激光雷达,并且是全系标配。

  • 正面的两颗高性能鱼眼相机负责识别近处的障碍物,根据物体类型采取不同的清扫策略;
  • 双光源固态激光雷达由面光源、线光源和接收器组成。面光源负责探测中距离范围内的障碍物,且因为是负角度对着地面,能精准探测地面障碍物。线光源负责中远距离探测,能快速获取地形信息,有利于快速建图和路径规划。这样的激光雷达组合,正面有两个,背面还有一个。

理论上它的避障性能会很强,我们也实测了一些场景。

地面弯曲的数据线是扫地机器人最大的杀手,基本上每个品牌都针对性地做了避障,而大疆因为有更精确的距离信息,可以做到更极限且灵活的贴边清扫。

面积小而且超级薄的扑克牌,ROMO 也可以识别并调整路径,躲避卡片的同时在没有障碍物的区域穿行清扫。

还有个我觉得挺强的点,因为它前面的两颗鱼眼镜头视角超广,所以它能在转弯前就看到墙角另一侧的障碍物,实时修改路径规划,避免发生碰撞。

如果你家里有宠物的话,一定要关注液体和粪便的避障功能。在检测到地面有不明液体的时候,ROMO 会主动进行更远距离的避让,避免打湿边刷还把其他地方弄脏了,遇到宠物便便的时候也会同样进行避让。

另外因为地图精度高、导航算法强,ROMO 还能在遇到复杂障碍物时候,智能选择不容易堵塞的大路,就像我们在手机导航里选「大路优先」一样,省去了在迷宫里穿梭的时间。

还有个功能叫「柔性拖布」,就是在遇到桌腿的情况下,机器可以一边扭身子一边伸缩拖布,拖布可以紧紧贴着桌腿。

不过可能是测试版的原因,我们在测试的时候偶尔会遇到不够贴边的问题,这个功能还是挺实用的,希望大疆能在之后的版本里大胆「擦边」。

大疆,本就是一家机器人公司

早在半年前听到大疆要做扫地机器人的时候我是真的很震惊,然后就会觉得,对啊,大疆本来就是个机器人公司。

无人机是四个螺旋桨的机器人,「大疆车载」智驾系统是四个轮子的机器人,那扫地机器人就是两个轮子的机器人。大疆在传感器、通信系统、导航系统、控制系统等方面的技术积累,让它可以在多个领域内轻松迁移。

DJI ROMO 作为大疆的第一款扫地机器人,它的确是是市面上很与众不同的东西,独树一帜的外观风格、独领风骚的传感器配置,实际表现却有些不及预期。

不过我觉得这些软件方面的 bug 对大疆来说都不算事儿。毕竟保持技术优势和强大的创新力,是大疆的生存之道。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


「兔子蹦床」播放超 5 亿!这条全网最火 AI 视频,是人类爱被「骗」的结果

By: 张子豪
4 August 2025 at 14:32

一段看起来像是夜视监控拍到的「兔子蹦床」视频,在 TikTok 上爆火,全网收获了有 5 亿次播放。

视频看上去像是某户人家的安防摄像头拍到的,灯光昏黄、画面模糊,但恰到好处地捕捉到几只兔子轮番起跳,活像在开夜间演出。

视频的标题写着:「刚查看了家庭监控,我想我们家后院来了几位特邀嘉宾!@Ring」 。

监控的模糊画质、几只看似在狂欢的兔子,这可爱又略带一丝真实感的画面迅速吸引了人们的眼球 。

在社交媒体平台 X 上坐拥百万粉丝的名人 @Greg 也评论说,「我从没意识到自己需要一群蹦床兔子,直到今天」。

然而,这份可爱是虚假的。视频中的兔子并非真实存在,有人发现,它是AI生成的。

第 5 到第 6 秒之间,左上角的兔子忽然「消失」。回头再看,细节确实有点怪。

但和大多数「AI 穿帮」视频不同,这次几乎没人第一时间认出来。哪怕是刷视频经验老到的年轻人,也直呼「完了,我居然被骗了」。

但这不是一场骗局,更像是一种小型社交媒体的灾难:不是「我们被骗了」,而是「我们居然愿意被骗」

看似糊得刚刚好,其实「骗」得刚刚好

这段 AI 视频之所以能成功「欺骗」大众,很大程度上并非因为 AI 视频生成技术已经完美,而在于它「骗得刚刚好」。

它精准地利用了我们对监控视频的固有印象,也踩中了最能让我们放下戒备的那些流量密码。

模糊的夜视画质和静态背景,刚好遮住 AI 的弱点

我们习惯于认为夜晚监控录像就是模糊、黑暗且充满噪点的。这种先入为主的印象,完美掩护了 AI 视频的技术硬伤,例如在动作连贯性、阴影细节和背景动态上容易穿帮等问题。

所以当它以「夜晚监控录像」的方式出现时,画质本身的低清模糊反倒成了障眼法,帮它遮住了真实感缺口。

▲ 视频画质符合夜间监控特点,且背景是完全静止。

此外,尽管一些 AI 视频生成模型在处理前景主体方面已经相当出色,但背景的渲染往往会显得非常超现实。

而这段视频的背景是静止的,这又为 AI 规避了一个技术难题。

带「@Ring」的文案增强了来源可信度

视频发布者在标题中聪明地标记了家庭安防摄像头品牌「Ring」,一下子就让这视频的来源显得有理有据,让人感觉更真了。

▲ Ring 是家庭摄像头品牌

这个小细节营造出「这视频是别人家门铃拍到的」错觉,让人自动归类为「生活记录」而非「创作内容」。

「动物夜间搞事情」是互联网用户默认接受的 meme

无数次病毒式传播的视频,已经训练我们相信这个场景是真实的。猫晚上偷吃泡面、浣熊夜闯泳池、郊狼在蹦床玩耍,动物们总爱在人类不在时「犯规」一下。兔子蹦床这种事,怎么看都合理。

▲ 熊闯入游泳池

最重要的:它太可爱了!谁会去质疑这么温柔的一幕呢?当一段内容足够甜、足够轻,它就很容易让我们「选择相信」。

尽管视频中间,左上角的兔子突然消失,暴露了 AI 生成的本质。但对于绝大多数刷短视频,快速滑动的观众来说,这一瞬间的破绽极易被忽略。

就在兔子视频引发热议的同时,马斯克也分享了 AI 视频技术的惊人进展。

10 天前,一段 6 秒的视频渲染需要 60 秒,之后降至 45 秒,再到 30 秒,现在已缩短至 15 秒。

本周我们或许能将时间控制在 12 秒以内。

他同时表示,实时视频渲染技术有望在 3 到 6 个月内实现。

▲ 马斯克推特截图

这意味着,今天我们还能看到的「兔子消失」这类穿帮镜头,在几个月后可能就几乎很难发现里面的 bug。

当 AI 视频在技术上无懈可击时,再去讨论「如何分辨真假」就失去了意义。

这也让我们不得不把目光从技术本身,转移到更核心的问题上。

让我们被骗和狂欢的,其实不是 AI

视频的真相揭晓后,许多用户表达了一种「信仰崩塌」的感觉。

一位 TikTok 用户说,「这是第一个我相信是真的 AI 视频,等我老了肯定完蛋了」。另一位用户则表示,「现在我觉得我以后就会是那种被骗的老年人」。

这种从自信到恐慌的情绪转变,成了一个新的网络热点。

然而,将问题仅仅归咎于「AI 发展得太快」或「我们太容易被骗」,可能忽略了更深层次的原因。这一事件的核心,或许不在于 AI 技术本身,其实在于社交媒体平台本身的那一套玩法。

通过翻看视频的评论记录,我们发现人们在评论区的反应,呈现出来的几乎是同样的一个心理剧本。

首先是「天啊,这也太可爱了」;

然后,「等等,好像不太对劲?」;

第三步,「我被骗了?完了,我要变成会被骗的老年人了吗」;

最后还是回到了,「但……我不怪它」

我们正在和 AI 视频建立一种全新的「互动逻辑」。

我们不是完全相信它,而是默认它可能是假的,但我们依然愿意停下来看看、点个赞、转发给朋友猜一猜,就像一个游戏。

▲ 短视频平台推荐系统

而平台的算法,也深知这种心理结构。

在这个过程中,「AI 视频是真是假」不再是重点,它更像一种参与门槛:你看懂了没?你能分辨出来吗?你被骗了吗?

AI 爆发的这两年,我们总是感叹 AI 视频图片已经能以假乱真,因此感到恐慌,担心自己未来会更容易被虚假信息蒙蔽。

然而,这个视频的病毒式传播,并非完全源于 AI 技术的「欺骗性」,而是源于人类观众内心深处对「被欺骗」的需求。

这些网友不都是被动地被骗,而有不少是主动地、心照不宣地参与了一场名为「假装相信」的集体游戏。

这场狂欢的主角不是 AI,而是我们自己。

正是视频中那「一闪而过」的兔子消失 bug,才让整个事件升级为一场全网参与的「找茬游戏」。如果视频完美的天衣无缝,它可能只会然后迅速被下一个视频淹没。

▲ 电影「致命魔术」

这就像观众明知道魔术师在「欺骗」他们,但他们享受的恰恰是那种「明明知道是假的,却看不出破绽」的认知挑战。

AI 兔子的「穿帮」,就是这个魔术被揭穿的时刻,它让所有人加入讨论,从而引爆了传播。

缺陷创造了争议,争议驱动了参与。视频的真假不再重要,它所引发的混乱和讨论本身,就是流量的保证。

这种「我竟然也被骗了」的自嘲,迅速拉近了陌生网友间的心理距离,形成了一种「我们都是容易被骗的笨蛋」的社群认同感。由「共同被骗」而产生的连接,其社交价值远大于视频内容本身的真实性。

理想的情况是,我们学会有意识地享受这种「虚假内容」带来的乐趣,同时保持一份清醒的认知,但这可能对大多数人来说并不容易。

潜在的危险不只在于 AI 的逼真程度,而在于当这种「集体欺骗」被用于恶意时,比如制造谣言或骗局。我们需要建立的,是对信息「意图」的识别,而非仅仅对「真伪」的判断。

我们可以多问问自己:这个内容想让我产生什么感觉?它最终想让我做什么?

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


亲自抓个精力独角仙吧!

By: Steven
24 July 2025 at 17:42

为了给旷野之勇者套装升级,需要给大精灵忒拉提供 15 只精力独角仙,但这家伙神出鬼没,抓是不难,但遇到它可就太难了。

于是,我们决定自己做一只,放进游戏里,想抓就抓:

倒也不是什么新鲜事儿,但是吧,当 AI 参与进来之后,这个过程就大大缩短了。

从想法到落地,也就一天。

VidPic – 免费在线图片制作视频工具,简单快捷无需登录

By: Anonymous
10 January 2025 at 14:59

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

VidPic 是一款免费在线工具,主要功能是将图片和音乐合成为视频,也能加入字幕、预先调整尺寸,只要几分钟即可快速把图片转换为高清视频格式!VidPic 本身具有中文在内等多国语言界面,操作上也很简单,几乎不用花太多时间就能轻松操作,算得上是很方便的免费工具。

VidPic 最大特色是所有操作过程都在本机浏览器上进行,因此不会有任何图片或音乐被上传到远程服务器,极大程度保障资料隐私和安全性,接下来就介绍这项服务的实际操作方式。

VidPic 是一款免费在线工具,支持将图片和音乐合成视频,无需下载或登录,快速生成高质量短视频!

进入 VidPic 网站后先从右上角切换语言,从上面的链接连到 VidPic 默认会是中文。

点击中间的上传框、选择要制作成视频的图片,可一次选择多张图片〔批量选择〕,支持 JPEG、PNG 和 WEBP 格式。

接着照片就会变成视频显示于 VidPic 编辑页面,下方有一排主要功能,包括:添加图片、设置背景音乐、设置视频尺寸、编辑字幕和下载完成的视频,若要加入更多图片可点击第一个按钮。

VidPic – 免费在线图片制作视频工具,简单快捷无需登录

下方会看到视频内的每张图片出现顺序,可以自由调整顺序或是删除。

每张照片会有一个固定的显示时间长度〔默认 2 秒〕、使用「淡入淡出」过场效果、过场时间 0.5 秒,试着预览播放视频就会知道制作出来的效果。

利用 VidPic 制作出来的视频很像照片幻灯片,很适合用来展示大量的图片,值得一提的是有不少可选用的过场效果,当然,这些都是免费、没有隐藏费用也不需要订阅。

将图片制作成视频后,也可以加入背景音乐,使视频看起来更活泼生动,点击「设置背景音乐」后就能加入音乐文件。

进入「设置视频尺寸」后可以预先调整视频尺寸大小,默认是平均宽高,会直接使用图片尺寸带入视频的长度、宽度,亦可调整为指定宽高、指定比例,设置图片平铺方式和填充颜色。

点击视频尺寸设置的「指定比例」计算方式,可以调整成不同的视频比例,例如 16:9、1:1、16:10、4:3、9:16 或是 3:4 等选项。

VidPic 还有加入字幕的功能,可以在浏览器内对视频的字幕进行编辑,也支持导入导出功能。

设置过程可以随时回到视频播放器,点击「播放」按钮来预览视频实际效果。

最后,点击右下角「下载视频」按钮就能将转换、制作完成的视频保存起来。

Luma AI – 生成式视频 AI 巨头重磅更新,创新的视频创作交互方式

By: Anonymous
25 November 2024 at 22:50

DUN.IM BLOG

DUN.IM BLOG

AI 视频,还能往哪个方向卷?Luma AI 的答案有些与众不同。对手还在练一招一式,它却像风清扬传授独孤九剑,讲究灵活变通,如行云流水,任意所之。

Luma AI 或许不如可灵、Runway 知名,但论实力也在第一梯队,它的视频模型叫作 Dream Machine,今年 6 月发布,最近进行了重磅升级,是推出产品以来声势最大的一次。

其中包括两项更新,一是发布自己的图像模型 Luma Photon,将文字、图像、视频一锅端;二是打造了生成 AI 视频的全新工作流,我们可以像和 ChatGPT 聊天一样,让 AI 生成视频,不用对提示词字斟句酌。

对于生成视频这件事,Dream Machine 首创了一种很新的方式。

Unlock your creativity with Luma AI Video Generator. Turn text into stunning videos with our cutting-edge text-to-video AI.

打开 Dream Machine,我们先看到的是「Board」,可以将它理解为无限的创意画布,在这里,我们使用自然语言,自由地生成图像或者视频。

开始一块 Board,我的提示词写得非常简单:「创建一个日式悬疑少年漫画的角色。」

AI 扩写了我的提示词,一次生成了 4 张图片,但是不行,年代不对。

没关系,再在对话框输入一句,「放在现代背景」。

AI 表示懂了,又生成了 4 张图片,右上这张孤身走暗巷,已经接近我想要的感觉了,但仍然不够,我想要他抬起头,露出五官。

不难,继续微调,忘掉复杂的提示词,和 AI 打直球就可以。

右下这张不错,虽然形象幼态了点。接下来,我想让 AI 生成一个视频,主角在同一条巷子里从白天走到黑夜。

Dream Machine 生成视频的首尾帧功能,就是为这种需求准备的——我们挑好头尾的两张图片,让 AI 补足中间的过程。

那么,我们只需基于满意的图片,让 AI 生成几张白天场景的,沟通方式还是一样的简单粗暴。最终选定的两张图片,细节略有落差,但同框也不违和。

万事俱备,只等生成视频,AI 过渡得还算自然。

看到这里,你应该明白 Dream Machine 和其他视频工具的区别了。

其他视频工具,通常是给你一个填入提示词的文本框,然后让你设置运镜、时长等参数。设置一次,生成一次。

但 Dream Machine 的界面,看起来非常像和聊天机器人交互,底部是输入框,文生图、图生图、图生视频、文生视频,都可以在这里进行。

专业创作者可以继续写传统的提示词,但我们也拥有了「讲人话」的权利,压力给到 AI,Dream Machine 能够理解上下文,帮我们完善提示词,我们可以从一个非常粗糙的想法开始,和它边聊边改边优化。

又因为 Dream Machine 是无限画布形式的,我们可能在一个环节反复生成,素材都会保留下来,不会互相覆盖。

我们的思维,不会局限在一段提示词、一个视频,而是像水一样流淌,更多的想法,可能就在这个过程里产生了。

Dream Machine 的全新工作流就像大树的主干,其中一些好玩且实用的功能则像枝桠,相得益彰,才能枝繁叶茂。

起到关键作用的,就是 Dream Machine 最新发布的图像模型 Luma Photon。

图片怎么生成得更符合我们的审美?Dream Machine 支持风格参考和角色参考功能。

先说风格参考,我们可以导入自己的图片,AI 会将风格融入到创作中。官方给出了一个例子:按蒙德里安风格,生成小鸟版的《戴珍珠耳环的少女》。

按这个思路实操一下,基于男性侦探的形象,参考梵高《星月夜》的风格,生成女性侦探。

二次元遇上后印象派,化学反应很奇妙。

角色参考功能,则可以通过一张图片,就实现角色的一致性,让这个角色出现在更多的图片和视频里。

Luma AI – 生成式视频 AI 巨头重磅更新,创新的视频创作交互方式

马斯克是行走的素材库,这样的例子太没挑战性了,我决定让甄嬛瞬移到哈利波特的世界,看场景变了之后,她还能不能气场两米八。

结果有些不好评价,看得出来是甄嬛的面容,但娘娘的长相入乡随俗,五官尤其眼睛,变得更像欧美人了。

其实,不另外找图片参考,Dream Machine 也可以让图片、视频不泯然于众人,这时候就要用到「头脑风暴」功能,它会根据你生成的图片,推荐一些艺术家的风格。

就像甄嬛进霍格沃茨这张,我们可以用吉卜力工作室风格二创。

不仅如此,提示词里的一些关键词,被框选了起来,能用下拉的选项替换,Dream Machine 称之为「概念药丸」,我们不用自己手写提示词,一键更换艺术风格,或者画面元素。

把「吉卜力」换成「新海诚」,把「独角兽」换成「龙」,不过点击几下的功夫。

Luma Photon 模型,基于 Luma 的通用 Transformer 架构构建。通过开发自己的图像模型,Luma AI 可以减少对 Midjourney 等外部图像模型的依赖,同时也能解决文生视频不稳定的问题。

当然,视频是老本行,镜头运动这种可控性功能,Dream Machine 也少不了。

紫禁城的甄嬛,和霍格沃茨的甄嬛,能不能实现丝滑的转场呢?用推拉镜头,画面有动感,人物没有严重的变形,可以打个 80 分。

巧的是,前两天 Runway 也官宣了自己的图像生成模型 Frame,和 Luma 更新是同一个晚上,看演示就知道非常注重审美,目前正逐步向 Gen-3 Alpha 开放资格。

▲ Runway Frame

图片的生成质量、美学高度,以及视觉风格的一致性和可控性,越来越被视觉模型重视了。

这对创作者来说是好事,当我们用 AI 进行平面设计、角色设定时,其实就是在生成一个独特的世界,讲一个独特的故事。

Runway 的 CEO Cristóbal Valenzuela 认为,Runway 不是一家 AI 公司,而是一家媒体和娱乐公司,AI 公司的时代已经结束了。

他不是在唱衰 AI,恰恰相反,他认为 AI 是一种基础设施,真正的革命不在于技术本身,而在于它所实现的东西:新的表达形式、讲述故事的新方式、连接人类体验的新方法。这和 Luma 的进化方向不谋而合。

这次更新之后,Luma AI 首席执行官兼联合创始人 Amit Jain,给 Dream Machine 下了一个很有趣的定义——视觉思维合作伙伴。

概念有些抽象,他的意思其实就是,让生成图片、视频这样的视觉创作,像聊天一样简单、直观。

交互的方式,影响着我们思考的方式。画布式的工作流,能将脑洞可视化,记录所有的创作过程和结果,呈现生成视频的完整思路。

无限画布通常在图像模型较为常见,比如 Recraft 和 Ideogram 的 Canvas。Dream Machine 的画布更加规整,相同提示词生成的素材和变体横向排列,不同的则竖向排列。

边聊边生成边优化的过程,会让人觉得,一个独立的小世界仿佛在画布里诞生。

先让 Dream Machine 用超写实电影 CG 风格,创造一个工业废土背景游戏的主角。

然后用环绕镜头,让主角动起来,并塑造环境的空间感。

接着,我们可以再和 AI 聊,让 AI 继续生成废土世界观里室内室外的各种场景,让 AI 建议我们怎么塑造得更有末日气息。

 

某种程度上,这个画布,就是我们个人故事的设定集。

当然,Luma AI 的 bug 也很多,包括但不限于,用一张图片实现角色一致性,效果并不理想;积分如流水,图片和视频还是要反复抽卡;图片模型可以生成准确的英文,但中文不行……

但意思传达到位了——少谈参数,以交互为出发点,构建一个 AI 创作工具。

更好的视频模型,不只是有更快的生成速度、更可控的镜头运动、更独特的美学,它应该也提供更好的讲故事的方式,让文字、图像、视频都作为表达想法的工具。

Dream Machine,造梦机器。

只管去创作吧,如同 Luma AI 的这句话:「不需要写复杂的提示词,问就好了。」未来 AI 留给我们的问题,不再关于技术,而是关于我们用它构建什么。

完全免费 AI 绘图工具 Dreamina AI,支持中文描述生成图片

By: Anonymous
20 November 2024 at 17:03

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

当前 AI 绘图工具已经全面席卷全球,你还在找一款能够用文字或图片生成的免费 AI 图像生成工具吗?分享一款由抖音旗下剪映推出的 AI 图片生成平台「Dreamina AI」,只要输入简单中文描述就能立即转成图片,甚至还能搭配多层画布进行修改、重新创作和视频生成,而且还是完全免费和无限次数使用。

完全免费 AI 绘图工具 Dreamina AI,支持中文描述生成图片

Dreamina AI 是一款由剪映推出的在线 AI 创作平台,能够帮助用户将文字描述转化为视觉艺术作品。支持多种创作模式,包括文字绘图、视频生成和图片扩展,适合专业艺术家和普通用户使用。

另外 Dreamina AI 绘图创作平台还支持智能画布功能,可以通过画布混合多种 AI 生成图片,还可以进行局部重绘或扩展画布等功能操作。

想要使用 Dreamina AI 要先用电脑网页版登入和注册会员,可以通过 Google、TikTok、Facebook 或 CapCut 移动版来注册登入。〔手机版目前会跑版建议改用平板或电脑板,至于 App Store 有 Dreamina AI App 也并非是官方推出〕

👉 前往 Dreamina AI 在线生成图片

要是首次注册账号,会跳出 Dreamina 平台要整合 CapCut 账号信息权限,直接点「确定」继续。

进入 Dreamina AI 主页面后,就可以点击「图片生成」开始使用 AI 生成功能。

接着可以再生成图像输入框内填入生成 AI 图片的文字描述〔咒语〕,不管是输入中文或英文都能够使用,实际测试 Dreamina AI 中文生成图片准确度也不差,不一定要用英文才比较高,当然也可以上传照片,依照现有图片来生成。

图片模型部分,会提供三种 Dreamina 模型效果分别如下:

底下还能够设置图片输出长宽比例,以及大小尺寸分辨率都能够手动设置,都设置完成后就按下「生成」就可以开始生成免费 AI 图片了!

Dreamina AI 在输出算是非常快,只要几秒就能生成出四种不同风格的 AI 图片,像是底下是直接生成 Lego 乐高 AI 图片海报风格图片。

说实在 Dreamina AI 生成图片效果,与当前大多数 AI 绘图工具也都不会差太多。

底下也尝试文字描述咒语来生成漫威的雷神索尔画面,会生成出不同风格和脸型效果。

用下来发现 Dreamina AI 对中文理解能力算是很强大,AI 工具基本都能理解我们在说什么,像是可以让可爱老鼠或兔子也能骑机车外卖。

连同用 Dreamina v2.0 Pro 模型来生成真人效果也非常逼真,让你看不出来这是用 AI 生成。

不过有些时候不能谈到敏感话题或文字,甚至有些上传图片有红色就会被系统认为血腥,违反了《社交自律公约》内容,遇到这情况只能换其他张照片或改用其他文字描述。

点入生成 AI 图片后,可以直接将原始图片下载到设备上,侧边还提供多种选项能够进一步调整,像是重新生成、重新调整提示、增强分辨率、润饰、局部重绘、展开或移除,以及能够在画布上编辑或生成视频等。

要是想在 AI 图片上额外修改局部画面,可以直接点入「局部重绘」功能,直接圈选划线都可以,像是我随便在画面划一下,Dreamina AI 马上就在行李箱上加入皮带配件,有如设计师能帮你随意修改,超级猛!

至于 Dreamina AI 提供的「画布」功能,简单来说就是在线 Photoshop 编辑器,能够在页面内用 AI 生成图片后,能够直接抠图,另外上传图片进行合成,侧边也有图层能够进行调整拖移,基本算是很容易上手。

以上就是 Dreamina AI 生成图片工具的技巧介绍,整体来看 Dreamina AI 算是一款功能强大、易于使用的 AI 图像生成工具,能让每个人都能成为艺术家,如果你想尝试看看 AI 绘图功能,或是想要创造出不同图片效果,倒是可以通过 Dreamina AI 来快速生成,且还能支持中文提示词,对大多数人来说也算是非常好上手。

TimeLapseCam – 让抽屉里的闲置安卓手机变身为延时摄影神器

By: Anonymous
15 October 2024 at 12:59

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

TimeLapseCam 是一款 4MB 大小,只需要 6.0 就可以运行的 Android 延时摄影,可以在屏幕关闭的情况下继续录制延时,还能自定义调整分辨率、定时录像、禁用快门声,没有录制限制,堪称闲置安卓手机的最佳伙伴。

Contribute to woheller69/TimeLapseCamera development by creating an account on .

谁抽屉里还没有一两部淘汰下来的安卓手机呢?(没有请举手)

如果,我是说如何还能开机,那么拿出来试试这款应用,说不定解锁了新姿势。

TimeLapseCam 是一款简单易用,但暂无中文界面的 Android 延时摄影应用,不过其已经配置的很好了,打开就能用。
设置界面
默认一秒拍摄一张照片、不限时,直到你点击停止。可以修改拍照间隔,最长 10 分钟一张,也支持自动结束时间,最长 46 个小时。

还能定时开始拍照,以及关闭屏幕后继续拍照。

在 TimeLapseCam 中打开 REST API 之后,就能用浏览器打开 http://192.168.2.182:8085/rest,看到如何使用 API:

REST API v1:
GET /1/ctrl/status: Get current state: [stopped/running]
GET /1/ctrl/start: Start recording
GET /1/ctrl/stop: Stop recording
GET /1/ctrl/param: Get parameter
GET /1/device/battery: Get battery percentage
GET /1/current/img: Current / last recorded image
GET /1/current/imgcount: Image count
GET /1/current/lastimg: Last image: Name, Timestamp and URL
GET /1/img/list: List image folders
GET /1/img/listhtml: user clickable HTML page
GET /1/img//list: List folder / images
GET /1/img///list: List folder / images
GET /1/img//…/: Download image

比如:http://192.168.2.182:8085/1/img/TimeLapseCam/2024-10-15/TimeLapseCam0.mp4 可以直接播放最近一段视频

copyparty – 免费开源强大的文件服务器,支持 WebDAV、FTP、媒体播放等超多功能

By: Anonymous
19 October 2024 at 12:16

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

copyparty 是一款功能非常丰富的多功能文件服务器,主要用来你电脑、服务器、设备里的文件,并通过、WebDAV、FTP 等方式访问,还支持播放音乐、上传文件、权限设置等功能。

几乎可以在任何有 Python 环境的地方运行,还支持 Docker 托管,以及 系统下的单可执行程序,甚至可以在 中运行。虽然运行很容易,但我不敢说它简单易用。

Portable file server with accelerated resumable uploads, dedup, WebDAV, FTP, TFTP, zeroconf, media indexer, thumbnails++ all in one file, no deps – 9001/copyparty

copyparty 给自己的定位是「便携式文件服务器,具有断点续传、重复数据删除、WebDAV、FTP、TFTP、零配置、媒体索引器、缩略图++,全部集成在一个文件中,无依赖。」

所有的功能集中在一个 .py 文件中,718 KB,直接运行就可以了。Windows 系统有编译好的 .exe 单可执行文件,双击也即开机用。其他平台直接 python copyparty-sfx.py 就行了。

就是文档太啰嗦了…看不下去。

直接运行就可以在浏览器访问 http://127.0.0.1 了,默认会使用 80/443 端口,打开就是这样的:

可以上传、、播放、听歌、看图片…非常纯粹的文件分享。有一种 Alist 的感觉,不过它不支持网盘。

只需要在启动的时候添加一个用户,就能设置权限了,包括只读、文件夹限制等等:

这一行的意思是创建了三个用户:u1/u2/u3,为它们挂载文件夹 music,对 u1/u2 两个用户只读,u3 用户可以写。

但注意有参数后,访问端口就变化了(3923)。

copyparty 默认开启了 WebDAV,只需要在你的 WebDAV 客户端里直接连 http://ip:3923 就行了。

甚至,你可以通过 WebDAV 把这个文件夹映射为 Windows 的网络磁盘,不过 Windows 默认需要 https,改一下注册表就好了。

而 FTP 则需要在启动的时候添加 --ftp 21 参数,用户名密码和上面的设置相同,不设置就支持匿名访问。

先答应

By: Steven
16 September 2024 at 23:58

最近有几件事,给我了一些触动。

因为确诊抑郁症后,我向公司请了长假来休息,所以忽然多了很多大片的空闲时间。可是吃药的感觉很不好,昏沉、嗜睡、动力低下且多屁。我觉得这不是适合我的方式。于是有了健身,有了我的理智告诉我:

先答应,强迫自己出去。

第一件事是汉洋跟我说他们计划九月初去一趟东北,给辽塔扫描建模,问我要不要一起。其实前几年他问过我好多次,每一次我都因为忙于工作,婉拒了,有时呢,是因为懒得动,也婉拒了。这次我心中有个声音:你先答应,然后就不得不去了。我就这么把自己推了出去,跟汉洋、Tim、夫聪去辽西走了一趟。

一上车,汉洋就问我,为什么这次有空来了?我说,重度抑郁症休病假了。他和 Tim 很自然地说,哦,这个咱们身边搞创作的朋友很多,然后就开始直奔沈阳。汉洋还给我拿着一台他刚从日本淘回来的 Mamiya 645 1000s,这是我第一次正经使用一台胶片相机,并且是一台 120 画幅的腰平取景器的机械单反。

这台相机在这一趟,教会我一些事。回头我再把整理好的照片陆陆续续发出来,有些照片我还是很喜欢的。这一趟时间虽然不长,但它不仅让我这个广东仔第一次对东北有了清晰的体会,也触动了我心中的一些东西。

出发前,脑放电波的 Nixon 问我要不要在苹果发布会之前合作一期节目。我下意识地想婉拒,但另一个声音说:

先答应,又不用你操心,你说就好,答应了再说。

这样,我又一次把自己推向了「不得不做」的位置上。

那一期节目似乎很不错,反响挺好。甚至一些路人都留言表示很喜欢这一期,说很有收获和启发。这对我是一种鼓舞。

在东北的路上,我们在车里聊起理想 mega、小米 SU7 的设计,汉洋说我们回去之后录一期节目吧。我其实不太想,毕竟工业设计这个母题太大了,轮不到我这个在设计领域里并无建树的人来说。但是,可以先答应吧,万一能聊出什么来呢?后来回到深圳,汉洋跟轶轩一起,我们仨在汉洋的酒店房间里聊了两个小时,在轶轩那些简单、外行、尖锐的问题的触动下,我觉得那一期节目剪出来之后应该不会太差。虽然可能只是很基础的科普,但大体上应该值得一听。

结束后我问轶轩,这样聊下来,你现在知道工业设计是做什么的了么?他说,虽然不能简单地描述出来,但确实理解了。

这又是一次把自己推出去,但不差的体验。尽管那天我们被突如其来的大雨浇透了,但也因此在轶轩家里打了几把《黑神话·悟空》,能算是好事吧。而且,就在临出门吃晚饭前,辽塔之行的大部分胶片都扫出来了,全部看下来,有几张还是不错的。他俩纷纷表示,作为第一次用胶片,算是很成功了。

也许有鼓励的成份,但有几张我很喜欢,回头要找 Tim 用飞思精扫再制作出来。

和创作有关的事情,我都不觉得累。

最后一天我在 Tim 的工作室里问他:经常接触不一样的项目,你会觉得疲惫吗?他的回答是,如果经常做一样的事,我就会觉得非常疲惫。

我也一样。

那天还偶遇了梁源,他们在楼下录了一下午节目,聊黑悟空里的佛教文化和文物。我旁听了几小段,挺有意思的。节目这两天也陆续上线了,虽然我说很感兴趣,但也确实提不起劲儿去点开它们,只能先 Mark 在列表里。

去找 Tim 的前一天,跟汉洋去了他们现在的工作室。养伤的 JT 在做日常的康复力量训练,看上去也很迷茫。晚上跟重轻一起吃饭,他看着也挺疲惫,疲于应付白天无聊活动的倦怠。我似乎向来都很喜欢这般真性情的人,嬉笑怒骂都可以自然流露。依稀记得也曾有人这样评价我,但又似乎是很遥远的故事碎片。

今天早上突然想看看苹果新品,手欠翻了翻图纸,看着看着就似乎琢磨出一些线索……截图往群里一放,两颗皮蛋就来问我要不要一起做一期节目。

好吧,虽然我原本可能想搞一期《设以观复》的,但我可能做不动了,如果有他们一起搞的话,是不是我自己的节目真的无所谓,但起码算是对一直关注我的人们有一个交待吧。他俩八月份就问过我和 Toby 要不要在发布会后一起录一期播客,没曾想居然还凭空出来期视频。

且不管能出来什么,先答应吧。

答应了就得不得不面对,不能偷懒。

我是病了,但不是傻了,如果说这段时间我发现了什么之前没注意到的事情的话,那就是「先答应」吧。

我过去很紧张,要有安排,要有预期,要有 planB 和后手,但渐渐发现有这些也不怎么管用,突发状况永远层出不穷,它们总能在预想之外的地方出现。先答应,硬着头皮上,反而似乎并没有我以为的那么多阻力。

例如这两天跟着筱烨去了音乐教室,学了十分钟,阿吉就让我弹贝斯,和小柒筱烨合了一首曲子,最简单几个位置就能出来很棒的旋律。今晚的中秋活动,虽然我们都不太想参加,不想去人多的地方,但为了给阿吉捧场,还是一家人都去了。躲在人群里的感觉并不放松也不自在,但音乐本身能令我感到舒服。

如果把抑郁症看作是太上老君的炼丹炉,似乎可行。

升级版的「用户路径」

输出是一种排泄

By: Steven
20 May 2024 at 21:13

在不同的平台上时不常的都能看到一些内容创作者他们会有疑问,说我的东西明明很有深度,准备得也很充分,制作也很用心,但是为什么没有获得很好的流量,或者其他的回报?这种时候要么就是真的有疑问,要么就是想通过这种疑问的方式,来表达对于这种流量的不满或者鄙视。

每次看到他们说这种话的时候,我就会代入到自己。我也有很多内容是花了很多心思很认真做的,但就是没有什么人看,没有什么人听。前几年确实会有疑惑,但现在我很坦诚地接受自己就是不擅长做那种大众流量欢迎的内容。

这里并没有鄙视大众流量的意思,我是真的发自内心的不懂,哈哈哈哈哈~

因为我做内容 99% 的动机,都只是为了把脑袋里的东西腾出来,它只是我的一个思考过程的外化。有人获得共鸣和启发,那就最好,没有那也无所谓。因此我确实没有真的花过心思在研究怎么样制作大家都喜欢的那种类型的内容,因为我也确实没有发自真心地想把自媒体作为自己的一条所谓职业赛道来看待。

因此,没有获得那样的流量,是很正常,也应该的。

女性视角下的江湖:夫妻对谈《九龙城寨》武侠美学_2.ylog

By: Steven
7 May 2024 at 07:35

这个五一假期的最后一天,我和太太一起进电影院看了《九龙城寨》。我们对这部电影有很多想分享的东西,因为平时看电影都会一起聊很多,所以这次就索性录一期对谈的电影节目。这是我们第一次录这种对话,期待听到你的反馈。

在这一期,你会听到:

—- 女性视角下,看男性动作电影的观感;

—- 九龙城寨的生存法则,江湖故事的熟悉感;

—- 风云雄霸天下之古惑仔大战九龙城寨;

—- 不同角色的动作与分镜设计,所带来的视觉差异;

—- 八零后熟悉的武侠、英雄、江湖是什么样的?

—- 服化道的设计,在不同的人物、帮派关系中的呈现有什么区别?

—- 黑道电影中的道与义,在漫画式表达中的特殊感受;

—- 唯一记住的女性角色:鱼蛋妹!

—- 成为父母之后,看电影的视角发生了怎样的变化?

—- 陈洛军:一个重要的名字;

—- 林峯的演技太好了!居然可以把古天乐的儿子辈演得那么好!

—- 兄弟情谊 VS 帮派立场,新老两代人处理的差异;

—- 传统武侠片的「留白」和意境之美;

—- 八零后小时候的集体记忆:电视机和街坊关系;

—- 张国荣的《Monica》和王九的「我的地位」;

—- 角色造型的设计,在人物与剧情塑造上的细节;

—- 四人打渣男 VS 四兄弟对决王九;

—- 兄弟情,是老套和无聊吗?

—- 兄弟之间无言的细节,电影镜头设计的美妙;

—- 古天乐的眼神戏 VS 任贤齐的眼神戏;

—- 如何通过住所的场景设计,呈现不同人物的个性与命运?

—- 牢笼 VS 命运 VS 心结;

—- 武侠电影的留白美学 VS 短视频的审美破坏;

—- 新旧交替:只要持续出作品,总会有希望的。

|登场人物|

苏志斌:广东人,工业设计师,《设以观复》作者

筱烨:服装设计师,占星师,动物园园长

|相关链接|

若你所使用的播客客户端未能完整显示插图,或遇网络问题未能正常播放,请访问:

荒野楼阁 WildloG 的地址:https://suithink.me/zlink/podcast/

阅读设计相关的各类文章:https://suithink.me/zlink/idea/

|其他社交网络媒体|

苏志斌 @ 知乎|SUiTHiNK @ 即刻 / 微博

苏志斌SUiTHiNK @ Bilibili / YouTube / 小红书

|联络邮箱|

suithink.su@gmail.com

欢迎在 小宇宙、Spotify、YouTube、Apple Podcast 收听本节目,期待你的留言。

💾

兔子王国里的外星人_0.ylog

By: Steven
26 April 2024 at 00:52

欢迎收听荒野楼阁 WildloG,这里是设计师苏志斌的个人播客。作为第 0 期,我会与你分享一下做这个播客的动机、这个播客的主题会是什么、起这个名字的缘由、本期封面和播客 Logo 的设计想法,以及后续的节目计划。

在这一期,你会听到:

—- 我是谁?从我家的动物园,工作和话剧的经历,聊到我二十多年的写作习惯。

—- 我对于视频内容的态度?为什么那么久没更新《设以观复》系列?

—- 原本并不想做播客,为什么转变想法呢?动机是什么?

—- 这个播客的主题:一个外星人

—- 荒野楼阁 WildloG 这个名字是什么意思?因为生机勃勃啊!

—- Why not 和 WildloG

—- 封面设计:隐秘的荒野和兔子王国

—- 以两类节目为主:一个人捡树枝,两人以上一起捡树枝

—- 要停更视频?

|登场人物|

苏志斌:工业设计师,车联网智能硬件产品经理/联创,《设以观复》作者

|相关链接|

若你所使用的播客客户端未能完整显示插图,或遇网络问题未能正常播放,请访问:

荒野楼阁 WildloG 的地址:https://suithink.me/zlink/podcast/

阅读设计相关的各类文章:https://suithink.me/zlink/idea/

|其他社交网络媒体|

苏志斌 @ 知乎|SUiTHiNK @ 即刻 / 微博

苏志斌SUiTHiNK @ Bilibili / YouTube / 小红书

|联络邮箱|

suithink.su@gmail.com

欢迎在 小宇宙、Spotify、YouTube、Apple Podcast 收听本节目,期待你的留言。

💾

AbemaTV 网页版与客户端强制 1080p

By: prin
26 April 2021 at 05:30

最近在看动画《佐贺偶像是传奇 卷土重来》(ゾンビランドサガ リベンジ),官方的同步网络放送有 Amazon Prime Video 和 AbemaTV。因为我已经订阅 Netflix 了,感觉 Prime Video 不怎么用得到,所以还是用免费的 Abema 吧。

然而 Abema 很不爽的一点就是动态分辨率(不如说很多流媒体网站都这样),就喜欢自己判断你网速够不够,然后给你播放带宽相应的清晰度。初衷估计是为了任何网络环境条件下都能流畅播放,可是讲道理,我就没见过这个自动判断准过几次。

就算在设置里开到最高画质,还是动不动给我跳到 480p 甚至是 360p。我他喵的到底是哪里不行,就只配看你这马赛克画质?

真是叔可忍婶不可忍,于是我去网上找有没有 Abema 强制 1080p 的方法(因为也有个 Chrome 启用 Netflix 1080p 的扩展),正好找到了一个

const open = XMLHttpRequest.prototype.open;XMLHttpRequest.prototype.open = function () {  arguments[1] = arguments[1].replace('720/playlist.m3u8', '1080/playlist.m3u8');  open.apply(this, arguments);};

看了一下,没想到原理还挺简单,就是油猴脚本劫持 XHR 请求方法,把其他清晰度的 m3u8 playlist 全部重定向到 1080p 的 playlist 上。这样不管怎样请求,实际返回的都是 1080p 清晰度的源了。想想确实是这个理,高啊!

还好以前捣鼓过一段时间 HLS 相关的东西,所以这些不算陌生。不过实际使用的时候发现 XMLHttpRequest 并没有拦截到 playlist.m3u8 之类的请求,看了一下,原来是 Abema 请求的时候改用了 fetch API。反正大同小异,稍微修改一下就行了。

修改后的脚本同样放在 Gist 上:

// ==UserScript==// @name Abema 强制 1080p// @description 把其他清晰度的播放列表强制指向1080p// @version 1.1.0// @run-at document-start// @namespace Violentmonkey Scripts// @match https://abema.tv/*// @grant none// ==/UserScript==const originalFetch = window.fetchwindow.fetch = (...args) => {  const regex = /\/\d+\/playlist\.m3u8/  if (typeof args[0] === 'string' && args[0].match(regex)) {    args[0] = args[0].replace(regex, '/1080/playlist.m3u8')    console.log(args[0])  }  return originalFetch(...args)}

题外话,好久没追过新番了,但佐贺二期开播后我现在每天都想快进到周四……

啊啊啊!

zombieland-saga-revenge-ep3

好了,网页端的问题解决了,那么客户端是不是也可以用这个方法呢?

抓包看了一下,客户端请求的确实是同样的 URL,直接如法炮制。

不过要修改客户端的请求就不像 Web 浏览器那么简单了,需要用到 MitM(中间人)攻击。目前 iOS 平台上主流的代理软件应该都支持 MitM,比如 Surge/Quantumult X/Shadowrocket。下面以 Quantumult X 为例。

开启 MitM 功能,添加主机名如下:

更新:网页版和手机版请求的是 vod-abematv.akamaized.net,iPad 上请求的是 ds-vod-abematv.akamaized.net,搞不懂,直接通配符算了。

*abematv.akamaized.net

安装并信任证书(过程略),修改配置文件,添加重写规则:

[rewrite_local]abematv\.akamaized\.net/.+/\d+/playlist\.m3u8 url request-header /\d+/playlist.m3u8 request-header /1080/playlist.m3u8

验证强制 1080p 是否成功(开启 HTTP 调试功能查看):

quantumult-x-rewrite

可以看到原本是要加载 720p 的,经过重写后实际加载的是 1080p 的 segment。

爽!

尝试为本地视频开启 AirPods Pro 空间音频

By: prin
5 March 2021 at 20:04

AirPods 2 之后,前段时间我又没忍住,入手了传说中的豌豆射手 AirPods Pro。

第一次体验到的「主动降噪」功能确实惊艳,虽然感觉对人声的处理还是差了点意思,但开和不开真的是两种完全不同的感受。尤其是乘坐公共交通的时候,感觉是终于夺回了一点耳朵的主导权,不用再一味地被各种噪声强奸了。

用了几个月,总的来说挺满意的,就是这人声降噪实在是普通,近处的人说话大声点就挡不住了(比如室友),只能开音乐盖过去。有人说是后续固件削弱了,不过我感觉买来就这吊样。可惜市面上还是没有能达到聋子模拟器效果的降噪耳机,遗憾。


AirPods Pro 另外一个比较受关注的新功能就是「空间音频」,简单来说就是通过耳机里的各种传感器和一系列计算来调整声音,模拟出影院级(据说)的环绕声效果。到手的时候我就拿爱奇艺上的《复仇者联盟4》测试了一下,确实挺 amazing 的。

为什么要说这些呢?其实是因为我最近下了个 EVA 新剧场版的资源,里面封装的音轨是 6.1 声道的。然而就是这个视频文件,在播放到战斗激烈的场景时,我的所有设备上,无论扬声器还是耳机都会出现爆音(clipping)。

eva-new-film

新剧场版终章真的要上映了,你庵野鸽鸽什么时候骗过你

初步排查应该是多声道音源 downmix 成双声道播放的时候出问题了,因为封装在一起的双声道粤语音轨并不会爆音。感觉挺奇怪的,难道这些播放器在 downmix 的时候默认都没有音量电平限制吗?

就在搜索解决方法时,我突然想到了 AirPods Pro 的「空间音频」功能:既然这音轨本身就是环绕声,那么如果用空间音频来播放,岂不是正好?

查了一下,目前支持为本地视频开启空间音频的播放器不多:

比如我主力使用的 nPlayer 目前就还不支持,遗憾。

另外也发现了个有意思的 App:Surround Sound Speaker Check

貌似原本是用来给家庭影院的环绕声音响系统做测试的,没想到还能拿来测试 AirPods Pro 空间音频,哈哈哈。用这个测试了一下,空间音频确实很有感觉,普通的双声道模拟环绕声的效果相形见绌,推荐各位也试试。

下面对帖子中提到的几个播放器做一下测试。


使用的视频文件如下。

测试文件①:杜比官方宣传片H.264 + AC-3MP4 封装)

Input #0, mov,mp4,m4a,3gp,3g2,mj2, from 'dolby-atmos-trailer_amaze_1080.mp4':  Duration: 00:01:03.55, start: 0.000000, bitrate: 9396 kb/s    Stream #0:0(und): Video: h264 (Main) (avc1 / 0x31637661), yuv420p, 1920x1080 [SAR 1:1 DAR 16:9], 8946 kb/s, 24 fps, 24 tbr, 24 tbn, 48 tbc (default)    Stream #0:1(und): Audio: eac3 (ec-3 / 0x332D6365), 48000 Hz, 5.1(side), fltp, 448 kb/s (default)

测试文件②:网上摸来的多声道 AACH.264 + AACMP4 封装)

Input #0, mov,mp4,m4a,3gp,3g2,mj2, from 'ChID-BLITS-EBU.mp4':  Duration: 00:00:46.63, start: 0.000000, bitrate: 188 kb/s    Stream #0:0(und): Video: h264 (Main) (avc1 / 0x31637661), yuv420p, 800x600, 26 kb/s, 8 fps, 8 tbr, 8 tbn, 16 tbc (default)    Stream #0:1(und): Audio: aac (HE-AAC) (mp4a / 0x6134706D), 44100 Hz, 5.1, fltp, 159 kb/s (default)

测试文件②:上面提到过的 EVA 新剧场版H.264 + FLACMKV 封装)

Input #0, matroska,webm, from 'Evangelion 1.11 You Are (Not) Alone 2007 [BD 1920x1080 23.976fps AVC-yuv420p10 FLAC].mkv':  Duration: 01:40:58.57, start: 0.000000, bitrate: 12663 kb/s    Stream #0:0(jpn): Video: h264 (High 10), yuv420p10le(progressive), 1920x1080, SAR 1:1 DAR 16:9, 23.98 fps, 23.98 tbr, 1k tbn, 47.95 tbc (default)    Stream #0:1(jpn): Audio: flac, 48000 Hz, 6.1, s16 (default)    Stream #0:2(eng): Audio: flac, 48000 Hz, 6.1, s16    Stream #0:3(chi): Audio: flac, 48000 Hz, stereo, s16

测试文件④:对测试文件③进行转码(H.264 + AC-3MP4 封装)

ffmpeg -i 'Evangelion 1.11 You Are (Not) Alone 2007 [BD 1920x1080 23.976fps AVC-yuv420p10 FLAC].mkv' -map 0:v:0 -map 0:a:0 -c:v h264_videotoolbox -c:a ac3 output.mp4
Input #0, mov,mp4,m4a,3gp,3g2,mj2, from 'output.mp4':  Duration: 01:40:58.57, start: 0.000000, bitrate: 52 kb/s    Stream #0:0(jpn): Video: h264 (High) (avc1 / 0x31637661), yuv420p, 1920x1080 [SAR 1:1 DAR 16:9], 559 kb/s, 23.98 fps, 23.98 tbr, 24k tbn, 48k tbc (default)    Stream #0:1(jpn): Audio: ac3 (ac-3 / 0x332D6361), 48000 Hz, 5.1(side), fltp, 448 kb/s (default)

测试结果(✅ 表示可以激活空间音频):

文件1文件2文件3文件4
PlayerXtreme
FE File Explorer❓ *
Plex✅ **

* FE File Explorer 播放 MKV 格式视频需要高级版,我就没测

** 需要修改 Plex Media Server 的配置,参考这篇文章


目前猜测触发空间音频的条件是:

  • 使用系统解码器播放
  • 音频为环绕声 AAC 或 AC-3 (E-AC-3)

由于有服务端转码的配合,Plex 的兼容性表现最好,推荐。

题外话:经过 Plex 转码以后,就算关闭耳机的空间音频,直接播放也不会出现爆音了,不知道是不是转码的时候做了处理。另外空间音频效果确实好,结尾主题曲响起的时候差点以为我没戴耳机,感觉声音真的像是从 iPad 那边发出来的一样,神奇。

日区 Apple Music 优缺点与实际体验

By: prin
17 February 2021 at 16:11

想在一个平台上听到所有喜欢的歌,太难了。

虽说在大版权时代,资源还是存到自己的硬盘里最踏实,但下载党也不是那么好当的。而且习惯了流媒体的便利以后,我是越来越不愿意花那个心思了。然而国内音乐平台版权之争使得听歌体验愈发水深火热,我也不得不面对现实……

在网易云音乐的歌单灰掉一大片后,我终于决定跑路。

这篇文章算是我个人使用了半年多日区 Apple Music 的感受,如果你恰巧也在纠结如何选择,希望对你有所帮助。

理想的流媒体音乐服务

  • 曲库丰富
  • 订阅价格适中
  • 可以自己上传音乐
  • 跨设备同步
  • 个性化推荐
  • 不要有花里胡哨的功能
  • 界面好看
  • 梦里什么都有

我主要听什么

  • Anisong(动画歌曲,俗称二刺螈
  • J-Pop(日本流行音乐)
  • J-Rock(日本摇滚乐)

其实我涉猎挺广泛的,各种类型都听一点。真不是精日

其他候选服务

国内的网易云、QQ 音乐啥的是靠不住了,还是放眼海外吧。

除了外区 Apple Music,还有其他几个也是我考虑过的:

  • Spotify
  • YouTube Music
  • ANiUTa

最后还是选了 AM,原因下面说。

当然,每个人的音乐口味千差万别,最适合我的不一定最适合你。

曲库还算可以

Apple Music 官方说的是「7000万曲聴き放題」,在日本所有音乐流媒体服务中算是数一数二(当然也还是得看你主要听什么)。

同样是日区,Spotify 我也试用过,可以说大部分 AM 没有的,Spotify 也没有;而 Spotify 有的,AM 基本也有,属于旗鼓相当的对手。比如说ヨルシカ、YOASOBI、Official髭男dism、あいみょん这些热门音乐人的歌,就是基本每家都有。

按照我自己使用下来的体验,其实想听的大部分歌都能在 Apple Music 里找到。

(当然这只是我个人的情况,毕竟我也不知道你要听什么)

playlist-top15

iCloud 音乐资料库

按照官方文档的描述:

如果订阅了 Apple Music 或 iTunes Match,您可以使整个 iCloud 音乐资料库在使用同一个 Apple ID 登录的所有设备上都可用。只要接入互联网,即可随时访问您的资料库。

可以理解为网易云那样的音乐云盘,曲库里没有的歌,可以自己上传。

  • 最多可以上传 100,000 首,每首最大 200MB
  • 不占用 iCloud 存储空间

这也是我选择 Apple Music 的最大原因:就算你曲库再大,总有些歌是没有的,比如各种特典 CD、会场限定等等,允许自己上传歌曲就很方便。

据说 Spotify 也可以播放本地音乐,但并不是上传到云端,还是没有 AM 好用。

与 iTunes Store 互通

iTunes Store 作为日本最大的音乐在线配信平台,可以说大部分的歌如果有在网上卖,那肯定有在 iTunes Store 上卖;如果 iTunes Store 上没有,那八成就是没有在网上卖。

有些音乐 Apple Music 上没有提供,但是 iTunes Store 上是有卖的,比如「宇宙よりも遠い場所」「少女終末旅行」的 OP、ED、插入歌专辑。还有 IM@S 偶像大师系列,万南不肯流媒体配信,唯一支持的 ANiUTa 还全都只有 short version,想第一时间听到新曲就只能上 iTunes Store 了。

毕竟都是水果家的服务,iTunes Store 上购买的专辑与单曲,也可以直接在 Apple Music 的应用中播放(废话)。

我实际使用下来,「Apple Music 流媒体提供的音乐」「iTunes Store 购买的音乐」和「自己上传到 iCloud 音乐资料库的音乐」都是一个待遇,播放、整理起来都没差别。比如下面这张图,如果我不说,你能分辨出它们的来源吗?

mixed-music-library

用 iTunes 整理资料库

哦对,现在 iTunes 已经拆成了三个独立应用,Music、Podcast 和 TV。

虽然 iTunes 的手机管理功能屎得不行(现在集成到 Finder 里去了,还是很屎,强力推荐 iMazing),但它的音乐库管理功能还是公认很强大的,metadata 编辑、智能播放列表都很好用。

而且只要添加到了自己的 iCloud 音乐资料库中,就算是 Apple Music 提供的音乐,其 metadata 也可以自由修改(比如专辑封面、艺人等),可以说是最接近本地曲库体验的流媒体音乐服务了。

itunes

没有社交元素

好吧,这对一部分人来说可能是缺点。不过我确实不喜欢那些花里胡哨的东西,不看评论,对「网抑云」也没有兴趣。

这是网易云音乐、QQ 音乐和 Apple Music 的首页对比,见仁见智吧。

netease-qq-apple

另外,虽然没有社交,不过可以在搜索里搜到其他人分享的整理好的播放列表,比如我前段时间找《钢之炼金术师》OP、ED 时就省的自己一个一个找了,也挺方便的。

官方播放列表推荐

Apple Music 的一大特色。

有个人推荐歌单、推荐电台、艺人歌单、音乐回忆歌单,等等。

其中我最中意的是编辑推荐歌单,比如:

各种艺人歌单也是入坑的好机会:

更多可以参考:「用好」Apple Music,这些是你应了解的 - 少数派

跨平台支持

在换 iPhone 之前,我在 Android 上也用过一段时间的 Apple Music(没错,竟然有 Android 客户端……),出乎意料地体验还不错,让人难以相信是那个以「自家生态圈以外的软件都做成一坨屎」闻名的🍎。

Windows 上的 iTunes,体验也马马虎虎,但感觉没人喜欢用这个听音乐吧。

虽然其他平台上也有支持,但 Apple Music 体验最好的肯定还是水果全家桶。如果你手头一部 Apple 设备都没有,那我是不推荐你用 Apple Music 的,因为很可能光是如何付款就得折腾半天……

至于网页版的 Apple Music,说实话我就没有成功打开过。🌚

切换 iTunes 账号会清空下载

说完优点说缺点。

Apple Music 的账号是跟着 iTunes Store/App Store 账号走的,不能独立设置。

也就是说如果你想要一直听日区 AM,那么就得保证 iTunes Store/App Store 的账号一直是日区(相信这对经常切外区账号下载 App 的 iOS 用户并不陌生)。

如果你临时需要下载一个只有国区 App Store 才有的 App,切了一下账号,那 Apple Music 的已下载音乐就会被清空。虽然资料库不会受影响,再登回日区账号就可以了,但又要再下载一遍还是很不爽。

看到有人说切账号会清空资料库,但我实际没有遇到过,只是清空了下载。

所以我现在一般是在 iPad 上切国区账号,下载完需要的 App,然后在电脑上通过 iMazing 安装 App 到手机,这样手机上就不需要切换账号了。

无法手动同步音乐

想要使用 Apple Music,必须开启音乐资料库同步

一旦开了资料库同步,你的设备里的音乐就会被同步成和 iCloud 中的音乐资料库一样。如果想要把一首歌传到 iPhone 里,以前是通过 iTunes 直接同步过去就行了,现在你必须先在电脑上把歌添加到资料库中,等待它上传至 iCloud,然后再等它从 iCloud 下载到手机上,而且你的所有设备里都会出现这首歌。

也就是说,用了 Apple Music,你的所有水果设备就全都共享一个音乐资料库了。想听什么就往里面加,会自动同步,所有设备上都能听。方便是挺方便,但你如果想把一些音乐 locally 放到设备上,而不上传到云端的话,那就不好意思了。

我之前想把《异度神剑 2》的 OST 放到手机里,就因为这个问题,最后只能另寻他法 —— 我可不想把 7GB 的 OST 全部上传到 iCloud 资料库里去,更何况还会被压缩。

一个解决方法就是不要用自带的音乐 App,下个其他的音乐播放器就可以了。我是在手机上下载了 VOX,然后把 OST 传到了 App 对应的文稿存储空间里解决的,手机版 foobar2000 和 Flacbox/Evermusic 也可以。

上传无损音乐会被压缩

iCloud 音乐资料库不能上传无损音乐,ALAC 会被压缩成 256kbps AAC。

如果源文件就是 MP3/AAC 格式,那么上传后不会被压缩。

alac-converted-to-aac

滚动歌词不能自己添加

Apple Music 支持滚动歌词,而且也挺好看的。不过这似乎只能是音乐发行人自己添加,用户是没办法自己添加滚动歌词的,添加的只能是静态歌词。搞不懂。

目前我感觉是 Apple Music 流媒体提供的歌大部分都有滚动歌词(听说有专门的团队负责?),iTunes Store 里买的歌,人气高的那些基本都有,但也有其他很多没有的(没错我说的就是你万代南梦宫)。

对于这些没有滚动歌词的音乐,想自己添加就只能添加静态歌词咯。

scroll-lyrics

部分功能需要科学上网

姑且放到缺点里来吧。下面是我正在使用的代理规则片段:

# 播放自己上传的歌曲DOMAIN-SUFFIX,blobstore.apple.com# iTunes Store 音乐试听DOMAIN-SUFFIX,audio-ssl.itunes.apple.com# iTunes Store 购买后播放DOMAIN-SUFFIX,streamingaudio.itunes.apple.comDOMAIN-SUFFIX,itsliveradio.apple.comDOMAIN-SUFFIX,aodp-ssl.apple.comDOMAIN-SUFFIX,video-ssl.itunes.apple.comDOMAIN-SUFFIX,mvod.itunes.apple.comDOMAIN-SUFFIX,hls-amt.itunes.apple.comDOMAIN-SUFFIX,audio.itunes.apple.comDOMAIN-SUFFIX,genius.itunes.apple.comDOMAIN-SUFFIX,genius-upload.itunes.apple.comDOMAIN-SUFFIX,genius-download.itunes.apple.com

参考:提升国内 Apple Music 体验的代理规则 - 丁丁の店

如何上车?

最后说一下日区 Apple Music 如何上车。目前的 plan 有:

  • 学生订阅,¥480/月
  • 个人订阅,¥980/月
  • 家庭订阅,¥1,480/月

其中最划算的就是家庭订阅,最多可以 6 个人共享,算下来一个人每月只要 250 日元左右。如果加点钱上 Apple One 家庭订阅(1,850円/月),每个月 300 日元,还能另外多出 Apple Arcade 和 200GB iCloud 存储空间。

如果想找人组队家庭订阅的话,推荐去蹲一下 Telegram 上的大型合租群

后记

总的来说缺点也有,瑕不掩瑜吧。

反正我用得是挺爽的,其他人咋样就不关我事了。

更好的问题,总是在交流之后才出现的

By: Steven
14 December 2023 at 11:40

前两天,我收到 AAAny 的 Wenbo 发来的邮件,问我是否有兴趣注册他们的 APP 体验。我一看就乐了,立马截图发给汉洋和轶轩,开玩笑地问道:「我是不是应该告诉他,我早就注册了?」

这个叫做 AAAny 的新问答社区是汉洋他们团队,从 redit 等社区平台的使用中,萌生的对于「Ask Anyone Anything」的重新思考,所做出的产品。我其实几个月前,就在一次和他俩吃饭之后就注册好了。但是一直因为忙,我担心不能及时回复别人的提问,就一直没好意思发起一场主题活动。中途有看到可达和 JT 发起的问答,很感兴趣,也想试试看,但也因为对时间的担心就止住了念头。正好借着这次 Wenbo 的邮件,跟汉洋他俩聊了一会儿后,我就趁着夜色正浓,冲动还在,就立马编辑了两段自我介绍,发起了分别以「工业设计师」和「设计类视频创作者」为主题的两场活动。

点击进入「工业设计师 SUiTHiNK AmA~

点击进入「设计类视频博主 苏志斌 AmA!

当天也是高效,一连开了三个会。中途用各种碎片时间,一一回答了 AAAny 上的提问。晚上赶回家陪筱烨过生日的路上,我一看已经回复过的内容,好家伙,累计的输出量都赶上我平时写两三篇文章了。

碎片化地高密度输出,也是可以产生一些好内容的。

在使用了一天后,当晚,我和汉洋、轶轩聊了聊感受。汉洋问我感觉 AAAny 和知乎之间有什么区别?我打了一个比方:

知乎的问答是一种广场上的广播。一个问题对应一个完整的回答,虽然我可以不断修改回答,但是你修改后的内容很难再被之前看过的人再次看到。评论区就是一些人在外围窃窃私语,它们和主回答之间很难形成交流互动。它是有层级的、单向的信息传播。

但是 AAAny 给我的感觉,是老城区的街头沙龙。任何对话都是水平方向的,没有任何层级关系,就和大家在街头聊天一样。你看到一个感兴趣的话题,就可以直接加入;别人对你们正在谈论的感兴趣,也可以随时参与进来。它不是广播的形式,是集会和交流的空间。

有意思的事情在于,我们往往需要遇到好问题,才能写出一个好的回答。

然而,好的问题通常并不是我们提出来的第一个问题。你会在持续的提问和持续的回复之间渐渐发现,那些更本质和更有趣的问题。这是知乎解决不了的。好的问题如果都由运营和编辑来提出,那么知乎的运营压力会爆炸;如果都由用户提出,那么一定伴随着海量毫无意义的垃圾问题,这对真正的好问题是一种掩盖。

因此,持续的对话和前后文关系的保留,就很重要。同时也得确保,来自对话后段出现的好问题/好回答,能够被之前关心这个话题的人看到,也能被后来的观众发现。

运营这样的社区,需要真正会采访的记者。

点击进入「工业设计师 SUiTHiNK AmA~

点击进入「设计类视频博主 苏志斌 AmA!

如何解决某些国内网站、app疯狂上传的问题?

By: fengooge
27 July 2023 at 14:16
我们在访问国内的网站尤其是看视频的时候,会发现一个现象,有时候上传流量会突然飙升,有服务在进行疯狂上传。最典型的例子是抖音,一人刷抖音,全家上网都遭殃(网络卡顿)。为什么会这样呢?以腾讯视频为例,当我们打开腾讯视频的网站或应用观看视频时,一般情况下,我们是从腾讯的服务器下载视频资源,这些下载的流量,腾讯是需要向电信运营商付费的(当然个人的宽带也是付了钱的)。腾讯为了省钱,就将每个用户的腾讯视频应用甚至浏览器弄成一个小型的缓存站。当其他用户观看视频的时候,就可以不用从腾讯自己的服务器下载视频,而是从被当作缓存站的个人用户那里。不止腾讯,国内几乎所有的视频网站都这样搞,看视频时都会霸道地疯狂上传,上传流量、上传网速是下载的几倍、十几倍是常有的事。这样做确实给腾讯这样的视频服务提供商省了大笔的钱,但却给用户带来了诸多麻烦:首先,不加节制地上传会阻塞下载,最直接的例子就是上面说的,当家庭网络有人

如何快速浏览一个YouTube长视频的内容?

By: fengooge
25 July 2023 at 15:15
有时候我们会碰到一个非常长的 YouTube 视频,例如一两个小时的直播录屏内容,有效信息夹杂在大量的无意义内容中,那么如何才能够快速浏览这个长视频,获取到我们需要的有效信息呢?方法如下:在 YouTube 视频的标题下面,找到「下载」右边的「···」图标,打开后会有如下图所示的功能菜单,选择其中的「内容转文字」,这样右边就会弹出整个视频内容的文字稿。通过快速浏览文字稿,就可以快速了解视频的主要内容了。在 YouTube 移动端上也有同样的功能。如果想更有效的获取文字稿的内容,可以将内容复制粘贴到 AI 辅助工具中,例如 ChatGPT、Claude,来帮助我们总结文字稿的内容,这样就更方便快捷了。目前 Claude 支持上传文档文件,当文字稿内容较长时,我们可以用它来帮助我们总结归纳。

使用FFmpeg进行简单的视频编辑

By: fengooge
21 August 2022 at 23:36
FFmpeg 是强大的视频编辑开源命令行工具,由于它过于强大,因此包装后的很多窗口工具都没有它好用,因此学习使用命令行工具还是很必要的。 FFmpeg 官网地址:https://www.ffmpeg.org/下面介绍几个使用 FFmpeg 的高频视频编辑功能。安装 FFmpeg macOS 命令行安装 FFmpegbrew install ffmpegFFmpeg 常用视频编辑功能 FFmpeg 使用参数:ffmpeg {1} {2} -i {3} {4} {5}上述参数说明: {1}:全局参数 {2}:输入文件参数 {3}:输入文件 {4}:输出文件参数 {5}:输出文件 常见参数:c:指定编码器 -c copy:直接复制,不经过重新编码(这样比较快) -c:v:指定视频编码器 -c:a:指定音频编码器 -i:指定输入文件 -an:去除

如何使用MediaCoder进行无损视频转码编辑

By: fengooge
12 March 2021 at 10:37
我们要用到的视频转换(转码)常用工具:MediaCoder官方网站地址:https://www.mediacoderhq.com/1、视频格式快速转换(以 .flv 转 .mp4)在很多时候我们下载到的是 .flv 视频格式的文件,但是这种格式在使用时非常不方便,例如不能够在常见的视频编辑软件中进行剪辑,因此需要将 .flv 格式的文件转换为 .mp4,下面就介绍一个工具,可以做到无损转换。所谓视频文件的无损转换,就是将原视频文件的音频流、视频流都提取出来,打包(封装)成另一种视频格式的文件。例如我们这里就是将原来以 FLV 容器打包的视频文件,重新打包成 MP4 格式,因为视频流、音频流都是提取复制,因此不存在质量损失。使用方法及步骤这里以 FLV 转 MP4 为例。1、将 .flv 格式的视频文件拖到上面显示的编辑界面中;2、分别在【视频】、【音频】两个选项卡中选择【复制视频流】、【

Netflix 合租计划(已结束)

By: AUTUMN
1 February 2018 at 21:02

参考了《YouTube Red 家庭方案合租计划》

我个人也是经常看美剧的,尤其是Netflix的剧集有很多非常好看的,比如最近看了他的原创剧集《terrace house》日本真人秀(推荐),还有很多好看的神剧《narcos》毒枭,《纸牌屋》,《瑞克和莫迪》,《恶魔人》,《13个理由》等等等等,我陆陆续续在这个平台用朋友的账户看了一年左右,体验相当好。当然啦,你可以说Netflix上的剧绝大多数可以下载的到,但是其实像《terrace house》这种资源还是有点难找到的,如果你希望和我一起轻轻松松的追美剧,那我希望你能加入进来,只限3人噢。

条件

  • 能够观看Netflix的代理或者在Netflix支持的国家内(Netflix并不是只要是国外的IP就能够看,Netflix自己屏蔽了很多机房的IP,所以一般的代理还是看不了的。如果有这个条件最好啦,没有的话,加入合租计划的小伙伴我可以帮助一下
  • 喜欢看美剧以及电影

套餐

(图片不清晰请新标签打开下面这张图片)

合租人数除了我以外3人,如果人满则开启合租计划。届时会购买如图显示的高级会员,支持UHD(超高清画质),同时支持4个屏幕,也就是说每个人独享一个屏幕,Netflix账户里面可新建多个子用户,每个用户播放记录都是互相分隔,所以不用担心合租者会影响到你。

价格

由于汇率影响以及支付时可能出现的各种手续费用也为了简便运算:

定价:20/月 (付费周期为半年)

常见问题

问:我是否能够中途退出?
答:可以,但不退款,而且希望提前告知

问:我如何加入?
答:评论表达你的意愿,我会把我的微信号通过邮件发送给你,或者你再单独留言你的微信号给我,我单独加你且不会公开此评论

问:我需要付费多少?
答:每次20x6=120元(付费周期半年)

了解更多讯息

目测是大陆第一个Netflix全平台评测

在中国怎样订阅Netflix?

❌
❌