Normal view

There are new articles available, click to refresh the page.
Today — 9 July 2025V2EX-最热主题

v2ex 毕业,恭喜站长

By: myora
8 July 2025 at 11:58
myora:

Solana 链上代币 V2EX 市值突破 300 万美元,24 小时交易量达 570 万美元

BlockBeats 消息,7 月 8 日,据 GMGN 数据显示,Solana 链上代币 V2EX 市值突破 300 万美元,现报 301 万美元,24 小时交易量达 570 万美元。

V2EX 是一个国内最大的技术社区和创意工作者社区,成立于 2010 年,由 Livid 创建。Livid 表示 Meme 代币 V2EX 的 Pump.fun 链接在 9 个月之前创建,并于今日毕业,其钱包里的 V2EX 代币没有出售,在链上是透明的。

Yesterday — 8 July 2025V2EX-最热主题

从 iPhone 换到三星 S25U,目前使用 3 天,太舒服了

By: yuhanz
8 July 2025 at 14:09
yuhanz:

从 iPhone 13PM 换到 Samsung S25 Ultra ,总共花费约 ¥ 5800 (含 2 年 Care+)

  • 中移动现有客户购机价 $8298 ,加两年 Samsung Care+ $998 ,一共 $9296
  • iPhone13 PM 给爱回收,回收价格 ¥ 2700 (只能说 Apple 真保值..)

iPhone 13PM 流畅度依然很高,但对我来说痛点主要有:

  1. 摄像头落伍,尤其长焦,但 iPhone 16 P/PM 也没有实质改进
  2. iOS 对一些小场景下的 LLM 应用不太流畅,比如:App 里的划词/划段落翻译;比如我有一些特定的 Prompts Templates ,需要在 App 中临时填写一些 Slots ,等 LLM 返回,并解析/抽取返回的结果
  3. iPhone 13PM 很重很重.. Specs 240g ,我的实机 251g ,带套 300g
  4. iPhone 13PM 屏幕亮度有点落伍了,在户外阳光下看不清

预期中 Android 的缺点:

  1. iCloud 全家桶没了,但平时反正也买了 Google One ,只是需要搬运一下数据;
  2. 视频拍摄弱,Android 没有通用的 Live Photo ,无法在社交媒体分享 Live Photo ;
  3. 钱包弱,包括不像 Apple Pay 兼容性那么好,不支持交通卡快捷支付,不支持国内交通卡,世界范围的支持也远不如 Apple Pay (比如西瓜卡,这个挺麻烦)
  4. 没有 FaceID 了,它还是比指纹方便一些

收获的 Android / Samsung OneUI 的优点:

  1. 痛点 1/2/4 完美解决,Android 强项,尤其 S25U 配合抗反射膜,户外阳光下跟室内的观感差不多
  2. S25U 重量 220g ,配合 Care+ 可以裸奔,至少没有压手的感觉了
  3. 分屏 + SPen ,在 App 中使用 LLM 非常方便了
  4. One UI + Good Lock 折腾下来,原本不像 iOS 的一些配置可以折腾得跟 iOS 习惯一致(比如 Keyboard 布局),其余不少功能都比 iOS 舒服,比如 充电会提示剩余时间、闹钟、截图、App 分享、文件管理... 都是大家都知道的优点了

预期外的缺点:

  1. 有些 App (比如某银行)布局兼容性不行,这个是之前没想到的,毕竟 OneUI 也不算很小众...
  2. 有些 App 在 Google Play 里没有,比如盒马,不过目前都可以通过微信小程序解决
  3. Garmin Connect 中国区和海外的数据是完全隔离的.. 不过可以手动搬运数据

总结:

  • 还是一次很开心的换机,估计能用两三年了

我老婆的思维有时候真的蛮奇怪,还是女生都是这样

By: eratpfus7
8 July 2025 at 15:25
eratpfus7:

背景是她是在一家乐器培训机构教课,教学对象主要是儿童。本地有举办一个儿童乐器比赛,说是比赛,其实参加了都能得将,金银铜的区别罢了,金奖银奖可以晋级到下一轮到北京参加复赛,去参加复赛的老师可以得一个优秀证书。

我老婆和同事 A 都有学生参赛,她俩教不同的乐器,我老婆学生金奖,但是因为期末考试选择放弃下一轮的比赛,同事 A 学生银奖选择参赛。然后某天 A 老师的证书到了,看到了我老婆于是跟她分享亦或是炫耀自己得奖的证书。我俩在这个问题上的观点产生分歧。

她认为同事 A 明知她没有证书,还故意拿这个来炫耀,故意恶心自己,但我只是觉得同事间分享下自己的喜悦似乎也没有什么不妥,只是当时正好拿到证书的时候看到她了所以才跟她分享而已。因为我觉得如果我买了什么东西或者得了什么奖可能因为开心也会跟身边的同事分享一下?也没什么不妥吧。于是我就安慰她不要想太多,人家可能没什么坏心思,也不知道她听没听进去,哈哈

你们觉得这是男女思维差异,还是我老婆想多了,还是我想简单了,只是单纯就这个问题聊一聊,不要人身攻击,谢谢

遇到一个情绪起伏很大的领导,怎么对付?

By: AichiB7A
8 July 2025 at 08:54
AichiB7A:

去年十一月换了个女领导,她刚从技术岗升到管理岗,现在算上我手底下带了 9 ,10 个人。我观察了半年,她情绪起伏很大,喜欢用反问,或者夸大事实来强调严重性,例如:

你觉得这个东西放在 XXX 上好看么...... XX 和 XX 看起来一样
再者,XXX ,你们忘了么?哪些是重要工作,里程碑,得先对自己有个正确的认识
都解了哪些紧急 bug ,咱们还记得么?
你们列出来,我来写最后的
XXX 这个咱们三得弄一下今天,不然夜里就出事了
因为 XXX ,这块就靠你们了

OP 也是第一次在这种风格的领导下做事。我不适应这个风格,昨天因为她花了很多时间整理自己的情绪,但是上班总是得对付过去。想问问大家有什么好办法吗?

ios26 真难用,试用两天连夜回滚

By: lonccc
8 July 2025 at 08:54
lonccc:

必须要开贴吐槽一下,首先 ui 效果我不喜欢,比网图强点但是比 ios18 差,见仁见智吧。带来的性能问题一大堆,

  • 息屏之后进桌面动画卡顿
  • 内存不够到 iphone 16 pro 微信无法常驻后台了
  • 发热严重,严重到打开任何 app 都感觉动画卡顿掉帧

本来打算忍一忍到正式版,昨天拿起我老婆的 iphone14 ios18.5 ,居然都比我流畅,立马备份数据回滚了。简直是工业垃圾,做 ios26 的人不如全裁掉

关于中医:一图胜千言

By: DeYiAo
8 July 2025 at 08:50
DeYiAo:

中医和现代医学 上次发帖很多人还是没明白, 现代医学本质是如何验证有效,是如何验证, 是验证... (重点说 3 遍) 现代科学并不是非得搞清楚原理,比如 18 ~ 19 实际的炼钢,几乎全是乱试,现代的合金很多也是碰运气,但只要做好验证,把抗拉强度屈服强度等指标测试好,谁能说不是科学? 只要能通过验证,画符烧水喝能重复治病,通过双盲,那也属于“现代医学”,也就说“西医”。 无论是中医、藏医、印医、蒙医,如果不能称之为西医药,通常就两个原因:1 、没有疗效; 2 、副作用太大;

求助生娃的 v 友,你们都是几岁生的 or 打算几岁生?

By: McreeWu
7 July 2025 at 14:52
McreeWu:

我 97 的今年 28 了,老婆 30 ,丈母娘天天催生,还要以一堆理由,不对家庭负责,不对女生负责等缘由来压力我,但是我和我老婆是双方都不想这么早生的,觉得自己还有充足的时间考虑,想问问大家的生育时间大概是什么情况?

Before yesterdayV2EX-最热主题

有没有瘦子增重成功的过来人指点下我

By: Asakijz
7 July 2025 at 17:19
Asakijz: 目前身高 192 ,体重 120 。

整个人跟电线杆差不多,消化很差,胃口小。

我有去搜了一下相关的增重教学视频,但很多训练动作对我现在的身体状况来说都有些太难了。

最近一个月是先尝试着骑车上下班,让自己先动起来,平时都久坐不运动。

主要还是想问看看有没有什么更适合我目前的训练方案。

小学毕业的女孩沉迷游戏、偷钱充值,该怎么引导?求经验分享!

By: z11218
7 July 2025 at 11:32
z11218:

孩子情况: 刚小学毕业,学习差(班级倒数),放学后长时间玩游戏(常到晚上 11 点)。 偷钱充值:之前偷转妈妈的钱充游戏,被发现后承诺不再犯,但后来又偷拿奶奶 500 块继续消费。 管教矛盾:妈妈曾摔过手机,但心软又买了新手机,规定“做完作业可玩”,结果孩子仍熬夜玩,理由是“白天朋友没空陪他”。 妈妈的心理负担:怕管太严,孩子会离家出走、绝食;不管又怕问题恶化,很焦虑。我姐和姐夫都是普通工薪家庭,家里条件不好,我姐夫身体三高,吃药维持。

想请教大家: 类似情况的孩子,怎么设定规则才能让孩子接受,而不是激烈反抗?(比如逐步减少游戏时间?) 偷钱行为该怎么纠正? 惩罚怕适得其反,讲道理又没用,有没有更有效的方法?

结个婚,差不多要 100 万,还都是男方一个人出,有点恐婚

By: jack274
7 July 2025 at 15:27
jack274:

最近相亲了一个女生,小 9 岁,离异带女娃。我本身也是离异不带娃。

如果一切顺利,按照她的计划,大约是这样。

  1. 见我父母(给她红包 2000 ,她花了 100 多买了水果)- 已经发生
  2. 见她父母(礼物 9 件好像,估计要花费几千吧,不知道她父母会不会给我红包)
  3. 想带我去西藏玩 (姑且花费 5000 吧, 我出)
  4. 买房 50 万 (我出,写她名字)
  5. 彩礼 18 万 (我出)
  6. 车子 20 万 (我出)
  7. 订婚,5 万需要吧(我出)

之前还相过一个小 4 岁的,要求少一点,大约是

  1. 房子 50 万
  2. 彩礼 18 万
  3. 订婚几万

因为我不跟我父母要钱,所以这些钱,都是从我的口袋掏出。

看到有人推荐无脑推荐特斯拉有感

By: teaser
7 July 2025 at 11:20
teaser:

利益相关: 特斯拉 model 3 车主

起因是看到这个帖子

下面很无视需求直接无脑推荐特斯拉, 我真的不懂特斯牛在哪里,常见的观点反驳

  1. 安全性高,现在 20w+ 的车,还有安全性特别差的吗?
  2. 吹嘘马斯克,space x 再牛逼,和特斯拉的车有啥特别强的关联?
  3. 智驾如何 nb ,连 EAP 都要花钱买,EAP 包含的功能,在国产电车这里都是标准功能,不需要额外购买吧。
  4. 电耗 nb ,你电池小,重量轻,肯定电耗 nb 啊

顺便再说下我使用的痛点,给想买的参考一下

  1. 无线充太垃圾了,没有风冷,iPhone 充电发热,基本上没用。
  2. 车机导航一坨狗屎,只能市内短途用一下,长途还得是高德手机
  3. 标准续航版本,长途不方便,高速时速 120km/h 续航 350km 左右
  4. 气温 35+ 不后装遮阳帘的话,车里会热
  5. 没有 Carplay
  6. 我后排只有节假日会有人坐,只能短时间坐,很难受

暂时就想这么多,反正优点自有人给说,哈哈哈


引用一下有意思的评论

特斯拉把钱花在你看不见的地方

哪里?马斯克的钱包里吗

我妈(娃他奶奶)来带娃二三事

7 July 2025 at 10:30
7eurvQrEtS:
  1. 催生
    • 不仅自己催,还给我丈母娘洗脑,三天两头的催我们,说趁他们现在还带得动能帮忙带娃。
    • 即使我们已经说了我们的规划,依然不停地催我们。
    • 我爸(老党员)还说我们是对社会不负责任,你不生,大家都不生,这个国家就完了。
  2. 月子(剖腹产)
    • 不停的给产妇吐苦水,带去老家养怎么怎么样,不花你们的钱,尿不湿,奶粉我们都包了,带个两三岁给我们带回来。
    • 动不动就说给她买票,把她送回去。
    • 动不动就给家人告状(我爸,我姐)
    • 动不动就给家人诉苦(我爸,我姐,七大姑八大姨)
    • 吃不惯
      • 月子期间冬天最冷的时候,呼吸不通畅要开门窗
      • 月子期间冬天最冷的时候,厕所不透气要开窗
      • 喊吃饭不吃,只吃馒头
      • 自己身体不舒服不给我讲,大半夜给我爸打电话,我爸又打给我,把刚哄睡的宝宝又吵醒了
  3. 我失业+她病发回家做手术
    • 半夜送去医院检查,开药开检查,这也贵那也贵,骗钱的。检查都开完了就交给医生,回家照顾产妇和宝宝。
    • 期间多次打电话问情况,说在输液了,我就说你输完液了给我打电话,我打车接你回来。
    • 从医院回来之后就说要回家,晚一天都不行,机票价+改签费 2K+。
    • 一把鼻涕一把泪拉着我老婆的手,说承诺要照顾多久的,实在不得已巴拉巴拉。
    • 下飞机我姐拍了照片,笑得无比的灿烂,对比在上海苦大仇深的样子,宛若两人。
  4. 回老家后
    • 到处给人说我不好相处
    • 回老家多天从未关心过她孙子
    • 到处说我把她一个人放医院,不管不问
    • 平时给我爸打视频躲在一边不吭声
  5. 丈母娘要回老家了让她来带
    • 我爸说她心理有阴影,承受不住来不了。
    • 她直接说 我不来
    • 多天后,可能是发了抖音说让她来带娃她不来,被街坊邻居都看到了,要面子就说要来。
  6. 来了
    • 教她泡奶,做辅食,教一半就走开了
    • 自己泡奶的时候奶多放了很多,又倒掉重新泡
    • 把娃放没有围栏的大床上,放沙发上,转头就弄别的看别的去了
    • 提醒的时候着急了,声音稍微大一点就自己去房间里去了,平时说她要注意什么,哪些不对,又去房间里面了。
    • 告诉她手机静音,少打视频,转头就给亲戚诉苦,描述得像在坐牢一样。
    • 要把剩的 ad d3 抹宝宝脸上。
    • 有空调不开,又说自己热,这日子怎么过。
    • 话很多,且我们听起来都是些负能量,比如把娃带回去等等。
    • 很多时候告诉她要怎么做,当场答应得很好很爽快,就不听,依然按照自己的想法来。

我感觉我快抑郁了,很难受,堵得慌。

ps:

我们的时候让我妈来,说有腱鞘炎来不了,我丈母娘来了,呆了两个月,很省心,很会照顾宝宝,相处也非常愉快。因为老家有事和身体原因,要回去,挺舍不得。

刚搬家,租房,人不在家,被前男友入室然后安装了监听怎么办。

7 July 2025 at 09:58
MoneyWasUseless:

已报警,现在警察的意思是必须要找到监听设备才能立案,刚租的房子,不想赔上押金搬家,淘宝购买过 K18 的这种设备。检测过整个屋子,没有找到监听的设备。但是可以确认被监听,因为上次前男友找到我,几乎说出了我最近生活的所有细节,很多内容只有我在房间里讲过。

入室的时间是 6 月,监控看到至少 3 次。中间通过物业监控看到过他入室,然后已经报警,警察也是和稀泥,一开始就是当成情侣吵架去处理,搞调解,后来因为我也不想他丢工作,签了谅解,但是他的监控设备还是没移除。现在我想到住在被监听的房子里,人还是很难过,不自在,因为一直有一个第三者在我的房间里,非常很难受。

我是想咨询有没有什么办法能找到这个设备的,床,床头柜之类的已经翻了个底朝天都没有找到。

请技术大神给一个技术上能找到这个设备的方法吧,救救孩子,刚租房子一个月,这个礼拜看了五六套房子也没有当前这个好,因为另外一个人对我的侵犯我就换房子实在是太难受了。违法犯罪的成本那么低,维权的成本却那么高。

谈一谈兼职朴朴超市骑手的感想

By: walterggg
7 July 2025 at 04:59
walterggg:

坐标武汉,朴朴超市骑手一单 3.1 元,朴朴 app 上配送费为 3 元,相当于朴朴招骑手的成本支出为一单 0.1 元,如果说这个人一个月配送 2000 单,那么朴朴只用给他支出 200 元工费。高温补贴一单 0.1 元,熟练工一小时大概 6 单,时薪约 18.6 元,武汉的路有多难走只有来过的人知道,到处水泄不通,街上人多,道路狭小,骑手行动非常不便利,经常有人买瓶装水,而且武汉老校区特别多,没有电梯,最高楼层 9 楼,搬着三十斤重的水和菜之类爬楼梯是家常便饭,超过四十斤才有三毛钱的补贴好像。我们再来算一下朴朴超市的毛利,就拿西瓜来算,朴朴的西瓜有七八块一斤的,他们的菜根本算不上便宜,毛利大概 1/3 ~ 1/2 。朴朴的分拣员时薪可能 18 块钱,我们再来聊一下朴朴的员工构成吧,朴朴员工主要分为分拣工、配送工、人力,一个仓库的人力有四个人,分拣工大概十人,配送骑手每个时段大概 25 人不到,按一小时每个骑手 5 单,每单销售额 30 块钱,利润 10 元,每天 12 个小时来算: 一天总产值:45000 一天毛利:15000 骑手:4650 分拣:2160 人力:600 仓库费用:800 电动车损耗费:100

总支出:8310 净利润:6790

算得出来朴朴真没啥实力,一个仓库一天才赚这么点,不过胜在老板一天什么事都不用干就能拿到 6790 元,确实多给骑手一分钱都是罪过啊!如果老板只拿一千,f 多分 5000 给员工,每个员工的日收益大概能加七八十,不过这老板得多有良心才行,我本来觉得朴朴的老板很恶心人,但是这么算下来,可能这就是人性,要想高薪就得去总产值高的公司工作,这样黑心老板才能多分点钱给员工,我女朋友在一家期刊公司上班,他们 t 公司在武汉分部就 2000 名员工,一篇论文出版费用收 20000 ,是朴朴一个仓库的总产值 1/2 ,可能确实不能怪朴朴抠门吧,我对朴朴的看法就是,把骑手当贼,也不重视员工学历,这种公司即使搭上了互联网的快车也发展不起来。为什么说把骑手当贼?入职的时候有各种协议,主要是针对骑手的处罚,被投诉一次罚款 200 ,迟到罚款 20 ,早退一秒罚款 50 ,如果当月罚款金额超过工资的 20%则延续到下个月罚,离职需要提前 15 天申请且最后一天必须到岗,否则就是违约。朴朴这种没什么技术的公司把骑手当贼看,也不重视员工学历,这是最让我恶心的一点,干了一周我就跑了,一天送四个小时,因为他要打卡,所以往返交通一小时加上配送超额的一小时,每次去 6 个小时,我只能送 13 单,赚 40 块,时薪不到 7 块,想都没想就直接不干了。写的有点乱,大家凑合看。

诺亚内部人员关于华为盘古套壳千问的文章,大家怎么看?

By: lbingl
6 July 2025 at 23:19
lbingl: 说明: 我不能确定这个人是不是真的诺亚的员工,但是里面写的东西我觉得技术上是能说通的,不像是随便一个黑公关能编出来的。

原文链接: https://github.com/HW-whistleblower/True-Story-of-Pangu

以下是全文转载:

盘古之殇:华为诺亚盘古大模型研发历程的心酸与黑暗

各位好,

我是一名盘古大模型团队,华为诺亚方舟实验室的员工。

首先为自证身份,列举一些细节:

现诺亚主任,前算法应用部部长,后改名为小模型实验室的主任王云鹤。前诺亚主任:姚骏(大家称姚老师)。几个实验室主任:唐睿明(明哥,明队,已离职),尚利峰,张维(维哥),郝建业(郝老师),刘武龙(称呼为武龙所)等。其他骨干成员和专家陆续有很多人离职。
我们隶属于“四野”这个组织。四野下属有许多纵队,基础语言大模型是四纵。王云鹤的小模型是十六纵队。我们参加过苏州的集结,有各种月份的时间节点。在苏州攻关会颁发任务令,需要在节点前达成目标。苏州集结会把各地的人员都集中在苏州研究所,平常住宾馆,比如在甪直的酒店,与家人孩子天各一方。
在苏州集结的时候周六默认上班,非常辛苦,不过周六有下午茶,有一次还有小龙虾。在苏州研究所的工位搬迁过一次,从一栋楼换到了另一栋。苏州研究所楼栋都是欧式装修,门口有大坡,里面景色很不错。去苏州集结一般至少要去一周,甚至更久,多的人甚至一两个月都回不了家。
诺亚曾经传说是研究型的,但是来了之后因为在四野做大模型项目,项目成员完全变成了交付型的,且充满了例会,评审,汇报。很多时候做实验都要申请。团队需要对接终端小艺,华为云,ICT 等诸多业务线,交付压力不小。
诺亚研发的盘古模型早期内部代号叫做“盘古智子”,一开始只有内部需要申请试用的网页版,到后续迫于压力在 welink 上接入和公测开放。
这些天发生关于质疑盘古大模型抄袭千问的事情闹的沸沸扬扬。作为一个盘古团队的成员,我最近夜夜辗转反侧,难以入眠。盘古的品牌受到如此大的影响,一方面,我自私的为我的职业发展担忧,也为自己过去的努力工作感到不值。另一方面,由于有人开始揭露这些事情我内心又感到大快人心。在多少个日日夜夜,我们对内部某些人一次次靠着造假而又获得了无数利益的行为咬牙切齿而又无能为力。这种压抑和羞辱也逐渐消磨了我对华为的感情,让我在这里的时日逐渐浑浑噩噩,迷茫无措,时常怀疑自己的人生和自我价值。

我承认我是一个懦弱的人,作为一个小小的打工人,我不仅不敢和王云鹤等内部手眼通天的人做对,更不敢和华为这样的庞然大物做对。我很怕失去我的工作,毕竟我也有家人和孩子,所以我打心眼里很佩服揭露者。但是,看到内部还在试图洗地掩盖事实,蒙蔽公众的时候,我实在不能容忍了。我也希望勇敢一次,顺从自己本心。就算自损八百,我也希望能伤敌一千。我决定把我在这里的所见所闻(部分来自于同事口述)公布出来,关于盘古大模型的“传奇故事”:

华为确实主要在昇腾卡上训练大模型(小模型实验室有不少英伟达的卡,他们之前也会用来训练,后面转移到昇腾)。曾经我被华为“打造世界第二选择”的决心而折服,我本身也曾经对华为有深厚的感情。我们陪着昇腾一步步摸爬滚打,从充满 bug 到现在能训出模型,付出了巨大的心血和代价。

最初我们的算力非常有限,在 910A 上训练模型。那会只支持 fp16 ,训练的稳定性远不如 bf16 。盘古的 moe 开始很早,23 年就主要是训练 38Bmoe 模型和后续的 71B dense 模型。71B 的 dense 模型通过扩增变成了第一代的 135Bdense 模型,后面主力模型也逐渐在 910B 上训练。

71B 和 135B 模型都有一个巨大的硬伤就是 tokenizer 。当时使用的 tokenizer 编码效率极低,每个单个的符号,数字,空格,乃至汉字都会占用一个 token 。可想而知这会非常浪费算力,且使得模型的效果很差。这时候小模型实验室正好有个自己训的词表。姚老师当时怀疑是不是模型的 tokenizer 不好(虽然事后来看,他的怀疑是无疑正确的),于是就决定,让 71B 和 135B 换 tokenizer ,因为小模型实验室曾经尝试过。团队缝合了两个 tokenizer ,开始了 tokenizer 的更换。71B 模型的更换失败了,而 135B 因为采用了更精细的 embedding 初始化策略,续训了至少 1T 的数据后词表总算更换成功,但可想而知,效果并不会变好。

于此同期,阿里和智谱等国内其他公司在 GPU 上训练,且已经摸索出了正确的方法,盘古和竞品的差距越来越大。内部一个 230B 从头训练的 dense 模型又因为各种原因训练失败,导致项目的状况几乎陷入绝境。面临几个节点的压力以及内部对盘古的强烈质疑时,团队的士气低迷到了极点。团队在算力极其有限的时候,做出了很多努力和挣扎。比如,团队偶然发现当时的 38B moe 并没有预期 moe 的效果。于是去掉了 moe 参数,还原为了 13B 的 dense 模型。由于 38B 的 moe 源自很早的 pangu alpha 13B ,架构相对落后,团队进行了一系列的操作,比如切换绝对位置编码到 rope ,去掉 bias ,切换为 rmsnorm 。同时鉴于 tokenizer 的一些失败和换词表的经验,这个模型的词表也更换为了王云鹤的小模型实验室 7B 模型所使用的词表。后面这个 13B 模型进行了扩增续训,变成了第二代 38B dense 模型(在几个月内这个模型都是主要的盘古中档位模型),曾经具有一定的竞争力。但是,由于更大的 135B 模型架构落后,且更换词表模型损伤巨大(后续分析发现当时更换的缝合词表有更严重的 bug ),续训后也与千问等当时国内领先模型存在很大差距。这时由于内部的质疑声和领导的压力也越来越大。团队的状态几乎陷入了绝境。

在这种情况下,王云鹤和他的小模型实验室出手了。他们声称是从旧的 135B 参数继承改造而来,通过训练短短的几百 B 数据,各项指标平均提升了十个点左右。实际上,这就是他们套壳应用到大模型的第一次杰作。华为的外行领导内行,使得领导完全对于这种扯淡的事情没有概念,他们只会觉得肯定是有什么算法创新。经过内部的分析,他们实际上是使用 Qwen 1.5 110B 续训而来,通过加层,扩增 ffn 维度,添加盘古 pi 论文的一些机制得来,凑够了大概 135B 的参数。实际上,旧的 135B 有 107 层,而这个模型只有 82 层,各种配置也都不一样。新的来路不明的 135B 训练完很多参数的分布也和 Qwen 110B 几乎一模一样。连模型代码的类名当时都是 Qwen ,甚至懒得改名。后续这个模型就是所谓的 135B V2 。而这个模型当时也提供给了很多下游,甚至包括外部客户。

这件事对于我们这些认真诚实做事的同事们带来了巨大的冲击,内部很多人其实都知道这件事,甚至包括终端和华为云。我们都戏称以后别叫盘古模型了,叫千古吧。当时团队成员就想向 bcg 举报了,毕竟这已经是重大的业务造假了。但是后面据说被领导拦了下来,因为更高级别的领导(比如姚老师,以及可能熊总和查老)其实后面也知道了,但是并不管,因为通过套壳拿出好的结果,对他们也是有利的。这件事使得当时团队几位最强的同事开始心灰意冷,离职跑路也逐渐成为挂在嘴边的事。

此时,盘古似乎迎来了转机。由于前面所述的这些盘古模型基本都是续训和改造而来,当时诺亚完全没有掌握从头训练的技术,何况还是在昇腾的 NPU 上进行训练。在当时团队的核心成员的极力争取下,盘古开始了第三代模型的训练,付出了巨大的努力后,在数据架构和训练算法方面都与业界逐渐接轨,而这其中的艰辛和小模型实验室的人一点关系都没有。

一开始团队成员毫无信心,只从一个 13B 的模型开始训练,但是后面发现效果还不错,于是这个模型后续再次进行了一次参数扩增,变成了第三代的 38B ,代号 38B V3 。想必很多产品线的兄弟都对这个模型很熟悉。当时这个模型的 tokenizer 是基于 llama 的词表进行扩展的(也是业界常见的做法)。而当时王云鹤的实验室做出来了另一个词表(也就是后续 pangu 系列的词表)。当时两个词表还被迫进行了一次赛马,最终没有明显的好坏结论。于是,领导当即决定,应该统一词表,使用王云鹤他们的。于是,在后续从头训练的 135B V3 (也就是对外的 Pangu Ultra ),便是采用了这个 tokenizer 。这也解释了很多使用我们模型的兄弟的疑惑,为什么当时同为 V3 代的两个不同档位的模型,会使用不同的 tokenizer 。

我们打心眼里觉得,135B V3 是我们四纵团队当时的骄傲。这是第一个真正意义上的,华为全栈自研,正经从头训练的千亿级别的模型,且效果与 24 年同期竞品可比的。写到这里我已经热泪盈眶,太不容易了。当时为了稳定训练,团队做了大量实验对比,并且多次在模型梯度出现异常的时候进行及时回退重启。这个模型真正做到了后面技术报告所说的训练全程没有一个 loss spike 。我们克服了不知道多少困难,我们做到了,我们愿用生命和荣誉保证这个模型训练的真实性。多少个凌晨,我们为了它的训练而不眠。在被内部心声骂的一文不值的时候,我们有多么不甘,有多少的委屈,我们挺住了。

我们这帮人是真的在为打磨国产算力底座燃烧自己的青春啊……客居他乡,我们放弃了家庭,放弃了假期,放弃了健康,放弃了娱乐,抛头颅洒热血,其中的艰辛与困苦,寥寥数笔不足以概括其万一。在各种动员大会上,当时口号中喊出的盘古必胜,华为必胜,我们心里是真的深深被感动。

然而,我们的所有辛苦的成果,经常被小模型实验室轻飘飘的拿走了。数据,直接要走。代码,直接要走,还要求我们配合适配到能一键运行。我们当时戏称小模型实验室为点鼠标实验室。我们付出辛苦,他们取得荣耀。果然应了那句话,你在负重前行是因为有人替你岁月静好。在这种情况下,越来越多的战友再也坚持不下去了,选择了离开。看到身边那些优秀的同事一个个离职,我的内心又感叹又难过。在这种作战一样的环境下,我们比起同事来说更像是战友。他们在技术上也有无数值得我学习的地方,堪称良师。看到他们去了诸如字节 Seed ,Deepseek ,月之暗面,腾讯和快手等等很多出色的团队,我打心眼里为他们高兴和祝福,脱离了这个辛苦却肮脏的地方。我至今还对一位离职同事的话记忆犹新,ta 说:“来这里是我技术生涯中的耻辱,在这里再呆每一天都是浪费生命”。话虽难听却让我无言以对。我担心我自己技术方面的积累不足,以及没法适应互联网公司高淘汰的环境,让我多次想离职的心始终没有迈出这一步。

盘古除了 dense 模型,后续也启动了 moe 的探索。一开始训练的是一个 224B 的 moe 模型。而与之平行的,小模型实验室也开启了第二次主要的套壳行动(次要的插曲可能还包括一些别的模型,比如 math 模型),即这次流传甚广的 pangu pro moe 72B 。这个模型内部自称是从小模型实验室的 7B 扩增上来的(就算如此,这也与技术报告不符,何况是套壳 qwen 2.5 的 14b 续训)。还记得他们训了没几天,内部的评测就立刻追上了当时的 38B V3 。AI 系统实验室很多兄弟因为需要适配模型,都知道他们的套壳行动,只是迫于各种原因,无法伸张正义。实际上,对于后续训了很久很久的这个模型,Honestagi 能够分析出这个量级的相似性我已经很诧异了,因为这个模型为了续训洗参数,所付出的算力甚至早就足够从头训一个同档位的模型了。听同事说他们为了洗掉千问的水印,采取了不少办法,甚至包括故意训了脏数据。这也为学术界研究模型血缘提供了一个前所未有的特殊模范吧。以后新的血缘方法提出可以拿出来溜溜。

24 年底和 25 年初,在 Deepseek v3 和 r1 发布之后,由于其惊艳的技术水平,团队受到了巨大的冲击,也受到了更大的质疑。于是为了紧跟潮流,盘古模仿 Deepseek 的模型尺寸,开启了 718B moe 的训练。这个时候,小模型实验室再次出手了。他们选择了套壳 Deepseekv3 续训。他们通过冻住 Deepseek 加载的参数,进行训练。连任务加载 ckpt 的目录都是 deepseekv3 ,改都不改,何其嚣张?与之相反,一些有真正技术信仰的同事,在从头训练另一个 718B 的 moe 。但其中出现了各种各样的问题。但是很显然,这个模型怎么可能比直接套壳的好呢?如果不是团队 leader 坚持,早就被叫停了。

华为的流程管理之繁重,严重拖累了大模型的研发节奏,例如版本管理,模型血缘,各种流程化,各种可追溯。讽刺的是,小模型实验室的模型似乎从来不受这些流程的约束,想套壳就套壳,想续训就续训,算力源源不断的伸手拿走。这种强烈到近乎魔幻的对比,说明了当前流程管理的情况:只许州官放火,不许百姓点灯。何其可笑?何其可悲?何其可恶?何其可耻!

HonestAGI 的事情出来后,内部让大家不停的研讨分析,如何公关和“回应”。诚然,这个原文的分析也许不够有力,给了王云鹤与小模型实验室他们狡辩和颠倒黑白的机会。为此,这两天我内心感到作呕,时时怀疑自己的人生意义以及苍天无眼。我不奉陪了,我要离职了,同时我也在申请从盘古部分技术报告的作者名单中移除。曾经在这些技术报告上署名是我一生都无法抹除的污点。当时我没想到,他们竟然猖狂到敢开源。我没想到,他们敢如此愚弄世人,大肆宣发。当时,我也许是存了侥幸心理,没有拒绝署名。我相信很多扎实做事的战友,也只是被迫上了贼船,或者不知情。但这件事已经无法挽回,我希望我的余生能够坚持扎实做真正有意义的事,为我当时的软弱和不坚定赎罪。

深夜写到这里,我已经泪流满面,泣不成声。还记得一些出色的同事离职时,我苦笑问他们要不要发个长长的心声惯例帖,揭露一下现状。对方说:不了,浪费时间,而且我也怕揭露出来你们过的更糟。我当时一下黯然神伤,因为曾经共同为了理想奋斗过的战友已经彻底对华为彻底灰心了。当时大家调侃,我们用着当年共产党的小米加步枪,组织却有着堪比当年国民党的作风。

曾几何时,我为我们用着小米加步枪打败洋枪洋炮而自豪。

现在,我累了,我想投降。

其实时至今日,我还是真心希望华为能认真吸取教训,能做好盘古,把盘古做到世界一流,把昇腾变成英伟达的水平。内部的劣币驱逐良币,使得诺亚乃至华为在短时间内急剧流失了大量出色的大模型人才。相信他们也正在如 Deepseek 等各个团队闪耀着,施展着他们的抱负才华,为中美在 AI 的激烈竞赛中奉献力量。我时常感叹,华为不是没有人才,而是根本不知道怎么留住人才。如果给这些人合适的环境,合适的资源,更少的枷锁,更少的政治斗争,盘古何愁不成?

最后:我以生命,人格和荣誉发誓,我写的以上所有内容均为真实(至少在我有限的认知范围内)。我没有那么高的技术水平以及机会去做详尽扎实的分析,也不敢直接用内部记录举证,怕因为信息安全抓到。但是我相信我很多曾经的战友,会为我作证。在华为内部的兄弟,包括我们曾经服务过的产品线兄弟们,相信本文的无数细节能和你们的印象对照,印证我的说法。你们可能也曾经被蒙骗,但这些残酷的真相不会被尘封。我们奋战过的痕迹,也不应该被扭曲和埋葬。

写了这么多,某些人肯定想把我找出来,抹杀掉。公司搞不好也想让我噤声乃至追责。如果真的这样,我,乃至我的家人的人身乃至生命安全可能都会受到威胁。为了自我保护,我近期每天会跟大家报平安。

如果我消失了,就当是我为了真理和理想,为了华为乃至中国能够更好地发展算力和 AI 而牺牲了吧,我愿埋葬于那片曾经奋斗过的地方。

诺亚,再见

2025 年 7 月 6 日凌晨 写于深圳

各位好,

感谢大家的关心与祝福。我目前暂时安全,但公司应该在进行排查与某些名单收集,后续情况未知。

我补充一些细节,以免某些人继续颠倒黑白。

关于 135B V2 ,小模型实验室在迅速地完成套壳并拿完所有套壳带来的好处后(比如任务令表彰和及时激励),因为不想继续支撑下游应用和模型迭代,又把这个烫手山芋甩给了四纵。确实技高一筹,直接把四纵的兄弟们拉下水。同事提供过去一个老旧的模型,最终拿回了一个当时一个魔改的先进的千问。做大模型的人,自己做的模型就像自己孩子一样熟悉,不要把别人都当傻子。就像自家儿子出门一趟,回来个别人家孩子。

盘古 report 的署名是不符合学术规范的。例如,135B V3 有不少有技术贡献的人,因为作者名额数量限制,劳动成果没有得到应有的回报,团队内曾经有不小的意见。这个模型当时是大家智慧和汗水的结晶,甚至是团队当时的精神支柱,支撑着不少兄弟们继续留在诺亚。所谓的名额限制,以及挂名了一些毫无技术贡献的人(如一些小模型实验室的人),让兄弟们何其心寒。

我的开源项目,官网域名好像被墙了

6 July 2025 at 15:46
1024xiaoshen: 我的开源项目是 PakePlus ,github 地址: https://github.com/Sjj1024/PakePlus ,官网地址:pakeplus.com ,我在 Cloudflare 上买的域名,并在 pages 部署了官网文档,cf 的二级域名是:ppofficial.pages.dev ,然后 pakeplus.com 关联到 pages 了,就在昨天突然被墙了,而且二级域名也打不开, 但是其他的二级域名还可以打开:pakeplus.pages.dev ,我试了一个国内 ping 测速全红........
我的项目是正经项目啊,为什么会被墙呢?我实在想不明白,有这方面经验的吗?还有救吗
❌
❌