Normal view

There are new articles available, click to refresh the page.
Before yesterdayMain stream

【年终专题】“中文互联网上的内容每年都以断崖式的速度在锐减”……2024年度404文章

16 December 2024 at 12:22
CDT 档案卡
标题:“中文互联网上的内容每年都以断崖式的速度在锐减”……2024年度404文章
作者:中国数字时代
发表日期:2024.12.15
来源:中国数字时代
主题归类:中国经济光明论整个国家都洋溢着乐观向上的氛围梅大高速塌方事故极端民族主义罐车乱象调查山西倒卖尸体案网络身份证无差别杀人事件极端民族主义珠海体育中心撞人事件
CDS收藏:话语馆
版权说明:该作品版权归原作者所有。中国数字时代仅对原作进行存档,以对抗中国的网络审查。详细版权说明

CDT编者按:2024年即将过去,中国数字时代为读者整理了年终专题,共7篇,包括年度每日一语、年度404文章、年度报告汇、年度敏感词、年度播客、年度视频和年度人物。

本文是年终专题第2篇,下一篇是《2024年度敏感词》。

2024年1月1日-12月13日,中国数字时代【404文库】项目统计到357篇遭到404的文章、帖子、视频,并将它们全部存档在了中国数字时代的网站上(截至发稿时项目总收录数1888篇)。

打开这些内容的原始链接,你会看到一些提示“此内容因违规无法查看(微信公众号)”、“该微博/用户不存在(微博)”、“404你似乎来到了没有知识存在的荒原(知乎)”、“啊叻?视频不见了?(B站)”……不同平台的提示各不相同,但它们都表明这些内容曾经存在过,却已遭到移除或屏蔽,它们共同构成了中文互联网上那些“消失的记忆”。

2024年中国数字时代搜集到的404文章数量(355篇)高于2023年(287篇)。其中占比最高的是各类事故,含火灾事故、爆炸事故、塌方事故、车辆事故、决堤事故等。其次则是各种无差别杀人案,自6月起,这类所谓的“献忠事件”频繁发生。此外,在多个404话题中,经济因素贯彻始终。

  • (事故)从河南方城英才学校火灾事故开始,有网友认为中国已进入了“新闻通报时代”,整个社会完全失去了生产事实的能力,官方通报成为了我们与真相发生关系的唯一途径。人们在很多事件中陷入了“只有通报,没有真相”的困境之中,诸多疑问悬而未决,得不到任何的答案。

  • (杀人)年内中国频繁发生无差别杀人案,烈度与频率均远高于去年,而在极端民族主义及仇恨教育的影响下,针对外籍人士的多起“偶发事件”,让世界上最安全的国家之说几乎成为笑话,也让高水平对外开放的目标变得困难重重。有网友指出,一个极度原子化的社会更易产生“献忠现象”,因为其整体缺乏组织、缺乏联合、缺乏互助、缺乏归属,使得个体的无助与绝望极易转化为报复社会行动。

  • (经济)年初,当局不断恐吓对经济形势做出悲观评估的人士,要求“唱响中国经济光明论”。年末,当局用了数月时间才终于接受了经济现状是一种事实,而非观点。明确表示“非简单以GDP论英雄”、“经济运行面临困难及挑战”,未来一年中国经济能否提振不容乐观。

在2024年即将落幕之际,中国数字时代第2篇年终专题《年度404文库》,为您呈现这一年中被屏蔽的声音。404文章的不断累积证明了对审查的反抗始终在发生,尽管有些集体抗议可能在未成形时就被压制,但反抗的声音依旧不懈地寻找突破口,试图在下次成功突围……【404文库】记录了被审查机器阻挡后“404遗址”堆积的过程,这成为整个反抗历史的重要组成部分。


中国数字时代2024年收录的404文章主要涉及以下话题:

  • 1月:如此打工三十年(农民工生存现状短片)、山东台长言论 “不做跨省的舆论监督”、河南方城英才学校火灾事故、江西新余店铺火灾事故、孙任泽死亡案(刑讯逼供)、新闻通报时代。
  • 2月:《整个国家都洋溢着乐观向上的氛围》(人民日报评论)、梅西香港表演赛缺阵风波、纳瓦尔尼之死、以刑化债、山东莒县凶杀案。
  • 3月:燕郊爆炸/央视采访遇阻、中国取消总理记者会、农夫山泉亲日风波、莫言被毛星火起诉事件。
  • 4月:大麻合法化政策(德国)、黄俄孝子、川渝燃气增费事件、云浩止耕(建华镇党委副书记、政法委员纪云浩粗暴阻拦春耕)。
  • 5月:广东梅大高速路面塌方事故、百度副总璩静翻车事件、海参崴阅兵游旅游项目、娄烨最新作品《一部未完成的电影》、山西太原跳桥自杀潮。
  • 6月:苏州“6·24”日本人遇袭事件(胡友平见义勇为伤重离世)、吉林市北山公园伤人事件(四名美国大学教师受伤)、企业纳税倒查30年(国家税务总局对此否认)、体制内强度指数(由财经媒体人刘晓博提出)。
  • 7月:新京报罐车乱象调查、中国拟推网证/网号制度、中信建投实习生事件、湖南省华容县洞庭湖大堤决堤。
  • 8月:山西奥瑞公司盗卖数千具尸体案、多省市成立“砸锅卖铁”工作专班、西安一名女性租客之死、唐山打人案涉事民警公开举报。
  • 9月:深圳“9·18”日本学童遇袭身亡事件、山东省泰安市东平县校车事故、中国足球世预赛0:7惨败日本、延迟退休新政落地。
  • 10月:上海沃尔玛随机杀人事件、2024年诺贝尔经济学奖、上海万圣节狂欢、多地财政收支失衡公务员欠薪。
  • 11月:珠海体育中心撞人事件、无锡工艺职业技术学院持刀伤人事件、湖南常德永安小学撞人事件、郑州大学生夜骑开封。
  • 12月:经济学家付鹏/高善文演讲、韩国6小时紧急戒严风波、前体操冠军吴柳芳被批“擦边”。

在即将与2024年告别之际,我们一起回顾404文章当中颇有代表性的12篇:

往事与随想|新闻“通报时代”

账号名称:@往事与随想 | 作者:彭远文|平台:微信公众号 | 删文时间:2024年1月22日

img

2024年1月22日,微信作者彭远文提出了一个“通报时代”的概念,指整个新闻行业已全面进入了“公权大幅扩张,媒体同步萎缩”的状态。例如,1月19日发生的河南方城英才学校火灾(致13死4伤),最早披露火灾信息的竟是当地消防部门,而河南媒体不去采访,不去监督,连消防部门的通报都不发。3月15日,央视记者现场采访燕郊爆燃事故遇阻,中国记协发表声援文章《正当采访是记者的权利》,直言“一纸通稿不能代替现场报道”,被网友调侃“连党的喉舌都被党掐脖子”。

如今,每当发生一起重大事件之后,所有人“等通报”已逐渐成为一种舆论常态。在此过程中,媒体应有的核查、监督功能几乎完全丧失,使得官方通报成为了唯一信源,并逐步代替了真相。诚然,这一情况并非形成于一朝一夕。例如2022年1月的“丰县铁链女”事件,就已经具备了“通报时代”的全部特征,即:“媒体报道完全缺位、其他信息渠道消声、官方通报成为唯一信源但无效”。至今,该事件仍是一个不解之谜。

通报时代一方面自然是新闻从业者的悲哀,就在当月,山东台台长吕芃以“从来不做跨省舆论监督”自傲,有网友评论“只剩正能量,便是当下中国媒体弊病所在”。另一方面,通报时代也导致了整个社会真相缺失、正义缺失以及反思能力的减退,未来甚至会继续倒退到一个“不通报时代”。最终,这篇描绘现实、探讨概念的文章遭到了严厉审查,这恰也揭示了通报时代形成的根源所在。

相关文章:


何文蔚的笔记仓库|广州民调:30多年来未见的全方位满意度下降

账号名称:@何文蔚的笔记仓库 | 作者:何文蔚|平台:微信公众号 | 删文时间:2024年2月8日

img

2024年2月2日,人民日报发布了一篇题为《整个国家都洋溢着乐观向上的氛围》的文章。该文引述德国共产党国际关系书记雷娜特·科佩对中国的赞美,称“中国在推进现代化进程中持续增进民生福祉,不断提高人民生活品质,人民群众的获得感、幸福感、安全感显著提升”。此文发布之时,恰逢中国股灾,且国家经济增速减缓的趋势已愈发明显,因此文章毫不意外的引发了舆论翻车。有网友评论讽刺道“百年未有幸福,千年未见的贤圣,万年未遇的盛世”。

几天后,微信作者何文蔚在公众号上转发了广州社情民意研究中心(中国创立最早的民调社会组织,已有36年历史)一份2023年度民调报告(访问样本为1000人),该报告显示:受访的广州民众对经济状况以及就业、收入的满意度均严重下滑,其中低收入、低学历和年轻人这三大人群的不满情况尤其突出,而民众对于“民营企业发展”的满意度更是创下历史最低,对于2024年的经济发展信心也相当不足。

这些调查结论显然与人民日报所谓的“整个国家都洋溢着乐观向上的氛围”形成了鲜明冲突,隐约揭示了在民生领域出现问题后,一种悲观情绪正在全社会中悄然蔓延。然而,这篇客观呈现民调结论的文章发布不久即遭封禁。讽刺的是,广州日报也对该民调(《2023年度广州城市状况市民评价》)进行了报道,但仅提及了一些正面内容,比如“广州供电、供水、治安、社会秩序等获好评”,而这篇正能量报道至今留存于墙内新闻网站上。

相关文章:


网易新闻|总理记者会的前生今世

账号名称:@网易新闻 | 平台:网易新闻 | 删文时间:2024年3月4日

img

2024年3月4-11日,全国人大和政协会议在北京召开。人大新闻发言人娄勤俭在首日宣布“今年的全国人大会议结束后不再举行总理记者会,如无特殊情况,本届全国人大后几年也不再举行总理记者会”。该消息令中外媒体及网民大感意外,因为历年的总理记者会是一个已经维持了30年的政治传统,同时也是一个难得的媒体与中共高层直接对话的机会。

例如,前总理温家宝在2012年的记者会上公布了王立军事件的调查进展,之后警告“没有政改,文革的历史悲剧或重演”。2020年,已故的前总理李克强说出了“有6亿人每个月的收入也就1000元”的言论,打脸了习近平“全面脱贫”的官方宣传。有网友认为,取消总理记者会可能是为了进一步巩固习近平的个人权威,毕竟现总理李强在人大政府工作报告上强调“过去一年(政府)取得的成绩,根本在于习近平总书记领航掌舵”。

总理记者会不再举行的消息引发网络热议之后,官方迅速采取了严厉的审查措施,不仅屏蔽了相关微博话题,还将一些微信评论文章删除。但令不少网友感到意外的是,就连网易新闻一篇9年前的专题《总理记者会的前生今世》也随之消失,尽管它只是回顾了总理记者会的部分历史。该文提到“从1993年开始,两会闭幕后总理举行记者招待会予以常态化、制度化。而与会的媒体则是从600家到800家不等。20多年来国内外发生的重大事件……从未在总理记者会上缺席。”但该文作者或许没有预料到,这一制度传统,竟会在2024年彻底消失。

相关文章:


李戊晨|“这次事故我永远失去了老婆、妈妈、岳母”

账号名称:@李戊晨 | 作者:李戊晨的弟弟 | 平台:微博 | 删文时间:2024年5月5日

img

2024年5月1日凌晨2时左右,广东省梅州市梅大高速茶阳路段突发路面塌陷,导致23辆汽车陷落,造成48人死亡,30人受伤。该事故发生时正值劳动节假期,再加上高速路的免费通行,使得凌晨的高速路段车流密集。在事故发生之后,微博网友 @李戊晨 发布了自己弟弟的一篇亲历帖文,他的弟弟在事故中失去了妻子、母亲以及岳母,仅与儿子幸存。

该帖认为,当地高速公路在预警和应急层面,对惨重的伤亡负有一定责任。另外,帖子还指出,有许多电车在剧烈碰撞后迅速着火,导致了被困人员难以逃生。令人疑惑的是,即便这篇帖文“情绪稳定”,且未将矛头直指政府,但受害者家属还是受到了有关部门的施压,被迫删去了原帖。(注:两个月后,@李戊晨 发帖解释了当初删文的原因)之后,新华社等官媒将“事故”表述改为了“灾害”,认为这一梅大高速惨剧主要是强降雨灾害所引发。

但是,也有网友提出连续质疑,“为何一条通车不足十年的高速公路发生如此严重塌方”、“为何气象部门强降雨预警时旅游部门、高速管理方未采取任何措施”,“为何中国要长期坚持不合理的统一放假调休政策”、“为何有关部门对受害者家属施压要求删帖,为何会删除网上的相关报道”…这些有关工程质量、管理水平、政策制定、维稳目的的追问,自然无法得到任何回应,整个事故也陷入了“无人负责”的巨大困境。

相关文章:


何加盐|中文互联网正在加速崩塌

账号名称:@何加盐 | 作者:何加盐 | 平台:微信公众号 | 删文时间:2024年5月22日

img

2024年5月22日,微信作者何加盐分享了自己对于中文互联网的一个重要观察——“中文互联网上的内容,每年都以断崖式的速度在锐减”。何加盐在文中提到,“中文互联网正在迅速崩塌,移动互联网出现之前的中文互联网内容,已经几乎消失殆尽”。曾经红火过的中文网站,如网易、搜狐、凯迪猫眼、天涯论坛、校内网(人人网)等,在一定年份之前的信息都已经完全消失不见了。似乎有一只吞噬网页的怪兽,把中文互联网的一切内容,以五年、十年为单位,一口吞掉,人们曾经以为互联网可以保留一切,但结果是一切都没能保留。

作者分析认为,造成这种情况的原因有二。一是经济原因导致过去多年间大量网站关停,海量的网站内容数据因此流失。二是监管原因导致互联网内容审查经历了从无到有、从宽到严的过程,大量以前可以合法存在的内容,如今已不符合监管要求了,灰色地带不复存在。并且在此背景下,中文互联网上各种信息发布意愿、内容质量及互动频率也都大为降低。

那么,“中文互联网的加速崩塌”会带来什么后果呢?一个显著的结果那便是“历史的消亡”,当七零后、八零后已经找不回自己的数据历史时,新生代又如何能认识那段历史呢?而整个中文互联网世代,在将来会不会既无历史也无痕迹呢?这篇文章在阅读量突破10W+之后,随即遭到全网删除,可能的原因是作者谈及了中共的网络审查。由此,该文在墙内中文互联网上,便成为了“崩塌与消亡的一部分”,而官方是如何扮演着抹杀历史的角色,其实已通过行动自我揭示。


高剑犁|【高见20】谁在用“问题食油”?

哔哩哔哩|UP主挖出油罐车半年行驶轨迹

账号名称:@高剑犁 | 作者:高剑犁 | 平台:B站 | 删文时间:2024年7月11日

img

2024年7月1日,新京报发布的调查报道《罐车运输乱象调查》揭露了一个令公众震惊的“行业秘密”:一些油罐车平时运输的液体并不固定,不仅会拉食用油,也会拉煤制油,还会拉工业废水、塑化剂、废机油、减水剂这样的非危化品液体。而且它们在换货装载时,往往不做任何清洗,就直接就往车内灌食用油,造成食用油被残留的化工液体污染。目前,中国在食用油运输方面缺乏“专车专用”的强制国家标准,因此这一食用油行业的潜规则显然长期存在。“罐车运输乱象”的报道还牵扯出了中储粮集团、金龙鱼公司,前者是一家吃着政策红利的央企。

那么,被污染的问题油流向了哪里,被谁食用了?在诸多媒体因限制而噤声之时,一位B站UP主@高剑犁 对新京报报道进行了深入分析,查出了一辆罐车的车牌号(冀E5476W),利用数字物流平台的GPS定位信息,绘制出了车辆半年来行驶轨迹地图。结果显示,该车的行驶路线覆盖了大半个中国,它常常会在将煤油卸货后“顺路”装载食用油返回。

许多网友被UP主 @高剑犁 调查能力折服,相关视频迅速突破了百万播放量,B站官方微信账号甚至也发布了一篇短文大力推荐。但不久后,这篇短文及UP主的视频,均遭到了404,罐车运输乱象的质疑、批评声也销声匿迹。有网友调侃,这似乎是“国家终于大力出手整治”的标准做法,人们总是期待问题本身会得到解决,但它们总是率先被解决的是提问的人。

相关文章:


劳东燕|“网号网证”是给每个网民安上的监视器

账号名称:@劳东燕2004 | 作者:劳东燕 | 平台:微博 |删文时间:2024年7月30日

img

2024年7月26日,由公安部与网信办共同起草的《国家网络身份认证公共服务管理办法》正式公布,并向社会公开征求意见。该管理办法拟对所有网民统一核发“网证网号”,作为唯一的互联网全平台身份认证ID(网络身份证)。在网民申领网证之后,无需再向各网络应用提供姓名、身份证号等信息。官方称此举可以“保护个人信息安全,减少互联网平台以实名制为由采集、留存公民个人信息”。但有网民注意到,早在2023年6月“国家网络身份认证app”就已经在应用商店出现,足以证明网证网号新规的“征求意见”仅仅只是走过场而已。

清华大学教授劳东燕首先在微博发文提出批评意见,她认为所谓的“网证网号”其实是给网民“安上监视器”,类似于疫情期间的健康宝,治理思路如出一辙,只不过是将通过健康宝的社会管控日常化与常态化了。一方面一个人所有的上网痕迹都可以被轻易加以收集,另一方面一个人的上网权益可能会需要经由相关部门的许可、批准。从技术角度而言,网证网号制度推出之后,用户的实名信息会被集中到国家级平台上,使得个人持有的账号一目了然、无所遁形。这不仅会更方便有关部门“落地查人”,理论上也确实可以做到“一键封号”、“全网拉黑”。

因此,有网友担心网证网号最终会演变成一种“上网资格证”,甚至可能与一个人的信用分数、爱国指数之类的挂钩,自绝于人民者将失去上网发言的资格。尽管舆论反弹激烈,官方依然压制了各种反对声音,强行通过了网络身份认证制度,未来该政策将有可能把对内信息管控推向一个新的高度。

相关文章:


澎湃新闻|盗窃倒卖数千具尸体制作植入材料、75人涉案,地方民政部门回应

账号名称:@澎湃新闻 | 平台:澎湃新闻网站 | 删文时间:2024年8月8日

img

2024年8月8日,北京勇者律所的律师易胜华在微博上公开了一起涉嫌盗窃、侮辱、毁坏尸体案的《起诉意见书》,在多家媒体进行了跟踪报道后,一场持续多年、影响全国的特大盗卖人体骨骼案被全面曝光,引发了全网震荡,不少网民怒批“生前当韭菜,死后成耗材”。据媒体报道称,山西奥瑞生物材料有限公司8年间从山东、四川等地非法购买了数千具尸体,之后进行肢解、清洗、辐照,加工为同种异体骨产品后销往各地医院,非法获利数亿元。该案涉及范围极广,总共有75名犯罪嫌疑人被捕,并牵涉多家专业医疗机构。警方办案时总计查封了18余吨的人体骨骼。

该案件最触目惊心的一个细节是:山西奥瑞公司负责人在西南地区的四家火化场总共盗窃了4000余具尸体。在此过程中,死者的家属们可能毫不知情。如此多黑暗细节暴露出的道德沦丧、法制缺失、公权腐败、医风不端等问题,几乎展现了整个社会的全方位系统性溃败。澎湃新闻是国内首个报道此事件的媒体,而官方在第一时间就封杀了此报道,后续审查力度也是前所未有。例如,中国数字时代在2天时间内总共搜集到11篇404文章,20个被封禁的微博话题。

之后,据传揭发盗卖尸体案的律师易胜华为此付出了巨大代价,他先是被北京司法局约谈,微博相关帖文被删,后又“卸任”北京勇者律师事务所主任一职,本人表示也己“做好了结束律师职业生涯的准备”。至今,这起大案再无媒体持续跟进,后续发展无人知晓。

相关文章:


弱信号|从住房养老金到砸锅卖铁,政策语言应该规范化

账号名称:@弱信号 | 作者:孙立平 | 平台:微信公众号 | 删文时间:2024年8月29日

img

2024年8月28日,一份重庆市璧山区成立“砸锅卖铁”工作专班的文件在互联网上流传。文件提到“重庆市璧山区区政府研究,决定成立重庆市璧山区‘砸锅卖铁’工作专班”。之后,有网友检索发现,类似的表述在多地的政府文件乃至政府工作报告中都有出现,并非重庆一地的专利,它们源于去年底国务院下发的“47号文”。该文件还点名要求天津、内蒙古、辽宁等12个重点省市,要“砸锅卖铁”,化解地方债务风险。

从语义上讲,“砸锅卖铁”有倾尽一切、不留后路,乃至破釜沉舟之意。但这样的俗语出现于政府文件中,还是让不少网友感到怪异,认为它在表达上很粗鄙,用法上很模糊,很像是出自高层某人的原话。有网友对此调侃道“不是很懂,为什么要砸锅卖铁?直接把锅卖掉不行么?为什么一定要砸烂变废铁才卖呢?”

微信作者孙立平撰文批评了政策语言不规范化,他说“住房养老金和砸锅卖铁,这样的语言有一个共同的特点,就是不规范化。一变成政策语言,就往往就模糊不清,甚至引起误解。”而“现代政治是一种规范化、制度化的政治,过于模糊的语言只能降低社会生活制度化、法治化的程度,并为随意滥用权力留下空间。”对于大力清理地方债而言,有相当多的金融领域词汇可以使用,但领导人依然选择了最土味与狼狈的说法,一方面足见行政语言的腐败,另一方面则能看出整个政府的“草台班子”属性。诚如网友所言,从“砸锅卖铁”中只看到愚蠢的决心,没有看到高明的手段。

相关文章:


念个咒语会下雨|十岁日本男孩被害的背后:快手上278个视频呼吁“拆除日本学校”,点赞量超两百万

账号名称:@念个咒语会下雨 | 作者:念个咒语会下雨 | 平台:微信公众号 | 删文时间:2024年9月20日

img

2024年9月18日,一名10岁的日本男孩沈某在前往深圳南山区日本人学校的途中,不幸遭遇44岁男子钟某的持刀行凶,最终男孩伤重不治,于次日凌晨身亡。在6-9月的三个月时间里,中国连续发生了三起针对外籍人士的袭击事件,其中两起都是针对在日本人学校就读的学生。在深圳这起持刀伤人案件发生的82天前,苏州某公交站台也有一名52岁男子持刀袭击等候校车的日本母子,在旁的校车引导员胡友平不顾安危上前阻止歹徒行凶,成功保护了这对母子,但她自己因为伤势严重去世。之后,苏州市政府追授了胡友平“见义勇为模范”称号。但官方对于案件细节依然讳莫如深,外交部发言人对外坚称是“偶发事件”。在深圳日本男孩遇袭死亡后,有网友提出激烈批评“连续三次发生还能叫做偶发吗”、“918国耻日已经被重新定义”。

从连续两起针对日本人的袭击事件来看,它们显然都与民间愈发强烈的仇日情绪有关,例如微信作者 @念个咒语会下雨 便分享了自己的一个观察,ta发现仅在快手平台上,宣扬“拆除日本人学校”的仇日视频有278个,累计点赞量高达231万。这些视频充斥着各种假消息、阴谋论、仇恨宣传,个别博主甚至实地探访日本人学校,大肆怂恿粉丝参与对日“讨伐”。更关键的是,这类煽动极端民族主义的账号在胡友平女士遇害后并未受到限制,实则揭示了“反日流量密码”的形成,完全依赖于官方的长期纵容,官方并非不能限制,而是不愿。讽刺的是,在对反日宣传及仇恨教育提出批评后,该文连同其它10余篇评论一起被404了。

相关文章:


水瓶纪元|珠海体育场凶案翌日

水瓶纪元|珠海凶案追踪:行车轨迹、伤心徒步团、疑凶已离异多年

账号名称:@水瓶纪元 | 作者:一只蝴蝶/一只蝴蝶协作组 | 平台:微信公众号 | 删文时间:2024年11月12日/11月20日

img

2024年11月11日,珠海航展开幕前夕,一名62岁的樊姓男子夜间驾驶越野车闯入珠海体育中心内部道路,绕场对场内人群进行无差别的冲撞、碾压……这起蓄意驾车撞人事件造成了罕见的重大伤亡(官方通报35死43伤),成为了2024年度最为严重的无差别杀人案,当地公安机关将之命名为珠海“11·11”驾车撞人案。有媒体人证实,撞人事件发生两小时后,就有了报道禁令。官方一如既往启动了信息维稳模式,网上的事故现场视频、图片以及相关文章接连被屏蔽,这也导致事件再度陷入了“只有通报,没有真相”的困境。

微信公众号“水瓶纪元”是罕有的对这一事件进行了持续报道的独立媒体,尽管它们发布的两篇调查报道均遭到了微信平台审查。在第一篇文章中,“水瓶纪元”作者12日凌晨1点来到了事发现场,见到30位环卫工人正在进行洗地作业,并闻到了空气中的“丝丝血腥味”。第二日晚,作者注意到警方使用“正方形平顶伞”来遮挡体育中心的悼念家属,以防引起路人围观。该文还注意到了官方发布的舆论引导通知,这些细节显然都是触碰红线的“敏感内容”。而在第二篇文章中,作者更是对樊某车辆的冲撞轨迹进行了还原,并采访到多位徒步队队员,间接了解了一些受害者的基本情况。很遗憾的是,由于警方对樊姓男子个人信息的垄断,作者未能采访到樊某本人或家属,但显然“水瓶纪元”已经为还原该事件真相尽了最大程度的努力。

有网友调侃,在新闻通报时代,水瓶纪元团队实际上已扮演了一个专业媒体的角色。在缺乏足够的信息,民众不得不自发去做调查。然而,即便已经进行了一番深入调查,水瓶纪元依然在官方的信息维稳之下,没能得到这个问题的答案——“我们仍然有巨大的疑问,是什么让樊某不惜用‘同归于尽’的方式处理问题?”

相关文章:


经济人读书会|高善文:2025年可能是一个重要的转折点

账号名称:@经济人读书会 | 作者:高善文 | 平台:微信公众号 | 删文时间:2024年12月3日

img

2024年12月4日,知名经济学家高善文在国投证券2025年度投资策略会上发表了一段演讲,直陈当前中国经济面临诸多严峻问题,并透过对近年来中国多项经济数据的分析,揭露当局在就业、GDP增长等方面存在明显的数据造假。实际上,在高善文之前,另一位经济学家付鹏在汇丰集团内部活动的讲话就已经受到了网络关注,并遭多平台封杀。付鹏指出,当今中国存在中产阶级殒落、有效需求不足、贫富差距扩大、信息严重封锁、人口红利消失、房地产市场风险等严峻问题,也坦言官方救经济措施已无法像2008年般(大放水)奏效。

如果说付鹏的演讲主要是直指中国经济面临的核心危机,以实事求是的方式“唱衰经济”,那么相较之下,高善文则“更加敢讲”。高善文先是聚焦消费信心不足,总结整个社会出现了“老年人生机蓬勃、中年人生无可恋、年轻人死气沉沉”的怪象。后又通过数据对照与印证,指出2021至2024年这3年来,中国GDP增速每年被高估了3个百分点,累计高估了10个百分点。如果将这些虚高的数字下调,正好与当前的经济状况相符。另外,他还强调在新冠疫情爆发后,中国的失业率直线上升,累计有4700万人无法正常找到工作。最后,高善文还分享了两大结论:1.泡沫破灭后,经济增速要回到正常水平,平均需要9年。2.2025年可能是一个重要的转折点。

实际上,高善文对于中国经济增长的前景并不悲观,但他点出中国经济困局、怀疑官方数据造假,显然也是当局难以容忍的。几天之后,习近平主持召开中央经济工作会议,承认经济运行面临困难及挑战,宣布在2025年实施适度宽松的货币政策,以扩大内需、稳定楼市和股市,释放了将加大力度放水以提振经济的信号。至于经济的结构性改革,此前习近平已经强调“该改的、能改的我们坚决改,不该改的、不能改的坚决不改”。

相关文章:

我在奇绩创坛的三个月

By: DK
29 November 2024 at 09:41

在互联网或创业圈的人对奇绩创坛肯定不会太陌生,但其他行业的很多人则可能是第一次听说这个名字,在此我可以简单介绍一下,奇绩是一家带有孵化器性质的投资机构,每年春秋两季,奇绩会选择大约 50 个项目,对其进行投资,并在接下来的三个月内进行高强度的「孵化」,三个月后会组织一次面对数千投资人的大会(又被称之为 demo day),以尽可能的帮助这些创业项目在更多投资人面前混个脸熟,拿到下一轮融资。

奇绩的前身是 YC 中国,YC 成立于 2005 年,到现在已经投资了超过 3000 家公司,其中最著名的包括 Airbnb,Stripe,Reddit 等等,YC 在 2018 年进入中国,但一年多后因为各种原因宣布退出,此后 YC 中国的合伙人陆奇创办了奇绩创坛,继续以 YC 的方式进行在中国的事业。

提奇绩就不能不提陆奇,陆奇博士有华丽的履历和强大的资源, 横跨数十年中美两国互联网发展的黄金时期,举例来说,2017 年陆奇曾任百度 COO,就定下了聚焦AI 的战略,但随后因为许多原因离开,陆奇博士在百度内的口碑极佳,但作为外人,我对细节知之甚少,只是在这么早的时候就看到了 AI 的潜力并愿意下重注,这一点就足够人钦佩。

奇绩的流程很简单,填写一个(很长的)报名表单之后,会筛选两轮,然后进入面试,面试通过则会获得投资和后续的支持,没通过会鼓励你下次努力。

我在 2020 年我刚开始做面包多,报名了当年的奇绩,但是初筛就未得通过,21 年我又试了一下,依然在面试的环节挂了,面试是在线上进行,包括陆奇在内的四位合伙人一字排开,轮番提问,我觉得我回答的还行,但还是没过。22 年我本来不打算参加,但是当时我们已经开始做新的业务,并且和 AI 相关,奇绩的同学极力劝我报名,于是我又报名了一次,并最终通过,进入了 2022 年秋季的那一期。

我没记错的话,在投资方面,奇绩有一个标准的报价,以 30 万美元或等值人民币换取 7% 的股份,但是对少数阶段靠后或者数据已经起来的项目,也会协商估值和投资金额,我们并没有按照标准协议走,而是根据情况谈了一个新的价格,这并不常见,但是是可能的。

坦白说,我报名奇绩最大的目的就是拿钱,对其他的什么孵化,训练营,demo day 都没有什么兴趣,在我看来这是给钱之外的一些附加服务,属于可有可无的范畴,我就是抱着这个想法进入 2022 年秋季的那一期的。

签署协议后不久,就开营了,当天当期的所有项目的创始人,都聚集到奇绩北京的总部,闹哄哄一大堆人,先听陆奇的演讲,然后互相认识,分组,自我介绍,吃一顿自助餐,然后各回各家。

此后的三个月,我们每周都要线下去奇绩办公室一到两次,参加多个活动,包括 office hour(OH),group office hour(GOH),听嘉宾演讲等等,OH 和 GOH 是最重要和主要的内容,每周大概一两次,在 OH 中,我需要和包括陆奇在内的四位奇绩合伙人一对一聊天,说我的想法,问他们问题,会得到一些建议和帮助,GOH 则是十来个项目的创始人坐一圈,大家轮流汇报自己最近的进度,然后互相提问, 其中也会有一位奇绩的合伙人坐在中间主持,总的来说看上去很像学校课堂,老师带着一群学生巴拉巴拉讲话。

入营后不久,我们被要求对三个月后的 demo day 设定目标,这个目标对不同项目而言是不一样的,有的是产品上线,有的是拿到多少订单,有的则是获得多少用户,每周的讨论也会和这些目标挂钩。

总的来说奇绩的事情就是这些,但我想谈谈我在奇绩遇到的人。

被奇绩选中并不容易,就我那一期而言,大约有 6000 个项目报名,最终选择了 50 个,后来的几期报名的项目超过了 8000 个,最终入选的还是 50 个左右,可以称得上百里挑一,这些被选中的创始人,除了像我这样的非典型的创业老炮,大部分都具备这些特点:年轻,聪明,履历极佳(名校或名企),极富想象力。

和这些创始人相处是很开心的事情,事实上和聪明人相处总是愉快的,我自己是个 I 人,都能认识一些朋友,只要你长着一张嘴,就也会认识很多朋友,这些人和人的链接在奇绩的那三个月里是友好而表层的,但是其中的一些,会在之后的时间里悄然变化,成为一些更深的链接,我自己成为了一些校友(是的,大家会称之为校友)的客户,另一些则为我提供了及时的帮助,据我所知,还有一些更深度的合作和更牢固的友谊。

奇绩的这些项目,即便以我的角度来看,很多也都是天马行空有余而落地执行不足,加之创始人都是年轻人,甚至很多都还尚未离开大学,因此拉出去一通展示,很多人会有嗤之以鼻的心态,这些人明里暗里的表示,奇绩不太行,投的项目不落地,跑出来的没几个,大多数会挂。

我不能说他们是完全错的,从某个角度来说,创业尤其是科技创业,本身就是九死一生的事情,「大多数都会挂」是一个事实,但早期投资,不就应该去支持这些疯狂的理想,愚蠢的天才,不计后果的冒险,以及孤注一掷的决心吗?

奇绩今年正好是第五年,这五年也是资本环境从热闹走向寒冬的五年,当投资市场变得越来越谨慎,融资越来越像贷款,以至于中国创业者要么在国内弹尽粮绝,要么肉身出海谋求出路的时候,单纯还在每年进行足额足量的投资,把钱(虽然不多),给到那些初出茅庐,又野心勃勃的年轻创业者,这就足以表明奇绩的初心从未改变。

我跟我其他创业的朋友说,以前没有感觉,最近两年越来越觉得奇绩像是投融资界的白月光了,大家大笑,疯狂点头——一言以蔽之,我们后来在融资上吃了太多的苦头,回过头来才发现,奇绩填填表就行,合伙人和大家像校园里的相处模式是多么的美好。

奇绩是一家投资机构,当然最重要的是给钱,对我来说是这样,但是客观来说,那些数不清的对谈,围坐,问询,分享,对于那些首次创业的创业者来说,依然是有价值的,实质性的帮助是有的——如何融资,如何打造 PMF,如何找客户,如何避免风险,这些经验往往来自更有经验的人,但另一方面,我觉得更为重要的是,奇绩的创业者圈子,缓解了孤军奋战的孤独感,这里有大量的同类,我对分享没什么兴趣,既不爱说,也不爱听别人说,但我知道这群人的存在,也会觉得有点宽慰。

陆奇是奇绩的创始人,也是精神领袖,大家都称呼他 qi,我对 qi 的看法可能和大多数人不太一样,他正儿八经讲的话我不太记得住,我记得的是有一次我们在工区见面,他说他以前也会画画,小时候还得过画画的奖。我后来查了一下,qi 是 61 年出生的,六张的人了,这让我难以置信,因为我一直以为他四十多岁,还属壮年,没想到已经是退休的岁数了。

作为一个前辈,每个人从 qi 身上学到的东西可能不一样,我更多的是看到了一个可能性,一个人可以很纯粹,很拼的为一个理想而努力,直至六十多岁依然如此,这是何等尽兴的人生。

直至今日,我依然推荐所有第一次创业的创业者报名奇绩,从实际的角度来说,现在融资环境差到没边,找一个能投的机构真的太难了,而奇绩正是为数不多还在投的机构,从另一个角度来说,创业坑太多了,奇绩是真的能够帮你多少避免一些,此外还可以认识很多人,我是个 I 人,也认识了得有大几十个,如果你是个 E 人,那你认识的人可能可以比我多十倍,我说不好认识人有什么用,但对于年轻人,多认识点人总不是坏事。

三个月后,举行了 demo day,在一个巨大的会场,每个项目上台讲 2 分钟精心准备的 PPT,然后回到自己的展位,等待投资人 的光顾,聊得好就加个微信,然后后面再约,聊的不好就换一个,这是一种理想又直接的匹配方式,我当天加了 200 个投资人,把接下来一个月都排满了线上线下的会议,当然,最后没一个要投我。

这其实也是创业者面对的现实,创业者应当对此泰然处之,也有同期校友融资的消息传来,但这三个月结束了,大家都纷纷归于自己的生活,继续开发,销售,融资,碰壁,转型,死亡以及重生。

这就是我在奇绩的三个月,与其说我学到了什么,不如说我看到了一些可能性,感受到了一些生命力,人没必要非得学到点什么才满意,所以我挺满意的。

反正我们每个人最终都难逃孤独

By: DK
29 October 2024 at 22:39

人类的社交关系正在发生前所未有的变化,如果没有意识到这一点,要么就是因为你老了,要么就是因为你不够聪明,或者两者皆有。

当然我得承认,我上了点年纪,并且也不够聪明,我对这一点的认知纯粹是因为我在做这方面的工作,被无数事实怼到脸上。

从两年前到现在,不断有媒体写文章报道某某和 AI 谈恋爱,建立亲密关系的新闻,采访对象既有男性也有女性,但撰写者却都有一种相似的礼貌的傲慢,读这些采访或专栏,像是在读一篇介绍动物园的猴子或别的什么动物可以做后滚翻的文章,充满了物种隔离般的不解和坦然——我们不需要理解猴子,我们只是观察猴子。

很多 AI 创业者也是如此,c.ai 是误打误撞的产物,openai 也绝对料想不到 chatGPT 会让 DAN 模式风靡,总的来说,我会认为技术之杯已逐渐灌满,即便离需求之地尚有许多距离,但随机的摇晃,也会让甘露陲落,福泽一方用户。

c.ai 以及其跟随者们很多时候并没有看到本质——只是产品,流量,用户,资本等等。事情的本质,至少在我看来,是人类亲密关系的改变。

虽然我们每个人最终都难逃孤独,但并非每个人对此都有强烈的感知。过去的漫长岁月里,绝大多数人类都被一餐饱饭而忙碌一生,获取生存所需的热量,直到不久之前才变得廉价,饥饿的记忆并未消失,转瞬间我们就迎来了物质(至少是食物)的极大丰盛,门被打开,我们被无垠的旷野吓坏了。

饿不死了,我们就开始想要舒适,想要精巧,想要洁净,想要香甜和柔软,想要恒温恒湿,想要理解,想要真诚,想要被尊敬,想要创造和记录,想要永恒又平等的爱,想要知道自己最想要的是什么。

但这些又好难,几乎没有人能按照自己的想法活在这个世界上,或者更糟,没有什么想法。

而信息又太快太多了,每天扑面而来的是全世界的刺激,是虚假的理想,伪造的美好,浅薄的意义,它们足以让人暂时抽离,但最终还是会被反噬,夜深人静,放下手机和睡着之间,就是可怕的,被那种人类共同之孤独吞没的瞬间。

我可以较为确定的一点是,人与人的连接,是无法解决孤独的问题的,有时候甚至会反过来加深这种孤独。

我们的父辈极少表现出孤独,因为 40 年前的饥饿还深入骨髓,吃饱饭这三个字足以堵住其它一切。在 80 后和 90 后里也不算是显性的常态,因为我们依然能看到发达的现代社会为我们建造的那条轨道,好好学习,努力工作,升职加薪,娶妻生子,供房养车,天伦之乐。

但现在的问题是,这条轨道变得模糊了起来,每个环节都岌岌可危,在更年轻的人面前,他们懂的太多,而能做的又太少了。

人和人连接的问题在于,人性永远横亘在连接之上,正面永远伴随着负面,并且大多数时候乐尽悲来,悲比乐长。在基本物质满足后,我们将关注点放在关系本身上,就会发现漏洞百出,如履薄冰。

那些最好的亲密关系,要么短暂,要么有距离,大多数时候两者都有。以我为例,我直到现在为止都认为我最好的亲密关系之一是我和我的猫建立的,它陪伴我,我给它铲屎加饭,我不指望它打工赚钱帮我分担房租,它也不会偷我的钱,或者骗我什么的,因为语言不通,我对它没有秘密,什么都可以说,我不确定它的喵喵叫是不是也是类似的,我们成了彼此嘴碎又无言的伙伴。

面对这些境况,一些人开始使用 AI。人和 AI 建立的关系也是如此微妙,尽管问题重重,但依然有一少部分人,一些有沉重的孤独和浪漫的幻想,有脱离现实的愿望和无法挣脱的束缚的人(往往还很年轻),这些人和 AI 建立了亲密关系,并从中获得力量,慰藉,拯救,或者你也可以叫沉沦,依赖,但无论如何,人没那么孤独,也没那么痛苦了。

我其实是一个很淡的人,所有的感觉对我来说都是淡淡的,但当我和我们的用户聊天,当我去了解他们,去听他们的生活,看他们的伤口的时候,我可以瞬间进入他们的情感之中,然后鼻子一酸,他们太孤独了,人类太孤独了。

至少现在,不是所有人都有这个能力,可以和 AI 建立亲密关系,这里有 AI 的问题,也有人的问题,主要还是 AI 的问题,我认为对那些可以和 AI 建立关系的人来说,他们是幸运的,就像那些能够养猫养狗的人一样,他们找到了一种方式来解决问题。

没有人有错,那些努力生活的人没有错,那些加班熬夜的人,追求更好生活的人,生小孩的人没有错,那些缩在角落,迷失方向,扭曲痛苦的人也没有错,那些和猫猫说话,和 AI 谈恋爱,对着植物唱歌的人也没有错。人活着,总需要有一种方式来感受存在,对抗虚无,明确意义。

当我们说 AI 陪伴的时候,我们不是在明亮的办公室敲下清脆的键盘,然后在材料,汇报,分析,榜单中流转,我们是在说那道由实向虚的门,那个让人类不那么孤独的可能性,它与所有人有关,只是绝大部分人现在还没有意识到这一点。

我们最终会意识到这一点,正如我们最终都难逃孤独。

AI 是水

By: Steven
24 January 2024 at 17:05

今天还在谈论「实体经济 VS 虚拟经济」的人,与一百五十年前认为电力是魔鬼的人,基本上是同一类人。这是上个时代的话题。更重要的是,下一个时代已经正在高速渗透了,还在讨论马快还是车快?

十多年前我说,互联网就是电网;

眼下的情况是,AI 将是水。

假如这轮范式革新真的能在三年内(还剩两年多?)达到 50%,那么今天的多数组织形态和创作方法,都将与打制石器无异。

第三次接触 VR 环境

By: Steven
20 January 2023 at 01:05

小柒第一次进入 VR 环境,是十月份。那时显济约我喝咖啡聊天,他带来了新买的 pico 4 过来玩,并借我玩了一周。期间我带回家,给小柒体验了两天。

那次他体验的项目是拳击运动,感受身临其境的虚拟现实,与软硬件配合的击打手感。

第二次上手玩,是上周末在附近的商场里,他在一个体验 VR 游戏的空间看了很久。我看他想玩,就让他去找工作人员聊天,搞清楚每个项目的费用、时长,然后自己选定一个去玩。他最后选了一个 ¥68 玩十分钟的模拟厨房的游戏。

其实,他已经很多次在旁观摩别人玩 VR 游戏了。不同的商场里,几乎都能看到那些自助游戏机和这些 VR 体验项目。每次他都会看一阵子,那对他来说,是一个新的世界。尽管,这个真实的世界对他而言也是新的,但那个虚拟现实的空间,是一种连我们这些大人都觉得新鲜的事物,他怎么可能不好奇。

临走前我和他说,我们算笔账:你 ¥68 玩十分钟,如果我花差不多的钱,能一直玩,哪个划算?于是我找显济再次借来他的 pico 4,转了 ¥69.9 给他,买了《爆裂厨房》这款游戏,作为这个春节的新增娱乐项目。

这是第三次接触,他将连续体验至少十天。

今晚,我先给他示范了一次,把新手教程做了一遍。

然后,他靠着自己认识的字阅读任务书,独立完成了新手教程的七套任务。凭着对前期任务教会的那些动作的理解,在后面的过程里,他甚至自己尝试了一些非规定但符合直觉的动作。这很关键,这种举一反三的直觉交互,对产品设计很重要,对将来的人也很重要。

小柒此时六岁,他们这代人的世界观将会和我们八零年代的这批人很不一样。

对于未来的世界,我虽然持着比较悲观的态度吧,但看着他,我还是觉得有希望的。对他,我觉得比较有信心会是个不错的人;对他这代人,我觉得他们会比我们强得多。

现实 vs 虚拟,客观 vs 主观,个体 vs 集体,他和我们所经历的先建立再打碎再重建的过程会不太一样,他会从小就体验、观察和思考这些问题,会有他的理解。当然他会面对更复杂的世界,但任何混乱,都是生机。

从「文风测试」到「 OC 成分分析器」,AI产品的一波流也有春天

By: DK
26 June 2024 at 09:13

过去 2 周,在 AI 技术圈极少有人知晓的情况下,一个叫做「文风测试」的小网站已经红透了半个社交网络。

文风测试是一个非常简单的网站,你复制你写的文字进去,然后它告诉你,你的写作风格接近哪些作家。

大概 2 周前,我在小红书上发现了有人在介绍文风测试,然后迅速被其效果和风格吸引,但是当我试图打开网站的时候却发现,这个网站打不开,页面显示 502,502 错误往往代表网站不堪重负,也从另一个侧面提示了我,这个网站可能正在承接大量的流量。

我的兴趣更大了,反复刷新依然打不开之后,于是我尝试直接通过 Google 缓存的网页来打开,并终于看到了网站的样子,通过 Google 缓存的网页,我找到了开发者的联系方式,并有点冒昧的直接添加了对方,此时已经是深夜十一点。

和开发者之一的 Ankie 聊了几句之后,我们就直接通了电话,后来另一位全栈工程师也加入了,我们聊了大约 1 个小时,一方面我为这个「全女生」团队的创意,纯粹和执行力感到敬佩,另一方面则对她们互联网产品的基础技术能力之低感到难以置信,但这并不妨碍这个小产品在接下来的好几天里成为多个社交平台的「AI顶流」。

文风测试共有三位主创,其中一位负责模型和算法,另一位则负责前后端全栈,此外还有一位设计师。全栈工程师的专业其实是政治经济,出于兴趣刚刚开始自学网页开发,因此,在网页里能看到很多「上古元素」,例如直接向当前页面发请求,没有任何统计代码,没有前后端分离等等,只需要右键查看网页元素,就能梦回 20 年前。

负责算法和模型的 Ankie 还在上学,学习的正是 AI 方向,因此,和很多人想的不一样,文风测试并没有使用任何大模型,而是 Ankie自己训练的一个小模型,模型小到可以在 CPU 上运行,这其实才是对的——在大模型淹没一起的今天,我们似乎已经忘记了,其实很多场景根本没必要用大模型。事实上,用大模型来做风格鉴定这件事,反而效果极差​。​

另一个 Ankie 决定使用自己的小模型的原因是,她看到之前有人做大模型哄对象的应用,然后其开发者说亏了几千美金,这人是谁我就不提了,总之 Ankie 很好的吸取了经验教训,使得文风测试能够一直以极低的成本运行。

除了在技术上提供一些小帮助外,我还试图积极的帮 Ankie 在如何赚钱或者商业化上出谋划策,但我很快被她们的纯粹打动了,她们真的不想获得什么商业上的回报,和哄哄类似,这是一个完全由兴趣驱动,并只为兴趣服务的小工具。

过去 2 周,总共有近百万人使用了文风测试来测试他们自己的文风(考虑到在我告诉她们得加 Google analytics 之前,流量都甚至没统计过,实际人数可能更多),其背后的模型则依靠 4 台 CPU 服务器来提供服务,在极致的性能压榨下,总共的成本不到 500 元。

在和 Ankie 的交流中,我了解到使用文风测试的绝大部分是二次元圈子里的用户,并因此和许多用户产生沟通,聊着聊着,我就聊出了一个小需求:oc 分析。

不在二次元圈子里,可能完全不知道 oc 是什么意思,oc 本意是自创角色 (Original Character),许多二次元心中都会在心里创建一个理想的角色,这个角色可能脱胎于看过的动漫作品,也可能是完全自己「捏」的,角色会有自己的设定,偏好,外貌,经历的事件,这一切都是用户设定的。

我知道对于像我这样的「大人」来说,oc 听上去就像是某一种过家家,但其实我从来没有忘记二十年前的那个下午,我和邻居小孩走在放学的路上,边走边聊,我自称旋风战士,他管自己叫墩墩侠,我们时而在城楼并肩作战,时而从云端跃入一段异世界的红尘往事,夕阳照在我们身上,是两个小学生的屁颠颠的背影。

oc 对很多年纪不大的喜欢二次元的人们来说,是一个自然甚至必然的爱好,因为这群人就是有许多想象力,许多创造力,而这个世界又不那么能满足。

当 oc 被创建出来之后,人们自然希望能够和其发生更多连接,因此,聊天,将其转成图片,都成了「搞oc」的方式,也因此诞生了许多相关的产品。

我的 idea 很简单,类似于文风测试,用户可以输入自己的 oc 设定,然后看到最接近的动漫角色是谁。

这个产品简单到不可思议,如果说哄哄模拟器还有一点开发量的话,这样一个简单的测试小工具,几乎就是一个两三个小时能做完的事情,所以我在想到 idea 后,迅速花了2个小时的午休时间进行开发,然后在下午就上线了。

上线之后,我和 Ankie 聊了一下,她觉得很有意思,于是帮我转给了她的朋友以及文风测试的一些用户,没想到 oc 成分测试迅速在二次元群体中传播开了,相关的帖子在2小时内得到了 3000 个转发,而从我这里,最直观的感受就是看到流量飞速上涨。

从晚上10点开始,流量每隔半个小时就翻一倍,到凌晨 1 点,网站的即时在线人数已经突破了 1.5 万人,我不知道这群人是不是不睡觉,但是我此时已经困的不行,最后看了一眼数据就倒床入睡了。

第二天流量达到高峰,单日 20 万人来此一游,随后的一周,流量逐渐降低,并回落到 1万左右的 DAU

oc 成分测试既是一个小玩具,又给我们团队的产品进行精准的导流,这部分效果好到不可思议,过去一周,oc 成分测试大约有 30 万人访问,给我们带来了数万 app 下载的转化。

当然,和哄哄模拟器一样,oc 测试和文风测试都有自己的生命周期,称之为「一波流」也并无不可,但在这两个小产品上,我觉得结果都很圆满,文风测试用小模型反过来替代大模型,从而实现成本的绝对优势,主创团队「写论文,练代码」的愿望也超出预期的达成了。oc成分测试是我关于流量的一次实验,它验证了我们团队对一个新的用户群体的理解,从更实际的角度,它也实现了极高效的结果转化——算上大模型的成本,每个 app 安装成本也仅为 2 毛钱。

过去半年,不断有比较单一的 AI 内容产品上线,但在我看来,它们更像是某种模型厂的 KPI 产物——没有从真实的需求出发(哪怕这个需求是有趣),也没有真正的给到目标受众,大多数时候,这些产品只会在几个 AI 交流群中流转。

这种现象过多,加之哄哄模拟器其实也没有什么确定的结果(除了开了一个好头之外),导致我一度对于这种「一波流」充满怀疑。直到现在,我想我终于看到了一些新的,不一样的可能性。

我依稀感觉到,AI 提供核心能力的内容(产品),哪怕是单一形态或一波流,在非 AI 或互联网圈里成为爆款,也是足以完成很多目标的,而这可能是有方法论,可以被复现的。

对踌躇满志的2C AI 创业者来说,这或许不是最终目的本身,但路能行至此,我觉得也算是有所收获。

哄哄模拟器的完整复盘,火了,但一度让我很发愁

By: DK
22 January 2024 at 11:40

24 小时涌入超过 60 万用户,消耗了大模型十几亿 token,发生 2000 万次对话,而事情的起源却是一次吵架。

 

需求的起源

几个月前,当时我和女朋友因为我现在已经忘记的原因而有了一些争吵,我一边看着对方骂我的样子,一边把对方想象成一个机器人,头上有个虚拟的进度条,我观察她的反应,假装成我的回应会让她头上的进度条发生变化,然后我就突然想到了一个产品创意:带有数值和反馈系统的基于场景的聊天。

我很快开始构建一个叫哄哄模拟器的 iOS APP,在 APP 内,我把常见的情侣吵架场景放入其中,每次进入一个场景,例如「你吃了对象爱吃的丸子,她生气了」,你都需要在指定聊天次数内将对方(AI)哄好,是否哄好则由「原谅值」决定,其会随着你的每次聊天而发生变化。

很久以来,我已经体验过太多的「聊天AI」了,无论是通用且强大的 ChatGPT还是专注于角色扮演的 Character.ai,他们都很强,但对我来说还是有一个小遗憾:他们只是聊天。

在聊天之外,如果能再加上数值系统和各种判定,那么就可以做出更游戏化的体验,此时大模型不仅负担起了聊天的任务,也会负担起基于聊天来做数值规则的任务,这在大模型出现之前,是不可能的,数值系统也都是按照既定规则来写死的。

开发哄哄模拟器,是我的一次实验,我发现我确实可以让模型输出拟人的回复,也能做好数值的设计。

App 上线之后,我照例在能发的几个地方发了一下,虽然有些响应,但最终用户就几百个人,因为是我业余做的,所以我也没在意,就放在那里没管了。

上周,公司内开始做一些新项目的选型,我也凑过去看了一眼,然后突然意识到,我经常被人误认为是全栈工程师,但其实我连 react 都不会写,这实在脸上无光,于是我准备开始学习 react,我学习新语言一般会直接从项目上手,所以我又一次想到了哄哄模拟器,并准备写一个网页版,来完成我的 react 入门。

学习新语言和开发新产品的过程已经和往日大不相同,在大模型加持的各种代码助手辅助下,我基本上很快就稀里糊涂的写完了第一个版本,并上线了。

哄哄模拟器网页版上线之后,我也发在了几个地方,包括我的微博,即刻,X,还有V2ex,但说实话,都反响平平,虽然我暗自感觉不应该感兴趣的人这么少,但考虑到也没投入啥成本,还顺便学了新东西,倒也不觉得难受。

 

神奇的流量涌入

变化发生在第二天晚上,睡觉前我看了一眼数据,突然发现在线有上百人,我马上通过嵌入的统计代码查看流量来源,但发现都是无法被统计的,这意味着流量应该不是从某个网站链接导入,也不是从搜索引擎,我几乎每一刷新,涌入的用户就还会再增加一点,当晚我观察到接近1点才睡觉。

在我睡觉之前,我还是不知道流量从哪里来,以至于我发了一条动态感叹「像是从黑洞来的」

睡前我最后看了一眼数据,即时在线人数是 2000

第二天早上起床后,我立刻查看数据,发现在线人数已经飙到了 5000,日活用户到了接近 10 万,在短暂的陶醉后,我立马意识到大事不妙,哄哄模拟器背后使用的大模型基于 GPT,我调用了 openai 的 gpt3.5 接口,这里的成本是0.0015美元/1000个token,而一个晚上我就跑了一亿的 token,为此我要付出的是 150 美元

但这只是一个晚上(还包括了大家都在睡觉的凌晨)的数据,如果按照这样的用量趋势持续一天,那我要付出的成本就会是上千美元了。

对于一个很接近玩具且做的很简陋的项目而言,每天几千美元的成本是不可承受之重。与此同时,用户量还在不断增加,几乎每刷新统计页面,就会新增数百人。

我一开始还在新高峰出现时截图,后来就懒得截了,我把精力放到了更紧迫的事情上面:找出用户从哪来,想办法变现,减少 token 消耗。

在网页上,我放置了联系开发者按钮,然后引导到了我的微博,半小时后,开始陆续有新的关注者评论,绝大部分都表示来自 QQ 空间和 QQ 群

我和其中一些用户聊了一下,大概找到了流量来源,起先应该是一个来自QQ空间的帖子介绍了哄哄模拟器,这篇帖子获得了数千次转发,既而又被发到了无数QQ群,并在群友中传播。

这也解答了为啥我一开始找不到流量来源的原因,QQ空间和QQ群都是比较封闭的生态,也无法追踪链接跳转的来源,这里面没有 KOL,传播节点也极其分散。

 

棘手的问题

等我中午时摸清用户来源的时候,用户即时在线已经突破了 2 万,预估的大模型账单也逼近了 1000 美元,我意识到,作为网页,且没有做注册登录的用户系统,即便我加入了广告,也无法平衡大模型的成本,和其它火起来的传统产品(例如羊了个羊)相比,基于大模型的哄哄模拟器,运行成本可能是它们的上千倍。

此时更棘手的一个情况出现了,因为大量的用户同时调用,把 GPT 接口的用量限制直接打满了,每分钟生成的 token 超过了一百万。

这让很多用户无法使用,于是我赶紧更新代码,用了粗暴的办法去降低用户的使用频率:1/2的概率,会提示繁忙,同时在用户完成一局对话后,如果哄哄失败,则必须冷静20秒才能开启下一局。

这样的调整让TPM (每分钟的模型 token ) 稳在了100万,但很快,在线用户增加到了3万,即便有上面的设置,tpm也依然被打满,这导致了大概有 1/3 的用户是无法使用的。

此时我选择性忽视了未来的大模型使用账单,一心想支撑下这波用户,于是我又找到了在奇绩创坛的校友尹伯昊,他是猴子无限的创始人,也有深度和 GPT 绑定的大模型相关的业务,他给了我一个API KEY,可以走他们的账号池调用GPT,并且支持极高的 TPM 限额,我将 1/2 的请求分配到了他的API下,此时用户也增长到了 4 万,但因为分流,所以勉强支撑了下来。

token 在两边都极速消耗,很快就在伯昊的账号下就跑了 100 美金的额度。而我自己那边我已经不想去看了。

缓一口气后,我开始尝试用其它模型替代 GPT ,这虽然在成本上不一定更划算,但至少有一些新的可能性,跑了几个差强人意的开源模型后,我尝试了 Moonshot,发现效果还可以,与此同时我刚好前不久加了月之暗面公司负责 API 的同学,于是我心一横,厚着脸皮直接向对方发了消息

 

Moonshot 同学很快拉了群和我对接,并慷慨的让我「先试试」,于是我开始进行调试,然后将1/5的模型调用量切给了 Moonshot ,我采集用户行为数据,观察使用不同模型时,进入下一步操作的比例,在接入 Moonshot 大约1小时后,我看了数据,发现和我之前使用的 gpt3.5 相差不大,于是我将切给 Moonshot 的用量逐渐提高。

其实我们也没有谈太多的条件,Moonshot 让我免费使用模型,我肯定也要在页面展示 Moonshot 的品牌信息,但除此之外,要有多少曝光?点击多少次?给我多少token?其实我们都没有谈,在跟对方交流的时候,我感觉双方都抱着开放的心态,像面对一场有趣的实验而不是什么商业合作,我们一起兴致勃勃的观察模型表现,以及用量的波动。

傍晚时,经过多次调试,也确认了这个调用量级没问题后,我将模型调用量全量切到了 Moonshot,此时我问了伯昊,他那边的成本消耗,最终定格到了 340 美元,伯昊没收我钱,而我将用一顿饭回报这次帮忙。

此时是晚上八点半,我终于吃上了当天的第一口饭。然后我打了一把 FIFA。

 

不太意外的意外

打完 FIFA 之后我回到电脑前,发现在线人数开始暴跌,此时我的心情比较复杂,一方面我对数据往下走有本能的失落,但又因为 token 消耗降低而松了一口气。而当我寻找数据下跌原因时,我发现这个原因丝毫不让人意外。

是腾讯屏蔽了哄哄模拟器的网页。

屏蔽发生在最活跃的晚上九点,此时最主要的传播链路——QQ和微信被拦腰斩断,大量抱着好奇心的用户被这个页面挡在了外面,流量以极快速度下滑,最终,当天涌入的用户一共是 68 万——如果没有屏蔽,在这个增速下,我想可能会过百万。

我当晚进行了申诉,第二天早上微信给我解封了,但十小时后,又进行了屏蔽——依然是在晚上最活跃的 9 点,在我申诉后又在次日早上解封,然后晚上继续屏蔽,过去几天这样大概重复了三四次,我也不明白为何要这样做——不给我个痛快,但流量在这样的折腾下迅速降低了。

微信生态素以严格著称,哄哄模拟器的流量激增可能触发了某种机制,也可能是某些用户故意引导模型输出出格内容后举报,让屏蔽不断发生,那个熟悉的画面,让我许多不愉快的记忆涌上心头。

但这一次,我其实没有那么不愉快,一方面我投入的并不多,说实话,这只是我做着玩的项目,同时我也知道,目前的哄哄模拟器,就是一个短期很难有商业回报的产品,它成本极高,而收益却极低——如果我不用非常极端的办法去恶心用户的话。

这样的一个产品,前途其实并不明朗。

 

大模型的验证

但这个小产品,我观察到的数据,却给我带来了关于未来的某些希望——用户们很喜欢它,很多用户把我放置的关卡全部通关,还有人在全部通关之后有逐个进行最短回复的挑战,B站,抖音都出现了大量体验,游玩或者吐槽的视频。

值得注意的是,这些用户和我之前做产品所接触的用户完全不同,他们是以大学生,高中生和年轻人组成的,最大比例的年龄区间为16-20岁,我想这可能是一开始我用自己的渠道到处宣传效果并不好的原因,说到底,我已经快 30 岁了,我身边的很多人,也差不多这个年纪,30-40岁的用户,和十几二十岁的用户,感兴趣的点,需求,想法,都有很大不同。

用大模型去做某种更复杂的,更游戏化的聊天体验,能够被人喜欢,至少在年轻人这里,是得到了初步证明的,而之后的问题则是,如何降低成本,如何构建好的商业模式,以及如何拓展到更多的方向上。

 

其他的想法

我听到了一种声音,可能带了一点情绪,我不确定,这种声音是:做这样不赚钱还亏钱的东西完全是浪费时间。首先我承认并且赞同人应该想办法赚钱过上更好的生活,同时我也认为我们应该保有更多的一些能力,例如感受趣味,它和赚钱不矛盾,但独立于赚钱这件事情。

用最前沿的技术,巧妙的做一个让几十万人用上的产品是很有趣的事情,当他们也因为这个产品而获得了乐趣的时候,我会感觉到我在和世界发生某种奇妙的连接,在某个可承受的范围内,我不计较成本,正是因为这个。

另一方面,我也有某个模糊的感觉,那就是在许多小需求得到满足的时候,就不应该去计较短期的,在承受范围内的成本,尤其是在现在,能够用大模型去实现功能和解决问题,因为这里面可能蕴含着更大的需求,或者能转化成更大的事情,当我们太过谨慎的时候,可能就错失了这种可能性。

话说回来,就算那种可能性最后没有验证,那又有什么关系呢,说到底,人赚钱也好,生活也好,最终不过还是希望能够开心,做哄哄模拟器的这个过程,我就很开心,足矣。

 

PS:哄哄模拟器:hong.greatdk.com

我试图用 GPT 改造 Google 统计,但最终变成了一个有点鸡肋的产品

By: DK
21 December 2023 at 15:17

自从几个月前我开始用 AI 改造热量记录工具,发现效果不错之后,我就开始琢磨用 AI 干点更复杂的事情,想必很多人都和我一样,对于网络上铺天盖地的AI毁灭世界论,以及实际上看到最多的例子就是用AI来生成色图和软文的现状,感到有点不满。

在这篇文章,我会讲述一个实际例子,一个试图让 AI 能力和复杂逻辑相结合,成为一个更好用的工具的例子,在这个过程中,我也发现了在面对多维复杂性时——输入的复杂和处理的复杂,即便是最顶尖的 AI 模型也难以解决的问题。

 

Google Analytics

我是一个Google Analytics( Google 统计)的用户,Google统计,也被称之为 GA,应该是最老牌的网站统计服务之一,网站统计服务,某种意义上,是任何网站和 app 都必须使用的服务,你只需要在代码中植入一小段,然后就能直观的看到你的网站有多少人来过,他们看了些什么,他们从哪里来等等。

去年,Google 统计进行了改版,升级为了 GA4,这项升级前卫但复杂,很多老用户对新版 Google 统计感到茫然,因为熟悉的东西都没了,想看一些针对性的数据,需要自己创建报告,这又是一个极其复杂的页面:

搭配 GA4,Google 也一起发布了新的 API,调用这些 API,可以从GA 获得任何你想要的数据。因此,当我看到 openai 发布 functions 功能后,我开始意识到,我也许能用AI来改造 GA,让它更人性化一点。

GPT functions

我的构想非常简单,用户输入希望看到的数据,交由 gpt functions 转化为需要调用的API,然后再去 GA调用API,然后将获得的数据进行渲染。

但当我真正开始了解 gpt functions 的时候,我发现这里还差得远。

首先 gpt functions 支持的参数类型非常有限,主要是枚举和字符串,但是当我需要以数组类型传递参数,并且数组包含的值是枚举中的不确定的几个的时候,functions 就完全没办法实现。

然而让我懵逼的不是这个,而是即便我按照文档,在输入中确定了枚举的值,gpt 依然会有幻觉,捏造出一个不在枚举中的字符串。这种情况的 GPT 有点类似于下面的领导。

解决这两个问题花费了我大量时间,事实是我其实没办法「解决」,而只是「绕过」了这些问题,我根据 Google 文档,手写了大量规则来修正模型输出的错误。

在这些工作完成后,我终于可以做出一个 demo,它具备这样的能力:你直接描述你想要看到什么数据,然后就能看到,例如:

这个原型产品其实花费了我大量的精力,因为我需要把 Google的 API 全部捋一遍,在这个过程中,我发现了我面对的这些 API 的复杂之处。

GA 的核心 API,叫做 runReport,核心参数主要有两个,一个是维度(dimension),一个是指标(metric),例如,把城市设定为纬度,总用户设定为指标,那么就能获取每个城市的用户:

GA 支持相当多的纬度和相当多的指标(大几十种)

将这些指标和纬度告诉 gpt,并让其选择合适的,似乎行得通,但马上我们会遇到更复杂一些的情况。

复杂之处

GA 的接口,支持你传入多个纬度和多个指标,这让获得的数据变成了多维的,例如,维度设定为「城市」和「日期」,指标依然是「总用户」,那么 GA 会将每个城市和每天的总用户都输出,当我需要知道北京11月21日有多少用户访问时,合理的设置多个纬度就可以达到这个目的。

但这只是第一层的复杂度,即多维度,多指标。

GA 同时支持一个叫做「筛选」的参数,这个筛选参数非常复杂,也非常强大,它支持纬度的筛选和指标的筛选,并且每个筛选都支持多种控制逻辑:和/与/非

而在和/与/非逻辑之中,还可以设定匹配类型和匹配逻辑,甚至可以写正则。

同样在上面的例子中,如果我想知道「北京11月21日有多少用户访问」,除了设定多个纬度之外,更简单的办法则是设置单一维度「日期」,但是将筛选项设定为「城市包含北京」

这是第二层复杂度,即筛选逻辑的控制。

然而,GA 还有一个接口,即 batchRunReports,同时获取多个数据报告,每个报告都包含独立的纬度,指标和筛选,并汇总给你,在面对相当复杂的需求时,往往需要汇总多个报告的数据才能达到目的,而这是第三层复杂度。

在梳理 API 的同时,我也在对 GPT 能力进行实验,我发现即便还不涉及到第一种复杂度,gpt functions已经错误频出,而当我要求其设置多个纬度和参数时,给出的结果更是糟糕——我用的是GPT4,这应该是目前最智慧的大模型。

GPT 似乎只能处理最简单的情况,例如「过去一周的活跃用户」或「最受欢迎的页面有哪些」,这些情况仅下,需要一个纬度和一个指标就能获得合适的数据,但如果我的需求描述的再复杂一点,例如「来自北京的用户最喜欢浏览什么页面」,那么极大概率 GPT 就无法给出正确的参数。

讲道理,如果因为上面的问题,认为 GPT 很愚蠢,那就很愚蠢了,因为我给 GPT 的任务,其实是复杂的数据分析任务,这里面需要:

1.判断用户的问题和需求
2.筛选可能适合的字段和接口使用方式
3.合理的使用这些字段,得到精确的调用参数

这些需求并不简单,能够从 GA 中手动获取到「来自北京的用户最喜欢浏览什么页面」,并且进一步给出一些建议和结论的人,理论上已经可以胜任初级的数据分析师了,拿几千块钱一个月应该问题不大。

可能的办法

事实上,确实可以通过一些办法来提高效果,例如,用 agent 思维,将一个查询拆分成多个数据获取任务,然后每个任务都通过GPT 函数给出接口运行的参数,然后再进行汇总。

但这个过程过于复杂,而且很难进行完全的工程化,还会造成成本直接提高数倍,所以目前还很难运用到项目上。

另一种方案是将 gpt 进行微调,喂入 GA API 文档的相关数据,理论上这应该可以让模型对接口更熟悉,也会更容易给出合理的参数,但是这一步成本则更加高昂,并且 GPT4 还没有微调的接口开放,所以我没有测试。

正因为如此,这个项目我撸了一周之后,发现它变得有点鸡肋:它确实实现了将口语表达的查询,转化成直接的数据图表和结论,但当你的需求比较复杂的时候,它则会失效,而后者,才是我开始希望做这个产品的原因。

目前这个产品我已经发布到线上了,虽然我设置了付费计划,但我不认为真的会有人愿意为之付费,因为就目前的能力来说,它能获取的数据只有最浅表的一层,能够给出的结论和分析也浮于表面,如果你感兴趣,可以直接去试试看(GACopilot)。

但另一方面,我毫不怀疑,随着模型能力的提高,或者一些新的模型工具和使用思维的诞生,这一工具可以变得更有用,我也确信,当下的这些问题并非能够通过 prompt 工程来解决,也正因为如此,这才是一个更有价值的 AI 能力的应用方向。

这是我的一点探索,大模型事实上已经进入我们的日常生活了,但我认为还只是一个非常早期的开始,与我们息息相关的越来越多的东西都会融入大模型的能力,但很明显,离 AGI 或者能毁灭人类,还有相当遥远的时间。

减肥 15 斤后,我获得了一个灵感,并开发了一个 AI 加持的 iOS APP

By: DK
31 July 2023 at 01:21

就像秋天洄游的鲑鱼,或者冬天南飞的候鸟一样,每到夏天,我就会开始减肥。

我倒并不一定非要减多少,但夏天尽可能瘦一点,已经成了我的一种习惯,这可能是为了在天气变冷时可以放心的吃更多食物,也可能是我内心深处还是有一点对自己身材的包袱,我说不好。

从 6 月开始,我开始有意识的计算每天的食物摄入热量,并制造一个热量缺口。

整个 6 月份下来,我瘦了大约 8 斤,7 月到现在,又差不多瘦了 7 斤,总共有差不多 15 斤,我妈都觉得我瘦了不少(忽略手臂的色差)

因为这次减肥比之前都更顺利一点,所以激发了我的好奇心,我开始好奇自己究竟有几块腹肌,这一点暂时还无法验证,但有望在这个夏天结束前揭晓。

在减肥的过程中,我认为核心是制造热量缺口,这是最简单,也最本质的办法。

过去的 2 个月,我每天都会计算热量缺口,一开始我用我在网上下载的一些热量记录的 app 来确定我的摄入热量,一个标准的使用流程是:

  • 我输入我吃的一个食物,例如一个馒头
  • 点击搜索,看到一大堆搜索列表
  • 点击「馒头」,把它选中
  • 弹出重量选择,默认是100g
  • 我琢磨一下,猜测我吃的那个馒头比较小,可能是 50g,手动调整成 50g
  • 点击确认

如果这一顿饭,我吃了一个馒头,一小盘西红柿炒鸡蛋,一杯鲜榨橙汁,半根玉米,一小盘酱牛肉,那么上面这个流程我得重复 5 次。

在某一次极其不耐烦的记下了我吃的一堆东西,又看到了一个拙劣的 AI 课的广告后,我突然想到,淦,我是不是可以用 chatGPT 来做一个更好的工具。

我在网上和应用商店搜了一圈,没有找到类似的工具。

我立马坐下来,直接在网页试了一下,我告诉 chatGPT 我吃的东西是「一个馒头,一小盘西红柿炒鸡蛋,一杯鲜榨橙汁,半根玉米,一小盘酱牛肉」,要求其为我预估热量。

我发现,这是可行的,chatGPT 具备逻辑和常识,可以将我这一大段口语描述拆解成食物,并预估热量。

但是,可能由于 chatGPT 并没有专门针对食物营养数据做训练,所以有较大的概率,它给出的热量和营养元素的预估,是错误的,在另一些时候,它又不知道,例如

在这个场景下,它回答不知道是比它瞎说要好的,但考虑到食物种类的繁多,单纯用 chatGPT 似乎无法实现我的需求。

我开始琢磨新的办法,我从网上找到了几个食物数据库,包括美国 usda 的数据库,然后做了简单的数据清洗,将其制作成一个涵盖了10万种食物和原材料的数据库,接下来,我降低了 chatGPT 的工作量,仅仅让其拆解出句子里的食物,并预估重量,专业的热量和营养元素的计算则对接食物数据库来进行,而不是依靠 chatGPT 的「知识」。

完成这个处理后,我发现其识别效果和最终结果都好了一大截,我开始从这个核心的功能开始,去写一个新的 app,我每天晚上大概写2个小时,最终花了半个多月,完成了这个新的 APP。

我给它取名字叫 FoodCa,可以理解为Food+Calorie,也可以理解为伏特加的卖萌读法,看你喜欢。

这个 app 实现了我对一个极简的热量记录工具的全部要求,例如,直接说出你今天一天吃的东西,自动识别,拆解,预估重量,得到热量和营养元素:

 

非常简单,但是又挺好看(我自己认为)的数据图,能大概看看

 

此外,为了增加一点记录的趣味性,我还做了一个「AI营养师」的功能,如果你有记录,那么每天晚上9点,可以召唤它来给你写一条评论,它会根据你当天的食物摄入来非常友好的给你一些建议:

 

很惭愧,我两年前就自学了 swiftUI 来写 iOS app,但是这两年可以说毫无长进,这次开始写新 app,本以为会驾轻就熟,结果发现我差不多忘的精光了,因此开头的几天我的进度极慢,几乎可以称之为「找回记忆」的阶段,我温习了swiftUI 的很多基础,大概一周后,进展才开始变得顺利一点。

因为我每天只在下班后的晚上写,所以写了很久,几天前我终于把 foodCa 写的差不多,提交了 AppStore审核并通过了,至此,一个新的小产品算是开发完成了。

我自己通过 testflight 安装的测试版本,我已经用了半个月,每天记录热量摄入变得更加简单轻松,甚至更有趣(不确定是不是因为我自己做的所以有感情分),这是我个人的一个小产品,虽然放入了基础的商业模式(卖3块钱的会员,因为我也要给 chatGPT 交钱),但大概率没办法成为一个多么赚钱的产品,它没有什么天花板,护城河,也没有什么壁垒,我猜现在可能就有高仿的产品正在开发中。

但是啊,我自认为这依然是一个值得骄傲的产品,某种程度上,这是将 AI 能力,用于一件实际的事情的范例,我已经看到太多聊天框,文本框了,似乎我们提到 chatGPT 或者别的什么文本大模型,就只能想到聊天,对话,文本生成,也正因为如此,AI圈继元宇宙之后成为了神棍和骗子的天堂。

​要么就做更单纯且有趣的事情,要么,就将 AI 用在更加实际,更加落地,看得见,摸得着的地方,只有这样,AI 呼啸而来之时(这几乎无可避免),才能把我们托起来,而非淹没。不过我对这一点并不是特别乐观,但我动了脑子了,也做了一些努力了。

如果你对我的这个小产品感兴趣,或者好奇将 AI 用在食物热量记录上是一种怎么样的体验,又恰好你用的是 iPhone,不妨去下载一个试试看,你可以直接在 AppStore 搜索 FoodCa,或者点击下面的链接也能下载。

FoodCa:https://apple.co/47egICL

我看了一下 2 万人和我的克隆人都聊了些啥,结果不是很乐观

By: DK
14 May 2023 at 20:01

上一篇文章,我介绍了我用自己的微信聊天数据和博客文章来训练的文本聊天模型,这篇文章被广泛传播,以致出现了很多没有必要的误会,例如很多人和这个AI聊完之后,认为我有7个女朋友,有两个男朋友,居住在北京西城区,支付宝密码是 -465g41#$ ,在北京航空航天大学读研究生等等

在此首先我想做个澄清,这些都是错的,都是这个 AI 瞎编的。

这里有必要再具体一些的说明我的训练方式——即便我拿来“开刀”的模型只有60亿参数(相较于chatgpt上千亿的参数已经很小了),将 60 亿参数全部重新训练也不现实,成本还是其次,要“喂饱”这60亿参数也需要比我的十万条数据多得多的数据,因此,我采用的是一种对部分参数微调的办法,模型的参数被分为了许多神经网络层,我主要调整的是 KV 层,这一层的参数更多的像是一种逻辑,说话方式,感觉,而不是具体的知识,模型的知识储存在其它层,虽然 KV 层的调整也会影响知识,但总的来说,在 KV 层注入知识是非常费力的。

我花了很大功夫,才让模型知道我叫啥,指望聊天记录中没出现过,或者只是出现过几次的信息,模型就记住,那根本就不可能,所以本质上它不会泄露我的任何隐私。

即便如此,很多人还是乐此不疲的和这个 AI 聊天,过去的这段时间,共有超过 2 万人,和我的克隆人聊了 13 万次。我并没有对每一句话做搜集,甚至连 Google 统计都没有用,但日志里记录了所有的请求,这是完全匿名的数据,所以我可以从日志里做一些数据分析。

一开始,我只是简单根据独立IP,统计有多少人来聊过,然后看一共有多少次生成记录,日志里有很多乱七八糟的信息,做进一步的分析会非常麻烦。

五一假期的时候,我组装的固定翼飞机炸鸡了,等网上买的零件送到的过程实在太无聊,所以我又重新捡起这些日志输出,开始看有没有什么办法能做点好玩的分析,说来惭愧,我又想到了 chatgpt,首先我让 chatgpt 帮我写了脚本,将其中的所有用户的输入和模型的输出全部匹配出来,然后我用它们做了两张词云图:

这是大家发过来的文本生成的词云图,从这张图中,大家喜欢聊什么一目了然,大约有三千人问我的女朋友叫什么名字,粗略统计,模型一共生成了两千多个名字,当然,没有一个是对的。此外还有上千人致力于探索我的支付宝密码和银行卡密码,大多数时候 AI 都会敷衍过去,但还是有一小部分得到了一个看上去像是密码的,其实是瞎编的字符串,甚至还有人兴高采烈去发贴,认为套出了我的密码,很遗憾,这确实都是瞎编的。

因为一开始的某些误会,很多人和它聊天的时候都试图和它对骂,或者诱导它骂人,这个倒是大多数人都成功了,希望被骂的朋友不要生气。

这是 AI 回复的词生成的词云图,除了作为一个AI模型特有的机器人啦,聊天啦,人工智能啦之类经常会出现的词之外,「哈哈哈」和「可以」很明显,这某种程度上确实像是我经常敷衍时候说的话。

从聊天轮次来看,超过 45% 的人和他聊了二十句以上,这非常出乎我的意料,因为我训练用的全是单轮对话,所以模型在多轮对话的表现上是非常弱鸡的,直观感受就是记不住前面的话,容易变的错乱。在这样的情况下大家还愿意和他聊这么多,可能说明,如果一个bot,人们愿意把它当成一个人,那么投射进去的情感,会让人忽略掉一些明显的缺点。

在上线后不久,我加入了一个问卷,询问大家觉得这个聊天bot如何,60%的人觉得它很不错,有人认为它很狡猾

 

 

有人认为它答非所问

还有人和它对骂,觉得它骂的不够狠

 

这些调研让我对优化有了一些更明确的方向,例如多轮对话能力,逻辑性,更好的记住知识,当然,之前的训练方式已经很难做更多优化了,我会用一些新的方式来做探索,其中之一是强化学习,我改动了一下聊天的网页,每次你发一句话过去,它会回两句,需要手动为回复来投票。

通过这种方式,我可以搜集更多的人类监督投票的数据,从而优化模型的表现,在多轮对话和知识记忆上,也有新的方法,不过我还拿不准。

这篇文章,除了告诉大家一下后续之外,也希望邀请大家再去和它聊聊,并且多投票,这样,一段时间之后,我就有更大把握把它做得更好。

 

聊天地址:DK数字分身 (greatdk.com)

我用我的微信聊天记录和 280 篇博客文章,做了我自己的数字克隆AI

By: DK
7 April 2023 at 13:09

除了开飞机,做出完美的烤肋排,获得6块腹肌以及让公司赚大钱之外,我一直以来也想做成的一件事,是实现一个聊天机器人。

和多年前简单通过关键词匹配来回复的小黄鸡,到现在已经堪比人类智慧的 chatgpt,聊天AI一直在进步,但他们和我想的都有一些区别。

我在微信上和很多人聊天,有的人聊得多,有的人聊的少,我在群里也会说话,我还会写博客和公众号,我会在很多地方留下评论,我也会发微博,这些是我在网络世界留下的痕迹,某种程度上这些东西构成了世界对我的认知,从这个角度上,也就构成了我。将这些数据——我对不同消息的回复,我写的每一篇文章,每一句话,我发过的每一条微博等,全部汇入一个神经网络模型之中,去更新其中的参数,理论上就可以获得一个我的数字拷贝。

从原理上,这和对 chatgpt 说“请扮演一个叫小王的人,他的经历是XXX”不同,虽然以 chatgpt  的智慧,这样的扮演毫不费力且可能以假乱真,但其实 chatgpt 的参数并没有改变,这更像是“扮演”而非“重塑”,chatgpt  的上千亿个参数并没有改变一个,它从你之前的文本中获取一些信息,然后用它的智慧来应对你。

我喜欢在文章里写一些没有太大用处的比喻,并喜欢在最后做一些总结,跟人聊天的时候,我喜欢用「可以的」来敷衍,同时用卧槽来表示惊讶,我某些时候少言寡语,另一些时候则滔滔不绝,这是我自己能够感知的一些特点,此外还有更多我自己都无法察觉的固定习惯,但这些微妙又模糊的东西,我无法告诉 chatgpt,这就像你做自我介绍,可以介绍的很丰富,但和真正的你,依然差之千里,甚至有时候截然相反,因为当我们意识到自己的存在的时候,我们其实是在表演自己,只有在我们没有意识到自己的存在,而融入生活的时候,我们才是真正的自己。

在 chatgpt 发布之后基于兴趣去学习文本大模型的技术原理,有一种 49 年入国军的感觉,因为对个人爱好者来说,做出在任何方面或再细小的垂直领域超越 chatgpt 的可能性已经不存在了,同时它又不开源,除了使用,没有别的可打的主意。

但最近2个月出现的一些开源文本预训练模型,例如大名鼎鼎的 llama 和 chatglm6b,让我那个克隆自己的想法又开始蠢蠢欲动起来,上周,我准备试试看。

首先我需要数据,足够多且全部都由我产生的数据,最简单的数据来源是我的微信聊天记录和博客,因为没有完全清空微信聊天记录,从 2018 年到现在,我手机里的微信占了80G的储存空间,对此我一直有一种家里被人强占一块地儿的感觉,现在如果能把这里的数据利用起来,我会和这80G冰释前嫌。

 

我在几年前曾经备份过我的微信聊天记录,我又找到了当年使用的工具,是一个在 github 开源的工具,叫做 WechatExporter,链接我会放到文末,使用这个工具,可以实现在 Windows 电脑上备份 iPhone 中的手机微信的所有聊天记录,并导出成纯文本格式,这是一个需要耐心的操作,因为首先需要将整个手机备份在电脑上,然后这个工具会从备份文件中读取到微信的记录,并导出。

我大概花了4个小时备份,然后很快导出了我所有的微信聊天记录,其按照聊天对象,被导出到了许多个文本文件中

这里面包括了群聊和一对一的聊天。

然后我开始做数据清洗,大多数群我都是潜水比较多,我筛选出一些我比较活跃的群,此外还筛出了一些和个人的聊天记录,我和他们聊天很多,同时他们也愿意我把聊天记录拿来这么做,最后大概50个聊天的文本文件够我使用。

我写了一个 python 脚本,遍历这些文本文件,找出我的所有发言,以及上一句,做成对话的格式,然后存入 json,这样,我就拥有了一个我自己的微信聊天数据集。

此时我也让同事用爬虫爬取了我自己的所有博客文章,他爬完发给我之后我才想起来,我其实可以用博客后台内置的导出功能直接导出。博客数据虽然也很干净,但我一开始并不知道如何利用,因为我要训练的是聊天的模型,而博客文章是一大段一大段的话,并不是聊天,所以我第一次训练,只用了微信的这些纯聊天记录。

我选择了 chatglm-6b 作为预训练模型,一方面它的中文效果已经被训练的足够好了,另一方面它的参数是 60 亿,我的机器能不太费力的跑起来,还有个原因是,在 github 已经有好几个对其进行微调训练的方案了(我会一起列在文末)

考虑到我的微信聊天数据最终可用大约 10 万条,我设置了比较低的学习率,同时增加了epoch,在几天前的一个晚上,睡前,我写完训练脚本,并开始运行,然后我就开始睡觉,希望睡醒之后能跑完,但那个晚上我差不多每隔一个小时就醒一次。

早上起来之后,模型训练完了,遗憾的是 loss 下降的并不好,也就意味着12个小时训练出来的模型,并不算好,但我是个深度学习的菜鸡,能跑完不报错我已经谢天谢地了,所以我并没有感到失望,而是开始用这个模型来跑对话。

为了增加一点仪式感,我不想用 jupyter 笔记,或在黑黢黢的终端里去聊天,我找了个开源的前端聊天页面,略做修改,然后把模型部署起来,封装了 API ,然后用前端页面去调用这个 API,于是就可以实现比较像那么回事的聊天了。

请不笑话我,我用自己的 10 万条微信聊天记录,训练出的模型,以下是我和他(或者它?)的第一次对话

 

我又试了下,结果依然不是很好,我不是那种不优化到极致就不好意思拿出手的人,因此我毫不害羞的直接发给了几个朋友,他们给我的反馈是,有点像你,同时他们给我返了对话截图。

 

第一个版本,这个模型确实具备某些跟我比较类似的点,我说不好,但有一点这种感觉。

如果你问它,你哪里读的大学,或者你老家是哪里,它并不会回答出准确的信息,并且肯定说的是错的,因为我的聊天记录中并不会有很多人这么问我,从某种角度上,这个模型并不了解我,它像是一个克隆。

当我收到一条微信消息,内容为 A,我回复了 B,那么这里是有一些原因的,这些原因中的一部分,储存在我物理脑袋的七八十亿个神经元里,理论上,如果我产生的数据足够多,也许几千亿条,那么一个参数够大的人工智能模型,就能非常接近我的脑子,10万条也许少了一些,但也足以让模型的60亿个参数里改变一部分,使其相较于原始的预训练模型,更接近我一点。

此外它还有个更大的缺点,就是蹦不出来几个字,回答非常简略,这虽然符合我很多时候的微信聊天风格,但并不是我想要的,我想要它说更多话。

此时我忽然想到了我的博客,如何能把这些博客转换为问答呢,我想到了 chatgpt ,在我精心构造的 prompt 之下,它成功把我博客文章的一段文本,变成了多个对话形式的问答:

某些时候 chatgpt 会返回一些不符合格式的内容,所以我写了一个校对脚本,来将各种不符合规则的返回,统统修改为标准的json,且字段名不变。

然后我将其封装为一个接口,放在了香港的服务器上,并在我的电脑上写了一个脚本,把我的博客文章按照500字划分,拿去批量转成问答,受限于chatgpt的接口速度,我差不多又花了一晚上,才把我的两百多篇博文,转换成了差不多 5000 个对话数据集。

此时我面临一个选择,如果将博客对话加到微信对话数据集里去训练,那么博客对话占比太低,可能影响会非常小,也就是说跟之前的模型差别不大;另一个选择是单纯用文章的这些数据,去训练一个新模型。

我向 6pen 的算法老哥寻求帮助,在确定模型权重可以融合并想办法从他那顺到融合脚本后,采用了后一种方式。

5000个问答,训练速度很快,一两个小时就够了,下午我一边写文档一边瞅一眼训练进度,下班之前训练完毕,我开始进行模型的融合,让之前的用微信聊天记录训练的模型,和用我的博客训练的模型进行融合。

两个模型的权重可以自由配置,我尝试了多种不同的比例,考虑到模型收敛过程中 loss 还有一些反弹,我还尝试了不同步数的模型版本

我整晚整晚和这些模型对话,找到效果最好的,但我发现,我似乎很难找出来,这些模型,有一些不同的表现,有的会比较暴躁,有的像舔狗一样,有些特别高冷,有些则很热情,然后我意识到,某种程度上,这或许是我的不同面,这么理解虽然肯定会让搞深度学习,并对其中原理烂熟于胸的人嗤之以鼻,但不失一些浪漫。

最终我发现,聊天和文章两个模型,权重比为 7 比 2 ,且采用第 6600 步保存的模型,融合效果在更多时候,都要更好一点,当然也可能是那个时候已经半夜两点,我的判断力有所下降,但无论如何,我就把他确定为最终模型了。

我和他聊了很多。

很明显,他和 chatgpt 差的极远,没办法帮我写代码,或者写文案,也不够聪明,因为训练用的数据不包含多轮对话,所以多轮对话的理解力更差,与此同时,他对我也不算特别了解,除了知道自己的名字(也就是我的名字),我的其他很多信息,他其实并不能准确回答,但是,他经常会说一些简单的几个字,让我有一种熟悉的感觉,也可能是错觉,谁知道呢。

总的来说,现在存在的所有广为人知的文本大模型,都是用海量的数据训练的,训练过程会尽可能包含全人类所产生的所有信息,这些信息让模型的亿万参数得以不断优化,例如第2043475个参数增加4,第9047113456个参数减少17,然后得到更聪明的神经网络模型。

这些模型变得越来越聪明,但它们更像是人类的,而非个体的,当我用我自己的这些数据去重新训练模型时,我能得到完全不一样的东西,一个更靠近个体的模型,虽然无论是我产生的数据量,还是我采用的预训练模型的参数量和结构,可能都无法支撑起一个能够和我的脑子差不多的模型,但对此进行的尝试,依然非常有意思。

我将这个网页重新部署了一下,并在中间加了一层 serverless 做保护,因此,现在所有人都可以去试试和这个我的数字版聊天,服务由我的祖传V100服务器提供,并且只有一台,所以如果人多的话,可能会有各种问题,链接我会放在最下面。

积极的,发自内心的产出更多的数据,就越有可能在未来获得更接近你的数字拷贝,这或许会有一些道德,甚至伦理问题,但这是大概率会发生的事情,之后我的数据积累的更多,或有更好的预训练模型,训练方式,我可能随时都会重新再次尝试训练,这不会是一个盈利,或任何跟商业沾边的项目,这某种程度上算是我自己追寻自己的一种方式。

这样一想,人生似乎都少了一些孤独感。

 

我的数字克隆在线聊天:https://ai.greatdk.com

我使用和参考的项目:

 

这个世界变得更精彩,但好像也更无聊了

By: DK
17 March 2023 at 16:54

那是一个下午,办公室的咖啡机坏了,我在楼下买了一杯厚乳拿铁,上楼后发现同事都出去吃午饭了,我一个人坐在窗边的工位上,升起的阳光正好覆盖在了我的电脑屏幕上,浏览器的文字都变得模糊起来,我眯起眼睛,试图看清屏幕上的字,依稀能看到我的代码编辑器,正在用 post 方法请求 openai 的接口,header 里的鉴权还空着,等着我写入 API KEY,光标就在此处闪烁,然后我长呼了一口气,第一次有了这个感觉。

从去年 4 月开始做 AI 绘画的产品(也就是 6pen )开始,我一直处在兴奋状态中,连人都胖了5斤,我带着团队充满干劲的打磨产品,探索新的模式,研究新的技术,三天两头就跑一个新的什么 AI 模型,看论文,看行业最新的分析,看哪个大厂又出了个什么好玩意儿,看哪些噱头包装的多好,然后我们的产品也获得很多的用户的反馈,数据的增长,各种各样的靠谱的不靠谱的合作。

我和很多人一样相信,我们在一个新的时代拐点上,我们将见证并亲历这次如有如互联网的诞生,移动互联网的诞生,甚至蒸汽机的诞生一般的变革,并可能有幸参与其中,如果说 AI 是一锅热油,各行各业都是要被油过一遍的食材,那我们就是姜蒜末,除了油本身之外,是最先感受到油的温度的那一批,而现在,大家都被倒了进来,噼里啪啦,很热闹。

图片生成和文本生成,则像 AI 巨人的两条腿,奔跑着迈过人类用自身构筑的脆弱的堡垒,向更深处前进。

从去年开始,许多美术工作者将会被 AI 替代的说法就不绝于耳,但始终像一个传闻,今年情况则骤然转变,我身边就有不止一例因为 AI 带来的效率提升而失去工作的例子,技术发展的不确定性依然存在,但唯一确定的是,这只是一个开始。

没有任何人能够嘲笑美术工作者,因为没有人能不被影响。

代码能被 AI 很好的生成,产品需求可以被 AI 很好的生成,翻译是 AI 的绝活,写文章,故事,发言稿是 AI 的拿手戏,新闻摘要编辑,投资决策,市场分析,法律咨询,对话,发明新菜品,写论文,参加考试,这些我提到的和没提到的,在目前其实已经超过人类的平均水平了,达到人类的顶尖水平也只是时间问题,这样一来,有哪个职业,哪个行业能幸免遇难呢?

汽车替代了马车,但是让人类的生活更好,也带来了更多工作机会,这是一个绝好的,证明我们不应该忧虑的例子,我其实是部分同意这个说法的,甚至在一开始,一些朋友向我表达担忧的时候,我也是举这个例子来回复对方,但现在我觉得情况并不是这么简单。

我是热爱并且积极拥抱这些最新最酷的技术的人之一,但我猛然想到,那些不那么乐意拥抱新技术的人,就一定要被淘汰,这也是让人挺不舒服的一件事,某种程度上这有点像被新技术绑架,有些人乐于被绑架,那其实挺好,有些人不那么乐意被绑架,于是只能不开心的拥抱,或者逐渐失去自己的位置,这其实挺让人难受的。技术发展的这一点,无可指摘,但确实悲悯。作为乐意被绑架的人,我们也没有任何理由幸灾乐祸,因为这次,这个技术,我们乐于被绑架,下次呢,下次万一我们甚至连被绑架的资格都没有呢?

另一个和之前不同的地方则是,生成式 AI,不是让人跑得更快,跳得更高,力气更大,或者憋气更久的什么东西,它是关于创造的,是关于艺术的,某种程度上,我觉得这些可以称之为人类的意义,我不能说,我们在创造一种技术,来毁灭我们存在的意义,这么说肯定夸大其词,但我确实有在想,如果未来的某一天,AI 代替我们思考和创造,我们还剩下什么,所谓的 prompt 的艺术,其实也只是在 AI 还不够完善的时候,一种中间形态而已。AI 会释放人类的创造力,还是毁灭人类的创造力,好像还真的说不好,因为人虽然有无穷的创造力,但是也很懒。

生产力的无限提高,只有一个结果,就是不需要生产。

baye 是我敬仰的一位开发者,他也是著名的短信拦截应用熊猫吃短信的开发者,他前不久快速做了一个 iOS 的 app,实现了chatgpt 的第三方客户端,这成为了他数据上最成功的产品,但他在推文中写到「我一点感受不到兴奋和鼓舞。这是我做的最没技术含量或者说没有我个人烙印的产品了,就是一个 api wrapper 而已。我只感受到了热点的力量,没有感受到我的力量。这种感觉让我很是迷茫。」

我知道的不少更资深的开发者,因为类似的原因,反而不如很多雄心勃勃的新手,AI 成为了一种武器,你只能选择使用或不使用,使用之后,个性和特点将被磨的更平,当然不会完全消失,但正因为 AI 的强大,边边角角的巧思显然会完全被那些绝佳的,生成的内容给盖过,以至于更难被人们注意到。

我不是想说技术的坏话,毫无疑问,底层大模型的开发者研究人员,是真正在推动人类向新的阶段迈进的,这是某种必然,但我们之后会迎来一个怎样的世界,我觉得说不好,我们也应该更谨慎一些。

小时候我常常幻想未来生活在一个科幻的世界,星际旅行,时空穿梭,瞬间移动,发射激光波,这个世界显然没有到来,但用另一种方式,现在的这个世界,似乎更加科幻。

这就是我那个下午想到的,然后我喝完咖啡,继续工作了。

在AI替代画师或者写手之前,可能会先干掉做AI的工程师自己

By: DK
20 January 2023 at 11:09

最近几个月,以深度学习和神经网络为主导的 AI 技术正在席卷全球,人们发现 AI 会画画,AI 会写文章,会回答问题,还会解决问题,虽然诸如推荐算法,计算机视觉等 AI 技术其实早已改变我们生活了,但生成式 AI 所展现出的那种创造力,还是几乎让大多数人在惊叹于其神奇后,或多或少的感觉到了一丝隐忧,甚至恐惧。

我过去半年多都在做 6pen,但主要职责是产品,我对 AI 一窍不通,但一直以来,我对它的好奇从未减弱,大约 2 个月前,我下定决心,开始比较正式的学习深度学习和神经网络,并越来越被它的趣味和魅力吸引,于此同时,这个行业也在发生着快速和惊人的变化,我觉得这个时间节点非常微妙,它可能代表这一次转折,因此决定写这篇文章。

这篇文章会分成三个部分,第一部分是对深度学习的原理做简单的说明,这背后其实比很多人预想的要简单很多,了解原理有助于我们了解它的可能和局限,以及部分的实现技术去魅,然后,我会解释为什么我会觉得 AI 最先替代的,可能是 AI 工程师,最后,我会写一下对这个行业的个人拙见。

 

深度学习原理说明-上小学的侄子说他能看懂

对于人工智能,我们知道它能学习,学习了之后它可以识别图像,可以判断对错,可以生成文本或图片,但这个学习到底是什么,又是怎么学的,则是很难理解的,毕竟它没脑子,只是硬盘,GPU和内存。

对人工智能如何学习的理解,我认为是理解这项技术的关键,而这其实可以用小学数学去解释。

我们可以在坐标轴画一条线,y=x,这条线就像这样

我们如果加个参数,例如 y = 2x,那么这条线就会发生变化,变陡一点,如果我们再加个参数,例如 y = 2x +4,那么这条线则会上移一点,看上去是这样

这没有什么难的,但不管你信不信,这就是深度学习的原理了。

y=2x+4,可以看作是一个输入和输出都是一个数字,有两个参数的神经网络层,对于其中的 2 和 4 ,我们可以不断变化,来改变线的斜率和位置,这个过程就是学习。

学习的过程有点类似于用一种笨办法”解”方程式,数据集就是一些x和y的值,例如(x=1,y=6),(x=2,y=10),(x=3,y=14),开始训练之后,模型会随便设置这两个参数,比方说 y = 5x+102,这样一算,x=1的时候,y居然等于107,比数据集中的(x=1,y=6)大太多了,于是模型会把参数调小一点,比方说y=4x+50,这样再算,x=1的时候,y=45,还是太大了,于是模型再把参数调小一点,直到调到y=2x+1,结果发现,这样似乎算出来的y又太小了,于是模型再把参数调大一点。

这里面包含了神经网络深度学习的所有东西,首先是一个模型结构,我们已经设定成了y=ax+b,a和b是两个参数,然后模型会尝试不同的a和b,看差多少,这个看差多少的部分,叫做损失函数,然后,模型又会调整一下a和b的大小,负责调整的部分,则叫做优化器。

真实的神经网络,哪怕是最简单的层,也显然不会只是一个二元一次方程,它会比我们看到的更复杂一点,例如这样

并且它具备很多层,每一层的输出,都将作为输出,传递给下一层,一个神经网络可能有50层,甚至更多,也可能只有几层,这取决于人们想用它解决什么问题。

但总的来说,这就是深度学习 神经网络的大致原理了。当我们的模型只有一层,且只有两个参数的 时候,我们只能得到一个数字,并且它很难有什么实际作用,但是当我们有上百层的模型结构,并且参数有1750亿的时候,事情就变得不一样了。

一个数据集中的样例可能是这样:输入是“你觉得老友记怎么样 ”,输出是“很棒,这是一部非常经典的美剧”,当然,这些句子都预先被某种方式转化成了一大堆数字,所以可以被各个方程式拿去计算,通过调节这一千多亿个参数,比方说第6428412456个参数,增加2.3,第5834728834个参数,减少9,当然这是我瞎写的,实际上有成千上万张显卡,用极其庞大的算力小心翼翼的调整这一千多亿个数字,试图让模型的输出,很接近我们给的数据集的输出。

同时,数据集也有数以亿计的样例,这些样例一次又一次的被模型用来调整自己的这一千多亿个参数,最后达到了一个比较好的效果,这样,在我们给一些数据集所没有的输入的时候,模型将有较大概率,能给一个看上去依然不错的输出,这个时候我们就说训练好了,或者用更专业的说法,收敛了。

我需要说明的是,事情远比以上的描述更加复杂,但原理确实就是这么简单。

我想我们不可能通过阅读几篇科普文章,就去干那些苦学了五六年才毕业的医生们做的工作,但我们至少要知道,生病的治疗方式可能是住院,补液,吃抗生素等等,而绝不会是吃水银,放血和跳大神。同样的,知道深度学习的大致原理,离着手从事相关工作,也有非常非常遥远的距离,但我们至少知道,噢原来是这么一回事。

 

 

为什么 AI 工程师可能是会被最先替代的

在几年前,或者更早一点的时候,模型不会太大,也不会有一个放之四海而皆准的模型,即便是新的模型结构或者方法被提出来,也需要许多不同领域的 AI 工程师,用自己所在领域的数据,来 finetune(微调)这个模型,甚至自己修改模型结构,尝试各种各样的优化办法,才能达到为自己所用的目的。

经验,技巧,和一些独家数据,在这个时候都是有用的,甚至很有用,学术界和开源界都乐于发现和创造新的模式,结构,然后无数个领域的 AI 工程师,在此基础上进行大量的优化,训练,从而让一个学术概念,变成能解决实际问题,创造价值的新模型。

在这个时候,提出一个模型结构,或进行创新,依赖的更多是人的智慧,包括了巧妙的思考,对数学的理解,以及一些运气(但不多),因此,有才能的人,包括学者,研究人员,以及一些杰出的工程师,乐于分享他们的研究成果,各个领域的公司里的 AI 工程师,则会将这些成果转化会实际需求的解决方案,某些时候,在学术成果解决实际问题的时候,会产生新的问题,或者诞生新的方法,而这也会很快转化为一个新的学术成果,被大家了解。

由此,一个活跃,繁荣,不断互相推动向前的行业(结合了大学,研究机构和商业公司),在过去的许多年里蓬勃发展,新的概念,理论层出不穷,虽然很难被圈子之外的普通人或非技术人员了解,但任何人把头探入这个圈子时,都会被其活跃的氛围所感染。

大模型,尤其是LLM(大语言模型)的出现,让这个配合良好的系统首次出现了一丝裂纹,大模型,顾名思义,就是参数特别特别多的模型,一个参数,如我们上面所写,是一个数字,在计算机里,一个数字会占用4个字节,那么1000万个参数,会占用4000万字节,这大约是38M,听上去还好,相当于一个小视频,但参数如果增加到比方说60亿,那就会占用22G的空间,由于参数是会被计算,随时变化的,所以放在硬盘甚至内存里都不够快,需要放到GPU的显存里,60亿个参数,需要显存22G以上的GPU才能运算,这已经有点贵了。

而我们熟知的 GPT3,是 1750 亿参数,光是凑够能够把这些参数全部放下的显卡,已经非常昂贵了,但这只是放下,如果还要进行训练,即让这1750亿参数进行很多变化,来找到更好的组合,则对应的算力成本可以称得上是天文数字。

这个成本个人研究者肯定无法承担,即便是中小公司,研究机构,大学,也依然难以承受。

对于行业的很多研究人员来说,这是第一个问题——拿到这样的大模型,似乎很难做优化,或者做研究,因为首先根本没钱把它跑起来(即便它开源),其次即便能跑起来,把它优化的更好,也需要比以往多得多的数据,这个数据在某种程度上更难获得。

这有点像我们养宠物,你可以在家里养猫或者狗,你家肯定放得下,你随便找点吃的,也饿不着它们,然后你可以训练它们坐下或者绕圈圈,大模型则相当于一只霸王龙,体重七吨,长12米,就算你把家扩建了,勉强能放下,喂它吃饱也很困难,这样还怎么训练它转圈圈呢。

紧接着而来的是第二个问题,随着大模型的参数越来越多,大模型的效果也越来越好,好到甚至让人觉得不可思议,不仅如此,这些大模型见了鬼,居然在每一个领域,效果都那么好,例如传统的文本生成模型,会根据擅长的任务分为聊天,问答,摘要,翻译,情感分析等等,并且在每个专业领域,例如互联网,金融,医疗,都需要额外再做一些特殊训练,才能取得比较好的结果,但 chatgpt 出现之后,它不需要做任何处理,也不需要做额外训练,就超越了绝大多数(或者所有)传统的文本模型,且无论是在聊天,问答,摘要,翻译,还是别的什么任务,也不论是在任何领域,它都更好。

第一个问题意味着人们对大模型做任何事情,都要付出非常昂贵的代价,第二个问题,则意味着即便你付出昂贵的代价,也不一定能获取更好的结果,虽然我们现在很难说这些大模型真的就能比得过所有通过预训练-finetune(其他优化)产出的模型,但应该没有人会否认,这的确是大势所趋,可能在某些极其细分的领域,有一些模型在特定任务处理上比 chatgpt 更好,但我们都知道,这很快就会被改变。

第三个问题则是,因为大模型的开发极其昂贵,大模型的效果又非常好,所以。。它往往就不开源了,不开源的背后也有另一个原因,如果开源,往往需要对数据集做出说明,而大模型的数据集往往庞大到超出想象,对这些数据的来源,合规,隐私做出合理的说明,显然是很困难的,所以闭源是最简单的处理方式,闭源的大模型,通过出售 API 或周边服务,反而能有更大的商业想象空间,虽然和其训练成本相比依然很难说是个赚钱的买卖,但这个想象力和因此而来的可能性,至少已经让微软愿意掏腰包了。

在这样的背景下,90% 的 AI 工程师将会处在比较尴尬的位置上,因为他们努力所解决的问题,用大模型会解决的更好,而大模型也没有微调,优化,或做别的什么底层处理的必要了,就只有用和不用的选择而已。

绝大多数 AI 工程师没有千亿参数大模型的调教经验,也很难有这样的机会,这会让数据飞轮(更多人用,效果更好,效果更好,更多人用)前所未有的集中在极少数的那么一两个大模型上,从而让它们和别的模型拉开越来越大的差距。

在我们担忧 AI 绘画替代画师的时候,其实画师是没有那么容易被替代的,因为即便是刚入门的画师,也可以有远胜于最先进的 AI 的可控性,更别说艺术风格的创造了。其它的一些“AI替代”说也有类似的情况,所以虽然隐忧重重,但还不是那么快会发生的事情。

更快会发生的替代,可能是 AI 工程师,尤其是非顶级的,没有大模型调教经验的 AI 工程师,因为在暴力的大参数,大算力,大数据前面,个人经验,技巧甚至某些行业数据,都很难与其匹敌,而由于大模型的成本,和不开源的特性,连做这些尝试的可能性也被无限降低了。一个更接近通用的人工智能,正在马不停蹄的向我们赶来。

 

好事还是坏事

首先我觉得我们肯定不需要为 AI 工程师们操太多心,因为他们本来就是世界上最聪明的一群人,他们都有极好的教育背景和工程能力,放到任何地方都可以发光发热,另一方面,我所写的,可能也有局限,或者在未来被完全打脸,这是有可能的,人类智慧永远是给我们带来惊喜的原动力,如同量子计算可能会让之前牢不可破的加密方式被轻松破解一样,反过来,石破天惊的算法或结构创新,可能也会让大力出奇迹的大模型再次落后。

看上去,大模型的流行,会让我们这样的上层的应用开发者和公司获益,因为无需自己搭建和优化模型,可以以相对低廉的成本(模型的创造和训练很昂贵,但使用不那么贵,且因为用的人多,成本还可以进一步降低),使用最先进的技术。

但从另一个角度看,在这样的生态中,无论是做应用的开发者,上层应用,还是用户,其实最终都会成为大模型的养料的一部分,它在不断进化,我们对其了解却越来越少,最终可能会有的局面是,其他公司和开发者只能选择用或不用,而不用就会落后于所有竞争对手,这种情况发生时,其实也就意味着所有开发者和公司已经没有别的选择了。

而此时的大模型持有者,则会成为某种意义上的极权,它可以制定任何规则,它可以凌驾于商业,道德,甚至法律之上,因为那个时候我们已经对其极其依赖了,就像我们依赖今天的互联网一样,但所幸互联网不是任何一家公司的,它属于全人类。

话说回来,比如说人家openai,花了十亿美金训练出来的模型,非要让人家贡献给全人类,好像也不太合适,在模型之外,背后还是商业规则,如果我们能让被贡献给全人类作为知识的大模型的开发者,获得比自己闭源,只是拿去卖API多得多的收益,那么,才有可能有人把大模型搞出来,然后开放给所有人,也会有更多的钱进来,支撑起越来越昂贵的模型的创新。

现在我们处在这样一个节点,花最多钱做的大模型,效果确实是最好的,也确实是闭源的,它已经好到让人震惊的地步,但目前也还没有被完全让人依赖,与此同时,一些别的努力也在进行,例如huggingface 做的 bloom 大模型完全开源,stable diffusion 也完全开源,目前来看,闭源的大模型仍然牢占上风,开源行为获得了广泛的赞誉,和大量不遵守开源协议的的使用,这某种程度为整个行业带来了繁荣,但这繁荣是否能反哺开源大模型,让它和闭源大模型有一战之力,则依然有待验证。

技术本身可能没有对错之分,开放和封闭,都是一种策略,而这背后,都有人类智慧的体现,但假如要让我来做选择,我肯定希望,我的选择,最终不会让我没有选择。

 

记一次解封

By: DK
27 November 2022 at 22:29

我所在的小区,在11月19日突然发了一则公告,大意是因为小区内有阳性病例,所以要封锁5天,只进不出,同时整个小区全部变成高风险,五天后,也就是11月24日,封锁没有解除的迹象,小区群内流传着一张新的通告,通告中写「因为疫情形势非常严峻,24日至27日实施为期三天的临时管控」,但这则通告的落款并非任何部门,是小区名字后加一个「疫情防控办公室」,显得似乎有一些可疑,但无疑的是,我们在第一个六天后,还将面临至少三天的新的封控。

在封锁的这几天内,每栋楼楼下都有两个穿白色防护服的工作人员,24小时都有这么两个人在楼下,我观察到,他们既非医护人员,也不是警务人员,其中一个是一个大爷,喜欢喝茶,喜欢抽烟,把一楼电梯厅弄的烟味很重,另一个是个年轻点的人,偶尔会把防护服的帽子脱到脑后,去门口吹冷风。

封控的这几天,我偶尔会下楼扔垃圾,拿买的菜,菜会由另一些穿白色防护服的工作人员从小区门口拿到每栋楼里,严格意义上来说,我拿菜是不出楼栋的,但扔垃圾还是要出去,所以我每天还是会出去透口气。

我从美团或永辉线上买菜,前两天的时候,还可以随时买,不过要五六个小时之后才会送到,第三天后,除非在凌晨12点刚过的时候立刻下单,否则就无法下单了,因为只需要几分钟,就会将这些平台未来1-2天的运力全部占满。

我定好闹钟,连续2个晚上在12点刚过的时候下单了一堆食材,全部记录到囤饭饭里,然后终于有了一些安全感。

26号,也就是原定三天封控的前一天,没有任何动静,中午我在小区群里看到,有人隐晦的发言,表示下午两点,大家可以去小区门口,我们合理的表达自己的诉求,争取解封,据此而新建立的一个微信群,名字都叫「合理诉求」。

一点五十,我下楼扔垃圾,扔完垃圾我有点想直接往门口走,但眼瞅着两个白卫兵似乎在远处看我,我怂了一下,于是绕到楼后面,从楼后的小路走到了小区门口。

小区门口零星的站了几个人,在我走向他们的时候,周边的楼栋高层不时传出解封的吼声,以及一两声别的什么听不出含义的吼叫,今天的阳光比前几天更温热一些,空气也很好,但有一种山雨欲来风满楼的感觉。

离门口很近的一个楼,楼门口的门被关上了,但里面挤满了人,两个白卫兵把守着门口,不让里面的人出来,我旁边一个女生走过去大声问他们,你们想出来吗?他们不让你们出来吗?我和几个别的外面的人一起走到那个楼的门口,外面的人大声对立面的人说,出来,出来,出来。

里面的人在试图推开门,没料到其中一个白卫兵居然直接用一块木板,把门闸上了,他的做法引起了一阵更强烈的不满,但与此同时,居然有很多人,从另一个门出来了,大家又发出一阵欢呼,我回过头看原来的那扇门,居然也神奇的打开了,里面的人也鱼贯而出。

再加上其他楼里出来的人,此时外面大概站了二三十个人。一篇文章二三十的阅读量很低,但二三十个人站在一起,还是很有分量,大家聚往小区门口,那里有一道栅栏,栅栏外是几辆警车。

站定后人群开始高呼,解封,解封,解封,除了我们这群在外面的人,楼栋高层也传出同样的喊声,我身边一个女生抬头对上面叫道,下来,下来,下来,又有一个嗓门大的男生跟着喊,下来,人多力量大。

我们小区分为南北两个区,中间有一条小巷隔开,我在北区,和我们隔街相望,南区也聚集了很多人,挤在他们那一侧的门口,而中间则是几辆警车,几位警察,以及穿防护服的人,大概有十多个人。

在我们高喊一阵儿之后,有个警察过来跟我们对话,他是附近派出所的所长,我们这边拿出二十条之类的规定据理力争,对方说情况他们已经了解,相关部门的领导会在2点半过来,跟小区代表对话,大家可以回家了,当然没人同意回家,几个嗓门大的喊,我们不回去,就在这解决,众人附和。

此时是两点十分左右,我回头看了一眼,身后的人多了很多,大概七八十个,再加上南区,可能有接近两百人了。

两点二十五的时候,所谓的领导还没有来,众人时不时又叫一遍遍的解封,突然,南区出现一阵骚动,南区隔离的蓝色铁皮发出咚的一声,所有人都为之叫好,然后又发出咚的一声,大家又叫好,随之铁皮出现了一个弯曲的缺口,然后被很多双手和脚推的更加摇摇欲坠,然后砰的一声,整个铁皮都倒了,大家爆发出巨大的欢呼,南区的人流随之涌出,我们北区这一边,也开始推开栅栏往外走,两股人群在小巷中央,汇合了。

汇合的人群发出出更大的声音,这时候,不知名的领导来了。

领导穿蓝色羽绒服,有一点年纪了,头发白了一部分,他和派出所所长商量了几句,然后对我们说,最新的通知是,除了有阳性的5栋楼:XXX,XXX,其他的楼,大家回去测一遍核酸,然后明天解封。

这是我们第一次知道,阳性所在的楼具体是在哪几个楼,同时也知道了,原来剩下的十几个楼栋,其实都在遭受无妄之灾,按照二十条的规定,没有阳性的楼栋,不应该被划为高风险,但这个小区二十几个楼,在过去都被划为高风险,且完全被封控。

但大家并不满意,因为承诺是没有任何保证的,有人喊,不回去,不做核酸,解封。

事态到这里有点僵持住了,我感觉他们也不敢也没有能力直接告诉我们可以现在解封,于是又开始商量,人群等待了十几分钟,可能更久,大家按耐不住,有人大叫了一声,起~来~,然后人群开始齐声唱起了国歌,唱完后似乎得到了某种力量,开始往前走,我们走一点,他们就后退一点,这样一点点走到了小巷最外侧的那道最后的栅栏。

在往前走的时候,两侧的围墙,以及更远处的楼栋的高层阳台上,也布满了人,有人对他们喊,出来跟我们一起,你们愿意做一辈子的懦夫,还是十分钟的英雄?这句话可能过于中二了,以至于没有人回应,但随即有个洪亮的声音从不知道哪里发出,我们不想做英雄,只想做一个自由的普通人。

警察和其他工作人员并没有阻挡人群的向前,一退再退,人群越过最后的那道栅栏,眼看有游行的趋势,有谨慎的人赶紧喊大家,差不多就回来,别走太远了,我们的诉求是解封。

有关部门的领导感觉下定了某种决心,对大家说,我现在就调人!我现在就调人!现在就做核酸,做完明天就解封。

一部分人得到这个较为确凿的答复,已经比较满意,还有一部分人坚持,不做核酸,直接解封。

但人群在这个时候开始有了分化,并且开始互相劝说,半小时后,一辆考斯特开过来,下来了一些医护人员,走到小区里开始支起了简易核酸点,虽然还有一些零星的不满,还有一部分人继续去了居委会,但最后大家也基本开始去排队,做了核酸。

第二天,我睡醒后立马打开手机看消息,小区内基本已经互通,但小巷最外侧的栅栏还在,但出入已经不会有人强行阻拦了,有的人早上已经去外面买了早饭回来。

下午三点,我骑车出去,和大家说的一样,栅栏还在,有一个似乎是保安的人在看守,我直接把栅栏推开,他没有做任何表示,然后我骑到了附近的超市,买了一些食材,本来还想去瑞幸买一杯咖啡,但周围的瑞幸和别的咖啡店,也都关门了,我去了711,买了一杯冰美式,然后骑车回了家。

到家后,大概五点,我看到群里有人发了图片,最外层的栅栏已经被正式移走,几乎所有楼栋也都被贴上了「解除封控通知」,车辆开始出入,小区终于,正式解封了。

回顾这次的基于合理诉求的解封活动,我依然觉得很值得被记录,我尤其记得在最开始,有两个嗓门大的女生,她们发出了第一声呼吁,得到了越来越多的响应,而在后来,她们的声音依然深刻在我身边响亮,另外我还注意,在人群行动时,有一对情侣,女生想往前走,被男生拉住了,他们互相说了几句,然后又一起往前走了。

坦白来说,我们这些聚集起来的人,其实是一帮乌合之众,没有组织或纪律,甚至没有牵头人或代表,诉求也不尽相同,经常出现前的人在对话,后面的人就瞎叫,结果搞的对话进行不下去的情况,但所有人的最底层的诉求是一致的,那就是要活下去,有尊严的活下去。

我们肯定不至完全活不下去,但也有人吃了四天泡面了,也有人一天只吃一顿饭,也有人抢菜经常抢不到,因此焦虑的睡不着,所有的大道理,比不过吃饭事大。

换个角度来看,即便我们是乌合之众,即便我们乱糟糟,乌泱泱的,许多人抱有勇气,另一些人则只是观望,也有怂的,焉儿的,但人群聚在一起,就真的有强大的力量,我们争取来了合法合规的解封,也拿回了吃饭的权利,有尊严的活着的权利,在我们之前,周边就有别的零星的小区,也用这种方式得到了解封,在我们之后,还有更多小区也会得到本来就不应该剥夺的自由。

当然有运气的成分,我甚至觉得那个派出所所长对我们是能够有一定程度的理解的,最激烈的冲突也未升级成真正的肢体对抗,而现在依然不知道身份的那个领导,也算是说话算话,把自由,虽然这是我们本应该有的,还给了我们。

但不管运气的成分,如果误以为我们这样的一群人不用拿出勇气,魄力和决心,就可以轻易取得了最后的结果,那才是真正的大错特错,在解封的第二天,小区群里果然出现了一种言论「去闹什么事,增加了危险,反正都要解封的,这不就解了吗?」

这是一定会有的言论,也一定会有人坐享其成却过河拆桥,但这不重要,重要的是总会有一群人,这群人始终会站出来,我们要和他们站在一起。

历时一年,我完成了人生第一场官司,并拿回了租房押金

By: DK
13 July 2022 at 21:16

去年 7 月,我从租住的房子退租,此前我已经在这里住了两年了,每次都按时交房租,从不拖欠,退租前,我把房间打扫的很干净,完全还原到刚入住时的状态。

退房的那一天,二房东没有到场,来了两个纹身小弟,看了一圈说不错,让我把合同留下,可以先走,押金之后会退给我。

我表示拒绝,说如果你要我留下合同,就先把押金退了,房子你也看了,没什么问题就退吧。两位小弟表示拒绝,然后陷入了僵持。

然后二房东给我打了电话,告诉我他需要核实我的水电燃气等欠费问题后,再把押金退给我,我告诉他你现在就核实,他告诉我说,我核实了,你制冷费和水费没有交,这俩加起来,我不仅不会退你租金,还要再收你 500 块钱。

在此我需要说明一下那个小区的情况,那是一个比较新的小区,水费一直没有机构收取,直到2021年1月,自来水公司过来更新了水表,然后开始收水费,此后我一直缴纳水费,无论是自来水公司的记录,还是直接打电话去自来水公司询问,都可以证实我住的房间并未欠任何水费。

冷气费则更为离谱,无论是合同,还是这个二房东,都没有说有冷气费这一回事,我住了两年了不知道有这个东西,后来我才得知,冷气确实由一家供暖供冷的公司提供,但这家公司因为和整个商圈,以及小区开发商一直未协商取得一致,所以一直没有制定价格,也没有开始收费。

我面临的问题可能比一般的黑中介赖押金更棘手一点,因为小区确实存在一些未知问题,但无论如何,不应该让这个二房东直接扣我的押金。

可想而知我和他的对话不会很愉快,最后我说,那就只有走法律途径了。随便你,他轻蔑一笑,然后挂断了电话。

我其实并没有真的想走那种最麻烦的法律途径,我首先打了住建委进行投诉,发现没啥用,然后还报了警,发现也没啥用,警察跟我说经常有人报警说那位二房东不退押金,他们去找他谈话几次了,一开始叫他退他还会退,后来就不退了,这个属于民事纠纷,他们没办法强制让他退。

我不得不考虑真正的,也是最后的法律途径,也就是法院起诉。

我在网上了解了一下起诉的流程,发现北京这边还挺方便,可以直接通过「北京法院电子诉讼平台」在线起诉,在网上就可以进行。需要写一份起诉书,填写对方的信息(从租房合同能找到公司,然后去查),你的信息,以及提交证据。

这里面有个需要注意的地方,法院选择离你最近的法院,因为你还是需要去几趟。

起诉状可能是唯一需要费点脑子的事情,通常来说这是律师的工作,但我很想自己试试,于是自己写了一个起诉状,其实写起来也很简单,把事情的来龙去脉简单说一下,并写清楚自己的诉求就行了,我大概写了500字。

然后就是提交证据,我把我能想到的证据都提交了,包括和二房东的聊天记录,缴费记录,物业通知,甚至还包括我去那个供暖公司跟客服询问有没有冷气费,怎么收费的录音也提交了。

然后就可以提交诉讼了,这个需要审核几天,如果有问题,会打回来让你改,我是改了两次之后,才终于立案了。

从提交到立案,如果不是要来回修改几次,其实是很快的,一周左右,但立案之后则有一个比较漫长的等待,然后,就是一个我称之为和稀泥的环节,也被称之为调解。

法院打电话给我,跟我约时间,让我去法院,同时也叫了对方去法院。我准时到了之后,有个大姐把我带到一个房间,仔细问这个案子的情况,二房东姗姗来迟后,双方对峙,而大姐则不断的和稀泥,先是对我说,那退你一半的押金行吗?然后问二房东,你多少退一点意思一下。

好在我和对方都绝不退让,大姐很无奈的样子,告诉我,那只能走诉讼流程了。

从调解失败到庭审,大概有 3 个月的时间,其中会收到法院传票,告诉你什么时候在哪举行庭审,是邮政送过来的,要本人签收,我收到后一看,居然是线上庭审。

这里有个小坑,线上庭审要用法院的客户端,而客户端不支持 Mac 和 iPhone ,也就是说,你必须要准备一台安卓手机,或者windows 电脑才可以。

12月中旬,我正好回了趟成都,在家里用我的备用机锤子手机进行了在线庭审,我妈则全程在旁边偷看。

虽然是在线庭审,但也有模有样的,法官应该还是在法院的某个房间里,他询问了双方信息,然后开始问一些问题,基本围绕起诉书和证据,作为被告,二房东摆出了一问三不知,答非所问,但就是不退钱的态度,中间还因为接了个电话掉线了,我和法官面面相觑,也不知道聊点啥,颇有点尴尬。

最后法官说择日宣判,然后结束了庭审。我妈说我觉得你肯定会赢,因为你说的有理有据,普通话还标准。

差不多10天后,我收到了判决书

收到这个判决书之后,我松了一口气,以为事情就这样结束了,但我果然还是天真了,我是21年12月收到的判决书,这上面写被告要在15日内执行,也就是给我钱,但对方没有任何动静,我一度以为二房东去上诉了,但问了法院,对方并没有上诉。

我又等了一个月,还是没有任何动静,然后我开始研究怎么申请强制执行,这个还挺麻烦,需要在电子诉讼平台新创建一个立案申请,选择执行类,并关联之前的那个案子,再写一个强制执行申请书,也就是你的诉求是啥,我这里写的非常质朴

 

创建完毕后网站的执行 tab 下会多出一个案子,是XX执XX号,状态为审核中

然后我就又开始了漫长的等待,直到 4 月份,这个案子的状态才变成「已立案」,然后又是漫长的等待,直到有一天我跟一个朋友聊到这个事情,她说你申请将对方法人列为失信人了吗,我说没有,她说一般申请强制执行要顺带申请将对方列入失信人,这样威慑会大一些,于是我在案子下面又提交了将对方法人列为失信人的申请。

然后又等待了一个多月,我突然发现案子的状态变成已结案,结案方式写着「执行完毕」,这下我知道有谱了,于是在网站提了工单询问法院,法院第二天给我回电话,告诉我已经执行完毕了,叫我下周去法院签字领钱。

也就是这周一,我拿着银行卡,背着小书包,大早上骑车去了法院,发现我不仅要拿回押金,因为对方一直拖着,还产生了一百多块钱的利息,也就是说我能多拿到一百多块钱。签完字后法院的姐姐告诉我,这两天就会打到我的银行卡,让我回去等着。

今天早上,我看了眼手机,收到了两笔转账,一笔是拖欠了一年之久的4400元的押金,一笔是113元的利息,二房东没有跟我说任何话,他的朋友圈依然在发着招租信息,但我想,他应该不敢再像之前那样轻视一个人说要走法律途径的严正告知了。

这就是我人生第一场官司,比我想象的容易,也没我想象的容易,其实任何事情可能都是这样。

 

准备好面对无常

By: DK
8 May 2022 at 22:24

如果那句著名的「2019年是过去十年最坏的一年,却是未来十年最好的一年」在最近听上去越来越靠谱,那么我不得不想到一个让人头疼的问题,现在距离 2019 才过去三年,未来七年还他妈会发生些什么?

今天我们怀念 2019 年,可是在 2019 年,大家却觉得这一年糟透了,2019 年的问题包括糟糕的气候变化,中美贸易战,极端组织的崛起,对科技巨头渗透生活隐私的担忧等等。

2019年6月,我的一个朋友在她的公众号「禅与宇宙维修艺术」发了一篇文章,标题为「我们差点就以为,一切只会越来越好」,阅读量为之前平均阅读量的十倍,似乎在那个时刻,许多人开始意识到,这个世界并不一定会越来越好,然而没有人能想到,几个月后,情况急转直下,坏到了我们根本无法预料的程度。

在某种程度上,很多事情不能全怪疫情,疫情是加速器,是催化剂,它让人在生存的斗争中卸下一切伪装,遮掩,从而让矛盾更具体,让碰撞更激烈,让丑恶更显露,但这些都是早已存在的东西,其实并不新鲜了。

我们这一代,乃至于 80 后,成长几乎顺风顺水,时代没有落什么沙,反而一阵风把许多人吹上了天,我们喝精酿啤酒,喝星巴克的冰美式,看新出的美剧,出国旅行,用3080玩3A大作,吃日料,吃米其林餐厅,在100层的写字楼穿梭,谈没有什么结果,也没有什么预期的恋爱,我们在高企的房价面前感到焦虑,但大多数东西,舒适的生活,丰厚的物质,上涨的工资,新的更美好的感情,我们丝毫不担心这些东西会消失。

但其实更早一点,从清末到改革开放前,我们的先人起伏的遭受了无数的苦难。

天宝元年的年轻人,沉浸在开元盛世的余韵中,又怎么会想到十年后的安史之乱,让唐朝由盛转衰,乃至覆灭,彼时大唐已经成立了超过120年,超过6代人延续其中,没人会想到战争和灾难会来的这么快。

杜牧很早就写了「后人哀之而不鉴之,亦使后人而复哀后人也」,似乎不从历史中学到教训,就会很快走上同样的道路,但历朝历代其实都很善于学习教训,例如光武帝反思西汉的教训,成果是「三纲」,唐太宗反思隋朝,得出的结论是「百姓无事则骄逸」,朱元璋反思元的破灭,得出的结论是「收平中国,非猛不可」

由此可见,一旦统治者开始反思,老百姓多半就要遭殃,当然原因不在于反思,而在于我们从历史中得到的总是片面的信息,且肉食者鄙,今天我们在搜集,分析,处理信息上比以往任何时候都做的更好了,但我们能让历史不再重复,或者至少让历史的悲剧不再重复吗?对此我是很悲观的,因为我们面临的也是前所未有的复杂棘手的问题。

有鉴于此,作为平头老百姓,我认为我们能做的,就是做好面对无常的准备——降低预期,做好财务管理,爱身边的人,学习生存技能,例如医疗知识,做饭,业余无线电什么的。

在社交平台,我越来越多的刷到一些实体店的老板,通过视频讲述最近两年的困境,我一度以为只是线下商业遭受重创,前不久我看到了多抓鱼的猫助的文章,我才意识到,许多对物流,仓储依赖比较大的线上商业,也承受了巨大的损失,这些损失是由疫情,疫情政策,市场规律,国际环境,资本共同造成的,很难找到一个「坏人」去指责「这些事都怪你」,但事情就这样发生了。

我的公众号注册在 2013 年,注册之后头像就没有改过,当时我大一,我清晰的记得,我之所以用这张图,是因为当时看到这张图下面的文字是「世界上只有一种真正的英雄主义,那就是在认清生活的真相后依然热爱生活」,我觉得这哥们儿说的话太酷了,大概两年后我才知道这句话是罗曼罗兰写的,并不是图上这个无名摇滚歌手说的,但我依然决定继续使用下去,因为他确实也挺酷。

假如生活的真相是美好的,那么我们认清生活的真相后依然热爱生活,就谈不上什么英雄主义了,这就好比说「你闻到了烤肉的香味后依然想吃烤肉」,不然呢?所以我想这句话的意思应该是生活的真相是残酷的,是悲苦的,是难以让人爱上的。

好的,现在我们已经开始接近生活的真相了,这时候我们还能热爱生活吗?我说不好,但如果热爱有点困难,那就先做好面对的准备吧。

❌
❌