Reading view

There are new articles available, click to refresh the page.

自深深处

奥斯卡·王尔德大名鼎鼎,但这《自深深处》是我读完过他的第一本作品。才华、学识,轮不到我去评价,但是人在情感上的脆弱和必然遭遇的悲剧,啊,我(作为一个社交场所的经营者)见的或许比王尔德还要多一些。所以大概读到五分之一,我已经知道他之后还会和波西纠缠不清——读完本书去查资料,果然得到证实:

妳辜负了我;妳错得离谱;反观我如何待妳;但我并不怨妳;我有自己的错;我独自一人扛下所有;我从过去中走出来了;我获得了新生;妳也可以;妳还要和我联系;我们可以从新开始。

不管才情如何,人总有些坎儿是过不去的,可能是因为事可能是因为人,总之,一时间陷进去就忘了自己之所以在这个坎儿里面意难平的真正原因,只有一个,就是:压根不应该在此处徘徊。那些人和事之所以纠缠着妳,不是因为它们珍视妳、离不开妳,而正是因为妳不属于它们。妳提供了一种让它们超脱日常的可能性,但那种可能性显然不可能也不应该变成它们的日常,否则一切就不再奇特不再超脱不再有吸引力。换句话说,妳的格格不入(包括格格不入所带给妳的痛苦)才是它们想要得到的、平凡生活里的调味。而妳却总期待着那些人和事「悟明」和「归正」……我也不能妄下判断说王尔德自己没能真正做到「悟明」,可能投身拯救爱人的事业,对于一个自视甚高的浪漫艺术家来说,太难抗拒了吧。


P.S. 我相信王尔德自恋的同时也诚恳地谦卑。以及,书中有一段写完自己在狱中受屈辱之后,随口说了句,出狱后一定要为改变监狱状况做点什么。我去查了查,他果然在出狱后用艺术家的方式比如给报纸写信抨击和呼吁、创作诗歌《雷丁监狱之歌》等,被历史学家和法学界认为直接推动了 1898 年《监狱法》的通过。总之,基于有限的了解,已经十分敬佩。

fin.

阅读不能替代体验

用不着我来告诉女儿,她大概早就认同这个观点。大学才上了一个学期,她已经用周末时间走了很多地方。不过所谓体验,也不局限于「行万里路」。去与人相处、去过真实的生活、去感受和思考,或许是更重要的部分,而阅读也只是补充和印证。

从某个时间点开始,语言模型经常会在回复中用到类似「这个问题我最近也时常会想」这样的话。人与人之间交流的时候,制造共鸣能拉近距离,所以可以理解,语言模型(被)加入这种措辞,模拟出一种彼此之间有相似经历的假象,以求让人感觉亲近。但正因如此,也让我对语言模型多了一分清醒的认识,它始终还不是智能,它(的创造者想)刻意模拟的,恰恰是它做不到的,只要它还没法体验人类的经历,这种输入输出就根本算不上交流。人如果没有足够的生活体验,即便读再多书,也只能像语言模型一样空洞——而且我们根本不可能读得像它一样多。

前几天刚读完的科幻小说《天渊》,结尾处写到一个文明在另一个文明的协助下从工业文明直接跨入了太空文明建立了自己的空间站,其中一个角色在内心感叹对方或许根本不知道自己在做的事有多么了不起。这让我想起一些朋友聊天时提到当下才明白年少时曾听到的教诲是多么有道理。我倒觉得没什么好懊悔的,凡事大抵如此,如果没有亲身探索和经历过更丰富的可能性,就很可能不自知。而以人类有限的寿命,能体验的还是太少了,幸好还可以阅读。

fin.

最需要阅读的年纪

二十多岁大概是我最「无知」的年纪,难道比幼儿期还无知吗?是的,因为年幼时保有着一项重要认识:承认自己对世界一无所知。而二十多岁时,刚结束持续多年的学校生活,那个一无所知的认识被抛之脑后了;这才是最无知的。

不过多年后追溯起来,所谓审美力,大概也就是在二十多岁时阅读、思考、梳理、沉淀得来的。就以我个人为例的分析而言,学生时代的阅读肯定也有效果,但是学业繁重往往没有充足阅读时间,而三十以后,人生境况的影响已经远超阅读可以改变的范畴。

想象一下,一个人在 35 岁时决定改变自己,这当然也是可能的,但是首先,不经历一些痛彻心扉,人们很难有这种要改变的决断;其次,要改变的方向,也很可能已经在更早的人生阶段里决定好了——认为更好但是各种因素导致一直没去走的方向。

也就是说,只要没有无知到自大、愚蠢地步,只要还能接受新的挑战,二十多岁是拥有低成本重塑自我的特权的年纪。方法就是阅读,多方面地阅读,兼收并蓄。不是尽信,而是提出自己的问题,挑战书本,也挑战自己的固有看法。在这个追问的过程中成长,是不是会更踏实呢?

写给我十八岁的女儿

fin.

天渊

不愧是文奇——妳可能听说过,技术奇点、赛博朋克,等概念就是由弗诺·文奇在科幻作品中提出的。出版于上世纪的《天渊》,其中「聚能者」的概念让人想到大语言模型:模糊的自然语言指令输入,得到像机器一样精确但又不完全是冷冰冰的机器语言;类似 RAG (Retrieval-Augmented Generation 检索增强生成) 的机器与人脑的结合方式;甚至连大语言模型擅长角色扮演,这种细枝末节都很奇妙地被言中了。除此之外,小说里还描述了头戴式视窗、墙纸系统等虚拟现实装置……但是,我总感觉,在现实中已经被实现出来的幻想,大概并不是未来。换句话说,未来可能是我们根本没想过的样子。至少我希望如此。

fin.

《史蒂夫·乔布斯传》带给我的思考

Reading

大概14年前,准确地说是在乔布斯去世后,我开始读《史蒂夫·乔布斯传》。这十多年来,也一直使用苹果系列的产品,从iPhone到iPad和Mac电脑,经常思考苹果产品背后的哲学。最近重读《史蒂夫·乔布斯传》,结合原文做了一些读书笔记,依然有不少收获。

科技与人文的交汇

乔布斯身上最突出的特质,是他站在科技与人文的交汇点上。懂科技的人往往缺乏人文精神,懂人文的人又常常不具备技术能力,而乔布斯恰好同时具备二者。他理解工程,也理解美学,因此他所创造的产品才会如此独特。无论是 Apple 的 iPhone 还是 iMac,都清晰地呈现出科技与艺术的结合:既具备强大的技术能力,又拥有高度一致、克制而优雅的审美。我们今天许多人过于专业了,稍微跨一个行业就完全没有才能了,理工科的人更需要美学等人文学科的结合。

出身、不安全感与偏执人格

乔布斯一生似乎始终缺乏安全感。他认为自己被父母抛弃,这种“被遗弃感”带来了愤怒,也塑造了他后来的性格。他后来一直在寻找亲生父母,得知自己有叙利亚血统。所幸的是,他的养父母对他不错。

他是一个极其固执的人,这种固执贯穿了他的生活方式。例如,他一生中实行过极端的饮食计划,只吃水果和蔬菜,后来身体状况并不好,最终罹患胰腺癌。他坚持不洗澡,身上常常有异味;他缺乏耐心;对印度禅宗极为着迷,由此产生了极端的饮食习惯,导致营养不良。

他的偏执还体现在所谓的“现实扭曲力”上——他擅长夸大事实,坚持按自己的规则办事。如果你相信他,你就能把事情做成;如果他认为某件事应该发生,他就会倾尽全力让它发生。

人品的复杂性与道德争议

如果从“人品”角度来考察乔布斯,他是一个极其复杂的人。他善于耍手段,也毫不避讳这一点。他相信“好的艺术家抄袭,伟大的艺术家窃取灵感”,并且坦然承认自己在“窃取伟大灵感”方面一直厚颜无耻。

他对人的态度同样冷酷而极端。当他异常专注于某件事时,会彻底忽略其他一切,甚至一度不愿意承认自己的孩子,因为他不确定孩子的母亲是否真的和他发生过关系。后来,他对自己年轻时的这些行为深感懊悔。

合伙人韦恩的选择与命运的悖论

乔布斯早期的合伙人韦恩,担心风险的他曾将自己持有的 10% 公司股份卖掉,最初得到 800 美元,后来又补偿了 1500 美元。如果这些股份一直保留,到 2000 年底价值约为 26 亿美元。如今,韦恩靠社会保险金生活,但他自己并不后悔。

乔布斯已经去世,而韦恩仍然在享受这个世界。究竟谁得谁失,并没有一个绝对的答案。

反物质主义的生活态度

尽管拥有巨额财富,乔布斯的个人生活却异常朴素、低调,家中陈设极其简单。他曾对自己许诺,不让金钱重新主导他的生活。他是一个反物质主义者,认为创业才是自己的历史使命。

但他同时又并非一个特别乐善好施的人,这种矛盾也在他身上并存得极为自然。

完美主义与对细节的偏执追求

乔布斯是一个彻底的完美主义者,拥有并坚持自己的审美品味。他善于学习、模仿并借鉴其他优秀产品的设计。在学校时,他曾旁听书法课,这个当时看似“无心之举”的选择,后来直接影响了苹果电子产品的字体设计,使其显示效果格外优雅。

他的完美主义不仅体现在可见部分,也体现在隐藏细节中。这一点可能源于他父亲的影响:即使是看不见的地方,也要把它做到漂亮。就像做一个衣柜,即便背板靠着墙、无人可见,也要用一整块漂亮的木头去完成。因为你自己知道它在那里。每一个细节都至关重要,最终的成果才配称为艺术品。

正因如此,他坚持软硬件一体化:软件为硬件量身定制,硬件也为软件服务。这一切都源于他对“控制权”的迷恋。

对用户、产品与市场的理解

乔布斯并不相信“顾客永远是正确的”。在他看来,顾客甚至不知道未来的产品是什么,只有你先创造出来,顾客才可能喜欢。顾客在看到产品之前,并不知道自己真正想要什么。这是一种超前的艺术。

他的产品哲学带有明显的“专制”色彩:一切都已经被设计好,用户只需享受成果即可。与之相对的是 Windows 所代表的自由开放体系,但自由也带来了效率问题,需要不断整合各种软件。

在自由与封闭的争论中,乔布斯始终认为:如果不能同时控制硬件和软件,迟早会受制于人。

东方智慧、极简主义与“少即是多”

乔布斯深受东方智慧,尤其是印度宗教哲学的影响。他的饮食癖好,本质上是人生哲学的外在体现。他相信苦行和极简会使人更加敏锐,匮乏即是富足,自律能够带来喜悦。

他理解一个多数西方人并不真正理解的道理:物极必反。他刻意避免对物质的执着,认为消费欲望本身是不健康的,应当过一种非物质化、不执着的生活,以实现觉醒。这些理念,都源自佛教修行信条。

对他而言,少永远意味着多——less is more,越简单越好。

对创新、年龄与好奇心的思考

乔布斯长期思考一个问题:为什么人在三十多岁以后会逐渐思维僵化、缺乏创新意识?而为什么有些人能终生保持强烈的好奇心,像孩子一样看待世界?可惜这样的人太少了。

他在四十五岁时,试图主动从这种思维固化中跳出来,就像跳出唱片中已经形成的凹槽。

对金钱、使命与伟大的看法

他说过:“我的未来不需要游艇,我做这些从来都不是为了钱。”他评价自己所持有的股票价值时认为,唯一的动机,是让世界因为有苹果而变得更好。他要通过创造足以令世人敬畏的传奇来获得满足。

因此,他无法容忍自己和他人的不完美,也不希望公司内部认为他回归苹果只是为了钱。他想创造伟大的产品,真正关心用户,并愿意为完整体验负责,而不是制造那些“别人已经在做的垃圾”。

关于热爱与工作的关系

在谈到热爱时,乔布斯说,做 iPod 是为了自己。当你真正为好友或家人做事情时,你不会轻易放弃。但如果你并不热爱这件事,就不会多走一步,也不会愿意在周末加班,而只会安于现状。

健康、癌症与现实扭曲力的代价

乔布斯自己推测,他之所以患上癌症,源于 1997 年一整年的高强度工作:同时管理苹果公司和皮克斯公司,两头奔忙,使他患上肾结石和其他疾病,甚至回到家后虚脱到说不出话。

在检查肾脏时,医生发现胰腺有阴影。医生建议他做胰腺检查,但他选择忽视。他不愿意接受手术和化疗,而是尝试各种替代疗法,吃草根进行治疗。后来,甚至连替代疗法和营养疗法的先驱医生都建议他手术,他依然回避。

他会刻意忽略自己不想面对的事情,包括健康问题。他相信自己可以把事情变成想要的样子,在健康问题上,他同样运用了自己的“现实扭曲力”。

对死亡的认知——向死而生

“记住自己终会死去,是我所知避免陷入‘失去恐惧’的最好方式。你已一无所有,没有理由不追随内心。”

这是他在斯坦福大学毕业典礼上的演讲内容。

封闭系统、权力与现实政治

iPhone 的电池是密封的,无法自行更换;应用程序必须遵循严格标准,通过苹果测试和批准,只能通过 iTunes(后来是 App Store)出售。他是封闭系统中最成功的创新者。

谷歌和微软则相信开放系统能带来更多竞争和可能性。乔布斯的立场始终是:控制意味着质量。

当年奥巴马总统想见他,他认为总统应当亲自打电话邀请,而不是安排象征性的会谈。他在与总统会面时毫不留情,希望政府对企业更友好,并直言在中国建工厂容易得多,而在美国,体系过于复杂。

他甚至公开抨击美国教育体系,认为教师应被视为专业人员,而非流水线工人;他相信电子教材会取代纸质教材——不免让人怀疑,这是否也与 iPad 有关。

对世界复杂性的承认

和许多天赋卓绝的人一样,乔布斯虽然并非在所有方面都同样出色,但他还是有利他之心,在美国知名企业家与总统聊天时,乔布斯表示:大家应当讨论什么对国家重要,而不是只关心对自己公司是否有利。

在与比尔·盖茨讨论两家公司截然不同的风格后,双方都互相承认:开放的横向模式可能胜出,但一体化的纵向模式同样可以做得非常出色。这个世界从来不是单一答案的。

最后的告别

在交出亲手创建的公司控制权时,他留恋地说:

“我有过很幸运的事业和人生,已经做了我能做的一切。”

——这或许是乔布斯对自己一生最冷静、也最诚实的总结。

世界读书日

【看看你读书达标了吗?#重庆成年居民人均阅读纸质图书4.2本#】4月17日上午,重庆解放碑,2024巴渝书市在十字金街正式开幕。开幕式上,《重庆市2023年全民阅读指数评估调查报告》(以下简称报告)发布。报告显示,2023年,重庆市成年居民人均阅读纸质图书4.2本,电子图书5.3本,听有声书3.6本,平均阅读量为4.76本。成年居民日均综合阅读时长为39.8分钟,较2021年增长1.8分钟。重庆市青少年群体日均课外阅读时间33.71分钟。重庆青少年最爱的三本书分别是《稻草人》《昆虫记》《小王子》。#2023年你读了几本书#?

这是微博前两天给我推送的消息,随手将其记录在了记事本里,感觉我可以就这个话题说点什么,今天据说是“世界读书日”(准确的说 4 月 23 日应该是“世界图书与版权日”),正好可以就这个话题聊一聊。

虽然不知道微博推送的这个统计数据是怎么来的,但可以肯定的是现在看书的人越来越少了,即便身边有人看书都是通过手机看书软件或者听书的方式来进行阅读,且很少听说在日常生活中有人讨论读书的话题。

大约十年前我还是很喜欢读书的,为此博客甚至还有一个分类叫作“阅读与光影”,目的就是为了来记录自己认真阅读过的书,到现在这个分类不知道已经荒废了多久了。

前些年通过订阅中国移动和中信出版社合作的咪咕中信悦读会员,每个月 48 元的话费有一张兑书券以及全场正版电子书免费读,但现实就是电子书一本都没读完过,纸质书虽然每个月都在兑换,都积攒了两个小书架了,大多数大现在连塑料薄膜都没有撕掉就放书架上吃灰了。

现在总是为自己没有读书找来各种的借口,平时不管是看长视频短视频都有时间,但就是找不出读书的时间。许久不读书的坏处就是现在博客都不会写了,甚至不能用一段文笔通顺的话来表达自己心中所想的事情。

2017 年 1 月 18 日的时候在 iPhone 的备忘录里写下了 “书店之死”的标题,并且理了个提纲想聊聊书店逐渐消亡的事情,因为当时看到镇上的新华书店变成了一个卖铁锅的铺子,除此之外还有两三个旧书店也早已物是人非,为什么我记得这么清楚,因为我们小镇只有一条街,而且是从小生活的地方。

后来到县上学的时候城里有一个大大的新华书店,还有一个位于大同街的“大同书店”,其它的小的旧书店还有不少。后来新华书店渐渐的开始卖学习机,音乐CD之类的,等我上大学第一个暑假回县里的时候新华书店已经改造成了一个大型的商场了,唯一能证明新华书店存在过的痕迹就只剩下一个叫新华书店的公交站名了。

余华书中文革结束后要凭书票通宵排队购书的情景是无法再现了,现在排队都是为了电子产品为了自己的爱豆。

以上,争取 2024 读书数量超过重庆人的平均数。

《褚时健传》:他做错了什么?

褚时健

我不吸烟,对烟草行业不知情,读完《褚时健传》这本书后,我对这个行业才算有了一点了解。这本传记比较完整记录了褚时健从出生到去世的一生历程。这本书有五百多页,对于一位活到90多岁的名人来说,用这么些篇幅来记录他的生平,并不算多。

我刚开始甚至不认识他的姓氏:褚。读完后我有一个整体感悟:一个人的一生,命运与时代有很大的联系,命运脱离不开时代这个大背景。褚时健无疑是一个很有能力的人,但即使如此,也无法摆脱时代的局限和牵绊。

他在新中国成立前生于云南边境华宁县的一个小村庄矣则村,他的事业一辈子也没有走出过云南。最开始只是一个普通农村少年,小时候和其他小孩子没什么两样,家里孩子多,作为老大的他,平时上学、抓鱼,干农活。家境贫寒、父亲去世,他不得不早早承担起家庭的主要责任。

一个人的优秀,从小事中就能看出来。比如说他在家里酿酒时,就比别人更动脑筋。他发现温度决定酿酒酵母的生长,于是他通过控制温度的方法,提高了酒的产量,小小年纪,酿酒产量就是比村里的人高。从这里便能看出他一生大概率会有所成就。这让我体会到,做事情要动脑子,掌握了多少知识和技能,就代表着有多少先进的生产力。

对褚时健来说,他一生中很重大的一个转折,是他的堂哥从省城昆明回来劝他要继续读书。他最终得到母亲的支持,离开家乡去省城读书,这使他终于走出了出生地,像我这种普通人家,如果不是求学,基本上是走不出自己的出生地的。他的堂哥可以说是他的贵人,当然他的堂哥也是个很厉害的人物,当年就算是地级市的状元了,万里挑一都不为过。

到了省城以后,在学校表现优异的褚时健,在建国前成为一名游击队员。在那个战火纷飞的年代,他选择的队伍在后来看是非常正确的,他跟对了党和政府。命运之神再一次垂青他,他没有牺牲在战场,而他的家人为此付出了巨大的牺牲,在战火中死了好几位亲人。

作为一位根正苗红的老革命,解放后他自然算是革命功臣。在早期革命工作中,不论是征粮还是其他事务,他都兢兢业业,干得风生水起。但风暴终究会来打破平静。或许在工作中有过失,留下了被人抓住的“辫子”。在反右时期,他还是被划为右派。

被划为右派后,褚时健跌入了人生谷底。在红光农场改造时,他甚至看不到人生希望。但他还是坚持了下来。命运就是这样,到了谷底或许就有转机出现。他调到了糖厂当副厂长。当时虽说大家都在搞意识形态的革命,并不真在乎生产。但世界总需要一些实干的人。褚时健从原料到技术,不断进行改造,在有限的资源下,活生生把糖厂的生产水平提升上来了,这一系列过程,锻炼了他对技术的掌握能力和对团队的管理能力。

我个人认为他有一点做得非常好:实事求是。比如在糖厂,他着力改善职工福利,职工群众得到了实惠,自然也就打心底拥护他的领导,无论哪种意识形态,谁不愿意让生活过得更好一点呢?他甚至开动脑筋,把糖厂的甘蔗渣拿来造纸,实实在在地解放了生产力、提高了劳动效率和成果。

褚时健人生真正的巅峰,是他离开糖厂后进入玉溪卷烟厂。烟草行业本身就是垄断行业,更是暴利行业,我认为,相对而言,理论上比糖厂就更容易干出事业,就像赚钱就要离钱最近的行业才能相对容易赚到钱。

虽然对于烟草行业很陌生,但万法不离其宗。褚时健改革了玉溪卷烟厂的生产水平,提升了该厂的烟草质量和品牌。他引进国外的先进设备,提高了农民的烟叶种植水平,串换到了难得的辅料,提升了职工薪水和福利,总之把整个玉溪卷烟厂推进到全国前列,甚至走向了世界。从烟叶质量、生产制度、生产设备、成本控制和烟草专卖等各方面,都做得极好。

我回想起90年代看电视时那句久久不能忘记的广告:山高人为峰,红塔集团!它就是玉溪卷烟厂基础上形成的红塔集团,我才想起当年在广东销售但不知来源的阿诗玛香烟原来也是由它生产出来和。红塔集团后来还探索了海外发展,投资能源、交通,甚至涉及金融领域,都取得了不菲的战绩。

正如《易经》所言:亢龙有悔。人生到了巅峰,也就意味着可能即将到来的下坡路。月满则亏,水满则溢。有多少人能真正做到激流勇退?

盛久必衰。褚时健的人生亦不例外。从今天的角度来看,很难说他到底错在何处。作为一个大型国企的领导、改革先锋,他贪了多少钱,我个人觉得很难用对错来评判,他毕竟是一个活生生的人。但正如国家所言,“功不抵过、过不掩功”,他最终还是受到了法律制裁,他自己也承认了贪污事实,且放弃上诉。在这个过程中,他受到的打击也极为沉重:妻子被抓,女儿死于狱中,自己被监视居住失去人身自由,再到最后定罪入狱。

60多岁的褚时健再次跌入人生谷底。但人们并没有抛弃他,在狱中甚至不少人给他零花钱,出狱时据说累计上百万元——那是2000年左右,但他只是扔在狱中的图书馆里。有关部门也算对他法外开恩:服刑时可以在监狱三公里范围内随意活动,他被安排在监狱图书馆做管理员。服刑两年后,他便因病保外就医,从某种意义上,这相当于释放了。

从监狱出来后,总想找点事情做的褚时健,不能也无心再从事烟草行业的工作,曾经的一代烟王回到老家山上种水果——从湖南引进的“冰糖橙”,利用云南的气候种植出更好的品质。对于一个七八十岁的老人来说,白手起家种橙子,利用业已成气候的互联网,把自己种植的橙子做成了知名品牌“褚橙”,一度成为一种励志的精神文化品牌,这确实是令人难以想象的事情,有志者事竟成。

直到去世前,他都坚持在他的果园亲力亲为。从生产技术、公司制度,再到销售和危机处理,他采用年轻时取得的智慧从容应对。这的确是非常不容易的。他所遇到的困难和波折,都一一克服了,也给他的后人留下了宝贵的农业基本盘。

和很多创业者一样,褚时健的成功有赖于他的坚守,而这种坚守有时也是一把双刃剑,用得不好就是固执。比如在他生命的最后一两年,他自己控制自己的饮食,固执地不摄入蛋白质,导致免疫力极度下降,可能因此而没能活到百岁。如果他当时听从医生的专业建议,合理摄取营养,也许真的可以活到百岁。只是那样活到一百岁的他可能就不是褚时健了。

纵观褚时健的整个一生,他这样一个有能力的人,多起多伏,做出了那么多超出常人的事业,我们普通人无法企及。我始终认为,往往是时势造英雄,很少英雄造时势。褚时健出生于改革开放前,经历过跌宕起伏的90多年人生,与他取得的成就相比,他所承受的苦难与折磨,我在书中难以切身体会。想到这里,我脑海里就回想起长者的那句金玉良言:

一个人的命运啊,当然要靠自我奋斗,但也要考虑到历史的行程。

复刻在腾讯微博中的回忆

大概是微博这个东西刚刚流行起来之时,也就是我初中的时候,我便用心的经营着我的腾讯微博,倒不是想要成为微博大咖,只是认为在同龄人坐在电脑前都只会打游戏时,我刷刷微博、发表一下自己的看法和见解,是更有意思的一件事。

然而腾讯微博迅速就被新浪微博超越,市场占有率几乎为 0 了。我自然也投靠了人多势众的新浪微博,但之前在腾讯微博中发的超过 1000 条微博是我的回忆 —— 中二青春。

我有一种预感,过不了多久腾讯微博就要被腾讯关停了,我可不能让之前写的那些碎碎念就这么消失,于是我用 Python 写了一个爬虫,将所有 [微博+图片+时间+转发微博+转发微博的所有信息] 都给爬到了本地数据库中,然后使用 React 做成了一个网站,名曰“复刻版腾讯微博”,将我发的微博放心地永远留在了自己的服务器中。

查看我的腾讯微博复刻网站,请点击:

https://hzy.pw/i/qqweibo/

## 基于服务器心情而工作的爬虫

截至目前,我的腾讯微博上共 1661 条微博,收听 65 人,听众 765 人。然而爬虫运行完毕之后获取到的微博数量为 1620,另外 41 条数据不翼而飞。我发布的微博和转发的微博中共包含了 1220 张图片,其中 6 张已被他们服务器丢失。微博中共包含 98 个视频,其中的 88 个均丢失(这是视频网站的锅,我们上传到优酷上的视频真的会被他们永远存放着吗,想想也是不可能的)。

微博中还包括了 785 条诸如 http://url.cn/482SZS 这样的短链接,其中 90% 均已失效,访问时直接提示 您访问的网址有误或该网址已过期 :( 此外,虽然 2011 年的微博也还给我留着,但所有微博的评论均没有了,数据被删掉了。。。

我想说的是,要是再不使用爬虫将这些宝贵的回忆取回,真说不定哪天就被腾讯给删掉了 ToT

讲真,各种复杂的情况都被我遇到了: 微博不提供 API,使用 Python 爬取 HTML 再解析,关键是 HTML 结构每次都会变,我花了很久很久的时间才适配了所有情况。另外服务器返回的数据并不可信,第一次得到的数据显示我在某一天发了 1 条微博,带有图片,再获取一次变成了发了 4 条,却无任何图片上传。(这不是腾讯为了防爬虫设计出来的,因为浏览器访问也是这样的,大概是腾讯微博在临死前,为了降低服务器负载而采用的拒绝式服务。。。)

于是我的爬虫在经过数天的完善后,拥有了应对前后数据不一致、连接握手失败、适应 HTTP 结构变化的功能。在此基础上又运行了四五天,才完成了爬取。因为对我那 1000 条微博的每一躺爬取,结果都是不一致的,直到最后连续运行十个小时也没爬出新数据后,我才认为是爬完了。

最终顺利爬取了能找到的所有数据,并存在了数据库里,真的是超级辛苦,让我激动的发了个微博(新浪微博~~)

数据清洗

数据清洗除了格式上的规范,还标记了一些重复的微博,这些微博在我的博客、空间里面重复,我的微博镜像站中没有必要包含这一部分内容。

此外为了制作微博镜像站,使用 Pillow 库将图片原图批量压缩成了 webp 格式的缩略图,在我的微博镜像站中,点击缩略图即可查看大图。 然而事实证明选择 webp 格式是错误的 ,虽然谷歌的 webp 格式拥有很高的压缩率,但是兼容性是个问题,不支持 Firefox、IE 和 iOS,几乎是只有 Chrome 能显示,所谓的 WebP JS 兼容性修复库其实是使用了 Flash 实现,然而后者本身就不值得使用。 所以说 WebP 格式的图片只适合客户端而不适合浏览器端。

最终我还是选择了 jpg 格式作为缩略图。毕竟我的服务器拥有 自动转换为 WebP 功能

愉悦的 React 开发体验

感谢 facebook/create-react-app 提供的脚手架,webpack+eslint+react 开发环境开箱即用。另外不得不感叹 React 的模块化使得逻辑相当清晰,很方便省心。

另外还要感谢 clean-blog CSS 主题lightgallery.js 图片灯箱插件

接下来

如果 QQ 空间、朋友圈、微博、豆瓣 这些网站在某一天宣布关停,我也会把自己的数据通通扒回本地,当我真心不希望这样,因为这个网站本身,就是一代回忆。

有空的话还要干几件事:试着统计下我发的微博中的一些有趣的数据,比如口头禅、文字情感之类的。再来就是把微博中的短链接替换成为长链接,因为正如上文提到的那样,很多短链接都在陆续失效了。

就酱。

现已完成,对我的腾讯微博的大数据统计挺有意思,请访问: https://hzy.pw/p/2569

关于 GMS 教务系统

 简介 

这是一个用于高校毕业生毕业流程线上管理的教务系统,由 Moshel 独立开发,并与 2016 年末开始被应用在西安石油大学计算机学院内。

毕业生在毕业设计时,需要学生与老师所出的题目建立一个多对一的关系,教师出题需要两层审核,而学生拥有三轮选题的机会,并且学生之间可相互竞选题目,此外,管理员可统揽全局,控制教务流程的进行,以及对相关数据的处理。这些就是本系统的大致功能。

答辩环节的完全线上化将是本系统的下一个主要开发方向。

链接:http://bkbysj.xsyu.edu.cn/(限西石大内网访问)

 系统功能 

作为一个完善的业务系统,除了 “选题” 功能外,还拥有完善的账号管理系统及附件管理系统等。

这张用例图是系统设计阶段所画,目前系统的功能已不局限于此。

教师拥有的功能

  

(↑ 点击可查看大图)

教师可以出题,并且实时跟踪自己题目的状态,历年所出题目会形成一个自己的题库以供复用,题目支持上传附件。这些特性弥补了旧选题系统的遗憾。

值得一说的是,本系统中所有的用户头像均不相同,根据用户 UID 哈希生成的随机矢量风格,避免了所有老师学生都使用默认头像的尴尬又无聊的景象。

学生角色

学生是本系统中最简单的角色,可进行选题,以及在选题成功之后通过此系统向老师发送文件。

在选题方面设计了 2 个人性化的特性:1、能看到某道题当前已选人数,这大大避免某道题被大家集中选择。2、在教师查看你的选题志愿之前,可以取消申请,并另选一道题。(事实上在此系统中所有的状态转移均支持最大程度的撤销操作)

管理员信息统揽

(↑ 点击可查看大图)

专门为管理员设计的功能占整个系统工作量的 70% 以上。管理员面板中,可以管理所有的用户类型,设定每位用户的类型,也可以看到现在所有选题配对情况。

值得一说的是,管理员支持使用 Excel 批量导入每届学生老师信息,系统会自动解析 xlsx 文档,并创建对应的登陆账号。

此外,本系统网页中所有可见的表格信息均可一键导出为 Excel 或 Word 文档,方便进一步办公处理。

仪表盘

数据可视化算是最近几年的技术热点,所以我为管理员开发了一个单独的仪表盘页面,用于总览整个选题流程的进行。

在这里,可以直观的看到待选题目和学生总数的柱状对比图,也可以分专业以饼状图的形式看到当前各专业学生的选题状态分布。这些都是选题流程中管理员需要掌握的数据。

数据库备份还原

 

本系统还拥有一个强大的自动备份还原功能,系统会自动在每天凌晨 3 时进行一次数据库备份,同时自动删除 15 天前的备份(不支持手动删除),当然,用户可以选择在需要的时候随时手动创建一个备份。

这样的设计使得系统更加稳定,无论是管理员的误操作,还是被任何形式的恶意攻击,都不会对系统造成很大的影响。

公告系统

 

(↑ 点击可查看大图)

本系统拥有完善的公告系统,支持富文本编辑、设置置顶、支持设置公告对不同类型用户的可见性,以及附件支持。

 关于技术 

以上说的是功能介绍,关于技术的细节欢迎大家点击以下两个链接继续阅读:

1、我在 2016 年 9 月写的:Meteor + React 教务系统开发经历

2、我在 2016 年 10 月发的相关论文:A High Performance Information System for College Graduation Management Cloud

技术亮点预告

1、使用 Javascript 全栈开发,包括 Node 作为后端,React 作为前端框架,MongoDB 作为数据库。

2、使用 Websocket 进行前后端通信,而不是 HTML 或者 AJAX。

3、使用黑科技实现前端浏览器直接操作数据库。

❌