俄罗斯官媒微博爆粗笔战中国网民回应侵略乌克兰批评

联合早报中港台

27 May 2026 at 16:53

自称“我是伟大的俄国人”的俄罗斯官媒“俄乌网”微博账号，因中国网民留言批评俄罗斯侵略乌克兰而频频爆粗回应，称这些中国网民是“鬼子”“人渣败类”，并认为自己的反击“教育改正了很多人”。

有中国网民星期一（5月25日）在俄乌网的微博贴文下留言称：“强烈谴责俄罗斯的暴行，必须追究俄罗斯的战争暴行。”俄乌网随后回应“你家接二连三遭遇不测导致你精神失常”“怪不得你胡言乱语”“祝你家人一路走好”等。

这则回复很快在微博上流传，被中国网民批评是“公然恶毒诅咒”，认为平台应该依据法律法规进行惩处。

俄乌网的微博回复记录显示，这个官方微博账号的运营人员自称“我是伟大的俄国人”，曾学习过华文，过去一段时间以来持续用各种粗话回应中国网民的侵略批评，用词包括“鬼子”“人渣败类”等。

当被中国网民问及“什么时候还给我国海参崴”时，俄乌网则回应：“去问你的国家相关部门啊，是怕没人搭理你吗？”

有中国网民呼吁俄乌网“官媒谨言慎行”，俄乌网星期三（5月27日）对此回应称：“官媒怎么了？官媒就要任由你们污言秽语造谣诽谤而不能反击吗？如果反击了就是素质低。相反，我认为官媒才不应该听之任之坐视不管，那是不负责任，我已经教育改正了很多人，我自豪！”

俄乌网曾发文自我介绍称，该网是俄罗斯官媒今日俄罗斯媒体集团旗下俄乌资讯官方新媒体，“不同于传统官媒，没有既定的叙事框架，我们更倾向于用网友喜欢的方式说话......我们倡导俄中友好，并坚信俄中两国是世界和平稳定的基石”。

对我的腾讯微博的大数据统计

中原驿站

By: 胡中元

23 July 2018 at 17:29

为了防止腾讯微博某一天被腾讯关停，使我初中时发的上千条微博灰飞烟灭。遂使用 Python 爬虫外加 React 搭建了一个微博复刻小站，将我的回忆放心地永远留在了自己的服务器中。相关技术介绍： https://hzy.pw/p/2554

在这上千条微博存入数据库之后，我便开始对其进行大数据分析了，包括我最喜欢转发谁的微博、我在星期几最喜欢发微博，以及微博当中包含最多的关键词等等。很是有趣。

我的微博复刻网站欢迎访问： https://hzy.pw/i/qqweibo/

相关技术介绍： https://hzy.pw/p/2554

下面是对我的腾讯微博的大数据统计。

我一共发布了 1620 篇微博，其中转发和原创的比例如图。可以看出，初中时候的我可以说是很认真地在更新自己的微博（就像现在认真的写这个博客一样 :P），没有灌水。

将所有微博正文提取、分词处理后，使用 NLP 中关键词提取的相关算法，得到了我微博中最常见的 30 个关键字，按照面积比例做成了这幅统计图。

可以看到那时的我完完全全就痴迷于 iOS，从越狱到汉化 App 到开发小程序。不得不承认乔布斯时代的苹果真的是秒杀竞争对手的存在，有着极大的魅力，不过我现在更喜欢安卓就是啦~

这时我顺便还进行了所有微博正文的情感分析，后来发现意义不大，模型输出结果显示积极情感 >99.999%（如果是对单条微博进行情感分析，则输出正常，但我懒得去处理和统计了）

我从 PC 网页端发布的微博占接近 40%，实际上在 2011 年前后，使用手机发微博真的是一件值得炫耀的厉害事情，但如今正好相反，手机发微博才是理所当然的主流。互联网的发展令人感叹。

很有趣的微博附图统计。在当时很长一段时间，微博只允许上传一张图。至于 “无图”，在微博最开始时还真是大家的选择，以现在移动互联网的思维来思考是难以理解的。

发了两百多条微博那个月我也是够闲。。。PS：我离开腾讯微博，来到新浪微博的时间是 2012 年 12 月。

将数据结构化地存在数据库中就是方便，大多数数据都是一条 SQL 搞定，于是随手统计了一下每周和每日的发微博时间分布。

能得出来的结论就是：我是一名周内认真学习，每天按时睡觉的好孩纸。

我转发微博真的挺少，而且转的最多的还是我自己的微博，因为我最喜欢的就是我自己。

最后一张是我的的微博的热度统计，热度定义为评论和转发的总数。不过我一直不太在意就是了。各条微博按照时间升序在横轴上排列。

结语

腾讯微博对我来就像自己的日记本一般，有着特别的意义，但是目前已经淡出舞台。

欢迎大家关注来我的个人网站、新浪微博，以及 Github 和知乎：https://hzy.pw/connect

复刻在腾讯微博中的回忆

中原驿站

By: 胡中元

20 July 2018 at 21:47

大概是微博这个东西刚刚流行起来之时，也就是我初中的时候，我便用心的经营着我的腾讯微博，倒不是想要成为微博大咖，只是认为在同龄人坐在电脑前都只会打游戏时，我刷刷微博、发表一下自己的看法和见解，是更有意思的一件事。

然而腾讯微博迅速就被新浪微博超越，市场占有率几乎为 0 了。我自然也投靠了人多势众的新浪微博，但之前在腾讯微博中发的超过 1000 条微博是我的回忆 —— 中二青春。

我有一种预感，过不了多久腾讯微博就要被腾讯关停了，我可不能让之前写的那些碎碎念就这么消失，于是我用 Python 写了一个爬虫，将所有 [微博+图片+时间+转发微博+转发微博的所有信息] 都给爬到了本地数据库中，然后使用 React 做成了一个网站，名曰“复刻版腾讯微博”，将我发的微博放心地永远留在了自己的服务器中。

查看我的腾讯微博复刻网站，请点击：

https://hzy.pw/i/qqweibo/

## 基于服务器心情而工作的爬虫

截至目前，我的腾讯微博上共 1661 条微博，收听 65 人，听众 765 人。然而爬虫运行完毕之后获取到的微博数量为 1620，另外 41 条数据不翼而飞。我发布的微博和转发的微博中共包含了 1220 张图片，其中 6 张已被他们服务器丢失。微博中共包含 98 个视频，其中的 88 个均丢失（这是视频网站的锅，我们上传到优酷上的视频真的会被他们永远存放着吗，想想也是不可能的）。

微博中还包括了 785 条诸如 http://url.cn/482SZS 这样的短链接，其中 90% 均已失效，访问时直接提示 您访问的网址有误或该网址已过期 :( 此外，虽然 2011 年的微博也还给我留着，但所有微博的评论均没有了，数据被删掉了。。。

我想说的是，要是再不使用爬虫将这些宝贵的回忆取回，真说不定哪天就被腾讯给删掉了 ToT

讲真，各种复杂的情况都被我遇到了： 微博不提供 API，使用 Python 爬取 HTML 再解析，关键是 HTML 结构每次都会变，我花了很久很久的时间才适配了所有情况。另外服务器返回的数据并不可信，第一次得到的数据显示我在某一天发了 1 条微博，带有图片，再获取一次变成了发了 4 条，却无任何图片上传。（这不是腾讯为了防爬虫设计出来的，因为浏览器访问也是这样的，大概是腾讯微博在临死前，为了降低服务器负载而采用的拒绝式服务。。。）

于是我的爬虫在经过数天的完善后，拥有了应对前后数据不一致、连接握手失败、适应 HTTP 结构变化的功能。在此基础上又运行了四五天，才完成了爬取。因为对我那 1000 条微博的每一躺爬取，结果都是不一致的，直到最后连续运行十个小时也没爬出新数据后，我才认为是爬完了。

最终顺利爬取了能找到的所有数据，并存在了数据库里，真的是超级辛苦，让我激动的发了个微博（新浪微博~~）

数据清洗

数据清洗除了格式上的规范，还标记了一些重复的微博，这些微博在我的博客、空间里面重复，我的微博镜像站中没有必要包含这一部分内容。

此外为了制作微博镜像站，使用 Pillow 库将图片原图批量压缩成了 webp 格式的缩略图，在我的微博镜像站中，点击缩略图即可查看大图。 然而事实证明选择 webp 格式是错误的 ，虽然谷歌的 webp 格式拥有很高的压缩率，但是兼容性是个问题，不支持 Firefox、IE 和 iOS，几乎是只有 Chrome 能显示，所谓的 WebP JS 兼容性修复库其实是使用了 Flash 实现，然而后者本身就不值得使用。 所以说 WebP 格式的图片只适合客户端而不适合浏览器端。

最终我还是选择了 jpg 格式作为缩略图。毕竟我的服务器拥有自动转换为 WebP 功能。

愉悦的 React 开发体验

感谢 facebook/create-react-app 提供的脚手架，webpack+eslint+react 开发环境开箱即用。另外不得不感叹 React 的模块化使得逻辑相当清晰，很方便省心。

另外还要感谢 clean-blog CSS 主题和 lightgallery.js 图片灯箱插件

接下来

如果 QQ 空间、朋友圈、微博、豆瓣这些网站在某一天宣布关停，我也会把自己的数据通通扒回本地，当我真心不希望这样，因为这个网站本身，就是一代回忆。

有空的话还要干几件事：试着统计下我发的微博中的一些有趣的数据，比如口头禅、文字情感之类的。再来就是把微博中的短链接替换成为长链接，因为正如上文提到的那样，很多短链接都在陆续失效了。

就酱。

现已完成，对我的腾讯微博的大数据统计挺有意思，请访问： https://hzy.pw/p/2569

Normal view

结语

数据清洗

愉悦的 React 开发体验

接下来