eSIM 比实体 SIM 更麻烦吗?
新发卡场景: 我记得实体 SIM 卡也需要在营业厅出示身份证办理吧,这样的话,两种形式其实一样麻烦 现在有些快捷营销渠道可以简化?如果可以简化,那 eSIM 的复杂度就高于实体 SIM 了
换机场景: 那肯定是去营业厅比直接拔出来更麻烦的
换卡场景: 有几个人 SIM 卡坏掉的?听说过,没见过。甚至诛心的说,我觉得拿这个场景来说事属于找茬儿
新发卡场景: 我记得实体 SIM 卡也需要在营业厅出示身份证办理吧,这样的话,两种形式其实一样麻烦 现在有些快捷营销渠道可以简化?如果可以简化,那 eSIM 的复杂度就高于实体 SIM 了
换机场景: 那肯定是去营业厅比直接拔出来更麻烦的
换卡场景: 有几个人 SIM 卡坏掉的?听说过,没见过。甚至诛心的说,我觉得拿这个场景来说事属于找茬儿
博客原文: 基于贝叶斯算法的 Telegram 广告拦截机器人(二):上线半月的故障、挑战与优化之路
半个月前,我发布了一个基于贝叶斯算法的 Telegram 广告拦截机器人 @BayesSpamSniperBot
(https://t.me/BayesSpamSniperBot)
项目地址:https://github.com/ramsayleung/bayes_spam_sniper
系列文章:
尽管项目代码开源,但我始终以产品思维运营它。上线半个月以来,经历了故障、用户反馈与持续优化,现将这段经历分享出来。
没想到我的产品的第一个线上故障来得这么快,发布的时候直接不可用,把正常消息都给删了,用户在各种途径都向我反馈:
故障的原因是我当时一直在收集垃圾广告的数据,太专注于垃圾广告数据,而忽略了收集的正常数据, 导致垃圾广告数据过多,消息都被认为是垃圾广告,被误删了。
通过补充大量正常消息数据,重新平衡训练集,模型逐渐恢复正常识别能力。
我在《基于贝叶斯算法的 Telegram 广告拦截机器人(一):从问题到产品》里面提到过:
常见的 Telegram 广告机器人是大多是基于关键字的,通过匹配关键字进行文本拦截,非常容易被发垃圾广告的人绕过。
这不禁让我想起了保罗.格雷厄姆在《黑客与画家》一书在 2002 年介绍的情况:
当时电子邮件兴起,也有非常多的垃圾邮件,常见的垃圾广告拦截方式是关键字匹配+邮件地址黑名单,但是既低效也容易被绕过。
保罗.格雷厄姆就创造性地使用贝叶斯算法(Bayes Theorem)实现了一个广告拦截器, 效果竟然出奇地好。
但产品上线之后,我发现聊天软件消息和 Email 虽然都是文字,还是有很大差别的:
Email 大多时候都是长文的,内容较长,并且大多情况,一封邮件上下文本身也很完整,就有较多的内容,较高的准确度来判断是否是广告。
而 Telegram, 微信这类的即时聊天软件,聊天消息大多都不长,可能把内容分成多条消息来发,就没有完整的上下文,比如:
换 U
找我
单条消息很较难准确判断是否是广告,所以对即时消息做广告拦截本身就更难, 「短文本+无上下文」是 NLP 中的经典难题,也是本项目最大的技术挑战。
漏删与误删是广告拦截中不可避免的矛盾权衡。
若想提高拦截率(召回率),就需降低置信度阈值,将更多疑似广告的消息拦截,但这也会增加误删正常消息的风险。
反之,若想避免误删(提高精确率),则必须提高置信度阈值,但这又会导致更多广告被漏掉。
在即时消息短小、上下文缺失的特性下,想同时实现零误删和零漏删几乎是不可能的。
权衡之下,我选择优先保证用户体验: 宁可漏删,不可误删
因为漏掉的广告,群友可以举报或由管理员手动删除;但误删的正常消息却无法恢复,对用户的伤害更大。
因此,我将拦截阈值设置为 95%,即仅当模型有极高把握(>95%概率)判定为广告时才会删除。
这虽然会放过一些疑似广告,但最大程度地保障了正常聊天不被误删。
产品上线之后,很快就有用户来试用了,然后其中一个用户就提了一个非常好的优化建议。
这个警告的消息不会自动删除,如果有很多人在群里发广告,那么群里就会有一堆这样的消息,也算是对群消息的污染。
所以用户建议:
可以发这个提醒,但在几分钟后也把这个提醒消息删除掉
我觉得这是个非常好的优化体验,因为就把这个功能给加上了,提醒消息本身会在 5 分钟后自动删除。
倾听用户的声音是非常重要的,他们可能就会从他们的角度提出非常好的建议。
但是不要盲目听从用户的建议,比如也有用户建议:
我觉得还应该有以下功能.
- 恢复消息, 恢复用户. (让管理员恢复误删的消息和用户)
- 主动投喂正常消息. (让管理员主动投喂一些消息. 比如, 群里面昨天 的消息, 随便选一些正常的, 投喂给机器人)
恢复消息这个功能没有太大必要,并且也不实用,因为恢复消息这个功能本身就很微妙,是直接恢复被删除的消息呢,还是重新发一条新消息?
如:
- 2025-09-09 10:01:00 张三: 我今天吃了鸡翅
- 2025-09-09 10:02:00 李四:鸡翅有啥好的(被误删消息)
- 2025-09-09 10:03:00 王五:人家就喜欢吃,你管得着嘛
如果是直接恢复被删除的消息,当前时间是 2025-09-09 11:00:00
,把消息恢复之后,还有人会手动刷历史消息,查找旧消息么?
Telegram 客户端不一定支持会跳转被恢复的旧消息,这意味着,你恢复误删的消息,也没人看得到。
假如是重新发一条新消息 鸡翅有啥好的
, 因为缺失了上下文,群里的人反而会疑惑,你在说什么。
解决误删问题本质是提高拦截的准确率,而非考虑如何恢复被误删消息,准确率提高了,误删就会减少, 自然就不需要考虑如何恢复消息,用户体验还会更好.
而主动投喂消息这个想法有点理所当然了。
没有任何群管理员有意愿帮忙训练这个机器人,对用户而言,他们只想要一个好用的广告拦截机器人,至于怎么开发,训练出来的,用户并不在乎。
所以用户不会有意愿和动力来优化这个机器人,不好用就再换一个好了,更何况,逐条消息收集的效率实在太慢太慢了, 所以我后面想出了一个比手工收集数据提效至少 100 倍的主意。
发现人难免会有误区,总会以为别人会和自己一样,之前看到发垃圾广告的人的时候,总会觉得他们是正常的用户手工发。
但是最近几天发现了一些规律,有用户把同一条消息反复发,不同的群还是发同样的内容 即使是复制粘贴也难免会多个或者少个空格,然后消息被删了还一直发同样的内容。
此外,还有一些群,内容的聊天内容都是广告,我还很奇怪,大家都在发广告,正常用户不都跑了嘛?
此时,我才意识到,发消息的都是机器人。
所以我加了个优化,计算消息内容的 hash 值,保存到数据库,并为这个字段建立索引。
后面检测消息的时候,先根据 hash 值查询,检查是否存在已有的消息,如果消息已经存在且已经被标记成广告或者正常消息,那么就无需再使用模型检测,可以直接返回之前的检测结果。
这样既提高了准确度,也优化了性能,也减少了人工干预的成本。
同一个用户如果在同一个群发了三条广告,那么就会自动被封禁掉,也就是相同的广告只要发三条,就会马上被自动封禁掉。
使用机器学习算法来实现一个类似的垃圾广告过滤器并不难,困难的持续收集高质量的训练数据,训练数据是非常宝贵的,毕竟数据才是核心资产。
而对于我这个产品来说,最难的是冷启动时的训练数据问题:
因为没有训练数据,模型就不准确,模型不好用就不会有人使用,自然也无法通过用户来收集垃圾广告数据,就无法良性循环, 存在一个鸡生蛋,还是蛋生鸡的问题。
所以冷启动时,我是手动加了非常多的 Telegram 大群,然后人工在里面收集垃圾广告.
但是这个效率实在是太低了,我收集了快一周才只有几百条数据, 一个是我无法一直盯着各个群,另外是这种 20w 的大群,一般都会有几个管理员,会手工删除广告,一会没有看垃圾广告数据就会被删掉了。
这样手工收集数据实在在太痛苦了,我就在想有没有什么办法自动收集数据呢?
我本来想的是直接把我的机器人拉到这些大群里面,即使没有管理员权限无法删除消息,也可以收集数据嘛,后面才意识到 Telegram 有个规定,只有群管理员才有权限加机器人,因为我不是管理员,所以自动没有权限添加机器人。
但是 telegram 的客户端是开源的,他们提供了 tdlib [^1]这个跨平台的 C++ 库便于社区构建第三方的 Telegram 客户端,那么我自然可以使用这个库来登录我自己的账号,然后使用我的模型来过滤消息,然后把疑似广告的数据都收集起来,我再人工确认下。
(顺便说一下,tdlib 和 telegram-bot-api [^2]这两个库竟然都是同一个作者 Aliaksei Levin [^3]在维护,实在是太强了。)
我现在需要做的就是添加各种大群,然后程序就会自动监听并收集数据,我再人工批量确认下。
实现起来也不复杂,200 行代码就实现了这个监听消息,分析,并且收集的功能。
得益于这个自动化的数据收集程序,我 1 周不到就收集了近上万条的高质量训练数据了,效率实在高太多太多了。
懒惰真的是程序员的美德, 这个经历再次证明:自动化工具往往能成倍提升效率,这正是工程师价值的体现.
所谓酒香也怕巷子深,没有用户使用,代码写得再好也没有意义。从产品角度,运营推广至关重要。
作为个人开发者,我没有大量粉丝关注,也没有营销预算,因此采用了传统的推广方式:撰写博客并在相关社区分享。
我撰写了两篇双语博客文章,中文版本分享至:
英文版本发布至:
虽然推广效果有限,但这些努力为项目带来了最初的用户关注。
上线半个月,截止到目前为止, 已经有超过 80 个群使用过这个机器人,用户数已经比我预期要多了:
指标 | 数值 |
---|---|
GitHub Stars | 106 |
使用群组数 | 83 |
训练数据量 | 10543 |
最开心的是看到我自己的程序在这些群成功拦截垃圾广告,就很有成就感,证明我做的东西真的能用户解决问题。
这半个月的运营让我深刻体会到:产品不是代码写完就结束,而是从用户反馈中不断迭代的开始。
产品是需要持续运营的,而写代码只是产品生命周期的其中一个环节,甚至不是最耗费时间的环节。
下一步,我计划进一步优化模型准确率,并探索多语言支持,也欢迎关注我的频道或提交 Issue 一起讨论。
[^1]: https://github.com/tdlib/td
[^2]: https://github.com/tdlib/telegram-bot-api
[^3]: https://github.com/levlam
[^4]: https://old.reddit.com/r/rails/comments/1n6p791/built_my_first_rails_project_a_telegram_spam/
1:房 2:币 3:债 4:股 5:汇
无忧行官网 https://www.jegotrip.cn/m/mobileIndex.html 给出的 Android 版下载地址跳转到 Google Play 提示:找不到该内容。这样是不是被下架了,上次更新距今快满一年了,感觉被放弃了。
然后找出个同中国移动国际开发的包名类似,图标雷同的应用。https://play.google.com/store/apps/details?id=com.cmi.jego.global 7 月 18 号发布 1.0.0 版本。 功能介绍:全球 eSIM 、SIM 卡管理和中国旅游必备
但美区 Play 市场提示:此商品无法在您所在国家/地区购买或下载。
从 apkpure 上找到安装包(12+M 大小)下载安装后 xiaomi.eu 的 rom 打开闪退。
有能从 Play 市场下载安装打开的看看这到底是什么应用。
MyServers 是一个专门为家庭 Nas 服务器玩儿家设计的 app ,All in one 管理各种自建服务:qbittorrent ,proxmox ,docker 等
最近上新了桌面小组件,ui 进行了优化。
送大家一些兑换码,欢迎提出宝贵意见
4PJFALP7EPNW
TXLMXTN7E9RK
PPK73MXYN9KP
6TT9LMHAXEXM
YHRXMHJAK39T
R6KHLK99LLMF
XHLYM4RH63RL
AXAP7TLTX4K6
YWWKH6FTEWJ3
LHKJP7X3MKEY
A33L9XEJA73X
RWY97A4T3PYY
PY6WYYYKKNJJ
3L7WJFJP9WFE
XFY9L3JR734T
一般都是在使用 eNSP 的时候蓝屏。
尝试问了下大模型,但感觉回答不太靠谱。想先问下各位大佬,有出现这个问题吗?
环境:
需要天翼云的折扣的老板看过来~~~
只要通过 https://www.ctyun.cn/h5/auth/invitation/22473925?staffUserId=23148151 链接注册天翼云账号,享受官网一年 83 折 3 年 5 折 5 年 3 折的基础上额外自研 A 类产品再 45 折,非自研产品 65 折的优惠。不需要折扣要返佣的话,最高可返 35% 欢迎各位老板一起合作。
需要比价的老板,欢迎各位老板发配置给我这边给报价。
腾讯云新拓 20% 存量 10%
阿里云国内新拓 25% 阿里云国际 75 折充值 200U 起充
AWS 中国区 3 折
联系方式:V:1152107599 TG:@dmmei2025
我自家的房子出租,不想给中介,只想租给聊得来的朋友。
房子在旗胜家园,83 平,精装修。地铁 8 号线和 13 号线两线交汇,出地铁 5 分钟到家。林萃路尽头,八达岭高速近邻,无论是上班还是出游都非常便利。
自己第一套房,倾注了爱和心血,写了一篇很详细的描述,在有道笔记里了,请点以下链接:
http://note.youdao.com/noteshare?id=0ea62e83149b5d419d5b0574c28d3644
结论: 1. 题材切换初期,首板具有高溢价,特别 10 点以前封板的
手里有工行的星座卡,我用星座 visa 卡绑定了 google play ,订阅了 gpt plus 。所以以后每个月的这一天都会扣款。
但为了成功购买 plus ,我打开了 visa 卡的 境外无卡支付锁。
虽然我办这个信用卡就是为了买 gpt ,没有用作过别的用途,以后也不会用来买其他东西。但一直保持 境外无卡支付锁 不上锁,会导致我这卡被盗刷吗?
或者说,我应该 平时保持境外无卡支付锁 上锁,等到当天收到 扣款失败的提醒后,我再临时打开这个锁,再手动付款 plus 。
我老婆的手机可以登录我的美区账号,是不是就自动下载我已经购买的软件了,然后再退出登录她自己的国区账号,这样可行吗?苹果会检测什么多设备啥的吗
如果可行的话,那岂不是只要一个账号购买了 ,只要愿意 能分享给很多人?
最近几个月一直在不停地弹通知,叫我同意和云上贵州相关的协议。但是不同意也能正常使用,网页端检查了 https://account.apple.com/account/manage/section/information 确认自己不在国区,看了 https://www.icloud.com/ 也找不到云上贵州字样。
手机为美版,账号为台区。
❓我们是谁
👨我们寻找的人
⚡️加分项
有想法的可以加 wx: cm1825 交流
我记得很多年之前注册要入金 1 万还是多少就没管了. 现在说盈透关门了,又去看发现还可以注册,就注册了,绑定 wise 入金了 1 刀 这是不是就算完成入金了
我之前外接显示器时,排列设置都是将外接显示器作为主屏(排列界面顶部的小白条也在这个外接显示器上)。但今天不知道误操作了什么,现在无论是同时使用两个显示器,还是合上 Mac 的盖子,当我按音量加减键时,音量提示框都只在 Mac 自带的屏幕上显示,而不会出现在外接显示器上了。有老哥知道这是怎么回事吗?
需要 root
https://github.com/sansgood/Sa2ration (原软件不更新很久了,这是 xda 的开发者 fork 更新的) 下载地址 https://sourceforge.net/projects/sa2ration/
关于安卓手机的色彩饱和度,所有的安卓手机几乎都只有 设置-辅助功能-灰度模式/色盲模式,无法自定义调节色彩饱和度的值。
想模拟 tcl nxtpaper 的类彩墨模式,达到低饱和度的效果,同时又能开启夜间模式/护眼模式(暖色温模式/屏幕发黄模式),找来找去真的让我发现了一款能用的软件 Sa2ration ,完美达到了我的需求,故此分享一下。
大券商免五越来越少,或者门槛很高,有些甚至 1000 万才能搞定,还有银河去年此时很容易,从去年 11 月开始到现在没有了,华宝也是 5 毛起收,停了好几月,再开也是 1 元起收,所以已经有免五务必珍惜,没有还是抓紧搞一个,随和券商并购重组节奏加快,说不定哪天就全没了。、
实践经验告诉我:好多千万也需要,尤其是量化的,也有几百万但总有一些高频小额的。
比如:周末一个 300 的客户,想要大券商的两融最低,又想免五,最优选择国信因为刚注销不能开,很可惜。 还有一个百万的客户,之前对免五不敏感,最近又找我说还是想要免五。
不是标题党,不过万 0.7 免五大券商需要 50w ,且限量。
免五按规定不允许的,但券商太卷又不得不,出现“xx 证券免五”会被其他券商举报的,所以还请理解。
广告太多确实烦人,所以我很少发,所以还请收下留情,我们 v 站很多人有这么需求,满足了需要也是价值体现。
不开户也可以找我聊,开户只是个临时副业,最终我要走向有价值的自媒体