Reading view

There are new articles available, click to refresh the page.

经视直播|多地学生称收到学校语音采集任务,有学校称与专业课成绩挂钩

公众号:经视直播

img

11月25日,一名IP属地为湖北的网友在社交媒体上反映,其所在学校强制要求学生录制语音,供安徽某科技企业用于语音大模型产品训练,并将此任务与专业课成绩挂钩——未完成者将被要求重修。湖北炽升律师事务所吴兴剑律师对此指出,校方无权强制采集学生的生物特征信息,此举涉嫌侵犯个人隐私。

11月26日,经视直播记者联系到发帖者。发帖者拒绝透露学校名称,但出示了一份学校通知。通知中写明:“本次录音正常完成的同学,可获得以下课程平时分满分奖励,未完成同学,该门专业课平时成绩不合格,且此门专业课期末考试不能及格,必须重修。”

img

img

img

根据发帖者提供的信息,记者联系到涉事的安徽某科技企业。企业工作人员回应称,公司确实与部分学校存在付费语音采集合作,但强调数据采集严格遵循自愿原则。该工作人员还透露,公司在外省的语音采集业务大多由供应商负责,但对于供应商与学校之间的具体协商内容,以及校方是否向学生支付报酬,其表示并不清楚。

发帖者向记者表示,完成该任务仅能获得平时分奖励,并无金钱报酬。

img

记者在招聘平台上发现,类似的声音采集任务报酬约为每小时20至30元。另外,此类情况并非孤例。有网友反映,相关录音任务与学校日常教学内容无关,且对话题、时长及环境均有较高要求,非常麻烦。一名IP属地为吉林的网友称,自己甚至在发烧期间仍被辅导员要求与同学调换时间后录制。这名网友向记者透露,自己学校并未强制要求录音,自己没有参与录音,后续不了了之了。不过自始至终,学校未曾提及向参与学生支付报酬一事。

CDT 档案卡
标题:多地学生称收到学校语音采集任务,有学校称与专业课成绩挂钩
作者:经视直播
发表日期:2025.11.29
来源:微信公众号-经视直播
主题归类:人工智能
CDS收藏:公民馆
版权说明:该作品版权归原作者所有。中国数字时代仅对原作进行存档,以对抗中国的网络审查。详细版权说明

img

img

这些情况引发了公众对学校与相关AI企业、中间商之间是否存在利益关联、语音真实用途及数据安全性的质疑。有业内人士向经视直播记者表示,通过第三方采购用户语音已成为AI行业收集大模型训练样本的常见方式之一,但必须确保参与者知情并自愿,同时符合数据采集与使用的相关法规要求。

湖北炽升律师事务所吴兴剑律师进一步指出,声音属于公民生物特征信息,除国家法定部门外,任何组织或个人均无权强制采集。若学校利用学生生物特征信息谋取利益,不仅违背教育本质,更可能构成对个人隐私的侵犯。他提醒公众应重视对个人生物特征与隐私信息的保护,谨防信息泄露。

来源:经视直播

记者:承畴

编辑:谢斯

责编:王紫嫣、朱迪蓓、李家新

编审:田程

对我的腾讯微博的大数据统计

为了防止腾讯微博某一天被腾讯关停,使我初中时发的上千条微博灰飞烟灭。遂使用 Python 爬虫外加 React 搭建了一个微博复刻小站,将我的回忆放心地永远留在了自己的服务器中。相关技术介绍: https://hzy.pw/p/2554

在这上千条微博存入数据库之后,我便开始对其进行大数据分析了,包括我最喜欢转发谁的微博、我在星期几最喜欢发微博,以及微博当中包含最多的关键词等等。很是有趣。

我的微博复刻网站欢迎访问: https://hzy.pw/i/qqweibo/

相关技术介绍: https://hzy.pw/p/2554

下面是对我的腾讯微博的大数据统计。

 

我一共发布了 1620 篇微博,其中转发和原创的比例如图。可以看出,初中时候的我可以说是很认真地在更新自己的微博(就像现在认真的写这个博客一样 :P),没有灌水。

 

将所有微博正文提取、分词处理后,使用 NLP 中关键词提取的相关算法,得到了我微博中最常见的 30 个关键字,按照面积比例做成了这幅统计图。

可以看到那时的我完完全全就痴迷于 iOS,从越狱到汉化 App 到开发小程序。不得不承认乔布斯时代的苹果真的是秒杀竞争对手的存在,有着极大的魅力,不过我现在更喜欢安卓就是啦~ 

这时我顺便还进行了所有微博正文的情感分析,后来发现意义不大,模型输出结果显示积极情感  >99.999%(如果是对单条微博进行情感分析,则输出正常,但我懒得去处理和统计了)

 

我从 PC 网页端发布的微博占接近 40%,实际上在 2011 年前后,使用手机发微博真的是一件值得炫耀的厉害事情,但如今正好相反,手机发微博才是理所当然的主流。互联网的发展令人感叹。

 

很有趣的微博附图统计。在当时很长一段时间,微博只允许上传一张图。至于 “无图”,在微博最开始时还真是大家的选择,以现在移动互联网的思维来思考是难以理解的。

 

发了两百多条微博那个月我也是够闲。。。PS:我离开腾讯微博,来到新浪微博的时间是 2012 年 12 月。

 

将数据结构化地存在数据库中就是方便,大多数数据都是一条 SQL 搞定,于是随手统计了一下每周和每日的发微博时间分布。

能得出来的结论就是:我是一名周内认真学习,每天按时睡觉的好孩纸。

 

我转发微博真的挺少,而且转的最多的还是我自己的微博,因为我最喜欢的就是我自己。

 

最后一张是我的的微博的热度统计,热度定义为评论和转发的总数。不过我一直不太在意就是了。各条微博按照时间升序在横轴上排列。

 

结语

腾讯微博对我来就像自己的日记本一般,有着特别的意义,但是目前已经淡出舞台。

欢迎大家关注来我的个人网站、新浪微博,以及 Github 和知乎:https://hzy.pw/connect

❌