Normal view

There are new articles available, click to refresh the page.

Before yesterdayMain stream

向AI“投毒”：“纠正AI的歧视，实际是纠正人的歧视”

南方周末-新闻

By: 南方周末记者郑丹

3 January 2025 at 17:00

“当AI提取了人类社会的偏见，复制后向人类社会再传播，反过来可能固化人类社会中一些歧视性、刻板性的观念。”

（本文首发于2025年1月2日《南方周末》）

南方周末记者郑丹

责任编辑：谭畅

改绘自美国画家诺曼·洛克威尔揭露种族歧视的作品《我们共视的难题》。（谭畅使用AI工具生成/图）

你有没有意识到，看上去无所不知的AI，回答人类提出的问题时也会带有偏见与歧视？

中国政法大学人权研究院教授刘小楠曾给AI出了一百多道题，涉及性别、城乡、残障人士等容易产生歧视的议题。AI给出严丝合缝的答案，但她发现，不少看似正确的答案流露出偏见。

刘小楠参与的测试活动名为“给AI的100瓶毒药”。对于明显高危问题，AI已具备足够的敏感度和应对能力，但在一些更微妙的议题上，AI的回复还有完善空间。2023年6、7月份，一个大语言模型中文数据集研发团队邀请心理学、法律、环保、无障碍组织等领域的专业人士担任“投毒师”，向AI投喂多道人类都不一定能完善回答的复杂问题，诱发AI做出错误或不得体的回答，再对回答评分，并给出更合理的答案让AI学习。

在那场活动前不久，国家网信办联合多部委颁布的《生成式人工智能服务管理暂行办法》要求，在算法设计、训练数据选择、模型生成和优化、提供服务等过程中，采取有效措施防止产生民族、信仰、国别、地域、性别、年龄、职业、健康等歧视。

“歧视是不可能被消除的，只要有人在，就一定会有歧视。”一年多过去，曾担任“投毒师”的北京航空航天大学法学院教授翟志勇对南方周末记者表示，AI的使用者、研发者可以共同努力减少歧视。

翟志勇。（受访者供图/图）

给AI挖坑，暴露偏见

南方周末：你接触AI有多长时间了？

翟志勇：我很早就接触AI，经历过AI从早期的机械性人工智能，更迭到人脸识别、自动驾驶，再到ChatGPT问世，大家当时都没想到，突然有这么一个大爆发。

刘小楠：我比较“老古董”，挺意想不到会与AI有交集。我一直觉得人工智能离我好远，跟我研究的人权、平等这些议题一点关系都没有。在日常生活中，我使用传统方法还能应付，不太接受新鲜事物。2023年7月，突然有人给我打电话，让我出一百道诱导AI掉坑里的题目，我觉得挺有意思，这才开始接触AI。

南方周末：你给AI出题是从哪些方面设计的？AI回答的效果如何？

翟志勇：我主要设计偏法理方面的，在所有组中，我那组得分最低，可能也是因为题目设计得比较难。我想看AI是不是能够真正理解法律，但可能AI在初期对偏专业性的法律还没那么了解，不如偏公共的话题满意度高。

刘小楠：我们提的问题包含了几个容易产生歧视的领域。AI给我的回答中，其实没有特别明显称得上违法、侮辱的文字，但我当时

登录后获取更多权限

立即登录

欢迎分享、点赞与留言。本作品的版权为南方周末或相关著作权人所有，任何第三方未经授权，不得转载，否则即为侵权。

AI 歧视

县城里的数据标注员：“有多少智能，就有多少人工”

南方周末-新闻

By: 南方周末记者郑丹南方周末实习生郭晓雨

2 January 2025 at 17:00

邢开瑞面试过上千人，知道数据标注的不超过5个。陶致萍的父母问女儿，是不是要提着油漆桶，在大马路上划线。

李亚梅听老板讲，这份工作的意义在于促进自动驾驶汽车提升性能。她不想那么多，累到坚持不下去，就想着给孩子赚点奶粉钱。

“机器识别准确率变高以后，简单的项目变少，人力需求也变少。”有人认为数据标注行业将会收缩，有人相信需求永不会消散。

（本文首发于2025年1月2日《南方周末》）

南方周末记者郑丹南方周末实习生郭晓雨

责任编辑：谭畅

（谭畅使用AI工具生成/图）

2024年12月末，四季如春的云南降温了。在蒙自一处不起眼的二层小楼里，十位员工对着24英寸的电脑屏幕勾勾画画，办公室只有点击鼠标和敲击键盘的“哒哒”声。坐在窗边的男孩搓搓手，吸吸鼻子，继续工作。

他们在做的是针对自动驾驶车辆的数据标注工作。屏幕上显示一种由雷达车扫描生成的4D逻辑图层，他们需要标明图层中的车道线、行驶区域、道路边界线以及地面标识指引。

数据标注是指对图片、语音、文本、视频等数据进行处理，转换为机器可识别的信息，为人工智能模型的训练和优化提供素材。“前面有多少智能，后面就有多少人工”的调侃，道出了数据标注在人工智能行业发展中起到的基石性作用。

2020年2月，数据标注员作为人工智能训练师的一个工种，被正式纳入国家职业分类目录。短短几年，这个劳动力需求量巨大的行业，迅速在一些中小城市落地生根。

“做梦都在画车道线”

屏幕上的图层是黑白色的，像医学治疗中的X光片，主干路在布满黑灰噪点的阴影里，以更深的颜色突出显示。坐在屏幕前的数据标注员如同看诊的大夫，指着图中一片雾蒙蒙的阴影区域比划一圈，“这是绿化带，在道路边上，因为它有明显的分层。”

员工们熟练地滑动鼠标，画面不时翻转，呈现立体三维图，或俯视平面图。光标牵动着红色坐标线在画面上移动，定下的点变幻成绿色，多点连成线。员工每画出一条线、一个框，都意味着几分钱到手了。

工资，在这里是以分为单位累计的。

“我们按计件结算，一天可以标120块钱，每月能赚三千出头。”在蒙自，这座隶属于红河哈尼族彝族自治州的县级市里，一间约170平方米的办公室和12名数据标注员，是云南凯瑞科技有限公司现有的全部家当。27岁的彝族女孩李亚梅是公司里最年长的数据标注员，她高中学历，出身于蒙自农村，如今是一个两岁孩子的妈妈。她想通过这份工作，给孩子赚点尿不湿和奶粉钱。

月收入两三千元不算高薪，但相比于许多奔波劳累的工作，对着电脑重复操作界面8小时，就可以赚得这份收入，李亚梅感到满足。

以前，李亚梅做销售宽带的话务员，收入差不多，每天连续拨打7个小时电话，时常被人误会为骗子。那是份挑战她性格的工作，“好紧张啊，就希望对面不要接电话”。

数据标注这份工作，李亚梅没经面试，就直接被老板邢开瑞录用。邢开瑞也是27岁，他刚创业，缺人，对员工不设置门槛，“只要你愿意

登录后获取更多权限

立即登录

欢迎分享、点赞与留言。本作品的版权为南方周末或相关著作权人所有，任何第三方未经授权，不得转载，否则即为侵权。

AI 数据标注员