当鉴黄师是怎样的体验？

【行业资讯】2020-08-31

分享到

随着移动互联网的飞速发展，网络上涌现出海量的文本、图片、语音和视频信息。

在这个流量就是金钱的时代，“黄色内容”自带流量，于是就有不法分子想借此走捷径，达到一些不可告人的目的。

而“鉴黄师”的职责就是净化网络中的涉黄内容……

说到鉴黄师，有些人表情就开始丰富起来……

我的同事也这样，表情扭曲的样子像是期待，又像是无奈……

为了刺破吃瓜少年的幻想，还鉴黄师一个清白。胡拉哥采访了一位资深的鉴黄专家，帮我们揭开内容净化的神秘面纱。说实话，我看他消瘦的样子，一定很累吧。

1.工作累不累？

我们每日审核的内容数量在亿级规模，因此完全交给人工鉴别是不现实的。当前主流的做法是采用“机器+人工”的方式。首先利用算法过滤掉大部分内容，之后交给人工判断。在算法越来越成熟的条件下，我们的工作相比之前轻松了许多。

2.算法鉴黄是什么？

利用机器学习技术“训练”出一个“算法模型”，或者说是AI鉴黄师。通过打好标签的数据告诉机器哪些内容涉黄，哪些不涉黄。这样一来，算法模型可以自动总结出涉黄的特征（如下图所示）。

顺便说一下机器鉴黄的好处：一是效率高，可以实时检测用户上传的内容；二是检测结果客观，不受情绪影响。

3.鉴黄难不难？

下面我举几个例子来解释一下当前面临的一些挑战。

（1）可能涉黄的主体多样化。包括真人、动物、卡通、艺术等。算法模型需要针对性地考虑各种可能涉黄的主体。

以卡通为例，人物线条简单且比例失真，这些因素会增加算法判断的难度。

（2）色情内容没有绝对的标准。大致分为露点和不露点两类。前者识别起来相对容易。而不露点的内容在色情和性感之间的边界是模糊的，因此识别起来比较困难。

（3）“非通用”色情内容不好判断。以情趣用品图片为例，直观上它的危害程度不及通用色情。但是如果一个面向青少年的APP每天都在传播各种情趣用品图像，我们鉴黄师显然不能袖手旁观。

这种类型的难点在于容易误判：一方面和情趣用品外形相似的物品很多，比如某些儿童玩具；另一方面用户产生的内容中情趣用品的占比太少（大约百万分之一），如果审核严格一些，就会带来较多的误判。

（4）用户对抗。当用户上传的内容被鉴定为非法内容时，他们会采取技术手段突破算法的审核。常用的技术是用修图软件（例如Photoshop）遮挡部分内容，从而绕过算法。更高级的方法是利用机器学习技术，以己之矛攻击己之盾，通过增加人类不可见的噪声（但机器可见）来欺骗算法。

下图利用机器学习的方法给左边的熊猫增加了一些噪点，得到了右边的熊猫。人眼无法察觉左右两张照片的区别，但是算法模型却把右边的熊猫误认为长臂猿。

4.工作开心吗？

我们用技术创造一个干净和谐的互联网环境能带来职业上的成就感，但是解决问题的过程常常是痛苦的。

例如需要定期收集人工审核员的反馈结果，然后讨论一些极端案例。这些内容往往超越普通人的理解，会引起内心的极度不适。

内容审核的工作看似容易，实则要求超越常人的心理承受能力。他们每天被迫观看大量恐怖、色情和凶杀图片及视频，很多人患上了心理后遗症——经常失眠、做恶梦、脑子里充满图片和视频内容。

国外有一名内容审核人员描述了浏览这些暴力、色情和令人不安的内容给她留下的情绪损伤和心理影响，她说：“当我从MySpace离开的时候，我大概有3年的时间不肯和人握手，因为我觉得人们都很恶心。我无法触碰别人。”她称，世界上最普通的人也都是TM的怪胎。“我从那里出来的时候对人性感到厌恶。我的同僚们，大多数也和我有一样的感觉，我们都对人性留下了可怕的观感。”

鉴黄是“内容审核”行业的冰山一角，“暴力、政治、违法”等敏感内容都在监控范围内。网络内容犹如一片茫茫的数据海洋，其中暗流涌动，如何实现有效、高效拦截？

“靠人力堆砌”、“不需要太多专业技能”、“职业赛道发展狭窄”、“无情的盯屏机器”、“昼夜颠倒”、“精神污染”是这个行业留给许多人的印象。不过，传统鉴黄师靠的是肉眼，如今他们可以依靠技术。人工智能的发展，正在改变这一切。

第一，节约了大量人工。UGC产品审核量大，人力成本高，易盾智能审核管理系统辅助人工审核、质检，支持全面的文本审核、图片审核、视频审核、音频审核，大大提高内容审核效率。

第二，改变了从业人员的职能。易盾智能审核管理系统具备多样的拦截策略配置，包括智能关键词、智能规则、高频规则、文本特征、联系方式特征。未来，内容审核员能够将重心放在观察和分析上。

第三，拓展了审核范围。易盾智能审核管理系统支持全面的文本审核、图片审核、视频审核、音频审核。此外，智能系统能够审核多部门、多平台发布公开内容，严格规范信息发布流程，审核流程可溯源、审核结果可统计。

来源：“生活研究生”微信公众号，作者胡拉哥

分享到

当鉴黄师是怎样的体验？

热门标签

热门文章

网易易盾接入DeepSeek，数字内容安全“智”理能力全面升级

数字内容风控圈「顶流」的 2024 年终总结

2024年度游戏安全报告发布：200+亿次风险检测背后的攻防全景

“AI换脸”骗过人脸识别？黑产攻击新手段应如何防御？

网易易盾亮相FCIS 2024网络安全创新大会，分享AIGC内容安全体系建设经验