网易易盾算法专家李雨珂出席音视频技术大会，分享AI助力下的内容安全攻防术

【易盾动态】2020-11-12

分享到

10月31日~11月1日，LiveVideoStackCon2020音视频技术领域峰会在北京举行。本届大会以“多媒体开启新世界”为主题，汇集了国内外音视频技术领域100余位顶尖技术专家，话题涵盖教育、娱乐、社交、电商等十余个领域。网易易盾作为国内领先的内容安全服务商受邀参会，并分享在“数字内容风控”领域的技术经验和实践成果。

当天，网易易盾资深算法专家李雨珂博士出席了大会，并围绕“人工智能技术下内容安全攻防对抗”进行了分享。此次演讲主要包括三大部分的内容：

○ 内容安全的常规技术操作，以及针对性的技术升级

○ 内容安全的实际对抗问题，以及针对性的优化方案

○ 易盾在内容安全方向上的实践成果

疫情期间，网络直播、短视频成为互联网赛道“弯道超车”的利器。随着信息通讯技术快速发展，教育、娱乐、社交、电商等多个行业都积极拥抱多媒体内容。新场景源源不断，内容审核也遇到了前所未有的挑战。

李雨珂博士指出，在内容安全攻防战中，一个关键信息是“场景”。当前，许多强大的人工智能基础算法已经到位，如何与实际应用场景相结合是最重要的，这关系到技术能力成功商业化和为客户创造真实价值。

一、AI打造互联网内容的柔性过滤器

在多媒体开启的新世界中，发布权不再是专业内容机构的专利，任何普通用户都能实时在线发布，不再需要层层审核，产出的内容也是五花八门，涵盖文本、图片、音视频。在内容量大增的同时，有害内容就像果蝇一样快速繁殖，我们如何应对海量内容所带来的审核挑战？

相对于传统审核模式，易盾在互联网内容审核工作中使用了大量深度学习技术，并拓展至精细化分类的审核需求。深度学习技术不断适应新型样本对抗，让算法了有更好的实时识别能力，自主解决一部分复杂的问题。

由于模型效果不断提升，模糊化、涂改、掩盖、手写手绘等早期内容安全场景下的对抗样本已经可以通过模型直接处理。不过,语义抽象化，破坏内容特征等对抗形式的出现，也对模型提出了更高要求。

“实际上，在短期内，攻防对抗问题无法完全直接从算法模型角度解决，这也是行业从业者的一个共识。”李雨珂博士说，“如果一上来就死磕模型，投入产出是不容乐观的。”

李雨珂博士认为，在这一现状下，安全厂商需要设立一个渐进目标，即通过技术手段，尽可能减小防守的时间滞后性，尽可能降低攻击对业务的影响。

基于以上目标，易盾设计了一条防守技术路径，由敏捷发现、精细排查、全面布控三个主要步骤组成。易盾技术团队的发力点，也从强调模型实时拦截能力转向为审核团队提供更有效的技术工具，通过多维度、多因子技术能力协同作用实现防控。

“不良有害信息拦截如同漏斗过滤渣滓，”李雨珂博士这样形容。为了得到可靠数据，易盾将原始信息流进行逐步处理，包括实时过滤、发现、排查几个步骤，集合特殊召回、聚类、高效巡检机制、属性标签、图搜、策略于一体。

具体而言，在整个流程中，实时过滤器是最上面的一层滤纸。实时过滤后的信息，再过一遍高效巡检机制，就能发现滤纸遗漏的有害信息。这些有害信息被聚在一起，将成为种子样本。有了种子样本，易盾接着对其他数据进行更全面细致的排查，搜查到更多有害信息。当然，最终沉淀下来的样本会反过来用于实时过滤器的效果增强，将这一层最顶上的滤纸做的更加厚实，形成良性循环。

二、多维度技术更好把控场景和细分领域

现阶段，易盾通过人工智能已全面赋能客户拦截色情、低俗、暴恐、违禁等各种类型的不良有害信息。随着业务的发展，易盾检测能力的覆盖的范围越来越广，涉及的细分领域也越来越多，以满足客户精细化运营的需求。

○ 某秀场直播产品，需要对“露沟”、“腿部特写”、“赤膊”等内容做特殊时期的管控需求。

○ 某教育类产品，需要对“骷髅”、“密集物体恐惧症”做不通过处理。

○ 某社交产品需要对“赤膊”区分“漏点赤膊”与“非漏掉赤膊”。

为了解决这一系列业务问题，易盾采用了特征分层的多模型融合方法，该方法不仅让服务有能力准确完成精细化分类任务，还可以大规模节省计算量，即同时为服务性能和效果提供保障。

在图像审核过程中，易盾采用了图像分类、目标检测、人脸识别、OCR等技术。易盾的服务不但会分析图片的全局信息，也会检测服饰、违禁品、徽章等元素信息，同时还会对图中人脸和文字信息进行识别和判断。

另一个特殊点是，易盾研发的图像技术更加贴合内容安全实际场景。以人脸为例，实人信息认证中的人脸方法，更看重的是特定拍摄条件下精确度保障和误判控制，而内容安全中的人脸方法，强调的是各种类型数据的召回能力，对于各类模糊脸、小脸都需要有良好的识别效果。

与此同时，李雨珂博士认为“内容安全风控”应不只局限于内容维度，也应着眼于用户行为和用户关系。“在内容安全场景，黑产用户的行为、关系网络都有鲜明的特点，根据这些特点我们可以联合内容分析维度和用户风控维度，协同作用强化对抗能力。”李雨珂博士分享到。

三、总结

当前，内容安全的重要性已多次被提及。对于企业来说，利用人工智能等技术，提升自身技术审核能力，做好对有害内容“事前防范”与“事后追责”是业务的生命线。一旦出现内容安全问题，随之而来的可能是产品下架和内容复查，这会给企业带来不可估量的损伤。

李雨珂博士强调，适应多媒体时代的内容审核，离不开三大关键词：一是“成本控制”，人工介入在这一过程是必要的，而通过技术手段降低防守成本是技术的核心诉求；二是“技术联合”，通过多种技术手段联合作用，优先召回风险数据，自主感知潜在风险，不断缩小排查范围，同时还包括人工和机器的联合；三是“主次有序”，即策略先行，模型能力缓行。

通过上述三个关键词，易盾完整地制作了完善的内容安全解决方案，实现了在高并发、高性能要求下，做到精准识别并且满足精细化要求，在训练素材极为有限的情况下，做到定制模型的快速制作和特定目标的快速识别。除了精准与快速之外，易盾的内容安全解决方案更加协同与智能化。

分享到

网易易盾算法专家李雨珂出席音视频技术大会，分享AI助力下的内容安全攻防术

热门标签

热门文章

网易易盾接入DeepSeek，数字内容安全“智”理能力全面升级

数字内容风控圈「顶流」的 2024 年终总结

2024年度游戏安全报告发布：200+亿次风险检测背后的攻防全景

“AI换脸”骗过人脸识别？黑产攻击新手段应如何防御？

网易易盾亮相FCIS 2024网络安全创新大会，分享AIGC内容安全体系建设经验