中文站

在网易,你如何管理1500人的审核团队?

任何世界的美好,都有人负重前行

纪录片《Im Schatten der Netzwelt》中,脸书的审核编辑一天需要审核 25000份内容 ,这些内容中遍地都是暴力、色情、恐怖主义…… 他们的职责,是把这个世界的暗面阻隔在我们的视界之外。


01 共识:健全内容审核机制

自2022年ChatGPT引爆AI大模型热潮,我们迈入了AIGC时代,数字内容如图片、视频、文本等呈爆炸式增长。新的生产方式为内容平台注入更多活力的同时,个人用户对关注量和影响力的过度追求、平台对经济效益和影响力的战略诉求,不可避免地导致低俗媚俗、血腥暴力、负面敏感、网络谣言等问题内容滋生,这给平台运营带来了更大的安全挑战。

近年来,监管部门出台了一系列法律法规和规范性、政策性文件,如《中华人民共和国网络安全法》《网络安全生态治理规定》《关于进一步压实网站平台信息内容管理主体责任的意见》《生成式人工智能服务安全基本要求》。相关规定要求,网络平台在用户账号、内容审核、信息发布、跟帖评论等方面加强平台治理,切实履行内容管理主体责任。

在这样一个网络意识多元和监管常态化的背景下,健全内容审核机制已经成为了内容平台的共识。那么,如何建立一套专业的审核机制和敬业的内容审核团队?

02 智能审核时代 = 机审 or 人审?

尽管机器审核在处理大量数据和识别违规内容方面具有显著优势,但它在面对网络内容中复杂的意识形态和价值导向问题时,仍然存在一定的局限性。这可能导致一些敏感内容未能被有效识别和过滤,从而在平台上出现,对网络生态的健康造成潜在影响。

在智能审核时代,人工审核的深度和细致仍然是机器审核所无法替代的,尤其是在处理那些机器难以识别的敏感和复杂内容时。人工审核能够提供更为精准和深入的分析,确保内容的安全性和合规性,对于维护网络环境的健康发展具有不可替代的作用。

同时,对于人工审核而言,面对海量的内容量以及日益多元化的意识形态,也会面对如下的问题:

○ 专业素养:审核人员不仅需要具备扎实的政治理论知识,还应具有人文素养和媒介素养,以更好地理解和判断内容的复杂性。

○ 心理压力:在严格的质量控制和处罚规则下,审核人员在把握审核尺度时承受巨大压力,这可能影响他们的判断力和心理健康。

○ 精准分析:审核人员需要在极短的时间内对内容做出判断,这限制了他们对单条内容深入分析的能力,从而可能降低审核的准确度。

○ 工作强度:面对海量的用户生成内容,为了确保内容安全和减少失误,平台需要提高人工审核的效率。

○ 如此看来,机器审核和人工审核都各有弊端。那么,AIGC时代的最佳审核机制是怎么样的呢?

03 在网易,你如何管理1500人的审核团队?

以网易易盾为例,2023年全年,易盾检测数据量超过9000亿,抵御外挂威胁300亿次+,处理移动安全风险超400亿条。

在这亮眼的成绩背后,自然离不开网易易盾分布全球的1500位兢兢业业的审核团队,但更离不开他们手中「智能审核系统」的“屠龙三式”——:提升审核人员效率、加强人员培育管理、加强策略运用能力。

优秀的审核系统不是单纯地替代“人审”,更应该提升团队的审核效率,强化实战能力,为审核人员提供更丰富实用的审核工具。同时,审核系统更需要为管理者提供更多、更精准的参考标准,帮助管理者能对审核人才适配的管理制度,能更好的建立起来一支业务优良、爱岗敬业的审核团队。

在智能审核时代,基于大数据、人工智能、深度学习等技术的机器审核+人工审核+智能审核系统相结合,已趋于成为平台型企业的主流审核机制。

屠龙一式:提升审核人员效率


智能审核系统中的直播电视墙支持最大38路直播视频流同时播放审核,是您直播内容巡检、查询、审核操作的不二之选,完美契合快速直播审核需求。


审核系统使用起点便是配置审核模板,在审核模板中易盾有许多细节的配置用于精细化管理审核人员:

○ 关闭快捷处理,让审核人员逐条必审,在关键节点(重保)提升审核力度。

○ 设定高亮词,从管理维度提醒审核人员,不要漏过高危内容。


自建图片算法模型,凝练易盾人工智能团队智慧结晶,只需提供30张特征明显图片,即可在5分钟内创建出一个识别率在80%以上的图片模型,可帮助您快速应对突发内容安全风险。

屠龙二式:加强人员培育管理

模拟考试是在审核系统中进行拟真的审核操作,主要场景是用于新员工培训,熟悉审核系统操作的同时不会对线上数据产生影响。当产品内部出现新的违规内容形态或改变了审核规则,都可以建立相应的考题在日常培训之后进行考试。

(当前易盾大部分客户的考试频率是月考,定期对每一位审核人员进行能力认证,以此来掌握审核人员能力水平,提升审核人员专业素养)


实战考核又名“投毒”,管理员可以自己设置考题,将这些题目无感知的投放到审核人员日常工作环节中,在真实工作状态下对审核人员进行考核,掌握其真实能力水平。

投毒场景:

○ 重要培训过后隔两天,无感考核其知识点掌握程度

○ 时事热点发生后,考核审核人员敏感度

○ 新员工实时培训考核

(多数平台客户每天都会进行投毒,这种考察是一个长期的过程,根据考核结果,不断优化培训机制、对审核人员进行针对性特训和业绩评价)


智能审核系统首页就是监控大屏,用于查看文本、图片等每一个业务的待审情况,除了重点关注待审数据量之外,还需要查看“平均出审时长”、“平均超时时长”这两个指标,用来掌握审核团队目前的工作情况。

(在顶部,能够看到“在线人数”与”审核活跃人数“两个功能,点击设置按钮可以对审核活跃进行定义,时间设置得越短,越能够掌握到审核人员的审核频率)


人员工作数据统计是是管理审核人员的重要指标,这里可以看到每个审核人员工作时长和工作效率,对人才“选用育留”提供参考标准。


“人审供应商管理”功能,允许引入并管理多达500家人审供应商。通过全新的“部门”功能,您可在账号管理页面创建审核部门,并将审核员帐户添加进去,实现对供应商账号的管理,实现“数据权限隔离” 、“数据统计分析”和“AI 智能排名”功能。

屠龙三式:加强策略运用能力

拉通机审+人审的数据生命全流程,监控数据指标,可根据指标情况下钻到策略、模型、规则等维度的配置,进行策略略调整。


覆盖十余种监控指标,支持指标高频计算与按月维度计算两种模式,常用于监控不通过率的波动、检测用量的上限、检测失败占比过大预警等场景。


提供全面的机器审核统计数据,涵盖质检、次品识别、误漏判情况及关键性能指标:精确率和召回率,助力精准评估审核效能,优化决策过程。

策略结果指标:分析提供规则、关键词的检测结果的统计数据,包括命中数、质检数、覆盖率、精确率和误判数、误判占比和误判数据详情。通过该模块快速了解策略布控结果,及时调整策略。

审核团队在内容平台中扮演着至关重要的角色,他们不仅是网络安全的守护者,也是健康网络生态的建设者。随着人工智能技术的不断进步,我们预见审核团队将经历转变。他们将不再仅仅是内容的筛选者,更会成为人工智能技术的引导者和训练者,负责监督和优化机器审核的过程。这样的转变将使得内容审核人员更加注重知识性和技术性,网易易盾「智能审核系统」致力于为审核团队提供更广阔的职业发展空间和更有意义的工作内容,以应对不断变化的网络安全挑战,保障用户的网络体验,同时为审核团队提供持续成长和发展的机会点击了解易盾「智能审核系统」