中文站

践行“清朗” | 网易易盾生活服务行业内容安全专项解决方案

“清朗”专项行动是由中华人民共和国国家互联网信息办公室部署开展的专项行动。自2020年起至今,每年开展一次,旨在让网络空间这个亿万民众的精神家园“天清气朗”。

去年,国家网信办组织开展13项“清朗”专项行动,累计清理违法和不良信息5430余万条;处置账号680余万个,下架App、小程序2890余款;解散关闭群组、贴吧等26万个,关闭网站超过7300家,有力维护网民合法权益。全年整治工作取得扎实成效,为广大网民成功营造了文明健康的网络环境。


今年3月28日,在国务院新闻发布会上,国家互联网信息办公室有关负责人介绍了2023年“清朗”系列专项行动的相关情况。2023年“清朗”系列专项行动,将认真贯彻落实党的二十大精神,以“推动形成良好网络生态”为工作目标,聚焦新情况新问题和难点瓶颈,开展一系列专项整治。


近年来,我国生活服务类平台蓬勃发展,为广大网民衣食住行提供了很大便利,成为人们日常生活中不可或缺的重要工具。国家互联网信息办公室网络执法与监督局局长华清在会上介绍,部分平台内容审核把关能力不够强,产生了一些信息内容问题乱象。

生活服务类平台面向的用户群体下至未成年,上至老人,各类信息资讯冗杂繁多,人与人之间发生交流的门槛较低,同时涉及个人与企业,诸如电商平台、信息分发平台、到店服务平台、直播平台等等,是“清朗”专项行动的主要目标。可能涉及:

  1. “清朗·打击网络水军操纵信息内容”专项行动

  2. “清朗·优化营商网络环境 保护企业合法权益”专项行动

  3. “清朗·生活服务类平台信息内容整治”专项行动

  4. “清朗·网络戾气整治”专项行动


因此,生活服务类平台的企业方对于平台上的内容要做到方方面面合法合规、安全稳定,面临巨大的难度,却是一个不得不完成的挑战。在这项挑战上,平台方需要解决的不是某一项或某一天的问题,而是一系列连环的难点问题——

  1. 平台上的哪些行为、内容不合规?

  2. 如何用最高效、最准确的方式检测发现违规内容,避免违规行为?

  3. 不合规的内容被成功检测发现后,如何进行治理?

  4. 如遇复杂场景下的复杂问题,如何确保影响最小化?

  5. 如何能实现平台“长治久安”?

  6. ……


基于此,网易易盾洞察监管要求与企业合规需求,推出了面向互联网生活服务平台行业的专项解决方案。


01.

知己知彼,事先洞察“违规点”


在打击网络水军操纵信息内容行动项上,“清朗”行动重点提到操纵信息、同质化文案、刷转评赞、机器人水军、批量养号等违规行为。平台企业需要应用智能风控技术在注册、登录、业务等环节埋点,从设备、账号、行为、业务、内容等多角度切入,对用户勾勒精准画像,拦截网络水军。

在优化营商网络环境,保护企业合法权益行动项上,“清朗”行动重点提到有关企业/企业家的不实谣言问题。平台企业需要对评论区、群组、互动板块清理企业/企业家不实负面信息,针对搜索联想词进行合规清洗;其次设立举报通道,充分发挥群众力量,鼓励大家检举不法不实谣言,对举报内容进行人工复核。

在生活服务类平台信息内容整治行动项上,“清朗”行动重点提到推荐页、搜索结果违法违规商品及导向不良信息,诱导点击类广告弹窗等问题。平台企业需要对平台内的商品信息进行上架审核,剔除违法违规商品,如管制刀具、迷药、毒品等,对商品广告存在不良导向内容清洗,如软色情、性暗示、儿童色情等;其次识别使用“关闭”“播放”等虚假,不符合原本功能的按钮弹窗通知并诱导用户点击的弹窗广告。

在网络戾气整治行动项上,“清朗”行动重点提到低俗、恶俗、谩骂、互撕等网络戾气问题。平台企业需要在评论区落实网络实名制,对评论进行先审后发,严禁谩骂、低俗、种族歧视、地域歧视、性别对立;热点评论实时监测,热门内容阈值管理,高热内容周期性关联审核。


02.

人机融合,智能协作下的敏捷治理


人工智能技术在内容审核领域取得了出色的成果。通过“机审+人审”的方式,网易易盾提供人机高度融合的智能协作内容审核模式,帮助生活服务平台建立完善的审核机制。

AI内容审核

文字、图片、音频、视频等各种形式都是现代社交媒体中常见的形式。丰富的内容形式使得社交媒体具有更加丰富的表达方式,但也让审核更加困难。例如,与文字相比,音视频内容技术审核要求高,完善审查机制耗费较大人力财力。易盾通过多年的数据训练和经验沉淀,已经建立了如情感分析、观点分析、文本翻译等模型,通过模型匹配,只需要调用接口,一次请求可同时返回反垃圾及内容分析结果,同步、异步、单次、批量模式均兼容,大幅节省成本,并且支持500+的分类标签返回,全业务类型覆盖,助力精细化分析内容数据。


人工审核

在人工审核执行环节,易盾在全国多地搭建了专业审核团队,审核人员经过网信办等培训,持证上岗,为企业提供高效、准确、安全的人工审核服务。团队不仅拥有严格的审核标准和流程,不断提升自身的审核能力和水平,能够快速识别出各类违规信息,如色情、暴力、恐怖主义等,确保企业的内容安全和合规。此外,易盾还不断优化审核流程和技术手段,如二审、三审、多审等,提高审核效率和准确率,为企业节省时间和成本。


智能审核平台

智能审核平台是易盾自研的人机协作的平台,它将人类的智慧和机器的高效结合在一起,实现了审核工作的高效化和精准化。通过这种方式,审核人员可以通过人机协作的方式,快速、准确地审核大量的信息,从而提高审核效率和准确性。同时,智能审核平台还可以通过机器学习和人工智能等技术,不断优化审核算法,提高审核的智能化水平,为用户提供更加优质的审核服务。


03.

特定场景中的全方位护航服务

直播护航助手


直播早已成为当下网络生活中随处可见的场景,在短视频平台、电商平台甚至外卖平台都上线了直播功能,直播带货、直播做饭、直播相声……各类形式层出不穷,已经进入“全民直播”时代。但在直播场景下,内容风控的难度非常大。

易盾的直播护航助手服务,建立“事前物料防控体系、事中直播过程自查机制、事后内容安全复盘机制”的完善流程。在直播前,对在售商品、市场营销、直播台本进行合规审查,并且通过培训提升运营安全意识;在直播中,实时检测敏感词汇、劣迹艺人、敏感歌曲、人员装扮等;直播后执行重点时期复盘沉淀、历史数据定期回归、合规机制迭代优化等动作,为主播与平台方提供全方位无死角的直播内容安全服务体验。


品牌内容风控

在当下监管环境里中,许多品牌主在合规意识不足的情况下,在品牌对外内容中遗漏了许多不合规内容。易盾为品牌主提供品牌内容风控服务,覆盖企业官网、App、小程序、公众号等全部对外主站,对中国地图、旗帜、国家与地区称谓、涉广告法等内容进行重点检测,同时包括其他常规内容检测。

通过全站内容检测,网易易盾最终为品牌商输出完整的风险报告,对品牌内容进行全方位的解读与整理,并且提供具体风险点说明与治理手段建议,帮助品牌商维护品牌形象。


广告法合规检测




“最佳”、“第一”、“领导者”、“独家”从这些词汇判断违反广告法也许难度并不大,因为用词高调。但如果把这些词换成“顶级”、“填补国内空白”、“领先上市”、“最新科技”、“全国X大品牌之一”这些看上去没那么夸张的词呢?依然全部涉嫌违反广告法。 

在广告法合规检测场景下,易盾对DSP平台、融媒体、展示广告均提供了详细的合规解决方案,覆盖了广告产业的每一个环节,包括图片、文字、视频等内容形式,开屏广告、信息流广告、banner广告等各种广告形式,穿山甲、广点通等各种平台,确保企业不再受广告合规困扰。


04.

化被动为主动,方可长治久安


历史数据扫描

除了对现有数据和内容进行合规审核以外,对历史数据进行清洗扫描也相当有必要。新的法规实行可能与以往标准存在较大差异,同时平台方也需要配合业务发展,改变运营方向。

易盾为客户提供了清扫数据托管、制定清扫计划、效果跟踪/回溯三步走流程,帮助客户化解历史存量风险,更好保障未来发展。


安全蓝军服务

面对越来越严苛的监管环境与层出不穷的违规内容,在即时内容审核之外,易盾也推出了安全蓝军服务,化被动审核为主动演练,帮助平台企业提升面对未知风险的应变能力。

  1. 蓝军巡检:初次需要分析巡检产品特征与巡检方案制定,后续常规迭代最新策略巡检,便于发现板块中最新策略的漏判情况,包括历史数据,按周输出巡查报告并确定是否需要进一步蓝军攻击。
  2. 蓝军攻击:蓝军攻击:通过巡检分析潜在风险,与客户方沟通确认后进行蓝军攻击。


安全培训服务

除了用AI技术和人工军团为客户提供即时内容审核服务以外,易盾还提供为客户提供培训服务,通过培训,将安全合规的意识与知识赋予客户,帮助客户从源头建立稳健的发展基础。

面向业务一线运营、中层管理、高管等不同角色,易盾根据不同角色打造了全面的课程,配备专业的讲师团队,建立有完善的培训考核体系,能够明显提升全体团队的内容安全意识形态。


目前我国网民人数已达10.67亿,形成了全球规模最大的网络社会。网络社会越是发展,网络形态越是丰富,净化网络生态就越重要,任务挑战也越艰巨。净化网络环境,离不开网民的支持。作为互联网平台类企业,更是有责任有义务维护自身平台上的网络环境。网易易盾作为网易智企旗下一站式数字内容风控品牌,将会携手各平台企业,一起真正践行“清朗”理念,配合“清朗”行动,让生活服务类平台真正惠及千家万户。