中文站

快乐至上的游戏世界里,为何也需要一面「内容防火墙」?

“某些对抗类游戏中,团战一个配合没打好,队友之间恶语相向,言辞激烈至问候双方家人。”

“为了博眼球博流量,各种游戏中的角色造型设计越来越大胆,拟人化角色裸露的部分越来越多。”

“本应是玩家之间友好交流的聊天频道,屡屡被“拉人广告”、“诈骗广告”、“色情广告”刷屏,导致无法进行正常的游戏交流。”


以上这些情况,几乎是当下每一款游戏都会遇到的“内容安全”问题。前不久,网易易盾发布的《2023年度游戏安全观察与实践报告》中对这些问题做了详细分析和解读。

近年来,随着游戏产业的高速发展,游戏不仅成为了人们休闲娱乐的工具,同时也扮演着文化传播的内容载体。伴随着开放式派对游戏的火爆,游戏内容创作不仅包含了游戏厂商的产出,同时玩家也在游戏内容创作中发挥着越来越大的价值。

同时,游戏具有极强的社交属性,游戏玩家在游戏中通过语音、文字、表情等形式进行团队配合、交友“唠嗑”、招募队友等等。

因此,即便是遵循“放飞自我、快乐至上”原则的游戏世界里,也需要一面“内容防火墙”帮助来维护游戏世界里的清朗。

01.违规内容:如灰尘般无孔不入


《游戏安全报告》中指出:游戏内容安全风险,一般是指游戏内生产的内容不符合国家法律规定、社会公序良俗约束,以及恶意导流的相关文本、图片、表情、语音等。

随着沙盒游戏、派对游戏等开放世界游戏的发展,也衍生出了大量玩家自主创作的场景性违规内容,需要引起游戏厂商重点关注,此类问题轻者影响玩家体验,重者则会直接导致游戏停服危险。

游戏的垃圾信息包含多种多样,从形式上来看我们可以理解为文字、图片(含表情包)、音频为主,部分游戏内还存在视频载体内容。常见违规内容载体包括但不限于以下:

文本内容:常规违规内容较多

文本内容作为最为常见的游戏互动载体,主要的违规内容包含色情、违禁、广告和谩骂,因为此类内容文本较为容易理解,且能够直接被其他玩家获取和感知。文本内容会出现较多的变种类型,比如数字、字母、密码组合等,通过这种方式传播违规信息。

图片内容:视觉化素材更具冲击力

游戏内的图片类素材主要是以玩家头像、表情包和群聊内的jpg格式图片为主,图片素材由于更为容易被理解且有传播性,所以图片类违规内容会增加更多的变形,比如二维码、恶心物、暴恐等,对于这类图片,游戏运营方需要第一时间进行处理封禁,特别是对于部分允许自定义上传表情包的游戏。

音频内容:谩骂与色情占据主导

游戏的音频内容我们可以理解包含了游戏NPC语音、游戏动画语音、玩家单条语音,玩家实时互语音,相对来说最为常见的是玩家的互动语音,这类语音多见以谩骂为主,特别是在FPS游戏中,以及一些团战类游戏中,语音的谩骂较为常见。

网易易盾在长达7年与违规内容的战斗中,总结出了违规的内容的三大特点。

国内游戏中的违规内容由于涉及数量巨大,类型多样,更新快等特点,同时游戏违规内容又涉及各类监管问题,所以在治理难度上相对于其他载体更为困难,具体来说:

违规内容的量级很大,且影响的用户群体广泛。解决这些问题需要处理大量数据和信息,投入大量时间和资源。

违规内容包括色情、广告、谩骂、违禁等多种类型,并且游戏场景也各不相同,因此针对不同的游戏场景和违规类型,需要采用不同的处理方法和技术,依赖高效精细的治理体系。

黑灰产常常采用文字变种、分段发布等方式,以绕开反垃圾策略,这使得平台需要持续攻防,增加了打击违规行为的难度。

因此,在游戏世界中,造一面坚强的“内容防火墙”虽是急需,却也并不容易。

02.内容安全治理,还游戏世界一片清朗


《游戏安全报告》的推荐单位之一,反网络黑灰产联盟对游戏违规内容做了以下解读:根据《互联网信息服务管理办法》和《互联网用户账号信息管理规定》,发布网络违规内容均要承担相应的法律责任。对于网络信息内容服务平台来说,也需履行相应的责任和义务。

网络信息内容服务平台应当履行信息内容管理主体责任,加强本平台网络信息内容生态治理,培育积极健康、向上向善的网络文化;网络信息内容服务平台应当设立网络信息内容生态治理负责人,配备与业务范围和服务规模相适应的专业人员,加强培训考核,提升从业人员素质;网络信息内容服务平台应当加强信息内容的管理,发现《互联网信息服务管理办法》第十五条信息的,应当依法立即采取处置措施,保存有关记录,并向有关主管部门报告。

针对各类游戏内存在的内容风险问题,网易易盾内容安全团队在多年实践中积累了大量的经验。从具体的游戏安全风险来看,网易易盾对于不同的内容载体进行了精细化的运营方式与拆解。


对于可能出现文本中的色情低俗、谩骂嘲讽、拉人引流等违规内容问题:网易易盾采用百万级别人工标注的游戏语料训练NLP模型,结合十万量级敏感词库能力,有效地检测和拦截内容中的色情低俗、谩骂嘲讽、拉人引流等有害信息。

对于可能出现在图片/视频中的色情低俗、广告、违禁内容问题:网易易盾采用上百个子分类CV模型,结合百万量级图库能力,可精细化检测拦截内容中包含的色情、性感低俗、广告、违禁人物等有害信息。

对于可能出现在音频中的色情低俗、谩骂嘲讽、违禁内容问题:网易易盾采用娇喘ASMR、声纹识别以及ASR技术,结合违禁音频库,有效地识别音频中的娇喘呻吟声、违禁人物声音以及其他在文本审核中常见的违规有害信息。

曾经有一位Dota游戏主播海涛说过一句广为流传的口号“不图不挂素质游戏,净化Dota从我做起”。

守护快乐至上的游戏精神,需要玩家自律,需要平台自查。在面对铺天盖地的违规内容时,我们也需要用科技的力量打造一面“内容防火墙”。

点击免费下载《2023年度游戏安全观察与实践报告》