快乐至上的游戏世界里，为何也需要一面「内容防火墙」？

【技术干货】2024-02-20

分享到

“某些对抗类游戏中，团战一个配合没打好，队友之间恶语相向，言辞激烈至问候双方家人。”

“为了博眼球博流量，各种游戏中的角色造型设计越来越大胆，拟人化角色裸露的部分越来越多。”

“本应是玩家之间友好交流的聊天频道，屡屡被“拉人广告”、“诈骗广告”、“色情广告”刷屏，导致无法进行正常的游戏交流。”

以上这些情况，几乎是当下每一款游戏都会遇到的“内容安全”问题。前不久，网易易盾发布的《2023年度游戏安全观察与实践报告》中对这些问题做了详细分析和解读。

近年来，随着游戏产业的高速发展，游戏不仅成为了人们休闲娱乐的工具，同时也扮演着文化传播的内容载体。伴随着开放式派对游戏的火爆，游戏内容创作不仅包含了游戏厂商的产出，同时玩家也在游戏内容创作中发挥着越来越大的价值。

同时，游戏具有极强的社交属性，游戏玩家在游戏中通过语音、文字、表情等形式进行团队配合、交友“唠嗑”、招募队友等等。

因此，即便是遵循“放飞自我、快乐至上”原则的游戏世界里，也需要一面“内容防火墙”帮助来维护游戏世界里的清朗。

01.违规内容：如灰尘般无孔不入

《游戏安全报告》中指出：游戏内容安全风险，一般是指游戏内生产的内容不符合国家法律规定、社会公序良俗约束，以及恶意导流的相关文本、图片、表情、语音等。

随着沙盒游戏、派对游戏等开放世界游戏的发展，也衍生出了大量玩家自主创作的场景性违规内容，需要引起游戏厂商重点关注，此类问题轻者影响玩家体验，重者则会直接导致游戏停服危险。

游戏的垃圾信息包含多种多样，从形式上来看我们可以理解为文字、图片（含表情包）、音频为主，部分游戏内还存在视频载体内容。常见违规内容载体包括但不限于以下：

文本内容：常规违规内容较多

文本内容作为最为常见的游戏互动载体，主要的违规内容包含色情、违禁、广告和谩骂，因为此类内容文本较为容易理解，且能够直接被其他玩家获取和感知。文本内容会出现较多的变种类型，比如数字、字母、密码组合等，通过这种方式传播违规信息。

图片内容：视觉化素材更具冲击力

游戏内的图片类素材主要是以玩家头像、表情包和群聊内的jpg格式图片为主，图片素材由于更为容易被理解且有传播性，所以图片类违规内容会增加更多的变形，比如二维码、恶心物、暴恐等，对于这类图片，游戏运营方需要第一时间进行处理封禁，特别是对于部分允许自定义上传表情包的游戏。

音频内容：谩骂与色情占据主导

游戏的音频内容我们可以理解包含了游戏NPC语音、游戏动画语音、玩家单条语音，玩家实时互语音，相对来说最为常见的是玩家的互动语音，这类语音多见以谩骂为主，特别是在FPS游戏中，以及一些团战类游戏中，语音的谩骂较为常见。

网易易盾在长达7年与违规内容的战斗中，总结出了违规的内容的三大特点。

国内游戏中的违规内容由于涉及数量巨大，类型多样，更新快等特点，同时游戏违规内容又涉及各类监管问题，所以在治理难度上相对于其他载体更为困难，具体来说：

违规内容的量级很大，且影响的用户群体广泛。解决这些问题需要处理大量数据和信息，投入大量时间和资源。

违规内容包括色情、广告、谩骂、违禁等多种类型，并且游戏场景也各不相同，因此针对不同的游戏场景和违规类型，需要采用不同的处理方法和技术，依赖高效精细的治理体系。

黑灰产常常采用文字变种、分段发布等方式，以绕开反垃圾策略，这使得平台需要持续攻防，增加了打击违规行为的难度。

因此，在游戏世界中，造一面坚强的“内容防火墙”虽是急需，却也并不容易。

02.内容安全治理，还游戏世界一片清朗

《游戏安全报告》的推荐单位之一，反网络黑灰产联盟对游戏违规内容做了以下解读：根据《互联网信息服务管理办法》和《互联网用户账号信息管理规定》，发布网络违规内容均要承担相应的法律责任。对于网络信息内容服务平台来说，也需履行相应的责任和义务。

网络信息内容服务平台应当履行信息内容管理主体责任，加强本平台网络信息内容生态治理，培育积极健康、向上向善的网络文化；网络信息内容服务平台应当设立网络信息内容生态治理负责人，配备与业务范围和服务规模相适应的专业人员，加强培训考核，提升从业人员素质；网络信息内容服务平台应当加强信息内容的管理，发现《互联网信息服务管理办法》第十五条信息的，应当依法立即采取处置措施，保存有关记录，并向有关主管部门报告。

针对各类游戏内存在的内容风险问题，网易易盾内容安全团队在多年实践中积累了大量的经验。从具体的游戏安全风险来看，网易易盾对于不同的内容载体进行了精细化的运营方式与拆解。

对于可能出现文本中的色情低俗、谩骂嘲讽、拉人引流等违规内容问题：网易易盾采用百万级别人工标注的游戏语料训练NLP模型，结合十万量级敏感词库能力，有效地检测和拦截内容中的色情低俗、谩骂嘲讽、拉人引流等有害信息。

对于可能出现在图片/视频中的色情低俗、广告、违禁内容问题：网易易盾采用上百个子分类CV模型，结合百万量级图库能力，可精细化检测拦截内容中包含的色情、性感低俗、广告、违禁人物等有害信息。

对于可能出现在音频中的色情低俗、谩骂嘲讽、违禁内容问题：网易易盾采用娇喘ASMR、声纹识别以及ASR技术，结合违禁音频库，有效地识别音频中的娇喘呻吟声、违禁人物声音以及其他在文本审核中常见的违规有害信息。

曾经有一位Dota游戏主播海涛说过一句广为流传的口号“不图不挂素质游戏，净化Dota从我做起”。

守护快乐至上的游戏精神，需要玩家自律，需要平台自查。在面对铺天盖地的违规内容时，我们也需要用科技的力量打造一面“内容防火墙”。

点击免费下载《2023年度游戏安全观察与实践报告》

分享到

快乐至上的游戏世界里，为何也需要一面「内容防火墙」？

热门标签

热门文章

Unity 引擎高危漏洞 CVE-2025-59489 深度解析：覆盖十年版本，游戏行业迎安全大考

多模态大模型综合防御体系，构筑金融安全 “护城河”

新规将至，网易易盾「AI生成识别」破局合规焦虑

国内首个！网易易盾参编国标《生成式人工智能服务安全基本要求》，领先助力行业健康发展

2024年度游戏安全报告发布：200+亿次风险检测背后的攻防全景