- 案例概括 -
在线阅读是一座随身携带的避难所,用户在这里体会最真实的人生百态,给苦闷的日子增加一丝趣味。违规内容,如黄色、涉政、暴恐、灌水等,无一不侵蚀着这座避难所的墙垣,有轰然崩塌之危,有贻害读者之毒。
近日,内容安全的巡检成为许多在线阅读平台相当重视的经营环节,平台逐字、逐句、逐行浏览每一部小说的文本,审核陷入低效甚至无效的恶梦中。
网易易盾通过“AI+人工”数字阅读解决方案的巡回检查,帮助在线阅读头部运营商提升3倍审核效率,更精准发现违规内容的所在。
- 客户介绍 -
每日占据用户130分钟,网文届黑马何以领跑?
国内某在线阅读头部运营商于2019年打造了一款网络文学APP,常年稳居在线免费网文平台前三甲,以“AI算法推荐 + 优质原创内容”的优势,搜罗都市、言情、甜宠、穿越、玄幻、修仙等热门小说,为用户免费提供在线小说和大型文献库。
以免费小说为核心,该运营商不断加强内容生态的建设,衍生出游戏、有声读物、IP电视连续剧,适应用户不断变化的内容偏好。
截止2020年12月,旗下网络文学APP日均活跃用户达到近1000万,每日阅读时长稳定在130分钟,签约作者超过3000位,原创作品贡献收入超过50%,高于行业平均水平。
- 遇到的问题 -
免费阅读风起,小说主线把握和合规审核成难题
网络文学市场竞争激烈,头部免费阅读 APP越来越看重内容竞争力与安全性。为寻求更大的商业价值和点击量,不少作品开始“钻空子”。
内容误,监管顾
网络文学诞生于自由宽松环境中,出现了色情、涉政、暴恐、违禁、广告、诈骗、灌水等有害违规问题内容,这些散布在小说中的“苍蝇卵”让读者大倒胃口,亦会孵化出更多风险。近年来,在网络阅读用户破亿的同时,监管也如期到位。
• 2019年3月,国家针对网络阅读行业展开“净网行动”,米读小说和番茄小说在2019年7月-10月整改停更,用户活跃度下降明显。
•《网络出版服务管理规定》、《互联网信息服务管理办法》、《互联网著作权行政保护办法》、《信息网络传播权保护条例》等法规要求互联网小说确保内容安全。
“垃圾”打捞速度缓慢
一部网络小说往往达几十万字至百万字之多,阅读花费时间较多。该运营商采用传统编辑审核的方式,往往审完一本小说就耗时数周。缓慢的审核速度追不上上千名作者的创作节奏,跟不上业务发展步伐。
色情片段定位难
小说文字赋予了“软色情”优渥的繁衍空间,充满着挑逗与诱惑。“软色情”,并不像“色情”一样直接出现和性有关的内容,而是描写给人以性联想的场景,狡猾地绕过露骨的黄词,分散在小说的各个章节。
该运营商作为国内在线阅读行业“三巨头”之一,对内容安全的关注从历史完结小说,延伸到新更连载作品。如何在万字长文中快速发现问题,确保合规运营,始终是该产业最重要的挑战。
为此,其在业务上亟需一个专业、可靠、值得信赖的数字内容风控商,希望为平台上的完结本带来更有效的审核,快速找出百万字文本中的安全隐患,确保小说对用户无害。
- 解决方案 -
直击痛点,长文本安全一步到位
为了消除后顾之忧,该运营商选择与易盾合作,建立基于“AI+人工”的数字阅读解决方案,对连载、完结小说进行多维度审核。
01 适应长篇文字的机器审核
易盾采用NLP算法有效理解小说的语义,结合专家策略解读、智能审核平台及人工审核,在机器和人工的配合下,一本长达几十万字的完结小说只需要2-3天即可审核完成。从技术角度来看,易盾在长文本审核上做到了哪些节点上的升级呢?
一书一审更连贯:客户的不少小说正处在连载中,尤其在章节顺序上,怎样保障前后章节的审核标准共享、审核逻辑统一、审核人员不变,面临了巨大的挑战。
基于智能审核SaaS平台,易盾引入多元ID跟踪体系,为书籍、主题、章节、审核员打造唯一ID标签。同本书各个章节的ID序号就摆在那里,主题和前后顺序一目了然。
ID体系,按章节排序发给审核员,在分配上保持前后章节的一致性,宛如一跟无形的绳索,帮助连载内容在数周、数月后,找到最初的审核大本营。
长文本审核技术:小说的篇幅长,真正的违规内容往往只占若干个零散的片段,分散地隐藏在整篇小说中,并受小说体裁的写作风格影响,给机器审核带来挑战。
客户发现,普通“文本审核”模型,对语意把握不足,导致误判率高,有害信息检出率偏低。这是由于普通模型,通常基于短篇的常规文本数据集进行学习,无法直接处理小说、电子书、漫画等长篇文本。
易盾自研了“长文本审核”技术,使用轻量级的语义检测模型,以长篇小说作为训练数据,以各个章节为单位,进行先分句再合并,实现长短文本系统的通学通用,提升了机器审核对小说的语意理解能力,识别效果更精准。
02 贴近业务的人审服务
分级监控色情:色情是小说中最常见、最严重的问题之一。客户希望将色情问题分为轻度、中度、重度3个不同等级,分级治理。为此,易盾总结常见色情场景,定制了不同梯度的色情策略,与该运营商定期组织业务复盘,完善各级色情的规则与标准。
方便审核处置:有了易盾的一臂之力,该运营商更便利地实施平台规则。一是,将不通过内容进行内容标记,便于在后续针对不通过内容可进行二次修改。二是,一旦同一本书的章节违规率超过30%,该运营商可选择直接打回给创作者,极大提高不良内容处置效率。
03 基于SaaS的完整审核流程
智能审核平台,由易盾自主研发,致力于打造一站式审核服务,通过多轮审核、走查、质检、电视墙等功能,支持极速分类审核、多人同审、关联审核、聚类审核模式,极大地减少客户的开发成本,降低了数字内容风控的使用门槛。统一管控、全程溯源、实时审查,轻松掌控潜伏于生态中的内容风险,极大提升人工审核效率。
- 显著效果 -
用技术死磕违规内容
通过本次合作,几大合规审核难题迎刃而解,客户能够迅速在线阅读平台锁定违规内容,给读者多一层安全感。该在线文学巨头的审核提速3倍,专业审核员每日可审核达2500-3000章,准确率保持在99.98%以上,有效应对快速增长的作品、预算有限等挑战。
随着网络小说平台快速发展,易盾潜心打造了基于AI的一站式数字阅读行业解决方案,还应用于中文万维、快看漫画、网易云阅读、连尚小说等阅读产品,开放给网文、小说、电子书、动漫等原创内容,成就了数字内容领域的安全阅读体验,以合规经营带来用户量的攀升。