中文站

独家揭秘网易新闻内容安全的正确打法!

达观数据显示,2017年中国移动综合资讯市场用户规模保持稳定增长,保持5亿左右的用户规模。其中在2017年11月网络媒体人均单日使用时长,网易新闻以月度人均单日使用时长40分钟位居第一。国内知名移动大数据服务商QuestMobile最新数据显示,2018年一季度,网易新闻人均单日使用时长居综合新闻资讯App排行榜第一位,“用户活跃率”(DAU/MAU)高达37.1%,超过腾讯新闻、搜狐新闻、凤凰新闻、新浪新闻等新闻资讯App,位居综合新闻资讯客户端排行榜首。

用户活跃率高达37.1%!这无疑是对“网易新闻——各有态度”最好的诠释。而“各有态度”的背后是巧妙的应对,对于网易新闻来说,除了让用户保持自己态度的同时,还需要给用户提供一个健康的交流环境以及担负起社会舆论健康化的责任。


网易新闻高速发展的背后,除了特色内容激励计划引入优质内容,还有一个存在了15年的杀手锏——网易跟帖。从2003年至今,网易跟帖在不知不觉中已经度过了15个年头,经历了互联网信息的爆发,也经历了PC向移动互联网的转型。而在同类产品近乎销声匿迹的时候,网易跟帖已然成为一种互联网文化,甚至可以说最成功的评论类产品。

网易新闻用户跟贴文化,也是网易新闻内容基因的重要组成部分,同时,跟贴文化也是网易新闻用户粘性的一大体现。大量活跃用户在网易新闻客户端,通过留言评论、点赞互动等方式,输出自己的观点,在此基础上形成的网易新闻独特的跟贴文化,是网易新闻用户价值的深刻体现。

移动互联网发展到今天,UGC早已是诸多流行APP中不可或缺的品类,这些产品和网易跟帖的一个共同特点就是用户原创内容。但用户可以制造优质内容,也会带来大量的负面和垃圾信息,随着技术的发展,机器人也成为垃圾内容的生产者。这不仅让很多内容运营难堪其重,一些产品的衰落也与此不无关系。

那么,网易跟帖是如何处理内容安全(反垃圾)问题的呢?

20年经验,以及网易的三次技术迭代

互联网反垃圾的历史似乎可以追溯到1978年的第一封垃圾邮件,而在今天全球每天都有数十亿的垃圾邮件在传播,再加上垃圾评论、诈骗短信、色情广告等等,几乎所有的互联网产品都面临着反垃圾的压力,网易也不例外。

自1997年推出邮箱类产品开始,网易就开始了自己的反垃圾之路,产品线也从邮箱、新闻扩展到了影音娱乐、游戏、社交、电商等领域。网易反垃圾技术助力网易跟帖的成功,其实在技术不断发展的同时,网易的反垃圾技术也完成了三次技术迭代。

第一阶段主要是依赖关键词、黑白名单和各种过滤器技术,来做一些内容的侦测和拦截。这是最基础的阶段,也是网易邮箱在垃圾邮件过滤方面的初次尝试,后来这一技术也被应用于网易新闻的评论区。不过受限于当时计算能力瓶颈以及算法理论的发展,第一阶段的技术只能说勉强满足使用。

第二个阶段主要基于计算机行业一些算法的更新,比如说贝叶斯过滤,一些肤色的识别,纹理的识别等等。网易在实际应用中对这些算法进行了更好的特征匹配和技术改造,达到更优的反垃圾效果,这也是网易跟帖能够持续13年之久并且越来越好的关键。

第三个阶段利用当下最流行的人工智能技术。网易在内容安全领域利用大数据做用户的行为分析,进行用户画像,评估用户是人还是机器。此外,网易还能基于人工智能的图像识别技术等,更准确识别是否是垃圾词汇、色情图片、广告图片以及一些违禁品图片等等。

个体的智慧是有限的,但个体乘以一百万之后就会产生神奇的化学反应。网易反垃圾技术就像是一个神奇的滤网,将网易新闻评论区的内容汰劣留良,使得跟帖这一体现网民智慧的生产力一直延续下去。

网易云易盾上线,跟帖神话或许可以复制

反垃圾技术进入到人工智能阶段时,网易的反垃圾团队发现国内第三方反垃圾市场近乎空白。基于此,网易在2016年年初正式推出了易盾内容安全服务,而此时网易内部大部分的互联网产品已经迁入了云。于是网易顺势将服务多年的成熟解决方案以云服务的形式推向市场,以服务帮助更多企业。

纵观市场上的各类UGC产品,在内容过滤方面的做法普遍有三类,一是人工干涉,诸如人工删除、屏蔽、禁言等等;二是进行用户分级,比如根据用户的注册时长和在线时间分为核心用户、普通用户、游客等等;三是优质内容的人工筛选,即人工置顶推荐一些优质内容。不难发现,这一机制和网易跟帖有着本质的差别,前者要投入庞大的人力资源和巨额的资金,而网易跟帖是网民的自发行为,网易很少进行人工干涉。此外,用户分级的做法在一定程度上有利于内容的净化,却也极大地损害了用户体验,网易跟帖则恰如其分的给了每个用户发言的权利。

网易跟帖之所以成功,或许有人认为是基于网易的产品情怀和工匠精神,也或许有人说是网民的智慧结晶,但不可否认的是,反垃圾技术却是决定网易跟帖能否良性循环的重要因素之一。可以预见,UGC创业大潮在未来会越来越汹涌,而网易云易盾内容安全服务等成熟的反垃圾解决方案,也将加速UGC产品的落地,网易跟帖的神话并非不可复制。