2019年视频文娱大会于5月16日在上海举行,包括视频综合平台、视频聚合平台、内容制作提供方、大数据机构、云存储机构、社交网络和初创教育项目等250+企业和机构参加了本次大会,网易易盾也受邀参加本次会议。
网易易盾资深产品经理王博在会上分享了《视频内容安全谁来守护——AI赋能的易盾内容安全实践》的议题,讲述了易盾的成立历史、反垃圾背后的故事以及易盾从0-1搭建内容安全系统的过程。
一、易盾成立
王博表示,网易是国内第一个为反垃圾设立专业团队的公司。之所以设立专业的团队,一方面是网易邮箱、博客天然的反垃圾的需求。另一方面是丁老板的产品洁癖。
如今网上还能搜到丁老板对于网易新闻和网易社交产品的段子——丁老板对产品体验和用户很关注,对产品有超乎平常的洁癖,对产品中存在不良信息的意见非常大,经常因为不良信息直接怼产品经理或相关责任人。“ 丁磊曾愤怒地把一张暴露的美女照片打印出来,贴在门户频道一位主编的墙上:‘如果谁再上这种图片,我就把照片打印出来寄给他父母。’”
王博说,因此网易的反垃圾(现在称为内容安全)团队早在1998年就成立了,这是国内最早以技术驱动的内容安全团队,隶属于网易安全部。早期内容安全团队在内部比较边缘化,再加上还管着审核员,因此团队自称“鉴黄部门”和“下水道清理部门”。
随着内容安全越来越重要,再加上网易的内容安全技术非常成熟,后来网易安全部决定把其自身的技术沉淀和实践云化并对外提供服务,从而推出——“网易易盾”这个品牌,并在业界率先发布第三代智能审核技术,其智能识别精准率超过99.8%,每天检测信息达十亿条。
目前易盾已成为国内首屈一指的内容安全服务商,服务数千家企业,其中不乏一直播、OPPO、携程、中信证券、知乎等大公司。
二、与不良内容产业攻防,推动内容安全技术升级
对于垃圾信息产业而言,2008年或许是一个重要的节点。
这一年,人工开始逐渐被机器和软件取代,广告、色情、赌博等垃圾信息规模化出现,这条零碎的产业链,开始集结成河。文本垃圾开始变成“图片垃圾”,也更具隐蔽性,而随着移动互联网、4G时代的到来,垃圾信息又变成更加难以处理的视频形式。好在相关的内容安全技术也在不断提升,尤其是后来人工智能技术在内容安全中的不断应用。
用人工智能技术解决内容安全问题是攻防不断拉锯的过程,“这是一场无尽之战,从不修战也永不言和。”王博指出。
网易易盾的内容安全技术更新升级一共分为三代:第一代内容安全技术是建立在关键词、黑白名单、过滤器和分类器上;第二代内容安全技术基于内容特征识别(肤色、纹理)、贝叶斯过滤、相似度匹配和规则系统;而第三代则升级为大数据分析(用户行为、用户分类)、人机识别、人工智能和机器学习(语义识别、图像识别)。过程中,易盾也自研了很多技术,包括语义池挖掘算法、在线学习算法等。
“除了运用人工智能技术之外,我们也融入了反作弊的技术。假如说一个客户或者用户频繁发送不良信息,我们有理由认为账号是有问题的,不单单是发出不良内容再进行处理,而是从源头上就把账号进行相应的跟进和处理。”
目前,网易易盾内容安全服务已覆盖了文本、图片、音频和视频(直播)等领域,其有害信息处理效果超出很多客户预期。
三、内容安全已成互联网企业标配风控项
王博认为,在当下内容安全已经成为企业标配的风控了。她给出了三个理由:第一个是法律法规的完善和营造风清气正的互联网环境的共同需求,使得企业的业务需要合规;第二个是互联网企业自身社区调性的建设,使得他们为了产品更好的氛围,开始主动清除不良内容;第三个则是未成年保护,使得互联网企业在当下履行起社会责任。
内容安全成为互联网企业TOP风控项的趋势也在国外出现。新西兰总理Jacinda Ardern今年曾表示,科技公司应被视为“出版商,而非只是邮递员”,而澳大利亚总理Scott Morrison也表示:“把互联网当作一个无人管理的空间是不可接受的。”
在法律层面,国外也开始立法,澳大利亚今年通过一项新法律,严控在社交媒体上传播暴力内容,如果社交媒体平台没有快速删除平台上暴力恐怖内容,公司高管可能被判入狱3年,而社交媒体平台也将面临高达其年营业额10%的罚款。而在同一个时间段,欧盟也通过草案:如果无法在一小时内删除恐怖主义内容,企业将面临最高达全球营业额4%的罚款。
国外的互联网巨头也在内容全上格外投入。Facebook CEO Mark Elliot Zuckerberg说,除了在技术上大力投入外,从事内容审核工作的人数也已增加到3万多人,每年在安全方面投入达数十亿美元。YouTube在人力和技术投入之外,还成立了“紧急事件负责人”一起协调合作。YouTube CEO Susan Wojcicki表示,这个岗位由多人轮流担任,旨在确保每次出现“事件升级”都有专人应对。
四、当下的易盾朝着精细化、场景化、智能化方向不断进化
依托网易21年内容安全经验,网易易盾提供文本、图片、音频和视频四大类的基础服务,文档、音视频、在线检测、网站、广告合规等解决方案,以及人工审核、舆情管家、智能审核系统等增益服务。易盾能够过滤包括鉴黄、涉政、暴恐、广告等数十大类近千小类的不良内容,使用场景包括新闻内容、聊天室、直播、视频、弹幕、评论、博客、短信/IM、昵称/头像、签名等。
王博表示,易盾正朝着精细化、场景化等方向不断自我迭代。目前,易盾定义并积累有害信息有数十种一级分类、数千种小类、数十万垃圾变种、20+应用场景,垃圾特征词库总量级达到100万以上。结合不同场景,易盾提供一站式的解决方案。比如说在直播领域,易盾提供账号实名认证、用户头像/昵称过滤、房间名过滤、人脸检测分析、音视频审核、弹幕实时过滤、黑屏挂机检测和房间热度检测等服务,全面解决企业在内容安全上的需求。
在最后,王博还提及,易盾于近期推出了历史存量内容套餐加急处理服务,能够根据历史数据专项策略布控、快速清洗、灵活定制不良内容模型,帮助客户全面检测,及时降低内容安全隐患。