中文站

网易易盾亮相上海电视节,AI内容审核真正助力广电行业智慧化

6月8日,第27届上海白玉兰电视节如期举行,在媒体数字化转型论坛上,网易易盾解决方案总监李加正以《AI内容审核真正助力广电行业智慧化》为题发表演讲。


互联网加人工智能,对数字内容产业的发展造成深远影响,在带来巨大机遇的同时,也催生了新的风险和挑战。在数字内容的细分市场,相较于移动互联网,广电传媒业的传播和管理特性决定了其内容空间的高度规范和健康,而这也无形中限制了产业经济规模。

显而易见的优势是,广电传媒市场的内容质量和安全性明显优于移动互联网,在内容治理层面,广电传媒业理应抓住AI技术变革浪潮,全方位提升AI能力,站在全社会数字内容发展视角,肩负社会责任,成为健康视听的时代领导者。

以下为演讲内容:

01 数字内容产业责任、机遇与机遇

在移动互联网和人工智能浪潮下,数字内容产业规模以超出权威预测的速度成长着,2020年,全球的数字内容量已经达到590万亿GB,就我国而言,去年全年,规模以上文化及相关产业营业总收入已接近10万亿元。其中,泛网络视听产业收入近6000亿,短视频一项的市场规模已经达到1400亿元。

产业的繁荣与AI技术运用密不可分,在内容生产环节,AI采编、AI剪辑、虚拟主播、虚拟场景、智能会话的运用无处不在,人工智能与大数据结合,主导了内容传播和消费决策,让移动互联网的数字内容产业坐上了火箭,一飞冲天。


移动互联网的商业化和诱惑力也带来了数字内容的风险性,大量充满诱惑、未经核实、无序发布的内容影响着国家安全、社会稳定,特别对青少年健康造成严重不良影响,一些人打着擦边球,将AI能力变成洪水猛兽,裹挟着深度伪造、算法歧视、和对版权的无视扑面而来,内容恶俗、隐私泄露、内容造假屡禁不止,更有甚者利用AI优势制造信息茧房,甚至造成舆论失衡,给社会治理带来严峻挑战。

互联网的内容审核刻不容缓,事实上,国家网信办、公安部等多部委也重来没有停止过检查和处罚,仅2020年度,全国各级网络举报部门就受理各类违规举报近1.63亿件,其中色情类以62%高居榜首,其次是网络赌博、涉政、低俗、侵权、诈骗、暴恐等。

以短视频和UGC为代表的数字内容爆发式增长,给内容审核行业带来巨大挑战,面对技术迭代升级、审核人员短缺、审核规范细化等一系列困难,人工智能审核服务势必要在摸索中上阵。

事实证明,以AI算法为基础的互联网企业,如腾讯、阿里、网易、百度等公司推出的审核服务,每年进行着数千亿次的内容检测,为清朗的网络空间做出了巨大的贡献。

说到数字内容治理,广电总局从来都是不遗余力,这从我们从近年来的网络内容监管中便能瞧出端倪,在短视频、直播秀场、电商直播、网络直播等领域,广电总局协同网信办、工信部、公安部等七部委多次下发文件。

总局在《关于加强网络秀场和电商直播的管理通知》中强调,要求各地广电局落实属地监管、登记备案、筛查整顿并建立长效管理机制。这类通知具备长久有效性,是对聂部长那句“维护网络视听新视界的重要使命“的解读。

02 广电传媒智慧化内容审核方案

互联网内容通常是先发后审,事后监管。而广播电视的安全播出重于泰山,在内容审核方面,首先是要符合道德规范、社会舆论、法律法规、行业制度要求,其次在内容纠错、版权审查、播出合规、广告合法方面亦不能越雷池半步。

近几年来,广电没少接触AI审核,往往因为审核效果达不到要求而不能放心使用。譬如某些算法的先进性差,误报、漏检较多,并没有真正节省人审工作量。优秀的检测算法是人工智能审核能够商用的基础,同时还要辅以完整的审核模型和策略沉淀。网易易盾经过长期的技术和实践沉淀,总结出一套算法先进、模型完整、策略完备、人机结合的高效审核方案。依托数十亿图文和音视频有害特征库,通过智能策略匹配和模型定制,为广电内容审核量身定制了解决方案。

模型库的沉淀是个长期过程,更需要大量样本学习。某些有害内容样本的获取通常很难,漏检就会带来重复工作量。为此,网易易盾采取了小样本增广方法,提取该样本有害信息特征后,通过部分切图、反转、模糊化等方式获取初始训练集,与海量无标签数据融合后反复训练,达到样本增广的目的,单个样本的模型训练周期可压缩到1~2天以内,如果是基于陌生人脸的样本训练,提供正面侧脸等样本数据后,可以做到实时训练和检测,大幅提升了审核效果。授人以鱼不如授人以渔,好的智慧化平台能够协助审核人员积累正负样本,自主学习,不断调优,提升准确率。


真实的审核场景下,垃圾率并不高,单一内容特征检测的计算量很大,易盾归纳了多模型融合分层计算方法,将不同模型的局部特征和全局特征融合,结合深度定制网络和特殊场景下的定制网络特征,能够在保证召回率的前提下节省90%运算能力。在单个场景下,通过同时分析内容特征向量、用户行为向量和用户关系向量,进行空间学习,就能顺利地分解出涉政、谩骂、吃播、涉价值观等等各种分类标签,大大提升了有效召回率。

网易公司立志于以领先AI能力和行业定制化方案服务好广播电视和互联网视听行业,为适应广电的新老业态以及不同工作岗位的审核需要,易盾分别封装了融媒体审核方案、短视频/长视频审核方案、互联网直播审核方案、赛事敏感内容辅助识别方案、智能电视墙审核方案、历史数据审核和识别方案等,将人工智能技术充分应用到了安全保障到数字资产管理、内容运营的各个环节中去。

03 携手广电传媒行业 共同维护数字内容空间

20多年来,网易公司一直深耕互联网内容安全领域,技术实力得到了中央网信办、工信部、公安部等多部委认可,在语音、短视频、侧脸识别大赛中多次斩获第一名。

2020年度,网易易盾实现全年检测数据4116亿次,有害信息拦截425亿次,新提炼有害特征信息12亿条。网易易盾参与编写了人社部、公安部、中国电子学会等的内容安全标准和职业技能标准,也在学习和参与广电总局基于区块链的内容审核标准体系,网易易盾目前已经服务了上海电视台、广东电视台、人民网、新华网、南方新媒体、北京海淀融媒体等广电和传媒业客户。


5月26日,网易易盾联合腾讯安全、阿里云安全等单位共同发起了“互联网内容安全联盟”,我们意识到,单靠某一家企业很难改变内容安全现状,我们将携手推进技术创新和行业标准制定,期待在相关管理单位的指导下,构建清朗的网络空间。

良好的网络监管更有助于广播电影电视节目的传播,我们期待在总局的指导下,携手广电从业者,将健康的内容管理体制机制代入到数字文娱、电商、教育等产业中去,共同护航广阔的内容空间!