近年来,受互联网音乐的影响,唱片市场已经开始走入低谷。与之相反,网络音乐出现迅猛增长。通过互联网和终端软件,普通用户上传自创歌曲十分便利,在网络原创音乐人作品激增的繁荣景象背后,也存在大量低俗、劣质音频夹杂其中的隐忧,尤其是说唱类音乐。受国外说唱音乐的影响,大量说唱歌曲中包含关于性与毒品等的违规描写,短视频内容的火爆也让一些改编的低俗音频传播速度加快。
低俗音频往往更容易受到部分听众追捧,作为音频传播平台该如何杜绝这类劣质资源内容?不妨看看网易易盾内容安全团队的处置策略。
Q1 哪些算是色情、低俗音频?
一段音频可以分为两部分,伴奏和歌词,伴奏的低俗和歌词的低俗既相辅相成,又各不相同。
低俗伴奏,即在编曲中加入人声喘息和呻吟声,并衍生出诸如同人音声系列及AMSR系列的问题。同人音声系列为场景剧情化的色情演绎,而AMSR系列则为单人模拟场景化的低俗演绎。
低俗歌词,即歌词存在色情低俗相关的直白描写或隐晦代指,衍生类型也很多,例如此前监管要求下架处理的色系歌曲,歌词中涉及描述性爱过程的意象化文字。
Q2 平时依据哪些标准展开判断?
我们知道一首音频内容通常包含文本、图片和音频三个信息。在审核过程中,审核员集合这三类信息做综合判断,给出最终结果。
文本:1、性行为描述 2、色情招嫖传播 3、 性暗示文字
图片:1、裸露私密部位 2、性暗示 3、私密拍摄视角 4、动物低俗 5、色情艺术类
音频:1、娇喘呻吟 2、性暗示ASMR 3、色系挑逗歌曲 4、性行为过程
Q3 什么样的情况下交由人工审核?
以下以某音乐业务为例,
由于顾及用户体验,一般音频遭机器判定“违规”后,并不会被直接删除,而是进一步查证。AI音频识别模型会把音频中的问题片段标注出来。部分音频因背景音或环境音等因素导致机器无法识别,安全系统便会将音频推给AI文本模型,把音频内容文本化,引导这类嫌疑数据进入人审环节。人审的结果会反哺机器策略模型的准确性,机器和人工双向互补,更高效处理色情低俗音频。
Q4 音频形态下,人工审核如何提升效率?
与文字相比,一条音频“从头听到尾”式的审核方式需要耗费大量时间。“技术+人工”两个步骤进行让审核时间明显缩短。
专业审核员不仅可以通过对音频内容前、中、后段分别监听、比对歌词内容,还可以结合系统策略从嫌疑用户维度、音频文本关键词标识,以及音频识别模型备注等工具去判别,就能事半功倍。
UGC产品的公司通常拥有庞大内容审核团队,审核员在处理数据的一线工作,每天均会与大量的音频交手,并为不少音频贴上问题标签。数据量庞大的问题音频将成为样本,供机器学习,进一步帮助机器更快速、更准确地识别全新的风险内容。
问题音频数据中的违规文本能协助运营人员补充“问题”关键词库,在审核页面展示给一线审核人员做辅助判断,让人审效率不断提升。
Q5 音频安全,易盾团队怎么样做?
音频具备较强的传播性,特别是低俗内容会被有心的听众分享传播,易盾内容安全团队对该类数据有多步过滤措施,防止劣质内容上线。
易盾机器识别判定
首先,音频内容需要过主流语种语音识别引擎、声纹识别引擎及语种识别引擎,之后再过更精细化的违规分类识别。
音频识别模型:易盾检测引擎有专业的色情低俗音频策略模型,包含娇喘、ASMR、音频转文本等多样模型,根据大量的案例样本训练,让机器自动识别音频中带有的喘息呻吟等人声内容并在审核页面展示违规音频片段标识。
机器敏感词库:易盾以网易历年积累下的敏感词库及不断新增的样本中提取的敏感词在机审环节对明确色情内容做屏蔽处理。
易盾人审判定
机器判定嫌疑的数据进入到人审环节,易盾人工审核团队依据互联网法规及历史监管查处案例制定了详细的色情低俗内容处理尺度标准,结合音频内容中的多类型信息(如歌词、封面、音频等)综合给出判定结果。音频资源内容因其数据的特殊性,对审核人员也会有较高的要求,易盾有专业的音频内容审核团队,人均听歌量两万以上,对于互联网音像内容传播法规及历史监管发布的违禁音频内容均有详实的了解。
易盾质检巡查处置
机器和人工在海量数据面前均无法保证百分百的过滤劣质内容,针对机器和人工日常处理的数据质检团队日常均为抽检复查数据处理质量,为策略团队和人审团队提供改进意见。另外还有前台巡查团队通过对站内突增播放分享量及其评论内容的发酵对歌曲进行监控巡查,特定相关用户及集聚圈子的巡视,可以返查到线上推荐资源内容的优劣,并保证优质内容评论社区的和谐。
综上所述,内容审核团队一般通过“技术+人工”相结合的方式过滤潜伏在音频中的违法违规内容,先依靠技术进行违规内容的初步筛选,快速识别数千亿条音频数据,挑选出疑似违法违规音频,再交由人工利用多项工具进行最终判断。互联网音乐百花齐放,人工审核能够结合语境上下文综合判定,一方面,避免违规音频在线上疯狂传播,另一方面,多样化音频得以在平台中存留下来,让色情低俗音频处理的更具灵动性。