近年来,网络内容呈现爆炸式增长,违法和不良内容也在严重威胁网络生态健康。《网络安全法》、《互联网信息服务管理办法》等法律法规强调网络平台在内容治理方面的主体责任,平台也开始寻求内容审核服务提供商的支持和帮助。网络平台在选购内容审核服务的过程中,如何评价其服务质量的优劣成为了一大难题。
其实,评价内容审核服务的优劣重点是从功能、性能两个方面。在功能方面:服务形态、支持审核内容的类型和格式等应满足网络平台的业务实际需求,如支持图像、文本、视频、音频等多种模态的内容审核;能够识别色情、暴恐、谣言等多类型的违规内容;能够支持流媒体、动态图的识别;能够支持超大图像、超长视频的识别等。在性能方面:内容审核的性能指标一般可以通过召回率、精准率等数据来衡量。召回率也叫查全率,以人物图像识别为例,将图像中的人物作为样本,高召回率表示模型正确识别出的人物占全部样本的比率高;精准率也叫查准率,它主要针对预测结果。以人物图片为例,精准率越高表示模型检出的人物样本中正确的样本越多。
然而,对于多数互联网平台而言,客观全面的评估方案制定、高质量测试样本的收集都存在较大的难度。为解决用户选型过程中面临的问题,规范内容审核市场,中国信息通信研究院于2017年起,就开展了内容审核相关的研究,依托CCSA TC602网络治理能力工作组、内容科技产业推进方阵,联合来自阿里、腾讯、网易、中国移动、中国电信等多家单位的专家,制定了基于视频、图像、文本和音频的内容审核服务评估规范《网络治理能力评估规范:第2部分-有害信息内容审核服务系统》,收集了40万条的测试样本。评估规范涵盖128个评估指标项,从服务基本信息披露、系统成熟度、服务质量三个方面,分别对用户关切的功能、性能、服务质量三个方面做出评测。2019年至2021年已先后开展了三批测试工作,阿里云、网易、金山云、腾讯云、百度、数美科技等12家单位的36项服务参评(已参评企业及服务附后)。
目前,最新一批“内容审核服务评估”工作已经开始报名,如希望从众多提供内容审核服务的厂商中脱颖而出,欢迎报名参与评测。中国信通院将于4月前后开展集中评测,年中召开成果发布会。欢迎有意向参评的企业参与。
附:目前已通过评测的企业和服务
来源:网络数据技术与标准推进委员会