中文站

一图读懂 | 网易易盾解密「AI生成识别」底层技术

近日,中智凯灵主办的第七届 AiDD AI+研发数字化峰会 在北京完美收官。本届峰会,以“拥抱AI,重塑研发”为主题,邀请来自全球的技术专家、专家学者、科研人员展开深度对话,共同探讨AI驱动的未来变革。

随着人工智能技术在各个领域的深度渗透,AI安全正成为全球关注的焦点。为应对AI时代的潜在风险,探讨安全与伦理治理的方式策略演变,本届AiDD峰会特别开设了「大模型安全与对齐」主题论坛,网易易盾担任本次论坛的出品单位。

在「大模型安全与对齐」主题论坛上,网易易盾AI算法负责人李雨珂深入解读了AIGC时代数字内容风控的核心技术,其中一项能力成为本次会议关注焦点。

作为网易易盾最新发布的重点能力——AI生成识别检测,其技术深度与应用广度备受瞩目。雨珂博士现场揭秘了底层实现原理及应用效果,其标注检测模型采用“显性标识识别+隐性标识识别”双通道,全面覆盖图片、文档、点播视频、点播音频等主流内容形态,实现从生成到传播的全链路合规管控,覆盖三大核心场景:

人脸伪造识别,聚焦人脸局部特征判断是否换脸,支持图像与视频检测;

AIGC生成图识别,通过整体特征分析辨别AI生成图像,适配图像与视频场景;

声纹伪造识别,针对机器语音转换、合成的音频进行检测,覆盖音频及视频中的音频内容。

技术上,依托垂直领域文本大模型、VL大模型、细粒度标签大模型、OCR大模型等基座,通过样本泛化生成、跨模态对齐等技术,目前易盾已将安全模型训练时长压缩至天级别,单标签精度显著提升,以应对日益复杂的网络环境。性能上,核心API准确率达99.8%,年过滤数据超1万亿次,精细化分类达300+,既能满足生成内容标识的法规要求,又能有效预防AI诈骗、保护隐私与版权。