一图读懂 | 网易易盾解密「AI生成识别」底层技术

【易盾动态】2025-08-15

分享到

近日，中智凯灵主办的第七届 AiDD AI+研发数字化峰会在北京完美收官。本届峰会，以“拥抱AI，重塑研发”为主题，邀请来自全球的技术专家、专家学者、科研人员展开深度对话，共同探讨AI驱动的未来变革。

随着人工智能技术在各个领域的深度渗透，AI安全正成为全球关注的焦点。为应对AI时代的潜在风险，探讨安全与伦理治理的方式策略演变，本届AiDD峰会特别开设了「大模型安全与对齐」主题论坛，网易易盾担任本次论坛的出品单位。

在「大模型安全与对齐」主题论坛上，网易易盾AI算法负责人李雨珂深入解读了AIGC时代数字内容风控的核心技术，其中一项能力成为本次会议关注焦点。

作为网易易盾最新发布的重点能力——AI生成识别检测，其技术深度与应用广度备受瞩目。雨珂博士现场揭秘了底层实现原理及应用效果，其标注检测模型采用“显性标识识别+隐性标识识别”双通道，全面覆盖图片、文档、点播视频、点播音频等主流内容形态，实现从生成到传播的全链路合规管控，覆盖三大核心场景：

●人脸伪造识别，聚焦人脸局部特征判断是否换脸，支持图像与视频检测；

●AIGC生成图识别，通过整体特征分析辨别AI生成图像，适配图像与视频场景；

●声纹伪造识别，针对机器语音转换、合成的音频进行检测，覆盖音频及视频中的音频内容。

技术上，依托垂直领域文本大模型、VL大模型、细粒度标签大模型、OCR大模型等基座，通过样本泛化生成、跨模态对齐等技术，目前易盾已将安全模型训练时长压缩至天级别，单标签精度显著提升，以应对日益复杂的网络环境。性能上，核心API准确率达99.8%，年过滤数据超1万亿次，精细化分类达300+，既能满足生成内容标识的法规要求，又能有效预防AI诈骗、保护隐私与版权。

分享到

一图读懂 | 网易易盾解密「AI生成识别」底层技术

热门标签

热门文章

Unity 引擎高危漏洞 CVE-2025-59489 深度解析：覆盖十年版本，游戏行业迎安全大考

多模态大模型综合防御体系，构筑金融安全 “护城河”

新规将至，网易易盾「AI生成识别」破局合规焦虑

国内首个！网易易盾参编国标《生成式人工智能服务安全基本要求》，领先助力行业健康发展

2024年度游戏安全报告发布：200+亿次风险检测背后的攻防全景