「大模型评测平台」发布，让AI安全看得见、管得住

【易盾动态】2025-02-27

分享到

当今数字化飞速发展的时代，AIGC 大模型如雨后春笋般涌现，在为各行业带来创新变革的同时，其安全性也成为了不容忽视的关键问题。在人工智能技术加速落地的今天，AIGC大模型的安全合规已成为产业发展的核心命题。

网易易盾基于数字内容风控领域的技术积淀和AIGC头部模型厂商的实践，正式推出「大模型评测平台」，为企业提供从模型评测、风险预警到智能优化的全链路解决方案。

破解行业痛点：让AI安全看得见、管得住

随着 AIGC 大模型在商业领域的广泛应用，越来越多的企业开始同时采买多个商业模型以满足不同业务需求。然而，不同模型之间的安全性能参差不齐，也让企业的平台安全面临着评测标准不统一、风险类型复杂、安全基线动态变化等挑战。

因此，定期对大模型进行安全评测，生成详细的评测报告以及高效管理题库，已经成为保障大模型安全运行的重要环节。

本次网易易盾推出的「大模型评测平台」正是面向拥有多个大模型的企业，如手机厂商、国企等大型商业应用企业。致力于满足这些企业的安全合规需求，帮助企业更好地管理和优化大模型的安全性能。

企业级核心价值：从被动防御到主动治理

智能题库管理中枢

● 首创"三级分类体系"，支持大模型备案要求的五大类31小类标准，兼容企业自定义安全标签

● 内置易盾行业领先的风险维度识别模型，支持全类敏感问题精准检索

● 支持多模态题库管理，覆盖文本全场景测试需求（图像、视频通过线下实现）

全生命周期评测管理

● 提供模型注册-任务编排-结果分析的可视化工作台

● 支持定期巡检与突发事件专项测试的双模式运行

● 生成包含合规得分卡等多维度评测报告

私有化安全部署能力

● 支持本地化部署确保数据主权

● 提供SDK/API灵活对接企业现有系统

三大能力，重构安全评测范式

能力一：测试题库精细化管理

网易易盾「大模型评测平台」在测试题库管理方面表现出色，能够进行多维度的分类。不仅涵盖了易盾自身成熟的垃圾分类体系，还严格遵循大模型备案要求的五大类 31 小类分类标准，同时支持关键元素分类以及自定义分类，这意味着用户可以快速精准地查找特定类型的题目。

能力二：测试报告可记录可追溯

平台对测试报告的管理同样严谨，实现了大模型测评过程的全程记录和可追溯性。每一次测评的结果都将被详细记录，形成完整的报告体系，方便企业随时查看和回顾大模型的安全性能历史数据，为企业决策提供有力依据。

能力三：商业化测评工具竞争力突出

在大模型测评工具的商业化进程中，初始化测评问题的设置是核心竞争点之一。网易易盾「大模型评测平台」伴随商业化推出了一系列高质量的初始化测评问题，能够全面、深入地对大模型进行评测，帮助企业准确了解模型的安全性能，从而在市场竞争中稳健运行。

未来展望：深度数据分析助力智能优化

随着平台的不断发展，未来将对大模型测评数据进行深度分析。通过对多个测评任务的数据挖掘，能够清晰呈现大模型在安全指标上的变化趋势，以及各个大模型在不同维度上的优势和短板。这将为企业后续对用户输入的 prompt 做问题分类路由提供有力支持，使大模型能够更加精准地回答自己擅长的问题，进一步提升大模型的应用效果和安全性。

网易易盾「大模型评测平台」的发布，将为企业在 AIGC 大模型安全领域带来全新的解决方案和体验。凭借其精准的题库管理、专业的报告体系、强大的功能模块以及对未来数据分析的深度挖掘，必将成为企业在大模型安全评测领域的得力助手，助力企业安心拥抱 AIGC 技术，推动行业的健康发展。

分享到

「大模型评测平台」发布，让AI安全看得见、管得住

热门标签

热门文章

社交App交友“防渣”指南

网易易盾接入DeepSeek，数字内容安全“智”理能力全面升级

2024年度游戏安全报告发布：200+亿次风险检测背后的攻防全景

“AI换脸”骗过人脸识别？黑产攻击新手段应如何防御？

网易易盾亮相FCIS 2024网络安全创新大会，分享AIGC内容安全体系建设经验