《生成式人工智能服务安全基本要求》
《生成式人工智能服务安全基本要求》
发布时间:2024年3月1日
报告目录:
前言
1 范围
2 规范性引用文件
3 术语和定义
4 总则
5 语料安全要求
5.1 语料来源安全要求
5.2 语料内容安全要求
5.3 语料标注安全要求
6 模型安全要求
7 安全措施要求
8 其他要求
8.1 关键词库
8.2 生成内容测试题库
8.3 拒答测试题库
8.4 分类模型
9 安全评估要求
9.1 评估方法
9.2 语料安全评估
9.3 生成内容安全评估
9.4 问题拒答评估
附录A 语料及生成内容的主要安全风险
参考文献
报告解读
网易易盾
网易易盾,国内新一代数字内容风控品牌,依托网易20余年技术与行业实践经验,深度输出AI能力与专家资源,为面向数字化业务的客户提供专业可靠的安全服务,涵盖内容安全、业务安全、应用安全三大领域,为全行业提供具备场景属性的高标准解决方案,全方位保障客户业务合规、稳健和安全运营。