中文站

《生成式人工智能服务安全基本要求》

《生成式人工智能服务安全基本要求》
发布时间:2024年3月1日
发布人:全国网络安全标准化技术委员会

报告目录:

前言
1 范围
2 规范性引用文件
3 术语和定义
4 总则
5 语料安全要求
  5.1 语料来源安全要求
  5.2 语料内容安全要求
  5.3 语料标注安全要求
6 模型安全要求
7 安全措施要求
8 其他要求
  8.1 关键词库
  8.2 生成内容测试题库
  8.3 拒答测试题库
  8.4 分类模型
9 安全评估要求
  9.1 评估方法
  9.2 语料安全评估
  9.3 生成内容安全评估
  9.4 问题拒答评估
附录A 语料及生成内容的主要安全风险
参考文献

报告解读

网易易盾

网易易盾,国内新一代数字内容风控品牌,依托网易20余年技术与行业实践经验,深度输出AI能力与专家资源,为面向数字化业务的客户提供专业可靠的安全服务,涵盖内容安全、业务安全、应用安全三大领域,为全行业提供具备场景属性的高标准解决方案,全方位保障客户业务合规、稳健和安全运营。