网易易盾

中文站

首页
产品

内容安全

AI内容检测

文本检测~~HOT~~

图片检测

音频检测~~HOT~~

视频检测

AI内容分析

安全审核

人工审核服务

智能审核平台~~NEW~~

明察·内容巡查平台~~NEW~~

业务安全

智能风控

风控引擎~~HOT~~

设备指纹

身份校验

行为式验证码~~HOT~~

号码认证

实名核验

人脸核验

应用安全

应用检测

隐私合规检测

APP安全检测

安全加固

Android应用加固~~HOT~~

iOS应用加固

H5应用加固

SDK加固

安全组件

安全专家服务

安全咨询服务

安全舆情服务~~HOT~~

安全培训服务~~NEW~~

安全蓝军服务

安全顾问服务
解决方案

内容安全场景解决方案

AIGC内容风控~~HOT~~

品牌内容风控

出海内容合规

广告法合规检测

历史数据回归~~NEW~~

头像人脸分析

未成年人保护~~HOT~~

举报审核~~NEW~~

业务安全场景解决方案

手游智能反外挂

端游智能反外挂

小游戏智能反外挂

人脸实名核验~~NEW~~

作弊监控~~HOT~~

注册保护

登录保护

引流欺诈账号识别~~NEW~~

应用安全场景解决方案

个人信息合规测评

移动应用安全管理

行业解决方案

媒体行业

数字阅读

教育行业

政企行业

金融行业~~HOT~~

泛零售行业
在线体验

内容安全

图片检测

文本检测

视频检测

音频检测

业务安全

验证码体验

人脸识别体验
价格

内容安全

机器检测服务~~HOT~~

智能审核平台~~NEW~~

人工审核服务

安全培训服务~~NEW~~

业务安全

行为式验证码~~HOT~~

号码认证~~NEW~~

风控引擎~~NEW~~

实名核验

人脸核验

应用安全

应用加固~~HOT~~

隐私合规检测~~NEW~~
帮助中心
渠道合作
关于易盾

动态资讯易盾简介发展历程资质荣誉联系我们易盾学院

《生成式人工智能服务安全基本要求》

《生成式人工智能服务安全基本要求》

发布时间：2024年3月1日

发布人：全国网络安全标准化技术委员会

报告目录：

前言

1 范围

2 规范性引用文件

3 术语和定义

4 总则

5 语料安全要求

5.1 语料来源安全要求

5.2 语料内容安全要求

5.3 语料标注安全要求

6 模型安全要求

7 安全措施要求

8 其他要求

8.1 关键词库

8.2 生成内容测试题库

8.3 拒答测试题库

8.4 分类模型

9 安全评估要求

9.1 评估方法

9.2 语料安全评估

9.3 生成内容安全评估

9.4 问题拒答评估

附录A 语料及生成内容的主要安全风险

参考文献

报告解读

万字长文，深度解析大模型备案全流程

网易易盾

网易易盾，国内新一代数字内容风控品牌，依托网易20余年技术与行业实践经验，深度输出AI能力与专家资源，为面向数字化业务的客户提供专业可靠的安全服务，涵盖内容安全、业务安全、应用安全三大领域，为全行业提供具备场景属性的高标准解决方案，全方位保障客户业务合规、稳健和安全运营。