中文站

网易易盾联合广州互联网协会发布《生成式人工智能服务安全合规指引》

8月6日,2024广州互联网+新经济学术会议在广州市重磅开幕。政府部门、行业组织、科研院校、学者专家、金融机构和数字技术服务商及应用场景方将悉数出席,同台论道。

大会已连续举办8届,以高端规格、专业品质、前沿内容及开放精神,累计吸引了参会观众近5000人,获得主流媒体报道近300篇次,已成为广州最有影响力的数字经济领域学术会议之一。


网易易盾以广州互联网协会官方特邀伙伴身份列席“羊城e家”网络治理与发展专题会,全方位展示在数字内容风控领域内产品、技术、服务经验等各方面实力,以及与行业共建的多项重要成果。

01 广州市网络生态治理合规发展实践基地揭牌 健全网络综合治理体系


“羊城e家”网络治理与发展专题会上宣布,广州市网络生态治理合规发展实践基地正式揭牌成立。

在市公安局、市人民法院、市委统战部、市委网信办以及市司法局的指导下,广州市网络生态治理基地合规发展实践基地以促进互联网行业,尤其是游戏和直播领域的合规发展为目的,以打造安全合规实践基地,成为全国行业合规发展最佳实践和广州数字经济产业虹吸的策动力。

本基地拟针对互联网企业平台在合规建设方面的痛点、难点,通过整合政企资源,打通监察机关和执法机关直连的绿色通道,围绕探索成立政企沟通机制和反馈机制、建立合规指引专家库、梳理普法培训体系、标准规范指引制定、打造法律援助平台、提供诊断和咨询服务等工作,为企业合规发展提供一站式服务,为广州互联网企业的合规建设运营保驾护航。

其中,网易易盾将作为协会推荐技术服务商为各位伙伴保驾护航。

02 《生成式人工智能服务安全合规指引》为行业共建聚力献策

会上,由网易易盾内容安全产品总监饶晓艳代表大会主办方,进行《生成式人工智能服务安全合规指引》发布并介绍。


随着生成式人工智能(AIGC)技术的快速发展和应用的日益广泛,AIGC在全球范围内引发科技巨头争相布局、掀起创业热潮,同时也带来了一系列新的安全风险和挑战。

为防范生成式人工智能带来重大安全风险,提升生成式人工智能服务的安全水平,促进生成式人工智能行业安全发展,广州互联网协会以广州市网络生态治理基地合规发展实践基地为依托,结合广州本地企业的实际需求,联合网易易盾编制并发布此次《生成式人工智能服务安全合规指引》。

《指引》在内容上重点关注生成式人工智能服务的安全组织建设、安全制度建设、生成内容安全管理、网络和数据安全管理,以及基础设施层安全、模型和数据层安全、应用层安全能力建设要求等多个方面,旨在确保生成式人工智能产业能够健康发展,构建安全又高效的企业生态环境,鼓励创新的同时降低技术风险,为用户提供更高质量的人工智能产品和服务,促进人工智能产业的长期可持续发展。

饶晓艳表示:“整体框架上,围绕相关法律法规和业务实践,《指引》提供了较为完整的安全能力建设指南;在公司内部治理层面,提出安全组织建设和安全制度建设指引;在网络生态治理层面,提出生成内容安全管理、网络和数据安全管理指引。希望通过该《指引》的推广应用,提升广州市企业的AIGC安全性,充分发挥合规基地的指导和服务作用,助力企业合规体系建设,为广州市人工智能产业营造更加良好的发展环境。我们也将一如既往的做好支撑和保障工作。”

03 构建面向AIGC时代的数字内容内生安全体系

而后,网易易盾内容安全产品总监饶晓艳为大会带来以《AIGC内容合规风险与实践》为主题的分享。

2024年,随着大模型技术的快速发展,AIGC已经迈进了场景化、行业化应用的爆发期,在技术飞速发展的同时,也带来了新的安全风险和挑战,模型生成内容中的道德伦理、虚假信息、偏见歧视、隐私泄露、侵犯个人和商业权益等问题凸显,安全治理成为国际、国内关注的焦点。


饶晓艳指出,网易易盾在AIGC的安全治理方案上,关键点有两部分:第一个是全周期,在模型的训练阶段、模型上线阶段、内容生成阶段,都有结合业务节点的相应安全措施;第二个是多维度,语料标注、大模型安全知识库、用户身份管理、大模型安全评估、实时内容审核等。

面向AIGC时代的数字内容风控,网易易盾贯彻的内生安全理念具有三个显著的特点:精细的安全标准、纵深的检测埋点、弹性的安全运营。

饶晓艳继续以大模型安全服务举例介绍。大模型的安全围栏有很多道,从用户输入端开始,易盾会先进行有害信息分析,并对问题进行分类,并针对部分类别提供安全回答,而正常由大模型回答的内容,在输出后也会再次进行有害内容的检测。同时考虑到时效性,易盾提供流式切片检测,可以更早发现风险。此外,网易易盾覆盖五大类、31小类的安全语料,也可以在大模型训练环节,提高模型本身的安全围栏能力。

最后,饶晓艳表示:“安全是任重道远的长期工作,在构建安全生态的蓝图中,每一位安全从业者、每一家企业、每一个组织都扮演着不可或缺的角色。网易易盾的目标是实现更高效、更智能的安全治理,这需要我们更多的行业协同,共同制定和遵守一系列安全规范,通过安全交流和技术共享,共建开放的安全生态。”点击了解易盾AIGC解决方案