中文站

网易易盾与武汉大学开展风控“第一课”:校企沟通共促内容安全

在信息爆炸的时代,内容安全宛如一座灯塔,照亮我们在数字世界中的航程。4月11日,网易易盾应邀进入武汉大学,网易易盾总经理朱浩齐在国家网络安全学院举行主题演讲。

朱浩齐以“内容安全行业入门与实践”为主题,为学生们讲解了内容安全的基本概念、最新趋势和发展前景,强调了内容安全行业的重要性,并分享了实践经验和职业规划建议。


与此同时,他还分享了内容安全领域的技术和应用,包括人工智能、大数据、图像识别、语音识别、自然语言处理、深度学习等技术在实际应用中取得的显著成效,让同学们深入了解内容安全的实际应用和解决方案。

他表示,“内容安全行业是一个充满活力的行业,它不仅能够提高用户体验,提升产品的价值,也能保护网络环境的安全,从而为社会发展做出贡献。” 


本次安全主题授课旨在通过合作学校和企业的共同努力,深入探讨行业知识,提升相关技能。作为主讲人,朱浩齐热情鼓励学生们投身网络安全和内容安全行业,共同维护网络空间的和谐与秩序。

互联网世界就像一座巨大的舞台,每个人都扮演着不同的角色,而内容则是舞台上不可或缺的介质。内容安全在整个生态中是至关重要的“导演”,既要仰赖技术进步,也要受到人文关怀和道德引导的支持。


一直以来,内容安全是一个颇为小众的概念,但应用场景却非常广泛,从智能汽车、智能手表到在线社区,从娱乐社交平台、游戏平台到电商平台,对内容的审核和管理无处不在。

具体而言,娱乐社交平台,如小红书、微信、微博等,会对用户上传的内容进行审核和管理。手游、页游等游戏平台,对用户上传的头像、游戏昵称、社区发言等内容进行审核和管理,维护游戏秩序和用户体验。淘宝、京东等电商平台等电商平台,对用户上传的商品信息、评价等内容进行审核和管理,保障商品质量和用户权益。在线教育、汽车、金融、新零售都搭建了行业化的在线社区/网站,要对用户上传的帖子、评论进行审核和管理。


当审核成为共识,新的挑战也随之而来。2022年11月30日,一款由Open AI公司开发的人工智能聊天机器人ChatGPT正式上线,上线后仅用5天就产生了百万用户。随后其他生产式AI技术如雨后春笋一般进入大众视野,内容生产赋予大众专业内容生产者的能力。

无所不能的生成式AI技术,也伴随着种类繁多的恶意风险,从虚假新闻、网络骗局、信息误导、内容垃圾到恶意广告,都在“内容安全”的警惕范围之内。

朱浩齐问道:“在未来,我们如何在巨大的信息洪流中保持清醒的头脑?面对网络暴力、谣言、侵权等问题,我们应如何采取有效措施,维护网络空间的和谐?” 这些问题引导在座师生们思考内容安全在维护网络环境中所扮演的重要角色。


在中国,内容安全得到了政府和企业的高度重视。政府部门加强了法律法规的制定与更新,积极管理网络内容,并推动企业落实主体责任。企业运用AI技术、大数据分析等手段提供全面、实时的风险监测和防范方案,辅助乃至代替人类审核员提高审核准确性和效率,是当前发展的主流方向。

近日,国家互联网信息办公室发布了一项关于《生成式人工智能服务管理办法(征求意见稿)》的公开征求意见的通知,以加强对生成式人工智能服务的监管细则。

"内容安全"是本次征求意见稿的重中之重,其主要包含三大监管要点。

01 利用生成式人工智能产品提供聊天和文本、图像、声音生成等服务的组织和个人,包括通过提供可编程接口等方式支持他人自行生成文本、图像、声音等,承担该产品生成内容生产者的责任。

02 提供者应当明确并公开其服务的适用人群、场合、用途,采取适当措施防范用户过分依赖或沉迷生成内容。

03 不得开展违反法律法规,违背商业道德、社会公德行为时,包括从事网络炒作、恶意发帖跟评、制造垃圾邮件、编写恶意软件,实施不正当的商业营销等,应当暂停或者终止服务。

国际上,内容安全也得到广泛关注。欧美等发达国家在相关领域具有较强的技术研发实力,多家科技巨头如谷歌、Facebook等积极投入资源开展数字内容风控技术研发。此外,政府和民间组织也在积极推动立法和监管,以保障网络空间的安全和秩序。


朱浩齐指出,虽然内容安全行业在全球范围内均取得了显著进展,但依旧面临着诸多挑战,如隐私保护、跨境法律监管、多元文化背景下的内容审查,以及监管标准不统一等问题。这些问题不仅涉及技术层面,更关乎社会伦理和法制建设,因此内容安全对于现代网络安全从业者来说是一门必修课。


网易智企旗下的“易盾”作为一家专注于内容安全的技术提供商,致力于颠覆传统的安全防护方式,提供更加智能化的保护,并积累了丰富的实践经验和众多成功案例。

针对生成式AI风险,传统的处理内容风险案例的方法“内容识别算法”,很快会达到极限。易盾还通过行为数据、账号数据、内容数据构建了统一向量空间的协同算法模型,通过不同维度信息之间的相互验证,构建起立体化全方位的防守系统。


毫无疑问,内容安全技术将继续在加强对用户生成内容(UGC)和人工智能生成内容(AIGC)的服务管理和监管中发挥着越来越重要的作用,有效保障用户的合法权益和维护社会安全稳定。