8 月 9 日,由中智凯灵主办的 AiDD AI+研发数字化峰会 将在北京隆重举行。本届峰会,以“拥抱AI,重塑研发”为主题,邀请来自全球近千位技术专家、专家学者、企业高层展开深度对话,共同探讨AI驱动的未来变革。
随着人工智能技术在各个领域的深度渗透,AI安全正成为全球关注的焦点。为应对AI时代的潜在风险,探讨安全与伦理治理的方式策略演变,本届AiDD峰会特别开设了「大模型安全与对齐」主题论坛。
网易易盾受邀出席本届大会,其中易盾总经理朱浩齐担任「大模型安全与对齐」论坛出品人;易盾AI算法负责人李雨珂将在现场带来主题分享——《构建大模型时代的数字内容风控体系》。

此次网易易盾出品「大模型安全与对齐」论坛,希望汇聚行业前沿智慧,与参会嘉宾共同探讨大模型安全与对齐的核心问题,推动行业形成更具操作性的安全策略与治理框架,为 AI 技术的安全、健康发展贡献重要力量,合力实现AI可信,共建创新与安全融合共生的AI未来。
本次「大模型安全与对齐」论坛嘉宾阵容如下:

邢 颖
北京邮电大学 副教授
分享主题:AI驱动的安全知识图谱自动构建与推理
聚焦安全知识图谱在漏洞挖掘与图谱优化中的应用。基于知识图谱开展漏洞挖掘研究,以CCleaner、SolarWinds等供应链攻击事件为背景,构建技术框架,应用于ATT&CK威胁建模等多场景;借助扩散模型优化知识图谱,通过去噪提升漏洞检测准确性;介绍知识图谱自动构建技术,利用大语言模型实现漏洞知识图谱自动化构建,提升效率、降低专业门槛,为开源软件供应链安全提供解决方案。

李雨珂
网易易盾 AI算法负责人
分享主题:构建大模型时代的数字内容风控体系
基于真实业务场景下的对抗性经验解析AIGC和大模型场景下的安全防御体系设计,重点剖析高可控数据生成的基础防御模型训练、融基于模态特征的对齐敏捷风险检测、基于领域大模型的动态弹性防护等创新技术模块,并展示了对抗训练体系、搭建推理算力引擎等优化关键工程实践。围绕“持续对抗-免疫强化-弹性响应”的思路,为AIGC时代数字内容治理提供可落地的算法与工程解决方案。

李文瑾
绿盟科技 天元实验室 负责人
分享主题:LLM Agent安全攻防战:从架构风险到应用实战剖析
随着LLM Agent在产业应用的快速落地,其复杂的工作流架构正面临严峻的安全挑战。本议题将系统分析LLM Agent的技术风险,结合真实场景下的LLM Copilot实际案例,展示Prompt注入攻击如何通过Agent工作流实现攻击利用。最后探讨智能化时代下Agent安全的未来趋势,为构建可信Agent系统提供可落地的安全实践参考。
💡附:活动全议程海报
