科普技术沙龙如期而至,阻止恶意“深度伪造”走向深远

近日,由网易易盾主办以“一念向善,一念向恶"为主题的技术沙龙圆满落幕。活动期间,网易易盾资深算法专家基于“深度伪造识别技术”进行专题技术分享,吸引了数百人上线观看与交流。

科技本身并没有错,但也难免走向被滥用的命运。易盾选择合乎道德的做法,用先进技术打击“深度伪造”技术黑产化,探讨防御技术的可行性,通过定期技术分享展示给大家,以提高警惕。

两期技术分享分别探讨了“人脸伪造识别”和“人脸防护”的底层逻辑,分享AI算法如何自动判断图片、视频中的人脸伪造,解答人脸信息保护的可行性。直播中,技术专家们针对人脸应用的不同场景,从具体问题出发,结合计算机视觉领域的硬核知识,全面介绍了由机器学习算法支撑的对抗方案。

01 深度伪造引发内容安全危机

深度伪造(deepfake)是一项有趣的自动化图像、视频处理技术,能够在探测出人脸区域之后,躲开眼镜、刘海等干扰物的影响,将两张不同的人脸进行相互替换,实现无缝融合,达到以假乱真的效果。

社交平台上的“趣味”换脸一面风靡社交网络,一面引发“安全”质疑。Creopoint报告显示,随着美国大选的到来,发布在互联网上的伪造视频数量,在过去一年中增长了20倍。其中,平台上发现的伪造视频中有60%是针对政客的。


图 | 《猩球崛起3》中猩猩的表情通过动作捕捉设备生成

深度伪造并不是在这几年刚诞生的技术。回溯过去数十年,影视媒体行业的视频后期制作与深度伪造相似,但制作过程由专业团队参与,耗费更长时间、更多金钱。如今,人工智能降低了伪造的门槛,大部分人不需要任何技术知识,只需要按照步骤上传照片,就可以瞬间完成换脸,例如大火之后迅速沉寂的“蚂蚁呀嘿”与“ZAO”。

“深度伪造”技术的发展和普及亦喜亦忧。在娱乐和搞笑的背面,在世界上目光无法触及的隐秘角落中,有人不怀好意地利用深度伪造技术,进行欺诈勒索,制造虚假消息,伪造政治言论,合成色情视频,在社交平台上的内容隐患不容忽视。


图 | 英国电视台利用“深度伪造”技术制作搞笑版女王圣诞祝词

02 AI在深度伪造中的“矛与盾”博弈

为了对抗“深度伪造”的滥用,网易易盾基于深度学习算法研发了“视频深度伪造检测”技术,利用AI技术直截了当地发现带有伪造嫌疑的视频,从而趋利避害,转忧为喜。

随着deepfake、GAN、style transfer等技术的流行和发展,人脸伪造识别技术面临着伪造方法多样化、数据多样化、场景多样化的难点。

网易易盾研究人员从数据的源头入手,通过攻击的方法来模拟更多攻击的方法,扩充更多攻击数据,以培训计算机检测“深度伪造”视频。这种常见且有效“对抗-防守”方法,使得训练数据尽可能覆盖到数据分布、攻击方法,进而提升人脸伪造识别的效果。

在真实场景下,该技术能够克服不同清晰度、不同肤色甚至大侧脸的挑战,并在第二界中国人工智能高峰论坛暨多媒体信息识别技术竞赛中荣获赛道最高级A级证书,现已被尝试应用在点播、直播视频等场景下的内容安全检测能力中。

由AI算法引发的“深度伪造”与“伪造鉴别”你来我往,或将演变成一场旷日持久的对抗拉锯战。为了保证识别效果,网易易盾不断跟进最前沿的伪造技术,引入通用训练,去探索泛化能力更强的检测算法,从根本上缓解问题。