相较于文本信息,图片信息的识别难度更大。因此,图片为许多恶意用户所利用,成了不良有害信息的藏匿之地,这些图片的传播破坏了文明和谐的互联网内容生态,也大大增加了平台的违规风险。
针对以上问题,“图像检索技术”发挥出了无可比拟的巨大优势,可以依据图片信息做到精准识别,是打击不良有害图片、守护内容安全的重要手段。
在网易易盾,“图像检索技术”是保障企业内容安全的核心技术之一,致力于该领域的资深算法专家李唐薇对此有着丰富的实践经验。在《图像检索技术怎样准如“雷达”,从一张到亿张精准定位图片违规?》一文中,她曾详细介绍构建基于内容的图像检索技术所涉及的一些典型算法,广受好评。
精准打击违规图片,守护企业内容安全
一般而言,图像检索技术可分为两种,一是基于文本的图像检索技术,二是基于内容的图像检索技术。
基于文本的图像检索技术主要依赖于文字描述,但受限于言语使用及认知差异,图像的文字描述之间并不完全一致,一个关键词对应的图片数量十分庞大,用户在检索过程中往往会发现最终结果差强人意。
基于内容的图像检索技术则完美弥补了这一劣势,它以图像语义特征为线索,从图像数据库中检出具有相似特性的其他图像,具备识别准确度高、检索速度快的优点。这种“以图搜图”的形式给我们带来了极大的便利,有效摆脱了“为寻找一张目标图像,需浏览海量图库”的窘境。
李唐薇表示,借助基于内容的图像检索技术,针对图像特征表达能力及检索结构设计的更新和优化,易盾能迅速提取图像中的风险特征,从海量图像中迅速检索出违规图片,以极其高效的方式帮助企业规避内容安全风险,保障平台内容生态和谐,并且可以从一定程度上降低企业的审核成本。
得益于强大的技术团队,易盾在“图片识别”技术上搭建起了强大的索引结构,“图索引”与“倒排量化索引”相融合的索引结构极大提升了检索系统的并发能力,可以高效快速地进行图像检索。针对服饰、logo 等具体任务,易盾也定制了任务相关特征模型,融合了多场景特征,可以有效提升特征检索的效果。
因此,易盾的“图片检测”服务具备极强的泛用性和稳定性,可以满足绝大多数企业的需求,一经接入,即可识别平台内的不良有害图片。
除了打击不良有害图片外,“图像检索技术”在生活中的应用也十分广泛,和我们的生活有着十分密切的联系。
当用户看见一件心仪的短袖却苦于不知如何在购物软件中找到同款商品时,通过拍照搜同款的方式就能解决。借助图像检索技术,用户还能确保自己注册的商标不会涉及到侵权问题,通过一张电影截图便能知道它的具体出处,也能让用户通过一张布料图片得到与其相关的更多信息。
这项技术也有着巨大的社会价值,通过人脸识别和特征比对,可以找到走失妇女儿童的具体信息,帮助他们重回家园。对大众而言, “图像检索技术”的发展无疑给我们的生活带来了许多便利。
“始于好奇,陷于有趣,忠于实践”
当被问及为何选择研究图像检索技术时,李唐薇认认真真说出了 12 个字:“始于好奇,陷于有趣,忠于实践”。
大学时期一门“特征识别”课程打开了她探索“图像”领域的好奇心,让她萌生出了进一步探索这其中原理的想法。通过一步步的学习和实践,她对这一领域的了解日渐深入,在研究生阶段,她开始系统学习“图像检索”技术。步入社会后,她选择加入网易易盾,成为了一名算法工程师。
从学生转变成职场人,身份上的转变让她意识到新技术的最终目的是运用于实践,如何让新技术更加科学地落地,让产品拥有更好的商业价值就成为了她在工作之中不断探索的方向之一。
“看到自己学习的新技术成功落地,并且给客户带来了便利时,这种‘成就感’是其他事情难以与之匹敌的”,在李唐薇看来,新技术的应用实施让产品更好服务于客户是这份工作的魅力所在。
为此,在下班时间研读相关论文,了解学界的最新发展动态,思考学界新技术在工业界落地实施的可能性,总结复盘其中遇到的问题已经成为了她的“工作标配”。
而在这过程之中,难免会出现不如意的时候。将新技术应用到新场景时,要做很多的尝试来适配和调优,有时并不那么顺利,“这时就需要自己多花一些功夫重新学习,并依据场景特点思考具体的优化方法”。
技术落地实施受阻的情况时常有之,面对这些压力时刻,李唐薇直言,“一定要保持良好的心态,不要放弃探索,要通过不断地学习和沟通交流来攻克难题、消解压力”。
当然,李唐薇的生活也不只有论文而已。每当周末到来,拼乐高、打球就成为了她放松身心的方式,“拼乐高的过程是很有趣的,我可以摆脱浮躁,静下心来。而且,积木的拼接组合往往会得到很多出乎意料的结果,在专注于积木拼接的过程中,有时也会让我萌生出很多新奇的想法,有些甚至可以给自己的工作带来新的启发”。
热爱可抵岁月漫长
人们常说,“热爱可抵岁月漫长”,工作占据了人生绝大多数时间,可以从事自己喜欢的工作是人生一大幸事,对李唐薇而言更是如此。
因为热爱,所以选择深耕于图像检索领域,从中得到的满足感和幸福感驱使着她保持“学习”的状态,用更新更好的技术服务于客户,这种良性循环让她对自己的工作充满热情和动力。
而在网络上,常常会出现“女生不适合做程序员”的错误论断,对此,李唐薇也明确表示,这实际上是一种误解,“‘热爱’才是决定你是否选择从事某一工作的重要原因”。
如果你对新事物有着强烈的好奇心,愿意不断对其进行探索,能够静下心来钻研学习,那么,你就具备了一位程序员应有的基本品质,可以考虑将程序员作为自己的未来职业之一。
“我的同事们也是如此,对技术人员而言,时时刻刻保持学习的状态是我们的职业基本素养之一”,她说道。
写在最后
提及“图像检索技术”的前景时,李唐薇坚定地表示,这一领域的前景十分明朗,未来的发展将更加可观。
将图像领域不断涌现的新技术应用于工业之中,精准高效打击违规图片以保障企业的合规经营,这是李唐薇的工作目标,也是易盾技术团队的愿景所在。
未来,易盾也将继续深耕于此,以技术革新推动行业发展,为守护清朗的网络空间、共建文明和谐的互联网内容生态贡献自己的一份力量。