-
解密UGC板块垃圾信息过滤_网易易盾
视频网站、论坛社区UGC板块存在着大量的垃圾信息,不仅触犯互联网内容安全相关规范,而且降低了用户的体验度。针对UGC板块垃圾信息过滤的问题,网易易盾给出了完美的解决方案。解密UGC板块垃圾信息过滤
来自:动态资讯 -
如何高效检测过滤文本中敏感违禁等不良信息?_网易易盾
文本检测是网站反垃圾系统中最为常见的部分。因为文本垃圾信息无孔不入,而且种类繁多,我们必须通过自动化的反垃圾技术体系来提高效率、降低成本;自动化技术体系升级,让工作更轻松一些。如何高效检测过滤文本中敏感违禁等不良信息?
来自:动态资讯 -
如何进行java代码混淆?_网易易盾
Java代码是非常容易反编译的,Java代码混淆就是为了保护Java源代码,混淆后的代码很难被反编译,即使反编译成功也很难得出程序的真正语义。本文以ProGuard来举例说明如何进行java代码混淆。如何进行java代码混淆?
来自:动态资讯 -
易盾反垃圾主要技术讲解_网易易盾
在互联网创业潮的冲击下,大量拥有互联网交互式服务功能的产品正在兴起,这些产品发展的过程中,均会遇到各种各样的垃圾信息。由于垃圾信息天然的“趋热”特点,产品拥有的用户量越大,“热度”越高,垃圾量也越大。易盾反垃圾主要技术讲解
来自:动态资讯 -
知物由学 | “找茬”不如交给AI算法,细说文本纠错的多种实现途径_网易易盾
顾名思义,文本纠错就是将文本中有错误的地方进行纠正,错误类型包含错别字、缺失字、冗余字、词语搭配错误和语法错误等。目前也有一些开源的文本纠错工具,但其效果距离真正应用还有较大的差距。知物由学 | “找茬”不如交给AI算法,细说文本纠错的多种实现途径
来自:动态资讯 -
如何识别文本中敏感词内容?_网易易盾
文本中敏感词识别,常规的方法是关键词识别和算法规则。算法规则也叫规则引擎,主要就是表达式的集合,这种方式识别准确率会提高很多。但垃圾内容升级进化速度太快,复杂字符重组、特殊符号等让审核方法也束手无策。如何识别文本中敏感词内容?
来自:动态资讯 -
再造巴别塔,我们如何进行NLP跨语言知识迁移?_网易易盾
借助这一技术,易盾能够将中文内容检测能力迅速扩展到其他语种,全方位拦截垃圾文本 再造巴别塔,我们如何进行NLP跨语言知识迁移?
来自:动态资讯 -
Java并发的3个核心问题_网易易盾
Java并发的3个核心问题是:可见性,有序性,原子性。“可见性”问题的本质描述是:在“多CPU/CPU核,且CPU/CPU核内存在高速缓存”的处理器架构中,线程A和线程B分别在不同的CPU/CPU核上Java并发的3个核心问题
来自:动态资讯 -
JAR包加固的原理是什么?_网易易盾
JAR文件是一种软件包文件格式,通常用于聚合大量的Java类文件、相关的元数据和资源文件到一个文件,以便开发Java平台应用软件或库。JAR加固是SDK加固重要部分。JAR包加固的原理是什么?
来自:动态资讯 -
知物由学 | 易盾自研文本实时聚类技术,一网打尽社交网络中的同类有害内容_网易易盾
实际业务场景中,每天文本内容的数据量都在亿级以上,为了高效处理如此海量的数据,文本聚类技术的运用是必不可少的。所谓文本聚类,指的是将文本按照类别进行聚合,然后以类别为单位对文本进行处理或使用。知物由学 | 易盾自研文本实时聚类技术,一网打尽社交网络中的同类有害内容
来自:动态资讯