-
如何识别文本中敏感词内容?_网易易盾
文本中敏感词识别,常规的方法是关键词识别和算法规则。算法规则也叫规则引擎,主要就是表达式的集合,这种方式识别准确率会提高很多。但垃圾内容升级进化速度太快,复杂字符重组、特殊符号等让审核方法也束手无策。如何识别文本中敏感词内容?
来自:动态资讯 -
如何查询过滤网站上违禁词?_网易易盾
违禁词过滤通常包括以下几个方面的工作:1.首先要进行用户画像,区分网站正常用户、新人(注册7天内的用户)和有违规记录的用户。通过大量数据研究发现,注册不久就发布内容的用户发布广告的比例较高如何查询过滤网站上违禁词?
来自:动态资讯 -
当鉴黄师是怎样的体验?_网易易盾
互联网飞速发展,网络上涌现出海量的文本、图片、语音和视频信息,黄色内容自带流量,于是就有不法分子想借此走捷径。鉴黄师的职责就是净化网络中的涉黄内容,本文采访了一位资深的鉴黄专家当鉴黄师是怎样的体验?
来自:动态资讯 -
更适合文本分类的轻量级预训练模型_网易易盾
本文将详细介绍一种基于预训练半监督的文本分类轻量型模型,即 VAMPIRE 模型,为解决由于大量数据和高昂计算力导致的资源不足问题提供一些思路。更适合文本分类的轻量级预训练模型
来自:动态资讯 -
精准打击!让违规图片无所遁形的秘密是什么?_网易易盾
相较于文本信息,图片信息的识别难度更大。因此,图片为许多恶意用户所利用,成了不良有害信息的藏匿之地,这些图片的传播破坏了文明和谐的互联网内容生态,也大大增加了平台的违规风险。精准打击!让违规图片无所遁形的秘密是什么?
来自:动态资讯 -
剖析一种短文本内容安全检测技术_网易易盾
本文介绍了短文本内容安全检测其中一小块的技术,实际应用中,网易易盾采用了更加复杂的模型和多套组合拳。如果对内容安全检测能力要求比较高的客户,可以免费体验网易易盾高效、智能的内容安全服务。剖析一种短文本内容安全检测技术
来自:动态资讯 -
杭研技术秀 | 短文本内容检测反垃圾技术_网易易盾
本文针对短文本数据,作者采用了一种基于二元文法双词共现的概率统计建模方法,在色情-辱骂分类问题上取得了比传统LDA主题模型更优的效果,并且准确率和召回率指标能够随着主题个数的增加而稳定提高。 杭研技术秀 | 短文本内容检测反垃圾技术
来自:动态资讯 -
再造巴别塔,我们如何进行NLP跨语言知识迁移?_网易易盾
借助这一技术,易盾能够将中文内容检测能力迅速扩展到其他语种,全方位拦截垃圾文本 再造巴别塔,我们如何进行NLP跨语言知识迁移?
来自:动态资讯 -
花椒敏感词系统架构详细_网易易盾
直播系统内容监管是必不可少的一个环节,需要拦截词语包括涉政、非法、宗教、暴恐、版权等,以及平台需要拦截的包括竞品挖人、低俗、广告等垃圾词,本文从文本内容的管控角度介绍下花椒敏感词服务的定制和应用。花椒敏感词系统架构详细
来自:动态资讯 -
整治通过谐音变体传播不良信息,一站式“文本纠错”交给AI_网易易盾
长期以来,平台用户为了躲避平台监管,在内容上采取“谐音”与“变种”等方式发布不良有害信息。“变体字”“谐音字”乔装打扮,也为色情暴力内容传播提供了便利,为低俗暧昧内容的传播提供可乘之机。整治通过谐音变体传播不良信息,一站式“文本纠错”交给AI
来自:动态资讯