-
OCR探索_网易易盾
OCR即字符识别,通俗的说就是将图片中有意义的文本信息识别出来。对于图片验证码的识别,通常分为几个步骤:图片预处理(二值化、去除干扰点)、字符分割、字符识别。OCR探索
来自:动态资讯 -
易盾牵头、工信部批准的行业标准,究竟长啥样?| 权威解读(内附标准免费下载)_网易易盾
网易易盾牵头编写的《信息内容识别技术 第 1 部分:基于文本识别的内容检测服务系统指标要求和评估方法》行业标准,获得正式批复,并于 2023 年 11 月 1 日正式实施。易盾牵头、工信部批准的行业标准,究竟长啥样?| 权威解读(内附标准免费下载)
来自:动态资讯 -
当鉴黄师是怎样的体验?_网易易盾
互联网飞速发展,网络上涌现出海量的文本、图片、语音和视频信息,黄色内容自带流量,于是就有不法分子想借此走捷径。鉴黄师的职责就是净化网络中的涉黄内容,本文采访了一位资深的鉴黄专家当鉴黄师是怎样的体验?
来自:动态资讯 -
如何识别文本中敏感词内容?_网易易盾
文本中敏感词识别,常规的方法是关键词识别和算法规则。算法规则也叫规则引擎,主要就是表达式的集合,这种方式识别准确率会提高很多。但垃圾内容升级进化速度太快,复杂字符重组、特殊符号等让审核方法也束手无策。如何识别文本中敏感词内容?
来自:动态资讯 -
精准打击!让违规图片无所遁形的秘密是什么?_网易易盾
相较于文本信息,图片信息的识别难度更大。因此,图片为许多恶意用户所利用,成了不良有害信息的藏匿之地,这些图片的传播破坏了文明和谐的互联网内容生态,也大大增加了平台的违规风险。让违规图片无所遁形的秘密是什么?
来自:动态资讯 -
剖析一种短文本内容安全检测技术_网易易盾
本文介绍了短文本内容安全检测其中一小块的技术,实际应用中,网易易盾采用了更加复杂的模型和多套组合拳。如果对内容安全检测能力要求比较高的客户,可以免费体验网易易盾高效、智能的内容安全服务。剖析一种短文本内容安全检测技术
来自:动态资讯 -
再造巴别塔,我们如何进行NLP跨语言知识迁移?_网易易盾
在实际应用中,使用大规模的预训练模型和平行数据实现基础迁移,再配合少量目标语言业务数据微调,可以实现更好的跨语言迁移效果。借助这一技术,易盾能够将中文内容检测能力迅速扩展到其他语种,全方位拦截垃圾文本 再造巴别塔,我们如何进行NLP跨语言知识迁移?
来自:动态资讯 -
花椒敏感词系统架构详细_网易易盾
直播系统内容监管是必不可少的一个环节,需要拦截词语包括涉政、非法、宗教、暴恐、版权等,以及平台需要拦截的包括竞品挖人、低俗、广告等垃圾词,本文从文本内容的管控角度介绍下花椒敏感词服务的定制和应用。花椒敏感词系统架构详细
来自:动态资讯 -
杭研技术秀 | 短文本内容检测反垃圾技术_网易易盾
本文针对短文本数据,作者采用了一种基于二元文法双词共现的概率统计建模方法,在色情-辱骂分类问题上取得了比传统LDA主题模型更优的效果,并且准确率和召回率指标能够随着主题个数的增加而稳定提高。杭研技术秀 | 短文本内容检测反垃圾技术
来自:动态资讯 -
整治通过谐音变体传播不良信息,一站式“文本纠错”交给AI_网易易盾
“变体字”“谐音字”乔装打扮,也为色情暴力内容传播提供了便利,为低俗暧昧内容的传播提供可乘之机。整治通过谐音变体传播不良信息,一站式“文本纠错”交给AI
来自:动态资讯