中文站
  • OCR探索_网易易盾

    OCR即字符识别,通俗说就是将图片中有意义文本信息识别出来。对于图片验证码识别,通常分为几个步骤:图片预处理(二值化、去除干扰点)、字符分割、字符识别。OCR探索

    来自:动态资讯
  • 如何识别文本中敏感词内容?_网易易盾

    文本中敏感词识别,常规方法是关键词识别和算法规则。算法规则也叫规则引擎,主要就是表达式集合,这种方式识别准确率会提高很多。但垃圾内容升级进化速度太快,复杂字符重组、特殊符号等让审核方法也束手无策。如何识别文本中敏感词内容?

    来自:动态资讯
  • 知物由学 | “找茬”不如交给AI算法,细说文本纠错多种实现途径_网易易盾

    顾名思义,文本纠错就是将文本中有错误地方进行纠正,错误类型包含错别字、缺失字、冗余字、词语搭配错误和语法错误等。目前也有一些开源文本纠错工具,但其效果距离真正应用还有较大差距。知物由学 | “找茬”不如交给AI算法,细说文本纠错多种实现途径

    来自:动态资讯
  • 易盾牵头、工信部批准行业标准,究竟长啥样?| 权威解读(内附标准免费下载)_网易易盾

    网易易盾牵头编写《信息内容识别技术 第 1 部分:基于文本识别的内容检测服务系统指标要求和评估方法》行业标准,获得正式批复,并于 2023 年 11 月 1 日正式实施。易盾牵头、工信部批准行业标准,究竟长啥样?| 权威解读(内附标准免费下载)

    来自:动态资讯
  • 精准打击!让违规图片无所遁形秘密是什么?_网易易盾

    相较于文本信息,图片信息识别难度更大。因此,图片为许多恶意用户所利用,成了不良有害信息藏匿之地,这些图片传播破坏了文明和谐互联网内容生态,也大大增加了平台违规风险。让违规图片无所遁形秘密是什么?

    来自:动态资讯
  • 文本内容安全领域 深度学习六个主流应用方法_网易易盾

    深度学习兴起之前相当长一段时间内,基于机器学习文本分类方法占据着文本分类领域统治地位。本文根据易盾文本算法团队在内容安全领域实践经验,介绍一些深度学习模型以及对部分技术细节进行讨论。文本内容安全领域 深度学习六个主流应用方法

    来自:动态资讯
  • 知物由学 | 易盾自研文本实时聚类技术,一网打尽社交网络中同类有害内容_网易易盾

    实际业务场景中,每天文本内容数据量都在亿级以上,为了高效处理如此海量数据,文本聚类技术运用是必不可少。所谓文本聚类,指的是将文本按照类别进行聚合,然后以类别为单位对文本进行处理或使用。知物由学 | 易盾自研文本实时聚类技术,一网打尽社交网络中同类有害内容

    来自:动态资讯
  • 基于DNN人脸识别反欺诈机制_网易易盾

    欺骗攻击是指通过使用照片、视频或授权人脸部其他替代品来获取其他人特权或访问权。本文介绍了基于DNN人脸识别反欺诈机制。基于DNN人脸识别反欺诈机制

    来自:动态资讯
  • 如何高效检测过滤文本中敏感违禁等不良信息?_网易易盾

    文本检测是网站反垃圾系统中最为常见部分。因为文本垃圾信息无孔不入,而且种类繁多,我们必须通过自动化反垃圾技术体系来提高效率、降低成本;自动化技术体系升级,让工作更轻松一些。如何高效检测过滤文本中敏感违禁等不良信息?

    来自:动态资讯
  • 更适合文本分类轻量级预训练模型_网易易盾

    本文将详细介绍一种基于预训练半监督文本分类轻量型模型,即 VAMPIRE 模型,为解决由于大量数据和高昂计算力导致资源不足问题提供一些思路。更适合文本分类轻量级预训练模型

    来自:动态资讯