中文站
  • 知物由学 | “找茬”不如交给AI算法,细说文本纠错的多种实现途径_网易易盾

    顾名思义,文本纠错就是文本中有错误的地方进行纠正,错误类型包含错别字、缺失、冗余、词语搭配错误和语法错误等。目前也有一些开源的文本纠错工具,但其效果距离真正应用还有较大的差距。知物由学 | “找茬”不如交给AI算法,细说文本纠错的多种实现途径

    来自:动态资讯
  • OCR探索_网易易盾

    OCR即字符识别,通俗的说就是图片中有意义的文本信息识别出来。对于图片验证码的识别,通常分为几个步骤:图片预处理(二值、去除干扰点)、字符分割、字符识别。OCR探索

    来自:动态资讯
  • 如何识别文本敏感词内容?_网易易盾

    文本敏感词识别,常规的方法是关键词识别和算法规则。算法规则也叫规则引擎,主要就是表达式的集合,这种方式识别准确率会提高很多。但垃圾内容升级进化速度太快,复杂字符重组、特殊符号等让审核方法也束手无策。如何识别文本敏感词内容?

    来自:动态资讯
  • 当鉴黄师是怎样的体验?_网易易盾

    互联网飞速发展,网络上涌现出海量的文本图片、语音和视频信息,黄色内容自带流量,于是就有不法分子想借此走捷径。鉴黄师的职责就是净化网络的涉黄内容,本文采访了一位资深的鉴黄专家当鉴黄师是怎样的体验?

    来自:动态资讯
  • 如何高效检测过滤文本敏感违禁等不良信息?_网易易盾

    文本检测是网站反垃圾系统最为常见的部分。因为文本垃圾信息无孔不入,而且种类繁多,我们必须通过自动化的反垃圾技术体系来提高效率、降低成本;自动化技术体系升级,让工作更轻松一些。如何高效检测过滤文本敏感违禁等不良信息?

    来自:动态资讯
  • 从互联网+角度看云计算的现状与未来_网易易盾

    传统行业干辛苦活的,也想纷纷上船,踏上互联网、云、智慧的浪潮。我们来盘点一下当前的现状,展望一下未来。从互联网+角度看云计算的现状与未来

    来自:动态资讯
  • 知物由学 | 易盾自研文本实时聚类技术,一网打尽社交网络的同类有害内容_网易易盾

    实际业务场景,每天文本内容的数据量都在亿级以上,为了高效处理如此海量的数据,文本聚类技术的运用是必不可少的。所谓文本聚类,指的是文本按照类别进行聚合,然后以类别为单位对文本进行处理或使用。知物由学 | 易盾自研文本实时聚类技术,一网打尽社交网络的同类有害内容

    来自:动态资讯
  • NLP 模型“解语如神”的诀窍:在文本分类模型注入外部词典_网易易盾

    面对复杂多变的文本表述,NLP 模型往往无法从有限的训练数据获得足够的支撑,寻求外部知识注入就成为了一条必经之路。本文基于网易易盾的实践经验,分享在文本分类模型注入外部词典的一些经验知识。NLP 模型“解语如神”的诀窍:在文本分类模型注入外部词典

    来自:动态资讯
  • “吃播”被点名批评,敏感内容几时休?_网易易盾

    视频直播平台相继看向美食区“吃播”内容,细化运营规则,整治相关不良内容。实际上,短视频直播平台面临着巨大的内容审核压力。治理敏感内容,不仅需要理念变化,更需要技术跟进。“吃播”被点名批评,敏感内容几时休?

    来自:动态资讯
  • 数据台-企业的数据引擎_网易易盾

    数据台最早是阿里提出的,真正火起来是2018年,大量的互联网、非互联网公司都开始建设数据台。为什么很多公司开始建设数据台?尽管数据台的文章很多,一千人眼里有一千个数据台,到底什么是数据台?数据台-企业的数据引擎

    来自:动态资讯