中文站
  • NLP 模型“解语如神”诀窍:在文本分类模型中注入外部词典_网易易盾

    面对复杂多变文本表述,NLP 模型往往无法从有限训练数据中获得足够支撑,寻求外部知识注入就成为了一条必经之路。本文将基于网易易盾实践经验,分享在文本分类模型中注入外部词典一些经验知识。NLP 模型“解语如神”诀窍:在文本分类模型中注入外部词典

    来自:动态资讯
  • OCR探索_网易易盾

    OCR即字符识别,通俗说就是将图片中有意义文本信息识别出来。对于图片验证码识别,通常分为几个步骤:图片预处理(二值化、去除干扰点)、字符分割、字符识别。OCR探索

    来自:动态资讯
  • 如何识别文本中敏感词内容?_网易易盾

    文本中敏感词识别,常规方法是关键词识别和算法规则。算法规则也叫规则引擎,主要就是表达式集合,这种方式识别准确率会提高很多。但垃圾内容升级进化速度太快,复杂字符重组、特殊符号等让审核方法也束手无策。如何识别文本中敏感词内容?

    来自:动态资讯
  • 当鉴黄师是怎样体验?_网易易盾

    互联网飞速发展,网络上涌现出海量文本、图片、语音和视频信息,黄色内容自带流量,于是就有不法分子想借此走捷径。鉴黄师职责就是净化网络中涉黄内容,本文采访了一位资深鉴黄专家当鉴黄师是怎样体验?

    来自:动态资讯
  • 精准打击!让违规图片无所遁形秘密是什么?_网易易盾

    相较于文本信息,图片信息识别难度更大。因此,图片为许多恶意用户所利用,成了不良有害信息藏匿之地,这些图片传播破坏了文明和谐互联网内容生态,也大大增加了平台违规风险。让违规图片无所遁形秘密是什么?

    来自:动态资讯
  • 花椒敏感词系统架构详细_网易易盾

    直播系统内容监管是必不可少一个环节,需要拦截词语包括涉政、非法、宗教、暴恐、版权等,以及平台需要拦截包括竞品挖人、低俗、广告等垃圾词,本文从文本内容管控角度介绍下花椒敏感词服务定制和应用。花椒敏感词系统架构详细

    来自:动态资讯
  • 剖析一种短文本内容安全检测技术_网易易盾

    本文介绍了短文本内容安全检测其中一小块技术,实际应用中,网易易盾采用了更加复杂模型和多套组合拳。如果对内容安全检测能力要求比较高客户,可以免费体验网易易盾高效、智能内容安全服务。剖析一种短文本内容安全检测技术

    来自:动态资讯
  • 再造巴别塔,我们如何进行NLP跨语言知识迁移?_网易易盾

    在实际应用中,使用大规模预训练模型和平行数据实现基础迁移,再配合少量目标语言业务数据微调,可以实现更好跨语言迁移效果。借助这一技术,易盾能够将中文内容检测能力迅速扩展到其他语种,全方位拦截垃圾文本 再造巴别塔,我们如何进行NLP跨语言知识迁移?

    来自:动态资讯
  • 杭研技术秀 | 短文本内容检测反垃圾技术_网易易盾

    本文针对短文本数据,作者采用了一种基于二元文法双词共现概率统计建模方法,在色情-辱骂分类问题上取得了比传统LDA主题模型更优效果,并且准确率和召回率指标能够随着主题个数增加而稳定提高。杭研技术秀 | 短文本内容检测反垃圾技术

    来自:动态资讯
  • 整治通过谐音变体传播不良信息,一站式“文本纠错”交给AI_网易易盾

    “变体字”“谐音字”乔装打扮,也为色情暴力内容传播提供了便利,为低俗暧昧内容传播提供可乘之机。整治通过谐音变体传播不良信息,一站式“文本纠错”交给AI

    来自:动态资讯