-
产品月报_开发文档_2024年12月产品月报_网易易盾
网易易盾开发文档内容安全文本检测1、AIGC场景:新增藏头诗指令生成识别模型,有效避免用户诱导大模型生成高危藏头诗内容。2、敏感事件专项模型优化,提升模型英文覆盖能力。 图片检测1、色情-隐晦色情:拆分三级分类「下体暗示」「臀档暗示」「手揉胸」「高潮脸」「性爱动作」「类性器官」「SM暗示」「手势暗示」「产品月报,开发文档,2024年12月产品月报
来自:帮助中心 -
如何高效检测过滤文本中敏感违禁等不良信息?_网易易盾
文本检测是网站反垃圾系统中最为常见的部分。因为文本垃圾信息无孔不入,而且种类繁多,我们必须通过自动化的反垃圾技术体系来提高效率、降低成本;自动化技术体系升级,让工作更轻松一些。如何高效检测过滤文本中敏感违禁等不良信息?
来自:动态资讯 -
花椒敏感词系统架构详细_网易易盾
直播系统内容监管是必不可少的一个环节,需要拦截词语包括涉政、非法、宗教、暴恐、版权等,以及平台需要拦截的包括竞品挖人、低俗、广告等垃圾词,本文从文本内容的管控角度介绍下花椒敏感词服务的定制和应用。花椒敏感词系统架构详细
来自:动态资讯 -
AIGC内容检测解决方案_开发文档_接口文档_接口概述_网易易盾
目前,易盾 AIGC 内容检测解决方案适用于检测 AI 大模型输入和流式输出的文本。该解决方案的提交接口支持 AI 大模型输入和流式输出的提交。 针对流式输出场景,该接口能智能地将模型的流式输出文字进行拼接并检测,同时AIGC内容检测解决方案,开发文档,接口文档,接口概述
来自:帮助中心 -
AI与黑产的攻守之道,详解攻击类文字图像的检测_网易易盾
随着 OCR 系统识别能力的提升,专业对抗 OCR 的黑产也越来越多,这个过程中 AI 如何抵御黑产攻击类的文字图像?本文通过分享相似性特征训练的常见算法,并选择了其中一些有代表性的工作进行介绍。AI与黑产的攻守之道,详解攻击类文字图像的检测
来自:动态资讯 -
语序点选验证码_点击按钮进行验证_点击验证码_点击验证在线体验
网易易盾语序点选验证码,根据中文语义,按顺序依次点击图中文字,语义理解能力结合行为轨迹。语序点选验证码,点击按钮进行验证,点击验证码,点击验证,语序点击验证码
来自:网站 -
“吃播”被点名批评,敏感内容几时休?_网易易盾
治理敏感内容,不仅需要理念变化,更需要技术跟进。“吃播”被点名批评,敏感内容几时休?
来自:动态资讯 -
语序选词验证码_点击按钮进行验证_点击验证码_点击验证在线体验
网易易盾语序选词验证码,根据中文语义,按顺序依次点击图中文字,语义理解能力结合行为轨迹。语序选词验证码,点击按钮进行验证,点击验证码,点击验证,语序点击验证码
来自:网站 -
如何识别文本中敏感词内容?_网易易盾
文本中敏感词识别,常规的方法是关键词识别和算法规则。算法规则也叫规则引擎,主要就是表达式的集合,这种方式识别准确率会提高很多。但垃圾内容升级进化速度太快,复杂字符重组、特殊符号等让审核方法也束手无策。如何识别文本中敏感词内容?
来自:动态资讯 -
Android 模拟点击研究,如何突围“黑灰产”的自动化作弊?_网易易盾
模拟点击是指通过脚本、系统指令完成一些自动化点击的操作,不需要人为点击,一般应用在自动化测试,帮助阅读屏幕文字等。本文主要介绍几种主流的模拟点击技术及应用。Android 模拟点击研究,如何突围“黑灰产”的自动化作弊?
来自:动态资讯