-
4月第2周易盾业务风控关注 | 四类网上有害内容将被大排查大扫除 _网易易盾
四类网上有害内容将被大排查大扫除;官司未决、处罚不断,“懂球帝”iOS和安卓双下架;中央发布重磅意见,数据首次正式被纳入生产要素范围,将制定数据隐私保护制度和安全审查制度4月第2周易盾业务风控关注 | 四类网上有害内容将被大排查大扫除
来自:动态资讯 -
知物由学 | 内容平台、社交媒体如何应对虚假新闻?_网易易盾
本文以Twitter平台为例,讲述的是内容平台、社交平台如何在不审查或禁止任何人的情况下打击虚假新闻的建议。需要指出的是,这个想法比较适合针对那些经常传播虚假新闻的加V(认证)用户。知物由学 | 内容平台、社交媒体如何应对虚假新闻?
来自:动态资讯 -
内容审核,靠人工还是靠机器?_网易易盾
互联网的UGC内容审查方向均在走向人工强干预,真正靠AI审核内容可能还需要5-10年的窗口期。各类音视频、社交平台只有坚持以正确的价值观引导人工审核,辅之以机器协助,才能真正将自己的社会责任落到实处。内容审核,靠人工还是靠机器?
来自:动态资讯 -
NLP 模型“解语如神”的诀窍:在文本分类模型中注入外部词典_网易易盾
面对复杂多变的文本表述,NLP 模型往往无法从有限的训练数据中获得足够的支撑,寻求外部知识注入就成为了一条必经之路。本文将基于网易易盾的实践经验,分享在文本分类模型中注入外部词典的一些经验知识。NLP 模型“解语如神”的诀窍:在文本分类模型中注入外部词典
来自:动态资讯 -
尝试用ChatGPT制造网络垃圾:从诈骗,谣言到黄暴_网易易盾
随着数字技术的开源开放,AIGC技术研发门槛、制作成本等不断降低,致使互联网内容生态更加鱼龙混杂,泥沙俱下。在ChatGPT走红掀起的新一轮的AIGC浪潮中,内容审核也应被推向新的技术高度。尝试用ChatGPT制造网络垃圾:从诈骗,谣言到黄暴
来自:动态资讯 -
OCR探索_网易易盾
OCR即字符识别,通俗的说就是将图片中有意义的文本信息识别出来。对于图片验证码的识别,通常分为几个步骤:图片预处理(二值化、去除干扰点)、字符分割、字符识别。OCR探索
来自:动态资讯 -
5月第1周业务风控关注 | 探探APP下架:涉嫌传播淫秽色情等违法违规信息_网易易盾
易盾业务风控周报每周呈报值得关注的安全技术和事件,包括但不限于内容安全、移动安全、业务安全和网络安全,帮助企业提高警惕,规避这些似小实大、影响业务健康发展的安全风险。5月第1周业务风控关注 | 探探APP下架:涉嫌传播淫秽色情等违法违规信息
来自:动态资讯 -
1月第3周业务风控关注 |官方监测发现24款违法App,包括高铁管家、搜狗浏览器等_网易易盾
官方监测发现24款违法App,包括高铁管家、搜狗浏览器等;欧盟拟在公共场所禁用人脸识别五年,防止滥用;2019 年全球网络空间内容治理动向分析;六部门联发修改网约车经营服务管理暂行办法的决定。1月第3周业务风控关注 |官方监测发现24款违法App,包括高铁管家、搜狗浏览器等
来自:动态资讯 -
易盾牵头、工信部批准的行业标准,究竟长啥样?| 权威解读(内附标准免费下载)_网易易盾
网易易盾牵头编写的《信息内容识别技术 第 1 部分:基于文本识别的内容检测服务系统指标要求和评估方法》行业标准,获得正式批复,并于 2023 年 11 月 1 日正式实施。易盾牵头、工信部批准的行业标准,究竟长啥样?| 权威解读(内附标准免费下载)
来自:动态资讯 -
如何识别文本中敏感词内容?_网易易盾
文本中敏感词识别,常规的方法是关键词识别和算法规则。算法规则也叫规则引擎,主要就是表达式的集合,这种方式识别准确率会提高很多。但垃圾内容升级进化速度太快,复杂字符重组、特殊符号等让审核方法也束手无策。如何识别文本中敏感词内容?
来自:动态资讯