社区将某一领域的人群聚集,出于某些目的,恶意广告发帖和灌水非常常见,本文介绍几种常见防恶意灌水的方法。
首先要进行用户画像,区分正常用户、新人(注册7天内的用户)和有违规记录的用户,不能一棒乱打。通过大量数据研究发现,注册不久就发布图片的用户发布广告的比例较高,并存在机器刷广告的行为。有过违禁记录的用户,又被称为“高危用户”,往往社区的惩罚解除不久,又开始“胡作非为”,因此针对这一人群需要做重点审核。
应对此类问题常会使用的方法有:
1.建立并完善违禁词词库,将违禁词分级为轻微违禁词和严重违禁词,当有用户发出带有违禁词帖子时,系统自动监测违禁词的级别,如果是轻微违禁词,则要过滤给人工审核进行判断,以防止误判,而带有严重违禁词的帖子则自动删除或阻止发布。
2.重复发帖及回复系统自动阻止或提醒,对于频繁发布重复内容及高频次回复用户重点监测,一旦发现其发布恶意广告的行为,在处理时也要委婉一点,比如提示网络不好,请重试等,防止错判。
3.建立风险名单库识别不良用户,基于长期的业务数据和反作弊数据,可以积累出各类风险名单库,比如:手机号、设备、账号等等。风险名单库主要包含黑名单和灰名单,网易易盾通过多年和恶意广告的斗争,已经积累了千万级的风险名单库。
4.完善举报、反馈机制,借助社区用户的力量,在一定程度上降低垃圾信息的危害。
网易易盾在内容安全防护领域有深厚积累,日过滤不良信息超过10亿。基于海量样本数据,智能策略定制,高效过滤色情、广告、涉政、暴恐等多类垃圾文字及敏感词、违禁变种,数千知名客户信赖之选,点击免费试用网易易盾智能审核管理系统。