
近日,随着美国法院对TikTok禁用法令的生效期逼近,美国大量网民对失去TikTok从而无处可去的担忧日益增加,我国另一款热门社交媒体应用小红书国际版(RedNote)迅速在美国互联网爆红,一举登顶苹果App Store下载榜。
原TikTok的用户们迅速涌入小红书,并自称“TikTok难民”,依靠着翻译系统,开始在小红书上开设账号并进行社交。截至目前,小红书上“TikTok refugee(TikTok难民)”话题下的笔记数量已经超过11万,总浏览量近亿。
此时此刻打开小红书,是这样子的:
(小红书App内容截图:首页推荐)
不仅是国外用户打开了一个全新的世界,对于国内用户来说,也颇有一种“游戏合区”的感觉。
在互联网社交行业中,对于任何一个社交平台型产品来说,用户量、用户活跃度都是被视为宝贵的产品资产。因而对于小红书发生一夜之间,用户暴增的情况,不少媒体在报道中将其形容成一场“意料之外的泼天富贵”。对于负责增长的从业人员来说,这当然是意外之喜。
但从安全从业人员的视角审视,还必须冷静地看到“喜”的背后蕴藏着怎样的“忧”,以及该如何解决“忧”。
01.一夜出海后的喜忧参半
不同文化、价值观与法规间的碰撞
当社交型平台短期内涌入大量海外用户后,除了带来暴增的用户资产以外,也必然还将面对一系列挑战。
从安全角度来看,将至少面临以下三方面内容安全问题:
一、用户大量涌入,平台内容数量“井喷”
大量海外用户涌入后,平台上的内容数量会大幅增加。前文提到,短短两天时间,小红书“TikTok refugee(TikTok难民)”话题下的笔记数量已经超过11万。
“井喷”的内容生产必然带来内容审核量的激增,这其中包括运用人工智能技术的AI审核计算量与人工审核的人力。因此,对于固有的审核机制和团队配置提出更高的要求。
(招聘网站截图)
二、用户来自全球,大小语种多点开花
海外用户来自不同的国家和地区,他们发布的内容涉及多种语言和文化背景。国内社交平台需要建立更加完善且适应多元文化的审核机制,以确保内容的合规性和符合平台价值观。
例如,不同国家对于内容的敏感度和接受度存在差异,一些在某些国家文化中可接受的内容,在其他国家可能被视为违规。
另外,来自全球多达数十种,甚至上百种主流与非主流语种对于多语种审核能力有着更高的要求。
(小红书App内容截图:不同语种)
三、黑灰产诈骗杀猪盘需额外谨慎
随着海外用户数量的爆发增长,虚假信息和不实内容传播的风险也在不断上升。对于内容和社区产品来说,平台内部不可避免地会出现导流、灰产、诈骗等不法行为。如何保障平台用户的财产安全和优质的产品体验,成为至关重要的任务。
互联网发展至今,导流、诈骗等行为往往是由成熟的灰黑产产业链所操控,他们积累了丰富的反监查和防过滤经验。因此,揪出这些不法分子并进行有效处理,需要平台运用合适的技术与策略。
02.同一空间,共享“清朗”
用户入乡随俗,内容风控紧守“红线”
基于不同文化、价值观与法规,造就了不同平台的社交环境与平台公约。
基于不同平台的社交环境与平台公约,需要有不同的内容风控规则。
基于不同的内容风控需求,需要有不同的内容风控产品与能力。
以此次TikTok用户大量入驻小红书为例,面对短期内暴增的海外用户,落在数字内容风控实践中需要提升以下能力:
一、AI审核多语种识别审核能力
基于目前已经发现的内容来看,已经出现了至少包含英文、日文、韩文、俄文、泰文、越南语等在内的各类内容,大量海外用户的增长意味着用这些语言生产的内容将大幅增加。因此AI审核的多语种识别能力必须提升,最好完全覆盖主流语种,尽可能覆盖稀有小语种。
以网易易盾为例,网易易盾多语种识别审核能力支持90+语种文本检测,包括:中文、粤语、维语、新维语、藏语、蒙古语、英文、日语、韩语、印尼语、印地语、泰语、越南语、菲律宾语、马来语、俄语、波兰语、德语、法语、乌尔都语、意大利语、西班牙语、土耳其语、葡萄牙语、阿拉伯语、希腊语、荷兰语、孟加拉语等,并且有20+种可支持定制化策略运营。
二、精准的图片检测能力
通常国外内容平台与国内的内容平台对比来看,即以TikTok与小红书为例对比,TikTok在某些方面内容审核的尺度可能较宽松一些,例如人体的裸露程度。另外,还有不同宗教信仰、不同民族文化、不同历史文明带来的不同审核尺度与布控重点。
因此,在图片这类比文本更加复杂一级的内容类别上,则尽可能需要更加精细化的检测类别,包括但不限于色情、涉政、爆空、低俗、违法违规等。
(小红书App内容截图)
三、专业的全球化审核团队与系统支持
对于一家面向全球海内外用户提供社交与内容创作交流价值的互联网平台而言,一支面向全球的专业化人工审核团队和专业化的审核系统是业务必需。从人工的专业能力上来说,通识几种主流大语种则是所需的专业素质之一。
以网易易盾的全球化审核服务为例,网易易盾为出海企业设计了海外专项团队。海外舆情团队负责搜集各国与内容相关最新法规政策、监控当地内容舆情走向;海外运营团队针对团队成员小语种能力来指定负责国家,基于最新政策、舆情内容,实时调优各国专属检测系统,提升机器识别准确率,保准覆盖最新法规标准;海外审核团队分别坐落于菲律宾、印尼、马来西亚、越南,为东南亚各国客户提供高效的人工审核服务。
四、引流内容、杀猪盘内容精准识别
常见的海外平台引流内容方式为通过评论、私聊等功能环节发布诱导信息,以各种理由引诱客户脱离当前产品,到黑灰产指定的沟通平台中进行后续交流;杀猪盘内容为不法分子活跃于各大社交软件寻找受害者,通过聊天发展感情取得信任,随后将受害者引入博彩、理财等诈骗平台进行充值,骗取受害者钱财。
当不同国家地区、不同文化的海外用户涌入平台后,更多的未知性可能会加剧这类情况发生,因此对此类内容的精准识别能力也需要进一步提升。

五、AI深度伪造识别专项能力
从内容生产的方式来看,当诸如小红书这样的内容平台涌入大量海外用户后,其实际上也代表着接受了国外的内容创作工具,例如国外的人工智能内容生成工具。
因此,在关于AI伪造与AI生成的内容风控上,需要额外增强相关专项内容安全能力。

六、未成年人专项保护能力
在国内外不同环境之下产生较大差异的场景中,未成年人保护是最为紧迫和重要的。
以网易易盾的实践为例,首先通过AI技术,我们能够精准判断年龄范围、识别未成年人声音、检测未成年人习惯用语以及检测手指触摸的大小范围和账号活跃时间等,从而可以快速锁定“疑似未成年”的账号。在识别未成年人账号后,我们需要对其在网络交互过程中产生和接收的内容进行细致的识别和筛选,准确地识别需要细化的内容分类分级标准。最后,网易易盾有的放矢地针对不同年龄段的未成年人进行精细化的内容管理。
网易易盾拥有9大分类与1000多种细分类标签,可以更好地标记出不适合未成年人的内容。通过这样的模式,在社交平台上为未成年人创造一片“清朗”空间,打造一个适合祖国花朵生长的空间。
对于像小红书这样的互联网平台而言,能通过此次在美国地区爆红进一步扩大海外用户规模和国际市场份额,带来更多的商业化机会。其次,亦可以作为促进国内外民间文化交流的窗口,承担更多社会责任。
但在接住“泼天流量”的同时,网易易盾认为做好该做的安全工作以应对一系列放大的安全合规挑战,牢牢守住安全“红线”更加是必要工作。