中文站

这个暑假,谁来守住孩子的内容边界?

暑假刚开始,运营部就没消停过。

小李是平台内容安全负责人,暑期本该是孩子放松的时候,对他来说却是风险高发的“内容雷区”。

他没想到,暑假还没过完,自己已经在梦里把《未成年人网络保护条例》背了三遍。

“你们平台到底推了什么东西给孩子?!” 凌晨两点,小李接到了一个电话,对面是情绪激动的母亲。

孩子刷到一条“挑战翻墙”的短视频,结果半夜真的跟朋友模仿,摔断了腿。家长发现后报警、投诉、发帖,舆情正在发酵。小李点开后台——这条视频播放量突破十万,点赞和评论还在疯涨:“太刺激了!”“我也要试试!”

他知道,这是一次内容事故,更是一次法律事故。

第二天上午,集团合规会临时加会,法务在会上发飙:“《未成年人网络保护条例》不是去年刚落地的吗?我们的‘青少年模式’还有用吗?”

没人说话,因为大家都知道,出问题不是因为没开青少年模式,而是没有效果。

比如,一个账号实名信息显示“赵大年,47岁”,但直播里坐着的是穿校服的小孩;短视频里写着“我在XX中学”,系统识别成“校园美食”并推上首页;青少年模式里的推荐,竟然有“粉底液测评”“翻墙挑战合集”“深夜emo语录”......

平台不是没看见,而是看不懂谁是孩子,更不知道给谁推什么

平台如何能守住“边界”?——小李开始寻找答案。

他开始找第三方服务商,找能“识别未成年”“理解内容”“区别用户”的系统。不是靠人力盯、靠封面图判断,而是靠技术系统真正建立一套“未成年人识别 + 内容识别 + 分发控制 + 运营闭环”的机制。

就在焦头烂额的Q2季度末,小李被拉去参加了一场关于“内容安全与未成年保护”的闭门技术交流会。那天,他听到了一个他最关心的问题:“不是所有内容都不良,问题是你有没有把对的内容,推给对的人。

这句话,让他彻底安静下来。

因为过去平台所有努力都只是在“删掉错的”,而现在,有人正在做一套系统,用来“识别对的”。

这背后的答案,就是为未成年场景定制的内容安全解决方案。

来自网易易盾的团队,分享了他们的核心体系:这不是一项技术,而是一整套系统——贯通了用户入网、业务交互、平台运营三大阶段,构建了多层次、全链路的风控闭环。

小李看着屏幕上的能力图谱,突然觉得自己一直在“补漏洞”,而别人已经在“重构地基”。

01 精准识别未成年用户

在平台系统里,账号的注册信息、内容行为、互动方式往往被“统一标签”,未成年用户不该是那个“被统一打包”的对象。他们的风险,不在内容本身,而在于系统是否真正识别出“这是谁”。

网易易盾的第一道防线,正是从源头认清身份

平台接入公安系统进行实名核验,验证身份信息真伪;而为了防止用照片、视频模拟身份,系统还部署了摄像头识别的活体检测模型,防止用照片或录屏模拟完成注册。此外,在用户与平台交互阶段,也会进行多模态生物特征识别,进而结合账号注册信息、历史行为判断是否为未成年人。人脸识别结合+年龄估计模型则进一步补充了一层语义识别能力,对“疑似未成年账号”进行标注并触发风控机制。

那一刻,小李突然意识到:真正的守护,不是限制谁发了什么,而是从“知道谁是孩子”开始。

02 智能识别风险行为与内容

内容安全的核心从来不只是内容本身,而是由于它推给了不该看到的人,或者是被不合适的人发布。

在内容交互环节,网易易盾构建了更智能的内容风控模型来补足平台盲点。比如,系统可以通过OCR文字识别提取视频中的字幕、文案、图像信息,快速识别“泄露学校”“家庭地址”“电话微信号”等隐私风险;再通过动作识别模型,对视频中的高危模仿行为(如翻墙、跳楼、恶作剧化学实验)打上预警标签。

直播风控层面,则通过人脸检测与语音年龄分析双重交叉验证,识别直播主是否为未成年人。商品识别系统也会自动判断是否出现烟酒、化妆品等不适宜向未成年人推荐的物品。

更关键的是,系统在评论区也布下了“第二道感知墙”。通过语义理解与情感分析模型,平台可以提前识别“搭讪”“诱导”“辱骂”等灰区内容,一旦触发关键词,就会触发嫌疑标签;为避免误判,会通过人工审核进行复核确认。

03 账号画像驱动的运营风控机制

在技术交流会的最后一个环节,小李听到了他最关心的问题:“平台每天处理这么多内容,靠删靠封靠申诉,能撑多久?”

网易易盾在此阶段提供的,是一整套基于账号画像的闭环风控能力,帮助平台建立起动态可调、分级响应、长期有效的治理机制。

首先,基于账号语言风格、活跃时间、访问内容等行为特征,易盾提供动态账号画像与风险等级评估能力,支持持续识别未成年用户及风险账号,并通过多维度打标将画像结果传递至平台系统。

其次,针对被识别为未成年或存在风险特征的用户,平台可调整权限执行策略,包括对评论、弹幕、打赏、私信等高互动功能进行限制,降低潜在的陌生人接触与情绪引导风险。

在内容推荐维度,易盾支持构建“适龄内容标签”,为平台提供分龄内容分发策略建议。平台可基于用户画像自动降低高风险内容权重,如涉及暴力模仿、情绪宣泄、商业化诱导等内容类型,强化对未成年用户的推荐安全保障。

同时,针对系统识别结果不确定或涉及高敏感场景的内容,易盾支持AI + 人工巡检机制,根据系统智能打标结果,将内容自动流转至人工审核队列,实现模糊边界场景的复核兜底。

对小李来说,这是他第一次看到“推荐系统”真正作为风控工具,而不是算法利润模型。他意识到了,真正守住边界的,不是一次性处理某条视频,而是让系统具备“不靠提醒也能持续守住”的能力。

那天会议结束的时候,已经是傍晚。

小李习惯性地打开平台后台——几个小时没看,评论区又多了十几条“疑似引流”的私信评论,几条短视频开始被举报“模仿风险”。

但今天不同了。他脑子里浮现的不是压力,而是解决路径:是不是可以先把账号打个标?是不是能提前把“高危模仿”分类放进低权重池?是不是能开通易盾的联动接口,把评论沉贴策略接起来?

他意识到了,风控不是一次决策,而是一种长期机制

走出会场前,他给自己的团队发了一条消息:“我们不需要再写一份‘未成年风险防控’PPT了,我们要上线一套能用的系统。”

未成年人的世界,需要有边界。网易易盾未成年人内容安全解决方案,让识别、审查、防控、协同成为闭环,为平台建立真正有温度的“技术底线”。