字节跳动

联系方式智能审核 Workflow

搭建规则初筛 → 视频抽帧 → 语义判断工作流,日均风险从 2000+ 降到 30+。

背景

黑产把手机号藏在路牌、门牌、衣服印花等背景区域里,传统 OCR 一扫一大片,误伤严重,审核员每天要看 2000+ 条风险漏放。

我的角色

Workflow 架构师 + 规则设计师

行动

  • 设计三层漏斗:代码正则初筛、标题电话判断、视频抽帧复核
  • 提出前景区域识别,只关注连续出现且位置固定的数字
  • 结合 Caption 判断号码是否与商家场景相关
  • 灰度测试 3 帧、5 帧、8 帧,最终收敛到最优阈值

结果

  • 日均风险从 2000+ 降到 30+
  • 模型准确率 99%
  • 人工复核工作量减少 80%+

关键洞察

细节决定成败。一个 5 帧阈值的设定,背后是几十次灰度实验和数据对比。