字节跳动
联系方式智能审核 Workflow
搭建规则初筛 → 视频抽帧 → 语义判断工作流,日均风险从 2000+ 降到 30+。
背景
黑产把手机号藏在路牌、门牌、衣服印花等背景区域里,传统 OCR 一扫一大片,误伤严重,审核员每天要看 2000+ 条风险漏放。
我的角色
Workflow 架构师 + 规则设计师
行动
- 设计三层漏斗:代码正则初筛、标题电话判断、视频抽帧复核
- 提出前景区域识别,只关注连续出现且位置固定的数字
- 结合 Caption 判断号码是否与商家场景相关
- 灰度测试 3 帧、5 帧、8 帧,最终收敛到最优阈值
结果
- 日均风险从 2000+ 降到 30+
- 模型准确率 99%
- 人工复核工作量减少 80%+
关键洞察
细节决定成败。一个 5 帧阈值的设定,背后是几十次灰度实验和数据对比。