人证测评避坑清单

2026-07-05

人证测评最怕只看演示通过率。供应商样片、办公室光线和真实用户现场完全不是一回事。避开这些坑，才能看出一套人证方案到底能不能扛业务。

问题一：测评只跑标准样本靠谱吗？

不靠谱。标准样本通常光线好、证件新、用户配合度高，很容易跑出漂亮数据。真正的人证测评必须放进脏样本：旧身份证、反光卡套、浓妆、眼镜、口罩摘戴、强背光、老人和未成年人。

我更看重边界样本表现。比如同一个人证件照相隔八年，系统是直接拒绝，还是进入复核区；双胞胎、相似亲属是否容易误过；照片翻拍攻击能否拦住。这些比演示时“一秒通过”有价值。

分数高不等于系统好。不同厂商的分值没有可比性，A家的85分可能相当于B家的70分。测评时应关注误拒率、误受率、重试率和人工复核比例，而不是单看界面上的数字。

一个常见坑是为了提高通过率，把阈值调得很松，短期投诉少了，风险也放进来了。反过来阈值过严，黑产没拦多少，正常用户先被劝退。阈值应该按业务损失和用户成本一起调。

会员专享，海量内容

复杂不一定好。连续眨眼、摇头、读数字，确实能增加攻击成本，但也会增加失败和流失。人证测评要看攻击防护，也要看用户完成时间。高峰线下场景，多出10秒就是明显排队。

更稳妥的做法是分层：普通低风险用无感或轻动作，高风险、异常设备、异地登录再加严。所有人都走最高强度，听起来安全，实际会把正常用户推向人工窗口。

很多测评只测技术，不测数据流，这是大坑。要问清楚照片是否落库、保存多久、谁能访问、是否加密、是否支持删除、日志能否审计、供应商是否把数据用于模型训练。答不上来，就不是小问题。

还要检查前端告知。用户点击前是否知道采集目的，是否有替代方式，失败后是否能申诉。人证系统一旦被用户理解成“强迫刷脸”，投诉压力会比技术故障更难处理。

我建议用四张表：样本覆盖表、指标结果表、异常处理表、合规检查表。样本少于几百组、没有真实业务环境、没有失败日志的人证测评，只能算试用，不足以支撑采购。

结论不要写成“某某最好”，而要写适配边界：适合高峰通行还是远程认证，适合年轻用户还是全年龄段，适合强风控还是低摩擦转化。避坑的关键，是让测评贴近你的业务，而不是贴近供应商的演示台。

加入会员，海量资源任你看

人证测评看哪些指标？

至少看通过率、误拒率、误受率、重试率、平均耗时、人工复核率、攻击拦截能力和投诉情况。

人证测评需要多少样本？

小试可用几十组发现明显问题，采购决策建议至少几百组，并覆盖年龄、光线、证件新旧和真实设备环境。

怎么判断人证供应商是否合规？

看数据用途告知、存储周期、加密措施、访问控制、删除机制、审计日志和合同中的数据处理条款。