在实验中,研究人员收集了来自58个名志愿者的5800段测试视频,他们分别输入了4位数和5位数的PIN码。经过3次尝试性输入(通常是卡被扣留前允许的尝试次数),研究人员分别以 30%和41%的概率还原了5位和4位PIN码的正确序列。
该模型可以根据遮挡键盘的那只手的覆盖范围来排除无关按键,并通过评估两个按键之间的拓扑距离,从另一只手的动作中推断出按下的数字。
拓扑:只考虑物体间的位置关系而不考虑它们的形状和大小
实验中,记录视频的摄像头位置对结果起着重要作用。在实际中,通过ATM顶部隐藏针孔摄像头被认为是最佳视角。如果摄像头也能够捕捉音频,模型还可以使用每个数字略有不同的按压声音反馈,从而使预测更加准确。