本福特定律(Benford’s Law),也称为首位数字定律。本福特定律指出,在许多自然发生的数据集合中,以数字1开头的数据出现的频率约为30.1%,以数字2开头的约为17.6%,以此类推,数字越大作为首位数字出现的概率越小。
具体概率为:
首位数字为1:30.1%
首位数字为2:17.6%
首位数字为3:12.5%
首位数字为4:9.7%
首位数字为5:7.9%
首位数字为6:6.7%
首位数字为7:5.8%
首位数字为8:5.1%
首位数字为9:4.6%
本福特定律并非对所有数据都适用,需要满足以下条件:
1、数据应该跨越至少2-3个数量级 例如:从几十到几万,或从几百到几十万。如果数据都在相似范围内(如100-200),则不适用
2、数据源要求:自然发生的数据:人口、收入、物理测量、地理数据。而不是人为分配的数据:电话号码、学号、产品编码等,并且也不是有固定范围的数据:考试分数(0-100)、年龄等。
本福特定律常见的应用:数据审计、监察以及科学研究