本福特定律(Benford‘s law)的直观解释
Posted dog250
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了本福特定律(Benford‘s law)的直观解释相关的知识,希望对你有一定的参考价值。
若待查自然数集是均匀分布的,可用 f ( x ) = 1 0 x f(x)=10^x f(x)=10x表示:
- x x x在 [ 0 , 1 ) [0,1) [0,1)区间, f ( x ) f(x) f(x)从1到10.
- x x x在 [ 1 , 2 ) [1,2) [1,2)区间, f ( x ) f(x) f(x)从10到100.
- x x x在 [ 2 , 3 ) [2,3) [2,3)区间, f ( x ) f(x) f(x)从100到1000.
- …
把 x x x轴分成 [ 0 , 1 ) [0,1) [0,1), [ 1 , 2 ) [1,2) [1,2), [ 2 , 3 ) [2,3) [2,3), [ 3 , 4 ) [3,4) [3,4),…等小区间,可将 f ( x ) f(x) f(x)分为:
- 1位数字。
- 2位数字。
- 3位数字。
- …
其中 x x x为整数时 f ( x ) f(x) f(x)为进位边界,如果为小数则 f x ) fx) fx)为两个进位边界之间的普通数字。
首位数字 n n n起头的数字包括:
- 1位数字 n n n。
- 2位数字 n m 1 nm_1 nm1。
- 3位数字 n m 1 m 2 nm_1m_2 nm1m2。
- …
上述数字的量加起来,就是以 n n n开头的数字总量 。
计算以
n
n
n开头的数字出现的概率
P
(
n
)
P(n)
P(n),要看
f
(
x
)
=
1
0
x
f(x)=10^x
f(x)=10x中
x
x
x的分布。计算方法如下图所示:
以 [ 2 , 3 ) [2,3) [2,3)这个3位数区间为例,首数为 4 4 4的有400,401…,499, f ( x ) = 1 0 x f(x)=10^x f(x)=10x单调递增,只需求出 400 = 1 0 x 1 400=10^x_1 400=10x1, 499 = 1 0 x 2 499=10^x_2 499=10x2中的 x 1 x_1 x1和 x 2 x_2 x2,首数 4 4 4的概率为:
log 10 ( 499 + 1 ) − log 10 400 3 − 2 = log 10 500 − log 10 400 = log 10 5 4 \\dfrac\\log_10(499+1)-\\log_104003-2=\\log_10500-\\log_10400=\\log_10\\dfrac54 3−2log10(499+1)−log10400=log10500−log10400=log1045
同理,对于所有小区间,首数 n n n的概率分别为:
X 0 , 1 = log 10 ( n + 1 ) − log 10 n 1 − 0 = log 10 n + 1 n X_0,1 = \\dfrac\\log_10(n+1)-\\log_10 n1-0=\\log_10\\dfracn+1n X0,1=1−0log10(n+1)−log10n=log10nn+1
X 1 , 2 = log 10 10 × ( n + 1 ) − log 10 10 × n 2 − 1 = log 10 n + 1 n X_1,2 = \\dfrac\\log_1010\\times(n+1)-\\log_10 10\\times n2-1=\\log_10\\dfracn+1n X1,2=2−1log1010×(n+1)−log1010×n=log10nn+1
X 2 , 3 = log 10 100 × ( n + 1 ) − log 10 100 × n 3 − 2 = log 10 n + 1 n X_2,3 = \\dfrac\\log_10100\\times(n+1)-\\log_10 100\\times n3-2=\\log_10\\dfracn+1n X2,3=3−2log10100×(n+1)−log10100×n=log10nn+1
…
整体上以数字 n n n开头的概率为:
P ( n ) = T = ∑ 小 区 间 的 概 率 S = ∑ 小 区 间 长 度 P(n)=\\dfracT=\\sum小区间的概率S=\\sum小区间长度 P(n)=S=∑小区间长度T=∑小区间的概率
所有小区间以 n n n开头的数字在小区间的概率和:
T
=
∑
m
=
0
∞
(
log
10
1
0
以上是关于本福特定律(Benford‘s law)的直观解释的主要内容,如果未能解决你的问题,请参考以下文章