대부분의 사람들은 우리 주변에 널린 다양한 수치 자료들을 모아서 맨 앞자리의 숫자를 조사하면 1, 2, 3, …, 9가 당연히 11.1%의 비슷한 확률로 나타날 것이라고 생각할 것이다. 그러나 경제 지표들에 나타나는 숫자, 주소에 있는 숫자, 어떤 회사의 회계 장부에 있는 숫자 등과 같은 다양한 숫자들을 수집하여 그 수들의 맨 앞자리의 숫자들을 조사해 보면 첫 자리의 수가 1인 것이 무려 30%로 가장 빈번하게 나타나고, 2에서 9로 갈수록 그 빈도는 현저히 낮아진다.
이러한 숫자들의 분포를 공식화한 것이 '벤포드의 법칙(Benford's law)'이다.
벤포드의 법칙은 다양한 데이터의 십진법의 값에서 첫 자리의 수가 1인 경우가 많은 것처럼 맨 앞자리에 오는 숫자가 고르게 분포되어 있지 않다는 법칙으로 미국의 수학자이자 천문학자인 사이먼 뉴컴(Simon Newcomb ; 1835~1909)이 다른 사람과 함께 쓰던 19세기에 사용되던 로그표의 앞부분의 페이지가 뒷부분의 페이지들보다 많이 훼손되는 경향이 있음을 발견하면서 알려지게 되었다.
미국의 물리학자 프랭크 벤포드(Frank Benford ; 1883~1948)는 뉴컴의 이런 발견을 1938년에 공식화했다. 벤포드는 강 335개의 넓이, 물리학 상수 104가지, 분자 중량 1800가지 등 20개 분야 자료들의 첫 자리 수의 분포를 분석해 벤포드의 법칙을 내놓았다.
벤포드의 법칙에 의하면 우리 주변에서 발견할 수 있는 수들의 맨 앞자리의 숫자가 k(k=1,2, 3, …, 9)일 확률을 P(k)라고 하면
가 성립한다고 한다. 이 확률의 근삿값을 표로 나타내면 다음과 같다.
한편,
(n=1, 2, 3, …)꼴을 비롯한 자연수의 거듭제곱도 일반적으로 벤포드의 법칙을 따른다. 실제로
중에서 맨 앞자리의 숫자가 1인 수는 30개나 된다.
벤포드의 법칙을 통해 숫자들의 패턴을 분석해서 숫자 조작, 사기, 오류, 자료에 내재된 편견 등을 검증할 수 있는 방법도 제안되었다. 가령 미국의 국세청에서는 어느 회사에서 제출한 회계 장부가 조작되었을 가능성이 있는지의 여부를 판단할 때 벤포드의 법칙을 이용하기도 한다.
'정신체조수학' 카테고리의 다른 글
기약다항식 판정법 (0) | 2015.04.27 |
---|---|
황도좌표에 따른 절기(節氣) (0) | 2014.12.29 |
평균으로의 회귀 (0) | 2014.12.27 |
섭씨온도와 화씨온도 (0) | 2014.12.26 |
댓글