쌩쌩 방/빔 프로젝터

넷플릭스 세상을 잇는 과학 <벤포드의 법칙>

쌩쌩 2022. 1. 18. 22:17

 

 

세상을 잇는 과학
넷플릭스 커넥티드 다큐

 

세상에는 무수히 많은 패턴들이 있고, 가설들을 세우고 실험을 통해 증명한다(?) 이제 법칙으로 세우고 그 전제를 바탕으로 무수히 많은 것들이 응용되고 만들어진다. 그 법칙은 추후에 더 큰 논리적인 세계에서는 적용 가능하지 않더라도 어떤 특정한 논리적 세계에서는 아주 유효하다. 넷플릭스 다큐에서 재밌는 수의 법칙을 발견했다. 영상을 보다 보면 신기하게도 이런저런 전혀 관계가 없어 보이지만 이 법칙으로 많은 것들이 연결되어 있다.

 

사이먼이란 사람이 이상하게 책의 더러워진 부분들이 일정한 패턴을 가지는 것을 보고는 이것이 무엇을 말하고 있는 것은 아닌가라는 가설을 세웠고, 그리고 사이먼 발견 50년 후 벤포드라는 기술자가 다시 그걸 발견하고 법칙으로 세웠다. 정말 관찰력이 뛰어나다. 그리고 각국 정부는 이 법칙을 바탕으로 세금 사기를 막는 비밀 무기로 쓴다고 한다. 그것은 바로 프랭크 벤포드의 이름을 딴 벤포드의 법칙이다. 특정한 영역에 벤포드의 법칙을 적용했는데 다르다면 수상한 징조일 수 있는 것이다.(정리나 증명은 딴 세상 이야기다. ㅋ)

 

벤포트의 법칙 : 어떤 특정한 영역의 자릿수를 뽑아 앞자리를 정리하면 그 수의 분포가 벤포드의 곡선을 보여 준다.(1은 30%, 2는 17%........)

 

벤포드의 법칙
벤포드의 법칙(곡선)

 

그러니 이 벤포드의 법칙을 따르지 않는다면 이상하다는 이야기가 된다. 그 대표적인 예시로 분식 회계 사건인 엔론 사태에도 적용이 된다. 일반적인 회계 데이터는 벤포드의 곡선의 모양을 보여 주지만 엔론의 데이터는 그 패턴에서 벗어난다.

 

 

 

분식 회계 엔론 곡선
분식 회계 엔론 곡선

 

정말 신기하게도 수많은 특정한 영역에서 이러한 곡선을 발견한다. 우리는 무작위적으로 선택한다는 생각 하지만 그 결과물은 이 법칙에 들어맞는다. 예를 들어서 각 도시의 인구수도 이러한 패턴을 따른다고 하며, 심지어 자연현상인 듯 보이는 화산의 높이마저도 이 법칙에 들어맞는다. 그래서 이 패턴이 여기도 맞을까 하면서 확인하다, 이상한 모습을 발견하게 되면 그것은 정말 이상한 징조였던 것이다. 소셜 미디어 팔로워 숫자를 조사하는 중 봇을 발견한 점, 투표를 조사하는 중 사람들의 마음을 발견한 점 등이다. 즉, 자연스럽다면(?) 이 패턴을 따르고 그 뒤편이 뒤틀려 있다면 다른 모습을 보여 주는 것이다. 뭔가 정말 머리가 아프다. 자연스럽다는 말은 일정한 패턴을 따른다는 말인가? 그러면 자연스럽다는 것은 이미 결정되어 있다는 것인가? 좀 더 잘 이해하고 싶다.

 

데이터 활용
빅데이터는 이 법칙으로 어떻게 활용될까?