선거 결과를 두고 흔히 언급되는 통계학 이론 중 하나가 **'대수의 법칙(큰 수의 법칙, Law of Large Numbers)'**입니다. 사전투표와 본투표(당일투표)의 표본 크기가 둘 다 수백만 명 이상으로 충분히 크기 때문에, 두 투표의 정당별 득표율이 거의 같아야 하는데 그렇지 않으니 의아하다는 지적이 나오는 것이죠.
결론부터 말씀드리면, 사전투표와 본투표의 결과가 다르게 나오는 것은 **대수의 법칙이 무너진 것이 아니라, 애초에 대수의 법칙이 성립하기 위한 전제 조건이 충족되지 않았기 때문**입니다.
통계학적으로 사전투표에 대수의 법칙을 곧바로 적용할 수 없는 핵심 이유는 다음과 같습니다.
### 1. 두 집단이 '동일한 분포(Identical Distribution)'가 아닙니다.
대수의 법칙이 성립하려면 추출한 표본들이 **모두 동일한 확률 분포를 가진 하나의 모집단**에서 무작위로 뽑혀야 합니다. 즉, 주사위를 던질 때 첫 번째 던지든 만 번째 던지든 1이 나올 확률이 $\frac{1}{6}$로 똑같은 상태여야 합니다.
하지만 **사전투표자 집단**과 **본투표자 집단**은 성격이 완전히 다른 **'이질적인 두 개의 집단'**입니다.
* **사전투표자:** 주로 젊은 층, 직장인, 주말이나 선거 당일 개인 일정이 있는 사람, 혹은 특정 정당의 독려에 적극적으로 호응하는 정치 관여도가 높은 유권자들이 많이 참여하는 경향이 있습니다.
* **본투표자:** 선거 당일 투표를 선호하는 고령층, 사전투표 제도를 신뢰하지 않거나 당일 투표를 관행으로 여기는 유권자층이 상대적으로 더 많이 참여합니다.
즉, 주사위로 비유하자면 사전투표는 '특정 숫자가 더 잘 나오도록 깎인 주사위'를 던진 것이고, 본투표는 '또 다른 숫자가 더 잘 나오는 주사위'를 던진 것과 같습니다. 아무리 많이 던져도(대수의 법칙) 두 주사위의 결과값은 다를 수밖에 없습니다.
### 2. '독립 시행(Independent Trials)'이 아닙니다
대수의 법칙을 적용하려면 각 시행이 서로 영향을 주지 않는 독립적이어야 합니다. 동전 던지기에서 앞면이 나왔다고 해서 다음 던질 때 뒷면이 나올 확률이 변하지 않는 것처럼 말이죠.
그러나 투표는 동전 던지기처럼 무작위(Random)로 결정되는 시행이 아닙니다.
* 정치적 성향, 연령대, 거주 지역, 직업 등 **특정 변수들이 결합하여 투표일(사전 vs 당일)을 선택**하게 만듭니다.
* 정당마다 지지층에게 "사전투표에 참여해 달라"거나 "당일투표를 해 달라"고 조직적으로 독려하는 등, 유권자들의 선택은 고도로 상호작용된 결과물입니다.
### 3. 표본이 아닌 '모집단 자체'의 성격이 강합니다
대수의 법칙은 '일부 표본'의 평균이 '전체 모집단'의 평균으로 수렴한다는 이론입니다.
하지만 대한민국 선거에서 사전투표자 수는 전체 유권자의 30%가 넘는 수천만 명에 달합니다. 통계학적으로 이는 무작위로 추출한 '표본(Sample)'이 아니라, **'사전투표를 선택한 유권자 전체'라는 별개의 모집단(Population) 그 자체**로 보는 것이 맞습니다. 두 개의 서로 다른 모집단을 전수조사한 것이므로 두 결과가 일치하지 않는 것은 통계학적으로 전혀 이상한 현상이 아닙니다.
### 💡 요약하자면
미국 대선에서도 민주당 지지층은 우편·사전투표를 선호하고 공화당 지지층은 당일투표를 선호하여 두 투표의 결과가 극명하게 갈리는 현상(블루 시프트 등)이 정기적으로 관찰됩니다.
이처럼 **사전투표와 본투표의 득표율 차이는 대수의 법칙의 오류나 조작 때문이 아니라, 투표 일정에 따른 유권자 구성(연령·정치성향·직업 등)의 통계적 이질성 때문에 발생하는 자연스러운 현상**입니다.
사전투표와 본투표의 통계적 차이가 발생하는 메커니즘을 시각적으로 설명해 주는 아래 영상을 참고하시면 이해에 도움이 될 것입니다.
사전 투표와 당일 투표의 통계적 차이 설명 영상
이 영상은 통계학적 전제 조건인 '독립성'과 '동일 분포' 개념을 바탕으로, 사전투표와 당일투표의 결과 차이가 왜 통계학적으로 정상적인 현상인지를 쉽게 풀어 설명하고 있습니다.