https://www.natesilver.net/p/dont-let-randomness-make-a-fool-of
선거에 대해 무슨 말을 하든, 또는 어떤 여론조사 결과가 나오든, 그로 인해 결과가 바뀌는 일은 없습니다. 만약 선거 결과에 관심이 있다면, 투표를 하거나, 기부를 하거나, 자원봉사를 하거나, 친구들을 설득하려고 노력하세요. 하지만 소셜 미디어에서 예의 없이 행동하는 건 도움이 되지 않습니다.
그리고 여론조사에는 오차범위가 있다는 점을 명심하세요. 예를 들어, 만약 우리가 노스트라다무스처럼 현재 위스콘신 주의 실제 선거 결과를 예측할 수 있다고 가정하고, 지금 선거를 치른다면 해리스가 1% 차이로 승리할 것이라고 합시다. 일반적인 여론조사는 약 800명의 응답자를 대상으로 합니다. 800명으로 구성된 여론조사의 오차범위는 ±3.5% 정도입니다.
그러나 이 오차범위는 한 후보의 득표율에만 해당되므로 실제 상황을 과소평가하는 것입니다. 제3당 후보가 거의 없는 선거에서는 해리스의 표가 아니면 트럼프의 표가 되고, 반대의 경우도 마찬가지입니다. 따라서 후보 간 차이에 대한 오차범위는 약 두 배인 7% 정도입니다.
즉, 만약 현재의 실제 상황이 해리스가 +1이라면, 표본 오차로 인해 트럼프가 +5로 나타나거나 해리스가 +7로 나타날 수도 있습니다(모든 유권자를 조사하지 않고 무작위로 표본을 조사하기 때문에 발생하는 오차). 그리고 여론조사에는 잘못될 수 있는 다른 요인들이 많다는 점도 고려해야 합니다. 또한, 오차범위는 전체의 95% 경우에만 해당한다는 사실도 중요합니다. 20번 중 1번은 해리스가 +10 또는 트럼프가 +8로 나타나는 진짜 이례적인 결과가 나올 수 있습니다. 물론 여론조사 기관이 정직하게 조사를 했을 때 말입니다. (실제로 여론조사 기관들은 대개 다른 조사 결과와 비슷한 결과를 내려고 이례적인 결과를 억제하려는 경향이 있습니다.)
다양한 여론조사를 평균 내는 것도 도움이 되지만, 한계가 있습니다. 예를 들어, 최근 위스콘신의 네 개의 여론조사가 있다고 가정해 봅시다. 이는 3200명의 유권자를 조사한 것과 같습니다. 그래도 후보 간 차이에 대한 오차범위는 여전히 3~4% 정도이며, 현재 상황이 해리스 +1이라고 해도 평균 결과가 트럼프 +2 또는 해리스 +4로 나올 수 있습니다.
실버 불릿 모델 같은 예측 모델은 한 단계 더 나아가 한 주의 여론조사를 바탕으로 다른 주의 결과를 추론하기도 합니다. 이것이 이 모델의 가치 중 일부입니다. 그러나 더 중요한 기능은 다른 가능성을 고려하는 것입니다: 예를 들어 2016년과 2020년에 여론조사에서 트럼프의 지지율을 크게 과소평가했던 것과 같은 체계적인 오류 가능성을 반영하는 것입니다. 예측의 확률은 실제로 여론조사가 얼마나 정확했는지에서 도출됩니다. 실질적으로 여론조사의 오차범위는 이론적인 것보다 훨씬 넓습니다.
어느 한 후보가 큰 격차로 앞서고 있을 때는 이런 점들이 크게 신경 쓰이지 않을 수 있습니다. 해리스가 +8이든 +4든 별 차이가 없고, 해리스가 85% 확률로 승리할 가능성이든 75%든 큰 차이가 없어 보입니다. 하지만 확률이 거의 반반일 때는 상황이 다릅니다. 해리스가 55대 45로 앞선다는 예측과 트럼프가 55대 45로 앞선다는 예측은 완전히 다르게 해석될 수 있지만, 두 예측은 사실상 같은 말을 하고 있는 것입니다: 선거는 거의 동전 던지기와 같다는 것입니다.
만약 도박사들이 말하는 '스릴'을 즐긴다면, 이 변동하는 확률들을 경험하는 것을 이해할 수 있습니다. 모델은 그런 사람들을 위한 것입니다. 하지만 그렇지 않다면, 투표, 기부, 자원봉사 외에도 또 다른 선택지가 있습니다: 그냥 마음을 편히 가지세요.
트위터에서 하는 비난이 트럼프를 패배시키지 않습니다. 당신이 남기는 악플이 트럼프를 이기게 하지도 않습니다. 여론조사를 조작하려 해봤자 보통 자신을 속이는 것뿐입니다. 그러니 최고의 삶을 살고, 당신이 바꿀 수 없는 것들을 받아들일 수 있는 평온함을 가지세요.