CAFE

Ω‥국정원부정선거

'더 플랜' 1.5K 알고리즘이 궁금하다

작성자무애|작성시간17.04.18|조회수142 목록 댓글 1

'선거는 투표가 아니라 개표가 결정한다.'

3·15 이승만 부정선거나 전두환 체육관선거와 달리 IT시대 부정선거는 세련되게 진행될 수 있다. 일련번호가 없기에 재검표도 불가능하다. 기획자 몇 명을 제외하고는 아무도 눈치채지 못할 수 있다.

 

김어준 총수가 18대 대선 부정개표 의혹을 4년간 파헤친 끝에 드디어 내놓은 '더 플랜'.(유튜브에 검색하면 나오니 꼭 보시길)

오로지 선관위에서 입수한 개표자료을 토대로 일체의 주관적 견해나 추측을 섞지 않고 매우 드라이하게 만든 영화다.(다큐 같은데 미스터리 스릴러 영화라고 주장)

 

그간 제기된 의혹은 크게 4가지다.

 

1. 박근헤 득표율 51.6%는 5·16쿠데타를 의미한다. 미리 득표율을 정해놓고 거기에 맞게 전자개표기(투표지 분류기) 프로그램을 디자인했을 가능성이 있다.

2. 전국 1만3500개 투표소 가운데 투표함이 개표 장소에 도착하기도 전에, 혹은 개표하기 전이나 개표 도중에 개표 결과가 방송된 곳이 수천 곳이 된다. 시간 역전 현상이 일어난 셈.(개표 통계지엔 투표함 도착, 개표 시작, 개표 완료 때마다 시간이 기재되는데 선관위에서는 PC 시간 설정이 잘못돼 있었을 것이라고 해명)

3. 선관위 집계표가 최종 수정된 날짜가 선거일 하루 전이다. 국민은 미리 만들어 놓은 일종의 게임을 TV방송으로 시청했을 수 있다.(선관위는 PC 날짜 설정이 잘못돼 있었다고 해명) 

4. 방송사들이 보도한 박근혜 당선을 확정짓는 개표율(95.6%와 95.7% 혼재)과 득표수가 저마다 달랐다.

 

수개표는 사람이 하는 일이라 못미덥지만 전자개표는 기계가 하니 더 안전하다고 생각하기 쉽다. 네트워크가 차단된 상태로 개표가 진행되기 때문에 해킹도 불가능하다고 선관위는 홍보한다. 하지만 정작 해커들은 너무나 쉽게 프로그램을 뚫고 들어가 조작할 수 있다고 한다. 개표장에 잠입해 해킹 프로그램을 심어놓은 USB를 잠시 꽂았다 빼는 것으로 개표기를 조작할 수도 있지만 아예 원거리에서도 프로그램에 접근할 수 있다고 한다. 둘 다 외부에서의 침투를 전제한 것이지만 선관위에서 직접 통제·조작하는 것도 배제할 수 없다. 외국에서도 전자개표 신뢰성에 대한 의문이 계속 제기되고 있다. 독일의 경우 시민의 제소로 헌법재판소가 전자개표기 사용 금지 결정을 내린 바 있다.

 

'더 플랜'은 중요한 의문점 두 가지를 더 보탰다.

1. 18대 대선 당시의 미분류표는 통계학적으로 결코 나올 수 없는 수치다.

2. 개표 시간대별로 박근혜와 문재인의 득표율 간격을 분석해보면 이상한 점이 발견된다. 최종 득표율을 놓고 역진행해 보면 개표 후반으로 갈수록 문재인의 득표율이 치솟아 박근혜를 역전하는 것으로 나타난다.(애초에 박근혜 표를 과다 산정해 놓았다가 후반엔 정상으로 돌리며 비율을 보정했을 가능성)

 

영화에서는  의문점 1을 푸는 데 초점을 맞춘다. 그리고 간단한 해킹 프로그램으로 개표기 조작이 얼마든지 가능하며 입맛에 맞는 득표율 결과를 도출할 수 있다는 것을 보여준다. 18대 대선 당시 사용된 개표기의 동일 회사 제품을 구입해 직접 시연하는 장면도 보여준다.

 

의문점 1을 살펴보자.

 

통상 전자개표에서 미분류표로 나오는 표는 1% 미만이라고 한다. 그런데 18대 대선에선 무려 3.6%의 표가 미분류표로 분류됐다.(111만1165표)

더 특이한 건 정상적인 표들이 무더기로 미분류표로 집계된 것이다. 인주가 번지거나 도장을 두 군데 찍거나 선에 걸쳐 찍어서 생기는 진짜 무효표는 11만2360표였다. 대부분이 정상적인 표가 잘못 들어간 것인데 이런 표들은 재검표하는 과정에서 다시 유효표로 인정이 된다.

 

재미있는 것은 이처럼 나중에 유효표로 살아날 미분류표 중엔 박근혜 표가 압도적으로 많았다는 거다. 랜덤이라면 득표율과 미분류표 비율이 비례해야 한다. 왜 박근혜 미분류표가 문재인 미분류표보다 1.5~2배가량 많았을까. 여기서 또 파생되는 의문점은 왜 미분류표로 토해냈다가 다시 유효표로 기입하는 과정을 거쳐야 했을까 하는 것이다. 이것이 핵심이다. 

 

상식적으로 생각했을 때 '박근혜표:문재인표=박근혜 미분류표:문재인 미분류표'가 정상인데 실제 미분류표는 통계학적으로 도저히 나올 수 없는 수치가 나온다. 통계 전문가는 그것을 번개에 연속해서 두 번 맞는 확률에 비유했다.

 

기계가 하는 일이니 무슨 알고리즘이 있을 것인데 김 총수는 더하기 빼기 로그만 하다가 허송세월을 했다고 한다. 캐나다 퀸즈대 통계학과 한인 교수는 2주 만에 그 함수관계를 푼다.

여기서 나누기 세 번이 나온다.

원래 득표한 표를 A라고 하고 미분류표로 집계됐다가 나중에 유효표로 산입되는 표를 K라고 할 때,

박근혜K를 문재인K로 나눈 뒤, 박근혜A를 문재인A로 나눈 값으로 다시 나눠 준다.

 

박근혜K(미분류표)

-------

문재인K(미분류표)

---------------

박근혜A(득표)

-------

문재인A(득표)

(분수 표기법 못 찾겠네 ㅠㅠ)

 

이 값이 1.5라는 결론을 얻는다. 개표소마다 약간의 편차는 있지만 거의 1.5라는 값으로 수렴된다는 것이다.

이 말은 박근혜 득표율이 50% 문재인 득표율이 50%일 경우 미분류표 중 박근혜표가 50% 문재인표가 50%여야 정상인데 박근혜표가 60% 문재인표가 40%로 나온다는 것이다. 정상적인 값은 1이다. 우연이 아니라면 왜 이렇게 디자인했을까.

 

퀸즈대 교수는 다시 돌아갈 몫으로 빼놓은 그만큼의 공간에 다른 표가 혼입됐을 수 있다는 가정을 내놓았다.

영화에서 실제로 해킹 프로그램을 통해 시연해 본 결과 얼마든지 의도한 대로 결과를 만들어 낼 수 있었다.

어떤 알고리즘으로 디자인했는지는 영화에서 밝히지 않는다.

 

다음은 오로지 필자의 추측이다.(참고로 필자는 인문학도라 수학에는 젬병이다)

 

단순화시켜서 생각해 보자. 박근혜A와 문재인A가 각각 50%라고 가정하자. 박근혜K와 문재인K가 1.5대 1의 비율로 나오려면 문재인K가 2표 나올 때 박근혜K가 3표 나와야 한다. 기계는 단순한 언어로 프로그램해야 한다. 박근혜K를 더 자주 뽑아내려면 더 짧은 간격마다 토해내면 된다. 

 

​이런 식으로 알고리즘을 짜보자.

 

65번째 카드마다 박근혜표일 때는 박근혜K(미분류표)로 보내고 문재인표일 때는 문재인A로 보낸다.

박근혜K가 나올 때마다 직후에 나오는 문재인표를 박근혜A에 혼입한다.

 

100번째 카드마다 문재인표일 때는 문재인K(미분류표)로 보내고 박근혜표일 때는 박근혜A로 보낸다.

문재인K가 나올 때마다 직후에 나오는 박근혜표를 문재인A에 혼입한다.

 

결국 둘 다 상대표가 혼입되지만 그 비율은 박근혜가 문재인의 1.5배가 된다.

 

​처음에 미분류표로 집계된 111만1165표 중 진짜 무효표 11만2360표를 제외하면 ​99만8805표가 박근혜K와 문재인K를 합친 표이다. 1.5K로 계산해 보면 박근혜K는 59만9283표이고 문재인K는 39만9533표이다.

 

그만큼 상대 표가 혼입된 것이니 박근혜A에 문재인표 ​59만9283표가 혼입되고, 문재인A에 박근혜표 39만9533표가 혼입됐다고 볼 수 있다.

 

​서로 혼입된 표를 제외하면 19만9750표(59만9283표-39만9533표)를 문재인이 되찾아 와야 한다.  

 

박근혜 득표수 1577만3128표 중 ​더 온 문재인표 19만9750표를 빼면 1557만3378표가 된다.

문재인 득표수 1469만2632표에 뺏겼던 19만9750표를 되찾아 오면 1489만2382표가 된다.

여전히 박근혜가 앞서는 데다 '도둑질'치고는 적은 수치이다.

 

그렇다면 앞의 알고리즘에 약간의 변화를 줘보자.

 

 

 

 

65번째 카드마다 박근혜표일 때는 박근혜K로 보내고 문재인표일 때는 문재인A로 보낸다.

박근혜k가 나올 때마다 직후에 나오는 문재인표 2표를 박근혜A에 혼입한다.

 

100번째 카드마다 문재인표일 때는 문재인K로 보내고 박근혜표일 때는 박근혜A로 보낸다.

문재인K가 나올 때마다 직후에 나오는 박근혜표 2표를 문재인A에 혼입한다. 

 

어떤 결과가 나오나.

​앞의 결과에 2를 곱하면 된다.

박근혜A에 문재인표 ​59만9283표×2=119만8566표가 혼입되고,

문재인A에 박근혜표 39만9533표×2=79만9066표가 혼입됐다고 볼 수 있다.

 

 

 

박근혜가 더 가져간 표(119만8566표-79만9066표)만 계산했을 때 39만9500표가 되니

 

 

 

 

 

 

박근혜 ​1517만3845표-39만9500표=1477만4345표가 되고

문재인 ​1429만3099표+39만9500표=1469만22599표가 된다.

여전히 박근혜가 앞선다.

 

​다시 상대표를 연달아 3표씩 혼입했다고 가정하면

 

 

 

 

박근혜A에 문재인표 ​59만9283표×3=179만7849표가 혼입되고,

문재인A에 박근혜표 39만9533표×3=119만8599표가 혼입됐다고 볼 수 있다.

 

박근혜가 더 가져간 표(​179만7849표-119만8599표)만 계산했을 때 59만9250표가 되니 

박근혜 ​1517만3845표-59만9250표=1457만4595표가 되고

문재인 ​1429만3099표+59만9250표=1489만2349표가 된다.

이럴 경우 박근혜가 문재인의 승리를 가로챈 결과가 된다.

 

아니면 각자 다른 횟수로 표를 혼입할 수도 있겠다.  

 

65번째 카드마다 박근혜표일 때는 박근혜K(미분류표)로 보내고 문재인표일 때는 문재인A로 보낸다.

박근혜K가 나올 때마다 직후에 나오는 문재인표 2표를 박근혜A에 혼입한다.

 

100번째 카드마다 문재인표일 때는 문재인K(미분류표)로 보내고 박근혜표일 때는 박근혜A로 보낸다.

문재인K가 나올 때마다 직후에 나오는 박근혜표 1표를 문재인A에 혼입한다.

(박근혜 쪽으로만 혼입표를 보내면 의심을 살 수 있기에 문재인 쪽으로도 약간의 혼입표를 보낸다고 가정)

 

박근혜A에 문재인표 59만9283표×2=119만8566표가 혼입되고

문재인A에 박근혜표 39만9533표가 혼입됐다고 볼 수 있다.

 

박근혜가 더 가져간 표(119만8566표-39만9533표)만 계산했을 때 79만9033표가 되니

박근혜 1517만3845표-79만9033표=1437만4382표가 되고

문재인 1429만3099표+79만9033표=1509만2132표가 된다. 

 

어떤 알고리즘을 썼는지는 알 수 없고 직접 재검표를 해보는 수밖에 없겠다.

​왜 바로 상대표를 혼입하지 않고 미분류표로 보낸 다음 그만큼에 비례하는 상대표를 혼입해 넣었을까 하는 의문이 들 수 있는데 1.5배 확률을 유지하기 위해서였다고 추측해 본다.

 

만약 미분류 방식을 쓰지 않고 65번째 카드마다 박근혜표일 경우 그냥 넘어가고 문재인표​가 나오면 박근혜표로 혼입하는 방식을 쓴다고 가정해 보자. 이럴 경우 박근혜표가 많이 나오는 지역에선 오히려 혼입표가 줄어들고 박근혜표가 적게 나오는 지역에선 지나치게 많이 문재인표가 혼입돼 금방 들통날 수가 있다. 1.5K가 나올 수 없는 셈이다.

 

미분류표로 보낸 뒤 되찾아 오는 방식을 쓸 경우 박근혜표가 많이 나오는 지역일수록 혼입표가 많아지고 박근혜표가 적게 나오는 지역은 상대적으로 혼입표가 적게 나온다. 순번이 되는 카드가 미분류표로 가는 확률은 득표율과 비례하기 때문이다. 그래서 1.5K가 유지될 수 있다.

 

몇 번째 카드마다 명령어를 주느냐에 따라 미분류표의 양은 달라질 것이다. 간격이 좁을수록 미분류표의 양이 많아지고 혼입되는 표도 늘어난다. 후보에 따라 명령어를 주는 간격을 달리하면 1.5K에 변화를 줄 수 있다. 박근혜의 경우 50번째 카드마다 적용하고 문재인은 100번째 카드마다 적용하면 2K가 산출된다. 박근혜 쪽으로 가는 혼입표가 1.5배에서 2배로 많아진다는 의미다. 

 

위의 내용은 다 가정이다. 하지만 만에 하나 이런 조작이 있었다고 해도 발견하기는 쉽지 않다. 100장마다 1장 정도 나오는 혼표는 놓치기 쉽다. 딱 그만큼의 혼표 알고리즘을 만들 수 있을 것이다.

 

전자개표기로 분류한 표는 묶음으로 처리돼 2단계로 사람의 손을 거치긴 한다. 하지만 시간도 촉박하고 하여 처삼촌 뫼 벌초하듯 넘어간다고 한다. 게다가 검표원들이 지나치게 기계를 믿는 것도 문제다. 정상적인 표가 99만8805표나 미분류표로 나왔는데도 말이다. 

 

지지율 차가 아주 크면 시도해볼 수 없지만 엎치락뒤치락할 땐 결과를 뒤집을 수도 있기에 조작 가능성을 완전히 배제할 수는 없다.​ 수개표로 바꾸거나 수개표를 먼저 하고 보조적 수단으로 전자개표를 하는 게 바람직하겠지만 그렇지 못할 경우 검표를 꼼꼼히 하는 방법밖에 없다. 하다 못해 미분류표라도 철저하게 챙겨봐야 할 것이다.(알고리즘을 바꾸면 그만이겠지만)  

 

위의 내용은 어디까지나 추측이고 계산도 완전 엉터리일 수 있다.(수학 좀 하는 사람이 보면 코웃음을 칠지도)

너무 궁금해서 요리조리 궁리해본 건데 생각보다 혼입표가 적게 나와 좀 당황스럽기도 하다.​^^;

그래도 번개 두 번 연달아 맞는 것보다는 합리적인 추론일 거라 생각한다.

개인적으로 마지막 알고리즘에 애착이 간다.

 

 

 

다음검색
현재 게시글 추가 기능 열기
  • 북마크
  • 공유하기
  • 신고하기

댓글

댓글 리스트
  • 작성자멋진의리남 작성시간 17.09.10 쥐새끼는 사형이다
댓글 전체보기
맨위로

카페 검색

카페 검색어 입력폼