CAFE

[스크랩] [기타]이기적이면 성공한다? 실험 돌려봤더니 ㄷㄷ

작성자(본인 닉네임) 25년홧팅|작성시간25.11.24|조회수12,232 목록 댓글 35

출처: 여성시대 (감정과다사용자)
 

옛날에 로버트 액설로드라는 학자가 있엇슨.
딱히 멀하진 않앗슨. (?)
그런데 어느 날 의문이 떠올랏슨.
 
 “이 무한 경쟁 사회에서 진짜로 살아남는 최강의 전략은 뭘까?”
 
그래서 대회를 열어버림. 

실제로 만나서 붙는건 아니고, 
전세계 학자들에게 전략을 받아서 컴퓨터로 각 전략을 1:1 맞다이 시키는거임
 
그렇게 최종으로 승리한 자(프로그램)가 이 세계 최강자가 된다..!

종목은 "반복적 죄수의 딜레마"게임.
죄수의 웅앵은 정치, 외교, 사업 같은 여러 분야에서도 자주 인용될 만큼 대표적인 상황을 설명하는 개념임
2나명의 죄수가 서로를 불신한 끝에 결국 배신이 최선의 전략이 되버린다는..그거..
 

이거 한번쯤 봤을거임ㅋㅋ 죄수의 딜레마를 변형한 게임임.
 
일단 죄수의 딜레마 게임은 한 판만 할 때는 배신이 유리한게 맞음.
 

하지만 이 게임이 여러 판 이어지면 어떻게 될까? 한번의 협력이나 배신으로 끝나지 않고, 매 판 어떤 카드를 꺼낼지 전략을 세워야 할 거임.
게임 방법은 단순함.
매 턴마다 상대에게 협력할지 배신할지를 선택하면 됨.
 

서로 협력 햇을 시: 3점
서로 배신: 1점 
나만 통수 맞으면: 0점
나만 배신 성공하면: 5점


이렇게 모든 참가자와 200라운드씩 경기를 하고, 총점이 가장 높은 전략이 우승하는거임!

이 게임 대회에는 14명의 학자/전략가들이 참가했는데,
정치학, 경제학, 사회학, 수학 등 여러 분야에서 각자 이길 것 같은 프로그램을 짜서 보냈음.

여시들이라면...어떤 전략을 택하시궜어요..?

'배신만 해도 손해는 없는거네? 안전빵으로 가야지. 무조건 배신! 운 좋으면 5점이고, 못 해도 1점은 얻는거네'
 
'둘중 하나만 하면 내 패턴이 들키잔아; 협력과 배신을 적당히 섞어서 예측 못하게 하는건 어떰?'

당연히 조금 더 꼬아서 수십 줄의 코드 전략을 짠 사람들도 있었음.
 
 
"협력 하는 척 하다가 통수 몇번 때리면 개꿀이겠지?ㅋㅋ"
 
"협력과 배신을 섞어서 몇 판 지켜보다가 협력 전략으로 판단되면 배신하도록 코딩 완."
 
"상대의 과거 기록 전체를 저장하고, 확률을 갱신하는 계산식을 넣으면 더 좋겠지.."
 
 
 
그 결과 가장 높은 점수를 기록한 전략은 뭐였냐면..

📢우승자는 '팃 포 탯!'
(Tit for Tat = 눈에는 눈, 이에는 이)

 
"저런 단순한 코드가 이겼다고?"
 
결과는 의외였음. 복잡한 전략들을 제치고, 단 4줄짜리의 간단한 코드가 우승.
'아나톨 라포포트'라는 학자가 제출했는데, 

아나톨 라포포트. 수학자이자 음악가, 평화학자였다고 함.

'팃포탯'이라는 이 전략은
1.첫 턴엔 무조건 협력하고,
2.그 다음엔 상대의 행동을 그대로 따라함. 이게 끝.
 
다음 턴에 상대가 배신 때린다? 응 나도 배신하면 돼~
협력해오면?>나두 협력하께 ㅎㅎ 이러는 프로그램임.  

"원래 눈눈이이가 괜찮은 전략이긴 한데.. 신기하네..? 한번 다시 개최해볼까? 일단 1차 대전 결과를 참가자들에게 알려야지."
 

"2차 대전 참여하실 분~"
 
이번엔 1차보다 더 늘어나서, 전세계에서 62개의 전략이 참가하게 되었음.

"흠.. 1차 결과를 보니 다들 배신에 호락호락하게 당하지 않는구나..그럼 일단 신뢰를 쌓은 후 슬금슬금 배신하다가 상대가 응징하면 후퇴하는 전법을.."

"1차에 협력 프로그램이 좋은 성적이었으니까 그걸 보고 다들 비슷한걸 제출하겠지? 그럼 난 걔네를 착취해야겟다ㅋㅋ"
 

"상대가 나의 협력 뒤에 협력하는 확률과, 배반 뒤에 협력하는 확률을 계산한다. 매 게임마다 이 두 조건부 확률을 새로 계산한 후,
상대방을 정확하게 모형화하였다는 가정 아래 장기 보상값을 극대화시킬 수 있는 행동을 선택한다."
 

1차 대전 결과를 받아본 학자들은 그걸 참고해 이번엔 더 교활하고 복잡한 전략들을 제출하게 되었음.
 
그렇게 대전시킨 결과 2번째 대회 우승자는..
 

'팃포탯' 
 
두번째 우승자 역시 '팃포탯'이었음.  
놀랍게도 참가자들은 팃포탯 전략을 더욱 발전시키려 고심했는데도, 더 복잡한 프로그램 그 어떤 것도 단순한 클래식 팃포탯을 능가하지 못했음.

액설로드는 이 전략을 분석해봤는데, 
이 단순한 전략의 승리 요인은 '선량하고 단호하기 때문'이였음.
또한 상대를 이기기 때문이 아니라, 많은 플레이어의 협력을 이끌어냈기 때문에 점수가 높았다는거임. 
 

루피 - 무조건 협력 70% + 팃포탯 30% (?)ㅋㅋ

 
팃포탯은 대전을 하면서 단 한 차례도 상대방보다 좋은 점수를 얻은 적이 없음. 사실 그럴 수가 없음. 먼저 배신 카드를 쓰지 않기 때문에..
 

일단 먼저 협력하기 때문에 다른 프로그램들의 협력을 잘 이끌어 냈고, 그러면서도 배신에는 즉각 단호하게 응징했기에 쉽게 착취 당하지 않았음.
하지만 상대가 다시 협력을 해오면, 용서하고 다시 협력으로 받아줬음. 
 
1. 먼저 협력함
2. 배신엔 보복함
3. 상대가 다시 협력해오면 용서함
 
즉, 단호하면서 쿨하고 너그럽기까지하다는거..

원래 눈눈이이는 손해 받은 것 이상으로 벌을 내리지 말라는 뜻 .

 
액설로드는 이 지점에서 전략 전문가들조차 '관용'의 가치를 낮게 평가 했다고 분석함.
조금 더 관대했으면 더 높은 점수를 받을 수 있었음에도, 다들 팃포탯보다 덜 관대해야 이길거라고 생각했다는거임. 
 
예를 들면 '프리드먼'이라는 프로그램은 선하지만 제일 고지식함.
 

'배신자는 절대 용서 못해ㅂㄷㅂㄷ'
 
프리드먼은 기본적으로 협력적이지만, 단 한 번이라도 자신을 배신한 상대에겐 가차없었음.
상대가 협력으로 돌아와도 끝까지 배신으로만 응답했음. 프리드먼은 다른 온화한 전략들과 협력해 상위권에 들었지만, 협력 성향의 전략 중에서는 하위권이었음.
왜냐면 계속 배신만 하는 프로그램은 드물었고, 이 게임엔 실제 인간 세상을 반영하기 위해 '실수'라는 오해 요소도 집어 넣었는데 
프리드먼은 이 실수에도 인정사정 없었기 때문임...
 

잘못 누른것도 안봐주냐고ㅠㅠ

 
그리고 또 한가지 의외였던건, 먼저 남을 통수 때리지 않는 소위 '선한' 전략들이 상위권을 기록했다는거임.
 

왜냐하면 협력적인 프로그램은 일단 동지끼리 만나기만 하면 완벽한 협력을 보장 받을 수 있었기 때문임. 
 

게다가 이기적인 전략들은 대체로 첫 판부터 배신을 때렸는데,
(상대가 협력할지 배신할지 모를 때는 '배신'을 가장 합리적인 수라고 판단하므로)
 

이건 많은 프로그램들의 보복을 불러일으켜 결국 좋지 않은 점수를 기록하게 되었음..
 
아이러니하게도 이들이 좋은 점수를 얻을 수 있었던 건 천사 같은 '무조건 협력'하는 전략의 프로그램이 많을 때만 가능했음.
 

 
그러나 착취적 전략들은 상대가 순도 100% 협력자라고 판명되면 맘 놓고 등쳐먹었기 때문에..헌신하면 헌신짝이 되는 게 맞았다..ㅠㅋ

'무조건 협력'을 쓰는 프로그램은 실제로 하위권이 되었음. 방어력이 0인 협력자들이 살아가기엔 이 게임 세상은 너무 가혹했음..
 

이들이 살아남으려면 배신을 응징하는 전략들이 훨씬 많아야 가능한데, 우리 사회는 팃포탯이나 프리드먼 같은 보복자의 역할을 법으로 대신 하고 있는 셈..
 
이 게임은 우리에게 선량함과 동시에 '응징'의 중요성을 알려줌. 호의적이되, 선을 잘 긋는 것. 그리고 또한 관대할 것..!
(단호하지 못한 성격으로서 쓰린 교훈이다😂)
 

그럼 착취적 전략들에는 뭐가 있었는지 살펴볼까요~?
 

-요스  (29위)
상대를 가끔가다 슬쩍 이용해 먹는 얌체. 일명 '욕심부리는 팃포탯'
팃포탯의 변형으로 똑같이 눈눈이이 전략을 쓰지만, 열 번에 한 번, 10퍼센트 정도의 확률로 배반을 함.
어이없는 점은 먼저 통수쳐놓고 자기도 팃포탯이랍시고 남이 배신으로 대응하면 그것도 짤없이 보복한다는거임 (내로남불..)
 
 -테스터  (46위)
호구를 물색하는 전략인데 한번 상대를 테스트 해보고 만만치 않은 모습을 보일 때는 언제든 뒤로 물러서게 프로그램 되어 있음. 한마디로 강약약강..
팃포투탯(통수 한번까진 참음)은 테스터를 만나면 너그러움 때문에 크게 이용 당했음.
테스터는 좋은 성적을 받진 않았지만 너그러운 협력자들이 낮은 점수를 받게 만들었음.. 

 

 

-트랜퀼라이저  (27위)
얘는 더 은근한 방법으로 이득을 취함.
이 프로그램은 우선 상대방과 상호이득 관계를 잘 다지고, 그 후에야 뭔가 몰래 취할 구석이 있는지 조심스레 탐색함.
 
 

암튼 이렇게 복잡한 전략들인데도 협력자들을 착취했을 때 얻는 것이 잃는 것보다 더 많지는 않았다고 함.
 

게다가 몇 착취적 전략은 게임 안에서 생태적 멸종을 맞이 할 것으로 예측 되기도 했음.
액설로드는 이 반복적 죄수의 딜레마 게임을 실제 자연계를 보듯이 가상 시뮬로 계속 돌려봤다고 함
'무조건 배신', '조건부 배신'같은 몇 프로그램은 처음엔 세를 늘려가는 듯 했음.

그러나 세월이 쌓이자 상황은 달라졌음. 이들은 결국 협력자들을 고갈 시켜 버렸고, 먹을 것이 없는 포식자처럼 같이 멸종해버렸음.
이런 전략은 처음에는 개이득으로 보이지만 장기적으로는 자신이 살아갈 환경 자체를 스스로 파괴하게 된다는 것임
이 진화 매커니즘은 암세포나 바이러스와도 놀랍도록 유사함.
 

실제로 많은 동물들은 이런 식으로 진화해 온 것 같음.
식물, 동물, 그리고 박테리아까지 모두 반복된 죄수의 딜레마 게임을 해온 셈임.
그래서 상호협력하는 생명체들이 지금도 자연 곳곳에 존재함.

 

 

 
그리고 인간도 협력을 어기는 개체를 매우 안 좋아하는 동물이기도 함.
약속을 어기는 상대는 짜증나고, 조별과제 무임승차자는 벌 주고 싶고, 이기적인 사람은 평판이 떨어짐.

 

 

곁다리 - ✨청소부 물고기와 속임수 물고기 이야기 ✨

다른 물고기를 청소하고 있는 청소놀래기속 물고기

청소 물고기는 다른 물고기의 기생충을 먹으며 공생하지만, 가끔씩 '배신'하는 전략을 쓰는 개체가 생김.
이 배신자들은 공생을 무시하고 기생충을 먹는 척하며 고객의 살점을 뜯어감;; 
너무 많은 배신자들이 생겨나면 결국 고객들은 해당 지역을 이탈하고 청소어들의 생존은 위협 받게 됨..
이런 반응은 청소어에게 '아, 이렇게 하면 손님이 끊기는구나'라는 학습 신호가 됨. 

 


아무튼 이렇게 여러 검증 결과 팃포탯 전략은 안정적이라는게 드러남.
 

사실 게임에서 팃포탯과 마주치면 그에게 협력하거나, 같이 망겜을 하거나 둘 중 하나밖에 없으므로 사기 전략이 아닐 수 없음;;
 

하지만 어떤게 안정적인 전략인지는 환경과 집단의 분포에 따라 바뀜.
예를 들어 주변에 협력 비율이 높으면, 좀 더 관대한 버전의 팃포탯이 나을거라고 함.

이 전략은 팃포탯을 쓰는 개체들을 다시 만날 가능성이 높고, 길게 관계를 지속해야 하는 구조에서는 특히 강력하게 작동함.
이건 반대로 말하면 : 관계가 곧 끝날 상황이나 미래가 불안정한 상황, 서로 연결 고리가 없어 평판이 닿지 않는 상대를 만날 때가 왜 특히 위험한지도 잘 보여줌.😨


이 원리는 극단적인 상황에서도 볼 수 있음.

-아포칼립스 세계 속에서 협력을 바탕으로 살아남는 서사들-

워킹데드 - 릭의 그룹. '팃포탯'과 유사

아포칼립스 상황에선 장기적인 미래를 보장 받지 못하므로 '무조건 배신'이 최선이 될 수 있음. 
하지만 그런 극한 상황에서도, 몇 가지 조건이 갖춰지면 협력은 자연스럽게 일어나는 현상이란 얘기임.
 

라스트오브어스 - 조엘과 앨리. '무조건 협력' 관계 🥹

수천만 년 동안 진화는 공존의 실패=멸종이라는 걸 끊임없이 반복하고 증명해왔음. 
협력이 강하다고 해서 인간이 그걸 택할지의 문제는 별개긴 함. 
현실은 게임보다 더 복잡하고 오해와 감정이 얽혀있기 때문임

하지만 이 게임이론은 많은걸 돌아보게 하는거가틈😲
우리 사회는 착취자를 제대로 제재하는지? 협력을 지키면 정당한 보상이 돌아가는지? 자연을 고갈 시키고 있지 않은지?
 

라포포트는 수학자이자 평화학자로서 협력과 평화의 가능성을 수학적으로 연구해 온 인물이었다고 해
그가 팃포탯을 계속 뚝심 있게 제출한 것도 "평화와 협력이 갈등을 이길 수 있다" 라는 철학적 확신이 반영된 선택이었음.
 

이 실험은 BBC 다큐 〈마음씨 좋은 놈이 일등한다(Nice Guys Finish First)〉로도 제작됐고, 리처드 도킨스도 '이기적 유전자'에서 이 아이디어를 적용했음.
 
(tmi-도킨스는 책 제목 때문에 마치 이기주의를 옹호하는 학자처럼 오해 받아왔는데, 저 다큐 참여 후에 처음으로 나이스 가이로 환영 받는 경험을 하고 제목의 중요성을 느꼈다고 함ㅋㅋ)

'역시 불멸의 유전자를 제목으로 할걸 그랫나..'

 
사실 도킨스도 2차 대회 참가 제안을 받았지만 참여하는 대신에 자신이 존경하던 진화 생물학자 해밀턴을 액설로드에게 소개해 줬음.

액설로드는 정치학자라서 팃포탯의 게임 전략을 '자연의 법칙'으로 확장하는 데에 한계가 있었는데, 이 부분을 해밀턴이 채워줬다고 함니다..

그렇게 해서 나온 책 <협력의 진화>
 
다른 전략들 얘기도 짧게 있는데 재밋어요..
팃포탯을 변형한 '강한 보복을 하는 팃포탯'이 권력자인 세계관도 있음. (마치 조폭같은..?)
 

돈이 아닌 '우정'을 대가로 협력하는 대부.

전쟁통에서 적군끼리도 협력이 싹틀 수 있을까?
은혜를 갚을 줄 모르는 친구에게는 계속해서 호의를 베풀어야 할까? 
팃포탯의 약점은 뭐가 있을까?
팃포탯은 어디까지 안정적일까?
 
등등의 의문들에 대한 답을 찾을 수 있읍니다..
 
 

 


"이 책은 낙관론 그 자체이다. 그러나 이 낙관론은 비현실적인 희망 사항이나 늘어놓고 감격스러워하는 순진한 낙관론이 아니라 믿음직한 낙관론이다."  
- 리처드 도킨스

1줄 요약 - 매너가 사람을 맨든다
 
 

https://osori.github.io/trust-ko/

▲'반복적 죄수의 딜레마' 게임을 직접 체감해 볼 수 있는 사이트
협력자와 배신자, 팃포탯 등 여러 전략들의 비율, 협력과 배신의 점수를 조정해서 생태계 실험을 해 볼 수도 있음. 흥미돋.. (7번 '샌드박스 모드'에 있어)

 

다음검색
현재 게시글 추가 기능 열기

댓글

댓글 리스트
  • 작성자영구치 아줌마 | 작성시간 25.11.25 좋은 글 고마워! 엄청 유익하다
  • 작성자xnxbwkq | 작성시간 25.11.25 재밌다
  • 작성자아랄리아 | 작성시간 25.11.25 넘 흥미로워...결국 협력이 이기는구만 책 추천 고마워`~~!
  • 작성자아잀씨유아웃 | 작성시간 25.11.25 와 이런 양질의 내용을 보기 쉽게 정리해주다니....
    너무 흥미롭다 고마워
  • 작성자아무닉네임임 | 작성시간 25.11.26 최애글
댓글 전체보기
맨위로

카페 검색

카페 검색어 입력폼