9월 25일 수업에서 교수님께서 행동주의를 설명하시면서 파블로프의 개 실험을 예로 드셨습니다.
개 실험에서 자극이라고 할 수 있는 고기, 그리고 종소리 중에서 '고기'를 '강화'라고 말씀하셨습니다.
저는 스키너의 상자 실험을 떠올렸는데 스키너의 상자 실험의 내용은 다음과 같습니다.

쥐가 어쩌다가 레버를 누르고, 레버를 누를 때 마다 고기가 쥐에게 제공됩니다. 여기서 자극은 '고기'이고 반응은 '레버 누르기'입니다. 일의 순서는 레버가 눌러져서 고기가 나오는 것이지만, 쥐는 '고기' 때문에 레버를 누르는 행동을 반복하는 것이기 때문입니다.
스키너는 쥐가 '고기'라는 보상을 얻기 위해 '레버를 누른다'라는 행동을 학습한다고 밝혔으며 이것을 강화 라는 개념으로 정립하였습니다.
이에 반해 파블로프의 실험에서 '고기'는 '침 흘리기'라는 행동을 학습시키는 것이라고 할 수는 없습니다.
'침 흘리기'는 '고기'를 접했을 때 본능적이고 무의식적으로 나오는 반응입니다. 스키너 상자의 쥐처럼 개가 '고기'라는 보상을 얻기 위해 침을 흘릴 리도 없을 것입니다.
저는 이런 차이 때문에 파블로프의 실험에서 '고기'는 '강화'의 예가 아니라고 보았습니다. 그래서 교수님께 이러한 점을 질문하였습니다.
두산백과에서 강화Reinforcement에 대해 검색해보았더니 다음과 같은 내용을 찾을 수 있었습니다.
강화는▶고전적 조건형성(條件形成)에서는 조건자극에 이어 무조건자극을 주는 것을 말한다. 예를 들면, 파블로프의 실험에서 벨소리를 내면서 개에게 고기를 줌으로써 벨소리와 타액분비의 결부가 쉬워지게 하는 것이다.
여기서 조건자극은 '조건화된 자극', 즉 원래 아무런 반응을 주지 못하는 벨소리가 고기와 결합하여 개에게 동일시되고 결국 '침흘리기'라는 반응을 이끌어낼 수 있도록 된 것을 말합니다. 벨소리와 함께 고기를 주는 것을 파블로프의 실험에서 강화라고 칭하고 있습니다. 정확히 말하면 고기와 벨소리 모두 강화라고 볼 수 있다고 합니다. 교수님이 말씀하신 강화는 바로 고전적 조건형성에서의 강화를 말씀하신 것입니다.
강화는▶도구적 조건형성(道具的條件形成)에서는 한 번 반응이 있은 뒤에 다시 그러한 반응을 일으키도록 자극을 주는 것이다. 예를 들면, 스키너 상자(skinner box) 안에서 쥐가 바(bar)를 누르면 먹이를 주어서, 바를 누르는 반응을 촉진하는 것을 말한다.
어떤 반응을 불러일으킨다는 점에서 일맥상통하지만, 스키너 상자에서는 '고기'로 쥐가 의식적인 학습을 하게끔 합니다.
그래서 두 실험에서 '보상을 통한 의식적 학습'의 효과가 있느냐 없느냐의 차이는 존재합니다만 결론적으로 두 실험에서 '강화물'이 존재한다는 것은 공통적이며, 파블로프의 실험에서 '고기'를 '강화'라고 칭하는 것은 알맞다고 할 수 있습니다.
좀더 정확한 정보가 있으신 분은 같이 지식을 공유하면 좋겠습니다! 감사합니다..