수행평가가 도입된 지 여러 해, 한 교사가 루브릭의 칸을 채운다. 항목마다 점수가 매겨지고, 학생들은 '채점 기준에 맞는 답'을 미리 외워 온다. 결과 한 장을 과정 여러 장으로 바꿨을 뿐, 외워서 재생산하는 구조는 그대로다. 정책은 '암기를 넘어 사고를 평가한다'고 선언했다. 그러나 묻게 된다. 그 선언은 증명되었는가.
먼저 분명히 해 두자. 과정중심평가의 방향은 옳다. 단 한 번의 시험으로 사람을 줄 세우는 평가가 사고력을 길러 주지 못한다는 것은 이미 자명하다. 2028 대입개편 확정안도 "지식 암기 위주의 5지선다형 평가를 지양하고 사고력·문제해결력을 평가하는 논·서술형 평가를 확대"하겠다고 못 박았다. 지향에는 흠이 없다. 문제는 지향과 증명은 다른 말이라는 데 있다.
놀랍게도, 과정중심평가가 학생의 사고력을 실제로 키웠다는 국내 실증은 거의 비어 있다. 효과를 보고한 대표 연구(장재홍, 2020)조차 측정한 것은 학생의 인지적 성취가 아니라 교사 쪽 변인—과제 피드백, 교사 효능감, 수업 이해도—이었고, 그나마 지필평가만 단독으로 시행한 방식은 효과가 없었다. 학생이 정말로 더 깊이 생각하게 되었는지를 인과적으로 검증한 최신 연구는, 솔직히 말해 찾기 어렵다. 우리는 평가의 형식을 바꿨다는 것은 알지만, 그 형식이 아이의 머릿속을 바꿨다는 증거는 갖고 있지 못하다.
더 뼈아픈 것은 현장의 역설이다. 전국 150개 중학교의 평가계획서를 분석한 연구(추진아·박영민, 2021)는, 국어과 수행평가가 학습을 돕겠다는 설계 의도와 달리 결국 학생의 등급을 평정해 '서열화'하는 도구로 작동하고 있음을 드러냈다. 과정을 보겠다던 평가가 또 하나의 줄 세우기가 된 것이다. 교사들이 무능해서가 아니다. 채점할 시간은 없고 민원은 쏟아지며 연수는 부족한 구조 안에서(한국교육과정평가원, 2019), 교사들은 정책의 이상과 교실의 현실 사이를 협상하는 '최적화 행동'으로 버틴다(남가영·김호정, 2023). 이상은 위에서 내려오고, 부담은 아래에서 떠안는다.
제도의 칼끝도 무디다. 2028 개편은 내신을 9등급에서 5등급으로 바꾸지만 상대평가 등급을 함께 매겨 서열 경쟁을 폐지가 아니라 완화에 그쳤고, 무엇보다 논·서술형 확대는 내신에만 적용될 뿐 수능은 여전히 5지선다로 남는다. 가장 높은 관문이 암기를 묻는 한, 그 아래 평가가 사고를 묻겠다는 다짐은 절반의 약속이다. 국제 연구가 형성평가의 효과를 "긍정적이지만 완만하다(+0.18)"고 신중하게 보고하는 것도(Xuan 외, 2022) 같은 경고다. 형식을 바꾸면 학습이 저절로 깊어진다는 믿음은, 근거가 얇다.
그러니 진짜 과제는 평가지의 모양이 아니라 설계다. 루브릭의 칸을 늘리는 일이 아니라, 학생이 정해진 답을 재생산하는 대신 근거를 들어 추론하고 자기 판단을 변호하게 하는 과제를 만드는 일이다. 교사는 '무엇을 썼는가'보다 '왜 그렇게 판단했는가'를 보고, 학부모는 점수표 대신 "그 결론에 어떻게 도달했니"를 물어야 한다. 평가의 형식을 바꾸는 일과 사고를 길러내는 일은 다르다. 과정을 칸칸이 채점한다고 저절로 과정중심이 되지는 않는다. 암기를 넘어서는 것은 제도의 선언이 아니라, 끝내 사고를 묻는 설계다.
출처
- "지식암기 위주 평가 지양·논서술형 확대"(단, 내신 한정·수능 5지선다 유지): 교육부, 「2028 대학입시제도 개편 확정안」(2023.12.27)
- 효과 연구가 학생 인지 아닌 교사 변인 측정·지필단독 무효과: 장재홍, 「교사별 과정중심평가 방식에 따른 …비교 분석」, 『교육공학연구』 36(4), 2020
- 국어과 수행평가의 '서열화' 형식화(150개 중학교 텍스트마이닝): 추진아·박영민, 「중학교 평가계획서에 나타난 국어과 수행평가의 특징」, 『청람어문교육』 80, 2021
- 채점 시간·민원·연수 부족 등 구조적 장벽: 한국교육과정평가원(박혜영 외), 「수업-평가 연계 강화를 통한 서·논술형 평가 내실화 방안」, 2019
- 국어교사의 '최적화 행동'(정책 이상↔실행 괴리): 남가영·김호정, 「서술형·논술형 평가 실행에 관한 국어 교사의 최적화 행동 분석」, 『교과교육학연구』 27(1), 2023
- 형성평가 효과 +0.18(완만): Xuan, Cheung & Sun, "The effectiveness of formative assessment …", Frontiers in Psychology, 2022