(이미지=ChatGPT)
시험지가 무너지고 있다
학기 말이 다가올 때마다 교수들은 같은 고민을 반복한다. "이 과제, 학생이 직접 쓴 건가?" 불과 3년 전만 해도 이 질문은 드물었다. 지금은 제출물을 열 때마다 드는 생각이 됐다.
수치가 이를 뒷받침한다. 2025년 영국 고등교육정책연구소(HEPI, Higher Education Policy Institute) 조사에서 영국 대학생의 92%가 학업에 생성형 AI를 활용하고 있다고 답했다. 2024년의 66%에서 단 1년 만에 26%포인트가 뛰었다. 학업 평가에 AI를 활용하는 비율도 88%에 달했다.
한국도 다르지 않다. AI 기업 무하유의 2026년 분석에 따르면, 대학 중간고사 기간 학생들의 AI 작성 탐지 자가점검 건수가 전년 대비 120% 넘게 급증했다. 학생들은 AI로 초안을 만들고, AI 탐지를 피하도록 다듬어 제출하는 방식을 새로운 루틴으로 삼고 있다.
문제는 학생들이 'AI를 쓰느냐, 안 쓰느냐'가 아니다. 기존의 평가 방식이 AI 시대에 더 이상 '학습을 측정'하지 못한다는 데 있다.
(이미지=ChatGPT)
평가가 측정하던 것이 사라졌다
전통적인 대학 평가는 크게 두 가지를 전제로 설계됐다. 첫째, 학생이 정보를 기억하고 정리하는 데 비용이 든다는 것. 둘째, 완성된 결과물이 학생의 이해를 반영한다는 것. AI는 이 두 전제를 동시에 무너뜨렸다.
정보 접근과 초안 작성의 비용이 사실상 0에 가까워졌다. 결과물이 훌륭해도 그것이 학생의 이해인지, AI의 출력인지 구분하기 어렵다. 2026학년도 수능이 끝난 직후 충남대에서 여러 AI 모델에 동일한 시험 문제를 풀리자, 만점을 받은 모델을 포함해 95점 이상이 6개나 나왔다. 기존 평가의 상당 부분이 AI에 의해 대체 가능해진 것이다.
여기서 우리가 직면한 진짜 질문은 이것이다. 지금 우리는 무엇을 평가하고 있는가? 그리고 무엇을 평가해야 하는가?
'결과'가 아니라 '과정'을 보라
평가 재설계의 핵심은 간단하다. AI가 대체하기 어려운 것을 측정하면 된다. 그것은 바로 '생각이 만들어지는 과정'이다.
첫 번째 방향은 과정 중심 평가(Process-based Assessment)다. 최종 제출물 하나만 받는 대신, 초안-피드백 반영-수정 과정을 단계별로 제출하게 한다. 각 단계에서 학생이 왜 이렇게 수정했는지를 메모로 남기게 하면, AI 의존도를 낮추는 동시에 비판적 사고 과정 자체를 평가할 수 있다. AI로 완성된 최종본을 제출하는 것은 쉬워도, AI와 대화하며 자신의 생각을 다듬은 흔적을 일관되게 만들어내는 것은 훨씬 어렵다.
두 번째 방향은 구술 평가(Oral Assessment)의 부활이다. 글로벌 교육혁신 연구기관인 디지털교육협의회(Digital Education Council)와 피어슨(Pearson)이 2026년 발표한 보고서는 101개 글로벌 사례를 분석하며 구술 시험이 AI 시대 핵심 평가 방식으로 급부상하고 있음을 확인했다.
직접 말하고 즉석에서 질문에 답하는 과정은 AI가 대신할 수 없다. 나 역시 수업에서 개인 발표 후 즉흥 질문을 더하는 방식을 도입해봤는데, 학생들이 과제를 얼마나 깊이 이해했는지가 2분의 대화로도 분명히 드러났다.
세 번째 방향은 포트폴리오 기반 평가다. 한 학기의 사고 변화를 누적 기록으로 남기게 하는 방식이다. 핀란드, 캐나다 등 교육 선진국에서는 이미 역량 기반 학습 이력 시스템을 고등교육에 적용하고 있으며, 국내에서도 일부 대학이 포트폴리오 기반 졸업 인증 제도를 시범 운영 중이다. 중요한 것은 AI가 포트폴리오를 대신 채워줄 수는 있어도, 왜 그 기록이 내 것인지를 설명하는 맥락과 성찰은 학생 자신만이 만들 수 있다는 점이다.
(이미지=ChatGPT)
AI를 금지할 것인가? 설계에 포함할 것인가?
여기서 교수들이 가장 많이 묻는 질문이 등장한다. "그럼 AI 사용을 막아야 하나요?" 나는 이 질문이 이미 잘못된 방향을 가리키고 있다고 생각한다.
AI를 사용했는지 안 했는지를 적발하는 데 에너지를 쏟는 것은 '탐지 군비 경쟁'에 불과하다. 학생들은 탐지를 피하는 방법을 이미 알고 있고, 그 기술은 계속 정교해진다.
대신 AI를 평가 설계 안으로 끌어들이는 것이 더 현실적이다. 예를 들어, "이 주제에 대해 AI에 질문을 설계하고, AI 답변의 오류를 찾아 수정하라"는 과제는 AI 리터러시(AI Literacy)와 전공 역량을 동시에 평가하면서, AI를 부정행위 도구가 아닌 사고 훈련 도구로 전환시킨다.
시드니대학교는 2025-2026학년도부터 AI 시대 학사 무결성 정책을 전면 개편하며, 위험도 기반 승인 체계를 도입했다. 2027년까지 모든 온라인 과정에 대면 평가 요소를 의무화하는 계획도 추진 중이다. 전 세계 대학이 같은 고민을 하고 있으며, 그 해법의 방향도 유사하게 수렴하고 있다.
평가를 바꾸면 수업이 바뀐다
평가 재설계는 단순히 부정행위를 막기 위한 방어 전략이 아니다. 평가가 바뀌면 학생이 수업에 임하는 방식 자체가 달라진다. 결과물 하나를 완성하는 것이 목표인 수업과, 생각의 과정을 쌓아가는 것이 목표인 수업은 학생에게 전혀 다른 경험을 만들어 낸다.
AI가 답을 대신 내어주는 시대에, 교수의 역할은 '정답을 가진 사람'이 아니라 '질문을 설계하는 사람'으로 이동하고 있다. 그리고 좋은 평가는, 언제나 좋은 질문에서 시작된다. 지금 우리 강의실의 시험지를 다시 펼쳐볼 때다.
유미선 극동대학교 교수
출처 : 교육플러스(https://www.edpl.co.kr)