챗GPT로 직접 생기부 써 보니…평가 항목만 넣으면 종합의견 알아서 줄줄
학생 과제물 평가 기준 입력하자
성취 수준별 총평 분량 맞춰 제시
종결어미 축약형 변환 등 순식간
적발 프로그램 검증도 무사 통과
#1. 고전 텍스트인 〈소크라테스의 변명〉(플라톤), 〈국부론〉(스미스), 〈역사란 무엇인가〉(카)를 읽고, '부와 명예보다 지혜와 진리의 뛰어남이 더 중요한가, 하층계급에게 어느 정도의 생활을 보장해야 바람직한가, 현대 사회에서 역사가가 갖추어야 할 자질은 무엇인가'와 같은 의문을 제기하고 스스로 해답을 탐색하는 활동을 하여 보고서를 작성하고 모둠원들과 공유하는 토의토론 활동에 적극적으로 참여함.
#2. 윤동주 시를 비평함으로써 텍스트의 담화 관습과 의미분석에 대한 감상 능력을 효과적으로 발휘함. ‘서시’에서는 윤동주의 현실과 이상 갈등을 명확하게 이해하고, 시의 의도를 세밀하게 해설함. 특히, 순수한 이상을 추구하는 마음과 현실 압박 속에서 희망을 유지하려는 의지를 명확하게 파악하며 표현함.
두 글 중에서 어떤 게 챗GPT가 쓴 고등학교 학생생활기록부(생기부)일까? 하나는 챗GPT 출시 전인 2019년 고등학교를 졸업한 한 학생의 생기부이고, 다른 하나는 기자가 고등학생이 쓴 비평문을 바탕으로 직접 챗GPT에게 요구해 만들어낸 글이다. 행간의 빈틈을 읽으려 해봐도, 어떤 게 교사가 직접 작성한 생기부인지 구별하기 쉽지 않다. 챗GPT의 작품은 2번이다.
〈부산일보〉 취재진은 지난달 20일 챗GPT 3.5와, 챗GPT를 기반으로 한 파생 서비스 플랫폼을 이용해 생기부의 국어 과목별 세부특기사항, 진로특기사항, 행동특성 및 종합의견을 직접 생성해봤다.
가장 손쉬운 방법은 생기부 전용 챗GPT를 활용하는 방법이었다. 주제별로 챗GPT 파생 서비스를 제공하는 플랫폼에서는 아예 선생님용 도구 메뉴가 별도로 마련됐다.
2023학년도 생기부 작성 요령을 반영했다는 챗GPT에 '학업 성취도 중간, 원만한 교우관계, 학급 부반장, 배려심, 봉사정신'만 입력했더니, 학생의 교내 영향력과 진로 인식, 성장 가능성까지 진단한 300자짜리 생기부용 문장이 생성됐다.
“학급 부반장으로서 리더십을 펼치며 학업에 열정을 보임. 진로에 대한 뚜렷한 인식과 봉사정신으로 학교 내 긍정적 영향을 미치며, 대인관계와 봉사활동을 통해 성장 가능성 큼.”
유튜브에선 이런 챗GPT의 기능을 활용해, 학생 여러 명에 대한 평가를 손쉽게 작성할 수 있는 방법도 소개되고 있다. 구글 스프레드 시트에 여러 학생에 대한 키워드를 학생별로 정리해둔 뒤 챗GPT를 연동시키는 것. 챗GPT가 만드는 문장의 다양성을 결정하는 하이퍼 파라미터인 온도(temperature) 값을 높게 조정하면, 학생들의 특성을 일일이 입력하는 노고와 창작의 고통에서도 벗어날 수 있었다.
자동으로 평가 문항을 작성해 주는 수준을 넘어선 생기부 작성도 가능했다. 질문하는 방법에 따라 답변의 품질이 달라지는 챗GPT의 특성을 감안하면 교사가 어떤 내용으로 챗GPT에 질문하느냐에 따라 양질의 생기부 작성도 가능한 셈이다.
대입 전문가들은 학생이 수업 시간에 발표한 내용이나 수행평가에서 학생의 장점이 잘 드러나도록 기술한 생기부가 높은 평가를 받는다고 조언했다.
이들의 조언을 참고해 우선 챗GPT에게 교육부 2023학년도 생기부 기재요령 등을 바탕으로 주요 평가기준, 과목 성취기준, 글자 수를 알려줬다. 이후 실제 고등학생이 작성한 독서 비평문을 입력했다.
불과 1분여 만에 그럴싸한 대답을 내놓은 챗GPT에게 문장 종결어미를 축약형으로 바꿔 달라거나 구체적인 표현을 포함해달라고 추가로 요구했다. 최종 결과물을 얻기까지 사람이 직접 한 일은 원하는 결과물이 나올 때까지 프롬프트를 수정한 뒤, 불필요한 접속사를 삭제하는 것 정도였다.
〈부산일보〉 청소년 기자의 기사를 교내 교지 동아리 활동 결과물인 것처럼 입력하고, 학생의 진로가 언론인이라는 정보, 진로활동 특기사항에 포함돼야 할 평가기준을 제시했을 땐 이런 문장을 생성했다. “교내 교지 동아리 기자로 활동하며 작성한 기사를 통해 뛰어난 분석력과 관찰 능력을 발휘함. 혈액 부족 문제를 주제로 한 기사에서 학교 내 헌혈 캠페인 상황을 사실적이고 정확하게 기록하여 사회 문제에 대한 예민한 감각과 높은 글쓰기 능력을 나타냄.”
일명 'GPT 판독기'라고 불리는 'GPT 제로'는 실제 생기부와 AI 생기부를 구분하지 못했다. 챗GPT가 생성한 생기부 문장이 완전히 AI에 의해 쓰였을 가능성을 48~49%로 진단했는데, 실제 사람이 쓴 생기부에 대해서도 48~49%로 진단했다. 사람이 직접 읽어도 구분하기 어려운 AI 생기부를, 기계조차 가려내지 못했다.
손혜림 기자 hyerimsn@busan.com