Recent Posts
Recent Comments
02-13 23:27
Today
Total
관리 메뉴

코딩하는 공무원

[경향신문] 27초 만에 24명 글쓰기 답안 채점 ... "점수 매번 달라 정확도 떨어져" (김송이, 김원진 기자 / 2025.12.22.) 본문

스크랩

[경향신문] 27초 만에 24명 글쓰기 답안 채점 ... "점수 매번 달라 정확도 떨어져" (김송이, 김원진 기자 / 2025.12.22.)

코딩펀 2025. 12. 23. 08:39

https://www.khan.co.kr/article/202512222037005

 

[AI에 ‘교육’을 먹이면]‘27초’ 만에 24명 글쓰기 답안 채점…“점수 매번 달라 정확도 떨어져

초등학교 4학년 학생 24명의 글쓰기 답안 채점이 27초 만에 끝났다. 학생들이 ‘어린이날 기념 학급 행사로 무엇을 하면 좋을까’라는 주제로 쓴 답안의 초벌 채점을 인공지능(AI)은 1분도 안 걸려

www.khan.co.kr

교사의 머릿속 채점 기준을 AI에게 ‘먹이는’ 과정에 손이 많이 간다는 이도 있었다. 고교 국어과 A교사는 “모든 과제물을 스캔하는 과정부터 거치고 교육과정에 맞춰 채점 기준을 넣어야 한다”고 했다. 요약, 논리성, 독창성, 주장과 근거의 일목요연함 등 서론·본론·결론마다 채점 요소를 넣어주는 작업도 이어진다.
고교 16년차 D교사는 “같은 학생의 답안을, 동일 채점 요소를 넣고 돌려도 돌릴 때마다 점수가 다르게 나온다”고 했다. D교사가 사용한 유료 서비스는 경기교육청 하이러닝에 도입된 E사 모델로, 언어모델의 생성형 AI를 기반으로 한다. AI가 학생 답안을 이해하고 채점하는 것이 아니라, 답안 내용이나 구조가 채점 기준과 유사하다면 확률상 그럴듯한 평가를 하는 식이다. <중략> 고교 국어 교사 중에는 E사 서비스에 대해 “상·하위권 학생 채점은 비교적 정확하지만 중위권 학생 평가 정확도가 떨어져 평가 설계가 고민된다”고 한 이들도 있었다.
AI 평가 도구를 써본 교사들은 장단점을 분류하기 시작했다. 이들은 AI 채점을 믿을 수 있는 영역과 그렇지 않은 부분으로 나눴다. 국어에선 AI가 채점 요소에 기재된 키워드를 학생의 문장·문단에서 찾아내는 것은 잘했지만, 글을 총체적으로 읽고 평가하는 것은 맞지 않다고 했다. 수학은 아직 AI 채점 도입이 어렵다. 제곱을 표기한 손글씨도 인식하지 못한다. 영어는 AI가 어법을 엄격하게 채점하지만 문장 표현이나 부사 활용 등은 너그럽게 채점한다는 평가를 받는다.
Comments