Recent Posts
Recent Comments
02-14 02:49
Today
Total
관리 메뉴

코딩하는 공무원

[중앙일보] 수능문제 줬더니, 제미나이 92점 국내 AI 20점 대 (김민정, 오현우 기자 / 2025.12.16.) 본문

스크랩

[중앙일보] 수능문제 줬더니, 제미나이 92점 국내 AI 20점 대 (김민정, 오현우 기자 / 2025.12.16.)

코딩펀 2025. 12. 16. 09:22

https://www.joongang.co.kr/article/25390315

 

수능문제 줬더니, 제미나이 92점 국내AI 20점대 | 중앙일보

국내 기업들이 개발한 인공지능(AI) 모델들에 수학능력시험(수능) 문제 등을 풀게 한 결과 해외 AI에 비해 크게 낮은 점수를 받은 것으로 나타났다. 평가 대상은 네이버, NC AI, LG AI연구원, SKT, 업스

www.joongang.co.kr

연구팀은 수능 수학의 네 분야(공통과목, 확률과 통계, 미적분, 기하)에서 가장 난도가 높은 문제 5개씩 20문제, 국내 논술·인도 대학 입시 10문제씩, 일본 도쿄대 공과대학 대학원 입시 10문제 등 총 50개 문제를 선별해 AI에 풀게 했다.
평가 결과 5개 해외 AI 모델은 전부 70% 이상 정답률을 기록했다. 특히 구글의 최신 모델 ‘제미나이 3 프로’는 50문항 중 46문제를 맞혀 92% 정답률을 보였다. 앤스로픽의 클로드가 84%, xAI의 그록이 82% 정답률로 뒤를 이었다.

출처 : joongang.co.kr/article/25390315

업계에선 평가받은 국내 AI 개발사들이 업무용 AI 개발에 주력해온 만큼, 해당 모델들의 수학 문제 풀이 점수는 낮을 수밖에 없다는 입장이다. <중략> 평가에 포함된 일부 모델이 사전 학습 방식(학습된 데이터를 기반으로 정답일 확률이 높은 답을 내놓는 방식) AI인 점도 한계다. 단계별로 검증을 거치는 추론 방식인 해외 모델들과 달리 사전학습 방식 AI는 수학·코딩 등 논리적 문제풀이에 상대적으로 약하다.
Comments