| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
Tags
- 4차 산업혁명
- 나만의 독서법
- 알프레드 에이호
- 누구를 위한 교육과정인가?
- Code Blast
- 제프리 울만
- 동영상 플레이어
- 박사 논문
- 블록 코딩
- 2022 개정 교육과정
- 2021년 튜링상
- 휴먼명조
- 욱
- 코드 폭발 효과
- 머신러닝
- MontyHall
- 앱
- code.org
- 패트릭 브링리
- Visual Studio Code
- 선각자
- 수학적 귀납법
- 변곡점
- 단편 드라마
- 인공지능
- 안드로이드
- 매트로폴리탄 미술관
- 중학교 교육과정
- 파일 검색
- 베스트 극장
Archives
코딩하는 공무원
[중앙일보] 수능문제 줬더니, 제미나이 92점 국내 AI 20점 대 (김민정, 오현우 기자 / 2025.12.16.) 본문
https://www.joongang.co.kr/article/25390315
수능문제 줬더니, 제미나이 92점 국내AI 20점대 | 중앙일보
국내 기업들이 개발한 인공지능(AI) 모델들에 수학능력시험(수능) 문제 등을 풀게 한 결과 해외 AI에 비해 크게 낮은 점수를 받은 것으로 나타났다. 평가 대상은 네이버, NC AI, LG AI연구원, SKT, 업스
www.joongang.co.kr
연구팀은 수능 수학의 네 분야(공통과목, 확률과 통계, 미적분, 기하)에서 가장 난도가 높은 문제 5개씩 20문제, 국내 논술·인도 대학 입시 10문제씩, 일본 도쿄대 공과대학 대학원 입시 10문제 등 총 50개 문제를 선별해 AI에 풀게 했다.
평가 결과 5개 해외 AI 모델은 전부 70% 이상 정답률을 기록했다. 특히 구글의 최신 모델 ‘제미나이 3 프로’는 50문항 중 46문제를 맞혀 92% 정답률을 보였다. 앤스로픽의 클로드가 84%, xAI의 그록이 82% 정답률로 뒤를 이었다.

업계에선 평가받은 국내 AI 개발사들이 업무용 AI 개발에 주력해온 만큼, 해당 모델들의 수학 문제 풀이 점수는 낮을 수밖에 없다는 입장이다. <중략> 평가에 포함된 일부 모델이 사전 학습 방식(학습된 데이터를 기반으로 정답일 확률이 높은 답을 내놓는 방식) AI인 점도 한계다. 단계별로 검증을 거치는 추론 방식인 해외 모델들과 달리 사전학습 방식 AI는 수학·코딩 등 논리적 문제풀이에 상대적으로 약하다.
'스크랩' 카테고리의 다른 글
Comments