"AI가 수석"…도쿄대 입시서 인간 뛰어넘었다

기사등록 2026/04/27 20:57:29 최종수정 2026/04/27 21:02:23
[서울=뉴시스] AI 모델이 도쿄대·교토대 입시 문제에서 인간 최고점을 넘는 성적을 기록한 것으로 나타났다. (사진=유토이미지)

[서울=뉴시스]이기주 인턴 기자 = 미국 오픈 AI와 구글, 앤트로픽의 최신 인공지능(AI) 모델이 일본 최상위 입시로 꼽히는 도쿄대학교와 교토대학교 시험에서 실제 수험생 최고점을 웃도는 성적을 기록한 것으로 나타났다.

일본경제신문이 AI 스타트업 라이프프롬프트, 입시학원 가와이주쿠와 함께 진행한 이번 조사에서는 2026학년도 입시 문제를 AI에 입력해 답안을 생성하고, 이를 전문 강사진이 채점하는 방식이 활용됐다.

평가 결과 오픈AI의 '챗GPT-5.2'는 도쿄대와 교토대 전 계열에서 최고 점수를 기록하며 사실상 '수석' 수준에 올랐다. 특히 이전 조사에서 약점으로 꼽혔던 수학에서 만점을 받으며 눈에 띄는 성능 개선을 보였다. 도쿄대 이과 기준 총점은 503점으로, 기존 수험생 최고점(453점)을 크게 웃돌았다.

구글의 '제미나이 3 프로 프리뷰' 역시 496점을 기록하며 모든 계열에서 상위권 성적을 냈고, 앤트로픽의 '클로드 오퍼스4.5'도 의대 수준을 포함해 전반적으로 합격 기준을 충족했다.

과목별로는 모델 간 강점이 뚜렷하게 갈렸다. 오픈AI는 수학과 화학 등 이과 과목에서 높은 점수를 기록한 반면, 구글은 국어와 역사 등 문과 과목에서도 고른 성적을 보였다. 앤스로픽은 일부 과목에서 최고점을 기록하는 등 특정 분야에서 경쟁력을 드러냈다.

다만 한계도 확인됐다. 오픈AI는 세계사 등 서술형 과목에서 논리 전개가 부족하다는 평가를 받았고, 일부 모델은 답안 분량을 초과하는 등 형식적인 오류도 나타났다. 특히 비유나 풍자 등 복합적 의미를 요구하는 문제에서는 전반적으로 취약한 모습을 보였다.

그럼에도 전반적인 학습 능력은 크게 향상된 것으로 평가된다. 채점에 참여한 강사진은 "논증 과정이 이전보다 훨씬 정교해졌고 모범 답안에 가까운 수준"이라고 분석했다. 답안 작성 속도 역시 대부분 30분 이내로, 인간 수험생보다 훨씬 빠른 것으로 나타났다.

전문가들은 AI가 이미 최상위권 수험생 수준의 학력을 보인 만큼, 향후에는 기술 자체보다 이를 어떻게 활용할지에 대한 인간의 '설계력'과 '감독력'이 더욱 중요해질 것이라고 전망했다.


◎공감언론 뉴시스 ufo0221@newsis.com