수학 추론 정확도 87.5%…美언론 "최고 수준에 근접"
29일 중국 관영 글로벌타임스 등에 따르면 딥시크는 전날(미국 동부시간 기준) 새벽 미국 AI 개발자 플랫폼 '허깅페이스'를 통해 자사의 새 추론 모델 'R1-0528'을 공개했다.
딥시크 측은 "이번 모델은 지난해 12월 출시된 V3 Base 모델을 기반으로 했으며, 추론 능력을 대폭 향상시킨 버전"이라면서 "미국 수학 경시대회(AIME) 2025 테스트 기준, 정확도가 70%에서 87.5%로 개선됐다"고 밝혔다.
미국 IT업계도 이번 공개에 주목하고 있다.
UC버클리와 매사추세츠공대 연구진이 개발한 AI 평가지표 '라이브코드벤치'에 따르면 R1-0528은 오픈AI의 O4-mini 및 O3 모델에 근접한 수준인 것으로 나타났다.
허깅페이스 소속 AI 연구원 아디나 야케푸는 "딥시크의 업그레이드 모델은 수학과 코딩 성능이 더 강화됐고, 추론 정확도도 크게 향상됐다"면서 "최고 성능의 모델군에 근접하고 있다"고 평가했다.
야케푸 연구원은 또 "AI 환각 현상도 크게 개선됐다"면서 "이는 딥시크가 단순한 추격자가 아니라는 점을 보여준다"고 전했다. AI 환각은 인공지능이 사실과 다른 정보를 생성하는 현상을 의미한다.
딥시크는 지난해 12월 자체 대형언어모델(LLM) V3를 출시한 데 이어, 올 1월 저비용 모델 ‘R1’을 공개하며 세계적 주목을 받은 바 있다. R1은 미국의 주요 상용 모델 대비 개발 비용이 10분의 1 이하임에도 불구하고, 챗GPT에 근접한 성능을 보이며 화제를 모았다.
◎공감언론 뉴시스 sophis731@newsis.com