'강화학습' 기술 사용…응답 일관되고 정확
인간 수준 AI인 AGI 개발에 중요한 이정표
뉴욕타임스(NYT)와 파이낸셜타임스(FT)에 따르면 오픈AI는 이런 새 버전의 챗GPT를 공개하면서, 여기에는 '오픈AI o1'이라는 새 모델이 도입됐다고 설명했다.
o1 모델은 일반 사용자보다는 과학자와 개발자에게 유용하도록 설계됐다고 한다. 오픈AI는 o1 모델이 국제수학올림피아드 예선 시험에서 GPT-4o와 같은 기존 모델보다 훨씬 우수한 성적을 거뒀다고도 설명했다. 이 시험에서 4o는 13%의 정답률을 기록했지만, o1 모델은 83%의 정답률을 기록했다고 한다.
오픈AI의 최고기술책임자(CTO)인 미라 무라티는 o1 모델을 통해 인공지능(AI)의 작동 방식을 이해하는 데도 새로운 길이 열렸다고 언급했다. 그는 "모델의 사고 과정을 단계별로 관찰할 수 있는 가시성을 확보했다"고 말했다.
o1 모델은 강화학습(reinforcement learning)이라는 기술을 사용해 문제에 접근하는데, 이로 인해 다양한 방향을 탐색하기 위해 시간이 더 오래 걸리고 비용도 더 많이 들지만 응답이 더 일관되고 정교하다고 한다.
무라티는 이런 모델이 AI 기반 검색엔진(오픈AI의 서치GPT 등)에서 새로운 검색 패러다임을 열어 더 나은 연구와 정보 검색을 가능하게 할 수 있다고 설명했다.
전문가들에 따르면 소프트웨어가 단계별 추론을 수행하도록 하고 미리 계획을 세우도록 하는 것은 인간 수준의 AI인 범용인공지능(AGI)을 개발하는 데 있어 중요한 이정표다.
새로운 기술이 추가된 서비스는 이날부터 챗GPT플러스, 챗GPT팀스 서비스 가입자를 대상으로 시작됐다. 또 오픈AI는 이 기술을 AI 앱을 개발하는 소프트웨어 개발자와 기업에도 판매하고 있다.
◎공감언론 뉴시스 wrcmania@newsis.com