인하대병원 영상의학과 이로운 교수와 공동 연구
SCI급 국제학술지에 게재…위치·진단 정확성 앞서
[서울=뉴시스]송종호 기자 = 딥노이드의 의료 인공지능(AI) 솔루션이 흉부 엑스레이 판독에서 챗(Chat)GPT 보다 위치, 진단 정확성 등에서 앞선 것으로 나타났다.
의료AI 전문기업인 딥노이드는 인하대병원 영상의학과 이로운 교수팀과 공동으로 진행한 '딥노이드의 M4CXR과 OpenAI의 챗(Chat)GPT간 흉부 X-ray 해석 성능 비교에 관한 연구' 결과를 이같이 밝혔다.
딥노이드의 M4CXR은 흉부 X-ray 영상을 분석해 판독문 초안을 생성하는 거대 언어 모델(LLM)로 설계된 클라우드 기반의 의료 AI 솔루션이다. 본 연구를 통해 M4CXR은 흉부 X-ray 진단 시 실제 의료현장에서 임상의의 역량을 강화하는 보조 도구로 적합함을 입증했다.
이번 연구는 의료 AI 관련 전문가인 인하대병원 영상의학과 이로운 교수의 주도로 진행됐다. M4CXR과 Chat GPT의 판독 결과를 ▲정확도 ▲위양성 ▲위치 오류 ▲개수 오류 ▲환각 등 다섯 개 지표로 평가했을 때, M4CXR은 모든 평가 항목에서 ChatGPT보다 일관되게 우수한 성능을 보였다. 특히 위치 정확성(76-77.5%)에서 ChatGPT(36-36.5%)를 크게 앞섰다. 진단 정확성 측면에서도 M4CXR(60-62%)은 ChatGPT(42-45%)보다 월등히 우수했다.
연구 결과 M4CXR은 전문 의료 환경에서 활용하기에 적합했으며, 범용 AI인 ChatGPT에 비해 월등히 우수한 성능을 나타냈다. 향후 M4CXR이 실제 의료 현장에서 사용될 경우, 진단 워크플로우를 최적화하고 의료 전문가의 역량을 보완할 것으로 기대하고 있다.
이번 논문의 제1저자인 인하대병원 영상의학과 이로운 교수는 "이번 연구를 통해 의료 영역에서 M4CXR의 진단 보조 도구로의 잠재력을 확인할 수 있었다"며 "특히 위치 정확도와 진단 정확성에서 보여준 우수한 성능은 실제 임상 현장에서 큰 가치를 발휘할 것"이라고 평가했다.
이어 "향후 실제 전문의와의 판독 비교 연구를 통해 M4CXR의 임상적 유효성을 더욱 강화하고, 이를 바탕으로 진단의 정확도와 효율성을 한층 높여나갈 계획"이라고 덧붙였다.
딥노이드 최우식 대표는 "이번 연구는 M4CXR이 전문 의료 영역에서 ChatGPT를 능가하는 훌륭한 성능을 갖췄음을 입증한 것"이라며 "내년 상반기 상용화를 목표로 영상 판독 시장 진출을 준비하고 있다"고 밝혔다.
이어 "전세계 영상판독 시장이 2030년까지 연평균 23.7% 성장해 약 56조원 규모로 성장할 것으로 전망되는 만큼, M4CXR을 통해 시장을 선도해 나갈 것"이라고 말했다.
이번 연구 결과는 SCI급 국제공인학술지 임상의학저널(Journal of Clinical Medicine)에 게재됐다.
◎공감언론 뉴시스 song@newsis.com