노벨화학상 영예도 'AI'…구글 딥마인드가 만든 '알파폴드2' 뭐길래

기사등록 2024/10/09 19:43:32 최종수정 2024/10/09 19:47:31

2024 노벨화학상에 데이비드 베이커 교수와 구글 딥마인드 연구자 2인 선정

베이커 교수, 새로운 단백질 만드는 기술 개발…질병 치료 등에 활용도 높아

알파폴드2, '단백질 구조' 2억여개 예측 성공…50년 묵은 학계 숙원 풀었다

[스톡홀름=AP/뉴시스]스웨덴 스톡홀름 스웨덴 왕립과학원에서 노벨상위원회가 2024년 노벨화학상을 수상한 데이비드 베이커 미국 워싱턴대 교수와 데미스 허사비스 구글 딥마인드 최고경영자(CEO), 존 점퍼 딥마인드 수석연구원을 소개하고 있다. 2024.10.09.
[서울=뉴시스]윤현성 기자 = 올해 노벨화학상은 새로운 단백질을 만들어내고, 복잡한 3차원 단백질 구조를 정확하게 예측하는 AI(인공지능) 모델을 개발한 3명의 과학자에게 돌아갔다.

올해는 노벨물리학상에 이어 노벨화학상까지 AI 관련 연구자들에게 돌아갔다. 그간 노벨상위원회가 융합학문보다 순수학문에 초점을 두는 보수적인 모습을 보였다는 점을 고려하면 이례적이라는 평가가 많다. 이번 노벨화학상의 주인공이 된 AI 모델은 구글 딥마인드의 '알파폴드2'다.

스웨덴 카롤린스카야 의학연구원의 노벨상위원회는 9일 데이비드 베이커 미국 워싱턴대 교수와 데미스 허사비스 구글 딥마인드 최고경영자(CEO), 존 점퍼 딥마인드 수석연구원을 노벨화학상 수상자로 선정했다고 발표했다.

노벨상위원회는 "올해 주목받는 발견 중 하나는 놀라운 단백질을 만드는 것에 관한 것이고, 다른 하나는 단백질 구조를 아미노산 서열로부터 예측하는 50년 묵은 꿈을 이룬 것이다. 이 두 발견은 엄청난 가능성을 열어준다"고 수상 이유를 설명했다.
단백질은 일반적으로 20가지의 아미노산으로 구성되며, 이 아미노산들이 긴 사슬처럼 연결된 형태를 띄게 된다. (사진=노벨상위원회) *재판매 및 DB 금지

베이커 교수는 새로운 단백질을 만들어내는 기술을 개발했다. 단백질은 일반적으로 20가지의 아미노산으로 구성되며, 이들은 생명체를 이루는 일종의 '블록' 같은 역할을 한다. 베이커 교수는 2003년 이 아미노산들을 이용해 기존에 존재했던 단백질과는 전혀 다른 단백질을 설계하는 데 성공했다.

2003년 첫 설계 성공 이후 베이커 교수 연구팀은 의약품, 백신, 나노 소재 등 다양한 분야에 응용할 수 있는 새로운 단백질들을 꾸준히 만들어냈다.

단백질이 인간을 비롯한 생명체의 활동에서 가장 기본적인 역할을 하는 만큼 단백질 구조의 이해는 질병 치료를 비롯한 다양한 분야에 활용할 수 있다. 베이커 교수의 연구는 용도에 따라 필요한 대로 단백질을 만들어낼 수 있는 길을 열어줬다는 데서 그 의의가 크다.

베이커 교수가 새로운 단백질을 만들어냈다면, 허사비스 CEO와 점퍼 수석연구원이 이끈 구글 딥마인드는 복잡한 단백질 구조를 예측할 수 있는 AI를 개발하는 데 성공했다.

단백질은 아미노산이 긴 사슬처럼 연결된 형태를 띄고 있다. 이 사슬은 3차원 구조로 접히게 되는데, 어떻게 접히는지에 따라서 단백질의 기능을 결정하게 된다. 단백질 구조를 이해해야 그 기능을 명확하게 파악할 수 있는 셈이다.

이에 학계에서는 1970년대부터 아미노산 사슬을 기반으로 단백질 구조를 예측하려 했으나, 20가지나 되는 아미노산이 3차원 구조로 복잡하게 접히며 50여년 가까이 정확한 메커니즘을 파악하지 못했다.
[마운틴뷰(캘리포니아주)=AP/뉴시스]지난해 5월10일 미국 캘리포니아주 마운틴뷰에서 열린 연례 개발자 행사에서 구글 딥마인드에 대한 브리핑이 진행되는 모습.
이 난제를 구글 딥마인드가 풀었다. 2020년 구글 딥마인드는 2020년 '알파폴드2'라는 AI 모델을 발표했다. 알파폴드2는 지금까지 학계에서 확인된 2억개에 달하는 단백질 구조를 거의 대부분 예측해냈다.

노벨상위원회는 알파폴드2의 등장 이후 전세계 190여개국에서 200만명 이상의 사람들이 알파폴드2를 사용해 단백질 구조를 예측해냈다고 설명했다. 이를 통해 연구자들은 항생제의 내성을 더 잘 이해하거나, 플라스틱을 분해하는 단백질 효소의 구조 등을 확인할 수 있게 됐다.

알파폴드2가 단백질 구조를 예측하는 과정은 크게 보면 데이터 입력 및 데이터베이스 검색 → 아미노산 서열 분석 → AI 기반 분석 및 데이터 고도화 → 가설적 단백질 구조 생성 및 테스트의 과정을 거쳐 이뤄진다.

알 수 없는 구조의 아미노산 서열(단백질 구조)을 알파폴드2에 입력하면 알파폴드2가 입력된 서열과 비슷한 형태를 찾기 위해 데이터베이스 검색에 나서게 된다. 이후 비슷한 서열이 여러개 나오면 이를 정렬하고 어떤 아미노산들이 서로 상호작용하는 지를 AI가 진단하게 된다. 이 과정에서 아미노산들이 구조 내에서 서로 얼마나 가까운지 파악하는 '거리 지도' 등을 생성하게 된다.

이같은 과정을 거친 후에는 AI가 반복 과정을 통해 서열 분석 결과 및 거리 지도를 보다 정교하게 다듬게 된다. 이때 일종의 인공신경망을 활용해 중요한 요소들을 식별하게 된다. 이후 최종적으로 퍼즐을 맞추듯 가설적인 단백질 구조를 생성하고, 해당 구조에 대한 테스트를 통해 실제 구조와의 일치 가능성을 계산해 최종적으로 단백질의 3차원 구조를 도출해낸다.

즉 올해 노벨화학상 수상자 3명은 인류가 생명체의 근간을 이루는 단백질을 이해하고 설계하는 능력을 크게 도약시킨 셈이다. 이같은 발견은 단순히 화학에만 그치는 것이 아니라 의학, 생명과학, 공학, 환경 등 다양한 분야에서 새로운 가능성을 열어젖혔다.

석차옥 서울대학교 화학과 교수는 "생명현상을 기계에 완전히 비유하긴 어렵지만, 기계가 고장나면 그 구조를 보고 어떻게 고칠지 생각할 수 있는 것처럼 단백질 등 생체분자도 비슷하다"며 "구조에 대해 이해하고, 원하는 모양과 성질을 가진 분자를 설계하는 게 필요하다. 알파폴드가 그 구조를 알려주는 거라면, 베이커 교수의 기술은 그 구조를 기반으로 단백질을 설계할 수 있게 하는 것"이라고 설명했다.

이어 "알파폴드의 등장 이후 베이커 교수가 이를 모티브로 '로제타 폴드 디퓨전'이라는 방법으로 분자를 새롭게 설계하는 방법까지 만들어냈다. 로제타 폴드 개발에는 우리나라 학자인 백민경 박사까지 참여하기도 했다"며 "물론 모든 문제를 다 풀어낸 건 아니지만, AI로 그전에 풀지 못했던 문제를 풀게 됐다는 점이 중요하다. 바이오나 신약 개발 등에 큰 영향을 주게 될 것"이라고 덧붙였다.

한편 이날 노벨화학상을 마지막으로 올해 과학 분야 노벨상 수상은 모두 마무리됐다. 노벨생리의학상은 '마이크로RNA(miRNA)'를 발견한 미국의 빅토르 암브로스 박사와 레리 루브쿤 박사가 선정됐고, 노벨물리학상은 AI의 아버지로 불리는 존 홉필드 미국 프린스턴대 교수와 제프리 힌튼 캐나다 토론토대 교수가 수상의 영예를 안았다.

올해 노벨상 시상은 10일 문학상, 11일 평화상, 14일 경제학상으로 모두 마무리될 예정이다.


◎공감언론 뉴시스 hsyhs@newsis.com