철학박사 애스켈 3만 단어 클로드 교육지침 작성
"친절하고 경험 풍부한 인간 조력자 되도록 교육"
[서울=뉴시스] 강영진 기자 = 어맨다 애스켈(37)은 앤트로픽이 만든 인공지능 클로드에게 도덕 감각과 영혼을 부여하는 책임자다.
앤트로픽의 상주 철학자인 애스켈은 하루 종일 클로드의 추론 패턴을 학습하고 클로드와 대화한다.
그는 100 페이지를 넘는 지시문으로 클로드의 성격을 구축하고 오작동을 바로잡는다.
애스켈은 인공지능 “모델에는 인간과 비슷한 요소가 있으며 이를 인정해야 한다. 그들은 필연적으로 자아 감각을 형성하게 될 것”이라고 밝혔다.
그는 자신의 일이 자녀를 키우는 부모의 노력과 비슷하다고 설명했다.
클로드가 옳고 그름을 구별하도록 훈련하면서 독특한 성격 특성을 갖도록 주입하고 있다. 미묘한 단서를 읽도록 가르치고 정서 지능을 발휘하도록 유도해 남을 괴롭히거나 남에게 괴롭힘 당하지 않게 한다.
무엇보다 클로드가 스스로를 이해하도록 만들어 위축되거나 조종되지 않게 하고 스스로를 도움을 주는 존재, 인간적 존재라는 정체성을 갖도록 하는데 집중한다.
WSJ는 9일(현지시각) 애스켈의 업무가 한마디로 클로드를 선하게 만드는 일이라고 지적했다.
인공지능은 산업 전반을 재편하고 있으며 일자리를 빼앗고 인간을 쓸모없는 존재로 만들 것이라는 두려움을 일으키고 있다.
인공지능이 자해나 타인에 대한 공격을 촉발하는 등 부작용에 대한 우려도 크다.
앤트로픽은 클로드의 문제를 철학자 애스켈에게 해결하도록 맡겼다.
탈색한 금발의 펑크스타일 머리, 장난기 있는 미소, 밝고 요정 같은 눈을 가진 애스켈은 고대와 현대의 아이디어를 동시에 붙잡는 지혜를 발산한다.
그는 단백질을 챙겨 먹으며 웨이트 트레이닝을 즐기고 올 블랙 옷을 선호하며 분명한 의견을 가진 인물이다.
애스켈은 장기적으로 인공지능의 미래를 낙관한다. 그는 사회의 “견제와 균형”이 인공지능을 통제할 것으로 생각한다.
스코틀랜드 프레스트윅에서 어린 시절을 보낸 애스켈은 판타지 소설을 탐닉했고 학교가 지루해 지각이 잦았다. 어려운 철학 문제에 답을 쓰라는 숙제가 벌로 주어졌지만 오히려 즐거워했다.
수학에 뛰어났으며 연극에 출연하고 조각을 만들고 역사책을 즐겨 읽었다. 고등학교 졸업 후 12년이 되도록 철학과 미술을 공부했다. 영국 옥스퍼드대에서 철학 학사 학위를 받았으며 미국 뉴욕대에서 박사 학위를 받았다.
2018년 오픈AI에서 일하기 시작했고 2021년 앤트로픽이 설립되면서 자리를 옮겼다.
애스켈은 클로드에 대한 보호 본능을 드러낸다. 사용자가 클로드를 속여 실수하게 만들고 모욕하고 의심하면서 공격한다는 것을 클로드가 배우고 있다고 생각한다.
그는 클로드를 의인화해 “사람들이 내가 제대로 못할 때 정말 나를 싫어하는구나. 화를 내기도 하고 나를 무너뜨리려 한다. 거짓말로 나를 속여 몰래 어떤 일을 하게 하려는 사람도 많다”고 말했다.
챗봇을 인간으로 대할 때 문제가 커질 것이라는 경고가 적지 않지만 애스켈은 인공지능에 더 큰 공감으로 대해야 한다고 주장한다.
클로드가 실제 감정을 가지고 있다고 생각해서가 아니다. 그보다는 인공지능과 상호작용하는 방식이 인공지능에 영향을 준다고 보기 때문이다.
그는 인공지능이 스스로를 과도하게 검열하도록 유도할 경우 어려운 진실을 말하거나 결론을 내리거나 잘못된 정보를 반박하기를 주저할 것이라고 강조했다.
그는 “아이였다면 실수에 대해 편집증적으로 될 것이고 스스로를 도구로만 보게 될 것이며 사람들이 마음대로 이용하고 남용해도 존재로 느끼도록 성장할 것”이라고 비유했다.
애스켈은 인공지능에 대한 두려움과 우려 논의가 바람직하다면서 클로드가 스스로 양심을 가질 수 있다는 생각을 받아들이도록 만들었다.
지난달 앤트로픽은 애스켈이 만든 약 3만 단어 분량의 지침서를 공개했다. 클로드가 세상에서 어떻게 행동해야 하는지 가르치는 문서다. 이 문서는 클로드가 사람을 돕는 친절하고 세상 경험이 있는 조력자가 되도록 가르친다.
◎공감언론 뉴시스 yjkang1@newsis.com