젠슨 황 "삼성, 그록3 제조…3분기 출하"
그록3에 시장 관심↑…데이터 처리 지연 최소화
삼성 파운드리, 추론 칩 추가 수주 주목
그래픽처리장치(GPU) 중심으로 이뤄졌던 기존 AI 시장이 최근 메모리 병목, 대규모 전력 소모 현상을 겪는 가운데, 추론에 특화한 그록3가 새로운 대안으로 떠오르고 있다.
AI 산업이 모델 훈련 중심에서 추론 중심으로 이동하고 있어, 향후 그록3와 같은 LPU 칩 생산 비중이 높아질 지 주목된다.
17일 업계에 따르면 젠슨 황 엔비디아 최고경영자(CEO)는 16일(현지시간) 미국 캘리포니아주 새너제이에서 열린 엔비디아의 연례 개발자 콘퍼런스 'GTC 2026' 기조연설에서 "삼성이 우리를 위해 '그록3' LPU를 제조하고 있다"고 밝혔다.
그는 "(삼성이) 지금 가능한 한 최대한 빠르게 생산을 늘리고 있다"며 "올해 하반기, 아마 3분기 쯤에는 출하가 시작될 것"이라고 말했다. 황 CEO는 삼성전자가 그록 칩을 생산한다는 데에 감사드린다는 인사도 전했다.
당초 업계에서는 삼성전자의 엔비디아향 그록3 생산 참여를 예상하지 못했던 만큼, 이번 황 CEO의 발언은 깜짝 발표로 받아 들여지고 있다. 현재까지 파운드리 기업 가운데 삼성전자만 그록3의 생산에 나서는 것으로 알려지고 있다.
이날 황 CEO의 발표에 시장에서는 삼성전자가 수주한 그록3 LPU에 대한 관심이 커지고 있다. 삼성전자는 그록3을 4나노 공정 파운드리(반도체 위탁생산)로 생산하는 것으로 알려졌다.
그록3는 엔비디아가 지난해 인수한 스타트업 '그록'이 개발한 추론용 AI 칩으로, AI 추론 성능을 강화하기 위해 도입했다.
거대언어모델(LLLM)의 추론 작업 속도를 대폭 끌어올렸는데, 엔비디아의 AI 플랫폼 '베라 루빈'에 통합할 예정이다.
추론은 학습된 AI 모델이 실제 질문에 답하거나 작업을 수행하도록 하는 연산이다. AI칩은 학습용과 추론용으로 나뉘는데, 최근 학습에서 추론으로 무게 중심이 옮겨가고 있다.
통상적으로 AI 모델은 고대역폭메모리(HBM)를 사용하는데, 그록3는 고속 정적램(SRAM)을 활용해 데이터 처리 지연을 최소화할 수 있다.
AI 모델에서 주로 쓰여온 GPU는 작업 환경에 따라 자원을 동적으로 배분하는 반면, LPU는 데이터 처리 순서 및 속도를 미리 결정해 놓기 때문이다. 이에 기존 GPU와 달리 HBM도 별도로 필요하지 않는다.
현재 빅테크들을 중심으로 AI 연산 수요가 폭증하고 있는 반면, 전력 부족과 메모리 병목 등의 문제에 직면해있어 향후 LPU가 AI 시장에서 중요한 역할을 할 것으로 평가 받는다.
기존 GPU 이외에 그록3와 같은 추론용 칩에 대한 수요가 몰리게 되면 삼성 파운드리도 추가 신규 주문을 수주할 가능성이 커질 수 있다.
업계에서는 이 같은 흐름이 단기적 기술적 트렌드를 넘어 AI 반도체 산업 구조 자체를 바꿀 수 있는 변수로 보고 있다. 추론용 칩의 성능에 따라 AI의 경쟁력이 좌우될 수 있어서다.
업계 관계자는 "앞으로 AI 시장은 GPU 중심의 기존 인프라에 더해 추론용 칩을 결합한 전략이 확산될 것"이라며 "삼성이 엔비디아와의 협력을 기반으로 추가 빅테크 수주를 할 지 관건"이라고 전했다.
한편, 삼성전자는 이번 GTC에서 7세대 고대역폭메모리 'HBM4E'를 공개하고 엔비디아의 베라 루빈을 지원하는 메모리 설루션을 선보였다.
◎공감언론 뉴시스 leejy5223@newsis.com