자체 TCP 아키텍처에 브로드컴 네트워킹·패키징 기술 결합
2나노·HBM4/4E 기반…하이퍼스케일 AI 추론 시장 공략
[서울=뉴시스]윤정민 기자 = 퓨리오사AI가 브로드컴과 손잡고 차세대 인공지능(AI) 추론 반도체 개발에 나선다. 생성형 AI 경쟁의 무게중심이 모델 학습에서 실제 서비스 구동에 필요한 추론 인프라로 옮겨가는 가운데 양사는 대규모 토큰 처리에 특화한 3세대 AI 가속기를 공동 개발한다는 구상이다.
퓨리오사AI는 브로드컴과 차세대 AI 가속기 개발을 위한 전략적 파트너십을 체결했다고 28일 밝혔다.
이번 협력의 핵심은 퓨리오사AI가 자체 개발한 '텐서축약프로세서(TCP)' 아키텍처를 멀티다이 기반 칩렛 시스템으로 확장하는 것이다. 여러 개의 실리콘 다이를 하나의 고성능 반도체처럼 연결해 연산 성능과 메모리 대역폭, 칩 간 통신 효율을 높이는 방식이다.
양사는 차세대 AI 가속기를 단일 칩 개발에 그치지 않고 AI 컴퓨팅, 네트워킹, 소프트웨어를 아우르는 인프라 플랫폼으로 발전시킨다는 계획이다. 퓨리오사AI의 AI 반도체 아키텍처에 브로드컴의 AI 네트워킹 기술과 고대역폭 이더넷 스위치 기술을 결합해 대규모 AI 추론 클러스터를 지원하는 구조를 만든다는 설명이다.
퓨리오사AI는 이번 협력에 대해 AI 서비스 환경이 빠르게 추론 중심으로 바뀌고 있다는 판단에 따른 것이라고 설명했다. 에이전틱 AI는 사용자의 요청에 한 번 답하는 데 그치지 않고 계획 수립과 도구 호출, 검증, 재시도 과정을 반복한다. 이 과정에서 다수의 추론 호출이 이어지고 토큰 처리량도 크게 늘어난다. 데이터센터 입장에서는 단순 연산 성능뿐 아니라 메모리, 전력 효율, 서버·랙 단위 네트워크 확장성이 핵심 경쟁 요소가 되고 있다.
퓨리오사AI는 2세대 AI 가속기 '레니게이드(RNGD)'를 통해 확보한 데이터센터 추론 경험을 차세대 제품 개발의 기반으로 삼는다. RNGD는 TSMC 5나노 공정과 SK하이닉스 HBM3를 적용한 180W급 PCIe AI 가속기다.
회사에 따르면 RNGD는 대형 엔터프라이즈와 클라우드 환경의 거대언어모델(LLM), 에이전틱 AI 워크로드를 겨냥해 개발됐으며 삼성SDS, LG AI연구원 등 고객 환경에서 검증을 거쳤다. 올해 2만장 양산을 목표로 하고 있다.
3세대 AI 가속기에는 2나노 공정 기반 컴퓨트 다이와 HBM4·HBM4E 메모리가 적용될 예정이다. 브로드컴의 첨단 패키징 기술을 활용해 복수의 다이를 통합하고 이더넷, 고속 스위치 기술을 더해 대규모 AI 클러스터에서 랙 단위 고대역폭 네트워킹을 지원한다.
양사는 차세대 AI 가속기 샘플링을 2028년 상반기에 시작할 계획이다. 퓨리오사AI는 이를 통해 초거대 프론티어 모델과 에이전틱 AI 서비스 확산에 대응하는 하이퍼스케일 AI 추론 인프라 시장을 공략한다는 방침이다.
찰리 카와스 브로드컴 반도체 솔루션 그룹 사장은 "AI 추론 성능은 더 이상 단순 연산 성능만으로 결정되지 않는다"며 "이제는 서버와 랙 간 데이터 재사용, 통신 효율성이 핵심 경쟁력"이라고 말했다.
이어 "퓨리오사AI의 TCP 아키텍처와 브로드컴의 XPU 기술과 IP 플랫폼, 이더넷 스케일업 네트워킹 기술을 결합해 대규모 에이전틱 AI 환경의 핵심 병목을 해결하는 플랫폼을 구축할 것"이라고 밝혔다.
백준호 퓨리오사AI 대표는 "브로드컴의 인프라 역량과 퓨리오사AI의 TCP 아키텍처 및 소프트웨어 스택이 결합되면서 '토큰 팩토리' 시대를 위한 하이퍼스케일 AI 추론 플랫폼을 제공할 수 있게 됐다"며 "양산 중인 RNGD를 통해 아키텍처의 성능과 효율성을 이미 입증한 만큼 차세대 제품에서는 초거대 AI 모델과 하이퍼스케일 에이전틱 AI 환경에서도 업계 최고 수준의 전력당 성능을 구현할 것"이라고 전했다.
◎공감언론 뉴시스 [email protected]
퓨리오사AI는 브로드컴과 차세대 AI 가속기 개발을 위한 전략적 파트너십을 체결했다고 28일 밝혔다.
이번 협력의 핵심은 퓨리오사AI가 자체 개발한 '텐서축약프로세서(TCP)' 아키텍처를 멀티다이 기반 칩렛 시스템으로 확장하는 것이다. 여러 개의 실리콘 다이를 하나의 고성능 반도체처럼 연결해 연산 성능과 메모리 대역폭, 칩 간 통신 효율을 높이는 방식이다.
양사는 차세대 AI 가속기를 단일 칩 개발에 그치지 않고 AI 컴퓨팅, 네트워킹, 소프트웨어를 아우르는 인프라 플랫폼으로 발전시킨다는 계획이다. 퓨리오사AI의 AI 반도체 아키텍처에 브로드컴의 AI 네트워킹 기술과 고대역폭 이더넷 스위치 기술을 결합해 대규모 AI 추론 클러스터를 지원하는 구조를 만든다는 설명이다.
퓨리오사AI는 이번 협력에 대해 AI 서비스 환경이 빠르게 추론 중심으로 바뀌고 있다는 판단에 따른 것이라고 설명했다. 에이전틱 AI는 사용자의 요청에 한 번 답하는 데 그치지 않고 계획 수립과 도구 호출, 검증, 재시도 과정을 반복한다. 이 과정에서 다수의 추론 호출이 이어지고 토큰 처리량도 크게 늘어난다. 데이터센터 입장에서는 단순 연산 성능뿐 아니라 메모리, 전력 효율, 서버·랙 단위 네트워크 확장성이 핵심 경쟁 요소가 되고 있다.
퓨리오사AI는 2세대 AI 가속기 '레니게이드(RNGD)'를 통해 확보한 데이터센터 추론 경험을 차세대 제품 개발의 기반으로 삼는다. RNGD는 TSMC 5나노 공정과 SK하이닉스 HBM3를 적용한 180W급 PCIe AI 가속기다.
회사에 따르면 RNGD는 대형 엔터프라이즈와 클라우드 환경의 거대언어모델(LLM), 에이전틱 AI 워크로드를 겨냥해 개발됐으며 삼성SDS, LG AI연구원 등 고객 환경에서 검증을 거쳤다. 올해 2만장 양산을 목표로 하고 있다.
3세대 AI 가속기에는 2나노 공정 기반 컴퓨트 다이와 HBM4·HBM4E 메모리가 적용될 예정이다. 브로드컴의 첨단 패키징 기술을 활용해 복수의 다이를 통합하고 이더넷, 고속 스위치 기술을 더해 대규모 AI 클러스터에서 랙 단위 고대역폭 네트워킹을 지원한다.
양사는 차세대 AI 가속기 샘플링을 2028년 상반기에 시작할 계획이다. 퓨리오사AI는 이를 통해 초거대 프론티어 모델과 에이전틱 AI 서비스 확산에 대응하는 하이퍼스케일 AI 추론 인프라 시장을 공략한다는 방침이다.
찰리 카와스 브로드컴 반도체 솔루션 그룹 사장은 "AI 추론 성능은 더 이상 단순 연산 성능만으로 결정되지 않는다"며 "이제는 서버와 랙 간 데이터 재사용, 통신 효율성이 핵심 경쟁력"이라고 말했다.
이어 "퓨리오사AI의 TCP 아키텍처와 브로드컴의 XPU 기술과 IP 플랫폼, 이더넷 스케일업 네트워킹 기술을 결합해 대규모 에이전틱 AI 환경의 핵심 병목을 해결하는 플랫폼을 구축할 것"이라고 밝혔다.
백준호 퓨리오사AI 대표는 "브로드컴의 인프라 역량과 퓨리오사AI의 TCP 아키텍처 및 소프트웨어 스택이 결합되면서 '토큰 팩토리' 시대를 위한 하이퍼스케일 AI 추론 플랫폼을 제공할 수 있게 됐다"며 "양산 중인 RNGD를 통해 아키텍처의 성능과 효율성을 이미 입증한 만큼 차세대 제품에서는 초거대 AI 모델과 하이퍼스케일 에이전틱 AI 환경에서도 업계 최고 수준의 전력당 성능을 구현할 것"이라고 전했다.
◎공감언론 뉴시스 [email protected]
