엔비디아

엔비디아, 대규모 컨텍스트 AI 처리를 위한 루빈 CPX GPU 공개

2025-09-10

엔비디아(NVDA)가 대규모 컨텍스트를 처리하는 애플리케이션에 특화된 새로운 GPU, 루빈 CPX를 선보였습니다. 이 기술은 수백만 토큰 규모의 소프트웨어 코딩이나 생성형 비디오 애플리케이션과 같은 고도의 연산이 필요한 작업을 지원하기 위해 설계되었습니다. 이번 글에서는 루빈 CPX GPU의 주요 특징과 이 기술이 가져올 변화, 그리고 다양한 산업에서의 활용 가능성에 대해 자세히 알아보겠습니다.

엔비디아는 루빈 CPX GPU를 포함한 새로운 플랫폼, 베라 루빈 NVL144 CPX를 함께 공개했습니다. 이 플랫폼은 최신 GPU와 CPU를 결합하여 놀라운 성능을 자랑합니다. 단일 랙에서 8엑사플롭스(Exaflops)의 AI 연산 성능을 제공하며, 100테라바이트(TB)의 고속 메모리와 초당 1.7페타바이트(PB)의 메모리 대역폭을 지원합니다. 이는 기존 시스템과 비교했을 때 엄청난 발전으로, AI 기술의 한계를 한층 더 넓히는 계기가 될 것으로 보입니다.

이 새로운 플랫폼은 이전 세대 시스템인 GB300 NVL72보다 AI 성능이 약 7.5배 향상되었다고 합니다. 루빈 CPX GPU 자체는 NVFP4 정밀도로 최대 30페타플롭스(Petaflops)의 연산 성능을 제공하며, 128GB의 GDDR7 메모리를 탑재하고 있습니다. 이러한 사양은 대규모 데이터 처리가 필수적인 AI 모델을 구동하는 데 최적화되어 있습니다. 특히, 수백만 토큰 단위의 방대한 데이터를 한 번에 처리하며 모델이 복잡한 추론을 수행할 수 있도록 돕는 것이 이 GPU의 가장 큰 강점입니다.

루빈 CPX는 AI 기술의 새로운 지평을 여는 도구로 평가받고 있습니다. 이 기술은 그래픽과 물리적 AI를 혁신했던 기존 기술을 넘어, 대규모 컨텍스트 AI에 특화된 최초의 GPU로 자리 잡을 가능성이 큽니다. 예를 들어, 비디오 애플리케이션에서는 1시간 분량의 콘텐츠를 처리하기 위해 최대 100만 토큰을 다룰 수 있는 능력을 갖추고 있습니다. 또한, 비디오 디코더와 인코더를 통합하여 긴 컨텍스트 추론 처리를 지원하는 점도 주목할 만합니다. 이는 비디오 콘텐츠 제작이나 분석 작업에서 혁신적인 변화를 가져올 것으로 기대됩니다.

이 기술은 이미 여러 기업의 관심을 끌고 있습니다. 일부 기업은 루빈 CPX를 활용해 코드 생성 작업을 개선하려는 계획을 세우고 있으며, 다른 기업들은 비디오 생성 워크플로우에 이 기술을 적용할 방안을 모색 중입니다. 또한, AI 연구 분야에서도 이 기술을 통해 1억 토큰 규모의 컨텍스트 창을 가진 기반 모델을 개발하려는 움직임이 있습니다. 이처럼 다양한 산업에서 루빈 CPX의 잠재력을 탐구하는 시도가 이어지고 있어, 앞으로의 활용 사례가 더욱 기대됩니다.

엔비디아는 이 플랫폼이 기업들에게 큰 경제적 가치를 창출할 수 있을 것이라고 전망하고 있습니다. 구체적으로, 1억 달러를 투자할 때마다 약 50억 달러 규모의 토큰 수익을 창출할 수 있다는 예측이 나오고 있습니다. 이는 AI 기술이 단순히 기술적 혁신을 넘어, 실질적인 비즈니스 성과로 이어질 수 있음을 보여주는 사례입니다. 물론 이러한 전망이 현실화되기 위해서는 기술의 안정성과 시장 수용도가 중요한 변수로 작용할 것입니다.

루빈 CPX는 2026년 말경에 정식 출시될 예정입니다. AI 기술이 점점 더 많은 분야에서 핵심적인 역할을 맡고 있는 가운데, 이 새로운 GPU가 시장에 어떤 영향을 미칠지 귀추가 주목됩니다. 대규모 데이터 처리가 필요한 AI 애플리케이션의 수요가 계속 증가하는 상황에서, 루빈 CPX는 기술 혁신의 선두주자로 자리 잡을 가능성이 높아 보입니다. 앞으로 이 기술이 어떻게 발전하고, 어떤 새로운 기회를 창출할지 지켜보는 것도 흥미로운 일이 될 것입니다.

다른 뉴스도 있어요!

이런 주제는 어떠세요?