[심층분석] 인피니틱스(INFINITIX) COMPUTEX 2026 'AI-Stack' 전격 공개: HBM 의존도를 낮추는 이기종 스케줄링과 'AI 클라우드 경제'의 서막
2026-05-27T00:03:21.498Z
![]()
[심층분석] 인피니틱스(INFINITIX) COMPUTEX 2026 'AI-Stack' 전격 공개: HBM 의존도를 낮추는 이기종 스케줄링과 'AI 클라우드 경제'의 서막
도입
글로벌 인공지능 산업의 패러다임이 다시 한번 중대한 변곡점을 맞이하고 있습니다. 과거의 AI 인프라 경쟁이 단순히 가장 빠른 칩을 확보하고 대규모 언어 모델을 선점하는 하드웨어 및 모델 중심의 양상을 띠었다면, 현재의 핵심 경쟁력은 확보한 컴퓨팅 자원을 얼마나 유연하게 통제하고 실질적인 수익으로 전환할 수 있는지에 대한 소프트웨어 역량으로 이동하고 있습니다. 막대한 자본이 투입된 데이터센터들이 수익성 악화라는 거대한 벽에 부딪히면서, 자원의 파편화를 막고 운영 효율을 극대화하는 오케스트레이션 기술이 그 어느 때보다 중요해졌습니다.
이러한 산업적 요구가 최고조에 달한 가운데, 대만의 엔터프라이즈 이기종 컴퓨팅 리소스 관리 및 AI 인프라 솔루션 전문 기업 인피니틱스(INFINITIX)가 COMPUTEX 2026에서 전격 공개한 청사진은 글로벌 IT 업계의 이목을 집중시켰습니다. 'AI 인프라에서 AI 클라우드 경제로'라는 강력한 슬로건 아래 발표된 인피니틱스의 'AI-Stack' 및 'ixCSP' 이중 플랫폼은 단순한 시스템 관리 도구를 넘어섭니다. 이번 분석에서는 고질적인 고대역폭 메모리(HBM) 의존도를 낮추는 혁신적인 이기종 스케줄링 기술의 원리와, 유휴 AI 자산을 상용화하여 새로운 수익 창출의 길을 여는 클라우드 경제 아키텍처에 대해 심층적으로 다루고자 합니다.
배경: AI 인프라의 역설과 총소유비용 위기
가트너의 시장 분석에 따르면 2026년 글로벌 AI 관련 지출 규모는 전년 대비 44% 폭발적으로 증가하여 약 2조 5,200억 달러에 달할 것으로 전망됩니다. 특히 2026년은 AI 모델의 학습 수요를 넘어서 실생활과 산업 전반에 AI를 적용하는 추론 수요가 급증하는 시기로, 기업들의 AI 도입이 본격적인 대규모 상용화 및 수익화 단계로 진입했음을 의미합니다.
그러나 역설적이게도 막대한 자본 투자를 단행한 대부분의 기업과 데이터센터는 심각한 자원 활용의 비효율성에 직면해 있습니다. 실제 엔터프라이즈 환경에서 고가에 도입된 GPU의 실제 활용률은 빈번하게 30% 미만을 맴돌고 있으며, 다양한 부서와 프로젝트 간의 자원 파편화로 인해 체감되는 인프라 부족 현상은 날로 심화되고 있습니다. 더불어 최신 거대 AI 모델을 구동하기 위해서는 엄청난 용량의 메모리가 요구되는데, 이를 충족하기 위해 막대한 비용이 드는 HBM 탑재 하이엔드 GPU를 지속적으로 증설하는 기존의 방식은 총소유비용(TCO) 측면에서 이미 한계점에 도달했습니다.
기업들은 이제 단순히 GPU의 보유 대수를 늘리는 스펙 경쟁을 멈추고, 보유한 유휴 컴퓨팅 자원의 활용도를 기술적으로 극대화하며 운영 비용을 획기적으로 절감해야 하는 생존의 기로에 섰습니다. COMPUTEX 2026에서 인피니틱스 웨인 첸 최고경영자가 시장의 승자는 GPU 보유량이 아니라 이를 지속 가능한 수익으로 전환하는 기업이 될 것이라고 역설한 배경도 바로 이러한 위기의식에 기반합니다.
핵심 분석: 3계층 아키텍처와 기술적 혁신
이번 전시에서 인피니틱스는 하드웨어의 단순한 집합을 넘어 경제적 가치를 창출하는 '컴퓨팅 경제' 3계층 아키텍처를 새롭게 선보였습니다. 이는 컴퓨팅 인프라의 물리적 제어를 담당하는 AI 인프라 계층, AI 모델의 학습 및 실시간 추론을 관장하는 AI 플랫폼 계층, 그리고 최종적으로 컴퓨팅 리소스의 서비스화 및 상용화 운영을 전담하는 AI 클라우드 경제 계층으로 유기적으로 구성됩니다. 이 거대한 아키텍처를 실제적으로 구동하는 핵심 동력은 바로 쿠버네티스 네이티브 플랫폼인 AI-Stack과, 글로벌 낸드 컨트롤러 선도기업 파이슨(Phison)이 제공하는 aiDAPTIV+ 기술의 전략적 결합입니다.
AI-Stack은 단일 벤더의 생태계에 종속되지 않고 NVIDIA, AMD의 GPU는 물론 NPU에 이르기까지 다양한 이기종 컴퓨팅 리소스를 단일 관리 체계에서 통합 제어할 수 있는 엔터프라이즈 인프라 관리 플랫폼입니다. 사용자는 직관적으로 시각화된 대시보드를 통해 멀티 테넌트 관리, 크로스 노드 컴퓨팅, GPU의 동적 분할 및 통합 기능을 사용할 수 있으며, 텐서플로우나 파이토치, Slurm과 같은 주류 AI 개발 프레임워크와 네이티브 수준으로 연동하여 개발 환경의 복잡성을 획기적으로 낮춥니다.
이 플랫폼의 진정한 가치이자 기술적 차별점은 인피니틱스가 독자적으로 개발한 핵심 기술인 코어 타입 인식 스케줄러(CTAs Scheduler)에서 폭발적으로 발현됩니다. 기존의 인프라 스케줄러들이 GPU를 단일한 연산 블록으로 취급하여 작업의 병목을 유발했던 반면, CTAs는 유입되는 작업 부하의 특성을 정밀하게 분석하여 GPU 내부의 CUDA 코어 워크로드와 Tensor 코어 워크로드를 철저히 분리하고 매핑합니다. 이를 통해 단일 GPU 칩셋 내에서도 서로 다른 성격의 다중 연산 작업을 동시에 병렬로 실행할 수 있게 됨으로써, 30% 수준에 머물던 GPU 활용률을 90% 이상으로 대폭 끌어올려 유휴 리소스와 연산 낭비가 전혀 없는 제로 아이들, 제로 웨이스트 컴퓨팅 생태계를 완성합니다.
더 나아가 업계의 비상한 관심을 모은 것은 파이슨의 aiDAPTIV+ 기술과의 통합을 통해 HBM 한계를 돌파한 기술적 성취입니다. 이 솔루션은 고속 NVMe SSD를 활용하여 GPU의 가상 메모리 용량을 동적으로 확장함으로써 AI 컴퓨팅 아키텍처의 스토리지 계층을 직접적으로 연산 계층과 통합합니다. 기업들은 이제 수천만 원에 달하는 HBM 기반 하이엔드 GPU를 전량 구매하는 극단적인 투자 없이도 대규모 언어 모델의 학습과 복잡한 추론 배포를 유연하게 수행할 수 있습니다. AI-Stack은 작업의 중요도와 지연 시간 요구사항에 따라 하이엔드 GPU와 SSD 확장 메모리 리소스를 지능적으로 교차 할당하여 성능 저하를 방지하면서도 총소유비용을 혁신적으로 절감합니다.
산업적 파급 효과: ixCSP와 AI 클라우드 경제의 도래
AI-Stack이 하드웨어 자원 관리의 효율화를 이룩하는 기술적 토대라면, 이를 실질적인 재무적 가치와 수익으로 치환하는 강력한 엔진은 ixCSP(AI 클라우드 서비스 플랫폼)입니다. ixCSP는 기업, 통신사, 그리고 대형 데이터센터가 보유하고 있는 막대한 유휴 GPU 자산을 즉각적으로 과금 및 운영이 가능한 독립적인 AI 클라우드 서비스로 신속하게 전환해 주는 상용화 플랫폼입니다.
이 플랫폼은 높은 호환성의 AI 게이트웨이, 정밀한 과금을 지원하는 BOSS 빌링 시스템, 그리고 AI-Stack의 리소스 관리 엔진이 삼위일체로 결합된 3계층 아키텍처를 채택하고 있습니다. 이를 통해 도입 기업은 막대한 자본 비용이 투입된 GPU 인프라를 단순한 비용 소모처에서 벗어나 지속 가능한 수익 창출의 원천으로 완벽하게 탈바꿈시킬 수 있습니다. 특히 서비스형 GPU(GaaS), 서비스형 모델(MaaS), 서비스형 토큰(TaaS)과 같은 다변화된 현대적 클라우드 비즈니스 모델의 즉각적인 배포를 전면적으로 지원하여 시장 수요에 기민하게 대응할 수 있는 역량을 부여합니다.
최근 글로벌 AI 서비스의 과금 패러다임이 기존의 획일적인 정액제 구독 모델에서 실제 사용한 토큰의 양에 따라 비용을 지불하는 토큰 기반 경제로 급격히 진화하고 있습니다. 이러한 시장의 전환기에 발맞춰 ixCSP는 세밀한 토큰 트래픽 관리 기능과 실시간 추론 효율성 분석, 그리고 정교한 클라우드 비용 최적화(FinOps) 도구를 포괄적으로 제공함으로써 차세대 클라우드 서비스 사업자들에게 독보적인 비즈니스 경쟁력을 선사합니다.
향후 전망 및 시장의 변화
인피니틱스의 이번 대규모 발표는 단순히 완성도 높은 소프트웨어 솔루션 한 쌍의 등장을 넘어, 컴퓨팅 자산을 설계하고 운용하는 글로벌 IT 생태계의 근본적인 시각 변화를 의미합니다. 그동안 엔비디아 등 소수의 거대 칩 메이커를 중심으로 집중되어 있던 하드웨어 공급망 지배력이 점차 이를 유기적으로 엮어내고 지능적으로 분배하며 새로운 서비스로 포장하는 소프트웨어 정의 인프라 계층으로 대거 이동할 것입니다.
인피니틱스의 이러한 기술적 우위는 이미 아시아 태평양 전역에서 실질적인 대형 인프라 비즈니스 성과로 구체화되고 있습니다. 대표적으로 글로벌 클라우드 사업자인 헤톤(HeTone)과 전략적 파트너십을 체결하고 태국 방콕에 70MW 규모의 매머드급 AI 엣지 데이터센터를 구축하는 프로젝트를 공식 발표했습니다. 이 데이터센터는 AI-Stack과 ixCSP 플랫폼을 전면적으로 도입하여 방대한 하드웨어 자산을 동남아시아 시장의 폭발적인 클라우드 수요에 맞게 서비스화하는 거대한 실증 사례가 될 것입니다.
뿐만 아니라 인피니틱스는 폭발적으로 성장하는 한국과 일본의 엔터프라이즈 AI 시장을 공략하기 위해 AI EXPO KOREA 2026을 기점으로 한국 공식 지사를 출범시켰으며, 일본 IT 위크(Japan IT Week Spring 2026)에서는 파이슨과 함께 이기종 컴퓨팅 리소스의 탄력적 오케스트레이션 솔루션을 대대적으로 시연하는 등 아시아 전역으로 시장 지배력을 공격적으로 확대하고 있습니다. 파이슨의 aiDAPTIV+와 같은 혁신적인 스토리지 기반 메모리 확장 솔루션이 시장에 안착할수록, 값비싼 HBM 중심의 획일적이고 고비용인 AI 훈련 인프라는 점차 다변화되고 민주화될 것입니다. 이는 곧 막대한 예산 제약으로 인해 AI 전환을 망설이던 수많은 중소 규모의 엔터프라이즈 기업들에게도 자체적인 대규모 언어 모델을 튜닝하고 상용화할 수 있는 기회의 문이 활짝 열리게 됨을 시사합니다.
결론
COMPUTEX 2026 무대에서 인피니틱스가 전 세계에 공개한 AI-Stack과 ixCSP 듀얼 플랫폼은, 폭발적인 AI 산업의 성장 이면에 깊게 드리워져 있던 자원 파편화, 심각한 유휴율, 그리고 감당하기 힘든 인프라 비용이라는 치명적인 맹점을 완벽하게 공략했습니다. CTAs 스케줄러를 통한 GPU 코어 단위의 정밀하고 지능적인 분배, 파이슨 aiDAPTIV+ 기술을 접목한 스토리지 기반의 혁신적인 메모리 확장, 그리고 ixCSP를 통한 다변화된 클라우드 수익 모델의 즉각적인 실현은 엔터프라이즈 AI의 상용화를 가속화할 가장 완벽한 융합 기술입니다. 전 세계의 IT 리더 및 데이터센터 인프라 설계자들은 이제 단순한 컴퓨팅 파워의 양적 확대를 맹목적으로 추구할 것이 아니라, 고도화된 소프트웨어 오케스트레이션을 통해 다가오는 'AI 컴퓨팅 경제'를 어떻게 통제하고 극대화된 수익으로 치환할 것인지에 대한 진지하고 전략적인 재고를 서둘러야 할 시점입니다.
비트베이크에서 광고를 시작해보세요
광고 문의하기