AI 칩 전쟁의 새로운 국면
인공지능 붐의 시대에 엔비디아는 강력한 그래픽 처리 장치(GPU)를 공급하며 AI 업계에서 독보적인 위치를 차지해왔다. 그러나 이제 AI 경쟁의 새로운 국면이 열리고 있으며, 이는 바로 엔비디아의 가장 큰 고객들에 의해 시작되고 있다.
2025년 6월 18일, ARPU의 보도에 따르면 아마존 웹 서비스(AWS)는 자사의 Graviton4 중앙처리장치(CPU)의 업그레이드 계획을 상세히 발표했으며, 주요 AI 연구소인 앤트로픽의 모델에 힘을 실어주고 있는 맞춤형 Trainium AI 칩의 성공을 강조했다. 이 움직임은 엔비디아의 하드웨어에 대한 높은 비용과 공급 제약에 대한 반발로, 구글, 마이크로소프트 및 메타와 같은 기술 대기업들이 수십억 달러를 투입하여 자체 전문화된 칩을 설계하고 있다. 이러한 변화는 엔비디아의 완전한 지배가 균열되고 있는지에 대한 근본적인 질문을 제기한다.
엔비디아의 AI 칩 지배 이유는?
엔비디아의 지배력은 단순히 빠른 하드웨어를 갖추고 있는 것 이상이다. 거의 20년간 구축된 깊이 있는 생태계 덕분이다. 회사의 CUDA 소프트웨어 플랫폼은 AI 개발의 사실상 표준이며, 수백만 명의 개발자들이 엔비디아의 GPU를 쉽게 활용할 수 있게 하는 독점 프로그래밍 모델이다.
소프트웨어를 넘어, 엔비디아는 인터커넥트 기술에서도 강점을 가지고 있다. 엔비디아의 NVLink 시스템은 수천 개의 GPU를 연결하여, 단일 거대한 AI 브레인으로 작동하게 할 수 있다. 이는 현재 AI 시대를 정의하는 대규모 기반 모델을 훈련하는 데 필수적이다. 이러한 우수한 하드웨어, 잠긴 소프트웨어 생태계, 시스템 수준의 혁신을 결합함으로써 엔비디아는 AI 데이터 센터 GPU 시장의 약 90%를 점유하고 있다.
고객이 자체 칩을 만드는 이유는?
높은 마진은 빅테크 기업들을 반란으로 이끄는 요인이다. 아마존, 구글, 마이크로소프트와 같은 하이퍼스케일러들은 매년 수십억 달러를 엔비디아 GPU에 지출하고 있으며, 이는 이른바 “엔비디아 세금”을 부담하는 셈이다. 고객들은 자신들의 워크로드에 맞게 칩을 설계하고, 엔비디아 판매를 우회함으로써 비용 성능을 향상시키려 하고 있다.
아마존의 전략은 이러한 트렌드의 대표적인 예다. AWS는 AI 훈련을 위한 엔비디아 GPU의 직접적인 대안으로 Trainium 칩을 개발해왔다. 이제 회사는 이를 대규모로 배치하고 있으며, 파트너인 앤트로픽과의 협력을 통해 40만 개 이상의 맞춤형 칩을 하나의 클러스터에 적용하고 있다. AWS 경영진은 엔비디아의 최신 Blackwell 칩이 성능 면에서 우위에 있음을 인정하지만, Trainium 칩이 더 나은 가격 성능을 제공한다고 주장한다.
엔비디아를 도전하는 다른 회사들은 누구인가?
엔비디아는 자사 고객뿐만 아니라 기존의 경쟁자들과 혁신적인 스타트업으로부터도 위협을 받고 있다. 그중에서도 AMD는 자사의 MI300 시리즈 칩을 통해 뛰어난 메모리 사양을 자랑하지만, 현실적인 성능에서는 다소 뒤처지고 있다.
한편, 신생 스타트업들은 급진적인 새로운 구조로 문제에 도전하고 있다. 예를 들면, 와퍼스케일 칩으로 유명한 Cerebras Systems와 초고속 추론을 위한 전문 칩을 개발 중인 Groq 등이 있다.
소프트웨어와 알고리즘으로 고착 상태를 탈출할 수 있을까?
하드웨어에 대한 위협은 소프트웨어와 AI 연구의 큰 변화에 의해 더욱 복잡해진다. CUDA가 강력한 보호막 역할을 해왔지만, 새로운 고수준 프로그래밍 프레임워크는 AI 코드를 한 번 작성하면 여러 종류의 칩에서 효율적으로 실행할 수 있도록 추상화시킨다. 이는 C++와 같은 더 유연한 고수준 언어로의 역사적인 이동을 반영하는 트렌드로, 결국에는 기본 프로세서의 중요성을 덜하게 만들고 있다.
마이크로소프트 CEO 사티아 나델라는 “AI가 저렴해짐에 따라 광범위하게 사용될 것이며, 이는 모든 종류의 컴퓨팅 인프라에 대한 수요를 더욱 증가시킬 것이다”라고 언급했다.