미국-중국 AI 컴퓨트 경쟁, 실제로 더 많은 연산능력을 추가하는 쪽은 누구인가

글로벌 AI 경쟁을 둘러싼 통념은 미국은 최첨단 칩은 앞서지만 전력과 인프라가 부족하고, 중국은 전력은 풍부하지만 최첨단 반도체 접근성이 제한적이라는 대비로 요약돼 왔다. 그러나 핵심 질문은 ‘누가 실제로 더 많은 사용 가능한 컴퓨트를 온라인으로 추가하고 있는가’이며, 이에 대한 답은 미국이 압도적 우위라는 분석이 제시됐다다.

2025년 11월 29일, 인베스팅닷컴의 보도에 따르면, 번스타인(Bernstein)의 애널리스트 스테이시 라스곤(Stacy Rasgon)은 이 같은 질문에 대해 “분명히 미국이며, 중국은 크게 뒤처져 있다”고 평가했다다. 라스곤은 단순한 전력 총량이 아니라, 실제 AI 가속에 투입되어 유효 성능을 내는 연산능력(컴퓨트)의 순증을 기준으로 양국을 비교해야 한다고 강조했다다.

라스곤은 “누가 더 많은 사용 가능한 컴퓨트를 추가하느냐가 관건이며, 답은 명백히 미국”이라고 밝혔다다.

번스타인은 미국과 동맹국이 2025년에 FP16 스파스(sparse) 기준으로 25 ZFLOPS 이상의 AI 가속 연산능력을 추가할 것으로 전망했다다. 반면, 중국은 같은 해 <1 ZFLOPS에 그칠 것으로 예상됐다다.

주목

라스곤은 2025년 중국 내 국산 AI 칩 출하가 약 150만 개에 달할 것으로 내다봤다다. 이를 화웨이 ‘Ascend 910B’의 성능(칩당 0.4 PFLOPS)에 준해 환산하면, 약 0.6 ZFLOPS추가 컴퓨트에 해당한다는 계산이다다.

설령 여기에 엔비디아AMD저가형 칩이 중국으로 반입되는 물량을 감안해도, 번스타인은 “또 다른 0.2~0.3 ZFLOPS 수준에 그칠 것으로 추정했다다. 이들을 모두 합산하더라도 중국의 2025년 추가분은 1 ZFLOPS 미만에 머문다는 설명이다다.

이에 비해 번스타인은 미국 및 동맹 시장에서 엔비디아 ‘블랙웰(Blackwell)’400만 개가 칩당 4.5 PFLOPS의 성능을 제공한다고 가정할 때, 18 ZFLOPS의 컴퓨트가 추가된다고 추정했다다. 여기에 TPUASIC 기반 배치까지 포함하면, 라스곤은 “총합은 최소 25 ZFLOPS 이상”이 될 것이라고 덧붙였다다.

“블랙웰 400만 개만으로도 18 ZFLOPS를 더하고, TPU·ASIC까지 포함하면 총합은 적어도 25 ZFLOPS” — 번스타인

흥미로운 점은 원시 전력(capacity)만 놓고 보면 2025년 중국이 ‘500GW 초과를 추가해 미국(약 30GW)을 크게 앞설 것으로 보이지만, 그럼에도 데이터센터 실증 투자와 컴퓨트 가용성에서는 미국이 주도권을 유지한다는 점이다다.

주목

데이터센터 건설 지표도 이를 뒷받침한다다. 2024년 기준 중국의 데이터센터 용량 순증3.9GW였던 반면, 미국5.3GW로 더 컸다다. 특히 AI 특화 인프라의 구축 속도에서는 격차가 더 벌어지고 있다고 번스타인은 분석했다다.


번스타인은 결론적으로, 중국의 칩 수급 제한‘병목’으로 작용해 유효 컴퓨트의 누적을 낮은 수준에 묶어두고 있다고 지적했다다. 빠른 성장세가 이어지더라도 중국이 2030년까지 도달 가능한 수준은 약 19 ZFLOPS로, 이는 미국이 현재 확보 중인 수준에도 미치지 못한다는 평가다다.

“중국은 칩 캐파의 제약으로 유효 컴퓨트 축적의 병목에 직면해 있다. 성장하더라도 2030년 ~19 ZFLOPS 수준으로, 미국의 현 수준에 못 미친다.” — 번스타인


용어 설명과 맥락

FLOPS: 초당 부동소수점 연산 횟수다. PFLOPS페타FLOPS로 1015 FLOPS, ZFLOPS제타FLOPS로 1021 FLOPS 규모다. 본문 수치는 대규모 모델 학습·추론 성능을 가늠하는 지표로 쓰인다다.

FP16 sparse: 16비트 부동소수점 정밀도와 희소성(sparsity) 가정을 결합해 실효 처리량을 높여 환산하는 관행을 말한다다. 최근 AI 칩은 구조적 스파스를 활용해 이론상 처리량을 배가시키는 최적화를 제공한다다.

TPU(Tensor Processing Unit), ASIC(Application-Specific Integrated Circuit): 특정 연산(예: 행렬 곱셈)에 최적화된 가속기로, GPU 외 대안으로서 클라우드 사업자들이 대규모로 배치한다다.

데이터센터 용량(GW): 전력 공급 가능 총량이 아닌, 센터의 가동·확장 능력을 가늠하는 지표다. 원시 전력이 크더라도 칩·냉각·네트워킹 등 핵심 요소가 확보되지 않으면 유효 컴퓨트로 전환되기 어렵다다.


분석: ‘전력 총량’이 아닌 ‘유효 컴퓨트’의 경쟁

이번 번스타인 분석의 골자는 전력 인프라의 총량 우위가 곧바로 AI 성능 우위로 연결되지는 않는다는 점이다다. 실제 AI 워크로드의 성능은 최첨단 칩의 수량·성능뿐 아니라, 고대역폭 메모리, 초저지연 네트워킹, 소프트웨어 최적화, 랙 단위 집적 설계가 맞물려야 극대화된다다. 미국·동맹권의 2025년 ‘≥25 ZFLOPS’ 증설 전망은 바로 이 전체 스택에서의 동시 투자와 공급망 결실을 반영한다 볼 수 있다다.

반대로 중국칩 접근성의 제약으로 노드 전환 속도규모의 경제 측면에서 병목이 발생한 것으로 해석된다다. 2025년 국산 칩 150만 개 출하와 엔비디아·AMD 저가형 칩 유입을 더해도 1 ZFLOPS 미만이라는 추정치는, AI 특화 데이터센터 대형화의 관점에서 여전히 격차가 크다는 메시지를 준다다. 이는 단지 칩 수량의 문제가 아니라, 서버 보드·인터커넥트·전력/냉각 인프라의 동시 확보라는 복합 과제를 시사한다다.

또한 2024년 미국 5.3GW vs 중국 3.9GW의 데이터센터 증설 격차는 AI 목적의 시설로 갈수록 더 벌어진다는 설명과 궤를 같이한다다. 블랙웰과 같은 차세대 가속기의 랙 밀도, 전력 효율, 상호연결 요구를 충족하려면, 전력 용량의 절대치보다 AI에 최적화된 데이터센터 아키텍처의 조달·배치가 관건이기 때문이다다.


핵심 수치 한눈에 보기

— 2025년 미국·동맹권 추가: ≥25 ZFLOPS (FP16 sparse 기준)
— 2025년 중국 추가: <1 ZFLOPS (국산 0.6 ZFLOPS + 외산 저가형 0.2~0.3 ZFLOPS)
— 블랙웰 400만 개 × 4.5 PFLOPS = 18 ZFLOPS (미국·동맹권)
— 2024년 데이터센터 순증: 미국 5.3GW, 중국 3.9GW
— 2025년 전력 용량 증설: 중국 >500GW vs 미국 ~30GW


전망과 함의

번스타인의 추정대로라면, 컴퓨트 총량의 선형 확장미국·동맹권이 주도하고, 중국2030년경 19 ZFLOPS로 추격하더라도 현 시점의 미국 수준에 미달할 수 있다다. 이는 대규모 AI 모델 개발·배치에서의 기회와 리더십이 연산능력 축적의 속도에 의해 계속 재편될 수 있음을 시사한다다. 결과적으로, 칩 공급망, 데이터센터 아키텍처, 소프트웨어 최적화를 통합적으로 확장하는 주체가 차세대 AI 경쟁에서 유리한 위치를 점할 가능성이 크다다.