화웨이, 4분기 세계 최고 성능 ‘Atlas 950’ 슈퍼컴퓨팅 노드 출시 예고

[상하이] 중국 정보통신장비 기업 화웨이 테크놀로지스가 2025년 4분기에 ‘Atlas 950’이라는 새로운 슈퍼컴퓨팅 노드를 선보일 계획이라고 밝혔다. 이 시스템은 현존 전 세계에서 가장 높은 단일 노드 연산 성능을 목표로 설계됐다.

2025년 9월 18일, 로이터 통신의 보도에 따르면 에릭 쉬(Eric Xu) 화웨이 부회장이자 순환 의장은 중국 현지 매체 차이나스타마켓(China Star Market)과의 인터뷰를 통해 해당 계획을 공개했다. 그는 같은 자리에서 Atlas 950의 차세대 모델인 ‘Atlas 960’을 2027년 4분기에 출시하겠다는 로드맵도 발표했다.

쉬 부회장은 “Atlas 950은 최대 8,192개의 Ascend 칩을, Atlas 960은 15,488개의 Ascend 칩을 각각 지원할 수 있다”면서 “카드 수(card count), 총 연산력(total compute), 메모리 용량(memory capacity), 그리고 상호연결 대역폭(interconnect bandwidth) 등 여러 핵심 지표에서 업계 최고 수준을 달성했다”고 강조했다.

주목

Ascend 칩, 무엇이 다를까?

화웨이 Ascend 시리즈는 인공지능(AI) 연산에 최적화된 화웨이 자체 설계의 전용 반도체다. GPU(그래픽처리장치) 기반 AI 가속기와 달리, AI 추론과 학습에 요구되는 텐서·매트릭스 연산을 전용 아키텍처 수준에서 처리한다. 화웨이는 이를 통해 전력 효율, 처리 지연(latency), 대규모 파라미터 모델 학습 속도 등에서 경쟁력을 확보했다고 설명한다.¹

최근 중국 당국은 자국 기업들에게 엔비디아(Nvidia) GPU를 대체할 수 있는 국산 솔루션을 우선 검토·도입하라는 가이드라인을 제시했다. Ascend 칩은 이러한 정책 기조 속에서 가장 주목받는 후보 중 하나로 꼽힌다.

“중국 기업들은 이제 자체 생태계를 구축해야 한다. Ascend는 그 선봉에 설 것” — 에릭 쉬, 화웨이 부회장

제품 로드맵 및 기술 사양

Atlas 950·960 노드는 화웨이 CANN(Compute Architecture for Neural Networks) 소프트웨어 스택과 완전 호환되며, 대규모 언어모델(LLM) 및 고성능컴퓨팅(HPC) 워크로드를 동시에 지원하도록 설계됐다. 화웨이는 구체적인 FLOPS(부동소수점 연산 초당 횟수) 수치는 공개하지 않았지만, 업계에서는 수 엑사FLOPS(ExaFLOPS)급 처리 성능이 목표일 것으로 추정한다.

또한 Atlas 시리즈에는 화웨이 자체 고속 인터커넥트 기술이 적용돼 노드 간 대기시간(latency)을 최소화한다. 이는 GPU 클러스터 대비 동시성(concurrency) 확장에서 이점을 제공한다는 설명이다.

주목

시장 전망과 업계 의미

이번 발표는 미국의 수출 통제 강화로 첨단 반도체·GPU 수입이 어려워진 중국 AI·클라우드 업체들에 중요한 선택지를 제공한다. 특히 중국 내 생성형 AI 모델 개발 경쟁이 가속화되는 상황에서, 화웨이는 자체 하드웨어·소프트웨어 생태계를 앞세워 ‘국산화’ 기조를 더욱 공고히 하고 있다.

전문가 분석에 따르면, Ascend 기반 시스템은 GPU 대비 소프트웨어 호환성, 개발자 생태계, 커뮤니티 지원에서 여전히 과제가 남아 있다. 그러나 중국 정부의 정책적 지원과 화웨이의 공격적 투자가 맞물린다면, 2027년 Atlas 960 출시 즈음에는 대규모 퍼블릭·프라이빗 클라우드 영역에서 실질적 우위를 확보할 가능성도 제기된다.

국제 시장에서는 미·중 기술 패권 경쟁이 장기화되면서, 화웨이의 슈퍼컴퓨팅 노드가 글로벌 공급망을 어떻게 재편할지에 대한 관심도 커지고 있다. 한편, 엔비디아는 AI 전용 GPU ‘H100’ 및 차세대 ‘GH200’ 등으로 초거대 모델 학습 수요를 견인하고 있으며, 양사 간 기술 격차와 시장 지배력 경쟁이 본격화될 전망이다.

기자 관점 — 추가 통찰

필자는 화웨이가 대규모 AI·HPC 시장에서 ‘완전 통합형 솔루션’ 전략을 내세우고 있다고 평가한다. 칩, 시스템, 인터커넥트, 소프트웨어 스택을 수직 계열화함으로써 공급망 불확실성에 대응하고, 고객사에게 엔드투엔드(End-to-End) 경험을 제공하려는 의도가 분명하다.

또한 8,000개가 넘는 칩을 단일 노드에 수용하는 구조는 냉각·전력 효율·결함 허용성(fault tolerance) 측면에서 새로운 공학적 도전을 요구한다. 화웨이가 이를 어떻게 해결할지, 그리고 실제 납품 시점에 어떤 성능 데이터를 공개할지가 기술 커뮤니티의 주요 관심사가 될 것이다.

결론적으로, Atlas 950·960 출시는 중국의 AI 인프라 자립도 향상과 글로벌 슈퍼컴퓨팅 지형 변화라는 두 개의 축에서 중요한 ‘분수령’이 될 가능성이 크다.