바이두, 자국산 AI 반도체와 슈퍼컴퓨팅 신제품 공개

바이두(Baidu)인공지능(AI) 반도체 두 종슈퍼컴퓨팅 관련 신제품을 공개하며, 중국 기업에 강력하고 저비용이며 국내에서 통제 가능한 컴퓨팅 파워를 제공하겠다고 밝혔다. 이번 발표는 중국 내 자립형 AI 인프라에 대한 수요가 커지는 가운데 이뤄졌다.

핵심: 바이두는 새 반도체가 중국 기업에 “강력하고 저비용이며, 국내에서 통제 가능한 컴퓨팅“을 제공할 수 있다고 밝혔다.

2025년 11월 13일, 로이터 보도에 따르면, 미국과 중국 간 긴장 고조로 인해 미국산 첨단 AI 칩의 중국 수출이 제한되자, 중국 기업들은 자체 프로세서를 개발하거나 국산 대체재를 모색하는 흐름이 빨라지고 있다. 이번 바이두의 신제품 공개는 이러한 흐름 속에서 국산 AI 컴퓨팅 스택을 강화하려는 시도의 일환으로 해석된다.

바이두 월드(Baidu World) 기술 콘퍼런스에서 회사는 추론에 특화된 칩 M1002026년 초에 출시하고, 훈련과 추론을 모두 지원하는 M3002027년 초에 선보일 계획이라고 밝혔다. M100은 모델이 배운 내용을 실제 서비스에 적용하는 단계에, M300은 모델을 학습시키는 단계와 서비스 운영 단계 모두에 적용될 수 있도록 설계됐다고 설명했다.

주목

훈련(Training)과 추론(Inference)은 AI 개발 전 과정의 양대 축이다. 훈련은 대규모 데이터셋에서 패턴을 학습해 모델을 구축하는 과정이며, 추론은 구축된 모델로 예측을 수행하거나 사용자 요청을 처리하는 단계다. 일반적으로 훈련은 막대한 연산과 메모리 대역폭이 필요하고, 추론은 지연시간(latency)과 비용 효율성이 핵심이다. 바이두의 로드맵은 이 두 수요를 분리·최적화하려는 전략으로 볼 수 있다.

바이두는 2011년부터 자체 칩을 개발해 왔으며, 이날 소위 ‘슈퍼노드(supernode)’ 제품도 두 종을 함께 공개했다. 슈퍼노드는 고속 네트워킹을 이용해 여러 개의 칩을 하나의 대규모 시스템으로 묶어, 단일 칩의 성능 한계를 시스템 아키텍처로 보완하는 접근이다. 이는 대형 언어 모델(LLM)과 멀티모달 모델의 훈련·추론에서 요구되는 수평적 확장(scale-out)을 가능하게 한다.

화웨이(Huawei)도 유사한 형태의 제품을 선보이고 있다. 화웨이의 CloudMatrix 384Ascend 910C 칩 384개를 묶은 시스템으로, 업계 관측통들은 이를 미국 엔비디아의 GB200 NVL72보다 더 강력한 시스템 레벨 제품으로 평가하고 있다. 화웨이는 또한 9월에 향후 수년 내 더 강력한 슈퍼노드를 출시하겠다고 발표한 바 있다.

바이두의 톈치(Tianchi) 256P800 칩 256개로 구성되며, 내년 상반기에 시장에 출시될 예정이다. 같은 P800 칩을 512개로 확장한 고성능 버전내년 하반기에 선보일 계획이라고 회사는 밝혔다. 이들 시스템은 칩 간 상호 연결 성능소프트웨어 스택 최적화가 성능에 큰 영향을 미치는 구성으로, 대규모 모델 훈련·추론 시 클러스터 효율을 좌우한다.

주목

아울러 회사는 자사 대형 언어 모델(LLM) 어니(Ernie)의 신규 버전을 공개했다. 이번 버전은 텍스트 처리뿐 아니라 이미지와 동영상 분석 역량에서도 두드러진다고 회사는 설명했다. 이는 멀티모달 AI로의 확장 추세와 맞물려, 검색·광고·클라우드·기업용 업무 자동화 등 다양한 영역에서 활용될 수 있는 기반을 제공한다.


용어 설명: ‘슈퍼노드’와 시스템 확장성

슈퍼노드(supernode)는 개별 칩의 성능 향상을 넘어, 여러 칩을 촘촘히 연결해 하나의 거대한 연산 자원처럼 동작하도록 설계한 시스템 아키텍처를 의미한다. 핵심은 고대역폭·저지연 네트워킹, 효율적 병렬 처리, 그리고 소프트웨어 스택(컴파일러·프레임워크·스케줄러)의 정교한 최적화다. AI 모델의 크기가 커질수록 단일 칩의 성능만으로는 한계가 나타나기 때문에, 슈퍼노드는 훈련 시간 단축서비스 안정성에 직접적인 영향을 준다.

훈련 vs. 추론의 관점에서는, 훈련은 데이터·연산량이 방대하여 메모리 용량과 통신량이 병목이 되는 반면, 추론지연시간 관리비용 효율이 핵심 과제다. 바이두가 M100(추론)M300(훈련·추론)을 구분해 제시한 것은, 서로 다른 워크로드 특성에 맞춘 차별화된 하드웨어 전략으로 볼 수 있다.※ 일반적 기술 개념 설명


맥락과 의미: ‘국내 통제 가능한 컴퓨팅’의 전략적 함의

미·중 기술 갈등이 고조되면서, 중국 기업은 첨단 AI 칩 조달에 구조적 불확실성을 안고 있다. 이번 바이두의 발표는 자국산 칩슈퍼노드, 그리고 자체 LLM(어니)을 묶어 엔드투엔드 AI 인프라를 강화하려는 시도로 요약된다. 특히 톈치 256/512와 같은 시스템 제품은 칩 단품의 스펙 경쟁을 넘어, 시스템 통합 수준소프트웨어 생태계를 포함한 총체적 경쟁력이 관건임을 시사한다.

경쟁 구도 측면에서, 화웨이의 CloudMatrix 384와 비교 언급은 중국 내 시스템 레벨 경쟁이 이미 고도화 단계에 진입했음을 보여준다. 업계 관측에 따르면 해당 시스템은 미국 엔비디아 GB200 NVL72를 능가하는 평가를 받기도 하는데, 이는 중국업계가 대체·대응 기술을 빠르게 진전시키고 있음을 시사한다. 이러한 환경에서 바이두의 M100·M300 로드맵톈치 256/512국내 통제 가능한 컴퓨팅을 목표로 한 장기 전략의 일환으로, 생태계 파트너와의 소프트웨어 호환성개발자 지원이 실제 성패를 좌우할 가능성이 크다.

한편, 바이두가 어니 LLM의 신규 버전을 통해 텍스트·이미지·동영상을 아우르는 멀티모달 역량을 강조한 점은, 검색·광고, 기업용 자동화, 콘텐츠 제작현업 도메인에 직접 적용 가능한 기능 고도화를 겨냥한 흐름으로 보인다. 이는 모델-하드웨어-시스템을 아우르는 통합 전략에서 상용화 경쟁력을 강화하는 축으로 기능할 수 있다.