미국 수출제한에도 엔비디아 AI 칩 ‘H100’·‘A100’ 수리 붐…중국서 밀수·정비 시장 급성장

베이징·상하이발— 미국 정부가 수출을 전면 차단한 엔비디아(Nvidia)의 최첨단 인공지능(AI) 그래픽처리장치(GPU)가 중국 시장에 다량 유입되면서, 이를 전문적으로 수리하는 ‘그레이(Gray) 정비 산업’이 급속히 팽창하고 있다.

2025년 7월 25일, 인베스팅닷컴의 보도에 따르면, 중국 기술 허브 선전(深圳)에는 이미 10여 개의 소규모 업체가 H100·A100 GPU를 비롯한 고성능 칩 수리에 뛰어들었으며, ‘존재해서는 안 될 시장’이라는 평가에도 불구하고 월 수백 개 단위의 물량을 소화하고 있다.

두 선전 소재 업체 관계자에 따르면, 이들은 주로 2022년 9월 미국의 수출 규제로 중국 내 공식 판매가 금지된 H100 GPU를 집중적으로 수리한다. H100의 전 세대 제품인 A100 역시 같은 시기에 금수조치 대상이 되었지만, 이미 2년 이상 시중에 풀려 있었던 탓에 고장이 빈번해 병목 현상을 유발하고 있다.

“수요가 정말 폭발적이다.”

15년간 게이밍 GPU를 다뤄 온 한 업체 공동창업자는 2024년 말부터 AI 칩 수리를 시작하자마자 주문이 폭주해 별도 법인을 신설했다고 밝혔다. 그는 한 달 최대 500개의 엔비디아 AI 칩을 수리하며, 256대 서버를 동시에 구동해 고객 데이터센터 환경을 그대로 시뮬레이션하는 테스트룸까지 갖췄다고 설명했다.


미·중 기술 패권 경쟁과 ‘밀수’ 정황1정책·규제

이처럼 수리산업이 급성장한 배경에는 대규모 밀수 가능성이 자리한다. 중국 정부 및 군(軍)이 엔비디아의 금지 칩을 조달했다는 조달 공고가 여러 차례 확인됐으며, 미국 의회는 초당적 법안을 발의해 칩 유통경로를 추적·검증하자는 목소리를 높이고 있다. 도널드 트럼프 전 대통령도 이번 주 해당 방안에 지지를 표명했다.

수리 업체들은 “구매·판매·정비 자체는 중국 법상 불법이 아니지만, 양국 정부의 레이더에 포착되길 꺼린다”며 익명을 요청했다. 실제로 엔비디아는 미국 수출관리규정(Export Administration Regulations)에 따라 중국 내에서 해당 제품을 정식으로 수리하거나 교체품을 제공할 수 없다. 반면 다른 국가에서는 보증기간(통상 3년) 내 결함 시 새 제품으로 교체해 준다.

엔비디아 대변인은 “엔비디아 또는 공식 파트너만이 고객이 필요로 하는 지원·서비스를 제공할 수 있다. 허가되지 않은 하드웨어·소프트웨어·기술지원으로 제한 제품을 운용하는 것은 기술적·경제적으로 모두 ‘출발선에조차 서지 못하는 선택’”이라고 강조했다.


수요 지속 가능성 및 가격 변수

엔비디아는 최근 중국 전용 모델인 H20 판매 허가를 받았으나, 업계는 가격과 성능 측면에서 쉽게 갈아타기 어렵다고 본다. 소식통에 따르면, H20 GPU 8개가 탑재된 한 대의 서버 가격은 100만 위안(약 13만 9,400달러)을 상회할 전망이다. 메모리 대역폭이 개선돼 추론(inference) 작업에는 적합하지만, 대규모 언어모델(LLM) 학습(training)에는 H100이 여전히 우수하다는 평가가 많다.

업계 인사들은 “중국 내 H100·A100 상당수가 이미 수년간 24시간 가동돼 고장률이 치솟고 있다”고 전한다. GPU는 사용 빈도·정비 주기에 따라 통상 2~5년 지나면 주요 부품 교체가 필요하다.

첫 번째 선전 업체는 고장 난 GPU 한 개당 1만~2만 위안(1,400~2,800달러)을, 두 번째 업체는 GPU 원가의 10% 안팎을 수리비로 책정한다. 후자의 경우 과거 GPU 렌털 사업을 하다가 올해 수리로 전환했으며, 월 최대 200개를 처리할 수 있다고 밝혔다.

주요 서비스 영역은 △소프트웨어 지표 테스트 △서버 냉각 팬 교체 △인쇄회로기판(PCB) 수선 △메모리 결함 진단 및 교체 등으로, 불량 부품을 새 부품으로 갈아끼우는 것이 핵심이다.


B200 향한 ‘차세대 밀수’ 움직임

칩 트레이더들에 따르면 밀수 네트워크의 관심은 이제 B200으로 이동하고 있다. B200은 2025년 들어 다른 국가로 대규모 출하가 시작된 엔비디아의 최상위 제품군이다. GPU 8개가 장착된 B200 서버 한 대는 중국 내에서 300만 위안(약 41만 8,000달러) 이상의 프리미엄 가격에 거래된다.


[용어 설명]

GPU(Graphics Processing Unit)는 대량의 병렬 연산을 처리하는 칩으로, 게임 그래픽 렌더링뿐 아니라 AI 모델 학습·추론에 필수적이다. LLM(Large Language Model)은 GPT·Claude와 같이 대규모 텍스트 데이터를 학습해 인간 언어를 생성·분석하는 AI 모델이며, ‘학습’(training)은 모델을 만드는 과정, ‘추론’(inference)은 학습된 모델이 실제로 답변·분석을 수행하는 과정을 뜻한다.


전문가 시각

판매 추적 의무화 법안이 현실화되면, 중국 내 비공식 수리 생태계는 상당한 타격을 받을 가능성이 크다. 하지만 대체제가 제한적이고, 엔비디아가 여전히 사실상 독점적 우위를 유지하는 한 당분간 ‘수리→재가동’ 수요는 지속될 전망이다. 또한 H20·Huawei 제품으로 전환하지 못한 기업 및 연구기관은 차세대 B200 구매를 위해 더 은밀한 루트를 모색할 것이라는 분석도 나온다. 이는 미·중 기술전쟁이 한층 복잡한 ‘유통·서비스’ 전선으로 확장되고 있음을 시사한다.

($1 = 7.1724 위안 기준)