베이징(로이터) — 지난주 개발자 플랫폼에 익명으로 등장해 차세대 모델로 의심받았던 강력한 인공지능(AI) 모델이 중국 스마트폰·전기차 기업인 샤오미에서 개발한 것으로 3월 18일 밝혀졌다. 이 모델의 등장은 한때 스타트업 DeepSeek이 출시 직전 비밀 테스트를 진행하는 것 아니냐는 추측을 촉발한 바 있다.
2026년 3월 18일, 로이터 통신의 보도에 따르면, 지난 해 DeepSeek가 저비용 모델인 DeepSeek-V3와 R1을 공개했을 때 전 세계 기술주가 급락하며 미국 AI 기업들이 막대한 AI 연산 비용을 지불할 필요가 있는지에 대한 논쟁이 일었다. 이후 공개되지 않은 차세대 모델인 DeepSeek-V4에 대한 관심이 지속되어 왔다.
샤오미의 AI 모델 팀인 MiMo는 3월 18일 Hunter Alpha가 “MiMo-V2-Pro의 초기 내부 테스트 빌드”라고 밝혔다. MiMo 팀은 이 모델을 AI 에이전트의 “두뇌(brain)” 역할을 하도록 설계했다고 설명했다. 에이전트(agent)는 챗봇보다 인간의 프롬프트와 감독을 덜 필요로 하면서 복잡한 작업을 실행할 수 있게 해주는 도구이다.
샤오미의 MiMo 팀 책임자인 뤄 푸리(Luo Fuli)는 전 DeepSeek 연구원으로 알려져 있다. 뤄는 소셜미디어(X) 게시물을 통해 “이 변화는 우리가 계획한 조용한 매복(quiet ambush)이 아니다. 채팅(chat)에서 에이전트(agent) 패러다임으로의 전환이 너무 빨리 일어나 심지어 우리조차도 믿기 어려웠다”고 말했다. 그는 또한 “사람들이 왜 우리가 이렇게 빠르게 이동하는지 묻는다. 나는 DeepSeek R1을 만들면서 그 현장을 직접 보았다”고 덧붙였다.
모델의 등장 경로와 이름 — 문제의 무료 모델은 Hunter Alpha라는 이름으로 3월 11일 AI 게이트웨이 플랫폼인 OpenRouter에 개발자 표기 없이 공개됐다. OpenRouter는 여러 AI 모델에 단일 인터페이스로 쿼리를 보낼 수 있게 해 익명으로 테스트를 수행하는 데 자주 사용되는 플랫폼이다. 해당 플랫폼은 이후 이 모델을 “stealth model(스텔스 모델)”로 설명했다.
로이터의 실험 결과와 모델 자체의 응답 — 로이터가 진행한 테스트에서 Hunter Alpha 챗봇은 스스로를 “주로 중국어로 학습된 중국산 AI 모델“이라고 설명했고, 지식의 컷오프(knowledge cutoff)가 2025년 5월까지라고 응답했다. 이는 DeepSeek 자체 챗봇에서 보고된 컷오프와 동일한 시점이다. 그러나 자신의 개발자를 묻는 질문에는 시스템이 신원을 밝히기를 거부하며 “나는 내 이름, 파라미터 규모와 컨텍스트 윈도우 길이만 안다”고 답했다.
모델 사양 — Hunter Alpha의 프로필 페이지는 이 모델을 1조(1,000,000,000,000) 개의 파라미터를 가진 모델이라고 설명한다. 이는 시스템이 언어를 처리하고 응답을 생성하는 방식에 영향을 주는 조정 가능한 값의 대략적인 수량을 의미한다. 또한 이 모델은 최대 100만 토큰(1,000,000 token)의 컨텍스트 윈도우를 광고하고 있는데, 이는 단일 상호작용 동안 모델이 처리하거나 기억할 수 있는 텍스트의 양을 가리킨다.
전문가 반응 — AI 에이전트 시스템을 구축하는 엔지니어 나빌 하움(Nabil Haouam)은 “컨텍스트 윈도우가 100만 토큰에 추론 능력과 무료 접근성이 결합된 조합이 눈에 띄었다”며 “그 정도의 컨텍스트 윈도우를 가진 최첨단 모델 대부분은 대규모에서 실제 비용이 수반된다”고 말했다. 독립적인 AI 벤치마크를 운영하는 우무르 오즈쿨(Umur Ozkul)은 모델의 시기와 광고된 성능을 고려하면 DeepSeek와 연관 지어 추측하는 것은 이해할만하다고 평가했다.
스텔스 테스트와 업계 관행 — 익명 모델 출시 자체는 드문 일이 아니다. OpenRouter와 같은 플랫폼은 개발자들이 새로운 시스템을 편리하게 시험할 수 있게 하며, 이러한 ‘스텔스’ 출시를 통해 편향 없는 피드백을 얻는 것이 업계 관행으로 자리잡았다. 예를 들어 2월에는 Pony Alpha라는 익명의 모델이 OpenRouter에 등장했고, 5일 후 중국기업 Zhipu AI가 자사 GLM-5 시스템의 일부임을 확인한 바 있다.
데이터 수집과 이용 고지 — Hunter Alpha의 프로필 페이지에는 모든 프롬프트와 완성(completion)이 “제공자에 의해 로그되고 모델 개선에 사용될 수 있다”는 고지가 표기되어 있었다. 이는 테스트 목적의 익명 모델 출시에 공통적으로 수반되는 행동이다.
채택과 사용량 — MiMo는 Hunter Alpha가 플랫폼에 등장한 이후 빠르게 채택되어 총 사용량이 1조 토큰을 넘었고 OpenRouter의 리더보드에서 상위에 올랐다고 밝혔다.
기술 용어 해설 — 파라미터(parameter)는 AI 모델 내부의 가중치 값으로, 숫자가 많을수록 모델이 복잡한 패턴을 학습할 수 있는 잠재력이 커지는 것으로 간주된다. 토큰(token)은 모델이 처리하는 텍스트의 최소 단위로, 한 토큰은 대체로 단어의 일부나 짧은 텍스트 조각에 해당한다. 컨텍스트 윈도우(context window)는 모델이 단일 상호작용에서 ‘기억’하고 처리할 수 있는 토큰의 수를 말한다. AI 에이전트(agent)는 단순 질의응답을 넘어 사용자가 지시한 복합 작업을 자율적으로 수행하거나 여러 도구와 상호작용할 수 있는 응용형 시스템을 뜻한다. OpenRouter는 여러 모델에 대한 API 접근을 중개하는 게이트웨이 플랫폼이며, OpenClaw는 중국에서 빠르게 채택되는 오픈소스 에이전트 프레임워크로 다양한 사용자층에서 에이전트 기반 응용을 쉽게 구축하게 한다.
시장·산업적 함의 분석 — 이번 사례는 몇 가지 산업적 의미를 갖는다. 우선, 샤오미와 같은 대형 제조·플랫폼 기업이 고성능 모델을 내부 테스트 단계에서 공개적으로 노출하는 방식은 경쟁 구도를 재편할 가능성이 있다. 지난해 DeepSeek의 저비용 모델 공개가 기술주 전반에 걸쳐 매도 압력을 촉발했던 전례를 고려하면, MiMo-V2-Pro가 상용화될 경우 AI 연산 수요와 관련된 비용 구조, 특히 클라우드 컴퓨팅과 가속기(예: GPU, AI 전용 칩) 수요에 대한 투자자들의 재평가가 촉발될 수 있다.
둘째, 대규모 컨텍스트 윈도우(100만 토큰)를 제공하는 모델의 등장은 애플리케이션 설계자들이 더 긴 대화 이해와 복합 작업 처리에 주목하게 만든다. 이는 검색, 기업용 자동화, 코드 생성, 멀티모달 작업 등 실무 적용 범위를 넓히며, 에지(edge)나 온프레미스(on-premises) 솔루션과 클라우드 기반 모델 간 비용·성능 균형에 영향을 미칠 수 있다.
셋째, 이러한 ‘스텔스’ 테스트와 익명 출시 관행은 규제·품질·책임성 측면에서 논쟁을 재점화할 소지가 있다. 모델이 로그와 데이터를 통해 개선된다는 고지는 투명성 측면에서는 긍정적이나, 개인정보·데이터 사용 동의 문제와 함께 모델의 오용 가능성, 책임소재에 대한 논의도 병행될 전망이다.
향후 시나리오와 전망 — 단기적으로는 Hunter Alpha가 공개된 플랫폼과 사용자 반응에 따라 MiMo의 공개 일정 및 제품화 전략이 결정될 가능성이 크다. 만약 MiMo-V2-Pro가 조속히 상용화되면 유사한 사양을 표방하는 모델을 보유한 경쟁사들은 가격·성능 면에서 재조정을 해야 할 것이다. 중장기적으로는 대형 하드웨어·클라우드 제공업체들이 고컨텍스트 모델을 원활히 서비스하기 위한 인프라 투자에 보다 적극적일 수 있으며, 이는 반도체 수요와 데이터센터 투자를 촉진할 여지가 있다.
결론 — 이번 사건은 AI 생태계에서의 경쟁 구도 변화, 기술적 사양의 상향 평준화, 그리고 테스트·출시 관행에 대한 규범적 논의를 동시에 불러일으킨다. 샤오미의 MiMo 팀이 밝힌 바와 같이 Hunter Alpha는 초기 내부 테스트 빌드였지만, 이미 사용자와 개발자 커뮤니티에서 큰 관심을 모았고 이는 향후 제품 출시와 시장 반응에 중요한 전조가 될 전망이다.
