중국 AI 모델, 큰 진전이었지만 난항도 함께한 한 주

중국의 대형 기술기업들이 최근 공개한 인공지능(AI) 모델들이 영상 생성과 로보틱스 분야에서 의미 있는 진전을 보였지만, 동시다발적인 문제와 규제·윤리적 논란도 드러났다는 평가가 나오고 있다. 알리바바, 바이트댄스, 콰이쇼우 등 중국 기업들이 이번 주에 발표한 신형 모델들은 미국 기업들이 개발 중인 솔루션과 정면으로 경쟁하는 모습을 보였다.

2026년 2월 14일, CNBC의 보도에 따르면 이번 주 중국 기업들의 AI 모델 공개는 비디오 생성(video generation) 기술과 로봇 제어(embodied intelligence) 기술에서 특히 눈에 띄는 성과를 보였으며, 동시에 개인정보·음성 합성 등 윤리적·정책적 이슈를 유발했다.

Alibaba AI at conference


알리바바(RynnBrain)

알리바바의 연구조직 DAMO 아카데미는 이번 주 RynnBrain이라는 로보틱스용 AI 모델을 공개했다. RynnBrain은 로봇이 물리적 환경을 이해하고 사물을 식별해 상호작용할 수 있도록 설계된 모델이다. 공개된 데모 영상에서는 집게 손을 가진 로봇이 오렌지를 세고 집어 바구니에 넣는 장면과 냉장고에서 우유를 꺼내는 장면이 시연됐다.

로보틱스 분야에서는 NvidiaGoogle 등도 유사한 모델을 개발 중이며, RynnBrain은 이들과 직접 경쟁하는 위치에 놓였다. Hugging Face의 연구원 Adina Yakefu는 CNBC에 “

주목할 만한 혁신 중 하나는 내장된 시간·공간 인식(time and space awareness) 기능이다. 로봇이 단순히 즉시 입력에 반응하는 것이 아니라 사건이 언제, 어디서 발생했는지를 기억하고 작업 진척을 추적하며 다중 단계 작업을 지속할 수 있다. 이는 복잡한 실제 환경에서 더 신뢰할 수 있고 일관된 행동을 가능하게 한다

“고 설명했다.

설명: 로봇이 환경의 시공간 정보를 기억하고 활용하는 능력은 복잡한 작업 수행에 필수적이다. 이 기능이 향상되면 창고·물류, 제조, 가정용 서비스 로봇 등 상업적 적용 범위가 넓어질 수 있다.


바이트댄스(Seedance 2.0)

바이트댄스는 텍스트 프롬프트만으로도 현실감 있는 영상을 생성할 수 있는 비디오 생성 모델 Seedance 2.0을 공개했다. 프롬프트에는 기존 영상이나 이미지도 포함시킬 수 있다. CNBC가 검토한 Seedance 2.0으로 생성된 영상은 시각적으로 매우 현실적이며 완전한 AI 생성물로 보일 정도의 완성도를 보였다.

Billy Boman (스톡홀름 기반 크리에이티브 광고 에이전시 운영자)은 “2023년에는 움직임을 구현하거나 걷는 장면을 만들기조차 어려웠다. 지금은 스크립트만으로 거의 모든 것을 구현할 수 있을 정도로 기술이 발전했다“고 말했다.

Hugging Face의 Yakefu는 Seedance 2.0에 대해 “

이전 세대보다 제어성, 속도, 제작 효율성에서 진전을 보였다. 간단한 프롬프트로도 첫 시도에서 만족스러운 결과를 내는 등 전반적으로 균형 잡힌 모델

“이라고 평가했다.

하지만 Seedance는 음성 생성 관련 기능에서 난관에 부딪혔다. 중국 현지 매체는 Seedance가 사진 한 장으로 해당 인물의 목소리를 생성하는 기능을 일시 중단했다고 보도했다. 이는 한 블로거가 동의 없이 음성 합성이 이뤄질 가능성을 문제제기하면서 촉발된 조치였다. 바이트댄스는 CNBC의 추가 문의에 즉시 답하지 않았다.


콰이쇼우(Kling 3.0)

콰이쇼우는 지난주 공개한 Kling 3.0을 통해 또 다른 경쟁 모델을 내놓았다. Kling 3.0은 일관성·포토리얼리즘 향상, 최대 15초의 연장된 영상 길이, 다국어·방언·억양을 포함한 네이티브 오디오 생성 기능을 특징으로 내세웠다. 현재는 유료 가입자에게만 제공되며 곧 일반 공개될 예정이다.

콰이쇼우는 Kling 모델의 성공이 최근 1년간 주가가 50% 이상 오른 주요 요인 중 하나였다고 밝혔다. 이는 투자자들이 비디오 생성 및 사용자 참여 향상에 따른 매출 성장 가능성을 높게 평가했음을 시사한다.


기타 주요 모델 출시 및 시장 반응

홍콩 상장사로 알려진 Zhipu AI(상표명: Knowledge Atlas Technology)는 GLM-5라는 오픈소스 대형언어모델(LLM)을 공개했고, 이 발표로 주가가 급등했다. 회사 측은 GLM-5가 코딩 벤치마크에서 Anthropic의 Claude Opus 4.5에 근접하며 일부 테스트에서는 Google의 Gemini 3 Pro를 능가한다고 주장했다. 이와 같은 주장에 대해 CNBC는 독자적 검증을 하지 못했다고 밝혔다.

또한 MiniMax는 에이전트 도구가 강화된 오픈소스 모델 M2.5를 내놓았고, 해당 발표 직후 주가가 상승했다. 여기서 말하는 에이전트(agentic AI)는 주어진 목표를 스스로 계획하고 수행해 반복적·다중 단계 작업을 자동화하도록 설계된 AI를 의미한다.

설명: 에이전트형 AI는 단순 질의응답을 넘어서 연속된 작업을 관리하고 외부 시스템과 상호작용하여 목표를 달성하는 능력을 가진다. 예컨대 코드 작성·디버깅 자동화, 웹 조작, 데이터 수집 및 보고서 작성 등에서 활용 가능하다.


시장·정책적 함의와 전망

이번 일련의 모델 출시는 중국의 AI 역량이 서구 경쟁자들과 “몇 달” 수준의 격차라는 구글 딥마인드의 데미스 하사비스(Demis Hassabis) 발언과 맥을 같이한다. 다만 기술적 성과와 상업화 사이에는 여전히 격차가 존재한다. 특히 영상·음성 합성 기술의 급격한 발전은 콘텐츠 생성 비용을 크게 낮추고 크리에이티브 산업 구조를 변화시킬 가능성이 크다. 광고, 엔터테인먼트, 전자상거래 등 소비자 접점 사업에서 신규 수익 모델이 창출될 여지가 크다.

반면 규제·윤리 리스크는 실물 영향력 확대의 걸림돌이다. 무단 음성 합성 기능의 일시 중단 사례처럼 개인정보·초상권·합성 음성의 동의 문제는 규제 강화로 이어질 수 있다. 투자 관점에서 보면, AI 모델의 발표는 단기적으로 관련 기업 주가를 견인하지만, 정책·사회적 반발이 커지면 오히려 변동성이 확대될 위험이 있다.

금융시장 측면에서는 다음과 같은 영향이 예상된다. 첫째, 영상·로보틱스·에이전트 솔루션의 상용화가 가속화되면 관련 기업의 매출 성장 기대치가 높아져 밸류에이션 프리미엄이 형성될 수 있다. 둘째, 규제 리스크와 기술 완성도에 따른 실적 불확실성은 단기적 주가 변동성을 키울 것으로 보인다. 셋째, 글로벌 공급망과 반도체 의존도(예: Nvidia GPU)에 의한 제약은 중국 모델의 배포 속도를 제한할 여지가 있다.

전문가들은 향후 12~24개월 내에 중국 업체들이 비디오 생성과 로보틱스 분야에서 상용화의 초기 성과를 보일 가능성이 높다고 전망한다. 다만 상용화의 폭과 속도는 해외 기술 접근성, 반도체 공급, 규제 환경 변화, 그리고 윤리·안전성 확보 노력에 달려 있다고 지적한다.

요약하면 이번 주는 중국 AI 업계의 기술적 진보와 동시에 현실적 과제들이 드러난 한 주였다. 기업들의 모델 공개는 경쟁력을 과시하는 한편, 개인정보·윤리 문제와 정책 리스크를 수반해 향후 상용화 과정에서 주의 깊은 대응이 필요하다.

China AI in 2026