베이징(로이터) — 중국 기술 대기업 화웨이(Huawei)가 정치적으로 민감한 주제에 대한 논의를 거의 100% 차단할 수 있다고 주장하는 안전 중심 인공지능(AI) 모델 DeepSeek-R1-Safe를 공동 개발했다고 밝혔다.
2025년 9월 19일, 인베스팅닷컴의 보도에 따르면, 화웨이는 자사의 공식 웨이신(WeChat) 계정을 통해 해당 사실을 공개했다.
중국 규제 당국은 국내 AI 모델과 이를 활용한 응용 프로그램이 대중에 공개되기 전에 반드시 중국의 ‘사회주의 핵심 가치관‘을 반영하도록 요구하며, 이는 표현의 자유에 대한 엄격한 통제 정책의 연장선으로 평가된다.
화웨이는 이번 모델 학습에 Ascend AI 칩 1,000개를 투입했다고 설명했다. 해당 모델은 오픈소스인 DeepSeek-R1을 기반으로 파인튜닝(fine-tuning) 과정을 거쳐 제작됐다.
공동 연구 파트너는 중국 명문 저장대학교(Zhejiang University)로, DeepSeek 설립자 량원펑(Liang Wenfeng)의 모교다. 다만 DeepSeek 측과 량원펑 본인은 이번 프로젝트에 직접 참여하지 않은 것으로 알려졌으며, DeepSeek는 로이터의 논평 요청에 즉시 답변하지 않았다.
중국 산업계, DeepSeek 활용 가속화
지난 1월 DeepSeek가 공개한 DeepSeek-R1과 DeepSeek-V3는 높은 완성도로 실리콘밸리를 비롯한 해외 투자자들을 놀라게 했으며, 이로 인해 서구권 AI 종목 주가가 급락하는 현상이 발생했다.
현재 해당 모델들은 중국 산업 전반에 걸쳐 적극적으로 도입·변형·배포되고 있다.
중국판 챗GPT로 불리는 바이두(Baidu)의 Ernie Bot 등 국내 AI 챗봇은 중국 공산당이 민감하다고 규정한 국내 정치 관련 질문이나 주제에 대해 응답을 거부하거나 회피하는 방식으로 설계돼 있다.
이번에 공개된 DeepSeek-R1-Safe는 ‘일반적인 유해 발언, 정치적 민감 콘텐츠, 불법 행위 선동’ 등을 방어하는 테스트에서 ‘거의 100%’의 차단 성공률을 기록했다고 화웨이는 주장했다.
다만 화웨이에 따르면 시나리오 기반 질문·역할극(role-playing)·암호화 코딩 등 우회적 기법이 동원된 환경에서는 성공률이 40%로 떨어졌다.
화웨이는 “동일한 조건에서 시험한 결과, 종합 보안 방어 능력은 83%로 알리바바의 Qwen-235B 및 DeepSeek-R1-671B 등 동시대 모델보다 8%p에서 15%p 높게 나타났다”고 밝혔다.
또한 DeepSeek-R1-Safe는 원본 DeepSeek-R1 대비 성능 저하율이 1% 미만에 그쳤다고 회사 측은 덧붙였다.
화웨이는 현재 상하이에서 연례 행사인 Huawei Connect 컨퍼런스를 개최 중이다. 행사 첫날인 19일에는 그동안 베일에 싸여 있던 자사 반도체 개발 상황을 공개하며 칩·컴퓨팅 파워 로드맵을 발표하기도 했다.
용어 정리
‘대형언어모델(LLM, Large Language Model)’은 대규모 텍스트 데이터를 학습해 인간과 유사한 문장 생성·이해 능력을 갖춘 AI 모델을 의미한다. ‘시나리오 기반 챌린지’는 질문자가 특정 상황·역할을 설정해 모델의 검열 필터를 우회하려는 기법이며, ‘암호화 코딩’은 질문을 암호화된 형태로 제시해 AI가 위험성을 인지하지 못하도록 하는 방법이다.
기자 해설: 중국 정부의 규제 환경을 고려할 때, 화웨이가 검열 성능을 전면에 내세운 것은 상업적·정책적 측면 모두에서 유리하게 작용할 전망이다. 그러나 해외 시장에서의 경쟁력은 ‘내용 안전성’과 ‘모델 자유도’ 간 균형에 달려 있다는 평가가 나온다. 실제로 40%까지 하락한 우회 공격 대응 성능은 앞으로의 기술 과제가 될 것으로 보인다.