딥시크의 R1 모델 업그레이드와 급속 상승 배경은?

중국 AI 스타트업 딥시크(DeepSeek)는 실리콘밸리와 견줄 수 있는 능력을 다시 한 번 증명하면서, 데뷔 후 몇 달 만에 조 단위의 주가 대폭락을 촉발시켰다. R1 모델의 최신 버전은 실질적인 코딩 경연대회에서 구글과 Anthropic의 모델과 함께 1위를 차지하는 성과를 거두었다. 이는 서양 경쟁사보다 훨씬 적은 비용으로 개발되었다는 주장에도 불구하고 이뤄낸 성과다.

2025년 6월 19일, 나스닥닷컴의 보도에 따르면 딥시크의 성공은 미국의 칩 수출 통제가 중국 AI 역량을 수년 뒤로 물러나게 했다는 안일한 견해를 무너뜨렸다. 딥시크의 급작스러운 상승은 중요한 질문을 제기한다: 어떻게 항저우의 거의 알려지지 않은 스타트업이 이렇게 빨리 성장할 수 있었는가? 또한, 이들의 매우 효율적인 접근 방식이 AI 경주에서 근본적인 변화를 예고하며 업계의 고비용 관행에 도전을 제기하는 것인가?

딥시크의 창립자는 누구인가?

주목

2025년 1월 이전에는 중국의 금융운용 분야 외에는 량원펑(Liang Wenfeng)이라는 이름을 아는 사람이 거의 없었다. 이 40세의 창립자는 비범한 사생활을 유지하며 시진핑 주석과의 고위급 회의를 통해 그의 사진이 널리 퍼지기 전까지는 사진도 드물었다. 그러나 이면에는 블룸버그 조사에 따르면 ‘매우 유능하고 재능 있는‘ 기술 기업가가 있다.

그는 광둥 성의 작은 마을에서 초등학교 교사의 아들로 태어나, 학업적으로 두각을 나타내어 전자공학과 기계 학습을 전공했다. 졸업 후 두 명의 동급생과 함께 양자적 헤지 펀드 ‘하이플라이어 매니지먼트’를 설립했으며, 이 펀드는 최고로 140억 달러 이상의 자산을 관리하며 연평균 35% 이상의 수익률을 기록했다.

딥시크는 어떻게 빠른 성과를 이뤘는가?

딥시크의 성공의 핵심은 효율성에 있다. 미국의 거대 기업들이 거대한 모형 구축과 비싼 칩 클러스터에 투자할 때, 딥시크는 모델 아키텍처 혁신에 집중했다. 그들은 ‘스파시티(희소성)’라는 기술을 개척했다.

주목

이는 대형 언어 모델 전체를 활용하는 대신, 특정 질문에 가장 관련성이 높은 전문가 집단만을 활성화하는 방식이다. 이 기술은 모델을 훨씬 더 컴퓨팅 효율적으로 만들어 훈련 및 운영 비용을 절감한다. 한 분석가는 이를 특정 할 일을 위해 필요한 뉴런만을 활성화시키는 것으로 비유한다.

이는 필수적으로 이루어진 방법이기도 하다. 워싱턴이 칩 수출 규제를 강화하면서 중국 개발자들은 적은 자원을 활용할 방안을 찾아야 했기 때문이다.

딥시크의 전략은 기술을 오픈소스화하는 데 있다. 경쟁사들이 가장 강력한 모델을 비공개로 유지하는 반면, 딥시크는 코드 공유를 적극적으로 진행하고 있다.

이 전략은 두 가지 주요 이점을 제공한다. 첫째, 빠른 수용을 가능하게 한다. 저렴하고 접근성이 좋은 모델을 통해 개발자와 기업들이 빠르게 이를 테스트하고 통합할 수 있다. 둘째, 이는 경쟁사를 매출면에서 우월하게 만든다. 블룸버그의 Saritha Rai는 딥시크의 접근 방식을 ‘세계를 빠르게 수용시키고 주류로 자리잡도록 함으로써 비싼 비공개 경쟁사를 효과적으로 대체하는‘ 전략이라 설명했다.