구글, 제미니 앱 ‘딥 씽크’ 공개…울트라 구독자 대상 고급 문제 해결 기능

구글이 인공지능 구독 서비스인 Google AI Ultra 고객을 위해 제미니(Gemini) 앱에 딥 씽크(Deep Think) 기능을 도입했다. 이 기능은 일상적인 질문뿐 아니라 고난도 수학·코딩 문제까지 신속하게 처리하도록 설계돼, 올 5월 I/O 행사에서 예고된 버전보다 성능이 대폭 향상됐다고 회사는 밝혔다.

2025년 8월 1일, 인베스팅닷컴 보도에 따르면, 딥 씽크는 올해 국제수학올림피아드(IMO)에서 금메달 수준을 달성한 모델을 소비자용으로 최적화한 변형이다. 대회용 모델은 복잡한 수학 문제를 해결하는 데 수 시간이 걸렸지만, 상용 버전은 처리 속도를 단축하면서도 내부 평가 기준인 ‘2025 IMO 벤치마크’에서 동메달(Bronze) 수준의 정확도를 기록했다.

구글은 이번에 공개한 ‘Gemini 2.5 Deep Think’ 공식 모델을 일부 수학자·학계 전문가에게 공유해 피드백을 받고, 향후 기능 개선에 반영할 계획이다. 회사 측은 “다중 병렬 사고(parallel thinking) 기법과 강화 학습(재강화 학습·Reinforcement Learning)을 결합해 ‘생각 시간’을 확장했다”며 “이에 따라 모델이 여러 경로로 추론을 진행할 수 있어 문제 해결력이 크게 높아졌다”고 설명했다.

국제수학올림피아드(IMO)란 무엇인가

IMO는 1959년 루마니아에서 시작된 고교생 대상 세계 최대 규모의 수학 경시대회다. 참가국 대표 6명이 2일간 총 6문제를 풀어 메달을 겨루며, 각 문제는 대학 고급 과정 이상의 난도를 자랑한다. 딥 씽크의 ‘금메달 성능’ 언급은 이 대회 기준으로도 최고 수준의 논증·추론 능력을 의미한다.

딥 씽크의 핵심 기술 및 성능 벤치마크

“딥 씽크는 창의적 설계·과학적 탐구·알고리즘 코딩 등 전략적 사고가 필요한 과업에서 우수한 결과를 보여준다.” – 구글 AI팀

구글에 따르면, 해당 모델은 LiveCodeBench V6Humanity’s Last Exam 같은 공개 벤치마크에서 도구(tool) 없이 테스트한 경쟁 모델 대비 최첨단(SOTA) 성능을 기록했다. LiveCodeBench는 다양한 프로그래밍 과제를 포함한 실시간 코딩 평가 세트이며, Humanity’s Last Exam은 인류학·과학·정책 등 고차원적 질문을 포괄한다.

구독자 이용 방법

Google AI Ultra 구독자는 제미니 앱 우측 상단 모델 드롭다운에서 ‘2.5 Pro’를 선택한 뒤, 프롬프트 바의 토글을 켜면 딥 씽크를 활성화할 수 있다. 코드 실행(code execution)·구글 검색(Google Search) 등 내장 툴과도 연동되며, 응답 길이 제약이 완화돼 장문 출력이 가능하다.

API 및 기업 활용 가능성

구글은 몇 주 안에 제미니 API를 통해 신뢰할 수 있는 테스터(trusted testers)에게 딥 씽크를 제공, 개발자·엔터프라이즈 환경에서의 유용성을 검증할 계획이다. 이는 기업 맞춤형 연구 개발, 금융 모델링, 대규모 시뮬레이션 등 고정밀 계산이 필요한 분야로의 확산을 염두에 둔 조치로 풀이된다.


전문가 해설 및 전망

국내 AI 생태계에서는 ‘딥 씽크’가 생성형 AI의 한계를 넘어 ‘추론 중심 AI’로 전환하는 신호탄이 될 것이란 평가가 나온다. 특히 IMO급 문제 해결 능력을 소비자용 앱에 이식한 사례는, 향후 대학·연구소·핀테크 기업까지 AI 활용 범위를 확장시키는 촉매제가 될 가능성이 크다. 필자는 개인화된 학습 보조, 고급 연구 설계 지원 등에서 구글이 선도적 우위를 점할 것으로 본다.

다만, 대량 연산 과정에서 발생할 수 있는 에너지·비용 문제와, 추론 판단의 투명성·검증 가능성 확보가 향후 과제로 남는다. 구글이 강화 학습을 통해 추론 경로를 ‘길게’ 가져가는 방식을 택한 만큼, ‘검증 가능한 해설(Chain-of-Thought Explanations)’을 제공할 수 있을지가 시장 신뢰의 관건이다.

결론적으로, 딥 씽크의 상용화는 차세대 AI 모델 경쟁에서 구글의 전략적 포지셔닝을 공고히 하는 동시에, 개발자와 연구자가 체감할 수 있는 실질적 유용성—예컨대 일상 문제 해결부터 대규모 과학 연구까지—을 한 단계 끌어올리는 계기가 될 전망이다.