[샌프란시스코] 세계 인공지능(AI) 업계를 주도해 온 오픈AI(OpenAI)가 차세대 대규모언어모델(LLM)인 ‘GPT-5’를 조만간 공개할 예정이라 밝히면서 글로벌 시장의 이목이 집중되고 있다.
2025년 8월 6일, 로이터 통신과 인베스팅닷컴의 보도에 따르면 사전 테스트에 참여한 두 명의 초기 사용자는 “코딩 능력과 과학·수학 문제 해결 수준에서 인상적인 성능을 확인했지만, GPT-3에서 GPT-4로의 ‘세대 점프’에 비해 향상 폭은 다소 제한적”이라고 전했다. 두 테스터는 비밀유지계약(NDA)으로 인해 실명을 밝히지 않았다.
오픈AI 측은 이번 기사에 대해 별도의 공식 논평을 거부했지만, 응용연구 책임자 보리스 파워(Boris Power)는 X(옛 트위터)에 “GPT-5가 공개될 때 대중의 반응이 매우 기대된다”고 적었다.
GPT-4의 도약과 ‘스케일링 한계’
2023년 3월 공개된 GPT-4는 방대한 연산 자원과 데이터 투입을 통해 지능 수준을 크게 끌어올린 모델로 평가받았다. 실제로 GPT-3.5가 변호사시험(Bar Exam) 시뮬레이션에서 하위 10% 점수를 받은 반면, GPT-4는 상위 10%로 도약하며 인간 능력을 넘어서는 사례를 보여줬다.
그러나 시가총액 3,000억 달러로 평가받는 오픈AI는 이른바 ‘스케일링 법칙’을 더 이상 그대로 적용하기 어렵다는 현실에 직면했다. 데이터 장벽 때문이다. 전 최고과학책임자(Chief Scientist) 일리야 서츠케버(Ilya Sutskever)는 “연산 능력은 기하급수적으로 늘지만, 인터넷 텍스트라는 원천 데이터는 한계에 도달했다”고 지적했다.
또 다른 문제는 초대형 모델을 훈련시키는 과정(Training Run) 자체가 복잡해지며, 수개월 후 결과가 확인될 때까지 하드웨어-기인 오류를 통제하기 어렵다는 점이다.
출시 시점과 시장 기대
오픈AI는 공식 출시일을 밝히지 않았으나 업계는 “수일 내 공개”를 기정사실로 받아들이고 있다. 벤처캐피털 메이필드(Mayfield)의 매니징 파트너 나빈 차다(Navin Chaddha)는 “GPT-3에서 GPT-4로의 놀라운 도약 후, GPT-5에 대한 기대치가 폭발적으로 증가했다”며 “챗(대화) 중심을 넘어 완전한 자율 업무 수행을 가능케 하는 응용 서비스가 열릴 것”이라고 전망했다.
“GPT-5가 ‘챗봇’이라는 틀을 깨고 AI 에이전트 시대로 이행할 수 있을지 여부가 핵심 쟁점” – 기자 분석
용어 풀이: ‘테스트-타임 컴퓨트(Test-Time Compute)’란?
최근 오픈AI가 집중하고 있는 테스트-타임 컴퓨트는, 모델 학습이 끝난 후 추론 단계에서 추가 연산 자원을 투입해 난해한 문제를 풀도록 하는 방식이다. 이는 사람의 ‘사고 시간’과 유사한 개념으로, 복잡한 수학 계산이나 다단계 의사결정에서 성능을 향상시킨다는 점에서 주목받고 있다.
샘 올트먼(Sam Altman) 오픈AI 최고경영자(CEO)는 올 초 “GPT-5는 대규모 모델과 테스트-타임 컴퓨트를 결합한 하이브리드 설계”라며, “모델·제품 라인업이 복잡해졌지만 이는 진화 과정의 필연”이라고 강조했다.
경쟁 지형: 구글·앤트로픽·메타의 추격
챗GPT가 2022년 말 데뷔하며 생성형 AI 열풍을 촉발한 지 3년이 채 되지 않아, 구글(Alphabet), 아마존이 투자한 앤트로픽(Anthropic), 메타플랫폼스(Meta Platforms) 등 주요 빅테크도 잇달아 맞대응 모델을 내놓았다. 특히 메타의 라마 3(Llama 3)는 오픈소스임에도 GPT-4와 견줄 만한 성능으로 평가받는다.
이처럼 다자 간 기술 경쟁이 격화되면서, GPT-5가 기대만큼 혁신적이지 않을 경우 시장 신뢰도에 균열이 생길 가능성도 배제하기 어렵다.
전문가 관전 포인트
첫째, GPT-5는 고차원 추론과 장기 메모리에서 어느 정도 실제 이득을 제공할지 관측 대상이다. 둘째, 모델의 에너지 효율성과 비용이 기업 도입에 결정적이므로, 테슬라·MS·AWS 등 클라우드 파트너십의 인프라 전략도 중요하다. 셋째, 데이터 라벨링·저작권 분쟁 같은 사회적 쟁점이 더욱 부각될 전망이다.
본 기자는 “GPT-4 수준 성능을 갖춘 오픈소스 모델이 이미 다수 등장한 상황에서, GPT-5가 보여줄 차별화 포인트는 ‘실시간 복합 작업 수행 능력’이 될 것”이라고 본다. 예컨대 연속적 멀티모달 입력을 받으며 문서 작성, 코드 배포, 데이터 시각화를 한 세션에서 자동화하는 기능이 출시되면 기업 수요가 폭발할 수 있다.
다만 기술 발전 속도에 비해 규제·윤리 논의가 따라오지 못하고 있다는 점은 지속적인 리스크로 지적된다.
결론 및 전망
오픈AI가 GPT-5로 다시 한번 ‘게임 체인저’ 역할을 할지, 아니면 치열한 추격자들 속에서 점진적 업그레이드에 머물지 여부는 곧 판가름날 것으로 보인다. 출시 직후 벤치마크 테스트, 기업용 API 가격 정책, 파트너 생태계 확장 전략 등이 시장 평가의 핵심 척도로 작용할 전망이다.
※ 용어 정리
• LLM(Large Language Model): 인터넷 텍스트를 대규모로 학습해 사람과 유사한 언어 생성·이해 능력을 갖춘 AI 모델.
• 스케일링 법칙: 모델 파라미터·데이터·연산량을 늘리면 성능이 로그 함수적으로 개선된다는 경험적 법칙.
• 테스트-타임 컴퓨트: 학습 완료 후 추론 단계에서 추가 연산 자원을 투입해 성능을 끌어올리는 방식.