OpenAI, 노트북에서도 구동 가능한 오픈-가중치 추론 모델 2종 전격 공개

SAN FRANCISCO/서울OpenAI가 2025년 8월 5일(현지 시각) 자사 최초의 오픈-가중치(open-weight) 언어 모델 2종을 공개했다. 해당 모델은 노트북 한 대만으로도 실행이 가능하도록 설계됐으며, OpenAI의 소형 독점 추론 모델과 유사한 성능을 제공한다고 회사 측은 밝혔다.

2025년 8월 5일, 인베스팅닷컴의 보도에 따르면 이번에 공개된 모델은 gpt-oss-120bgpt-oss-20b 두 가지다. gpt-oss-120b는 단일 GPU 위에서 구동될 수 있고, 더 작은 gpt-oss-20b는 개인용 노트북에서도 원활히 작동하도록 최적화됐다. 이는 2019년 GPT-2 이후 OpenAI가 6년 만에 선보이는 첫 오픈 모델이라는 점에서 의미가 크다.

“오픈 모델의 독특한 점은 사용자가 자신의 방화벽 뒤, 곧 자체 인프라 내부에서 모델을 직접 돌릴 수 있다는 것”이라고 공동 창업자 그렉 브록먼(Greg Brockman)은 화상 기자회견에서 강조했다.

오픈-가중치 모델과 오픈-소스 모델의 차이

일반적으로 오픈-소스 모델코드·데이터·학습 방법론 전체를 전면 공개하지만, 오픈-가중치 모델은 학습된 파라미터(가중치)만을 공개한다. 개발자는 이 가중치를 바탕으로 원하는 작업에 맞게 미세조정(fine-tuning)을 수행할 수 있으며, 원본 학습 데이터를 별도로 확보할 필요가 없다는 이점이 있다.

AWS Bedrock과의 협업 — 첫 상용 배포

한편 아마존닷컴(NASDAQ: AMZN)은 OpenAI의 이번 오픈-가중치 모델을 자사 AWS 생성형 AI 마켓플레이스인 Bedrock에서도 즉시 사용할 수 있다고 발표했다. 아툴 데오(Atul Deo) Bedrock 제품 총괄은 “OpenAI의 새 모델은 고객에게 훌륭한 오픈-가중치 옵션이 될 것”이라고 평가했지만, 구체적인 계약 조건은 공개를 거부했다.

지난주 아마존 주가는 AWS 부문 성장 둔화 소식으로 크게 하락했다. 업계에서는 이번 파트너십이 AWS의 경쟁력 회복에 기여할 수 있을지 주목하고 있다.

치열해진 오픈 모델 경쟁 구도

올해 들어 Meta PlatformsLlama 시리즈가 한동안 업계 표준으로 자리매김했지만, 중국 DeepSeek이 비용 대비 성능을 앞세운 DeepSeek-R1 모델을 선보이면서 판도가 흔들렸다. Meta가 Llama 4 출시에서 난항을 겪는 사이, OpenAI가 새 카드를 꺼내 든 셈이다.

모델 사양 및 성능 지표

OpenAI는 두 모델 모두 자사 독점 추론 모델 o3-minio4-mini에 견줄 만한 성능을 낸다고 설명했다. 특히 코딩·경시 수학·의료 상담과 같은 복합 추론 과업에서 두각을 보인다는 점이 강조됐다. 학습 데이터셋은 텍스트 전용이며, 과학·수학·코딩 지식이 집중적으로 포함됐다. 다만 DeepSeek-R1 등을 포함한 경쟁 모델과의 직접 벤치마크 지표는 공개되지 않았다.

어려운 용어 해설

  • GPU(Graphics Processing Unit) — 고속 병렬 연산이 가능한 칩으로, 대규모 AI 모델 추론·학습에 필수적이다.
  • 파라미터(가중치) — 모델이 학습 과정에서 익힌 수치 값으로, 입력 데이터를 바탕으로 출력을 생성하는 핵심 요소다.
  • 파인튜닝(fine-tuning) — 이미 학습된 모델을 특정 작업에 맞춰 추가 학습하는 과정이다.
  • 추론(inference) — 학습이 완료된 모델에 새 데이터를 넣어 결과를 얻는 실행 단계다.

기업 가치 및 자금 조달

마이크로소프트가 후원하는 OpenAI는 현재 3,000억 달러의 기업 가치를 인정받고 있다. 회사는 소프트뱅크그룹(OTC: SFTBY)이 주도하는 400억 달러 규모의 신규 펀딩 라운드를 진행 중이다.

기자 관전평

기자는 이번 발표가 ‘독점 대 오픈’ 구도에 새로운 균형점을 제시한다고 본다. 그간 고성능 모델은 막대한 GPU 리소스를 요구해 개발 역량이 부족한 스타트업·연구기관에는 현실적으로 높은 진입 장벽이 존재했다. 그러나 단일 GPU 또는 노트북에서 구동 가능한 120억·20억 파라미터급 모델이 등장함에 따라, ‘온-프레미스 AI’ 환경 구축이 한층 용이해질 전망이다. 특히 금융·의료·국방 등 데이터 주권이 중요한 산업에서 수요가 급증할 것으로 예상된다. 다만 세부 벤치마크가 비공개인 만큼, 실제 성능 우위를 입증하려면 추가 검증이 필요하다.


ⓒ 2025 Investing.com. 무단전재·재배포 금지.