런웨이, 구글·오픈AI 제친 새 AI 영상 모델 ‘Gen 4.5’ 공개…독립 벤치마크 1위

사진: Mustafa Hatipoglu | Anadolu | Getty Images

인공지능(AI) 영상 스타트업 런웨이(Runway)가 새로운 텍스트-투-비디오 모델 ‘Gen 4.5’를 공개했으며, 독립 벤치마크에서 구글오픈AI의 유사 모델을 제치고 선두에 올랐다고 밝혔다. 이 모델은 사용자가 텍스트로 동작과 움직임을 서술하면, 그 지시에 맞는 고해상도(HD) 영상을 생성하도록 설계됐다. 런웨이는 Gen 4.5가 물리 법칙 이해, 인체 동작, 카메라 무빙, 인과관계에 대한 이해에서 강점을 보인다고 설명했다.

2025년 12월 1일, CNBC뉴스의 보도에 따르면, Gen 4.5는 독립 AI 벤치마킹·분석 기관Artificial Analysis가 운영하는 Video Arena 리더보드에서 1위를 차지했다. 이 순위는 참가자들이 두 개 모델의 결과물을 비교하고, 어떤 기업의 모델인지 모른 채 선호하는 결과에 표를 던지는 방식으로 매겨진다. 블라인드 비교를 통해 모델의 출처 편향을 줄이려는 평가 구조다.

주목

해당 리더보드에서 구글의 ‘Veo 3’는 2위를, 오픈AI의 ‘Sora 2 Pro’는 7위를 기록했다. 순위는 지속적으로 변동될 수 있으나, 이번 공개 시점에서 런웨이 Gen 4.5최상위를 차지했다는 점이 주목된다.

“우리는 100명의 팀으로 수조 달러 규모 기업들을 상대로 경쟁에서 이겼다.”라고 런웨이 CEO 크리스토발 발렌수엘라(Cristóbal Valenzuela)는 CNBC와의 인터뷰에서 말했다. “극도의 집중과 치밀함만으로도 최전선을 개척할 수 있다.”


CNBC 테크 뉴스 더 보기관련

  • 팔란티어, AI주 하락 속 2년 만의 최악의 한 달 기록
  • 넥스페리아 내부 동향: 중국 윙텍, 네덜란드 반도체사와 공방 격화
  • 바이두, 중국 내 NVIDIA 대체를 위한 주요 AI 칩 플레이어로 부상
  • 구글, AI 컴백을 위한 퍼즐 조각을 어떻게 맞췄나

런웨이의 배경과 연구 방향

런웨이2018년 설립되었으며, 2025년 CNBC ‘Disruptor 50’ 리스트에 이름을 올렸다. 회사는 AI 연구를 수행하면서 비디오 모델월드 모델(world models)을 개발한다. 월드 모델동영상과 관찰 데이터로 학습해 물리적 세계의 작동 방식을 더 정밀하게 반영하도록 설계된 모델을 뜻한다.

주목

런웨이의 고객군에는 미디어 조직, 스튜디오, 브랜드, 디자이너, 크리에이터, 학생 등이 포함된다. 시장조사업체 PitchBook에 따르면, 런웨이의 기업가치35억5천만 달러(3.55 billion)로 평가된다.

OpenAI Sora 2 관련 이미지

코드명 ‘David’와 개발 맥락

Gen 4.5‘다윗과 골리앗’의 성서 이야기에 착안해 코드명 ‘David’로 불렸다. 발렌수엘라 CEO는 이 모델이 “하룻밤 사이 성공처럼 보이지만, 약 7년이 걸렸다”라고 말했다. 이어 그는 “효율과 연구의 시대가 도래한 것 같다”며, “AI가 두세 개 기업에 의해 독점되지 않도록 하는 데 기여할 수 있어 기쁘다”고 덧붙였다.

“지금은 효율과 연구의 시대가 본격화하는 매우 흥미로운 시점으로 느껴진다. 우리는 AI가 두세 곳의 기업에 의해 독점되지 않도록 하는 데 힘을 보태고자 한다.” — 크리스토발 발렌수엘라

출시 계획과 접근 경로

Gen 4.5점진적 롤아웃이 진행 중이며, 이번 주가 끝나기 전 전 고객에게 제공될 예정이다. 발렌수엘라에 따르면, 이는 런웨이가 준비 중인 여러 차례의 메이저 릴리스 중 첫 번째에 해당한다. 모델은 런웨이 플랫폼애플리케이션 프로그래밍 인터페이스(API), 그리고 일부 파트너사를 통해 이용 가능해진다.

할리우드가 우려하는 AI 비디오 기술

참고: 오픈AI Sora 2와 업계 관심맥락

CNBC는 “우리는 오픈AI의 Sora 2 AI-비디오 앱을 테스트해 할리우드가 왜 우려하는지를 확인했다”는 주제를 소개했다. 이는 고품질 합성 영상 기술콘텐츠 제작과 저작권, 산업 생태계 전반에 미칠 잠재적 파급력을 보여주는 사례로 해석된다.


용어 설명

  • 텍스트-투-비디오(Text-to-Video): 사용자가 문장 형태의 프롬프트로 원하는 장면, 동작, 스타일을 설명하면, 해당 설명에 맞춘 짧은 동영상을 자동 생성하는 기술을 말한다.
  • 월드 모델(World Models): 비디오·관찰 데이터에서 학습해 물리 세계의 규칙을 내재화하려는 모델. 원인-결과객체 상호작용에 대한 추론 능력이 중요한 영역이다.
  • Video Arena 리더보드: 독립 기관 Artificial Analysis가 운영하는 순위. 두 모델의 결과물을 블라인드로 비교 투표해 선호도가 높은 쪽에 점수를 주는 상대평가 방식이다.
  • API(애플리케이션 프로그래밍 인터페이스): 외부 애플리케이션이 특정 서비스의 기능을 프로그램적으로 호출해 이용할 수 있도록 하는 인터페이스다.

분석: 독립 벤치마크 1위의 의미

Gen 4.5의 1위사용자 선호 기반의 블라인드 평가에서 두각을 나타냈다는 점에서 콘텐츠 품질·자연스러운 움직임·장면 구성체감 성능이 강하다는 신호로 해석된다. 특히 물리·인간 동작·카메라 무빙의 이해력은 영상 생성 품질을 좌우하는 핵심 축으로, 상용 활용 시 안정감을 높이는 요소다. 또한 100명 규모 팀으로 빅테크와의 정면 경쟁에서 상징적 승리를 거뒀다는 CEO의 메시지는, 집중 연구와 효율성을 내세운 스타트업 모델의 유효성을 부각한다.

다만, 리더보드 순위는 동적인 지표로, 데이터·알고리즘 개선과 사용자 표본 변화에 따라 달라질 수 있다. 그럼에도 불구하고, 블라인드 비교에서의 우위는 향후 미디어·브랜딩·디자인수요가 높은 범용 제작 워크플로로의 확산 가능성을 시사한다. API 제공파트너 경로엔터프라이즈 통합크리에이티브 툴체인 내 확장을 촉진할 수 있다.


체크 포인트: 실무 적용을 위한 확인 사항

  • 평가 방식: 블라인드 선호 투표는 사용자 지각에 민감하다. 특정 산업 도메인의 정량 지표(예: 장면 일관성, 타임라인 안정성 등)와 함께 교차 검토하는 것이 바람직하다.
  • 제공 시점: 모델은 이번 주 내 전 고객에게 개방 예정이다. 초기 롤아웃 특성상 기능 업데이트와 성능 튜닝이 빈번할 수 있다.
  • 접근 경로: 플랫폼·API·파트너 채널을 통해 도입 가능하다. 기존 파이프라인과의 호환성과 비용 구조를 확인하는 것이 중요하다.

결론

런웨이Gen 4.5Video Arena 리더보드 1위를 계기로 텍스트-투-비디오 영역에서 사용자 체감 품질 경쟁을 선도하고 있다. ‘David’라는 코드명은 집중과 효율을 내세운 스타트업의 도전을 상징한다. 발렌수엘라 CEO가 언급했듯, 이는 “효율과 연구의 시대”라는 흐름 속에서 AI 기술의 비독점적 발전을 지향하는 행보다. 이번 주 내 전면 개방다음 대형 릴리스 예고는, 향후 업계 경쟁 판도에 또 한 번의 변곡점을 제시할 수 있다.