메타 거래 이후 구글이 스케일 AI와의 협력 중단한 이유

지난 2년간 AI 붐의 이야기는 하드웨어와 관련되어 왔다. 엔비디아의 GPU, TSMC의 첨단 반도체 제조 시설 사용권, 거대 데이터 센터에 전기를 공급할 충분한 전력을 두고 경쟁이 벌어졌다. 하지만 이번 주에 전혀 다른 종류의 부족 사태가 발생했다. 바로 사람에 관한 문제이다. 특히 기계에게 설명하는 데 뛰어난 능력을 가진 사람들에 대한 수요가 급증했다.

2025년 6월 14일, 나스닥닷컴의 보도에 따르면 드라마틱한 상황은 고품질 훈련 데이터를 AI 모델에 제공하는 스타트업 스케일 AI 중심으로 전개되고 있다. 구글은 메타가 이 회사의 지분 49%를 대량 매입한 후 스케일 AI와의 협력을 중단할 계획이다. 마이크로소프트와 일론 머스크의 xAI를 포함한 다른 주요 고객들도 협력을 중단하려고 한다는 소식이다. 이러한 이탈은 가장 영리한 AI를 만들기 위한 경쟁에서 최고의 인간 주석 데이터에 대한 접근이 이제 중요한 전략적 병목점이 되고 있음을 보여준다.

데이터 라벨링 회사란 무엇이며 왜 중요한가?

기본적으로 데이터 라벨링은 AI 모델이 학습하는 방법이다. 초기에는 고양이 그림에 상자를 그리는 단순한 작업이었다. 그러나 모델이 진화함에 따라 필요한 데이터도 더 복잡해졌다. 이제는 대형 언어 모델에 인터넷 전체를 제공하는 것만으로는 충분하지 않다. 모델이 진정으로 똑똑해지고, 이유를 분석하며 복잡한 작업을 수행하고, 잘못된 결론에 이르지 않기 위해서는 전문가에 의해 가르침을 받아야 한다.

스케일 AI가 하는 일이 바로 이것이다. 이 회사는 특화된 지식을 갖춘 인간 훈련자 네트워크를 구축했다. 이러한 훈련자들은 박사, 과학자, 역사학자로 구성되어 있으며 인간 피드백을 통한 강화 학습(RLHF)이라는 복잡한 데이터 세트를 주석 처리하는 공정을 진행한다. 이러한 ‘사후 훈련’ 정련이 비밀 요소이다. 어떻게 구글의 제미니 같은 모델이 더 나은 코드 작성자가 되는지, 오픈AI의 모델이 대학 수준의 문제를 해결하게 되는지 설명한다. 이 공정의 가치는 매우 높아서 단일이고 미묘한 주석 비용이 최대 100달러에 이를 수 있다고 한다. 구글은 올해에만 2억 달러를 스케일 AI의 서비스에 투자할 계획이었다.

메타-스케일 AI 거래의 중심에 있는 충돌

구글 등의 문제는 메타가 단순한 투자자가 아니라는 점이다. 메타는 AI 우위를 위해 경쟁하는 가장 큰 경쟁자 중 하나이다. 메타가 49%의 지분을 인수하고 스케일의 CEO를 메타의 고위직에 알맞게 배치하면서, 사실상 이 회사는 산업 전체에 중요한 공급자를 흡수해버렸다.

근본적인 우려사항에 대해 로이터는 이렇게 보도했다. “최첨단 AI 모델 개발에서 메타와 경쟁하는 회사들은 스케일과의 거래가 연구 우선순위와 로드맵을 경쟁자에게 노출할 수 있다고 걱정하고 있다. 스케일 AI와 계약하면 고객은 종종 자사 데이터와 프로토타입 제품을 스케일의 워커들이 라벨링 서비스를 제공하는 동안 공유하게 된다. 이로 인해 AI 회사들은 중요한 경쟁자 중 하나가 자사의 비즈니스 전략과 기술 청사진에 대한 정보를 얻을까 우려하고 있다.”

본질적으로 스케일 AI와의 협력을 계속하는 것은 포드가 주된 경쟁사인 GM의 전략가들이 자사의 차세대 차량에 대한 기밀 연구개발 시설을 자유롭게 드나드는 것을 허용하는 것과 같다. 이는 경쟁에서 이처럼 극심한 위험을 감수할 수 없다는 것을 의미한다.

이것이 AI 공급망에 미치는 영향은 무엇인가?

메타의 움직임은 즉시 데이터 라벨링 시장을 분열시켰다. 모든 주요 연구소에 서비스를 제공하는 중립적인 중개업체라는 개념은 이제 과거의 일이 되어 버릴 수 있다. 경쟁업체인 투링의 CEO인 조나단 시다르스는 로이터와의 인터뷰에서 “주요 AI 연구소는 중립성이 더 이상 선택 사항이 아니라 필수라는 것을 깨닫고 있다”고 말했다.

이는 구글, 마이크로소프트, 오픈AI 같은 회사들에 중대한 전략적 변화를 요구한다. 이들은 이제 확실히 중립적인 새로운 데이터 파트너를 찾거나 이러한 중요한 기능을 내부화해야 한다. 두 가지 모두 이미 진행 중이다. 메타-스케일 거래의 여파로 작은 독립적인 경쟁자들에게는 큰 기회가 열렸다. 라벨박스의 CEO는 fleeing 고객들로부터 “수억의 새로운 매출을 올릴 것”이라고 전망하고 있으며, 또 다른 경쟁자인 핸드셰이크는 주요 AI 연구소로부터의 수요가 “하룻밤 사이에 세 배 증가했다”고 밝혔다. 동시에 많은 연구소들이 이제 전문가 데이터 라벨러의 자체 팀을 구축하려고 하며, 그들의 가장 귀중한 데이터를 벽 안에 완전히 보관하기 위해 노력하고 있다.

AI 경쟁은 희소 자원에 대한 접근권이 항상 중요했다. 오랫동안 연산 능력이 이 경쟁의 주를 이루었다. 이제 그 경쟁은 확장되었다. 세계에서 가장 발전된 AI 모델은 세계에서 가장 고도화된 인간 전문 지식을 확보하기 위해 치열한 경쟁을 벌이고 있으며, 이를 제공하는 공급망은 또 다른 전쟁터가 되었다.