뉴욕타임스의 탐사기자이자 저서 Bad Blood의 저자 존 캐리루(John Carreyrou)가 구글(Google), 일론 머스크의 xAI, 오픈AI(OpenAI), 메타 플랫폼스(Meta Platforms), 앤트로픽(Anthropic), 퍼플렉서티(Perplexity) 등을 상대로 저작권 침해 소송을 캘리포니아 연방법원에 제기했다.
2025년 12월 22일, 로이터통신의 보도에 따르면 캐리루와 다른 다섯 명의 작가들은 이들 AI(인공지능) 기업들이 저작권이 있는 서적을 허락 없이 대규모 언어 모델(LLM) 학습에 사용했다고 주장하며 집단적(class) 소송과는 별개로 개별적인 소송을 택해 피해 구제를 요구하고 있다.
이번 소송은 블레이크 브리튼(Blake Brittain)이 작성한 로이터 보도를 근간으로 하고 있으며, 원고 측은 법률사무소 프리드먼 노먼드 프리드랜드(Freedman Normand Friedland)의 변호사들이 사건을 대리한다고 밝혔다. 해당 법무법인에서 활동하는 카일 로슈(Kyle Roche)는 2023년 캐리루가 뉴욕타임스에 프로파일을 게재한 인물이다.
원고들은 소장에서 AI 기업들이 자신들의 서적을 무단으로 복제·수집하여 대형 언어 모델(LLM)에 ‘피딩(feeding)’했다고 적시했다. LLM은 챗봇의 응답을 생성하는 기저 모델로, 대규모의 텍스트 데이터로부터 통계적 패턴을 학습해 자연어를 생성하는 인공지능 기술을 의미한다.
“LLM 회사들은 수천에서 수만 건의 고부가가치 청구권을 매우 저렴한 비용으로 소멸시키지 못해야 한다.”라는 문구가 소장에 포함돼 있으며, 이는 집단소송으로 다수 원고의 권리가 단일 합의로 사라지는 것을 우려하는 취지다.
퍼플렉서티(Perplexity) 대변인은 이 사건에 대해 “우리는 서적을 색인화하지 않는다(doesn’t index books)”고 밝혔으나, 다른 피고 기업들의 대변인들은 즉각적인 논평을 내지 않았다.
이번 소송은 저작권 소유자들이 AI 기업들을 상대로 제기한 여러 건의 소송 중 하나이며, 특히 xAI가 피고로 이름을 올린 첫 사례라는 점에서 주목된다. 원고들은 이번 사건을 통하여 AI 업계의 데이터 수집 관행과 훈련 방식에 법적·윤리적 책임을 묻고자 한다.
한편, 앤트로픽(Anthropic)은 올해 8월 AI 학습용 저작권 분쟁에서 최초의 대형 합의를 체결했으며, 해당 합의는 저자들로 구성된 집단에 대해 $15억(1.5 billion dollars)을 지불하는 내용이었다. 그러나 새 소송은 그 합의가 원고들의 권리를 충분히 보장하지 못한다고 주장한다. 소장은 앤트로픽 합의에 따라 배당을 받는 클래스(class) 구성원들이 저작권법이 규정한 $150,000의 법정상한(statutory ceiling) 중 극히 작은 비율(단지 2%에 불과하다)에 불과한 보상을 받을 것이라고 지적했다.
법원 심리 과정과 관련 쟁점
소송 서류에 따르면, 지난 11월 앤트로픽 클래스 액션의 심리에서 미 연방법원 판사 윌리엄 알솝(William Alsup)은 로슈가 공동 설립한 별도의 법률사무소가 저자들을 모아 합의에서 탈퇴(opt-out)하도록 하는 과정에 대해 비판적 견해를 보였다. 해당 판사는 탈퇴를 유도하는 행위가 ‘더 달콤한 거래(a sweeter deal)’를 찾기 위한 것이라고 지적했다. 로슈 측은 해당 비판에 대해 이날 추가적인 논평을 거부했다.
캐리루 본인도 법정에서 앤트로픽이 책을 훔쳐 AI를 구축한 것이 “원죄(original sin)”이라고 주장하며 기존 합의가 충분하지 않다고 말했다.
전문용어 및 법적 개념 설명
대형 언어 모델(LLM)은 대량의 텍스트 데이터를 입력받아 언어의 통계적 패턴을 학습하는 인공지능 모델을 가리킨다. 이러한 모델은 뉴스, 책, 웹페이지 등에서 수집한 데이터로 학습하며, 학습 데이터의 저작권 문제는 법적·윤리적 논쟁의 핵심이다. 클래스(class) 소송은 다수의 원고가 단일 소송으로 묶여 법적 구제를 받는 제도이며, 집단 합의 시 개별 원고들이 개별적으로 더 큰 보상을 받을 기회를 잃을 수 있다는 문제가 제기된다. 법정상한(statutory ceiling)은 미국 저작권법에서 침해당한 작품 하나당 부과될 수 있는 최대 손해배상액을 의미한다.
시장·산업적 함의 및 전망
이번 소송은 AI 기업들의 데이터 이용 관행에 대한 법원과 시장의 관심이 높아지고 있음을 보여준다. 법적 불확실성이 지속될 경우 AI 스타트업 및 기존 플랫폼의 개발 비용이 상승하고, 합의금·소송 비용은 해당 기업들의 영업비용을 증가시킬 수 있다. 특히 이미 앤트로픽이 체결한 $15억 규모의 합의은 업계 전반에 데이터 라이선싱 및 정당한 데이터 조달에 대한 압력을 가할 가능성이 높다.
법적 리스크가 자본비용과 기업가치에 미치는 영향도 주목할 필요가 있다. 소송·합의 비용의 증가는 단기적으로는 해당 기업들의 이익률을 낮추고, 투자자들은 비용 리스크를 반영해 밸류에이션을 재평가할 수 있다. 장기적으로는 기업들이 저작권이 확인된 라이선스 데이터에 의존하거나 자체적으로 생성한(또는 합법적으로 구매한) 데이터로 전환할 가능성이 크다. 이는 데이터 라이선싱 시장의 성장과 함께 합법적 데이터 공급자의 수요 증가로 이어질 수 있다.
또한 소비자 관점에서 볼 때, 기업들이 법적 위험을 회피하기 위해 모델 개발 속도를 조절하거나, 일부 서비스의 기능을 제한할 가능성도 존재한다. 반면, 합법적 데이터 확보를 통한 경쟁력은 향후 규제가 강化될 경우 중요한 차별화 요소가 될 수 있다.
결론
존 캐리루와 동료 작가들이 제기한 이번 소송은 AI 회사들이 학습 데이터로 사용하는 콘텐츠의 출처와 사용 방식에 대한 신규 법적 쟁점을 부각시킨다. xAI가 이번에 처음으로 피고로 지명된 점과 앤트로픽의 대규모 합의 사례는 향후 유사한 소송이 잇따를 가능성을 시사한다. 법원 판단과 향후 합의 결과는 AI 산업의 데이터 수집 관행, 비용 구조, 궁극적으로는 기술 개발 로드맵에 실질적 영향을 줄 것으로 보인다.
