엘스비어 등 주요 출판사들, AI 학습용 저작권 침해 혐의로 메타 제소

엘스비어(Elsevier), 센게이지(Cengage), 아셰트(Hachette), 맥밀란(Macmillan), 맥그로힐(McGraw Hill) 등 주요 출판사들이 메타 플랫폼스(Meta Platforms)를 상대로 맨해튼 연방법원에 집단소송을 제기했다는 소식이다. 출판사들은 메타가 자사 서적과 학술 논문을 무단으로 사용해 대규모 언어 모델Llama를 학습시켰다고 주장한다.

2026년 5월 5일, 로이터 통신의 보도에 따르면, 이번 소송은 저작권자들을 대표하는 제안된 집단소송(putative class action) 형태로 제출되었으며 원고 측에는 소설가 스콧 투로우(Scott Turow)도 포함되어 있다. 소송장에서는 메타가 수백만 건에 달하는 저작물을 불법적으로 복제·수집해 대형 언어 모델의 학습 데이터로 활용함으로써 저작권을 침해했다고 명시되어 있다.

“AI는 개인과 기업에게 혁신과 생산성, 창의성을 제공하고 있으며, 법원은 저작권이 있는 자료를 AI 학습에 사용하는 것이 공정 이용(fair use)에 해당할 수 있다고 판단해 온 바 있다.”

메타 대변인은 화요일 발표한 성명에서 이렇게 밝히고 “우리는 이 소송에 대해 강력히 대응할 것”이라고 덧붙였다.

원고 측은 메타가 교과서부터 과학 논문, 소설에 이르기까지 광범위한 저작물을 무단으로 수집했다고 주장했다. 소송장에는 N.K. Jemisin의 “The Fifth Season”과 피터 브라운의 “The Wild Robot” 같은 작품들이 예시로 거론되어 있다. 출판사들은 법원에 더 넓은 범위의 저작권자들을 대표할 수 있도록 허가해달라고 요청했으며, 금전적 손해배상 액수는 특정하지 않은 채 청구했다.

미국출판협회(Association of American Publishers)의 회장 마리아 팔란테(Maria Pallante)는 성명에서 “메타의 대규모 침해는 공적 진보가 아니며, 기술 기업이 학문과 상상력을 무단 복제하는 사이트를 우선시하는 한 AI는 제대로 실현될 수 없다.”


본 사건은 창작자들과 기술 기업들 간 AI 학습을 둘러싼 저작권 분쟁의 새로운 장을 연다. 이미 여러 저자, 언론사, 시각예술가 등 수십 명의 원고들이 메타, 오픈AI(OpenAI), 앤트로픽(Anthropic) 등을 상대로 유사한 침해 소송을 제기해 왔다. 법적 쟁점의 핵심은 AI 시스템이 저작권으로 보호되는 자료를 학습에 사용함으로써 그 사용이 ‘공정 이용(fair use)’에 해당하는지 여부다.

법원 판단은 사례별로 갈렸으며, 기사에서는 지난해 이 문제를 심리한 초창기 두 판사가 서로 다른 판결을 내렸다고 지적했다. 이러한 판결의 불확실성은 향후 항소와 더 광범위한 법리 해석을 예고한다.

한편, 앤트로픽(Anthropic)은 이번 분쟁에서 선제적 합의를 체결한 첫 주요 AI 기업이다. 앤트로픽은 아마존과 구글의 지원을 받은 업체로, 작년 한 작가 그룹과의 집단소송을 해결하기 위해 15억 달러(약 1조원대)를 지급하는 조건으로 합의했다. 이 합의는 유사 소송에서 기업들이 막대한 금전적 부담을 질 수 있음을 극명하게 보여준다.


용어 설명

대규모 언어 모델(LLM, Large Language Model)은 방대한 텍스트 데이터를 기반으로 인간의 언어를 이해하고 생성하는 인공지능 시스템을 말한다. LLM은 인터넷에 공개된 자료, 디지털 도서, 학술 논문 등 다양한 소스에서 수집된 데이터로 학습되며, 이렇게 학습된 모델은 인간의 질문에 응답하거나 텍스트를 생성하는 데 사용된다. 특히, 이번 소송에서 문제가 된 ‘Llama’는 메타가 개발한 LLM 계열의 모델명이다.

공정 이용(fair use)은 미국 저작권법 상의 예외 규정으로, 교육·연구·비평·뉴스 보도 등 공익적 목적을 위해 저작물을 제한적으로 사용할 수 있도록 허용하는 개념이다. 법원은 공정 이용 여부를 판단할 때 사용 목적, 저작물의 성격, 사용된 분량과 질, 사용이 저작물의 시장에 미치는 영향 등 여러 요소를 종합적으로 고려한다.


전문가 분석 및 향후 전망

이번 소송은 AI 분야의 법적 불확실성을 다시 드러내며, 기술 기업의 데이터 수집 관행과 출판권 보유자들의 권리 보호 사이의 균형 문제를 중심으로 전개될 것이다. 법적 판단이 기업의 AI 학습 방식에 직접적인 규제 효과를 미칠 가능성이 크다. 만약 법원이 출판사 측의 손을 들어 저작권 침해로 판결할 경우, AI 기업들은 학습 데이터 확보를 위해 저작권자와의 라이선스 협상에 더 큰 비용을 지불해야 할 가능성이 높다.

이로 인한 경제적 파급 효과는 다음과 같이 요약될 수 있다. 첫째, AI 모델 개발 비용의 상승으로 인해 신규 투자 유입 구조가 변화하고, 일부 스타트업이나 연구 중심 기업은 자금 조달과 사업화 전략을 재검토하게 될 수 있다. 둘째, 기업들이 저작권자들과의 라이선스 계약을 통해 정식으로 데이터를 확보할 경우, 콘텐츠 제공자들에게는 새로운 수익원이 창출될 수 있다. 셋째, 소비자 서비스의 가격 구조에는 장기적으로 상향 압력이 생길 수 있으나, 이는 기술 효율화와 시장 경쟁으로 일부 완화될 여지도 있다.

법적 불확실성은 투자자 심리에 영향을 줄 수 있으며, 기술주와 출판업계 주가의 변동성을 야기할 가능성이 있다. 또한 이번 소송은 향후 관련 법률과 규제의 정비를 촉발할 수 있어, 기업들은 소송 결과와 더불어 규제 동향을 면밀히 모니터링해야 한다.


결론

엘스비어 등 주요 출판사들의 이번 제소는 AI 학습과 저작권의 충돌을 대표하는 사건으로, 향후 법원의 판단은 AI 산업 전반의 데이터 사용 관행과 비용 구조를 재편할 수 있다. 원고와 피고 양측 모두 이번 소송의 향방이 향후 수년간의 법적·경제적 판도를 좌우할 수 있음을 인지하고 있으며, 소송 과정과 판결 결과는 AI 생태계의 운영 방식에 중요한 선례가 될 전망이다.