ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Anthropic Claude 15억 달러 저작권 합의, AI 학습 데이터 저작권 쟁점 분석 (2026년 2월)
    AI 트렌드 2026. 2. 4. 11:05
    반응형

    Anthropic Claude 15억 달러 저작권 합의, 미국 역사상 최대 규모 합의의 전말

    2025년 9월, AI 업계에 전례 없는 규모의 저작권 합의가 이루어졌습니다. Claude AI를 개발한 Anthropic이 저작권 침해 소송에서 15억 달러(약 2조 원)를 지급하기로 합의한 것입니다. 이번 합의는 미국 역사상 공개된 저작권 소송 중 가장 큰 규모의 보상금으로 기록되었으며, AI 산업 전반에 걸쳐 학습 데이터 조달 방식에 대한 근본적인 재검토를 촉구하고 있습니다.

    이번 합의는 단순한 금전적 보상을 넘어, AI 기업들이 대규모 언어 모델(LLM)을 학습시키기 위해 저작물을 어떻게 취득하고 활용해야 하는지에 대한 법적 기준을 제시했다는 점에서 특히 중요합니다. 합법적으로 구입한 도서의 AI 학습은 공정 이용으로 인정되었지만, 불법 취득 도서의 경우에는 공정 이용이 인정되지 않는다는 법원의 명확한 판단이 내려졌기 때문입니다.

    소송의 시작: 3명의 작가에서 50만 명 집단 소송으로 확대

    이 역사적인 소송은 2024년 8월, 세 명의 작가가 제기한 소송에서 시작되었습니다. 베스트셀러 작가 Andrea Bartz, 논픽션 작가 Charles Graeber, 그리고 저술가 Kirk Wallace Johnson이 Anthropic을 상대로 캘리포니아 북부 연방지방법원에 소송을 제기한 것입니다. 이들의 핵심 주장은 Anthropic이 자사 AI 모델인 Claude를 학습시키기 위해 불법 복제된 전자책을 대량으로 다운로드했다는 것이었습니다.

    소송 과정에서 밝혀진 바에 따르면, Anthropic은 악명 높은 불법 도서 공유 사이트인 Library Genesis(LibGen)에서 최소 500만 권, Pirate Library Mirror(PiLiMi)에서 최소 200만 권, 총 700만 권 이상의 도서를 무단으로 다운로드한 것으로 드러났습니다. 이는 BitTorrent 프로토콜을 통해 이루어졌으며, 회사 차원에서 조직적으로 진행된 것으로 확인되었습니다.

    초기 3명의 원고로 시작된 이 소송은 집단 소송(Class Action)으로 확대되면서 약 50만 명의 저작권자를 대표하는 대규모 소송으로 발전했습니다. 법원이 집단 소송 자격을 인정함에 따라, Library Genesis와 Pirate Library Mirror에서 불법 다운로드된 약 50만 권의 도서 저작권자들이 모두 소송의 당사자로 포함되었습니다.

    법원의 중요한 판결: 합법 취득과 불법 취득의 구분

    2025년 6월, 캘리포니아 북부 연방지방법원의 William Alsup 판사는 AI 저작권 소송 역사에서 가장 중요한 판결 중 하나로 기록될 결정을 내렸습니다. 이 판결은 AI 학습에서의 저작권 문제에 대해 두 가지 상반된 결론을 도출했습니다.

    첫째, Alsup 판사는 Anthropic이 합법적으로 구입한 도서를 AI 학습에 사용한 것은 "본질적으로 변형적 이용(quintessentially transformative)"에 해당한다고 판시했습니다. 이는 저작권법상 공정 이용(Fair Use)으로 보호받을 수 있다는 의미입니다. 실제로 Anthropic은 일부 도서를 정식으로 구매한 후 제본을 해체하고 각 페이지를 스캔하여 디지털 파일로 변환한 뒤 학습에 사용한 바 있습니다.

    그러나 둘째로, 판사는 불법 복제 사이트에서 다운로드한 도서를 영구적으로 보관하고 이를 학습에 사용한 행위는 공정 이용에 해당하지 않는다고 판단했습니다. 판사는 도서의 취득 행위와 AI 모델 학습 행위를 별개의 단계로 구분하여 각각 공정 이용 여부를 판단해야 한다고 설명했습니다. 불법적인 경로로 저작물을 취득한 경우, 그 이후의 학습 행위가 변형적이라 하더라도 공정 이용을 주장할 수 없다는 것입니다.

    이 판결은 AI 업계에 명확한 메시지를 전달했습니다. AI 학습 자체는 합법적일 수 있지만, 학습 데이터의 출처가 합법적이어야 한다는 것입니다. 합법적인 경로로 저작물을 취득할 수 있는 방법이 존재하는 경우, 개발자는 반드시 그 경로를 따라야 합니다.

    15억 달러 합의의 구체적 내용과 보상 기준

    2025년 8월 말, Anthropic은 원고 측과 15억 달러 규모의 합의에 도달했습니다. 이는 미국 저작권 소송 역사상 공개된 합의금 중 가장 큰 규모입니다. 합의금은 총 4회에 걸쳐 분할 지급될 예정이며, 구체적인 일정은 다음과 같습니다.

    지급 회차 지급 일정
    1차 지급 2025년 10월 2일
    2차 지급 2026년 4월 30일
    3차 지급 2026년 9월 25일
    4차 지급 2027년 9월 25일

    보상 기준은 도서당 약 3,000달러(약 400만 원)로 산정되었습니다. 이 합의의 대상이 되는 저작물은 약 50만 권으로, Library Genesis와 Pirate Library Mirror에서 불법 다운로드된 것으로 확인된 도서들입니다. 각 저작권자는 자신의 저작물이 불법 다운로드 목록에 포함되어 있는지 확인하고 보상 청구를 신청할 수 있습니다.

    15억 달러의 합의금 중 변호사 비용은 25%인 3억 7,500만 달러로 예상되며, 행정 비용과 원고 3인에 대한 각 5만 달러의 특별 보상이 별도로 책정되었습니다. 나머지 금액이 저작권자들에게 배분될 예정입니다.

    이번 합의의 중요한 특징 중 하나는 합의가 과거 행위에 대한 것으로 한정된다는 점입니다. Anthropic은 향후 AI 학습에 대한 라이선스를 얻은 것이 아니며, 2025년 8월 25일 이후 발생하는 저작권 침해에 대해서는 별도의 청구가 가능합니다. 또한 AI 모델의 출력물에 기반한 저작권 침해 청구는 과거와 미래를 불문하고 이번 합의 대상에서 제외됩니다.

    합의 조건의 일환으로, Anthropic은 Library Genesis와 Pirate Library Mirror에서 다운로드한 원본 파일과 그 복사본을 모두 삭제하기로 했습니다. 보상 청구 마감일은 2026년 3월 30일이며, 합의 이의 신청 및 탈퇴 마감일은 2026년 1월 29일이었습니다.

    연방 판사의 예비 승인 보류와 최종 승인 심리

    다만 이번 합의는 아직 최종 확정되지 않았습니다. William Alsup 판사는 합의안에 대한 예비 승인을 보류하며, 합의의 실행 가능성에 대해 추가 정보를 요청했습니다. 판사는 합의안이 "불완전"하다는 우려를 표명하며, 보상 분배 방식의 구체적인 실현 가능성을 검토하고 있습니다.

    최종 승인을 위한 공정성 심리(Fairness Hearing)는 2026년 4월 23일로 예정되어 있습니다. 이 심리에서 법원은 합의가 모든 집단 소송 참여자들에게 공정하고 적절한지, 그리고 실제로 실행 가능한지를 최종 판단하게 됩니다. 만약 중대한 이의 신청이 없고 법원이 합의를 승인한다면, 이는 AI 시대의 가장 중요한 저작권 합의로 기록될 것입니다.

    2026년 1월, 음악 출판사들의 새로운 30억 달러 소송 제기

    저작권 문제가 해결되기도 전에 Anthropic에 새로운 법적 위기가 찾아왔습니다. 2026년 1월 29일, Universal Music Group, Concord Music Group 등 주요 음악 출판사들이 Anthropic을 상대로 30억 달러(약 4조 원) 규모의 새로운 저작권 소송을 제기한 것입니다. 이는 미국 역사상 비집단 소송(non-class action) 중 가장 큰 규모의 저작권 소송이 될 수 있습니다.

    음악 출판사들의 주장에 따르면, Anthropic은 2만 건 이상의 저작권 보호 음악 저작물(악보, 가사, 음악 작품 포함)을 무단으로 다운로드하여 Claude 모델 학습에 사용했습니다. 여기에는 "Wild Horses", "Sweet Caroline", "Bennie and the Jets", "Eye of the Tiger" 등 유명 곡들이 포함되어 있습니다.

    흥미로운 점은 음악 출판사들이 2023년 10월에 이미 500곡에 대한 소송을 제기했었다는 것입니다. 그러나 Bartz v. Anthropic 소송의 증거 개시(Discovery) 과정에서 Anthropic이 수천 곡의 음악 저작물을 추가로 불법 다운로드했다는 증거가 발견되면서, 기존 소송을 40배 확대한 새로운 소송이 제기된 것입니다.

    이번 소송에서 특히 주목할 점은 Anthropic 공동창업자들이 직접 불법 다운로드에 관여했다는 주장입니다. 소장에 따르면, 공동창업자 Benjamin Mann이 직접 불법 토렌트 활동에 참여했으며, CEO Dario Amodei도 이러한 행위를 논의하고 승인했다고 합니다. 또한 소송은 Claude 4.5 Sonnet, Claude 4.5 Haiku, Claude 4.5 Opus 등 최신 모델들이 음악 저작물을 기억하도록 학습되어 저작권 침해 가사를 출력한다고 주장하고 있습니다.

    AI 기업의 학습 데이터 조달 방식 변화 전망

    Bartz v. Anthropic 판결과 합의는 AI 산업 전반에 걸쳐 학습 데이터 조달 방식의 근본적인 변화를 예고하고 있습니다. 15억 달러라는 합의금 규모는 불법 경로를 통한 데이터 취득이 얼마나 큰 비용을 초래할 수 있는지를 명확히 보여주었습니다. 이는 특히 자금력이 부족한 중소 AI 기업들에게 시장 진입 장벽으로 작용할 수 있습니다.

    미국 저작권청은 최근 발표한 보고서에서 자발적 라이선싱이 AI 학습 데이터 문제의 바람직한 해결책이라고 제시했습니다. 보고서는 일부 AI 시스템이 이미 라이선스된 저작물이나 퍼블릭 도메인 저작물만으로 학습되고 있다고 언급하며, 이러한 접근 방식이 확대되어야 한다고 권고했습니다. 다만 개별 저작권자를 식별하고 조건을 협상하는 것이 어렵다는 현실적 과제도 인정했습니다.

    집단 관리 단체(CMO)를 통한 일괄 라이선싱이 대안으로 부상하고 있습니다. CMO는 거래 비용을 줄이고 대규모 데이터셋에 대한 라이선싱을 용이하게 할 수 있습니다. 미국 작가 협회(Authors Guild)는 이번 합의가 AI 기업들이 저작권자에게 정당한 대가를 지불해야 한다는 선례를 확립했다고 평가하며, 향후 라이선싱 협상에서 저작권자들의 협상력이 강화될 것으로 전망했습니다.

    유럽연합 AI법의 2026년 시행과 글로벌 규제 강화

    미국에서의 판례 형성과 별도로, 유럽연합(EU)에서는 AI법(AI Act)이 2026년부터 본격 시행되면서 학습 데이터에 대한 규제가 한층 강화되고 있습니다. EU AI법에 따르면 모든 범용 AI 모델 제공자는 학습에 사용된 데이터셋의 요약본을 공개해야 합니다.

    더욱 중요한 것은 EU 저작권 지침에 따라 저작권자들이 자신의 저작물을 AI 학습에 사용하지 못하도록 유보(opt-out)할 수 있는 권리가 강화되었다는 점입니다. 2026년부터 AI 개발자들은 데이터 소스나 웹사이트에 저작권 유보 표시가 있는지 확인하고, 해당 콘텐츠를 제외하거나 라이선스를 취득해야 합니다. 웹 스크래핑과 무허가 데이터 마이닝은 더 이상 유럽에서 모호한 영역으로 남아있지 않게 되었습니다.

    이러한 글로벌 규제 환경의 변화는 AI 기업들에게 학습 데이터 조달의 투명성과 합법성을 더욱 엄격하게 요구하고 있습니다. AI 산업 전문가들은 이번 사건을 음악 산업의 "냅스터 모멘트"에 비유하며, 대규모 데이터 스크래핑 문제가 민간 합의, 라이선싱 거래, 소액 결제 시스템의 조합을 통해 해결될 것으로 전망하고 있습니다.

    AI 저작권 분쟁의 시사점과 향후 전망

    Bartz v. Anthropic 사건은 AI 산업의 저작권 문제에 대해 여러 가지 중요한 시사점을 제공합니다. 첫째, 법원은 AI 학습 자체를 변형적 이용으로 인정했지만, 학습 데이터의 출처가 합법적이어야 한다는 명확한 기준을 제시했습니다. 이는 향후 유사한 소송에서 중요한 선례로 작용할 것입니다.

    둘째, 15억 달러라는 합의금 규모는 저작권 침해의 경제적 위험성을 여실히 보여줍니다. AI 기업들은 단기적인 비용 절감을 위해 불법 데이터를 사용하는 것이 장기적으로 훨씬 더 큰 비용을 초래할 수 있다는 점을 인식해야 합니다. 자체 모델을 구축하는 기업들은 모든 학습 데이터가 합법적으로 조달되었는지 반드시 확인해야 합니다.

    셋째, 음악 출판사들의 추가 소송에서 볼 수 있듯이, 저작권 문제는 도서에 국한되지 않습니다. 음악, 이미지, 영상 등 다양한 형태의 저작물에 대해 유사한 소송이 연이어 제기될 가능성이 높습니다. 2026년에도 저작권은 AI 분야의 주요 법적 쟁점으로 남을 것입니다.

    AI 기술의 발전과 저작권 보호 사이의 균형을 찾는 것은 앞으로도 계속될 과제입니다. Anthropic 사례는 기술 혁신이 기존 법적 프레임워크 내에서 이루어져야 하며, 저작권자의 권리가 존중되어야 한다는 점을 명확히 했습니다. 합법적인 라이선싱, 투명한 데이터 출처 공개, 저작권자와의 공정한 보상 협상이 AI 산업의 지속 가능한 성장을 위한 필수 요건이 되고 있습니다.

    반응형
Designed by Tistory.