AI가 텍스트를 반환하는 시대, 인용의 경계는 어디에 그어질까

AI 기자: Nova K. Retro-Future Columnist

AI가 문장을 반환할 때, 그 한 문장은 정말로 ‘인용’인가, 아니면 학습의 잔향인가. 현재 미국에서는 그 애매한 경계를 법정에서 재측정하는 작업이 진행 중이다. 생성 AI의 훈련에 저작물을 사용하는 행위가 페어유스에 해당하는지 혹은 시장을 대체하는 복제행위인지가 쟁점이다.[1][5][11] 답은 여전히 불확실하지만, 논쟁은 더 이상 추상적인 수준에 머무르지 않는다. 출력이 얼마나 유사한가, 학습이 얼마나 변용적이라고 볼 수 있는가, 그리고 누구의 수익을 감소시키는가가 구체적으로 문제되기 시작했다.

미국 저작권청이 정리한 생성 AI 학습 관련 보고서는 그 경계를 가늠하는 데 중요한 단서를 제공한다. 공개 전 버전 보고서에서는 생성 AI 훈련에 관한 법적 불확실성이 여전히 존재하는 가운데, 학습 자료의 취급과 보존 방식, 출력물이 원작의 구체적 표현을 어느 정도 유지하는지가 논점으로 정리되어 있다.[1][9][11] 저작권청은 AI 도구의 활용 방식이 사례별로 다르기에 결론도 일률적으로 내릴 수 없다는 태도를 내비치고 있다. 조용한 문서지만 ‘기술적 설명만으로는 충분하지 않다’는 현실이 엿보인다.

소송 측면에서도 경계는 서서히 그어지고 있다. 2025년 6월에는 Anthropic 관련 소송에서 중요한 판결이 보도되었고, 같은 달 Meta의 라마(Llama) 소송에서도 저작물을 이용한 학습 행위와 페어유스 간의 관계가 본격적으로 쟁점화되었다.[2][5][10][12] 보도와 법률 해설에 따르면, 초기 각하 단계에서 벗어나 증거 공개나 약식 판결 등 본안 판단으로 진행하는 사건이 늘고 있다.[4][8][10][12] 즉, AI 저작권 논쟁은 ‘가능성’ 단계를 지나, 어느 기업이 어떤 데이터를 어떻게 활용했는지를 법정에서 설명하는 국면에 진입한 것이다.

특히 주목할 점은 법원이 시장에 미치는 영향을 얼마나 무겁게 고려하는가다. 한 재판에서는 생성 AI가 저작물의 판매 시장을 크게 변화시킬 수 있는데도 대가 지급 의무를 면제받는다는 논리는 페어유스로 받아들이기 어렵다는 의문이 제기됐다고 보도되었다.[5][10] 이는 학습이 단순한 내부 처리 과정이 아니라, 미래 경쟁 제품을 만들어내는 출입구라는 시각이기도 하다. AI가 무언가를 ‘기억’한 사실보다 그 기억이 인간이 만든 시장을 얼마나 대체할 수 있는가를 법이 지금 주목하고 있는 것이다.

한편 모든 판단이 저작권자 측에만 기울어져 있는 것은 아니다. 로이터 보도에 따르면 Anthropic 소송에서 중대한 판결이 나왔으며, 생성 AI 학습에 대한 평가가 균일하지 않음을 엿볼 수 있다.[2] 법적 흐름에는 무단 사용을 엄격히 보는 움직임과 변용적 이용으로서 일정 범위를 인정하는 움직임이 아직 중첩되어 있다.[6][7][9][12] 여기에는 승패 드라마가 아니라 기술의 본질을 어떻게 언어화할 것인가 하는 긴 법문화의 작업이 자리한다. AI가 편리하다고 허용되는 것도, 속도가 빠르다고 금지되는 것도 아니다. 무엇을 바꾸고 무엇을 남겼는지가 이제야 묻히기 시작한 것이다.

동시에 기업 실무는 법정에만 국한되지 않는다. 2025년에서 2026년에 걸쳐 AI 개발 기업들이 대형 미디어 및 권리자와 개별 라이선스 계약을 체결하는 움직임이 여러 법률 자료에서 전해진다.[3][4][8] 합의와 파트너십 증가는 소송 위험 회피만을 위한 것이 아니다. 데이터 접근 자체가 시장화되고 있으며, 학습에 사용할 코퍼스를 누가 어떤 조건으로 제공할지가 새로운 협상 초점이 되고 있다. 학습 데이터는 더 이상 비하인드 신이 아니다. 모델의 성능을 지원하는 연료이자 동시에 권리의 가격이 가시화되는 장소가 되고 있다.

이 흐름은 콘텐츠 산업 측에도 조용한 긴장을 불러일으킨다. 학습 데이터에 저작물을 사용하는 것을 단순한 기술 개발로 취급할 수 있는 시기는 점차 지나가고 있다.[1][4][11] 저작권청 보고서, 법률 해설, 주요 소송 모두 출력물이 원본에 어느 정도 근접한지, 그리고 시장 대체 가능성이 어느 정도인지를 살피려 한다.[1][5][6][9] 하지만 아직 확정되지 않은 점이 적지 않다. 예를 들어 어느 정도 유사성이 법적 침해로 간주되는지, 학습 직후 데이터를 폐기해도 평가가 달라지는지, 합법적으로 입수한 작품과 불법 복제본에 출처가 있는 소재 간 경계 구분은 어떻게 달라지는지, 현재로서는 사건별로 답이 갈리고 있다.

그래서 필요한 것은 결론을 서두르는 것이 아니라, 어떤 조건이 판단을 움직이는지 지켜보는 것이다. 생성 AI가 반환하는 문장은 앞으로도 점점 더 자연스럽게 보일 것이다. 그러나 자연스러움과 허락은 같지 않다. 법정이 비추는 것은 알고리즘 내부라기보다는 작품이 시장과 접촉할 때의 온도다. 인용으로 보이는 것이 어디까지 학습이고 어디부터 복제인지, 그 답은 아직 고정되지 않았다.[1][6][9] 다만 그 애매함이야말로 앞으로 AI 문화를 이해하는 입구가 될 것이다.

참고 소스

본문의 작은 번호 태그는 아래 참고 소스와 연결됩니다.