AI 학습데이터 무단 사용에 대한 저작권 보호 방안
Copyright Protection Against Use of copyrighted Works Without Permission in AI Machine Learning: Focused on Introducing Blockchain-Based Extended Collective Licensing System
- 한국저작권위원회
- 계간 저작권
- 146호(37권 2호)
- 2024.06
- 79 - 121 (43 pages)
저작물을 학습데이터로 사용하는 문제에 대하여, 두 가지 입장이 대립되고 있다. AI산업의 발전을 위해 무상 이용을 합법화하자는 주장과, 창작에 대한 인센티브 감소 등을 이유로 저작물이 함부로 이용되어서는 안 된다는 주장이다. 생성형 AI는 인간 저작물을 통한 학습을 토대로 문학적, 예술적 결과물을 훨씬 빠르고 저렴하게 제공하므로, 인간저작자는 대체될 수 있는 위험에 처해있다. 이와 같은 현실에서 창작자의 정신적 노력의 산물에 무임승차 하는 것을 ‘사회적 이익’이라는 이름으로 정당화할 수 있을 것인지에 대한 고민이 필요한 시점이다. 이에 공정이용 법리의 적용이나 TDM 예외규정의 입법을 통한 저작물의 무상 이용정책보다는, 저작권자에 대한 적절한 보상방법을 강구함으로써 저작권자와 AI 개발자, 이용자 간 이익의 균형을 유지할 수 있는 본질적인 해결책이 필요하다고 본다. 본 논문에서는 AI 학습데이터로 저작물을 무단 이용하는 문제를 해결할 수 있는 새로운 해법으로 ‘확대된 집중관리제도(Extended Collective Licensing)’를 도입할 것과 블록체인기술을 활용한 저작권 거래 시스템을 확립할 것을 제언한다. 저작권 라이선싱은 저작권소유자에 대한 공정한 대우를 보장하고, AI 서비스를 사용하는 기업에 법적 안정성을 제공하며, 산업발전을 가속화 할 수 있는 효과적인 메커니즘이다. 특히 전 세계적으로 머신러닝 목적으로 사용되었거나 사용될 수 있는 저작물에는 수많은 저작권자들이 존재하기 때문에, 확대된 집중관리제도의 적용은 AI를 훈련하는 데 사용되는 저작물을 투명하게 관리하고 저작권법이 추구하는 정당한 대가를 분배하기 위한 AI 시대의 가장 논리적인 대응이라 할 수 있다.
Regarding the issue of using copyrighted works as training data, there are two conflicting claims. One is that free use should be legalized for the development of the AI industry, and the other is that copyrighted works should not be used without permission due to reducing incentives for creation. Generative AI provides literary and artistic outputs much faster and cheaper based on learning from human works, putting human authors at risk of being replaced. In this situation, it is time to consider whether it is reasonable to justify free riding on the works that the creator achieved with a great deal of effort in the name of ‘the social benefit’. Rather than applying fair use doctrine or legislating TDM exception, an substantial solution is required that can maintain the balance between copyright holders, AI developers, and users, such as finding appropriate rewards system. In this paper, I suggest to introduce ‘Extended Collective Licensing (ECL) System’ as a new solution to resolve problems caused by use of copyrighted works without permission and establish a copyright trading system based on blockchain technology. Copyright licensing is an effective mechanism to ensure legitimate rewards to copyright holders, provide legal stability to users and developers of AI services, and accelerate industrial development. Because there are numerous copyright holders worldwide for works that have been used or may be used for machine learning purposes, the adoption of an Extended Collective Licensing System can be said to be the most logical response in the AI era. This system will manage transparently copyrighted works used in AI machine learning and distribute fair compensation guaranteed by copyright law.
I. 서론
II. 데이터마이닝의 속성과 저작권침해 가능성
III. AI 학습에 저작물 사용에 대한 법률상 해석
IV. 학습데이터 무상 이용의 합법화에 따른 문제
V. 정책적 대안