This study analyzes the legal, economic, and technological fairness issues arising throughout the training processes of generative artificial intelligence (AI), particularly in relation to creators’ rights, data collection practices, and the overall technological structure. Although the vast majority of data collected by AI models consists of copyrighted works, current practices largely lack mechanisms for consent, compensation, and transparency necessitating a new normative standard of fair generation. In this study, fair generation refers to a state in which the entire process of data collection, training, and content generation satisfies legal fairness (preventing rights violations and ensuring due process), technological fairness (ensuring transparency of data sources and usage, and guaranteeing creators’ rights to consent or refuse), and economic fairness (ensuring that the benefits of technological development are equitably distributed among creators and society at large). The study critically examines the limitations of existing copyright frameworks particularly the doctrines of fair use and text and data mining (TDM) exceptions in addressing the structural characteristics of generative AI training, with a focus on how the economic rights of content creators, such as journalists, are being infringed in the AI era. Drawing on Germany’s copyright regime and journalist protection measures, it argues that the legal legitimacy of AI use alone is insufficient; the value of creative labor must be fairly shared in the process of technological advancement. Based on this analysis, the study proposes the legal, technical, and economic conditions necessary to ensure that generative AI content is produced in a socially just and sustainable manner, and calls for institutional restructuring and broader societal consensus to realize fair generation.
한국어
이 연구는 생성형 인공지능(Generative AI)의 학습 과정이 창작자 권리, 데이터 수집 방식, 기술 구조 전반에 걸쳐 어떤 법적, 경제적, 기술적 공정성 문제를 야 기하는지를 분석한다. 특히 AI 모델이 대규모로 수집하는 데이터가 대부분 저작권 보호를 받는 창작물임에도 불구하고, 이에 대한 동의, 보상, 투명성 확보가 결여 된 현실은 ‘공정한 생성(fair generation)’이라는 새로운 규범적 기준을 요구한다. 본 연구에서 말하는 ‘공정한 생성’이란 AI의 적법성 여부를 넘어, 데이터 수집·학 습·콘텐츠 생성 전 과정이 법적 공정성(권리 침해 방지와 절차적 정당성), 기술적 공정성(데이터 출처와 사용 방식의 투명성 및 창작자의 동의·거부권 보장), 경제적 공정성(기술 발전의 이익이 창작자와 사회 전체에 공평하게 분배되는 구조)을 동시에 충족하는 상태를 의미한다. 본 연구는 기존의 저작권법상 공정이용(fair use) 이나 텍스트 및 데이터 마이닝(TDM) 예외 조항이 생성형 AI 학습과정의 구조적 특성을 반영하지 못함을 비판적으로 고찰하며, 특히 저널리스트와 같은 콘텐츠 창 작자의 저작재산권이 AI 시대에 어떻게 침해되고 있는지를 분석한다. 또한, 독일의 저작권 제도 및 언론인 보호 사례를 통해, AI 기술의 활용이 단지 법적 정당성만 으로는 충분하지 않으며, 창작 노동의 가치가 기술 발전 과정에서 공정하게 분배되어야 함을 강조한다. 이를 바탕으로 본 연구는 생성형 AI 콘텐츠가 사회적으로 정 당하고 지속 가능하게 생성되기 위해 필요한 법적·기술적·경제적 조건을 제시하며, ‘공정한 생성’을 위한 제도적 재구성과 사회적 합의의 필요성을 제언한다.
목차
요약 Abstract I. 들어가며 II. 공정이용과 저작권법: 법적 공정성의 한계 1. 국내 저작권법과 공정이용 2. 미국의 저작권법과 공정이용 3. 유럽연합의 저작권법과 TDM 예외 III. 생성형 AI의 학습 메커니즘과 저작권 침해구조 1. TDM과 머신러닝 기술 2. 생성형 AI 모델 학습은 저작권 침해이다 IV. 창작자의 권리와 경제적 공정성: 저널리스트의사례 1. 경제적 공정의 필요성 2. 독일 언론인의 저작권 사례 3. 국내 언론인의 저작권 V. 결론 참고문헌
키워드
인공지능 콘텐츠저작권법공정이용텍스트 데이터 마이닝저널리스트의 권리AI-generated contentcopyrightfair usetext and data miningrights of journalists