自序
從2022年底OpenAI的聊天機器人ChatGPT(GPT-3.5)問世後,立即席捲全球掀起一股「生成式AI」(Generative AI)熱潮(以下稱GAI)。這項被譽為繼全球資訊網(World Wide Web)以來最具顛覆性的技術革新,迅速進入人們的工作與生活。然而,隨著這波GAI的廣泛應用,其於訓練過程中大量爬取網路資料,也引爆前所未有的著作侵權爭訟,幾乎所有AI大咖,如OpenAI、Meta、Microsoft、Nvidia、Midjourney、Stability AI、Anthropic與Perplexity AI等,無一倖免都成為被告。
目前全球已出現近50件未經授權,擅自使用他人著作內容,進行模型訓練之著作權官司。涉案標的涵蓋文字(小說、新聞)、圖形影像(繪畫、攝影)、音樂(詞曲與錄音)、影音視頻乃至開源碼。這些爭訟從2022年底起最初集中於美國,隨後延燒至英、德、法、加拿大等國,而中國則更早於2019年就已有騰訊訴訟,GAI興起後也有好幾件案例;然後再擴展至亞洲之印度與韓國等,形成全球之著作權訴訟風暴。
筆者自2023年起,開始整理這波GAI訴訟,起初聚焦於美國多起具指標性的案件,然而隨著訴訟戰火擴展至各地,成為AI發展與全球智財體系間的重大衝突。因此筆者擴大範圍,將國際間已發生之侵權案例進行綜合分析整理,全面彙整全球迄今GAI著作權訴訟,挑選其中具代表性的撰擬;並針對各國法律適用,提供縱深探討與比較視角。此外,本書不但聚焦於GAI實體法之智財議題,更進而揭開首波AI訴訟中程序法扮演的關鍵角色。
目前各國著作權法面對AI的訓練與生成過程,其適用與解釋均遭遇重大挑戰。大多數國家未針對GAI明確規範,因此法院只能依現行著作權法加以詮釋,其核心問題多集中於:AI生成內容是否具著作權保護適格?其訓練過程「向量嵌入」之資料轉化處理是否等同於複製?GAI生成內容是否係衍生著作?AI工具提供商是否構成直接或間接侵權(代理侵害與輔助侵害)?GAI如構成侵權時使用者是否侵權人?AI工具開發商是否構成合理使用?而這些問題至今都尚無全球共識。有鑑於此,2025年5月,美國著作權局發布第三部分之「生成式AI訓練與合理使用報告」;而歐盟智慧財產局(EUIPO)也發布「從著作權觀點看生成式AI之發展」。
從案例中可看出,所有的Transformers預訓練模型如ChatGPT、Llama、Claude、Gemini和Grok 3等,業者已捨棄傳統事先取得授權的模式,而是「先斬」(不告而取)「後奏」﹝被告了之後才主張合理使用(fair use),且強調構成「轉化性使用」(transformative use)。然而,這種策略雖降低開發成本,卻實質挑戰傳統著作權法中的既有原則;更何況合理使用抗辯,基本上有其局限性,並非得任意擴張。惟面對原告主張之大規模未經授權擷取、已產生代替市場效應等,卻仍具高度爭議性。
有些國家意識到在AI衝擊之下,此種大量擷取數據的必要性。例如日本在2018年即修法,明定非基於欣賞或享受之機器學習,可不經授權使用著作,前提是用於資訊處理且不侵害著作權人正當利益。這樣的條文設計為AI發展鋪路,但也引發範圍過寬且條文語意不夠具體明確等疑慮。相較之下,美國則仍維持保守立場,以個案方式判定合理使用與否(但歐盟等就文本與資料探勘,已有複製例外限制之立法)。
本書延續筆者過去出版之AI智財系列,這次系統化地整理全球GAI相關著作侵權案(並涵蓋其他重大爭議,如GPT4o吉卜力風波、DeepSeek蒸餾爭議等),力求全面蒐集、歸納並彙整迄今的訟案,儘管大多尚未終局判決,但二造的爭點與法律攻防,已呈現對現行智財法制度之挑戰。透過這些先端爭議之剖析,可窺得未來立法或修法方向與可能因應。
台灣目前尚未出現GAI侵權訴訟,可能因產業規模與內容創作密度尚未形成直接對抗的局面,惟隨著生成式AI應用日益普及,國內相關業者不可避免地終將面對類似法律風險,宜未雨綢繆及早建構合理使用準則機制,筆者也提供我國因應GAI應否修改著作權法之芻見。
總之,GAI所引發的訴訟,不僅挑戰著作權法的界限,更反映出科技進展與法律治理之間日益擴大的落差。本書作為首部聚焦全球AI著作權侵害案例之專書,依各國發展趨勢探索此一變局,希冀藉由書中梳理與比較之觀察視角,供各界理解此一新興科技與智財權交錯的複雜樣貌,並為未來智財權與AI科技的共存制度改革,提供可資參考的具體借鑑。惟筆者不揣淺陋擬以個人之力探勘舉世官司,勢必有所疏漏,尚祈見諒。筆者要特別感謝因子數據共同創辦人許正乾顧問,與筆者合作完成本書第一篇「談OpenAI指控DeepSeek侵權──剽竊 v. 創新?」。
陳家駿
2025年6月