袁如陵
2024-11-09發佈
AI 發展該大於創作保護嗎?日本有何啟示?
生成式 AI 的崛起引發全球關注,但同時也令許多創作者擔憂。日本繪師 jima 的案例顯示,創作者的作品有可能被用於 AI 訓練,生成相似風格且獲取商業利益。各國,包括歐盟,日本,正採取法律行動或制定規範以保護創作者權益。台灣在這方面的關注度相對較低,但 AI 發展仍需平衡創作權益與產業發展。未來,台灣可以參考日本等國的應對方式,打造更健全的法律體系。
生成式 AI 在全球掀起風潮,但各地創作者卻對此感到擔憂。
2024 年 7 月,日本知名繪師 jima 表示,自己的作品被他人拿來訓練 AI 模型,還被用來生成與自己風格雷同的作品。這個 AI 模型不但被公開分享,還直接被命名為 jima。之後生成的繪畫作品,更被網友拿來營利使用,甚至在社群媒體上獲得 10 萬以上的按讚數。
類似的事情幾乎每天在世界各地上演。但許多 AI 開發商卻宣稱,取用網路上的公開資料是一種「合理使用」,並將訓練 AI 形容為「人類讀書」。
這樣的比喻真的恰當嗎?既有的法律制度,能否繼續保障創作者的利益?
日本的相關發展,有什麼我們可以借鏡的地方呢?
保障創作者利益,是各國政府無法迴避的議題
在網路上,有許多藝術家公開反對 AI,例如一個名為「藝術家反對生成式 AI」(Artists Against Generative AI)的臉書社團,就號召了超過 15 萬的成員加入。在 YouGov 的調查中,當美國人被問到對生成式 AI 的感受,49% 的受訪者感到擔心,22% 甚至覺得恐懼。
這股反對力量也開啟了法律行動。AI 大廠如 OpenAI、Meta、Midjourney 正於美國面臨諸多來自藝術家、新聞媒體的訴訟。為應對社會大眾的反彈聲浪,像是歐盟即推出 AI 法案來規範人工智慧的各種應用。
不過實際上,各國政府仍對 AI 監管感到兩難;沒有一個國家願意出手,深怕一不小心阻撓了 AI 發展,而使自己的國家在這火熱的軍備競賽中落隊。然而,若忽視社會各界對 AI 的不滿情緒,只會讓這名為「著作權」的壓力鍋,一步步逼近極限。
最糟的情況是,AI 廠商若無法自我約束,且政府也欠缺規範來引導,最終只能在法院與創作者正面衝撞。若法官在公眾的期待下,宣判 AI 公司擅自使用他人創作的行為侵犯了著作權,即可能造成過去訓練 AI 所投入的龐大成本難以回收,形成兩敗俱傷的局面。
在臺灣,為何本議題鮮少受到關注?
背後原因或許有些可悲。一是主流 AI 模型大多是以英文資料訓練而成,未用到台灣的本土資料。二是台灣既沒有歐美的迪士尼、華納兄弟、Netflix 等媒體公司,也沒有日本強大的動漫產業,自然也不會有太多作品面臨侵權的問題。
另外,近年我國各界更關注反詐騙、隱私、國安等 AI 應用層面的問題,也或多或少掩蓋掉前述議題的能見度。
不過試想,若有一個 AI 應用違反當地法律,頂多是停止服務,但當 AI 模型本身侵權,則會影響到所有奠基於此模型的 AI 工具,而目前主要的 AI 公司如 OpenAI、Meta 都身陷著作權官司當中,臺灣日後豈能不受影響?
台灣的 AI 基本法已在 2024 年 7 月推出草案,然而內容果然相當「基本」,只提供了政策的概略方向;也就是說,除了宣示效果外,許多問題仍懸而未決。尤其在著作權議題上,更是隻字未提。
日本與台灣一樣,缺乏強大的跨國媒體集團或是本土的社群平台。不過由於動漫文化及電玩產業興盛,該等產業在這波 AI 浪潮也受到不小的衝擊,因此日本的應對方式,或許可供台灣政府未來參考。
日本官方致力打造規範框架
為了盡早打造健全的 AI 發展環境,日本經濟產業省在在徵集各方意見後,於 2024 年 4 月公布了「AI 廠商準則」(AI事業者ガイドライン,AI Guidelines for Business),以供 AI 開發商參考。
緊接著日本文化廳也在 2024 年 5 月發布了「日本人工智慧與著作權的一般理解」(General Understanding on AI and Copyright in Japan,以下簡稱「AI 報告」)。日本政府以此讓外界理解 AI 時代下應如何詮釋著作權法,並讓企業有所依循。
前述廠商準則或 AI 報告,無論是從開發角度提供建議,或從《著作權法》的角度解釋,說明生成式 AI 在什麼情況下可能引發侵權行為,雖沒有直接的法律效力,但可一窺日本政府對於生成式 AI 的態度,進一步預測未來立法趨勢,頗值得細細品味。
創作權益與公共利益,不可偏廢
為了傳播知識與保障創作自由,各國的著作權法,都會允許第三方有限度地使用具有著作權的作品。例如老師在課堂上,可以為了教育目的擷取文章內容給學生閱讀討論;新聞媒體也能引用他人的創作,以利報導。
日本的《著作權法》也不例外,提供了公眾運用作品的彈性空間。依據該法,只要不是以「享受著作」為目的(受し又は他人に享受させることを目的としない場合,non-enjoyment purpose),就可以在一定程度內利用著作。
所謂「享受著作」,可以理解為「閱讀」小說、「聆聽」音樂、「執行」電腦程式、「觀賞」電影等行為。反之,「下載電影來分析不同時期的電影主題」,就不屬於「享受」目的了。過去十多年常聽到的大數據分析,由於只是從資料中獲取有意義的資訊,也屬於此類豁免,以保障研究自由。
然而這樣的豁免條款,也有附帶條件,即「不 能損害著作權人利益(著作権者の利益を不当に害することとなる場合)」。
換句話說,使用著作時,不能影響到創作者該拿的好處。前述 AI 報告中也特別提醒,會不會損害著作權人利益,需要考量「是否會在市場上與原作品競爭」和「是否會阻礙原作品未來的潛在銷售管道」。
使用 AI 的哪個階段,可能會侵犯著作權?
前述 AI 報告中,日本官方將有潛在風險的行為,拆分為二階段:
(一)開發及訓練階段
這是指為了訓練 AI 而蒐集、複製作品,以及使用那些資料來訓練 AI的行為。目前 AI 的訓練資料大多來自網路上的公開資料,但必須要特別小心以下三種資料來源:
- 盜版書籍或是非法網站上的影音資料,絕對不能拿來訓練 AI,否則有非常高機率侵害著作權。
- 資料來自網路,但須付費取得(有時是以「付費牆」的形式出現,需要購買單篇或訂閱才能閱讀),但 AI 開發商在使用前卻未付費。
- 著作權人已經採取「科技保護措施」(technological protection measures),例如在網站上使用 "robots.txt" 來告知 AI 開發商不可擅自抓取內容。
簡言之,如果明知是盜版的資料而拿來使用,利用不恰當的手段獲取原本需要付費的內容,或是忽視著作權人拒絕被抓取資料的要求,就會衍生極大風險。
不過在使用沒有特別標示的網路資料時,風險則相對較低,這或許就是日本想要留給 AI 產業的空間,以確保 AI 模型仍有足夠的訓練資料。
而在訓練階段,依據 AI 報告,訓練 AI 的基礎模型不算是「享受著作」,所以原則上可不經著作權人同意,就拿作品來訓練 AI。然而,下述情況,可能會被認定符合「享受目的」:
-
為了生成與資料相似的內容,而蒐集資料來 訓練 AI:這也被稱為「微調」(Fine-tuning),是一種追加訓練基礎模型的技術。
-
直接提供資料給 AI 作為回答的參考:這一般是為了要提高回答特定問題的正確性,通常是利用常見的「檢索增強生成」(Retrieval Augmented Generation, RAG)技術來達成。
另外,在「AI 廠商準則」中也提及,如果 AI 開發者蓄意調整模型,以方便使用者產生侵權的作品,就必須擔負責任。從以上的說明,很明顯可以看出,日本政府只想要排除「蓄意侵權」的 AI 模型。
現在我們可以回頭看看,前面日本繪師的作品被拿去訓練模型的例子,試著討論一下「蓄意模仿他人風格」,是否合理?
著作權法只保護創作的「表達方式」,而不保護「想法」本身。例如超現實藝術家達利,擅長將常見的物品「變形」,像是以融化的鐘錶表達時間的流逝。不過,只要不繪製類似形狀的鐘錶,其他藝術家仍可繪製變形的日常物品,創作出屬於自己的超現實主義作品。
由於「風格」一般不受著作權法保護,所以即使是模仿特定的藝術家,頂多受到輿論撻伐,不至於被判定侵權。然而,或許是因為 AI 技術過於強大,日本政府在 AI 報告中表達了立場:如果是「刻意」複製特定藝術家的作品來訓練 AI,是不恰當的。
這是因為,在日本著作權法的脈絡下,來自相同藝術家的系列作品集,可能已經不僅僅只是「想法」,而涵蓋了他獨特的「創意表達」,讓後續的訓練帶有「享受目的」,進而踩踏到侵權的紅線。
這恰好就是本文開頭中,讓藝術家頭疼的抄襲困境:網友刻意複製一整組日本繪師的作品,用來訓練 AI,目的就是為了再現繪師的作品。除了道德上的疑慮外,也可能侵犯了繪師的權利。