Retro-Future Columnist

生成式AI所產生的句子,已不再是單純的答案,而是承載著來源學習、重現範圍與合法表達的隱約光芒。 AI之所以「引用」成為問題,不是因為其表面類似引用,而是因AI在學習、生成與傳遞等每一階段,到底何時觸及著作權的界線,語言上尚未完整界定。[1][2] 在美國,這樣的界限整理正透過司法判決與行政報告逐步推進中。

美國著作權局在生成式AI訓練相關報告中指出,學習資料的處理已成為著作權分析的核心。[1] 關鍵不再是AI是不是「創作作品的機器」,而在於用什麼輸入資料,以及輸出與原作品相似程度。 著作權討論逐漸從抽象權利概念轉向資料處理與再現設計層面。 其中,時代氛圍在於不只關切模型大小,更著眼於學習及記錄方式的規範。[1]

轉捩點出現在圍繞Anthropic的2025年6月24日判決。[2] 報導顯示,法院作出對該公司有利的重要判決,至少在部分爭點上強化了AI著作權訴訟中的地位。[2] 然而,把此判決簡化為「勝訴」尚嫌過早。生成式AI的法律界定涉及多個層面,包括學習階段、儲存資料的使用,以及輸出近似度,單一司法決定並不會一體適用於所有AI模型。 單一判決不會以相同方式套用於所有AI模型。

法務實務面中,相關爭點己被細分。[3] 2026年6月5日的法務文章梳理了AI企業面對的多重法律問題,涵蓋不僅著作權,還有資料使用、契約義務、責任分攤與產品說明等議題。[3] 換言之,「合理使用就安全」並非簡單定律。 現場需求是在法律與產品層面同步設計何種學習內容、保留哪些記錄,以及如何抑制特定輸出。AI的「引用」可能更是運營慣例,而非單純法庭用語。

儘管如此,目前仍有許多尚未確認的疑問。 美國的討論能否影響其他國家制度,法院將學習過程與輸出結果的切割界限,以及何種疑似「引用」構成違法,均尚未明朗確定。[1][2] 最重要的是不宜急於下結論。 判斷容許類似度高低,需要藉由學習方法、素材管理與輸出對比等證據支持。[1][2][3] 隨着證據充實,合理使用的輪廓也會改變。

此議題更複雜之處在於AI常只是借用「引用」的外貌。 人類引用通常透過明示出處與保留上下文來正當化。反之,生成式AI的輸出常隱去出處訊息,只剩語句輪廓。 這帶來的更多是資訊摩擦降低後留下的焦慮,而非知識共享。 對用戶而言實用便利,但對創作者來說,難以看見其文章遭何層吸納。

因此,未來焦點將轉向非「AI能否引用」,而是「如何可視化並記錄貌似引用的再利用」。 包括模型開發者如何說明學習衍生的風險、如何測量生成結果的近似度,以及著作權人對追蹤性之要求。[1][3] 若無實務累積,合理使用將始終是概念而非現實。 法言尚未成熟前,用戶介面、使用條款與稽核日誌或將先行劃界。

對日本讀者而言,這不只是遙遠的美國訴訟。 越來越多企業將生成式AI導入工作,學習資料來源與輸出再利用條件將回頭成為採購與契約議題。[1][3] 從編輯、翻譯、市場營銷到開發支援,各領域AI觸及文字表面的場景日增。 每次面對的焦點,不是便利性,而是責任說明的厚度。背後暗潮流動的是權利設計得有多謹慎細膩,將決定未來信任基石。

當前關注點不僅在下一輪司法判決。 還有學習資料的揭露、輸出相似度測量方法、契約中的責任分配,以及不同國家類似合理使用理念的銜接方式。[1][2][3] AI的引用將非華麗機能,而是長久存在的無形底層問題。 後續動態值得關注的是,哪些企業基於何種依據立界限,且該界限對用戶與創作者雙方是否具說服力。[1][2][3]