Industrial Technology Correspondent
在生成式人工智慧的討論中,焦點早已不僅是系統是否能給出正確答案。 真正挑戰是這些系統在指引他人文本時,是否能履行與人類引用相同的功能,還是僅在語言表面上令人信服,卻不承擔引用所帶來的文化及法律責任。 正是在這個交匯點,技術、著作權與用戶期待相互碰撞。
美國著作權局在多份人工智慧報告中,明確將辯論置於現行原則層面。[1][7][9] 第二部分指出,既有的著作權規範具足彈性,可涵蓋生成式人工智慧;同時強調,只有當人類充分決定了表現元素時,AI生成的成果才具有著作權保護。[7][9] 此一見解對引用問題至關重要,因為機關在此劃出界線:並非所有機器生成的文本相似性皆等同於自主創作。
《紐約時報》和OpenAI的爭議進一步明確了這道界線。[2][5][8][10] 公開指控不僅涉及把新聞文本用於訓練,還包括系統輸出中存在幾乎逐字重現文章段落的現象,可能變成原作的替代品。[2][5][8][10] OpenAI則援引合理使用條款,並強調其模型並非設計為直接取代報紙內容。[2][5][8] 法律上仍有關鍵疑問:一個在部分內容非常接近原作的模型,究竟是依賴搜尋與生成,還是已成為外來內容的分銷途徑?
技術分析中,檢索增強生成(RAG)是一種實用的反例。[3][11][12] 此方法結合語言模型與外部搜索,目標是提供基於可追蹤來源的回答。[3][11][12] 這類系統描述強調其能提供用戶可審核的來源,建立信任。[11][12] 然而,這仍無法等同於人類意義上的引用。 RAG系統能顯示證據,但無法「理解」學術或新聞引用在標示、界定和語境中的意義。
因此,來源標示與引用之間的混淆頑強存在。 人類引用旨在彰顯來源、權威與界限,伴隨責任意識。 模型則結合訓練、檢索與生成的模式。[1][11][12] 它能輸出來源訊號,卻無引用意圖。[1][11][12] 差異雖然看似語義層面,但對產業卻十分重要:產品團隊設計信任介面時,常誤以為來源列表等同編輯審核。
相對地,作者與出版商將此判斷視為危險。[4][6] 聲明中主張,未經授權用於訓練的創作作品會威脅著作者生計,無可簡化為技術中間程序。[4][6] 這是辯論的經濟核心:用他人文本訓練模型,不只產出數學參數,還改變了授權、報酬與曝光的談判權力。 新聞與專業內容特別敏感,因其商業基礎依賴明確歸屬。
然而,允許的重構與禁止的挪用界線仍未明確。 現有證據顯示兩點:一是法院及監管機構無意將生成式AI視為特例;二是相關證明難度大。[1][7][9][10] 一宗近乎逐字引用的個案,對整體系統評價無法構成決定性證據。[2][10] 作出更堅實判斷,需取得詳細數據,包括此類輸出頻率、提示情境及是否可被定向複現。
因此,AI引用問題實際上也是產品架構問題。 若僅生成語句而不明確劃分來源,來源標示多成裝飾,難作為佐證。 反之,若以檢索為基礎,呈現證據並揭露訓練與外部來源界線,至少接近用戶期待的引用功能。[3][11][12] 挑戰往往不在模型本身。 而是如何整合檢索、展示、授權與責任,打造一個用戶友好的系統。
從歐洲角度,此事超越美國產業法律糾紛。 當AI系統用於新聞編輯、知識庫、法律應用或工業文檔,來源管理同時影響信任與風險。[3][6][7][9] 錯誤來源標示不僅是風格問題,更涉及流程、核查鏈及法律責任。 因此,應當關注更穩健的實務:誰負責提供來源?誰審核來源?系統何時過度靠近原作? 這些問題將在人工智慧與著作權辯論中比螢幕上的速決答案持續存在。
參考來源
參考來源
正文中的小編號標籤對應下方參考來源。
- [PDF] Copyright and Artificial Intelligence, Part 2 Copyrightability Report
- OpenAI Claps Back at NYT Lawsuit
- Incorporating Legal Structure in Retrieval-Augmented Generation: A Case Study on Copyright Fair Use
- [PDF] Copyright and Artificial Intelligence, Part 3: Generative AI Training ...
- [PDF] The New York Times, OpenAI, and the Copyright Implications of AI ...
- May 3, 2024 Via E-Mail Suzanne Wilson General Counsel ...
- Copyright Office Releases Part 2 of Artificial Intelligence Report
- Stolen Stories or Fair Use? The New York Times v. OpenAI and the Limits of Machine Learning — Columbia Undergraduate Law Review
- Copyright and Artificial Intelligence | U.S. Copyright Office
- Exploring Memorization and Copyright Violation in Frontier LLMs: A Study of the New York Times v. OpenAI 2023 Lawsuit
- What Is Retrieval-Augmented Generation aka RAG - NVIDIA Blog
- Aman's AI Journal • Primers • Retrieval Augmented Generation
推薦文章
推薦文章
-
生成式 AI 與基礎模型
當 AI 文字變成大宗商品,價值將轉向經驗與可信度
本文從作者身分研究、可信度調查及過去關於可重複性的辯論角度,解析 AI 生成文字的價值所在。
-
生成式 AI 與基礎模型
AI企業為何無法停止基準測試的競賽?
大規模語言模型的性能競賽已進入一個階段,正如Stanford CRFM的HELM與Stanford AI Index所展示的多面向評估,單一基準測試已無法全面反映實力。GPT-4、Claude 4和Gemini的技術報告揭示了基準測試應用與實際運用間的差異,凸顯AI企業在競爭中更傾向追求可比較性指標,而非純粹的用戶價值。
-
生成式 AI 與基礎模型
開源AI遇上定義挑戰
本文將開源AI的爭論視為治理與基礎建設問題,而非僅是品牌爭議。