Retro-Future Columnist

Aux États-Unis, le débat sur l’IA générative n’est plus seulement une affaire de prouesse technique. Il s’est déplacé vers une question plus discrète, presque liturgique: qu’est-ce qu’un modèle fait réellement aux œuvres dont il s’imprègne ? Entre l’entraînement sur des livres, des images ou des enregistrements, et la production d’un texte ou d’une réponse qui ressemble à une œuvre existante sans la reproduire mot pour mot, la frontière juridique se resserre.[1][7][8] Ce n’est pas un détail de conformité; c’est désormais l’un des lieux où se décide la forme économique de l’IA.

Le rapport final du U.S. Copyright Office consacré à l’entraînement des modèles génératifs, publié en mai 2025, a donné à ce débat une architecture plus nette.[1][12] Il rappelle que le fair use n’est pas une permission générale, et que l’analyse dépend du contexte: finalité de l’usage, nature de l’œuvre, quantité copiée et effet potentiel sur le marché.[1][4][11][12] Les résumés publics de ce rapport insistent sur un point particulièrement sensible: lorsque l’usage final concurrence la fonction originale de l’œuvre, l’argument de transformation devient plus fragile.[1][3][12] Autrement dit, transformer n’est pas seulement changer la forme; il faut encore changer le rôle économique de l’objet.

Cette nuance est capitale, car beaucoup de défenseurs de l’IA ont longtemps présenté l’entraînement comme l’équivalent numérique de la lecture humaine.[3][8] Les sources réunies ici montrent cependant que cette comparaison a ses limites.[3][12] Dans le droit américain, le caractère transformateur ne suffit pas à lui seul si le marché des œuvres originales est menacé.[4][11][12] Le rapport et plusieurs analyses juridiques publiées autour de cette question convergent sur une idée simple, presque austère: l’argument du « c’est comme apprendre » ne ferme plus le dossier. Il l’ouvre, au contraire, sur la question des usages substitutifs et de la licence.

La décision la plus marquante de cette séquence, en juin 2025, vient de l’affaire Thomson Reuters contre Ross Intelligence.[2][5][10] Un tribunal fédéral y a jugé que l’utilisation de contenus protégés pour entraîner un système d’IA destinée à produire des résultats concurrents pouvait relever de la contrefaçon, et non du fair use.[2][5][10] Les analyses disponibles soulignent que le dossier portait sur un outil de recherche juridique et non sur un modèle génératif au sens strict, mais l’écho dépasse ce cadre.[5][10] Le message est clair: lorsqu’un système apprend à partir d’œuvres protégées pour mieux servir le même marché, la protection du fair use devient plus difficile à soutenir.

Le dossier Anthropic, lui, rappelle que la jurisprudence n’avance pas en ligne droite.[2][6][9] Un autre jugement fédéral rendu en juin 2025 a estimé qu’entraîner un modèle sur des livres pouvait relever du fair use dans certaines circonstances, tout en distinguant ce point de la manière dont les exemplaires avaient été obtenus et des questions séparées liées à des copies pirates.[2][6][9] Cette coexistence de décisions n’a rien d’anecdotique. Elle dessine un paysage où l’IA n’est ni interdite ni absoute, mais évaluée selon la provenance des données, la nature du produit final et la proximité avec un marché existant.[2][6][9][12] Le droit ne tranche pas encore l’ensemble du futur; il découpe des zones de risque.

C’est précisément là que le sujet quitte la simple technique pour entrer dans l’économie politique des modèles. Si l’entraînement sur des œuvres protégées demande davantage de licences, les entreprises d’IA devront intégrer ce coût dans leurs marges, leurs calendriers et leurs choix de produits.[1][4][12] Cela favorise les acteurs capables de négocier à grande échelle, de documenter leurs corpus et de présenter des chaînes de conformité solides.[1][4][12] Pour les créateurs, l’enjeu est moins abstrait qu’il n’y paraît: il s’agit de savoir si les œuvres deviennent une matière première gratuite de l’ère des modèles, ou si elles retrouvent une valeur contractuelle mesurable.[1][3][12]

Il reste pourtant une zone d’ombre importante, et il faut la garder ouverte. Les documents disponibles ne permettent pas encore de conclure de façon générale que tout entraînement d’IA sur des contenus protégés est licite ou illicite.[1][4][12] Les cas cités distinguent les livres, les bases de données juridiques, les copies obtenues légalement ou illégalement, ainsi que les usages internes et les usages commerciaux concurrents.[2][5][6][9] Ce qu’il faut surveiller, ce sont les prochains jugements qui préciseront la notion de marché substitutif, la place des licences collectives et le sort des modèles qui produisent des sorties trop proches des œuvres d’origine.

En arrière-plan, cette évolution touche aussi à la culture du web et des outils numériques. Un moteur de recherche, une base documentaire ou un assistant génératif ne manipulent pas les mêmes attentes sociales.[5][8][11] Le premier indexe; le second sert; le troisième synthétise et parfois remplace.[5][8][11] Plus l’interface devient silencieuse, plus la question du contenu qu’elle a absorbé devient bruyante en droit. Le sentiment est familier à Tokyo comme ailleurs: quand l’écran se fait plus lisse, la chaîne invisible de ce qui l’alimente devient soudain plus importante que l’interface elle-même.

Au fond, le vrai sujet n’est pas de savoir si l’IA « cite » les œuvres comme un humain le ferait. C’est de déterminer si elle les utilise pour produire autre chose, ou pour occuper la place qu’elles occupaient déjà. Tant que cette distinction restera floue, le fair use demeurera un terrain mouvant, non un refuge automatique.[1][4][11][12] Le prochain tournant viendra sans doute de la manière dont les tribunaux traiteront le couple données licenciées et marchés concurrents; c’est là que se dessinera la mémoire juridique durable de l’IA générative.[2][5][6][9] Et c’est cette ligne, plus que les effets de mode, qu’il faudra continuer à suivre de près.