Global Technology Editor
Le mot « ouvert » impliquait autrefois un compromis simple en logiciel : vous pouviez inspecter le code, le modifier et le redistribuer. En IA, ce compromis s’est effiloché.[10][12] Ce que beaucoup d’entreprises appellent aujourd’hui open source est souvent plus proche des poids ouverts — un accès suffisant pour exécuter un modèle, mais pas assez pour comprendre pleinement comment il a été conçu, ce qu’il a appris ni avec quelle fidélité Cette différence n’est pas un débat sémantique futile. Elle touche au cœur de la question de savoir qui peut auditer les systèmes IA, qui peut les améliorer et qui peut revendiquer l’autorité morale de l’ouverture.[1][5][10][12]
L’Open Source Initiative a publié la version 1.0 de sa Définition de l’IA Open Source en 2024 après des années de consultations.[1][4][7] Le groupe visait à établir une norme qui dépasse les seuls paramètres du modèle. Selon ce cadre, un système doit exposer non seulement les poids, mais aussi le code utilisé pour le construire et l’entraîner, le code servant à créer les ensembles de données, ainsi que soit les données complètes d’entraînement soit suffisamment d’information[4][7] Autrement dit, le débat ne porte plus sur la simple possibilité de télécharger un modèle. Mais sur la possibilité de l’étudier comme un système.
La distinction entre poids ouverts et IA open source est désormais l’un des arguments clés du domaine.[2][10][12] Certains acteurs utilisent « ouvert » pour signifier que les paramètres sont largement accessibles. D’autres réservent ce terme pour un ensemble plus complet de libertés connues de l’ère du logiciel. Cette tension n’est pas purement philosophique. Elle influe sur les attentes des développeurs, les décisions d’achat et le vocabulaire employé par les décideurs politiques lorsqu’ils rédigent les règles d’accès à l’IA.[1][3][12] Si l’étiquette devient trop élastique, elle risque de tromper les utilisateurs sur ce que le système prend réellement en charge.
Il y a une raison pratique à cette dérive linguistique. Les données d’entraînement sont souvent la partie la plus difficile à partager.[4][5][11] Certains ensembles de données contiennent des matériaux propriétaires, sous licence ou sensibles qui ne peuvent être publiés sans conséquences légales ou de confidentialité.[5][11] Ainsi, de nombreux fournisseurs et chercheurs se contentent d’une divulgation partielle : poids, peut-être un peu de code, et une description du processus d’entraînement. Cela reste utile, notamment pour le fine-tuning ou le déploiement local, mais cela ne respecte pas la promesse classique de l’open source. Le résultat est un paysage à plusieurs niveaux où l’ouverture devient un spectre plutôt qu’une catégorie.
Les implications techniques sont réelles. Les poids du modèle déterminent comment un réseau entraîné réagit aux entrées, et des poids publics peuvent soutenir le fine-tuning, l’adaptation et l’inférence locale.[2][8][10] Mais les poids ne sont pas du code source. Ils ne donnent pas la même visibilité sur l’architecture, les choix d’entraînement, le filtrage ou la curation des données. Un modèle peut être largement disponible et rester opaque sur les aspects critiques pour la fiabilité et la responsabilité.[11][13] C’est pourquoi chercheurs et spécialistes politiques considèrent de plus en plus les modèles à poids ouverts comme une classe distincte plutôt qu’un synonyme d’open source.
Les enjeux politiques ont nettement augmenté lorsque les contrôles à l’exportation se sont focalisés non plus uniquement sur les puces, mais aussi sur les poids des modèles eux-mêmes. L’analyse par RAND du Cadre de Diffusion de l’Intelligence Artificielle américain souligne que ces nouveaux contrôles ciblent certains poids de modèles IA tout en exemptant ceux disponibles publiquement.[3][6][9] Cela fait de la frontière entre accès public et restreint un sujet de politique de sécurité nationale. C’est un changement important. L’ouverture ne concerne plus uniquement la culture des développeurs. C’est désormais une question de savoir quels systèmes peuvent franchir les frontières, quelles organisations peuvent les héberger, et où les modèles les plus performants peuvent être déployés.[3][6][9]
Cela modifie aussi la structure incitative pour les grands développeurs d’IA. Les entreprises cherchent le bénéfice réputationnel de paraître ouvertes, l’avantage écosystémique pour attirer des développeurs, et le profit commercial d’imposer une couche d’infrastructure par défaut autour de leurs modèles. En même temps, elles veulent éviter les contraintes d’une divulgation complète. Le résultat est un compromis délicat : assez de diffusion pour stimuler l’adoption, mais pas assez pour perdre le contrôle. Ce compromis peut être rationnel commercialement, mais il laisse au public un terme affaibli comparé à ce que l'histoire du logiciel lui attribuait.[1][10][12]
La question non résolue est la quantité de preuves nécessaires avant de juger que le terme « ouvert » est trompeur. La réponse dépend de ce qui est réellement divulgué dans chaque cas, et les sources ne donnent pas encore un tableau clair du marché. On peut confirmer l’existence d’une définition formelle, la persistance des publications de modèles à poids ouverts, et l’intérêt politique pour restreindre certains poids modèles.[1][3][4][6] Ce qui reste incertain, c’est si l’industrie convergera vers une norme commune ou continuera d’utiliser la même étiquette à des niveaux d’accès substantiellement différents. L’enjeu des prochaines évolutions est donc de surveiller non seulement qui publie des modèles, mais ce qu’ils publient exactement.[1][4][6][12]
Pour les développeurs et institutions, ce n’est pas une querelle d’image de marque. C’est une question de gouvernance qui aura des conséquences durables sur la recherche, la concurrence et la responsabilité publique. Quand un modèle est qualifié d’ouvert, les utilisateurs s’attendent à une inspectabilité et une indépendance qui peuvent ne pas être réelles. Si les décideurs confondent poids ouverts et open source, ils risquent d’écrire des règles qui ne correspondent pas à la réalité technique. La leçon importante est simple : en IA, l’ouverture n’est plus une propriété unique. Elle est un ensemble de permissions, de divulgations et de contraintes, et l’industrie sera jugée sur sa transparence quant à leur dénomination.[1][3][4][6]
Références
Références
Les petits numéros dans le corps du texte renvoient aux sources ci-dessous.
- We finally have an 'official' definition for open source AI | TechCrunch
- [PDF] OPEN-WEIGHT AI MODELS - IEEE-USA
- Export controls | Emerging Technology Policy Careers
- The Open Source Initiative Announces the Release of the Industry’s First Open Source AI Definition – Open Source Initiative
- Open Weights: not quite what you've been told - Open Source Initiative
- Understanding the Artificial Intelligence Diffusion Framework - RAND
- Report from OSS EU 2025 and AI_dev: What’s next for OSAID – Open Source Initiative
- Open-Access AI: Lessons From Open-Source Software | Lawfare
- Export Controls on Artificial Intelligence and Uncrewed Aircraft Systems: Interagency Challenges | RAND
- Open vs. closed AI: How behind are open models? | Epoch AI
- [PDF] Open-Sourcing Highly Capable Foundation Models - arXiv
- State of the Source at ATO 2025: State of the “Open” AI – Open Source Initiative
- PRISM: A Design Framework for Open-Source Foundation Model Safety
ARTICLES À LIRE
Articles sélectionnés
-
IA générative et modèles fondamentaux
Une startup affirme avoir résolu un goulet d’étranglement des modèles de langage volumineux. Le vrai test sera de voir si le reste de la cha
La déclaration d’une startup sur la résolution d’un goulet d’étranglement mathématique dans les grands modèles de langage soulève une question plus vaste pour le secteur de l’IA :
-
IA générative et modèles fondamentaux
La percée d’une startup en LLM importe peut-être moins comme produit que comme test des hypothèses du domaine
Cet article examine la revendication de Subquadratic selon laquelle elle aurait résolu un goulet d’étranglement mathématique qui freine les grands modèles de langage depuis près d’
-
IA générative et modèles fondamentaux
Une startup affirme avoir résolu un goulet d’étranglement ancien des LLM. Le véritable test sera la portée mathématique.
Cet article analyse l’affirmation de Subquadratic selon laquelle elle aurait surmonté un goulet d’étranglement mathématique de longue date des grands modèles de langage, en la repl