Le cofondateur de Wikipedia, Jimmy Wales, a déclaré que l'organisation à but non lucratif derrière l'encyclopédie en ligne cherche à conclure davantage d'accords de licence avec des entreprises d'IA. Cette initiative a lieu alors qu'une série de robots d'IA automatisés mettent à rude épreuve l'infrastructure de Wikipedia.
Wales a expliqué que les entreprises d'IA utilisent les connaissances librement disponibles de la plateforme pour entraîner des grands modèles de langage (LLM). Il a noté que des robots d'IA à haut volume parcourent l'intégralité du site, imposant des charges techniques et financières importantes à la plateforme.
"Les robots d'IA... parcourent l'intégralité du site... donc nous devons avoir plus de serveurs, plus de RAM et de mémoire pour la mise en cache, et cela nous coûte un montant disproportionné," a-t-il expliqué.
Wales a noté que l'utilisation intensive par les robots d'IA oblige Wikipedia à étendre ses serveurs, augmenter la RAM et améliorer la mise en cache, tout cela à un coût élevé.
Bien que le site soit gratuit pour les utilisateurs individuels, a-t-il noté, l'accès automatisé à haut volume par des entreprises d'IA à but lucratif est un autre problème. L'organisation à but non lucratif a signé un accord de licence avec Google en 2022 et négocie des accords similaires avec d'autres entreprises.
L'organisation à but non lucratif qui gère Wikipedia, la Fondation Wikimedia, s'appuie sur des dons publics relativement modestes et des éditeurs bénévoles pour fonctionner, ce qui n'était pas destiné à financer des développements d'IA à grande échelle et à but lucratif.
Wales a déclaré qu'il est injuste pour les contributeurs et les donateurs de supporter les coûts des entreprises commerciales d'IA utilisant le contenu de Wikipedia.
Wikipedia affirme qu'elle met en garde contre la charge insoutenable des robots d'IA. Ces demandes sur les serveurs de Wikipedia ont augmenté fortement ces derniers mois. Les robots automatisés ont augmenté le trafic — particulièrement via les téléchargements multimédias — et ont obligé l'organisation à but non lucratif à investir massivement dans l'infrastructure.
Une grande partie de ce trafic provient d'entreprises d'IA qui extraient du contenu conçu pour entraîner leurs modèles, plutôt que des humains. En 2022, la Fondation a lancé un produit commercial payant, Wikimedia Enterprise, pour fournir un accès à son contenu principal à grande échelle et offrir aux utilisateurs de la plateforme les outils et ressources nécessaires.
Ce service est conçu pour alléger la pression sur le site en direct de Wikipedia tout en fournissant aux développeurs d'IA les données nécessaires pour améliorer leurs modèles. Wales a exhorté les entreprises d'IA à utiliser cette option payante plutôt que d'extraire des données du site public.
Si les entreprises ne se conforment pas à ces mesures techniques, Wales a déclaré que la restriction de l'accès des robots via des outils tels que AI Crawl Control pourrait être mise en œuvre. Il y a un certain débat avec les entreprises sur le rôle de l'IA publique (ou commerciale) dans la gestion des données personnelles que les utilisateurs détiennent maintenant à une échelle qui dépasse le droit légal à la connaissance libre et transparente, et ce dont les secteurs privé et public ont besoin.
Avec une part toujours plus grande du traitement de l'IA s'appuyant fortement sur de grands ensembles de données publiquement disponibles, Wikipedia plaide pour une approche équitable qui compense à la fois les entités qui maintiennent ces données et les entreprises. Wikipedia n'est pas à l'abri de son engagement à maintenir la neutralité.
Le site Wikipedia est en activité depuis plus de 20 ans en tant qu'entité à but non lucratif gérée par la Fondation Wikimedia. Son modèle repose sur une armée mondiale d'éditeurs bénévoles, qui consacrent leur temps à créer, éditer et relire du contenu.
Les dons publics sont un ingrédient clé pour garantir qu'il reste ouvert à tous, partout, indépendamment de la quantité d'argent ou de la portée géographique dont ils disposent. Wikipedia, un site web et une encyclopédie internationale bien connue, a également lutté pour rester neutre parmi d'autres sources.
Le problème devient encore plus aigu lors de la couverture détaillée de questions politiques à enjeux élevés, de mouvements sociaux ou de conflits armés dans le monde entier. Wales a déclaré que bien que la plupart des éditeurs de Wikipedia ne soient pas eux-mêmes des militants, les préférences personnelles peuvent influencer la façon dont les sujets sont couverts.
Cependant, il a ajouté qu'il fait confiance à la communauté, affirmant que les éditeurs ont tendance à atteindre d'une manière ou d'une autre les valeurs de Wikipedia d'équité et d'exactitude, même sous une pression intense. La neutralité de la plateforme est encore plus évidente dans sa politique communautaire, ses méthodes d'évaluation par les pairs et son processus de règlement des différends, entre autres aspects.
En même temps, la dépendance constante aux bénévoles et aux dons souligne la faiblesse du système. Et alors que la plateforme fait face à de nouvelles pressions, y compris une augmentation de l'utilisation de son contenu par les entreprises d'IA, il devient de plus en plus important de garantir que les valeurs fondamentales de la plateforme (neutralité, exactitude et accès libre) restent inchangées.
Vous voulez que votre projet soit présenté aux meilleurs esprits de la crypto ? Présentez-le dans notre prochain rapport sectoriel, où les données rencontrent l'impact.


