O cofundador da Wikipedia, Jimmy Wales, disse que a organização sem fins lucrativos por trás da enciclopédia online está a procurar mais acordos de licenciamento com empresas de IA. Esta iniciativa está a ocorrer enquanto uma série de bots de IA automatizados sobrecarregam a infraestrutura da Wikipedia.
Wales explicou que as empresas de IA utilizam o conhecimento livremente disponível da plataforma para treinar grandes modelos de linguagem (LLMs). Ele observou que bots de IA de alto volume percorrem todo o site, impondo cargas técnicas e financeiras significativas à plataforma.
"Os bots de IA... estão a percorrer a totalidade do site... por isso temos de ter mais servidores, mais RAM e memória para armazenamento em cache, e isso custa-nos uma quantidade desproporcional", explicou.
Wales observou que o uso intensivo por bots de IA força a Wikipedia a expandir os seus servidores, aumentar a RAM e melhorar o armazenamento em cache, tudo com um custo elevado.
Embora o site seja gratuito para utilizadores individuais, ele observou que o acesso automatizado de alto volume por empresas de IA com fins lucrativos é outra questão. A organização sem fins lucrativos assinou um acordo de licenciamento com a Google em 2022 e está a negociar acordos semelhantes com outras empresas.
A organização sem fins lucrativos que opera a Wikipedia, a Fundação Wikimedia, depende de doações públicas relativamente pequenas e editores voluntários para funcionar, o que não foi concebido para financiar desenvolvimentos de IA em grande escala e com fins lucrativos.
Wales disse que é injusto para os contribuidores e doadores suportarem os custos das empresas comerciais de IA que utilizam o conteúdo da Wikipedia.
A Wikipedia afirma que alerta sobre a carga insustentável dos bots de IA. Essas exigências nos servidores da Wikipedia têm aumentado drasticamente nos últimos meses. Os bots automatizados aumentaram o tráfego — particularmente através de downloads multimédia — e resultaram na necessidade da organização sem fins lucrativos investir fortemente em infraestrutura.
Grande parte deste tráfego origina-se de empresas de IA que extraem conteúdo destinado a treinar os seus modelos, em vez de humanos. Em 2022, a Fundação lançou um produto comercial pago, o Wikimedia Enterprise, para fornecer acesso ao seu conteúdo principal em escala e oferecer aos utilizadores da plataforma as ferramentas e recursos necessários.
Este serviço foi concebido para aliviar a pressão sobre o site ativo da Wikipedia, fornecendo simultaneamente aos desenvolvedores de IA os dados necessários para melhorar os seus modelos. Wales instou as empresas de IA a utilizarem esta opção paga em vez de extraírem dados do site público.
Se as empresas não cumprirem estas medidas técnicas, Wales afirmou que poderá ser implementada a restrição de acesso aos bots através de ferramentas como o AI Crawl Control. Existe algum debate com as empresas sobre o papel da IA pública (ou comercial) na gestão de dados pessoais que os utilizadores agora possuem numa escala que excede o direito legal ao conhecimento livre e transparente, e o que os setores privado e público necessitam.
Com uma parcela cada vez maior do processamento de IA dependendo fortemente de grandes conjuntos de dados publicamente disponíveis, a Wikipedia defende uma abordagem justa que compense tanto as entidades que mantêm estes dados como as empresas. A Wikipedia não está imune ao seu compromisso de manter a neutralidade.
O site Wikipedia está em operação há mais de 20 anos como uma entidade sem fins lucrativos gerida pela Fundação Wikimedia. O seu modelo baseia-se num exército global de editores voluntários, que dedicam o seu tempo a criar, editar e revisar conteúdo.
As doações públicas são um ingrediente fundamental para garantir que permaneça aberto a qualquer pessoa, em qualquer lugar, independentemente da quantidade de dinheiro ou alcance geográfico disponível. A Wikipedia, um site e enciclopédia internacional bem conhecida, também tem lutado para permanecer neutra entre outras fontes.
O problema torna-se ainda mais agudo ao relatar em detalhe questões políticas de alto risco, movimentos sociais ou conflitos armados em todo o mundo. Wales disse que, embora a maioria dos editores da Wikipedia não sejam ativistas, as preferências pessoais podem influenciar como os tópicos são abordados.
No entanto, acrescentou que confia na comunidade, dizendo que os editores tendem de alguma forma a alcançar os valores da Wikipedia de justiça e precisão, mesmo sob intensa pressão. A neutralidade da plataforma é ainda mais evidente na sua política comunitária, métodos de revisão por pares e processo de resolução de disputas, entre outros aspectos.
Ao mesmo tempo, a dependência constante de voluntários e doações destaca a fragilidade do sistema. E à medida que a plataforma enfrenta novas pressões, incluindo um aumento no uso do seu conteúdo por empresas de IA, garantir que os valores fundamentais da plataforma (neutralidade, precisão e acesso livre) continuem inalterados torna-se cada vez mais importante.
Quer o seu projeto à frente das mentes mais brilhantes da cripto? Destaque-o no nosso próximo relatório da indústria, onde os dados encontram o impacto.


