Acțiunile Meta Platforms (META) au scăzut ușor la începutul tranzacționării după ce un grup de editori majori a depus un proces amplu acuzând compania că a folosit cărți protejate prin drepturi de autor și materiale academice fără permisiune pentru a antrena modelele sale AI Llama.
Acțiunea juridică, depusă la tribunalul federal din Manhattan pe 5 mai, a intensificat preocupările privind modul în care companiile tehnologice de top procură date de antrenament pentru sistemele de inteligență artificială generativă.
Reclamanții includ case academice și edituri majore precum Elsevier, Cengage, Hachette, Macmillan și McGraw Hill, alături de autorul Scott Turow. Cazul susține că Meta a folosit milioane de lucrări protejate, inclusiv manuale școlare, lucrări de cercetare științifică și romane celebre, pentru a-și dezvolta sistemele AI fără a obține acorduri de licențiere corespunzătoare.
Conform plângerii, seturile de date de antrenament ar fi inclus o gamă largă de materiale protejate prin drepturi de autor, cuprinzând manuale educaționale, literatură științifică și titluri de ficțiune. Printre lucrările citate se numără The Fifth Season de N.K. Jemisin și The Wild Robot de Peter Brown, evidențiind amploarea conținutului despre care se spune că a fost incorporat în pipeline-ul de antrenament AI al Meta.
Meta Platforms, Inc., META
Editorii susțin că utilizarea neautorizată a acestor lucrări încalcă drepturile de proprietate intelectuală și solicită despăgubiri, precum și protecții juridice mai largi pentru proprietarii de conținut ale căror materiale ar fi putut fi utilizate în dezvoltarea AI fără consimțământ.
Procesul adaugă presiune suplimentară dezbaterii globale în creștere privind dacă utilizarea materialelor protejate prin drepturi de autor pentru antrenarea AI se califică drept „utilizare echitabilă." Companiile tehnologice, inclusiv Meta, au argumentat în mod repetat că antrenarea modelelor AI pe seturi de date la scară largă este transformativă și se încadrează în protecțiile privind utilizarea echitabilă.
Cu toate acestea, creatorii și editorii sunt ferm în dezacord, susținând că astfel de practici reproduc efectiv conținut protejat fără compensație. Cazul se alătură unor procese similare împotriva OpenAI și Anthropic, semnalând un front juridic în extindere în industria AI. O înțelegere recentă care implică Anthropic, în valoare de aproximativ 1,5 miliarde de dolari, a arătat deja că instanțele pot distinge între datele obținute legal și materialele piratate în hotărârile viitoare.
Dincolo de afirmațiile din sală de judecată, raportările anterioare au evidențiat preocupări suplimentare privind practicile de procurare a datelor ale Meta. Documentele depuse la instanță în cazuri conexe sugerează că compania ar fi putut accesa seturi de date din biblioteci fantomă precum LibGen și Anna's Archive, cu acuzații că zeci de terabytes de date au fost obținute prin canale de torrenting.
Discuțiile interne ar fi relevat preocupări în rândul cercetătorilor și inginerilor privind implicațiile etice ale utilizării unor astfel de seturi de date. Unii angajați ar fi ridicat obiecții față de utilizarea materialelor piratate, în timp ce alții au dezbătut dacă licențierea lucrărilor individuale ar submina strategia de apărare mai largă a Meta privind utilizarea echitabilă.
The post Meta (META) Stock; Edges Lower as Publishers Sue Over Llama AI Training Data Claims appeared first on CoinCentral.


