Zadie Smith, Stephen King și Elena Ferrante, printre miile de autori ale căror opere piratate au fost folosite pentru a antrena inteligența artificială

Zadie Smith, Stephen King și Elena Ferrante, printre miile de autori ale căror opere piratate au fost folosite pentru a antrena inteligența artificială
Profit.ro
Profit.ro
scris 23 aug 2023

Zadie Smith, Stephen King, Rachel Cusk și Elena Ferrante se numără printre miile de autori ale căror opere piratate au fost folosite pentru a antrena instrumente de inteligență artificială, se arată într-un articol publicat în The Atlantic.

Urmărește-ne și pe Google News
Evenimente
27 mai - Eveniment Profit.ro: Piaţa imobiliară românească sub spectrul crizei occidentale. Ediţia a IV-a
30 mai - Maratonul Fondurilor Europene
6 iunie - Maratonul Energiei
13 iunie - Eveniment Profit: Piața de Capital.forum - Provocări pentru dezvoltarea piețelor și creșterea lichidității, Ediția a IV-a. Parteneri BCR, CEC Bank, Sphera, Teraplast

Mai mult de 170.000 de titluri au fost introduse în modelele gestionate de companii precum Meta și Bloomberg, potrivit unei analize a „Books3” - setul de date folosit de aceste firme pentru a-și construi instrumentele de inteligență artificială, scrie News.ro.

Microsoft a ajuns la un acord pentru tranzacția-gigant Activision Blizzard. Drepturile de streaming pentru jocuri, vândute către o companie prezentă și în România CITEȘTE ȘI Microsoft a ajuns la un acord pentru tranzacția-gigant Activision Blizzard. Drepturile de streaming pentru jocuri, vândute către o companie prezentă și în România

Books3 a fost folosit pentru a antrena LLaMA al Meta, unul dintre modelele lingvistice de mari dimensiuni - cel mai cunoscut dintre acestea fiind ChatGPT al OpenAI - care poate genera conținut pe baza modelelor identificate în exemple de texte. Setul de date a fost utilizat, de asemenea, pentru a antrena BloombergGPT de la Bloomberg, GPT-J de la EleutherAI și „probabil” că a fost utilizat în alte modele de inteligență artificială.

Titlurile conținute în Books3 sunt aproximativ o treime ficțiune și două treimi non-ficțiune, iar majoritatea au fost publicate în ultimele două decenii. Alături de scrierile lui Smith, King, Cusk și Ferrante, lucrările protejate de drepturi de autor din setul de date includ 33 de cărți de Margaret Atwood, cel puțin nouă de Haruki Murakami, nouă de Bell Hooks, șapte de Jonathan Franzen, cinci de Jennifer Egan și cinci de David Grann.

De asemenea, figurează cărți de George Saunders, Junot Díaz, Michael Pollan, Rebecca Solnit și Jon Krakauer, precum și 102 romane de tip pulp ale fondatorului scientologiei L. Ron Hubbard și 90 de cărți ale pastorului John MacArthur.

Titlurile cuprind edituri mari și mici, inclusiv peste 30.000 publicate de Penguin Random House, 14.000 de HarperCollins, 7.000 de Macmillan, 1.800 de Oxford University Press și 600 de Verso.

Acest lucru vine după un proces intentat luna trecută de trei scriitori - Sarah Silverman, Richard Kadrey și Christopher Golden - care au susținut că operele lor protejate de drepturi de autor „au fost copiate și incluse ca parte a formării” LLaMA de la Meta. Analiza a arătat că scrierile celor trei reclamanți fac într-adevăr parte din Books3.

PROFIT NEWS TV Antreprenor de România – Alexandru Manea, co-fondator ELEC: Creșterea costurilor de finanțare și accesul greu la capital e o problemă. Compania a strâns deja 200.000 euro din 500.000 euro CITEȘTE ȘI PROFIT NEWS TV Antreprenor de România – Alexandru Manea, co-fondator ELEC: Creșterea costurilor de finanțare și accesul greu la capital e o problemă. Compania a strâns deja 200.000 euro din 500.000 euro

OpenAI, compania din spatele chatbot-ului AI ChatGPT, a fost, de asemenea, acuzată că și-a antrenat modelul pe opere protejate de drepturi de autor. Indiciile privind sursele datelor de antrenament ale OpenAI se află într-o lucrare publicată de companie în 2020, care menționează două „corpusuri de cărți bazate pe internet”, dintre care unul se numește Books2 și se estimează că ar conține aproape 300.000 de titluri. Un proces din iunie afirmă că singurele site-uri care oferă atât de mult material sunt „bibliotecile din umbră”, cum ar fi Library Genesis (LibGen) și Z-Library, prin care cărțile pot fi asigurate în vrac prin intermediul sistemelor torrent.

Shawn Presser, dezvoltatorul independent de inteligență artificială care a creat inițial Books3, a declarat că, deși înțelege îngrijorările autorilor, a creat baza de date pentru ca oricine să poată dezvolta instrumente de inteligență artificială generativă și își face griji cu privire la riscurile pe care le presupune faptul că marile companii dețin controlul asupra tehnologiei.

În timp ce un purtător de cuvânt al Meta a refuzat să comenteze pentru The Atlantic utilizarea Books3 de către firmă, un purtător de cuvânt al Bloomberg a confirmat că firma a folosit setul de date. „Nu vom include setul de date Books3 printre sursele de date utilizate pentru antrenarea viitoarelor versiuni ale BloombergGPT”, au adăugat aceștia.

viewscnt
Afla mai multe despre
zadie smith
stephen king
inteligența artificială