Meta Platforms a folosit postări publice pe Facebook şi Instagram pentru a antrena părţi ale noului său asistent virtual Meta AI, dar a exclus postările private partajate doar cu familia şi prietenii, într-un efort de a respecta confidenţialitatea consumatorilor, a declarat un director de top al companiei pentru Reuters, într-un interviu.
De asemenea, Meta nu a folosit chaturile private pe serviciile sale de mesagerie ca date de instruire pentru model şi a luat măsuri pentru a filtra detaliile private din seturile de date publice utilizate pentru instruire, a declarat preşedintele pentru afaceri globale al Meta, Nick Clegg, vorbind în marginea conferinţei anuale Connect a companiei, de săptămâna trecută.
”Am încercat să excludem seturile de date care au o mare preponderenţă de informaţii personale”, a spus Clegg, adăugând că ”marea majoritate” a datelor utilizate de Meta pentru instruire sunt disponibile public.
El a citat LinkedIn ca exemplu de site web al cărui conţinut Meta a ales în mod deliberat să nu îl folosească, din cauza preocupărilor legate de confidenţialitate.
Comentariile lui Clegg vin pe măsură ce companiile de tehnologie, inclusiv Meta, OpenAI şi Google, parte a grupului Alphabet, au fost criticate pentru că folosesc fără permisiune informaţii de pe internet pentru a-şi antrena modelele AI, care ingerează cantităţi masive de date pentru a rezuma informaţii şi a genera imagini.
Companiile analizează cum să gestioneze materialele private sau protejate prin drepturi de autor, pe care sistemele lor de inteligenţă artificială le pot reproduce, în timp ce se confruntă cu procese din partea autorilor care îi acuză de încălcarea drepturilor de autor.
Meta AI a fost cel mai important produs dintre primele instrumente AI ale companiei destinate consumatorilor, dezvăluite de CEO-ul Mark Zuckerberg miercurea trecută, la conferinţa anuală a produselor Meta, Connect.
Evenimentul din acest an a fost dominat de discuţii despre inteligenţa artificială, spre deosebire de conferinţele anterioare, care s-au concentrat pe realitatea augmentată şi virtuală.
Meta a creat asistentul folosind un model personalizat, bazat pe puternicul model de limbaj mare Llama 2, pe care compania l-a lansat pentru uz comercial public în iulie, precum şi un nou model numit Emu, care generează imagini ca răspuns la solicitările textului.
Produsul va putea genera text, audio şi imagini şi va avea acces la informaţii în timp real printr-un parteneriat cu motorul de căutare Bing al Microsoft.
Postările publice de pe Facebook şi Instagram care au fost folosite pentru a antrena Meta AI au inclus atât text, cât şi fotografii, a spus Clegg.
Aceste postări au fost folosite pentru a instrui Emu pentru elementele de generare de imagini ale produsului, în timp ce funcţiile de chat s-au bazat pe Llama 2, cu unele seturi de date adnotate disponibile public, a declarat pentru Reuters un purtător de cuvânt al Meta.
Interacţiunile cu Meta AI pot fi, de asemenea, folosite pentru a îmbunătăţi funcţiile în viitor, a spus purtătorul de cuvânt.
Clegg a arătat că Meta a impus restricţii de siguranţă cu privire la conţinutul pe care instrumentul Meta AI l-ar putea genera, cum ar fi interzicerea creării de imagini foto-realiste ale personajelor publice.
Cu privire la materialele protejate prin drepturi de autor, Clegg a spus că se aşteaptă la ”o cantitate echitabilă de litigii” cu privire la problema ”dacă conţinutul creativ este acoperit sau nu de doctrina de utilizare loială existentă”, care permite utilizarea limitată a operelor protejate în scopuri precum comentariul, cercetarea şi parodiile.
Unele companii cu instrumente de generare de imagini facilitează reproducerea personajelor emblematice precum Mickey Mouse, în timp ce altele au plătit pentru materiale sau au evitat în mod deliberat să le includă în datele de instruire.
OpenAI, de exemplu, a semnat un contract de şase ani cu furnizorul de conţinut Shutterstock, în această vară, pentru a folosi bibliotecile de imagine, video şi muzică ale companiei pentru instruire.
Întrebat dacă Meta a luat astfel de măsuri pentru a evita reproducerea imaginilor protejate prin drepturi de autor, un purtător de cuvânt al Meta a subliniat noi termeni şi condiţii care interzic utilizatorilor să genereze conţinut care încalcă drepturile de confidenţialitate şi de proprietate intelectuală.