Meta Platforms, proprietara Facebook, a lansat un set de noi modele AI dezvoltate de divizia sa de cercetare, inclusiv un „Evaluator Autodidact” care ar putea reduce implicarea umană în procesul de dezvoltare a inteligenţei artificiale (AI), transmite Reuters.
Această lansare vine după introducerea acestui instrument în luna august, într-o lucrare care a detaliat modul în care se bazează pe tehnica ”lanţului de gândire”, similară cu cea folosită de modelele o1 recent lansate de OpenAI, pentru a face evaluări mai fiabile ale răspunsurilor oferite de modele.
Tehnica implică descompunerea problemelor complexe în paşi logici mai mici, îmbunătăţind acurateţea răspunsurilor în domenii precum ştiinţa, programarea şi matematica.
Cercetătorii Meta au utilizat date generate exclusiv de AI pentru a antrena modelul evaluator, eliminând complet intervenţia umană în această etapă.
Această abilitate de a folosi AI pentru a evalua alte AI oferă o perspectivă asupra unui potenţial drum către dezvoltarea agenţilor AI autonomi capabili să înveţe din propriile greşeli, au declarat pentru Reuters doi dintre cercetătorii din spatele proiectului.
Mulţi specialişti din domeniul AI îşi imaginează aceşti agenţi ca fiind asistenţi digitali suficient de inteligenţi pentru a executa o gamă largă de sarcini fără intervenţie umană.
Modelele care se auto-îmbunătăţesc ar putea elimina necesitatea procesului costisitor şi ineficient numit Învăţare prin Întărire din Feedback Uman (RLHF), care presupune contribuţia unor adnotatori umani cu expertiză specializată pentru a eticheta corect datele şi a verifica răspunsurile la întrebări complexe din matematică şi scriere.
”Sperăm că, pe măsură ce AI devine din ce în ce mai supraomenească, va deveni tot mai bună la verificarea propriului lucru, astfel încât să fie mai precisă decât un om mediu. Ideea de a fi autodidact şi capabil să te autoevaluezi este esenţială pentru a ajunge la acest nivel supraomenesc de AI”, a spus Jason Weston, unul dintre cercetători.
Alte companii, precum Google şi Anthropic, au publicat, de asemenea, cercetări despre conceptul RLAIF (Învăţare prin Întărire din Feedback AI), dar, spre deosebire de Meta, aceste companii tind să nu îşi lanseze modelele pentru uz public.
Alte instrumente AI lansate vineri de Meta includ o actualizare a modelului de identificare a imaginilor ”Segment Anything”, un instrument care accelerează timpul de generare a răspunsurilor LLM şi seturi de date care pot fi folosite pentru descoperirea de noi materiale anorganice.