Inteligența artificială poate reproduce vocea umană în mai puțin de un minut

Inteligența artificială poate reproduce vocea umană în mai puțin de un minut
Liviu Mihai
Liviu Mihai
scris 5 mar 2018

50 de secunde de „ascultare” îi sunt necesare inteligenței artificiale pentru a putea clona vocea unui om.

Urmărește-ne și pe Google News
Evenimente

25 aprilie - MedikaTV - Maratonul Sănătatea Digestiei
23 mai - Maratonul Fondurilor Europene
27 mai - Eveniment Profit.ro Real Estate (ediţia a IV-a) - Piața imobiliară românească sub aspectul crizei occidentale

Cercetătorii care lucrează pentru gigantul chinez Baidu au creat o inteligență artificială care poate reproduce fidel vocea unui om după ce o ascultă anterior preț de numai 50 de secunde.

AI-ul celor de la Baidu are la bază sistemul propriu de sintetizare Deep Voice, care era folosit până acum pentru conversia textului în vorbire. Acesta a parcurs un proces de antrenare care a constat în ascultarea 2.400 de vorbitori, însumând peste 800 de ore de audio.

În mod normal, clonarea veritabilă a unei voci umane se face după parcurgerea a 100 de pasaje audio a câte 5 secunde fiecare. Însă, după doar 10 pasaje audio de 5 secunde AI-ul celor de la Baidu este deja capabil să păcălească sistemele de recunoaștere vocală în 95% din cazuri.

Șeful Boeing: Taxiurile zburătoare vor deveni realitate în următorii 10 ani CITEȘTE ȘI Șeful Boeing: Taxiurile zburătoare vor deveni realitate în următorii 10 ani

Faptul că poate învinge în majoritatea cazurilor sistemele de recunoaștere vocală nu înseamnă că automat AI-ul chinezilor poate păcăli și creierul uman, însă, conform cercetătorilor, este un imens pas înainte față de vocile artificiale folosite în prezent pe orice smartphone.

Clonarea vocii umane poate avea numeroase aplicații. Cercetătorii chinezii vorbesc în primul rând despre pacienții care și-au pierdut vocea și și-ar putea-o recăpăta pe această cale. De asemenea, aplicațiile de smartphone ar putea fi configurate să citească texte chiar cu vocea utilizatorului.

O altă idee de aplicare a acestei tehnologii vizează jocurile electronice. Dezvoltatorii ar putea crea pe cale artificială o mare diversitate de voci pentru caracterele din joc, voci care să nu poată fi distinse de cele umane.

Bineînțeles că cercetătorii chinezi nu vorbesc și despre aplicațiile negative ale acestei tehnologii, care ar putea varia de la crearea unor știri false cât mai credibile, până la învingerea sistemelor de securitate bazate pe recunoaștere vocală.

viewscnt
Afla mai multe despre
inteligenta artificiala
ai