luni, 8 iulie 2019

Sistemul care reconstruieşte chipuri umane în funcţie de voce


În era tehnologiei, inteligenţa artificială atinge performanţe ce păreau acum câteva decenii strict de domeniul SF. Mai nou, este nevoie doar de voce ca să reconstruim un chip uman. 


Cercetători americani de la MIT CSAIL (Computer Science & Artificial Intelligence Laboratory) au conceput un sistem de inteligenţă artificială capabil să genereze o imagine digitală a unei persoane în funcţie de vocea acesteia, după ce "ascultă" o scurtă înregistrare audio cu respectiva persoană. 
Sistemul, "botezat" Speech2Face, este o reţea neuronală - un computer care gândeşte într-un mod similar cu un creier uman - şi a fost "antrenat" de oamenii de ştiinţă folosind milioane de clipuri video de pe internet, în care vorbesc peste 100.000 de oameni diferiţi. Pornind de la această bază de date, Speech2Face a învăţat să facă asociaţii între timbrul vocii şi anumite trăsături ale feţei, apoi sistemul a fost folosit pentru a genera faţa care corespunde unei anumite înregistrări audio. 
Potrivit autorilor, reţeaua recunoaşte anumite caracteristici ale vocii care definesc în principal genul, vârsta şi etnia, elemente generale pentru mari categorii de oameni. "Astfel, acest model va produce chipuri care arată generic. El nu va produce imagini ale anumitor indivizi", notează cercetătorii. Chipurile generate de Speech2Face privesc drept înainte, au expresii neutre şi nu corespund exact persoanelor ale căror voci au fost analizate în cadrul studiului. 
La capitolul performanţă mai este, aşadar, de lucrat. Confruntat cu variaţii de limbă, sistemul a fost uşor de păcălit. De exemplu, când a ascultat un asiatic vorbind în chineză, sistemul a generat figura unui asiatic. Dar, atunci când aceeaşi persoană a vorbit în engleză, sistemul a fost păcălit şi a generat imaginea unei persoane caucaziene. De asemenea, sistemul şi-a demonstrat limitele şi când a venit vorba despre genul persoanei, în funcţie de tonalităţile vocii. Astfel, Speech2Face  a asociat vocile mai groase, mai grave, cu subiecţi de sex masculin şi vocile mai subţiri cu subiecţi de genul feminin, ceea ce nu este de fiecare dată corect. 
Conform cercetătorilor, aceste limitări sunt legate de faptul că baza de date folosită pentru pregătirea sistemului provine doar din clipurile video educative de pe YouTube şi nu este reprezentativă la nivelul întregii populaţii umane. 
Cert este că recunoaşterea facială şi tehnologia se împletesc tot mai mult şi mai bine. De pildă, un inginer software olandez a construit un sistem de recunoaştere facială pentru pisica lui. Când animalul de companie se apropie de uşă, bărbatul primeşte o notificare şi îi dă drumul în casă. Sistemul foloseşte un mini computer, o cameră video, un program software şi senzori de mişcare. După ce îi face o poză animalulii de companie, sistemul analizează imaginea şi, dacă se potriveşte cu cele din baza de date, lansează mesajul "Deschide uşa". Sistemul poate fi adaptat însă şi pentru a recunoaşte oameni, spune inginerul. 
Pentru a descifra personalitatea umană urmărind trăsăturile faciale cheia o reprezintă însă cursurile Face Keys România

Articol de Alma B

Sursa: livescience.com

Te-ar putea interesa şi…
  1. Tu câte chipuri crezi că poţi să recunoşti?
  2. Prosopagnosia sau "orbirea faţă de feţe"
  3. Până la 30 de ani, tot căpătăm experienţă în a recunoaşte chipuri
  4. Mă bucur să te REcunosc!




Niciun comentariu:

Trimiteți un comentariu