În era tehnologiei, inteligenţa artificială atinge performanţe
ce păreau acum câteva decenii strict de domeniul SF. Mai nou, este nevoie doar
de voce ca să reconstruim un chip uman.
Cercetători americani de la MIT CSAIL (Computer Science &
Artificial Intelligence Laboratory) au conceput un sistem de inteligenţă
artificială capabil să genereze o imagine digitală a unei persoane în funcţie
de vocea acesteia, după ce "ascultă" o scurtă înregistrare audio cu
respectiva persoană.
Sistemul, "botezat" Speech2Face, este o reţea
neuronală - un computer care gândeşte într-un mod similar cu un creier uman -
şi a fost "antrenat" de oamenii de ştiinţă folosind milioane de
clipuri video de pe internet, în care vorbesc peste 100.000 de oameni diferiţi.
Pornind de la această bază de date, Speech2Face a învăţat să facă asociaţii
între timbrul vocii şi anumite trăsături ale feţei, apoi sistemul a fost
folosit pentru a genera faţa care corespunde unei anumite înregistrări
audio.
Potrivit autorilor, reţeaua recunoaşte anumite caracteristici
ale vocii care definesc în principal genul, vârsta şi etnia, elemente generale
pentru mari categorii de oameni. "Astfel, acest model va produce chipuri
care arată generic. El nu va produce imagini ale anumitor indivizi",
notează cercetătorii. Chipurile generate de Speech2Face privesc drept înainte,
au expresii neutre şi nu corespund exact persoanelor ale căror voci au fost
analizate în cadrul studiului.
La capitolul performanţă mai este, aşadar, de lucrat. Confruntat
cu variaţii de limbă, sistemul a fost uşor de păcălit. De exemplu, când a
ascultat un asiatic vorbind în chineză, sistemul a generat figura unui asiatic.
Dar, atunci când aceeaşi persoană a vorbit în engleză, sistemul a fost păcălit
şi a generat imaginea unei persoane caucaziene. De asemenea, sistemul şi-a
demonstrat limitele şi când a venit vorba despre genul persoanei, în funcţie de
tonalităţile vocii. Astfel, Speech2Face a asociat vocile mai groase, mai
grave, cu subiecţi de sex masculin şi vocile mai subţiri cu subiecţi de genul
feminin, ceea ce nu este de fiecare dată corect.
Conform cercetătorilor, aceste limitări sunt legate de faptul că
baza de date folosită pentru pregătirea sistemului provine doar din clipurile
video educative de pe YouTube şi nu este reprezentativă la nivelul întregii
populaţii umane.
Cert este că recunoaşterea facială şi tehnologia se împletesc
tot mai mult şi mai bine. De pildă, un inginer software olandez a construit un
sistem de recunoaştere facială pentru pisica lui. Când animalul de companie se
apropie de uşă, bărbatul primeşte o notificare şi îi dă drumul în casă.
Sistemul foloseşte un mini computer, o cameră video, un program software şi
senzori de mişcare. După ce îi face o poză animalulii de companie, sistemul
analizează imaginea şi, dacă se potriveşte cu cele din baza de date, lansează
mesajul "Deschide uşa". Sistemul poate fi adaptat însă şi pentru a
recunoaşte oameni, spune inginerul.
Pentru a descifra personalitatea umană urmărind trăsăturile
faciale cheia o reprezintă însă cursurile Face Keys
România.
Articol de Alma B
Sursa: livescience.com
Te-ar putea interesa şi…
- Tu câte chipuri crezi că poţi să recunoşti?
- Prosopagnosia sau "orbirea faţă de feţe"
- Până la 30 de ani, tot căpătăm experienţă în a recunoaşte chipuri
- Mă bucur să te REcunosc!
Niciun comentariu:
Trimiteți un comentariu