La tecnologia continua a crescere a passi da gigante, attingendo a diverse aree per esplorare nuove capacità e funzioni. Uno di questi è riuscire a «ricostruire» il volto di una persona attraverso un frammento di voce.
Lo studio Speech2Face presentato nel 2019 in una conferenza sui modelli di visione e riconoscimento ha dimostrato che un'intelligenza artificiale (AI) può decifrare l'aspetto di una persona attraverso brevi segmenti audio.
L'articolo spiega che l'obiettivo dei ricercatori Tae-Hyun On, Tali Dekel, Changil Kim, Inbar Mosseri, William T. Freeman e Michael Rubinstein del MIT Research and Science Program non è quello di ricostruire i volti delle persone in modo identico, ma di creare un'immagine con le caratteristiche fisiche che sono correlate con il audio analizzato.
Per raggiungere questo obiettivo, hanno utilizzato, progettato e addestrato una rete neurale profonda che ha analizzato milioni di video presi da YouTube in cui le persone parlano. Durante la formazione, il modello ha imparato a correlare le voci con i volti, permettendogli di produrre immagini con attributi fisici simili a quelli dei parlanti, tra cui età, sesso ed etnia.
La formazione è stata condotta sotto supervisione e utilizzando la concomitanza dei volti e delle voci dei video su Internet, senza la necessità di modellare le caratteristiche fisiche dettagliate del viso.
Hanno spiegato che, poiché questo studio potrebbe avere aspetti sensibili all'etnia, così come alla privacy, non sono stati aggiunti aspetti fisici specifici alla ricreazione dei volti e assicurano che, come qualsiasi altro sistema di apprendimento automatico, migliora nel tempo, poiché in ogni uso aumenta la sua libreria di conoscenze.
Mentre i test mostrati mostrano che Speech2Face ha un numero elevato di coincidenze tra volti e voci, aveva anche alcuni difetti, dove etnia, età o sesso non corrispondevano al campione vocale utilizzato.
Il modello è progettato per presentare correlazioni statistiche esistenti tra i tratti del viso e la voce. Va ricordato che l'IA ha imparato attraverso i video di YouTube, che non rappresentano un campione reale della popolazione nel mondo, ad esempio, in alcune lingue mostra discrepanze con i dati di formazione.
In questo senso, lo studio stesso raccomanda, alla fine dei suoi risultati, che coloro che decidono di esplorare e modernizzare il sistema, considerino un campione più ampio di persone e voci in modo che l'apprendimento automatico abbia un repertorio più ampio di volti corrispondenti e ricreati.
Il programma è stato anche in grado di ricreare la voce nei cartoni animati, che hanno anche un'incredibile somiglianza con le voci degli audio analizzati.
Poiché questa tecnologia potrebbe essere utilizzata anche per scopi malevoli, la ricreazione del viso rimane solo il più vicino alla persona e non dà facce piene, poiché questo potrebbe essere un problema per la privacy delle persone. Tuttavia, è stato sorprendente ciò che la tecnologia può fare dai campioni audio.
CONTINUA A LEGGERE:
Más Noticias
Día Internacional de Besar a un Pelirrojo: el origen de una fecha que nació como respuesta al estigma y la burla
Cada 12 de enero se conmemora el Día Internacional de Besar a un Pelirrojo, una fecha surgida como reacción cultural frente a la discriminación, que hoy busca reivindicar la diversidad y celebrar la identidad pelirroja.

Alianza Lima vs Rebaza Acosta EN VIVO HOY: punto a punto del partidazo por la fecha 1 de la fase 2 de la Liga Peruana de Vóley 2025/2026
El elenco ‘victoriano’ afronta el encuentro tras una destacada actuación en la primera etapa, mientras que el equipo del Callao buscará dar la sorpresa en Villa El Salvador

María Pía Copello revela cómo Catitejas y Starbucks llegaron a un acuerdo de coexistencia de marcas
El registro de la marca Catitejas fue autorizado por Indecopi tras la firma de un acuerdo de coexistencia con Starbucks, descartando cualquier conflicto legal entre ambas partes y permitiendo que ambos productos convivan en el mercado peruano

Yeison Jiménez era uno de los artistas más cotizados: cuánto cobraba por concierto y por qué se quejaba del pago de impuestos
El cantante de música popular, fallecido el 10 de enero en accidente aéreo, justificaba su valor porque “a la gente le gusta ir a mis conciertos y se llenan”

EN VIVO - Mercado de fichajes: altas, bajas y rumores de los equipos de la Liga BetPlay hoy, 11 de enero
La confirmación del fichaje de Luis Muriel mantiene la expectativa en el cierre de la bolsa de jugadores para el primer semestre del campeonato colombiano
