Futuro

La prima ragazza “artificiale”

La startup di Hong Kong Pantheon Lab ha diffuso il video di una giovane che corre, parla, vive come un essere umano. Ma è un sofisticatissimo progetto di AI che può essere usato per marketing e produzioni
“La modella in questo video è stata sintetizzata da Pantheon Lab Limited", ha spiegato la startup cinese
“La modella in questo video è stata sintetizzata da Pantheon Lab Limited", ha spiegato la startup cinese Credit: Via pantheonlab.ai
Tempo di lettura 5 min lettura
16 maggio 2022 Aggiornato alle 19:00

La linea che divide reale e irreale si fa sempre più sottile. Un video diffuso dalla startup cinese Pantheon Lab Limited vede come protagonista una giovane ragazza che posa per uno shooting, si allena, beve una birra in compagnia, balla e canta allegramente. Ma non è una persona vera. “La modella in questo video è stata sintetizzata da Pantheon Lab Limited”, spiegano sotto la clip.

È dall’agosto del 2019, data di fondazione della startup made in Hong Kong, che il team composto da 8 persone si sforza di “costruire l’immaginazione all’interno della realtà”: in questi tre anni le loro tecnologie di intelligenza artificiale si sono sviluppate abbastanza da consentire di realizzare un viso, una voce e un lipsync (il labiale) abbastanza naturali da simulare una persona vera.

La novità arriva dall’Hong Kong Science Park, uno tra i più grandi parchi scientifici e tecnologici al mondo: si tratta di una società pubblica istituita dal governo locale nel 2001 per promuovere lo sviluppo dell’innovazione e della tecnologia in una delle due regioni amministrative speciali della Cina.

I pilastri di Pantheon Lab sono tre: Virtual Human Synthesis, Image & Video Synthesis, Speech & Voice Synthesis. Creano, in ordine, avatar virtuali molto fedeli alla realtà in pochi clic, generano e manipolano contenuti visivi su larga scala e possono sintetizzare il parlato, a partire da un testo o da altre registrazioni vocali.

“L’azienda utilizza la tecnologia di deep learning per creare applicazioni software per lo sviluppo di contenuti visivi di qualità e auto-generati, inclusi immagini, video, caratteri e esseri umani virtuali per servire le industrie del marketing, della creatività e dei contenuti”, spiegano sul sito dell’Hong Kong Science Park.

Il deep learning è l’apprendimento di dati non forniti dall’uomo, ma elaborati grazie all’utilizzo di algoritmi di calcolo statistico. Il loro obiettivo? Comprendere come funziona il cervello umano e come riesca a interpretare immagini e linguaggio. Per poi riprodurre lo stesso processo.

I tempi di “addestramento”, grazie alle numerose conquiste in campo informatico, si sono ridotti di moltissimo: grazie all’introduzione di nuove unità in grado di elaborare dati sensibili – le Gpu, graphics processing unit – e alla facilità di trovare enormi quantità di dati, il deep learning ha compiuto passi da gigante.

E questo sviluppo è ben visibile nel video di Pantheon Lab, che spiega come l’azienda utilizzi, in particolare, “la più recente tecnologia di deep learning (Generative Adversarial Network) per creare un servizio di back-end in grado di generare autonomamente contenuti visivi specificati dagli utenti, dalle immagini, ai video, ai caratteri e ai modelli umani”.

Pantheon Lab punta a costruire “tecnologie a supporto della vita umana virtuale” e mira a riprodurre ”realismo, naturalezza e prestazioni”. La ragazza protagonista del video in questione, di cui ancora non conosciamo nome e cognome, ride, parla e si muove esattamente come un essere umano.

“La nostra tecnologia riduce di un ampio margine i costi e i tempi di produzione causati dalla necessità di costruire modelli specializzati per ogni nuovo avatar. Questo sblocca possibilità illimitate nella creazione rapida nel nostro ecosistema umano virtuale”, spiega la startup.

Le tecnologie offerte prevedono il Face Shifting, che applica le caratteristiche del viso a qualsiasi immagine o video del viso (c’è anche una demo che permette di applicare il volto di alcune star famose alla faccia originale); la Lip Synchronization, che sincronizza il movimento di labbra, bocca e mascella con il parlato, supportando più di 50 lingue, e il Voice Cloning, che, data una breve registrazione vocale, permette di riprodurre quegli attributi vocali su un’altra clip.

Inoltre, Pantheon Lab offre la possibilità a marchi e aziende di creare i propri “ambasciatori virtuali” e produrre video di marketing e formazione interna. “Per creare un video umano virtuale da zero su Internet, tutto ciò di cui hai bisogno è uno script”, spiegano.

Aidol Studio, che è uno dei prodotti di punta dell’azienda, “consente agli utenti di produrre contenuti video coinvolgenti senza la necessità di attori, troupe cinematografiche o studi di registrazione. Utilizziamo il nostro realistico motore di generazione umana virtuale per creare modelli virtuali o cloni umani”.

Aidol Ai, questo il nome del servizio che, dalla creazione di esseri umani virtuali fotorealistici, vuole insegnare loro azioni reali, arriverà presto. La promessa di Pantheon Lab è di dare la possibilità di accesso a una tecnologia “abilitante, coinvolgente ed equa. Cerchiamo di essere responsabili per gli algoritmi che utilizziamo e proteggiamo la privacy degli utenti attraverso il consenso e l’apertura nell’utilizzo dei dati”.

Ma, aspetto più importante, “ci dedichiamo ad assicurarci che la nostra tecnologia rivoluzionaria venga utilizzata esclusivamente per il bene”. Ce lo auguriamo tutti.

Leggi anche