Microsoft presenta Vasa-1 che genera volti con capacità visive affettive

Microsoft VASA-1 genera volti parlanti estremamente realistici, sincronizzando movimenti labiali e espressioni naturali con l’audio. Supporta vari input come audio e foto, offrendo controllo su sguardo ed emozioni. Capace di produrre video a 45 fps, VASA-1 si distingue per autenticità e precisione, entrando in competizione con modelli come Lumière e Sora.

volti di persone e simbolo di microsoft

Tempo di lettura:

2 minuti


Microsoft VASA-1 genera volti parlanti estremamente realistici, sincronizzando movimenti labiali e espressioni naturali con l’audio. Supporta vari input come audio e foto, offrendo controllo su sguardo ed emozioni. Capace di produrre video a 45 fps, VASA-1 si distingue per autenticità e precisione, entrando in competizione con modelli come Lumière e Sora.

Contenuto riservato agli iscritti alla newsletter.

Se sei iscritto, inserisci la tua email per sbloccare. Se apri da un link della newsletter, l’accesso è automatico.


Consiglio: apri l’articolo direttamente dal link della newsletter per essere riconosciuto automaticamente.

Alcune immagini,traduzioni e sintesi possono essere stati realizzati con ausilio di strumenti di intelligenza artificiale.

Storytelling e supervisione umani