Microsoft presenta Vasa-1 che genera volti con capacità visive affettive
Microsoft VASA-1 genera volti parlanti estremamente realistici, sincronizzando movimenti labiali e espressioni naturali con l’audio. Supporta vari input come audio e foto, offrendo controllo su sguardo ed emozioni. Capace di produrre video a 45 fps, VASA-1 si distingue per autenticità e precisione, entrando in competizione con modelli come Lumière e Sora.

Tempo di lettura:
2 minuti
Alcune immagini,traduzioni e sintesi possono essere stati realizzati con ausilio di strumenti di intelligenza artificiale.
Storytelling e supervisione umani
algoritmo avatar generato capacità visive affettive direzione dello sguardo espressioni facciali foto artistiche generazione video google gpu nvidia rtx 4090 input audio intelligenza artificiale lumiere microsoft research asia modelli di ia movimenti facciali openai parametri umani responsabilità tecnologica SØØn172024 sora streaming online traccia audio vasa-1 video realistici










