lumiere

Microsoft presenta Vasa-1 che genera volti con capacità visive affettive

Di |2024-04-26T09:21:57+02:0026 Aprile , 2024|Articoli, Intelligenza Artificiale, News, Tecnologia e applicazioni|

Microsoft Research Asia ha introdotto VASA-1, un nuovo strumento di intelligenza artificiale per creare volti parlanti estremamente realistici per personaggi virtuali. Questo innovativo strumento consente di generare movimenti labiali perfettamente sincronizzati con l'audio con capacità visive affettive (VAS - visual affective skills), catturando una vasta gamma di espressioni facciali e movimenti naturali della testa, che contribuiscono a rendere la produzione più autentica. Il modello di Microsoft accetta segnali opzionali come condizione, tra cui la direzione dello sguardo principale e le emozioni, permettendo un controllo più preciso sul comportamento dell'avatar generato.

SØØn – Newsletter n°8 del 23 febbraio 2024

Di |2024-03-08T14:48:51+01:0023 Febbraio , 2024|Riepiloghi|

Gli argomenti trattati questa settimana sono: - La visione sull’IA del The New York Times - Le controversie sul copyright nell’addestramento dei modelli di intelligenza artificiale - IA e disinformazione: 20 big tech firmano un accordo a Monaco - Reddit vende i dati degli utenti all’IA - Anche OpenAI ha il suo text to video: nasce Sora

Anche OpenAI ha il suo text to video: nasce Sora

Di |2024-03-01T13:42:47+01:0023 Febbraio , 2024|Articoli, Tecnologia e applicazioni|

OpenAI ha recentemente annunciato il lancio del suo strumento di generazione video da testo denominato Sora. Questo strumento è progettato per convertire istruzioni testuali in video con una durata massima di 60 secondi, consentendo la creazione di scene complesse caratterizzate da più personaggi, movimenti specifici e sfondi dettagliati. Sora si basa su una versione del modello di diffusione utilizzato da Dalle-3 di OpenAI e da GPT-4, il che gli consente di comprendere non solo le istruzioni testuali fornite, ma anche di sviluppare una comprensione della grammatica cinematografica per produrre video più realistici. Con Sora OpenAI entra in competizione diretta con altre aziende, tuttavia, OpenAI afferma che Sora si distingue per il suo sorprendente fotorealismo e la capacità di produrre video più lunghi, fino a un minuto, rispetto alla concorrenza.

Google svela Lumiere

Di |2024-02-05T10:02:22+01:002 Febbraio , 2024|Articoli, Tecnologia e applicazioni|

Google ha introdotto Lumiere il suo innovativo modello di intelligenza artificiale per la generazione di video, questo modello si caratterizza per l'utilizzo del rivoluzionario framework di diffusione denominato Space-Time-U-Net (STUNet), che consente a Lumiere di comprendere sia gli aspetti spaziali che temporali. Diversamente dagli approcci tradizionali, questa tecnologia avanzata consente di creare video in un unico processo, eliminando la necessità di assemblare fotogrammi fissi più piccoli. Il processo di Lumiere inizia con la creazione dia struttura di base che può provenire da un prompt o da un’immagine. Sfruttando il potenziale di STUNet, il modello approssima la traiettoria degli oggetti all'interno del fotogramma, generando una sequenza organica di fotogrammi che si fondono senza soluzione di continuità, creando un effetto di movimento fluido.

Torna in cima