MIMO es un modelo generalizable para la síntesis de video controlable, que no solo puede sintetizar videos de personajes realistas con atributos controlables (es decir, personaje, movimiento y escena) proporcionados por entradas de usuario muy simples, sino que también logra simultáneamente una escalabilidad avanzada para personajes arbitrarios, generalidad para nuevos movimientos 3D y aplicabilidad a escenas interactivas del mundo real en un marco unificado.
Comentarios
Dejo también enlace a la página del proyecto con muchos más vídeos y explicaciones:
https://menyifang.github.io/projects/MIMO/index.html
Uno de los investigadores se llama Miaomiao... ¿aquí no gustaban los gatos?