Presentamos Phenaki, un modelo capaz de realizar una síntesis de video realista dada una secuencia de indicaciones textuales. Generar videos a partir de texto es particularmente desafiante debido al costo computacional, las cantidades limitadas de datos de video de texto de alta calidad y la duración variable de los videos.
|
etiquetas: inteligencia artificial , texto a video , tecnología