La Inteligencia Artificial está demostrando ser una herramienta muy capaz cuando se trata de manipular videos de personas.

El ejemplo más visible ha sido el de las “falsificaciones profundas” (deepfakes) en las que se intercambian caras animadas.

Pero cada día se encuentran nuevas aplicaciones. ¿Lo último? Deepfakes de baile. Utilizan la Inteligencia Artificial para leer los movimientos de alguien y replicarlos digitalmente con el cuerpo de otra persona.

La herramienta fue creada por un cuarteto de investigadores de la UC Berkley. Como describen en un artículo publicado en arXiV, su sistema consta de una serie de pasos discretos. En primer lugar, se graba un vídeo del objetivo y un subprograma convierte sus movimientos en una figura de trazos. Se necesita bastante vídeo para obtener una transferencia de buena calidad: alrededor de 20 minutos de metraje a 120 fotogramas por segundo. Luego, se encuentra un video fuente y se hace una figura de trazos con sus movimientos. A continuación, el intercambio ocurre con una red neuronal de síntesis de vídeo de la persona objetivo sobre la base de los movimientos de la figura de palitos de la fuente.

Youtube video

Suena simple, pero hay mucha ingeniería inteligente involucrada. Por ejemplo, hay una subrutina que suaviza el movimiento de las figuras de trazos para que los bailarines no se muevan demasiado, y hay una red neuronal completamente separada dedicada a retrazar la cara del objetivo para asegurar el realismo.

También hay limitaciones en el programa. La red no puede modelar con precisión telas sueltas, por ejemplo, por lo que el individuo objetivo tiene que usar ropa ajustada. En el vídeo también se pueden ver bastantes anomalías visuales, como momentos en los que las articulaciones del bailarín de destino y de origen no se alinean del todo o en los que el software de IA no puede reproducir movimientos complejos, como una mano volteándose de atrás hacia adelante.

Aún así, es un trabajo impresionante. Es el tipo de manipulación de vídeo que probablemente le llevaría a todo un equipo semanas producir. Ahora, todo lo que se necesita es un poco de vídeo fuente y el software de IA adecuado.

La correcta aplicación de esta tecnología no es lo que preocupa sino los potenciales usos perversos, como la colocación de personas en escenas de las que nunca participaron.