Doblaje caótico
¿Liang Feng? 2017-05-22?Star Company
Lo que ves puede no ser cierto.
Se dice que oír es falso y ver es verdad, pero la tecnología derribará este dicho. Hay vídeos reales, o pueden ser "vídeos falsos".
Investigadores de la Universidad de Oxford han desarrollado un sistema de inteligencia artificial que puede convertir imágenes estáticas en vídeos dinámicos e incluso hacer hablar a las personas que aparecen en las imágenes. Crearon este video usando una foto de una persona y un clip de audio.
Si bien el sistema aún es tosco y poco realista, los investigadores dicen que el software pronto hará que los "vídeos falsos" parezcan reales.
En este sistema, los investigadores utilizan el reconocimiento de imágenes para identificar los rostros de las personas.
Luego, el sistema de inteligencia artificial manipula las formas de la boca de las personas en las imágenes estáticas para hacerlas hablar como personas reales.
El autor dijo en el artículo que el sistema es adecuado para rostros y audio sin precedentes, lo que significa que incluso si estos rostros no aparecen como datos de entrenamiento, el sistema se puede utilizar para sintetizar el efecto de "videos falsos". .
Para lograr este objetivo, propusieron un modelo CNN de codificación y decodificación que incorpora rostros y audio para sintetizar el efecto de que las personas puedan hablar en el vídeo. Este modelo ha sido entrenado con decenas de miles de horas de vídeo sin etiquetar.
Zhong Junsen, un estudiante de posgrado de la Universidad de Oxford, es uno de los creadores del sistema. Joon Son Chung dijo que están considerando dividir los videos en varios idiomas.
Espera que con el tiempo los vídeos de noticias puedan traducirse automáticamente a diferentes idiomas y que también se pueda realizar la sincronización de labios. De esta manera, para una plataforma de noticias internacional, la eficiencia de la producción de noticias mejorará enormemente y se reducirá el costo de traducción.
Antes de esto, existían muchos sistemas que podían convertir imágenes en vídeos.
Sin embargo, estos sistemas requieren una gran cantidad de acumulación de vídeo para funcionar correctamente. Coinciden automáticamente con las formas de la boca de la voz humana y luego las recombinan en nuevos vídeos.
Joon Son Chung dijo que esto es para celebridades, como el ex primer ministro británico David. Cameron, sería fácil crear un vídeo con sus imágenes, pero para la gente común y corriente que no es muy conocida, el trabajo se volvería muy difícil porque no hay muchos datos de imágenes que extraer.
Además, Chung también cree que el sistema que desarrolló también es muy eficaz para el doblaje de animaciones. Alex Champandard, otro experto en inteligencia artificial, afirmó que aunque estos sistemas actualmente están enfocados a cambiar la forma de la boca, en el futuro podrán cambiar las expresiones faciales y las posturas. También dijo que la gente rápidamente se confundiría acerca de qué vídeos eran falsos y cuáles reales.
Champandard es cofundador de Creative AI, un sitio web que proporciona herramientas de inteligencia artificial para artistas.
Con el tiempo, los expertos en IA crearán suficientes vídeos para que parezcan reales.
Esta no es una buena noticia para los agentes del orden. Equivale a añadir un nuevo factor de interferencia. Los avances en esta tecnología pueden hacer que las imágenes sean una evidencia menos confiable en algunos casos. Los tribunales tendrán que confiar más en la experiencia judicial, la evidencia científica y el testimonio de los testigos.
Además, debido a que las herramientas de inteligencia artificial hacen que este proceso sea rápido y simple, el umbral de producción se reduce considerablemente y, eventualmente, cualquiera puede hacer un video de este tipo.
Como resultado, ¿se difundirán los vídeos falsos? Al igual que las imágenes p de hoy, están en todas partes.
No encontré la dirección de este software.