Pese a que Google dio sus primeros pasos en el ámbito de la inteligencia artificial (IA) hace muchos años, ahora con la llegada oficial de su chatbot Bard y su modelo multimodal Gemini, la compañía de Mountain View ha apostado de forma clara por el desarrollo de dicha tecnología.
Ahora, en lo último que parece estar trabajando la compañía, es en un proyecto de IA llamado VLOGGER en el que, tras coger una imagen, esta se puede transformar en un video de personas gesticulando y hablando de forma realista.
¿En qué consiste VLOGGER, de Google?
VLOGGER llega de las manos de un equipo de investigadores de Google, aunque de momento es un estudio y no dispone de ningún tipo de herramienta online. Este proyecto se basa en el uso de los modelos de difusión, que es una técnica de aprendizaje automático que ha demostrado ser bastante eficaz de cara generar imágenes realistas a partir de descripciones de texto.
Cuando esté disponible, se podrá doblar vídeos a otros idiomas e incluso mejorar la interacción entre el humano y el ordenador con avatares realistas. Siempre existe un lado malo, y esto podría fomentar la creación de deepfakes orientados a la desinformación y a los bulos. La principal diferencia entre este y otros intentos es que, en este caso, no hay necesidad de tener que entrenar modelo para cada persona específica.
Detrás de Vlogger se encuentran más de 800.000 identidades distintas y más de 2.000 horas de vídeo, orientados a reproducir a las personas humanas, desde diferentes razas, edades y un completo abanico de expresiones. Como hemos dicho antes, de momento, solamente es un proyecto y debemos esperar para que esta tecnología se materialice y esté disponible para todo el mundo, detalla el portal 20 Minutos.
Cactus24 22-03-24
Abre este enlace para unirte al grupo de WhatsApp
También estamos en Telegram, Facebook y el canal de Whatsapp