Este viernes, 14 de julio, Meta anunció el lanzamiento de su propia herramienta de inteligencia artificial, creada para producir texto a partir de una imagen y viceversa.
La herramienta se conoció con el nombre de ‘CM3leon’, el primer modelo de IA generativa diseñada a partir de un lenguaje multimodal.
Mark Zuckerberg, líder de la compañía, ha optado por explorar estos modelos generativos de inteligencia artificial que poco a poco se han ido incorporando en el procesamiento de lenguaje natural, ya que puede comprender tanto imágenes como textos.
Las técnicas avanzadas de aprendizaje automático, son utilizadas en estas herramientas de IA con el fin de que aprendan a interpretar correctamente lo requerido por el usuario.
En este sentido, ‘CM3leon’, se estrena con cinco veces menos recursos que los modelos anteriores, pese a esto, es capaz de ofrecer el más alto rendimiento en cada uno de sus resultados.
¿Cómo funciona ‘CM3leon’?
Meta indicó en su blog oficial, que la nueva herramienta tiene la capacidad para producir imágenes más coherentes y detalladas al seguir las indicaciones de entrada. Son diversas las tareas que la IA puede realizar, a continuación explicamos algunas de estas.
Texto a imagen: a partir de un texto en específico el usuario podrá obtener una representación visual de este. La descripción de la misma debe ser completamente detallada y con las composiciones exactas para obtener los resultados esperados.
Generación y edición de imágenes guiadas por texto: esta actividad puede ser un desafío cuando se trata de objetos complejos o cuando la solicitud del usuario no incluye los detalles suficientes. Para ello debe ser muy descriptivo con lo que desea y con los cambios que desea realizarle a la imagen.
Tareas de texto: este modelo de IA, puede generar subtítulos, descripciones largas y cortas, según las indicaciones del usuario. Asimismo, usted podrá darle instrucciones a la IA sobre la generación de subtítulos de imágenes y respuestas a preguntas visuales.
Edición de imágenes: la edición de imágenes es guiada por una estructura que implica comprende no solo las indicaciones textuales, sino también la información de diseño que requiere. De este modo, la herramienta le brinda las ediciones visualmente coherentes.&/ Semana