¿Cada vez más creativa? Meta presenta CM3leon, su nueva IA para la generación de imágenes a partir de texto

Meta presenta CM3leon, un modelo de lenguaje multimodal que alcanza “un rendimiento de vanguardia” para la generación de imágenes a partir de texto y “está entrenado con cinco veces menos fuerza de cómputo que métodos basados en transformadores anteriores”.

CM3leon es un modelo entrenado con una receta innovadora basada en modelos lingüísticos de texto. A través de un proceso de preentrenamiento ampliado y una etapa de ajuste fino supervisado, este modelo demuestra que los transformadores basados en tokenizadores pueden alcanzar un rendimiento excepcional en la generación de texto a imagen.

La nueva Inteligencia Artificial (IA) de Meta logra tales resultados con una capacidad de entrenamiento cinco veces menor que los enfoques anteriores basados en transformadores. En un comunicado, la empresa pone varios ejemplos: si uno teclea “un pequeño cactus con un sombrero de paja y gafas de sol de neón en el desierto del Sahara”, se genera una imagen con esa descripción.

Otra función consiste en editar una imagen a partir de una indicación con un texto, como “modificar el color del cielo” de una foto o “ponerle bigote” al cuadro de Johannes Vermeer de “La joven de la perla”.

Además, permite pedir a la IA que describa una foto con palabras.Lo que sorprende de CM3leon es su versatilidad y eficiencia, pues ombina la funcionalidad de los modelos autorregresivos con costos de entrenamiento y una eficacia de inferencia más bajos.

Los sistemas de IA han alcanzado un hito notable al lograr generar imágenes a partir de texto, desatando un mundo de posibilidades creativas y prácticas.

Fuente: Banca y Negocios

0 Shares:
Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

También te puede interesar