Inteligencia artificial para crear imágenes – ¿Quién genera el contenido? Por: Juan Nicolás Del Cairo

Hace unos días, se viralizó contenido sobre aplicaciones de inteligencia artificial (IA) que pueden crear cualquier tipo de imagen a partir de descripciones textuales. Los alcances de estas herramientas son asombrosos porque en pocos segundos se obtienen imágenes que, en teoría, son completamente nuevas. Esta posibilidad supone una discusión muy interesante frente al concepto de crear piezas visuales.

Tan pronto me enteré de estos programas, me aventuré a probar uno. Hice la búsqueda y encontré uno llamado Stable Difussion que es de uso libre. Este programa en particular genera una imagen de 512x512 pixeles a partir de una descripción textual de los conceptos, atributos y el estilo que guiara a la IA en la materialización de la imagen; abrí el programa, escribí los textos e hice clic en el botón de “generar” y en pocos segundos el programa creó una imagen completamente nueva. Para confirmar lo que había leído sobre la originalidad de cada pieza, decidí intentar la creación de una nueva imagen sin alterar el texto que había escrito inicialmente. El resultado fue una imagen diferente. Exploré algunas imágenes más, y me resultó increíble constatar con un software sencillo y gratuito de IA puede representar cualquier elemento que se le indique.

Algunos de estos programas se desarrollan con un modelo de código abierto, es decir que cualquier persona puede modificar el programa y compartirlo con las mejoras que le haga. De este modo se construye una herramienta pública que puede personalizarse a gusto de cada quien. Las licencias de las imágenes que se generan varían según la herramienta: algunas son libres, incluso para uso comercial, pero bajo ciertas condiciones; en otras se debe pagar bajo un sistema de suscripción para liberarlas.

Hay algo interesante en la construcción de estos aplicativos con inteligencia artificial, se trata de la “educación” o “entrenamiento” del programa. En este caso, lo hacen relacionando imagen y texto por medio de tags. Por ejemplo, le muestran millones de imágenes de bicicletas con el tag “bicicleta” y el programa empieza a comprender cómo deben organizarse formalmente los pixeles para representar visualmente ese elemento en particular. Este proceso se hace con millones de tags, así la inteligencia artificial adquiere la capacidad de leer y entender qué organización básica de pixeles configura la imagen relacionada con un texto específico.

Una vez la inteligencia artificial ya identifica los tags, debe aprender a recrearlos a partir de un proceso de “corrupción” de la imagen con ruido (grano digital). Según el blog de Google AI, la IA debe añadirle ruido a la imagen y volverla a regenerar reversando el proceso. Cuando la IA logra satisfactoriamente este paso, ha adquirido autónomamente el conocimiento para reconstruir imágenes a partir de tags.

Algunos de los programas más reconocidos para la creación de imágenes por entrada de texto son Dall-e, desarrollado por OpenAI, Midjourney y Stable Difussion. Estos programas no sólo permiten crear imágenes fotorrealistas sino manipular, reorganizar y añadir elementos a imágenes ya existentes. A diferencia de los primeros dos, Stable Difussion es un programa de IA completamente gratuito diseñado de manera colaborativa por más de 20.000 miembros de comunidades, según lo indican en su página web.

El auge de la inteligencia artificial para crear imágenes a partir de texto trae consigo un beneficio para los ilustradores, diseñadores y artistas; en general para todo el gremio creativo, debido a que elimina la limitación técnica para crear o plasmar un concepto, así mismo el tiempo que toma desarrollarlo. Ahora si tengo la idea y el acceso a estos programas, puedo describir que es lo que quiero y obtenerlo en cuestión de minutos.

Considero que esta tecnología va a revolucionar la forma en la que entendemos el concepto de crear piezas visuales. En unos años seguramente van a desarrollar herramientas más capaces, que incluso generarán películas completamente artificiales. Estamos empezando a darle un nuevo significado al contenido digital, donde ya no necesitamos de conocimientos técnicos, en términos de dibujo pintura, fotografía, etc., para crear elementos visuales.

Nos adentramos a una era donde la inteligencia artificial reemplaza el proceso análogo de ilustrar una pieza o de tomar una fotografía, sólo dependeremos de ideas y conceptos para crear, aun así, seguiremos siendo los autores de la idea. Lo interesante resulta cuando los conceptos, ideas y el texto de input lo genera un software de IA especializado en creación de estos. En este punto, ¿quién será el autor de la pieza?

Leave a Reply

Your email address will not be published. Required fields are marked *