Este texto no es una introducción a como generar imágenes con inteligencia artificial, tampoco es una critica a el modelo de negocio, ni mucho menos hablaré (o eso intentaré) sobre la ética de usar y el origen de las imágenes de alimentan a midjourney, Para todos esos temas estoy seguro existen mejores lugares en linea para enterarse o discutir de esos temas.
Más bien lo que me interesa es escribir eso sobre experiencia de usar durante un mes el servicio de midjourney y dar algunos comentarios sobre que me provoca, que ideas me vienen a la mente.
Lo primero que plantearía es como se da esta relación indirecta de creación de imágenes. Una de las cosas que se ha intentado hacer cuando se genera una imagen e computadora es darle al usuario la posiblidad de hacerla directamente. Se intenta simular un pincel, un lapiz o el recorte fisico para permitir que con un mouse o una pluma que toca la pantalla el usuario pueda ver como la imagen se crea, se pega, se modifica. Por decirlo asi, se intenta crear la experiencia fisica de crear una imagen y si se pude mejorarla.
En el caso de la generación de imágenes en midjourney nos encontramos con un método indirecto que me recuerda a el uso de la terminal: Se abre el programa de discord y para crear imágenes se escribe y se describe lo que se quiere generar y midjourney regresa su interpretación de ese comando. se pueden subir imágenes de referencia para tener resultados más precisos y se puede controlar que tanto se deja que el caos aparezca en escena, pero la generación es un acto que sucede detrás de escena.
Es un acto que me recuerda a consultar a un oráculo a un adivino, también me recuerda a la resolución de problemas al soñar. Me hace pensar que es una herramienta que tal vez a los surrealistas les hubiera gustado, escribir un poema mandárselo a la maquina-oraculo que sueña y esperar el resultado.
En Tik Tok algún filtro que genera imágenes a partir de lo que ve la cámara, a terminado siendo usado para cosas como descubrir qué tipo de aura tienes o encontrar fantasmas. Me parece que el uso esotérico y recreativo es casi natural para este tipo de herramientas que nos ocultan su proceso y que aparentemente piensan.
Otra cosa que me pone a pensar es el nivel de realismo que se genera y diría que la mayoría de las personas se maravillan y quieren generar imágenes que parezcan fotográficas o cinematográficas, de hecho existen muchos prompts con palabras como hiperrealism, 8k, cinematic, etc que recuerdan que existe un interés en tener imágenes que parezcan reales. Esta búsqueda de la imagen hiperreal creo que es la que genera toda esta idea de que su uso cuestiona a la imagen fotográfica de prensa (qué es real? qué es deepfake?) y también hace pensar que el trabajo del diseñador o del fotógrafo corre peligro.
Sobre el trabajo creativo y la IA, diré que por un lado pareciera que estamos viendo cómo así como existe el software como servicio, ahora esta empezando a existir el diseño como servicio o tal vez la ilustración como servicio. El problema es saber si estos servicios se volverán monopolicos (como spotify) o tendrán una vida más para ser usado por cada diseñador o creativo a su gusto y manera. También pienso que la Inteligencia artificial que generar imágenes nos enfrenta a pensar en como oficios creativos como el escribir o el diseñar se volvieron una profesión escolar, pero que esto no implica que toda la creación de imágenes o textos deba ser hecha por los profesionales o por lo menos que no es la única manera comercial de satisfacer las necesidades de creación de imágenes.
¿Debemos defender a nuestros gremios o simplemente veremos que sobrevivirán los gremios que alcancen a legislar para protegerse? esa es una pregunta que dejo obviamente sin responder.
Otra cosa que pienso sobre el realismo que se busca con midjourney es la parte erotica y hedonista. Si uno revisa los ejemplo que aparecen en el sitio de midjourney se da cuenta que muchos son ejemplos de modelos perfectas en escenarios ligeramente de ensueño. Obviamente lo veo natural, somos nuestro primer modelo y nuestro deseo esta generalmente en los otros que vemos, el arte esta lleno de representaciones de la belleza humana y me parece que uno de los usos y deseos culposos puede ser dedicarse a copiar esos prompts y ver que aparece, esto tiene sus limites supongo que para no terminar con pura pornografia como ejemplos, pero imagino servicios más privados donde la gente se dedique solo a eso, a correr prompts para satisfacer su deseo.
Al estar generando imágenes pensaba que cantidad de estilos podia crear y si existía un estilo midjourney. Técnicamente no me queda claro cuantos estilos o mejor dicho que tan diversa sean las imágenes de referencia. La respuesta simple seria que si pareciera surgir un cierto estilo midjourney, pero no me queda tan claro si este estilo por ejemplo al crear ilustraciones, tiene más que ver con los prompts que uno usa y si es posible cambiarlo en la medida que no se use instrucciones muy genéricas.
De pronto creando algunas imágenes donde ponía términos como mexicano o mexicana sí me sorprendió como los sombreros aparecían rápidamente, como que estos estilos de lo que pudiera ser mexicano estuvieran muy ligados a imágenes de gente con sombrero. También buscando crear imágenes con estilos de moda juvenil, sobre todo de Japón, me encontraba que algunos términos si mostraba esos estilos pero en otros no parecía entender que se buscaba.
También aun que mi búsqueda no fue extensa, sí me encontraba que al intentar crear una imagen con el estilo de un artista en particular, esta búsqueda se volvía menos correcta cuando se alejaba uno de los artistas más famosos. En este caso creo que es claro que la cantidad o el origen de estos posible artistas esta limitada.
¿Cuál seria la utilidad de midnjourney, cuál seria la parte mas gustosa de usar esta herramienta? Aun que siempre tiene uno la sensación que no se esta creando nada, si no solo pidiendo imágenes, la verdad es que en algún momento se vuelve una experiencia muy gozosa la de esta experimentando rápidamente en muchas variantes de una misma idea.
Me parece una manera de generar muchos bocetos. Una manera de explorar, que se siente muy amplia y con resultados muy terminados. Recuerdo ver varios videos de gente usándolo para crear casas, cómics o fotografías de moda y la manera que hacían estos procesos me parecía muy interesante, diría muy liberadora, por ejemplo si uno no puede fácilmente hacer una imagen con bordados de hilo o en pintura o sacar uan foto en un lugar de dificil acceso. uno podría crear imágenes con este tipo de acabados si tener que aprender estas técnicas o ir a esos lugares.
También me parece que generando prompts que unan ideas no tan claras de combinar o contradictorias (me falto entrarle a poner poemas como prompts) y darle varias vueltas a esos prompts se llega a generar cosas interesantes, también en algunos casos empieza uno a ver como es que midjourney resuelve algunas de estas peticiones, en algunos casos de maneras muy burdas y en otras de maneras inesperadas. De hecho ese me parece un campo interesante de exploración gráfica y de concepto: las maneras que une o amalgama diferentes objetos - ideas de manera gráfica.