Fuente de la imagen: Generado por Unbounded AI
Stability AI, el desarrollador de Stable Diffusion (SD), un modelo de generación de imágenes de código abierto, anunció hoy varias mejoras nuevas en su plataforma Stable Diffusion. Estas actualizaciones no solo ofrecen nuevas y emocionantes capacidades de texto a imagen, sino que también aprovechan el mundo de la creación de contenido 3D.
La mejora más notable es el nuevo modelo 3D estable. Hasta ahora, Stable Diffusion se ha centrado principalmente en la generación de imágenes bidimensionales (2D). Los modelos 3D estables cambiarán eso, proporcionando características que ayudan a crear cualquier tipo de contenido 3D, incluido el diseño gráfico e incluso el desarrollo de videojuegos.
Para los diseñadores gráficos, los artistas digitales y los desarrolladores de juegos, la creación de contenido 3D puede ser una de las tareas más complejas y que requiere más tiempo, ya que a menudo lleva horas (y a veces días) crear un objeto 3D moderadamente complejo.
La capacidad de Stable 3D para generar objetos 3D texturizados con calidad de concepto a partir de imágenes o ilustraciones, o mediante la escritura de indicaciones de texto, elimina gran parte de la complejidad y permite a los no expertos generar un modelo 3D con calidad de borrador en minutos seleccionando un modelo.
Los objetos creados con Stable 3D están en el formato de archivo estándar “.obj”, que se puede editar y refinar aún más en herramientas 3D como Blender y Maya, o importar a motores de juegos como Unreal Engine 5 o Unity. Reduce drásticamente la carga de trabajo de los creadores.
Stable 3D proporciona un entorno creativo rápido para diseñadores, artistas y desarrolladores independientes, lo que les permite crear miles de objetos 3D por día a una fracción del costo.
Actualmente, Stability AI solo está abierto para una vista previa privada de Stable 3D, solicite acceso
Además de su incursión en la generación de contenido 3D, Stability AI también ha lanzado la herramienta Sky Replacer, que está diseñada para hacer exactamente lo que su nombre sugiere: reemplazar el fondo del cielo en imágenes 2D.
La plataforma Stable Diffusion ahora también ofrece Stable Fine-Tuning, que está diseñado para ayudar a las empresas a acelerar el proceso de ajuste fino de imágenes para casos de uso específicos.
Además, la compañía integrará una marca de agua invisible para la autenticación de contenido en imágenes generadas por la API de Stability AI. A medida que la IA generativa se convierte cada vez más en parte de los flujos de trabajo comunes, estas nuevas actualizaciones están diseñadas para ayudar a las empresas con el desarrollo creativo.
Emad Mostaque, CEO de Stability AI, dijo en una entrevista: "Se trata de dar a los narradores creativos las herramientas que necesitan para tener un control adicional sobre sus imágenes. "
Los avances de Stability AI llegan en un momento en que el mercado de generación de texto a imagen se está volviendo más competitivo.
Adobe se ha dirigido a este mercado con Firefly, una herramienta de IA que está estrechamente integrada con el software de diseño de la compañía. Midjourney agrega constantemente nuevas funciones a su tecnología para ayudar a los diseñadores a generar imágenes. No hay que pasar por alto que OpenAI lanzó recientemente el modelo nativo DALL-E 3 de ChatGPT, que mejora la capacidad de generar texto dentro de las imágenes.
Mostaque es muy consciente de su competencia y se compromete a ayudar a que Stability AI se destaque de varias maneras. En particular, enfatizó que su empresa ahora está pasando de solo ofrecer modelos a proporcionar un canal para las ideas. Señala que con el nuevo Sky Replacer y las capacidades de ajuste, todos son pasos adicionales más allá del modelo base básico utilizado para generar imágenes.
Sky Replacer es más que una función, también se centra en casos de uso empresarial.
El concepto de reemplazar fondos en las imágenes no es nuevo. En las aplicaciones de IA no generativa, los fondos a menudo se pueden reemplazar por técnicas como la pantalla verde y la clave de croma.
Mostaque afirma que Stability AI está construyendo y automatizando flujos de trabajo sobre estas tecnologías clásicas para hacer que los procesos sean rápidos y eficientes para los usuarios empresariales. Cambiar el color de fondo del cielo no se trata solo de agregar algún tipo de toque creativo, es una característica con un caso de uso muy específico y práctico.
“Sky Replacer, por ejemplo, es muy útil para el sector inmobiliario”.
Mostaque señala que los usuarios quieren poder tener diferentes fondos y diferentes efectos de iluminación. Fundamentalmente, subrayó, se trata de proporcionar control, ya que las organizaciones tienen sus propios flujos de trabajo para generar imágenes y contenido. Lo que Stability AI está haciendo es crear flujos de trabajo optimizados para ayudar a lograr el control necesario para diferentes casos de uso.
“Sky Replacer es el primero de una serie de productos que lanzaremos y que son muy específicos de la industria y la empresa, basándose en nuestra experiencia de los últimos 6 a 12 meses”.
El nuevo modelo 3D estable funciona ampliando el modelo de difusión utilizado en Stable Diffusion para incluir conjuntos de datos 3D adicionales y vectorización.
“Estoy muy emocionado de poder crear todo el mundo en 3D”.
Mostaque explicó que Stable 3D se construyó en base al trabajo de Stable Diffusion and Stability AI en Objaverse-XL, uno de los conjuntos de datos 3D abiertos más grandes del mundo. La construcción y renderización de imágenes 3D ha sido durante mucho tiempo un proceso que requiere muchos recursos, pero Mostaque es optimista de que la estabilización 3D será más efectiva que los métodos tradicionales de generación de imágenes 3D. Enfatizó que aún es pronto para estabilizar la IA, pero es optimista de que la tecnología evolucionará y se expandirá constantemente con el tiempo. Stable 3D está disponible inicialmente en versión preliminar privada.
"Esto es muy eficiente en comparación con la creación tradicional de modelos 3D. Lo que antes tardaba mucho tiempo en construirse, ahora está obteniendo las primeras aprobaciones muy rápidamente. "
La administración Biden emitió una orden ejecutiva (EO) sobre inteligencia artificial esta semana, y uno de sus componentes es integrar marcas de agua en el contenido generado.
Stability AI ahora está integrando marcas de agua invisibles y credenciales de contenido en su API. Las credenciales de contenido son un esfuerzo de la industria de múltiples proveedores que Adobe y otros participan para ayudar a proporcionar información al autor sobre el contenido. Mostaque dice que es responsable agregar marcas de agua invisibles y credenciales de contenido. También forma parte de un esfuerzo más amplio de Stability AI para aportar autenticidad al contenido que genera.
“Realmente estamos implementando una serie de iniciativas y algunas iniciativas adicionales en torno a este tema, así como investigaciones adicionales, porque queremos saber qué es cierto y qué es falso”, dijo Mostaque. También ayuda con algunos de los mecanismos de atribución y otros mecanismos que estamos creando para futuras versiones. "
Recursos: