Transformación de la creatividad en el comercio electrónico: Implementación estratégica de modelos de IA de estabilidad optimizados para PietraStudio utilizando AWS SageMaker.

Cliente

Pietra

Ubicación

Nueva York, NY

Industria

Nueva York, NY

Servicios y tecnología

Jupyter notebook, sagemaker, AWS bedrock

Resumen del proyecto

En una era donde las aplicaciones creativas y prácticas de la IA se expanden continuamente, Pietra, pionera en soluciones de comercio electrónico, buscó aprovechar el poder de los modelos de IA generativa para mejorar sus ofertas de tienda en línea. Esta iniciativa tuvo como objetivo realizar un análisis comparativo meticuloso de los modelos Stability Diffusion y DALL-E utilizando técnicas avanzadas. La piedra angular del proyecto fue el desarrollo en AWS Sagemaker para evaluar estos modelos en paralelo sobre un conjunto uniforme de indicaciones proporcionadas por el usuario. El objetivo principal era explorar y documentar las capacidades, la eficiencia y el potencial de aplicación práctica de cada modelo en varios escenarios creativos.

El proyecto implicó el establecimiento de un entorno Sagemaker, la optimización del modelo Stability Diffusion en conjuntos de datos relevantes del dominio del comercio electrónico, la generación y el análisis de los resultados de indicaciones idénticas y la comparación de estos con los resultados del modelo DALL-E. El objetivo era extraer información práctica para guiar la implementación estratégica del modelo en las operaciones comerciales.

El problema

Con la tecnología de IA generativa en constante avance, existe una creciente demanda para aprovechar los mejores modelos; sin embargo, estas creaciones completamente nuevas vienen con desafíos:

  • Incertidumbre en el rendimiento del modelo: A menudo no está claro qué modelo generativo ofrece un rendimiento superior, ya que se prueban en una variedad de indicaciones y casos de uso. Esta incertidumbre complica el proceso de selección para aplicaciones específicas.
  • Necesidad de optimización: Existe una notable falta de información sobre cómo las técnicas de optimización impactan en el rendimiento de cada modelo. Esta brecha en el conocimiento dificulta la optimización de los modelos para satisfacer las necesidades específicas de manera efectiva.
  • Complejidad del análisis comparativo: Establecer una comparación sistemática y justa entre los modelos presenta dificultades significativas.
  • Restricciones de recursos: La disponibilidad de recursos computacionales para la capacitación/optimización y evaluación extensivas del modelo es limitada. Esta escasez plantea una barrera sustancial para llevar a cabo mejoras exhaustivas y continuas del modelo.
  • Satisfacción del usuario: La medida definitiva del éxito de un modelo es si los resultados generativos satisfacen las expectativas del usuario y se ajustan a los requisitos de la aplicación prevista. Asegurar esta alineación es crucial pero desafiante, dada la naturaleza subjetiva de la satisfacción del usuario.

Valor del proyecto

Estar a la vanguardia es lo que permite a una empresa ser el punto culminante de su dominio; incursionar en un campo apenas explorado es innovador. Al aprovechar y comprender qué modelos y técnicas son los más impactantes para el caso de uso, el proyecto proporcionó un valor significativo al cliente:

  • Información sobre el rendimiento: Ofreció información clara sobre las fortalezas y debilidades de los modelos Stability Diffusion y DALL-E.
  • Eficiencia de los recursos: Demostró el uso eficiente de los recursos computacionales a través de procesos optimizados de capacitación y evaluación.
  • Comprensión mejorada: Mejoró la comprensión del cliente sobre las capacidades y limitaciones de la IA generativa.
  • Toma de decisiones estratégicas: Permitió la toma de decisiones informadas para futuros proyectos de IA y selección de modelos.
  • Satisfacción del usuario: Aseguró que los resultados generados se alinearan con las expectativas del usuario y las necesidades de la aplicación.
  • Facilidad de replicación: Proporcionó pasos detallados con instrucciones fáciles de usar que permiten al equipo técnico del usuario replicar los mejores resultados sin tener que pasar por una fase de descubrimiento.

Solución

Para presentar un modelo factible, se compararon modelos de última generación (DALL-E y Stability Diffusion varios modelos, principalmente SDXL) a través de Jupyter Runbooks, para permitir a los desarrolladores probar diferentes enfoques:

  • Configuración del entorno Jupyter: Se configuró un entorno Jupyter con las bibliotecas y dependencias necesarias para los modelos Stability Diffusion y DALL-E.
  • Preparación de datos: Se utilizó un conjunto de datos de subtítulos de imágenes de ropa de Hugging Face para personalizar los datos y superar los resultados de DALL-E.
  • Optimización del modelo: Para facilitar la comparación y la capacitación de los modelos, se empleó el siguiente diagrama de arquitectura:

Diagrama de arquitectura para la capacitación y la inferencia. Tener un diagrama definido ayuda a la tarea de comparación.

Se aplicaron técnicas avanzadas de optimización al modelo Stability Diffusion, incluyendo:

  • Inversión textual
  • Optimización LoRA (una técnica eficiente en GPU)
  • ControlNet para tareas de imagen a imagen
  • Generación de salida: Se generaron imágenes y salidas para cada indicación utilizando ambos modelos.

Modelo LoRA:

  • Generación de texto a imagen

Salida :

Salida :

Inversión textual

Salida :

Red de control

Salida :

  • Análisis de resultados: Se llevó a cabo un análisis detallado de las salidas, centrándose en aspectos como la calidad, la coherencia, la creatividad y la eficiencia computacional

Generación con LoRA vs DALL-e:

Imagen a imagen:

SDXL-turbo optimizado con LoRA

SDXL-turbo optimizado con LoRA

ControlNet

DALL-E. No permite agregar variaciones a la imagen con texto, es muy restrictivo.

  • Prueba virtual con modelos de estabilidad:

Prueba virtual para hombres.

Prueba virtual para mujeres.

  • Visualización e informes: Se utilizaron Jupyter Notebooks para visualizar los resultados y compilar un informe exhaustivo que destacara los hallazgos y las comparaciones.

Recomendamos encarecidamente a Avahi como un socio tecnológico fiable e innovador. Su experiencia en tecnologías de vanguardia fue fundamental para construir nuestra prueba de concepto (PoC) y desarrollar nuestro producto mínimo viable (MVP). Avahi siempre ofreció soluciones de alta calidad a tiempo, manteniendo un enfoque colaborativo y receptivo. Fueron más allá de las expectativas al identificar oportunidades de mejora, garantizando la escalabilidad y el cumplimiento de nuestros productos centrados en la aplicación de la ley. Avahi es la elección clara si necesita un socio tecnológico con conocimiento de la industria, profesionalidad y un compromiso con la innovación.

Brandon Puhlman

Fundador, bravo foxtrot

¿Listo para transformar su negocio con la IA?

Reserve su taller gratuito de IA de activación

Exploremos juntos sus oportunidades de IA de alto impacto en una sesión gratuita de medio día

Vea nuestros casos prácticos

Vea cómo hemos ofrecido resultados medibles para empresas como la suya