Generación de contenido multimedia mejorada con IA: cómo Photozig escaló los flujos de trabajo de imagen y vídeo con Avahi y AWS

Cliente

Photozig, inc.

Ubicación

Campbell, CA

Industria

Medios digitales y tecnología de la salud

Servicios y tecnología

Amazon EC2, Amazon S3, Amazon API Gateway, AWS Lambda, Amazon SageMaker, Amazon Bedrock, Amazon CloudWatch, AWS IAM

Resumen del proyecto

Photozig, una empresa de tecnología digital centrada en aplicaciones de salud y medios, pretendía optimizar y escalar sus procesos de generación de contenido multimedia impulsados por IA. Se asociaron con Avahi para construir un sistema listo para producción en AWS que mejorara las indicaciones del usuario utilizando LLM avanzados, integrara modelos de difusión de vanguardia para la generación de imágenes y permitiera la creación de vídeos de formato corto. Este proyecto de 8 semanas entregó con éxito una plataforma escalable, impulsada por API y respaldada por herramientas nativas de AWS, mejorando la calidad del contenido y la velocidad de entrega, al tiempo que reducía la complejidad operativa

Acerca del cliente

Photozig, Inc. es una empresa de tecnología con sede en California que se especializa en soluciones de medios digitales para las industrias de la salud, el bienestar y la creatividad. La empresa se centra en el aprovechamiento de la inteligencia artificial para mejorar la generación de imágenes y vídeos tanto para los usuarios finales como para los clientes empresariales.

El problema

Photozig necesitaba una canalización moderna y eficiente para procesar las indicaciones generadas por los usuarios y convertirlas en imágenes y vídeos de alta calidad. Sus sistemas existentes carecían de optimización de las indicaciones, y la generación de contenido multimedia se basaba en flujos de trabajo de modelos obsoletos o aislados. Sin abordar estas carencias, Photozig se arriesgaba a tiempos de respuesta lentos, resultados inconsistentes y pérdida de competitividad en el mercado de las herramientas creativas impulsadas por la IA. Además, la incapacidad de manejar grandes volúmenes de contenido o de admitir funciones de vídeo modernas limitaba su capacidad de escalar la producción.

Por qué AWS

AWS proporcionó la infraestructura segura, escalable y optimizada para GPU necesaria para las cargas de trabajo de IA generativa. Servicios como Amazon Bedrock permitieron la mejora de las indicaciones a través de LLM potentes, mientras que Amazon EC2 con GPU NVIDIA admitió la inferencia de modelos de alto rendimiento. AWS Lambda, S3, CloudWatch y SageMaker simplificaron la orquestación, el almacenamiento, la supervisión y la implementación en toda la plataforma.

Por qué Photozig eligió Avahi

Como socio AWS de nivel Premier, Avahi aportó una profunda experiencia en la creación de soluciones en la nube centradas en la IA, incluyendo el conocimiento práctico de la evaluación de modelos, la optimización del flujo de trabajo y la arquitectura sin servidor. El enfoque consultivo de Avahi garantizó una ejecución rápida a través de hitos semanales, una integración flexible con los activos existentes de Photozig y el uso personalizado de modelos de última generación como Nova Canvas y AnimatedDiff. El enfoque del equipo en la preparación para la producción y la implementación nativa de AWS fue clave para entregar un sistema robusto en un plazo de 8 semanas.

Solución

Avahi implementó una solución multicomponente en los flujos de trabajo de imagen y vídeo:

  • Data ETL: Ingesta, limpieza y almacenamiento de las indicaciones de usuario existentes utilizando canalizaciones personalizadas en Amazon S3.
  • Mejora de las indicaciones: Creación de una API de calidad de producción impulsada por el modelo Nova Pro de Amazon Bedrock para refinar las entradas de usuario y obtener resultados de generación de mayor calidad.
  • Generación de imágenes: Integración de modelos de difusión como Nova Canvas, SD3.5 y Flux con eliminación de fondos y post-procesamiento, optimizando para múltiples resoluciones.
  • Generación de vídeo: Implementación de canalizaciones de vídeo corto utilizando LTX, Wan 2.1 y AnimatedDiff con funciones avanzadas como zoom, paneo, intercambio de caras e intercambio de productos.
  • Infraestructura: Aprovisionamiento de instancias EC2 aceleradas por GPU (g6e.8xlarge con NVIDIA L40S), API Gateway, Lambda y monitorización a través de CloudWatch para el rendimiento y la fiabilidad.
  • Plataforma ComfyUI: Integración de un motor de flujo de trabajo basado en nodos para permitir la gestión intuitiva y el procesamiento por lotes de las canalizaciones de IA.

Resultados clave

  • API de mejora de indicaciones lista para producción
  • Canalizaciones ETL para indicaciones de usuario
  • Modelos de difusión integrados para la generación de imágenes
  • Canalizaciones de generación de vídeo corto
  • Scripts de implementación y automatización de AWS
  • Documentación y sesiones de transferencia de conocimientos
  • Monitorización a través de AWS CloudWatch

Impacto del proyecto

La implementación permitió a Photozig operar una plataforma de generación de contenido de IA escalable y de alta calidad con una integración perfecta en sus sistemas existentes. El cliente ahora admite casos de uso avanzados en imagen y vídeo con tiempos de salida más rápidos, flujos de trabajo optimizados y compatibilidad con múltiples resoluciones.

Métricas clave

  • Implementación 100% nativa de AWS sin dependencia de SaaS de terceros
  • Soporte para más de 3 formatos y resoluciones de imagen (1024×1024, 864×1536, 1536×864)
  • Optimización de GPU a través de NVIDIA L40S (46 GB de VRAM) en instancias g6e.8xlarge
  • Más de 6 modelos de IA integrados, incluyendo Nova Pro, Flux, LTX, AnimatedDiff y Hunyuan

Recomendamos encarecidamente a Avahi como un socio tecnológico fiable e innovador. Su experiencia en tecnologías de vanguardia fue fundamental para construir nuestra prueba de concepto (PoC) y desarrollar nuestro producto mínimo viable (MVP). Avahi siempre ofreció soluciones de alta calidad a tiempo, manteniendo un enfoque colaborativo y receptivo. Fueron más allá de las expectativas al identificar oportunidades de mejora, garantizando la escalabilidad y el cumplimiento de nuestros productos centrados en la aplicación de la ley. Avahi es la elección clara si necesita un socio tecnológico con conocimiento de la industria, profesionalidad y un compromiso con la innovación.

Brandon Puhlman

Fundador, bravo foxtrot

¿Listo para transformar su negocio con la IA?

Reserve su taller gratuito de IA de activación

Exploremos juntos sus oportunidades de IA de alto impacto en una sesión gratuita de medio día

Vea nuestros casos prácticos

Vea cómo hemos ofrecido resultados medibles para empresas como la suya