Cleverman
Nueva York
Cuidado personal / Comercio electrónico
AWS EC2 (GPU) Amazon S3 AWS Bedrock Flux Kontext IP Adapters ComfyUI FastAPI PyTorch Streamlit GCP Storage Juggernaut SDXL DreamShaper
Cleverman es una marca de cuidado personal y aseo con sede en Nueva York que ayuda a los clientes a tomar decisiones de compra más seguras a través de la tecnología. Para impulsar una experiencia de prueba virtual personalizada, Cleverman necesitaba una infraestructura de IA de grado de producción capaz de visualizar cambios en el color del cabello y la barba desde múltiples ángulos, sin sacrificar el fotorrealismo ni la precisión de la identidad. Avahi construyó una infraestructura de IA generativa escalable utilizando Flux Kontext con adaptadores IP y un novedoso enfoque Image RAG, logrando puntuaciones perfectas de 5/5 en preservación de la identidad y velocidades de procesamiento 8 veces más rápidas que los modelos de difusión tradicionales. El resultado es una experiencia fluida y orientada al cliente que impulsa la confianza en la compra y diferencia a Cleverman en un mercado de aseo cada vez más competitivo.
Cleverman es una marca de aseo y cuidado personal con sede en la ciudad de Nueva York, centrada en ofrecer experiencias personalizadas a sus clientes. Operando en la intersección de la belleza, el comercio electrónico y la tecnología emergente, la plataforma de Cleverman permite a los consumidores explorar y comprar productos de aseo adaptados a sus necesidades individuales. Con un equipo ágil e impulsado por la innovación, Cleverman ha hecho de la personalización impulsada por IA un pilar fundamental de su estrategia de experiencia del cliente, reconociendo que ayudar a los clientes a visualizar los resultados antes de la compra es una de las formas más efectivas de generar confianza e impulsar las conversiones.
Para una marca de aseo que vende productos para el color del cabello y la barba, la decisión de compra es inherentemente visual e inherentemente incierta. Se pide a los clientes que se comprometan con un producto basándose en una muestra de etiqueta o una foto de modelo genérica que no se parece en nada a ellos. La brecha entre «¿cómo me quedará esto?» y lo que realmente se muestra en la página de un producto es una fuente persistente de dudas, abandono del carrito y devoluciones post-compra.
Cleverman reconoció que una experiencia de prueba virtual personalizada y basada en IA podría cerrar esa brecha, pero ejecutarla con calidad de producción era mucho más exigente técnicamente de lo que parecía. El desafío no era simplemente volver a colorear una foto. Requería generar transformaciones de color consistentes y fotorrealistas en ocho ángulos distintos por imagen de cliente, manteniendo una preservación precisa de la identidad, una coincidencia de color exacta y una precisión de máscara limpia. Cualquier degradación en los detalles faciales o del cabello —incluso sutil— socavaría la confianza del cliente en lugar de construirla.
Los primeros intentos utilizando modelos de generación de imágenes estándar revelaron una limitación crítica: las herramientas existentes producían una deriva de identidad, imprecisiones de color y resultados inconsistentes que requerían un retoque manual significativo. Desplegar ese tipo de infraestructura en un producto orientado al cliente no era viable. Sin una solución que pudiera cumplir con el nivel de calidad requerido para un entorno de comercio real, Cleverman se enfrentaba a tasas de conversión más bajas, mayores volúmenes de devoluciones, crecientes costes de edición manual y una desventaja competitiva cada vez mayor a medida que las experiencias de prueba impulsadas por IA se convertían en una característica esperada en el espacio de la belleza y el aseo.
AWS proporcionó la infraestructura informática y de IA necesaria para ejecutar una carga de trabajo de IA generativa exigente y con uso intensivo de GPU a escala de producción. Los requisitos de procesamiento para la transformación de imágenes multiángulo —particularmente con modelos de difusión de alta fidelidad— hicieron de las instancias de GPU construidas específicamente en AWS EC2 la base adecuada, ofreciendo la flexibilidad de escalar los recursos informáticos según las demandas de la carga de trabajo sin un aprovisionamiento excesivo.
AWS Bedrock amplió aún más las capacidades de la solución al proporcionar acceso a modelos fundacionales gestionados dentro del mismo entorno de nube, lo que permitió a Avahi integrar capacidades de IA adicionales sin introducir dependencias externas. La ejecución de la infraestructura en AWS también se alineó con las prácticas establecidas de seguridad y control de acceso, con roles de IAM que rigen el acceso a los recursos y mantienen los datos de imagen del cliente dentro de un entorno gobernado y controlado durante todo el flujo de trabajo.
El desafío de Cleverman requería un socio con profunda experiencia en IA generativa aplicada, específicamente en visión por computadora, arquitectura de modelos de difusión y el problema matizado de la transformación de imágenes con preservación de la identidad. Las soluciones estándar ya habían demostrado ser insuficientes. Lo que se necesitaba era un equipo capaz de diseñar una infraestructura personalizada desde cero, con una metodología rigurosa de evaluación de modelos para respaldar cada decisión técnica.
Avahi aportó exactamente eso. En lugar de recurrir a un único modelo o enfoque, Avahi realizó una evaluación estructurada de cuatro modelos en cinco casos de prueba con puntuaciones cuantificadas en cinco dimensiones de rendimiento antes de seleccionar la arquitectura final. Esta metodología basada en datos, que evaluó Flux Kontext, Juggernaut SDXL, DreamShaper y alternativas frente a puntos de referencia medibles, dio a Cleverman la confianza de que la solución elegida era genuinamente la mejor opción disponible, no simplemente la más conveniente.
La capacidad de Avahi para combinar técnicas de IA de vanguardia (coincidencia de flujo, Image RAG, enmascaramiento consciente del contexto) con una arquitectura de nube escalable y un código limpio y listo para la entrega los convirtió en el socio adecuado para un proyecto donde tanto la calidad de la ingeniería como la independencia del cliente al final del compromiso eran requisitos innegociables.
Avahi diseñó y construyó una infraestructura de transformación de imágenes GenAI lista para producción, creada específicamente para el caso de uso de prueba virtual multiángulo de Cleverman.
Selección de modelos mediante evaluación rigurosa Antes de escribir una sola línea de código de producción, Avahi realizó una evaluación estructurada de cuatro modelos candidatos: Flux Kontext, Juggernaut SDXL y DreamShaper. Una alternativa adicional, en cinco casos de prueba y cinco dimensiones puntuadas: calidad visual, preservación de la identidad, precisión del color, precisión de la máscara y velocidad de procesamiento. Este marco de evaluación produjo resultados claros y cuantificados que justificaron la selección de la arquitectura final y proporcionaron a Cleverman una base defendible y respaldada por datos para la elección tecnológica.
Arquitectura central de la infraestructura La infraestructura de producción fluye desde una interfaz de usuario basada en Streamlit, donde se cargan las imágenes y se realizan las selecciones de color, a través de un backend de FastAPI que orquesta los flujos de trabajo de ComfyUI que se ejecutan en instancias de GPU de AWS EC2. La arquitectura de coincidencia de flujo de Flux Kontext maneja la transformación central de la imagen, reemplazando el muestreo de difusión iterativo tradicional con un enfoque más directo y eficiente que redujo drásticamente el tiempo de procesamiento. Las imágenes transformadas se almacenan en GCP Storage, y la infraestructura completa está diseñada para la automatización de flujos de trabajo por lotes para soportar la escala.
Preservación de la identidad mediante Flux Kontext El problema técnico más difícil de todo el proyecto fue evitar la deriva de identidad durante la transformación del color, la degradación sutil pero perjudicial de las características faciales, la textura del cabello y las características individuales que hicieron que los intentos de modelos anteriores no fueran adecuados para la producción. La arquitectura de edición consciente del contexto de Flux Kontext abordó esto directamente, logrando una puntuación perfecta de 5/5 en preservación de la identidad en todos los casos de prueba y superando a todas las alternativas evaluadas en dos o tres puntos solo en esta dimensión.
Precisión del color mediante Image RAG con adaptadores IP Lograr una coincidencia de color precisa y consistente, particularmente en ocho ángulos de visión diferentes, requirió un enfoque novedoso. Avahi implementó Image RAG (Generación Aumentada por Recuperación para imágenes) utilizando adaptadores IP, lo que permitió a la infraestructura referenciar y hacer coincidir las características de color objetivo con alta fidelidad en lugar de depender únicamente de indicaciones de texto o del comportamiento generalizado del modelo. Esta técnica produjo una puntuación de precisión de color de 4/5 y fue fundamental para ofrecer una consistencia multiángulo que se mantuvo en condiciones de producto del mundo real.
Preprocesamiento, enmascaramiento y automatización Una infraestructura de preprocesamiento dedicada manejó la precisión de la máscara, aislando las regiones del cabello y la barba con edición consciente del contexto para asegurar que las transformaciones se aplicaran limpiamente sin sangrar en la piel, el fondo u otros elementos de la imagen. La automatización del flujo de trabajo por lotes se integró en la arquitectura desde el principio, lo que permitió a Cleverman procesar múltiples imágenes y ángulos de manera eficiente sin intervención manual en cada paso, y posicionando la plataforma para escalar a medida que crece su base de clientes.
Avahi entregó una infraestructura GenAI de grado de producción que transformó la capacidad de prueba virtual de Cleverman de un objetivo conceptual a una característica de producto escalable y orientada al cliente. Al resolver el problema de la preservación de la identidad que había bloqueado intentos anteriores —y al combinarlo con una coincidencia de color precisa y una precisión de máscara limpia en ocho ángulos—, la solución ofrece a los clientes de Cleverman una vista previa genuinamente fiable y fotorrealista de cómo les quedará un producto antes de comprarlo. Esa capacidad aborda directamente los desafíos de conversión y devoluciones que motivaron el proyecto en primer lugar.
La arquitectura fue construida para la independencia —con documentación completa, transferencia de conocimientos y un código limpio— asegurando que el equipo de Cleverman pueda mantener, extender y escalar la solución sin dependencia externa continua.
Resultados destacados:
Nombre del cliente: Cleverman
Ubicación de la ciudad de negocios del cliente: Nueva York, Nueva York
Industria de negocios del cliente: Aseo / Cuidado personal / Comercio electrónico
Servicios y tecnología: AWS EC2 (GPU) Amazon S3 AWS Bedrock Flux Kontext IP Adapters ComfyUI FastAPI PyTorch Streamlit GCP Storage Juggernaut SDXL DreamShaper
Exploremos juntos sus oportunidades de IA de alto impacto en una sesión gratuita