Próximo evento: El marco de implementación de agentes de IA
3C Solutions es una empresa de servicios de TI y desarrollo de software con sede en Washington, D. C., que crea soluciones tecnológicas para empresas de los sectores inmobiliario, sanitario y de servicios profesionales. La empresa se enfrentaba a un cuello de botella operativo crítico: el personal tenía que extraer manualmente 22–24 campos de datos de cada documento de transacción inmobiliaria, un proceso lento, propenso a errores e incapaz de escalar. Avahi, socio consultor de AWS, diseñó e implementó una canalización de OCR nativa de AWS, basada en eventos e impulsada por GenAI, que automatizó todo el flujo de trabajo de extracción de documentos mediante Amazon Textract y Amazon Bedrock. La solución alcanzó una cobertura de extracción del 96 % de los campos, con un 90 % de precisión en los campos críticos de fecha, transformando un proceso totalmente manual en una canalización automatizada capaz de procesar por lotes 40–80 archivos por transacción.
3C Solutions es un proveedor de servicios de TI con sede en Washington, D. C., con más de 20 años de experiencia ofreciendo desarrollo de software a medida, servicios de TI gestionados, infraestructura de red y soluciones de ciberseguridad a empresas de la región de Northern Virginia, D. C. y Maryland. La empresa presta servicio a clientes de múltiples sectores, incluidos el inmobiliario, el sanitario y los servicios profesionales. Entre sus productos tecnológicos, 3C opera Broker Central, una plataforma propietaria utilizada por agencias inmobiliarias para gestionar datos de transacciones, flujos de trabajo documentales y procesos de cumplimiento. Con un equipo de aproximadamente 15 empleados, 3C combina una sólida experiencia técnica con un enfoque centrado en el cliente, actuando como una extensión de los departamentos de TI de sus clientes.
Los clientes del sector inmobiliario de 3C Solutions dependían de un proceso manual, intensivo en mano de obra, para extraer datos críticos de los documentos de transacción. Cada transacción inmobiliaria requería que el personal revisara y capturara manualmente 22–24 campos de datos específicos, incluidas fechas de cierre, información de listados MLS, datos de agentes, estructuras de comisiones e identificadores de propiedad, a partir de una combinación de formularios escaneados, PDF y archivos de imagen. Este enfoque manual consumía un tiempo significativo del personal, introducía riesgos de precisión y no podía escalar a medida que aumentaban los volúmenes de transacciones.
El reto se vio agravado por la disponibilidad limitada de datos de muestra. Con solo 22–23 documentos disponibles para establecer patrones de extracción (muy por debajo de los más de 40 que suelen necesitarse para un desarrollo fiable del modelo), crear una solución automatizada exigió enfoques creativos de ingeniería de prompts y diseño de clasificación.
Sin experiencia interna en GenAI o aprendizaje automático, 3C carecía de la capacidad para crear de forma independiente un sistema de extracción impulsado por IA. La plataforma Broker Central existente de la empresa podía gestionar los datos de transacciones una vez introducidos, pero no había un puente automatizado entre los documentos en bruto y los registros estructurados de la base de datos. Cada jurisdicción (Maryland, Virginia y D. C.) utilizaba formatos de documento y convenciones de campos diferentes, lo que añadía más complejidad. Continuar con flujos de trabajo manuales dejaría a 3C sin capacidad para ofrecer los servicios de procesamiento documental automatizados y escalables que sus clientes inmobiliarios esperaban cada vez más.
AWS ofrecía un conjunto integral de servicios de IA y aprendizaje automático diseñados específicamente para flujos de trabajo de procesamiento documental. Amazon Textract proporcionaba capacidades de OCR para extraer texto, pares clave-valor y campos de formularios de PDF e imágenes, mientras que Amazon Bedrock ofrecía acceso a modelos fundacionales para la extracción de entidades impulsada por GenAI, ambos componentes críticos de la canalización de extracción en dos etapas que requería el proyecto.
El ecosistema más amplio de AWS, que incluye Amazon S3 para el almacenamiento de documentos, AWS Lambda y Amazon EventBridge para la orquestación basada en eventos, AWS Fargate para cómputo sin servidor y Amazon RDS para el almacenamiento de datos estructurados, permitió una arquitectura totalmente gestionada y escalable que minimizó la sobrecarga operativa. El modelo de precios de pago por uso de AWS y los componentes sin servidor garantizaron la eficiencia de costes para volúmenes variables de procesamiento documental. La colaboración contó con financiación de socios de AWS, reforzando el compromiso de AWS de impulsar la transformación empresarial basada en IA para sus clientes.
3C Solutions necesitaba un socio con una sólida experiencia tanto en el desarrollo de aplicaciones GenAI como en el diseño de arquitecturas nativas de AWS. Avahi, como socio consultor de AWS especializado en IA generativa, migraciones a la nube y modernización de aplicaciones, aportó el talento especializado en ingeniería de IA/ML y el conocimiento de infraestructura de AWS que a 3C le faltaba internamente.
El equipo de Avahi incluía científicos de datos, ingenieros de IA e ingenieros cloud con experiencia, capaces de diseñar y entregar desde cero una canalización de extracción lista para producción, abarcando la integración de OCR, la ingeniería de prompts de GenAI, la arquitectura basada en eventos y el desarrollo de aplicaciones front-end. Esta amplitud de capacidades permitió a 3C trabajar con un único socio para toda la solución, en lugar de coordinarse con múltiples proveedores.
El modelo de colaboración, respaldado por financiación de socios de AWS, permitió a 3C acceder a capacidades GenAI de nivel empresarial sin inversión inicial en infraestructura, con Avahi gestionando todo el ciclo de entrega desde el descubrimiento hasta la transferencia de conocimiento y el soporte por correo electrónico posterior a la colaboración.
Avahi diseñó e implementó una canalización de OCR nativa de AWS, basada en eventos e impulsada por GenAI, que automatizó todo el flujo de trabajo de extracción de documentos para 3C Solutions. La solución combinó las capacidades de OCR de Amazon Textract con los modelos fundacionales de GenAI de Amazon Bedrock para crear una canalización de extracción en dos etapas capaz de gestionar tanto datos estructurados de formularios como texto no estructurado presente en documentos de transacciones inmobiliarias.
La arquitectura sigue un patrón basado en eventos orquestado íntegramente mediante servicios de AWS. Los usuarios cargan documentos a través de una interfaz web de Streamlit desplegada mediante Amazon CloudFront, que genera URL prefirmadas de Amazon S3 a través de Amazon API Gateway y AWS Lambda para una transferencia segura de archivos. Cuando el archivo llega a Amazon S3, Amazon EventBridge activa tareas de AWS Fargate que orquestan la canalización de procesamiento. Los documentos pasan primero por un motor de clasificación personalizado que utiliza puntuación de confianza para identificar tipos de documento y filtrar contenido irrelevante. A continuación, Amazon Textract realiza OCR para extraer texto, pares clave-valor y campos de formularios de PDF, JPG y PNG. Amazon Bedrock aplica extracción de entidades impulsada por GenAI mediante modelos fundacionales con prompts diseñados específicos por tipo de documento, adaptados a los formatos de transacciones inmobiliarias de las jurisdicciones de Maryland, Virginia y D. C.
Los datos extraídos se transforman a un formato JSON estructurado y se almacenan en una base de datos de Amazon RDS. La solución admite integración entre cuentas mediante una conexión VPN de AWS Site-to-Site, lo que permite un flujo de datos fluido hacia la plataforma Broker Central existente de 3C. La canalización gestiona el procesamiento por lotes de 40–80 archivos por transacción mediante seguimiento basado en TransactionID con procesamiento asíncrono basado en colas, garantizando la escalabilidad y manteniendo la eficiencia de costes mediante cómputo sin servidor.
Avahi gestionó todo el ciclo de entrega a lo largo de una colaboración de cinco meses, de septiembre de 2025 a marzo de 2026, con reuniones diarias y puntos de contacto semanales con el cliente para asegurar una colaboración ágil. La colaboración incluyó documentación técnica completa, entrega del código con archivos README y múltiples sesiones de transferencia de conocimiento para garantizar que el equipo de 3C pudiera mantener y ampliar la solución de forma independiente. Se proporcionaron dos semanas de soporte por correo electrónico tras la finalización para cualquier aclaración pendiente.
La solución transformó el procesamiento documental de 3C Solutions de una operación totalmente manual a una canalización automatizada impulsada por IA. El sistema logró la extracción automatizada de 23 de los 24 campos objetivo, lo que representa una cobertura del 96 % de los campos, es decir, casi todos los puntos de datos requeridos de transacciones inmobiliarias se capturan ahora sin introducción manual. En las fechas MLS, un campo crítico y sensible al tiempo para el seguimiento de transacciones, el sistema demostró un 90 % de precisión, confirmando un rendimiento listo para producción en puntos de datos de alta prioridad.
La arquitectura sin servidor basada en Fargate proporciona escalabilidad elástica para gestionar volúmenes variables de documentos, con procesamiento basado en eventos iniciado automáticamente tras la carga de archivos y procesamiento asíncrono basado en colas que garantiza un rendimiento fiable durante picos de carga. Al cierre del proyecto, el cliente valoró la colaboración global con 5 sobre 5 en entrega del proyecto, experiencia técnica, gestión del proyecto y experiencia general con Avahi, destacando la capacidad de respuesta del equipo, el apoyo durante toda la compleja colaboración y la capacidad de mantener el proyecto según lo previsto. La solución se entregó dentro del marco presupuestario asignado, con una utilización del 95 % del presupuesto, lo que demuestra un uso eficiente de los recursos pese a la complejidad técnica y las limitaciones derivadas de la escasez de datos de muestra.
Exploremos juntos sus oportunidades de IA de alto impacto en una sesión gratuita