Próximo evento: El marco de implementación de agentes de IA
Corporate Creations
North Palm Beach, Florida
Servicios de agente registrado y cumplimiento normativo empresarial
Amazon Textract, Amazon Bedrock, Amazon Bedrock Prompt Manager, AWS Lambda, Amazon SQS, Amazon S3, Amazon CloudWatch, AWS IAM, Terraform
Corporate Creations, uno de los principales proveedores nacionales de servicios de agente registrado y cumplimiento normativo, se enfrentaba a un desafío operativo creciente: procesar manualmente miles de documentos gubernamentales emitidos por los estados para clientes en los 50 estados de EE. UU. Avahi diseñó y entregó una solución de procesamiento inteligente de documentos (IDP) nativa de AWS que automatiza la extracción de campos de datos clave de informes anuales y avisos fiscales mediante Amazon Textract y Amazon Bedrock. La solución reemplazó un flujo de trabajo manual que requería varios minutos de trabajo intensivo por un proceso automatizado que genera salidas JSON estructuradas, lo que permite a Corporate Creations escalar sus operaciones mientras reduce el esfuerzo manual y el error humano.
Corporate Creations, fundada en 1993, es el tercer proveedor más grande de servicios de agente registrado y cumplimiento normativo en Estados Unidos. La empresa presta servicios a compañías Fortune 1000, empresas Global 2000, bufetes de abogados Am Law 200 y negocios privados, gestionando la presentación de documentos corporativos, la constitución de empresas, la gestión del cumplimiento normativo y los servicios de agente registrado en los 50 estados de EE. UU. Con miles de clientes y presencia en todas las jurisdicciones, Corporate Creations procesa un alto volumen de documentos emitidos por los estados en nombre de sus clientes, incluidos informes anuales, avisos fiscales y presentaciones por morosidad. La empresa tiene su sede en North Palm Beach, Florida.
Corporate Creations recibe un flujo constante de documentos emitidos por el gobierno procedentes de las oficinas del Secretario de Estado de 51 jurisdicciones. Estos documentos, que incluyen informes anuales, informes anuales por morosidad y avisos fiscales, contienen datos críticos de cumplimiento normativo que deben extraerse e introducirse en los sistemas internos de la empresa de forma precisa y oportuna. Cada documento requiere que el personal lo escanee, extraiga manualmente campos clave como la jurisdicción, el nombre de la entidad, la fecha de vencimiento, el número de expediente y la tasa de presentación, e introduzca esos datos en el sistema. Este proceso tarda aproximadamente de 3 a 4 minutos por documento.
Con miles de documentos procedentes de los 50 estados, este proceso manual creaba un importante cuello de botella operativo. La naturaleza repetitiva del trabajo lo hacía propenso al error humano, y el tiempo necesario para procesar cada documento limitaba la capacidad del equipo para escalar. El director de tecnología de Corporate Creations llevaba tiempo imaginando la automatización de este flujo de trabajo mediante el procesamiento inteligente de documentos, estimando que la automatización podría eliminar la mayor parte de la intervención manual. El equipo directivo consideraba que este cambio proporcionaría un retorno de la inversión masivo al reemplazar la introducción de datos intensiva en mano de obra por una extracción automatizada y escalable.
Corporate Creations seleccionó AWS como plataforma en la nube para esta iniciativa porque AWS ofrecía un conjunto completo de servicios de IA y aprendizaje automático diseñados específicamente para el procesamiento inteligente de documentos. Amazon Textract proporcionaba la capacidad de extraer texto, formularios y tablas de archivos PDF con alta precisión, mientras que Amazon Bedrock ofrecía acceso a modelos de lenguaje de gran tamaño capaces de interpretar y estructurar el contenido extraído en campos de datos bien definidos. La arquitectura sin servidor habilitada por AWS Lambda, Amazon SQS y Amazon S3 permitió al equipo construir un proceso completamente basado en eventos que podía escalar con el volumen de documentos sin requerir gestión de infraestructura.
Además, el apoyo financiero de AWS ayudó a eliminar la barrera de costes de entrada, permitiendo a Corporate Creations emprender esta iniciativa con un riesgo financiero reducido y avanzar en un proyecto que el equipo directivo había estado considerando durante mucho tiempo.
Corporate Creations eligió a Avahi para este proyecto basándose en la profunda experiencia de Avahi como socio consultor de AWS con experiencia demostrada en soluciones de IA generativa y procesamiento inteligente de documentos. El equipo de Avahi aportó conocimientos especializados en la arquitectura de procesos IDP de extremo a extremo utilizando Amazon Textract, Amazon Bedrock y servicios sin servidor de AWS, que era exactamente la pila tecnológica requerida para este proyecto.
Avahi también demostró la capacidad de entregar dentro de un plazo ajustado. El proyecto requería que se construyera, validara y entregara una solución completamente funcional y probada en aproximadamente cuatro semanas, incluyendo el descubrimiento, el diseño de la arquitectura, el desarrollo, las pruebas iterativas y la transferencia de conocimientos. La metodología de entrega estructurada de Avahi, con fases claramente definidas, demostraciones semanales de sprints y un equipo de proyecto dedicado, dio a Corporate Creations la confianza de que la solución se entregaría a tiempo y según las especificaciones.
Avahi diseñó y construyó un proceso de procesamiento inteligente de documentos de extremo a extremo utilizando servicios nativos de AWS. La solución automatiza la extracción de datos estructurados de documentos PDF emitidos por los estados, convirtiendo presentaciones gubernamentales no estructuradas en cargas útiles JSON limpias y legibles por máquina, listas para su integración en los sistemas existentes de Corporate Creations.
El proceso comienza cuando se carga un documento PDF en un bucket de Amazon S3, lo que activa un mensaje a una cola de Amazon SQS. Una función de AWS Lambda de despacho recoge el mensaje, obtiene el PDF de S3 y lo envía a Amazon Textract para su análisis. Textract extrae el contenido de texto sin procesar, incluido el texto incorporado en formularios y tablas.
Una vez que Textract completa su análisis, el contenido extraído se almacena en S3 y se activa una segunda función Lambda. Esta función envía el texto preprocesado, fragmentado y normalizado, a Amazon Bedrock, que utiliza modelos de lenguaje de gran tamaño para identificar y extraer ocho campos de datos clave de cada documento: nombre del archivo, jurisdicción, tipo de documento, nombre de la entidad, fecha de vencimiento, número de expediente, tasa de presentación y fecha del documento. Los prompts del LLM se gestionan a través de Amazon Bedrock Prompt Manager, lo que permite a Corporate Creations iterar sobre la lógica de extracción sin modificar el código de la aplicación.
Los campos extraídos se estructuran en una carga útil JSON y se publican en una cola de salida de Amazon SQS, lo que hace que los datos estén inmediatamente disponibles para su consumo posterior por las aplicaciones internas de Corporate Creations. Los campos identificados con baja confianza se marcan para revisión humana, y toda la actividad de procesamiento se registra en Amazon CloudWatch para monitorización y seguimiento de errores.
Toda la infraestructura se codificó utilizando Terraform, con pilas modulares que separan la configuración de CI/CD, el despliegue de funciones Lambda y la infraestructura de soporte. Se proporcionó un entorno de desarrollo local basado en Docker para las pruebas, junto con un endpoint FastAPI accesible a través de Postman para la validación. La solución se probó con 49 documentos de 8 estados y dos tipos de documentos (informes anuales y avisos fiscales), con un refinamiento iterativo de los prompts a lo largo de tres rondas de pruebas que logró una extracción exitosa sin errores de exactitud en el ciclo de validación final.
Avahi entregó un proceso de procesamiento inteligente de documentos completamente funcional en aproximadamente cuatro semanas, permitiendo a Corporate Creations automatizar lo que anteriormente había sido un flujo de trabajo manual e intensivo en mano de obra. La solución se validó con 49 documentos de 8 estados de EE. UU. y dos tipos de documentos, y la ronda de pruebas final produjo una salida JSON estructurada sin errores de exactitud. El equipo de ingeniería confirmó que todos los documentos de prueba se procesaron con éxito, señalando: «Todos los PDF tuvieron éxito, todos ellos. Bedrock devolvió la salida perfectamente para cada uno de ellos». El proceso se diseñó para integrarse directamente en el flujo de trabajo existente de Corporate Creations y es arquitectónicamente extensible a las 51 jurisdicciones a las que presta servicios la empresa.
El director de tecnología de Corporate Creations calificó el proyecto con un 5 sobre 5 en todas las categorías de evaluación, incluido el progreso del proyecto, la experiencia técnica, la gestión del proyecto y la experiencia general, afirmando: «Hicieron un buen trabajo, me mantuvieron informado, exactamente lo que pedí».
Exploremos juntos sus oportunidades de IA de alto impacto en una sesión gratuita