Próximo evento: El marco de implementación de agentes de IA
Primary Health
San Francisco, CA
Atención sanitaria / Atención neonatal
Amazon Textract | AWS Bedrock (Claude Sonnet) | AWS Lambda | Amazon S3 | Amazon API Gateway | AWS KMS | Amazon VPC | Python
Primary Health es una organización sanitaria que procesa cientos de tarjetas de cribado neonatal (NBS) vitales para los resultados de salud temprana de los lactantes. El personal clínico introducía manualmente aproximadamente 500 tarjetas NBS por ciclo en sus sistemas de Expedientes de Salud Electrónicos (EHR), desviando a las enfermeras de la atención directa al paciente e introduciendo un riesgo inaceptable de errores de datos. Los intentos previos de automatización utilizando AWS Bedrock Data Automation y Google Document AI no fueron suficientes, alcanzando solo entre el 92 y el 94 por ciento de precisión, un umbral insuficiente para el procesamiento de documentos de grado médico. Avahi diseñó una arquitectura híbrida de procesamiento inteligente de documentos que combinaba Amazon Textract con AWS Bedrock y Claude Sonnet, superando el umbral de precisión del 95 por ciento requerido para datos de grado clínico, automatizando el flujo de trabajo completo de entrada de tarjetas y entregándose como un punto final de API listo para producción y una herramienta de línea de comandos con controles de seguridad conscientes de HIPAA.
Primary Health es una organización sanitaria que opera en el ámbito de la atención neonatal, donde la precisión y la puntualidad de los datos del paciente influyen directamente en los resultados clínicos. Como parte de la atención neonatal rutinaria, Primary Health recopila tarjetas de cribado neonatal que contienen información crítica del paciente que debe registrarse con precisión en los sistemas EHR para su uso clínico posterior. La organización opera en instalaciones que reciben formularios NBS de múltiples estados y entornos de atención, lo que resulta en una variabilidad significativa en los formatos de los formularios. Sus equipos clínicos y operativos requieren un enfoque riguroso y compatible con HIPAA para el manejo de datos, lo que hace que la integridad y la seguridad de los datos sean requisitos fundamentales para cualquier solución tecnológica.
Las tarjetas de cribado neonatal se encuentran entre los documentos más críticos en la atención sanitaria neonatal. Cada campo es importante. Sin embargo, el personal de enfermería de Primary Health dedicaba una cantidad significativa de tiempo a transcribir manualmente aproximadamente 500 tarjetas NBS en los sistemas EHR, un proceso propenso a errores que alejaba a los profesionales clínicos cualificados del trabajo más importante: la atención al paciente. Más allá del coste laboral, la entrada manual introducía el riesgo de errores de transcripción en registros donde un solo campo incorrecto puede tener graves consecuencias clínicas.
La extrema variabilidad de los formularios complicaba aún más el desafío. Las tarjetas de cribado neonatal no tienen un formato estandarizado en todos los estados o instalaciones. Primary Health encontró más de seis tipos de formularios distintos, con solo 20 de 30 campos consistentes entre las variantes. Los nombres de los campos, los diseños y los campos opcionales diferían ampliamente, lo que hacía inviables los enfoques de automatización basados en plantillas. La organización ya había intentado resolver esto con una combinación de AWS Bedrock Data Automation y Google Document AI, pero la mejor precisión alcanzada fue del 92 al 94 por ciento. Para los flujos de trabajo de documentos estándar, esto podría ser suficiente. Para los registros médicos, no lo es.
Las limitaciones de calidad de los datos añadieron otra capa de complejidad. Debido a que las tarjetas de cribado neonatal reales son equipos médicos regulados y difíciles de conseguir para fines de desarrollo, los datos de entrenamiento disponibles consistían en fotografías impresas de formularios reales en lugar de originales, lo que introducía borrosidad y ruido en el conjunto de datos. Cualquier solución necesitaría funcionar de manera fiable en estas condiciones de calidad de imagen del mundo real, al mismo tiempo que cumplía con los requisitos de HIPAA para el procesamiento de información de salud protegida.
Sin una solución precisa, escalable y compatible, Primary Health se enfrentaba a la continua desviación del personal clínico a tareas administrativas, un riesgo persistente de errores de transcripción en registros médicos críticos y ninguna vía viable para manejar el creciente volumen y diversidad de formularios NBS en toda su red de atención.
Primary Health ya había establecido AWS como su plataforma en la nube preferida, habiendo evaluado AWS Bedrock Data Automation como parte de un esfuerzo de automatización anterior. AWS ofrecía un conjunto convincente de servicios elegibles para HIPAA, diseñados específicamente para el tipo de cargas de trabajo de inteligencia de documentos y aprendizaje automático requeridas para el procesamiento de tarjetas NBS. Fundamentalmente, tanto Amazon Textract como AWS Bedrock están diseñados teniendo en cuenta el cumplimiento empresarial, y AWS confirmó que ninguno de los servicios retiene ni entrena con datos de clientes, un requisito no negociable para una solución que procesa información de salud protegida.
AWS también proporcionó la flexibilidad arquitectónica que Primary Health necesitaba. Servicios como AWS Lambda con configuración de VPC, Amazon API Gateway con autenticación de clave API, Amazon S3 para almacenamiento de documentos y AWS KMS para cifrado permitieron al equipo diseñar una postura de seguridad por capas alineada con los requisitos de HIPAA sin sacrificar el rendimiento o la escalabilidad. La amplitud del ecosistema de AWS significó que la solución podría construirse, protegerse y entregarse completamente dentro de un entorno que Primary Health ya gestionaba y en el que confiaba.
Primary Health recurrió a Avahi debido a su trayectoria como socio de primer nivel de AWS con profunda experiencia en el diseño de arquitecturas nativas de la nube para entornos complejos y sensibles al cumplimiento. Cuando un intento previo de automatización con una sola tecnología ya había demostrado ser insuficiente, Primary Health necesitaba un socio que pudiera replantearse el enfoque por completo, no solo optimizar lo que ya existía. Avahi aportó el criterio arquitectónico para identificar por qué las soluciones anteriores se quedaron cortas y la profundidad técnica para diseñar un enfoque fundamentalmente diferente.
Avahi también demostró el tipo de agilidad en la entrega que requieren las organizaciones sanitarias. Cuando Primary Health solicitó una reducción significativa del alcance a mitad del proyecto a finales de noviembre de 2025 para acelerar la entrega y reducir la complejidad operativa, Avahi ejecutó la transición de una implementación completa de infraestructura de AWS a un modelo de entrega basado en scripts en aproximadamente dos semanas, sin comprometer los objetivos de precisión ni la funcionalidad principal. Esta capacidad de respuesta, combinada con la habilidad de Avahi para navegar por los requisitos de diseño conscientes de HIPAA en las capas de aplicación e infraestructura, los convirtió en el socio adecuado para un proyecto donde tanto la precisión técnica como la velocidad de entrega eran críticas.
Avahi diseñó una arquitectura híbrida de procesamiento inteligente de documentos que aborda la complejidad de los formularios NBS a través de dos capas de extracción complementarias, cada una optimizada para diferentes aspectos del problema. En lugar de depender de una única tecnología, la solución aplica la herramienta adecuada en el momento oportuno, equilibrando la eficiencia de costes con las exigencias de precisión del procesamiento de documentos de grado médico.
La capa de extracción principal utiliza Amazon Textract como motor OCR central. Textract procesa cada tarjeta NBS y extrae texto y datos a nivel de campo junto con puntuaciones de confianza. A pesar de las imágenes de entrenamiento de baja calidad disponibles durante el desarrollo, Textract demostró ser notablemente resistente a la borrosidad y el ruido, funcionando eficazmente sin requerir un preprocesamiento extenso de imágenes. Se exploraron técnicas de mejora de la visión por ordenador, incluidos los operadores de Sobel y el mosaico de imágenes, pero finalmente se consideraron innecesarias para los formularios NBS, lo que permitió al equipo confiar en las capacidades nativas de Textract y simplificar la canalización de procesamiento.
Cuando Textract encuentra campos con baja confianza o contenido semánticamente ambiguo, se activa una capa de reserva inteligente opcional. Se invoca AWS Bedrock ejecutando Claude Sonnet como un modelo de lenguaje grande multimodal para analizar el contexto visual y las relaciones de campo, resolviendo ambigüedades que el OCR puro no puede abordar. Esto incluye escenarios como determinar si un campo de «Apellido» se refiere al lactante o a un tutor, o desambiguar los campos de tipo y origen de la muestra que varían en significado entre los tipos de formulario. La reserva de Bedrock se activa mediante un indicador de alternancia, lo que permite a Primary Health controlar el coste y el tiempo de procesamiento en función de sus necesidades de flujo de trabajo.
Un sistema de enrutamiento basado en la confianza rige cómo se mueven los documentos a través de la canalización. Se aplican umbrales de confianza duales: aproximadamente el 80 por ciento de confianza por campo individual y el 95 por ciento de confianza para la precisión del documento completo. Los documentos o campos que caen por debajo de estos umbrales se enrutan automáticamente para una revisión adicional o un procesamiento asistido por LLM, creando una capa de garantía de calidad incorporada que respalda la integridad de los datos sin requerir un triaje manual de cada registro.
Para abordar el desafío fundamental de la diversidad de formularios NBS, Avahi construyó un sistema de variación de campos basado en configuración, impulsado por una coincidencia difusa basada en la distancia de Levenshtein. Esto permite a Primary Health añadir nuevas asignaciones de nombres de campo y esquemas de salida a medida que surgen nuevos tipos de formularios, manejando variaciones como «DOB» frente a «Fecha de nacimiento» o «Fecha de nacimiento» sin requerir cambios de código o soporte de ingeniería del proveedor. La solución es inherentemente autoserviciable, lo que reduce la dependencia a largo plazo de Avahi a medida que se introducen nuevas variantes de formularios en los estados y las instalaciones.
La solución se entregó como un punto final de API REST y una herramienta de interfaz de línea de comandos, compatible con formatos de entrada JPEG, PNG y PDF con compresión automática de archivos para documentos que superan los 10 megabytes. Se completó el endurecimiento de la seguridad consciente de HIPAA en 41 correcciones identificadas, cubriendo la autenticación de API Gateway con requisitos de clave API, la configuración de VPC para funciones Lambda que procesan información de salud protegida, el cifrado de AWS KMS para datos de monitoreo, la sanitización de inyección de prompts de LLM, la eliminación de comodines CORS en producción, la validación del tamaño de los archivos para prevenir el riesgo de denegación de servicio y la confirmación de que los servicios de AWS utilizados en la canalización no retienen ni entrenan con datos de clientes. El código base completo se transfirió a la organización GitHub de Primary Health, lo que les permite autoalojar y extender la solución de forma independiente.
La solución híbrida de procesamiento inteligente de documentos de Avahi ofreció mejoras medibles en precisión, eficiencia operativa, coste y cumplimiento. La arquitectura superó el requisito de precisión de grado médico de Primary Health y cambió fundamentalmente la forma en que el personal clínico interactúa con los datos de las tarjetas de cribado neonatal, devolviendo a las enfermeras de la entrada de datos administrativa a la atención directa al paciente.
Al combinar las capacidades de OCR resistentes de Amazon Textract con una reserva específica de AWS Bedrock, la solución alcanzó niveles de precisión que los enfoques anteriores de una sola tecnología no pudieron lograr, todo ello manteniendo una estructura de costes optimizada para flujos de trabajo de documentos médicos de alto volumen. El diseño basado en configuración garantiza que la solución siga siendo adaptable y mantenible sin una dependencia continua del proveedor a medida que los tipos de formularios NBS continúan evolucionando.
Exploremos juntos sus oportunidades de IA de alto impacto en una sesión gratuita