Próximo evento: El marco de implementación de agentes de IA

Cuando la precisión lo es todo: automatización del cribado neonatal con IA de Primary Health en AWS

Cliente

Primary Health

Ubicación

San Francisco, California

Industria

Tecnología sanitaria

Servicios y tecnología

Amazon Textract, AWS Bedrock (Claude Sonnet), AWS Lambda, Amazon API Gateway, Python

Resumen del proyecto

Primary Health es una empresa de tecnología sanitaria cuya plataforma basada en la nube permite programas de pruebas, vacunación y cuidados preventivos en todo Estados Unidos. El personal de enfermería de la empresa introducía manualmente las tarjetas de cribado neonatal (NBS) en los sistemas de historia clínica electrónica (EHR), un proceso lento y propenso a errores que restaba tiempo al personal clínico para la atención al paciente. Avahi desarrolló un script de transcripción OCR basado en Python que combina Amazon Textract con AWS Bedrock para el perfeccionamiento mediante IA generativa, automatizando la extracción de datos de las tarjetas NBS. La solución logró una precisión de extracción superior al 95 %, superando el punto de referencia anterior de Primary Health del 92-94 %, y se entregó tanto como un punto de conexión de API REST como una herramienta de CLI con un sistema de mapeo de campos configurable para una adaptabilidad a largo plazo.

Acerca del cliente

Primary Health es una empresa de tecnología sanitaria con sede en San Francisco, California. Su plataforma basada en la nube ofrece soluciones de gestión de salud digital, interoperabilidad de datos y análisis a agencias de salud pública, distritos escolares, organizaciones comunitarias y sistemas sanitarios. La misión de la empresa es detener la propagación de enfermedades y reducir la gravedad de las dolencias proporcionando diagnósticos asequibles y cuidados preventivos a gran escala. Su software agiliza la administración de programas, la programación, las comunicaciones con los pacientes y la notificación de resultados de pruebas, lo que permite al personal sanitario centrarse en la prestación de cuidados.

El problema

El personal de enfermería de Primary Health introducía manualmente las tarjetas de cribado neonatal (NBS) en sus sistemas EHR. Este proceso manual era lento, propenso a errores y distraía al personal clínico de la atención al paciente. El desafío se veía agravado por la extrema variabilidad de los formularios: existían múltiples tipos de formularios NBS sin un formato estándar entre estados e instalaciones. Los nombres de los campos, los diseños y los campos opcionales variaban enormemente entre las distintas versiones.
Primary Health había intentado previamente automatizar este proceso utilizando AWS Bedrock Data Automation combinado con Google Document AI, logrando solo una precisión del 92-94 %. Esto no alcanzaba el estándar requerido para los documentos médicos, donde la integridad de los datos es primordial. El CTO de la empresa hizo hincapié en que la precisión era la principal preocupación; los errores en la extracción erosionarían la confianza en el sistema y crearían una carga adicional para el personal clínico, que tendría que verificar manualmente cada resultado.
Para complicar aún más el reto, los datos de entrenamiento disponibles consistían en fotografías impresas de formularios reales en lugar de originales, lo que introducía borrosidad y ruido. Las tarjetas de cribado neonatal reales son documentos médicos difíciles de obtener para fines de desarrollo, lo que obligaba a que cualquier solución funcionara bajo importantes limitaciones de calidad de datos.

Por qué AWS

Primary Health ya trabajaba con AWS y había explorado AWS Bedrock Data Automation como parte de sus intentos iniciales de automatización. Amazon Textract proporcionó la capacidad de extracción OCR y AWS Bedrock ofreció el perfeccionamiento mediante IA generativa para los campos ambiguos. AWS Lambda y Amazon API Gateway proporcionaron un modelo de despliegue ligero que se alineaba con la preferencia del cliente por una solución sencilla basada en scripts que su aplicación Ruby pudiera invocar directamente.
Tanto Amazon Textract como AWS Bedrock ofrecen la posibilidad de excluir los datos del cliente del entrenamiento de la IA, un requisito importante para el procesamiento de documentos médicos. La amplitud de los servicios de IA y ML de AWS la convirtió en la plataforma natural para combinar la extracción OCR con el perfeccionamiento de IA generativa en un único script.

Por qué Primary Health eligió a Avahi

Los intentos previos de automatización de Primary Health se habían estancado en una precisión del 92-94 % utilizando un enfoque de tecnología única. La empresa necesitaba un socio con experiencia en IA y aprendizaje automático en AWS que pudiera superar el techo de precisión que las soluciones estándar no habían podido alcanzar.
Avahi propuso combinar Amazon Textract para la extracción OCR con AWS Bedrock para el perfeccionamiento mediante IA generativa, un enfoque que Primary Health no había intentado anteriormente. Avahi también demostró su capacidad para adaptarse a mitad del proyecto cuando el cliente solicitó un ajuste del alcance, entregando una solución optimizada basada en scripts en un plazo reducido sin comprometer los objetivos de precisión.

Solución

Avahi entregó un script de transcripción OCR basado en Python desplegado en AWS Lambda y expuesto a través de Amazon API Gateway como un punto de conexión de API REST, lo que permite que la aplicación Ruby de Primary Health lo invoque directamente. El script también se ejecuta localmente como una herramienta de CLI para desarrollo y pruebas.
El script utiliza Amazon Textract como motor de OCR, extrayendo texto y datos a nivel de campo con puntuaciones de confianza por campo de los formularios NBS. Textract demostró ser resistente a los datos de entrenamiento de baja calidad (impresiones fotografiadas con borrosidad y ruido), funcionando bien sin preprocesamiento. El equipo exploró técnicas de visión artificial (corrección de inclinación, binarización, eliminación de ruido, mejora del contraste), pero la validación confirmó que Textract producía una calidad suficiente sin ellas, por lo que el flujo de preprocesamiento se entregó como un componente independiente opcional.
Para los campos ambiguos o ausentes, como determinar si el «Apellido» se refiere al bebé o al tutor, o para eliminar la ambigüedad en los campos de tipo/fuente de la muestra, el script invoca opcionalmente a AWS Bedrock (Claude Sonnet) para el perfeccionamiento mediante IA generativa. El LLM utiliza los datos extraídos y las relaciones entre campos para resolver ambigüedades que el OCR puro no puede manejar, mejorando la precisión en el texto manuscrito y los diseños no estándar. Este perfeccionamiento se activa mediante un indicador, de modo que el LLM solo se invoca cuando es necesario, manteniendo bajos los costes de procesamiento por imagen.
Para gestionar la variabilidad continua de los formularios NBS, el script utiliza un archivo de configuración con coincidencia difusa para el mapeo de nombres de campos. Cuando aparece una nueva variante de formulario, Primary Health puede añadir mapeos de nombres de campos y modificar el esquema de salida editando el archivo de configuración, sin necesidad de cambios en el código ni soporte del proveedor. El script genera un JSON estructurado alineado con el esquema de Primary Health, que incluye puntuaciones de confianza por campo y a nivel de documento, lo que permite a su backend aplicar la lógica de negocio para la integración posterior en el EHR. Admite entradas en JPEG, PNG y PDF, con compresión automática para archivos grandes cuando se utiliza la CLI.
Originalmente, Primary Health previó un proyecto más amplio que incluía infraestructura, una interfaz de revisión humana, orquestación de flujos de trabajo y múltiples API de backend. A finales de noviembre de 2025, el cliente solicitó un ajuste del alcance para acelerar la entrega. El proyecto pivotó hacia una entrega exclusiva del script, reduciendo el compromiso en 139 horas (un 42 % respecto al alcance original) y preservando al mismo tiempo toda la funcionalidad principal de OCR y los objetivos de precisión. La demostración final tuvo lugar el 22 de diciembre de 2025 y el código base completo se transfirió a la organización de GitHub de Primary Health.

Resultados clave

  • Script de transcripción OCR en Python con integración de Amazon Textract y AWS Bedrock (Claude Sonnet)
  • Punto de conexión de API REST a través de AWS Lambda y Amazon API Gateway para la integración de aplicaciones Ruby
  • Herramienta de CLI para el procesamiento local de documentos con soporte multiformato (JPEG, PNG, PDF)
  • Módulo de perfeccionamiento mediante IA generativa para mejorar la precisión en texto manuscrito y campos ambiguos
  • Puntuación de confianza a nivel de campo y de documento
  • Alineación de esquemas y generación de salida JSON estructurada
  • Sistema de variación de campos basado en configuración con coincidencia difusa
  • Flujo de preprocesamiento de imágenes independiente opcional (corrección de inclinación, binarización, eliminación de ruido, mejora del contraste)
  • Documentación de la API con ejemplos de código en Ruby
  • Código base completo transferido a la organización de GitHub de Primary Health

Impacto del proyecto

El enfoque combinado de Textract y Bedrock logró una precisión de extracción superior al 95 % en los documentos probados, superando el punto de referencia anterior de Primary Health del 92-94 % obtenido con su implementación de AWS Bedrock Data Automation y Google Document AI. La solución automatiza la entrada manual de las tarjetas de cribado neonatal que el personal de enfermería introducía previamente en los sistemas EHR, permitiendo que el personal clínico se centre en la atención al paciente.

El mapeo de campos basado en configuración proporciona mantenibilidad a largo plazo, lo que permite a Primary Health adaptarse de forma independiente a los nuevos tipos de formularios NBS a medida que surjan. El alcance optimizado redujo el proyecto en 139 horas (un 42 % respecto al alcance original) al tiempo que entregó la capacidad de extracción principal que el cliente necesitaba. El código base completo se transfirió a la organización de GitHub de Primary Health, lo que permite el autohospedaje y la personalización.

  • Precisión de extracción superior al 95 %, frente al 92-94 % de la solución anterior
  • La entrada de datos de las tarjetas NBS, que antes realizaba manualmente el personal de enfermería, ahora está automatizada
  • Múltiples tipos de formularios NBS compatibles mediante el mapeo de campos basado en configuración
  • Reducción del alcance del 42 % (139 horas) preservando toda la funcionalidad principal de OCR
  • Soporte multiformato: JPEG, PNG, PDF con compresión automática

¿Listo para transformar su negocio con la IA?

Exploremos juntos sus oportunidades de IA de alto impacto en una sesión gratuita