Data Lake de atención médica con Amazon HealthLake

TL;DR

Amazon HealthLake permite a las organizaciones sanitarias almacenar, transformar y analizar de forma segura grandes volúmenes de datos sanitarios en AWS a escala.
Convierte información médica no estructurada, como notas clínicas, recetas e imágenes, en datos estructurados y compatibles con FHIR para facilitar el acceso y la interoperabilidad.
Los modelos integrados de aprendizaje automático y PNL extraen información médica clave, lo que permite análisis avanzados y modelado predictivo.
HealthLake se integra a la perfección con herramientas como Amazon QuickSight y SageMaker para la visualización de datos y las predicciones basadas en IA.
Al utilizar HealthLake, los proveedores de atención médica pueden unificar los datos de los pacientes, mejorar la toma de decisiones y acelerar la innovación en los sistemas de prestación de atención.

El sector de la atención médica y las ciencias biológicas ha experimentado una transformación digital masiva en la última década, lo que ha llevado a una vasta recopilación de datos. Para encontrar valor en estos datos y adoptar modelos de aprendizaje automático, las organizaciones deben abordar desafíos como la normalización, la disponibilidad, la integridad y la gobernanza de los datos. La información médica está muy distribuida, es contextual e incluye principalmente datos no estructurados, como formularios de admisión, notas clínicas, radiografías, tomografías computarizadas, recetas manuscritas, reclamaciones de seguros, etc.

Amazon lanzó un nuevo servicio en re:invent 2020 para abordar el creciente problema de la gestión de datos relacionados con la salud en la nube. El servicio, denominado Amazon HealthLake, es un servicio totalmente gestionado y apto para HIPAA que permite a las empresas de atención médica y ciencias biológicas almacenar, transfo rmar, consultar y analizar datos de salud en la nube de AWS a escala de petabytes. Para evaluar estas capacidades sin riesgos, muchas organizaciones inician una prueba de concepto de AWS dirigida. Este piloto permite a los equipos importar de forma segura datos estructurados y no estructurados de sistemas locales y aprovechar modelos de aprendizaje automático preconstruidos para normalizar, indexar y etiquetar fechas clave, descriptores médicos o diagnósticos antes de comprometerse con un despliegue completo.

Las empresas pueden agregar toda su información de salud dispar, en varios estilos y formatos, en un lago de datos centralizado aprovisionado y gestionado por Amazon HealthLake. Este enfoque centralizado permite a los usuarios buscar, analizar y consultar toda su información de salud rápidamente a través de una única interfaz.

Amazon HealthLake se encarga de configurar varias fuentes de datos, ingiere los datos, indexa toda la información para que se pueda buscar más adelante y la almacena en formatos estándar abiertos, como el formato exigido por FHIR. Procesa los datos de texto no estructurados mediante PNL y las imágenes mediante modelos de ML como la clasificación binaria, la clasificación multiclase o la regresión. Una vez que los datos se han convertido en información estructurada y centralizada, se obtiene una visión completa del historial de un paciente individual a un nivel de granularidad en el que se pueden aplicar análisis avanzados o modelos de aprendizaje automático para la predicción.

Ingesta de datos mediante HealthLake

Amazon HealthLake facilita la ingesta de datos desde fuentes de datos locales a AWS. Las organizaciones pueden utilizar la función de importación masiva para migrar fácilmente sus archivos locales al bucket de S3.

Almacenamiento de datos en el formato estándar abierto

Para permitir las consultas de búsqueda rápidas, Amazon HealthLake Data Store crea una vista completa del historial médico de cada paciente en orden cronológico. Data Store facilita el intercambio de información utilizando la especificación V4 FHIR estándar abierta y siempre está en funcionamiento para mantener el índice actualizado. Para cumplir con el cumplimiento normativo, permite un riguroso control de seguridad y acceso.

Transformación de datos mediante modelos de aprendizaje automático

Amazon HealthLake integra el procesamiento del lenguaje natural (PNL) médico para transformar los datos médicos sin procesar del Data Store. Utiliza modelos especializados de aprendizaje automático preconstruidos que se han entrenado para comprender y extraer información significativa de datos de atención médica no estructurados. El recurso original permanece sin cambios y la información médica extraída se añade automáticamente al recurso.

Consulta y búsqueda de datos

Los usuarios pueden buscar toda la información de un paciente utilizando filtros predefinidos o utilizar las operaciones FHIR CRUD (Crear/Leer/Actualizar/Eliminar) y FHIR Search compatibles con Amazon HealthLake.

Visualización de datos y realización de predicciones

Los desarrolladores pueden aprovechar la integración con Amazon QuickSight para crear rápidamente paneles de control sobre los datos normalizados para explorar las tendencias y los patrones entre sus patentes. Los desarrolladores también pueden utilizar Amazon SageMaker para construir, entrenar y desplegar sus modelos de aprendizaje automático sobre los datos para realizar predicciones.

En el momento de escribir esto, Amazon HealthLake solo está disponible en la región US East (North Virginia), pero estamos seguros de que estará disponible en las demás áreas muy pronto. Póngase en contacto con nosotros si tiene problemas para ingerir sus datos en diferentes formatos y para encontrar valor en estos datos. Nuestro equipo de expertos en la nube puede ayudarle a configurar su canalización de datos o a construir un data lake utilizando Amazon HealthLake.

Preguntas frecuentes

1. ¿Qué es Amazon HealthLake y cómo ayuda a las organizaciones sanitarias?

Amazon HealthLake es un servicio de lago de datos totalmente gestionado y apto para HIPAA que permite a las organizaciones sanitarias y de ciencias de la vida almacenar, transformar y analizar grandes volúmenes de datos sanitarios a escala. Convierte los datos médicos no estructurados en datos estructurados compatibles con FHIR, lo que facilita la búsqueda, la consulta y la aplicación de aprendizaje automático para obtener información valiosa.

2. ¿Cómo gestiona Amazon HealthLake los datos sanitarios no estructurados?

Amazon HealthLake utiliza el aprendizaje automático y el PNL médico para extraer información médica clave de datos no estructurados, como notas clínicas, recetas e informes de imagenología. A continuación, etiqueta e indexa estos datos con detalles como diagnósticos, medicamentos y procedimientos, lo que permite a los proveedores de atención médica crear un historial completo del paciente.

3. ¿Cuáles son las ventajas de utilizar el formato FHIR en Amazon HealthLake?

El formato FHIR (Fast Healthcare Interoperability Resources) garantiza que los datos almacenados en Amazon HealthLake sean interoperables y estén estandarizados, lo que facilita el intercambio de información entre los sistemas sanitarios, el cumplimiento de los requisitos normativos y la realización de análisis avanzados sin necesidad de transformaciones complejas de los datos.

4. ¿Puede Amazon HealthLake integrarse con herramientas de análisis y ML?

Sí. Una vez que los datos se han incorporado y normalizado, se pueden integrar con Amazon QuickSight para crear paneles de control y visualizaciones, y con Amazon SageMaker para crear, entrenar e implementar modelos predictivos de aprendizaje automático, como los de predicción de tasas de readmisión, progresión de la enfermedad o resultados del tratamiento.

5. ¿Está Amazon HealthLake disponible en todas las regiones de AWS?

Por ahora, Amazon HealthLake solo está disponible en la región US East (N. Virginia), pero se espera que AWS lo amplíe a más áreas con el tiempo. Las organizaciones fuera de esta región aún pueden utilizar HealthLake, pero deben tener en cuenta la latencia, el cumplimiento y los requisitos de residencia de los datos antes de la implementación.