El sector de la atención médica y las ciencias biológicas ha experimentado una transformación digital masiva en la última década, lo que ha llevado a una vasta recopilación de datos. Para encontrar valor en estos datos y adoptar modelos de aprendizaje automático, las organizaciones deben abordar desafíos como la normalización, la disponibilidad, la integridad y la gobernanza de los datos. La información médica está muy distribuida, es contextual e incluye principalmente datos no estructurados, como formularios de admisión, notas clínicas, radiografías, tomografías computarizadas, recetas manuscritas, reclamaciones de seguros, etc.
Amazon lanzó un nuevo servicio en re:invent 2020 para abordar el creciente problema de la gestión de datos relacionados con la salud en la nube. El servicio, denominado Amazon HealthLake, es un servicio totalmente administrado y apto para HIPAA que permite a las empresas de atención médica y ciencias biológicas almacenar, transformar, consultar y analizar datos de salud en la nube de AWS a escala de petabytes. Las empresas pueden agregar toda su información de salud dispar en varios estilos y formatos en un data lake centralizado aprovisionado y administrado por Amazon HealthLake. Facilita la importación de datos estructurados y no estructurados desde las instalaciones locales a la nube de AWS. Las empresas pueden aprovechar los modelos de aprendizaje automático preconstruidos para normalizar e indexar la información etiquetando las fechas clave, los descriptores médicos y los eventos como medicamentos, procedimientos y diagnósticos. Permite a los usuarios buscar y analizar toda la información de salud rápidamente.
Amazon HealthLake se encarga de configurar varias fuentes de datos, ingiere los datos, indexa toda la información para que se pueda buscar más adelante y la almacena en formatos estándar abiertos, como el formato exigido por FHIR. Procesa los datos de texto no estructurados mediante PNL y las imágenes mediante modelos de ML como la clasificación binaria, la clasificación multiclase o la regresión. Una vez que los datos se han convertido en información estructurada y centralizada, se obtiene una visión completa del historial de un paciente individual a un nivel de granularidad en el que se pueden aplicar análisis avanzados o modelos de aprendizaje automático para la predicción.
Ingesta de datos mediante HealthLake
Amazon HealthLake facilita la ingesta de datos desde fuentes de datos locales a AWS. Las organizaciones pueden utilizar la función de importación masiva para migrar fácilmente sus archivos locales al bucket de S3.
Almacenamiento de datos en el formato estándar abierto
Para permitir las consultas de búsqueda rápidas, Amazon HealthLake Data Store crea una vista completa del historial médico de cada paciente en orden cronológico. Data Store facilita el intercambio de información utilizando la especificación V4 FHIR estándar abierta y siempre está en funcionamiento para mantener el índice actualizado. Para cumplir con el cumplimiento normativo, permite un riguroso control de seguridad y acceso.
Transformación de datos mediante modelos de aprendizaje automático
Amazon HealthLake integra el procesamiento del lenguaje natural (PNL) médico para transformar los datos médicos sin procesar del Data Store. Utiliza modelos especializados de aprendizaje automático preconstruidos que se han entrenado para comprender y extraer información significativa de datos de atención médica no estructurados. El recurso original permanece sin cambios y la información médica extraída se añade automáticamente al recurso.
Consulta y búsqueda de datos
Los usuarios pueden buscar toda la información de un paciente utilizando filtros predefinidos o utilizar las operaciones FHIR CRUD (Crear/Leer/Actualizar/Eliminar) y FHIR Search compatibles con Amazon HealthLake.
Visualización de datos y realización de predicciones
Los desarrolladores pueden aprovechar la integración con Amazon QuickSight para crear rápidamente paneles de control sobre los datos normalizados para explorar las tendencias y los patrones entre sus patentes. Los desarrolladores también pueden utilizar Amazon SageMaker para construir, entrenar y desplegar sus modelos de aprendizaje automático sobre los datos para realizar predicciones.
En el momento de escribir esto, Amazon HealthLake solo está disponible en la región US East (North Virginia), pero estamos seguros de que estará disponible en las demás áreas muy pronto. Póngase en contacto con nosotros si tiene problemas para ingerir sus datos en diferentes formatos y para encontrar valor en estos datos. Nuestro equipo de expertos en la nube puede ayudarle a configurar su canalización de datos o a construir un data lake utilizando Amazon HealthLake.
Preguntas frecuentes
1. ¿Qué es Amazon HealthLake y cómo ayuda a las organizaciones sanitarias?
Amazon HealthLake es un servicio de lago de datos totalmente gestionado y apto para HIPAA que permite a las organizaciones sanitarias y de ciencias de la vida almacenar, transformar y analizar grandes volúmenes de datos sanitarios a escala. Convierte los datos médicos no estructurados en datos estructurados compatibles con FHIR, lo que facilita la búsqueda, la consulta y la aplicación de aprendizaje automático para obtener información valiosa.
2. ¿Cómo gestiona Amazon HealthLake los datos sanitarios no estructurados?
Amazon HealthLake utiliza el aprendizaje automático y el PNL médico para extraer información médica clave de datos no estructurados, como notas clínicas, recetas e informes de imagenología. A continuación, etiqueta e indexa estos datos con detalles como diagnósticos, medicamentos y procedimientos, lo que permite a los proveedores de atención médica crear un historial completo del paciente.
3. ¿Cuáles son las ventajas de utilizar el formato FHIR en Amazon HealthLake?
El formato FHIR (Fast Healthcare Interoperability Resources) garantiza que los datos almacenados en Amazon HealthLake sean interoperables y estén estandarizados, lo que facilita el intercambio de información entre los sistemas sanitarios, el cumplimiento de los requisitos normativos y la realización de análisis avanzados sin necesidad de transformaciones complejas de los datos.
4. ¿Puede Amazon HealthLake integrarse con herramientas de análisis y ML?
Sí. Una vez que los datos se han incorporado y normalizado, se pueden integrar con Amazon QuickSight para crear paneles de control y visualizaciones, y con Amazon SageMaker para crear, entrenar e implementar modelos predictivos de aprendizaje automático, como los de predicción de tasas de readmisión, progresión de la enfermedad o resultados del tratamiento.
5. ¿Está Amazon HealthLake disponible en todas las regiones de AWS?
Por ahora, Amazon HealthLake solo está disponible en la región US East (N. Virginia), pero se espera que AWS lo amplíe a más áreas con el tiempo. Las organizaciones fuera de esta región aún pueden utilizar HealthLake, pero deben tener en cuenta la latencia, el cumplimiento y los requisitos de residencia de los datos antes de la implementación.
															