El sector de la atención médica y las ciencias biológicas ha experimentado una transformación digital masiva en la última década, lo que ha llevado a una vasta recopilación de datos. Para encontrar valor en estos datos y adoptar modelos de aprendizaje automático, las organizaciones deben abordar desafíos como la normalización, la disponibilidad, la integridad y la gobernanza de los datos. La información médica está muy distribuida, es contextual e incluye principalmente datos no estructurados, como formularios de admisión, notas clínicas, radiografías, tomografías computarizadas, recetas manuscritas, reclamaciones de seguros, etc.
Amazon lanzó un nuevo servicio en re:invent 2020 para abordar el creciente problema de la gestión de datos relacionados con la salud en la nube. El servicio, denominado Amazon HealthLake, es un servicio totalmente administrado y apto para HIPAA que permite a las empresas de atención médica y ciencias biológicas almacenar, transformar, consultar y analizar datos de salud en la nube de AWS a escala de petabytes. Las empresas pueden agregar toda su información de salud dispar en varios estilos y formatos en un data lake centralizado aprovisionado y administrado por Amazon HealthLake. Facilita la importación de datos estructurados y no estructurados desde las instalaciones locales a la nube de AWS. Las empresas pueden aprovechar los modelos de aprendizaje automático preconstruidos para normalizar e indexar la información etiquetando las fechas clave, los descriptores médicos y los eventos como medicamentos, procedimientos y diagnósticos. Permite a los usuarios buscar y analizar toda la información de salud rápidamente.
Amazon HealthLake se encarga de configurar varias fuentes de datos, ingiere los datos, indexa toda la información para que se pueda buscar más adelante y la almacena en formatos estándar abiertos, como el formato exigido por FHIR. Procesa los datos de texto no estructurados mediante PNL y las imágenes mediante modelos de ML como la clasificación binaria, la clasificación multiclase o la regresión. Una vez que los datos se han convertido en información estructurada y centralizada, se obtiene una visión completa del historial de un paciente individual a un nivel de granularidad en el que se pueden aplicar análisis avanzados o modelos de aprendizaje automático para la predicción.
Ingesta de datos mediante HealthLake
Amazon HealthLake facilita la ingesta de datos desde fuentes de datos locales a AWS. Las organizaciones pueden utilizar la función de importación masiva para migrar fácilmente sus archivos locales al bucket de S3.
Almacenamiento de datos en el formato estándar abierto
Para permitir las consultas de búsqueda rápidas, Amazon HealthLake Data Store crea una vista completa del historial médico de cada paciente en orden cronológico. Data Store facilita el intercambio de información utilizando la especificación V4 FHIR estándar abierta y siempre está en funcionamiento para mantener el índice actualizado. Para cumplir con el cumplimiento normativo, permite un riguroso control de seguridad y acceso.
Transformación de datos mediante modelos de aprendizaje automático
Amazon HealthLake integra el procesamiento del lenguaje natural (PNL) médico para transformar los datos médicos sin procesar del Data Store. Utiliza modelos especializados de aprendizaje automático preconstruidos que se han entrenado para comprender y extraer información significativa de datos de atención médica no estructurados. El recurso original permanece sin cambios y la información médica extraída se añade automáticamente al recurso.
Consulta y búsqueda de datos
Los usuarios pueden buscar toda la información de un paciente utilizando filtros predefinidos o utilizar las operaciones FHIR CRUD (Crear/Leer/Actualizar/Eliminar) y FHIR Search compatibles con Amazon HealthLake.
Visualización de datos y realización de predicciones
Los desarrolladores pueden aprovechar la integración con Amazon QuickSight para crear rápidamente paneles de control sobre los datos normalizados para explorar las tendencias y los patrones entre sus patentes. Los desarrolladores también pueden utilizar Amazon SageMaker para construir, entrenar y desplegar sus modelos de aprendizaje automático sobre los datos para realizar predicciones.
En el momento de escribir esto, Amazon HealthLake solo está disponible en la región US East (North Virginia), pero estamos seguros de que estará disponible en las demás áreas muy pronto. Póngase en contacto con nosotros si tiene problemas para ingerir sus datos en diferentes formatos y para encontrar valor en estos datos. Nuestro equipo de expertos en la nube puede ayudarle a configurar su canalización de datos o a construir un data lake utilizando Amazon HealthLake.