Descubrimiento de médicos impulsado por IA en AWS, entregado en seis semanas

Cliente

Consultoría Inpharmativ

Ubicación

Ancaster, ON

Industria

Consultoría de datos sanitarios y ciencias de la vida

Servicios y tecnología

• Amazon S3 • AWS Lambda • Amazon API Gateway • Amazon Bedrock • Amazon RDS for PostgreSQL • Amazon OpenSearch Service • AWS Identity and Access Management • Amazon CloudWatch

Resumen del proyecto

Inpharmativ Consulting elabora listas de médicos relevantes utilizando fuentes de investigación públicas. La empresa quería automatizar y escalar este trabajo con IA generativa, manteniendo al mismo tiempo los costes y el tiempo de rentabilidad ajustados. Avahi diseñó e implementó un sistema de datos y recuperación listo para producción en AWS que automatiza la extracción de entidades, impulsa un asistente de búsqueda basado en RAG y expone los resultados a través de API seguras. El compromiso se estructuró para ajustarse a una ventana de ingeniería de seis semanas, financiada a través de créditos AWS GenAI Prod.

Acerca del cliente

Inpharmativ Consulting opera en el ámbito de los datos sanitarios y las ciencias de la vida, ayudando a los clientes a identificar médicos e investigadores basándose en publicaciones, actividades en conferencias y señales públicas relacionadas en todo Canadá.

El problema

El descubrimiento manual de médicos no se escalaba con las crecientes fuentes de datos o la complejidad de las consultas. Los analistas tenían que examinar documentos de investigación, resúmenes y perfiles de autores, lo que ralentizaba el tiempo de respuesta y aumentaba el riesgo de resultados incoherentes.

Inpharmativ necesitaba la extracción automatizada de personas, instituciones y temas médicos, además de una forma de conectar a los médicos con las afecciones con relevancia semántica, y luego devolver los resultados de forma programática. Sin una solución, el equipo seguiría dedicando grandes cantidades de tiempo de los analistas a la búsqueda repetitiva y al trabajo de selección, y los plazos de entrega se alargarían a medida que aumentara el volumen de datos.

Cualquier automatización también tenía que respetar una lista controlada de fuentes públicas, incluyendo PubMed, Google Scholar, sitios web de conferencias y bases de datos de revistas.

Por qué AWS

AWS proporcionó bloques de construcción gestionados para la IA generativa y las canalizaciones de datos, incluyendo Amazon Bedrock para el acceso al modelo, servicios sin servidor para la ingesta y las API, y almacenamiento gestionado para los datos estructurados y vectoriales. El uso de estos servicios ayudó al equipo a entregar rápidamente sin operaciones pesadas de la plataforma.

El proyecto también se alineó con la financiación de AWS GenAI Prod, que contenía los costes y apoyó la ventana de entrega de seis semanas.

Por qué inpharmativ eligió a Avahi

Avahi es un socio de servicios de nivel Premier de AWS con patrones repetibles para la búsqueda de GenAI, la extracción de entidades y el despliegue de producción. El equipo se comprometió a una iteración rápida, demostraciones frecuentes y validación del cliente en ciclos de tres días, y a la entrega dentro del plazo del cliente.

Avahi se despliega en la cuenta de AWS del cliente, el cliente conserva la propiedad del código, los modelos, las API y las salidas, lo que coincidía con los requisitos de gobernanza de Inpharmativ.

Solución

Avahi implementó una canalización de extremo a extremo que ingiere datos de investigación públicos, los enriquece con PNL y sirve resultados de médicos clasificados a través de una API.

Ingesta y preprocesamiento de datos. Las fuentes incluyeron PubMed, Google Scholar, sitios web de conferencias y bases de datos de revistas. El web scraping mejorado extrajo texto estructurado y no estructurado de artículos, resúmenes y perfiles de autores. La canalización normalizó el texto, eliminó los duplicados y preparó el contenido multilingüe para la PNL descendente.

Extracción y enriquecimiento de entidades. Utilizando modelos alojados en Amazon Bedrock, el sistema aplicó el reconocimiento de entidades nombradas para capturar los nombres de los médicos, las afiliaciones, los temas de investigación y las afecciones médicas. Se generaron incrustaciones para calcular la similitud semántica entre el cuerpo de trabajo de un médico y las afecciones especificadas por el usuario. Esto produjo relaciones legibles por máquina que mapean a los médicos con las áreas de enfoque médico.

Almacenamiento y recuperación. Las relaciones entre médicos se almacenan en Amazon RDS para PostgreSQL. Las incrustaciones se indexan en un almacén de vectores, Amazon OpenSearch Service o ChromaDB. La recuperación admite la búsqueda semántica y un flujo de trabajo RAG.

Asistente inteligente y API. Una base de conocimientos optimizada para la recuperación alimenta un LLM a través de Amazon Bedrock que ensambla la respuesta final. Los resultados se sirven a través de Amazon API Gateway y AWS Lambda, lo que permite a Inpharmativ integrarse directamente con las aplicaciones internas.

Operaciones y seguridad. El almacenamiento provisional de datos utiliza Amazon S3. El registro y las métricas utilizan Amazon CloudWatch. El acceso se rige por AWS Identity and Access Management. Avahi entregó documentación, scripts de despliegue y manuales de operaciones limitados a las características creadas en este proyecto.

Resultados clave

  • Marco de web scraping mejorado que extrae de PubMed, Google Scholar, sitios web de conferencias y bases de datos de revistas
  • Extracción de entidades basada en PNL para médicos, afiliaciones, temas de investigación y afecciones médicas
  • Generación de incrustaciones y coincidencia de similitud que vincula a los médicos con las afecciones
  • Canalización de generación aumentada de recuperación conectada a un asistente inteligente en Amazon Bedrock
  • Amazon API Gateway y puntos finales de AWS Lambda para la búsqueda de médicos en tiempo real
  • Scripts de despliegue, documentación técnica y formación operativa

Impacto del proyecto

El compromiso satisfizo las necesidades de Inpharmativ de una canalización y una API listas para la producción, manteniendo al mismo tiempo el alcance y el coste dentro de una ventana estrechamente gestionada. El resultado es una experiencia de descubrimiento asistida por IA que muestra a los médicos relevantes por afección y enfoque de investigación, respaldada por manuales de operaciones documentados y una clara propiedad en la cuenta de AWS del cliente.

Métricas documentadas:

  • Plazo total de entrega de seis semanas, desde el inicio hasta la validación y la entrega, tal como se especifica en el plan del proyecto
  • Plazo de entrega de validación de tres días para las demostraciones y los resultados de los experimentos
  • Datos y acceso iniciales proporcionados en un plazo de tres a cinco días hábiles a partir del inicio
  • Las fuentes integradas incluyen PubMed, Google Scholar, sitios web de conferencias y bases de datos de revistas

¿Listo para transformar su negocio con la IA?

Exploremos juntos sus oportunidades de IA de alto impacto en una sesión gratuita