Consultoría Inpharmativ
Ancaster, ON
Consultoría de datos sanitarios y ciencias de la vida
• Amazon S3 • AWS Lambda • Amazon API Gateway • Amazon Bedrock • Amazon RDS for PostgreSQL • Amazon OpenSearch Service • AWS Identity and Access Management • Amazon CloudWatch
Inpharmativ Consulting elabora listas de médicos relevantes utilizando fuentes de investigación públicas. La empresa quería automatizar y escalar este trabajo con IA generativa, manteniendo al mismo tiempo los costes y el tiempo de rentabilidad ajustados. Avahi diseñó e implementó un sistema de datos y recuperación listo para producción en AWS que automatiza la extracción de entidades, impulsa un asistente de búsqueda basado en RAG y expone los resultados a través de API seguras. El compromiso se estructuró para ajustarse a una ventana de ingeniería de seis semanas, financiada a través de créditos AWS GenAI Prod.
Inpharmativ Consulting opera en el ámbito de los datos sanitarios y las ciencias de la vida, ayudando a los clientes a identificar médicos e investigadores basándose en publicaciones, actividades en conferencias y señales públicas relacionadas en todo Canadá.
El descubrimiento manual de médicos no se escalaba con las crecientes fuentes de datos o la complejidad de las consultas. Los analistas tenían que examinar documentos de investigación, resúmenes y perfiles de autores, lo que ralentizaba el tiempo de respuesta y aumentaba el riesgo de resultados incoherentes.
Inpharmativ necesitaba la extracción automatizada de personas, instituciones y temas médicos, además de una forma de conectar a los médicos con las afecciones con relevancia semántica, y luego devolver los resultados de forma programática. Sin una solución, el equipo seguiría dedicando grandes cantidades de tiempo de los analistas a la búsqueda repetitiva y al trabajo de selección, y los plazos de entrega se alargarían a medida que aumentara el volumen de datos.
Cualquier automatización también tenía que respetar una lista controlada de fuentes públicas, incluyendo PubMed, Google Scholar, sitios web de conferencias y bases de datos de revistas.
AWS proporcionó bloques de construcción gestionados para la IA generativa y las canalizaciones de datos, incluyendo Amazon Bedrock para el acceso al modelo, servicios sin servidor para la ingesta y las API, y almacenamiento gestionado para los datos estructurados y vectoriales. El uso de estos servicios ayudó al equipo a entregar rápidamente sin operaciones pesadas de la plataforma.
El proyecto también se alineó con la financiación de AWS GenAI Prod, que contenía los costes y apoyó la ventana de entrega de seis semanas.
Avahi es un socio de servicios de nivel Premier de AWS con patrones repetibles para la búsqueda de GenAI, la extracción de entidades y el despliegue de producción. El equipo se comprometió a una iteración rápida, demostraciones frecuentes y validación del cliente en ciclos de tres días, y a la entrega dentro del plazo del cliente.
Avahi se despliega en la cuenta de AWS del cliente, el cliente conserva la propiedad del código, los modelos, las API y las salidas, lo que coincidía con los requisitos de gobernanza de Inpharmativ.
Avahi implementó una canalización de extremo a extremo que ingiere datos de investigación públicos, los enriquece con PNL y sirve resultados de médicos clasificados a través de una API.
Ingesta y preprocesamiento de datos. Las fuentes incluyeron PubMed, Google Scholar, sitios web de conferencias y bases de datos de revistas. El web scraping mejorado extrajo texto estructurado y no estructurado de artículos, resúmenes y perfiles de autores. La canalización normalizó el texto, eliminó los duplicados y preparó el contenido multilingüe para la PNL descendente.
Extracción y enriquecimiento de entidades. Utilizando modelos alojados en Amazon Bedrock, el sistema aplicó el reconocimiento de entidades nombradas para capturar los nombres de los médicos, las afiliaciones, los temas de investigación y las afecciones médicas. Se generaron incrustaciones para calcular la similitud semántica entre el cuerpo de trabajo de un médico y las afecciones especificadas por el usuario. Esto produjo relaciones legibles por máquina que mapean a los médicos con las áreas de enfoque médico.
Almacenamiento y recuperación. Las relaciones entre médicos se almacenan en Amazon RDS para PostgreSQL. Las incrustaciones se indexan en un almacén de vectores, Amazon OpenSearch Service o ChromaDB. La recuperación admite la búsqueda semántica y un flujo de trabajo RAG.
Asistente inteligente y API. Una base de conocimientos optimizada para la recuperación alimenta un LLM a través de Amazon Bedrock que ensambla la respuesta final. Los resultados se sirven a través de Amazon API Gateway y AWS Lambda, lo que permite a Inpharmativ integrarse directamente con las aplicaciones internas.
Operaciones y seguridad. El almacenamiento provisional de datos utiliza Amazon S3. El registro y las métricas utilizan Amazon CloudWatch. El acceso se rige por AWS Identity and Access Management. Avahi entregó documentación, scripts de despliegue y manuales de operaciones limitados a las características creadas en este proyecto.
El compromiso satisfizo las necesidades de Inpharmativ de una canalización y una API listas para la producción, manteniendo al mismo tiempo el alcance y el coste dentro de una ventana estrechamente gestionada. El resultado es una experiencia de descubrimiento asistida por IA que muestra a los médicos relevantes por afección y enfoque de investigación, respaldada por manuales de operaciones documentados y una clara propiedad en la cuenta de AWS del cliente.
Métricas documentadas:

Fundador, bravo foxtrot