El experto, recurso o evento adecuado, al instante: Cómo Avahi construyó una plataforma de descubrimiento impulsada por IA para The Bloom

Cliente

The Bloom

Ubicación

Pittstown, Nueva Jersey

Industria

Impacto social / Desarrollo comunitario

Servicios y tecnología

Amazon Bedrock Claude 3.5 Sonnet Claude 3 Haiku Amazon Titan Embeddings Amazon OpenSearch Serverless AWS Lambda Amazon S3 Amazon EventBridge Amazon CloudWatch AWS IAM Next.js

Cliente

The Bloom

Ubicación

Pittstown, Nueva Jersey

Industria

Impacto social / Desarrollo comunitario

Servicios y tecnología

Amazon Bedrock Claude 3.5 Sonnet Claude 3 Haiku Amazon Titan Embeddings Amazon OpenSearch Serverless AWS Lambda Amazon S3 Amazon EventBridge Amazon CloudWatch AWS IAM Next.js

Resumen del proyecto

The Bloom es una organización de impacto social que conecta a los miembros de la comunidad con expertos, recursos educativos y eventos en áreas como las finanzas climáticas, la justicia social y el desarrollo comunitario. A medida que su plataforma y biblioteca de contenido crecían, un motor de búsqueda de palabras clave rígido dificultaba cada vez más que los miembros encontraran lo que realmente necesitaban, frenando las conexiones que la plataforma estaba diseñada para crear. Avahi diseñó e implementó una plataforma de búsqueda y descubrimiento totalmente sin servidor y basada en IA en AWS, combinando búsqueda semántica, interpretación de consultas en lenguaje natural basada en RAG y una canalización de indexación de eventos automatizada. El resultado es una plataforma comunitaria inteligente y de automantenimiento que se mantiene actualizada y precisa, sin gastos operativos continuos.

Acerca del cliente

The Bloom es una organización de impacto social con sede en Pittstown, Nueva Jersey, dedicada a conectar a los miembros de la comunidad con las personas, el conocimiento y las oportunidades relevantes para su trabajo. Operando en áreas de enfoque que incluyen las finanzas climáticas, la justicia social y el desarrollo comunitario, The Bloom gestiona una plataforma curada que reúne a profesionales expertos, contenido educativo y eventos para una comunidad impulsada por una misión. Como organización austera en el ámbito del impacto social, The Bloom depende de la capacidad de su plataforma para establecer conexiones significativas de manera eficiente y a un coste sostenible.

El problema

La propuesta de valor central de The Bloom es la conexión: poner al experto, recurso o evento adecuado frente al miembro de la comunidad correcto en el momento oportuno. A medida que la biblioteca de perfiles, documentos, artículos, informes y eventos de la plataforma crecía, esa promesa se hacía más difícil de cumplir. Un motor de búsqueda de palabras clave tradicional —que compara términos con campos de texto— es demasiado rígido para manejar la forma en que las personas de una comunidad especializada y orientada a una misión realmente buscan. Una consulta como «¿Con quién puedo hablar sobre finanzas climáticas?» no es una búsqueda de palabras clave. Es una expresión de intención, contexto y necesidad que requiere una comprensión semántica para ser respondida correctamente.

La brecha entre lo que los miembros de la comunidad preguntaban y lo que la búsqueda por palabras clave podía ofrecer era un problema de detectabilidad con consecuencias cada vez mayores. Los miembros que no podían encontrar expertos o recursos relevantes se desvinculaban.

Los eventos no contaban con asistencia, no porque carecieran de relevancia, sino porque eran invisibles para las personas que más los habrían valorado. Para una plataforma cuyo éxito depende enteramente de facilitar conexiones de alta calidad, una experiencia de búsqueda que no podía seguir el ritmo de una biblioteca de contenido creciente y diversa era una amenaza directa para la misión de la organización y la retención de miembros.

El desafío de los eventos añadió una dimensión operativa adicional. Mantener un índice de eventos preciso y actualizado requería un esfuerzo manual, y para una organización de impacto social austera, ese gasto general no era escalable. Sin automatización, la experiencia de descubrimiento de eventos siempre iría por detrás de la realidad, erosionando la confianza en la utilidad de la plataforma con el tiempo.

Por qué AWS

AWS ofreció la combinación de servicios de IA gestionados, computación sin servidor e infraestructura de búsqueda vectorial que hizo posible construir una plataforma de descubrimiento sofisticada sin el coste y la complejidad del despliegue de modelos personalizados o la infraestructura autogestionada. Amazon Bedrock proporcionó acceso directo a modelos de lenguaje de vanguardia —Claude 3.5 Sonnet, Claude 3 Haiku y Titan Embeddings— a través de una única API gobernada, eliminando la necesidad de gestionar el alojamiento de modelos y preservando la capacidad de implementar lógica de respaldo automática entre modelos. Esto fue particularmente importante para una organización como The Bloom, donde la fiabilidad del servicio y la simplicidad operativa son esenciales.

Amazon OpenSearch Serverless proporcionó una capa de búsqueda vectorial totalmente gestionada capaz de ejecutar consultas híbridas —combinando la puntuación tradicional por palabras clave con la similitud vectorial KNN— sin que The Bloom tuviera que aprovisionar o mantener la infraestructura del clúster de búsqueda. Junto con AWS Lambda, Amazon EventBridge y las notificaciones de eventos de S3, la canalización completa se ejecuta en una arquitectura sin servidor que se escala según la demanda y mantiene los costes operativos al mínimo. Para una organización de impacto social que opera de forma austera, un coste mensual estimado de la canalización de 15-20 $ hizo de AWS la única plataforma que podía ofrecer este nivel de capacidad de IA a un precio sostenible.

Por qué The Bloom eligió a Avahi

The Bloom necesitaba más que un proveedor que pudiera configurar los servicios de AWS. Necesitaban un socio que entendiera cómo diseñar una arquitectura de IA que fuera simultáneamente potente, fiable y operativamente sostenible para una organización impulsada por una misión con recursos de ingeniería limitados. Esa combinación de sofisticación técnica y juicio práctico es lo que Avahi aportó al compromiso.

El enfoque de Avahi en la ingeniería de resiliencia fue un factor diferenciador desde el principio. En lugar de construir una canalización que dependiera de que cualquier fuente o modelo externo se comportara de manera predecible, Avahi diseñó una redundancia en capas en cada flujo de trabajo crítico, ya sea extracción de contenido web, raspado de eventos o llamadas a modelos de IA. Esto significaba que The Bloom obtendría una plataforma que se degradaría con elegancia en condiciones del mundo real en lugar de fallar por completo cuando un sitio externo bloqueara un rastreador o un modelo alcanzara un límite de velocidad.

Avahi también aportó la experiencia para diseñar pensando en la independencia del cliente. La documentación técnica completa, una guía de implementación y una arquitectura sin servidor limpia significaban que el equipo de The Bloom podía mantener y extender la plataforma sin una dependencia externa continua, una consideración crítica para una organización que necesitaba una solución duradera, no una relación de servicio gestionado.

Solución

Avahi construyó una plataforma de descubrimiento basada en IA totalmente sin servidor en AWS, que opera a través de tres flujos de trabajo interconectados de búsqueda e ingesta, todos unificados en una única interfaz accesible a través de un frontend Next.js.

  • Búsqueda de expertos y recursos Cuando un miembro de la comunidad envía una consulta, la capa API de Next.js enruta la solicitud al modelo Titan Embeddings de Amazon Bedrock, que genera una representación vectorial de 1536 dimensiones del texto de la consulta. Ese vector se pasa luego a Amazon OpenSearch Serverless, que ejecuta una búsqueda híbrida en los índices de expertos y recursos, combinando la coincidencia tradicional de palabras clave con la similitud vectorial KNN utilizando el algoritmo HNSW y la puntuación de similitud de coseno. Los resultados se filtran por umbrales de puntuación de relevancia y se devuelven como tarjetas interactivas, mostrando expertos y recursos semánticamente relevantes incluso cuando la consulta no coincide con los valores exactos de los campos.
  • Búsqueda de eventos basada en RAG El descubrimiento de eventos utiliza un enfoque distinto de dos etapas. Claude 3 Haiku primero interpreta la consulta en lenguaje natural, extrayendo la ubicación, el tema y las palabras clave a temperatura 0 para una salida estructurada y determinista. Luego, el sistema selecciona la estrategia de búsqueda óptima (solo ubicación, solo tema o combinada), genera una incrustación Titan para el componente temático y ejecuta una búsqueda vectorial KNN con filtros geográficos contra el índice de eventos en OpenSearch, devolviendo hasta 20 eventos próximos clasificados por relevancia semántica y geográfica.
  • Canalización de eventos automatizada El componente más significativo operativamente de la plataforma es su canalización de descubrimiento de eventos totalmente automatizada. Amazon EventBridge activa una función Lambda de Python cada mañana de forma programada. Esa función extrae el calendario Luma de The Bloom utilizando cuatro estrategias de extracción secuenciales —solicitudes HTTP simuladas por navegador, análisis de datos estructurados JSON-LD, extracción de datos incrustados de Next.js y llamadas directas a la API de Luma—, con cada respaldo activado automáticamente si el método precedente falla. Los eventos extraídos se guardan como CSV en Amazon S3, lo que dispara una notificación de evento de S3 que activa automáticamente una segunda función Lambda para generar incrustaciones Titan para cada evento e indexarlos masivamente en OpenSearch. A partir de ese momento, los eventos son inmediatamente buscables, sin necesidad de intervención humana después de la configuración inicial.
  • Flujo de trabajo de ingesta de documentos Para la ingesta de contenido, Avahi construyó una canalización de extracción web multiestrategia que acepta una URL e intenta la recuperación de contenido utilizando cuatro métodos secuenciales: obtención directa de HTTP con rotación de agente de usuario, API de Puppeteer para páginas renderizadas con JavaScript, enrutamiento de servicio de proxy y análisis de la estructura de la URL como último recurso. Una vez que se extrae el contenido, Claude 3.5 Sonnet lo analiza para generar un título estructurado, una descripción estandarizada de 100 palabras y clasificaciones de categorías, con un respaldo automático a Claude 3 Sonnet y luego a Claude 3 Haiku si el modelo principal no está disponible. Titan Embeddings luego genera un vector para el recurso, que se añade a un CSV compartido en S3 y se hace buscable a través del mismo índice híbrido de OpenSearch. Amazon CloudWatch proporciona registro y monitoreo del rendimiento en todas las funciones Lambda, y AWS IAM aplica un control de acceso granular en toda la arquitectura del servicio.

Resultados clave

  • Plataforma de búsqueda semántica híbrida sin servidor que cubre tres tipos de contenido: expertos, recursos y eventos
  • Búsqueda de eventos basada en RAG con interpretación de consultas en lenguaje natural a través de Claude 3 Haiku
  • Canalización automatizada de descubrimiento e indexación de eventos (EventBridge + funciones Lambda duales + notificaciones de eventos S3)
  • Flujo de trabajo de ingesta de contenido web multiestrategia con extracción de respaldo de cuatro capas y análisis de Claude 3.5 Sonnet
  • Cascada de respaldo automático de modelos de IA (Claude 3.5 Sonnet → Claude 3 Sonnet → Claude 3 Haiku)
  • Índices de Amazon OpenSearch Serverless para expertos, recursos y eventos con puntuación híbrida KNN + palabras clave
  • Interfaz de usuario de Streamlit para pruebas de plataforma
  • Puntos finales de API RESTful para todas las funciones de búsqueda e ingesta
  • Documentación técnica completa que cubre arquitectura, configuración, resolución de problemas y mantenimiento
  • Guía de implementación de AWS que cubre Lambda, OpenSearch Serverless, S3, Bedrock y EventBridge

Impacto del proyecto

Avahi entregó una plataforma de descubrimiento de IA completamente implementada y de automantenimiento que cambia fundamentalmente la forma en que los miembros de la comunidad de The Bloom se conectan con expertos, recursos y eventos. Las consultas en lenguaje natural —la forma en que las personas realmente buscan— ahora devuelven resultados semánticamente relevantes en los tres tipos de contenido, reemplazando las limitaciones rígidas de la coincidencia de palabras clave con un descubrimiento genuino basado en la intención. El proceso automatizado de eventos elimina el esfuerzo manual que anteriormente se interponía entre el calendario Luma de The Bloom y un índice de eventos actualizado y consultable.

Para una organización de impacto social austera, el perfil de costes de la arquitectura es tan significativo como sus capacidades. La plataforma opera en una infraestructura de AWS totalmente gestionada y sin servidor, diseñada específicamente para escalar sin gastos operativos y con un precio que la hace sostenible mucho después de que finalice el compromiso.

Métricas

  • Cobertura de la base de conocimientos: procesa hasta 20 manuales de OEM

Aspectos destacados de los resultados

  • Búsqueda en lenguaje natural habilitada en tres tipos de contenido (expertos, recursos y eventos) en una única interfaz unificada
  • Coste estimado del pipeline automatizado de eventos: ~$15-20/mes en infraestructura serverless de AWS
  • Índice de eventos actualizado a diario y de forma automática, sin intervención manual tras la configuración inicial
  • La estrategia de extracción web de cuatro capas de respaldo garantiza la ingesta de contenido desde una amplia variedad de fuentes externas sin intervención manual
  • El scraper de eventos de Luma con cuatro métodos de respaldo mantiene la continuidad del pipeline incluso cuando los métodos de extracción principales están bloqueados o no disponibles
  • La cascada de respaldo automático de modelos de IA entre tres modelos de Claude mantiene la disponibilidad del servicio durante caídas del modelo o eventos de limitación de tasa
  • La búsqueda vectorial KNN con filtrado geográfico devuelve hasta 20 próximos eventos clasificados semántica y geográficamente por consulta
  • Titan Embeddings genera vectores de 1.536 dimensiones para todos los expertos, recursos, eventos y consultas de los usuarios, lo que impulsa la búsqueda semántica en toda la plataforma

¿Listo para transformar su negocio con la IA?

Exploremos juntos sus oportunidades de IA de alto impacto en una sesión gratuita

¿Listo para transformar su negocio con la IA?

Exploremos juntos sus oportunidades de IA de alto impacto en una sesión gratuita

¿Listo para transformar su negocio con la IA?

Reserve su taller gratuito de IA de activación

Exploremos juntos sus oportunidades de IA de alto impacto en una sesión gratuita de medio día

Vea nuestros casos prácticos

Vea cómo hemos ofrecido resultados medibles para empresas como la suya