Fringe
Richmond, Virginia
Servicios de recursos humanos.
AWS EKS, AWS CodePipeline, AWS CodeDeploy, Karpenter.
Para garantizar que los clientes que visitan su plataforma de redes sociales siempre disfruten de una experiencia superior, el desarrollador de software necesitaba paneles para mostrar las métricas de uso y rendimiento de todos sus recursos informáticos de infraestructura de AWS y aplicaciones orientadas al cliente. Para resolver este desafío, la empresa recurrió a Avahi Technologies, que integró los paneles de Datadog con el entorno para proporcionar visibilidad de la infraestructura y las aplicaciones orientadas al cliente. Avahi también configuró alertas cuando las métricas de rendimiento alcanzaban los umbrales preestablecidos para advertir a la empresa sobre posibles problemas. Con esta información, la empresa de desarrollo de software puede garantizar que la infraestructura y las aplicaciones proporcionen a los clientes una experiencia superior.
El cliente proporciona una plataforma de redes sociales que ofrece aplicaciones para que las personas se conecten entre sí en torno a la música y su cultura. Los clientes pueden iniciar sesión en la plataforma para encontrar comunidades y crear espacios personalizables para mostrar sus intereses.
Desafío del cliente: integrar Datadog con AWS para desarrollar paneles de rendimiento
Para garantizar que los clientes que visitan su plataforma de redes sociales siempre disfruten de una experiencia superior, el desarrollador de software necesitaba paneles para mostrar las métricas de uso de todos sus recursos informáticos de infraestructura de AWS. La empresa también necesitaba métricas de rendimiento para sus aplicaciones orientadas al cliente. Además, el equipo de TI requería alertas basadas en umbrales preestablecidos. Esto permitiría al equipo saber si algún recurso informático o aplicación experimenta problemas antes de que algún cliente experimente un rendimiento degradado mientras escucha música.
El cliente ya estaba recopilando las métricas necesarias mediante Amazon CloudWatch. Intentaron ver las métricas a través de una integración de terceros con Datadog, un servicio de observabilidad para aplicaciones en la nube que supervisa servidores, bases de datos, herramientas y servicios.
Sin embargo, el equipo interno de TI tuvo problemas para configurar los paneles y las alertas para proporcionar la visibilidad necesaria del rendimiento de la infraestructura y las aplicaciones. El equipo de administración quería paneles integrales para garantizar que los componentes de la infraestructura de AWS y las aplicaciones ofrecieran el rendimiento que demandan los clientes de todo el mundo.
Avahi Technologies es una empresa centrada en la nube y socia de Amazon Web Services (AWS) con un equipo de expertos en ingeniería de software, datos y nube, y experiencias obtenidas a través de años de trabajo dentro del ecosistema de la nube. Un extraordinario equipo de expertos de Avahi altamente certificados destaca en la arquitectura y el funcionamiento de soluciones seguras, automatizadas y basadas en la nube construidas sobre AWS. Con el objetivo de convertirse en una extensión de los equipos de clientes existentes, Avahi ofrece un servicio excepcional y trabaja incansablemente para construir las soluciones adecuadas para resolver los problemas empresariales.
Solución del socio: Avahi desarrolla el panel y las alertas necesarios
Para resolver este desafío, el cliente recurrió a Avahi Technologies. Avahi creó paneles en Datadog y configuró las integraciones con el entorno de AWS para recopilar métricas de uso para cada componente de la infraestructura de AWS:
Avahi también creó métricas y alertas de aplicaciones para notificar al equipo de TI de la empresa de software cuando se producen eventos específicos. Estos incluyen la utilización de tareas que supera el 80% y cuando el trabajo pendiente de la cola SQS supera los tres minutos. El equipo también recibe una notificación cuando la utilización asíncrona de la CPU se mantiene al 80% o más durante más de 10 minutos, o de cualquier patrón inusual de tráfico de equilibrio de carga que indique un aumento o una caída repentina del tráfico. Otras alertas se producen cuando no se han producido eventos de implementación de tareas ECS correctos en 30 minutos, la utilización de la CPU de RDS supera el 50% o si el número de conexiones RDS supera el 50%.
Fundador, bravo foxtrot