AccueilContact

Datadog - Observabilité sur Téléphone

Publié dans DevOps
11 juillet 2024
3 min read
Datadog - Observabilité sur Téléphone

Datadog Brings Big Observability Directly to Your Phone

NEW YORK — Avoir à être de garde la nuit ou le week-end si nécessaire a été l’un des principaux points de douleur de l’informatique depuis des décennies. Évoluant à partir d’alertes uniquement par pager et devant agir sur celles-ci, Datadog envisage d’ajouter plus de fonctionnalités à votre téléphone. Grâce à son service On-Call disponible en version bêta, au lieu de simplement recevoir une alerte via un service de pager comme PagerDuty, vous recevez un appel, un SMS ou une autre alerte sur votre téléphone. Vous pouvez alors accéder directement au backend de Datadog. Cela signifie qu’il y a moins de temps passé à recevoir l’alerte et à devoir aller sur votre PC ou même une autre application sur votre téléphone. C’est rationalisé pour que vous obteniez les données dont vous avez besoin directement sur votre téléphone. Vous pouvez agir et avoir beaucoup de fonctionnalités d’observabilité sur votre téléphone également, vous permettant de gérer les incidents au fur et à mesure qu’ils se produisent. Cette intégration fournit les données dont vous avez besoin, rendant le processus plus efficace et plus efficace. On-Call offre tout ce qu’un pager fournit, vous permettant de recevoir des alertes sur votre téléphone, tout en prenant en charge des fonctionnalités qui peuvent être exécutées sur Datadog, a déclaré un chef de projet de Datadog lors du discours d’ouverture de la conférence annuelle des utilisateurs de Datadog ici. “Essentiellement, vous pouvez exécuter Datadog depuis votre téléphone de manière que vous ne pouviez pas avant”, a déclaré Sandu. Un article que Sandu a co-écrit expliquait qu’On-Call permet aux utilisateurs de : Minimiser les changements de contexte en consolidant la surveillance, le paging et la résolution dans une seule plateforme. Assurer la clarté de la propriété du service et de l’équipe pour briser les silos de connaissances et éviter la confusion Mettre en œuvre des politiques d’escalade et d’escalade intuitives pour des réponses rapides. Obtenir des informations exploitables à partir des pages avec des analyses détaillées. Si vous utilisez PagerDuty, les rotations de planning d’astreinte peuvent être configurées, y compris les rotations de paging. Cependant, avec Datadog lui-même, la configuration de l’astreinte n’était pas possible jusqu’à présent. Au lieu d’utiliser un outil différent pour gérer l’expérience d’astreinte, cela peut maintenant être fait où toutes les équipes, pays et catalogues de services sont gérés sur le téléphone. En effet, Datadog n’envoyait pas les alertes auparavant. Les alertes étaient envoyées, mais ensuite ces alertes étaient généralement consommées par PagerDuty ou un autre fournisseur qui appelait ensuite le téléphone pour informer l’utilisateur. et la création de tableaux de bord sont poussés directement sur le téléphone. Le produit fournit également un contexte avec un graphique d’évaluation. “Tous les graphiques porteurs de charge que les gens utilisent sont maintenant disponibles dans l’application mobile”, , vice-président de la gestion de projet, m’a dit lors des coulisses de la conférence. Meilleur sommeil L’idée est d’envoyer les bonnes données aux bons membres de l’équipe au bon moment, le tout de manière centralisée via Datadog sans contourner le système de paging. Vous pourriez penser que cela pourrait contribuer à la fatigue des alertes, vous rendant toujours accessible. Cependant, pour ceux qui sont “de garde”, cela aide à la réduire. L’objectif est d’améliorer le contexte de sorte que lorsque vous êtes de garde, vous n’ayez pas à regarder différentes sources de données sur votre PC ou d’autres appareils. Au lieu de cela, vous avez tout sur votre téléphone. Si vous recevez cet appel redouté à 3 heures du matin, vous pouvez rapidement déterminer si vous êtes la bonne personne pour gérer le problème. Sinon, vous pouvez alerter l’équipe appropriée qui peut remédier au problème, vous permettant de retourner dormir. Cette approche rationalisée garantit que vous êtes toujours connecté aux opérations via la plateforme de Datadog. En fin de compte, si elle est configurée correctement, le temps que vous passez à rechercher des solutions ou à trouver la bonne personne lorsque des problèmes surviennent devrait être minimisé. “Les escalades ou les transferts sont désormais possibles”, a déclaré Whetten. “Les escalades vers quelqu’un d’autre peuvent être effectuées. C’est nouveau, donc cela peut être vérifié directement sur le téléphone s’il y a un problème en cours.” En regardant le tableau de bord dans le contexte de Datadog sur le téléphone, il peut être déterminé si le problème n’est pas pour la personne actuelle et transmis à quelqu’un d’autre, à une équipe ou escaladé à un responsable ou à quelqu’un de plus sophistiqué et conscient de ce type de problème, a déclaré Whetten. La gestion de la rotation d’astreinte est importante car si quelqu’un est de garde, généralement il y a quelqu’un derrière lui, a déclaré Whetten. “La personne de garde n’est pas la seule de garde. Donc, elle est remise à la bonne personne”, a-t-il noté. “En général, il faudrait se lever, prendre son ordinateur portable, reconnaître l’alerte dans PagerDuty, puis ouvrir Datadog pour savoir qui appeler. Ici, l’objectif est de réduire la quantité de travail.”

Source de l’article


Share

Article précédent
Deactivation d'une API
Article suivant
DOM parallèle

Articles similaires

Analyse de la panne du réseau Rogers
11 juillet 2024
1 min
© 2024, All Rights Reserved.

Liens Rapides

Partenariats et opportunités publicitairesContactez nous

Réseaux Sociaux