Manifeste de l’observabilité 2021

La seule constante est le changement

Combien faut-il d'ingénieurs SRE pour définir l'observabilité ?

Tous. Et ils n'arriveront quand même pas à se mettre d'accord.

Qu'elle que soit la manière que vous choisissiez pour définir l'observabilité, vous devez prendre en compte une constante inhérente à tout environnement informatique distribué moderne : le changement.

Le changement des types et sources de données télémétriques. Le changement des architectures et méthodes de déploiement des applications. Le changement des meilleures pratiques et outils informatiques. Le changement des types et nombre de systèmes distribués, conteneurs et niveaux d'abstraction entre application et infrastructure. Le changement de l'utilisation client du produit.

Le changement de l'activité qui exige un changement de technologies.

Chez New Relic, nous définissons l'observabilité très simplement : il s'agit de votre niveau de compréhension des systèmes complexes que vous gérez.

Nous savons aussi que la définition est bien moins importante que les principes que vous appliquez pour pratiquer l'observabilité avec succès.

Et donc, au lieu de pinailler sur les définitions possibles, nous avons consulté des développeurs et des ingénieurs sur ce sujet, et nous avons extrait les 10 principes de l'observabilité.

Data_lines

Les 10 principes de l'observabilité

1. L'observabilité vous apporte une vision partagée.

Les équipes DevOps veulent éliminer les silos entre les ingénieurs qui programment le code et ceux qui portent ce code en production. Avec l'observabilité, ces équipes disposent d'un cadre commun qui leur permet d'agir sur les données partagées.

« Quand on a une convergence d'individualités (avec les personnes qui font le monitoring, celles qui s'occupent de l'observabilité et celles qui sont chargées du budget), l'observabilité apporte une vision partagée qui est la seule source de vérité, et rassemble ces individualités pour qu'elles collaborent vers les mêmes objectifs. »

Josh Biggley, Conseiller stratégique TechOps, New Relic

2. L'observabilité doit vous permettre l'instrumentation de votre système afin que toutes vos données soient toujours disponibles en temps réel et à partir de la même plateforme.

La visibilité sur tout votre système informatique est plus essentielle que jamais, tout comme l'est la traçabilité sut tout votre stack. C'est pourquoi 94 % des leaders informatiques sont convaincus que l'observabilité est un facteur clé du développement de logiciels, et non une pièce rapportée après coup.

En d'autres termes, vous devez pouvoir accéder, en un seul et même endroit, à tous les événements, métriques, logs et traces (que les données proviennent de l'agent d'un fournisseur, de votre solution interne ou d'un élément standard en open source).

« Au coeur de chaque entreprise, on trouve fondamentalement une entreprise de données. Le meilleur outil pour réussir est donc une bonne compréhension de ces données. »

Zack Mutchler, Conseiller stratégique TechOps, New Relic

3. L'observabilité exige l'ingestion des données à forte cardinalité.

Pourquoi collecter des données si vous ne pouvez pas les analyser à la volée ? Une forte cardinalité vous permet d'aborder vos questions sous tous les angles afin de gérer les inconnues inconnues et de découvrir des informations vitales.

Il est impératif que les ingénieurs puissent tester leurs systèmes en production et poser des questions pour explorer les problèmes imprévisibles au départ.

« Nous pouvons prendre de meilleures décisions parce que nous avons la visibilité qu'il nous faut pour mettre le doigt sur les problèmes et les résoudre proactivement. Et maintenant, nous pouvons résoudre les problèmes que nous ne savions pas que nous avions. »

Daniela Constanza Muñoz, Développeuse, Banco de Credito e Inversiones

4. L'observabilité donne à vos équipes l'assurance dont elles ont besoin.

Plus vous comprenez rapidement et efficacement vos systèmes complexes, plus vous accueillez l'implémentation de changements système avec assurance.

Vous savez que tout le monde a accès aux données nécessaires pour prendre des décisions informées à tous les niveaux de l'entreprise. Vous savez faire évoluer le système avec la demande. Et vous savez que vous pouvez pousser du code, voir immédiatement ses effets et réagir à tout problème avant que l'utilisateur ne s'en rende compte.

« Avec l'observabilité, on peut apporter des modifications sans avoir à s'inquiéter de tout casser. Si on n'est pas sûr que le changement qu'on veut faire ne va pas impacter tout un tas d'éléments, on ne le fait pas, et on perd en innovation. »

Léo Guinan, Ingénieur DevOps, Fuse by Cardinal Health

man working on laptop

5. L'observabilité permet de prévenir les problèmes et non plus seulement de les guérir.

La capacité à relier et corréler les signaux entre eux permet de contextualiser les points problématiques avant qu'ils n'aient un impact sur l'expérience client. Ainsi vous comprenez pourquoi les incidents critiques se sont produits et vous les empêchez proactivement de se reproduire. Cela se traduit par une réduction des temps d'indisponibilité, une amélioration du MTTR, et une équipe qui a plus de temps pour l'innovation.

« Nous pouvons voir les performances de l'application, examiner en détail les raisons derrière l'augmentation du taux d'erreurs, quand il y a eu une montée en flèche de la latence, et le noeud exact qui est touché. Ces informations sont très précieuses lors de la sortie d'une nouvelle version parce que nous pouvons désormais avoir une vue imprenable sur l'endroit précis d'où vient le souci. »

Chris Callaghan, Responsable Ingénierie Fiabilité du site, Royal Society of Chemistry

Data_lines

Résultats de l'observabilité : Leaders et traditionalistes de l'informatique

  • 83 % des leaders informatiques subissent moins de 5 pannes par mois, contre 3 % des traditionalistes.
  • 75 % des leaders informatiques signalent un MTTR moyen de moins d'une demiheure, contre 1 % des traditionalistes.
  • 78 % des leaders informatiques sont informés des interruptions de services par les solutions d'observabilité, contre seulement 12 % des traditionalistes.
  • 89 % des leaders informatiques ont adopté la résolution automatisée des problèmes, contre seulement 5 % des traditionalistes.
  • Les traditionalistes découvrent presque la moitié (48 %) des interruptions par le biais des clients, soit 15 % plus souvent que les leaders (33 %).
  • Les leaders informatiques passent 77 % de leur temps à innover et seulement 23 % à résoudre les problèmes. Les traditionalistes passent deux fois plus de temps (46 %) sur le dépannage. 

Source: Deeper Than Digital - New Relic

6. L'observabilité est un système sociotechnique.

Elle dépasse les « simples » systèmes et logiciels et touche tous les niveaux de l'entreprise : activité, équipes, rôles et personnel.

Elle vous permet de voir comment toutes vos applications et les services et systèmes sous-jacents sont liés entre eux, afin que vous puissiez comprendre les dépendances entre les limites organisationnelles et dépanner les problèmes plus rapidement.

C'est une visibilité des personnes et processus et non seulement de la technologie.

« L'observabilité comprend tout le système sociotechnique (l'humain, les détecteurs), il n'y a pas de ligne de démarcation entre l'aspect technique et les personnes qui en sont responsables. Si vous essayez de les séparer de manière distincte, c'est simplement impossible, et l'effort nécessaire pour le faire plombe le travail d'interprétation de la situation et d'identification de ce qu'il faut améliorer. »

Beth Long, Ingénieure IT senior, New Relic

7. L'observabilité vous permet d'aller plus vite.

Elle contextualise les relations et vous permet de répondre beaucoup plus rapidement aux incidents.

« La gestion de notre environnement microservice exige l'observabilité. […] Un seul et même endroit où nous pouvons comprendre ce qui se passe au niveau de l'infrastructure sous-jacente, de nos applications individuelles et de tous nos microservices. Nous pouvons non seulement nous assurer que nous répondons à nos objectifs de niveau de service, mais quand quelque chose ne va pas, nous pouvons résoudre le problème plus rapidement. […] Cela nous permet d'aller plus vite sans que le moteur nous lâche. »

Matthew Tapper, Chef ingénieur Fiabilité du site, Culture Amp

8. L'observabilité est une boucle sans fin.

C'est un voyage, pas une destination ; ce sont de constantes améliorations, pas des modifications à l'emporte-pièce. Si vous pensez avoir atteint l'observabilité « parfaite », vous avez tout simplement tort. En effet, si vous ne cherchez pas constamment à adapter et améliorer vos méthodes d'observabilité pour garder le rythme avec les changements d'exigences de l'activité et des meilleures pratiques, vous irez droit dans le mur.

La bonne nouvelle c'est qu'une pratique réussie de l'observabilité améliore les mécanismes internes de toute l'entreprise. La mauvaise nouvelle c'est que vous n'aurez jamais fini d'en faire la maintenance.

« La manière dont nous gérons les problèmes du jour va révéler toute une nouvelle série de problèmes et le gros défi est d'en garder le contrôle au cours des quelques prochaines années. »

Beth Long, Ingénieure IT senior, New Relic

9. L'observabilité, c'est laisser le travail au bureau et avoir de vraies nuits de sommeil.

Elle permet d'éliminer la fatigue due aux alertes inutiles, mais aussi la fatigue physique, en sachant que votre système est suffisamment robuste pour supporter les problèmes sans causer une panne complète, avec des alertes priorisées afin que vous ne soyez interrompu qu'en cas de problème majeur.

« Si vous n'avez pas de visibilité sur le système dont vous êtes responsable, vous allez souffrir d'insomnies. Et vous vous sentirez vulnérable parce que vous ne disposez pas des informations dont vous avez besoin. »

Beth Long, Ingénieure IT senior, New Relic

10. L'observabilité est un super-pouvoir.

Elle vous permet de réinventer comment vous faites un travail et de comprendre l'impact des changements informatiques (les connexions entre vos outils, applications et infrastructure) sur l'utilisateur. Elle vous donne les moyens d'améliorer cette expérience sans mettre en danger la santé du système.

« L'observabilité me permet d'interpréter toutes les données et d'en devenir le narrateur. Elle me permet d'être un meilleur dirigeant, de dynamiser les contributions au sein de l'entreprise et d'atteindre les objectifs voulus. »

Josh Biggley, Conseiller stratégique TechOps, New Relic

woman and man working together

Les six questions à absolument poser

Data_lines

L'observabilité c'est comme la démocratie, il est toujours possible de l'améliorer.

Commencez où vous le pouvez et avancez au rythme qui convient à votre entreprise.

Pour aider à passer de l'approche passive du monitoring (qui vous dit quand quelque chose ne fonctionne pas correctement) à l'approche active de l'observabilité (qui vous permet de comprendre les raisons du mauvais fonctionnement), nous avons compilé pour vous les six questions à poser au système, à vos dirigeants et aux ingénieurs SRE.

Q.1 - Y a-t-il ingestion des métriques/ événements/logs/traces de toutes les sources, que celles-ci soient open source, internes, ou exclusives ?

Q.2 - La plateforme que vous utilisez vous apporte-t-elle la flexibilité nécessaire pour collecter les données à forte cardinalité qui vous permettent de poser les meilleures questions et d'y répondre avec précision ?

Q.3 - Pouvez-vous interroger dynamiquement les données que vous collectez et surtout, pouvez-vous poser les questions que vous ne saviez pas que vous deviez poser lors de la configuration initiale de l'instrumentation ?

Q.4 - Pouvez-vous connecter les datasets pour obtenir des informations personnalisées qui renseignent les métriques métier clés ?

Q.5 - Pouvez-vous surfacer les connexions dynamiques automatiquement afin de trouver les schémas de données par le biais d'analyses et de visualisations organisées ?

Q.6 - Y a-t-il une volonté, à tous les niveaux de l'entreprise, d'investir dans une plateforme qui apporte la visibilité nécessaire pour découvrir la réalité de votre situation ? 

Ou, vu sous un autre angle, la direction veut-elle des données qui confirment ce qu'elle pense ou des données qui lui révèlent l'état réel des choses ?

Changez votre manière de changer

Les entreprises traditionalistes ont du mal à s'adapter aux besoins et défis d'aujourd'hui en raison de l'énorme complexité qui rend très difficile la séparation des alertes importantes du bruit inutile.

Elles ont du mal à voir comment les personnes, les équipes et les systèmes convergent pour fonctionner ensemble.

Mais plus votre pratique de l'observabilité est robuste, plus elle saura évoluer avec votre système, et mieux vous serez placés pour maîtriser cette complexité.

New Relic. L'observabilité simplifiée.

Inscrivez-vous pour obtenir votre compte New Relic gratuit.

Data_lines