Focus technique : les standards de l'instrumentation des performances IT

Les portails ALALOOP sont par construction, ouverts à l'intégration de l'instrumentation du marché (standard ou propriétaire). Cet article fait le point sur les différents standards et approches d'instrumentation utilisés pour les mesures de performance des infrastructures et/ou applications.
L'instrumentation des performances s'appuie, par ordre d'importance, sur les 3 métriques suivantes : 1. la mesure des performances des services délivrés : cette métrique est exprimée en unité de TEMPS (min,sec,ms). Ces mesures ont pour objectif de valider que les services délivrés répondent aux objectifs de performance généralement consignés dans un contrat de service (SLA : Service Level Agreement). On distinguera les SLA d'infrastructures (réseau & hébergement) des SLA globaux (Applications et Utilisateur) ; 2. la charge des composants critiques : cette métrique doit pouvoir s'exprimer en POURCENTAGE par rapport à la charge nominale. Ces mesures ont pour objectif de valider le dimensionnement des ressources pour assurer un fonctionnement optimal à un coût optimal; 3. l'analyse des trafics : cette métrique doit permettre d'identifier une ORIGINE de trafic (adresse IP, application, etc.). Ces mesures ont pour objectif de maîtriser les usages des infrastructures par utilisateur, application ou tout autre élément d'analyse.
Mesure des performances réseau, serveurs, application et ressenti utilisateur (QoE) par les robots
Elle fait appel à deux techniques complémentaires adaptées à des usages différents. Le monitoring actif, également appelé monitoring synthétique, consiste à valider la performance d'un service (connexion réseau, application, ..) en simulant son utilisation à l'aide d'un ROBOT à intervalles réguliers 24/24h - 7/7j. Cette technique est bien adapté à l'identification des problèmes de performance et le suivi des SLAs. Parmi les robots populaires, signalons IP SLA qui est embarqué dans la majorité des équipements Cisco et qui permet de faire des tests de performance d'infrastructures réseaux et d'hébergement grâce à de nombreux tests (OPERATION) prédéfinis dans le robot. Un autre robot très répandu est JMETER pour effectuer des tests de performances d'applications selon différents protocoles. A contrario le monitoring passif est basé sur la capture des trafics réseaux entre l'utilisateur et les applications auxquelles il accède (analyseur). Il est davantage adapté au "troubleshooting" de problèmes identifiés ou à l'analyse des échanges client/serveur en phase de développement.
Mesure de charge des ressources sensibles : collecte d'indicateurs (Mibs SNMP / WMI - WBEM/ ...)
La mesure de charge composants critiques du SI fait également appel à plusieurs techniques. Le standard SNMP (Simple Network Management Protocol) permettant l'accès aux MIB (Management Information Base) des ressources est le standard incontournable de l'IETF (Internet Engineering Task Force) pour tous les équipements réseau et de médiation (proxy, firewall, etc.). Il existe également de nombreuses MIB pour différents composants logiciels (Oracale, Notes, etc.). Le site MIBdepot (www.mibdepot.com) recense environ 10 000 MIBs représentant 1 380 000 objets gérables. Un autre standard également important et plus récent est le WBEM (Web Based Entreprise Management). Sous ce vocable sont rassemblés un ensemble de technologies et standards du DMTF (Distributed Management Task Force) pour unifier la gestion des environnements informatiques distribués. Le point central d'enregistrement des informations est CIM (Common Information Base) qui est une structure ouverte orientée objet. Ce standard est davantage répandu pour le monitoring des serveurs et des applications. WMI (Windows Management Instrumentation) est l'implémentation Microsoft des standards WBEM et CIM du DMTF. A l'origine, l'accès distant à WMI n'était possible que via DCOM (Distributed Component Object Model : technique propriétaire Microsoft). Plus récemment, Microsoft a rendu disponible la méthode WinRM (Windows Remote Management) basée sur le standard WS-Management (Web Services for Management) du DMTF. L'intérêt de cette méthode est d'utiliser des protocoles standards WEB (messages SOAP) sécurisés pour accéder à distance aux informations CIM d'une ressource. C'est pour cette raison qu'Alaloop utilise WinRM comme mode d'accès à WMI et non DCOM. De nombreux composants matériels/logiciels ne disposent malheureusement pas d'une interface standard (SNMP/MIB ou WBEM/CIM). Dans ce cas, il sera nécessaire de "parser" les indicateurs pertinents publiés par l'application "propriétaire" de gestion du composant.
Analyse des trafics : Netflow / IPFix
Nous terminons notre revue des standards d'instrumentation par le suivi des trafics assuré par des enregistreurs. On distingue principalement les techniques d'enregistreurs de flux et d'enregistreurs de paquets. Les enregistreurs de flux (un flux peut se résumer à une "conversation" entre 2 adresses IP) permettent d'avoir une vision globale et synthétique des trafics. Le standard IPFix (IP Flow Information Export) de l'IETF est issu de la technologie Netflow de Cisco Systems. Il défini un format d'export d'informations de trafic vers un collecteur qui sera chargé de les stocker, généralement dans une base de données pour permettre tout type d'analyse. De nombreux équipements réseaux (routeurs et commutateurs) embarquent un analyseur de flux Netfow/IPfix ce qui permet de disposer de nombreux points d'analyse de trafic sans installer d'équipement additionnels, et avec une vision centralisée.
Les enregistreurs de paquets quant à eux sont plutôt utilisés à des fins de "troubleshooting". Il existe de nombreux enregistreurs de paquets basés sur l'interface PCAP qui est une API permettant de capturer un trafic réseau. (lbpcap est l'implémentation Pcap sous Unix/Linux et WinPcap est une implémentation sous Windows). La grande quantité d'informations collectées n'autorise pas de pouvoir les exporter. Les enregistreurs de paquets disposeront donc d'une interface locale d'analyse. Sflow est un standard de capture de trafic dans les commutateurs et les routeurs. Son architecture est similaire à Netfow/IPFix à savoir un agent logiciel de collecte embarqué dans l'équipement (commutateur / routeur) qui exporte ses informations dans des datagrammes Sflow vers un collecteur. Au delà de cette ressemblance d'architecture, la nature des informations envoyées dans les datagrammes Sflow diffère totalement. Un agent SFlow réalise 2 formes d'opérations : l'échantillonnage de paquets et le comptage sur les interfaces. Alaloop a choisi de ne pas supporter Sflow car les analyses de trafic basées sur l'échantillonnage de paquets induisent des erreurs d'interprétation et les informations de compteurs d'interfaces sont plus simples à obtenir en Mib2 snmp.
En résumé, cet article a permis de faire le point sur les différentes techniques d'instrumentation actuelles et les nombreux acronymes associés. La figure ci-contre résume leur intégration au portail Alaloop. Des détails sur l'instrumentation supportée sont disponibles dans un nouveau guide intitulé : "Guide de l'instrumentation Alaloop".
Signalons à ce sujet le partenariat renforcé avec Cisco pour supporter la NAM (Network Analysis Module) comme nouvelle source de données des portails Alaloop. La NAM est une sonde polyvalente d'analyse réseau disponible en tant que module sur un grand nombre d'équipements Cisco (routeurs ou commutateurs) et également en tant qu'appliance. Elle supporte de nombreuses fonctions d'analyse comme les mesures de temps de réponse applicatifs (NAM ART) et permet en outre de mesurer les bénéfices apportés par les modules d'optimisation de trafic WaaS (Wide-Area Application Services). L'objectif de ce partenariat est pour Alaloop de disposer d'une nouvelle source de données de mesures très riche fonctionnellement et pour Cisco de disposer des puissantes fonctions de reporting et d'analyse des portails Alaloop associées à une simplicité d'utilisation.
|