Contexte de la mission :
Dans le cadre de l’activité Observabilité et Suivi du Run
MISSIONS :
Observabilité et Suivi du Run :
– Assurer la maîtrise et le suivi technico-fonctionnelles des applications en maitrisant les chaines de liaisons et les outils à disposition (Zabbix, Dynatrace, Appdynamics, Service Now, Splunk)
– Garant de la disponibilité des applications et acteur des arrêts / Relances / Vérifications. ( Maîtrise technique des commandes ou gestes pour gérer des serveurs, des JVMs, des services applicatifs, et cela en fonction de l’OS)
– Gestion des incidents N1 & N2 (Mettre en œuvre les actions nécessaires pour rétablir les services ou identifier les bonnes escalades)
– Rédiger et maintenir les consignes nécessaires liées à son domaine d’intervention.
– Réaliser des analyses proactives et sur incidents de la disponibilité des infras et applis. (Analyse, synthétisation, plan d’action, force de proposition…)
-> Savoir créer des tableaux de bord de suivi dans nos différents outils en autonomie et les utiliser (Zabbix, Dynatrace, ServiceNow, graphana, Maitrise d’Excel et des statistiques – stats tableau croisé dynamique…)
-> Collecter / Analyser les métriques de supervision et permettre le traitement des signaux faibles pour éviter la survenance d’incidents. (Pour améliorer les consignes, diminuer les incidents, les récurrences…)
-> S’inscrire dans le processus de gestion des problèmes pour remonter les dysfonctionnements techniques ou fonctionnelles (Amélioration continue).
-> Mettre en œuvre / organiser la déclinaison de monitors de supervision en fonction du besoin.
– Participation active aux cellules de crise en sachant mettre en évidence une dérive. (Présentation, explication, contribution au plan d’action)
– Participation à des projets pour décliner le volet Exploitation (DEX, Observabilité, Monitoring)
– Participer au PCI et assurer le déroulement des opérations de bascule en suivant les procédures.
– Réaliser les interventions planifiées dans son domaine de compétences (Livraisons HO et HNO, contribution aux changements relances d’applications ou d’environnements, Observabilité, livraison (Correctifs, Cycle Court, Mep Majeur) …)
– Assurer le support technique du Centre de Service pilotage du site distant et faciliter les remontées et les réponses aux besoins pour ces acteurs.
– Suivi des indicateurs et des écarts dans le cadre du Centre de Service Pilotage.
– Rédiger et maintenir les procédures pour le Centre de Service du pilotage.
Une connaissance sérieuse des systèmes d’exploitation Windows Server, Linux est indispensable pour pouvoir suivre nos applications fonctionnant sur différentes technologie ( JVMs , Apache, Tomcat, Wildfly, Openshift… CF ci-dessous)
AIX aussi mais à moindre échelle.
Utilisation forte des outils de supervision technique. Il faut savoir les utiliser. (Zabbix, Dynatrace ou Appdynamics, Service Now, ELK (graphana))
Aisance dans la communication Orale et écrite.
Dans le cadre de cette mission une connaissance sur le Mainframe serait un plus (MVS, TSA, AS400, ou encore de l’outil TOPx, ).
Sinon réversibilité et montée en compétence à organiser.
En cible,
– Suivre la disponibilité des environnements mainframe et intervenir dans le cadre des IPL, redémarrages, et interventions. (reprise manuelle, application de consigne, déblocage…) (TSA)
– Surveillance des ressources en production et hors production, assurer la disponibilité et le bon fonctionnement.
Compétences requises :
– OS : Windows Server 2003 à 2019 / Linux RedHat CENTOS / Unix (AIX)
– Pack Office dont Excel (stats tableau croisé dynamique), Confluence, PowerBi
– ServiceNow , Event, Splunk
– Serveurs Physique, VMWARE
– Websphere Application Serveur, publication Citrix, Wildfly, Openshift, MQ Series…
– Outils de supervision : Dynatrace, Zabbix, Event, Selenium, ELK, Graphana …