Monitoramento de servidores: uma importante ferramenta para atingir os SLAs de infraestrutura e as expectativas dos usuários

26*Por Emerson Dorrow

Contar com serviços de TI funcionando ininterruptamente e com ótima performance é o mínimo esperado pelos usuários. Entretanto, esse “mínimo” não é simples de ser obtido, já que depende de uma série de fatores que, juntos, se tornam complexos, como recursos financeiros, pessoas, hardware, software, conhecimento, processos, entre outros.

O custo da indisponibilidade, então, pode impactar em uma venda que não pôde ser feita, atraso em entregas, retrabalhos e custos que comprometem o resultado dos negócios, afinal, o tempo que passou não pode mais ser recuperado, e isto gera custos para a empresa.

Só para se ter uma ideia, uma forma simples, mas não única, de calcular o custo de uma indisponibilidade é:

Custo da indisponibilidade = qtd usuários impactados x custo/médio/hora x horas de indisponibilidade.

Do ponto de vista da TI, a infraestrutura é um ambiente complexo que precisa ser gerenciado e que envolve uma série de tecnologias que interagem entre si. Muitos eventos ocorrem no dia-a-dia e são transparentes para os usuários, como backups, gargalos no uso de recursos de servidores, ajustes na performance do banco de dados, tentativas de acesso não autorizados, entre outros. Há também eventos que não podem ser evitados e, se ainda não existem planos para reestabelecer os serviços o mais rápido possível dentro do orçamento previsto, estes têm de ser elaborados com urgência.

Para alinhar as expectativas dos usuários e garantir os recursos financeiros para atendê-las, é comum as áreas de TI acordarem com clientes internos níveis de serviço, mais conhecidos como Acordos de Nível de Serviço, ou SLA (sigla em inglês). Os indicadores mais comuns utilizados no mercado hoje são disponibilidade e tempos para solução de incidentes. Um incidente é uma interrupção ou perda de desempenho dos serviços de TI. Quanto mais rápido um incidente for resolvido, maior a chance do nível de serviço ser atingido.

É caríssimo construir um serviço de TI (quase) livre de falhas. Quanto maior a disponibilidade desejada, maior é o arranjo de infraestrutura necessária (hardware, software, pessoas, fornecedores, instalações físicas) e maior o custo. Fora os grandes compradores de TI, nos quais se justifica o investimento de milhões de dólares ao ano neste tipo de estrutura (como o caso de bancos, por exemplo), fica inviável para o mercado em geral adquirir e manter uma estrutura com custo tão alto.

A redução dos custos para prover os serviços de TI e evitar indisponibilidades não planejadas passa pela prevenção e, uma das formas mais simples de prevenir e que traz grandes resultados, é o monitoramento de servidores.

O monitoramento de servidores dá à área de TI informações sobre o uso dos recursos, tendências de utilização e alertas que precisam ser analisados com urgência, antecipando ações que precisam ser realizadas para manter os serviços de TI funcionais antes que o usuário final seja afetado. Aqui podemos fazer um paralelo com um cockpit de um avião. O avião tem uma série de sensores que avisam sobre condições do tempo, níveis de combustível, velocidade, altura, problemas em algum componente, entre outros. Estas informações são muito importantes para acompanhar a performance do voo e possibilitar que ações sejam tomadas a tempo pelos pilotos (ou até automaticamente) antes que aconteçam complicações. Portanto, manter uma infraestrutura sem monitoramento é o mesmo que pilotar um avião sem os seus sensores. O risco de incidentes aumenta consideravelmente e se perde a capacidade de antever as situações e tomar ações no momento correto.

Como diz o ditado, é melhor prevenir do que remediar. É muito mais barato. Remediar, além do custo da indisponibilidade, prejudica a imagem da TI e também da empresa. Uma operação estável dá credibilidade à TI e permite que ela tenha mais foco em atividades que gerem valor ao negócio. Com isso, todos ganham.

E você, caro leitor? Você tem o pleno controle da sua infraestrutura de TI? Você consegue hoje agregar valor ao negócio? Ou ainda passa seus dias apagando incêndios?

*Emerson Dorrow é coordenador de Suporte na Senior, referência nacional em softwares para gestão.

Fonte: Senior