Como os líderes de TI aumentam a proatividade em suas organizações com a observabilidade

Minerar dados de desempenho para insights podem fazer a diferença para obter resultados positivos nos negócios

alert-management.jpg
Principais conclusões
  • A observabilidade pode ajudar a converter sua organização de TI de reativa em proativa
  • Identificar problemas antes que eles surjam evita que o usuário tenha uma experiência insatisfatória
  • Um sinal em tempo real ajuda a melhorar a métrica de MTTR (tempo médio até a resolução)

Na língua franca da arquitetura de TI moderna, latência é a metáfora perfeita para uma empresa que não responde. Se a latência de uma organização é problemática, as equipes de operações estão sempre um passo atrás, reagindo aos eventos em vez de antecipá-los. 

Mas isso não precisa ficar assim. 

Por exemplo, a Wells Fargo, uma multinacional de serviços financeiros com sede em São Francisco, Califórnia, percebeu que, para mensurar o desempenho de suas diversas aplicações, eles precisavam de uma solução moderna de observabilidade e APM. Eric Chho, vice-presidente de engenharia da Wells Fargo, é responsável por fornecer observabilidade para as várias equipes de aplicações na ampla organização de TI da Wells. Chho diz que “ser capaz de mensurar os sinais de ouro [da melhoria na disponibilidade das aplicações e da redução da latência] é o que melhorará a experiência do cliente de forma geral”.

“Em última análise, como dizem, ‘os dados são o novo petróleo’”, reflete Chho. “Temos toda essa matéria-prima, mas não conseguimos processá-la rápido o suficiente. É por isso que a busca é tão importante. Ser bom ou rápido depende da sua capacidade de explorar [os dados].”

“Ter visibilidade econômica em todo o ambiente, nas aplicações e em uma stack de infraestrutura multinuvem é um requisito de missão crítica”, diz Sajai Krishnan, gerente-geral do Observability na Elastic. “Os executivos não querem ouvir sobre os problemas dos clientes nas redes sociais — eles querem resolver possíveis pontos problemáticos de forma proativa.”

Converter as operações de TI de reativas em proativas começa com o estabelecimento de uma solução de observabilidade para ingerir e analisar os dados de telemetria recebidos. Uma plataforma de observabilidade pode gerar alertas automaticamente quando  anomalias são detectadas. A mineração desse fluxo de dados de desempenho permite que a TI atinja metas estratégicas, como a redução do tempo médio até a resolução e cinco noves (99,999%) na disponibilidade dos sistemas. O monitoramento proativo pode descobrir e ajudar a prevenir problemas antes que eles afetem os usuários finais — uma preocupação em particular para um provedor altamente utilizado que utiliza uma plataforma de CDN.

Ação proativa com dados

O gerenciamento de alertas faz a diferença. 

Muitos sistemas de monitoramento não conseguem acompanhar adequadamente o crescimento exponencial dos fluxos de dados de desempenho provenientes de nuvens, serviços, redes, Internet das Coisas e sistemas distintos. Embora o uso de várias ferramentas de monitoramento de desempenho possa funcionar para algumas organizações, a Wells Fargo precisava ter a capacidade de analisar dados sem instituir um formato unificado ou rotear os dados para soluções isoladas.

“Engajamento é fundamental”, diz Chho. “Não podemos simplesmente criar a tecnologia e esperar que as pessoas a adotem. Trabalhamos com uma abordagem de parceria entre os grupos para entender os casos de uso e onde há benefícios.” Para atingir o “ponto de inflexão” em que o usuário da observabilidade passa a trabalhar com autoatendimento, o gerenciamento de alertas é um recurso fundamental para reduzir o atrito e aumentar a adoção. “Como podemos tornar nossos desenvolvedores produtivos o mais rápido possível?” é no que Chho pensa constantemente ao gerenciar a solução de observabilidade da Wells Fargo. “Basicamente, quero sair do caminho e fornecer [esses serviços] de maneira automatizada.”

O teste é uma forma de as organizações agirem de forma proativa, geralmente testando jornadas do usuário como busca de produtos, finalização de compra ou até mesmo login básico. Os sistemas de observabilidade podem ajudar as organizações a identificar a origem de problemas como desempenho abaixo do esperado em aplicações B2B fornecidas como SaaS (por exemplo, verificações de crédito). Identificar problemas com antecedência (e receber notificações instantâneas) ajuda a evitar que experiências insatisfatórias do usuário se transformem em déficits de receita.

As equipes de operações também podem se tornar proativas analisando tendências de dados de desempenho ao longo do tempo. A automatização de um processo como o monitoramento do desempenho da aplicação de CRM pode evitar que as equipes de operações precisem analisar manualmente os relatórios do dashboard. Se uma aplicação não atende aos objetivos de nível de serviço, a observabilidade pode ajudar as equipes de operações a identificar rapidamente a origem do problema.

Redução do tempo até a resolução

Em outro exemplo, para a Jaguar Land Rover, construir uma plataforma de observabilidade significava obter dados críticos de gestão de ciclo de vida do produto e criar alertas para manter a linha de produtos funcionando tão bem quanto um Jaguar E-type. 

“Um aspecto fundamental no desempenho dos nossos veículos e linhas de produção é a qualidade dos dados disponíveis para nossas equipes de liderança e engenheiros”, diz Andy Walker, gerente de projetos sênior da Jaguar Land Rover. “A quantidade é imensa, e esses dados precisam ser precisos e completos, além de estarem disponíveis em um instante.”

A Jaguar Land Rover implantará o Elastic para gerar relatórios sobre a eficiência e a utilização dos ativos de fabricação e tecnologia, incluindo ferramentas licenciadas no valor de centenas de milhões de dólares, infraestrutura (incluindo armazenamento de dados) e equipamentos de fabricação. O sistema enviará alertas proativamente quando forem detectadas anomalias nos dados. 

Para alcançar uma solução proativa, é necessário ter uma compreensão em tempo real do que está acontecendo no seu sistema. 

“A diferença entre monitoramento e observabilidade é a diferença entre um monitor de pressão arterial e um dispositivo vestível conectado a analítica na nuvem”, diz Krishnan da Elastic. “É a analítica em tempo real que pode ser usada para fazer perguntas sobre grandes volumes de dados. Para uma organização, essa solução de observabilidade precisa ter a capacidade de acompanhar economicamente seu crescimento.”

Assista ao webinar sob demanda — Tendências de observabilidade em 2022: um olhar para o futuro