Português

Métricas de EM: Velocidade de Entrega, Qualidade, Retenção, Contratação

Turn this article into takeaways for your work.

Each assistant summarizes the article only for you and suggests best practices for your work.

Na primeira vez que entrei em um QBR com um gráfico de story points, meu VP me deixou falar por cerca de noventa segundos antes de dizer: "Camellia, qual é sua rotatividade lamentável? E a frequência de implantação? Esqueça os pontos."

Eu não tinha nenhum dos dois números. Tinha um gráfico de barras lindamente colorido de velocidade de entrega por sprint e um slide intitulado "Q3 Vazão +18%." Nada disso sobreviveu ao contato com a pergunta. Ele não estava sendo rude. Estava sendo honesto. A camada executiva estava financiando resultados. Eu havia trazido atividade. Não estávamos falando a mesma língua, e a conversa sobre orçamento que se seguiu foi tão calorosa quanto você esperaria.

Essa reunião mudou como gerencio dashboards. Este guia é o dashboard que eu gostaria de ter tido: seis métricas, faixas de números reais, diagnósticos nomeados, um slide para o QBR. Nada mais, porque mais é como a lei de Goodhart te come.

Por Que Resultados Superam Vazão

Métricas de vazão, story points, tickets fechados, linhas de código, horas registradas, medem atividade. Atividade é o que sua equipe fez. Resultados são o que a empresa obteve. A camada executiva financia resultados: velocidade de entrega, confiabilidade, durabilidade da equipe, vazão de contratação. Se você não consegue traduzir o trabalho da sua equipe nesses quatro baldes, vai ser cortado das conversas sobre quadro de pessoal e não vai ver isso chegando até o congelamento de ofertas aparecer na sua caixa de entrada.

Há uma segunda razão. Métricas de vazão são fáceis de manipular sem que ninguém tenha intenção. Diga a uma equipe que você mede tickets fechados e dentro de um trimestre você terá tickets menores. Diga que mede story points e dentro de dois trimestres você terá inflação que envergonharia um banco central. Métricas de resultado são mais difíceis de manipular porque estão ligadas à realidade. O deploy aconteceu ou não, o engenheiro ficou ou saiu, a oferta foi aceita ou recusada.

Portanto: seis métricas. Quatro para entrega e confiabilidade, duas para saúde do time. Esse é o conjunto.

Frequência de Implantação

Com que frequência o código da sua equipe chega à produção? Diária, semanal, mensal ou menos. Esta é a primeira métrica DORA e o sinal mais limpo de se seu pipeline de entrega é de fato um pipeline ou uma série de portas trancadas com chaves manuais.

Nível alvo por maturidade da equipe:

Nível Frequência de implantação O que geralmente significa
Elite Sob demanda (várias por dia) trunk-based, feature flags, CI maduro
Alta Diária a semanal Equipe saudável, CI razoável, algumas barreiras manuais
Média Semanal a mensal Trem de releases, atrelado ao sprint, risco em lote
Baixa Mensal ou menos Releases em big bang, cadência baseada em medo

A maioria das equipes de produto deveria estar no nível Alta. Se você está no nível Médio e o trabalho justifica (setor regulamentado, longos ciclos de QA), diga isso no slide. Se você está no nível Baixo e é uma equipe SaaS, isso é um achado, não um número.

Tempo de Entrega de Mudanças

Tempo do commit à produção. Esta é a segunda métrica DORA e a que te diz onde o gargalo realmente está. Horas, dias ou semanas.

Quando você mede isso e decompõe, geralmente encontra um de três culpados: revisão de código (PR fica aberto dois dias esperando um sênior que está em reuniões), CI (suite de testes leva 47 minutos e falha uma em cada cinco vezes) ou barreira de deploy (aprovação manual que vive no calendário de alguém). Escolha o mais longo e corrija. Não tente corrigir os três de uma vez.

Faixas saudáveis por tipo de equipe:

  • Equipe de produto, aplicativo web: menos de 24 horas, idealmente menos de 8.
  • Equipe de plataforma, infraestrutura: menos de 48 horas.
  • Equipe mobile: 3 a 7 dias, limitado pela revisão da loja de aplicativos.

Se seu tempo de entrega é de duas semanas e sua frequência de implantação é diária, algo está matematicamente errado. Você está ou implantando principalmente mudanças triviais enquanto as grandes apodrecem, ou contando errado. Investigue antes de colocar o slide no ar.

Taxa de Falhas em Mudanças

Percentual de deploys que causam um rollback, hotfix ou incidente em produção. A terceira métrica DORA. A faixa alvo é de 0 a 15%, com equipes saudáveis situadas em 5 a 10%.

Duas coisas para observar. Primeiro, taxa de falhas em mudanças de zero é um sinal de alerta, não de excelência. Geralmente significa que sua equipe está testando excessivamente, implantando com muito pouca frequência ou subcontando incidentes. Segundo, esta métrica tem um piso natural. Software é difícil, humanos entregam bugs, e uma taxa de 2% é ruído, não sinal de declínio. Não persiga o último ponto percentual ao custo da velocidade de entrega.

Quando a taxa de falhas em mudanças ultrapassa 15%, o diagnóstico é quase sempre um de: cobertura de testes insuficiente em caminhos críticos, um processo de release que agrupa coisas demais (fazendo as falhas ficarem entrelaçadas) ou novas contratações entregando em produção antes de entenderem o raio de impacto. Nomeie qual. Não os dissolva em uma média.

MTTR

Tempo médio para restauração. Quando algo quebra em produção, quanto tempo leva até voltar a funcionar? Horas, não dias. Esta é a quarta métrica DORA e a mais ligada à higiene de plantão.

Um bom MTTR fica abaixo de 4 horas para um produto SaaS. Abaixo de 1 hora para equipes de elite. O truque é que MTTR não é realmente sobre quão rápido você consegue escrever uma correção. É sobre quão rápido você consegue detectar, diagnosticar e implantar. A maior parte dos MTTRs lentos que já depurei vinha de um de três lugares: alertas que não dispararam (então a equipe ficou sabendo da interrupção por um cliente), runbooks que não existiam (então o engenheiro de plantão estava descobrindo do zero) ou um pipeline de deploy que leva 90 minutos (então mesmo depois que a correção foi escrita, você espera).

Se o MTTR está subindo, verifique a carga de plantão. Engenheiros de plantão esgotados são engenheiros de plantão lentos. Esta é a métrica onde frequência de implantação, taxa de falhas em mudanças e saúde do time se tocam.

Rotatividade Lamentável de 12 Meses

A primeira das duas métricas de saúde do time, e a que seu VP mais se importa.

Rotatividade lamentável conta apenas as pessoas que você queria manter. Se um colaborador de baixo desempenho sai, isso não é lamentável. Se um engenheiro de nível médio estável que nunca criou ondas sai e você dá de ombros, isso não é lamentável. Se um IC sênior, um tech lead ou um júnior de alta trajetória sai, isso é lamentável. Seja honesto consigo mesmo quando rotula. Os gestores tendem a decidir retroativamente que todo mundo que saiu "não era o perfil certo", que é como você acaba com 0% de rotatividade lamentável e uma equipe que está na metade do caminho para fora.

Baselines do setor para tecnologia, 2026:

  • Saudável: 8 a 12% anual.
  • Zona de atenção: 13 a 15%.
  • Alarme: acima de 15%.
  • Alarme cinco estrelas: acima de 20%.

Acompanhe em base de rolagem de 12 meses, não por trimestre civil. Números trimestrais têm muito ruído em equipes pequenas. Se você tem oito engenheiros e uma saída lamentável no Q2, isso é 12,5%: aceitável em base de rolagem, assustador em um gráfico trimestral.

Taxa de Aceitação de Ofertas Mais Tempo de Adaptação

A segunda métrica de saúde do time, e a que te diz se sua equipe consegue crescer.

Duas submétricas, uma linha no slide. Taxa de aceitação de ofertas: das ofertas que você estendeu no último trimestre, qual percentual foi aceito? A meta é 70% ou mais. Abaixo de 60% significa que suas ofertas não são competitivas (geralmente remuneração, às vezes título, ocasionalmente a história que você conta).

Tempo de adaptação: da data de início até o primeiro PR não trivial mesclado em produção, quantos dias? Meta abaixo de 30. Se seu novo contratado médio leva 60 dias para entregar algo real, sua integração está quebrada ou seu codebase é um labirinto. De qualquer forma, isso é um achado.

Ambos os números juntos contam a história da contratação. Alta taxa de aceitação, adaptação rápida: o motor de contratação funciona. Alta taxa de aceitação, adaptação lenta: você vende bem, integra mal. Baixa taxa de aceitação, adaptação rápida: quando as pessoas entram, prosperam, mas você não consegue fechar. Baixa taxa de aceitação, adaptação lenta: o motor está quebrado em ambas as pontas.

NPS de Engenharia

Pesquisa de pulso trimestral, uma pergunta: "Você recomendaria esta equipe a outro engenheiro?" Escala de zero a dez. Subtraia os detratores (0 a 6) dos promotores (9 a 10), ignore os passivos (7 a 8). O resultado fica entre -100 e +100.

Equipes de engenharia saudáveis pontuam 30 a 50. Acima de 50 é ótimo. Abaixo de 20 é um aviso. Negativo é um incêndio que já começou; você só ainda não viu a fumaça.

Aplique na mesma semana todo trimestre. Anônimo. Sempre inclua um follow-up aberto: "Qual é a coisa que moveria sua pontuação para cima em um ponto?" Leia cada resposta. O número é o título; os comentários são o diagnóstico.

O Diagnóstico de "Alta Velocidade de Entrega, Alta Rotatividade"

Aqui está o arquétipo que pega a maioria dos EMs de surpresa. A frequência de implantação é alta. A taxa de falhas em mudanças é baixa. O tempo de entrega é excelente. O MTTR é sólido. Pelas quatro métricas DORA, a equipe está entregando como campeã.

E a rotatividade lamentável está subindo. O NPS de engenharia está caindo. Pessoas que você queria manter estão saindo.

A equipe está entregando o caminho para fora da empresa.

Vivi isso exatamente uma vez. Fazíamos 60 deploys por mês, taxa de falhas em mudanças de 4%, MTTR abaixo de 90 minutos, e perdi três engenheiros em um trimestre, dois deles seniores. O dashboard de métricas estava mentindo por omissão. A verdade apareceu nas entrevistas de desligamento: "Estou cansado." "Não cresci em 18 meses." "Meu amigo em uma concorrente ganha 30% a mais pelo mesmo trabalho."

Geralmente há três causas, e elas costumam se acumular:

  1. Esgotamento. Alta velocidade de entrega é sustentável por um trimestre, às vezes dois. Depois disso, você está tomando emprestado do futuro da equipe.
  2. Defasagem salarial. O mercado se moveu, suas faixas não, e seus seniores sabem disso porque recebem mensagens no LinkedIn toda terça-feira.
  3. Sem trajetória de crescimento. As pessoas ficaram enquanto estavam aprendendo. Uma vez que o codebase pareceu pequeno, foram procurar um maior.

Nomeie a causa no slide. Não a dissolva em um genérico "as pessoas estão saindo, trabalharemos no engajamento." Essa frase nunca salvou uma equipe.

Métricas de Vaidade Para Parar de Reportar

A lei de Goodhart: quando uma medida se torna uma meta, deixa de ser uma boa medida. Toda métrica desta lista, incluindo as seis acima, é vulnerável. Mas essas quatro são vulneráveis o suficiente para que você as retire completamente:

  • Story points completados. Inflação garantida. Incentiva histórias menores enquadradas como maiores. Não diz nada sobre o que chegou à produção.
  • Tickets fechados. Mesmo problema, scorecard diferente. Incentiva a multiplicação de tickets.
  • Linhas de código. Uma medida de digitação, não de engenharia. Penaliza exclusões, que geralmente são os melhores PRs.
  • Horas registradas. Mede presença, não resultado. Pune pais e recompensa mensagens noturnas performáticas no Slack.

Substitua-os. Story points e tickets se tornam frequência de implantação e tempo de entrega. Linhas de código se tornam taxa de falhas em mudanças. Horas registradas se tornam NPS de engenharia, porque se sua equipe está saudável e entregando, você não precisa contar horas.

O Slide para o QBR

Um slide, seis linhas de métricas, três colunas: atual, meta, seta de tendência. Adicione uma frase de diagnóstico por linha. Esse é o formato.

Layout de exemplo:

Métrica Atual Meta Tendência Diagnóstico
Frequência de implantação 12/semana Diária cima Melhorias de CI entraram em março; trunk-based funcionando
Tempo de entrega 31 horas Menos de 24h estável A fila de revisão é o gargalo; pilotando auto-atribuição no Q2
Taxa de falhas em mudanças 7% Menos de 10% estável Faixa saudável; processo de entrega de novas contratações está funcionando
MTTR 2,4 horas Menos de 4h baixo Cobertura de runbook chegou a 80% neste trimestre
Rotatividade lamentável (12 meses) 14% Menos de 12% cima Duas saídas seniores Q1; revisão de remuneração e auditoria de trajetória de crescimento em andamento
NPS de Engenharia 38 40+ estável Carga de plantão é a principal reclamação nas respostas abertas

Seis linhas. Seis diagnósticos. Sem story points. Sem gráfico de velocidade de entrega escondido em um apêndice. Se um número está ruim, diga claramente e nomeie o que está fazendo a respeito. VPs confiam nos EMs que nomeiam problemas mais rápido do que o VP teria identificado. Desconfiam dos EMs que escondem.

O Que Pedir ao Seu VP

Feche o QBR com uma pergunta, não uma rodada de vitória. Pergunte quais dois dos seis indicadores mais importam para a empresa neste trimestre, e qual faixa de meta seria considerada uma vitória.

Tentar otimizar os seis de uma vez é como você não consegue nada. Uma equipe que está trabalhando na velocidade de entrega não está também trabalhando na vazão de contratação, e uma equipe que está trabalhando em contratação vai ter uma queda temporária no tempo de entrega enquanto seniores entrevistam candidatos em vez de revisar PRs. Escolha dois. Consiga alinhamento nas metas. Repita a pergunta no próximo trimestre.

Se seu VP disser "os seis", gentilmente contrarie. Diga: "Se eu precisasse sub-investir em dois deles neste trimestre para investir totalmente em outros dois, quais dois devo priorizar menos?" Essa pergunta quase sempre obtém uma resposta real, porque força uma troca para o campo aberto.

Esta é a versão do QBR que eu deveria ter entrado na primeira vez. Seis métricas. Números reais. Diagnósticos nomeados. Um slide. O gráfico de story points fica na gaveta onde pertence.

Saiba Mais

About the author

Camellia

Camellia

Principal Product Marketing Strategist

Camellia is Principal Product Marketing Strategist at Rework, helping B2B buyers pick the right software with confidence. With 6+ years in product marketing and 150+ SaaS tools evaluated across CRM, project management, and sales engagement, Camellia turns competitive intelligence into clear, honest comparisons. Readers get vendor evaluations they can trust to cut through marketing noise and decide faster.