Español

Métricas de PM: resultado frente a producción, North Star e indicadores adelantados (B2B SaaS)

Turn this article into takeaways for your work.

Each assistant summarizes the article only for you and suggests best practices for your work.

He aguantado el QBR donde el PM presenta catorce funcionalidades enviadas en el Q3. Nuevo flujo de onboarding. Edición masiva. SAML. Tres integraciones. Dos dashboards nuevos. Paridad móvil para el pipeline de tratos. La diapositiva es una hermosa matriz de marcas verdes. Todos asienten.

Luego el CEO se inclina hacia adelante y hace una pregunta: "¿Se movió la retención?".

Silencio. El PM mira al analista, que mira al ingeniero de datos, que mira al suelo. Alguien finalmente dice: "Creemos que sí, pero la cohorte aún no está del todo madura". El CEO escribe algo en su libreta. La sala lo sabe.

A ese PM no lo despidieron. Le pasó algo peor. Lo apartaron en silencio de la siguiente conversación de estrategia. Seis meses después su roadmap lo coescribe ventas, porque producto no puede demostrar que su trabajo importa.

Esta es la brecha entre producción y resultado, y la mayoría de los PMs caen en el lado equivocado de ella. No porque sean perezosos. Porque la producción es fotogénica y los resultados no lo son.

El encuadre de Cagan: la producción es lo que envía, el resultado es lo que cambia

Marty Cagan lleva quince años insistiendo en esto y la mayoría seguimos equivocándonos.

Producción es todo lo que puede ver en una demo de sprint. Funcionalidades enviadas. Tickets cerrados. Story points consumidos. Versiones etiquetadas. Es contable, semanal, y vive en Jira donde toda parte interesada puede verlo.

Resultado es lo que cambió en el comportamiento del cliente o en el rendimiento del negocio a causa de esa producción. La tasa de activación se movió del 38% al 51%. El NRR se mantuvo en 112% a pesar de una subida de precio. El tiempo hasta el primer trato bajó de 9 días a 4. Las cuentas del pod del pipeline de tratos ahora inician sesión 3,2 veces por semana en lugar de 1,8.

La producción es un sustantivo en una diapositiva. El resultado es un verbo en la vida de un cliente.

Los PMs recurren por defecto a la producción por una razón: es lo único que se observa de forma fiable un viernes. Envió siete cosas este sprint, aquí están las siete cosas, aquí están las capturas de pantalla. El resultado tarda 30, 60, a veces 90 días en aflorar, y la cadena causal es más confusa ("¿se movió la activación por el nuevo flujo, o porque el Q3 es simplemente un trimestre de alta intención?"). Cuando está estresado y la presentación vence el lunes, recurre a lo contable.

El problema: lo contable no es por lo que le paga su CEO. Le paga por el cambio de comportamiento. Hasta que su diapositiva refleje eso, usted es un gerente de entregas con un título más elegante.

Las 5 métricas de resultado que de verdad aguantan en B2B SaaS

No necesita 47 métricas. Necesita cinco, definidas explícitamente, refrescadas semanal o mensualmente según la cadencia, y en las que finanzas confíe.

1. Tasa de activación. El porcentaje de cuentas nuevas que alcanzan el evento "ajá" de su producto dentro de N días tras el registro. La parte difícil es definir el evento, no medirlo. Para un CRM, "3 tratos creados en 14 días" es un ajá defendible. Significa que el cliente ha movido de verdad su pipeline al producto. Para una herramienta de gestión de proyectos, "5 tareas creadas en 2 proyectos con 1 asignado distinto del creador" funciona. Elija el evento, anótelo, defiéndalo durante un trimestre antes de cambiarlo. Una activación por debajo del 40% en B2B SaaS es una fuga. Por encima del 60% es raro y vale la pena protegerlo.

2. Retención. Dos variantes, y necesita ambas. Gross revenue retention (GRR) mide lo que conservó de las cuentas existentes antes de cualquier expansión. Lo típico es que del 85 al 92% sea sano en SaaS de mercado medio, y cualquier cosa por debajo del 80% es un problema de churn. Retención de logos mide el porcentaje de cuentas que no perdió, sin importar el tamaño del contrato. Rastree ambas por cohorte (mes o trimestre de registro) para poder ver si las cohortes nuevas son más sanas que las antiguas. Si su cohorte del Q1 retiene mejor que su cohorte del Q3, el equipo que envió entre ambas hizo trabajo de verdad.

3. Expansión. El net revenue retention (NRR) es el número estrella. Tome los ingresos de una cohorte de hace 12 meses, mire lo que esa misma cohorte genera hoy (después del churn y después de la expansión), divida. Por encima del 110% en B2B SaaS es bueno, por encima del 120% es excelente, por encima del 130% significa que ha encontrado algo que la mayoría de las empresas no. Empareje esto con el ARR de expansión por cuenta para poder ver si el cliente promedio está creciendo o si tiene unas pocas ballenas tirando del promedio hacia arriba.

4. NPS o CSAT. Rezagado, direccional, útil como alarma. El NPS se retrasa respecto al comportamiento real entre 60 y 90 días. Para cuando cae, el daño ya se ha hecho en su pipeline de churn. No dirija con él. Úselo para confirmar una historia que ya está viendo en la retención y la expansión. Si el NPS cae 8 puntos y la retención está bien, tiene un problema de percepción. Si el NPS cae 8 puntos y la retención también cae, tiene un problema de producto y necesitaba saberlo antes.

5. Ingresos por usuario (o por cuenta). ARPU o ARPA, rastreado a lo largo del tiempo. La señal más limpia de que su producto se está volviendo más valioso para sus clientes. Si la activación sube, la retención sube, pero el ARPU está plano, ha construido un nivel gratuito más adictivo y poco más. Si el ARPU está subiendo y la retención se mantiene, el producto está haciendo lo que se supone que un producto debe hacer.

Estas cinco juntas cubren el recorrido del cliente a través de su producto: ¿empezaron a usarlo (activación), se quedaron (retención), crecieron (expansión), les gustó lo suficiente para recomendarlo (NPS), y gastaron más (ARPU). Cualquier cosa que mida fuera de estas cinco debería estar al servicio de explicar una de ellas.

La North Star: una por pod, no una por empresa

Amplitude popularizó "la métrica North Star" como un único número en torno al cual se organiza una empresa. Usuarios activos diarios para una app de consumo. Noches reservadas para Airbnb. Canciones reproducidas para Spotify.

Para B2B SaaS en Serie A o B, una por empresa se desmorona. Un pod de CRM, un pod de facturación, y un pod de reportes hacen trabajos completamente distintos. Forzarlos a compartir una North Star la convierte en una métrica vaga a nivel de empresa como "cuentas activas semanales" que en realidad nadie usa para dirigir.

La solución: una North Star por pod. La única métrica que, si se mueve, significa que su pod hizo su trabajo este trimestre. Ejemplos que he visto funcionar:

Pod de activación de CRM → % de cuentas nuevas con 3+ tratos creados en los primeros 14 días
Pod de enrutamiento de leads → % de leads cualificados enrutados a un representante en menos de 5 minutos
Pod de onboarding → % de cuentas que completan la checklist de configuración en 7 días
Pod de reportes → espectadores activos semanales de dashboards por cuenta de pago
Pod de móvil → % de usuarios activos semanales que inician sesión desde móvil en una semana cualquiera

Cada una es específica. Cada una es un único número. Cada una puede moverla el equipo que es su dueño sin discutir con otro equipo sobre la atribución. Esa es la prueba. Si dos pods pueden ambos reclamar el crédito cuando la métrica se mueve, no es una North Star, es una métrica de resultado a nivel de empresa.

La North Star a nivel de pod no es la North Star de la empresa. A la empresa todavía le importa el NRR. Pero al pod le importa lo adelantado que impulsa el NRR para el recorrido del cliente del que es dueño.

Indicadores adelantados frente a rezagados: no puede dirigir con una métrica que tarda 90 días

Cada métrica que he nombrado hasta ahora está en algún punto del espectro de rezagado a adelantado, y tiene que saber dónde.

Los indicadores rezagados le dicen lo que ya pasó. El NPS se retrasa entre 60 y 90 días. La retención se retrasa un trimestre o más. El ARR de expansión se retrasa según el ciclo del contrato. Para cuando estos se mueven, el trabajo que los movió se hizo hace dos trimestres. No dirige con ellos. Hace autopsias con ellos.

Los indicadores adelantados se mueven semana a semana y predicen la métrica rezagada. La tasa de activación es un indicador adelantado de la retención (las cuentas que se activaron retienen mejor, punto). La finalización de la checklist de configuración es un indicador adelantado de la activación. El tiempo hasta el valor es un indicador adelantado de la finalización de la configuración. El volumen de tickets de soporte sobre una funcionalidad recién lanzada es un indicador adelantado de si esa funcionalidad va a impulsar el churn o va a cuajar.

La regla por la que me rijo: empareje cada métrica rezagada con uno o dos indicadores adelantados en los que confíe para predecirla. Si su North Star es la retención y lo único que mide es la retención, vuela a ciegas durante 90 días seguidos. Si su North Star es la retención y también rastrea la tasa de activación semanalmente, sabrá que tiene un problema en la semana 2 en lugar de la semana 14.

Para cada una de las cinco métricas de resultado, aquí están los indicadores adelantados que vale la pena rastrear:

Activación → % de finalización de la checklist de configuración, tiempo hasta la primera acción clave, % de cuentas con 2+ usuarios en la semana 1
Retención → usuarios activos semanales por cuenta, amplitud de adopción de funcionalidades (cuántas funcionalidades toca cada cuenta), volumen de tickets de soporte por cuenta
Expansión → % de utilización de asientos, % de cuentas al 80%+ del límite del plan, solicitudes de funcionalidades sobre funcionalidades del nivel premium
NPS → tiempo de respuesta de soporte, tiempo hasta la resolución, % de tickets resueltos en el primer contacto
ARPU → tasa de impresión a clic de los prompts de upgrade, % de cuentas que llegaron a un paywall en los últimos 30 días

No va a rastrear todos estos. Va a elegir uno o dos indicadores adelantados por métrica de resultado, anotarlos, y revisarlos semanalmente. La disciplina importa más que las elecciones específicas.

Cómo cablear el árbol de métricas

Un árbol de métricas es el artefacto visible que dice "así es como el trabajo de nuestro pod se conecta con el negocio". La North Star en la cima, de 3 a 4 métricas impulsoras debajo, indicadores adelantados bajo cada impulsora. Dibujado, el pod de activación de CRM podría verse así:

NORTH STAR: % de cuentas nuevas con 3+ tratos creados en 14 días
├── IMPULSORA 1: Tasa de finalización de la checklist de configuración
│   ├── Adelantado: Tiempo hasta el primer trato creado
│   └── Adelantado: % de cuentas que invitan a un 2.º usuario en la semana 1
├── IMPULSORA 2: Engagement con emails de onboarding (apertura + clic en CTA)
│   ├── Adelantado: Tasa de apertura del email del día 3
│   └── Adelantado: Tasa de respuesta del día 7 al email "¿atascado?"
├── IMPULSORA 3: Volumen de tickets de soporte en la primera semana
│   ├── Adelantado: % de tickets etiquetados como "confusión en la configuración"
│   └── Adelantado: Tiempo mediano hasta la resolución en tickets de configuración
└── IMPULSORA 4: % de cuentas con llamada de presentación del equipo de ventas agendada
    ├── Adelantado: Tasa de clics en el enlace de Calendly desde el email de bienvenida
    └── Adelantado: Tasa de ausencias en las llamadas de presentación

Tres cosas importan sobre este árbol. Primero, cada impulsora alimenta la North Star con una historia causal clara (mejor finalización de la configuración → más cuentas alcanzando 3 tratos en 14 días). Segundo, cada indicador adelantado bajo una impulsora es algo que puede extraer de su herramienta mañana sin un proyecto de ingeniería de datos. Tercero, todo cabe en una página.

Herramientas, por categoría:

Indicadores adelantados (datos de eventos): Amplitude o Mixpanel. La herramienta de analítica de producto rastrea los eventos a nivel de usuario que componen sus indicadores adelantados.
Métricas de resultado (datos del warehouse): Snowflake o BigQuery para el warehouse, Looker o Metabase para el dashboard. Las métricas de resultado involucran ingresos, contratos, y uniones a nivel de cliente que no viven en la herramienta de analítica de producto.
Las definiciones de las métricas en sí: un único documento de Notion, propiedad del PM, legible por ingeniería. No una página de wiki que se queda obsoleta. Un documento vivo donde la definición del evento de activación vive junto al SQL que lo calcula. Si su equipo de ingeniería no puede encontrar la definición de activación en 30 segundos, sus métricas no son reales.

El error que veo cometer a los PMs junior: construir este árbol una vez, presentarlo en un all-hands, y nunca actualizarlo. El árbol debería revisarse cada trimestre. Las métricas impulsoras que no mueven la North Star se recortan. Se añaden nuevos indicadores adelantados cuando los descubre.

La diapositiva de QBR que aguanta el escrutinio

Una diapositiva. Esta es la estructura:

QBR DE PRODUCTO, Q3, POD DE ACTIVACIÓN DE CRM

NORTH STAR: % de cuentas nuevas con 3+ tratos en 14 días
  Q2: 38%   →   Q3: 51%   (+13 pts)

MÉTRICAS IMPULSORAS (trimestre sobre trimestre):
  • Finalización de la checklist de configuración: 44% → 67%
  • Clic en CTA de emails de onboarding: 12% → 19%
  • Volumen de tickets de soporte de la semana 1 por cuenta: 1,8 → 1,1

INDICADORES ADELANTADOS QUE EXPLICAN POR QUÉ:
  • Tiempo hasta el primer trato: 6,2 días → 2,8 días
    (impulsado por el nuevo flujo de configuración enviado en la sem. 3 del Q3)
  • Usuarios activos del día 7 por cuenta: 1,4 → 2,1
    (prompt de invitar al 2.º usuario añadido en la sem. 5)

CONTEXTO DE NEGOCIO:
  • NRR se mantuvo en 112% (sin cambio trimestre sobre trimestre)
  • Correlación activación→retención: las cuentas activadas
    retienen al 89% frente al 61% de la cohorte no activada

Esa es toda la diapositiva. Las funcionalidades enviadas durante el trimestre (el nuevo flujo de onboarding, el prompt de invitación, la reescritura del email) van en un apéndice. Son contexto, no el titular.

La razón por la que esta diapositiva sobrevive a la pregunta del CEO es que responde la pregunta antes de que la hagan. "¿Importó el trabajo?" Sí. La activación pasó del 38% al 51%. Aquí están las tres impulsoras. Aquí está el indicador adelantado que demuestra que el nuevo flujo lo causó. Y por cierto, la división de retención del 89% frente al 61% le dice por qué la activación es lo correcto con lo que obsesionarse.

Si su VP puede leer esa diapositiva en 20 segundos y entrar a la oficina del CEO y volver a contar la historia sin notas, lo ha clavado. Si lo necesitan a usted en la sala para traducir, la diapositiva no está terminada.

La trampa del "enviamos 14 funcionalidades" y cómo salir de ella

Las diapositivas de recuento de funcionalidades se sienten seguras. Son contables. Demuestran que estuvo ocupado. Dan crédito a ingeniería, lo cual mantiene contento al gerente de ingeniería. Parecen trabajo.

También matan la credibilidad del PM en un horizonte de 12 meses. Esta es la cuenta: su CEO ha estado quizás en 20 QBR de PM en su carrera. Para el tercero, han dejado de preguntar "qué enviaste" y han empezado a preguntar "qué cambió para el cliente". Si sus diapositivas siguen respondiendo la primera pregunta, será el PM cuyo trabajo el CEO no termina de recordar cuando llegan las conversaciones de promoción.

Salir de ella es un problema de una conversación y un problema de ejecución de dos trimestres.

La conversación es con su VP, idealmente antes de que empiece el próximo trimestre. Suena así: "Quiero cambiar cómo reportamos el progreso el próximo trimestre. Aquí está el árbol de métricas de nuestro pod. Aquí está la plantilla de diapositiva de QBR que voy a usar. Las funcionalidades que enviamos pasarán a un apéndice. Seguiré reportando lo que construimos, pero el titular será lo que cambió para el cliente. ¿Puedo conocer tu opinión sobre las definiciones de las métricas antes de llevarlo al equipo?"

Pasan dos cosas. Una: su VP recibe un borrador de un mejor PM, y recuerdan la conversación. Dos: usted se compromete por escrito. No puede volver a deslizarse en silencio hacia las diapositivas de recuento de funcionalidades tres semanas después, cuando el árbol de métricas se sienta difícil.

El problema de ejecución son los próximos 6 meses. El primer trimestre será incómodo. Se presentará a un QBR con una diapositiva de resultados y una de las impulsoras estará plana o a la baja, y tendrá que explicarla en lugar de esconderse tras 14 marcas verdes. El segundo trimestre, tendrá una comparación trimestre sobre trimestre y la conversación se vuelve más fácil. Para el tercer trimestre, su diapositiva es la diapositiva que otros PMs capturan en silencio antes de sus propios QBR.

Qué hacer esta semana

No espere al próximo trimestre. Haga esto en los próximos 10 días.

Elija la North Star de su pod. Una frase, una métrica. Si no puede hacer esto en una tarde, su alcance es demasiado amplio y tiene un problema distinto.
Escriba las 3 métricas impulsoras debajo de ella. Cada una con una definición específica (no "engagement", sino "% de usuarios activos semanales que completan la acción clave X").
Encuentre los 2 indicadores adelantados por impulsora que pueda extraer de Amplitude o Mixpanel mañana. Si no puede extraerlos mañana, su herramienta tiene un hueco que merece un ticket aparte.
Póngalo todo en un documento de Notion. Una página. El árbol de métricas en la cima, las definiciones y las consultas de SQL debajo.
Envíe el documento a su mánager y pida una ronda de objeciones antes del próximo QBR. No pida aprobación. Pida la única definición que ellos rebatirían. Lo que sea que objeten es la métrica que su equipo de ingeniería tiene más probabilidades de malinterpretar también. Arréglela antes del QBR, no durante.

El PM que reporta resultados, aunque sea de forma imperfecta, vence al PM que reporta producción a la perfección. Reportar producción es la opción que se siente más segura y que limita la carrera. Puede seguir construyendo la misma diapositiva de recuento de funcionalidades durante tres años más y verse en silencio derivar fuera de la conversación de estrategia, o puede pasar dos trimestres incómodos haciendo el cambio y componer confianza desde ahí.

Empiece este trimestre. El árbol de métricas no tiene que ser perfecto. Solo tiene que existir.

Más información

About the author

Camellia

Principal Product Marketing Strategist

Camellia is Principal Product Marketing Strategist at Rework, helping B2B buyers pick the right software with confidence. With 6+ years in product marketing and 150+ SaaS tools evaluated across CRM, project management, and sales engagement, Camellia turns competitive intelligence into clear, honest comparisons. Readers get vendor evaluations they can trust to cut through marketing noise and decide faster.

View full profile LinkedIn