Modelos de Health Score: Diseñando Scoring Efectivo de Salud del Cliente

Una empresa SaaS rastreaba la salud del cliente usando un modelo simple: verde si iniciaban sesión ese mes, amarillo si no lo hacían, rojo si no habían iniciado sesión en dos meses.

El problema: Su tasa de churn era del 15%, pero solo predecían el 40% de los clientes que abandonaron. Peor aún, el 30% de sus clientes "verdes" abandonaron de todos modos.

El VP de Customer Success preguntó: "¿Por qué nuestro health score es tan malo prediciendo algo?"

Profundizaron en los datos y encontraron:

  • La frecuencia de login por sí sola era básicamente inútil para predecir retención
  • No estaban midiendo calidad de engagement, profundidad de relación o si los clientes realmente veían valor
  • Cada señal tenía el mismo peso, aunque algunas importaban mucho más que otras
  • Perdían patrones de declive porque solo miraban el mes actual
  • Un enfoque único significaba que clientes enterprise y SMB se puntuaban idénticamente

Así que reconstruyeron su health score desde cero:

  • Múltiples dimensiones: uso, engagement, sentimiento, relación, valor
  • Scoring ponderado basado en lo que realmente predecía retención (uso 35%, engagement 20%, etc.)
  • Seguimiento de tendencias y momentum—porque la dirección importa tanto como el score mismo
  • Modelos diferentes para diferentes segmentos (enterprise vs SMB tienen líneas base "saludables" diferentes)
  • Validación trimestral contra resultados reales de renovación

Seis meses después:

  • Predijeron el 82% de clientes que abandonaron (desde el 40%)
  • Los falsos positivos cayeron 60% (muchas menos cuentas saludables marcadas como en riesgo)
  • La tasa de éxito de intervención saltó 45% (porque actuaban sobre señales reales, no ruido)
  • Identificaron 25 oportunidades de expansión que habrían perdido antes

La lección: No todos los health scores son iguales. Construir uno que realmente funcione requiere diseño cuidadoso, validación continua y voluntad de seguir refinándolo.

Fundamentos del Health Score

Propósito y Casos de Uso

Lo Que Realmente Hacen los Health Scores: Un customer health score cuantifica la probabilidad de que un cliente logre sus objetivos, se quede a largo plazo y expanda su relación contigo. Esa es la teoría. En la práctica, es tu respuesta a "¿Debería preocuparme por esta cuenta?"

Aquí es donde realmente los usarás:

Priorización CSM:

  • ¿Qué cuentas necesitan que deje todo y las llame ahora mismo?
  • ¿Dónde debería pasar mi tiempo limitado hoy?
  • ¿Qué cuentas están bien con check-ins trimestrales?

Gestión de Riesgo:

  • ¿Qué clientes podrían abandonar si no hago algo?
  • ¿Qué tan malo es—alerta amarilla o alerta roja?
  • ¿Necesito intervenir esta semana o puede esperar?

Identificación de Oportunidades:

  • ¿Qué cuentas están listas para una conversación de expansión?
  • ¿Dónde puedo impulsar adopción más profunda sin ser molesto?
  • ¿Quién está lo suficientemente feliz para convertirse en cliente de referencia?

Forecasting:

  • ¿Cómo se ve nuestra tasa de retención el próximo trimestre?
  • ¿Cuántos ingresos podrían irse?
  • ¿Qué hay realísticamente en nuestro pipeline de expansión?

Reporting Ejecutivo:

  • Salud general del portafolio (el dashboard que los ejecutivos realmente miran)
  • Cómo están las tendencias mes a mes
  • Si nuestras iniciativas funcionan o solo estamos ocupados

Tipos de Health Scores

Tienes tres sabores básicos de health scores, y se construyen uno sobre otro en complejidad.

Health Scores Descriptivos: Estos te dicen dónde están las cosas ahora mismo. "Este cliente está saludable" o "este está en riesgo." Miran comportamiento reciente y métricas actuales. Aquí es donde empiezan la mayoría de empresas, y donde muchas se quedan.

Ejemplo: La cuenta XYZ tiene 75% de usuarios activos, asistió a su último QBR y dio un NPS de 8. Health score: 78 (Saludable). Snapshot simple de dónde están hoy.

Health Scores Predictivos: Estos intentan decirte hacia dónde van las cosas. "Este cliente probablemente abandonará en 90 días según su trayectoria actual." Miran patrones y tendencias a lo largo del tiempo. Necesitas datos históricos decentes para lograrlo.

Ejemplo: El uso de la cuenta XYZ está declinando 30% mensual. Ahora están en un "moderado" 65, pero si haces los números, llegarán a 42 (En Riesgo) en 90 días. ¿El insight? Intervén ahora mientras todavía tienes relación, no cuando ya tienen un pie fuera.

Health Scores Prescriptivos: Estos te dicen qué hacer al respecto. "Este cliente necesita re-onboarding, aquí está el playbook." Comparan patrones de cuentas similares para recomendar acciones específicas. Este es el enfoque más sofisticado y usualmente necesita machine learning o un equipo de data science muy bueno.

Ejemplo: La cuenta XYZ tiene un health score de 58. Tu sistema detecta que cuentas con patrones similares mejoraron 12-15 puntos después de una campaña dirigida de adopción de features. Acción recomendada: Lanzar el mismo playbook para esta cuenta.

¿Cuál deberías construir? Empieza con descriptivo—es tu fundación. Agrega predictivo una vez que tengas suficientes datos históricos para detectar patrones. Solo construye prescriptivo si tienes recursos de data science y suficientes cuentas para hacer los patrones significativos.

Componentes y Dimensiones del Score

Aquí están las dimensiones que la mayoría de empresas rastrean, aproximadamente en orden de cuánto importan:

1. Uso del Producto y Adopción (peso 30-40%)

  • Usuarios activos (tanto el número bruto como porcentaje de licencias que están pagando)
  • Frecuencia de login
  • Amplitud de features (cuántos features realmente usan)
  • Profundidad de features (¿son power users o solo rascan la superficie?)
  • Tendencias de uso (creciendo, plano o declinando)

Por qué importa: El uso predice retención mejor que cualquier otra cosa. Los clientes que usan tu producto se quedan. Los clientes que no están ya a medio camino de irse.

2. Engagement y Actividad (peso 15-25%)

  • Qué tan seguido tu CSM habla con ellos
  • Si se presentan a QBRs
  • Asistencia a training y webinars
  • Involucramiento en comunidad
  • Email engagement (aperturas, clicks, respuestas)
  • Qué tan rápido responden cuando los contactas

Por qué importa: Los clientes engaged han invertido tiempo y energía en la relación. Los clientes disengaged están a un email competitivo de cambiar.

3. Relación y Sentimiento (peso 15-25%)

  • ¿Tienen un executive sponsor?
  • ¿Hay un champion identificado y está todavía engaged?
  • Scores de NPS y CSAT
  • Sentimiento de feedback (¿están felices o frustrados?)
  • Fortaleza de relación (el feeling del CSM, cuantificado)
  • Cobertura de stakeholders (¿a cuántas personas conoces ahí?)

Por qué importa: Las relaciones fuertes sobreviven bugs de producto y aumentos de precio. Las relaciones débiles no sobreviven casi nada.

4. Soporte y Resolución de Issues (peso 10-15%)

  • Volumen de tickets de soporte
  • Severidad de issues (emergencias P1 vs preguntas menores)
  • Cuánto tardan en resolver issues
  • Ratings de satisfacción de soporte
  • Escalaciones

Por qué importa: Muchos tickets serios significa que o el producto no encaja o tienes problemas de calidad. Un historial de soporte limpio usualmente significa navegación suave.

5. Resultados de Negocio y Valor (peso 10-20%)

  • Objetivos logrados (los que te contaron durante el proceso de ventas)
  • ROI demostrado (¿pueden señalar impacto real?)
  • Casos de uso expandidos (empezaron con ventas, ahora marketing lo usa también)
  • Milestones de valor alcanzados
  • Métricas de impacto de negocio que realmente les importan

Por qué importa: Los clientes que ven valor claro renuevan. Los clientes que no pueden articular ROI son vulnerables al momento de renovación.

6. Financiero y Comercial (peso 5-10%)

  • Historial de pagos (a tiempo vs consistentemente tarde)
  • Estado del contrato
  • Historial de expansión
  • Señales de presupuesto (¿acaban de anunciar despidos?)

Por qué importa: Los pagos tardíos a menudo predicen churn. La expansión pasada usualmente señala satisfacción.

Ponderación y Métodos de Cálculo

Cómo Descubrir los Pesos Correctos:

No adivines. Aquí está cómo hacerlo correctamente:

Paso 1: Profundiza en Tus Datos Históricos Ejecuta análisis de correlación entre cada dimensión y retención real. Esto te muestra qué realmente predice si los clientes se quedan.

Ejemplo de Análisis:

  • Correlación de dimensión de uso con retención: 0.72 (predictor fuerte)
  • Correlación de dimensión de engagement: 0.48 (predictor moderado)
  • Correlación de dimensión de sentimiento: 0.35 (débil a moderado)
  • Correlación de dimensión financiera: 0.18 (predictor débil)

Paso 2: Pondera Basado en Poder Predictivo Da más peso a dimensiones que realmente predicen retención. No trates todo igual solo porque se siente justo.

Ejemplo de Ponderación:

  • Uso: 35% (predictor más fuerte recibe más peso)
  • Engagement: 25%
  • Valor: 20%
  • Relación: 15%
  • Financiero: 5% (predictor débil recibe peso mínimo)

Paso 3: Pruébalo y Ajusta Ejecuta tu modelo ponderado contra resultados históricos. Si no es preciso, ajusta y prueba nuevamente. Este no es un ejercicio de una sola vez.

Ejemplo de Cálculo:

Dimensión Peso Score Bruto (0-100) Score Ponderado
Uso 35% 80 28.0
Engagement 25% 70 17.5
Valor 20% 75 15.0
Relación 15% 60 9.0
Financiero 5% 90 4.5
Total 100% 74.0

Health Score Final: 74 (Moderado)

Estableciendo Rangos y Umbrales de Score

Rangos Estándar de Health Score:

Saludable (75-100):

  • Uso y engagement fuertes
  • Sentimiento positivo
  • La retención se ve sólida
  • Probablemente listos para conversaciones de expansión
  • Qué hacer: Mantén la relación cálida, busca oportunidades de expansión, pide referencias

Moderado (50-74):

  • Aceptable pero podría ser mejor
  • Algunas brechas en uso o engagement que necesitan atención
  • Probablemente renovarán, pero no es seguro
  • Qué hacer: Ejecuta iniciativas de mejora proactivas, arregla las brechas específicas que ves

En Riesgo (25-49):

  • Uso bajo o declinante
  • Engagement o relación débil
  • La retención está genuinamente en riesgo aquí
  • Qué hacer: Deja todo, intervén ahora, arma un plan de salvamento, escala si es necesario

Crítico (0-24):

  • Apenas usando el producto o completamente inactivo
  • Zero engagement
  • Probablemente van a abandonar a menos que hagas un milagro
  • Qué hacer: Escalación ejecutiva, esfuerzo de salvamento con todos

Diferentes Segmentos Necesitan Diferentes Umbrales:

No todos los clientes son iguales. Lo que es "saludable" para un cliente enterprise podría ser preocupante para un cliente SMB.

Clientes Enterprise:

  • Saludable: 70+ (productos complejos tardan una eternidad en implementarse)
  • En Riesgo: <50
  • Por qué: Los clientes enterprise tienen curvas de adopción largas. Uso más bajo temprano no significa que están infelices—significa que todavía están logrando que 5 departamentos acuerden un flujo de trabajo.

Clientes SMB:

  • Saludable: 80+ (productos más simples, adopción más rápida)
  • En Riesgo: <60
  • Por qué: Los clientes SMB deberían estar funcionando rápido. Si no lo están, algo está mal.

Tus umbrales deberían reflejar tus datos reales y cómo se comportan diferentes segmentos.


¿Listo para construir tu modelo de health score? Empieza con customer health monitoring, implementa early warning systems y rastrea retention metrics.

Aprende más: