PM-Metriken: Outcome statt Output, North Star und Frühindikatoren (B2B SaaS)
Ich habe das QBR durchgesessen, in dem der PM vierzehn in Q3 ausgelieferte Features präsentiert. Neuer Onboarding-Flow. Bulk-Edit. SAML. Drei Integrationen. Zwei neue Dashboards. Mobile-Parität für die Deal-Pipeline. Die Folie ist eine schöne Matrix grüner Häkchen. Alle nicken.
Dann lehnt sich der CEO vor und stellt eine Frage: "Hat sich die Kundenbindung bewegt?"
Stille. Der PM blickt zum Analysten, der zum Data Engineer blickt, der zum Boden blickt. Schließlich sagt jemand: "Wir glauben schon, aber die Kohorte ist noch nicht vollständig ausgereift." Der CEO schreibt etwas in sein Notizbuch. Der Raum weiß Bescheid.
Dieser PM wurde nicht gefeuert. Er bekam etwas Schlimmeres. Er wurde still aus dem nächsten Strategiegespräch entfernt. Sechs Monate später wird seine Roadmap von Sales mitgeschrieben, weil das Produkt nicht beweisen kann, dass seine Arbeit zählt.
Das ist die Lücke zwischen Output und Outcome, und die meisten PMs landen auf der falschen Seite davon. Nicht, weil sie faul sind. Weil Output fotogen ist und Outcomes es nicht sind.
Cagans Rahmung: Output ist, was Sie ausliefern, Outcome ist, was sich ändert
Marty Cagan trommelt das seit fünfzehn Jahren, und die meisten von uns verstehen es immer noch falsch.
Output ist alles, was Sie in einer Sprint-Demo sehen können. Ausgelieferte Features. Geschlossene Tickets. Abgearbeitete Story Points. Getaggte Releases. Es ist zählbar, wöchentlich und lebt in Jira, wo jeder Stakeholder es sehen kann.
Outcome ist, was sich im Kundenverhalten oder in der Geschäftsleistung wegen dieses Outputs verändert hat. Die Aktivierungsrate ist von 38 % auf 51 % gestiegen. Die NRR hielt durch eine Preiserhöhung hindurch bei 112 %. Die Zeit bis zum ersten Deal sank von 9 Tagen auf 4. Die Accounts des Deal-Pipeline-Pods loggen sich jetzt 3,2-mal pro Woche ein statt 1,8.
Output ist ein Substantiv auf einer Folie. Outcome ist ein Verb im Leben eines Kunden.
PMs greifen aus einem Grund standardmäßig zum Output: Es ist das Einzige, das an einem Freitag zuverlässig beobachtbar ist. Sie haben diesen Sprint sieben Dinge ausgeliefert, hier sind die sieben Dinge, hier sind die Screenshots. Outcome braucht 30, 60, manchmal 90 Tage, um aufzutauchen, und die Kausalkette ist unsauberer ("hat sich die Aktivierung wegen des neuen Flows bewegt oder weil Q3 einfach ein Quartal mit hoher Intention ist?"). Wenn Sie gestresst sind und das Deck am Montag fällig ist, greifen Sie nach dem Zählbaren.
Der Haken: Das Zählbare ist nicht das, wofür Ihr CEO Sie bezahlt. Er bezahlt für Verhaltensänderung. Solange Ihre Folie das nicht widerspiegelt, sind Sie ein Delivery Manager mit einem schickeren Titel.
Die 5 Outcome-Metriken, die im B2B SaaS wirklich standhalten
Sie brauchen keine 47 Metriken. Sie brauchen fünf, explizit definiert, je nach Takt wöchentlich oder monatlich aktualisiert und von der Finanzabteilung anerkannt.
1. Aktivierungsrate. Der Prozentsatz neuer Accounts, die das "Aha"-Ereignis Ihres Produkts innerhalb von N Tagen nach der Anmeldung erreichen. Der schwere Teil ist, das Ereignis zu definieren, nicht es zu messen. Für ein CRM ist "3 Deals innerhalb von 14 Tagen erstellt" ein verteidigbares Aha. Es bedeutet, dass der Kunde tatsächlich seine Pipeline eingebracht hat. Für ein Projektmanagement-Tool funktioniert "5 Aufgaben über 2 Projekte hinweg mit 1 anderen Zuständigen als dem Ersteller". Wählen Sie das Ereignis, schreiben Sie es auf, verteidigen Sie es ein Quartal lang, bevor Sie es ändern. Aktivierung unter 40 % im B2B SaaS ist ein Leck. Über 60 % ist selten und schützenswert.
2. Kundenbindung. Zwei Ausprägungen, und Sie brauchen beide. Gross Revenue Retention (GRR) misst, was Sie von bestehenden Accounts vor jeder Expansion behalten haben. Typischerweise sind 85 bis 92 % im Mid-Market-SaaS gesund, und alles unter 80 % ist ein Abwanderungsproblem. Logo-Retention misst den Prozentsatz der Accounts, die Sie nicht verloren haben, unabhängig von der Vertragsgröße. Verfolgen Sie beide nach Kohorte (Anmeldemonat oder -quartal), damit Sie sehen können, ob neuere Kohorten gesünder sind als alte. Wenn Ihre Q1-Kohorte besser hält als Ihre Q3-Kohorte, hat das Team, das dazwischen ausgeliefert hat, echte Arbeit geleistet.
3. Expansion. Net Revenue Retention (NRR) ist die Schlagzeilen-Zahl. Nehmen Sie den Umsatz einer Kohorte von vor 12 Monaten, schauen Sie, was dieselbe Kohorte heute generiert (nach Abwanderung und nach Expansion), und teilen Sie. Über 110 % im B2B SaaS ist gut, über 120 % ist großartig, über 130 % bedeutet, dass Sie etwas gefunden haben, das die meisten Unternehmen nicht haben. Kombinieren Sie es mit Expansion-ARR pro Account, damit Sie sehen können, ob der durchschnittliche Kunde wächst oder ob Sie ein paar Wale haben, die den Durchschnitt nach oben ziehen.
4. NPS oder CSAT. Nachlaufend, richtungsweisend, nützlich als Stolperdraht. NPS läuft dem realen Verhalten um 60 bis 90 Tage hinterher. Bis er fällt, ist der Schaden in Ihrer Abwanderungs-Pipeline bereits angerichtet. Steuern Sie nicht damit. Nutzen Sie ihn, um eine Geschichte zu bestätigen, die Sie bereits in Kundenbindung und Expansion sehen. Wenn der NPS um 8 Punkte fällt und die Kundenbindung in Ordnung ist, haben Sie ein Wahrnehmungsproblem. Wenn der NPS um 8 Punkte fällt und die Kundenbindung ebenfalls, haben Sie ein Produktproblem und hätten früher davon wissen müssen.
5. Umsatz pro Nutzer (oder pro Account). ARPU oder ARPA, über die Zeit verfolgt. Das sauberste Signal dafür, dass Ihr Produkt für seine Kunden wertvoller wird. Wenn die Aktivierung steigt, die Kundenbindung steigt, aber ARPU flach ist, haben Sie eine klebrigere Gratis-Stufe gebaut und nicht viel mehr. Wenn ARPU steigt und die Kundenbindung hält, tut das Produkt, was ein Produkt tun soll.
Diese fünf zusammen decken die Reise des Kunden durch Ihr Produkt ab: Hat er angefangen, es zu nutzen (Aktivierung), ist er geblieben (Kundenbindung), ist er gewachsen (Expansion), mochte er es genug, um es weiterzuempfehlen (NPS), und hat er mehr ausgegeben (ARPU). Alles, was Sie außerhalb dieser fünf messen, sollte im Dienst stehen, eines davon zu erklären.
Der North Star: einer pro Pod, nicht einer pro Unternehmen
Amplitude hat "die North-Star-Metrik" als eine einzige Zahl popularisiert, um die sich ein Unternehmen organisiert. Daily Active Users für eine Consumer-App. Gebuchte Nächte für Airbnb. Abgespielte Songs für Spotify.
Für B2B SaaS in der Series A oder B bricht einer-pro-Unternehmen zusammen. Ein CRM-Pod, ein Billing-Pod und ein Reporting-Pod erledigen völlig unterschiedliche Aufgaben. Sie zu zwingen, sich einen North Star zu teilen, verwandelt ihn in eine vage Metrik auf Unternehmensebene wie "wöchentlich aktive Accounts", nach der niemand tatsächlich steuert.
Die Lösung: ein North Star pro Pod. Die eine Metrik, die, wenn sie sich bewegt, bedeutet, dass Ihr Pod dieses Quartal seine Aufgabe erfüllt hat. Beispiele, die ich funktionieren gesehen habe:
- CRM-Aktivierungs-Pod → % der neuen Accounts mit 3+ erstellten Deals in den ersten 14 Tagen
- Lead-Routing-Pod → % der qualifizierten Leads, die in unter 5 Minuten an einen Rep geroutet werden
- Onboarding-Pod → % der Accounts, die die Setup-Checkliste innerhalb von 7 Tagen abschließen
- Reporting-Pod → wöchentlich aktive Dashboard-Betrachter pro zahlendem Account
- Mobile-Pod → % der wöchentlich aktiven Nutzer, die sich in einer beliebigen Woche mobil einloggen
Jeder ist spezifisch. Jeder ist eine Zahl. Jeder kann von dem Team bewegt werden, das ihn verantwortet, ohne mit einem anderen Team über die Zurechnung zu streiten. Das ist der Test. Wenn zwei Pods beide die Anerkennung beanspruchen können, wenn sich die Metrik bewegt, ist es kein North Star, sondern eine Outcome-Metrik auf Unternehmensebene.
Der North Star auf Pod-Ebene ist nicht der North Star des Unternehmens. Das Unternehmen kümmert sich weiterhin um die NRR. Aber der Pod kümmert sich um die vorlaufende Sache, die die NRR für die Customer Journey treibt, die er verantwortet.
Früh- vs. Spätindikatoren: Sie können nicht mit einer Metrik steuern, die 90 Tage braucht
Jede Metrik, die ich bisher genannt habe, liegt irgendwo auf dem Spektrum von nachlaufend zu vorlaufend, und Sie müssen wissen, wo.
Spätindikatoren sagen Ihnen, was bereits passiert ist. NPS läuft um 60 bis 90 Tage hinterher. Kundenbindung läuft um ein Quartal oder mehr hinterher. Expansion-ARR läuft dem Vertragszyklus hinterher. Bis diese sich bewegen, wurde die Arbeit, die sie bewegt hat, vor zwei Quartalen erledigt. Sie steuern nicht mit ihnen. Sie obduzieren mit ihnen.
Frühindikatoren bewegen sich von Woche zu Woche und sagen die nachlaufende Metrik voraus. Die Aktivierungsrate ist ein Frühindikator für die Kundenbindung (Accounts, die aktiviert wurden, halten besser, Punkt). Der Abschluss der Setup-Checkliste ist ein Frühindikator für die Aktivierung. Time-to-Value ist ein Frühindikator für den Abschluss des Setups. Das Support-Ticket-Volumen bei einem neu gelaunchten Feature ist ein Frühindikator dafür, ob dieses Feature Abwanderung treiben oder haften wird.
Die Regel, nach der ich lebe: Koppeln Sie jede nachlaufende Metrik mit einem oder zwei Frühindikatoren, denen Sie zutrauen, sie vorherzusagen. Wenn Ihr North Star die Kundenbindung ist und das Einzige, was Sie messen, die Kundenbindung ist, fliegen Sie 90 Tage am Stück blind. Wenn Ihr North Star die Kundenbindung ist und Sie auch die Aktivierungsrate wöchentlich verfolgen, wissen Sie in Woche 2 von einem Problem statt in Woche 14.
Für jede der fünf Outcome-Metriken hier die Frühindikatoren, die das Verfolgen wert sind:
- Aktivierung → Abschlussquote der Setup-Checkliste, Time-to-First-Key-Action, % der Accounts mit 2+ Nutzern in Woche 1
- Kundenbindung → wöchentlich aktive Nutzer pro Account, Breite der Feature-Adoption (wie viele Features jeder Account berührt), Support-Ticket-Volumen pro Account
- Expansion → Seat-Auslastung %, % der Accounts bei 80 %+ des Plan-Limits, Feature-Anfragen zu Premium-Tier-Features
- NPS → Support-Antwortzeit, Time-to-Resolution, % der beim Erstkontakt gelösten Tickets
- ARPU → Impression-to-Click-Rate von Upgrade-Prompts, % der Accounts, die in den letzten 30 Tagen auf eine Paywall gestoßen sind
Sie werden nicht alle davon verfolgen. Sie werden einen oder zwei Frühindikatoren pro Outcome-Metrik wählen, sie aufschreiben und wöchentlich prüfen. Die Disziplin zählt mehr als die konkrete Auswahl.
Den Metrikbaum verdrahten
Ein Metrikbaum ist das sichtbare Artefakt, das sagt "So verbindet sich die Arbeit unseres Pods mit dem Geschäft". North Star ganz oben, 3 bis 4 Treibermetriken darunter, Frühindikatoren unter jedem Treiber. Aufgezeichnet könnte der CRM-Aktivierungs-Pod so aussehen:
NORTH STAR: % of new accounts with 3+ deals created in 14 days
├── DRIVER 1: Setup checklist completion rate
│ ├── Leading: Time to first deal created
│ └── Leading: % of accounts inviting a 2nd user in week 1
├── DRIVER 2: Onboarding email engagement (open + CTA click)
│ ├── Leading: Day-3 email open rate
│ └── Leading: Day-7 reply rate to "stuck?" email
├── DRIVER 3: First-week support ticket volume
│ ├── Leading: % of tickets tagged "setup confusion"
│ └── Leading: Median time-to-resolution on setup tickets
└── DRIVER 4: % of accounts with sales-team intro call scheduled
├── Leading: Calendly link click rate from welcome email
└── Leading: No-show rate on intro calls
Drei Dinge sind an diesem Baum wichtig. Erstens speist jeder Treiber den North Star mit einer klaren Kausalgeschichte (besserer Setup-Abschluss → mehr Accounts, die in 14 Tagen 3 Deals erreichen). Zweitens ist jeder Frühindikator unter einem Treiber etwas, das Sie morgen aus Ihrem Tooling ziehen können, ohne ein Data-Engineering-Projekt. Drittens passt das Ganze auf eine Seite.
Tooling, nach Kategorie:
- Frühindikatoren (Event-Daten): Amplitude oder Mixpanel. Das Produktanalyse-Tool verfolgt die Events auf Nutzerebene, aus denen sich Ihre Frühindikatoren zusammensetzen.
- Outcome-Metriken (Warehouse-Daten): Snowflake oder BigQuery für das Warehouse, Looker oder Metabase für das Dashboard. Outcome-Metriken umfassen Umsatz, Verträge und Joins auf Kundenebene, die nicht im Produktanalyse-Tool leben.
- Die Metrik-Definitionen selbst: ein einziges Notion-Dokument, vom PM verantwortet, von der Entwicklung lesbar. Keine Wiki-Seite, die veraltet. Ein lebendiges Dokument, in dem die Definition des Aktivierungs-Events neben dem SQL steht, das es berechnet. Wenn Ihr Eng-Team die Definition der Aktivierung nicht in 30 Sekunden finden kann, sind Ihre Metriken nicht real.
Der Fehler, den ich Junior-PMs machen sehe: diesen Baum einmal bauen, ihn bei einem All-Hands präsentieren und nie aktualisieren. Der Baum sollte jedes Quartal überprüft werden. Treibermetriken, die den North Star nicht bewegen, werden gestrichen. Neue Frühindikatoren werden hinzugefügt, wenn Sie sie entdecken.
Die QBR-Folie, die einer Prüfung standhält
Eine Folie. Hier die Struktur:
PRODUCT QBR : Q3 : CRM ACTIVATION POD
NORTH STAR: % of new accounts with 3+ deals in 14 days
Q2: 38% → Q3: 51% (+13 pts)
DRIVER METRICS (Q-over-Q):
• Setup checklist completion: 44% → 67%
• Onboarding email CTA click: 12% → 19%
• Week-1 support ticket volume per account: 1.8 → 1.1
LEADING INDICATORS THAT EXPLAIN WHY:
• Time-to-first-deal: 6.2 days → 2.8 days
(driven by new setup flow shipped wk 3 of Q3)
• Day-7 active users per account: 1.4 → 2.1
(invite-2nd-user prompt added wk 5)
BUSINESS CONTEXT:
• NRR held at 112% (no Q-over-Q change)
• Activation→retention correlation: activated accounts
retain 89% vs 61% for non-activated cohort
Das ist die ganze Folie. Die während des Quartals ausgelieferten Features (der neue Onboarding-Flow, der Invite-Prompt, das umgeschriebene E-Mail) gehören in einen Anhang. Sie sind Kontext, nicht die Schlagzeile.
Der Grund, warum diese Folie die Frage des CEO übersteht, ist, dass sie die Frage beantwortet, bevor er sie stellt. "Hat die Arbeit etwas gebracht?" Ja. Die Aktivierung ging von 38 % auf 51 %. Hier sind die drei Treiber. Hier ist der Frühindikator, der beweist, dass der neue Flow es verursacht hat. Und übrigens sagt Ihnen die Aufteilung von 89 % zu 61 % bei der Kundenbindung, warum die Aktivierung die richtige Sache ist, von der man besessen sein sollte.
Wenn Ihr VP diese Folie in 20 Sekunden lesen, in das Büro des CEO gehen und die Geschichte ohne Notizen nacherzählen kann, haben Sie es getroffen. Wenn er Sie im Raum braucht, um zu übersetzen, ist die Folie nicht fertig.
Die "Wir haben 14 Features ausgeliefert"-Falle und wie man herauskommt
Folien mit Feature-Zählungen fühlen sich sicher an. Sie sind zählbar. Sie beweisen, dass Sie beschäftigt waren. Sie geben der Entwicklung die Anerkennung, was den Eng-Manager glücklich hält. Sie sehen nach Arbeit aus.
Sie killen auch die PM-Glaubwürdigkeit auf einer 12-Monats-Zeitachse. Hier die Rechnung: Ihr CEO war vielleicht bei 20 PM-QBRs in seiner Karriere. Beim dritten hat er aufgehört zu fragen "Was habt ihr ausgeliefert" und angefangen zu fragen "Was hat sich für den Kunden geändert". Wenn Ihre Folien weiterhin die erste Frage beantworten, sind Sie der PM, an dessen Arbeit sich der CEO nicht ganz erinnern kann, wenn Beförderungsgespräche anstehen.
Herauszukommen ist ein Ein-Gespräch-Problem und ein Zwei-Quartal-Umsetzungsproblem.
Das Gespräch ist mit Ihrem VP, idealerweise bevor das nächste Quartal beginnt. Es klingt so: "Ich möchte ändern, wie wir nächstes Quartal über Fortschritt berichten. Hier ist der Metrikbaum für unseren Pod. Hier ist die QBR-Folienvorlage, die ich verwenden werde. Die Features, die wir ausgeliefert haben, wandern in einen Anhang. Ich berichte weiterhin, was wir gebaut haben, aber die Schlagzeile wird sein, was sich für den Kunden geändert hat. Kann ich deine Einschätzung zu den Metrik-Definitionen bekommen, bevor ich es ins Team trage?"
Zwei Dinge passieren. Erstens: Ihr VP bekommt den Entwurf eines besseren PM, und er erinnert sich an das Gespräch. Zweitens: Sie legen sich schriftlich fest. Sie können nicht drei Wochen später still zu Feature-Zählungs-Folien zurückrutschen, wenn sich der Metrikbaum schwer anfühlt.
Das Umsetzungsproblem sind die nächsten 6 Monate. Quartal eins wird unangenehm. Sie erscheinen bei einem QBR mit einer Outcome-Folie, und einer der Treiber wird flach oder rückläufig sein, und Sie müssen das durchsprechen, statt sich hinter 14 grünen Häkchen zu verstecken. Quartal zwei haben Sie einen Q-zu-Q-Vergleich, und das Gespräch wird einfacher. Bis Quartal drei ist Ihre Folie die Folie, die andere PMs still vor ihren eigenen QBRs als Screenshot speichern.
Was Sie diese Woche tun sollten
Warten Sie nicht auf das nächste Quartal. Tun Sie das in den nächsten 10 Tagen.
- Wählen Sie den North Star Ihres Pods. Ein Satz, eine Metrik. Wenn Sie das nicht an einem Nachmittag schaffen, ist Ihr Scope zu breit und Sie haben ein anderes Problem.
- Schreiben Sie die 3 Treibermetriken darunter. Jede mit einer spezifischen Definition (nicht "Engagement", sondern "% der wöchentlich aktiven Nutzer, die Key-Action X abschließen").
- Finden Sie die 2 Frühindikatoren pro Treiber, die Sie morgen aus Amplitude oder Mixpanel ziehen können. Wenn Sie sie morgen nicht ziehen können, hat Ihr Tooling eine Lücke, die ein eigenes Ticket wert ist.
- Packen Sie alles in ein Notion-Dokument. Eine Seite. Metrikbaum oben, Definitionen und SQL-Abfragen darunter.
- Schicken Sie das Dokument an Ihren Vorgesetzten und bitten Sie um eine Runde Widerspruch vor dem nächsten QBR. Bitten Sie nicht um Freigabe. Bitten Sie um die eine Definition, mit der er streiten würde. Was auch immer er anficht, ist die Metrik, die Ihr Eng-Team am ehesten ebenfalls falsch interpretiert. Beheben Sie es vor dem QBR, nicht währenddessen.
Der PM, der Outcomes berichtet, selbst unvollkommen, schlägt den PM, der Outputs perfekt berichtet. Output-Reporting ist die sicherer wirkende, karrierebegrenzende Wahl. Sie können dieselbe Feature-Zählungs-Folie noch drei Jahre lang bauen und still zusehen, wie Sie aus dem Strategiegespräch hinausdriften, oder Sie können zwei unangenehme Quartale damit verbringen, umzustellen, und von da an Vertrauen mit Zinseszins aufbauen.
Fangen Sie dieses Quartal an. Der Metrikbaum muss nicht perfekt sein. Er muss nur existieren.
Mehr erfahren

Principal Product Marketing Strategist
On this page
- Cagans Rahmung: Output ist, was Sie ausliefern, Outcome ist, was sich ändert
- Die 5 Outcome-Metriken, die im B2B SaaS wirklich standhalten
- Der North Star: einer pro Pod, nicht einer pro Unternehmen
- Früh- vs. Spätindikatoren: Sie können nicht mit einer Metrik steuern, die 90 Tage braucht
- Den Metrikbaum verdrahten
- Die QBR-Folie, die einer Prüfung standhält
- Die "Wir haben 14 Features ausgeliefert"-Falle und wie man herauskommt
- Was Sie diese Woche tun sollten
- Mehr erfahren