FP&A Kennzahlen: Prognosegenauigkeit, Modell-Geschwindigkeit, Business Partner NPS
Turn this article into takeaways for your work.
Each assistant summarizes the article only for you and suggests best practices for your work.
FP&A ist die einzige Finanzfunktion, die sich selbst nicht misst.
Accounting hat den Buchungsabschluss-Tag. Treasury hat DSO und Kapitalfluss-Prognose-Abweichung. Tax hat die effektive Steuerquote und termingerechte Einreichung. Fragen Sie in einem FP&A-Team: "Wie genau war die Umsatz-Prognose des letzten Quartals, auf Positionsebene, auf eine Dezimalstelle genau?" Die meisten können es nicht beantworten. Der erfahrene Analyst, der es kann, zieht die Zahl aus einer Folie, die er sich selbst gebaut hat, nicht aus einem System, das irgendjemand anderes sieht.
Das ist das Problem. Wenn Sie Ihrem Director keinen Trendverlauf Ihrer eigenen Arbeit zeigen können, werden Sie nach Außenwirkung bewertet. Wer am spätesten blieb. Wer die schönste Präsentation gebaut hat. Wer am schnellsten auf die Ad-hoc-Anfrage reagiert hat. Nichts davon ist Output. Das ist Aktivität.
Das ist der Fünf-Kennzahlen-Scorecard, der das ändert. Keine davon ist exotisch, keine erfordert ein neues System, und Sie können alle fünf in sechs Wochen selbst erfassen, bevor irgendjemand sonst eine Zahl sieht.
Warum es sich seltsam anfühlt, sich selbst zu messen (aber keine Option ist)
Die erste Reaktion der meisten Analysten ist: "Wir würden uns damit angreifbar machen." Richtig. Das ist der Punkt.
Jede andere Funktion im Unternehmen hat KPIs, die aufwärts berichtet werden. Sales hat die Quoten-Erreichung. Marketing hat CAC und Pipeline-Abdeckung. Engineering hat Vorfallsrate und Durchlaufzeit. Die einzigen, die ohne öffentlichen Scorecard arbeiten dürfen, sind diejenigen, die über die Scorecards aller anderen berichten. Lesen Sie diesen Satz zweimal.
Wenn Sie Ihren eigenen Output nicht messen, passieren drei Dinge:
- Ihr CFO bewertet Sie nach Bauchgefühl. "Gutes Quartal, Sie haben hart gearbeitet." Bauchgefühl befördert Sie nicht in einem vorhersehbaren Rhythmus.
- Fehler bleiben verborgen. Ein Modell mit einer veralteten Formel liefert weiterhin Prognosen, bis etwas so laut bricht, dass es sich sechs Monate zurückverfolgen lässt.
- Die Funktion wird bei einem Abschwung als erste gestrichen. Funktionen ohne messbaren Output sind am leichtesten zu kürzen, weil niemand quantifizieren kann, was verloren geht.
Selbstmessung ist keine Eitelkeitsübung. Es ist die Art, wie Sie Stunden gegen Glaubwürdigkeit tauschen. Der CFO interessiert sich nicht dafür, dass Sie am Dienstag bis 23 Uhr blieben. Der CFO interessiert sich dafür, ob die Prognose für das nächste Quartal innerhalb von 5% liegen wird.
Kennzahl 1: Prognosegenauigkeit (±5% Umsatz, ±3% OPEX, auf Positionsebene)
Die Hauptkennzahl. Die meisten Teams erfassen diese bereits auf unzureichende Weise.
Die zwei Fehler, die Teams dabei machen:
Falscher Weg 1: Nur auf Gesamtergebnis-Ebene. "Wir lagen innerhalb von 2% des Gesamtumsatzes." Klingt gut. Dahinter stecken +18% im Enterprise-Segment, -15% im SMB-Segment und ein glücklicher FX-Rückenwind, der beides verdeckte. Abweichungen gleichen sich auf Gesamtergebnis-Ebene aus und täuschen Sie. Wenn Ihr Modell beim Segment-Mix falsch liegt, werden Sie weiterhin dieselben falschen Entscheidungen bei Ressourcenzuteilung, Einstellungsplänen und Gebietsabdeckung treffen, und die Gesamtergebnis-Genauigkeit wird Ihnen weiterhin sagen, dass alles in Ordnung ist.
Falscher Weg 2: Abweichung gegenüber Budget statt gegenüber Prognose. Das Budget wurde im Q4 letzten Jahres festgelegt. Nachprognostizieren ist der eigentliche Job. Sich an einer neun Monate alten Zahl zu messen belohnt Sie dafür, langsam falsch zu liegen.
Der richtige Weg: Messen Sie die Prognosegenauigkeit auf Positionsebene, gegen die aktuellste Nachprognose, bei den Kennzahlen, die Entscheidungen treiben. Für ein B2B SaaS-Unternehmen sind das typischerweise:
- Neuer ARR nach Segment (Enterprise / Mid-market / SMB)
- Expansions-ARR
- Brutto-Abwanderungs-ARR
- Personalbestand nach Funktion
- Top-5-OPEX-Positionen (Personalkosten, T&E, Marketing-Programmausgaben, Software, professionelle Dienstleistungen)
Zielwerte, die ich bei mittelgroßen Unternehmen als stabil erlebt habe: ±5% bei Umsatzpositionen, ±3% bei OPEX-Positionen. OPEX sollte enger sein, weil der Großteil davon vertraglich gebunden oder personalbestandsgetrieben ist und Sie die Inputs kontrollieren. Wenn Sie OPEX um 8% verfehlen, fehlt in Ihrem Modell etwas Strukturelles (meistens ein neuer Lieferant, den jemand vergessen hat zu melden, oder ein Einstellungsplan, der sich verschoben hat).
Verfolgen Sie dies monatlich. Plotten Sie einen Trend. Das Ziel ist nicht, vom ersten Tag an jeden Monat ±5% zu treffen, sondern dass die Linie über zwei oder drei Quartale auf den Zielwert zuläuft, während Sie das Modell verbessern.
Kennzahl 2: Modell-Geschwindigkeit / Lieferzeit
Wie schnell kann FP&A aus einer Anfrage ein verwendbares Modell machen.
Zwei Ausprägungen:
Ad-hoc-Anfragen: "Können Sie modellieren, was passiert, wenn wir den SMB-Personalbestand um 20% reduzieren?" Ziel: v1 in weniger als 48 Stunden in den Händen des Anfragers. V1 muss nicht perfekt sein. Sie muss eine Richtung angeben und klar als v1 gekennzeichnet sein. Der Fehler ist, eine Woche warten zu lassen, wenn Sie vier Stunden brauchen, aber sechs Tage in Ihrer Warteschlange steckt.
Neue wiederkehrende Modelle: Ein neues monatliches OPEX-Tracking, ein neuer Provisions-Kalkulator, eine neue Kohortenbindungs-Ansicht. Ziel: innerhalb von 2 Wochen nach Auftragsklärung ausgeliefert. Dauert es länger, verliert der Anfrager das Interesse und fängt an, es selbst in Google Sheets zu bauen, wodurch Sie Shadow-Modelle erhalten, die Ihren widersprechen.
Das Tracking ist einfach. Jede eingehende Anfrage erhält eine Zeile: Anfrager, Anfrage, Auftragsklärungsdatum, v1-Lieferdatum. Stunden bis v1 ist die Kennzahl. Der Median ist nützlicher als der Durchschnitt, weil eine einzige aufwendige Anfrage den Durchschnitt verzerrt und Sie das Muster ignorieren lässt.
Der Grund, warum Geschwindigkeit wichtiger ist, als die meisten denken: Langsames FP&A trainiert das Unternehmen dazu, nicht zu fragen. Wenn ein Sales-Leiter weiß, dass er eine Woche auf ein Modell warten muss, hört er auf zu fragen und trifft die Entscheidung ohne eines. Ihren Platz am Strategie-Tisch verlieren Sie nicht dadurch, falsch zu liegen. Sie verlieren ihn dadurch, so langsam zu sein, dass niemand auf Sie wartet.
Kennzahl 3: Business Partner NPS
Die Kennzahl, die zeigt, ob der Rest des Unternehmens tatsächlich mit Ihnen arbeiten möchte.
Senden Sie Ihren Business Partnern (Sales-, Marketing-, Ops-, Produkt-, CS-Leitern) einmal pro Quartal eine 2-Fragen-Umfrage. Nur zwei Fragen:
- Auf einer Skala von 0 bis 10, wie wahrscheinlich ist es, dass Sie die Zusammenarbeit mit FP&A einem Peer-Leader in einem anderen Unternehmen empfehlen würden?
- Was ist die eine Sache, die wir ändern sollten?
Berechnen Sie den NPS auf die übliche Weise (% Promotoren minus % Detraktoren). Die meisten FP&A-Teams, die ich erlebt habe, landen im Bereich 20 bis 40. Gute Teams erreichen 60+. Über 70 ist selten und bedeutet meist, dass das Team strukturell eingebettet ist. Der Analyst sitzt in den Staff Meetings des Sales-Leiters, nicht nur in den Finance-Reviews.
Das Skript zum Fragen, denn die Unannehmlichkeit ist es, was die meisten Analysten davon abhält:
"Hallo [Director], wir versuchen FP&A für Ihr Team nützlicher zu machen. Kann ich Ihnen am Ende des Quartals eine 2-Fragen-Umfrage schicken? Buchstäblich zwei Fragen, dauert 30 Sekunden. Wir teilen die Ergebnisse zurück und sagen Ihnen, was wir ändern."
Das war es. Kein Vorspann, keine Entschuldigung, kein "Ich weiß, dass Sie beschäftigt sind." Senden Sie es über den Kanal, den sie tatsächlich lesen. Slack DM schlägt E-Mail schlägt Umfrage-Tool. Aggregieren Sie die Ergebnisse, teilen Sie zurück, was Sie gehört haben, benennen Sie, was Sie ändern. Dann führen Sie es nächstes Quartal erneut durch und beobachten Sie den Trend.
Die qualitativen Antworten sind der eigentliche Mehrwert. Die Zahl zeigt den Trend. Die Kommentare zeigen, was zu verbessern ist.
Kennzahl 4: Modellfehlerrate
Nach der Lieferung entdeckte Fehler, pro 10 ausgelieferter Modelle.
Zellbezugsfehler. Defekte Formeln. Veraltete Annahmen, die jemand vergessen hat zu aktualisieren. Ein SUMIF, der im Februar funktionierte und im März stillschweigend brach, als ein neues Segment hinzugefügt wurde. Die Art von Dingen, die den CFO um 21 Uhr eine E-Mail schreiben lässt: "Stimmt diese Zahl?"
Ziel: weniger als 0,5 nach-der-Lieferung entdeckte Fehler pro 10 Modelle. Übersetzung: eines von zwanzig Modellen enthält einen Fehler, der nach dem Versand gemeldet wird. Alles über 1,0 (eines von zehn) bedeutet, dass Ihre QA defekt ist oder Ihre Modellierungsgeschwindigkeit Ihre Überprüfung übersteigt.
So tracken Sie ehrlich: Führen Sie eine laufende Liste. Jedes Mal, wenn jemand (Sie, Ihr Manager, der Anfrager) einen Fehler in einem ausgelieferten Modell findet, protokollieren Sie es. Datum, Modell, was defekt war, Grundursache. Die meisten Grundursachen fallen in vier Kategorien:
- Zellbezug brach, als Zeilen eingefügt wurden
- Hartcodierte Annahme, die ein Werttreiber hätte sein sollen
- Formel erweiterte sich nicht, als Spalten hinzugefügt wurden
- Quelldaten änderten das Format, und der Lookup gab stillschweigend Leerzeichen zurück
Jede davon hat eine Lösung auf der Build-Ebene. Benannte Bereiche statt Zellbezüge. Werttreiber-Tabs getrennt von Berechnungs-Tabs. Tabellen statt Bereiche, damit sich Formeln automatisch erweitern. Datenvalidierung bei Quell-Imports.
Der Sinn des Trackings der Fehlerrate ist nicht, sich schlecht zu fühlen. Es geht darum, die Muster sichtbar zu machen, damit Sie den Build-Prozess verbessern können, nicht nur den Fehler.
Kennzahl 5: Ad-hoc-Rückstau-Alter
Medianes Alter offener Ad-hoc-Anfragen in Tagen.
Liegt Ihr Median über 14 Tagen, betreiben Sie kein FP&A. Sie betreiben Reporting-Triage, und die strategische Arbeit wird nicht erledigt, weil Sie in der Bedienung einer Warteschlange feststecken.
Warum Median, nicht Durchschnitt: eine einzige uralte Anfrage, die seit 90 Tagen wartet, verzerrt den Durchschnitt und verbirgt, dass sich der Rest der Warteschlange tatsächlich bewegt. Der Median zeigt, was eine typische Anfrage erlebt.
Ziel: Median unter 7 Tagen, Maximum unter 21. Wenn etwas länger als 21 Tage in der Warteschlange liegt, sollte es entweder ordentlich spezifiziert und auf die Roadmap für wiederkehrende Modelle gesetzt werden oder ehrlich mit einer "Wir werden das nicht tun"-Notiz an den Anfrager geschlossen werden. Das schlimmste Ergebnis ist, es für immer offen zu lassen. Der Anfrager verliert das Vertrauen, und die Warteschlange wächst weiter.
Das Rückstau-Alter ist die Kennzahl, die Ihnen sagt, wann Sie einstellen müssen. Wenn die Genauigkeit gut ist, die Geschwindigkeit bei dem, was Sie ausliefern, gut ist, aber das mediane Rückstau-Alter über 14 Tage steigt, haben Sie kein Qualitätsproblem. Sie haben ein Kapazitätsproblem. Das ist ein ganz anderes Gespräch mit dem CFO.
Die Diagnose "geringe Genauigkeit wegen veralteter Inputs"
Wenn die Prognosegenauigkeit um mehr als 10% verfehlt, ist der erste Instinkt, das Modell neu zu bauen. Tun Sie das nicht. Acht von zehn Mal ist das Modell in Ordnung. Die Inputs sind veraltet.
Führen Sie die Input-Aktualitäts-Prüfung durch, bevor Sie eine einzige Formel anfassen:
- Öffnen Sie das Modell. Listen Sie jede Annahme auf, die eine Prognose-Zeile treibt. Neue Kunden nach Segment. Durchschnittliche Deal-Größe. Länge des Sales-Zyklus. Gewinnquote. Personalbestand nach Funktion. Lieferantenausgaben nach Kategorie.
- Versehen Sie jede mit einem Zeitstempel. Wann wurde diese Zahl zuletzt vom Quelldaten-Verantwortlichen aktualisiert? Pipeline-Zahl von Sales Ops, Personalbestand von HR, Lieferantenausgaben von AP.
- Markieren Sie alles, was älter als der Prognose-Zyklus ist. Wenn Sie monatlich neu prognostizieren, ist alles, was älter als der Beginn des aktuellen Zyklus ist, verdächtig. Wenn quartalsweise, alles, was älter als der Beginn des aktuellen Quartals ist.
- Verfolgen Sie die größten Abweichungen zu den veraltesten Inputs. Plotten Sie Abweichungen gegen das Input-Alter. Die Korrelation ist fast immer vorhanden.
Reales Beispielmuster: Prognose verfehlte neuen ARR um 12%. Das Modell ist in Ordnung. Die Pipeline-Zahl, die es speiste, wurde drei Wochen vor dem Abschluss gezogen, und in diesen drei Wochen rutschten zwei große Deals ins nächste Quartal, ohne dass jemand Finance informierte. Die Lösung ist kein Modell-Umbau. Die Lösung ist ein fester 30-minütiger wöchentlicher Check-in mit Sales Ops, bei dem die Pipeline vor dem Prognose-Einfrieren aktualisiert wird.
Diese Diagnose ist auch der Weg, wie Sie Arbeit zur Input-Qualität an die Input-Verantwortlichen zurückgeben. Sales Ops aktualisiert die Pipeline nicht, weil Finance nicht fragt. Sobald Sie dem CFO zeigen können "unsere Prognose verfehlte um 12%, weil die Pipeline-Daten beim Einfrieren 21 Tage alt waren", hat Sales Ops einen echten Grund, den Rhythmus zu verbessern. Sie hören auf, ein Problem zu besitzen, das nicht Ihres zu lösen ist.
Die QBR-Folie, die das Gespräch verändert
Eine Folie, vier Quadranten, jedes Quartal, vor Ihrem Director oder CFO. Das ist es, was das Gespräch von "woran arbeiten Sie" zu "verbessert sich die Funktion" verschiebt.
Layout:
+---------------------------------------+---------------------------------------+
| OBEN-LINKS: Prognosegenauigkeit-Trend | OBEN-RECHTS: Modell-Geschwindigkeit |
| Liniendiagramm, letzte 8 Quartale | Balkendiagramm, letzte 8 Quartale |
| - Umsatz-Genauigkeit % | - Median Stunden bis v1 (Ad-hoc) |
| - OPEX-Genauigkeit % | - Median Tage bis Lieferung (rekurr.) |
| Ziellinien bei ±5% und ±3% | Ziellinien bei 48h und 14d |
+---------------------------------------+---------------------------------------+
| UNTEN-LINKS: Business Partner NPS | UNTEN-RECHTS: Top 3 Abweichungen |
| Zahl + Trend-Pfeil | 1. Q1 neuer ARR -12%: Pipeline veraltet|
| Top 2 qualitative Themen | 2. Q1 OPEX +4%: Lieferant spät eingebunden|
| (z.B. "wünscht schnellere Ad-hocs", | 3. Personalbestand +6: Einstellungsplan-Drift|
| "wünscht Segment-Details") | Jedes mit benannter Grundursache |
+---------------------------------------+---------------------------------------+
Drei Regeln für die Folie:
- Keine Sprechpunkte darunter. Die Folie sind die Sprechpunkte. Wenn Sie ein Skript brauchen, ist die Folie falsch.
- Abweichungen werden mit Grundursache benannt. "Neuer ARR in Q1 um 12% verfehlt aufgrund von veralteter Pipeline, in Q2 durch wöchentlichen Sales-Ops-Sync behoben." Nicht "um 12% verfehlt aufgrund von Marktbedingungen." Märkte sind keine Grundursache. Veraltete Pipeline ist es.
- Zeigen Sie den Trend, nicht den Schnappschuss. Ein NPS von 60 in diesem Quartal bedeutet nichts. Ein Trend von 40, 48, 55, 60 bedeutet, dass sich die Funktion verbessert.
Führen Sie diese Folie vier Quartale lang jedes Quartal durch. Im dritten Quartal hört der CFO auf zu fragen, woran Sie arbeiten, und fragt stattdessen, was als nächstes kommt. Das ist die Neuausrichtung. Das ist das, wofür Sie optimieren.
Eitelkeitskennzahlen, die die Funktion tatsächlich schaden
Eine kurze Liste von Kennzahlen, die wie Output aussehen, aber das falsche Verhalten belohnen:
- Anzahl gebauter Modelle. Belohnt Volumen über Impact. Das Team, das 40 mittelmäßige Modelle ausliefert, bekommt genauso viel Kredit wie das Team, das 12 baut, die Entscheidungen treiben.
- In Modellen protokollierte Stunden. Belohnt Langsamkeit. Der Analyst, der es in zwei Stunden löst, sieht schlechter aus als der, der zwei Tage brauchte.
- Wortzahl des Abweichungskommentars. Belohnt Weitschweifigkeit. Lange Kommentare bedeuten meist, dass der Analyst die Ursache nicht kennt und absichert. Zwei Sätze mit einer benannten Grundursache schlagen zwei Absätze "aufgrund einer Kombination von Faktoren."
- Anzahl der verwalteten Dashboards. Belohnt Ausbreitung. Ein Team mit 23 Dashboards hat 19, die niemand liest.
- Geschwindigkeit der Close-Unterstützung. Wichtig für Accounting, nicht für FP&A. Der Buchungsabschluss-Tag ist die Kennzahl von Accounting. Der Job von FP&A beginnt nach dem Abschluss.
Wenn Sie an einer dieser Kennzahlen gemessen werden, ist das Gespräch mit Ihrem Manager: "Ich würde lieber an Genauigkeit und Geschwindigkeit gemessen. Hier ist der bisherige Trend."
Wie man tatsächlich beginnt
Führen Sie nicht alle fünf auf einmal ein. Wählen Sie dieses Quartal drei. Die Kombination, mit der ich beginnen würde:
- Prognosegenauigkeit (Positionsebene, gegen letzte Nachprognose). Die Hauptkennzahl. Nicht verhandelbar.
- Ad-hoc-Rückstau-Alter. Am einfachsten zu tracken, am schwersten zu fälschen, zeigt, ob Sie ein Kapazitätsproblem haben.
- Business Partner NPS. Bewegt sich am langsamsten, aber die qualitativen Antworten werden umgestalten, was Sie bauen.
Tracken Sie sie sechs Wochen lang privat, bevor Sie es jemandem zeigen. Gewinnen Sie eine Baseline, der Sie vertrauen. Finden Sie die offensichtlichen Probleme und beheben Sie sie stillschweigend, damit die erste Zahl, die Ihr CFO sieht, nicht Ihre schlechteste ist.
Dann bauen Sie die QBR-Folie. Legen Sie sie Ihrem Director oder CFO beim nächsten Review vor. Bauen Sie sie weiter jedes Quartal.
Im dritten Quartal wird die Funktion nicht mehr an Arbeitsstunden gemessen. Sie wird an Output, an Trend, an der Anzahl der Entscheidungen gemessen, die sie verbessert. Das ist der Platz am Strategie-Tisch, und so verdienen Sie ihn.
Weiterlesen

Principal Product Marketing Strategist
On this page
- Warum es sich seltsam anfühlt, sich selbst zu messen (aber keine Option ist)
- Kennzahl 1: Prognosegenauigkeit (±5% Umsatz, ±3% OPEX, auf Positionsebene)
- Kennzahl 2: Modell-Geschwindigkeit / Lieferzeit
- Kennzahl 3: Business Partner NPS
- Kennzahl 4: Modellfehlerrate
- Kennzahl 5: Ad-hoc-Rückstau-Alter
- Die Diagnose "geringe Genauigkeit wegen veralteter Inputs"
- Die QBR-Folie, die das Gespräch verändert
- Eitelkeitskennzahlen, die die Funktion tatsächlich schaden
- Wie man tatsächlich beginnt
- Weiterlesen