PMの指標:アウトカムとアウトプット、ノーススター、先行指標(B2B SaaS)
私は、PMが第3四半期にリリースした14の機能を発表するQBRに同席したことがあります。新しいオンボーディングフロー。一括編集。SAML。3つの連携。2つの新しいダッシュボード。取引パイプラインのモバイル対応。スライドは緑のチェックマークの美しいマトリクスです。みんながうなずきます。
それからCEOが前のめりになり、一つの質問をします。「リテンションは動いたか?」
沈黙。PMはアナリストをちらりと見て、アナリストはデータエンジニアをちらりと見て、データエンジニアは床をちらりと見ます。ついに誰かが言います。「そう思いますが、コホートはまだ完全には固まっていません。」CEOは手帳に何かを書きます。部屋は分かっています。
そのPMはクビにはなりませんでした。もっと悪いものを得ました。次の戦略の会話から静かに外されたのです。6か月後、彼らのロードマップはセールスと共同で書かれています。プロダクトが自分の仕事が重要だと証明できないからです。
これがアウトプットとアウトカムのあいだのギャップであり、ほとんどのPMはその間違った側に着地します。怠惰だからではありません。アウトプットは写真映えし、アウトカムはそうではないからです。
ケーガンの枠組み:アウトプットはリリースするもの、アウトカムは変わるもの
マーティ・ケーガンは15年間この太鼓を叩き続けていますが、私たちのほとんどはいまだに間違えています。
アウトプットは、sprintのデモで見えるすべてです。リリースした機能。クローズしたチケット。消化したストーリーポイント。タグ付けしたリリース。それは数えられ、週次で、すべてのステークホルダーが見られるJiraに存在します。
アウトカムは、そのアウトプットによって顧客の行動やビジネスのパフォーマンスで変わったものです。アクティベーション率が38%から51%へ動いた。値上げを通してネット収益維持が112%を保った。初回取引までの時間が9日から4日へ下がった。取引パイプラインのpodのアカウントが、いまや週1.8回ではなく3.2回ログインしている。
アウトプットはスライド上の名詞です。アウトカムは顧客の生活の中の動詞です。
PMがアウトプットをデフォルトとするのは一つの理由からです。それが金曜日に確実に観察できる唯一のものだからです。あなたはこのsprintで7つのものをリリースした、これがその7つだ、これがスクリーンショットだ。アウトカムは表面化するのに30日、60日、ときには90日かかり、因果の連鎖はより乱雑です(「アクティベーションが動いたのは新しいフローのおかげか、それとも第3四半期がただ意欲の高い四半期だからか?」)。あなたがストレスを抱え、デッキが月曜締め切りのとき、あなたは数えられるものに手を伸ばします。
落とし穴はこうです。数えられるものは、あなたのCEOが対価を払っているものではありません。彼らは行動の変化に対価を払っています。あなたのスライドがそれを反映するまで、あなたは少し洒落た肩書きを持つデリバリーマネージャーです。
B2B SaaSで実際に耐える5つのアウトカム指標
47の指標は必要ありません。5つが必要です。明示的に定義され、リズムに応じて週次または月次で更新され、財務に信頼されたものです。
1. アクティベーション率。 サインアップからN日以内にプロダクトの「アハ」イベントに到達した新規アカウントの割合です。難しいのはイベントを定義することであって、測定することではありません。CRMなら、「14日以内に3件の取引を作成」は弁護できるアハです。それは顧客が実際にパイプラインを移し入れたことを意味します。プロジェクト管理ツールなら、「2つのプロジェクトにまたがって、作成者以外に1人の担当者がいる5つのタスクを作成」が機能します。イベントを選び、書き留め、変える前に一四半期それを弁護します。B2B SaaSで40%未満のアクティベーションは漏れです。60%超は稀で、守る価値があります。
2. リテンション。 2つの種類があり、両方が必要です。**グロス収益維持(GRR)**は、エクスパンションの前に既存アカウントから保持したものを測ります。ミッドマーケットSaaSでは通常85〜92%が健全で、80%未満は解約の問題です。ロゴリテンションは、契約規模にかかわらず、失わなかったアカウントの割合を測ります。新しいコホートが古いコホートより健全かどうかが分かるよう、両方をコホート(サインアップの月または四半期)別に追跡します。第1四半期のコホートが第3四半期のコホートより良く維持されるなら、そのあいだにリリースしたチームは本物の仕事をしました。
3. エクスパンション。 ネット収益維持(NRR)が見出しの数値です。12か月前のコホートの収益を取り、その同じコホートが今日生み出すもの(解約後、エクスパンション後)を見て、割ります。B2B SaaSで110%超は良く、120%超は素晴らしく、130%超はほとんどの企業が見つけていない何かを見つけたことを意味します。それをアカウントあたりのエクスパンションARRと組み合わせ、平均的な顧客が成長しているのか、それとも数頭の鯨が平均を押し上げているのかが分かるようにします。
4. NPSまたはCSAT。 遅行し、方向性を示し、ワイヤーとして有用です。NPSは実際の行動に60〜90日遅れます。それが下がるころには、損害はすでにあなたの解約パイプラインで生じています。それで舵を取らないでください。リテンションとエクスパンションですでに見ている物語を確認するために使います。NPSが8ポイント下がってリテンションが問題なければ、知覚の問題があります。NPSが8ポイント下がってリテンションも下がれば、プロダクトの問題があり、それをもっと早く知る必要がありました。
5. ユーザーあたり(またはアカウントあたり)の収益。 ARPUまたはARPAを、時間をかけて追跡します。プロダクトが顧客にとってより価値あるものになっているという最もきれいなシグナルです。アクティベーションが上がり、リテンションが上がっても、ARPUが横ばいなら、あなたはより粘着性の高い無料ティアを作っただけで、それ以上のものはありません。ARPUが上がりリテンションが保たれるなら、プロダクトはプロダクトがすべきことをしています。
この5つは合わせて、あなたのプロダクトを通る顧客の旅をカバーします。使い始めたか(アクティベーション)、留まったか(リテンション)、成長したか(エクスパンション)、推薦するほど気に入ったか(NPS)、そしてより多く支払ったか(ARPU)。この5つの外で測定するものはすべて、これらの一つを説明することに資するべきです。
ノーススター:会社ごとに1つではなく、podごとに1つ
Amplitudeは「ノーススターメトリクス」を、会社が中心に据える単一の数値として広めました。コンシューマーアプリのデイリーアクティブユーザー。Airbnbの予約された宿泊数。Spotifyの再生された曲数です。
シリーズAやBのB2B SaaSでは、会社ごとに1つは破綻します。CRMのpod、課金のpod、レポーティングのpodは、まったく違う仕事をします。それらに無理やりノーススターを共有させると、誰も実際には舵を取らない「週次アクティブアカウント」のような曖昧な会社レベルの指標になります。
対策はこうです。podごとに1つのノーススター。それが動けば、あなたのpodが今四半期に仕事をしたと言える単一の指標です。私が機能するのを見た例です。
- CRMアクティベーションのpod → 最初の14日間に3件以上の取引を作成した新規アカウントの割合
- リードルーティングのpod → 5分未満でrepにルーティングされた適格リードの割合
- オンボーディングのpod → 7日以内にセットアップチェックリストを完了したアカウントの割合
- レポーティングのpod → 有料アカウントあたりの週次アクティブダッシュボード閲覧者数
- モバイルのpod → 任意の週にモバイルからログインする週次アクティブユーザーの割合
それぞれが具体的です。それぞれが1つの数値です。それぞれが、帰属について別のチームと議論せずに、それを所有するチームによって動かせます。それがテストです。指標が動いたときに2つのpodがともに手柄を主張できるなら、それはノーススターではなく、会社レベルのアウトカム指標です。
podレベルのノーススターは会社のノーススターではありません。会社は依然としてNRRを気にかけます。しかしpodは、それが所有する顧客の旅についてNRRを駆動する先行するものを気にかけます。
先行指標と遅行指標:90日かかる指標で舵は取れない
これまで挙げたすべての指標は、遅行から先行のスペクトルのどこかにあり、あなたはそれがどこかを知る必要があります。
遅行指標は、すでに起きたことを教えてくれます。NPSは60〜90日遅れます。リテンションは四半期以上遅れます。エクスパンションARRは契約サイクル分遅れます。これらが動くころには、それを動かした仕事は2四半期前に行われていました。それらで舵を取りません。それらで検死します。
先行指標は週単位で動き、遅行指標を予測します。アクティベーション率はリテンションの先行指標です(アクティベートしたアカウントはより良く維持されます、以上です)。セットアップチェックリストの完了はアクティベーションの先行指標です。初回価値までの時間はセットアップ完了の先行指標です。新しくローンチした機能のサポートチケット量は、その機能が解約を駆動するか定着するかの先行指標です。
私が信条とするルールはこうです。すべての遅行指標を、それを予測すると信頼する1〜2つの先行指標と組み合わせる。あなたのノーススターがリテンションで、測定するのがリテンションだけなら、あなたは一度に90日間、計器なしで飛んでいます。あなたのノーススターがリテンションで、アクティベーション率も週次で追跡するなら、14週目ではなく2週目に問題があると分かります。
5つのアウトカム指標それぞれについて、追跡する価値のある先行指標がこれです。
- アクティベーション → セットアップチェックリスト完了率、初回キーアクションまでの時間、1週目に2人以上のユーザーがいるアカウントの割合
- リテンション → アカウントあたりの週次アクティブユーザー、機能の定着の広がり(各アカウントが触れる機能の数)、アカウントあたりのサポートチケット量
- エクスパンション → 席の利用率、プラン上限の80%以上のアカウントの割合、プレミアムティア機能への機能リクエスト
- NPS → サポートの応答時間、解決までの時間、初回接触で解決したチケットの割合
- ARPU → アップグレードプロンプトの表示からクリックへの率、過去30日にペイウォールに到達したアカウントの割合
これらすべてを追跡するわけではありません。アウトカム指標ごとに1〜2つの先行指標を選び、書き留め、週次でチェックするのです。具体的な選択よりも規律が重要です。
メトリクスツリーを配線する
メトリクスツリーは「私たちのpodの仕事がビジネスにどうつながるか」を語る目に見えるアーティファクトです。一番上にノーススター、その下に3〜4のドライバー指標、各ドライバーの下に先行指標です。描き出すと、CRMアクティベーションのpodはこう見えるかもしれません。
NORTH STAR: % of new accounts with 3+ deals created in 14 days
├── DRIVER 1: Setup checklist completion rate
│ ├── Leading: Time to first deal created
│ └── Leading: % of accounts inviting a 2nd user in week 1
├── DRIVER 2: Onboarding email engagement (open + CTA click)
│ ├── Leading: Day-3 email open rate
│ └── Leading: Day-7 reply rate to "stuck?" email
├── DRIVER 3: First-week support ticket volume
│ ├── Leading: % of tickets tagged "setup confusion"
│ └── Leading: Median time-to-resolution on setup tickets
└── DRIVER 4: % of accounts with sales-team intro call scheduled
├── Leading: Calendly link click rate from welcome email
└── Leading: No-show rate on intro calls
このツリーについて3つのことが重要です。第一に、すべてのドライバーは明確な因果の物語でノーススターに供給します(より良いセットアップ完了 → 14日で3件の取引に到達するアカウントが増える)。第二に、ドライバーの下の各先行指標は、データエンジニアリングのプロジェクトなしで明日ツールから取り出せるものです。第三に、全体が1ページに収まります。
カテゴリー別のツールです。
- 先行指標(イベントデータ): AmplitudeまたはMixpanel。プロダクト分析ツールが、先行指標を構成するユーザーレベルのイベントを追跡します。
- アウトカム指標(ウェアハウスデータ): ウェアハウスにSnowflakeまたはBigQuery、ダッシュボードにLookerまたはMetabase。アウトカム指標は、プロダクト分析ツールには存在しない収益、契約、顧客レベルの結合を含みます。
- 指標の定義そのもの: PMが所有し、エンジニアリングが読める単一のNotionドキュメント。古くなるwikiページではありません。アクティベーションイベントの定義が、それを計算するSQLの隣に存在する生きたドキュメントです。エンジニアリングチームが30秒以内にアクティベーションの定義を見つけられないなら、あなたの指標は本物ではありません。
私がジュニアPMがする間違いを目にします。このツリーを一度築き、一度の全社会議で発表し、二度と更新しないことです。ツリーは四半期ごとに見直すべきです。ノーススターを動かさないドライバー指標は切られます。新しい先行指標は、発見したときに追加されます。
精査に耐えるQBRスライド
1枚のスライド。構造がこれです。
PRODUCT QBR : Q3 : CRM ACTIVATION POD
NORTH STAR: % of new accounts with 3+ deals in 14 days
Q2: 38% → Q3: 51% (+13 pts)
DRIVER METRICS (Q-over-Q):
• Setup checklist completion: 44% → 67%
• Onboarding email CTA click: 12% → 19%
• Week-1 support ticket volume per account: 1.8 → 1.1
LEADING INDICATORS THAT EXPLAIN WHY:
• Time-to-first-deal: 6.2 days → 2.8 days
(driven by new setup flow shipped wk 3 of Q3)
• Day-7 active users per account: 1.4 → 2.1
(invite-2nd-user prompt added wk 5)
BUSINESS CONTEXT:
• NRR held at 112% (no Q-over-Q change)
• Activation→retention correlation: activated accounts
retain 89% vs 61% for non-activated cohort
それがスライドのすべてです。四半期中にリリースした機能(新しいオンボーディングフロー、招待プロンプト、メールの書き直し)は付録に入ります。それらは文脈であって、見出しではありません。
このスライドがCEOの質問を生き残る理由は、尋ねられる前に質問に答えているからです。「仕事は重要だったか?」はい。アクティベーションは38%から51%になりました。ここに3つのドライバーがあります。新しいフローがそれを引き起こしたと証明する先行指標がここにあります。ところで、89%対61%のリテンションの差は、なぜアクティベーションがこだわるべき正しいものなのかを教えてくれます。
あなたのVPがそのスライドを20秒で読み、CEOのオフィスに入り、メモなしで物語を語り直せるなら、あなたは見事に決めました。もし彼らが翻訳のためにあなたを部屋に必要とするなら、スライドは完成していません。
「14の機能をリリースした」の罠と、そこから這い上がる方法
機能数のスライドは安全に感じられます。それらは数えられます。あなたが忙しかったことを証明します。エンジニアリングに手柄を与え、エンジニアリングマネージャーを満足させ続けます。それらは仕事のように見えます。
それらはまた、12か月のタイムラインでPMの信頼を殺します。計算はこうです。あなたのCEOはキャリアの中でおそらく20回のPM QBRに出ています。3回目までに、彼らは「何をリリースしたか」を尋ねるのをやめ、「顧客にとって何が変わったか」を尋ね始めています。あなたのスライドが最初の質問に答え続けるなら、昇進の会話が起きるときにCEOがその仕事をはっきり思い出せないPMになるでしょう。
這い上がることは、1回の会話の問題であり、2四半期の実行の問題です。
会話はVPと、理想的には次の四半期が始まる前にします。それはこう聞こえます。「来四半期、進捗の報告の仕方を変えたいのです。これが私たちのpodのメトリクスツリーです。これが私が使うQBRスライドのテンプレートです。リリースした機能は付録に移します。何を作ったかは依然として報告しますが、見出しは顧客にとって何が変わったかになります。チームに持っていく前に、指標の定義についてあなたの見解をもらえますか?」
2つのことが起こります。一つ:あなたのVPはより良いPMの草稿を得て、その会話を覚えています。二つ:あなたは書面で自分をコミットします。3週間後にメトリクスツリーが難しく感じても、こっそり機能数のスライドに戻ることはできません。
実行の問題は次の6か月です。第1四半期は気まずいでしょう。あなたはアウトカムのスライドを持ってQBRに現れ、ドライバーの一つが横ばいか下がっており、14の緑のチェックマークの後ろに隠れる代わりにそれを語り抜かなければなりません。第2四半期には、四半期比較ができ、会話は楽になります。第3四半期までに、あなたのスライドは、他のPMが自分のQBRの前にこっそりスクリーンショットを撮るスライドになります。
今週やること
来四半期を待たないでください。次の10日間でこれをします。
- あなたのpodのノーススターを選ぶ。 一文、一つの指標。これを午後一回でできないなら、あなたのスコープは広すぎ、別の問題があります。
- その下に3つのドライバー指標を書く。 それぞれを具体的な定義とともに(「エンゲージメント」ではなく、「キーアクションXを完了する週次アクティブユーザーの割合」)。
- 明日AmplitudeかMixpanelから取り出せる、ドライバーあたり2つの先行指標を見つける。 明日取り出せないなら、あなたのツールには別のチケットに値するギャップがあります。
- すべてをNotionドキュメントに入れる。 1ページ。一番上にメトリクスツリー、その下に定義とSQLのクエリ。
- そのドキュメントをマネージャーに送り、次のQBRの前に1ラウンドの反論を求める。 承認を求めないでください。彼らが議論するであろう一つの定義を求めます。彼らが反論するものは何であれ、あなたのエンジニアリングチームも最も誤解しやすい指標です。QBRの最中ではなく、その前に直しましょう。
たとえ不完全でもアウトカムを報告するPMは、アウトプットを完璧に報告するPMに勝ります。アウトプットの報告は、より安全に感じられる、キャリアを制限する選択です。同じ機能数のスライドをあと3年作り続け、自分が戦略の会話から静かに漂い出るのを見ることもできれば、2四半期の気まずさを費やして切り替え、そこから信頼を複利で積み上げることもできます。
今四半期に始めましょう。メトリクスツリーは完璧である必要はありません。ただ存在すればよいのです。
さらに詳しく

Principal Product Marketing Strategist