KI im Workflow des CX Managers
Turn this article into takeaways for your work.
Each assistant summarizes the article only for you and suggests best practices for your work.
Eine CX Managerin, mit der ich letztes Quartal zusammenarbeitete, verbrachte zwei Stunden damit, aus 800 NPS-Kommentaren einen sauberen VoC-Bericht zu erstellen. Sie hatte einen guten Prompt, ein ordentliches Clustering und eine knappe Executive Summary. Sie trug den Bericht in das Produktreview mit dem Gefühl, gerade das Feuer entdeckt zu haben.
Der PM las drei Absätze, runzelte die Stirn und sagte: „Das klingt nicht nach unseren Kunden."
Der Bericht wurde abgelehnt. Nicht weil die Synthese falsch war. Die Themen stimmten in die richtige Richtung. Die Häufigkeiten waren korrekt. Die Zusammenfassung war präzise. Aber die Kundenstimme war weggefiltert worden. Jedes Zitat klang, als wäre es gebügelt worden. Jeder Themenname las sich wie eine McKinsey-Folie. Der PM vertraute dem Bericht nicht, weil nichts darin nach den wütenden, spezifischen, merkwürdig formulierten Beschwerden klang, die er wöchentlich in Support-Calls hört.
Das ist die Falle. KI komprimiert die Zeit, die es dauert, Feedback von Tagen auf Minuten zu synthetisieren. Das ist real, und es zu ignorieren wäre töricht. Aber CX Manager werden nicht für Synthesegeschwindigkeit bezahlt. Wir werden für Kundenurteil bezahlt. Wenn KI-Output das Urteil ersetzt, anstatt es zu beschleunigen, wird unser Platz am Tisch leiser, dann optional, dann überflüssig.
Die Aufgabe ist nicht, mehr KI einzusetzen. Die Aufgabe ist, KI dort einzusetzen, wo sie Sie verstärkt, und sie dort zu verweigern, wo sie Sie imitiert.
Warum das jetzt relevant ist
Jedes CX-Team, mit dem ich spreche, befindet sich in einer Version desselben Gesprächs. Die Geschäftsführung will KI im Workflow. Der CX Manager hat eine Liste von 14 Stellen, an denen sie sie einbinden könnten. Einige davon sparen echte Stunden. Einige davon untergraben leise das Vertrauen, auf dem die Rolle aufgebaut ist.
Die ehrliche Version: KI ist hervorragend bei den Teilen der CX-Arbeit, die überwiegend mechanisch sind (Clustering, Sortieren, Formatieren, Entwürfe erstellen). KI ist schlecht bei den Teilen, die überwiegend Urteilsvermögen erfordern (welche Signale wichtig sind, welches Segment gerade schreit, welcher „frustrierte" Kommentar kurz vor der Abwanderung steht). Diese beiden zu verwechseln ist der Weg, einen schönen Bericht zu produzieren, der abgelehnt wird.
Beim ersten Mal, als ich einen vollständig KI-generierten VoC-Bericht einreichte, dachte ich, ich hätte etwas entdeckt. Das hatte ich nicht. Ich hatte lediglich meine Stimme ausgelagert. Beim zweiten Mal nutzte ich KI für das Clustering, schrieb aber jede Themenzusammenfassung mit meinen eigenen Worten und verwendete direkte Zitate, die ich persönlich überprüft hatte. Dieser Bericht wurde akzeptiert, im QBR zitiert und führte zu einer Roadmap-Änderung. Dieselben Tools. Eine andere Beziehung zu ihnen.
Wo KI hilft, wo KI schadet
Hier ist die Entscheidungsregel, die ich verwende und die ich für jedes CX-Team an der Wand aufhängen würde, das KI einführt:
| Aufgabe | KI-Status | Warum |
|---|---|---|
| Thematisches Clustering von Freitext-Feedback | Hilft | Mustererkennung im großen Maßstab; Sie überprüfen Themen anhand von Originalzitaten |
| NPS-Kommentar-Zusammenfassung nach Segment | Hilft | Sortiert bereits vertrauenswürdige Daten um; spart Sortierzeit |
| Starter-Entwurf einer Customer Journey Map aus einem Transkript | Hilft | Überwindet die leere Seite; Sie korrigieren, was falsch ist |
| Executive Readout Entwurf | Hilft | KI ist gut in Struktur; Sie liefern den Insight |
| Win/Loss-Synthese aus Call-Notizen | Hilft | Hebt Muster aus vielen Calls schnell hervor |
| Kundengerichtete Kommunikation (Entschuldigung, Eskalation, Churn-Save) | Schadet | Kunden spüren den KI-Ton; Vertrauen sinkt |
| Emotionale/Sentiment-Inferenz | Schadet | Verfehlt Sarkasmus, kulturellen Kontext, Intensität |
| Priorisierung ohne Segment-Gewichtung | Schadet | Sortiert nach Häufigkeit; ignoriert Kontowert |
| Finales VoC-Narrativ für Führungskräfte | Schadet | Wenn es nicht nach Ihren Kunden klingt, stirbt es im Raum |
Die vier „Hilft"-Zeilen sparen Ihnen 4 bis 6 Stunden pro VoC-Zyklus. Die vier „Schadet"-Zeilen kosten Sie die nächsten zwölf Monate Glaubwürdigkeit. Die Rechnung ist eindeutig.
Fünf Prompts, die wirklich Zeit sparen
Das sind die Prompts, die ich wöchentlich verwende. Kopieren Sie sie, ändern Sie die Variablen und führen Sie sie aus. Sie sind so formuliert, dass sie ehrlich darüber sind, was KI leisten kann, was bedeutet, dass sie „wenn Sie keine Belege finden, sagen Sie es"-Klauseln enthalten. Dieser eine Satz verändert den Output mehr als jede andere Anweisung.
1. Thematisches Clustering von Freitext-Feedback
You are helping me cluster customer feedback into themes.
Input: [paste 200-800 raw verbatim comments]
Task: Cluster these comments into 8-12 distinct themes.
For each theme:
- Theme name (4 words max, plain English, no jargon)
- Count (how many comments support this theme)
- 3 representative verbatim quotes (exact text, no edits)
- One-sentence summary of what customers are actually saying
Rules:
- Do not editorialize.
- Do not invent themes that are not supported by at least 5 comments.
- If a theme contradicts another theme, surface the contradiction.
- Quotes must be verbatim from the input. Do not paraphrase, polish, or fix grammar.
Das ist das Arbeitspferd. Verwenden Sie es auf rohen NPS-Exporten, Support-Tickets, Abwanderungsgrund-Notizen. Die Zeile „do not polish quotes" ist tragend. Ohne sie entfernt das Modell die eigentliche Stimme des Kunden.
2. NPS-Detractor-Zusammenfassung
You are helping me understand what NPS detractors are complaining about.
Input: [detractor comments only, score 0-6]
Task: Group complaints by issue type. For each issue:
- Issue name
- Count
- 2-3 direct quotes (verbatim)
- Whether this issue appears in promoter or passive comments too (yes/no, with one quote if yes)
Rules:
- If you cannot find evidence for a claimed pattern in the actual comments, say so explicitly.
- Do not soften language. If customers are angry, say they are angry.
- Flag any comment that mentions a specific competitor by name.
Die Anweisung „if you cannot find evidence, say so" ist die wichtigste Zeile in jedem KI-Prompt, den ich verwende. Sie reduziert halluzinierte Themen um etwa 70 %.
3. Starter-Entwurf einer Customer Journey Map
You are helping me draft a v0 customer journey map.
Input: [interview transcript or session notes from a single customer]
Task: Map this customer's journey across these stages:
1. Trigger (what made them look)
2. Evaluation (how they decided)
3. Onboarding (first 30 days)
4. Activation (when they got value)
5. Steady state (current usage)
6. Friction points (where they're stuck)
For each stage:
- What the customer did
- What they thought (use direct quotes where possible)
- What tool/touchpoint was involved
- What went well or poorly
Rules:
- Use the customer's actual words, not paraphrases.
- If a stage is not covered in the transcript, write "not covered", do not invent.
- Flag emotional moments with the customer's actual phrasing.
Dieser Prompt halbiert die Zeit für leere Seiten bei Journey-Arbeit. Das Ergebnis ist nie die finale Map. Es ist das Gerüst, das ich weiterbearbeite.
4. Executive Readout Entwurf
You are helping me turn raw findings into a 1-page executive summary.
Input: [bulleted findings, with quotes and counts]
Task: Write a 250-word executive summary.
Structure:
- One-sentence headline (the customer impact, not the methodology)
- 3 key findings, each with the quantified evidence and a representative quote
- 1 recommendation, framed as a decision the exec needs to make
- 1 risk if we do nothing
Rules:
- Lead with customer impact. Methodology goes in an appendix, not the body.
- Keep it under 250 words.
- No adverbs that signal opinion ("clearly," "obviously," "significantly").
- If a finding has weak evidence, say so. Do not bury caveats.
KI ist bei der Formatierung wirklich gut. Das ist einer der wenigen Prompts, bei denen ich nur leicht überarbeite, meist 20 bis 30 Prozent. Der strukturelle Aufwand ist das, wofür KI gedacht ist.
5. Win/Loss-Synthese aus Call-Notizen
You are helping me synthesize patterns from win/loss interview notes.
Input: [10-30 win/loss interview summaries]
Task: Produce two lists.
WHY WE WIN:
- Top 5 reasons, each with count and 2 verbatim quotes
- Note which segment each reason is strongest in (SMB / mid-market / enterprise)
WHY WE LOSE:
- Top 5 reasons, same format
- Distinguish "lost to competitor X" from "lost to no decision"
Rules:
- Do not include any reason mentioned by fewer than 3 interviews.
- If a reason appears strongly in only one segment, say so.
- Surface any reason that contradicts our internal assumptions about why we win.
Der letzte Punkt rechtfertigt seinen Platz. KI kennt Ihre internen Annahmen nicht, aber wenn Sie ihr sagen, dass sie Widersprüche kennzeichnen soll, tut sie es, und die Widersprüche sind meist die wertvollste Zeile im Output.
Ein sechster Prompt: Churn-Signal-Triage
Dieser ist riskant genug, dass ich ihn in einem eigenen Abschnitt mit einem Hinweis platziere.
You are helping me triage churn-risk signals.
Input: [list of accounts with usage drop %, last login date, support ticket count, NPS score]
Task: For each account, output:
- Risk level (high / medium / low)
- Primary signal driving the risk
- One question I should ask the CSM before reaching out
Rules:
- Do not produce a confident risk score if 2 or more signals are missing.
- Flag accounts where signals contradict (e.g., usage dropped but NPS is 9).
- Do not rank accounts by frequency of signals. Rank by severity.
Der Hinweis: Lassen Sie KI niemals ohne Ihre Beteiligung die Kunden-Roadmap oder die Save-Call-Liste priorisieren. KI sortiert nach Häufigkeit. Sie wissen, dass ein Enterprise-Konto, der über ein Problem schreit, mehr zählt als 50 Free-Tier-Nutzer, die ein anderes erwähnen. KI weiß das nicht, und ein „Churn-Risiko-Score", der den Kontowert ignoriert, ist schlechter als kein Score.
Ich behandle den Output dieses Prompts als Ausgangspunkt für ein Gespräch mit den CSMs, niemals als handlungsfertige Liste.
Output-Review-Checkliste (vor dem Verlassen des Schreibtisches ausführen)
Drei Fragen. Stellen Sie diese bei jedem KI-Output, bevor Sie Ihren Namen daran setzen.
- Kann ich für jede Aussage das Quellzitat benennen? Wenn ein Thema sagt, „Kunden sind frustriert mit dem Onboarding", sollte ich in der Lage sein, den rohen Export zu öffnen und das Originalzitat zu finden, das das stützt. Wenn nicht, ist das Thema halluziniert und wird gestrichen.
- Klingt das nach unseren Kunden? Lesen Sie es laut. Unsere Kunden schimpfen, schweifen ab, verwenden spezifische Produktnamen, erwähnen Wettbewerber X namentlich. KI-Output klingt wie ein TED-Vortrag. Wenn Ihrer das auch tut, schreiben Sie die Zitate zurück in die echten Stimmen.
- Würde ich meinen Namen darunter setzen? Nicht „ist es gut genug". Würde ich es vor dem CFO verantworten? Wenn nein, korrigieren Sie es. Wenn Sie unsicher sind, bitten Sie einen CSM, drei Absätze zu lesen.
Eine nützliche Kennzahl: Wie viel vom KI-Output bearbeiten Sie, bevor Sie ihn veröffentlichen? Der gesunde Bereich liegt bei 30 bis 50 Prozent. Wenn Sie weniger als 10 Prozent bearbeiten, rubber-stampen Sie nur, und Ihre Stimme ist verloren. Wenn Sie mehr als 70 Prozent bearbeiten, braucht Ihr Prompt Überarbeitung, und Sie hätten es besser selbst geschrieben. Für die zugrunde liegenden VoC- und Priorisierungs-Frameworks, in die die KI einspeist, lesen Sie Das NPS-Programm, das wirklich Maßnahmen antreibt und VoC-Feedback in Roadmap-Entscheidungen umwandeln.
Häufige Fehler
Einige Muster, die ich bei ansonsten guten CX Managern beobachtet habe.
Vollständig KI-generierte VoC-Berichte einreichen, ohne sie in der eigenen Stimme zu überarbeiten. Das ist die Falle aus dem Eingang. Die Synthese kann technisch korrekt sein und trotzdem abgelehnt werden, weil die Stimme falsch ist. Überarbeiten Sie immer die Hauptthemen und die Executive Summary in Ihren eigenen Worten, mit Originalzitaten, die Sie persönlich überprüft haben.
Einen KI-Churn-Risiko-Score als Evangelium behandeln. KI weiß nicht, welches Konto das Golfpartner Ihres CEO ist. Es weiß nicht, welches Logo im Case-Study-Deck steht. Es sortiert nach dem, was in den Daten steht, und die Daten enthalten keine Kontopolitik. Gewichten Sie immer nach Segment und strategischem Wert.
Nicht überprüfen, ob Themen wirklich in den Rohdaten existieren. KI halluziniert Muster. Nicht oft, aber oft genug. Wenn das Modell sagt, „20 % der Kunden erwähnen X", suchen Sie im Export. Wenn Sie 4 Erwähnungen statt 40 finden, ist das Thema erfunden und der Rest des Outputs steht unter Verdacht.
KI verwenden, um die Kundengeschichte zu schreiben, anstatt sie zu finden. KI ist ein Forschungsassistent, kein Erzähler. Der Erzähler sind Sie. Sie haben die Stellenbeschreibung (Customer Experience Manager Stellenbeschreibung) mit Kundenurteil verfasst, aus gutem Grund: Hier zeigt es sich.
Mehr zu den Fehlern, die sich in einer CX-Rolle leise summieren, lesen Sie in Häufige Fehler, die CX Manager ausbremsen.
Wo KI in den übergeordneten Tech-Stack passt
KI-Tools sind eine Schicht im Stack, nicht der Stack selbst. Sie brauchen weiterhin eine Survey-Plattform, ein Tagging-System und eine Möglichkeit, Kundensignale an einer verlässlichen Datenquelle zu verankern, damit PMs und CSMs handeln können. Ohne diese Infrastruktur löst kein noch so cleverer Prompt den Workflow. Die Tools und der Tech-Stack des CX Managers erklärt, was darunter aufgebaut werden muss.
Ein einfaches, skalierbares Setup: Speichern Sie jedes Kundenfeedback (NPS, Support-Tickets, Interview-Notizen, Win/Loss-Calls) in einem nachverfolgbaren System, taggen Sie nach Thema und Konto, und speisen Sie diese strukturierten Daten in Ihre KI-Prompts ein. Rework Work Ops bietet CX Managern eine einzige Oberfläche zum Taggen von Kundensignalen, deren Zuordnung zu bestimmten Konten und zur Nachverfolgung der eingegangenen Verpflichtungen. Work Ops beginnt bei 6 USD pro Nutzer und Monat. Sie brauchen es nicht, um diese Prompts zu verwenden. Sie brauchen aber einen zuverlässigen Ort, um die Daten zu speichern, die Sie einspeisen.
Messen, ob das funktioniert
Drei Kennzahlen, mit denen ich mich vierteljährlich selbst überprüfe.
- Eingesparte Synthesezeit pro VoC-Zyklus. Wenn KI nicht mindestens 60 % der Zeit einspart, die Sie früher von Rohdaten zu Themen gebraucht haben, sind Ihre Prompts nicht präzise genug.
- Anteil des KI-Outputs, der vor der Veröffentlichung bearbeitet wird. Gesund sind 30 bis 50 %. Unter 10 % bedeutet rubber-stamping. Über 70 % bedeutet, der Prompt oder der Anwendungsfall ist falsch.
- Vertrauenswert bei PM und PMM. Informell, aber am wichtigsten. Fragen Sie einen Peer-PM direkt: „Fühlt sich mein Output noch an, als käme er von jemandem, der die Kunden wirklich kennt?" Wenn er zögert, entweicht Ihre Stimme aus der Arbeit.
Diese letzte Kennzahl ist die, die es zu schützen gilt. Geschwindigkeit ist wiederherstellbar. Den Ruf als Person, deren CX-Berichte wie ein Chatbot klingen, ist es nicht.
Der Vorteil des CX Managers besteht darin, zu wissen, welche 50 Kommentare von 500 wichtig sind. KI kann das nicht für Sie tun. Vorzugeben, dass sie es kann, führt dazu, den Raum zu verlieren. Sie gut einzusetzen, mit schnellem Clustering, präziser Zusammenfassung, verifizierten Zitaten und Ihrer Stimme obendrauf, bedeutet, den Raum zu behalten und jede Woche einen zusätzlichen Nachmittag zurückzugewinnen.
Das ist der Handel. Nehmen Sie ihn an.

Principal Product Marketing Strategist
On this page
- Warum das jetzt relevant ist
- Wo KI hilft, wo KI schadet
- Fünf Prompts, die wirklich Zeit sparen
- 1. Thematisches Clustering von Freitext-Feedback
- 2. NPS-Detractor-Zusammenfassung
- 3. Starter-Entwurf einer Customer Journey Map
- 4. Executive Readout Entwurf
- 5. Win/Loss-Synthese aus Call-Notizen
- Ein sechster Prompt: Churn-Signal-Triage
- Output-Review-Checkliste (vor dem Verlassen des Schreibtisches ausführen)
- Häufige Fehler
- Wo KI in den übergeordneten Tech-Stack passt
- Messen, ob das funktioniert