Deutsch

KI im Product-Designer-Workflow: Was sie leistet, wo sie scheitert

Jedes Design-Tool hat inzwischen einen "KI"-Button. Sie haben die meisten davon angeklickt. Die Hälfte lieferte Ergebnisse, die aussahen wie ein Dribbble-Shot von 2019 im Trenchcoat. Die andere Hälfte hat Ihnen tatsächlich einen Nachmittag gespart.

Der Unterschied liegt nicht am Tool. Er liegt daran, an welcher Stelle im Workflow Sie es eingesetzt haben.

Ich habe das letzte Jahr damit verbracht, mich zu schämen, wie viel ich KI bei bestimmten Aufgaben einsetze, und mich gleichzeitig zu ärgern, wie wenig ich sie bei anderen einsetzen will. Was folgt, ist die aufgeräumte Version dessen, worauf ich mich wirklich geeinigt habe. Kein "KI wird Designer ersetzen"-Pessimismus. Kein "KI verzehnfacht Ihr Handwerk"-Versprechen. Nur die Teile der Woche, wo sie ihren Einsatz wert ist, und die Teile, wo ich sie immer noch wegschicke.

Warum das jetzt relevant ist

PMs liefern bereits mit v0 und Cursor, ohne Sie einzubeziehen. Das sage ich nicht, um jemanden zu erschrecken. Ich sage es, weil die Frage "sollten Designer KI nutzen?" bereits von Leuten beantwortet wurde, die keine Designer sind.

Wer keine eigene Haltung zu KI im eigenen Handwerk hat, übernimmt automatisch die Haltung anderer. Und diese Haltung ist fast immer: ein generischer Tailwind-Kartenstapel mit drei Icons, einem Verlauf und dem Wort "Empower" irgendwo im Hero. Sie kennen das.

Es geht also weniger ums Annehmen von KI als ums Konkretwerden. Was macht sie wirklich gut? Was ruiniert sie? Und was ist der kleinste Test, den Sie diesen Monat durchführen können, um es herauszufinden?

Wo KI wirklich hilft

Das sind die Teile meiner Woche, bei denen ich aufgehört habe, zu viel Wert drauf zu legen. Das Ergebnis ist gut genug, die Zeitersparnis ist real, und der Aufgabenteil, der hier früher lag, war sowieso nicht der, mit dem ich mein Gehalt verdient habe.

Clustering von Research-Transkripten

Zwanzig Nutzerinterviews bedeuteten früher eine Woche mit einer Tabelle, einer Tag-Spalte und dem langsamen Schwinden meines Lebenswillens. Jetzt sind es ungefähr dreißig Minuten.

Dovetail AI, Notion AI oder Claude mit eingefügten Transkripten ziehen Themen, Häufigkeiten und Zitatcluster schneller heraus als jeder Mensch. Ich lese trotzdem jedes Zitat. Ich gleiche die Synthese mit meinem eigenen Bauchgefühl aus den tatsächlichen Sessions ab. Aber ich überspringe die Tabellenphase vollständig, und die eingesparte Zeit fließt in mehr Interviews, wo der eigentliche Hebel liegt.

Die Falle: vertrauen Sie dem ersten Cluster nicht blind. Führen Sie zwei Durchläufe mit unterschiedlichen Prompts durch und schauen Sie, wo sie sich widersprechen. Im Widerspruch steckt die interessante Research.

Prototyp-Gerüst bauen

v0, Galileo, Figma Make. Ich nutze diese für das langweilige Grundgerüst: eine Einstellungsseite, die niemand zweimal anschaut, eine Tabelle für ein internes Admin-Tool, ein Wizard mit fünf Schritten, die alle gleich aussehen.

Der Trick: betrachten Sie das Ergebnis als Wireframe, nicht als Design. Das Raster ist ein Ausgangspunkt. Die Hierarchie ist ein Ausgangspunkt. Dann redesignen Sie ungefähr 70% davon, weil die KI-Version generisch ist und Ihr Produkt es nicht ist. Aber Sie haben das leere Blatt übersprungen, das schlimmste an jedem Sprint mit Layouts, die Sie nicht interessieren.

Für Verbraucheroberflächen oder alles mit starker Markenpräsenz bricht das zusammen. Dazu gleich mehr.

Microcopy-Varianten

Empty States, Fehlermeldungen, Onboarding-Tooltips, Button-Text, wenn "Speichern" zu schlicht klingt, aber "Änderungen anwenden" zu lang ist. Ich generiere zehn Varianten, werfe neun weg, bearbeite eine.

Das Schlüsselwort ist "bearbeite". Alles, was ich wortgetreu aus einem LLM übernommen habe, klang in der Produktion wie ein LLM. Der Rhythmus stimmt nicht. Die Zurückhaltung fehlt. Es gibt immer ein Adjektiv zu viel. Aber als Brainstorming-Partner schlägt es das Starren auf den blinkenden Cursor neben "Entschuldigung, etwas ist schiefgelaufen" zum hundertsten Mal.

Alt-Text und Barrierefreiheits-Gerüst

Erster Entwurf für Alt-Text. ARIA-Label-Entwürfe. Farbkontrast-Prüfungen. Prüfung der Überschriftenstruktur für Screenreader.

Ich verifiziere alles. KI trifft bei den offensichtlichen Punkten WCAG AA und verfehlt jeden nuancierten Edge Case. Aber die leere Seite ist weg, und das zählt, wenn Barrierefreiheitsarbeit ohnehin der Teil des Jobs ist, den die meisten Teams zu wenig beachten. Ein 50%-Vorsprung ist besser als nichts.

Ich betone das stark im nächsten Abschnitt, denn KI-generierten Alt-Text ohne Überprüfung auszuliefern ist der Weg, wie Sie 4.000-mal "Bild einer Person" auf einer Marketing-Website veröffentlichen.

Handoff-Gerüste

Cursor, der einen Figma-Frame in eine funktionierende Komponente umwandelt, die der Ingenieur dann verfeinert. Das ist still und heimlich das am meisten unterschätzte KI-Design-Tool der ganzen Runde.

Cursor mit einem guten design system kombiniert und Sie halbieren die Handoff-Zeit. Der Ingenieur muss Abstands-Tokens nicht mehr manuell übersetzen. Sie bekommen nicht mehr die dritte "Meinen Sie das so?"-Slack-Nachricht um 16 Uhr freitags. Der erste Commit liegt beim ersten Versuch näher an Ihrer Absicht.

Es funktioniert, weil ein striktes design system die Ausgabe einschränkt. Ohne eines freelancet Cursor, und Freelance-Cursor ist nur v0 mit mehr Schritten.

Wo KI scheitert (und Sie es nicht auslagern sollten)

Das ist die Liste, die ich jedem Junior Designer ans Display kleben würde, der fragt, wie viel KI er nutzen soll. Alles Folgende ist der Bereich, in dem Sie bezahlt werden, um zu denken, und in dem KI denkt wie alle, die vor Ihnen kamen, was genau der falsche Instinkt ist.

Geschmack

KI mittelt. Ihr Job ist, spezifisch zu sein.

Wenn ich eine KI bitte, ein SaaS Dashboard zu designen, bekomme ich ein SaaS Dashboard. Generisch, plausibel, vergesslich. Drei KPI-Karten oben, ein Diagramm, eine Tabelle, eine Seitenleiste. Es sieht aus wie jedes andere SaaS Dashboard, weil es auf jedem anderen SaaS Dashboard trainiert wurde.

Aber Sie designen nicht "ein" SaaS Dashboard. Sie designen "dieses" Dashboard für "diesen" Nutzer, der in "diesem" Kontext arbeitet, wo das Diagramm die falsche Hauptinformation ist, weil der Nutzer die Seite öffnet, um eine ganz bestimmte Aufgabe zu erledigen, und das Diagramm das nicht ist. KI wird das nicht erkennen. Sie schon.

Problemrahmung

KI beantwortet Fragen. Designer entscheiden, welche Frage es wert ist, beantwortet zu werden.

Wenn ein PM ein Einstellungs-Redesign verlangt und Sie Claude bitten, Einstellungen neu zu gestalten, haben Sie beide etwas verpasst. Der interessante Schritt ist zu erkennen, dass Einstellungen kein Redesign brauchen. Sie müssen entbündelt werden, mit den drei Einstellungen, die die Leute wirklich nutzen, in den Hauptfluss gehoben, und der Rest in einer "Mehr"-Schublade versteckt. KI führt diesen Schritt nicht aus. KI baut eine bessere Einstellungsseite.

Die Problemrahmung liegt bei Ihnen. Lagern Sie sie nicht aus.

Barrierefreiheits-Nuancen

Ich habe das oben gesagt und sage es nochmal, weil es wiederholt werden muss. KI trifft die WCAG-AA-Kontrastprüfungen. Sie schreibt plausiblen Alt-Text. Sie generiert ARIA-Rollen, die richtig aussehen.

Sie versteht die Tastaturnavigation nicht, wenn ein Modal sich innerhalb eines Sheets innerhalb einer Schublade öffnet. Sie versteht nicht, dass ein Screenreader, der "Button Button Button Button" über ein Karten-Grid liest, technisch konform und funktional feindlich ist. Sie versteht nicht, dass ein Autoplay-Video ohne Pause-Button mehr als nur ein Kriterium verletzt.

Testen Sie mit einem Screenreader. Testen Sie nur mit der Tastatur. Testen Sie mit reduzierter Bewegung. KI ist kein Ersatz für die echten Tests, egal wie selbstsicher die Ausgabe klingt.

Markenstimme

KI-Text klingt wie KI-Text. Der Rhythmus, die Insider-Witze, die Zurückhaltung, die Bereitschaft, einen Satz kürzer zu lassen als er sein will. Das sind immer noch Sie.

Jede Marke, die ich respektiere, hat eine Stimme, die leicht eigenartig ist. Leicht aus dem Takt. Sagt Dinge in einer Reihenfolge, die überrascht. KI kann das nicht reproduzieren, weil KI darauf trainiert wurde, das Gegenteil von eigenartig zu sein. Sie wurde darauf trainiert, vernünftig zu sein. Vernünftig ist der Tod einer Markenstimme.

Wenn Ihre Markenstimme von einem LLM reproduziert werden kann, hat Ihre Marke keine Stimme.

Neuartige Interaktionsmuster

KI ist auf das trainiert, was existiert. Wenn Ihr Produkt etwas Neues braucht, zieht KI Sie in Richtung Durchschnitt.

Ich bat einmal Galileo, einen Flow für ein wirklich neuartiges Feature zu skizzieren. Es produzierte eine tadellose Version des nächstgelegenen bestehenden Musters, das das falsche Muster war. Ich verbrachte eine Stunde damit, es zum Neuen zu drängen, und kam nirgendwo hin. Ich schloss den Tab und skizzierte es in 15 Minuten auf Papier.

Wenn die Antwort neuartig ist, ist KI ein Anker. Kämpfen Sie nicht dagegen. Nutzen Sie sie für diesen Teil einfach nicht.

Ehrliche Tool-Einschätzungen

In grober Reihenfolge, wie oft ich sie öffne:

  • Figma AI. Solide für das Umbenennen von Ebenen (das allein lohnt sich), für Platzhalterinhalte statt "Lorem ipsum", für erste Entwürfe von Icons, die Sie dann neu zeichnen. Mittelmäßig bei "Gestalte diesen Screen": Ausgabe ist generisch. Nutzen Sie es für die Routinearbeit.
  • v0 / Galileo. Gut für Ingenieure, die interne Tools ohne Designer aufsetzen. Für Verbraucheroberflächen oder markenprägende Erlebnisse zeigt sich die Naht sofort. Ich nutze v0 für Inspirationsgerüste, die ich dann von Grund auf neu mache. Galileo nutze ich seltener.
  • Cursor für Design-to-Code. Das am meisten unterschätzte KI-Design-Tool, ohne Einschränkung. Mit einem guten design system kombiniert wird Ihr Handoff-Zyklus merklich schneller. Die einzelne Änderung mit dem höchsten ROI auf dieser Liste.
  • ChatGPT / Claude als Denkpartner. Besser als jedes visuelle Tool oben für Critique, Texterstellung, Naming und das Testen der eigenen Logik. Schlechter als alle für visuellen Output. Behandeln Sie es wie einen Kollegen, den Sie um 23 Uhr unterbrechen können.

Das ist die vollständige Liste, die ich in einer normalen Woche tatsächlich öffne.

Die Erkennungszeichen für "KI hat es designed"

Ich halte diese Liste in meinem Figma angeheftet. Wenn drei oder mehr davon in etwas auftauchen, das ich ausliefern will, überarbeite ich es.

  • Drei-Karten-Layout mit drei Icons über dem Hero oder Value-Prop-Bereich.
  • Ein Verlauf auf einem CTA, der keinen Verlauf brauchte.
  • Text, der "Unlock", "Empower" oder "Seamless" ohne Ironie verwendet.
  • Perfekt gleichmäßige Abstände, die das visuelle Gewicht ignorieren (alles ist 16px, weil der Prompt "konsistente Abstände" sagte).
  • Hero-Illustration im Stockfoto-Stil mit diversen Menschen, die auf einen Laptop zeigen.
  • Eine Preisseite mit drei Stufen, die mittlere mit "Am beliebtesten" beschriftet, und eine Häkchenspalte, die niemand lesen wird.
  • Überschriften, die dem Muster "Ihr Verb Ihr Substantiv" folgen. ("Optimieren Sie Ihren Workflow." "Beschleunigen Sie Ihr Team." "Vereinfachen Sie Ihren Stack.")
  • Fließtext, der mit "In der heutigen schnelllebigen Welt" beginnt.

Drei davon und das Design verrät sich, bevor jemand die Datei sieht. Überarbeiten Sie es.

Ihr 30-Tage-Plan

Sie können diesen Artikel lesen und nicken, oder Sie führen einen echten Test durch. Hier ist die günstigste Version der zweiten Option.

Woche 1: Clustern Sie ein Research-Projekt. Wählen Sie ein Projekt, bei dem Sie 10 oder mehr Nutzerinterview-Transkripte haben. Lassen Sie sie durch KI-Clustering laufen (Dovetail AI, Notion AI oder Claude). Führen Sie parallel Ihre eigene manuelle Synthese durch. Vergleichen Sie beide. Notieren Sie, wo KI recht hatte, wo sie selbstsicher falsch lag, und wo sie etwas entdeckte, das Ihnen entgangen war. Es geht nicht darum, Ihre Synthese zu ersetzen. Es geht darum, Ihr Vertrauen zu kalibrieren.

Woche 2: Erstellen Sie das Prototyp-Gerüst für einen internen Screen. Nutzen Sie v0, Figma Make oder Galileo für einen internen Screen von Anfang bis Ende. Einstellungen, eine Tabelle, ein Admin-Panel, irgendetwas, wo Markenpolitur keine Rolle spielt. Messen Sie, wie lange es dauert im Vergleich zu Ihrem normalen Ablauf, und schreiben Sie auf, wo Sie von Grund auf neu beginnen mussten. Sie lernen schnell, welche 70% Sie behalten können und welche 30% neu gebaut werden müssen.

Woche 3: Microcopy-Varianten-Durchlauf. Lassen Sie alle Microcopy Ihres aktuellen Projekts (Empty States, Fehlermeldungen, Tooltips, Button-Text) durch einen KI-Variantengenerator laufen. Behalten Sie, was besser ist. Entfernen Sie, was schlechter ist. Protokollieren Sie die Muster, bei denen KI konsistent geholfen hat im Vergleich zu denen, bei denen sie Ihre Stimme konsistent abgeflacht hat. Das wird Ihr persönliches Nachschlagewerk für den nächsten Sprint.

Woche 4: Entwicklung im Tandem beim Handoff. Wählen Sie eine Komponente, die in diesem Sprint an Engineering übergeben wird. Richten Sie den Ingenieur mit Cursor und einem engen design system-Constraint ein. Messen Sie Handoff-Zeit und Überarbeitungsschleifen im Vergleich zur äquivalenten Komponente des letzten Sprints. Wenn es schneller und sauberer ist, ist das Ihre wirkungsvollste Änderung. Machen Sie sie dauerhaft.

Vier Wochen. Ein echter Test pro Woche. Am Ende haben Sie eigene Meinungen statt meiner.

Optional: Zuordnung zum ACE Framework

Wenn Ihr Team das ACE-Vokabular nutzt (Ingest, Analyze, Predict, Generate, Execute), lohnt es sich, zu benennen, wo Design-KI passt und wo nicht.

  • Ingest: Research-Transkripte, Support-Tickets und Session-Recordings in ein handhabbares Corpus ziehen. KI hilft viel.
  • Analyze: Themen clustern, Häufigkeiten aufdecken, Ausreißer in qualitativen Daten finden. KI hilft, mit einem Verifikations-Durchlauf.
  • Generate: Prototyp-Gerüst, Microcopy-Varianten, Alt-Text-Entwürfe, Handoff-Gerüste. KI hilft innerhalb von Leitplanken.
  • Predict: Welches Problem als nächstes gelöst wird, welche Version ausgeliefert wird, welche Kompromisse zählen. Sie. Nicht KI.
  • Execute: Die eigentliche Auslieferungsentscheidung und die Verantwortung nach dem Launch. Sie und Ihr Team. Nicht KI.

Das laut auszusprechen ist nützlich, wenn ein PM fragt, warum Sie es nicht einfach "die KI machen ließen." Die ehrliche Antwort: KI hilft bei drei der fünf Capabilities, und die beiden, die sie nicht abdecken kann, sind die, die Designern ihren Platz am Tisch sichern. KI Predict oder Execute überlassen heißt, KI Ihr Produkt designen zu lassen, was man auch "ein generisches Produkt ausliefern" nennt, was auch das ist, was Ihre Wettbewerber ohne Designer bereits tun.

Häufige Fehler

Eine kurze Liste, wie das schiefläuft, ungefähr in der Reihenfolge, in der ich jeden Fehler selbst gemacht habe:

  • KI-Output ohne Critique ausliefern, weil "es fertig aussieht." Es sieht fertig aus. Es ist nicht fertig. Lassen Sie es durch Ihr Team laufen.
  • KI für den Teil des Jobs nutzen, der Ihnen Respekt einbringt. Geschmack, Problemrahmung, neuartige Muster. Wenn Sie diese auslagern, werden Sie ersetzbar, und der Ersatz ist kein KI. Es wird der nächste Designer sein, der das nicht getan hat.
  • Verstecken, welche Teile Ihrer Arbeit KI-gestützt sind. Sagen Sie es Ihrem Team. Transparenz schafft Vertrauen. Verbergen zerstört es, sobald es jemand bemerkt.
  • KI-Selbstsicherheit über das eigene Urteil stellen. KI klingt selbstsicher, auch wenn sie falsch liegt. Ihr Instinkt ist durch tausend Designs kalibriert. Vertrauen Sie dem Instinkt.
  • Die falschen 30% der Woche optimieren. KI, die Ihnen 30 Minuten bei einer Aufgabe spart, die Sie nur einmal im Monat erledigen, ist nicht wert, integriert zu werden. Finden Sie den wiederkehrenden Schmerz.

Erfolg messen

Das ist der Maßstab, den ich an meine eigene KI-Nutzung anlege.

Sie liefern schneller bei Gerüstarbeiten: Research-Synthese, interne Tool-Layouts, erste Microcopy-Entwürfe, Entwicklungs-Handoff. Sie liefern langsamer und überlegter bei den Dingen, die zählen: die Problemrahmung, das neuartige Muster, die Markenstimme, die Barrierefreiheits-Nuance.

Ihr Team kann erkennen, welche 20% Ihrer Designwoche jetzt zurückgewonnene Zeit sind. Sie nutzen sie für mehr Interviews, mehr Critique, mehr Nachdenken, mehr Iteration bei den Teilen der Arbeit, wo Iteration sich aufaddiert.

Und das wichtigste Maß: niemand schaut auf Ihre Arbeit und denkt "KI hat das gemacht."

Das ist der Maßstab. Alles darunter und Sie nutzen KI für den falschen Teil des Jobs.

Mehr erfahren