Lead Capture Automation
Multichannel-Leads deduplizieren: Wie man verhindert, dass dieselbe Person zweimal kontaktiert wird
Ein B2B-Vertriebsteam mit fünf aktiven Lead-Erfassungskanälen — Website-Formular, Meta Lead Ads, WhatsApp-Chat, LinkedIn-Formular, Webinar-Registrierung — entdeckte, dass 23% ihrer CRM-Kontakte Duplikate waren. Mehr als 600 Kontakte hatten mindestens zwei Datensätze für dieselbe Person.
Die Folgen: Reps kontaktierten dieselbe Person mehrfach und wussten es nicht. Lead-Scoring berechnete fälschlicherweise doppelt so hohes Engagement. Nurture-E-Mails wurden doppelt gesendet. Der Vertriebs-Direktor berichtete dem Vorstand verzerrte Akquisitionszahlen.
Deduplizierung ist keine einmalige Bereinigung — es ist ein laufender Prozess, der verhindert, dass Duplikate überhaupt entstehen. Dieser Leitfaden zeigt den Aufbau eines Deduplizierungssystems, das mit Ihren Kanälen skaliert.
Schritt 1: Die häufigsten Duplikat-Szenarien kartieren
Bevor Sie Regeln aufbauen, identifizieren Sie die genauen Szenarien, die in Ihrer Pipeline Duplikate erzeugen.
Häufige Duplikat-Quellen:
| Szenario | Warum es Duplikate erzeugt |
|---|---|
| Dieselbe Person füllt Website-Formular aus und schreibt dann auf WhatsApp | Zwei Erfassungsereignisse, möglicherweise zwei verschiedene E-Mails oder keine E-Mail auf WhatsApp |
| Dieselbe Person registriert sich für zwei Webinare | Zwei Registrierungsformulare, dasselbe Unternehmen aber variierender Name-Format |
| Dieselbe Person bei verschiedenen Kampagnen getargeted | Meta und LinkedIn erfassen dieselbe E-Mail; beide erstellen CRM-Kontakte |
| Rep erstellt manuell Kontakt, der bereits existiert | Kein Duplikat-Check vor der manuellen Erstellung |
| Firmennamen-Variation | „Acme GmbH" vs. „ACME" vs. „Acme" erzeugt separate Unternehmens-Datensätze |
Überprüfen Sie Ihre eigenen Kanäle und listen Sie die fünf wahrscheinlichsten Szenarien auf. Diese werden Ihre höchste Priorität bei der Deduplizierung bestimmen.
Schritt 2: Ihren primären Abgleichschlüssel definieren
Deduplizierung erfordert einen verlässlichen primären Identifier. Für B2B-Leads sind die Kandidaten:
E-Mail-Adresse (bevorzugt): Der stärkste Identifier, wenn konsistent erfasst. Problem: WhatsApp-Leads haben oft keine E-Mail. LinkedIn-Leads geben manchmal Privatmail statt Unternehmensmail an.
Telefonnummer: Stärker für Chat-basierte Kanäle. Problem: Internationale Formatvariationen (+49 30 123456 vs. 030 123456 vs. 0049 30 123456 können dieselbe Nummer sein). Normalisierung erforderlich.
Kombination aus Name + Unternehmensname: Fallback wenn weder E-Mail noch Telefon konsistent. Problem: Hohe False-Positive-Rate bei häufigen Namen.
Empfehlung: Primärer Abgleichschlüssel = E-Mail-Adresse. Sekundärer Schlüssel = normalisierte Telefonnummer. Fallback = Vorname + Nachname + Unternehmensname.
Schritt 3: Echtzeit-Deduplizierung in HubSpot einrichten
Nativer HubSpot-Duplikat-Schutz: HubSpot verhindert automatisch Duplikat-Kontakte, wenn Sie dieselbe E-Mail-Adresse einreichen. Wenn ein Formular-Lead dieselbe E-Mail hat wie ein bestehender Kontakt, aktualisiert HubSpot den bestehenden Datensatz.
HubSpot Duplikat-Management aktivieren:
- Zu HubSpot → Kontakte → Aktionen → Duplikate verwalten gehen
- Duplikat-Kandidaten überprüfen (HubSpot listet vermutete Duplikate basierend auf Name + Unternehmen auf)
- Zusammenführen oder als nicht-dupliziert markieren
Für Chat-basierte Leads (WhatsApp-Telefonnummer, keine E-Mail): HubSpot's nativer Duplikat-Schutz funktioniert nicht, wenn der primäre Identifier eine Telefonnummer statt E-Mail ist.
Lösung in Zapier: Bevor ein neuer Kontakt erstellt wird, mit HubSpot API nach existierendem Kontakt via Telefonnummer suchen:
- Auslöser: Neuer WhatsApp-Lead in Respond.io
- Aktion 1: HubSpot → Kontakt nach Telefonnummer suchen
- Bedingung: Wenn Kontakt gefunden → Bestehenden Kontakt aktualisieren
- Bedingung: Wenn kein Kontakt gefunden → Neuen Kontakt erstellen
Schritt 4: Telefonnummer-Normalisierung konfigurieren
Telefonnummern in verschiedenen Formaten erzeugen falsche „kein Duplikat gefunden"-Ergebnisse. +49 30 1234567 und 030 1234567 sind dieselbe Nummer, aber ein einfacher String-Vergleich erkennt das nicht.
Normalisierungsregeln:
- Alle nicht-numerischen Zeichen entfernen: Leerzeichen, Klammern, Bindestriche
- Auf internationales Format standardisieren: +[Ländercode][Nummer]
- Lokale Vorwahlen auf internationale mappen: 030... → +4930...
In Zapier normalisieren: Einen „Text Format"-Schritt in Zapier vor dem CRM-Duplikat-Check hinzufügen, der die Telefonnummer in ein konsistentes Format transformiert.
In n8n normalisieren: Einen Code-Knoten mit JavaScript verwenden:
const phone = items[0].json.phone.replace(/[^0-9+]/g, '');
// Wenn beginnt mit 0, durch +49 (oder entsprechenden Ländercode) ersetzen
const normalized = phone.startsWith('0') ? '+49' + phone.slice(1) : phone;
return [{ json: { phone_normalized: normalized } }];
Schritt 5: Kanalübergreifende Deduplizierungsregeln aufbauen
Das schwierigste Deduplizierungs-Szenario: dieselbe Person mit verschiedenen Identifiern über verschiedene Kanäle.
Szenario: E-Mail von Formular + Telefon von WhatsApp
Ohne Verknüpfung haben Sie zwei Datensätze: einen mit E-Mail (Formular-Lead) und einen mit Telefon (Chat-Lead). Selbe Person, zwei Datensätze.
Lösungsansatz:
- Wenn Chat-Lead hereinkommt (hat Telefon, keine E-Mail): In CRM nach bestehendem Kontakt mit derselben Telefonnummer suchen
- Gefunden: Bestehenden Kontakt aktualisieren, Chat-Aktivität hinzufügen
- Nicht gefunden: Neuen Kontakt erstellen mit Telefon als primärem Identifier
- Wenn Lead später seine E-Mail angibt (z.B. nach Qualifizierungsflow): CRM nach Kontakt mit dieser E-Mail suchen
- Wenn E-Mail-Kontakt gefunden und Telefon-Kontakt gefunden: Zusammenführen und einer als primär markieren
In HubSpot ist dieser Zusammenführungs-Schritt aktuell manuell oder über Dedupely (ein Deduplizierungs-Tool) zu automatisieren.
Dedupely für fortgeschrittene Deduplizierung: Dedupely integriert mit HubSpot und Salesforce und findet Duplikate basierend auf konfigurierbaren Regeln: Name + Unternehmensähnlichkeit, Telefon mit Normalisierung, E-Mail-Domain-Übereinstimmung.
Konfiguration: Duplikat-Regeln nach Ihrer Priorisierung definieren → Dedupely täglich ausführen → Zusammenführungsvorschläge überprüfen → Batch-Zusammenführung durchführen.
Schritt 6: Duplikat-Erkennungs-Schwellenwerte konfigurieren
Nicht jede ähnliche Datensatz-Kombination ist ein Duplikat. Schwellenwerte definieren, um False Positives zu reduzieren.
Hohe Konfidenz (automatisch zusammenführen):
- Identische E-Mail-Adresse → 100% sicheres Duplikat
- Normalisierte Telefonnummer exakt gleich + Vorname exakt gleich → 95% sicher
Mittlere Konfidenz (zur manuellen Überprüfung vorschlagen):
- Vorname + Nachname ähnlich (Levenshtein-Distanz < 2) + Unternehmensname identisch → 80% sicher
- E-Mail-Domain identisch + Vorname identisch → 70% sicher
Niedrige Konfidenz (nicht automatisch zusammenführen):
- Nur Unternehmensname identisch (kann viele Mitarbeiter aus demselben Unternehmen bedeuten)
- Nur Nachname identisch
Schritt 7: Laufendes Duplikat-Management einrichten
Deduplizierung ist kein einmaliger Task. Eine wöchentliche Routine einrichten.
Wöchentlicher Deduplizierungs-Prozess:
- Montags: HubSpot Duplikat-Management-Dashboard überprüfen → Neu erkannte Duplikate der Woche zusammenführen (sollte <30 Minuten bei stabiler Pipeline dauern)
- Wöchentliche Metrik verfolgen: Neue Duplikate diese Woche / Gesamte neue Leads → Duplikat-Rate sollte <5% sein
- Wenn Duplikat-Rate steigt: Die Quelle identifizieren. Kommt ein bestimmter Kanal unverhältnismäßig viele Duplikate? Das deutet auf ein Konfigurations-Problem mit diesem Kanal hin.
Automatischer Duplikat-Alert: In HubSpot einen Workflow erstellen: Wenn Kontakt erstellt wird und ähnlicher Kontakt existiert (Name + Unternehmen matchen) → Aufgabe für Admin erstellen: „Potenzielles Duplikat überprüfen".
Häufige Fallstricke
Zu aggressiv zusammenführen. Wenn Sie alle Kontakte mit demselben Nachnamen und Unternehmens-Domain zusammenführen, führen Sie möglicherweise verschiedene Personen aus demselben Unternehmen zusammen. Zusammenführungs-Regeln mit hoher Konfidenz beginnen und nach unten iterieren.
Zusammenführungsrichtung falsch. Beim Zusammenführen von Duplikaten wählen Sie, welcher Datensatz der „Master" ist. Immer den Datensatz mit mehr Aktivitätshistorie als Master behalten. Standardmäßig älterer Datensatz ist Master.
Normalisierung für Telefonnummern vergessen. Das häufigste technische Versagen in Phone-first Kanälen. Telefonnummer-Normalisierung vor Duplikat-Check in alle Workflows einbauen.
Laufende Duplikatrate nicht verfolgen. Wenn Sie nicht verfolgen, ob Duplikate steigen, wissen Sie nicht, ob Ihr Präventionssystem funktioniert.
Was als Nächstes zu tun ist
Führen Sie diese Woche einen Duplikat-Audit durch: In HubSpot → Kontakte → Aktionen → Duplikate verwalten gehen und sehen, wie viele potenzielle Duplikate das System erkannt hat. Wenn es über 100 sind, haben Sie ein aktives Problem. Beginnen Sie damit, die am meisten betroffenen Felder (normalerweise E-Mail und Telefon) zu analysieren und bauen Sie Ihre Deduplizierungs-Logik von dort auf.
Weitere Ressourcen

Victor Hoang
Co-Founder
On this page
- Schritt 1: Die häufigsten Duplikat-Szenarien kartieren
- Schritt 2: Ihren primären Abgleichschlüssel definieren
- Schritt 3: Echtzeit-Deduplizierung in HubSpot einrichten
- Schritt 4: Telefonnummer-Normalisierung konfigurieren
- Schritt 5: Kanalübergreifende Deduplizierungsregeln aufbauen
- Schritt 6: Duplikat-Erkennungs-Schwellenwerte konfigurieren
- Schritt 7: Laufendes Duplikat-Management einrichten
- Häufige Fallstricke
- Was als Nächstes zu tun ist
- Weitere Ressourcen