Bahasa Indonesia

AI dalam Workflow Marketing Ops: Di Mana Ia Bernilai, Di Mana Ia Membohongi Anda

Turn this article into takeaways for your work.

Each assistant summarizes the article only for you and suggests best practices for your work.

Setiap MAP dan CDP dalam daftar pendek Anda kini mengklaim "AI lead scoring". Sebagian besar dari mereka menghasilkan skor berbentuk ICP yang diam-diam diabaikan oleh tim demand gen karena model tersebut menempatkan ibu seorang SDR lebih tinggi daripada komite pembelian Fortune 500. Masalahnya bukan bahwa AI tidak berguna dalam operasi pemasaran. Masalahnya adalah bahwa standar untuk "fitur AI" sudah jatuh ke titik terendah, dan Andalah yang terjebak merekonsiliasi interval kepercayaan model dengan apa yang sebenarnya tutup kuartal lalu.

Jika Anda adalah Marketing Ops Manager, Anda sudah tahu ini. Anda pernah menjadi orang yang pada pukul 11 malam menarik grafik konversi skor-desil-ke-SQL untuk model "prediktif" dan menemukan bahwa kurvanya datar. Anda pernah menyaksikan vendor menelusuri presentasi slide di mana setiap tangkapan layar memiliki lencana AI dan tidak satu pun di antaranya memiliki kumpulan uji yang ditahan (held-out test set). Anda mengangguk sopan dan kembali memperbaiki apa yang dirusak AI.

Ini adalah panduan untuk orang tersebut. Bukan tulisan penuh hype, bukan tulisan penuh malapetaka. Sebuah katalog kerja tentang di mana AI mendapatkan tempatnya dalam workflow MOps dan di mana ia berbohong cukup parah hingga bisa membakar pipeline jika Anda memercayainya.

Mengapa MOps memiliki pertanyaan ini

AI muncul di tiga tempat sekaligus bagi sebuah organisasi pemasaran, dan Anda adalah satu-satunya peran yang melihat ketiganya.

Tempat pertama adalah MAP Anda. HubSpot AI, Marketo Predictive, Pardot Einstein. Alat-alat ini memunculkan skor, merekomendasikan waktu pengiriman, menyarankan baris subjek, memprediksi engagement. Vendor mengendalikan model, fitur, dan ritme pelatihan ulang. Anda melihat output dan klaim samar tentang akurasi.

Tempat kedua adalah CDP dan lapisan niat Anda. 6sense, Demandbase, Bombora, ZoomInfo Intent. Mereka memberi tahu Anda akun mana yang "siap beli" berdasarkan konsumsi konten pihak ketiga dan resolusi ID. Modelnya buram. Sinyalnya nyata tetapi penuh noise.

Tempat ketiga adalah meja kerja Anda sendiri. Claude, ChatGPT, terkadang Gemini di tab browser. Analisis kohort, prompt audit, draf teks, pekerjaan data eksploratif cepat. Ini adalah AI paling berguna dalam tumpukan teknologi Anda dan tidak ada seorang pun di perusahaan Anda yang memiliki anggaran untuknya.

Penjualan tidak melihat keseluruhan gambar ini. Demand gen melihat kampanye, bukan infrastruktur. CFO melihat tagihan, bukan model. Andalah yang harus memberi tahu pimpinan output mana yang harus dipercaya pada Senin pagi. Jadi Anda membutuhkan peta yang jernih tentang apa yang berhasil dan apa yang tidak.

Di mana AI benar-benar membantu

Mari kita mulai dengan kemenangannya, karena mereka ada dan bermakna ketika Anda menjaga ekspektasi tetap jujur.

Pengayaan niat. Menggabungkan sinyal 6sense atau Demandbase ke daftar akun Anda dan memunculkan "akun ini sedang meneliti kategori" adalah peningkatan nyata. Data pihak ketiga tidak sempurna, tetapi memberikan arah, dan pemeringkatan AI di atas sinyal mentah cukup baik dalam mengelompokkan perilaku yang serupa. Apa yang dikuasainya: memberi tahu Anda bahwa sebuah akun target berpindah dari dingin menjadi hangat. Apa yang lemah darinya: memberi tahu Anda bahwa mereka akan membeli kuartal ini. Gunakan niat untuk prioritisasi, bukan peramalan.

Pemeriksaan kewarasan penilaian lead. Inilah yang paling tidak digunakan oleh kebanyakan tim MOps padahal seharusnya digunakan. Ambil model penilaian lead Anda yang sudah ada (yang diluncurkan MAP Anda dua tahun lalu dan tidak pernah disentuh siapa pun sejak itu) dan audit dengan Claude. Tempelkan logika model, tempelkan sampel empat kuartal terakhir dari closed-won dan closed-lost, minta ia mencari kebocoran fitur dan ketidaksesuaian peringkat. Anda akan menemukan bahwa "mengunduh halaman harga" melakukan 80% pekerjaan dan 14 fitur lainnya hanyalah noise. Itulah audit yang Anda butuhkan tiga kuartal lalu.

Otomatisasi deduplikasi dan kebersihan data. Pencocokan fuzzy dalam skala besar, validasi email, normalisasi nama perusahaan, penggabungan akun berdasarkan domain ditambah kemiripan firmografis. Inilah pekerjaan yang membosankan, ber-ROI tinggi, dan berisiko rendah di mana AI diam-diam memberikan hasil. ZoomInfo, Clearbit, Demandbase, bahkan deduplikasi native HubSpot: semuanya kini memiliki pencocokan fuzzy bernuansa AI yang benar-benar lebih baik daripada regex yang Anda tulis pada 2022. Aktifkan.

Varian teks untuk kampanye pemeliharaan. Baris subjek, teks pratinjau, tiga varian teks isi untuk urutan pemeliharaan. Perlakukan output AI sebagai draf, bukan kiriman. Pola yang berhasil: beri Claude ringkasan tentang penawaran, persona, tahap funnel, dan tiga kiriman masa lalu Anda yang berkinerja terbaik. Dapatkan lima varian. Pilih dua untuk uji A/B/n. AI buruk dalam mengetahui suara merek Anda; ia cukup baik dalam menghasilkan teks yang bervariasi secara struktural lebih cepat daripada penulis manusia.

Deteksi anomali dalam data funnel. Penurunan konversi dari minggu ke minggu, lonjakan pengisian formulir, keanehan kanal atribusi, perubahan volume MQL yang tidak cocok dengan perubahan belanja kampanye. Anda bisa merangkai ini dengan cron job sederhana dan panggilan Claude API terhadap snapshot funnel Anda. Ia menangkap hal-hal yang baru akan Anda sadari dua minggu kemudian ketika VP of Marketing bertanya mengapa pipeline lesu.

Setiap item dalam daftar ini memiliki sifat yang sama: biaya kesalahan rendah dan pekerjaannya bervolume tinggi. Itulah titik manis AI dalam MOps. Membosankan, berulang, dan pemaaf.

Di mana AI gagal

Sekarang mode kegagalannya. Hal-hal ini lebih penting daripada kemenangannya karena di situlah pimpinan paling ingin menggunakan AI.

Klaim kausal. "Kampanye ini menyebabkan pipeline" bukanlah sesuatu yang diketahui oleh model penilaian lead atau atribusi. Itu adalah korelasi yang didandani sebagai kausalitas, terkadang dengan skor kepercayaan terlampir untuk pertunjukan ekstra. Tidak ada AI dalam tumpukan teknologi Anda yang pernah menjalankan eksperimen terkontrol. Tidak satu pun dari mereka memiliki kontrafaktual. Ketika vendor mengatakan model mereka "mengidentifikasi kampanye yang mendorong pendapatan", yang mereka maksud adalah "memeringkat kampanye berdasarkan asosiasi dengan closed-won". Itu adalah daftar yang berguna. Itu bukan kausalitas. Jangan biarkan CFO mengira demikian.

Kebenaran atribusi. Atribusi multi-sentuh dengan pembobotan AI tetap tidak bisa melihat dark social, percakapan penjualan, rujukan rekan, atau sumber yang dilaporkan sendiri. Seorang pembeli yang mendengar tentang Anda di podcast, mencari nama Anda tiga minggu kemudian, dan mengeklik iklan berbayar akan dikreditkan sebagai berbayar. Model tidak tahu podcast itu ada. Pembobotan AI atas masukan yang buruk hanyalah masukan buruk yang penuh percaya diri. Atribusi laporan mandiri pada formulir demo lebih jujur daripada alat MTA seharga $40 ribu setahun, dan itu adalah prinsip yang layak dipertahankan mati-matian.

Penanganan pengecualian. AI menangani kasus 95% dengan baik. Yang merusak adalah 5% strategis. Lead dari direktur Fortune 100 yang menggunakan alamat Gmail pribadi diberi skor sebagai orang yang sekadar lihat-lihat. Akun yang telah dingin selama enam bulan tetapi baru saja merekrut VP of Operations baru tidak menggerakkan jarum model karena fitur firmografisnya tidak berubah. Perusahaan beranggotakan 80 orang yang berprestasi melampaui ukurannya dirutekan ke SMB meskipun kasus penggunaannya bersifat enterprise. Anda harus membangun human-in-the-loop untuk kasus-kasus ini, dan vendor AI akan memberi tahu Anda bahwa itu adalah permintaan fitur untuk kuartal berikutnya.

Nuansa ICP. Model mempelajari "ukuran perusahaan ditambah industri ditambah tech stack". Ia tidak mempelajari "mereka baru saja merekrut VP of Ops" atau "CEO mereka memposting di LinkedIn tentang keinginan mengonsolidasi vendor" atau "mereka adalah pelanggan dua tahun lalu dan churn karena integrasi yang sejak itu sudah kami perbaiki". Itulah sinyal pembelian yang sebenarnya. Model mengabaikannya karena tidak ada dalam kumpulan fitur, dan tidak ada dalam kumpulan fitur karena sulit ditangkap. ICP adalah target yang bergerak dan penilaian AI adalah snapshot.

Polanya: AI gagal di tempat di mana pekerjaan membutuhkan penalaran kausal, penilaian tentang pengecualian, atau pengetahuan yang hidup di luar data terstruktur. Itulah 20% strategis dari MOps. 20% yang menentukan apakah pemasaran adalah pusat biaya atau mesin pendapatan.

Jebakan "AI lead scoring"

Bagian ini layak mendapat seksinya sendiri karena ini adalah fitur AI tunggal yang paling dijual secara berlebihan dalam tumpukan pemasaran.

Inilah arti sebenarnya dari "predictive lead scoring" di kebanyakan MAP: sebuah regresi logistik atas kira-kira delapan fitur, dilatih ulang setiap kuartal berdasarkan apa pun yang disebut CRM Anda sebagai "closed-won". Terkadang sebuah gradient boosted tree jika vendor ingin menempelkan "ML-powered" pada lencananya. Fiturnya adalah yang sudah jelas: tampilan halaman, pembukaan email, pengisian formulir, permintaan demo, firmografis. Label pelatihannya berantakan karena data CRM Anda berantakan. Ritme pelatihan ulangnya terlalu lambat untuk menangkap pergeseran pasar.

Ini bukan kritik terhadap regresi logistik. Regresi logistik baik-baik saja. Masalahnya adalah jurang antara apa yang diisyaratkan vendor ("AI memprediksi lead mana yang akan tutup") dan apa yang dilakukan model ("memeringkat lead berdasarkan korelasi historis dengan label hasil yang penuh noise").

Cara mengauditnya tanpa tim data science:

Tarik MQL 90 hari terakhir dari MAP Anda, beserta skornya pada saat menjadi MQL.
Gabungkan ke hasil konversi SQL yang sebenarnya. Apakah rep menerimanya? Apakah ia menjadi opportunity? Apakah ia tutup?
Kelompokkan berdasarkan desil skor. Hitung tingkat konversi SQL untuk setiap kelompok.
Buat grafik. Jika kurvanya monoton dan bersih, model sedang melakukan pekerjaan nyata. Jika penuh noise atau datar, model hanyalah dekorasi.

Pemeriksaan kedua: tarik 50 deal closed-won teratas Anda dari tahun lalu. Berapa skor mereka pada saat menjadi MQL? Jika separuh dari mereka berada di bawah ambang batas MQL, model Anda melewatkan deal-deal yang paling penting. Di situlah setiap kisah "komite pembelian Fortune 500 diberi skor sebagai sampah" berasal.

Jalankan audit ini setiap tahun. Jalankan sebelum Anda memperbarui MAP. Jalankan sebelum Anda membiarkan pimpinan menata ulang perutean di sekitar skor. Model adalah alat, bukan kebenaran.

6sense atau Demandbase ditambah Claude sebagai sebuah stack

Inilah workflow yang mengalahkan apa pun yang dijual oleh vendor tunggal.

Platform niat memberi tahu Anda akun mana yang siap beli. 6sense dan Demandbase keduanya sama-sama baik dalam hal ini; pilih yang sudah digunakan tim Anda, jangan beralih hanya karena klaim akurasi 3%. Ekspor daftar akun siap beli setiap minggu. Tambahkan data firmografis dari CRM Anda. Tambahkan data engagement dari MAP Anda.

Sekarang bagian yang tidak diberitahukan siapa pun kepada Anda: serahkan kumpulan data gabungan itu ke Claude (atau ChatGPT, tetapi untuk analisis kohort saya condong ke Claude. Lebih sedikit fakta perusahaan yang dihalusinasikan, lebih baik dalam mengatakan "data tidak mendukung itu"). Ajukan pertanyaan kohort:

"Ini daftar 240 akun yang ditandai siap beli minggu ini, dengan firmografis, skor engagement, dan tanggal sentuhan terakhir. Kelompokkan mereka ke dalam 4-6 kohort yang bermakna. Untuk setiap kohort, beri saya atribut penentu, play yang disarankan, dan asumsi paling berisiko yang akan saya buat dengan memperlakukan mereka sebagai satu kelompok."

Itu adalah prompt sekali tembak yang, pada kumpulan data yang bersih, memberi Anda sesuatu yang lebih berguna daripada tiga hari analisis demand gen. Anda mendapat kohort. Anda mendapat pengelompokan yang dapat diuji-hipotesis. Anda mendapat daftar apa yang Anda asumsikan. Anda kemudian bisa memberi pengarahan kepada penjualan dengan satu lembar ringkasan alih-alih ekspor 4.000 baris.

Kombinasinya (niat pihak ketiga untuk mana, analisis kohort AI untuk mengapa) mengalahkan keduanya secara terpisah. Vendor niat tidak tahu motif penjualan Anda. Claude tidak tahu siapa yang sedang meneliti kategori Anda. Bersama-sama mereka membawa Anda ke sebuah ringkasan.

Catatan tentang biaya: workflow ini membutuhkan biaya berupa satu kunci Claude API dan satu jam. Tambahan vendor yang menjanjikan hal yang sama menghabiskan biaya lima angka dan memberikan hasil di bawah harapan. Matematika ROI-nya tidak rumit.

Rencana 30 hari

Jika Anda membaca ini karena seseorang di atas Anda berkata "apa strategi AI kita untuk operasi pemasaran" dan Anda punya waktu sampai akhir bulan, inilah rencananya.

Minggu 1. Audit apa yang sudah Anda miliki. Buat daftar setiap tempat di mana tumpukan teknologi Anda mengklaim AI. HubSpot AI, Marketo Predictive, lapisan penilaian 6sense, AI pengayaan ZoomInfo, "prioritisasi cerdas" milik alat SDR. Tuliskan. Catat dua mana yang paling langsung menyentuh pendapatan, biasanya penilaian lead dan pemeringkatan niat. Itulah target audit Anda.

Minggu 2. Validasi satu. Pilih model penilaian lead. Jalankan audit skor-desil-vs-konversi-SQL dari bagian sebelumnya dalam panduan ini. Dokumentasikan apa yang Anda temukan. Tulis memo satu halaman: "Model penilaian lead kita melakukan/tidak melakukan pekerjaan nyata, ini grafiknya, ini yang harus kita ubah." Jangan kirimkan dulu.

Minggu 3. Tambahkan satu kasus penggunaan baru dari daftar kemenangan. Opsi berisiko terendah: otomatisasi deduplikasi jika CRM Anda berantakan, atau pembuatan varian teks jika demand gen kekurangan konten pemeliharaan. Lebih berdaya ungkit tetapi lebih sulit: deteksi anomali pada data funnel menggunakan panggilan Claude API terhadap snapshot mingguan Anda. Pilih satu. Luncurkan.

Minggu 4. Tulis memonya. Satu halaman, tiga bagian: apa yang kita percaya, apa yang tidak, apa yang akan kita beli berikutnya. Bagikan dengan VP Marketing dan RevOps. Memo adalah hasil kerjanya. Audit dan kasus penggunaan baru adalah buktinya. Rencana selalu mengalahkan basa-basi, terutama ketika pimpinan baru saja menghadiri konferensi dan kembali dengan pendapat.

Rencana 30 hari ini adalah yang membedakan orang MOps yang bertahan dari siklus AI dari yang terjebak membela klaim vendor yang tidak mereka buat sendiri.

Opsional, melalui lensa ACE Framework

Untuk tim yang memetakan pekerjaan AI secara formal, ACE Framework memberi Anda lima kapabilitas (Ingest, Analyze, Predict, Generate, Execute) dan cara untuk melihat di mana investasi AI Anda terkumpul. Memetakan workflow MOps:

Ingest. Data niat dari 6sense atau Demandbase, pengayaan dari ZoomInfo atau Clearbit, firmografis yang dinormalisasi. AI solid di sini.
Analyze. Analisis kohort Claude, deteksi anomali pada data funnel, audit penilaian lead. Inilah kapabilitas yang paling kurang dimanfaatkan di kebanyakan tumpukan MOps.
Predict. Penilaian lead, penilaian opportunity, prediksi churn. Penuh catatan kehati-hatian. Audit setiap tahun.
Generate. Varian teks, draf email, baris subjek, varian uji A/B/n. Perlakukan sebagai draf.
Execute. Otomatisasi perutean, penegakan SLA, peringatan. Bernilai nyata, tetapi aturan bisnis lebih penting daripada AI-nya.

Sebagian besar tim MOps terlalu banyak berinvestasi pada Predict (karena vendor menjualnya paling keras) dan kurang berinvestasi pada Analyze (karena tidak ada lencana untuknya). Membalik rasio itu adalah salah satu langkah dengan daya ungkit tertinggi yang bisa Anda ambil tahun ini.

Apa yang harus ditanyakan kepada vendor

Daftar singkat untuk disimpan di ponsel Anda untuk demo berikutnya:

Tunjukkan kepada saya kumpulan uji yang ditahan. Berapa akurasi model pada data yang tidak digunakan untuk melatihnya?
Fitur apa yang digunakan model? Seberapa sering ia dilatih ulang? Atas data siapa, milik saya atau kumpulan global?
Bagaimana kurva skor-desil-ke-konversi pada pelanggan rata-rata Anda? Tunjukkan grafiknya.
Bisakah saya mengekspor prediksi model dan menggabungkannya dengan hasil saya? Bagaimana caranya?
Apa pendirian Anda tentang klaim kausal? Apakah model ini mengidentifikasi pendorong, atau memunculkan korelasi?
Ketika model salah, apa jalan keluarnya? Bisakah saya menimpanya? Bisakah saya melatih ulang hanya pada data saya?

Perhatikan wajah vendor pada pertanyaan satu. Itulah diagnostiknya.

Intinya

AI dalam operasi pemasaran adalah pengganda kekuatan pada pekerjaan yang membosankan (kebersihan data, deduplikasi, draf teks, pemeringkatan niat, deteksi anomali) dan sebuah liabilitas pada pekerjaan yang membutuhkan penalaran kausal: atribusi, pengecualian strategis, nuansa ICP, memprediksi apa yang akan tutup. Pekerjaan dari IC MOps yang bertahan dari siklus ini adalah mengetahui mana yang mana dan mengatakannya dengan lantang ketika pimpinan bertanya.

Anda tidak harus anti-AI. Anda harus anti-asal jadi. Orang MOps yang bisa mengatakan kepada vendor "tunjukkan kepada saya kumpulan uji yang ditahan" tanpa berkedip, yang bisa mengaudit model prediktif dalam satu sore, yang bisa menulis memo satu halaman yang menjelaskan apa yang harus dipercaya dan apa yang tidak: orang itu memiliki kendali atas kariernya untuk satu dekade ke depan. Perannya menjadi lebih sulit. Daya ungkitnya menjadi lebih besar. Standar untuk "saya menggunakan AI" naik setiap kuartal.

Mulailah dengan audit. Jalankan hari Senin. Sisanya mengikuti dari sana.

Pelajari Lebih Lanjut

About the author

Camellia

Principal Product Marketing Strategist

Camellia is Principal Product Marketing Strategist at Rework, helping B2B buyers pick the right software with confidence. With 6+ years in product marketing and 150+ SaaS tools evaluated across CRM, project management, and sales engagement, Camellia turns competitive intelligence into clear, honest comparisons. Readers get vendor evaluations they can trust to cut through marketing noise and decide faster.

View full profile LinkedIn