IA no fluxo de trabalho de Marketing Ops: onde ela ganha o salário e onde ela mente para você
Todo MAP e CDP na sua shortlist agora afirma ter "AI lead scoring". A maioria deles produz pontuações no formato de ICP que a demand gen ignora discretamente, porque o modelo classifica a mãe de um SDR acima de um buying committee de uma Fortune 500. A dor não é que a IA seja inútil em operações de marketing. A dor é que a régua para "recurso de IA" está no chão, e é você quem fica preso conciliando o intervalo de confiança do modelo com aquilo que realmente fechou no trimestre passado.
Se você é o Gerente de Marketing Ops, já sabe disso. Você já foi a pessoa que, às 23h, puxava o gráfico de conversão de decil-de-pontuação-para-SQL de um modelo "preditivo" e descobria que a curva era plana. Você já assistiu a um fornecedor passar por um slide deck onde cada captura de tela tem o selo de IA e nenhuma delas tem um conjunto de teste retido. Você acenou educadamente e voltou a consertar o que a IA quebrou.
Este é um guia para essa pessoa. Não é uma peça de hype, nem uma peça catastrofista. Um catálogo prático de onde a IA conquista seu lugar no fluxo de trabalho de MOps e onde ela mente forte o suficiente para incendiar o pipeline se você confiar nela.
Por que MOps é dono dessa questão
A IA aparece em três lugares ao mesmo tempo para uma organização de marketing, e você é o único papel que vê os três.
O primeiro lugar é o seu MAP. HubSpot AI, Marketo Predictive, Pardot Einstein. Essas ferramentas exibem pontuações, recomendam horários de envio, sugerem linhas de assunto, preveem engajamento. O fornecedor controla o modelo, os recursos e o ritmo de retreinamento. Você vê o resultado e uma afirmação vaga sobre precisão.
O segundo lugar é o seu CDP e a camada de intent. 6sense, Demandbase, Bombora, ZoomInfo Intent. Eles dizem quais contas estão "em mercado" com base no consumo de conteúdo de terceiros e na resolução de identidade. O modelo é opaco. O sinal é real, mas ruidoso.
O terceiro lugar é a sua própria mesa. Claude, ChatGPT, às vezes Gemini em uma aba do navegador. Análise de coortes, prompts de auditoria, rascunho de copy, trabalho exploratório rápido de dados. Essa é a IA mais útil do seu stack e ninguém na sua empresa tem uma linha de orçamento para ela.
Vendas não vê esse quadro completo. A demand gen vê campanhas, não infraestrutura. O CFO vê a conta, não o modelo. Você é quem precisa dizer à liderança em qual resultado confiar na segunda-feira de manhã. Então você precisa de um mapa lúcido do que funciona e do que não funciona.
Onde a IA realmente ajuda
Vamos começar pelas vitórias, porque elas existem e são significativas quando você mantém suas expectativas honestas.
Enriquecimento de intent. Juntar um sinal do 6sense ou Demandbase à sua lista de contas e exibir "esta conta está pesquisando a categoria" é um ganho real. Os dados de terceiros não são perfeitos, mas são direcionais, e o ranqueamento por IA em cima do sinal bruto faz um trabalho decente agrupando comportamentos semelhantes. No que ele é bom: dizer que uma conta-alvo passou de fria para morna. No que ele é fraco: dizer que ela vai comprar neste trimestre. Use intent para priorização, não para previsão.
Verificações de sanidade de lead scoring. Esta é a que a maioria das equipes de MOps não está usando e deveria. Pegue o seu modelo de pontuação de leads atual (aquele que o seu MAP lançou há dois anos e ninguém tocou desde então) e audite-o com o Claude. Cole a lógica do modelo, cole uma amostra dos últimos quatro trimestres de closed-won e closed-lost, e peça para ele procurar vazamento de features e discordâncias de ordenação. Você vai descobrir que "baixou a página de preços" está fazendo 80% do trabalho e as outras 14 features são ruído. Essa é a auditoria que você precisava três trimestres atrás.
Automação de dedupe e higiene. Correspondência aproximada em escala, validação de e-mail, normalização de nomes de empresas, fusão de contas com base em domínio mais semelhança firmográfica. Esse é o trabalho chato, de alto ROI e baixo risco, onde a IA entrega discretamente. ZoomInfo, Clearbit, Demandbase, até o dedupe nativo do HubSpot: todos eles agora têm correspondência aproximada com sabor de IA que é genuinamente melhor do que o regex que você escreveu em 2022. Ative.
Variantes de copy para nutrição. Linhas de assunto, texto de pré-visualização, três variantes de corpo de texto para sequências de nutrição. Trate o resultado da IA como rascunho, não como envio. Um padrão que funciona: faça um briefing para o Claude com a oferta, a persona, o estágio do funil e três dos seus envios passados de melhor desempenho. Pegue cinco variantes. Escolha duas para um teste A/B/n. A IA é ruim em conhecer a voz da sua marca; ela é razoável em produzir copy estruturalmente variada mais rápido do que um redator humano consegue.
Detecção de anomalias em dados de funil. Quedas de conversão semana a semana, picos de preenchimento de formulários, estranhezas no canal de atribuição, mudanças no volume de MQL que não batem com mudanças no investimento em campanhas. Você pode montar isso com um simples cron job e uma chamada à API do Claude contra o snapshot do seu funil. Ele pega as coisas que você só notaria duas semanas depois, quando o VP de Marketing perguntasse por que o pipeline estava fraco.
Todo item desta lista compartilha uma propriedade: o custo de errar é baixo e o trabalho é de alto volume. Esse é o ponto ideal da IA em MOps. Chato, repetível, tolerante.
Onde a IA quebra
Agora os modos de falha. Eles importam mais do que as vitórias, porque as falhas são onde a liderança mais quer usar IA.
Afirmações causais. "Esta campanha causou pipeline" não é algo que um modelo de pontuação de leads ou de atribuição saiba. É correlação fantasiada de causação, às vezes com uma pontuação de confiança anexada para dar um drama extra. Nenhuma IA no seu stack rodou um experimento controlado. Nenhuma delas tem um contrafactual. Quando um fornecedor diz que o modelo "identifica as campanhas que geram receita", ele quer dizer "ordena campanhas por associação com closed-won". Essa é uma lista útil. Não é causação. Não deixe o CFO achar que é.
A verdade da atribuição. A atribuição multitoque com ponderação por IA ainda não consegue enxergar dark social, conversas de vendas, indicações de pares ou origem autodeclarada. Um comprador que ouviu falar de você em um podcast, pesquisou seu nome três semanas depois e clicou em um anúncio pago é creditado como pago. O modelo não sabe que o podcast existiu. Ponderação por IA sobre entradas ruins é só entradas ruins com confiança. A atribuição autodeclarada no formulário de demo é mais honesta do que a sua ferramenta de MTA de 40 mil dólares por ano, e essa é uma trincheira que vale a pena defender.
Tratamento de exceções. A IA roteia bem os 95% dos casos. São os 5% estratégicos que quebram. O lead de um diretor de uma Fortune 100 que usou um endereço pessoal do Gmail é pontuado como curioso sem intenção. A conta que esteve fria por seis meses mas acabou de contratar uma nova VP de Operações não move o ponteiro do modelo, porque as features firmográficas não mudaram. A empresa de 80 pessoas que rende acima do esperado é roteada para SMB mesmo que o caso de uso dela seja enterprise. Você tem que construir o human-in-the-loop para esses casos, e o fornecedor de IA vai te dizer que isso é um pedido de funcionalidade para o próximo trimestre.
Nuance de ICP. O modelo aprende "tamanho da empresa mais setor mais tech stack". Ele não aprende "eles acabaram de contratar uma VP de Ops" ou "o CEO deles postou no LinkedIn sobre querer consolidar fornecedores" ou "eles foram cliente há dois anos e deram churn por causa de uma integração que já corrigimos". Esses são os sinais de compra reais. O modelo os ignora porque eles não estão no conjunto de features, e não estão no conjunto de features porque são difíceis de capturar. ICP é um alvo móvel e a pontuação por IA é um instantâneo.
O padrão: a IA quebra onde o trabalho exige raciocínio causal, julgamento sobre exceções ou conhecimento que vive fora dos dados estruturados. Esses são os 20% estratégicos de MOps. Os 20% que determinam se o marketing é um centro de custo ou um motor de receita.
A armadilha do "AI lead scoring"
Isso merece sua própria seção, porque é o recurso de IA mais supervalorizado de todo o stack de marketing.
Aqui está o que "pontuação preditiva de leads" realmente significa na maioria dos MAPs: uma regressão logística sobre cerca de oito features, retreinada trimestralmente sobre o que quer que o seu CRM chame de "closed-won". Às vezes uma árvore com gradient boosting, se o fornecedor quiser colocar "powered by ML" no selo. As features são as óbvias: visualizações de página, aberturas de e-mail, preenchimentos de formulário, solicitações de demo, dados firmográficos. O rótulo de treinamento é confuso porque os dados do seu CRM são confusos. O ritmo de retreinamento é lento demais para captar mudanças de mercado.
Isso não é uma crítica à regressão logística. Regressão logística é boa. O problema é a lacuna entre o que o fornecedor insinua ("a IA prevê quais leads vão fechar") e o que o modelo faz ("ordena leads por correlação histórica com um rótulo de resultado ruidoso").
Como auditar isso sem uma equipe de ciência de dados:
- Puxe os últimos 90 dias de MQLs do seu MAP, com a pontuação que tinham no momento de virarem MQL.
- Junte aos resultados reais de conversão para SQL. O rep aceitou? Virou oportunidade? Fechou?
- Agrupe por decil de pontuação. Calcule a taxa de conversão para SQL de cada grupo.
- Plote. Se for uma curva monotônica limpa, o modelo está fazendo trabalho real. Se for ruidosa ou plana, o modelo é decoração.
Uma segunda verificação: puxe os seus 50 principais negócios closed-won do ano passado. Qual era a pontuação deles no momento de virarem MQL? Se metade deles estava abaixo do limite de MQL, o seu modelo está perdendo os negócios que mais importam. É daí que vem toda história de "buying committee de uma Fortune 500 pontuado como lixo".
Rode essa auditoria anualmente. Rode antes de renovar o MAP. Rode antes de deixar a liderança reorganizar o roteamento em torno da pontuação. O modelo é uma ferramenta, não uma verdade.
6sense ou Demandbase mais Claude como stack
Aqui está o fluxo de trabalho que vence qualquer coisa que um único fornecedor venda.
A plataforma de intent diz quais contas estão em mercado. 6sense e Demandbase são ambos bons nisso; escolha aquele que sua equipe já usa, não troque por uma afirmação de 3% de precisão. Exporte a lista de contas em mercado semanalmente. Sobreponha os dados firmográficos do seu CRM. Sobreponha os dados de engajamento do seu MAP.
Agora a parte que ninguém te conta: entregue esse conjunto de dados unido ao Claude (ou ChatGPT, mas para análise de coortes eu prefiro o Claude. Menos fatos de empresas alucinados, melhor em dizer "os dados não sustentam isso"). Faça perguntas de coorte:
"Aqui está uma lista de 240 contas sinalizadas como em mercado nesta semana, com dados firmográficos, pontuações de engajamento e datas de último toque. Agrupe-as em 4 a 6 coortes significativas. Para cada coorte, me dê os atributos definidores, a jogada sugerida e a suposição mais arriscada que eu estaria fazendo ao tratá-las como um grupo."
Esse é um prompt de uma tacada que, em um conjunto de dados limpo, te dá algo mais útil do que três dias de análise de demand gen. Você ganha coortes. Você ganha agrupamentos testáveis por hipótese. Você ganha uma lista do que está supondo. Daí você pode fazer o briefing de vendas com um documento de uma página em vez de uma exportação de 4.000 linhas.
A combinação (intent de terceiros para o quais, análise de coortes por IA para o porquê) vence qualquer uma sozinha. O fornecedor de intent não conhece a sua motion de vendas. O Claude não sabe quem está pesquisando a sua categoria. Juntos, eles te levam a um briefing.
Uma nota sobre custo: esse fluxo de trabalho te custa uma chave de API do Claude e uma hora. Os complementos de fornecedores que prometem a mesma coisa custam cinco dígitos e entregam menos. A conta de ROI não é sutil.
Um plano de 30 dias
Se você está lendo isto porque alguém acima de você disse "qual é a nossa estratégia de IA para operações de marketing" e você tem até o fim do mês, aqui está o plano.
Semana 1. Audite o que você já tem. Liste todo lugar onde o seu stack afirma usar IA. HubSpot AI, Marketo Predictive, a camada de pontuação do 6sense, a IA de enriquecimento do ZoomInfo, a "priorização inteligente" da ferramenta do SDR. Anote tudo. Note quais dois tocam a receita mais diretamente, geralmente lead scoring e ranqueamento de intent. Esses são os seus alvos de auditoria.
Semana 2. Valide um. Escolha o modelo de pontuação de leads. Rode a auditoria de decil-de-pontuação-versus-conversão-para-SQL descrita antes neste guia. Documente o que encontrar. Escreva um memorando de uma página: "Nosso modelo de pontuação de leads está/não está fazendo trabalho real, aqui está o gráfico, aqui está o que devemos mudar." Não o envie ainda.
Semana 3. Adicione um novo caso de uso da lista de vitórias. Opções de menor risco: automação de dedupe se o seu CRM está bagunçado, ou geração de variantes de copy se a demand gen está faminta por conteúdo de nutrição. De maior alavancagem mas mais difícil: detecção de anomalias em dados de funil usando uma chamada à API do Claude contra o seu snapshot semanal. Escolha um. Coloque no ar.
Semana 4. Escreva o memorando. Uma página, três seções: em que confiamos, em que não confiamos, o que compraríamos a seguir. Compartilhe com o VP de Marketing e com RevOps. O memorando é o entregável. A auditoria e o novo caso de uso são a evidência. O plano vence o gesticular vazio toda vez, especialmente quando a liderança foi a uma conferência e voltou com opiniões.
Esse plano de 30 dias é o que separa a pessoa de MOps que sobrevive ao ciclo da IA daquela que acaba defendendo afirmações de fornecedores que ela mesma não fez.
Opcional: pela lente do ACE Framework
Para equipes que mapeiam o trabalho de IA de forma estruturada, o ACE Framework te dá cinco capacidades (Ingest, Analyze, Predict, Generate, Execute) e uma forma de ver onde os seus investimentos em IA se concentram. Mapeando o fluxo de trabalho de MOps:
- Ingest. Dados de intenção do 6sense ou Demandbase, enriquecimento do ZoomInfo ou Clearbit, dados firmográficos normalizados. A IA é sólida aqui.
- Analyze. Análise de coortes com Claude, detecção de anomalias em dados de funil, auditorias de pontuação de leads. Esta é a capacidade mais subutilizada na maioria dos stacks de MOps.
- Predict. Pontuação de leads, pontuação de oportunidades, previsão de churn. Cheia de ressalvas. Audite anualmente.
- Generate. Variantes de copy, rascunhos de e-mail, linhas de assunto, variantes de teste A/B/n. Trate como rascunho.
- Execute. Automação de roteamento, aplicação de SLA, alertas. Valor real, mas as regras de negócio importam mais do que a IA.
A maioria das equipes de MOps investe demais em Predict (porque os fornecedores vendem isso com mais força) e investe de menos em Analyze (porque não existe selo para isso). Inverter essa proporção é um dos movimentos de maior alavancagem que você pode fazer neste ano.
O que perguntar ao fornecedor
Uma lista curta para deixar no seu celular para a próxima demo:
- Me mostre o conjunto de teste retido. Qual foi a precisão do modelo em dados nos quais ele não foi treinado?
- Quais features o modelo usa? Com que frequência ele é retreinado? Sobre os dados de quem, os meus ou um pool global?
- Qual é a curva de decil-de-pontuação-para-conversão no seu cliente médio? Mostre o gráfico.
- Posso exportar as previsões do modelo e juntá-las aos meus resultados? Como?
- Qual é a sua posição sobre afirmações causais? Esse modelo identifica drivers ou ele exibe correlações?
- Quando o modelo erra, qual é o recurso? Posso sobrescrever? Posso retreinar apenas com os meus dados?
Observe o rosto do fornecedor na pergunta um. Esse é o diagnóstico.
A conclusão
A IA em operações de marketing é um multiplicador de força no trabalho chato (higiene, dedupe, rascunho de copy, ranqueamento de intent, detecção de anomalias) e um passivo no trabalho que exige raciocínio causal: atribuição, exceções estratégicas, nuance de ICP, prever o que fecha. O trabalho do profissional de MOps que sobrevive a este ciclo é saber qual é qual e dizer isso em voz alta quando a liderança perguntar.
Você não precisa ser anti-IA. Você precisa ser anti-porcaria. A pessoa de MOps que consegue dizer a um fornecedor "me mostre o teste retido" sem piscar, que consegue auditar um modelo preditivo em uma tarde, que consegue escrever o memorando de uma página que explica em que confiar e em que não: essa pessoa é dona da própria carreira pela próxima década. O papel fica mais difícil. A alavancagem fica maior. A régua para "estou usando IA" sobe a cada trimestre.
Comece pela auditoria. Rode na segunda-feira. O resto decorre dali.
Saiba mais

Principal Product Marketing Strategist