La IA en el workflow de Marketing Ops: dónde se gana su sueldo y dónde le miente
Cada MAP y CDP de su lista corta ahora promete "lead scoring con IA". La mayoría producen puntuaciones con forma de ICP que el equipo de demand gen ignora en silencio porque el modelo clasifica a la mamá de un SDR por encima de un comité de compra Fortune 500. El problema no es que la IA sea inútil en operaciones de marketing. El problema es que el listón para "función de IA" está por el suelo, y usted es quien se queda atascado conciliando el intervalo de confianza del modelo con lo que realmente cerró el trimestre pasado.
Si usted es el Marketing Ops Manager, ya lo sabe. Ha sido la persona que a las 11 de la noche saca el gráfico de conversión score-decil-a-SQL para un modelo "predictivo" y descubre que la curva es plana. Ha visto a un proveedor recorrer un slide deck donde cada captura de pantalla tiene la insignia de IA y ninguna tiene un conjunto de prueba reservado. Ha asentido con cortesía y ha vuelto a arreglar lo que la IA rompió.
Esta es una guía para esa persona. No es un panfleto entusiasta ni uno catastrofista. Es un catálogo práctico de dónde la IA se gana su lugar en el workflow de MOps y dónde miente con la fuerza suficiente para incendiar el pipeline si usted le cree.
Por qué MOps es dueño de esta pregunta
La IA aparece en tres lugares a la vez para una organización de marketing, y usted es el único rol que ve los tres.
El primer lugar es su MAP. HubSpot AI, Marketo Predictive, Pardot Einstein. Estas herramientas muestran puntuaciones, recomiendan horarios de envío, sugieren líneas de asunto, predicen el engagement. El proveedor controla el modelo, las funciones y el ritmo de reentrenamiento. Usted ve el resultado y una vaga afirmación sobre la precisión.
El segundo lugar es su CDP y su capa de intención. 6sense, Demandbase, Bombora, ZoomInfo Intent. Estos le dicen qué cuentas están "en mercado" según el consumo de contenido de terceros y la resolución de identidad. El modelo es opaco. La señal es real pero ruidosa.
El tercer lugar es su propio escritorio. Claude, ChatGPT, a veces Gemini en una pestaña del navegador. Análisis de cohortes, prompts de auditoría, borradores de copy, trabajo exploratorio rápido con datos. Esta es la IA más útil de su stack y nadie en su empresa tiene una línea de presupuesto para ella.
Ventas no ve este panorama completo. Demand gen ve campañas, no infraestructura. El CFO ve la factura, no el modelo. Usted es quien tiene que decirle al liderazgo en qué resultado confiar el lunes por la mañana. Así que necesita un mapa lúcido de qué funciona y qué no.
Dónde ayuda realmente la IA
Empecemos por las victorias, porque existen y son significativas cuando usted mantiene sus expectativas honestas.
Enriquecimiento de intención. Unir una señal de 6sense o Demandbase a su lista de cuentas y mostrar "esta cuenta está investigando la categoría" es un aporte real. Los datos de terceros no son perfectos, pero son orientativos, y la clasificación de IA sobre la señal en bruto hace un trabajo decente agrupando comportamientos similares. En qué es bueno: decirle que una cuenta objetivo pasó de fría a tibia. En qué es débil: decirle que comprarán este trimestre. Use la intención para priorización, no para forecasting.
Comprobaciones de cordura del lead scoring. Esta es la que la mayoría de los equipos de MOps no están usando y deberían. Tome su modelo de puntuación de leads existente (el que su MAP desplegó hace dos años y nadie ha tocado desde entonces) y audítelo con Claude. Pegue la lógica del modelo, pegue una muestra de los últimos cuatro trimestres de closed-won y closed-lost, pídale que busque fugas de variables y desacuerdos de orden de clasificación. Descubrirá que "descargó la página de precios" está haciendo el 80% del trabajo y las otras 14 variables son ruido. Esa es la auditoría que necesitaba hace tres trimestres.
Automatización de dedupe e higiene. Coincidencia aproximada a escala, validación de email, normalización de nombres de empresas, fusión de cuentas basada en dominio más similitud firmográfica. Este es el trabajo aburrido, de alto ROI y bajo riesgo donde la IA entrega en silencio. ZoomInfo, Clearbit, Demandbase, incluso el dedupe nativo de HubSpot: todos tienen ahora coincidencia aproximada con sabor a IA que es genuinamente mejor que la regex que usted escribió en 2022. Actívela.
Variantes de copy para nurture. Líneas de asunto, texto de vista previa, tres variantes de cuerpo de copy para secuencias de nurture. Trate el resultado de la IA como un borrador, no como un envío. Un patrón que funciona: instruya a Claude con la oferta, el persona, la etapa del funnel y tres de sus envíos pasados de mejor rendimiento. Obtenga cinco variantes. Elija dos para una prueba A/B/n. La IA es mala conociendo la voz de su marca; es aceptable produciendo copy estructuralmente variado más rápido de lo que un redactor humano puede.
Detección de anomalías en datos del funnel. Caídas de conversión semana a semana, picos en el llenado de formularios, rarezas en los canales de atribución, cambios en el volumen de MQL que no coinciden con cambios en el gasto de campaña. Puede montar esto con un simple cron job y una llamada a la API de Claude contra su snapshot del funnel. Detecta las cosas que habría notado dos semanas más tarde cuando el VP de Marketing preguntara por qué el pipeline estaba flojo.
Cada elemento de esta lista comparte una propiedad: el costo de equivocarse es bajo y el trabajo es de alto volumen. Ese es el punto óptimo de la IA en MOps. Aburrido, repetible, indulgente.
Dónde se rompe la IA
Ahora los modos de fallo. Estos importan más que las victorias porque los fallos son donde el liderazgo más quiere usar la IA.
Afirmaciones causales. "Esta campaña causó pipeline" no es algo que un modelo de lead scoring o de atribución sepa. Es correlación disfrazada de causalidad, a veces con una puntuación de confianza adjunta para más teatro. Ninguna IA de su stack ha realizado un experimento controlado. Ninguna tiene un contrafactual. Cuando un proveedor dice que su modelo "identifica las campañas que impulsan los ingresos", quiere decir "clasifica campañas por asociación con closed-won". Esa es una lista útil. No es causalidad. No deje que el CFO piense que lo es.
La verdad de la atribución. La multi-touch attribution con ponderación de IA todavía no puede ver el dark social, las conversaciones de ventas, las referencias de pares ni la fuente autoinformada. Un comprador que escuchó de usted en un podcast, buscó su nombre tres semanas después e hizo clic en un anuncio de pago se acredita como pago. El modelo no sabe que el podcast existió. La ponderación de IA sobre datos malos es solo datos malos con confianza. La self-reported attribution en el formulario de demo es más honesta que su herramienta de MTA de 40.000 dólares al año, y esa es una colina por la que vale la pena morir.
Manejo de excepciones. La IA enruta bien el caso del 95%. Es el 5% estratégico el que se rompe. El lead de un director Fortune 100 que usó una dirección personal de Gmail se puntúa como un curioso sin intención de compra. La cuenta que ha estado fría seis meses pero acaba de contratar a un nuevo VP de Operaciones no mueve la aguja del modelo porque las variables firmográficas no cambiaron. La empresa de 80 personas que rinde por encima de su tamaño se enruta a SMB aunque su caso de uso sea enterprise. Usted tiene que construir un humano en el bucle para estos, y el proveedor de IA le dirá que eso es una solicitud de función para el próximo trimestre.
El matiz del ICP. El modelo aprende "tamaño de empresa más industria más tech stack". No aprende "acaban de contratar a un VP de Ops" ni "su CEO publicó en LinkedIn que quiere consolidar proveedores" ni "fueron clientes hace dos años y se fueron por una integración que desde entonces hemos arreglado". Esas son las señales de compra reales. El modelo las ignora porque no están en el conjunto de variables, y no están en el conjunto de variables porque son difíciles de capturar. El ICP es un objetivo móvil y el scoring de IA es una instantánea.
El patrón: la IA se rompe donde el trabajo requiere razonamiento causal, juicio sobre excepciones o conocimiento que vive fuera de los datos estructurados. Ese es el 20% estratégico de MOps. El 20% que determina si el marketing es un centro de costos o un motor de ingresos.
La trampa del "lead scoring con IA"
Esto merece su propia sección porque es la función de IA más sobrevendida de todo el stack de marketing.
Esto es lo que "lead scoring predictivo" realmente significa en la mayoría de los MAP: una regresión logística sobre aproximadamente ocho variables, reentrenada trimestralmente sobre lo que su CRM llame "closed-won". A veces un árbol con gradient boosting si el proveedor quiere poner "impulsado por ML" en la insignia. Las variables son las obvias: vistas de página, aperturas de email, llenados de formulario, solicitudes de demo, firmográficos. La etiqueta de entrenamiento es desordenada porque los datos de su CRM son desordenados. El ritmo de reentrenamiento es demasiado lento para captar los cambios del mercado.
Esto no es un golpe a la regresión logística. La regresión logística está bien. El problema es la brecha entre lo que el proveedor insinúa ("la IA predice qué leads cerrarán") y lo que el modelo hace ("clasifica leads por correlación histórica con una etiqueta de resultado ruidosa").
Cómo auditarlo sin un equipo de ciencia de datos:
- Extraiga los últimos 90 días de MQL de su MAP, con su puntuación en el momento del MQL.
- Únalos a los resultados reales de conversión a SQL. ¿El rep lo aceptó? ¿Se convirtió en una oportunidad? ¿Cerró?
- Agrupe por decil de puntuación. Calcule la tasa de conversión a SQL para cada grupo.
- Grafique. Si es una curva monótona limpia, el modelo está haciendo trabajo real. Si es ruidosa o plana, el modelo es decoración.
Una segunda comprobación: extraiga sus 50 mejores acuerdos closed-won del año pasado. ¿Cuál era su puntuación en el momento del MQL? Si la mitad de ellos estaban por debajo del umbral de MQL, su modelo está perdiendo los acuerdos que más importan. De ahí viene cada historia de "comité de compra Fortune 500 puntuado como basura".
Ejecute esta auditoría anualmente. Ejecútela antes de renovar el MAP. Ejecútela antes de dejar que el liderazgo reorganice el enrutamiento alrededor de la puntuación. El modelo es una herramienta, no una verdad.
6sense o Demandbase más Claude como stack
Este es el workflow que supera a cualquier cosa que un solo proveedor venda.
La plataforma de intención le dice qué cuentas están en mercado. 6sense y Demandbase son ambas adecuadas en esto; elija la que su equipo ya usa, no cambie por una afirmación de precisión del 3%. Exporte la lista de cuentas en mercado semanalmente. Superponga datos firmográficos de su CRM. Superponga datos de engagement de su MAP.
Ahora la parte de la que nadie le habla: entregue ese conjunto de datos unido a Claude (o ChatGPT, pero para análisis de cohortes me inclino por Claude. Menos hechos de empresa alucinados, mejor para decir "los datos no respaldan eso"). Haga preguntas de cohorte:
"Aquí hay una lista de 240 cuentas marcadas como en mercado esta semana, con firmográficos, puntuaciones de engagement y fechas de último contacto. Agrúpelas en 4-6 cohortes significativas. Para cada cohorte, deme los atributos definitorios, la jugada sugerida y la suposición más arriesgada que estaría haciendo al tratarlas como un grupo."
Ese es un prompt de una sola pasada que, sobre un conjunto de datos limpio, le da algo más útil que tres días de análisis de demand gen. Obtiene cohortes. Obtiene agrupaciones con hipótesis comprobables. Obtiene una lista de lo que está suponiendo. Luego puede informar a ventas con una hoja de una página en lugar de un export de 4.000 filas.
La combinación (intención de terceros para qué, análisis de cohortes con IA para por qué) supera a cualquiera por separado. El proveedor de intención no conoce su movimiento de ventas. Claude no sabe quién está investigando su categoría. Juntos lo llevan a un brief.
Una nota sobre el costo: este workflow le cuesta una clave de API de Claude y una hora. Los complementos del proveedor que prometen lo mismo cuestan cinco cifras y rinden por debajo. Las cuentas del ROI no son sutiles.
Un plan de 30 días
Si está leyendo esto porque alguien por encima de usted dijo "¿cuál es nuestra estrategia de IA para operaciones de marketing?" y tiene hasta fin de mes, aquí está el plan.
Semana 1. Audite lo que ya tiene. Liste cada lugar donde su stack afirma tener IA. HubSpot AI, Marketo Predictive, la capa de scoring de 6sense, la IA de enriquecimiento de ZoomInfo, la "priorización inteligente" de la herramienta del SDR. Anótelo. Note cuáles dos tocan los ingresos más directamente, normalmente el lead scoring y la clasificación de intención. Esos son sus objetivos de auditoría.
Semana 2. Valide uno. Elija el modelo de lead scoring. Ejecute la auditoría de score-decil-vs-conversión-a-SQL de antes en esta guía. Documente lo que encuentre. Escriba un memo de una página: "Nuestro modelo de lead scoring está/no está haciendo trabajo real, aquí está el gráfico, aquí está lo que deberíamos cambiar." No lo envíe todavía.
Semana 3. Añada un nuevo caso de uso de la lista de victorias. Opciones de menor riesgo: automatización de dedupe si su CRM está desordenado, o generación de variantes de copy si demand gen está hambriento de contenido de nurture. Mayor apalancamiento pero más difícil: detección de anomalías en datos del funnel usando una llamada a la API de Claude contra su snapshot semanal. Elija uno. Despliéguelo.
Semana 4. Escriba el memo. Una página, tres secciones: en qué confiamos, en qué no, qué compraríamos después. Compártalo con el VP de Marketing y RevOps. El memo es el entregable. La auditoría y el nuevo caso de uso son la evidencia. El plan supera al palabrerío siempre, especialmente cuando el liderazgo ha estado en una conferencia y ha vuelto con opiniones.
Este plan de 30 días es lo que separa a la persona de MOps que sobrevive al ciclo de la IA de la que queda atrapada defendiendo afirmaciones del proveedor que ella no hizo.
Opcional: a través de la lente del ACE Framework
Para equipos que mapean el trabajo de IA formalmente, el ACE Framework le da cinco capacidades (Ingest, Analyze, Predict, Generate, Execute) y una forma de ver dónde se agrupan sus inversiones en IA. Mapeando el workflow de MOps:
- Ingest. Datos de intención de 6sense o Demandbase, enriquecimiento de ZoomInfo o Clearbit, firmográficos normalizados. La IA es sólida aquí.
- Analyze. Análisis de cohortes con Claude, detección de anomalías en datos del funnel, auditorías de lead scoring. Esta es la capacidad más infrautilizada en la mayoría de los stacks de MOps.
- Predict. Lead scoring, scoring de oportunidades, predicción de churn. Lleno de salvedades. Audite anualmente.
- Generate. Variantes de copy, borradores de emails, líneas de asunto, variantes de prueba A/B/n. Trátelo como borrador.
- Execute. Automatización de enrutamiento, cumplimiento de SLA, alertas. Valor real, pero las reglas de negocio importan más que la IA.
La mayoría de los equipos de MOps invierten en exceso en Predict (porque los proveedores lo venden con más fuerza) e invierten por debajo en Analyze (porque no hay insignia para eso). Invertir esa proporción es una de las jugadas de mayor apalancamiento que puede hacer este año.
Qué preguntarle al proveedor
Una lista corta para tener en su teléfono para su próxima demo:
- Muéstreme el conjunto de prueba reservado. ¿Cuál fue la precisión del modelo sobre datos con los que no fue entrenado?
- ¿Qué variables usa el modelo? ¿Con qué frecuencia se reentrena? ¿Con datos de quién, los míos o un fondo global?
- ¿Cuál es la curva de score-decil-a-conversión de su cliente promedio? Muestre el gráfico.
- ¿Puedo exportar las predicciones del modelo y unirlas a mis resultados? ¿Cómo?
- ¿Cuál es su postura sobre las afirmaciones causales? ¿Este modelo identifica impulsores o muestra correlaciones?
- Cuando el modelo se equivoca, ¿cuál es el recurso? ¿Puedo anularlo? ¿Puedo reentrenar solo con mis datos?
Observe la cara del proveedor en la pregunta uno. Ese es el diagnóstico.
La conclusión
La IA en operaciones de marketing es un multiplicador de fuerza sobre el trabajo aburrido (higiene, dedupe, borradores de copy, clasificación de intención, detección de anomalías) y un lastre sobre el trabajo que requiere razonamiento causal: atribución, excepciones estratégicas, matiz del ICP, predecir qué cierra. El trabajo del MOps IC que sobrevive a este ciclo es saber cuál es cuál y decirlo en voz alta cuando el liderazgo pregunte.
No tiene que ser anti-IA. Tiene que ser anti-relleno. La persona de MOps que puede decirle a un proveedor "muéstreme el conjunto de prueba reservado" sin pestañear, que puede auditar un modelo predictivo en una tarde, que puede escribir el memo de una página que explica en qué confiar y en qué no: esa persona es dueña de su carrera durante la próxima década. El rol se vuelve más difícil. El apalancamiento se vuelve más grande. El listón para "estoy usando IA" sube cada trimestre.
Empiece por la auditoría. Ejecútela el lunes. El resto se desprende de ahí.
Más información

Principal Product Marketing Strategist