Tu posición subió 6 lugares este trimestre. ¿Fue el retail media, el cambio de empaque, la promo del 12.12, las reseñas que finalmente cruzaron las 200, o que tu competidor más fuerte se quedó agotado dos semanas? Spoiler: probablemente fue una mezcla. La pregunta operativa no es "cuál fue" sino "qué peso tuvo cada uno".

En los dos artículos anteriores construimos el termómetro (posición orgánica ponderada) y la matriz (orgánico cruzado con SOV pagado). Esos dos te dicen si estás ganando o perdiendo. Pero eventualmente alguien — el CFO, el VP de Marketing, tu agencia — va a hacer la pregunta más difícil: "Si estamos ganando, ¿qué está siendo el motor?". Y no se puede contestar bien con solo el termómetro y la matriz. Necesitas un detective.

Este artículo trata de la tercera capa: atribución multivariable observacional. Cómo descomponer el movimiento de la posición en sus probables causas, sin necesitar un experimento de geografía formal de seis meses. No es atribución causal pura, pero es decisión-útil — y eso es lo que el negocio realmente necesita.

La atribución perfecta no existe (y por qué los que la prometen exageran)

Empecemos por aclarar algo que muchos vendedores de "soluciones de atribución" no van a admitir: la atribución causal pura es un problema teóricamente insoluble en el contexto de retail media operacional.

¿Por qué? Porque la atribución causal requiere que tengas un mundo paralelo idéntico al tuyo, excepto sin el anuncio que estás midiendo. Como no existe ese mundo, todos los métodos de atribución son aproximaciones — algunas mejores, otras peores. La buena noticia es que algunas aproximaciones son lo suficientemente buenas para tomar decisiones de presupuesto.

La mala noticia es que el mercado está lleno de productos que prometen "atribución de retail media con precisión causal" y que en realidad están haciendo correlación inteligente y vendiéndola como causalidad. La regla rápida para detectarlos: si el dashboard te da un número sin intervalos de confianza, sin caveats sobre confounders, y sin instrucciones específicas sobre experimentos de validación, está exagerando.

El detective real no te entrega "el culpable". Te entrega una lista de sospechosos ordenada por probabilidad, con la cuerda de evidencias para cada uno, y te dice "con la información disponible, el sospechoso más probable es X, pero no descarto Y. Si quieres confirmarlo necesitamos hacer este experimento". Esa es la postura honesta. Esa es la atribución observacional bien hecha.

Las 6 variables que casi siempre importan

En retail media para CPG, hay seis variables que casi siempre tienen efecto medible sobre la posición orgánica de un producto. Son los inputs del modelo. Si tu data captura estos seis, ya tienes el 80% del problema resuelto:

  1. Tu sponsored share-of-voice por keyword. Cuánto estás comprando del espacio pagado.
  2. Tu precio relativo a la categoría. Tu precio dividido por la mediana o promedio de los SKUs comparables. Un producto 30% más caro que el promedio enfrenta resistencia mecánica del ranker.
  3. Promociones activas y profundidad. Si estás corriendo una promo de 20% en el momento del pick, tu velocidad de ventas se acelera y el ranker lo registra. Importa el flag (sí/no), la duración y la profundidad.
  4. Content score / completitud del listing. Calidad y cantidad de imágenes, descripciones, atributos llenos, presencia de video. VTEX y Walmart calculan explícitamente un "listing quality score" que es input directo del ranking.
  5. Velocidad de reseñas y rating promedio. Cuántas reseñas nuevas estás recibiendo por semana, qué rating promedio mantienen. Las reseñas son el input social del ranker.
  6. Acciones de la competencia. Su SOV pagado, sus precios, sus agotados, sus lanzamientos. La posición orgánica es un juego relativo: tu posición sube cuando los competidores caen, no solo cuando tú mejoras.

Hay otras variables que importan menos (estacionalidad, eventos del retailer, lanzamientos propios), pero estas seis son las que mueven el grueso. Si las tienes registradas semana a semana junto con tu posición orgánica, tienes la materia prima del modelo.

El modelo observacional en lenguaje humano

Vamos a explicar el modelo sin usar las palabras "regresión" ni "panel" hasta que sea estrictamente necesario.

La pregunta del detective es: "Dado que tu posición orgánica para una keyword cambia cada semana, ¿cuál de las seis variables se mueve junto con ella, y con qué consistencia?".

Si tu SOV pagado sube y dos semanas después tu posición sube, y eso pasa consistentemente en 80% de tus keywords, hay buena evidencia de que el SOV está moviendo la posición. Si tu SOV sube y la posición no se mueve en ningún lado, hay buena evidencia de que el SOV no es el motor — al menos no en esta categoría con esta inversión.

Si tu precio cae 5% y dos semanas después la posición sube, y eso pasa consistentemente, evidencia de que el precio importa. Si tu precio cae 5% y la posición no responde, evidencia de que el precio no es el motor.

Esto se hace formalmente con lo que en estadística se llama regresión de panel con efectos fijos por SKU y semana. El nombre asusta pero la intuición es la que acabamos de describir: estás buscando qué variables se mueven junto con la posición, controlando por características fijas del SKU y por movimientos generales del mercado en cada semana.

El output del modelo no es "el SOV pagado movió tu posición 3 lugares este trimestre". El output es "un aumento de 10 puntos en SOV pagado se asocia con una mejora de 1.4 lugares en la posición orgánica, con un intervalo de confianza de 0.8 a 2.0 lugares". Es un rango, no un número. Es un coeficiente, no una sentencia. Es honestidad estadística.

La trampa de la endogeneidad (en lenguaje de fútbol)

Hay una trampa importante que vale la pena nombrar antes de seguir: la endogeneidad. Suena académico pero el concepto es simple.

El modelo observacional asume que las variables se movieron de forma "más o menos independiente" entre sí. Pero en retail media eso es falso. Tú no inviertes SOV pagado al azar — inviertes más en los SKUs y semanas donde crees que va a funcionar, contra los competidores que más te preocupan, en las temporadas donde más se vende. La inversión está correlacionada con todo lo demás.

Analogía simple: imagínate que estás midiendo "¿el entrenador motiva al equipo?" y observas que cuando el entrenador grita más fuerte, el equipo gana más. Conclusión naïve: gritar funciona. Pero si el entrenador grita más fuerte cuando ve que el equipo está perdiendo, y el equipo a veces da vuelta el partido por sus propias razones, la correlación entre "gritar" y "ganar" puede estar confundiendo causa y efecto.

En retail media pasa exactamente eso: inviertes pesado en las semanas donde tu competidor ataca, y a veces ganas porque inviertes y a veces ganas porque el competidor se desinfló. El modelo observacional no puede distinguir limpiamente entre las dos.

¿Qué se hace con eso? Tres respuestas honestas:

  1. Reportar coeficientes con esa caveat explícita. "Probablemente hay sesgo positivo de endogeneidad, así que el coeficiente real es ≤ X."
  2. Cruzar SKUs y semanas suficientes para que el ruido se promedie. Con 200 SKUs por 52 semanas por 5 retailers tienes 52,000 observaciones — eso amortigua mucho ruido idiosincrático.
  3. Validar con experimentos puntuales. Una vez al año, geo holdout en tu mayor línea para chequear que las direcciones del modelo observacional se sostienen en un experimento controlado.

Por qué "direccionalmente positivo" es decisión-útil

Hay una crítica común al modelo observacional desde el lado purista: "tu coeficiente está sesgado, no es causal, no me sirve para tomar decisiones".

La respuesta es: depende de qué decisión.

Decisión 1: "¿Cierro la línea de retail media?" Para esta decisión necesitas atribución causal pura — un experimento de geografía. El modelo observacional no alcanza, porque la decisión es discreta (sigues o paras) y costosa de revertir.

Decisión 2: "¿Subo el bid 20% en estas 50 keywords?" Para esta decisión, un coeficiente sesgado pero direccionalmente positivo es plenamente suficiente. Si el modelo dice "subir SOV se asocia con mejora de posición, en el rango de 0.8-2.0 lugares por cada 10pp de SOV", la decisión es razonable: subir el bid en las keywords prioritarias y medir. No necesitas el coeficiente exacto para hacerlo.

Decisión 3: "¿Reasigno presupuesto del retailer A al retailer B?" Acá el modelo observacional es exactamente la herramienta correcta — está hecho para decisiones de asignación incremental. Causa-efecto perfecto sería bonito pero no es necesario.

La mayoría de las decisiones de retail media son de la categoría 2 y 3: asignaciones incrementales semana a semana, trimestre a trimestre. Para esas decisiones, "direccionalmente positivo con intervalo de confianza" es la moneda correcta. Atribución causal perfecta es un objetivo de fin de año, no de operación.

La frase a recordar: mejor que la oscuridad absoluta. No es una rendición — es la postura honesta sobre lo que la atribución observacional puede y no puede hacer.

Cuándo SÍ necesitas un experimento real

Hay tres situaciones en las que el modelo observacional no alcanza y tienes que hacer un experimento controlado:

  1. Cuando la decisión es grande e irreversible. Reducir 50% del presupuesto de una RMN, cerrar una línea, cambiar de agencia. Acá vale la pena las 4-8 semanas y los costos de un geo holdout.
  2. Cuando el modelo dice algo que va contra tu intuición fuerte. Si el modelo dice "tu inversión en Mercado Libre Ads no está moviendo nada" y tu intuición dice "imposible, debería estar moviéndose", el experimento controlado dirime. Una de las dos está mal.
  3. Cuando la inversión es tan grande que el costo del experimento es marginal. Si gastas 20% de tus ingresos en retail media, gastar el 1% adicional para hacer un geo holdout anual es trivial. Es el chequeo de calibración del sistema.

Para todo lo demás, el modelo observacional es la herramienta correcta.

Cómo se hace un geo holdout, en cinco líneas: divides tu footprint geográfico en grupos comparables de mercados, mantienes pauta normal en unos y la pausas (o reduces) en otros durante 4-8 semanas, comparas la trayectoria de ventas entre los grupos. Es la metodología de Meta Conversion Lift y Google Ads Geo Experiments. Funciona limpiamente para off-site retail media (display programmatic). Para on-site sponsored search es más complicado, requiere coordinación con el retailer, y muchas RMNs todavía no tienen las herramientas para soportarlo bien.

El estándar IAB/MRC: lo que la industria está acordando reportar

En enero 2024, IAB y el Media Rating Council (MRC) publicaron las primeras Retail Media Measurement Guidelines — la respuesta formal de la industria al "cada retailer es su propia caja negra". El Executive Playbook complementario, desarrollado con Boston Consulting Group, traduce las definiciones en pasos accionables. IAB Europe publicó su versión en abril 2024, construida sobre el estándar US.

Tres puntos del estándar que importan para el modelo observacional:

Lo que el IAB/MRC no resuelve: el conflicto de interés estructural. El retailer puede ser 100% IAB-compliant en cómo cuenta impresiones y atribuye conversiones, y aún así estar reportando solo lo que le conviene mostrar. El estándar empareja vocabulario; la verificación independiente sigue siendo necesaria.

Cómo se alimenta el modelo en la práctica

El modelo observacional vive o muere por la calidad de los inputs. Si registras tres de las seis variables en lugar de las seis, el modelo es mucho más débil. Si registras las seis pero solo en 50 keywords y 3 SKUs, no hay variación suficiente para estimar coeficientes confiables.

ePerfectStore.com alimenta el modelo con scraping consistente de las seis variables a escala:

Con esos inputs, una marca puede correr el modelo internamente con su equipo de analytics, o usar la salida pre-procesada que ePerfectStore entrega como dashboard. Lo importante no es el algoritmo específico — es la disponibilidad consistente de los datos. La mayoría de las marcas no tienen el modelo porque no tienen los datos, no porque no tengan los analistas.


En resumen

Pregunta Lo que aplica
¿Qué es el modelo? Atribución observacional: relacionar posición orgánica con 6 variables semana a semana.
¿Es causal? No. Es direccional, con sesgo conocido por endogeneidad.
¿Para qué sirve? Decisiones incrementales: subir/bajar bid, reasignar presupuesto entre retailers o keywords.
¿Para qué NO sirve? Decisiones discretas grandes (cerrar línea, cambiar de agencia). Acá usas geo holdout.
¿Cuándo experimentas? Anualmente en tu mayor línea + cada vez que el modelo contradice intuición fuerte.

El modelo de atribución observacional no es magia y no es atribución causal pura. Es una herramienta de detective: te entrega los sospechosos ordenados por probabilidad y te dice cuál perseguir primero. Para la mayoría de las decisiones de retail media — asignaciones incrementales de presupuesto entre retailers, entre keywords, entre SKUs — esa es exactamente la información que necesitas.

Donde el modelo se queda corto, los experimentos puntuales toman la posta. Donde el modelo es suficiente, evita el costo y la lentitud de los experimentos. La combinación de ambos — modelo observacional continuo + experimentos puntuales anuales — es lo más cercano a un sistema operativo de medición de retail media que existe hoy.

En el último artículo de la serie cerramos con la capa que paga su propio costo todos los días: scraping operacional en tiempo real para detectar agotados de la competencia, cambios de precio y oportunidades de bidding inteligente.

Fuentes

¿Quieres correr atribución observacional sobre tu portafolio en LATAM? ePerfectStore.com captura las seis variables clave en todos los retailers, semana a semana, listas para alimentar tu modelo.

Volver al Blog