Probablemente esté haciendo demasiadas pruebas A/B. Esto es lo que debe hacer en su lugar

Harvard Business Review Wake-Up Call Spanish

Las pruebas A/B son el estándar de oro de la experimentación. Su objetivo es ayudar a las empresas a tomar decisiones más rápidas, mejores y basadas en datos. Pero, con demasiada frecuencia, ocurre lo contrario. La reunión comienza con optimismo: una nueva idea de precios, diseño publicitario o pantalla de registro entra en una prueba A/B. Tras semanas de espera, los analistas regresan con valores p, umbrales de confianza del 95% y una conclusión ya conocida: "Deberíamos esperar a tener más datos. Aún no tenemos suficiente evidencia y no es estadísticamente significativa".

Esperar a tener "suficientes datos" se siente seguro, pero consume tiempo, participación y crecimiento. Hay una razón para ello: los métodos estadísticos comunes recompensan la inacción.

En lugar de juzgar si un resultado es lo suficientemente significativo, los equipos deberían evaluar qué decisión minimiza la pérdida en el peor escenario. Esta guía surge de un marco de decisión denominado "arrepiento minimax asintótico" (AMMR).

Read more!

El AMMR muestra cómo actuar utilizando pruebas A/B, manteniendo al mismo tiempo el rigor estadístico que se espera de los equipos modernos de analítica y conservando mecanismos de protección para los casos en los que la decisión ejecutiva pudiera resultar incorrecta, al limitar las pérdidas en el peor escenario.

Así es como se aplica el AMMR en cuatro pasos:

1. FORMULE LA PREGUNTA CORRECTA.

En esencia, el AMMR reduce cada decisión de prueba a un único umbral: lance la nueva idea si su incremento estimado supera su costo de implementación por cliente. En otras palabras, "elija al ganador". Esta lógica, que durante mucho tiempo fue intuida por profesionales como Jeff Bezos, ahora cuenta con un respaldo riguroso.

Los ejecutivos ya piensan en términos de economía unitaria. El AMMR simplemente lo hace explícito y añade salvaguardas, de modo que los equipos de datos puedan trabajar con los ejecutivos, no en su contra. Por lo tanto, no pida a su equipo que recopile evidencia solo para lograr que el valor p sea < 0.05. El AMMR replantea las pruebas como una decisión de negocio: ¿Qué opción es más probable que genere más valor, teniendo en cuenta lo que ya sabemos?

2. HAGA EXPLÍCITO EL ANÁLISIS DE COSTO/BENEFICIO DE LA ALTA DIRECCIÓN (EN TÉRMINOS POR CLIENTE).

La mayoría de las decisiones de despliegue implican costos por cliente (o por unidad), por ejemplo, 1.7 dólares por cada talonario de cupones promocionales enviado o 0.03 dólares por cada chat de soporte adicional. Estos costos también incluyen tarifas de proveedores, infraestructura incremental, carga operativa y cualquier mínimo contractual prorrateado por usuario o cliente.

El AMMR convierte esos costos en un umbral de decisión, imponiendo disciplina: los equipos no pueden recomendar lanzamientos cuya economía unitaria esperada no supere sus propios costos de implementación. Este es el criterio de decisión:

-- Lance si el incremento estimado por cliente es ≥ al costo unitario de implementación.

-- Deténgase si es inferior.

3. EXIJA RESULTADOS EXPRESADOS EN TÉRMINOS DE NEGOCIO.

Indique a su equipo de analítica que reporte tres elementos en cada prueba A/B:

-- Decisión (basada en AMMR): ¿Lanzar o detenerse?

-- Pérdida esperada en el peor escenario si seguimos esa decisión (en dólares/KPIs).

-- Tamaño de muestra necesario para limitar la pérdida a un objetivo que usted defina (por ejemplo, "mantener la pérdida diaria de ingresos en el peor escenario por debajo de 10,000 dólares").

Por qué funciona: la pérdida en el peor escenario escala linealmente con el error estándar del ATE (efecto promedio del tratamiento). Esto le brinda una palanca clara: si el límite de pérdida actual es demasiado alto, usted sabe exactamente cuánta recolección adicional de datos se necesita para reducirlo al nivel deseado y asegurarse de que un posible error no resulte demasiado costoso.

4. CIERRE EL CICLO PARA EL APRENDIZAJE ESTRATÉGICO.

Como el AMMR expresa todo en el KPI que usted gestiona, facilita el aprendizaje posterior al lanzamiento.

Dado que todo se mide en el KPI que usted administra, puede comparar pronósticos con resultados y refinar los umbrales futuros. Puede preguntarse: ¿La acción generó el valor que esperábamos? Si no fue así, ¿la variabilidad fue mayor de lo previsto o el efecto fue menor? Utilice esas respuestas para ajustar el próximo límite de pérdida objetivo y el plan de muestreo de su siguiente prueba.

Read more!