Research Mom Test: Validación de Problemas contra la Realidad del Campo (Artículo 3 de 7)

Serie Gemba: AI Mercadona User Story Framework — De PRDs validados a JTBDs con evidencia real

mar 09, 2026

Introducción: El Abismo entre lo que Creemos Saber y lo que Realmente Sucede

Existe un momento crítico en el viaje de cualquier producto digital: el instante justo después de haber finalizado un Documento de Requerimientos de Producto (PRD). El equipo siente la satisfacción de haber articulado claramente qué se va a construir, por qué, y cuál será el impacto. Los números están en la hoja de cálculo. Las métricas de éxito definidas. Los casos de uso mapeados.

Pero hay un problema silencioso: el PRD describe el problema desde la perspectiva del negocio, pero las mejores historias de usuario se construyen desde la perspectiva del usuario. Entre esos dos universos existe un abismo lleno de suposiciones no cuestionadas, contextos incompletos, y comportamientos que nadie ha observado realmente.

En el artículo anterior exploramos cómo Quality Guard verifica que el PRD contenga información suficiente y separada (problema vs. solución) para que el producto pueda diseñar bien. Pero ahora nos enfrentamos a la pregunta siguiente: ¿Es ese problema realmente lo que el usuario experimenta?

Esta es la pieza que introduce Research Mom Test, el tercer módulo del AI Mercadona User Story Framework.

El Mom Test: La Filosofía de la Investigación Honesta

El nombre “Mom Test” viene de un concepto acreditado a Rob Fitzpatrick en su libro del mismo nombre. La idea es devastadoramente simple: si le preguntas a tu madre si tu idea de negocio es buena, te dirá que sí, porque te quiere. No porque la idea sea buena.

El Mom Test propone que las preguntas de investigación deben diseñarse para que incluso tu madre no pueda darte una respuesta falsa. Esto se logra evitando tres tipos de preguntas tóxicas:

Preguntas tóxicas que Mom Test prohíbe:

Preguntas de opinión: “¿Te gustaría...?”, “¿Qué opinas de...?”, “¿Sería útil si...?”
Preguntas hipotéticas: “¿Usarías X si existiera?”, “¿Cuánto pagarías por...?”, “¿Cambiarías tu proceso si...?”
Preguntas dirigidas: “¿No crees que sería mejor si...?”, “¿El problema principal es X, verdad?”

En su lugar, Mom Test exige preguntas sobre comportamiento real, pasado, observable:

“Cuéntame la última vez que hiciste X. ¿Qué pasó?”
“¿Qué hiciste cuando ocurrió Y?”
“¿Cómo resuelves Z actualmente?”
“¿Cuánto tiempo te lleva?”
“¿Qué intentaste antes de hacer lo que haces ahora?”

La clave es que estas preguntas revelan comportamiento real, no intención declarada. Y en Mercadona, donde cada cambio de proceso en un almacén puede impactar a 1,800 empleados, la diferencia entre intención declarada y comportamiento real puede costar millones.

Cómo Research Mom Test Transforma PRDs en Investigación de Campo

En el AI Mercadona User Story Framework, Research Mom Test recibe un PRD que ha pasado Quality Guard. El PRD contiene: métricas baseline y target, proceso AS-IS y TO-BE, actores y handoffs, y un problema limpio sin contaminación de solución.

Research Mom Test analiza este PRD y genera automáticamente:

1. Gap Detection (Detección de Huecos): Identifica qué información falta en el PRD para poder construir buenas historias de usuario. Busca: suposiciones no validadas, comportamientos asumidos pero no observados, actores mencionados pero no entrevistados, métricas que dependen de datos no recopilados, y procesos descritos teóricamente pero no verificados en campo.

2. Guía de Entrevistas Mom Test: Para cada gap detectado, genera preguntas de entrevista que cumplen estrictamente Mom Test. No preguntas de opinión. No hipotéticas. Solo preguntas sobre comportamiento real, pasado, observable.

3. Jobs-to-be-Done (JTBD) Reforzado: Después de las entrevistas, Research Mom Test procesa las notas y genera JTBDs enriquecidos con evidencia real: citas directas, patrones observados, frecuencia, contexto emocional.

Gap Detection: Encontrar lo que No Sabemos que No Sabemos

La parte más valiosa de Research Mom Test es su capacidad para detectar huecos en el conocimiento. Hay tres categorías:

Gaps de Proceso Funcional (PF): Información faltante sobre cómo funciona el proceso actual. Ejemplo: el PRD dice que “recepcionistas procesan pallets” pero no dice cuántos pallets por turno, cuánto dura cada procesamiento, o qué pasa cuando hay 3 camiones simultáneos.

Gaps de Inventario de Secciones (PI): Información faltante sobre las secciones o áreas afectadas. Ejemplo: el PRD menciona “almacén” pero no especifica si aplica a refrigerados, secos, congelados, o todos. Cada sección puede tener flujos diferentes.

Gaps de Contexto de Usuario: Falta de comprensión sobre cómo los usuarios realmente interactúan con el proceso. Qué workarounds usan, qué frustraciones tienen, qué han intentado antes.

La Guía de Entrevistas: Preguntas que Revelan Verdad

Para cada gap detectado, Research Mom Test genera preguntas de entrevista específicas. Un ejemplo real del almacén de Lleida:

Gap detectado: “El PRD asume que las discrepancias en recepción son un problema grave, pero no sabemos con qué frecuencia ocurren realmente, ni cómo las resuelven los recepcionistas.”

Preguntas Mom Test generadas:

“Cuéntame sobre la última vez que recibiste un pallet con algo diferente a lo esperado. ¿Qué pasó exactamente?”
“¿Cómo supiste que había una discrepancia? ¿Qué hiciste después?”
“¿Cuántas veces esta semana te pasó algo así? ¿Es típico?”
“Cuando encontraste la discrepancia, ¿a quién le avisaste? ¿Cuánto tardó en resolverse?”
“¿Alguna vez inventaste una forma de resolver esto más rápido por tu cuenta? Cuéntame.”

Estas preguntas no preguntan “te gustaría un sistema mejor”. Preguntan “qué haces hoy”. La diferencia es fundamental.

Research Mom Test también genera preguntas para cada rol diferente. Para el recepcionista, para el analista de almacén, para el supervisor, para el operador logístico. Cada uno ve el proceso desde un ángulo diferente.

JTBD Reforzado: Jobs-to-be-Done con Evidencia Real

Después de las entrevistas, llega el momento más transformador: convertir las respuestas en Jobs-to-be-Done enriquecidos con evidencia.

Un JTBD tradicional dice: “Cuando [situación], quiero [motivación], para poder [resultado esperado].”

Un JTBD Reforzado en nuestro framework añade capas críticas:

Funcional: ¿Qué tarea específica necesita completar?
Emocional personal: ¿Cómo quiere sentirse durante y después?
Emocional social: ¿Cómo quiere ser percibido por colegas/supervisores?
Cambio de comportamiento: ¿Qué debería empezar (START), dejar de hacer (STOP), o hacer diferente (DIFFERENT)?
Evidencia de entrevista: Citas directas y observaciones que soportan cada JTBD

Ejemplo real del almacén de Lleida:

JTBD Funcional: “Cuando recibo un pallet con discrepancias, necesito poder registrar la diferencia y obtener una decisión inmediata sobre qué hacer con los items sobrantes o faltantes, para no tener que parar mi flujo de trabajo esperando al analista.”

JTBD Emocional Personal: “Quiero sentir que tengo control sobre mi zona de trabajo y que puedo resolver problemas sin depender de otra persona que a veces no está disponible.”

JTBD Emocional Social: “Quiero que mi supervisor vea que manejo discrepancias de forma profesional y rápida, sin generar colas en el muelle.”

Evidencia: 3 de 5 recepcionistas entrevistados mencionaron esperar entre 15-45 min al analista. Uno dijo: “A veces resuelvo yo solo porque ya sé lo que hay que hacer, pero después me reganan por no seguir el proceso.”

Dos Modos de Operación: Discover y Validate

Research Mom Test opera en dos modos según el estado del PRD:

Modo Discover: Cuando el PRD tiene gaps significativos. La investigación es exploratoria. Se busca entender el territorio completo. Preguntas abiertas, observación en campo, seguimiento de workarounds. Resultado: mapa completo de JTBDs con evidencia.

Modo Validate: Cuando el PRD está bastante completo pero necesita confirmación. La investigación es confirmatoria. Se busca validar que lo que asumimos es correcto. Preguntas más específicas, verificación de hipótesis. Resultado: JTBDs confirmados o corregidos.

En ambos modos, Research Mom Test SIEMPRE se ejecuta. No hay camino del PRD a las historias de usuario que no pase por investigación de campo. Es un principio no negociable del framework.

El Wendel Checklist: Validando Cambio de Comportamiento

Una innovación importante de nuestro framework es integrar el Wendel Checklist (inspirado en los principios de diseño conductual de Stephen Wendel) en la validación de JTBDs.

La idea: cada JTBD implica un cambio de comportamiento. Si queremos que el recepcionista registre discrepancias en tiempo real en lugar de en papel, estamos pidiendo un cambio de hábito. Y los cambios de hábito fallan si no se diseñan bien.

El Wendel Checklist verifica cinco condiciones para cada JTBD:

CUE (Señal): ¿Hay un momento claro que dispara la acción? Si el recepcionista no sabe CUÁNDO usar el nuevo sistema, no lo usará.
REACTION (Reacción): ¿La reacción instintiva es positiva? Si el sistema parece complicado, el recepcionista volverá al papel.
EVALUATION (Evaluación): ¿El usuario ve el beneficio inmediato? Si el beneficio es “mejor para la empresa” pero no “mejor para mí”, la adopción será baja.
ABILITY (Capacidad): ¿El usuario PUEDE hacerlo? Si necesita 3 manos (una para el pallet, una para el papel, una para el dispositivo), no es factible.
TIMING (Momento): ¿Es el momento adecuado? Si el recepcionista tiene 5 camiones esperando, no va a pararse a aprender un sistema nuevo.

Cada JTBD que sale de Research Mom Test se evalúa contra estas cinco condiciones. Si alguna falla, el JTBD necesita ajuste antes de convertirse en historia de usuario.

El Poder del Comportamiento START/STOP/DIFFERENT

Research Mom Test introduce una clasificación de cambio de comportamiento para cada JTBD:

START: Algo que el usuario NO hace hoy y debería empezar. Ejemplo: registrar discrepancias digitalmente.
STOP: Algo que el usuario hace hoy y debería dejar. Ejemplo: anotar en papel, esperar al analista.
DIFFERENT: Algo que el usuario hace hoy pero de forma diferente. Ejemplo: comunicar discrepancias por radio en vez de caminando.

Los cambios STOP son los más difíciles. Dejar de hacer algo que funciona (aunque sea ineficiente) requiere que la alternativa sea significativamente mejor. Los cambios START son los más riesgosos. Añadir un nuevo paso a un proceso ya cargado genera resistencia. Los cambios DIFFERENT son los más fáciles de adoptar. El hábito ya existe; solo cambia la herramienta.

Conclusiones: La Investigación como Puente entre Negocio y Usuario

Research Mom Test es el puente que conecta la claridad del PRD con la realidad del campo. Sin él, las historias de usuario se construyen sobre suposiciones. Con él, se construyen sobre evidencia.

Aprendizajes clave de este artículo:

El Mom Test es no negociable: No preguntar opiniones. No preguntar hipótesis. Solo comportamiento real, pasado, observable.

Gap Detection antes de entrevistar: Saber qué no sabemos antes de ir al campo es la mitad del trabajo.

JTBD Reforzado: Funcional + Emocional Personal + Emocional Social + Cambio de Comportamiento + Evidencia. No solo “qué quiere hacer” sino “cómo quiere sentirse” y “cómo quiere ser visto”.

Wendel Checklist: Cada JTBD implica un cambio de comportamiento. Si no pasa las 5 condiciones (Cue, Reaction, Evaluation, Ability, Timing), la historia de usuario que salga de ahí fracasará en adopción.

START/STOP/DIFFERENT: Clasificar el cambio de comportamiento para saber dónde está el riesgo de adopción.

En Mercadona, donde cada cambio impacta a miles de personas en cientos de ubicaciones, esta rigurosidad no es un lujo. Es una necesidad. La diferencia entre un producto exitoso y un producto abandonado a menudo no está en la calidad del código, sino en la calidad de la investigación que lo precedió.

En el próximo artículo, exploraremos cómo JTBD to Stories toma estos JTBDs reforzados y los transforma en historias de usuario de alta calidad, listas para el equipo de desarrollo.

Próximo artículo: Artículo 4 — “JTBD to Stories: La Transformación de JTBDs en User Stories de Calidad”

Serie “AI Mercadona User Story Framework” — Febrero 2026

Gemba

Discusión sobre este post

Por supuesto, sigue adelante.