Gemba
Gemba Podcast
Métricas para productos con IA
0:00
-15:07

Métricas para productos con IA

lo que medimos… y lo que aún no sabemos medir

En los productos tradicionales, medir el éxito siempre fue relativamente sencillo. Mirábas cuántos usuarios activos tenías, cuántos completaban una acción, cuántos volvían al día siguiente.

El product manager vivía cómodo entre tasas de conversión, embudos y cohortes. Pero con la llegada de la inteligencia artificial, esa claridad empezó a desvanecerse. Porque, ¿cómo mides el éxito de algo que aprende, cambia y genera resultados diferentes cada vez? ¿Cómo sabes si el producto “funciona” cuando ni siquiera hay una única respuesta correcta?

Bienvenido a la nueva frontera del product management: las métricas vivas de los productos con IA.


Cuando las métricas clásicas ya no bastan

Las métricas de toda la vida —DAU, retención, conversión— siguen siendo útiles, pero cuentan solo una parte de la historia. Un chatbot puede tener miles de usuarios diarios, pero si la mayoría lo abandona frustrado después de tres respuestas, esa métrica deja de significar éxito. La IA introduce una capa de complejidad: no solo hay que medir lo que el usuario hace, sino cómo se siente y qué aprende el sistema.

Un producto inteligente no se mide solo por lo que entrega hoy, sino por qué tan bien mejora con el tiempo.


Dos tipos de aprendizaje: el humano y el del sistema

Un buen producto de IA evoluciona en dos direcciones:

  1. El usuario aprende a usar el sistema.

    Por ejemplo, en ChatGPT o Midjourney, el usuario mejora sus prompts y obtiene resultados más precisos. La experiencia se vuelve más valiosa con la práctica.

  2. El sistema aprende del usuario.

    Sus respuestas, recomendaciones o predicciones mejoran con cada interacción.

Medir estos dos aprendizajes —el del usuario y el del sistema— es el nuevo reto del PM. Porque el valor real no está en una acción puntual, sino en la relación dinámica entre ambos.


Nuevas métricas para una nueva era

Aquí tienes algunas métricas emergentes que los equipos más avanzados están usando para medir productos con IA:

1. Tasa de éxito percibido (Perceived Success Rate)

No mide si la IA “acertó” técnicamente, sino si el usuario sintió que la respuesta fue útil. En IA generativa, esa percepción es más importante que la precisión.

2. Confianza del usuario (User Trust Index)

Una métrica subjetiva, pero medible con feedback continuo: ¿qué tan dispuesto está el usuario a delegar tareas al sistema? ¿cuándo deja de revisar o corregir lo que la IA sugiere?

3. Reducción de esfuerzo (Effort Reduction Rate)

Mide cuánto trabajo ahorra el producto al usuario. Si antes necesitaba cinco pasos y ahora solo uno, el valor de la IA está ahí, aunque el flujo total sea más corto.

4. Tasa de aprendizaje del modelo (Model Learning Rate)

Indica cuánto mejora el modelo con cada nueva interacción. Por ejemplo, si el porcentaje de respuestas “satisfactorias” aumenta sin intervención humana, el sistema está aprendiendo bien.

5. Tasa de corrección humana (Human Correction Rate)

Cuántas veces el usuario necesita corregir o reintroducir una respuesta. Una IA con baja tasa de corrección inspira confianza; una con alta tasa genera frustración o desconfianza.

6. Calidad emergente

Mide cómo evoluciona la experiencia cuando el producto se usa en contextos distintos. Por ejemplo, ¿responde igual de bien un asistente de IA en inglés que en español? ¿mantiene consistencia entre usuarios expertos y novatos?


El cambio de mentalidad: de métricas absolutas a métricas evolutivas

El PM clásico medía estados: cuántos usuarios tengo, cuántos compran, cuántos se quedan. El PM de productos con IA mide trayectorias: cuánto aprende el sistema, cuánto confía el usuario, cuánto se reduce la fricción con el tiempo. El foco pasa de la foto al vídeo. No importa solo el resultado puntual, sino la curva de aprendizaje entre el usuario y la IA.


Métricas que también pueden engañar

No todo lo que se puede medir tiene sentido.

Algunos errores comunes:

  • Confundir engagement con valor. Que el usuario interactúe mucho no significa que esté satisfecho. A veces, la alta interacción es síntoma de que la IA falla y el usuario insiste.

  • Celebrar mejoras locales sin ver el sistema completo. Un modelo que reduce errores en un área puede generar nuevos sesgos en otra.

  • Optimizar para la precisión, ignorando la percepción. Un asistente ultra preciso pero frío y robótico puede ser peor que uno algo menos exacto, pero más empático.

En IA, medir bien significa entender el contexto del error tanto como el acierto.


El rol del PM: diseñar la conversación con los datos

El PM ya no solo define qué construir, sino qué medir y por qué. Y, sobre todo, cómo conectar esas métricas con la experiencia real del usuario. Debe convertirse en traductor entre datos y significado. No basta con tener dashboards: hay que saber qué historia cuentan y qué historia ocultan. En productos con IA, las métricas no son solo indicadores de rendimiento; son parte del diseño del sistema. Lo que decides medir, termina moldeando lo que la IA aprende.


El takeaway

Los productos con IA no se evalúan solo por cuántos los usan, sino por qué tan bien aprenden, ayudan y generan confianza.

El éxito ya no está en las conversiones o los clics, sino en el grado de entendimiento mutuo entre el usuario y el sistema.

👉 En esta nueva era, el product manager no persigue métricas estáticas, sino señales vivas de aprendizaje, mejora y confianza.

El reto no es medir más, sino medir mejor.

Discusión sobre este episodio

Avatar de User