Acceder

Tres personas van de cacería.  Uno de ellos es experto en estadística.  Uno de ellos dispara a la presa y falla porque el tiro pasó a la derecha.  El otro dispara y el tiro pasa a la izquierda y falla.  En ese momento, el estadístico exclama emocionado: "¡¡Le dimos, le dimos, en promedio le dimos!!".

La estadística a menudo parece muy complicada, pero en realidad suele guiarse por principios muy lógicos, pero el analfabetismo estadístico y la ideología hacen que en distintos contextos haya fracasos muy notables que pueden destruir empresas, proveer información errónea para planificar el futuro o para planificar el trabajo presente.

Sentido común

Cuando hablamos de media, mediana y moda, en realidad hablamos de medidas de tendencia central, cuyo uso debe estar sujeto al sentido común, y no a la arbitrariedad del analfabeto en estadística.

  • La media nos recuerda lo que en la escuela solíamos conocer como "promedio" (que en realidad se llama media aritmética).  ¿Por qué no le llamamos promedio en lugar de llamarle media? Es que hay varios tipos de promedio que según el contexto en que se usen reciben los nombres de media aritmética, media geométrica, media ponderada y media armónica.
  • La mediana resulta de ordenar los datos de menor a mayor y tomar el dato del medio de la lista.
  • La moda se refiere al valor que se repite más.  Puede haber más de una moda.  Por ejemplo, si tomamos a un grupo de ancianos y los ponemos con un grupo de niños, calcular la media de edades no tienen ningún sentido, ni tampoco la mediana, pues podríamos ver dos modas, la edad más frecuente entre los viejos y la más frecuente entre los niños.

Si tienes un grupo de 9 empleados y todos producen 10, y uno produce 20, y decides usar la media como nivel mínimo aceptable, tendrás 1 empleado exitoso, y 9 que debes despedir.  Lo lógico sería usar la mediana, que es 10.  El problema de usar la media es que si tienes valores extramos (varianza alta), usar la media no serviría de mucho, porque crea una situación de injusticia, y además un problema innecesario de desmotivación entre empleados.

Al final el razonamiento viene de usar el sentido común.  Y al igual que al elegir la medida de tendencia central, el rigor estadístico también se guía por principios de sentido común.  El uso del sentido común viene de entender las implicaciones del uso de cada una de las herramientas estadísticas.  Cada herramienta tiene un uso, ventajas y limitaciones, como cualquier herramienta.  Sería absurdo que trataras de cavar para construir los sótanos de un rascacielos, con una cuchara.  Sería absurdo beber agua con un tenedor.  De igual forma, el analfabetismo estadístico o la ideología, cumplen un papel clave en el mal uso de la estadística.

Incluso la estadística misma tiene sus limitaciones.  Si usas la estadística para predecir el futuro, en realidad usas datos del pasado para extrapolar un futuro, lo cual significa que estás conduciendo un coche mirando por el espejo retrovisor.  Que no te sorprenda entonces si el futuro no era una mera continuación del pasado.

Podemos mirar algunos casos muy dramáticos de mal uso de la estadística.

Las elecciones entre Landon vs Roosevelt en 1936

Uno de los casos más dramáticos de mala praxis estadística que registra la historia es el caso de las elecciones de 1936.  La aplicación rigurosa de los mecanismos de muestreo hizo una gran diferencia, pues todas las encuestadoras apuntaban a la victoria de Landon, y sólo Cid Gallup usó el rigor estadístico y señaló la victoria de Roosevelt.  Ninguna de las otras firmas encuestadoras sobrevivió a esas elecciones.  Hubo muchas malas prácticas que aparentando ser inofensivas, agregaron sesgo no estadístico a los resultados.  Por ejemplo, en la lista de electores, seleccionar al siguiente en la lista si un elector no podía ser localizado, o encuestar al vecino del elector seleccionado.

La aplicación rigurosa de los mecanismos de muestreo indica la selección de muestras con números verdaderamente aleatorios, que algunos confunden con números arbitrarios o apuntar con los ojos cerrados a una lista luego de mover el dedo hacia arriba o hacia abajo.  En primer lugar los números arbitrarios o los números desordenados o apuntar con los ojos cerrados rara vez genera números aleatorios.  En estadística hay pruebas de aleatoriedad para listas de números, que hacen que se encuentre patrones no aleatorios en una lista supuestamente aleatoria.  Por ejemplo, si tienes una lista y apuntas con el dedo, sabrás que hay números a la altura del hombro, y encima y debajo.  Probablemente la primera decisión del que señala, será apuntar por encima, por debajo o a la altura del hombro.  Entonces dependiendo de la altura de la persona, habrá más o menos sesgo hacia alguna de las tres direcciones que agrupará los datos que empezarán a seguir un patrón, en lugar de ser aleatorios.  ¿Quedarán los primeros y los últimos en la lista con la misma probabilidad de ser escogidos que los demás?

Imaginaríamos que las bolas con números en un recipiente darían números aleatorios, algo así como la lotería.  Eso podría no ser cierto.  Las bolas podrían tener diferencias de peso mínimas, de modo que las ligeramente más pesadas podrían terminar en el fondo.  Las más resbalosas podrían ser más difíciles de agarrar y circularían mejor al revolverse, y además está el sesgo del que toma la bola. ¿Toma las de arriba las del medio, o las de abajo?

Al final, hay muchas maneras de agregar sesgo no estadístico (imposible de medir estadísticamente) por el simple hecho de que no hubo apego al rigor estadístco.  Lo peor de todo es que ni siquiera los que incurren en esa mala praxis estadística podrán darse cuenta de que cometieron un error, porque no tendrían nada que comparar, a menos que haya algo muy evidente, como una elección presidencial.

  • Problema: La conveniencia, la pereza, los costos (tomar muestras tiene un costo) son algunos de los motivadores que empujan a la mala praxis durante el muestreo estadístico.
  • Resultado: Destrucción de empresas.

Falla de los modelos neoclásicos con la crisis de 2008

Los economistas neoclásicos antes de 2008 llegaron a creer que la economía neoclásica debía ser considerada ciencia exacta.  Sus complicados modelos de simulación a menudo estaban llenos de errores en temas como la propagación del sesgo estadístico en los cálculos, falta de análisis de causa-efecto (los números eran causa y efecto de los números y el ser humano no existe), y el uso inadecuado de distribuciones probabilisticas en virtud de si las variables son o no dependientes (usaban supuestos, al considerar como variables independientes algunas variables dependientes).  La ideología (que es creencia) les impedía mirar claro o cuestinar si estaban equivocados.

Sus modelos de simulación arrojaban que las crisis eran una oveja negra, un resultado altamente improbable.  En cambio el análisis fractal de Mandelbrot arroja que las crisis son mucho más comunes de lo que piensan los neoclásicos y el apego a la realidad es mucho mayor (Mandelbrot, fractales y crisis financieras).  La ideología le empujó perdidas a las universidades de Yale y Harvard (Harvard and Yale Report Losses in Endowments) que enseñaban economía al mundo.

No contentos con la demostración de la chapuza estadística y el fracaso de sus modelos, se inventaron la "econofísica" (Failed Economists Are Now Developing 'Econophysics' As Our New Savior), siempre con la idea de que tienen una ciencia exacta entre manos.  Y de esta manera ignoran de nuevo los hallazgos de Mandelbrot, al tratar las crisis como si tuviesen una "sismología económica".  Ignoran evidencia empírica y se empeñan en aferrarse a sus creencias.

Cuando miramos la historia de 1637 hasta hoy miramos que las burbujas son cada vez más frecuentes, y la razón no tiene que ver con procesos ocultos de la naturaleza, no tiene nada que ver con flujos subterráneos de magma y procesos de convección naturales.

Los Estados le dieron a los bancos privados el privilegio de crear dinero emitiendo deuda con la excusa de que eso era necesario para financiar la actividad de las empresas y los consumidores. Pero en los últimos treinta años, la banca internacional multiplicó la deuda para financiar los mercados especulativos y para ganar dinero simplemente comprando y vendiendo más dinero, y no para financiar a la economía productiva. Esta es la primera estafa. - ATTAC. La crisis, una estafa detrás de otra

Los bancos no producen nada, pues en el fondo son un negocio que maneja anotaciones en una libreta, y el dinero no tiene manera de agregarse valor a sí mismo.  El inversionista Jim Rogers ha llamado ale modelo de rescate bancario improductivo "quitar el dinero a los competentes para dárselo a los competentes para que compitan contra los competentes".

  • Problema: Tratar de ajustar la realidad a la ideología y tratar de precedir el futuro
  • Resultado: La realidad se aparta del modelo y eso trae pérdidas debido a un modelo inservible de pronóstico

Asumir ausencia de varianza en servicios en un contexto de Six Sigma

Sabemos que en servicios la mejor manera de medir el trabajo es usando casos, como ocurre con los casos judiciales y los casos en call centers o en otras labores administrativas, pues puedes rastrear cada problema por separado y monitorear su avance.  Un caso es un encargo, y los casos se dividen en tipos de casos.  La práctica normal es tomar una muestra de la duración de casos y usar la media para estimar la carga de trabajo.  ¿Y que pasa con la varianza?  A partir el momento en que se calcula la media, es como si la varianza dejara de existir.

Carga de trabajo = Cantidad de casos x Duración promedio de los casos

Es que si pensamos en no eliminar la varianza de manera mágica, los cálculos se complican, arrojando números indeterminados, rangos de números, en lugar de arrojar una cifra fija.  Habría que hacer un análisis de bondad de ajuste para ver la distribución probabilística de los datos, o tener algún conocimiento de estadística para ver si se debe usar media, mediana o moda como medida de tendencia central.  Encima habría que efectuar un análisis de sensibilidad para ver la probabilidad de que la carga de trabajo sea tal o cual, dependiendo de la probabilidad y para el análisis de bondad de ajuste (para ver si los datos se ajustan a una distribución de probabilidad) habría que saber sobre estadística y habría que tomar suficientes muestras para asegurar que la muestra tenga un error de estimación aceptable.  Esto es demasiado para un supervisor promedio o incluso para algunos gerentes, de modo que incurren en errores de sesgo no estadístico y los que salen pagando los platos rotos son los empleados que tienen cargas de trabajo superiores a las estimadas, lo cual genera problemas en el servicio y al final los empleados son culpados por falta de compromiso, o simplemente de ser vagos.

Seis Sigma es una simple moda gerencial, refrito de otras modas gerenciales del pasado, que propone la reducción de la variabilidad en los procesos y reducción de defectos.  La reducción de defectos suele medirse en la forma de reprocesos o en la forma de quejas, cuando se trata de servicios.  Y bajo la idea de Six Sigma, se busca reducir la variabilidad hasta alcanzar cierto nivel.

Desafortunadamente los casos suelen tener una variabilidad inherente a varios factores:

  • Falta de claridad en los requerimientos.
  • Información incorrecta proveída para procesar el caso.
  • Faltante de documentación requerida
  • Volúmen de trabajo (tiempo) involucrado en la resolución del caso.
  • Complejidad del problema a resolver debido a otros factores internos y externos que complican algo que debía ser simple.

Como siempre, los consultores y gurús que diseñan las modas gerenciales, no se han tomado la molestia de trabajar en aquello que pretenden afectar, y le toca a los empleados rasos lidiar con las inconsistencias del diseño, que se suma a la ignorancia estadística de las jefaturas que tratan de aplicar modas gerenciales, mientras implementan en medio de un analfabetismo estadístico generalizado.

Cuando las cargas de trabajo son superiores a las estimadas ocurren varias cosas:

  1. Alta rotación de personal: Los empleados se van al mirarse abrumados por una carga de trabajo que sus jefes no miran
  2. Horas extra: Para poder cumplir con los plazos prometidos.  Puede causar problemas de costos si se paga esas horas, o problemas de salud de empleados o de calidad del trabajo debido al agotamiento de los empleados.
  3. Incumplimiento de plazos: Cuando se trabaja sólo durante la jornada laboral.

A nadie se le ocurriría decir que 1+1=5, porque faltan 3 de un lado de la ecuación.  El analfabetismo estadístico hace que la ecuación gerencial del Six Sigma sea:

Carga de trabajo estimada + Carga de trabajo ignorada por analfabetismo = Carga de trabajo real

...donde se asume (supone) automáticamente que la carga de trabajo ignorada por analfabetismo es igual a cero, y así se elimina los problemas de varianza de un plomazo, mágicamente, sin haber hecho nada más que una chorrada numérica, igual a la de los neoclásicos.  Igual que en el primer ejemplo, la pereza, la conveniencia, la ignorancia y la idea de no incurrir en costos, hace que lo que podía ser una herramienta útil se convierta en un adefesio numérico, una vil mentira, que al no tener contra qué compararse, se da por cierta.  Claro, al cabo de pocos meses, cuando las cargas de trabajo sean superiores a las estimadas, porque ignoran los datos de la cola derecha de la distribución de probabilidad, prácticamente la mitad de los datos, empezará a verse los problemas y para la gerencia los empleados serán los culpables, y no los analfabetos estadísticos que estimaron un nivel de servicio para tener un nivel de servicio de 50% (o más o menos, dependiendo de la distribución de los datos), y no de 95% ni de 99% que es lo que la excelencia dicta.  En otras palabras, escogieron tener su rendimiento a la mitad, y así el resultado es desmejorar el servicio, o poner en los empleados la carga del imposible estadístico, bajo amenaza de considerarles vagos o poco comprometidos.

Gerencia basada en suposiciones numéricas y no en evidencia numérica es lo que resulta de esto.

  • Problema: El analfabetismo estadístico en la empresa bajo el disfraz de certeza de la moda gerencial empuja resultados que no corresponden con la realidad.
  • Resultado: Información equivocada para planificar el trabajo en la empresa.  Se culpa a los empleados por los malos resultados que resultan de una mala planificación

Corolario

Dicen que hay mentiras, grandes mentiras, y hay estadísticas. 

Mostrar números no significa que los números se ajusten a la realidad.  La diferencia es error puro.  Una parte del error se puede medir estadísticamente, pero el error por el mal uso de la herramienta no.  Ese mal uso viene de la ignorancia o de la ideología (creencia).  Al final la ignorancia también induce la creencia de que se hizo bien el trabajo con números a pesar de que los resultados son una bazofia numérica.  Las consecuencias, las realidades, que vienen de comparar la realidad con los cálculos, pueden tener efectos muy serios.

En el caso de las elecciones de 1936 significaron el fin de muchas empresas, en el caso de Yale y Harvard significó pérdidas millonarias (sin mencionar la futilidad de los costos de construcción de los modelos de simulación), y en las empresas que usan Six Sigma el costo es la pérdida de talento, incremento de problemas de calidad por agotamiento, y los costos de reentrenamiento y/o de jornadas extendidas.

La mala praxis estadística cuesta dinero, pero las lecciones sólo las aprenden, de manera dolorosa, los que de buena fe aceptaron esos números para tomar decisiones.  Que no te ocurra eso.

 

5
¿Te ha gustado el artículo?

Si quieres saber más y estar al día de mis reflexiones, suscríbete a mi blog y sé el primero en recibir las nuevas publicaciones en tu correo electrónico.

  1. #5
    06/10/14 12:58

    Permitame un ejemplo clásico de promedio estadistico:La temperatura media de nuestro cuerpo es meter la cabeza en el frigo y el culo en el horno

  2. en respuesta a José Manuel Durbá
    -
    Top 100
    #4
    06/09/14 21:09

    Esa es una práctica muy común en India.
    A nivel de gobierno los diagnósticos de la realidad del país son tan manipulados que es imposible hacer política pública con los resultados.
    A nivel corporativo, si un empleado obtiene menos que 100% (calificación perfecta) en sus métricas, le despiden como se desecharan un trasto viejo.

    Miras entonces que en los casos de India, sólo hacen aquello que les empuja métricas perfectas, aunque ello signifique hacer trampa. Y eso crea gigantescas brechas entre realidad y números. Miras prácticas como no poner notas en los casos (para ahorrar tiempo), o cerrar el caso en el momento de empezar a resolverlo, no al terminarlo.

  3. #3
    06/09/14 21:01

    Me gusta la frase "Mostrar números no significa que los números se ajusten a la realidad. La diferencia es error puro. Una parte del error se puede medir estadísticamente, pero el error por el mal uso de la herramienta no. Ese mal uso viene de la ignorancia o de la ideología (creencia)". Totalmente de acuerdo aunque añadiría que también puede venir del interés o conveniencia en manipular o al menos influir en los resultados(aunque tal vez se pueda incluir en la ideología).
    Utilizamos modelos numéricos para medir la realidad, pero alguien, de manera interesada, puede pretender hacernos creer que si varía la información que se obtiene del modelo, la realidad ha variado en el mismo sentido que da el modelo. En ese caso podría haber manipulación consciente que llevaría a error no producido por la ignorancia sino por el interés. Claro que en este caso la ignorancia estaría en la parte del que cree en la información manipulada.

  4. en respuesta a Ismael Vargas
    -
    Top 100
    #2
    03/09/14 18:05

    El problema viene de usar cosas cuyo uso y limitaciones no entendemos del todo. Un mal uso, lleva a una mala decisión.

  5. Top 100
    #1
    03/09/14 16:06

    La estadística viene bien, porque se puede interpretar, y para personas con ideología pueden llevar los datos, según qué métodos estadísticos se usen hacia un terreno u otro.

    Dicen que si tenemos un pie en un cubo de agua helada y otro en un cubo de agua caliente el termino medio es que estamos templados, pero la realidad no es esa. Existen métodos estadísticos muy avanzados, pero llegamos hasta donde llegamos.

Definiciones de interés