Rankia España Rankia Argentina Rankia Brasil Rankia Chile Rankia Colombia Rankia Czechia Rankia Deutschland Rankia France Rankia Indonesia Rankia Italia Rankia Magyarország Rankia México Rankia Netherlands Rankia Perú Rankia Polska Rankia Portugal Rankia Romania Rankia Türkiye Rankia United Kingdom Rankia USA
Acceder

En muchas ocasiones en este blog he recurrido a datos del INE; en no pocas he expuesto o criticado determinadas metodologías a la hora de crear las estadísticas. Sin embargo hasta ahora siempre he creído que las estadísticas no estaban manipuladas.

Pero he tenido conocimiento de que el INE ha tomado una serie de medidas en el proceso de toma y tratamiento de los datos que suponen una clara manipulación de una de las encuestas más importantes que tenemos en España: La Encuesta de población Activa.

Quienes conozcan este blog saben, que para bien o para mal trato siempre de aportar conclusiones en base a argumentos que a su vez vienen siempre de datos que se pueden contrastar. Pero hoy me toca exponer una información que me ha llegado y que me parece especialmente relevante y grave. Está fundada en fuentes que no puedo identificar a las que les doy la máxima credibilidad. Hasta donde he podido he buscado información que lo corrobore y además el proceso es coherente con los resultados que hemos encontrado en la encuesta.

La información se refiere a que el INE ha priorizado las llamadas a hogares que sabían ocupados (explico después como se segmentan) y ha dejado para el final las llamadas a hogares de pensionistas. Todo ello, entremezclado con la introducción de personal para realizar trabajos de una empresa pública pero que contrata a trabajadores sin los requisitos del sector público y que en todo caso no son personal permanente sujeto a independencia, lo que es lo mínimo que se debe exigir a los trabajadores que desarrollan esta función.

Para centrar el tema me gustaría recordar un símil habitual en el campo de las encuestas; la cocina. En la cocina de las estadísticas se usan unos ingredientes (datos recogidos aleatoriamente) para de acuerdo a unas recetas determinadas (procesos), que nos pueden gustar o no, llegar a un resultado.  Y esto es un aspecto clave; se puede criticar la habilidad del cocinero o las recetas; pero hay un punto que todos deberíamos tener claro: ¡no puede existir manipulación en la obtención de datos!; y esto precisamente es lo que me ocupa en este post.

El organismo encargado de recopilar, tratar y ofrecer información estadística es el Instituto Nacional de Estadística. Por tanto, del rigor y calidad del trabajo de este organismo depende el rigor y la calidad de toda la información a nivel macro que exista.

De esto depende la confianza en las instituciones y finalmente es un aspecto clave para determinar si estamos en un país con unos estándares aceptables o nos encontramos en una “Monarquía Bananera”. Es tan simple como decir que cuando no podamos creernos los métodos y resultados de las encuestas públicas ya no tendremos ojos.

En primer lugar me gustaría destacar que las encuestas son el único medio para mostrar una realidad que no podríamos conocer de otra forma. He tratado de justificar, en muchas ocasiones, que la interpretación de las encuestas difiere de la realidad. Pero de la misma forma he defendido reiteradamente que estas malinterpretaciones responden a procesos que no son manipulación. Es muy diferente criticar que los resultados se presenten de una forma conveniente a unos intereses que criticar que se ha hecho trampa en la confección de datos oficiales.  En particular, entiendo que no son manipulaciones (aunque  sí estén sujetos a crítica) ni los errores, ni los cambios metodológicos ni mucho menos que los analistas no comprendan bien los términos estadísticos que usan.

En ocasiones encontramos errores; (me gustaría recordar el caso de las encuestas sobre las elecciones en 1936 en USA que pronosticaban una victoria del candidato republicano por el sencillo motivo de que se hicieron por teléfono en un momento en el que la mayoría de los que  tenían teléfono eran los votantes republicanos). Los errores en el diseño son inherentes a las estadísticas y por tanto no los censuro. Además, conociendo los datos del diseño, cualquier persona puede detectar los errores y sesgos que puedan existir y por tanto interpretar correctamente.

 Otras veces encontramos cambios metodológicos que hacen que estemos comparando cosas distintas. El PIB de 2014 no recoge lo mismo que el PIB de 2002, por lo que poner una gráfica de evolución del PIB que incluya los dos años es un error garrafal, y esto tampoco es manipulación. Conociendo la metodología, este error será culpa del que coja los datos “a lo bruto”.

Otra gran fuente de error está en que las cosas no son lo que creemos que son. Por ejemplo me gustaría recordar, a título de ejemplo, que en el PIB aparecen rentas y consumos que son en realidad imputaciones y no estrictamente renta y consumo (propongo como ejemplo el caso de las “actividades inmobiliarias en el PIB”). Cómo también he explicado, si no tenemos en cuenta esto podemos tener conclusiones erróneas acerca de los datos que se analizan. Esto tampoco lo considero manipulación del INE siempre que tengamos información suficiente para descubrir (con mayor o menor dificultad) lo que en realidad nos dicen los datos.

Aclarado todo esto, paso a explicar lo que sí considero especialmente grave. En principio, la única información publicada se corresponde a una denuncia de un representante de la CIG (sindicato gallego) en la web Praza Pública, en la que se pregunta las razones por las que el INE, por primera vez en la historia, “privatiza” los trabajos de la EPA. La entrada en cuestión es incompleta y además estimo que tiene un grave error ya que en realidad los trabajos de la EPA no se están privatizando. Sin embargo el artículo corrobora la información que me habían facilitado en muchas cosas, aunque parece que se queda un poco corto. No afirma la existencia de manipulación pero se pregunta las razones de un proceso que en realidad es de externalización.

A título de antecedente me gustaría explicar que el INE usó durante mucho tiempo contratos temporales de obra o servicio determinado con distintos trabajadores para los trabajos de encuestas periódicas. Se entendía por tanto que el organismo contrataba en fraude de ley porque se trataban de encuestas perfectamente programadas. Judicializado el tema, han recaído sentencias obligando al INE a recontratar a estas personas, que pasarían a ser personal propio, para dichas encuestas.

Sin embargo el INE decide externalizar los servicios; lo que el artículo dice incorrectamente: privatizar. A tal efecto aparece una empresa pública que se llama Tragsa, que a través de su filial Tragsatec se ha ocupado de contactar con casi  500 hogares para la confección de los trabajos de la EPA durante los últimos meses de 2014. Esta información sale de una nota de prensa de 26 de enero de 2015, remitida en el contexto del ruido generado por los sindicatos (contexto en el que también debemos entender la entrada de antes).

Tragsa es una empresa pública, por lo que no deberíamos hablar en ningún caso de privatización. Sin embargo, los criterios de contratación y el personal no responden a los criterios de la administración pública; no hay más que ver el apartado de “trabaja con nosotros” en su web:

El problema es que no había nada que indicaba que el grupo Tragsa trabajaba en la EPA salvo en el apartado de observaciones del sistema informático del INE donde aparecen las marcas de los trabajadores de esta empresa.  Entiendo que por esta razón surge la nota de empresa (unos días después de la entrada del post de sindicato) para darle cierta “oficialidad” a la colaboración.

En primer lugar no existe ninguna garantía de que los datos que ofrece Tragsa, tomados por personas que son contratadas “por perfil” respondan al interés general. Es sencillo entender que el contratado hará lo que sus jefes quieran y sus jefes son los que los contratan; no los ciudadanos.

Pero es que además en el apartado de metodología de la EPA encontramos lo siguiente: “Hay 52 oficinas provinciales en toda España que cuentan con personal permanente que hacen el trabajo de ese territorio en relación con las entrevistas personales. También hay siete centros de entrevista telefónica asistidos por ordenador que cubren toda la muestra en sucesivas entrevistas. Cada semana, se envía la información disponible en cada oficina provincial o centro de entrevista telefónica a la oficina central en Madrid. En la Comunidad Autónoma de Galicia, el trabajo de campo se comparte con el Instituto Gallego de Estadística (IGE).”

Nótese que las prevenciones sobre la recogida de los datos no son ciertas, ya que existen numerosas sentencias que afirman que se estaba realizando la encuesta con personal no permanente (y por tanto más dúctil) y  tampoco aparece por ningún lado Tragsatec  ni empresa ajena alguna.

Con todo tal circunstancia no es tan grave en comparación con lo siguiente; Para que se entienda debemos tener en cuenta el diseño de la recogida de datos.

Para obtener los datos se seleccionan 65.000 familias en cada trimestre de tal forma que cumplan determinados criterios de representatividad. Cada trimestre salen de la muestra 1/6 de los hogares. De esta forma, cada familia es entrevistada durante 6 trimestres consecutivos, como máximo. El diseño de la muestra está centralizado y en las delegaciones del INE se encargan de realizar la encuesta a las personas (en este caso familias) que salen en la base de datos.

La primera entrevista a cada familia es presencial mediante el desplazamiento de personal del INE; una vez obtenidos los datos de las familias las siguientes entrevistas son telefónicas. (dicha información también aparece corroborada en la página de la metodología del INE anteriormente linkada)

Se ha jugado con dos aspectos muy preocupantes relacionadas con el contacto telefónico.  Recordemos que están llamando a hogares sobre los que ya existen datos (otro de los problemas de Tragsatec es que han accedido a estos datos) y por tanto la posibilidad de segmentación. Las llamadas telefónicas tienen el problema de la localización ya que las personas no están siempre localizables y en casa. Tenemos que tener en cuenta que lo normal será tener que llamar varias veces a muchos hogares para localizarlos y aquí surgen dos comportamientos que son una clara manipulación de la muestra:

Me cuentan primero que las bases de datos de las que las personas llamaban se abrieron en dos fases. En una primera fase se eliminaron de la base de datos aquellos hogares de pensionistas. (Recordemos que los datos se obtienen ya en la primera encuesta). A estos hogares se les ha llamado a todos en los últimos dos días de confección de datos. Me indican que la explicación que se ha dado a esta novedad está en los recortes de personal. Dado que es más difícil localizar a las personas que están trabajando se concentran las llamadas primero en los trabajadores para conseguir la mayor parte de respuestas.  Queda al arbitrio de todo el mundo entender si esta explicación es coherente o no; pero que no quepa ninguna duda que no se puede hacer una encuesta para determinar la situación laboral de la sociedad concentrándose primero en los trabajadores.

Llegado un punto determinado se abren las llamadas al resto de personas para cubrir el cupo. Debemos tener en cuenta que en un hogar en el que no se conteste no entra en los resultados, y derivado de concentrar los esfuerzos en localizar a los ocupados, apenas ha existido tiempo para localizar a los inactivos.

 Es decir, estamos ante un proceso similar a “cargar los dados”, se concentra la búsqueda de respuestas que contesten que están empleados y se reducen los esfuerzos y las posibilidades de contactar con inactivos. Es decir, se mejora artificialmente el dato de empleo y de actividad.

Me cuentan, en segundo lugar, que también en la última EPA las frecuencias de las llamadas no fueron las mismas. Es decir, se han concentrado los esfuerzos en aquellas familias que, a la luz de la información previa, estarían trabajando. Si a una familia se las llama en 30 ocasiones (hasta que se le localice) y a otras familias en 2 ocasiones (y a pasar a la siguiente) es mucho más sencillo localizar a las primeras, de tal forma que las respuestas que vamos a obtener son las que queremos.

Lamentablemente la EPA no da información sobre el número de respuestas obtenidas y en todo momento se refiere a la muestra de “aproximadamente” 65.000 hogares. Los índices de calidad de las respuestas, se efectúan sobre las respuestas recibidas. Es obvio que dichos índices por tanto no van a detectar irregularidades en la selección de las llamadas.

En definitiva, parece claro que el INE ha cargado los dados en este casino con el objetivo de alterar los resultados de la EPA lo que me parece especialmente grave.  No puedo valorar cual de las dos opciones es peor:

-          O bien resulta que alguien del gobierno pretende acabar con el paro preguntando si trabajan a los trabajadores para transmitir una imagen infiel aprovechando las instituciones públicas que previamente han desguazado.

-          O bien resulta que después de desguazar las instituciones públicas y no tener personal adecuado para una función tan importante, deciden concentrar los esfuerzos en un segmento de una muestra determinado lo que va en contra de toda lógica estadística e incluso de sentido común.

En cualquiera de las opciones me parece que lo único que nos diferencia de una republica bananera es que tenemos dos reyes.

19
¿Te ha gustado mi artículo?
Si quieres saber más y estar al día de mis reflexiones, suscríbete a mi blog y sé el primero en recibir las nuevas publicaciones en tu correo electrónico
  1. #19
    26/02/15 02:32

    Lo curioso es que una encuesta mal hecha, que no refleja la realidad, no vale para nada.

    No aporta información en el momento de querer emprender acciones para cambiar o hacer lo que fue objeto de la encuesta.

    Por lo consiguiente, otro dinero tirado. Con todo que nos sobra.

    un saludo

  2. en respuesta a Futurama
    -
    #18
    21/02/15 01:19

    Si, según las encuestas el 100% de las encuestas están sesgadas y están manipuladas con un +-3% de error.

  3. #17
    20/02/15 23:43

    El 100% de las encuestas están sesgadas y están manipuladas.

  4. en respuesta a 8........s
    -
    Top 100
    #16
    19/02/15 21:02

    ya...

    pero esto es otra cosa.

    una cosa es manipular una estadística y otra falsear los datos o manipular la obtención de los datos. Lo otro, como sugieres es normal, pero el resto es mucho peor.

  5. en respuesta a Ice man
    -
    Top 100
    #15
    19/02/15 21:01

    Un par de cuestiones.

    La primera es que una cosa es maquillar los datos. Es decir, presentar determinada información de determinada forma acorde a unos intereses determinados. Esto es censurable, (no acabo de entender como hemos llegado a un punto donde lo vemos normal), porque no deja de ser "engaño".. inducir a error.

    Sin embargo esto es completamente distinto. Yo asumo que las encuestas tienden bastante de lo anterior y por esto me preocupo de ver el conjunto de los datos y la metodología antes de sacar conclusiones, (hay muchos post que así lo demuestran). Sin embargo todo depende de que los datos no esten falsedos. La inducción al error se puede corregir (a veces no fácil), pero la falsedad es imposible.

    Respecto a la segunda. Si consideras que normalmente existe engaños, como parece indicar tu cuestionario... ¿cómo es que tradicionalmente apoyas precisamente lo que estos cocinadores nos venden?. Entendería que una persona ajena a lo que comentas lo defienda todo... pero.. no me lo explico.

  6. en respuesta a Siames
    -
    Top 100
    #14
    19/02/15 20:50

    A ver, creo que no he explicado bien varias cosas:

    la primera es que existen diversas frecuencias en las llamadas y se busca a los que están trabajando con mayor frecuencia... Por tanto la probabilidad de encontrar ocupados es mayor cuanto mayor sea lo que dediques a lo de activos.

    La segunda es obvia...

    Si primero llamas a los activos y luego a los inactivos, la tasa de actividad (el otro gran dato de la EPA) es literalmente un chiste.

    La tercera es simple y consecuencia de las otras dos... cuanto mayor sea el campo en el que cargas las pesas hacía un lado, (los esfuerzos para contactar con ocupados es el peso y el conjunto de "no inactivos" es el campo en el que te mueves) frente al resto, mayor es el impacto de lo anterior.

    La cuarta si quieres verlo de otra forma es simple... ¿Quieres modificar el dato de paro como te de la gana?.. Pues lo que haces es ir sacando hasta que te salga el dato que te da la gana. y luego rellenas con el otro grupo.

    oye... que no has contestado.

  7. en respuesta a Siames
    -
    Top 100
    #13
    19/02/15 19:30

    A ver. He puesto los hechos como son...

    Es decir. No he dicho que hayan inventado números no similar.

    La pregunta que te hago es simple. Es manipulación o no?.
    En tu opinión... Claro. Y los hechos descritos

  8. en respuesta a Yo mismo
    -
    #12
    19/02/15 19:09

    A ver deja el ejercicio y piensalo bien un ratico anda..."Igual si que llames a más ocupados que parados introduce un sesgo y si llamas a más activos que inactivos otro a través de la tasa de actividad"

    Si hablamos de sesgo en la tasa de paro lo primero si, lo segundo no, o que no te has enterado todavía? otra cosa es que si manipulas el paro llamando mas trabajadores que parados y luego rellenes con mas jubiletas la encuesta te baje la tasa de actividad pero seria una consecuencia no el motivo. Digamos que de hacerlo así cantaria que mejora la tasa de paro y baja la actividad mas de lo normal, cosa que no se ve en los datos. Vamos que no parece que lo esten manipulando mucho de esta forma.

    Claro que si lo que quieres es gritar "MANIPULACIÖN MANIPULACION que lo se de muy buena tinta" pues no te marques una de tus chapas tan sesudas, que a algunos no nos tragamos las preferentes ;)

  9. en respuesta a Siames
    -
    Top 100
    #11
    19/02/15 18:55

    Pd. Menos mal que tu no necesitas que las cosas tengan sentido

  10. en respuesta a Siames
    -
    Top 100
    #10
    19/02/15 18:54

    Es que estoy en móvil haciendo ejercicio.

    Pero dadas las condiciones te voy a dar la razón en lugar de explicarte que si salen 50 de 100 llamadas que dicen que están en el grupo A y dado que hay un número fijo de españoles... Sobre el que se aplica el porcentaje para llegar a número....

    Igual si que llames a más ocupados que parados introduce un sesgo y si llamas a más activos que inactivos otro a través de la tasa de actividad...

    Y pd.. Si antes puse 100 en el ejemplo fue comodidad... Pon 46 millones a ver si te sale mejor

  11. en respuesta a Yo mismo
    -
    #9
    19/02/15 18:48

    Ah claro ahora no quieres hablar de los detalles...si acusas de manipulación que no se si la hay o no que tu acusación tenga al menos sentido.

  12. en respuesta a Siames
    -
    Top 100
    #8
    19/02/15 18:27

    Vale. Lo que tu digas... Llamar por segmentos según conocimientos previos no afecta para un procedimiento determinado a saber cuántos hay en cada segmento.

    Mejor?

  13. en respuesta a Yo mismo
    -
    #7
    19/02/15 18:23

    Pues la trampa estará en llamar a los que presumas que estan trabajando dentro de la población activa pero como te digo llamar a 100 que a 10.000 pensionistas no cambia nada porque estan inactivos. Vamos que como mucho te compro que se pongan a llamar a un numero determinado de gente que sepan que trabajan (habrá que demostrar que lo hacen así) y luego cuando tengan la tasa de paro que quieran rellenan el resto de llamadas con jubilados (habrá mas y no menos), cosa que no cambia la tasa de paro ya te que insisto que la trampa es poder llamar a los que trabajan en vez de a los activos que no tienen y buscan empleo (parados). Pero vamos para manipular que te llamen a ti que en el ejemplo que has hecho lo has bordado ;)

    Por cierto que de ser así la manipulación, lo que verias seria un caida muy fuerte de la actividad no una subida como dices...porque una vez que obtuvieran las respuestas de trabajadores que necesitan rellenarian la encuesta con mas jubilados. Pues no, justo estamos viendo que sube la actividad algo en el último trimestre...cosa por otro lado nada sospechosa como dices, ya que habitual cuando mejoran las perspectivas de encontrar empleo.

  14. en respuesta a Siames
    -
    Top 100
    #6
    19/02/15 18:14

    Joder... Será una táctica new ave de captar... Llamas primero y con más interés a los que presumes están trabajando. Y dejas a los inactivos al final. Luego llamas a los inactivos hasta llegar al número de estadísticas y parece que no se ve ningún problemita ni cuando se ve que sube tasa de actividad y baja de paro salvo que se de muy mala suerte...

  15. en respuesta a Yo mismo
    -
    #5
    19/02/15 18:00

    Te estas haciendo trampas en el solitario. Das por hecho que esos 10 activos de mas que llamas (pasando de 80 a 90) no estan parados. Vamos que tus 20 parados son fijos e independientes de los activos que llamas y eso no tiene sentido. Lo que efectivamente mide la tasa de paro es desempleados sobre activos, si llamas a 20, a 300 o a 5000 pensionistas no cambia nada en la ecuación ya que no estaran ni en el numerador ni en el denominador. Otra cosa es la trampa que te haces en tu ejemplo, que seas capaz de pasar de llamar de 80 a 90 activos y sigas obteniendo como respuesta solo 20 parados ya que tu de ante mano has decidido que vas a tener 20 parados. Pero vamos para eso da igual los pensionistas lo que importa es que llames a otros 10 tios activos que sepas seguro que estan trabajando.

    Para que lo entiendas mejor tienes 20 parados de 80 llamadas a no pensionistas luego da igual que llames a 20 o a 2000 pensionitas que tu tasa de paro sera de 20/80. si pasas a 20/90 es porque has llamado a 10 tios mas con curro los pensionistas no cambian nada.

  16. en respuesta a Siames
    -
    Top 100
    #4
    19/02/15 15:31

    imagina que llamas a 20 parados, y que tienes tener 100 respuestas.

    Si llamas a 90 activos y 10 inactivos (Pensionistas) te sale una tasa de paro de (20/90)*100=22,22%.

    Si llamas a 80 activos y 20 inactivos (pensionistas) te sale una tasa de paro de 20/80 =25%

    Todo el mundo sabe que pensionistas no son parados, pero cuantos menos pensionistas existan, mayor será la tasa de actividad y por tanto menor la tasa de paro.

  17. #3
    19/02/15 14:43

    Los pensionistas no son parados

  18. #2
    19/02/15 12:35

    Pues acabas de descubrir la sopa de ajo.

    Por el año 2003 estaba un amigo mío reunido con un consejero autonómico y en un momento dado precisaron datos que no tenían encima de la mesa en aquel momento, el consejero cogió el teléfono y pidió que se los trajeran especificando "pero trae los maquillados eh, que ya sabes que me gustan con mucho maquillaje". Y en este caso los datos estaban recogidos y "cocinados" por funcionarios, no hacen falta empresas privadas para maquillar o cocinar lo que se quiera.

  19. Top 100
    #1
    18/02/15 22:45

    Solo me fío de las estadísticas que he manipulado...

    winston churchill ...un abrazo tomas

Definiciones de interés
Sitios que sigo