Acceder

 

Ayer he puesto un post sobre las nociones básicas de la econometría. Avisaba que era un post que iba a necesitar y hoy lo pretendo completar con una pequeña aplicación práctica de lo que pueden llegar a ser las burradas econométricas y los resultados engañosos.

El de hoy también es necesario para entender cómo se cocinan los resultados, y vuelvo a pedir perdón porque es muy difícil hacer estos post más amenos, (o por lo menos yo no tengo tal capacidad).

Hoy propongo un juego; imaginemos que me gustaría estimar cuales son las páginas vistas o mejor dicho, tratar de adivinar cómo afectan determinadas variables al tráfico de este blog.

Lo primero que he de hacer es tratar de encontrar algún indicativo de las razones que llevan a que unos días tenga unas visitas y otros días un número diferente. Por supuesto, tal circunstancia no es sencilla, pero como hay barra libre, he seleccionado en primer lugar la temperatura. Voy a asumir que el clima afecta a los hábitos de la gente y por tanto consiguiendo las temperaturas medias, comprobaré la relación con el blog.

Puestos a hacer un experimento he encontrado por internet los datos de la estación meteorológica de Tocumen, (en Panamá), y he cogido los datos de los días laborales de 2010 y los he comparado con las páginas vistas en mi blog. De esta forma he conseguido un modelo que me dice que las páginas vistas cada día en este blog serán iguales a 1590,383025 menos -15,87309759 por cada grado de temperatura en esta estación. Por tanto puedo decir con orgullo que existe la relación que yo estimaba lógica. Cuantos más grados existan, la gente se va a disfrutar del aire libre, olvida los ordenadores y tengo menos visitas.

Para demostrar que el modelo vale, podría decir que aplicando la fórmula para el pasado, es cierto que han existido errores, pero la verdad es que sumando los errores por exceso y restando los por defecto, el error global que me sale es -1,2867*10-09; o sea que es casi cero. Por supuesto, el hecho de que se compensen los errores y me de un acierto global perfecto no es más que una ilusión matemática, ya que de eso se trata. Es más, este pequeño error es derivado de los redondeos en los cálculos, que producen un error muy bajo.

Comprobando el coeficiente de determinación me ha dado un resultado de 0,002100788, lo cual viene a decir que mi modelo explica el 0.21% de las variaciones del tráfico en mi blog.  Por esto, sorprendentemente me encuentro que debo buscar un fallo en todo el trabajo que he hecho.

Como tengo bastante moral, pues he decidido no tirar los datos, pero probar otra relación. De esta forma puedo defender que las páginas vistas de este blog están relacionadas con el valor el EONIA, (tipo del interbancario europeo a un día). La razón es que si el tipo sube, resulta que la gente se dedica a buscar información, (aunque resulta que casi nadie sigue los valores de eonia). En este caso, sale que las visitas de cada día a mi blog van a ser iguales a 1049,904458 a lo que tengo que sumarle 228,343548 por cada punto de eonia. Por tanto, puedo decir con unos datos inapelables que “según estudios y datos se comprueba que la subida de eonia va a beneficiar las visitas a mi blog”.

Ahora que sabemos que hay coeficientes de determinación, tengo que decir que en este caso da un resultado de 0,006513695; por tanto si me baso en esto para deducir que existe una relación entre el eonia y las visitas a mi blog, se me podría acusar de ser o un completo inútil o un manipulador que intenta vender una sucesión de tonterías como algo científico, olvidando el significado real de las cosas y el mínimo rigor, hasta el punto de que estaría ignorando que un coeficiente de determinación no llega a un nivel de 0,9 que es un mínimo para empezar a considerar el modelo y por tanto las conclusiones como buenas.

Pero bueno, sigamos probando y lo que voy a hacer es otro modelo en el que trate de explicar las visitas al blog en función de las dos variables. El resultado me diría que un día determinado debería tener 1226,915869 visitas más 209,4472794 por cada punto de eonia y restar 6,015465153 por cada grado de temperatura media de Tocumen. Como vemos, se confirman las dos hipótesis que tenía, que resulta que cuanta más temperatura, menos visitas y cuanto mayor sea el eonia, mayores visitas.

El coeficiente de determinación se incrementa hasta 0,006770804, de forma que es el mayor de todos, (aunque muy poquito superior a si lo explicaba sólo con el eonia). Esto es otro pequeño efecto de los cálculos; a medida que incrementamos las variables explicativas, se incrementa el coeficiente de determinación, por lo que podría ponerme a meter variables y variables hasta llegar a un coeficiente de determinación. Por supuesto, existe un método para seleccionar cual de los modelos es mejor, (R2 corregido); método que no tiene sentido, ya que lo primero es que tenemos que encontrar métodos válidos y luego compararlos.

Se puede analizar qué es lo que ha fallado en estos modelos, o incluso podemos esconder el coeficiente de determinación, (total, nadie preguntará por él), y seguir usando los modelos para hacer predicciones. Por supuesto, seguir en estas condiciones será una temeridad, que sólo se puede entender desde la inutilidad total del que propone este modelo, o de simplemente un morro increíble, si se trata de satisfacer algún interés en particular.

Existen varias razones para las que un modelo salga mal, pero desde luego la más plausible es que no existe una relación tan fuerte como suponíamos. En estos ejemplos es más que evidente, ya que ni la temperatura en Tocumen, ni el EONIA, (que nadie mira diariamente), tienen absolutamente nada que ver con los motivos por los que una persona accede a este blog, por lo que este modelo planteado es un absurdo completo.

Desde luego estos ejemplos no son realistas, lo más normal es que tratemos de establecer relaciones entre variables que pueden tener algo que ver. Ya que estábamos he tratado de establecer una relación entre Euribor a 12 meses y Eonia. Este sería un ejemplo un poco más normal y metiendo los datos del 2010 hasta el 26 de octubre (210 datos), me sale una relación que dice que el euribor fijado en cualquier día es 1,114978154 más 0,479319425 por cada punto de eonia.

Estos datos son coherentes ya que cuando sube el tipo de interés que han fijado ese día las entidades financieras, el euribor tiende a subir. ¿Qué ocurre con el coeficiente de determinación?. Pues el resultado es un 0,444532707; que es un resultado bastante pobre y que nos dice que el modelo que relaciona el euribor y el eonia simplemente no es válido.

Por supuesto, lo que quiere decir esto es que existe una relación entre ambas variables, pero que los valores finales dependen de variables distintas. Y tendríamos que buscar nuevas razones para defender las relaciones entre las dos variables.

Por supuesto, si salgo a defender que puedo estimar el euribor, sabiendo el eonia, en este enfoque, me aplicaría los mismos calificativos que intentando defender que las visitas de este blog se explican por  eonia o temperaturas de algún sitio que reconozco no saber ni donde está. Sólo sería un poco menos exagerado.

Por cierto, no he puesto los datos porque todo esto es un absurdo, y bastante ladrillazo me ha salido. Además la presentación es un desastre; sin embargo, si alguien está especialmente interesado, puedo enviar por mail un Excel donde van los datos y los cálculos, pero por supuesto, los datos son fácilmente obtenibles y estoy seguro que existen múltiples programas más fáciles de usar que una hoja de Excel, bastante chapuza que he construido para el caso.

15
¿Te ha gustado mi artículo?
Si quieres saber más y estar al día de mis reflexiones, suscríbete a mi blog y sé el primero en recibir las nuevas publicaciones en tu correo electrónico
  1. en respuesta a Yo mismo
    -
    #15
    03/11/10 17:16

    Yo me refería al gráfico de regresión que aparece al representar las respuestas que da el modelo (multivariado) y las respuestas que debería haber dado. No confundir con los gráficos de regresión del modelo frente a cada variable del sistema.

    Es decir, un gráfico que representa "lo bien" que lo hace tu modelo prediciendo, comparando con lo que debería hacer.

  2. en respuesta a Dabulper
    -
    Top 100
    #14
    03/11/10 10:14

    Esa es la idea, pero claro, matemáticamente esto lo podemos hacer si tenemos una variable explicada y una explicativa.

    a partir de ahí, ya no nos sirve la representación gráfica, porque cada variable adicional supone una dimensión adicional.

  3. #13
    03/11/10 05:26

    Con lo fácil que es "ver" en un gráfico de regresión si el modelo ajusta los datos o no...

    Si la distribución de puntos es una hermosa línea recta, el modelo lo clava.
    Distribuciones de puntos más alejadas de la línea recta, no es tan buen modelo.
    Distribuciones de puntos en plan nube borrosa donde se dibuja una recta de regresión que podría apuntar en cualquier otra dirección y no notaríamos la diferencia, entonces es que el modelo es una M...

  4. en respuesta a Fernan2
    -
    Top 100
    #12
    02/11/10 21:33

    vas a tener que graduar del 1 al 20, la comprensión y luego me vas a tener que mandar una codificación del volumen de letras que eres capaz de leer por segundo, el grado de estudios de tus familiares hasta 3 grado y el numero de minutos que dedicas a ver a la esteban...

    y luego si conseguimos otros treinta más... nos hacemos un modelo simpatico que vendemos como un estudio de impacto a todos los períodicos de españa....

    igual sirve para algo....¡para forrarnos!

  5. en respuesta a Comstar
    -
    Top 100
    #11
    02/11/10 21:31

    evidentemente siempre es posible una relacion causal. en todo caso en este ejemplo el problema son los datos. son muy pocos datos para conseguir una relacion fiable.

    en todo caso, el problema es siempre de orden... si el modelo te da una buena relación tienes que contrastarla y seguir buscando...

    si el modelo te da una mala determinación, el modelo no sirve y simplemente no te sirve para nada.

  6. en respuesta a Yo mismo
    -
    Joaquin Gaspar
    #10
    02/11/10 20:59

    Estoy en espera de tu próximo post

  7. Top 100
    #9
    02/11/10 06:25

    Creo que te gustaría leer este artículo

    PIRACY AS A PREVENTOR OF TROPICAL CYCLONES
    By Jacob Haqq-Misra and Michael Larson

    http://www.scq.ubc.ca/piracy-as-a-preventor-of-tropical-cyclones/

    Al establecer una correlación estadística entre el calentamiento global y la piratería, se llega a la conclusión de que la solución contra los tifones es aumentar la piratería. Claro, olvidan analizar el fenómeno de causalidad, el ligamen causa-efecto, pero ¿a quién le importa esas pequeñeces cuando las matemáticas funcionan tan bien?

  8. Top 25
    #8
    02/11/10 01:04

    A mí no se me ha hecho nada pesado ni difícil de entender... pero francamente, no me veo como alguien representativo de la gente normal (ni para lo bueno ni para lo malo), así que no te precipites en establecer modelos entre lo que a mí me gusta y lo que le gusta a tus lectores... ;-)

    s2

  9. en respuesta a Gaspar
    -
    Top 100
    #7
    01/11/10 23:21

    Desde luego este es un problema muy grave....

    nos encontramos con multitud de casos en los que nos dicen..."se demuestra", "el año que viene tendremos tal dato...", y desde luego existe multitud de casos en los que se da el chiste que dices.. (lo de los efectos visuales).

    Pero en particular iba hacía el caso contrario, que es aquel en el que "expertos" hacen informes con una apariencia de seriedad de tal calibre que con todo el morro del mundo exponen incluso las burradas metodológicas para dar la sensación de un estudio riguroso y cientifico cuando realmente nos están contando una de vaqueros,

    En este caso es para apoyar la idea de que las obligaciones de Zinkia son una buena inversión y para eso no dudan en cargarse todas las normas y razonamientos econométricos, con tal de poner en un informe las palabras bonitas, ¡aunque den todos los datos para demostrar que no es cierto!...

    En definitiva, que traten de dar la sensación de que es algo cientifico que puede fallar, (los analisis son buenos, pero hay riesgo), pero que la cosas está muy estudiada por los profesionales...

    en todo caso, ya estoy acabando el post sobre lo que es el informe y sobre las razones por las que da tan poca correlación y además de todos los fallos metodólogicos que incluye y que todos ellos llevan a la conclusion de que ese informe o es una soberana tontería o un soberano engaño...

    animo a leerlo entero a descubrir todos los fallos metodológicos...

  10. en respuesta a Mateodecasas
    -
    Top 100
    #6
    01/11/10 23:07

    En primer lugar, lamento lo del retraso en la propuesta... prometo colgarla el miercoles a esta hora....

    me está costando condensarla y conseguir algunos datos, que ya he conseguido, y sobre todo tratar de redactar.

    Respecto a lo de los peajes en la sombra, si que lo había visto, lamento no haber contestado. Por supuesto, el tema no es nuevo, y la verdad es que llevan una buena temporada con la historía...

    por ejemplo en septiembre de 2009

    https://www.rankia.com/blog/nuevasreglaseconomia/426999-espana-s

    y sobre todo

    https://www.rankia.com/blog/nuevasreglaseconomia/427735-bienes-privados-bienes-publicos

    donde explicaba estas cosas...

    ya en 2010... estaba tambien en el post...

    https://www.rankia.com/blog/nuevasreglaseconomia/477066-espana-europa-que-paisaje-paisanaje

    (antes del ajuste...)

    y despues del ajuste....

    https://www.rankia.com/blog/nuevasreglaseconomia/499485-van-bajar-sueldo-otros-funcionarios

    por no hablar de que opino que esto es un gran robo...

    https://www.rankia.com/blog/nuevasreglaseconomia/580204-colaboracion-publico-privada-gran-robo

    respecto a lo de adonde pretendía llegar, no es a lo del euribor-eonia, que la verdad es que ya hace tiempo que justifique que tenían algo que ver pero muchas diferencias y de que desde luego lo del euribor es un gran cachondeo, (sobre todo desde el punto y hora que nos cuentan que es el interbancario).

    Pero no era ahí donde quería llegar, sino que era a un informe completamente demencial que ha hecho Intermoney sobre la emisión de obligaciones de Pocoyó.

    Es completamente demencial y es en parte culpa de que haya retrasado tanto la serie de lo de la los tipos de cambio, (y la irracionalidad de la hiperinflación), que retomo el jueves... como lo del "que hacemos ante los abusos en los mercados" que viene el miercoles.

    El problema es que explicar las burradas del informe de intermoney me obligaba a cierta explicación previa, porque sinceramente es un ejercicio increible esto de emitir un informe con mucha palabrería y con un aspecto de rigor cientifico, para acabar sacando conclusiones. La gran suerte es que para desacreditarlo, no eran necesarios conocimientos muy fuertes...

  11. en respuesta a Angelito7454
    -
    #5
    01/11/10 22:26

    Creo saber hacia dónde va esto (o de donde viene) ya que por lo que veo, el euribor no tiene nada que ver con el interbancario, ni con las ayudas a los bancos, ni tan directamente como pensaba, con los tipos de interés. Vamos, que es un índice más manipulado que un combate de lucha libre. Por otro lado, ¿qué pasó con la propuesta de boicot? No sé si viste cómo se confirmó lo de los peajes en la sombra previo endeudamiento del mi(ni)sterio de fomento...

  12. Joaquin Gaspar
    #4
    01/11/10 16:08

    Sigue interesante el post. Continúa.

    Me imagino que a donde quieres llegar es a que muchas veces algunos economistas o estadísticos, deforman la realidad y nos ocultan la fiabilidad de sus modelos y predicciones, de manera que uno ve las estimaciones de un economista serio y las de uno sin ética y percibe una diferencia en los resultados pero como uno de ellos esconde y acomoda a su favor las variables parece como si ambos tuviesen razón.

    No hay que ir tan lejos, simplemente las gráficas que muestran los gobiernos las ponen en dimensiones donde el eje Y o el eje X se ven reducidos o ampliados par que el efecto visual sea el que ellos pretenden.

  13. #3
    01/11/10 01:30

    sigue, sigue, que me come la curiosdidad por saber a donde quieres llegar.

  14. en respuesta a Feinmann
    -
    Top 100
    #2
    01/11/10 01:21

    [cachondeo mode: on]

    Es que soy Gallego y aquí ya se sabe... nunca se sabe si subimos y bajamos, por lo que tenemos que aclararlo todo.

    [cachondeo mode: off]

    gracias por la corrección, ya he borrado lo que sobraba.

    saludos.

  15. #1
    01/11/10 01:04

    "Estos datos son coherentes ya que cuando sube el tipo de interés que han fijado ese día las entidades financieras, el euribor tiende a subir hacía arriba."

    [cachondeo mode:on]
    Curiosa forma tiene de subir el euribor: ¡hacia arriba!
    [cachondeo mode:off]

Definiciones de interés
Sitios que sigo