Hola clapas,
Espero que no me tomes como una referencia en esta materia, ya que al contrario de lo que pueda parecer, no soy ni de lejos un experto ni en Excel, ni en matemáticas, estadística ni en nada. Tengo unos conocimientos muy limitados e intento manejar esto con 4 cosas desde un enfoque totalmente minimalista.
El como enlazar Excel a un origen de datos, lo explico en el segundo post del hilo de Excel.
Básicamente lo que hago es conectar una hoja de Excel a través de un link al servidor de Yahoo, de manera que cada vez que se abre Excel, este descarga un fichero CSV (una tabla plana), sin complicaciones, siempre se descarga la tabla completa. Hay otros servidores como puede ser Quandl, que tambien ofrecen a través de un enlace la descarga de una tabla con las cotizaciones. Hay bastantes webs que ofrecen esto, la pega es que si no pagas, solo te dan los datos en resolución diaria.. para resoluciones inferiores (horas, minutos o incluso tick RAW) hay que pagar...
Lo que comentas de splitt/contrasplit es un problema ya que por ej. Yahoo no los tiene en cuenta y sería necesario hacer un ajuste manual. Esto no me preocupa ya que básicamente me centro en índices.
Excel no deja de ser un juguete, y si finalmente te animas con el proyecto, un entorno más serio sería montar tu propio servidor de base de datos (por ej. SQL Server de Microsoft) y un entorno de programación (por ej. MS Visual Studio) y todo ello alimentado desde una fuente de datos de pago (hay mil plataformas de pago que permiten descargar CSVs o mejor aún alguna API a través de la cual atacar los históricos).
De esta manera tendrás un control absoluto de todos los parámetros, y una plataforma de programación en condiciones. La pega es que sale caro..
Muy interesante el enlace al proyecto R, tiene buena pinta. Yo últimamente estoy utilizando estadística robusta (al menos en una primera fase de suavizado) en vez de estadística clasica, es decir utilizar Mediana en vez de Media, desviación absoluta sobre mediana en vez de desviación típica y etc. Creo que es más apropiada cuando hay mucho ruido en los datos, y creo que es mas fiable.
Por lo demás utilizo 4 funciones (promedio, Max/min, línea de regresion, pendiente y para de contar..). Soy un informático del montón, totalmente desfasado, tal vez abarcó mucho pero aprieto muy poco.. :D. A mí favor solo puedo decir que me encanta y soy tozudo.
De economía soy un cero a la izquierda.
S2