Artículo Recomendado: Metodología de trabajo para modelos cuantitativos
Esta es la primera entrada de sobre artículos recomendados que publicaré. Es algo que llevo haciendo ya un tiempo en twitter (@IvillalongaB) donde recomiendo un paper o artículo que me ha gustado especialmente.
El artículo de esta semana es interesante en cuanto a que señala de forma clara que problemas nos podemos encontrar a la hora de diseñar modelos cuantitativos de inversión y propone un modelo de trabajo acorde para evitarlos.
Artículo
A Backtesting Protocol in the Era of Machine Learning – R. Arnott, C. Harvey, H. Markowitz
https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3275654
Contenido
Quizás siendo un artículo más denso de lo que llevo compartiendo últimamente, creo que proporciona una buena herramienta. De hecho, en el Exibit 2, hay un resumen con las preguntas clave que hay que hacerse constantemente para evitar el (tan temido) overfit.
Es muy interesante ver los peligros que presenta el data mining si no se hace correctamente. Como puede ser encontrarte un sistema como este que pasa todos los “filtros” del backtest, de robustez, correlación, etc.
Pero el sistema simplemente ha sido encontrado por fuerza bruta y no tiene ninguna base lógica, financiera ni económica detrás. Simplemente una combinación casual en las letras de los Tickers.
Una buena base lógica, y aplicar el método científico es imprescindible para poder empezar a realizar estos análisis. Las cajas negras, especialmente cuando aplicas métodos de ML, pueden ser muy peligrosas. Hay que entender bien que está haciendo el modelo y porqué funciona.
Evitar tus sesgos, cuidar la calidad de los datos, llevar un registro del proceso, etc, son puntos muy importantes para garantizar la calidad de los resultados. Es más importante que el resultado sea correcto, a que sea positivo. Encontrar lo que no funciona es clave también.
Las ganas de encontrar sistemas ganadores a toda costa llevan a encontrar sistemas que lo hacen genial sobre el pasado y con un overfit impresionante en el futuro.
Otro punto que me ha gustado mucho es “no true out-of-sample data exists; the only true out of sample is the live trading experience”. Es cierto no podremos tener la certeza de cómo se comportará en real hasta que no lo pruebas en real.
Esta metodología que proponen es válida para todo tipo de investigación cuantitativa de inversión, desde los sistemas de largo plazo con factores en acciones hasta los sistemas en futuros de commodities intradiarios.
Tener una buena base de trabajo es realmente muy importante.
Que lo disfrutéis!
Para cualquier pregunta tenéis mi twitter @IvillalongaB y @ZonaQuant y mi mail [email protected]
Si os ha gustado, subscribíos al blog para que os avise cuando haya más publicaciones!
Un abrazo.
Ignacio Villalonga
Zona Quant