La cantidad de datos que está disponible hoy en día tiene la capacidad de cambiar cómo funciona el mundo. Empresas como Google están inventando continuamente nuevas formas creativas para recoger y procesar los datos que nos sometemos a través de la web.
Al mismo tiempo, comerciantes cuantitativos creativas están constantemente buscando nuevas maneras de encontrar una ventaja en los mercados de hoy. Era sólo cuestión de tiempo antes de que estas dos fuerzas chocaron.
Damien Challet y Ahmed Bel Hadj Ayed publicaron un artículo en julio de 2013 titulado La predicción de los mercados financieros con Google Trends y palabras clave no tan al azar. El objetivo del trabajo fue evaluar la credibilidad de las afirmaciones que buscan datos disponibles de Google Trends podría utilizarse para predecir los movimientos importantes del mercado.
Al final del documento, Challet y Bel Hadj Ayed concluyen que los grupos de palabras clave, si estaban vinculadas a la financiación o no, no ofreció ninguna prueba razonable de que robustamente podían predecir los movimientos del mercado. Sin embargo, había pruebas de que las palabras clave específicas aplicadas a los activos específicos podrían producir estrategias comerciales rentables.
Este es un enfoque muy emocionante y muy fuera de la caja a cotización que me pareció ser una lectura fascinante. Yo estaba particularmente impresionado con la cantidad de atención que Challet y Bel Hadj Ayed pagó a todos los diferentes sesgos que estuvieron presentes tanto en sus resultados de pruebas retrospectivas y el estudio previo que se citan.
Éstos son algunos de los sesgos interesantes que abordan:
Herramienta Bias
Los autores que se refiere al sesgo como herramienta de “el sesgo más alto.” Explicaron que describe la situación en la que uno está usando hardware o software que no estaba disponible en el momento de los datos analizados.
Este tipo de sesgo es citada como la razón de que muchas pruebas retrospectivas ven bien antes 2003, pero no producir los mismos resultados después. Los autores explican un poco más lejos:
Encontrar previsibilidad en datos antiguos con herramientas modernas es de hecho más fácil de lo que debería ser.
Datos sesgos
Challet y Bel Hadj Ayed pasaron una gran parte de sus sesgos sección romper todos los diferentes tipos de sesgos de datos que estaban afectando el backtesting de esta estrategia.
El sesgo de los datos más evidente fue el hecho de que los datos de Google Trends sólo se remonta a agosto de 2008. Cualquier análisis antes de que el tiempo es completamente especulativa.
Los autores también abordan el hecho de que muchas veces los datos se ajusta después de los hechos. Ellos usan el ejemplo de las cifras del PIB de ser liberado y luego se ajustó más tarde. El backtest sólo percibirá el número final, por lo que no dará cuenta de la original y luego el ajuste.
También hay casos de ajustes en el formato de datos en el tiempo. Los autores explican que Google Trends ajustar el tipo de datos que se utilizan en 2012. Por lo tanto, los datos de antes 2012 está estructurado de manera diferente de los datos elaborados después 2012.
Challot y Bel Hadj Ayed también señalan el impacto que sesgo de supervivencia tiene en el backtest.
Bias palabra clave
Los sesgos de palabras clave eran los sesgos más interesantes que el papel cubierto. El documento original que los autores se citan eligió palabras clave que fueron sesgadas intencionalmente hacia los mercados financieros.
Challot y Bel Hadj Ayed tomaron un paso más allá mediante la creación de tres grupos no sesgada de palabras clave para comparar la palabra clave financiera con. Esto dio lugar a interesantes resultados sobre la base de palabras clave al azar, como “cáncer de hueso” y “Moon Patrol” en comparación con las palabras clave seleccionadas específicamente dirigidos como “la deuda.”
Otros sesgos
Los autores continuos mediante la identificación de un número de otros sesgos que estaban presentes, incluyendo los errores de codificación, palabras clave futuras, espionaje de datos, y la falta de las comisiones por transacciones.
Sin embargo, a pesar de todos estos prejuicios que están afectando el backtesting, Challet y Bel Hadj Ayed todavía encontraron que una estrategia rentable podría ser construido sobre la idea de utilizar los datos de Google Trends como una señal para el comercio.
Chris Vermeulen dice
This is a really great piece and the embedded links are very useful also. I use Google trend all the time for various things in my life and business and believe it has great value to those who understand the data.
Backtesting is no easy task if you want near accurate results, that is for sure.
Gracias por compartir!
Andrew Selby dice
Gracias, Chris! Me alegro de que te haya gustado!
berry dice
Leider muss ich sagen, muss der Artikel überarbeitet werden, da sehr viele gravierende Satzbaufehler enthalten sind 🙂 aber im groben mehr oder weniger verständlich.
Shaun Overton dice
It’s far from perfect…