Mientras que muchas personas de boquilla a la importancia de sesgo de supervivencia, la mayoría de ellos no se dan cuenta de cómo puede afectar dramáticamente los rendimientos. Ajuste de los resultados del backtesting un sistema que negocia un índice bursátil determinado se ha demostrado que reducir la rentabilidad anual hasta en un medio. Esto puede significar la diferencia entre los beneficios consistentes y la voladura de su cuenta.
Yo escribí un post hace unos meses que enumeran y explican una serie de diferentes sesgos backtesting que puede sesgar los rendimientos de un sistema de comercio dado. Muchos de estos sesgos entran en juego como resultado de malinterpretar los datos. Una de las razones que encuentro sesgo de supervivencia interesante es que representa un defecto inherente a los datos en sí.
El volumen de negocios Understated de Sobrevivencia de Bias
Wikipedia define sesgo de supervivencia como:
“la tendencia de las empresas fallidas para ser excluido de los estudios de performance, porque ya no existen. A menudo hace que los resultados de los estudios para sesgar más alto porque sólo las empresas que eran lo suficientemente exitoso como para sobrevivir hasta que se incluyen al final del período.”
Aunque esta definición es correcta, proveedores de sistema tienen una tendencia a bajo-apreciar la cantidad de volumen que puede ocurrir en un índice durante un período determinado de tiempo.
Frank Hassler de Devoluciones Ingeniería ilustra este punto haciendo una lista de hechos acerca de la S&P 500 el volumen de negocios 1990 a través de 2010. Durante ese tiempo, el índice de 500 acción contiene un total de 1006 existencias. De las acciones que componían el índice sobre los 20 año, 402 se han retirado de la lista. En realidad, hay sólo 189 poblaciones que permanecieron en el S&P 500 para la totalidad 20 período del año de 1990 a 2010.
A pesar de ser consciente de sesgo de supervivencia y la comprensión de cómo podría afectar a los resultados de pruebas retrospectivas, estos números seguían chocante para mí. Simplemente no damos cuenta de la cantidad de volumen de negocios que sucede en los principales índices de año en año, y que realmente puede tener un tremendo impacto en la rentabilidad de los sistemas de valores de renta variable basado.
Comparando Supervivencia polarización a través de distintos tipos de sistemas
Hassler tomó su análisis de sesgo de supervivencia un paso más allá mediante la construcción de un conjunto de datos libre de prejuicios y comparándolo con un conjunto de datos parciales del sistema mediante tres sistemas de negociación diferentes. Comparó los resultados de un conjunto de datos sesgados y su conjunto de datos imparcial backtesting una estrategia de reversión a la media, una larga única estrategia de seguimiento de tendencias, y después de una breve tendencia única estrategia.
Hassler probó cada una de las estrategias cuando se aplica al Nasdaq 100, S&P 100, y S&P 500. Los resultados fueron muy consistentes a través de los tres índices, y muy importante para el sistema de comercio a nadie en esos índices.
La media de Pruebas de Reversión
El sistema de reversión a la media que Hassler utilizó para su prueba fue muy similar a la RSI 27/75 Sistema de reversión a la media que vimos hace unos meses. Comprobación del sistema en el S&P 500 resultó en una tasa de crecimiento anual compuesta (CAGR) de 22.48% para el conjunto de datos sesgados y una tasa compuesta anual de 14.51% para el conjunto de datos imparcial. El conjunto de datos sesgados experimentó una reducción máxima de 44.05%, mientras que la reducción máxima del conjunto de datos fue imparcial 47.11%. La tasa de ganancias del sistema se redujo de 68.05% a 66.5% cuando se expone a los datos imparcial. Prueba de ambos conjuntos de datos en el Nasdaq 100 y S&P 100 resultados similares producidos.
Solo Trend largo después de la prueba
El siguiente sistema de tendencia que Hassler utiliza clasificado todas las acciones en un índice por RSI(14) y sostuvo posiciones largas en la parte superior 25 existencias. Los resultados aplicando esta estrategia para los diferentes conjuntos de datos de la S&P 500 dado lugar a una tasa compuesta anual de -4.11% para los datos parciales y -11.25% para los datos imparcial. La reducción máxima fue 78.47% para el conjunto de datos parciales y 93.14% para el conjunto de datos imparcial.
Es importante tener en cuenta que los rendimientos reales del sistema son irrelevantes aquí. Lo único que interesa es su relación con los demás. Claramente, Esto no es un sistema rentable, pero lo apoyo Hasslers argumento que sesgo de supervivencia puede tener un tremendo impacto en la acción los sistemas de trading.
Solo Trend corto después de la prueba
Este sistema fue el opuesto de la larga único sistema de seguimiento de tendencias. Sostuvo posiciones cortas en el peor de los casos 25 existencias de un índice en términos de RSI(14). Prueba de este enfoque en la S&P 500 dado lugar a una tasa compuesta anual de -33.86% para conjunto de datos sesgados y -21.95% para el conjunto de datos imparcial. La reducción máxima registrada fue -99.92% para los datos parciales y -98.79% para los datos imparcial.
Esta fue la parte más interesante de la investigación de Hassler. Cuando se trata de sólo estrategias cortos, sesgo de supervivencia parece funcionar de una cuestión inversa. Incluyendo las acciones que realizan tan mal que estaban apartados del índice o retirado de la lista por completo dio las oportunidades del sistema a corto en su camino hacia abajo. El sistema no se beneficia de estas oportunidades cuando usamos el conjunto de datos sesgados.
Hace sesgo de supervivencia largo solamente estrategias buscar realiza mejor que ellos realizan y estrategias sólo corta mirada peores que ellos realmente. Esta combinación va un largo camino para explicar el riesgo adicional que muchos comerciantes se asocian con el comercio el lado corto. Todos sus datos backtesting sesgada les lleva a creer que las estrategias secundarios a corto son mucho peores que las estrategias laterales largos cuando su desempeño en realidad sería mucho más cerca.
La prevención de Supervivencia Bias
La mejor manera para nosotros para evitar exponernos a la supervivencia del sesgo es hacer nuestra propia backtesting en conjuntos de datos críticas. Muchos comerciantes que son nuevos en los sistemas en desarrollo no ven el valor de pagar sustancialmente más por los datos libres de prejuicios. Sin embargo, si mis sistemas sólo se va a realizar la mitad de bien que yo les esperaba, Quiero saber que antes de poner dinero real en la línea. No lo haría usted?
Decano de Jim dice
Creo que “Sesgo de supervivencia” (SBias) es un término que ha sido tan ampliamente utilizado, su significado se ha convertido en demasiado borroso. En el artículo, Creo que la cita grandes destacada “la tendencia … período se incluyen"es un ejemplo correcto de SBias. PERO … cualquier discusiones que giran en torno con índices tales como listas de SP100 o gurú como IBD100 no están relacionadas con SBias … están tratando con lo que yo llamaría “Sesgo de popularidad”. Eso es, la razón de que esas listas cambian con el tiempo prácticamente nada tiene que ver con el símbolo desaparece de los intercambios – más bien, esas listas cambian por dinámica de construcción de filtros de fundamentos, Estudios de sentimiento, etc.. El punto es, que las reglas de filtrado que los índices de cambio no son “supervivencia” relacionados con la … están relacionados con la lógica. Como tal, SE CONVIERTEN EN PARTE DE LA LÓGICA DE LA ESTRATEGIA. POR LO TANTO … Si se compara la estrategia A largo 20 lista de años usando un símbolo fijo a estrategia de B que es idéntica a Strat pero con algunas reglas extra filtrados, pero usando el mismo símbolo lista … llamaría una comparación de dos estrategias diferentes. Eso es lo que está sucediendo. Cuando se ejecutan pruebas para fijo, EDH-SP500 lista volver 20 años frente a un “lista de listas” ese cambio en los años … entonces realmente la comparación es entre dos estrategias diferentes, no una estrategia vs una lista con y sin símbolos “murió en el camino.” RESUMEN: cuando el “efectos de filtrado dinámicos” contablemente, el efecto de verdad “Supervivencia” desaparición del símbolo es generalmente insignificante.
Shaun Overton dice
Grandes pensamientos! Agradezco el detalle que pones en explicar tu idea.