好像我们越了解开发和测试的量化交易策略, 我们意识到我们的回溯测试结果如何轻松地可以毁了更. 其中,我们能生产完全无用的测试结果最简单的方法是使用尚未妥善清理数据.
生存偏差可能会潜入我们在许多微妙的方式使用我们的回溯测试的价格数据. 三个最明显的方式是通过为交易价格的差异, 未能包括股票摘牌, 或者通过今天的测试指标,因为它们是由而不是用他们的历史组成部分.
所有这些数据集的缺陷可以对我们的回溯测试结果的各种影响, 取决于策略,我们正在测试的类型和许多其它变量的. 在一个 最近的文章, 塞萨尔·阿尔瓦雷斯花时间来测试使用包含不同版本的生存偏差的数据的一些策略. 他的研究结果显示,目前在偏置可以有一个不可忽视的影响时间, 但也有时间时的影响是显著.
指数成份股
在不同的时间全年, 各主要股指将做出调整,以组成该指数的股票. This is done in order to maintain the index’s ability to track the general market in a specific fashion.
By using only the stocks that comprise today’s version of an index as a backtesting universe, 我们将被自动取消所有已进行足够不佳的股票被从索引在我们后台测试的长度除去. 这给我们留下了股票的宇宙比我们本来其实是有,如果我们交易系统的版本,在此期间要强得多活.
Cesar’s research shows us a strategy that was able to post an annual return of 36.25% 用的最大跌幅 24.54%. 然而, 当完全相同的策略是在历史上正确版本的指标测试, 每年的回报率下降至 14.07% 而最大跌幅上升至 30.42%.
股票摘牌
摘牌的股票是最普遍理解的形式 生存偏差. 这些股票,我们的回溯测试将错过,因为他们不再因收购或破产的交易. 就像是在索引不再是上市股票, 如果不考虑退市的股票在我们的宇宙中给我们的股票更强的宇宙比我们会在现场交易有.
该塞萨尔提供在这种情况下,证据是有趣的,因为它是不一致的. 当测试一个 均值回归策略, 包括摘牌的股票出现实际改善性能. 然而, 测试时, 趋势跟踪策略, 包括股票摘牌了年度回报,最大跌幅有负面影响.
AS-成交价
另一种生存偏差想法,塞萨尔想试验分割调整后的价格对回溯测试性能的影响. 因为股票分割的, 有很多情况下个股的历史分割调整后的价格远低于他们实际在当时.
Cesar’s theory was that this could have a negative influence on backtesting a strategy that required a minimum price for stocks it would consider. 虽然这听起来很合理, 结果表明,该差异是几乎可以忽略不计,在大多数情况下.
留言