我花了近两年来编写跑在我的卧室的算法交易系统,虽然我离开了家, 工作我的日常工作, 住了我的生活. 这个想法花了几个月的时间才能获得, 实施, 完善的同时克服更多的障碍,我能想象. 到目前为止, 我遇到的最大的问题就是找到好, 免费股票数据.
股票蜱数据
免费数据的最小增量我能找到的是挪威网站,可以通过搜索“NetFonds”在谷歌和选择读英文“翻译此页”。随着货币和商品数据, Netfonds 也有纳斯达克的所有数据打勾, 纽约证券交易所, 和AMEX股. 获取数据免费是很容易, 但需要一些努力去理解.
开始, 输入以下网址到浏览器
HTTP://hopey.netfonds.no/tradedump.php?日期=[日期]&纸=[股票]&csv_format = TXT
这里, 还有,你需要改变两个参数.
[日期] – 应替换形式YYYYMMDD日期, 因此,例如 20130919 将是从周四获得的数据, 九月 19, 2013. 在我的经验, 数据可以追溯到各地 15 天, 但我不能保证这一点对于每一只股票. 通常, 我拍摄和储存今天昨天的数据.
[股票] – 这是你更换股票名称来收集. 美中不足的是,你必须知道的交换码.
NYSE代码是'N' — 例如, 收集梅西, [股票] = M.N
纳斯达克代码是'O' — 例如, 收集谷歌, [股票] = GOOG。O
AMEX代码是'A' — 例如, 你得到的图片
显示的数据有一个时间, 价格, 量为.txt格式. 一切看起来言自明, 预计该时间列. 我详细阐述的例子,我看到的第一个条目.
时间= 20130919T153000
译为 2013, 09 (七), 19 (天), 时间, 15:30:00
这似乎不可思议, 但要记住, 你是从挪威网站收集数据和奥斯陆领先的纽约市时间6小时. 考虑到军事时间格式, 15:30:00 是真的 3:30 在挪威, 这是 9:30 在EST和市场开放. 请注意,在这个逻辑, 在公开市场时间的最后一个数据点是由字符串表示
时间= 20130919T220000
到目前为止, 我遇到的最大的问题是找到很好的免费数据
您还会注意到,有些行具有相同的时间戳. 这应该按时间顺序与逻辑,价格正在改变每秒几次被解释. 记得价格是如何变化.
最后, 欲外注意,任何时候都 15:30 和 22:00 是小时交易后,. 您可以在谷歌金融市场的活动后随时查看. 尝试搜索苹果, 并检查下设置“延长服务时间”给出的图表链接下. 灰色的价格是小时后发生的交易.
订单蜱数据
最好的免费剔订单数据,我能找到只显示最好的买入价和卖出报价在给定时间. 虽然, 有无穷的方法此信息可以用来提高系统.
再次Netfonds, 尝试粘贴以下网址到浏览器:
HTTP://hopey.netfonds.no/posdump.php?日期=[日期]&纸=[股票]&csv_format = TXT
与上面使用的相同的日期和库存公约. 请注意,你必须相应的体积和最佳买入了一些额外的列/卖价市场.
对于这个数据组, 你会看到,延长服务时间延长报价远远超过刻度数据, 虽然价差大幅扩大. 延长盘后交易存在很大风险,由于缺乏流动性, 但是,这是它自己的一个主题.
谷歌财经数据
数据可以在这里找到, 并遵循非常相似的约定来NetFonds尽管数据来自每分钟. 网址是
HTTP://www.google.com/finance/getprices?I =[期间]&P =[天]ð&F =ð,该,ħ,升,Ç,在&DF = PABX&Q =[自动收报机]
[期间] – 以秒为单位的时间间隔
[天] – 历史数据周期. 例如 [天] = 10D要求后十天
[自动收报机] – 股票代码. 没有必要的代码, 所以AAPL工作得很好
雅虎财经数据
类似于谷歌财经和雅虎, 一般的URL由下式给出
HTTP://chartapi.finance.yahoo.com/instrument/1.0/[自动收报机]/chartdata;类型=报价;范围= 1D / CSV
频率为秒, 和历史范围内使用是 5 天.
获取数据
编程语言有一个古老的权衡. 如果你想有一个快语, 你在学习的非平凡的语言和概念牺牲. 如果你想要的下载上面的数据集的代码, 你希望它明天上班, 你在使用较慢的语言牺牲.
对我来说, 数学和Python是非常直观的,以第一天使用, 并且都内置功能来浏览和下载数据. 我也学会了用苹果脚本在我的Mac用很少的努力. 这是很好的,因为我可以计划我的电脑在早上醒来, 去一个网站, 并下载最新数据.
从没有使用像C 语言的速度权衡假设离开我. 除非你支付顶级美元, 你必须假设你正在下载的数据是有些忐忑还有就是你可以做些什么.