华宝油气净值估算的PHP程序
2015年8月18日
眼看Qualcomm收购CSR股票的现金快要到账,最近我在琢磨在A股中国特色的QDII基金华宝油气和美股XOP之间套利。每天看Yahoo新浪等网站的股票行情,时不时还要用鼠标点开计算器算算转换价格,时间长了后有点烦。
后来我想起来5年前学习的PHP,于是打算写我的第二个PHP程序,统一把套利需要常看的行情显示在一起。
同时根据SPDR标普油气开采指数ETF(XOP)、标普油气开采指数(^SPSIOP)、以及美元对人民币的汇率计算华宝油气LOF(SZ162411)净值。今天出了第一版,记录下相关开发过程以备日后查阅。A股的QDII基金缺乏及时的信息更新,希望这里能够补上这个生态位空缺。
谢谢abkoooo帮助提供了新浪实时美股数据接口的格式。
美股、A股、期货和汇率都用新浪实时的数据接口:gb_xop,sz162411,hf_CL,USDCNY
一开始发现无论怎么弄fopen
打开这些链接都会失败,估计是我用的Yahoo网站服务不支持allow_url_fopen
。
在网上找解决方法,发现应该用早就有的curl。抄了2段curl代码,仿照file_get_contents
函数的名字加了个url_get_contents
函数。
为提高页面反应速度,使用2个文件gb_xop.txt和sz162411.txt分别保存最后更新的股票数据,同时实施以下优化:
- 跟文件时间在同一分钟内的页面请求直接使用原来文件内的数据。
- 美股盘后交易结束后的页面请求直接使用gb_xop.txt内的美股数据。
- A股闭市后的页面请求直接使用sz162411.txt内的A股数据。
类似的,原油期货数据缓存在文件hf_cl.txt,美元人民币汇率数据在usdcny.txt。
所有的代码最终都会烂到无法维护,成功的项目就是在烂掉之前发布出去的。
经典测试图像Lenna部分原始图片
2015年8月20日
为严格交易规则, 套利过程中我打算简单的在均线上下单买卖XOP. 这个版本加入下一个交易日XOP预计的常用SMA均线值,
以及当前成交价格相对于华宝油气对应净值的溢价.
作为一个懒人, 我给自己预定的交易模式是盘前下单, 交易时间不盯盘. 关注过新浪等网站提供的均线指标的都知道, 这些值是随着当天的交易一直在变动的.
因此我需要在盘前下单时先算出一个不动点用于买卖.
从最简单的5日线说起:
A5 = (X0 + X1 + X2 + X3 + X4) / 5;
其中X0是当天交易价, X1-X4是前4个交易日的收盘价. 为方便起见, 可以把 (X1 + X2 + X3 + X4) 写成 ∑X4. 按这个模式, 任意日的简单均线SMA可以表示成:
An = (X0 + ∑Xm) / n; 其中m = n - 1;
在什么时候会有一个不动点可以用于买卖呢? 显然是An = X0的时候, 这样An = (An + ∑Xm) / n, 从这个简单的一元一次方程可以解出An不依赖于X0的表达式:
An = ∑Xm / (n - 1); 或者 An = ∑Xm / m;
这样就很清楚了, 当我说5日线的时候, 我实际算的是前4个交易日收盘价的平均值. 当我说20周线的时候, 我实际算的是前19周每周最后一个交易日收盘价的平均值.
这样算出来的不动点是极限值, 所以我整天装神弄鬼说XOP过了什么什么均线算强势, 没过什么什么均线算弱势. 而这些装神弄鬼的背后, 其实用到的都是小学数学.
XOP历史数据每天只需要更新一次, 采用Yahoo股票历史数据: https://finance.yahoo.com/quote/XOP/history,
同样每天只需要更新一次的还有华宝油气基金官方净值, 来自于f_162411,
使用文件f_162411.txt缓存, 因为不知道什么时候更新当日数据, 只好采用一个小时更新一次的笨办法.
增加调试文件debug.txt用于临时查看数据.
2015年8月21日
发了这个工具小软件链接后,昨天翻墙出去看了一下Google Analytics的统计。上线三天,总共289个IP访问了584次。跟Palmmicro通常的客户访问网站极大不同的是,访问这个工具的有1/3用的是手机。于是匆忙加上为手机用户优化显示界面的代码。
使用http://mobiledetect.net判断是否手机用户访问,代码从github复制下来按照原开发者的建议单独放在/php/class/Mobile_Detect.php中。
2015年8月24日
每次进phpMyAdmin去看历史数据虽然不算麻烦,但是毕竟还是用自己写的网页看更有成就感!
历史价格
日期 | 开盘 | 最高 | 最低 | 价格 | 数量 | 复权价格 |
2024-12-09 | 137.79 | 139.13 | 136.97 | 137.11 | 3247161 | 137.11 |
2024-12-06 | 138.62 | 138.77 | 134.75 | 135.82 | 4069833 | 135.82 |
2024-12-05 | 140.18 | 141.03 | 138.93 | 138.98 | 2373587 | 138.98 |
2024-12-04 | 143.52 | 143.75 | 138.33 | 139.41 | 3437651 | 139.41 |
2024-12-03 | 144.74 | 145.36 | 143.15 | 143.94 | 1369984 | 143.94 |
2024-12-02 | 145.46 | 145.86 | 142.01 | 143.83 | 2221509 | 143.83 |
2024-11-29 | 145.56 | 146.51 | 145.13 | 145.48 | 681153 | 145.48 |
2024-11-27 | 144.71 | 146.99 | 144.71 | 145 | 1154152 | 145 |
2024-11-26 | 146.02 | 146.39 | 144.24 | 144.99 | 2045292 | 144.99 |
2024-11-25 | 148.67 | 149.82 | 145.82 | 146.04 | 2822565 | 146.04 |
2015年8月27日
整理代码最好的方式是多开发几个类似港股QDII和美股QDII。伴随最近抄底港股加入恒生ETF(SZ159920)和H股ETF(SH510900)净值计算工具,观摩美股崩盘期间顺手加入了标普500ETF(SH513500)净值计算工具,也许日后会用上。
牢记股市三大幻觉:A股要涨、美股见顶、港股便宜!
女士,如果一个地方我不知道如何走出去,就绝不会走进去。
2015年9月13日
跟我的第一个PHP程序结合起来, 用户登录后可以输入相关股票交易记录. 根据交易记录计算华宝油气和XOP对冲交易策略和数据.
交易记录的输入和处理分别在文件/woody/res/php/_edittransactionform.php和_submittransaction.php.
同时修改Visual C++的Woody的网站工具对_editXXXform.php名字格式的自动生成对应的_submitXXX.php文件.
开始自己写PHP的class类
2015年11月7日
分离数据和用户界面代码,把QDII用到的股票数据部分放到StockReference类中,用在QdiiAccount类中。
继续整理代码,为热心吃螃蟹的用户们增加纳指ETF、恒生H股、国泰商品、石油基金和诺安油气等页面.
2016年1月8日
在塔夫男等人的建议下,加入华宝油气基金历史表格记录每天的折价溢价情况。最近几天的直接显示在当前页面,同时增加单独显示全部历史数据的页面。
开始动手后发现几个月前分析的新浪A股实时数据接口的字段意义已经差不多忘光了。好记性不如烂笔头,本着磨刀不误砍柴工的精神,先在这里完整记录一下,以便日后查阅:sz162411
SZ162411的历史价格相对于净值的溢价 基金溢价记录
日期 | 价格 | 净值 | 溢价 | 官方估值 | 时间 | 误差 | XOP净值 |
2024-12-09 | 0.766 | 0.7619 | 0.54% | 0.762 | 07:13 | 0 | 135.8 |
2024-12-06 | 0.771 | 0.7792 | -1.05% | 0.779 | 06:31 | 0 | 138.99 |
2024-12-05 | 0.777 | 0.7819 | -0.63% | 0.782 | 06:00 | 0 | 139.44 |
2024-12-04 | 0.802 | 0.807 | -0.62% | 0.807 | 06:58 | 0 | 144.01 |
2024-12-03 | 0.802 | 0.8043 | -0.29% | 0.805 | 05:59 | 0.06% | 143.78 |
2024-12-02 | 0.81 | 0.8137 | -0.45% | 0.814 | 06:01 | 0 | 145.43 |
2024-11-29 | 0.808 | 0.8118 | -0.47% |
2024-11-28 | 0.806 | 0.8128 | -0.84% | 0.813 | 06:10 | 0 | 145.08 |
2024-11-27 | 0.808 | 0.8114 | -0.42% | 0.81 | 06:02 | -0.15% | 144.99 |
2024-11-26 | 0.809 | 0.816 | -0.86% | 0.817 | 06:13 | 0.13% | 146.07 |
统一数据显示格式
2016年1月26日
在oldwain的建议下,在相关价格记录的时间中加入日期显示。这下上次的A股接口记录就派上用场了,不过新浪外盘期货的格式又重新看了一遍,加个记录以防以后还要用:hf_CL
原来版本中没有它是因为自己觉得交易日期很明显,完全没有必要出来占地方。不过既然有人觉得有问题,我就效仿白居易写诗先读给妇孺听的优良传统改了。
估计跟我从2000年开始就在美股赔钱不同,很多人还是不熟悉美国股市交易时间。而在这里,美股数据后面跟的是美东日期和时间。
虽说是个小的分离数据和显示改动,但是忍不住哗啦哗啦又整理优化了一大片代码,StockReference
类要被挤爆了。
参考数据
代码 | 价格 | 涨幅 | 日期 | 时间 | 名称 |
SZ162411 | 0.766 | -0.65% | 2024-12-09 | 15:00 | 华宝油气LOF |
2016年1月27日
不知不觉在前面写了很多QDII。其实QDII和华宝油气这个名称里后面的LOF,绝大多数的美国人都不会认识。
把Google设置成显示英文结果,然后查QDII,百度百科的中文页面显示在搜索结果的第2位,第3位是Wiki。听过一个笑话,一个腹黑的HR问程序员求职者碰到问题怎么办,回答去查百度的都会被默默的拒掉,因此我就不去看它了。
Wiki的QDII词条下显示了它是Qualified Domestic Institutional Investor的简称,同时用简体和繁体标注了合格境内机构投资者。
跟QDII一样,LOF也是一个出生和仅用于中国的英文简写。它更惨,英文的Google完全没有收录它的中国用途:Listed Open-Ended Fund的简写,意思是上市型开放式基金。
跟QDII和LOF不同,ETF是个货真价实的英文简写。常出现的XOP就是美股的ETF。对我来说,A股的ETF和LOF基金的区别按重要性排列如下:
- ETF通常都是100%仓位,而LOF一般不会超过95%的仓位。仓位上的细节会决定估值的准确度。
- A股可以从6位数字代码上区分。深市ETF代码从150000到159999,深市LOF代码从160000到169999。沪市ETF代码从510000到518999,沪市LOF代码从500000到509999。SH510900就是一个沪市ETF。
- A股ETF的申购门槛通常至少都是50万份或者100万份,我这种穷套利者玩不起,所以其实我到现在也没搞清楚具体到底是50万还是100万。在美股市场,ETF的申赎基本上都是由做市商完成的。可以看出,A股从制度上来说其实有利于套利群体。
- ETF的申赎会比同类型LOF早一个交易日确认。对有钱的套利者来说,就可以少担一个交易日的风险。
夜深忽梦少年事 梦啼妆泪红阑干
2016年2月16日
晚上九点多的时候,uqot跟我说华宝油气净值出问题了。我看了一下调试信息,发现八点的时候做了一次自动校准。按照流程,拿到15日的SZ162411净值后先跟15日XOP的收盘值校准,但是昨天美股因为总统日没有交易,这一步没有成功。
接下来进入使用前一个交易日的数据校准的代码,而不幸的是美股的上周五交易日刚好碰上中国春节假期,A股没有交易。数据中的上一个交易日净值是春节前的,于是软件拿节前最后一个交易日的华宝油气净值跟上周五XOP收盘价做了错误的自动校准。这种问题只在中美轮流休市的情况下才会出现,而过去的一周恰好是这种情况!
我先用手工校准的功能恢复了正确的数据,然后趁着又看了一遍新浪基金数据接口字段意义的热乎劲,依旧加个记录备用:f_162411
接下来我想到,这么追着做以前日期的自动校准太蠢了,应该只做当天的然后存下来,如果当天不满足自动校准的条件,就用最近保存的校准数据估值就是了。
本来每次拿到官方发布的净值后都会根据净值当天的美股数据做一次自动校准,从现在开始全部记录下来,同时还方便观察长期趋势。校准时间就是拿到新的官方净值后第一次访问的时间。
碰到XOP分红除权的日子,就需要进行手工校准。否则的话要等下一次自动校准后,估值结果才会再次正确。
校准记录
日期 | 校准值 | 时间 | 次数 | 净值 | 对冲值 |
2024-12-06 | 1280.5635 | 17:10 | 1 | 0.7619 | 1348 |
2024-12-05 | 1282.138 | 16:30 | 1 | 0.7792 | 1350 |
2024-12-04 | 1282.8025 | 16:30 | 1 | 0.7819 | 1350 |
2024-12-03 | 1284.8181 | 18:13 | 1 | 0.807 | 1352 |
2024-12-02 | 1284.6733 | 17:00 | 1 | 0.8043 | 1352 |
2024-11-29 | 1284.6126 | 18:11 | 1 | 0.8137 | 1352 |
2024-11-27 | 1284.8132 | 16:00 | 1 | 0.8128 | 1352 |
2024-11-26 | 1284.9707 | 16:30 | 1 | 0.8114 | 1353 |
2024-11-25 | 1287.4221 | 18:06 | 1 | 0.816 | 1355 |
2024-11-22 | 1286.866 | 18:11 | 1 | 0.8312 | 1355 |
2016年2月22日
有人跟我指出基金溢价记录中净值的日期显示早了一天,我差点一口鲜血吐在了键盘上。用脚趾头想想,要计算华宝油气当天的交易溢价,肯定是要跟前一天的净值比较啊。当天的净值要等当晚美股收盘后才出来,否则的话我写这个净值估算有什么意义呢。
把当天的交易价格跟前一天的净值放在一起比较,其实也正是我平时最为推崇的不同数据显示方式引导不同思维模式的举措。
不过为了避免以后还有人搞混淆,我干脆另外加了一个单独的显示页面,算上最开始的历史价格和前几天加的校准记录,现在总共有四个历史数据页面了。
净值记录
日期 | 净值 | 涨幅 | USCNY | 涨幅 | XOP净值 | 涨幅 | 仓位 |
2024-12-06 | 0.7619 | -2.22% | 7.1848 | -0.04% | 135.7952 | -2.3% |
2024-12-05 | 0.7792 | -0.35% | 7.1879 | -0.08% | 138.9894 | -0.32% |
2024-12-04 | 0.7819 | -3.11% | 7.1934 | -0.09% | 139.4366 | -3.18% |
2024-12-03 | 0.807 | 0.34% | 7.1996 | 0.18% | 144.0147 | 0.16% |
2024-12-02 | 0.8043 | -1.16% | 7.1865 | -0.02% | 143.7783 | -1.13% |
2024-11-29 | 0.8137 | 0.23% | 7.1877 | -0.02% | 145.4275 |
2024-11-28 | 0.8118 | -0.12% | 7.1894 | -0.12% |
2024-11-27 | 0.8128 | 0.17% | 7.1982 | 0.1% | 145.0774 | 0.06% |
2024-11-26 | 0.8114 | -0.56% | 7.191 | -0.01% | 144.9903 | -0.74% |
2024-11-25 | 0.816 | -1.83% | 7.1918 | -0.03% | 146.0742 | -1.75% |
周期三意味着混沌
2016年2月26日
华宝油气持续溢价10%已经成了常态,最近最高甚至到了17%,华宝油气和XOP套利没法做了。
继续整理同类代码,这次下手目标是MySQL相关部分。 加入MysqlReference
类继承自StockReference
类,集中代码处理历史记录和净值校准等数据库内容。再加入MyStockReference
类继承自MysqlReference
,从此代替StockReference
类作为股票数据实例。
FundReference
同时也改为继承自MysqlReference
,从MysqlReference
开始调用了数据库相关函数。
一直有用户建议我在华宝油气等QDII的基金溢价记录表格上加入预估净值比较栏目。除了不愿意直接打自己嘴巴外的心理因素外,迟迟没有加上它的原因主要是估值是跟着美股交易实时变化的,一直想不清楚这个时间上的对应关系。
在QDII的代码中,单独的预估净值变量原本放在QdiiAccount
类中,在这次改动时,我把预估净值的变量挪到了FundReference
类中。当预估净值和当日净值的变量排列在一起后,突然之间数据结构引导思维方式的例子再次爆发,没有比在记录当日净值的时候同时记录预估净值更合理的了!
同时记录和显示估值的时间,这样当看到估值时间落在美股交易结束前,那么有误差就是天经地义的事情,而不是我的算法有问题。计算估值是由用户访问页面的动作驱动的,如果某页面没有用户经常访问,那么就会出现这种异常时间估值。
由于在股票交易日的净值系列页面访问量已经稳定在了1000左右,最高的一天有接近1700,我一直在琢磨如何优化页面应对以后可能的更大的访问量高峰。把只会每天变化一次的SMA计算结果保存下来是很容易想到的,但是之前一直没有做。
这次整理代码时我意识到同一个GLD的SMA要在包括黄金LOF的嘉实黄金LOF(SZ160719)、黄金主题LOF(SZ161116)和黄金LOF(SZ164701)共3个页面各算一遍,觉得不能再忍下去了。
基于之前在网上找Mobile-Detect代码的经验,我极大的低估了找一个现成的读写配置文件的PHP类的难度。比较容易找到的是一个要收费5美元的,号称同时支持文件和MySQL读写配置。而我就是不想多搞MySQL的表才想用文件存的,不免觉得这5美元有点浪费。
最后好不容易才翻到免费的INIFile。这个类原本只支持在已经存在的配置文件上修改,让我这个PHP新手折腾改了好几个小时才顺利用上。
新浪实时港股数据
2016年4月23日
用Yahoo拿港股数据给港股QDII估值搞了半年后,一贯后知后觉的我才在均金无忌的帮助下发现新浪也有港股数据。这次吸取以往教训,挽起袖子改我的StockReference
类前先写这个格式文档:rt_hkHSCEI
刚过去的周四净值页面系列的当日总访问量创纪录的超过了2200,激励我继续优化页面反应速度。
近几年来最低级的错误
2016年5月15日
上周人民币又开始贬值,让华宝油气估值暴露出一个新错误,到了13日周五的时候,我的估值居然比官方数据高了差不多一个百分点。
周末开始查问题,发现最后一次自动校准还是12日晚上拿到11日的官方净值后,而本应该在13日晚上拿到12日官方净值后的自动校准居然没有做。也就是说,在过去的一段时间内,自动校准都不知不觉的晚了一天,只不过在汇率平稳的情况下这个问题暴露不出来而已。
找到问题并不难,春节后用最简单的增加校准记录方法解决中美轮流休市导致的估值问题时,我还按照是否港股QDII重新整理了部分代码,结果无意改了个其实无关的代码,把$iHours = STOCK_HOUR_END + ($this->usdhkd_ref ? 0 : 24)
写成了$iHours = STOCK_HOUR_END + ($this->usdhkd_ref) ? 0 : 24
。
不过这个错误严重打击了我的自信心。这一次我没法用自己是个六年的PHP新手来自嘲了,在我自豪的写了25年的C语言中,这同样是个超级低级的错误!
2016年6月5日
王小波总是不忘记唠叨他写了自己用的编辑软件,在20年前我是暗自嘲笑的。没想到过了这么些年以后,我也开始写自己用的炒股软件了。不同的年龄段心态是完全不同的。
持仓盈利功能刚完成的时候页面出来得奇慢无比,而接下来刷新就会快很多。因为对自己的MySQL水平没有自信心,我一头扎进了优化数据库的工作中。
优化了一些明显的问题,例如扩展了stockgroupitem表的内容,把stocktransaction表中groupitem_id相同的交易预先统计好存在stockgroupitem表中,避免每次都重新查询stocktransaction表然后重新计算一次。
不过折腾了一大圈后并没有明显的改善,倒是在这个过程中理清了原来闭着眼睛写的代码的内在逻辑,看出来了问题的根源。
在按member_id查询stockgroup表找到这个人所有的股票分组后,我会对每个stockgroup直接构造MyStockGroup
类,
在它原来的构造函数代码中,会马上对该stockgroup中的每个stock构建一个MyStockTransaction
类, 而MyStockTransaction
的构造函数又需要这个stock的MyStockReference
类作为参数,
如果没有现成的实例可用,就会新构造一个。结果就是在首次统计持仓盈利的过程中,我会把几乎所有股票的数据都去新浪拿一遍,难怪那么慢。
找到问题就好办了,首先判断stockgroup中stock对应的groupitem_id到底有没有交易记录,没有的话就不去构造MyStockTransaction
类。另外预先统计好有交易记录的stock,统一去预取一下新浪数据。
随后我把预取数据的思路用在了所有需要读取新浪数据的地方,包括华宝油气净值计算在内,所有的页面反应速度都有不同程度的提升。原来我说因为网站服务器在美国所以访问慢的理由看来并不是那么准确的!
一头特立独行的猪
东方财富美元人民币中间价USCNY
2016年6月15日
因为从新浪拿的USDCNY是实时交易数据,而美股QDII净值使用的是美元人民币中间价,在华宝油气净值估算中跟最终官方数据相比有时候会出现0.1分的误差。考虑到误差不大,我也不会去做0.1分钱的套利,而且我还相信交易值总会往中间价靠拢,所以我一直没有去改它。
今年以来国泰商品的基金经理费心费力,在国内监管部门要求多个不同美股ETF持仓的条件下,居然一直维持了净值和USO几乎完全相同的变动,由此在白天引发了大量跟原油期货CL的套利交易。
高手像zzzzv已经做到了0.05分的套利,这样就必须使用中间价了,他还根据长期经验给我确认了交易值不会往中间价靠拢,并且给我提供了他手头的Excel+VBA工具中使用的东方财富美元人民币中间价USCNY的接口。
美股QDII中考虑当日CL交易情况后的T+1估值
2016年8月18日
发现有人的Excel计算表格中有这一项,我也就顺应潮流把它加上了。大概是沿用集思录的叫法,把已经公布的净值称为T-1、把估算的官方将要公布的下一日净值称为T、而把考虑了当日美油期货CL变动的称为T+1估值,大致意思是用白天CL的变动预测晚上XOP的变动。
按我的看法,拉长到一年看CL和XOP对应关系可能是不错,但是具体到每一天就未必了,所以在自己的套利交易中目前是不考虑这个T+1估值的。当然需要进行期货交易也是我不做它的一个重要因素,怕不小心杠杆赌大了把自己搞破产。一手CL是1000桶,目前每桶油价大约50美元,也就是说每次要交易五万美元的货值。
因为特立独行的原因,我不喜欢T-1/T/T+1这种叫法。于是我在网页中把T-1直接写成了净值,T日估值称为官方估值,而把T+1估值称为实时估值。另外还有一个参考估值,接下来解释一下这些看上去混乱的估值名称。
参考估值和实时估值的区别仅仅是用不用CL的实时交易数据。实时估值假定SZ162411和CL关联程度是100%,XOP和USO关联程度也是按照100%估算。由于估值依赖CL和USO在美股交易时段的自动校准,而期货总是免不了升水贴水,每个月20日左右CL期货换月的当天实时估值是不准确的。
另外因为CL期货的每日结算价格通常跟收盘价不同,CL期货收盘比美股晚一个小时的收盘价也不同于我在估值中实际用来参考的美股收盘时的CL价格,有可能出现CL价格的显示高(或低)于上一日,而参考估值低(或高)于实时估值的情况。
先说明一下如何把华宝油气官方估值精确到0.001元。说实在话,刚开始我也不可能想到花了整整一年时间才做到这一点。
- 要使用^SPSIOP或者XOP的净值,而不是XOP的交易价,两者通常并不一致。
- 要使用美元人民币中间价,而不是新浪的美元汇率实时交易价格,更不是离岸人民币价格。
- LOF基金要按95%仓位的处理,而不是ETF基金的100%。
为了避免每次都依靠A股后6位数字判断LOF,我增加了fundposition表来记录估值中使用的仓位。
估值网页链接
代码 | 官方估值 | 日期 | 溢价 | 实时估值 | 溢价 |
SZ162411 | 0.769 | 2024-12-09 | -0.45% | 0.77 | -0.57% |
估值因素 | 官方估值 | 参考估值 | 实时估值 |
T日美股交易 | XOP净值 | XOP净值 | XOP净值 |
CL期货 | 否 | 否 | 是 |
美元人民币中间价 | T日 | T/T+1日 | T/T+1日 |
相对于官方估值,当美元人民币中间价波动比较大的时候参考估值就值得关注了,此外在A股或者美股休市的日子里, 它也比官方估值更能反映实际的净值。
至于为什么叫它参考估值,那是因为我也不知道给它取什么名字好。事实上,在英文版本和软件代码中我给它取名为FairEst
,意思是一个公平的估值。
在A股开市日期的美股交易时段,这三个估值通常都是完全一致的,参考估值因此不会显示出来。如果偶尔出现官方估值和实时估值不同,那是因为CL和USO的数据没能在同一分钟内自动校准或者软件改出了新错误。
显然在美股交易时段是没有T+1的美元人民币中间价的,此时的实时估值用的只能是T日的美元人民币中间价。此时所有的估值和校准都是为美股结束后的参考估值和实时估值做准备,用户只需要看官方估值即可。
在美股交易结束后,这3个估值就开始分道扬镳了。T日官方估值不会再变化。CL通常会在美股收盘后继续多交易一个小时,此时实时估值也就会随之变化。
等到第二天,软件会去自动拿通常在9点15分发布的T+1日美元人民币中间价,参考估值会因此改变固定在新值上,实时估值也会在这时候开始用T+1日美元人民币中间价。
赢了会所嫩模,输了下海挖沙!
写了这么多细节,最后着重列一下大家最关心的:
- 验证估值算法准确程度和测算申购赎回的成本,看官方估值。
- 按溢价折价决定当日是否套利和做跟XOP配对交易的,看参考估值。折价不申购,溢价不赎回。此外A股或者美股休市的日子里也应该看它。
- 做跟美油期货CL配对交易的,看实时估值。
2016年9月18日
不知不觉中宣传和实践华宝油气和XOP跨市场套利已经快2年了. 期间碰到过LIFEFORCE这种自己动手回测验证一下能赚钱就果断开干的,
也有老孙这种数学爱好者回测验证一下能赚个年化10%后就袖手旁观的,
还有常胜将军Billyye这种觉得华宝油气可以看成无非是XOP延长了的盘前盘后交易没有多少套利意义的.
最气人的是thanous这种, 总是喜欢说大资金如何牛, 如果白天华宝油气在大交易量下溢价, 晚上XOP必然是要涨的, 彻底否定套利的根基.
最近几个月华宝油气折价多溢价少, 经历了几次溢价的情况后, 发现thanous的说法基本靠谱, 我于是开始按他的名字命名为小心愿定律. 中秋节前最后一个交易日华宝油气又溢价了,
大熊宝宝--林某人建议我实际测算一下, 正好放假闲着也是闲着, 就削尖铅笔搞了个新页面测试小心愿佯谬.
我网站记录了从去年底以来所有的华宝油气数据, 跑了下从去年底到现在的统计结果没有觉得小心愿定律能成立, 于是改名为小心愿佯谬. 但是去掉春节前后华宝油气因为停止申购导致的长期溢价的影响, 只考虑最近100个交易日的情况后,
有趣的结果出现了:
这里只统计了94个数据, 因为美股休市没有交易的日子被忽略了. 在华宝油气折价交易的情况下, 当晚XOP依旧是涨跌互现没有什么规律. 但是在平价和溢价的时候, 小心愿定律的确是明显大概率成立的!
说白了, 如果你发现了什么交易上的规律, 只是因为交易得不够多而已.
新浪国内期货实时数据接口的字段意义
2016年10月8日
国际黄金价格在国庆期间暴跌,为了寻找内外盘套利的机会,赶快把国内黄金期货的数据看了一下:AU0
新浪实时美股数据接口的字段意义
2016年10月17日
最近在股票交易中对SMA均线的依赖越来越严重,而同时Yahoo的负面用户体验和甩卖消息越来越多,让我比较担心哪一天Yahoo突然不提供历史数据了,毕竟是一个非公开的东西。
于是下决心自己开始记录历史数据,刚开始改程序就发现去年写的读取新浪实时美股数据的代码中缺Yahoo历史数据中提供的的开盘价、最高价、最低价和成交量,又重新看了一遍数据接口的字段意义:gb_xop
2016年10月20日
今天发现有个微信公众号用户用语音查询交通银行,没查到因为数据库中根本没有它。不过因此刺激了我给加上查询所有股票交易数据的功能。
首先我要把A股3000多只股票都加到数据库中。开始我想直接开个大循环从000001到699999从新浪拿数据,后来觉得太蠢了,还担心新浪的数据接口把我列入黑名单。不过接下来我从https://vip.stock.finance.sina.com.cn/mkt/#hs_a找到了所有A股数据。
还有数量上几乎跟股票同一个量级的指数https://vip.stock.finance.sina.com.cn/mkt/#hs_s。
继续给数据库中加美股代码,希望https://vip.stock.finance.sina.com.cn/usstock/ustotal.php这个不完整的美股单子能满足绝大多数中国用户的查询。
查询A股基金数据
2016年10月28日
昨天让我广发证券网上开户的经理帮忙宣传一下微信公众号查股票数据,随即加进来两个人。其中一个上来就查159915,发现没有数据后立马取消了订阅,又刺激了我给数据库加上所有A股基金数据。
从https://vip.stock.finance.sina.com.cn/mkt/#open_fund找到了基金列表,没想到全市场居然有上万基金。然后继续写代码加入了其中可以场内交易ETF和LOF,从此应该不怕被查。
2017年1月28日
为了有效配合今年的打新计划,我打算扩大中国石化外的门票范围。但是同时沿用AH股价格比较的思路,只选取A股价格低于H股的作为门票。
微信公众号搞了几个月,使用者寥寥。不过开发的过程中有个意外收获,帮助我彻底区分了净值计算和用户显示界面的代码。为了充分利用这个好处,我打算把AH比较也包括在查询结果中,结果又牵扯出不少一开始未曾想到的改动。
首先要加入港股数据https://vip.stock.finance.sina.com.cn/mkt/#qbgg_hk。 面对跟A股差不多一样多的港股,我犹豫了,担心会进一步拖累消息回应时间。然后我又打起了优化的主意:
- 输入刚好是六位数字并且数值大于等于1000时,直接按照按照A股代码规律扩展后寻找唯一匹配。例如162411匹配SZ162411,600028匹配SH600028。
- 输入刚好是六位数字并且数值小于1000时,寻找可能的沪市指数和深市股票最多两个匹配。例如000001匹配上证指数SH000001和平安银行SZ000001。
- 当输入有非ASCII字符,比如中文华宝油气时,不查找代码,而是只在名称字段寻找可能的最多32个匹配。
- 其它情况如sz162411同时在代码和名称字段寻找可能的最多32个匹配。
这样一来,输入162411永远会反应最快,华宝油气第二,sz162411最慢。至于想输入hbyq拼音简称的,则什么都查不到!
AH数据来源:https://vip.stock.finance.sina.com.cn/mkt/#aplush
现在可以输入600028或者00386试试看,同时增加个对比页面:
A股和H股对比 AH历史价格比较
代码 | H股代码 | H股价格 | H股人民币¥ | A/H比价 |
SH600028 | 00386 | 4.39 | 4.06 | 1.5955 |
2017年4月2日
SMA均线交易XOP很有效, 但是有时候会在价格突破所有均线后失去用武之地, 因此我把布林线也加入进了交易系统, 跟SMA放同一个表格中显示.
同样为避免半夜盯盘, 我还是需要一个不动的布林线交易点. 这时候小学数学就不够了, 要用到一点初中数学知识. 沿用上面的SMA表达方式, 布林线的出发点依然是简单均线SMA, 可以换个符号写成:
B = An = (X0 + ∑Xm) / n; 其中m = n - 1;
在计算出B后, 继续计算标准差σ:
σ² = ((X0 - B)² + (X1 - B)² + (X2 - B)² + ... + (Xm - B)²) / n;
B和σ都计算出来后, 布林上轨是B + 2 * σ; 布林下轨是B - 2 * σ;
现在来计算用来交易的不动点, 为简化起见, 先只考虑布林下轨, 就是说当天交易价格X0刚好到布林下轨的情况, 用这个价格计算对应的布林值. 写成条件是:
X0 = B - 2 * σ;
带入到上面计算B的公式后得到:
B = (B - 2 * σ + ∑Xm) / n
从而解出σ = (∑Xm - (n - 1) * B) / 2; 或者 σ = (∑Xm - m * B) / 2;
再把条件 X0 = B - 2 * σ; 带入到计算σ的公式后得到:
σ² = (4 * σ² + (X1 - B)² + (X2 - B)² + ... + (Xm - B)²) / n;
定义∑Xm² = X1² + X2² + ... Xm²; 上面可以写成:
(n - 4) * σ² = ∑Xm² - 2 * ∑Xm * B + m * B²;
带入上面解出的σ = (∑Xm - m * B) / 2; 最后得到一个B的一元二次方程:
(n - 4) * (∑Xm - m * B)² = 4 * ∑Xm² - 8 * ∑Xm * B + 4 * m * B²;
令 k = n - 4; 写成标准的ax²+bx+c=0的格式:
a = k * m² - 4 * m;
b = (8 - 2 * k * m) * ∑Xm;
c = k * (∑Xm)² - 4 * ∑Xm²;
做计算机最擅长的事情, 解出这个方程的2个根得到2个不同B值.
然后数学的神奇魅力出现了, 虽然列方程的时候只考虑了布林下轨, 解出B的2个值以及对应的σ后, 却同时得到了不依赖于当天交易价X0的布林上轨和布林下轨值.
实际应用中我采用大家都用的20天布林线, 也就是说n = 20, 而我是用前19个交易日的收盘价算的当日不动点的布林上轨和布林下轨, 作为交易价格.
不像简单均线SMA的不动点, 可以从一元一次方程中解出一个很容易理解的表述: 20天的SMA不动点就是前19天收盘价的平均值.
解布林线一元二次方程得到的结果就没有一个类似的容易理解的表述了, 很难说它是什么, 但是可以很简单的说它不是什么, 它不是只算19天的布林上轨和布林下轨.
事实上, 因为考虑的都是极限因素, 20天布林上下轨不动点的开口要比只算前19天的布林上下轨大, 就是说, 下轨更低一点而上轨更高一点.
感觉好久没做这么复杂的数学了, 把计算过程拍了个照片留念一下.
你永远比你想象中更勇敢 -- 相信梦想
200日和50日EMA均线
2017年10月1日
均线交易系统中加入美股最看重的牛熊分界线200日EMA均线和小牛熊分界线50日EMA均线。按美股标准,当50日EMA上穿200日时进入牛市,下穿则进入熊市。
考虑到50日EMA在数值上其实跟10周SMA差不多,而200日EMA则大致相当于10月SMA,为避免重复加减仓位,我并不在这2个EMA数据上进行交易,而仅仅只是看它们衍生显示的牛熊状态。
依旧是出于控制仓位的目的,熊市抄底做多时我只在日布林下轨或更低价格的周线SMA和月线SMA上加仓,牛市做空时我也只在日布林上轨或更高价格的周线SMA和月线SMA上进一步卖空。
用En表示今天的n日EMA值,其它沿用前面的符号:
En = k * X0 + (1 - k) * Em; 其中m = n - 1; k = 2 / (n + 1)
不动点En = X0,得到En = Em,就是说今天的不动点就是昨天的值。所以唯一要做的就是每天收盘后算一下当天的EMA。
走火入魔的T+1均线
2018年3月27日
从宇宙观上来说,我是不相信历史能够预测未来的,当然也就不相信技术分析能够预测市场。但是交易XOP这4年多来,我却在技术指标上一步一步加码。从SMA均线、布林线到美股牛熊分界线EMA均线,我都觉得自己变成了一个神棍。
现在居然搞起了T+1均线,原因是我发现XOP的SMA周线和月线经常能做出非常准的交易价格预测,但是SMA日线和和布林线就不如前2者。
而另外一方面,XOP的收盘价却经常会刚好在第2天我计算出来的SMA日线或者布林线上。这让我猜想每天交易结束前也许有人偷跑,会提前估算在第二天的均线位置上交易。
偷跑也可以解释为什么我觉得周线和月线准确,因为要在周5和月末最后一个交易日才会出现周线和月线上的偷跑,总体概率就小了。
计算SMA的偷跑很简单,沿用前面SMA的表述:
An = (X0 + ∑Xm) / n; 其中m = n - 1; 改写为
An = (X0 + X1 + ∑Xm) / n; 其中m = n - 2;
偷跑的情况下,不动点是An = X0 = X1,这样An = (An + An + ∑Xm) / n,从这可以解出An不依赖于X0和X1的表达式:
An = ∑Xm / (n - 2); 或者 An = ∑Xm / m;
这个结果可以非常简单的理解成,5日SMA偷跑的T+1结果,就是算一下前3天的SMA均线而已。
再来依葫芦画瓢算布林线的偷跑:
B = An = (X0 + X1 + ∑Xm) / n; 其中m = n - 2;
还是先只考虑布林下轨,偷跑交易的不动点写成条件是:
X0 = X1 = B - 2 * σ; 带入上面得到:
B = (B - 2 * σ + B - 2 * σ + ∑Xm) / n;
从而解出σ = (∑Xm - (n - 2) * B) / 4; 或者 σ = (∑Xm - m * B) / 4;
在把条件X0 = X1 = B - 2 * σ; 带入标准差σ计算公式:σ² = ((X0 - B)² + (X1 - B)² + (X2 - B)² + ... + (Xm - B)²) / n; 得到:
σ² = (4 * σ² + 4 * σ² + (X2 - B)² + ... + (Xm - B)²) / n;
定义∑Xm² = X2² + ... Xm²; 上面可以写成:
(n - 8) * σ² = ∑Xm² - 2 * ∑Xm * B + m * B²;
带入上面解出的σ = (∑Xm - m * B) / 4; 最后得到一个B的一元二次方程:
(n - 8) * (∑Xm - m * B)² = 16 * ∑Xm² - 32 * ∑Xm * B + 16 * m * B²;
令 k = n - 8; 写成标准的ax²+bx+c=0的格式:
a = k * m² - 16 * m;
b = (32 - 2 * k * m) * ∑Xm;
c = k * (∑Xm)² - 16 * ∑Xm²;
最后解出结果。
EMA设计精巧,不存在偷跑的问题,所以没有T+1估值。
XOP 2024-12-09数据 牛市 历史价格
均线 | 估值 | 溢价 | T+1估值 | 溢价 | SZ162411 | T+1估值 |
5日 | 137.83 | -0.52% | 137.3 | -0.14% | 0.773 | 0.77 |
10日 | 141.62 | -3.18% | 141.2 | -2.89% | 0.793 | 0.791 |
20日 | 142.78 | -3.97% | 142.89 | -4.04% | 0.799 | 0.8 |
布林上轨 | 150.35 | -8.81% | 152.32 | -9.99% | 0.84 | 0.85 |
布林下轨 | 135.2 | 1.41% | 133.46 | 2.74% | 0.759 | 0.75 |
5周 | 142.71 | -3.92% | 143.32 | -4.34% | 0.799 | 0.802 |
10周 | 138.9 | -1.29% | 138.68 | -1.13% | 0.779 | 0.777 |
20周 | 136.66 | 0.33% | 136.82 | 0.22% | 0.767 | 0.768 |
周布林上轨 | 149.13 | -8.06% | 152.39 | -10.03% | 0.833 | 0.851 |
周布林下轨 | 124.18 | 10.41% | 121.24 | 13.09% | 0.7 | 0.684 |
5月 | 136.59 | 0.38% | 135.91 | 0.88% | 0.766 | 0.763 |
10月 | 143.23 | -4.28% | 142.01 | -3.45% | 0.802 | 0.795 |
20月 | 138.68 | -1.13% | 140.06 | -2.11% | 0.778 | 0.785 |
月布林上轨 | 160.33 | -14.48% | 161.34 | -15.02% | 0.893 | 0.898 |
月布林下轨 | 117.03 | 17.16% | 118.78 | 15.43% | 0.662 | 0.671 |
小牛熊分界 | 139.19 | -1.5% | | | 0.78 | |
牛熊分界 | 139.06 | -1.41% | | | 0.78 | |
2018年4月4日
雪球创始人方三文,自称不明真相的群众。平时总是苦口婆心的把盈亏同源放在嘴边,鼓动大家通过雪球资管做资产配置。但是他却认为自己对互联网企业有深刻理解,在推销自己私募的时候总是鼓吹腾讯和FB,又把盈亏同源抛在脑后了。
最近2个月腾讯结束了屡创新高的行情,开始跟FB一起下跌,引发了大家抄底雪球方丈的热情。不仅港股腾讯00700每天巨量交易,就连它在美股粉单市场的ADR在雪球上都热闹非凡。
这吸引了我的注意力,然后发现港股还有其它不少股票也有美股市场的American Depositary Receipt(ADR)。于是我按照原来A股和H股对比的套路增加了个页面蹭一下热度。同时也加入到了微信公众号的查询中:输入腾讯或者00700试试看。
数据来源:阿思達克ADR
从数据库的表格开始,TableSql
是所有表格的基类,它本身也可以用在只有一个整数id的表格。
ValSql
基于TableSql
,试图包括所有一个整数id和一个val的表格,它本身可以用于id+浮点数的表格,例如基金仓位fundposition表。
DateSql
和IntSql
都基于ValSql
,分别对应id+YMD日期和id+整数的表格。
PairSql
基于IntSql
,额外为反向查询加上了索引,这样刚好用于A/H的情况:id是A股的stock_id,它对应的整数值是H股的stock_id。
StockPairSql
基于PairSql
,额外加上了从stock_id到symbol的来回转换,ahpair表就是直接来自它。
跟A股和H股总是1:1不同,每股ADR可以对应100、1或者0.5等各种不同数值的H股。因此一个自然的做法是继续从StockPairSql
派生adrpair表,加上这个额外的对应数值。不过这样一来,A/H和ADR/H比较页面能共用的代码就不多了。
在QDII估值中原本就有基金仓位fundposition表,我脑洞一开,想到每股ADR对应多少股H股其实也是一种仓位上的体现,就把不是1:1的ADR/H对应数值也存到了这个表中。
更妙的是,想通了比例对应仓位后,A/H和ADR/H之间的价格转换跟QDII估值比较就只差一个校准记录的概念了。具体的看,在A/H情况下,其实相当于校准值永远是1。而在ADR/H的情况下,校准值其实就是固定的(1/仓位)。
这样一来,我不仅统一了A/H和ADR/H比较页面的代码,还顺便统一了目前用到的各种价格转换计算,顿时感觉打通了任督二脉!
Life is like a snowball. The important thing is finding wet snow and a really long hill. — Warren Buffett
ADR和H股对比
代码 | H股代码 | H股价格 | H股美元$ | ADR/H比价 | 仓位 |
TCEHY | 00700 | 418.8 | 53.83 | 1.0274 |
2018年4月5日
折腾完H股后觉得意犹未尽,一鼓作气继续加上AB股对比。其实我自己连B股账户都没有,写这个就是完全为了测试一下现有代码的可扩展性。此外,因为B股规模远小于A股,以后可以用来方便测试二者的共同代码。
数据来自https://vip.stock.finance.sina.com.cn/mkt/#hs_b。
输入查000488或者200488试试看。
A股和B股对比
代码 | B股代码 | B股价格 | B股人民币¥ | A/B比价 |
SZ000488 | SZ200488 | 1.08 | 1 | 3.348 |
中国外汇交易中心的中间价接口
2018年4月13日
不知道是不是没有人用,去年东方财富的中间价USCNY数据接口混乱了两个月,总是给个老数据出来,偶尔才冒个当天的新数据。这样吊着我的胃口,害我一直在没当天新数据的时候手工更新数据库。
而等我下定决心克服自己的爬虫厌恶情绪打算去中国外汇交易中心网站爬数据后,东方财富的中间价接口却又奇迹般恢复正常了。
前天晚上的时候东方财富又出错了,这次不是给老数据,而是干脆就没有数据了。昨天白天我抱怨了一下,正打算重新挽起袖子写爬虫,没想到QQ群里的海风突然告诉我他找到了中国外汇交易中心的中间价接口:http://www.chinamoney.com.cn/r/cms/www/chinamoney/data/fx/ccpr.json。
真是个天大的利好啊,我赶快把手头的微信小程序和IB自动交易编程放在一边,在晚上炒美股的时候改写了中间价的读取数据方式,过几个小时就能用上了。
基于中国外汇交易中心的第一手数据,这样能够有效的在每天9点15后就拿到当天的中间价,从而可以根据按当天中间价调整后的华宝油气参考估值决定是否要在9点20前撤销掉集合竞价的买卖单。
软件总是会越写越乱。在两年前的结构设计中, 放在/php/stock/目录下的文件本来是打算只放跟MySQL数据库无关的基本股票数据采集处理代码的。但是这个结构在两个月前把GB2312对应的UNICODE码表放到MySQL数据库时就被打破了,因为读取新浪股票数据后需要把它GB2312编码的中文转换成UTF-8。
发现自己短时间违背了两次原则后,我感觉恶向胆边生,想干脆一口气把原来幻想独立于MySQL而方便测试和移植的基础股票类全部取消掉,给自己的理由是结构更紧凑了!
2018年5月3日
交易了几年XOP下来, 发现它的收盘价经常跟净值有个1分2分的偏差, 不知道这其中是否有套利机会.
XOP的净值价格比较
日期 | 价格 | 净值 | y溢价 | x涨幅 | 份额(万) | 换手 |
2024-12-09 | 137.11 | 137.1743 | -0.05% | 0.95% |
2024-12-06 | 135.82 | 135.7952 | 0.02% | -2.27% |
2024-12-05 | 138.98 | 138.9894 | -0.01% | -0.31% |
2024-12-04 | 139.41 | 139.4366 | -0.02% | -3.15% |
2024-12-03 | 143.94 | 144.0147 | -0.05% | 0.08% |
2024-12-02 | 143.83 | 143.7783 | 0.04% | -1.13% |
2024-11-29 | 145.48 | 145.4275 | 0.04% | 0.33% |
2024-11-27 | 145 | 145.0774 | -0.05% | 0.01% |
2024-11-26 | 144.99 | 144.9903 | 0 | -0.72% |
2024-11-25 | 146.04 | 146.0742 | -0.02% | -1.77% |
增加这个页面倒是让我突然下了决心删除英文版本. 压死骆驼的最后一根稻草是这行代码, 混在其中的中文冒号让我恶向胆边生, 彻底放弃了本来就几乎没有什么浏览量的英文版本股票软件.
echo UrlGetQueryDisplay('symbol').($bChinese ? '净值和收盘价比较' : ' NetValue Close History Compare');
从软件开发的角度来说, 遍布我PHP代码的1000多个$bChinese肯定意味着某种代码结构缺陷, 希望这次代码清理完成后能让我醒悟过来.
冷静下来后仔细想想, 发现自己早有停止英文版的意图背后其实有个更深层的原因. 三年来的各种跨市场套利经历, 让我深深体会到了对手盘的重要性和A股韭菜的可贵, 从而不愿意留个英文版让外面的世界进来抢着割这么嫩的韭菜.
If you've been playing poker for half an hour and you still don't know who the patsy is, you're the patsy. — Warren Buffett
巴菲特和盖茨一起打桥牌
2018年6月20日
配合抄底A股指数加入沪深300ETF(SH510300)页面,根据沪深300指数SH000300估算SH510300和ASHR的净值,看看有没有华宝油气和XOP这种跨市场套利的机会。
为了避免原有代码进一步走向混沌,不想从原有的FundReference
类扩展这种新估值模式,从MysqlReference
类继承了一个新的FundPairReference
。
同时增加一个基金指数对照表新页面,用来记录使用FundPairReference
的所有品种。
基金指数对照表
代码 | 跟踪代码 | 仓位 | 校准值 | 日期 | 参考值 |
SH510300 | SH000300 | 1 | 978.8 | 2024-12-09 |
2019年10月25日
华宝油气在国庆假期后持续高溢价,到今天已经连续第13个交易日。吃瓜群众们充分利用华宝油气限购1000的机会,开始了新开1+6拖拉机账户溢价申购套利的狂欢之旅,从10月11号到现在测算的申购账户数一直在创历史新高。
不断新开的账户把我线性回归统计基金场内申购账户的结果活生生搞成了非线性。
10月22日那天场内新增了5766万股,对应限购1000人民币下场内满额申购了22127户,全部场内份额已经接近65亿股。好几个人看到迅速增加的份额后都问我华宝油气会不会继续把限额降到100块或者是彻底关门。
我暗自一笑,回答说你们想多了。华宝基金有对它来说更聪明应对方式,其实在8月份刚开始限额申购后的那一轮溢价申购时已经表现出来了。
这个聪明方法是主动降低股票持仓仓位比例,把大家新申购的人民币拿在手里除了收管理费以外什么都不做。
我修改了一下平时基本闲置的净值记录页面,统计了过去4年来的华宝油气仓位估算结果。
可以看出在今年8月份之前,基本上都是稳定维持在基金说明书中写的95%附近;8月份降到了85%-90%,9月份经过连续11个交易日折价大量赎回后,9月底时仓位又回到了95%。
为了避免一般的华宝油气官方估值的误差来源的影响,我在这里只选择了XOP当晚净值涨跌幅度大于4%的日子进行仓位估算,因为仓位回到95%以后没有这样的大波动,这样的话当前华宝油气具体仓位依然是个谜。
下一个XOP大涨或者大跌后不出意外的话,肯定是会再次看到华宝油气上涨跟不上涨幅,下跌也跟不上跌幅的。
显然华宝油气在雪球的工作人员对目前仓位降低的问题是了然于胸的。昨天我的估值软件给出10月23日的净值是0.387,而他在雪球狡猾的给出了0.386,结果公布后果然是他对了。
XOP净值在10月21到23日连续每天小涨,没有一天达到了我定的4%的标准,所以我一直没能有效的测算目前的实际仓位。
不过这3天累计的涨幅达到了5.14%,我于是灵机一动,想到了可以优化一下算法:不用拘泥于单日的涨跌,只要连续几天的累计涨幅或者跌幅超过了4%就计算一次仓位。
这样我又增加了一个专门估算仓位的新页面:仓位估算
加了新页面后继续脑洞大开,我又加了一行输入界面,从此可以自行设置4%的阈值。
既然现在有了实测的数据,当然要把它们派上用场,在QDII估值中被打入冷宫的fundposition表又复活了。不过我暂时只把SZ162411和SZ160216仓位用在了估值上,而其它的LOF依旧使用缺省的95%仓位。如果小于1,在估值页面上会显示实际使用的估值仓位。
国泰商品跟华宝油气是2011到2012年基本上同时代的第一批QDII基金,开始几年没啥人气。2015年传说中的著名网络写手烟雨江南邱晓华卸任基金经理前,把名字上依然保持着大宗商品的SZ160216改造成了一个纯油基金,净值几乎100%跟随USO和美油期货CL。
也就是说,我可以用USO准确的给这4年以来的国泰商品估值。
100%跟随CL就意味着可以套利。在CL砸向2016初的26美元那一轮中,可以抄底油价又可以套利的国泰商品跟华宝油气一样迅速成长起来,QDII场内流动性仅次于华宝油气。在华宝油气2016年1月21日因为外汇额度彻底关门后,国泰商品也在2016年2月24日彻底关门。
接下来神奇的事情发生了。随着油价迅速反弹,华宝油气很快就在2016年3月25日恢复了每日10万限额的申购,到了当年4月8日更是恢复到了50万。而国泰商品却一直到2017年的5月11日才恢复每日1000的限额申购,然后2018年8月21日至今一直是每日限额1万。
民间传说是国泰基金把外汇额度挪到其它产品上去了。可能是因为关门时间太长,之前累积起来的流动性一去不复返,以至于现在都要被后来者追上了。
事实上,当南方原油LOF计划在2016年中间上市的时候,我看到的套利群体是对它寄予厚望的,希望它能重复国泰商品100%跟CL的模式方便大家赚钱。可惜南方基金没采用现成的套利促进流动性的模式,所以它到现在的流动性也还是苦哈哈。
因为国内监管的要求,FOF的持仓不能过于集中。SZ160216费了不少力气让自己的持仓跟USO保持100%一致。因为美股市场上没有足够多的原油ETF品种选择,它同时持有了小部分2倍日内杠杆的原油ETF和看多美元的ETF,甚至还有一点点贵金属ETF,说白了就是为了满足监管的分散要求。
而南方原油LOF(SH501018)更离谱,它持仓了很大一部分欧洲市场上的原油ETF,由于市场收盘时间不同,市场假期也有差异,我用USO给它估值就不准了,反向计算出来的仓位就更加不靠谱。
想给它正确估值,使用SZ162411的这种单一品种参考模式是不行的。惊艳大师计算净值的Excel虽然在我的网页工具出来后落寞了许多,不过他说了,用XOP估算华宝油气净值只是小学生水平,能够用实际的详细持仓明细估算净值才算初中生水平!
魏大户在雪球和公众号上写了一系列A股大时代的故事,一直用这个封面图片。因为我今天也忍不住开始讲原油基金历史的故事,就东施效颦也放个图。
不要怕,是技术性调整,不要怕。
华宝油气的C类份额
2020年1月13日
流动性是个很神奇的东西,我一直喜欢用高速公路上的车流来比喻它。不知道什么时候原本高速行驶的车流会突然慢下来塞住,又不知道什么时候会逐步缓解直到重新一路畅通。
今天收盘后,华宝基金发布了一个给我当头一棒的公告,要开始销售C类华宝油气份额。0申购费、7日后0赎回费、同时还降低管理费率的场外C类份额无疑会严重打击场内SZ162411的流动性。我感觉华宝基金在犯一个明显的错误,一旦流动性开始下降,紧跟着会下降的就是市场规模了。
国泰商品已经只剩大半桶油
2020年3月26日
从仓位估算可以看到,之前国泰商品仓位一直中规中矩的保持在LOF标准的95%附近。不过在3月6日开始的这一轮CL断崖式下跌后,它的仓位也随着断崖式下跌了。目前估算仓位59%,已经只有大半桶油。
国泰商品在3月13日停止了申购,紧接着的3月16日周一广发石油也停止了申购。因为海外账户保证金不够的原因,突然的大额申购可能会让SZ160216和SZ162719这种QDII基金在随后的大约一周内出现明显的仓位降低。
可以看到SZ162719仓位在3月20日就恢复到了正常的95%附近。那么,SZ160216一直没有恢复仓位,是不是它也采用了SZ162411类似的降仓位保申购的方式,尽可能吸引流动性?要知道,早已经在2月14日再次关门后的华宝油气因为美元资产净值的大幅降低,它如今的仓位已经由基金公司恪守的80%底线被动降低到了75%。
这个问题其实难于判断,因为在基金公司有意降低仓位保申购的可能性外,还有另外一个解释:在国泰商品的持仓中,能保持迅速跟上当月CL跌幅的USO只是其中之一,此外还有大量像USL这种持仓很多远期CL的,所以看上去表现就像SZ160216仓位不足了。
无论是什么原因,既然表现出来的仓位已经如此之低,用CL对冲的要小心,很容易一下子多空36%的仓位,一旦油价快速反弹就亏惨。
基于类似的逻辑,持有XLE、XOP和IXC等多只美股原油股票ETF的诺安油气也会显示出它相对于XLE波动的仓位区别,为避免莫名其妙的亏钱,用XLE对冲前一定要记得看一眼实际表现出来的SZ163208仓位!
2021年6月24日
虽然原则上来说XOP也可以使用这个页面,但是它其实是为同时有港股和美股的KWEB持仓准备的。
QDII基金总是越跌规模越大,流动性越好,前些年是华宝油气,而今年最热门的变成了中概互联。按SZ162411对应XOP的模式,中概互联的小弟SZ164906之前是用KWEB估值的。
不过因为有1/3的港股持仓,它的净值在港股交易时段会继续变化,所以原来的SZ164906页面其实没有什么实际用处。唯一的好处是在基金溢价记录中累积了几年的官方估值误差数据,帮我确认了用KWEB持仓估值的可行性。
跟A股LOF基金每个季度才公布一次前10大持仓不同,美股ETF每天都会公布自己的净值和详细持仓比例。因为KWEB和SZ164906跟踪同一个中证海外中国互联网指数H11136,这样可以从KWEB官网下载持仓文件后,根据它的实际持仓估算出净值。然后SZ164906的参考估值也就可以跟随白天的港股交易变动了。
写了快6年的估值软件终于从小学生水平进化到了初中生水平,还是有些成就感的。暑假即将来到,了不起的狐狸爸爸要开始教已经读了一年小学的娃在Roblox上编程了。
了不起的狐狸爸爸会干很多事情,但是刺猬才会干大事。
KWEB的持仓中混合了部分二次回港上市的股票,需要单独处理一下。虽然它们跟港股在美股的ADR是不同的概念,但是在数据结构上是一致的,犹豫了一分钟后,我就把这两者合并了。
数据来源:阿思達克二次回港上市
2021年7月14日
相对于净值记录等其它历史数据,这个页面来得实在是比较晚,主要是之前做华宝油气套利时不需要特别关注每天的场内新增份额,反正流动性足够好。不过随着XOP一路上涨,华宝油气的上百亿场内规模只剩下了零头,失去了流动性的华宝油气和XOP跨市场套利变成了屠龙之技。
我也被迫开始关注像SZ164906这种流动性不是那么好的品种,为以后的套利早做打算。
历史数据页面汇总:历史价格 基金溢价记录 净值记录 净值价格比较 基金场内份额 校准记录 仓位估算 基金场内申购账户 小心愿佯谬
SZ162411的成交数量相对于场内份额(万)的换手比例 基金场内份额
日期 | 份额(万) | 场内新增(万) | 数量 | 换手 | 新增换手 |
2024-12-09 | 83624.79 | -688.12 | 92450586 | 11.06% |
2024-12-06 | 84312.91 | -179.77 | 107029900 | 12.69% |
2024-12-05 | 84492.68 | -16.13 | 98833792 | 11.7% |
2024-12-04 | 84508.81 | -443.49 | 29295966 | 3.47% |
2024-12-03 | 84952.3 | 0.27 | 50637641 | 5.96% | 1875468% |
2024-12-02 | 84952.03 | -15.55 | 40003265 | 4.71% |
2024-11-29 | 84967.58 | -191.88 | 24244734 | 2.85% |
2024-11-28 | 85159.46 | -104.69 | 32632704 | 3.83% |
2024-11-27 | 85264.15 | -81.95 | 57086656 | 6.7% |
2024-11-26 | 85346.1 | -76.04 | 58308265 | 6.83% |
为中丐互怜增加混合QDII工具系列
2021年7月28日
从QDII中分出来,采用跟踪成分股变化的方式对同时有美股和港股持仓的SH513050等进行净值估算。
A股大妈最喜欢干的事情就是抄底。随着过去半年来中概互联一路跌成了中丐互怜,中概互联网ETF的市场规模和流动性都在暴涨,就连原来叫中国互联的SZ164906都蹭热度借增加扩位简称的机会改名成了中概互联网LOF。看得我口水流一地,忍不住想做点什么蹭蹭热点。
跟SZ164906和KWEB跟踪同一个指数H11136不同,SH513050跟踪的是另外一个不同的中证海外中国互联网50指数H30533。H30533和H11136在成分股选择上基本一致,但是H30533对单一成分股最大仓位限制是30%,而H11136限制10%的最大仓位,这样导致它们俩在腾讯和阿里持仓比例上区别巨大。
在中间的是跟踪中证海外中国互联网30指数930604的SZ159605和SZ159607,限制15%的最大仓位。另外,顾名思义930604的成分股数量要少50-30=20只。
SH513050的成分股和比例来自于上交所官网的ETF申购赎回清单,SZ159605和SZ159607来自深交所官网的ETF申购赎回清单,这样未来可以方便的继续扩大新成员。SZ164906的成分股和比例依旧还是来自KWEB官网公布的每日基金持仓更新。
把SZ164906从老QDII挪到新的混合QDII其实是个相当痛苦的过程,原来以SZ162411为模板写的仓位估算等功能都要从QDII拓展出来,港股QDII在这个过程中也跟着沾了光。
官方估值跟原来美股QDII一样,不过参考估值有所不同。除了当日汇率的变化外,参考估值在港股开盘后还会反应当日港股成分股的变动对净值的影响。
依稀往梦似曾见,心内波澜现。
为混合QDII补充A股成分股的持仓处理
2022年9月14日
在美军从越南撤退的时候,美国政府估计其中有相当大比例的染上了毒瘾。按当时的普遍研究,吸毒者复发的可能性高达90%以上,如何面对预期中几十万退伍的瘾君子成了一个严峻的问题。然后让严阵以待的社会学家们完全没有想到的是,事实上复发的比例不到5%。
于是研究者们又挖空心思搞了一个新理论出来:只要远离了原来上瘾的环境,就不容易再次上瘾。
在我刚开始混雪球和搞微信公众号的时候,对成为股票套利大V曾经是满怀希望的。这个希望破灭在QQ群和号被封后。我意识到套利者群体中其实不少人是满怀敌意的。而且即使不举报我,出于秘籍不能外传的心理,绝大多数套利者也不会愿意主动帮我分享,因此这条大V之路其实走不通。
不幸的是,我发现我上瘾了,每天花了大量的时间搞无效的网络社交。于是开始有意的让自己远离上瘾环境。公众号在去年11月因为举报封了我一篇文章,我就不再更新文章,放弃微信上6000多的订阅者;雪球在今年2月删除了我一条宣传网站的评论,我就弃用了13000多粉丝的woody1234帐号。从此彻底戒断大V梦想。
戒断上瘾总会有副作用,对我来说,就是口头上喊着要努力专心做好自己的网站,实际上在很长时间内却再也提不起兴致,以至于经常放在嘴边自嘲的每天20行代码都断了很久。
7月份的时候,我注意到中丐互怜来了个新成员中概互联ETF(SH513220),本来想简单的通过拷贝复制加上,却发现跟其它老丐帮成员不同,它居然还有A股成分股。一下子我的拖延症就犯了,一直拖到这个月才动手。
既然加上了A股成分股的处理,那么把老的同样同时有美股、港股和A股成分股的教育ETF(SH513360)加上也就成了简单的拷贝复制。剩下就看在没有网络宣传的情况下,搜索引擎们能多有效的帮助用户找到这些估值网页了。
年轻人,我这儿有本秘籍。 640x399 原图
2023年5月21日
四个跟踪日经225的ETF上市好几年来一直不愠不火,我觉得它们流动性不好就没有去搞估值。直到19日周五收盘日经225ETF易方达(SH513000)场内溢价拉到了20%,让我觉得不能再观望下去了!毕竟只要有人来拉溢价,流动性就可能会好起来。
能够拉溢价的原因是多方面的,比如巴菲特月初开股东大会宣传增持日本五大商社,日本股市最近几天创下三十多年新高接近1990年最高水平,但是关键还是在于限购。
易方达基金公司因为中丐互怜缺QDII额度,SH513000每天限制申购50万份。而作为ETF,它又要求每次最少申购50万份,这样每天只有一个幸(kai)运(hou)儿(men)能申购到。
SH513520同样因为限购总份额50万份也被拉到了接近20%的溢价,而SH513880和SZ159866则因为分别限购1500万和1亿份而基本上平价。
日本QDII跟港股QDII的估值模式基本上是一致的。中国和日本股市都开市的日子里,用新浪日经225指数数据znb_NKY做官方估值,日本股市北京时间下午两点收盘后官方估值就不再改变,直到晚上跟公布的实际净值比较和自动校准。
同时全天都用新浪日经225指数期货数据hf_NK做实时估值,可以反映日本股市收盘后的变化。
配张日本美女图。
1991年宫泽理惠Santa Fe写真
2023年5月25日
华安基金公司的QDII基金不仅有跟踪美国和日本股市的ETF,还有德国和法国的。之前我都用美股市场上的ETF给德国ETF(SH513030)和法国CAC40ETF(SH513080),误差一直很大。
专门去看过它们的季报持仓,发现它们还真是在德国和法国市场上买股票,这样就像南方原油LOF的估值一样,连收市时间都差几个小时,当然不准。
在加了日本QDII后,我意识到可以用同样的模式给这两个ETF估值,股指数据分别来自于新浪的znb_DAX和znb_CAC。目前德国和法国都在夏令时,北京时间下午三点开市,晚上11点半收市。
隔一段日子后到基金溢价记录页面看估值误差,就知道这个改动是否成功了。
命运赠送的礼物都早已暗中标好了价格
增加全球芯片LOF和海外科技LOF的估值
2023年5月30日
NVDA上周创历史的财报预期后,掀起了全球芯片股票的高潮,让我实在坐不住了。按Forest_g一个半月前的具体建议在混合QDII中加上了同时持有美国和中国芯片股的全球芯片LOF(SH501225)估值页面。
又要到饭了兄弟们 640x360 原图
不知道是持有多地上市股票的基金是今年的新潮流,还是只是为了躲开纳斯达克QDII基金的拥挤,华宝基金还搞了一个同时持有纳斯达克和香港科技的海外科技LOF(SH501312),顺便一并加了进来。
2024年4月19日
解释完美元利息带来的期货升水导致纳斯达克100的实时估值偏高后,我就把它们丢在一边了,因为自己没钱申购ETF,而仅有的SZ161130LOF常年关门,平时根本没机会用到它。
前几天似酒闻香突然问我为什么不用当前NQ期货和美股收盘时的NQ价格比较计算实时估值,我下意识的回答因为没有一个好的方式在美股收盘时拿NQ数据,然后突然意识到这跟我需要把USO和美油期货CL自动校准以及保存校准记录一样,在美股交易时自动校准一下当天的NQ期货和^NDX指数就行了。
原来的做法就是画蛇添足,代码现成到只需要注释掉一行if ($strEtfSymbol == 'USO' || $strEtfSymbol == 'GLD')
。
即便如此,还是拖了几天才完成这个说明,不知道自己平时都在忙什么!
咦,那个人看上去好像一条狗!
印度基金LOF的实时估值
2024年6月6日
在全世界的集体看好下,印度股市一路新高,A股场内唯一印度基金LOF(SZ164824)更是备受追捧,在今年年初接近耗尽QDII额度时开始了限购100的套利盛宴。盛宴倒不是说赚了多少钱,而是热闹非凡,套利做了这么多年,第一次如此顺畅,每天只需要闭着眼睛申购闭着眼睛卖,就把讨饭的钱给赚到了。
过去几年一直用INDA给它估值,虽然一直都知道并不太准,但是直到6月4日印度股市盘中跌八个百分点的时候,我才意识到判断溢价申购时必须考虑当天印度股市的涨跌,否则可能会完全错误。于是这两天削尖铅笔给它新加了实时估值。
跟处理日本QDII和欧洲QDII类似,印度股指数据来自于新浪环球市场中的znb_SENSEX。以前其它品种的实时估值用的都是期货,虽然共用了校准记录,但是手工校准和自动校准的模式都不相同,我的PHP代码因此在继续恶化膨胀。
印度股市在北京时间11点45分开盘后,实时估值会开始跟随变化,一直到北京时间下午6点收盘。
美股晚上开盘后,官方估值会随着的日期变化而变化,但是并不会跟实时估值一致,因为当天INDA的交易通常不会跟SENSEX完全重合。要等到美股收盘后一个小时,我会自动去Yahoo拿当天INDA的净值,然后跟SENSEX当天收盘价自动校准,此时官方估值就会跟实时估值一致。
北京时间早上9点15分,我会自动更新当天的美元人民币中间价,参考估值会开始显示,并且跟实时估值一致,直到A股上午收盘。由于中间价每天都变化,美股QDII的官方估值和参考估值通常也不会一致。