如何用例子浅显地解释什么是统计套利?
例子:
假如有五个市场 A、B、C、D、E
A: 卖1.98 买2.08
B: 卖2.05 买2.15
C: 卖2.01 买2.09
D: 卖2.00 买2.06
E: 卖2.07 买2.15
------
先说普通套利;
其实这里只存在一个明显的机会 - 买D,卖E。
A、B、C对我们来说就没有用了,因为都不是最好的价格。
我们这么做,利润是2.07-2.06: 大概0.5%
满好的,可以一直这样做下去;利润慢慢累积起来了
------
但有三个问题:
1)发生这种机会;市场状态并不是稳定的。其中一个市场有了动静,只是其他市场还没反应过来而已。时间也许只有一秒钟,大家又是一致的了。
这两个交易必须都成功才行;我们很可能只抢到其中一个。而且抢到的那一个肯定是已经更新了的,没有价值。
看这个例子,可能是D刚刚下降了,暂时不会再动。反而E马上要跟着下降。最好是先卖E,抢不到罢了没事,抢到了,再考虑要不要去买D。
这么简单的漏洞;好多人都能够发现;除非我们是世界上反应最快的,否则操作不了。
2)这0.5%利润是不是太少了?也许本来卖E已经是+2.0%的利润,而买D是-1.5%。两者合并一起操作,我们利润才0.5%。就是说我们把E的那么好的价值的75%白送给D了。
3)这种套利机会发生很少。那么多的涨跌变化,偶尔小小部分才会产生市场之间这么夸张的临时差距。
这么大信息量,对我们来说都是用不到的吗?A、B、C也一直在变动,难道没有更多更好的方法?
------
所以呢,我们可以讲到统计套利;
解释一个最简单的方法,先算一下每个市场所代表的价格。我们就用很普通的平均吧(也可以用microprice之类的,好多条路可以走)。得到:
A:2.03
B:2.10
C:2.05
D:2.03
E:2.11
好吧,那么也估计真正总体实价应该是:2.064
但是我们还可以通过机器学习或凭感觉调整这五家的权重,得到更靠谱的实价:
1)看他们本身的正确程度,说不定有几家只是随便打酱油的?
2)看交易量或其他效率有关的,谁更确定自己的价格?
3)看他们最近更新的顺序,哪些刚刚把价格移过来了?
反正可以用很多种模型来决定现在的综合实价。
-----
假如说我们统计出来的实价为2.03。
那我们应该怎么操作?
E现在的价值是2.07-2.03,约2%。很好阿!就算E不存在或已经错过了,卖B也很值得~1%。
再看看另一边;所有的买价都对我们来说毫无价值。最好的才2.06,也是2.03-2.06~-1.5%。注意是负的;其他买价更差更不用说。
现在我们决定卖,不买了。
危险吗?万一之后涨了很多?再说好像已经不是套利的样子,因为有take position?
好吧,那如果价格突然涨了是随机的事情。也有可能突然跌很多,对我们更有利,但同样是随机的。我们只要相信自己的模型,去测试和backtest就行了。排除这些随机因素,长期平均利润应该就是我们所认为的那个+2%。
而且这么做的话,我们在每一次变动都能够进行交易,交易频率比以前那个方法高多了。很自然就有更多的买卖机会,反复让position互相取消掉cancel out。
【补充:什么时候感觉position太大了,我们随时都可以去hedge了。这里hedge的意思就是故意让自己去买卖价值少于零的东西,为了压低我们的position。也可以比较动态地说;比方说position大到X万欧元,我们愿意付出小于X%的价值来平衡。这样只有在市场最窄的时候最便宜的时候才hedge。不要害怕,市场以后总有比较窄的时候。】请问position和hedge用中文如何表达?
这就是统计套利。
统计指的是我们测算实价背后的模型。
更高级的模型可能会用到各种其他因素。假如说市场上其他对象。如果是做外汇的话,那就是其他货币的相关性数据,甚至一些更基本的经济数据。这种东西都有预测用途的;只要量化统计他们的各种关系就行了。
|
|