如何量化股票振荡?
对于题主的题目,我的回答是:在时域里无法定量刻画震荡; 在频域里可以量化计算震荡;
一、时域 时域里的指标有很多,最常用的是K线、MACD、RSI等。这些指标都是通过对历史数据的处理,得出一个动态的数值,从而帮助我们解读市场中短期的走势。 对于这些传统指标,其本质上是一类均值恢复的量化模型。因此我们可以通过求解偏微分方程(PDE)的方式,对这些算法进行推导,最终得到市场波动率的一个表达式。但这样得到的结论是无穷大,意味着无论我们选取多长的数据窗口,或者采用多么精细的时间区间划分,最后的结果都只能无限趋近于真实值。这是由于这些指标的本质决定的——它们都是对历史数据的描述,而历史是不能被量化的,因此任何一种对历史的数据处理,都不会完全接近真实的市场行情。
所以基于这种思路的指标,都是对未来行情的一种预测,它的本质取决于参数θ的取值。如果一个指标的参数θ选取合适,并且在历史数据集上得到了较好的测试效果,那么我们可以认为这个指标是有效的;反之,如果一个指标的参数θ在历史上无论怎么选取都无法得到有效验证,那么我们就可以说这个指标是不存在的。虽然这样的指标存在无穷多,但我们只要选取其中最优的一个,即认为它最接近真实值,从而能够正确反映未来的变化趋势。
二、频率 从概率的角度来讲,任何一组数据出现的可能都有发生(2^n次方种可能),而我们之所以能用有限个数据来描述未知的数据源头,是因为这些数据发生的可能性远比其他数据发生的可能性大的多。换句话说,如果我们收集到了足够多的数据,那么理论上所有的数据排列都是可以实现的。 所以从频率的角度来看,市场的每一次波动都可以用一个向量来表示,该向量包含了指标的所有可能的取值。既然如此,我们就可以把频率分析和时域分析的思路结合在一起,用指标的参数估计值作为初始条件,通过递归的方法不断迭代出未来更长时间内的波动情况。
三、小结 无论是使用时域还是频率的方法来研究问题,其本质都是通过数据生成过程来推测未知的数据源头。只要所采用的算法有效,并且通过一定的数据预处理解决了存在的问题,那么我们就可以比较满意的给出问题的答案。