论文《基于数据挖掘的量化选股策略的研究》 |
|
摘要:近年来,由于股票市场的不断发展,量化投资技术越来越受到投资者的关注,我国的量化投资体系也逐渐走向成熟。随着股市规则的不断完善,上市股票的数量及与之相关的数据在不断的增加,而股票的这些数据多且复杂,却又隐含着很多有用的信息,那么如何从这些海量的数据中发现有用的信息,用常规的方法显然已经无法解决,而近些年发展起来的数据挖掘技术则可以帮助我们从那些海量的股票数据中挖掘出我们所需要的数据信息,通过对这些数据进行分析、建模得到我们想要的信息。本文主要讨论了基于数据挖掘的量化选股模型。首先我们根据两个条件对2013年-2015年沪深市场类全部A股的3000多支股票进行初步筛选:一是连续3年净资产收益率稳定且不小于10%,并剔除ST等公司股票;二是主营业务增长率与净利润增长率基本一致并且在10%以上。经过筛选,51支基本面较好的股票被保留。其次,我们选取了财务数据中能够反映公司盈利、偿债、成长等能力的17个重要指标作为数据分析的基础,考虑到因子之间存在重叠性、相关性,并且若模型解释变量太多则容易出现主次不分等问题,因此我们对这些指标做了主成分分析。通过主成分分析,在保留原数据绝大部分信息的同时,我们选出了无相关性的五个综合指标,进而达到了降维的目的。在众多的数据挖掘的算法中,聚类分析是特别容易理解而且已经被证明在选股方面是很有效的一种方法,所以本文选择了K均值聚类来研究选股策略,并且对K的选取做了对比,通过R软件选出了最优的K,从而将选股问题演变为选类问题。事实证明,针对我们的数据,当K取5时聚类效果最好,因此我们选出了7支股票作为最终选股结果,通过wind平台调出已选股票的历史k线,发现所选的股票的整体走势几乎都可以跑赢大盘,而且未来有上升的趋势,事实证明文章所做的工作对股票投资者分析选择股票具有一定的参考作用。
![]()
购买主题
本主题需向作者支付 30 金钱 才能浏览
|