论文《基于数据挖掘的量化选股策略的研究》

[复制链接]
查看314 | 回复0 | 123466884 | 2020-1-22 16:55:03 | 显示全部楼层 |阅读模式
摘要:近年来,由于股票市场的不断发展,量化投资技术越来越受到投资者的关注,我国的量化投资体系也逐渐走向成熟。随着股市规则的不断完善,上市股票的数量及与之相关的数据在不断的增加,而股票的这些数据多且复杂,却又隐含着很多有用的信息,那么如何从这些海量的数据中发现有用的信息,用常规的方法显然已经无法解决,而近些年发展起来的数据挖掘技术则可以帮助我们从那些海量的股票数据中挖掘出我们所需要的数据信息,通过对这些数据进行分析、建模得到我们想要的信息。本文主要讨论了基于数据挖掘的量化选股模型。首先我们根据两个条件对2013年-2015年沪深市场类全部A股的3000多支股票进行初步筛选:一是连续3年净资产收益率稳定且不小于10%,并剔除ST等公司股票;二是主营业务增长率与净利润增长率基本一致并且在10%以上。经过筛选,51支基本面较好的股票被保留。其次,我们选取了财务数据中能够反映公司盈利、偿债、成长等能力的17个重要指标作为数据分析的基础,考虑到因子之间存在重叠性、相关性,并且若模型解释变量太多则容易出现主次不分等问题,因此我们对这些指标做了主成分分析。通过主成分分析,在保留原数据绝大部分信息的同时,我们选出了无相关性的五个综合指标,进而达到了降维的目的。在众多的数据挖掘的算法中,聚类分析是特别容易理解而且已经被证明在选股方面是很有效的一种方法,所以本文选择了K均值聚类来研究选股策略,并且对K的选取做了对比,通过R软件选出了最优的K,从而将选股问题演变为选类问题。事实证明,针对我们的数据,当K取5时聚类效果最好,因此我们选出了7支股票作为最终选股结果,通过wind平台调出已选股票的历史k线,发现所选的股票的整体走势几乎都可以跑赢大盘,而且未来有上升的趋势,事实证明文章所做的工作对股票投资者分析选择股票具有一定的参考作用。
想要下载论文的读者朋友,请先付费获得积分。
购买主题 本主题需向作者支付 30 金钱 才能浏览
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

媒体报道
反包测试
心怡反包测试
反包:今日K线H>昨日K线H 且今日K线L
如何抄在针尖上?
刘昱妗如何抄在针尖上?
如果有办法能让你抄在针尖上,你想不想学? 不需要复杂的指标,也不需要高深的技术,
交易模型测试库
宇晨交易模型测试库
目录 1.MACD日线 2.海6日线3.海龟S1日线 4.海龟S2日线
关于调delta的研究
刘昱妗关于调delta的研究
调备兑时间点 早晨9点,下午14:30,晚上21点 12.9 夜盘调delta 纸浆成交量为0 delta
文华各分区测试
宇晨文华各分区测试
////一楼////
test1
admintest1
test1
test1
admintest1
test1
交易SOP
刘昱妗交易SOP
日常任务及流程【金山文档 | WPS云文档】 交易sop https://www.kdocs.cn/l/cvXFT8HZDO
相关课程推荐
反包测试
反包:今日K线H>昨日K线H 且今日K线L
如何抄在针尖上?
如果有办法能让你抄在针尖上,你想不想学? 不需要复杂的指标,也不需要高深的技术,只要死磕这招盈亏比极
交易模型测试库
目录 1.MACD日线 2.海6日线3.海龟S1日线 4.海龟S2日线

1

主题

1

帖子

10

积分

普通会员

Rank: 2

积分
10
  • 官方论坛

    提供最新 Discuz! 产品新闻、软件下载与技术交流