数理统计综合作业解析.docx
《数理统计综合作业解析.docx》由会员分享,可在线阅读,更多相关《数理统计综合作业解析.docx(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、“数理统计”课程综合作业作业要求为了考核同学们综合运用统计方法解决实际问题的过程,请同学们结合当前社会生活实际中的问题,自己拟定一个研究题目,并应用参数估计、假设检验、回归分析、方差分析、正交设计(这些方法中至少选择两个)对其进行分析。要求:(一) 内容必须涵盖以下几个方面:1.题目;2.研讨的问题是什么;3.相关的数据及来源;4.建立的统计模型和统计问题是什么,样本数据是什么;5.使用的统计方法是什么?使用的统计分析软件是什么?5.计算过程(若统计软件,其计算结果是什么)6.对计算结果的说明或解释。(二) 格式 包括报告题目、摘要、正文、参考文献和附录五个部分。正文内容一般包括问题描述、数据
2、描述、模型建立、统计方法选择和问题求解、结果分析等内容。报告用Word 文本格式,中文字使用宋体、小四号字,英文用Roman 字体5 号字,数学符号用MathType 输入。题 目(黑体,三号)摘要:(200-400字)(黑体,小四)正文(正文标题:宋体,粗体,小四)一、问题提出。(正文内容:宋体,五号)二、数据描述(用表格表达数据信息,指出数据来源或提供原始数据)三、建立统计模型四、统计方法设计和方法使用的条件,计算工具的选择。五、计算过程和计算结果。六、结果分析。参考资料(标题:宋体,粗体,小四,内容:宋体,五号)附录(标题:宋体,粗体,小四,内容:宋体,五号)(三) 课外作业提交形式纸质
3、材料和电子文档注意:纸质材料打印内容从封面开始,包括作业要求,直至作业的所有内容。电子文档:先提交给班长,再由班长将压缩文件提交给老师。特别注意电子文档的名称,按如下模板写: 2011级某班“数理统计”综合作业姓名,学号。(四) 课外作业提交时间参加课程考试那天上午提交纸质材料,当天班长提交电子文档给老师。请注意:不能复制现有成果,同学之间也不能相互复制内容。 股票市场中变量之间的关系摘要: 在经济飞速发展的当代,金融市场占据着半壁江山,而在金融市场中股票作为公司筹资的重要来源,它占据着重要的地位,我接下来就是要研究股票市场中变量之间的关系,通过统计分析方法还原大数据时代海量数据所反映的事实,
4、以及数据之间的规律性。 首先用统计中的参数估计的方法对所得数据进行分析建立模型Y=X+,对搜集到的数据做参数估计,即最小二乘估计。然后对数据建立回归预测的模型,用回归分析的方法对搜集到的中证100股指的数据建立线性模型,用R软件编程进行求解,最后求出的估计值并用R软件画出残差图并与实际走势相比较。最后对所得结果进行分析,联系实际的K线图,检验预测的效果,对R软件中得出的异常点进行分析,用三种不同的方法得到的结果进行比较,分析此次分析对实际问题的实用性。中证100指数的回归分析一 问题的提出生活在21世纪,这个信息的海洋里,每天都面对着海量的数据,而与我们并不遥远的金融市场更是信息的集中体,股票
5、期权等每秒都有上亿的数据信息量,面对如此多的数据信息,如何才能从众多的股票中选出优质股进行投资成为人们争夺的热点,其实我们可以用统计的方法来解决这些问题。下面便针对这种现象提出如下的问题:请搜集有关股票数据并对其变量用统计方法进行分析。二 数据描述在大智慧软件上搜集中证100的指数,并对中证100支成分股搜集15分钟k线的收盘价,共352组样本数据得到如下数据:(具体见附录) 三.建立统计模型对搜集到的数据进行建模,因为影响因变量中证100收盘价Y的共有100支股票,设这一百只股票分别为X1,X2,X3.X99,X100.这100个变量与Y有如下相关关系:Y=+x+.+其中 N(0,) 且co
6、v()=0,ij.即建立了线性模型: Y=X+ E=0,cov()=I参数估计: 对上述建立的模型进行参数估计,设=()为的估计量,则称为线性回归方程,残差平方和为给定观测数据()i=1,2,3.100就是的最优解即 (1)的解由(1)式可知为正规方程 rank()=rank(X)=p+1所以得到的LS 估计为即四、 统计方法设计和方法使用的条件,计算工具的选择。 用用R软件对所搜集的数据进行用回归分析的方法对最小二乘估计进行计算,并用回归分析建立回归模型,首先把数据中缺失的即停盘的股票删去,并将缺失的补齐,另存为Csv文件,下面在R软件中编程进行解答。下面是程序DA=read.csv(),h
7、ead=T) library(nnls) x=as.matrix(DA,2:101) y=as.vector(DA,1) a=2:101 b=0.000373465 D=data.frame(a,b) b0=as.vector(D,2) y1=y-x%*%b0 nnr nnr coef coef五、计算过程和计算结果。对数据做正回归分析得出结果:coef(提取系数向量的估计值) 1 1.986219993 45.724918486 14.346167164 0.000373465 2.901370739 6.540717465 0.114566603 9.684098103 36.471730
8、436 0.682356715 0.000373465 12 0.000373465 0.835485658 0.000373465 3.471582198 0.000373465 1.488914287 1.500925835 0.000373465 0.000373465 0.000373465 0.000373465 23 0.000373465 0.000373465 14.426982052 31.705891305 0.000373465 0.000373465 0.000373465 18.460676674 0.000373465 0.000373465 0.000373465
9、 34 0.000373465 0.000373465 0.000373465 0.000373465 5.243724570 12.354343316 0.000373465 0.000373465 0.000373465 0.000373465 0.000373465 45 0.000373465 0.000373465 0.671666765 0.000373465 0.000373465 0.000373465 1.631742836 0.000373465 0.000373465 0.000373465 29.402227896 56 3.856391237 0.000373465
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数理统计 综合 作业 解析
限制150内