2022年考研重点之非参数检验与参数检验的异同.docx
-
资源ID:63370673
资源大小:17.19KB
全文页数:4页
- 资源格式: DOCX
下载积分:15金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
2022年考研重点之非参数检验与参数检验的异同.docx
非参数检验与参数检验的异同:1) 一般不需要严格的前提假设2)特别适用于顺序资料等级变量)3)适用于小样本,且方法简单4)最大的缺乏是未能充分利用资料的全部信息5)较难处理交互作用差异表达在二者的差异上参数检验包含正态总体的均值或者均值差异检验,二项分布检验,积差相关系数显著性检验, 方差分析等。共同前提:总体呈正态分布,假设涉及两总体,须方差同质。参数检验通常用 于等比和等距型数据。非参数检验包含相关样本的双向秩次检验和独立样本的单向秩次检验。非参数检验对总体的 分布情况要求低,适用范围比参数检验广泛。非参适用于顺序型变量以及命名型变量。但非 参未能利用数据全部信息,检验效率下降,犯第二类错误的可能性比参数检验大。回归分析与相关分析的区别和联系:二者均研究2个或2个以上变量之间的关系区别:1) 二者研究目的不同,相关一一研究变量之间是否存在线性关系以及关 系的强弱程度,回归一一在相关根底上进一步研究变量之间的联系方 法,在一个或几个变量根底上预测或操纵另一个变量的值.相关变量关 系对等,回归不对等(谁是X,谁是Y);2) 二者假设条件不同,相关一一两变量为随机的,回归一一解释变量是确定性的,被解释变量是随机的,有一概率分布。回归的目的就是通 过给定的解释变量来预测或操纵被解释变量的总体均值或个别值。联系:在进行回归分析之前一般先确定变量之间线性关系是否紧密(相关分析), 变量之间的相关系数与回归系数的拟合程度也存在关系。以两个样本均值差异的显著性为例,说明假设检验的根本原理与步骤:假设检验的根本思想可以用小概率原理来解释。所谓小概率原理,就是认为小概率事件在一 次试验中是几乎不可能发生的。也就是说,对总体的某个假设(即原假设)是真实的,那么 不利于或不能支持这一假设的事件A在一次试验中是几乎不可能发一的;要是在一次试验 中事件A竟然发生了,我们就有理由疑心这一假设的真实性,拒绝这一假设。要对原假设作出接受还是拒绝的抉择,就必须依据研究的问题和决策条件,对样本值与原假 设的差异进行分析。假设有充分理由认为这种差异并非是由偶然的随机因素造成的,也即认 为差异是显著的,才能拒绝原假设,否那么就不能拒绝原假设。前提假设:随机取样,样本间观察独立,总体方差不变。步骤:1)提出关于总体的虚无假设H0,2)利用虚无假设来预测样本应有特征,3)从总体中得到随机样本,4)比较得到样本与假设预测之间差异。以总体方差区间估量为例,说明区间估量的根本原理:统计量是样本的函数,它是一个随机变量。统计量的分布称为抽样分布。总体参数区间估量的根本原理是依据样本统计量的分布规律及样本分布的标准误总体方差的区间估量:2依据72分布:/ =(”旷 自正态分布的总体中,随机抽取容量为n的样本,其样本 c方差与总体方差比值的分布为力2分布,这样可以直接查表确定其比值的0.95和0.99置信 区间。再进一步用下式确定总体方差的0.95和0.99置信区间。查df=n-l的/表确定X*;与的值,代入不等式得到。正态分布与标准正态分布的区别于联系:1)区别:正态分布的平均数为U,标准差为。;不同的正态分布可能有不同的u值和 d值,正态分布曲线形态因此不同。标准正态分布平均数u=0,标准差。=1, U和。都 是固定值;标准正态分布曲线形态固定。(2)联系:正态分布可以通过标准化处理,转化为标准正态分布。具体方法是使用 将 原始数据转化为标准分数。简述统计假设检验中两类错误的定义及其关系:11)统计检验中两类错误即Q错误和B错误。Q错误是指当零假设成立时,拒绝零假设犯 的“弃真错误,也叫I型错误;B错误是指当零假设不成立时,未拒绝零假设所犯的“取 伪错误,也叫H型错误。2) a错误和B错误相互之间的关系是:a大时,B小;a和B不能同时减少。 什么是双尾、单尾检验?在实际问题中,如何推断是使用双尾或单尾检验?只强调差异而不强调方向性的检验叫双尾检验;强调某一方向的检验叫做单尾检验。 两者的区别在于:(1)问题的提法不同;建立假设的形式不同;(3)否认域不同。在实际问题中,要依据研究目的所规定的方向性来确定使用何种检验。应该用单尾 检验的问题,假设使用双尾检验,其结果一方面可能使结论由“显著变为“不显著; 另一方面也增大了 B错误。反之,应当用双尾检验的问题假设用单尾检验,虽然缩小了 B错误,但是使无方向性问题人为地成为单方向问题,有悖于研究目的。 列举几种相关系数及其适用条件1)皮尔逊相关一一适用于正态双变量,连续数据,两列数据关系是直线的2)斯皮尔曼等级相关一一两列顺序数据,关系是线性的3)肯德尔W系数一一对K个评价者的一致性进行统计分析4)点二列相关一一两列变量,一列是等距或等比数据,总体分布为正态,一列为二分称名变量5)6系数一一两个变量都是二分变量X变量Y变量备注积差相关连续、正态数据连续、正态数据斯皮尔曼等级数据等级数据称名数据或顺序数据肯德尔2列以上等级变量(对K个评价者的一 致性进行统计分析)点二列相关连续正态(等距或等比)二分名义变量中相关二分名义变量二分名义变量 举例说明方差分析的根本原理与过程方差分析是从观测变量的方差入手,依据方差可分解性,研究诸多操纵变量中哪些变量 是对观测变量有显著影响的变量。方差分析的假定条件为:1)各处理条件下的样本是随机的。2各处理条件下的样本是相互独立的,否那么可能出现无法解析的输出结果。(3)各处理条件下的样本分别来自正态分布总体,如果不满足需要较大的样本量。4各处理条件下的样本方差相同,即具有齐效性。方差分析的假设检验:假设有K个样本,来自具有相同方差。2的K个总体。H。假设为K 个总体的均值相同。如果组间均方远远大于组内均方,那么推翻原假设,说明样本来自不同的 正态总体,说明处理造成均值的差异有统计意义。否那么成认原假设,样本来自相同总体,处 理间无差异。 简述算数平均数、中数、众数特点:(1)、算术平均数的特点:算术平均数是一个良好的集中量数,具有反响灵敏、确定严密、简明易解、计算简单、合 适进一步演算和较小受抽样变化的影响等优点,它在生活中应用最广泛,代表数据的总 体的“平均水平。算术平均数易受极端数据的影响,这是因为平均数反响灵敏,每个数据的或大或小的变化 都会影响到最终结果。计算要用到全部的数据,它能够充分利用全部的数据信息,但它受极端值的影响较大,在 组距数列中有较大假设性。(2)、中位数的特点:将一组数据按大小依次排列,把处在最中间位置的一个数或最中间位置的两个数 的平均数叫做这组数据的中位数。中位数的大小仅与数据的排列位置有关。用来代表 一组数据的“中等水平。因此中位数不受偏大和偏小数的影响,当一组数据中的个别数据变动较大时,常用 它来描述这组数据的集中趋势。用中位数作为一组数据的代表,可靠性也比较差,但中位数也不受极端数据的影响。(3)、众数的特点:不受数列中极端值的影响.难以精确反响数列中标志值的平均水平,可靠性较差.众数可能不存在,可能有多个众数(这时应重新分组求法简便,用来代表一组数据的“多数水平、适用范围:L比几组数据时大致差不多时,用平均数(反映平均程度);主要适用于数值型数据。2.如果每组数中出现很多相同的数时,要用到众数,众数是反映数据集中程度的;适用于非数 值性资料。3当一组数据中某些数据严峻偏大或偏小时,就最好选用中位数来表示该组数据的一般水平; 如果数据是按照从大到小或从小到大顺序排列的,会用到中位数;适用于非数值性资料。简述正态曲线特点:正态曲线normal curve)是一条顶峰位于中央,两侧逐渐下降并完全对称,曲线两端永 不与横轴相交的钟型曲线。一般用N(u,o )来表示均数为u,标准差为。的正态分布。1以均数为中心,左右对称,即关于X=u对称;2)位于横轴上方,X= 处取得概率密度函数的最大值,曲线在X= 口土。处有拐点,表 现为钟型;3) X取值范围理论上没有边界,X离u越远,f(X)值越接近0,但永远不会等于0;4)正态分布具有可加性15)正态分布完全由两个参数即均数u与标准差。决定。其中u是位置参数,决定曲线在 横轴上的位置,u增大,曲线沿横轴向右移;反之,u减小,曲线沿横轴向左移。是变异 参数,决定曲线的形状,u恒定时,。越大,数据越分散,曲线越“矮胖,反之,数据越 集中,曲线越“瘦高。6)正态分布曲线下的面积分布有肯定的规律,曲线下面积和为1.标准误是统计推断可靠性的指标分析:标准误反映的是样本均数之间的变异(即样本均数的标准差,是描述均数抽样分布的离 散程度及衡量均数抽样误差大小的尺度),标准误不是标准差。标准误用来衡量抽样误差。标准误越小,说明样本统计量与总体参数的值越接近,样本 对总体越有代表性,用样本统计量推断总体参数的可靠度越大。因此,标准误是统计推断可 靠性的指标。