第四版统计学考试复习要点(共4页).doc
《第四版统计学考试复习要点(共4页).doc》由会员分享,可在线阅读,更多相关《第四版统计学考试复习要点(共4页).doc(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上1 统计数据类型及其特点:分类数据,只能归于某一类别的非数字型数据,对事物进行分类的结果,数据表现为类别,用文字来表述顺序数据,只能归于某一有序类别的非数字型数据,对事物类别顺序的测度,数据表现为类别,用文字来表述数值型数据,按数字尺度测量的观察值,结果表现为具体的数值,对事物的精确测度。2 概率抽样:按一定的概率以随机原则抽取样本,每个单位被抽中的概率是已知的,或是可以计算出来的,当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率;非概率抽样:抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。3 茎
2、叶图类似横置的直方图,与直方图相比,茎叶图能够给出数据的分布状态,又能给出每一个原始数值,即保留了原始数据的信息。在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。4 众数,不受极端值影响,具有不惟一性。数据分布偏斜程度较大且有明显峰值时应用。中位数,不受极端值影响。数据分布偏斜程度较大时应用。平均数,易受极端值影响,数学性质优良。数据对称分布或接近对称分布时应用P955 当n趋向于正无穷大,X2的极限分布就是正太分布;随着自由度n的增加,t分布的密度函数越来越接近于标准正太分布的密度函数。一般n30时,t分布与标准正太分布就非常接近;如果随机变量X服从t(n)分布,则X2服
3、从F(1,n)的F分布。6 由100个样本构造的总体参数的100个置信区间中,有95%的区间包含了总体参数的真值,则95%的这个值被称为置信水平,即95%置信区间。7 参数估计和假设检验是统计推断的两个组成部分,它们都是利用样本对总体进行某种推断。然而推断的角度不同。参数估计讨论的是利用样本统计量估计总体参数的方法,总体参数在估计前是未知的。而在假设检验中,则是先对的值提供一个假设,然后利用样本信息去检验这个假设是否成立。8 相关系数的性质r 的取值范围是 -1,1r具有对称性。r数值大小与x和y原点及尺度无关仅仅是x与y之间线性关系的一个度量,它不能用于描述非线性关系r虽然是两个变量之间线性
4、关系的一个度量,却不一定意味着x与y一定有因果关系9 判定系数R2 ,回归平方和占总误差平方和的比例。反映回归直线的拟合程度10.预测步骤:确定并分离季节成本;建立预测模型并进行预测;计算最后的预测值11.加权综合指数和加权平均指数的相同只是形式上的,本质上还是有区别的,主要表现在是全面资料还是样本资料。如果是全面资料,可以采用加权综合指数;而计算价格指数时,只能采取选样方法,若采用加权综合指数,其结果就仅仅计算了代表规格品的价格变化。48 一项关于大学生体重状况的研究发现男生的平均体重为60kg,标准差为5kg;女生的平均体重为50kg,标准差为5kg。请回答下面的问题:(1)是男生的体重差
5、异大还是女生的体重差异大?为什么? (2)以磅为单位(1ks22lb),求体重的平均数和标准差。(3)粗略地估计一下,男生中有百分之几的人体重在55kg一65kg之间? (4)粗略地估计一下,女生中有百分之几的人体重在40kg60kg之间?解:(1)女生,因为标准差一样,而均值男生大,所以,离散系数是男生的小,离散程度是男生的小。(2)都是各乘以2.21,男生的平均体重为60kg2.21=132.6磅,标准差为5kg2.21=11.05磅;女生的平均体重为50kg2.21=110.5磅,标准差为5kg2.21=11.05磅。(3)计算标准分数:Z1=-1;Z2=1,根据经验规则,男生大约有68
6、%的人体重在55kg一65kg之间。(4)计算标准分数:Z1=-2;Z2=2,根据经验规则,女生大约有95%的人体重在40kg一60kg之间。411 对10名成年人和10名幼儿的身高进行抽样调查,结果如下:成年组166 169 l72 177 180 170 172 174 168 173幼儿组68 69 68 70 7l 73 72 73 74 75要求:(1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量?为什么? (2)比较分析哪一组的身高差异大 解:(1)均值不相等,用离散系数衡量身高差异。(2)成年组平均172.1标准差4.离散系数0.幼儿组平均71.3标准差2.离散系数0
7、. 幼儿组的身高差异大。715 在一项家电市场调查中随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机。其中拥有该品牌电视机的家庭占23。求总体比例的置信区间,置信水平分别为90%和95%。解:总体比率的估计大样本,总体方差未知,用z统计量样本比率=0.23置信区间:。=0.90,=1.645=(0.1811,0.2789)=0.95,=1.96。=(0.1717,0.2883)8.6 某厂家在广告中声称,该厂生产的汽车轮胎在正常行驶条件下超过目前的平均水平25000公里,对一个由15个轮胎组成的随机样本做了试验,得到样本均值和标准差分别27000公里和5000公里.假定轮胎寿命服从状
8、态分布,问该厂家的广告是否真实?解:11.5 一家物流公司的管理人员想研究货物的运输距离和运输时间的关系,为此,他抽出了公司最近10个卡车运货记录的随机样本,得到运送距离(单位:km)和运送时间(单位:天)的数据如下:运送距离x825 215 1 070 550 480 920 1 350 325 670 1 215运送时间y3.5 1.0 4.0 2.0 1.0 3.0 4.5 1.5 3.0 5.0要求:(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态:(2)计算线性相关系数,说明两个变量之间的关系强度。(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。 解:(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 统计学 考试 复习 要点
限制150内