第54讲随机抽样正态分布PPT讲稿.ppt
《第54讲随机抽样正态分布PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《第54讲随机抽样正态分布PPT讲稿.ppt(46页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第54讲随机抽样正态分布1第1页,共46页,编辑于2022年,星期一第七单元计算原理、概率与统计第2页,共46页,编辑于2022年,星期一第第54讲讲随机抽样、正态分布随机抽样、正态分布第3页,共46页,编辑于2022年,星期一1.了了解解分分布布的的意意义义和和作作用用,会会列列频频率率分分布布表表,会会画画频频率率分分布布直直方方图图、频频率率折折线线图、茎叶图,理解它们各自的特点图、茎叶图,理解它们各自的特点.2.理理解解样样本本数数据据标标准准差差的的意意义义和和作作用用,会计算数据标准差会计算数据标准差.3.能能从从样样本本数数据据中中提提取取基基本本的的数数字字特特征征(如平均数、
2、标准差),并做出合理的解释(如平均数、标准差),并做出合理的解释.第4页,共46页,编辑于2022年,星期一4.会会用用样样本本的的频频率率分分布布估估计计总总体体分分布布,会会用用样样本本的的基基本本数数字字特特征征估估计计总总体体的的基基本本数数字字特特征征,理解用样本估计总体的思想理解用样本估计总体的思想.5.会会用用随随机机抽抽样样的的基基本本方方法法和和样样本本估估计计总总体的思想,解决一些简单的实际问题体的思想,解决一些简单的实际问题.6.通通过过实实际际问问题题,借借助助直直观观(如如实实际际问问题题的的直直方方图图),认认识识正正态态分分布布曲曲线线的的特特点点及及曲曲线线所所
3、表示的意义表示的意义.第5页,共46页,编辑于2022年,星期一1.某某初初级级中中学学共共有有30个个班班,其其中中初初一一有有12个个班班,初初二二有有12个个班班,初初三三有有6个个班班.现现从从中中抽抽出出5个个班进行调查,则应在初三班进行调查,则应在初三6个班中抽取个班中抽取 个班个班.12.把数据把数据x1,x2,xn分成若干组分成若干组,已知某数已知某数xi的频数的频数和频率分别为和频率分别为4和和0.125,则则n的值是的值是()CA.16 B.24C.32 D.64第6页,共46页,编辑于2022年,星期一3.数数据据5,10,73,1,3,105,111的的中中位位数数与与
4、极差的差为极差的差为 .-100 因因为为中中位位数数是是10,极极差差是是111-1=110,故故所求的值为所求的值为10-110=-100.4.将一组数据同时减去将一组数据同时减去3.1,得到一组新数据,得到一组新数据,若原数据的平均数、方差分别为、若原数据的平均数、方差分别为、s2,则新数据则新数据的平均数是的平均数是 ,方差是方差是 .-3.1s2第7页,共46页,编辑于2022年,星期一 设设=(x1+x2+xn),则则 =(x1-3.1)+(x2-3.1)+(xn-3.1)=-3.1.s2=(xi-)2=(xi-3.1)-(-3.1)2=(xi-)2=s2.第8页,共46页,编辑于
5、2022年,星期一5.随机变量随机变量的概率密度函数为的概率密度函数为(x)=x(-,+).若若N(0,1),且,且=a+b(a0),则则=()A.B.C.D.A第9页,共46页,编辑于2022年,星期一 因为因为E=0,D=1,E=-5,D=4,而而E=E(a+b)=aE+b,D=D(a+b)=a2D.-5a+b=0 a=4a2=1 b=,所以所以=+,故选,故选A.又又a0,所以所以,解得解得第10页,共46页,编辑于2022年,星期一6.已知正态曲线已知正态曲线,(x)=,当当=时,曲线时,曲线最高点的纵坐标是标准正态曲线最高点的纵最高点的纵坐标是标准正态曲线最高点的纵坐标的坐标的 倍倍
6、.当当=时时,正正态态曲曲线线最最高高点点的的纵纵坐坐标标为为 ,而而标标准准正正态态曲曲线线最最高高点点的的纵纵坐坐标为标为 ,故答案是,故答案是 .第11页,共46页,编辑于2022年,星期一1.数据的基本数字特征数据的基本数字特征(1)平平均均数数:一一组组数数据据的的平平均均数数,记记为为.设设有有n个数据个数据x1,x2,xn,则平均数为,则平均数为 =.(2)中中位位数数:一一组组数数据据按按照照从从小小到到大大或或从从大大到到小小的的顺顺序序进进行行排排列列时时,处处于于中中间间位位置置的的数数.当当这这组组数数据据的的个个数数为为奇奇数数时时,中中位位数数为为中中间间一一个个数
7、数;当当这这组组数数据据的的个个数数为为偶偶数数时时,中中位位数数为为中中间间的的两两个数的平均数个数的平均数.第12页,共46页,编辑于2022年,星期一(3)众数众数:一组数据中出现次数最多的数一组数据中出现次数最多的数.(4)极差极差:一组数据中最大数与最小数的差一组数据中最大数与最小数的差.(5)方方差差:一一组组数数据据中中所所有有数数与与平平均均数数的的差差的的平方和的平均数平方和的平均数,记为记为s2,即即s2=.(6)标准差:方差的算术平方根标准差:方差的算术平方根,记作记作s.2.主要统计图表主要统计图表(1)基基本本统统计计图图表表:象象形形、条条形形、折折线线、扇扇形形统
8、统计图计图.第13页,共46页,编辑于2022年,星期一(2)频率分布直方图的画图步骤:频率分布直方图的画图步骤:()求求极极差差;()决决定定组组距距与与组组数数;()将将数数据据分分组组;()列列频频率率分分布布表表;()画画频频率率分分布布直直方方图图(以频率组距为纵坐标以频率组距为纵坐标).(3)频频率率分分布布折折线线图图:连连接接频频率率分分布布直直方方图图中中各小长方形上端的中点所得的折线各小长方形上端的中点所得的折线.(4)总总体体密密度度曲曲线线:随随着着样样本本容容量量的的增增加加,作作频频率率分分布布折折线线图图时时所所分分的的组组数数增增加加,组组距距减减小小,相相应应
9、的的频频率率折折线线图图会会越越来来越越接接近近于于一一条条光光滑滑曲曲线线,则则称这条光滑曲线为总体密度曲线称这条光滑曲线为总体密度曲线.第14页,共46页,编辑于2022年,星期一(5)茎茎叶叶图图:中中间间的的数数字字表表示示数数据据的的十十位位数数字字,旁旁边边的的数数字字分分别别表表示示两两组组数数据据中中各各个个数数据据的个位数字的个位数字.3.抽样方法抽样方法(1)简简单单随随机机抽抽样样:从从含含有有N个个个个体体的的总总体体中中逐逐个个不不放放回回地地抽抽取取n个个个个体体作作为为样样本本(nN),如如果果每每次次抽抽取取时时总总体体内内的的各各个个个个体体被被抽抽到到的的机
10、机 会会 都都 相相 等等,就就 把把 这这 种种 抽抽 样样 方方 法法 叫叫 做做 .有两种常用方法:有两种常用方法:简单随机抽样简单随机抽样第15页,共46页,编辑于2022年,星期一():就就是是把把总总体体中中的的N个个个个体体编编号号,把把号号码码写写在在号号签签上上,将将号号签签放放在在一一个个容容器器中中,搅搅拌拌均均匀匀后后,每每次次从从中中取取出出一一个个号号签签,连连续续抽抽取取n次次,就得到一个容量为就得到一个容量为n的样本的样本.():利利用用随随机机数数表表、随随机机数数骰骰子或计算机产生的随机数进行抽样子或计算机产生的随机数进行抽样.(2)系统抽样:按下列步骤进行
11、抽样:系统抽样:按下列步骤进行抽样:()先先将将总总体体的的N个个个个体体编编号号;()确确定定分分段段间间隔隔k,对对编编号号进进行行分分段段;()在在第第1段段用用简简单单随随机机抽抽样样确确定定第第一一个个个个体体编编号号l(lk);()按按照照一一定定的的规则抽取样本规则抽取样本.抽签法抽签法随机数表法随机数表法第16页,共46页,编辑于2022年,星期一 (3)分层抽样分层抽样:即即 .4.正态分布正态分布 (1)如果随机变量如果随机变量的概率密度为的概率密度为 ,(x)=.其其中中、分分别别表表示示总总体体的的平平均均数数与与标标准准差差,称称服服 从从 参参 数数 为为、的的正正
12、态态分分布布,记记作作N(,2),函函数数图图象象称称为为正正态态密密度度曲曲线线,简简称称正正态态曲曲线线.在抽样时在抽样时,将总体分成将总体分成互不交叉的层互不交叉的层,然后按照一定的比例然后按照一定的比例,从各层从各层独立地抽出一定数量的个体独立地抽出一定数量的个体,将各层取出的将各层取出的个体合在一起作为样本个体合在一起作为样本(x(-,+)第17页,共46页,编辑于2022年,星期一一一般般的的,如如果果对对于于任任何何实实数数ab,随随机机变变量量满满足足P(ab)=,(x)dx,则则称称的的分分布布为为 .(2)标准正态分布标准正态分布在在正正态态分分布布中中,当当=,=时时,正
13、正态态总总体体称称为为标标准准正正态态总总体体,正正态态分分布布N(0,1),称称为为标标准准正态分布,记作正态分布,记作N(0,1).(3)正态曲线的性质正态曲线的性质()曲线在曲线在x轴的上方,与轴的上方,与x轴不相交;轴不相交;()曲线关于直线曲线关于直线x=对称;对称;正态分布正态分布01第18页,共46页,编辑于2022年,星期一()曲线在)曲线在x=时位于最高点;时位于最高点;()当当x时时,曲曲线线下下降降,并并且且当当曲曲线线向向左左、右右两两边边无无限限延延伸伸时时,以以x轴轴为渐近线向它无限靠近;为渐近线向它无限靠近;()当当一一定定时时,曲曲线线的的形形状状由由确确定定,
14、越越大大,曲曲线线越越“矮矮胖胖”,表表示示总总体体的的分分布布越越分分散散;越越小小,曲曲线线越越“瘦瘦高高”,表表示示总总体体的的分分布布越越集中集中.(4)若若N(,2),则则E=,D=2.第19页,共46页,编辑于2022年,星期一(5)若若XN(,2),则则P(-X+i)=0.6826,P(-2X+2)=0.9544,P(-3X+3)=0.9974.(6)通通常常认认为为服服从从正正态态分分布布N(,2)的的随随机机变变量量X只取只取 ,并简称之为并简称之为3原则原则.(-3,+3)之间的值之间的值1111第20页,共46页,编辑于2022年,星期一题型一题型一 抽样方法抽样方法例例
15、1 在在我我国国东东南南沿沿海海有有60个个人人均均GDP在在3万万元元以以上上的的城城市市,其其中中人人均均GDP在在34万万元元之之间间的的有有36个个,在在45万万元元之之间间的的有有18个个,在在5万万元元以以上上的的有有6个个.国国家家环环保保总总局局欲欲用用分分层层抽抽样样从从中中随随机机抽抽取取部部分分城城市市进进行行环环境境调调查查,若若抽抽取取的的人人均均GDP在在45万万元元之之间间的的城城市市个个数数为为3,则则抽抽取取的的人人均均GDP在在34万元之间的城市个数为万元之间的城市个数为.第21页,共46页,编辑于2022年,星期一 根根据据分分层层抽抽样样的的特特征征,在
16、在各各层层抽抽取取的的比比例例是是相相同同的的,故故可可先先依依据据已已知知求求出出这这个个比比例例,再求解再求解.抽抽取取的的人人均均GDP在在45万万元元之之间间的的城城市市的的比比例例为为 ,故故抽抽取取的的人人均均GDP在在34万万元元之之间间的的城城市市的的比比例例也也是是 ,则则抽抽取取的的城城市市个个数数为为36 .分层抽样在各层抽取样本的比例是相等的分层抽样在各层抽取样本的比例是相等的,这是解决分层抽样计算问题的主要依据这是解决分层抽样计算问题的主要依据.第22页,共46页,编辑于2022年,星期一题型二题型二 正态分布正态分布例例2 某某 批批 材材 料料 的的 强强 度度
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 54 随机 抽样 正态分布 PPT 讲稿
限制150内