用样本的频率分布估计总体分布精.ppt
用样本的频率分布估计总体分布第1页,本讲稿共14页1、求极差、求极差(即一组数据中最大值与最小值的差即一组数据中最大值与最小值的差)知道这组数据的变动范围知道这组数据的变动范围4.3-0.2=4.12、决定组距与组数(将数据分组)、决定组距与组数(将数据分组)3、将数据分组将数据分组(8.2取整取整,分为分为9组组)复习:画频率分布直方图的步骤复习:画频率分布直方图的步骤4、列出、列出频率分布表;频率分布表;5、画出、画出频率分布直方图。频率分布直方图。组距组距:指每个小组的两个端点的距离指每个小组的两个端点的距离组数组数:将数据分组,当数据在将数据分组,当数据在100个以内时,个以内时,按数据多少常分按数据多少常分5-12组。组。第2页,本讲稿共14页频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5连接频率分布直方图中各连接频率分布直方图中各小长方形上端的中点小长方形上端的中点,得到得到频率分布折线图频率分布折线图第3页,本讲稿共14页利用样本频率分布对总体分布进行相应估计利用样本频率分布对总体分布进行相应估计(3)当样本容量无限增大,组距无限缩小,)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光那么频率分布直方图就会无限接近于一条光滑曲线滑曲线总体密度曲线总体密度曲线。(2)样本容量越大,这种估计越精确。)样本容量越大,这种估计越精确。(1)如如果果样样本本容容量量增增大大,其其频频率率分分布布直直方方图图的的情况会有什么变化?情况会有什么变化?第4页,本讲稿共14页 总体分布的估计总体分布的估计频率频率组距组距月均用水量月均用水量(mm)ab 当样本容量无限增大,分组的组距无限缩小,那么频率分当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近一条光滑曲线布直方图就会无限接近一条光滑曲线总体密度曲线总体密度曲线总体在区间总体在区间 内取值的概率内取值的概率S第5页,本讲稿共14页总体密度曲线总体密度曲线频率频率组距组距月均用水月均用水量量/tab (图中阴影部分的面积,表示总体在某(图中阴影部分的面积,表示总体在某个区间个区间(a,b)内取值的百分比)。内取值的百分比)。第6页,本讲稿共14页 用用样样本本分分布布直直方方图图去去估估计计相相应应的的总总体体分分布布时时,一一般般样样本本容容量量越越大大,频频率率分分布布折折线线图图就就会会无无限限接接近近总总体体密密度度曲曲线线,就就越越精精确确地地反反映映了了总总体体的的分分布布规规律律,即即越越精精确确地地反反映映了总体在各个范围内取值百分比。了总体在各个范围内取值百分比。总总体体密密度度曲曲线线反反映映了了总总体体在在各各个个范范围围内内取取值值的的百百分分比比,精精确确地地反反映映了了总总体体的的分分布布规规律律。是是研研究总体分布的工具究总体分布的工具.总体密度曲线总体密度曲线第7页,本讲稿共14页茎叶图茎叶图情境:情境:某赛季甲、乙两名篮球运动员每场比赛得分的某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:原始记录如下:(1)甲运动员得分:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39(2)乙运动员得分乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39问题:如何有条理地列出这些数据,分析该如何有条理地列出这些数据,分析该运动员的整体水平及发挥的稳定程度?运动员的整体水平及发挥的稳定程度?第8页,本讲稿共14页茎叶图茎叶图甲甲乙乙0123452 55 41 6 1 6 7 94 9 084 6 336 83 8 9 1第9页,本讲稿共14页 一般地:当数据是一位和两位有效数字时,一般地:当数据是一位和两位有效数字时,用中间的数字表示十位数,即第一个有效数字,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎上长出来的叶子,因此通常把这样的图叫做茎叶图。茎按从小到大的顺序从上向下列出,共叶图。茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或茎的叶一般按从大到小(或从小到大从小到大)的顺序)的顺序同行列出。同行列出。1 1茎叶图的概念:茎叶图的概念:第10页,本讲稿共14页2 2茎叶图的特征:茎叶图的特征:)用茎叶图表示数据有两个优点:一是从统计图上)用茎叶图表示数据有两个优点:一是从统计图上没有原没有原始数据信息的损失始数据信息的损失,所有数据信息都可以从茎叶图中得到;,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据二是茎叶图中的数据可以随时记录,随时添加可以随时记录,随时添加,方便记录,方便记录与表示;与表示;()茎叶图只便于表示两位(或一位)有效数字的数据,()茎叶图只便于表示两位(或一位)有效数字的数据,对位数多的数据不太容易操作;而且茎叶图只方便记录两组对位数多的数据不太容易操作;而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰;记录那么直观,清晰;()茎叶图()茎叶图对重复出现的数据要重复记录对重复出现的数据要重复记录,不能遗漏,不能遗漏第11页,本讲稿共14页小结:一、总体密度曲线小结:一、总体密度曲线1.当样本容量无限增大,组距无限缩小,那么频率分布直方当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线图就会无限接近于一条光滑曲线总体密度曲线总体密度曲线。2.用样本分布直方图去估计相应的总体分布时,一般样用样本分布直方图去估计相应的总体分布时,一般样本容量越大,本容量越大,频率分布折线图频率分布折线图就会无限接近就会无限接近总体密总体密度曲线度曲线,就越精确地反映了总体的分布规律,即越,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。精确地反映了总体在各个范围内取值百分比。第12页,本讲稿共14页二、茎叶图茎叶图茎叶图,它的思路是将数组的数按位数进茎叶图,它的思路是将数组的数按位数进行比较,将数大小基本不变或变化不大的行比较,将数大小基本不变或变化不大的位作为一个主杆(茎),将变化大的位的位作为一个主杆(茎),将变化大的位的数作为分枝(叶),列在主杆的后面,这数作为分枝(叶),列在主杆的后面,这样就可以清楚地看到每个主杆后面的几个样就可以清楚地看到每个主杆后面的几个数,每个数具体是多少。数,每个数具体是多少。茎叶图在质量管理上用途与直方图差不多,但它茎叶图在质量管理上用途与直方图差不多,但它通常是作为更细致的分析阶段使用。通常是作为更细致的分析阶段使用。第13页,本讲稿共14页P81 第1题(1)(2)作业:作业:第14页,本讲稿共14页