直方图和正态分布精.ppt
直方图和正态分布第1页,本讲稿共14页第一节 直方图v直方图(又称方柱形图、矩形图,Histogam)对于计量资料,可根据其次数分布表绘出直方图以表示资料的分布情况。第2页,本讲稿共14页 (产量,g/行)140行水稻产量次数分布直方图行水稻产量次数分布直方图第3页,本讲稿共14页 (产量,g/行)140行水稻产量次数分布多边形图第4页,本讲稿共14页 直方图的绘制直方图的绘制步骤:(1)数据排序;(2)求全距,极差R=Max-Min;(3)确定组数和组距;组数的确定根据经验公式:组数=1+3.3LogN(N为数据的个数),组距=全距/组数;第5页,本讲稿共14页 样样本容量与本容量与组组数数 样样本容量本容量 组组 数数303060 560 58 86060100 8100 81010100100200 10200 101212200200500 12500 121818500500以上以上 18183030第6页,本讲稿共14页(4)确定组限和组中值。各组的最大值和最小值称为组限,每一组的中)确定组限和组中值。各组的最大值和最小值称为组限,每一组的中点值为组中值。点值为组中值。组中值组中值=(组下限(组下限+组上限)组上限)/2 在资料分组时为了避免第一组中的观测值过多,第一组的组中值以接近在资料分组时为了避免第一组中的观测值过多,第一组的组中值以接近或等于资料中的最小观测值为好。或等于资料中的最小观测值为好。为了恰好使等于前一组上限和后一组下限的数据能确切归组,确为了恰好使等于前一组上限和后一组下限的数据能确切归组,确定将其归入后一组,即约定定将其归入后一组,即约定“上限不在内上限不在内”。(5)归组、作次数分布表)归组、作次数分布表第7页,本讲稿共14页第二节 正态分布v正态分布是一种很重要的连续型随机变量连续型随机变量的概率分布。在生物科学研究中,有许多变量是服从或近似服从正态分布的,如水稻产量、小麦株高、玉米百粒重等。第8页,本讲稿共14页一、正态分布的定义与主要特征(一)正态分布的定义 若连续型随机变量x的概率分布密度函数为其中,为平均数,2为方差,则称随机变量x服从正态分布(normal distribution),记为xN(,2)第9页,本讲稿共14页(二)正态分布的特征 正态分布密度曲线正态分布密度曲线 第10页,本讲稿共14页正态分布的重要特征:1、正态分布密度曲线是单峰、对称的“悬钟”形曲线,对称轴为x=;2、概率分布密度函数f(x)在x=处达到极大。3、概率分布密度函数f(x)是非负函数,以x轴为渐近线,分布从-至+;4、分布密度曲线在x=处各有一个拐点,即曲线在(-,-)和(+,+)区间内是下凸的,在-,+区间内是上凸的;第11页,本讲稿共14页 5、正态分布有两个参数,平均数和标准差。是位置参数。当恒定时,愈大,则曲线沿x轴愈向右移动;反之,愈小,曲线沿x轴愈向左移动。是变异度参数。当恒定时,愈大,表示x的取值愈分散,曲线愈“胖”;愈小,x的取值愈集中在附近,曲线愈“瘦”。相同而不同的三个正态分布相同而不同的三个正态分布 第12页,本讲稿共14页6、分布密度曲线与横轴所夹的面积为1,即:第13页,本讲稿共14页二、标准正态分布=0,2=1的正态分布称为标准正态分布(standard normal distribution)。随机变量u服从标准正态分布,记作uN(0,1),u称为标准正态变量或标准正态离差(standard normal deviate)。第14页,本讲稿共14页