《描述性统计》PPT课件.pptx
《《描述性统计》PPT课件.pptx》由会员分享,可在线阅读,更多相关《《描述性统计》PPT课件.pptx(51页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4天 津 科 技 大 学 数 学 系 谢中华MATLAB从零到进阶从零到进阶描述性统计描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4 案例背景案例背景 案例描述案例描述 描述性统计量描述性统计量 统计图统计图 频数和频率分布表频数和频率分布表主要内容:主要内容:描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4第一节第一节 案例背景案例背景描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4 从一封情书
2、开始说起从一封情书开始说起亲爱的莲:亲爱的莲:我们的感情,在组织的亲切关怀下、在领导的亲自过问我们的感情,在组织的亲切关怀下、在领导的亲自过问下,一年来正沿着健康的道路蓬勃发展。这主要表现在:下,一年来正沿着健康的道路蓬勃发展。这主要表现在:(一)我们共通信(一)我们共通信121121封,平均封,平均3.013.01天一封。其中你给我天一封。其中你给我的信的信5151封,占封,占42.1%42.1%;我给你的信;我给你的信7070封,占封,占57.9%57.9%。每封信平。每封信平均均15021502字,最长的达字,最长的达52155215字,最短的也有字,最短的也有624624字。字。(二)
3、约会共(二)约会共9898次,平均次,平均3.73.7天一次。其中你主动约我天一次。其中你主动约我3838次,占次,占38.7%38.7%;我主动约你;我主动约你6060次,占次,占61.3%61.3%。每次约会平均。每次约会平均3.83.8小时小时,最长达最长达6.46.4小时,最短的也有小时,最短的也有1.61.6小时。小时。(三)我到你家看望你父母(三)我到你家看望你父母3838次,平均每次,平均每 9.49.4天一次;天一次;你到我家看望我父母你到我家看望我父母3636次,平均次,平均1010天一次。以上充分证明一天一次。以上充分证明一年来的交往我们已形成了恋爱的共识,我们爱情的主流是
4、互年来的交往我们已形成了恋爱的共识,我们爱情的主流是互相了解、互相关心、互相帮助,是平等互利的。相了解、互相关心、互相帮助,是平等互利的。描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.当然,任何事物都是一分为二的,缺点的存在是不可避免当然,任何事物都是一分为二的,缺点的存在是不可避免的。我们二人虽然都是积极的,但从以上的数据看,发展还不的。我们二人虽然都是积极的,但从以上的数据看,发展还不太平衡,积极性还存在一定的差距,这是前进中的缺点。太平衡,积极性还存在一定的差距,这是前进中的缺点。相信在新的一年里,我们一定会发扬成绩、克服缺点、携手前相信在新的一年里,我们一定会发
5、扬成绩、克服缺点、携手前进,开创我们爱情的新局面。因此,我提出三点意见供你参考:进,开创我们爱情的新局面。因此,我提出三点意见供你参考:(一)要围绕一个(一)要围绕一个“爱爱”字,字,(二)要狠抓一个(二)要狠抓一个“亲亲”字,字,(三)要落实一个(三)要落实一个“合合”字。字。让我们弘扬团结拼搏的精神,共同振兴我们的爱情,争取让我们弘扬团结拼搏的精神,共同振兴我们的爱情,争取达到一个新高度,登上一个新台阶。本着达到一个新高度,登上一个新台阶。本着“我们的婚事我们办,我们的婚事我们办,办好婚事为我们办好婚事为我们”的精神,共创辉煌。的精神,共创辉煌。你的憨哥你的憨哥描述性统计描述性统计 谢中华
6、谢中华,MATLAB从零到进阶从零到进阶.2023/2/4 统计学家当奶爸统计学家当奶爸 有个从未管过自己孩子的统计学家,在一个星期六下午有个从未管过自己孩子的统计学家,在一个星期六下午妻子要外出买东西时,勉强答应照看一下四个年幼好动的妻子要外出买东西时,勉强答应照看一下四个年幼好动的孩子。当妻子回家时,他交给妻子一张纸条,上面写着:孩子。当妻子回家时,他交给妻子一张纸条,上面写着:“擦眼泪擦眼泪1111次;系鞋带次;系鞋带1515次;给每个孩子吹玩具气球各次;给每个孩子吹玩具气球各5 5次;次;每个气球的平均寿命每个气球的平均寿命1010秒钟;警告孩子不要横穿马路秒钟;警告孩子不要横穿马路2
7、626次;次;孩子坚持要穿马路孩子坚持要穿马路2626次;我还要再过这样的星期六次;我还要再过这样的星期六0 0次。次。”描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4第二节第二节 案例描述案例描述描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4【例例17.2-1】现有现有某两个班的某门课程的考试成绩,某两个班的某门课程的考试成绩,如如下下表所表所示。试对成绩数据进行统计分析(计算描述性统计量,绘制示。试对成绩数据进行统计分析(计算描述性统计量,绘制统计图),分析成绩是否服从正态分布。统计图),分析成绩是否服从正态分
8、布。序号序号学号学号姓名姓名成绩成绩序号序号学号学号姓名姓名成绩成绩序号序号学号学号姓名姓名成绩成绩16010101陈亮63186010118肖君扬80356010211尹浩天9026010102李旭73196010119徐欣露69366010212曾松涛8036010103刘鹏飞*206010120杨姗姗81376010213张小兵8046010104任时迁82216010121姚丽娜49386010214奚才7356010105苏宏宇80226010122张萌91396010215郭以纯7366010106王海涛70236010123张婷婷76406010216黄惠雯7276010107王
9、洋88246010124褚子贞76416010217刘丽7986010108徐靖磊80256010201曹不凡72426010218聂茜茜8096010109阎世杰92266010202付程远89436010219苏红妹81106010110姚前树84276010203李林森77446010220唐芸82116010111张金铭95286010204李强64456010221王飞燕73126010112朱星宇82296010205林志远94466010222徐思漫83136010113韩宏洁75306010206盛世74476010223许佳慧87146010114刘菲71316010207宋
10、天清98486010224杨雨婷*156010115苗艳红70326010208王润泽89496010225曾亦可90166010116宋佳艺80336010209吴鹏辉49506010226张阳85176010117王峥瑶78346010210徐佳80516010227张梓涵92描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4第三节第三节 描述性统计量描述性统计量描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4一、均值一、均值 定义:定义:一首打油诗:张村有个张千万,隔壁一首打油诗:张村有个张千万,隔壁9个穷光蛋,平
11、均个穷光蛋,平均起来算一算,人人都是张百万。起来算一算,人人都是张百万。报纸上报道有个人在一条河中淹死了,这条河的平均深报纸上报道有个人在一条河中淹死了,这条河的平均深度仅度仅10cm,你信吗?,你信吗?来自国家统计局天津调查总队最新的数据显示,今年上来自国家统计局天津调查总队最新的数据显示,今年上半年天津城市居民人均可支配收入半年天津城市居民人均可支配收入12861元,北京元,北京17068元、上海元、上海18382元、重庆元、重庆11134元。元。描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4二、方差和标准差二、方差和标准差 方差:方差:标准差:标准
12、差:最常用最常用三、最大值和最小值三、最大值和最小值 最大值:最大值:最小值:最小值:描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4四、极差四、极差 极差:极差:五、中位数五、中位数六、六、p分位数分位数七、众数:七、众数:样本数据中出现最频繁的数样本数据中出现最频繁的数描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4八、变异系数八、变异系数九、九、k k阶原点矩阶原点矩十、十、k k阶中心矩阶中心矩十一、偏度十一、偏度十二、峰度十二、峰度描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023
13、/2/4十三、第一四分位数:十三、第一四分位数:样本数据中小于等于此数的数据占整个数据集的样本数据中小于等于此数的数据占整个数据集的25%十四、第三四分位数:十四、第三四分位数:样本数据中小于等于此数的数据占整个数据集的样本数据中小于等于此数的数据占整个数据集的75%十五、四分位间距:十五、四分位间距:最稳健最稳健描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4【例例17.3-1】根据根据表表17.2-1中数据中数据,计算描述性统计,计算描述性统计量量。%求均值求均值score=xlsread(examp7_1_1.xls,Sheet1,G2:G52);s
14、core=score(score 0);score_mean=mean(score)%求方差和标准差求方差和标准差SS1=var(score)%计算计算(17.3-1)式的方差式的方差SS1=var(score,0)%也是计算也是计算(17.3-1)式的方差式的方差SS2=var(score,1)%计算计算(17.3-2)式的方差式的方差s1=std(score)%计算计算(17.3-3)式的标准差式的标准差s1=std(score,0)%也是计算也是计算(17.3-3)式的标准差式的标准差s2=std(score,1)%计算计算(17.3-4)式的标准差式的标准差描述性统计描述性统计 谢中华
15、谢中华,MATLAB从零到进阶从零到进阶.%求最大值和最小值求最大值和最小值score_max=max(score)score_min=min(score)%求极差求极差score_range=range(score)%求中位数求中位数score_median=median(score)%求分位数求分位数score_m1=quantile(score,0.25,0.5,0.75)score_m2=prctile(score,25,50,75)%求众数求众数score_mode=mode(score)描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.%求变异系数求变异系数sc
16、ore_cvar=std(score)/mean(score)%求原点矩求原点矩A2=mean(score.2)%求中心矩求中心矩B1=moment(score,1)B2=moment(score,2)%求偏度求偏度score_skewness=skewness(score)%求峰度求峰度score_kurtosis=kurtosis(score)描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4第四节第四节 统计图统计图描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.一、一、样本的频数分布与频率分布样本的频数分布与频率分布将样本观测值
17、将样本观测值从小到大排列得:从小到大排列得:,列出样本频率分布表如下,列出样本频率分布表如下观测值观测值x(1)x(2)x(l)总计总计频数频数n1n2nln频率频率1描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.称称函数函数为样本分布函数(或为样本分布函数(或经验分布函数经验分布函数)。它满足分)。它满足分布函数所具有的性质。布函数所具有的性质。二、样本经验分布函数图二、样本经验分布函数图1.定义定义描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2.格里汶科定理格里汶科定理设总体设总体X 的的分布函数为分布函数为F(x),样本,样本此定理表明:
18、当样本容量此定理表明:当样本容量n n相当大时,经验分布函相当大时,经验分布函数是总体分布函数的一个良好的近似。数是总体分布函数的一个良好的近似。的经验的经验分布函数为分布函数为Fn(x),则有,则有描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.3.MATLAB实现实现cdfplot和和ecdf函数函数函数函数调用方式:调用方式:cdfplot(X)f,x=ecdf(y)功能:功能:绘制经验分布函数图绘制经验分布函数图描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4【例例17.4-1】根据根据表表17.2-1中数据中数据,绘制经验分
19、布函数图。,绘制经验分布函数图。%经验分布函数图经验分布函数图score=xlsread(examp7_1_1.xls,Sheet1,G2:G52);score=score(score 0);figure;h,stats=cdfplot(score)set(h,color,k,LineWidth,2);x=40:0.5:100;y=normcdf(x,stats.mean,stats.std);hold onplot(x,y,:k,LineWidth,2);legend(经验分布函数经验分布函数,理论正态分布理论正态分布,Location,NorthWest);描述性统计描述性统计 谢中华谢中
20、华,MATLAB从零到进阶从零到进阶.(1)(1)找出样本观测值的最小值找出样本观测值的最小值x(1)和最大值和最大值x(l);(2)(2)取取ax(1)和和bx(l),将区间,将区间a,b分成分成k个子区间;个子区间;(3)(3)计算样本观测值落入各子区间内的频数计算样本观测值落入各子区间内的频数ni 和频率和频率 ;(4)(4)在在x 轴上以各子区间为底边,以轴上以各子区间为底边,以ni(或(或 )为高)为高 作小矩形即得频数(或频率)直方图。作小矩形即得频数(或频率)直方图。三、频数与频率直方图三、频数与频率直方图1.1.步骤步骤描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶
21、从零到进阶.2.MATLAB实现实现hist、ecdf和和ecdfhist函数函数函数函数调用方式:调用方式:%频数直方图频数直方图hist(Y,nbins)%频率直方图频率直方图f,x=ecdf(y)ecdfhist(f,x)功能:功能:hist函数,用来绘制频数直方图函数,用来绘制频数直方图 ecdf和和ecdfhist函数,用来绘制频率直方图函数,用来绘制频率直方图描述性统计描述性统计 谢中华谢中华,MATLAB从零到进阶从零到进阶.2023/2/4【例例17.4-2】根据根据表表17.2-1中数据中数据,绘制频率直方图。,绘制频率直方图。%频数(率)直方图频数(率)直方图figure;
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 描述性统计 描述 统计 PPT 课件
限制150内