统计学资料3.ppt
《统计学资料3.ppt》由会员分享,可在线阅读,更多相关《统计学资料3.ppt(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章数据的描述在在对对数数据据进进行行深深入入加加工工之之前前,总应该对数据有所印象。总应该对数据有所印象。可可以以借借助助于于图图形形和和简简单单的的运运算算,来了解数据的一些特征。来了解数据的一些特征。由由于于数数据据是是从从总总体体中中产产生生的的,其其特特征征也也反反映映了了总总体体的的特特征征。对对数数据据的的描描述述也也是是对对其其总总体体的的一个近似的描述。一个近似的描述。3.1 如何用图来表示数据?如何用图来表示数据?3.1.1 定量变量的图表示定量变量的图表示:1.直方图直方图对于一个定量变量,比如某个地区对于一个定量变量,比如某个地区(地区(地区1)测量了)测量了163个
2、高三男生的身个高三男生的身高高(S3height1.txt)。用图形来表示这个数据,使人们能够用图形来表示这个数据,使人们能够看出这个数据的大体分布或看出这个数据的大体分布或“形状形状”的一个办法是画的一个办法是画直方图直方图(histogram)。图图3.1就是利用这个数据由就是利用这个数据由SPSS软件软件所画的直方图。所画的直方图。该图的横坐标是身高区间,这里每一格代表该图的横坐标是身高区间,这里每一格代表5cm的身高范围(格子的身高范围(格子宽度因不同的数据性质或要求而定,这里的格子宽度为宽度因不同的数据性质或要求而定,这里的格子宽度为5cm),而),而纵坐标为各种身高区间的身高的频数
3、。纵坐标为各种身高区间的身高的频数。直方图直方图3.1.1 定量变量的图表示定量变量的图表示:2.盒型图盒型图简单一些的是简单一些的是盒形图盒形图(boxplot,又称,又称箱图、箱线图、盒子图箱图、箱线图、盒子图)。图图3.2的左边一个是根据地区的左边一个是根据地区1高三男高三男生的身高数据所绘的盒形图;其右边生的身高数据所绘的盒形图;其右边的图代表另一个地区(地区的图代表另一个地区(地区2)的高)的高三学生的身高三学生的身高(height.txt,height.sav,第三章例,第三章例.xls)。盒型图盒型图盒子的中间横线是数据的中位数盒子的中间横线是数据的中位数(median),封闭盒
4、子的上下两横线,封闭盒子的上下两横线(边)为上下四分位数(点);按照(边)为上下四分位数(点);按照SPSS的默认选项,如果所有的默认选项,如果所有样本中的数目都在离四分位点样本中的数目都在离四分位点1.5倍盒子长度之内,则线的端点为最倍盒子长度之内,则线的端点为最大和最小值,否则线长就是大和最小值,否则线长就是1.5倍的盒子长度(盒子长度称为四分位倍的盒子长度(盒子长度称为四分位间距),在其外面的度量单独点出间距),在其外面的度量单独点出3.1.1 定量变量的图表示定量变量的图表示:3.茎叶图茎叶图 在直方图和盒形图中,很难恢复数据在直方图和盒形图中,很难恢复数据的原貌。而另一种图:的原貌。
5、而另一种图:茎叶图茎叶图(stem-and-leaf plots)可以恢复数据可以恢复数据以地区以地区1高三男生身高为例(图高三男生身高为例(图3.3),),茎叶图既展示了分布形状又有原始数茎叶图既展示了分布形状又有原始数据。它象一片带有茎的叶子。茎为较据。它象一片带有茎的叶子。茎为较大位数的数字,叶为较小位数的数字。大位数的数字,叶为较小位数的数字。茎叶图茎叶图其中茎叶图中茎的单位为其中茎叶图中茎的单位为10cm,而叶子单位为,而叶子单位为1cm。比如,由于。比如,由于第一行茎为第一行茎为150cm,因此叶子中的九个数字,因此叶子中的九个数字001223344代表九个数代表九个数目目150、
6、150、151、152、152、153、153、154、154cm等。每等。每行左边有一个频数(比如第一行有行左边有一个频数(比如第一行有9个数目,第二行有个数目,第二行有17个等等);个等等);可以看出最长的一行为从可以看出最长的一行为从165cm到到169cm的一段(有的一段(有35个数)。个数)。3.1.1 定量变量的图表示定量变量的图表示:4.散点图散点图 数据会有两个变量,如美国男士和女数据会有两个变量,如美国男士和女士初婚年限数据(士初婚年限数据(marriage.txt)。)。该数据描述了自该数据描述了自1900年到年到1998年男女年男女第一次婚姻延续的时间。第一次婚姻延续的时
7、间。这里年份是一个变量,婚姻延续时间这里年份是一个变量,婚姻延续时间是第二个变量。由于不可能将所有人是第二个变量。由于不可能将所有人的婚姻年限都给出来,所以每年就取的婚姻年限都给出来,所以每年就取了一个中间的值了一个中间的值(中位数中位数)作为代表。作为代表。散点图散点图3.1.2 定性变量的图表示:饼图定性变量的图表示:饼图定性变量(或属性变量,分类变定性变量(或属性变量,分类变量)不能点出直方图、散点图或量)不能点出直方图、散点图或茎叶图,但可以描绘出它们各类茎叶图,但可以描绘出它们各类的比例。的比例。下面用下面用SPSS绘的图绘的图3.5(饼图,(饼图,pie chart)表示了说世界各
8、种主表示了说世界各种主要语言人数的比例要语言人数的比例(language.txt).饼图饼图3.1.2 定性变量的图表示:条形图定性变量的图表示:条形图而用同样数据画的图而用同样数据画的图3.6称为称为条条形图(形图(bar chart)。从每一条可以看出讲各种语言从每一条可以看出讲各种语言的实际人数,而且分别给出了的实际人数,而且分别给出了每个语种中母语和日常使用的每个语种中母语和日常使用的人数(在图中并排放置)。条人数(在图中并排放置)。条形图显示比例不如饼图直观。形图显示比例不如饼图直观。条形图条形图3.2 如何用少量数字来概括数据?如何用少量数字来概括数据?大量的数字既繁琐又不直观;需
9、大量的数字既繁琐又不直观;需要对数据做人们时间和耐心所允要对数据做人们时间和耐心所允许的简化许的简化我们可以用我们可以用“平均平均”,“差距差距”或百分比等来概括大量数字。或百分比等来概括大量数字。由于定性变量主要是计数,比较由于定性变量主要是计数,比较简单,常用的概括就是比例或百简单,常用的概括就是比例或百分比。下面主要介绍关于定量变分比。下面主要介绍关于定量变量的数字描述。量的数字描述。3.2 如何用少量数字来概括数据?如何用少量数字来概括数据?可用少量所谓汇总统计量或可用少量所谓汇总统计量或概括概括统计量统计量(summary statistic)来描来描述定量变量的数据。述定量变量的数
10、据。这些数字是从样本数据得来的,这些数字是从样本数据得来的,因而也是样本的函数,因而也是样本的函数,任何样本的函数,只要不包含总任何样本的函数,只要不包含总体的未知参数,都称为体的未知参数,都称为统计量统计量(statistic)。样本的随机性决定统计量的随机样本的随机性决定统计量的随机性(统计量也是随机变量)性(统计量也是随机变量)3.2 如何用少量数字来概括数据?如何用少量数字来概括数据?概括统计量经常对应于总体概括统计量经常对应于总体的无法观测到的某些参数。的无法观测到的某些参数。这时,统计量可作为这些参这时,统计量可作为这些参数的估计。一些统计量还可数的估计。一些统计量还可以用来检验样
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 资料
限制150内