第二章 数据资料的整理.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第二章 数据资料的整理.ppt》由会员分享,可在线阅读,更多相关《第二章 数据资料的整理.ppt(55页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章第二章 资料的整理资料的整理钟爱华第一节第一节 基本概念和术语基本概念和术语 1.变量与观测值变量与观测值变量(变量(variable):指某种特征,它的表现):指某种特征,它的表现在不同个体间或不同组间存在变异性。在不同个体间或不同组间存在变异性。(如体高、体重、性别等)(如体高、体重、性别等)观测值观测值(observation):指对变量的表现进指对变量的表现进行观察或测量所获得的数值,这些数值有行观察或测量所获得的数值,这些数值有时也称为变数。时也称为变数。2总体和样本总体和样本总体:研究对象的全体,具有共同性质的个总体:研究对象的全体,具有共同性质的个体所组成的集团。体所组成的
2、集团。样本:直接观察测量研究的对象。样本:直接观察测量研究的对象。总体和样本的基本组成单位都是个体,由有总体和样本的基本组成单位都是个体,由有限个个体组成的总体称为有限总体,反之为限个个体组成的总体称为有限总体,反之为无限总体。组成样本的个体少的样本称为小无限总体。组成样本的个体少的样本称为小样本,反之,为大样本。样本,反之,为大样本。在实际研究中还有一类在实际研究中还有一类假想总体假想总体。例如进。例如进行几种饲料的饲养试验,实际上并不存在用这行几种饲料的饲养试验,实际上并不存在用这几种饲料进行饲养的总体,只是假设有这样的几种饲料进行饲养的总体,只是假设有这样的总体存在,把所进行的试验看成是
3、假想总体的总体存在,把所进行的试验看成是假想总体的一个样本;一个样本;样本中所包含的个体数目叫样本中所包含的个体数目叫样本容量样本容量或或大大小小(sample size),样本容量常记为样本容量常记为n。通常把通常把n30的样本叫的样本叫小样本小样本,n 30的样本叫的样本叫大样本大样本。研究的目的是要了解总体,然而能观测到研究的目的是要了解总体,然而能观测到的却是样本,的却是样本,通过样本来推断总体是统计分析通过样本来推断总体是统计分析的基本特点的基本特点。下一张下一张 主主 页页 退退 出出 上一张上一张 3参数与统计量参数与统计量参数:总体的特征量。(总体平均数、总体参数:总体的特征量
4、。(总体平均数、总体方差等)方差等)统计量:样本的特征量。(样本平均数、样统计量:样本的特征量。(样本平均数、样本方差等)本方差等)两者的关系:通过统计量估计推算参数。两者的关系:通过统计量估计推算参数。常用希腊字母表示参数,例如用常用希腊字母表示参数,例如用表示总表示总体平均数,用体平均数,用表示总体标准差;表示总体标准差;常用拉丁字母表示统计量,例如用常用拉丁字母表示统计量,例如用 表表 示样本平均数,用示样本平均数,用S表示样本标准差。表示样本标准差。4随机抽样和随机样本随机抽样和随机样本抽样:从总体中抽取一部分直接进行研究的抽样:从总体中抽取一部分直接进行研究的过程。过程。随机:所有的
5、对象(个体)都有相等的机会随机:所有的对象(个体)都有相等的机会被抽取。被抽取。随机抽样所得的样本称随机样本。随机抽样所得的样本称随机样本。5误差和错误误差和错误误差:测量值与真值之间的差异,不可避免。误差:测量值与真值之间的差异,不可避免。误差误差=测量值测量值真值真值错误:人为的差错,可避免。错误:人为的差错,可避免。6准确性和精确性准确性和精确性准确性是指测量值接近真值的程度。准确性是指测量值接近真值的程度。精确性:变异量重现性指标。同一对象重复精确性:变异量重现性指标。同一对象重复测量,一致性高,精确度高。测量,一致性高,精确度高。精确性是准确性的必要条件。精确性是准确性的必要条件。7
6、效应和互作效应和互作效应是指因素影响的结果,也称效果。效应效应是指因素影响的结果,也称效果。效应分为有效和无效两种,有效又可分正效和负分为有效和无效两种,有效又可分正效和负效两种。效两种。互作是指因素的协同效应,总效应不等于互作是指因素的协同效应,总效应不等于分效应之和即表明具有因素互作,总效如大分效应之和即表明具有因素互作,总效如大于分效应之和为具有正互作效应,总效如小于分效应之和为具有正互作效应,总效如小于分效应之和为具有负互作效应。于分效应之和为具有负互作效应。第二节第二节 资料的分类资料的分类数据的整理:就是把大量复杂的数据进行整数据的整理:就是把大量复杂的数据进行整理归类,使其系统化
7、,便于统计分析,从而理归类,使其系统化,便于统计分析,从而得出正确的科学结论。得出正确的科学结论。一资料的概念一资料的概念定义:资料是指研究对象的信息材料。定义:资料是指研究对象的信息材料。特点:特点:数字性:应以数字形式表示数字性:应以数字形式表示大量性:对大量相象或者同类相象观察所得的数大量性:对大量相象或者同类相象观察所得的数据资料据资料具体性:已经实现的事实具体性:已经实现的事实二资料的类型二资料的类型1 数量性状资料:简称数性资料,可分两类:数量性状资料:简称数性资料,可分两类:连续性变数(连续性变数(continuous variable)或计量资)或计量资料料可以用工具直接测量的
8、量,如身高、体重等。可以用工具直接测量的量,如身高、体重等。特征:连续性变量,不间断量。特征:连续性变量,不间断量。不连续性或间断性变数(不连续性或间断性变数(discontinuous or discrete variable)或计数资料)或计数资料计数得到的数性资料,一般都是自然数,如人数,计数得到的数性资料,一般都是自然数,如人数,天数,种子数。天数,种子数。特征:以整数计量,非连续性变量,间断性量。特征:以整数计量,非连续性变量,间断性量。2 质量性状资料:简称质性资料,指不能或不质量性状资料:简称质性资料,指不能或不易直接测量能观察的性状资料,如颜色、性易直接测量能观察的性状资料,如
9、颜色、性别、状态等描述性特征。常用两种方法数量别、状态等描述性特征。常用两种方法数量化:化:等级评定:等级评定:如人的健康状况分为优,如人的健康状况分为优,良,一般,差;生存状态分为生或死等。良,一般,差;生存状态分为生或死等。统计次数法或归类计数:于一定总样统计次数法或归类计数:于一定总样或样本内,统计其具有某个性状的个体数目或样本内,统计其具有某个性状的个体数目及具有不同性状的个体数目,按类别计其次及具有不同性状的个体数目,按类别计其次数或相对次数。如黄花数或相对次数。如黄花64朵,白花朵,白花56朵。朵。第二节第二节 数据资料的整理数据资料的整理 一、次数分布表一、次数分布表间断性变数资
10、料的整理。连续性变量资料的整理步骤:步骤:(1)数据分组数据分组:(2)计算频率分布计算频率分布3、属性变数资料的整理、属性变数资料的整理也可可用类似次数分布的方法来整理。也可可用类似次数分布的方法来整理。把资料按各种质量性状进行分类把资料按各种质量性状进行分类分类数等于组数分类数等于组数归组:按个体在质量属性上的具体表现。归组:按个体在质量属性上的具体表现。二、次数分布图(统计图)二、次数分布图(统计图)1.方柱形图(histogram)(P书39-40)适用于表示连续性变数的次数分布 2.条形图(Bar Chart)适用于间断性变数和属性变数资料3.饼图(Pie Chart)饼图适用于间断
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二章 数据资料的整理 第二 数据资料 整理
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内