《统计和统计数据的收集.ppt》由会员分享,可在线阅读,更多相关《统计和统计数据的收集.ppt(29页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、一、一、什么是统计什么是统计?(一)统计包含(一)统计包含三种涵义,两重关系三种涵义,两重关系1.统计工作:统计工作:对统计数据进行搜集、整理和分析的过对统计数据进行搜集、整理和分析的过程程。2.统计数据:统计工作所产生的成果,用以描述我们所统计数据:统计工作所产生的成果,用以描述我们所研究现象的属性和特征研究现象的属性和特征。如统计图表,统计分析报告如统计图表,统计分析报告等。等。3.统计学:一门研究总体数量特征的方法论科学。统计学:一门研究总体数量特征的方法论科学。统计工作统计工作统计资料统计资料统统计计学学工作与工作成果关系工作与工作成果关系实践与理实践与理论关系论关系(二)(二)四个重
2、要的术语四个重要的术语所所研研究究的的具具有有某某些些相相同同性性质质的的全全部部单单位位或或事件的整体。事件的整体。总体总体无限总体:含无限多个单位。无限总体:含无限多个单位。无限总体:含无限多个单位。无限总体:含无限多个单位。范围范围范围范围 有限总体:含有限个单位。有限总体:含有限个单位。有限总体:含有限个单位。有限总体:含有限个单位。样样本本:亦亦可可称称为为抽抽样样总总体体,是是从从总总体体中中抽抽取取部部分分单单位所组成的整体,用以分析总体。位所组成的整体,用以分析总体。参参数数:亦亦可可称称为为总总体体指指标标,是是综综合合测测量量的的整整个个总总体体的某个数量特征。的某个数量特
3、征。统统计计量量:亦亦可可称称为为样样本本指指标标,是是根根据据样样本本数数据据计计算算的的综综合合测测量量值值,可可用用以以反反映映或或估估计计、推推断断总总体体的的某某个数量特征。个数量特征。(三)统计学的内容(三)统计学的内容1.描述统计描述统计关于搜集、展示一批数据,并反映这关于搜集、展示一批数据,并反映这批数据特征的各种方法,其目的是为批数据特征的各种方法,其目的是为了正确地反映总体的数量特点。了正确地反映总体的数量特点。2.推断统计推断统计根据样本统计量估计和推断总体参根据样本统计量估计和推断总体参数的技术和方法。数的技术和方法。描述统计是推断统计的前提,推描述统计是推断统计的前提
4、,推断统计是描述统计的发展。断统计是描述统计的发展。二、数据二、数据(一)(一)为何需要数据为何需要数据?统计学要研究各种随机变量,通过对这些随机变量的统计学要研究各种随机变量,通过对这些随机变量的观察所获取的数据包含了我们所需的信息,这些信息观察所获取的数据包含了我们所需的信息,这些信息能有助于我们在许多场合中做出更为正确的决策。能有助于我们在许多场合中做出更为正确的决策。例如:例如:市场研究者需要对产品的特性进行评估,以区分不市场研究者需要对产品的特性进行评估,以区分不同的产品。同的产品。药品制造厂商需要判别一种新药是否比现在正使用药品制造厂商需要判别一种新药是否比现在正使用着的药更有效。
5、着的药更有效。审计审计人人员员想通想通过查过查看某家公司的看某家公司的财务报财务报表,以确表,以确认认这这家公司是否是依据了通行的会家公司是否是依据了通行的会计计准准则则做做报报表。表。财务财务金融分析人金融分析人员员想判断在未来的五年中,哪些行想判断在未来的五年中,哪些行业业中的哪些公司最具有成中的哪些公司最具有成长长性。性。经济经济学家想估学家想估计计我国国内生我国国内生产总值产总值今年的增今年的增长长速度。速度。生产部门的经理按惯例要检查生产过程,以检验其生产部门的经理按惯例要检查生产过程,以检验其生产的产品质量是否符合公司的标准。生产的产品质量是否符合公司的标准。(二)(二)数据数据分
6、类的原则分类的原则互斥原则:互斥原则:每一个数据只能划归到某一类型中,而每一个数据只能划归到某一类型中,而不能既是这一类,又是那一类不能既是这一类,又是那一类。穷穷尽尽原原则则:所所有有被被观观察察的的数数据据都都可可被被归归属属到到适适当当的的类型中,没有一个类型中,没有一个数据数据无从归属。无从归属。(三)(三)数据数据的类型的类型1.定性数据和定量数据定性数据和定量数据定性数据:定性数据:用文字描述的用文字描述的 。如如在在本本章章的的“统统计计引引例例”中中消消费费者者对对永永美美所所提提供供服服务务的的总总体体评评价等都属于文字描述的定性数据价等都属于文字描述的定性数据。定量数据:定
7、量数据:用数字描述的用数字描述的。如如企企业业的的净资产额净资产额、净净利利润额润额等等。2.离散型数据和连续型数据离散型数据和连续型数据变量变量若我们所研究现象的属性和特征的具体表现在若我们所研究现象的属性和特征的具体表现在不同时间、不同空间或不同单位之间可取不同不同时间、不同空间或不同单位之间可取不同的数值,则可称这种数据为变量。的数值,则可称这种数据为变量。类型类型离散型变量:数据只能取整数。离散型变量:数据只能取整数。如一家公司的如一家公司的职职工人数工人数。连续连续型型变变量的数据量的数据可以取介于两个可以取介于两个数数值值之之间间的任意的任意数数值值。如如销销售售额额、经济经济增增
8、长长率等。率等。3.数据的数据的四个等级四个等级 定类数据定类数据例如,对人口按性别划分为男性和女性例如,对人口按性别划分为男性和女性两类两类。也称定名数据,这种数据只对事物的某也称定名数据,这种数据只对事物的某 种属性和类别进行具体的定性描述。种属性和类别进行具体的定性描述。能能够够进进行行的的唯唯一一运运算算是是计计数数,即即计计算算每每一一个类型的频数或频率(即比重)。个类型的频数或频率(即比重)。定类数据定类数据例如,对企业按经营管理的水平和取得例如,对企业按经营管理的水平和取得的效益划分为一级企业、二级企业等。的效益划分为一级企业、二级企业等。定序定序数据,数据,也称序列也称序列数据
9、,是数据,是对对事物所具事物所具有的属性顺序进行描述。有的属性顺序进行描述。定距定距数据数据如如1010、2020等。它不仅有明确的高低等。它不仅有明确的高低之分,而且可以计算差距,如之分,而且可以计算差距,如2020比比1010高高1010,比,比55高高1515等。等。也称间距也称间距数据数据,是比定序,是比定序数据的描述功能数据的描述功能更好更好一些的定量一些的定量数据数据。定定距距测测定定的的量量可可以以进进行行加加或或减减的的运运算算,但但却不能进行乘或除的运算。却不能进行乘或除的运算。定比定比数据数据如如产产量量、产产值值、固固定定资资产产投投资资额额、居居民民货币收入和支出、银行
10、存款余额等。货币收入和支出、银行存款余额等。也称比率也称比率数据数据,是比定距,是比定距数据数据更高一级的更高一级的定量定量数据数据。它不仅可以进行加减运算,而。它不仅可以进行加减运算,而且还可以作乘除运算。且还可以作乘除运算。测定层次测定层次特征特征运算功能运算功能举例举例1.定类测定定类测定2.定序测定定序测定3.定距测定定距测定4.定比测定定比测定分类分类分类;排序分类;排序分类;排序;分类;排序;有基本测量单位有基本测量单位分类;排序;分类;排序;有基本测量单位;有基本测量单位;有绝对零点有绝对零点计数计数计数;排序计数;排序计数;排序;计数;排序;加减加减计数;排序;计数;排序;加减
11、加减乘除乘除产业分类产业分类企业等级企业等级温度温度商品销售商品销售额额统计数据四个层次的概括统计数据四个层次的概括4.截面数据和时间序列数据截面数据和时间序列数据 截截面面数数据据:所所搜搜集集的的不不同同单单位位在在同同一一时时间间的的数数据据。例例如,所有上市公司公布的如,所有上市公司公布的20042004年年度的净利润。年年度的净利润。时时间间序序列列数数据据:所所搜搜集集的的同同一一总总体体或或单单位位在在不不同同时时间间的数据。的数据。某某公公司司公公布布的的19931993年年到到20042004年年的的年年度度净净利利润润就就是是时时间间序列数据。序列数据。5.原始数据原始数据
12、和和次次级级数据数据 原原始始数数据据:指指直直接接从从各各个个调调查查单单位位搜搜集集的的、尚尚未未经经过过整理的整理的统计统计数据数据资资料,也称一手数据。料,也称一手数据。次次级级数数据据:指指那那些些已已经经加加工工整整理理过过的的,往往往往是是公公开开发发表表的数据的数据,也称二手数据。也称二手数据。如从如从报报纸纸杂杂志、志、统计统计年年鉴鉴、会、会计报计报表上取得的数据表上取得的数据 。(四)(四)数据数据的来源的来源1.1.从政府机构、各种行业组织、公司和企业所公布的从政府机构、各种行业组织、公司和企业所公布的数据中获取。数据中获取。就是把政府机构、各种就是把政府机构、各种组织
13、组织和公司所公布的数据作和公司所公布的数据作为为来源,来源,这这种数据往往是种数据往往是次次级级数据数据。2.2.设计一次试验以获取必要的数据。设计一次试验以获取必要的数据。例如,在检验洗衣机洗净程度的研究中,研究人员通例如,在检验洗衣机洗净程度的研究中,研究人员通过实际洗涤脏衣服,来研究哪种牌子的洗衣机效果最过实际洗涤脏衣服,来研究哪种牌子的洗衣机效果最佳。佳。3 3.从从观观察研究中察研究中获获取。研究人取。研究人员员通常是在自然状通常是在自然状态态下下,进进行直接的行直接的观观察。察。例例如如,观观察察路路口口的的交交通通流流量量、观观察察顾顾客客在在商商场场的的购购买买行为和观察流水线
14、上的产品质量等。行为和观察流水线上的产品质量等。4.4.进行一次调查。进行一次调查。它对所调查人们的行为不进行任它对所调查人们的行为不进行任何控制,仅提出诸如出生年月、爱好、消费习惯、对何控制,仅提出诸如出生年月、爱好、消费习惯、对某一事件的看法和其他特征方面的问题,然后对他们某一事件的看法和其他特征方面的问题,然后对他们回答的结果进行整理、编码、列表和分析。回答的结果进行整理、编码、列表和分析。调查方调查方案的主案的主要内容要内容确定调查确定调查目的目的确定调查确定调查对象对象和和调查单位调查单位拟订调查拟订调查提纲提纲确定调查确定调查时间时间编制调查的编制调查的组织计划组织计划三、数据搜集
15、的组织方式三、数据搜集的组织方式(一)普查、抽样、统计报表制度和重点调查(一)普查、抽样、统计报表制度和重点调查1.普查普查特点:特点:工作量大工作量大,时间性强时间性强,需要大量人力和财力。,需要大量人力和财力。任务:任务:搜集重要的搜集重要的国情国力和资源状况国情国力和资源状况的全面资的全面资料,为政府制定规划、方针政策提供依据。料,为政府制定规划、方针政策提供依据。方式:方式:建立专门机构,配备专门人员调查。建立专门机构,配备专门人员调查。利用基层单位原始记录和核算资料进行调查。利用基层单位原始记录和核算资料进行调查。原则:原则:规定统一的标准时点。规定统一的标准时点。规定统一的普查期限
16、。规定统一的普查期限。规定统一的调查的项目和指标。规定统一的调查的项目和指标。2.抽样调查抽样调查特点:特点:1.按按随机原则随机原则从总体中抽取样本;从总体中抽取样本;2.以样本指标(统计量)为依据以样本指标(统计量)为依据推断总体参数推断总体参数或或检验总体的某种假设检验总体的某种假设;3.抽样误差可以事先抽样误差可以事先计算计算并加以并加以控制控制。3.3.统计报表制度统计报表制度是按一定的表式和要求,是按一定的表式和要求,自上而下自上而下统一布置,统一布置,自下而自下而上上提供统计资料的一种统计调查方法。提供统计资料的一种统计调查方法。这种搜集统计数据方法是伴随着计划经济而产生的,这种
17、搜集统计数据方法是伴随着计划经济而产生的,并曾在我国占主导地位。现在,在社会主义市场经济并曾在我国占主导地位。现在,在社会主义市场经济条件下,仍是我国搜集统计数据的组织方式之一。条件下,仍是我国搜集统计数据的组织方式之一。4.重点调查重点调查特点:特点:在总体中选择在总体中选择个别或部分个别或部分重点单位重点单位进行调查进行调查。任务:任务:及时了解总体基本情况,为主管部门指导工及时了解总体基本情况,为主管部门指导工作服务。作服务。方式:方式:重点单位重点单位指在总体中有举足轻重地位的单位,指在总体中有举足轻重地位的单位,其标志值在总体标志总量中占有绝大比重。其标志值在总体标志总量中占有绝大比
18、重。经常性调查;同报表制度结合,用统计报表经常性调查;同报表制度结合,用统计报表调查。调查。例如,要了解全国钢铁生产的基本情况,只要调例如,要了解全国钢铁生产的基本情况,只要调查鞍钢、宝钢、首钢、武钢、包钢等十几家特大查鞍钢、宝钢、首钢、武钢、包钢等十几家特大型的钢铁企业就可以掌握全国钢铁企业生产的基型的钢铁企业就可以掌握全国钢铁企业生产的基本情况本情况。(二)抽样的优点(二)抽样的优点 1.适用的范围广。适用的范围广。对对于于有有限限总总体体,从从理理论论上上讲讲,既既可可以以进进行行普普查查也也可可以以进行抽样;进行抽样;对对于于无无限限总总体体,就就只只能能进进行行抽抽样样。若若理理论论
19、上上可可以以而而实实际上很难采用全面普查的情况,也只能采用抽样。际上很难采用全面普查的情况,也只能采用抽样。如产品质量的破坏性检验、居民住户调查等。如产品质量的破坏性检验、居民住户调查等。2.2.与全面普查相比,抽样最大的优点是节省人、财、物与全面普查相比,抽样最大的优点是节省人、财、物力和时间。力和时间。3.3.随机抽样可以比普查更为精确。随机抽样可以比普查更为精确。(三)抽样的类型(三)抽样的类型 非随机抽样非随机抽样 随机抽样随机抽样 判断抽样判断抽样定额抽样定额抽样 方便抽样方便抽样 简单随机抽样简单随机抽样 抽样类型抽样类型系统抽样系统抽样 分层抽样分层抽样 整群抽样整群抽样 非随机
20、抽样非随机抽样又称为非概率抽样又称为非概率抽样,是是不按照随机原不按照随机原则则来抽取样本中的单位或个体。来抽取样本中的单位或个体。特点特点具有方便、快速和低成本具有方便、快速和低成本精确性差,结论缺乏普遍性精确性差,结论缺乏普遍性判断抽样判断抽样又称为典型调查,是从事有关工作的专家按照一定的又称为典型调查,是从事有关工作的专家按照一定的标准标准有意识地有意识地在总体中选择若干有代表性的单位组成在总体中选择若干有代表性的单位组成样本进行调查,代表单位的选取标准应根据统计研究样本进行调查,代表单位的选取标准应根据统计研究的目的而定。的目的而定。定额抽样定额抽样 是根据已定的单位数抽取样本,是根据
21、已定的单位数抽取样本,往往是对总体了解甚少往往是对总体了解甚少的时采用。的时采用。如想获取某地区化妆品的销售情况,对该地区的如想获取某地区化妆品的销售情况,对该地区的5 5家商家商厦进行调查厦进行调查。方便抽样方便抽样 是为了取样方便,随意地抽取样本单位。是为了取样方便,随意地抽取样本单位。街头偶遇式调查就是一种最为常见的方便抽样街头偶遇式调查就是一种最为常见的方便抽样。随机抽样随机抽样 是根据是根据随机原则随机原则来抽取样本单位来抽取样本单位.简单随机抽样简单随机抽样 方法:方法:在抽样框中的每个单位都具有相同的被抽中的机在抽样框中的每个单位都具有相同的被抽中的机会会,每个容量相同的样本被抽
22、中的机会也是相同的。每个容量相同的样本被抽中的机会也是相同的。亦称为纯随机抽样亦称为纯随机抽样抽取样本的方法:抽取样本的方法:有放回抽样和无放回抽样。有放回抽样和无放回抽样。适合:适合:总体内部差异不是很大,规模也不大的情况总体内部差异不是很大,规模也不大的情况。系统抽样系统抽样方法:方法:抽样框中的抽样框中的N N个单位被分成个单位被分成k k个系统,个系统,k k等于抽样等于抽样框的容量框的容量N N除以所需的样本容量除以所需的样本容量n n,在抽样框中前面的在抽样框中前面的k k个个体或单位中随机抽出第一个样本单位,然后,可在个个体或单位中随机抽出第一个样本单位,然后,可在其后的每隔其后
23、的每隔k k个单位抽取样本中其余的部分。个单位抽取样本中其余的部分。亦可称为等距抽样亦可称为等距抽样 编号有两编号有两种方法:种方法:一种是利用原有的顺序或编号一种是利用原有的顺序或编号。如学生的注册名单,或者是从生产流水线上如学生的注册名单,或者是从生产流水线上下来的、有编号的产品等。下来的、有编号的产品等。对所研究的总体已有所了解,则可用已知对所研究的总体已有所了解,则可用已知的相关变量对抽样框中的单位进行编号。的相关变量对抽样框中的单位进行编号。分层抽样分层抽样 亦可称为类型抽样亦可称为类型抽样 方法方法:将总体全部单位分类,形成若干个类型组,后:将总体全部单位分类,形成若干个类型组,后
24、从各类型中分别抽取样本单位,合成样本。从各类型中分别抽取样本单位,合成样本。总体总体N样本样本n等额等额等比例等比例最优最优整群抽样整群抽样 方法方法:首先把总体中的首先把总体中的N个单位划分成为若干个群,个单位划分成为若干个群,并要求每个群对整个总体都具有代表性,然后对群进并要求每个群对整个总体都具有代表性,然后对群进行简单随机抽样,并对抽中群内的所有单位进行调查行简单随机抽样,并对抽中群内的所有单位进行调查研究。研究。总体群数总体群数R=16样本群数样本群数r=4样本容量样本容量ABCDEFGHIJKLMNOPLHPD适合:适合:比简单随机抽样的方法能节约更多的成本,特别比简单随机抽样的方
25、法能节约更多的成本,特别当总体的分布地域非常辽阔当总体的分布地域非常辽阔时。时。四、四、有关数据调查的几个问题有关数据调查的几个问题调查的目的调查的目的判断调查误差的大小判断调查误差的大小调调调调查查查查误误误误 差差差差登记性误差:登记性误差:代表性误差代表性误差系统性的代表性误差系统性的代表性误差登记、汇总、过录时产生的误差,登记、汇总、过录时产生的误差,以及无回答误差和测量误差等以及无回答误差和测量误差等偶然性的代表性误差偶然性的代表性误差即为抽样误差即为抽样误差调查中的道调查中的道德性德性问题问题 1.1.调查者别有用意地、有意识地选择导向性的问题,调查者别有用意地、有意识地选择导向性的问题,使回答者出现有倾向性的回答。使回答者出现有倾向性的回答。2.2.询问询问者有意者有意识识地通地通过语过语气、气、语调语调引引导导被被询问询问者出者出现现有有倾倾向性的回答。向性的回答。3.3.回答者不重回答者不重视视或不愿意回答或不愿意回答调查调查的内容,就很可的内容,就很可能提供能提供错误错误的信息。的信息。
限制150内