《统计学基础(第一章)优秀PPT.ppt》由会员分享,可在线阅读,更多相关《统计学基础(第一章)优秀PPT.ppt(43页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1统计学2017年9月12第一章 统计和数据1.1 1.1 统计及其应用领域统计及其应用领域1.2 1.2 统计数据及其类型统计数据及其类型1.3 1.3 统计中的基本概念统计中的基本概念*1.1统计及其应用领域统计及其应用领域什么是统计什么是统计n从不同的角度理解可以有三种含义:从不同的角度理解可以有三种含义:n1 1统计工作统计工作对社会经济现象的数量方面进行对社会经济现象的数量方面进行搜集、整理、分析研究所做的工作。搜集、整理、分析研究所做的工作。如:如:“你是你是不是搞统计的?不是搞统计的?”n2 2统计资料统计资料指反映社会经济现象的数量方面指反映社会经济现象的数量方面的数字及文字资
2、料。的数字及文字资料。如:如:“据统计据统计”。n3 3统计学统计学系统论述统计工作原理和方法的科系统论述统计工作原理和方法的科学。学。如:如:“我正在学统计我正在学统计”。3*41.1统计及其应用领域统计及其应用领域一、什么是统计学一、什么是统计学n1.数据收集:取得数据数据收集:取得数据n2.数据处理:图表展示数数据处理:图表展示数据据n3.数据分析:分析数据数据分析:分析数据 n4.数据解释:结果的说明数据解释:结果的说明 统统计计学学是是收收集集、处处理理、分分析析、解解释释数数据据并从中得出结论的科学并从中得出结论的科学*什么是统计学?n1.1.收集数据收集数据Collecting
3、DataCollecting Datan 例:问卷调查例:问卷调查SurveySurveyn2.2.表示数据表示数据Presenting DataPresenting Datan 例:图表例:图表Charts&Tables Charts&Tables n3.3.描述数据描述数据Characterizing DataCharacterizing Datan 例:平均值例:平均值AverageAverage为什么?为什么?数据分析数据分析Data AnalysisData Analysis做出决策做出决策Decision-Decision-MakingMaking?1984-1994 T/Make
4、r Co.5统计学分类67描述统计示例89描述统计描述统计示例示例我国高等学校历年毕业生人数(万人)我国高等学校历年毕业生人数(万人)*10推断统计示例11n饲养场规定,肉鸡平均体重超过饲养场规定,肉鸡平均体重超过3 3千克时方可屠宰,千克时方可屠宰,现随机抽取现随机抽取2020只,测得平均体重为只,测得平均体重为2.952.95千克,方千克,方差为差为0.20.2千克,请问,该批鸡是否达到屠宰标准?千克,请问,该批鸡是否达到屠宰标准?12某产品广告投入和销售额数据某产品广告投入和销售额数据(单位:万元单位:万元)广告广告1.03.23.25.55.97.17.39.210.812.1销售额销
5、售额9.431.833.252.453.556.056.959.260.163.51.这两个变量之间是否有关系这两个变量之间是否有关系?2.如果有关系如果有关系,它们的关系是否显著它们的关系是否显著?3.二者是什么关系二者是什么关系?是否可以用数学模型来描述是否可以用数学模型来描述?推断统计示例推断统计示例*13二、统计学的应用领域二、统计学的应用领域统计学统计学经济学经济学经济学经济学管理学管理学管理学管理学医学医学医学医学工程学工程学工程学工程学社会学社会学社会学社会学食品科学食品科学食品科学食品科学*统计学的应用领域14*文学也用到统计学n19811981年,首届国际年,首届国际红楼梦红
6、楼梦研讨会在美国召开,研讨会在美国召开,威斯康星大学讲师陈炳藻独树一帜,宣读了题为威斯康星大学讲师陈炳藻独树一帜,宣读了题为从词汇上的统计论红楼梦作者的问题从词汇上的统计论红楼梦作者的问题的论文。的论文。他从字、词出现频率入手,通过计算机进行统计、他从字、词出现频率入手,通过计算机进行统计、处理、分析,对处理、分析,对红楼梦红楼梦后后4040回系高鹗所作这一回系高鹗所作这一流行看法提出异议,认为流行看法提出异议,认为120120回均系曹雪芹所作。回均系曹雪芹所作。15*三、统计的误用与滥用n问:统计资料表明,大多数汽车事故发生在中等问:统计资料表明,大多数汽车事故发生在中等速度的行驶中,极少数
7、的事故是发生在大于速度的行驶中,极少数的事故是发生在大于150150公里小时的行驶速度上。这是否就意味着高速公里小时的行驶速度上。这是否就意味着高速行驶比较安全?行驶比较安全?16n答:绝不是这样。统计关系往往不能表明因果关答:绝不是这样。统计关系往往不能表明因果关系。由于多数人是以中等速度开车,所以多数事系。由于多数人是以中等速度开车,所以多数事故是发生在中等速度的行驶中故是发生在中等速度的行驶中*n问:统计数字还表明,在亚利桑那州死于肺结核问:统计数字还表明,在亚利桑那州死于肺结核的人比其他州死于肺结核的人多。这是否就意味的人比其他州死于肺结核的人多。这是否就意味着亚利桑那州的气候容易生肺
8、病?着亚利桑那州的气候容易生肺病?n答:正好相反。亚利桑那的气候对生肺病的人有答:正好相反。亚利桑那的气候对生肺病的人有好处,所以肺病患者纷纷前来,自然就使这个州好处,所以肺病患者纷纷前来,自然就使这个州死于肺结核的平均数升高了。死于肺结核的平均数升高了。17*1.2 统计数据及其类型18*19*20 产品质量分为一等品;二等品;三等品。评价分数为产品质量分为一等品;二等品;三等品。评价分数为优;良;差。劳动效率分为高;中;低。优;良;差。劳动效率分为高;中;低。1.2 数据的类型数据的类型分类数据分类数据(categorical data)人口按性别分为男;女。职业分为国家机关、党人口按性别
9、分为男;女。职业分为国家机关、党群组织工作人员、企事业单位管理人员;各类专业、群组织工作人员、企事业单位管理人员;各类专业、技术人员;办事人员和有关人员;商业与服务业人员;技术人员;办事人员和有关人员;商业与服务业人员;农林牧渔业生产人员;生产人员,运输人员和有关人农林牧渔业生产人员;生产人员,运输人员和有关人员;军队;不便分类的其他劳动者员;军队;不便分类的其他劳动者8 8类。类。顺序数据顺序数据(rank data)人的身高分为人的身高分为168cm168cm;175cm175cm;183cm183cm。销售利润为。销售利润为3030万万元;元;5050万元;万元;8080万元。年薪为万元
10、。年薪为2020万元;万元;3535万元;万元;5050万元。万元。数值型数据数值型数据(metric data)分类标准:计量尺度分类标准:计量尺度*21*对课本第6页的解释22*23在实验中控制实验对象而收集到的数据。在实验中控制实验对象而收集到的数据。1.2 数据的类型数据的类型观测数据观测数据(observational data)在没有对事物人为控制的条件下而得到的数据。在没有对事物人为控制的条件下而得到的数据。实验数据实验数据(experimental data)分类标准:收集方法分类标准:收集方法*24 第三产业对国民经济的拉动作用,第三产业对国民经济的拉动作用,19901990
11、年为年为0.60.6,19951995年为年为2.92.9,20002000年为年为2.92.9,20052005年为年为4.24.2,20062006年为年为4.94.9,20072007年为年为5.15.1。1.2 数据的类型数据的类型截面数据截面数据(cross-sectional data)20092009年中国年中国GDPGDP达到达到33.5333.53万亿元,城镇居民万亿元,城镇居民人均可支配收入人均可支配收入1717517175元,农村居民人均纯收入元,农村居民人均纯收入51535153元元。时间序列数据时间序列数据(time series data)分类标准:时间状况分类标准
12、:时间状况*25*对课本第7页的解释26*27*281.3 统计中的基本概念统计中的基本概念一、总体和样本一、总体和样本二、参数和统计量二、参数和统计量三、变量三、变量129一、总体和样本1.总体(population)总体是所研究的全部元素的集合,其中的每一个元素称为个体 分为有限总体和无限总体n有限总体的范围能够明确确定,且元素的数目是有限的n无限总体所包括的元素是无限的,不可数的*30研究食品研究食品3 3学生的学习情况学生的学习情况总体总体全班所有的学生全班所有的学生个体个体每一个学生每一个学生广州市的工业生产情况广州市的工业生产情况所有的工业企业所有的工业企业每一个工业企业每一个工业
13、企业广州的工业生产设备情况广州的工业生产设备情况每一台工业生产设备每一台工业生产设备所有的工业生产设备所有的工业生产设备总体总体总体总体个体个体个体个体*312.2.2.2.样本样本样本样本 (sample)(sample)(sample)(sample)n n从总体中抽取的从总体中抽取的从总体中抽取的从总体中抽取的一部分一部分一部分一部分元素的集合元素的集合元素的集合元素的集合n n构成样本的元素的数目称为构成样本的元素的数目称为构成样本的元素的数目称为构成样本的元素的数目称为样本量样本量样本量样本量*32总体总体个体个体样样本本个体个体 个体个体个体个体总体和样本总体和样本*33*34练习
14、*35练习*36*37*38二、参数和统计量1.参数(parameter)用来描述总体特征的概括性数字度量参数主要有总体均值()、标准差()、总体比例()等总体参数通常用希腊字母表示 2.统计量(statistic)用来描述样本特征的概括性数字度量 样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)等样本统计量通常用小写英文字母来表示*39*40总体参数一般是不知道的总体参数一般是不知道的统计学抽样研究的目的就是:统计学抽样研究的目的就是:样本统计量 总体参数*41三、变量1.说明现象某种特征的概念如性别、民族、身高、体重、成绩、合格率等变量的具体表现称为变量值,女、苗族、1.68米
15、、50公斤、优等即为变量值也称为数据2.变量可以分为分类变量:说明事物类别的一个名称顺序变量:说明事物有序类别的一个名称数值型变量:说明事物数字特征的一个名称 n离散变量:取有限个整数值 n连续变量:可以取无穷多个小数值*42离散型变量离散型变量 人数人数 2020人、人、5050人、人、8282人、人、123123人等人等连续型变量连续型变量身高身高1.601.60米、米、1.611.61米、米、1.621.62米等米等例如变量值变量值变量值变量值*43 练练 习习1.某大学有某大学有1000名男教师和名男教师和500名女教师,为了了解教名女教师,为了了解教师的生活状况,从师的生活状况,从1000名男教师中随机抽取了名男教师中随机抽取了100名,名,500名女教师中随机抽取了名女教师中随机抽取了50名。名。(1)指出这一研究的总体、个体、样本;)指出这一研究的总体、个体、样本;(2)指出这一研究的参数;)指出这一研究的参数;(3)指出这一研究的统计量;)指出这一研究的统计量;(4)这一研究涉及的是截面数据还是时间序列数据。)这一研究涉及的是截面数据还是时间序列数据。2.要调查某家电商场洗衣机的销售情况,试指出总体、要调查某家电商场洗衣机的销售情况,试指出总体、个体是什么?并举出至少一个分类变量、顺序变量、个体是什么?并举出至少一个分类变量、顺序变量、数值型变量。数值型变量。*
限制150内