《统计学导论幻灯片.ppt》由会员分享,可在线阅读,更多相关《统计学导论幻灯片.ppt(31页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计学导论统计学导论第1页,共31页,编辑于2022年,星期二举出一个统计没有用途的领域名称举出一个统计没有用途的领域名称比举出一个统计作为其组成部分的比举出一个统计作为其组成部分的领域名称要困难得多。领域名称要困难得多。Robert Johnson第2页,共31页,编辑于2022年,星期二第第 1 章章 导导 论论作者:中国人民大学统计学院作者:中国人民大学统计学院贾俊平贾俊平统计学第3页,共31页,编辑于2022年,星期二第4页,共31页,编辑于2022年,星期二第5页,共31页,编辑于2022年,星期二第第 1 章章 导导 论论1.1 统计及其应用领域统计及其应用领域1.2 统计数据的类
2、型统计数据的类型1.3 统计中的几个基本概念统计中的几个基本概念第6页,共31页,编辑于2022年,星期二学习目标学习目标1.理解统计学的含义理解统计学的含义2.理解统计数据与统计学的关系理解统计数据与统计学的关系3.了解统计学的应用领域了解统计学的应用领域4.了解数据的类型了解数据的类型5.理解统计中的几个基本概念理解统计中的几个基本概念 第7页,共31页,编辑于2022年,星期二1.1 统计及其应用领域统计及其应用领域1.1.1 什么是统计学什么是统计学1.1.2 统计的应用领域统计的应用领域1.1.3 历史上著名的统计学家历史上著名的统计学家第8页,共31页,编辑于2022年,星期二什么
3、是统计学什么是统计学?(statistics)1.统计学是收集、分析、表述和解释数据的科学(不列颠百科全书不列颠百科全书)2.统计是一门收集、分析、解释和提供数据的科学(韦伯斯特国际辞典第韦伯斯特国际辞典第3 3版版)3.统计指的是一组方法,用来设计实验、获得数据,然后在这些数据的基础上组织、概括、演示、分析、解释和得出结论(Mario F.Triola,(Mario F.Triola,初级统计学初级统计学)第9页,共31页,编辑于2022年,星期二什么是统计学什么是统计学?(statistics)1.1.收集数据:取得数据收集数据:取得数据2.2.处理数据:整理与图表展示处理数据:整理与图表
4、展示 3.3.分析数据:利用统计方法分析数分析数据:利用统计方法分析数据据4.4.数据解释:结果的说明数据解释:结果的说明5.5.得到结论:从数据分析中得出客得到结论:从数据分析中得出客观结论观结论收集、处理、分析、解释数据并从数据中得出结论的科学收集、处理、分析、解释数据并从数据中得出结论的科学 第10页,共31页,编辑于2022年,星期二统计研究的过程统计研究的过程收集数据收集数据(取得数据取得数据)整理数据整理数据(处理数据处理数据)解释数据解释数据(结果说明结果说明)分析数据分析数据(研究数据研究数据)实际问实际问题题第11页,共31页,编辑于2022年,星期二统计方法统计方法第12页
5、,共31页,编辑于2022年,星期二描述统计描述统计(descriptive statistics)1.研究数据收集、整理和描述的统计学分支 2.内容n n收集数据收集数据n n整理数据整理数据n n展示数据展示数据n n描述性分析描述性分析3.目的n n描述数据特征描述数据特征n n找出数据的基本规律找出数据的基本规律0 0 0252525505050Q QQ1 1 1Q QQ2 2 2Q QQ3 3 3Q QQ4 4 4¥x x=30 =30 s s2 22=105=105第13页,共31页,编辑于2022年,星期二推断统计推断统计 (inferential statistics)1.研究
6、如何利用样本数据来推断总体特征的统计学分支2.内容参数参数估计估计假设检验假设检验3.目的对总体特征作出推断对总体特征作出推断样样本本总体总体第14页,共31页,编辑于2022年,星期二描述统计与推断统计的关系描述统计与推断统计的关系反映客反映客反映客反映客观现象观现象观现象观现象的数据的数据的数据的数据总体内在的总体内在的总体内在的总体内在的数量规律性数量规律性数量规律性数量规律性推断统计推断统计推断统计推断统计(利用样本信息和概率利用样本信息和概率利用样本信息和概率利用样本信息和概率论对总体的数量特征进论对总体的数量特征进论对总体的数量特征进论对总体的数量特征进行估计和检验等行估计和检验等
7、行估计和检验等行估计和检验等)概率论概率论概率论概率论(分布理论、大数定律和中分布理论、大数定律和中分布理论、大数定律和中分布理论、大数定律和中心极限定理等心极限定理等心极限定理等心极限定理等)描述统计描述统计描述统计描述统计(数据的收集、整理、显示和数据的收集、整理、显示和数据的收集、整理、显示和数据的收集、整理、显示和分析等分析等分析等分析等)总体数据总体数据样本数据样本数据第15页,共31页,编辑于2022年,星期二统计的应用领域统计的应用领域经济学经济学经济学经济学管理学管理学管理学管理学医学医学医学医学工程学工程学工程学工程学社会学社会学社会学社会学 统计学统计学第16页,共31页,
8、编辑于2022年,星期二统计的应用领域统计的应用领域actuarial workactuarial work (精算精算精算精算)agricultureagriculture (农业农业农业农业)animal scienceanimal science (动物学动物学动物学动物学)anthropologyanthropology (人类学人类学人类学人类学)archaeology archaeology(考古学考古学考古学考古学)auditing auditing(审计学审计学审计学审计学)crystallography crystallography(晶体学晶体学晶体学晶体学)demogra
9、phy demography(人口统计学人口统计学人口统计学人口统计学)dentistry dentistry(牙医学牙医学牙医学牙医学)ecologyecology (生态学生态学生态学生态学)econometrics econometrics(经济计量学经济计量学经济计量学经济计量学)education education(教育学教育学教育学教育学)election forecasting and projectionelection forecasting and projection (选举预测和策划选举预测和策划选举预测和策划选举预测和策划)engineering engineeri
10、ng(工程工程工程工程)epidemiology epidemiology(流行病学流行病学流行病学流行病学)finance finance(金融金融金融金融)fisheries researchfisheries research (水产渔业研究水产渔业研究水产渔业研究水产渔业研究)gambling gambling(赌博赌博赌博赌博)genetics genetics(遗传学遗传学遗传学遗传学)geography geography(地理学地理学地理学地理学)geology geology(地质学地质学地质学地质学)historical researchhistorical researc
11、h (历史研究历史研究历史研究历史研究)human geneticshuman genetics (人类遗传学人类遗传学人类遗传学人类遗传学)第17页,共31页,编辑于2022年,星期二统计的应用领域统计的应用领域hydrology hydrology(水文学水文学水文学水文学)industryindustry (工业工业工业工业)linguisticslinguistics (语言学语言学语言学语言学)literature literature(文学文学文学文学)manpower planningmanpower planning (劳动力计划劳动力计划劳动力计划劳动力计划)manageme
12、nt sciencemanagement science (管理科学管理科学管理科学管理科学)marketing marketing(市场营销学市场营销学市场营销学市场营销学)medical diagnosismedical diagnosis (医学诊断医学诊断医学诊断医学诊断)meteorology meteorology(气象学气象学气象学气象学)military sciencemilitary science (军事科学军事科学军事科学军事科学)nuclear material safeguardsnuclear material safeguards (核材料安全管理核材料安全管理核
13、材料安全管理核材料安全管理)ophthalmology ophthalmology(眼科学眼科学眼科学眼科学)pharmaceutics pharmaceutics(制药学制药学制药学制药学)physicsphysics (物理学物理学物理学物理学)political sciencepolitical science (政治学政治学政治学政治学)psychology psychology(心理学心理学心理学心理学)psychophysics psychophysics(心理物理学心理物理学心理物理学心理物理学)quality controlquality control (质量控制质量控制质量
14、控制质量控制)religious studiesreligious studies (宗教研究宗教研究宗教研究宗教研究)sociologysociology (社会学社会学社会学社会学)survey samplingsurvey sampling (调查抽样调查抽样调查抽样调查抽样)taxonomy taxonomy(分类学分类学分类学分类学)weather modification weather modification (气象改善气象改善气象改善气象改善)第18页,共31页,编辑于2022年,星期二历史上著名的统计学家历史上著名的统计学家 Jacob Bernoulli(Jacob Be
15、rnoulli(伯努利伯努利)(1654-1705)(1654-1705)Edmond Halley(Edmond Halley(哈雷哈雷)(1656-1742)(1656-1742)De Moivre(De Moivre(棣莫弗棣莫弗)(1667-1754)(1667-1754)Thomas Bayes(Thomas Bayes(贝叶斯贝叶斯)(1702-1761)(1702-1761)Leonhard Euler(Leonhard Euler(欧拉欧拉)(1707-1783)(1707-1783)Pierre Simon Laplace(Pierre Simon Laplace(拉普拉斯拉
16、普拉斯)(1749-1827)(1749-1827)Adrien Marie Legendre(Adrien Marie Legendre(勒让德勒让德)(1752-1833)(1752-1833)Thomas Robert Malthus(Thomas Robert Malthus(马尔萨斯马尔萨斯)(1766-1834)(1766-1834)Pierre Simon Laplace Pierre Simon Laplace Francis GaltonFrancis GaltonJames BernoulliJames BernoulliAbraham de MoivreAbraham d
17、e MoivreWilliam S.GossetWilliam S.Gosset第19页,共31页,编辑于2022年,星期二历史上著名的统计学家历史上著名的统计学家 Friedrich Gauss(Friedrich Gauss(高斯高斯)(1777-1855)(1777-1855)Johann Gregor Mendel(Johann Gregor Mendel(孟德尔孟德尔)(1822-1884)(1822-1884)Karl Pearson(Karl Pearson(皮尔逊皮尔逊)(1857-1936)(1857-1936)Ronald Aylmer Fisher(Ronald Aylm
18、er Fisher(费希尔费希尔)(1890-1962),)(1890-1962),Jerzy NeymanJerzy Neyman(奈曼)(奈曼)(1894-1981)(1894-1981)Egon Sharpe Pearson(Egon Sharpe Pearson(皮尔逊皮尔逊)(1895-1980)(1895-1980)William Feller(William Feller(费勒费勒)(1906-1970).)(1906-1970).Friedrich Gauss Friedrich Gauss Egon S.PearsonEgon S.Pearson Ronald A.Fishe
19、r Ronald A.FisherKarl PearsonKarl PearsonJerzy NeymanJerzy Neyman第20页,共31页,编辑于2022年,星期二1.2.1 分类数据、顺序数据、数值型数据分类数据、顺序数据、数值型数据1.2.2 观测数据和实验数据观测数据和实验数据1.2.3 截面数据和时间序列数据截面数据和时间序列数据1.2 统计统计数据的类型数据的类型第21页,共31页,编辑于2022年,星期二统计数据的分类统计数据的分类统计数据的分类统计数据的分类按计量层次按计量层次分分分分类类类类的的的的数数数数据据据据顺顺顺顺序序序序的的的的数数数数据据据据数数数数值值值
20、值型型型型数数数数据据据据按时间状况按时间状况截截截截面面面面的的的的数数数数据据据据时时时时序序序序的的的的数数数数据据据据按收集方法按收集方法观观观观察察察察的的的的数数数数据据据据试试试试验验验验的的的的数数数数据据据据第22页,共31页,编辑于2022年,星期二统计数据的分类统计数据的分类(按计量尺度分按计量尺度分)1.1.分类数据分类数据分类数据分类数据(categorical data)(categorical data)n n只能归于某一类别的非数字型数据只能归于某一类别的非数字型数据n n对事物进行分类的结果,数据表现为类别,用文字来表述对事物进行分类的结果,数据表现为类别,用
21、文字来表述n n例如,人口按性别分为男、女两类例如,人口按性别分为男、女两类 2.2.顺序数据顺序数据顺序数据顺序数据(rank data)(rank data)n n只能归于某一有序类别的非数字型数据只能归于某一有序类别的非数字型数据n n对事物类别顺序的测度,数据表现为类别,用文字来表述对事物类别顺序的测度,数据表现为类别,用文字来表述n n例如,产品分为一等品、二等品、三等品、次品等例如,产品分为一等品、二等品、三等品、次品等 3.3.数值型数据数值型数据数值型数据数值型数据(metric data)(metric data)n n按数字尺度测量的观察值按数字尺度测量的观察值n n结果表
22、现为具体的数值,对事物的精确测度结果表现为具体的数值,对事物的精确测度n n例如:身高为例如:身高为175cm175cm、168cm168cm、183cm183cm第23页,共31页,编辑于2022年,星期二统计数据的分类统计数据的分类(按收集方法分按收集方法分)1.1.观测的数据观测的数据观测的数据观测的数据(observational data)(observational data)(observational data)n nn通过调查或观测而收集到的数据通过调查或观测而收集到的数据通过调查或观测而收集到的数据n nn在没有对事物人为控制的条件下而得到的在没有对事物人为控制的条件下而得
23、到的在没有对事物人为控制的条件下而得到的n nn有关社会经济现象的统计数据几乎都是观测数据有关社会经济现象的统计数据几乎都是观测数据有关社会经济现象的统计数据几乎都是观测数据2.2.试验的数据试验的数据试验的数据试验的数据(experimental data)(experimental data)n nn在试验中控制试验对象而收集到的数据在试验中控制试验对象而收集到的数据在试验中控制试验对象而收集到的数据n nn比比比如如如,对对对一一一种种种新新新药药药疗疗疗效效效的的的试试试验验验,对对对一一一种种种新新新的的的农农农作作作物物物品种的试验等品种的试验等品种的试验等n nn自然科学领域的数
24、据大多数都为试验数据自然科学领域的数据大多数都为试验数据自然科学领域的数据大多数都为试验数据第24页,共31页,编辑于2022年,星期二统计数据的分类统计数据的分类(按时间状况分按时间状况分)1.截面数据(cross-sectional data)n n在相同或近似相同的时间点上收集的数据在相同或近似相同的时间点上收集的数据n n描述现象在某一时刻的变化情况描述现象在某一时刻的变化情况n n比如,比如,20052005年我国各地区的国内生产总值数据年我国各地区的国内生产总值数据2.时间序列数据(time series data)(time series data)n n在不同时间上收集到的数据
25、在不同时间上收集到的数据n n描述现象随时间变化的情况描述现象随时间变化的情况n n比如,比如,20002000年至年至20052005年国内生产总值数据年国内生产总值数据第25页,共31页,编辑于2022年,星期二1.3 统计中的几个基本概念统计中的几个基本概念1.3.1 总体和样本总体和样本1.3.2 参数和统计量参数和统计量1.3.3 变量变量第26页,共31页,编辑于2022年,星期二总体和样本总体和样本1.总体总体(population)n n所研究的全部个体所研究的全部个体(数据数据)的集合,其中的每一个个体也的集合,其中的每一个个体也称为元素称为元素n n分为有限总体和无限总体分
26、为有限总体和无限总体l l有限总体的范围能够明确确定,且元素的数目是有限的有限总体的范围能够明确确定,且元素的数目是有限的l l无限总体所包括的元素是无限的,不可数的无限总体所包括的元素是无限的,不可数的2.样本样本(sample)n n从总体中抽取的一部分元素的集合从总体中抽取的一部分元素的集合n n构构成成样样本本的的元元素素的的数数目目称称为为样样本本容容量量或或样样本本量量 (sample size)sample size)第27页,共31页,编辑于2022年,星期二参数和统计量参数和统计量1.1.参数参数参数参数(parameter)(parameter)n n描述总体特征的概括性数
27、字度量,是描述总体特征的概括性数字度量,是研究者想要了解的总体的研究者想要了解的总体的某种特征值某种特征值n n所关心的参数主要有总体均值所关心的参数主要有总体均值()、标准差、标准差()、总体比例、总体比例()等等n n总体参数通常用希腊字母表示总体参数通常用希腊字母表示 2.2.统计量统计量统计量统计量(statistic)(statistic)n n用用来来描描述述样样本本特特征征的的概概括括性性数数字字度度量量,它它是是根根据据样样本本数数据据计计算算出出来来的的一些量,是样本的函数一些量,是样本的函数n n所所关关心心的的样样本本统统计计量量有有样样本本均均值值(x x)、样样本本标
28、标准准差差(s s)、样样本本比比例例(p p)等等n n样本统计量通常用小写英文字母来表示样本统计量通常用小写英文字母来表示 第28页,共31页,编辑于2022年,星期二变变 量量(variable)1.说明现象某种特征的概念n n如商品销售额、受教育程度、产品的质量等级等如商品销售额、受教育程度、产品的质量等级等n n变量的具体表现称为变量值,即数据变量的具体表现称为变量值,即数据2.变量可以分为变量可以分为n n分分类类变变量量(categorical categorical variablevariable):说说明明事事物物类类别别的的名名称称n n顺序变量顺序变量(rank var
29、iable(rank variable):说明事物有序类别的名称说明事物有序类别的名称n n数数值值型型变变量量(metric(metric variablevariable):说说明明事事物物数数字字特特征征的的名称名称 l l离散变量:取有限个值离散变量:取有限个值 l l连续变量:可以取无穷多个值连续变量:可以取无穷多个值 第29页,共31页,编辑于2022年,星期二变变 量量(其他分其他分类类)1.随机变量和非随机变量2.经 验 变 量(empirical variables)和 理 论 变 量(theoretical variables)n n经验变量所描述的是我们周围可以观察到的事物经验变量所描述的是我们周围可以观察到的事物n n理理论论变变量量则则是是由由统统计计学学家家用用数数学学方方法法所所构构造造出出来来的的一一些些变变量量,比比如如,z 统统计计量量、t t 统统计计量量、2统统计计量量、F F 统计量等统计量等第30页,共31页,编辑于2022年,星期二结结 束束第31页,共31页,编辑于2022年,星期二
限制150内