教学课件(05)第5章推断分析基本方法(R 语言-1).pptx
《教学课件(05)第5章推断分析基本方法(R 语言-1).pptx》由会员分享,可在线阅读,更多相关《教学课件(05)第5章推断分析基本方法(R 语言-1).pptx(54页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、教材配套资源页完整PPT课件教学课件(05)第5章 推断分析基本方法(R 语言-1)5 - 22022-7-22数据分析基础R语言实现(贾俊平)课程结构第1章 数据分析与R语言第2章 R语言数据处理第3章 数据可视化分析第4章 数据的描述分析第5章 推断分析基本方法第6章 相关与回归分析第7章 时间序列分析5 - 32022-7-22数据分析基础R语言实现(贾俊平)5 - 42022-7-22数据分析基础R语言实现(贾俊平)l学习目标学习目标了解概率和概率分布的有关概念,掌握正态分布和t分布概率和分位数的计算深入理解统计量分布在推断分析中的作用,理解样本均值的分布与中心极限定理掌握总体均值和总
2、体比例的区间估计方法掌握总体均值和总体比例的假设检验方法使用R计算分布的概率和分位数使用R进行估计和检验l思政目标思政目标利用概率分布知识,结合实际问题学习概率在社会科学和自然科学领域的应用结合中心极限定理,深入理解坚持党的领导和走中国特色社会主义道路的必然性利用参数估计和假设检验原理,针对具体问题能提出合理的假设,并对决策结果做出合理解释,避免主观或乱用p 值,应将P值的使用与树立正确的价值观相结合学习目标和思政目标5 - 52022-7-22数据分析基础R语言实现(贾俊平)概率(概率(probability)l 对事件发生可能性大小的度量,它是介于0和1之间(含0和1)的一个值明天降水的概
3、率是80%。这里的80%就是对降水这一事件发生的可能性大小的一种数值度量购买一只股票明天上涨的可能性是30%,这也是一个概率l 概率分布是经典统计推断的理论基础 推断的理论基础5 - 62022-7-22数据分析基础R语言实现(贾俊平)随机变量(随机变量(random variable)l 事先不知道会出现什么结果,一般用 X,Y,Z 来表示投掷两枚硬币出现正面的数量一座写字楼,每平方米的出租价格一个消费者对某一特定品牌饮料的偏好 推断的理论基础l 离散型随机变量随机变量 X 取有限个值或所有取值都可以逐个列举出来以确定的概率取这些不同的值l 连续型随机变量可以取一个或多个区间中任何值 所有可
4、能取值不可以逐个列举出来,而是取数轴上某一区间内的任意5 - 72022-7-22数据分析基础R语言实现(贾俊平) 推断的理论基础5 - 82022-7-22数据分析基础R语言实现(贾俊平)正态分布(正态分布(normal distribution)l由C.F.高斯(Carl Friedrich Gauss,17771855)作为描述误差相对频数分布的模型而提出l描述连续型随机变量的最重要的分布l许多现象都可以由正态分布来描述 l可用于近似离散型随机变量的分布,如二项分布l经典统计推断的基础l概率密度函数 推断的理论基础5 - 92022-7-22数据分析基础R语言实现(贾俊平) 推断的理论基
5、础-6-4-202460.00.10.20.30.4xDensityN(-2,1)N(-2,1.5)N(2,1.5)5 - 102022-7-22数据分析基础R语言实现(贾俊平)正态分布正态分布图形的特点图形的特点l 正态随机变量在特定区间上取值的概率由正态曲线下的面积给出,而且其曲线下的总面积等于1l 经验法则总结了正态分布在一些常用区间上的概率值 推断的理论基础68.27%2295.45%3399.73%5 - 112022-7-22数据分析基础R语言实现(贾俊平)标准正态分布标准正态分布l随机变量具有均值为0,标准差为1的正态分布l任何一个一般的正态分布,可通过下面的线性变换转化为标准正
6、态分布l标准正态分布的概率密度函数 推断的理论基础-4-20240.00.10.20.30.4zDensityPz 2z 2-4-20240.00.10.20.30.4zDensityP1 z 2z 1z 2-4-20240.00.10.20.30.4zDensityz0.05 1.645Pz 1.645-4-20240.00.10.20.30.4zDensityz0.025 1.96z0.025 1.96Pz 1.96Pz 1.965 - 122022-7-22数据分析基础R语言实现(贾俊平) 推断的理论基础5 - 132022-7-22数据分析基础R语言实现(贾俊平) 推断的理论基础T T
7、 分布与标准正态分分布与标准正态分布曲线的比较布曲线的比较5 - 142022-7-22数据分析基础R语言实现(贾俊平)【例【例5-25-2】计算:(1)自由度为10,t值小于-2的概率(2)自由度为15,t值大于3的概率(3)自由度为12,t值等于2.5的双尾概率(4)自由度为25,t分布累积概率为0.025时的左尾t值(5)自由度为20,双尾概率为0.05时的双尾t值 推断的理论基础5 - 152022-7-22数据分析基础R语言实现(贾俊平) 推断的理论基础5 - 162022-7-22数据分析基础R语言实现(贾俊平) 推断的理论基础5 - 172022-7-22数据分析基础R语言实现(
8、贾俊平) 推断的理论基础246810总体分布频率0.00.20.40.60.81.0样本均值的分布频率2468100.000.050.100.150.205 - 182022-7-22数据分析基础R语言实现(贾俊平) 推断的理论基础5 - 192022-7-22数据分析基础R语言实现(贾俊平)样本均值的分布与总体分布及样本量的关系样本均值的分布与总体分布及样本量的关系 推断的理论基础5 - 202022-7-22数据分析基础R语言实现(贾俊平) 推断的理论基础5 - 212022-7-22数据分析基础R语言实现(贾俊平) 推断的理论基础5 - 222022-7-22数据分析基础R语言实现(贾俊
9、平) 参数估计5 - 232022-7-22数据分析基础R语言实现(贾俊平) 参数估计5 - 242022-7-22数据分析基础R语言实现(贾俊平)区间估计区间估计l在点估计的基础上,给出总体参数估计的一个估计区间l根据样本统计量所构造的总体参数总体参数在一定置信水平下的估计区间,称为置信区间(confidence interval,CI),其中区间的最小值称为置信下限,最大值称为置信上限l该区间由样本统计量加减估计误差而得到 参数估计置信水平(置信水平(confidence level)l将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例l也称为置信度或置信系数(con
10、fidence coefficient)l统计上,常用的置信水平有90%、95%和99%。置信水平置信水平90%0.100.051.64595%0.050.0251.9699%0.010.0052.585 - 252022-7-22数据分析基础R语言实现(贾俊平)l如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值,5%的区间不包含总体参数的真值,那么,用该方法构造的区间称为置信水平为95%的置信区间l置信区间是一个随机区间,它会因样本的不同而不同,而且不是所有的区间都包含总体参数的真值l在实际问题中,进行估计时往往只抽取一个样本,此时所构造的是与该样本相联系的一定置信水平(比如9
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教学课件05第5章 推断分析基本方法R 语言-1 教学 课件 05 推断 分析 基本 方法 语言
限制150内