概率数理统计精选文档.ppt





《概率数理统计精选文档.ppt》由会员分享,可在线阅读,更多相关《概率数理统计精选文档.ppt(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、概率数理统计本讲稿第一页,共三十七页第一章 概率统计基础n1.1 基本原理n1.2 高斯分布n1.3 统计基础本讲稿第二页,共三十七页高斯分布(Gaussian)nNormal 正态分布n:均值(mean)n2:方差(variance),:标准方差n=1/2:精确度(Precision)本讲稿第三页,共三十七页Gaussian分布期望与方差n期望n方差本讲稿第四页,共三十七页Gaussian分布的再生性n若独立随机变量 为分别服从均值为 ,方差为 的正态分布,则 随机变量的线性组合仍然服从相同的分布 本讲稿第五页,共三十七页第一章 概率统计基础n1.1 基本原理n1.2 高斯分布n1.3 统计
2、基础数据显示与图形法常用统计量常用统计分布本讲稿第六页,共三十七页总体和统计推断n全体被研究对象称为总体,每个研究对象称为个体可以是有限的,如学校学生身高、视力n有限总体很大时,可以认为是无限的,如全国干电池寿命可以是无限的,如每天的测量气压n统计推断当无法获取总体全部个体的观测值时,只能依赖从总体中获得的某个观测子集来对总体做出推断。本讲稿第七页,共三十七页抽样n样本是总体的一个子集保证从样本到总体推断的正确性,选择随机抽样,表示得到的观测值是独立且随机n随机变量X总体上服从概率分布p(x),那么随机抽样的n个样本值x1,x2,xn独立且具有相同概率p(x),其联合概率:本讲稿第八页,共三十
3、七页统计推断步骤随机抽样数据分析(图形法)分布假设参数估计假设检验假设修正预测总体模型本讲稿第九页,共三十七页数据显示和图形法n利用有启发性的图形来提取关于数据特性的信息,对数据分布进行假设茎叶图(Stem and leaf)直方图(histogram)箱须图(Box-Whisker)经验分布函数图(empirical cumulative distribution)正态概率分布图(Normal Probability)本讲稿第十页,共三十七页茎叶图n将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地
4、看到每个主干后面的几个数,每个数具体是多少。n通常 选取520根茎汽车电池寿命2.2 4.1 3.5 4.5 3.2 3.7 3.0 2.6 3.4 1.6 3.1 3.3 3.8 3.1 4.7 3.7 2.5 4.3 3.4 3.6 2.9 3.3 3.9 3.1 3.3 3.1 3.7 4.4 3.2 4.1 1.9 3.4 4.7 3.8 3.2 2.6 3.9 3.0 4.2 4.5 汽车电池寿命茎叶图茎叶频率1 692 2 256695 3 0001111222333444556777889925 4 11234577 8 本讲稿第十一页,共三十七页频率直方图n将样本取值分为r个区
5、间,n个样本,落在某个区间(ak-1,ak的个数 nk称为频数 nk/n称为频率目标:标:利用频率直方图估计总体的概率密度n在(ak-1,ak区间用频率为纵坐标,制作相应的频率直方图本讲稿第十二页,共三十七页相对频率直方图n每个频数除以数据总量,得到相对频率汽车电池寿命相对频率分布区间组组中点频率相对频率1.5-1.91.720.050 2.0-2.42.210.025 2.5-2.92.740.100 3.0-3.43.2150.375 3.5-3.93.7100.250 4.0-4.44.250.125 4.5-4.94.730.075 本讲稿第十三页,共三十七页相对频率折线图汽车电池寿命
6、相对频率分布区间组组中点频率相对频率1.5-1.91.720.050 2.0-2.42.210.025 2.5-2.92.740.100 3.0-3.43.2150.375 3.5-3.93.7100.250 4.0-4.44.250.125 4.5-4.94.730.075 n根据每个分区的相对频率,画出折线图估计频率分布本讲稿第十四页,共三十七页茎叶图与直方图n茎叶图特优点没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到图中的数据可以随时记录,随时添加,方便记录与表示。只便于表示两位有效数字的数据,且只方便记录两组的数据n茎叶图与直方图类似茎叶图保留原始资料的资讯,直方图则失去原始
7、资料的讯息将茎和叶逆时针方向旋转90,实际上就是一个直方图,可以从中统计出次数,计算出各数据段的频率或百分比。可以看出分布是否与正态分布或单峰偏态分布逼近。本讲稿第十五页,共三十七页Box-Whisker图(箱须图)n中位数:将x1,x2,Xn按升序排列,n四分位数:25%(上Q1),75%(下Q3)n四分位数差(IQR)上四分位数与下分位数之间的差值本讲稿第十六页,共三十七页BOX图(2)n上边缘 大于Q1+1.5IQR的点或最大值n下边缘 小于Q3-1.5IQR的点或最小值n上下边缘以外的点为异常点(Outliers)n例:班级学生成绩统计本讲稿第十七页,共三十七页(1)(2)(3)(4)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率 数理统计 精选 文档

限制150内