概率数理统计Less2.ppt
《概率数理统计Less2.ppt》由会员分享,可在线阅读,更多相关《概率数理统计Less2.ppt(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、概率统计与随机过程宋 晖 2012年秋第一章 概率统计基础n1.1 基本原理n1.2 高斯分布n1.3 统计基础高斯分布(Gaussian)nNormal 正态分布n:均值(mean)n2:方差(variance),:标准方差n=1/2:精确度(Precision)Gaussian分布期望与方差n期望n方差Gaussian分布的再生性n若独立随机变量 为分别服从均值为 ,方差为 的正态分布,则 随机变量的线性组合仍然服从相同的分布 第一章 概率统计基础n1.1 基本原理n1.2 高斯分布n1.3 统计基础数据显示与图形法常用统计量常用统计分布总体和统计推断n全体被研究对象称为总体,每个研究对象
2、称为个体可以是有限的,如学校学生身高、视力n有限总体很大时,可以认为是无限的,如全国干电池寿命可以是无限的,如每天的测量气压n统计推断当无法获取总体全部个体的观测值时,只能依赖从总体中获得的某个观测子集来对总体做出推断。抽样n样本是总体的一个子集保证从样本到总体推断的正确性,选择随机抽样,表示得到的观测值是独立且随机n随机变量X总体上服从概率分布p(x),那么随机抽样的n个样本值x1,x2,xn独立且具有相同概率p(x),其联合概率:统计推断步骤随机抽样数据分析(图形法)分布假设参数估计假设检验假设修正预测总体模型数据显示和图形法n利用有启发性的图形来提取关于数据特性的信息,对数据分布进行假设
3、茎叶图(Stem and leaf)直方图(histogram)箱须图(Box-Whisker)经验分布函数图(empirical cumulative distribution)正态概率分布图(Normal Probability)茎叶图n将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少。n通常 选取520根茎汽车电池寿命2.2 4.1 3.5 4.5 3.2 3.7 3.0 2.6 3.4 1.6 3.1 3.3 3.8 3.1 4.7 3.7 2.5
4、4.3 3.4 3.6 2.9 3.3 3.9 3.1 3.3 3.1 3.7 4.4 3.2 4.1 1.9 3.4 4.7 3.8 3.2 2.6 3.9 3.0 4.2 4.5 汽车电池寿命茎叶图茎叶频率1 692 2 256695 3 0001111222333444556777889925 4 11234577 8 频率直方图n将样本取值分为r个区间,n个样本,落在某个区间(ak-1,ak的个数 nk称为频数 nk/n称为频率目标:标:利用频率直方图估计总体的概率密度n在(ak-1,ak区间用频率为纵坐标,制作相应的频率直方图相对频率直方图n每个频数除以数据总量,得到相对频率汽车电池
5、寿命相对频率分布区间组组中点频率相对频率1.5-1.91.720.050 2.0-2.42.210.025 2.5-2.92.740.100 3.0-3.43.2150.375 3.5-3.93.7100.250 4.0-4.44.250.125 4.5-4.94.730.075 相对频率折线图汽车电池寿命相对频率分布区间组组中点频率相对频率1.5-1.91.720.050 2.0-2.42.210.025 2.5-2.92.740.100 3.0-3.43.2150.375 3.5-3.93.7100.250 4.0-4.44.250.125 4.5-4.94.730.075 n根据每个分区
6、的相对频率,画出折线图估计频率分布茎叶图与直方图n茎叶图特优点没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到图中的数据可以随时记录,随时添加,方便记录与表示。只便于表示两位有效数字的数据,且只方便记录两组的数据n茎叶图与直方图类似茎叶图保留原始资料的资讯,直方图则失去原始资料的讯息将茎和叶逆时针方向旋转90,实际上就是一个直方图,可以从中统计出次数,计算出各数据段的频率或百分比。可以看出分布是否与正态分布或单峰偏态分布逼近。Box-Whisker图(箱须图)n中位数:将x1,x2,Xn按升序排列,n四分位数:25%(上Q1),75%(下Q3)n四分位数差(IQR)上四分位数与下分位数
7、之间的差值BOX图(2)n上边缘 大于Q1+1.5IQR的点或最大值n下边缘 小于Q3-1.5IQR的点或最小值n上下边缘以外的点为异常点(Outliers)n例:班级学生成绩统计(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)5333535364344454748(11)(12)(13)(14)(15)(16)(17)(18)(19)(20)52555864646568697074(21)(22)(23)(24)(25)(26)(27)(28)(29)(30)78808080828384848589最小数(90%)下四分位数(75%)中位数(50%)上四分位数(25%)最大數班
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率 数理统计 Less2
限制150内