2013统计软件统计方法第三章.ppt
《2013统计软件统计方法第三章.ppt》由会员分享,可在线阅读,更多相关《2013统计软件统计方法第三章.ppt(49页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三第三/四章:描述性统计和直观图形四章:描述性统计和直观图形1 1、概率密度及随机数、概率密度及随机数2 2、统计量统计量3 3、R R的作图环境:图形分解、绘图命令的作图环境:图形分解、绘图命令4 4、统计图形:散点图、直方图、统计图形:散点图、直方图、ecdfecdf、QQQQ 箱线图、多维图箱线图、多维图5 5、特殊图形、特殊图形3.1 概率密度及随机数概率密度及随机数随机变量及其分布是概率统计研究中的重要基础随机变量及其分布是概率统计研究中的重要基础离散型:随机抽样【放回和不放回】离散型:随机抽样【放回和不放回】sample,二项分布二项分布binom,泊松分布,泊松分布pois,几
2、何分布几何分布geom,超几何分布超几何分布hyper,连续型:均匀分布连续型:均匀分布unif,指数分布指数分布exp,beta分布分布 正态分布正态分布norm,卡方分布卡方分布chisq,t分布分布t,F分布分布f,对数正态分布对数正态分布lnorm,伽玛分布伽玛分布gamma,柯西分布柯西分布cauchy注:加上注:加上p,d,r,q计算概率计算概率,密度密度,随机数随机数,下分位点下分位点3.1 概率密度及随机数概率密度及随机数例例1:绘制标准正态分布密度图:绘制标准正态分布密度图,区间区间3,3x=seq(-3,3,length=200)plot(x,dnorm(x,0,1),ty
3、pe=l)或者或者plot(x,dnorm(x),type=l)3.1 概率密度及随机数概率密度及随机数例例2:Xt(10),求求 P(|X|1.5)pt(1.5,10)-pt(-1.5,10)返回:返回:0.8354927例例3:Xt(10),求求y满足满足P(Xy)=0.9177463qt(0.9177463,10)返回:返回:1.5例例4:XN(60,42),模拟产生模拟产生10个随机数个随机数rx=rnorm(10,60,4)某次返回值:某次返回值:某次返回值:某次返回值:56.61105 56.04935 66.63273 57.15021 56.61105 56.04935 66.
4、63273 57.15021 53.14499 56.67600 60.84096 64.60479,62.34092 66.4692353.14499 56.67600 60.84096 64.60479,62.34092 66.469233.1 概率密度及随机数概率密度及随机数例例5:验证关系:验证关系Tt(n),F=T2F(1,n)从概率上验证:从概率上验证:P(Fx)=P(|T|0P(Tx)=1-pf(x2,1,n)/2,x,t(n)-N(0,1)例例8:正态抽样的样本,:正态抽样的样本,确定确定n的起点的起点3.2 统计量统计量统计量是数理统计及应用统计中的一项基础工作统计量是数理统
5、计及应用统计中的一项基础工作也是富有创意的一项工作,是区间估计也是富有创意的一项工作,是区间估计/假设检假设检验验/回归回归/方差分析等诸项工作的基础。方差分析等诸项工作的基础。对于于统计量的理解:量的理解:1.是样本的函数是样本的函数 G(X1,X2,Xn)2.是随机变量是随机变量 r.v.3.具有值的特性具有值的特性 G(x1,x2,xn)3.2 统计量统计量-基本统计量基本统计量1.样本均值,样本方差,样本中位数,极差样本均值,样本方差,样本中位数,极差,分分位数,众数,中程数等。位数,众数,中程数等。R中的实现中的实现mean(x);mean(x,trim=0);apply(mat,1
6、,mean)median(x);(min(x)+max(x)/2quantile(x,type=2)var(x);sd(x)range(x);max(x)-min(x)sd(x)/mean(x)#注意注意mean(x)03.2 统计量统计量-基本统计量基本统计量2.讨论均值与中位数的应用差异讨论均值与中位数的应用差异模拟:来自标准正态总体的样本,加入扰动模拟:来自标准正态总体的样本,加入扰动(异常异常值值)看看,样本均值和中位数的变化。看看,样本均值和中位数的变化。3.2 统计量统计量-基本统计量基本统计量3 讨论样本方差和有偏方差的区别讨论样本方差和有偏方差的区别模拟:来自标准正态总体的样本
7、,样本方差和有模拟:来自标准正态总体的样本,样本方差和有偏方差的取值变化。偏方差的取值变化。3.2 统计量统计量-基本统计量基本统计量4 偏度系数和峰度系数偏度系数和峰度系数利用包利用包TSA和和leaps两个包中的两个函数计算两个包中的两个函数计算 skewness(),kurtosis()问题问题:如何通过模拟数据理解和直观展示偏度和如何通过模拟数据理解和直观展示偏度和峰度峰度3.3 图形分解图形分解主标题主标题子标题子标题子标题子标题X X轴标签轴标签轴标签轴标签y y轴轴轴轴标标标标签签签签图图例例四周边距四周边距四周边距四周边距刻度刻度刻度刻度par(mai=c(0.6,0.6,0.
8、6,0.1)#par(mai=c(0.6,0.6,0.6,0.1)#指定四周空白指定四周空白指定四周空白指定四周空白plot(1:10,1:10,type=n,main=plot(1:10,1:10,type=n,main=主标题主标题主标题主标题,sub=,sub=副标题副标题副标题副标题,xlab=,ylab=,xlim=c(0,15),ylim=c(0,10),xlab=,ylab=,xlim=c(0,15),ylim=c(0,10),frame.plot=TRUE,axes=FALSE,mgp=c(0.3,0.3,0),frame.plot=TRUE,axes=FALSE,mgp=c(
9、0.3,0.3,0),cex.main=1,cex.sub=0.8)cex.main=1,cex.sub=0.8)#不画坐标轴不画坐标轴不画坐标轴不画坐标轴,标题的字体大小各不同标题的字体大小各不同标题的字体大小各不同标题的字体大小各不同,标题离坐标轴距离标题离坐标轴距离标题离坐标轴距离标题离坐标轴距离lines(c(1,11),c(8,8),lty=2);lines(c(1,11),c(6,6),lty=3);lines(c(1,11),c(8,8),lty=2);lines(c(1,11),c(6,6),lty=3);lines(c(1,11),c(4,4),lty=1)#lines(c(
10、1,11),c(4,4),lty=1)#画三种线画三种线画三种线画三种线 legend(12.5,10,c(L1,L2,L3),lty=c(2,3,1),cex=0.75)legend(12.5,10,c(L1,L2,L3),lty=c(2,3,1),cex=0.75)#图例图例图例图例axis(1,0:15,labels=0:15,cex=0.75)#xaxis(1,0:15,labels=0:15,cex=0.75)#x坐标轴坐标轴坐标轴坐标轴axis(2,0:10,labels=0:10,cex=0.75)#yaxis(2,0:10,labels=0:10,cex=0.75)#y坐标轴坐
11、标轴坐标轴坐标轴title(xlab=xtitle(xlab=x轴标签轴标签轴标签轴标签,adj=1,mgp=c(0.3,0.3,0),cex=0.75),adj=1,mgp=c(0.3,0.3,0),cex=0.75)title(ylab=ytitle(ylab=y轴标签轴标签轴标签轴标签,adj=1,mgp=c(0.3,0.3,0),cex=0.75),adj=1,mgp=c(0.3,0.3,0),cex=0.75)#x#x轴标签右对齐轴标签右对齐轴标签右对齐轴标签右对齐,y,y轴标签右对齐轴标签右对齐轴标签右对齐轴标签右对齐 3.3 图形分解图形分解代码代码 通常一个统计图形的右侧边空是
12、没有多大意义的,通常一个统计图形的右侧边空是没有多大意义的,通常一个统计图形的右侧边空是没有多大意义的,通常一个统计图形的右侧边空是没有多大意义的,左侧边空也没有必要留太多,同理上下边空的空白也不左侧边空也没有必要留太多,同理上下边空的空白也不左侧边空也没有必要留太多,同理上下边空的空白也不左侧边空也没有必要留太多,同理上下边空的空白也不能太大。能太大。能太大。能太大。而而而而R R默认绘制的图形的边空都比较大,这在截图编默认绘制的图形的边空都比较大,这在截图编默认绘制的图形的边空都比较大,这在截图编默认绘制的图形的边空都比较大,这在截图编辑的时候总是造成麻烦。所以可以在绘图开始的时候进辑的时
13、候总是造成麻烦。所以可以在绘图开始的时候进辑的时候总是造成麻烦。所以可以在绘图开始的时候进辑的时候总是造成麻烦。所以可以在绘图开始的时候进行统一边空控制。行统一边空控制。行统一边空控制。行统一边空控制。par(mai=c(bottom,left,top,right)par(mai=c(bottom,left,top,right)单位:英寸,单位:英寸,单位:英寸,单位:英寸,一英寸一英寸一英寸一英寸=2.539999918=2.539999918 厘米厘米厘米厘米3.3 图形分解图形分解边空统一控制边空统一控制如果希望将所绘制的图形覆盖在一个有效的刻度范围内,则必须如果希望将所绘制的图形覆盖在
14、一个有效的刻度范围内,则必须如果希望将所绘制的图形覆盖在一个有效的刻度范围内,则必须如果希望将所绘制的图形覆盖在一个有效的刻度范围内,则必须使用上例中参数:使用上例中参数:使用上例中参数:使用上例中参数:xlim=c()xlim=c()和和和和 ylim=c()ylim=c()例如:来自标准正态分布的例如:来自标准正态分布的例如:来自标准正态分布的例如:来自标准正态分布的100100个随机数,画出其频数直方图个随机数,画出其频数直方图个随机数,画出其频数直方图个随机数,画出其频数直方图 x=rnorm(100);hist(x)x=rnorm(100);hist(x)3.3 图形分解图形分解有效
15、区域控制有效区域控制改写代码:改写代码:改写代码:改写代码:hist(x,xlim=c(-4,3),ylim=c(0,35)hist(x,xlim=c(-4,3),ylim=c(0,35)绘制不同数据图形的直观说明可通过绘制不同数据图形的直观说明可通过绘制不同数据图形的直观说明可通过绘制不同数据图形的直观说明可通过 legend legend图例实现图例实现图例实现图例实现比如上例中,绘制三种不同线型是用图例区别:比如上例中,绘制三种不同线型是用图例区别:比如上例中,绘制三种不同线型是用图例区别:比如上例中,绘制三种不同线型是用图例区别:legend(12.5,10,c(Line1,Line2
16、,Lline3),legend(12.5,10,c(Line1,Line2,Lline3),lty=c(2,3,1)lty=c(2,3,1)注意:注意:注意:注意:12.5,1012.5,10表示的相对于表示的相对于表示的相对于表示的相对于xlimxlim和和和和ylimylim的坐标位置,的坐标位置,的坐标位置,的坐标位置,坐标起点(原点)是左下角坐标起点(原点)是左下角坐标起点(原点)是左下角坐标起点(原点)是左下角(left,bottom)(left,bottom)3.3 图形分解图形分解图例的作用图例的作用如果希望对如果希望对如果希望对如果希望对x,yx,y轴标签的输出位置进行控制,可
17、以使用几个参数轴标签的输出位置进行控制,可以使用几个参数轴标签的输出位置进行控制,可以使用几个参数轴标签的输出位置进行控制,可以使用几个参数:mgp(x,y,0):mgp(x,y,0):距离距离距离距离x x刻度的英寸刻度的英寸刻度的英寸刻度的英寸,距离距离距离距离y y刻度的英寸刻度的英寸刻度的英寸刻度的英寸 adj=0,0.5,1 :0 adj=0,0.5,1 :0 左对齐左对齐左对齐左对齐 0.5 0.5居中居中居中居中 1 1右对齐右对齐右对齐右对齐 3.3 图形分解图形分解坐标轴控制坐标轴控制如果希望对坐标轴刻度及刻度值进行控制,可以使用如果希望对坐标轴刻度及刻度值进行控制,可以使用
18、如果希望对坐标轴刻度及刻度值进行控制,可以使用如果希望对坐标轴刻度及刻度值进行控制,可以使用axisaxis axis(which,ticks,labels,las)axis(which,ticks,labels,las)which=1,2,3,4 which=1,2,3,4 分别表示分别表示分别表示分别表示bottom,left,top,rightbottom,left,top,right坐标坐标坐标坐标 ticks ticks表示刻度位置表示刻度位置表示刻度位置表示刻度位置,向量向量向量向量 labels labels表示刻度值文本,向量表示刻度值文本,向量表示刻度值文本,向量表示刻度值文
19、本,向量 las=0,1,2,3 las=0,1,2,3 分别表示分别表示分别表示分别表示labelslabels的读方向的读方向的读方向的读方向:平行坐标轴平行坐标轴平行坐标轴平行坐标轴,水行垂直水行垂直水行垂直水行垂直 坐标轴,垂直坐标轴,垂直坐标轴,垂直坐标轴,垂直 main main表示顶端的主标题表示顶端的主标题表示顶端的主标题表示顶端的主标题 sub sub 表示底端的副标题表示底端的副标题表示底端的副标题表示底端的副标题(子标题子标题子标题子标题)xlab xlab 表示表示表示表示x x轴标签轴标签轴标签轴标签 ylab ylab 表示表示表示表示y y轴标签轴标签轴标签轴标签
20、3.3 图形分解图形分解标题控制标题控制另外:另外:另外:另外:cex=0.75 cex=0.75 表示字体大小的缩放比例表示字体大小的缩放比例表示字体大小的缩放比例表示字体大小的缩放比例 分类控制分类控制分类控制分类控制cex.main,cex.sub,cex.xlab,cex.ylabcex.main,cex.sub,cex.xlab,cex.ylab lty lty表示线的类型,表示线的类型,表示线的类型,表示线的类型,lwdlwd表示线的宽度表示线的宽度表示线的宽度表示线的宽度 pch pch表示线以字符方式绘图表示线以字符方式绘图表示线以字符方式绘图表示线以字符方式绘图 abline
21、(v=x,lty,col);abline(h=y,lty,col)abline(v=x,lty,col);abline(h=y,lty,col)在当前图中添加在当前图中添加在当前图中添加在当前图中添加x=xx=x,y=y y=y的直线的直线的直线的直线 abline(a,b,lty,col)abline(a,b,lty,col)在当前图中添加在当前图中添加在当前图中添加在当前图中添加 y=a+bx y=a+bx points(x,y,pch,col)points(x,y,pch,col)在当前途中加入点在当前途中加入点在当前途中加入点在当前途中加入点其中:其中:其中:其中:ltylty控制线的
22、类型,控制线的类型,控制线的类型,控制线的类型,colcol控制颜色控制颜色控制颜色控制颜色 pch pch控制点的形状控制点的形状控制点的形状控制点的形状3.3 图形分解图形分解直线或点绘制直线或点绘制 plot(x,y)plot(x,y)绘制绘制绘制绘制y y关于关于关于关于x x的散点图的散点图的散点图的散点图 plot(x)plot(x)绘制绘制绘制绘制x x关于关于关于关于1:length(x)1:length(x)的散点图的散点图的散点图的散点图例如:例如:例如:例如:plot(rnorm(100)plot(rnorm(100)abline(h=c(-2,-1,0,1,2)abli
23、ne(h=c(-2,-1,0,1,2)练习:练习:练习:练习:绘制绘制绘制绘制-3,3之间的之间的标准正态分布,标准正态分布,标准正态分布,标准正态分布,t(10)t(10)分布分布分布分布的密度图,要求分别用实线红色和虚线蓝色,并给出图的密度图,要求分别用实线红色和虚线蓝色,并给出图的密度图,要求分别用实线红色和虚线蓝色,并给出图的密度图,要求分别用实线红色和虚线蓝色,并给出图例说明。例说明。例说明。例说明。3.4 统计图统计图-散点图散点图 hist(x,freq=TRUE)hist(x,freq=TRUE)频数直方图频数直方图频数直方图频数直方图 hist(x,freq=FALSE)hi
24、st(x,freq=FALSE)密度直方图密度直方图密度直方图密度直方图 问题:问题:问题:问题:如何根据给定的分组来画直方图?如何根据给定的分组来画直方图?如何根据给定的分组来画直方图?如何根据给定的分组来画直方图?3.4 统计图统计图-直方图直方图使用参数:使用参数:使用参数:使用参数:breaksbreaks 1 1 指定区间个数指定区间个数指定区间个数指定区间个数,R,R会自动调整会自动调整会自动调整会自动调整 breaks=6 breaks=6 不好用不好用不好用不好用 2 2 指定区间的端点,区间数等于端点个数减指定区间的端点,区间数等于端点个数减指定区间的端点,区间数等于端点个数
25、减指定区间的端点,区间数等于端点个数减1 1例如:例如:例如:例如:x=rnorm(100)x=rnorm(100)hist(x)hist(x)hist(x,breaks=6)hist(x,breaks=6)hist(x,breaks=c(-4,-2,-1,0,1,2,4)hist(x,breaks=c(-4,-2,-1,0,1,2,4)3.4 统计图统计图-直方图求解众数直方图求解众数问题:问题:请根据图形自行推导公式请根据图形自行推导公式3.4 统计图统计图经验分布图经验分布图格列文科定理给出,随机抽样的经验分布函数与分布函格列文科定理给出,随机抽样的经验分布函数与分布函格列文科定理给出,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2013 统计 软件 方法 第三
限制150内