数据分析描述性统计分析过程.ppt
《数据分析描述性统计分析过程.ppt》由会员分享,可在线阅读,更多相关《数据分析描述性统计分析过程.ppt(33页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据分析描述性统计分析过程现在学习的是第1页,共33页几种描述性统计分析的SAS过程和作图过程proc means proc univariate proc corr proc plot/proc gplot proc capability现在学习的是第2页,共33页proc means(1)Means过程的语句格式过程的语句格式Means过程的主要控制语句如下:proc means 输入数据集名 ;var变量列表;class 变量列表;byfreq变量列表;变量;weight 变量;id变量列表 ;output ;run;现在学习的是第3页,共33页proc means(2)var语句语句规
2、定要求计算简单描述性统计量的数规定要求计算简单描述性统计量的数值变量的次序。by语句语句按按by语句定义的变量进行分组计算其相语句定义的变量进行分组计算其相应的简单统计量,要求输入数据集已按by变量排序。class语句语句与与by语句一样,可用语句一样,可用class变量定义变量定义观测组,分别计算各组观测的描述统计量。输出格式与by不同且事先不需要按class变量排序。freq语句语句指定一个数值型的指定一个数值型的freq变量,它的值变量,它的值表示输入数据集中相应观测出现的频数。weight语句语句规定一个规定一个weight变量,它的值表示变量,它的值表示相应观测的权数。id语句语句在
3、输出数据集中增加一个或几个附加变在输出数据集中增加一个或几个附加变量,目的在于识别输出数据集里的观测。其值为生成这个观测的输入数据集中相应观测组里id变量具有的最大值。现在学习的是第4页,共33页ntcvproc means(3)proc means语句中可用的统计量关键字语句中可用的统计量关键字统计量名称含义统计量名称 含义未丢失的观测个数mode众数,出现频数最高的数nmissmeanstderrsumstdvarusscssskewnesskurtosis丢失的观测个数算术平均均值的标准误差加权和标准偏差方差变异系数的百分数加权平方和关于均值偏差的加权平方和对称性的度量偏度对尾部陡平的度
4、量峰度sumwgtmaxminrangemedianprtclmlclmuclm权数和最大值最小值极差,maxmin中间值总体均值等于0的t统计量t分布的双尾p值置信度上限和下限置信度下限置信度上限现在学习的是第5页,共33页proc means(4)output语句中的选项。语句中的选项。输出数据集输出数据集名。统计量关键字=变量名列表规定在输出数据集中要包含的统计量并规定这些统计量在新数据集中的变量名。means过程对过程对output语句的次数没有语句的次数没有限制,可以使用几个output语句来创建内容不同的多个数据集。现在学习的是第6页,共33页Nproc means(5)SAS程序
5、程序data examp1;input x;cards;70.4 72.0 76.5 74.3 76.5 77.6 67.3 72.0 75.0 74.373.5 79.5 73.5 74.7 65.0 76.5 81.6 75.4 72.7 72.767.2 76.5 72.7 70.4 77.2 68.8 67.3 67.3 67.3 72.775.8 73.5 75.0 72.7 73.5 73.5 72.7 81.6 70.3 74.373.5 79.5 70.4 76.5 72.7 77.2 84.3 75.0 76.5 70.4;proc means data=examp1 n m
6、ean cv skewness kurtosis range median;var x;run;输出The MEANS ProcedureAnalysis Variable:xMeanVariationSkewnessKurtosisRangeMedian50 73.7460000 5.4083794 0.1540111 0.3581179 19.300000073.5000000现在学习的是第7页,共33页proc univariate(1)单变量统计分析对一组单指标实验数据进行分析常采用两种方法:图示法包括茎叶图、盒型图和正态概率图。描述统计量包括矩、分位数、极端值和頻数分布表。现在学习的
7、是第8页,共33页proc univariate(2)Univariate过程的主要控制语句如下:过程的主要控制语句如下:proc univariate 输入数据集名 ;varbyfreqweightid变量列表变量列表变量 ;变量 ;变量列表;output ;run;现在学习的是第9页,共33页proc univariate(3)Univariate过程的主要控制语句如下:过程的主要控制语句如下:proc univariate 输入数据集名 ;varbyfreqweightid变量列表变量列表变量 ;变量 ;变量列表;output ;run;现在学习的是第10页,共33页教材1.1例题 ex
8、amp1_1(SAS程序)data examp1_1;input x;cards;74.3 78.8 68.8 78.0 70.4 80.5 80.5 69.7 71.2 73.579.5 75.6 75.0 78.8 72.0 72.0 72.0 74.3 71.2 72.075.0 73.5 78.8 74.3 75.8 65.0 74.3 71.2 69.7 68.073.5 75.0 72.0 64.3 75.8 80.3 69.7 74.3 73.5 73.575.8 75.8 68.8 76.5 70.4 71.2 81.2 75.0 70.4 68.070.4 72.0 76.5
9、 74.3 76.5 77.6 67.3 72.0 75.0 74.373.5 79.5 73.5 74.7 65.0 76.5 81.6 75.4 72.7 72.767.2 76.5 72.7 70.4 77.2 68.8 67.3 67.3 67.3 72.775.8 73.5 75.0 72.7 73.5 73.5 72.7 81.6 70.3 74.373.5 79.5 70.4 76.5 72.7 77.2 84.3 75.0 76.5 70.4;proc univariate data=examp1_1;var x;run;现在学习的是第11页,共33页教材1.1例题 examp
10、1_1(SAS结果1)The UNIVARIATE ProcedureVariable:xMomentsNMeanStd DeviationSkewness100 Sum Weights73.66 Sum Observations3.94008153 Variance0.06007521 Kurtosis100736615.52424240.03386864Uncorrected SS544116.46 Corrected SS1536.9Coeff Variation 5.34901103 Std Error MeanBasic Statistical Measures0.39400815L
11、ocationVariabilityMean 73.66000 Std DeviationMedian 73.50000 VarianceMode 73.50000 Range3.9400815.5242420.00000Interquartile Range4.60000现在学习的是第12页,共33页教材1.1例题 examp1_1(SAS结果2)The UNIVARIATE ProcedureQuantiles(Definition 5)Quantile100%Max99%95%90%75%Q3Estimate84.3082.9580.5079.1575.8050%Median25%Q11
12、0%73.5071.2068.405%1%0%Min67.3064.6564.30现在学习的是第13页,共33页proc capability(能力分析过程)PROC CAPABILITY is designed for processcapability analysis,including:Histograms(直方图)and comparative histograms.Cumulative distribution function plots(cdf plots)(累积分布函数).Quantile-quantile plots(Q-Q plots),probabilityplots,
13、and probability-probability plots(P-P plots).These plots facilitate the comparison of a datadistribution with various theoretical distributions.Goodness-of-fit(拟合优度)tests for a variety ofdistributions including the normal.Statistical intervals(prediction,tolerance,andconfidence intervals)for a norma
14、l population.现在学习的是第14页,共33页教材1.2例题 examp1_4(SAS程序)data examp1_4;input x;cards;74.3 78.8 68.8 78.0 70.4 80.5 80.5 69.7 71.2 73.579.5 75.6 75.0 78.8 72.0 72.0 72.0 74.3 71.2 72.075.0 73.5 78.8 74.3 75.8 65.0 74.3 71.2 69.7 68.073.5 75.0 72.0 64.3 75.8 80.3 69.7 74.3 73.5 73.575.8 75.8 68.8 76.5 70.4
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分析 描述 统计分析 过程
限制150内