《多元描述统计.ppt》由会员分享,可在线阅读,更多相关《多元描述统计.ppt(26页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第一章第一章多元描述统计分析多元描述统计分析多元数据的表格形式多元数据的表格形式n n设设p p个变量来记录事物的特征,对于每个个体或单位,记录个变量来记录事物的特征,对于每个个体或单位,记录下这些变量的测量值。我们用记号表示第下这些变量的测量值。我们用记号表示第i i个样本上第个样本上第j j个变个变量的测量值,即量的测量值,即 x xij ij=第第j j个变量的第个变量的第i i项测量值项测量值 多元数据的矩阵形式多元数据的矩阵形式n nX=(xij)np例题分析例题分析n n消费者物价指数消费者物价指数(CPI)(CPI)是反映与居民生活有关的产是反映与居民生活有关的产品及劳务价格统计
2、出来的物价变动指标,通常作品及劳务价格统计出来的物价变动指标,通常作为观察通货膨胀水平的重要指标。为观察通货膨胀水平的重要指标。n n商品零售价格指数是反映一定时期内商品零售价商品零售价格指数是反映一定时期内商品零售价格变动趋势和程度的相对数。格变动趋势和程度的相对数。n n两者都能为研究市场流通、进行国民经济核算提两者都能为研究市场流通、进行国民经济核算提供依据。供依据。n n样本数据的矩阵形式为:多元描述统计量多元描述统计量n n样本均值n n样本协方差n n样本相关系数样本均值样本均值n n样本均值样本均值是反应样本数据集中趋势的统计量,是对单个变量样本数据取值一般水平的描述。8样本均值
3、样本均值n n矩阵形式n n其中其中样本协方差样本协方差n n样本协方差 是反应数据离散趋势的统计量,协方差分析是利用线性回归的方法消除混杂因素的影响后进行的方差分析,其功能就是消除方差分析中不可控因素的影响。n n样本数据的分布程度即可由样本协方差来描述。10样本协方差样本协方差n n矩阵形式n n其中其中其中其中n n事实上,事实上,事实上,事实上,s sjkjk是变量是变量是变量是变量j j和和和和k k的协方差的协方差的协方差的协方差n n当当当当j j=k k时,时,时,时,s sjj jj是变量是变量是变量是变量j j的方差,也常记为的方差,也常记为的方差,也常记为的方差,也常记为
4、n ns sjkjk=s skjkj ,即,即,即,即S S是对称矩阵。是对称矩阵。是对称矩阵。是对称矩阵。样本相关系数样本相关系数n n样本相关系数,又称皮尔逊(Pearson)距离相关系数,是样本协方差的标准化形式,反应两个现象之间相关关系密切程度。12样本相关系数样本相关系数n n矩阵形式n n其中其中其中其中r rjkjk为样本相关系数为样本相关系数为样本相关系数为样本相关系数n nR R也为对称矩阵也为对称矩阵也为对称矩阵也为对称矩阵13样本相关系数样本相关系数n n样本相关系数r的性质:1.1.r r的值必在的值必在-1-1 与与 +1+1 之间之间2.2.r r表示两个变量之间的
5、相关程度,表示两个变量之间的相关程度,r r值越大,相关程值越大,相关程度越高:度越高:a.a.r=1 r=1 完全正相关;完全正相关;b.b.r=-1 r=-1 完全负相关;完全负相关;c.c.r=0 r=0 不相关;不相关;d.d.0 r 1 0 r 1 正相关;正相关;e.e.-1 r 0-1 r 0 负相关;负相关;数据的标准化处理数据的标准化处理n n公式公式公式公式n n其中其中其中其中n n此时,此时,此时,此时,SPSS应用应用-样本均值和方差样本均值和方差n nAnalyze Descriptive Statistics Frequencies 统计量统计量n n单击单击“S
6、tatisticsStatistics”按钮,弹出按钮,弹出“FrequenciesFrequencies:StatisticsStatistics”对话框对话框分位数分位数离散离散程度程度集中集中趋势趋势n n输出结果 X1X1X2X2N NValidValid4 4 4 4 MissingMissing0 00 0MeanMean104.4500104.4500103.5000103.5000VarianceVariance3.536673.536673.446673.44667n n结果解释n n两个变量的均值分别为两个变量的均值分别为104.45104.45和和103.5103.5n
7、n两个变量的方差分别为两个变量的方差分别为3.536673.53667和和3.446673.44667StatisticsSPSS应用应用-样本协方差样本协方差n nAnalyze Scale Reliability Analysis n n单击“Statistics”按钮,弹出“Reliability Analysis:Statistics”对话框 n n输出结果 R E L I A B I L I T Y A N A L Y S I S -S C A L E (A L P H A)Covariance Matrix X1 X2X1 3.5367X2 3.3933 3.4467 N of C
8、ases=4.0Reliability Coefficients 2 itemsAlpha=.9857 Standardized item alpha=.9858SPSS应用应用-样本相关系数样本相关系数n nAnalyze Correlate Bivariate n n输出结果 X1X1X2X2X1X1Pearson CorrelationPearson Correlation1 1.972(*).972(*)Sig.(2-tailed)Sig.(2-tailed).028.028 N N4 44 4X2X2Pearson CorrelationPearson Correlation.972
9、(*).972(*)1 1 Sig.(2-tailed)Sig.(2-tailed).028.028.N N4 44 4n n结果解释n n 两个变量之间的相关系数为两个变量之间的相关系数为0.9720.972,P P值为值为0.0280.028(小于显著性水平(小于显著性水平0.050.05),所以相关性显),所以相关性显著。著。SPSS应用应用-数据的标准化变换数据的标准化变换n nAnalyze Descriptive Statistics Descriptivesn n输出结果(1)N NMinimumMinimumMaximumMaximumMeanMeanStd.DeviationStd.DeviationX1X14 4102.50102.50106.30106.30104.4500104.45001.880601.88060X2X24 4101.40101.40105.30105.30103.5000103.50001.856521.85652Valid N Valid N(listwise)(listwise)4 4 n n输出结果(2)n n结果解释n n表中的表中的“zx1zx1”和和“zx2zx2”为标准化后的值,可以为标准化后的值,可以进行后续的统计分析进行后续的统计分析常用的统计图常用的统计图n n散点图n n条形图n n线图n n
限制150内