统计学基础知识培训.ppt





《统计学基础知识培训.ppt》由会员分享,可在线阅读,更多相关《统计学基础知识培训.ppt(44页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计学基础知识培训2007年5月根据测量尺度数据的分类姓名性别级别年龄绩效分数月均收入甲乙丙丁戊戌1101100001122125262725318.67.89.27.98.98.4247923452547268927763124注:1.本表纯属虚构,如有雷同实属巧合;2.性别栏0代表男,1代表女;级别栏0代表员工,1代表领班,2代表主管;3.绩效栏10分为满分。1999年某公司员工情况明细表数据的分类根据数据测量的尺度:分为定类数据、定序数据、定距数据、定比数据根据描述对象与时间的关系:分为截面数据和时间序列数据根据统计数据的收集方法:分为观测数据和实验数据你想要干什么?一.归纳、描述或者显
2、示数据二.观察变量和数据的分布三.比较组间数据的不同四.变量之间显著性关系的测度五.相似数据分组的测度六.相似变量的压缩测度结束4你要归纳整理的是什么类型的数据?1.已分类数据(定类、定序)2.连续、数值型数据(定距、定比)返回你想如何归纳整理数据?1.分类计算频数和百分比2.计算两分类变量下的频数和百分比3.计算比率值:比率是各不同类别数值之间的比值返回分类变量的图形及图表显示员工级别频数百分(%)累积百分比(%)员工领班主管经理助理75 15 8 275%15%8%2%75.00%90.00%98.00%100%合计100100%AnalyzeDescriptive StatisticsF
3、requencies返回两分类变量数据的图表及图形显示员工级别30岁30-39岁40-49岁49-50岁合计员工领班主管经理助理 47 7 2 20 5 2 1 6 2 3 1 2 1 1 75 15 8 2合计 56 28 12 4100AnalyzeDescriptive StatisticsCrosstabs返回比率值的计算及显示AnalyzeReportsCase summaries员工级别30岁30-39岁40-49岁49-50岁0时为尖峰分布;当K0时为扁平分布 与数据分布相关的测度量总结定类定序定距和定比集中趋势适用的统计量众数中位数分位数众数 均值 加权平均 几何平均 中位数
4、分位数 众数离散趋势使用的统计量异众比率四分位差异众比率 全距 方差 标准差 四分位差 异众比率用于比较不同组数据的相对位置 标准分数:zi=(xi-x平均)/标准差用于比较不同组数据相对离散程度 离散系数:V=标准差/x平均值常见的数据分布正态分布 在社会经济问题中,有许多随机变量的概率分布服从正态分布,如身高、体重等。正态分布记作XN(,),为随机变量X的均值,为随机变量X的标准差。决定了正态分布图形的中心位置,决定了图形中峰的陡峭程度,当 较大,图形较缓,当 较小,图形趋于陡峭。所有的正态分布均能通过Z=(X-)/化成标准正态分布XN(0,1)(均数为0,方差为1)。随机变量X处在一个正
5、负一个之内的概率为68.26%;2个之内的概率为95.45%;3个之内的概率为99.73%。返回你要比较什么类型的数据?1.分类数据(定比、定序)2.已分组的连续数值型数据(定距、定比)返回应用列联分析解决分类数据的组间比较 频数分布表每次只能描述一个变量的情况,而列联表是由两个以上的变量进行交叉分类的频数分布表,是反映两个或多个变量联合分布的表格。可用于各组比例值是否一在列联表中,可以计算以列合计为基数的列百分比或以行合计为基数的行百分比。卡方统计量提供对列联表中观察到的联系的统计显著性检验(拟合优度和变量联系),通过系数、列联系数、Cramers V和系数测量变量关系强度的指标。Analy
6、ze-Descritives-Crosstabs举例说明 某公司为了提高市场占有率,某行业有两个主要的竞争对手,A和B公司同时开展了广告宣传。在广告宣传之前,A公司的市场占有率为45%,B公司市场占有率为40%,其它公司为15%。广告战后,随机抽取了200名消费者,其中102人准备买A公司产品,82人买B公司产品,另外有16人准备买其它公司产品。问以广告战前后各公司市场占有率是否发生了变化。公司观察频率期望频率AB其它1028216908030合计200200 检验观察值和期望值的拟合优度:计算卡方值为8.18,而显著性0.05、自由度为2时的卡方值5.99,因此说明占有率发生了显著的变化。举
7、例说明 列联表格的卡方检验还用于判断两个分类变量之间是否存在联系的问题中。一种原料来自不同的地区,原材料质量被分为三个不同的等级。从这批原料中随机抽取500件进行检验,结果如下表:地区一级二级三级合计甲乙丙526050645965245274140171189合计162188150500 计算卡方值为19.82大于显著性为0.05、自由度为4的的卡方值为9.488,所以地区和原材料等级之间存在依赖关系,原材料的质量受地区影响。存在关系的假设成立,可以计算系数、列联系数Cramers V和系数测量变量关系强度的指标。返回你想要比较多少组数据或多少个变量?1.一组数据或变量与一个已知数值进行比较2
8、.两组数据或变量3.三组或者三个以上变量返回应用单样本T检验检验一组数据或变量与一已知数值是否相等 工作中经常碰到根据已有的知识或者给定的标准对单个变量做出结论,比如新产品的份额是否超过了15%等。这样的问题就可以转化为通过单样本T检验进行检验的零假设。单样本T检验检验的是抽样总体均值是否与给定假设一致。根据样本计算得出的T统计量值与给定的0.05显著性水平下的临界值进行比较,从而得出结论。SPSS实现:Analyze-Compare Means-One Sample T Test返回你的数据是如何组织起来的?1.分成两不相关组的一个连续数值型变量2.具有相关关系的两连续数值型变量返回你想要进
9、行何种独立的样本检验?步骤:1.首先检测变量是否服从正态分布,方法为通过Graphs-Interactive-Histogram(直方图)进行观察2.如果变量服从正态分布,那么应用独立样本T检验进行两样本均数的比较:Analyze-Compare Means-Independent Samples T Test3.如果变量不服从正态分布,那么应用非参数双独立样本检验进行两独立样本所在总体分布是否相同的检验:Analyze-Nonparametric Tests-2 Independent Samples返回你想要何种配对样本的检验步骤:1.同样通过直方图观察变量是否服从正态分布;2.如果服从正
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 基础知识 培训

限制150内