样本描述性统计与假设检验幻灯片.ppt
《样本描述性统计与假设检验幻灯片.ppt》由会员分享,可在线阅读,更多相关《样本描述性统计与假设检验幻灯片.ppt(57页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、样本描述性统计与假样本描述性统计与假设检验设检验第1页,共57页,编辑于2022年,星期六数据分析数据分析-何帆何帆主要内容主要内容o基本数学模型o频数分析过程o数据描述过程o数据探察过程o列联表分析过程第2页,共57页,编辑于2022年,星期六数据分析数据分析-何帆何帆基本数学模型-集中趋势统计量o算术平均数算术平均数n样本数据的总和除以样本个数样本数据的总和除以样本个数n是样本数据集中趋势中最常用的统计量是样本数据集中趋势中最常用的统计量n公式公式n在不分组的情况下在不分组的情况下f都为都为1第3页,共57页,编辑于2022年,星期六数据分析数据分析-何帆何帆基本数学模型-集中趋势统计量o
2、中位数(中位数(Median)n先将样本按升序或降序排列先将样本按升序或降序排列n样本数为奇,中间的数,样本为偶,取样本数为奇,中间的数,样本为偶,取中间两个的平均中间两个的平均n例如:下列两组样本的中位数为例如:下列两组样本的中位数为_?11 2 4 9 5 23 2012 54 22 36第4页,共57页,编辑于2022年,星期六数据分析数据分析-何帆何帆基本数学模型-集中趋势统计量o众数(众数(Mode)n样本数据出现频数最多的那个数样本数据出现频数最多的那个数n不受极值影响,可能有多个不受极值影响,可能有多个n例如,下面一组样本的众数为例如,下面一组样本的众数为_?1 2 3 2 1
3、9 4 6 3 2 1 8第5页,共57页,编辑于2022年,星期六数据分析数据分析-何帆何帆基本数学模型-集中趋势统计量o调整平均数(调整平均数(Trimmed Mean)n将样本数据排序后,按照一定的比率去掉两端最大将样本数据排序后,按照一定的比率去掉两端最大值,最小值,对剩下的数据求平均值,最小值,对剩下的数据求平均nExplore功能中的调整平均数默认两端各去掉功能中的调整平均数默认两端各去掉2.5%后,对剩下的后,对剩下的95%的数据求平均的数据求平均第6页,共57页,编辑于2022年,星期六数据分析数据分析-何帆何帆基本数学模型-集中趋势统计量o几何平均数几何平均数(Geometr
4、ic Mean)n加权几何平均数加权几何平均数n简单几何平均数简单几何平均数f=1第7页,共57页,编辑于2022年,星期六数据分析数据分析-何帆何帆基本数学模型-集中趋势统计量o调和平均数(调和平均数(Harmonic)n是是n个数的倒数平均数的倒数个数的倒数平均数的倒数n适用于平均价格、平均速度方面的计算和适用于平均价格、平均速度方面的计算和分析分析n公式公式第8页,共57页,编辑于2022年,星期六数据分析数据分析-何帆何帆基本数学模型-集中趋势统计量o四分位数四分位数(Quartiles)n25分位数:最低数和中位数之间的中位数分位数:最低数和中位数之间的中位数n75分位数:最高数和中
5、位数之间的中位数分位数:最高数和中位数之间的中位数n其他分位数其他分位数第9页,共57页,编辑于2022年,星期六数据分析数据分析-何帆何帆基本数学模型-离散趋势统计量o极差极差(Range)最大值最大值-最小值最小值稳定性差稳定性差o平均差平均差(Average Difference)各样本数据与均值间差异的绝对值的均值各样本数据与均值间差异的绝对值的均值o方差方差(Variance)o标准差标准差(Standard Deviation,Std Dev)方差的算术方根方差的算术方根第10页,共57页,编辑于2022年,星期六数据分析数据分析-何帆何帆基本数学模型-离散趋势统计量o标准误标准误
6、(Standard Error,S.D.Mean)是样本平均数的标准差是样本平均数的标准差由于样本抽取的随机性,每次抽取的样本不一,样本由于样本抽取的随机性,每次抽取的样本不一,样本均值不一。考虑所有被抽取的样本均值,他们的标准均值不一。考虑所有被抽取的样本均值,他们的标准差就是标准误。差就是标准误。第11页,共57页,编辑于2022年,星期六数据分析数据分析-何帆何帆基本数学模型o偏度偏度(Skewness)反映数据分布不对称的一个数字特征反映数据分布不对称的一个数字特征当数据为正态分布时,偏度为零当数据为正态分布时,偏度为零(=0)II(0)(0)(=0)(Descriptive Stat
7、istics-Frequencieso对话框:对话框:第14页,共57页,编辑于2022年,星期六数据分析数据分析-何帆何帆Statistics对话框对话框分位数集中趋势统计量偏度和峰度离散趋势统计量第15页,共57页,编辑于2022年,星期六数据分析数据分析-何帆何帆Chart按钮按钮选择图形定义是按照频数还是按百分比作图 第16页,共57页,编辑于2022年,星期六数据分析数据分析-何帆何帆应用实例应用实例o例例1 对统计出来的红球和值,进行绘制频数对统计出来的红球和值,进行绘制频数表、直方图;计算最大最小值,均数、标准表、直方图;计算最大最小值,均数、标准差、中位数差、中位数M、p2.5
8、和和p97.5,并考察偏度,并考察偏度和峰度。和峰度。第17页,共57页,编辑于2022年,星期六数据分析数据分析-何帆何帆数据描述过程数据描述过程是否保存变量的标准化数据第18页,共57页,编辑于2022年,星期六数据分析数据分析-何帆何帆Option按钮按钮选择显示的次序选择统计量第19页,共57页,编辑于2022年,星期六数据分析数据分析-何帆何帆数据探察过程数据探察过程功能菜单功能菜单 ExploreoExplore过程主要用于对资料的性质、分布过程主要用于对资料的性质、分布特点等完全不清楚时,故又称之为特点等完全不清楚时,故又称之为探索性分探索性分析析。o在一般描述性统计指标的基础上
9、,增加有关在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,如茎叶图、数据其他特征的文字与图形描述,如茎叶图、箱图等,显得更加详细、全面,有助于用户箱图等,显得更加详细、全面,有助于用户制定继续分析的方案制定继续分析的方案 第20页,共57页,编辑于2022年,星期六数据分析数据分析-何帆何帆数据探察过程数据探察过程o对话框对话框因变量分组变量样本标签第21页,共57页,编辑于2022年,星期六数据分析数据分析-何帆何帆Statistics按钮按钮描述性统计反映集中趋势的稳健估计量样本异常嫌疑值,最大最小5个四分数第22页,共57页,编辑于2022年,星期六数据分析数据分析-
10、何帆何帆Statistics按钮按钮oDescriptives复选框:输出均数、中位数、众数、复选框:输出均数、中位数、众数、5%修正均数、标准误、方差、标准差、最小值、最大值、修正均数、标准误、方差、标准差、最小值、最大值、全距、四分位全距、峰度系数、峰度系数的标准误、偏度系全距、四分位全距、峰度系数、峰度系数的标准误、偏度系数、偏度系数的标准误及指定的均数可信区间。数、偏度系数的标准误及指定的均数可信区间。oM-estimators复选框:作中心趋势的最大似然化的复选框:作中心趋势的最大似然化的稳健估计量,输出四个不同权重的最大似然确定数。稳健估计量,输出四个不同权重的最大似然确定数。oO
11、utliers复选框:输出五个最大值与五个最小值。复选框:输出五个最大值与五个最小值。oPercentiles复选框:输出第复选框:输出第5%、10%、25%、50%、75%、90%、95%位数位数 第23页,共57页,编辑于2022年,星期六数据分析数据分析-何帆何帆Plots按钮按钮设置多个变量时箱型图的形式第24页,共57页,编辑于2022年,星期六数据分析数据分析-何帆何帆Option按钮按钮o剔除缺失值剔除缺失值o成对剔除缺失值成对剔除缺失值o单独分组,用频数表标出单独分组,用频数表标出第25页,共57页,编辑于2022年,星期六数据分析数据分析-何帆何帆实例应用实例应用o例例2 以
12、例以例1数据为例,做数据为例,做Explore过程统计,过程统计,画出茎叶图,和箱形图。画出茎叶图,和箱形图。第26页,共57页,编辑于2022年,星期六假设检验假设检验-平均数比较与平均数比较与T检验检验第27页,共57页,编辑于2022年,星期六数据分析数据分析-何帆何帆主要内容主要内容o假设检验一般理论假设检验一般理论o分组平均数比较分组平均数比较o单一样本单一样本T T检验检验o配对样本配对样本T T检验检验第28页,共57页,编辑于2022年,星期六数据分析数据分析-何帆何帆问题的提出o例3 某工厂用包装机包装奶粉,额定标准为每袋净重0.5kg.设包装机称得奶粉重量X服从正态分布,据
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 样本 描述 统计 假设检验 幻灯片
限制150内