Minitab实战.docx
《Minitab实战.docx》由会员分享,可在线阅读,更多相关《Minitab实战.docx(57页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、minitab操作有些时候我们在复制数据进入minitab后,由于分析的需要,需要对数据的排列进行处理,我们会有很多偷懒的方法,先看看下图的命令菜单。l 它们分别为堆叠栏、堆叠栏块、堆叠行。针对下图的数据我们在选择上面的堆叠栏时,出现如图的对话框,并如图输入指令时,堆叠行的对话框操作基本与堆叠栏相同,输出的不同可以根据附图看出。堆叠的操作在很多的分析中可以应用,如方差分析、测量系统分析、控制图等等。l 转换栏操作1有些时候我们的数据需要从栏的顺序结构转换为行的结构,这时可以使用转换栏操作,如图。l 转换栏操作2利用转换栏的操作,针对下图1的数据,进行图2的对话框操作后的结果如图1。=将A、B栏
2、的数据转换为行的格式。转换栏前后数据l 按序排列数据有时为了分析和观察的方便,需要将数据按某栏的数据大小进行排列,这是可以使用sort命令,对话框如图。针对图1的数据按图2对话框操作以后的数据排列效果如图1。l 栏运算1在进行minitab分析时,有时需要对数据进行简单的运算或函数运算,完成这个功能的菜单操作如图1,出现的对话框及简要的操作方法如图2。sample针对图中的C1栏进行简单运算和对数运算的结果如图。l 行、栏统计1我们有时需要对某一栏或行的数据进行一些基本统计,执行如图菜单可帮帮你。在执行菜单后出现的对话框如图,此命令一次只提供一个基本统计参数的运算,包括:均指、和、方差、极值、
3、缺失数据等,然后输入需要计算的栏或行所在栏组就可以了。l 标准化操作标准化结合与分布概念应该不是一个陌生的名词,minitab的操作菜单如图。从出现的对话框来看,minitab提供5种标准化的方法:1.减去均值并除以标准差;2.减去均值;3.除以标准差;4.减去指定的值并除以指定的值;5.将数据标准化,使得数据变化在某个范围内。什么是标准化结合?是标准化操作,例如将均值为,标准差为的正态分布转化为标准正态分布,其操作就是(x-)/,这个应用是很重要的。各种常见的标准化操作上面讲的5种,但应用第一种居多。l 生成模板数据有时我们在进行输入数据的时候,有些数据是呈现某种规律的,但一个个输入就显得比
4、较麻烦,我们可以试试生成模板数据这个操作,菜单操作如图。生成模板数据共有5种:1.等距数据的生成2.自定义数列数据的生成3.自定义文本数据的生成4.等距日期数据的生成5.自定义日期数据的生成等距数据的操作如图1,例如生成简单的1到3的数据,间距为1,每个数据重复2次,总体重复两次,按图1操作后,输出结果如图2。生成自定义数列数据的对话框如图,例如生成数列为1、3、9的数据,每个数据重复2次,总体重复两次,按图1操作后,输出结果如图2。对于其它几种模板数据的生成方式,操作基本与上面讲述的对话框操作及生成结果相似,例如自定义文本数据的生成,就是在Text values (e.g., red lig
5、ht blue)框中输入要生成的文本数列就可以了,如a、b、c。l 生成随机数据进行随机抽样或生成各种分布的随机数据,可以进行一些验证分析和抽样分析,其菜单操作如图。选择上面菜单的Sample From Columns,出现进行随机抽样的对话框及操作如图1。例如我们要从总体为1-10的数据中随机抽取5个样本,则在Sample _ rows from column(s)中输入5,并给出总体数据1-10所在栏,选择存储位置,选择是否重复抽样等后,输出结果如图2。如果抽取的样本量大于总体数据量,就必须选择Sample with replacement,也就是允许重复抽样,例如从1-10中抽取12个数
6、据,输出如图2。生成随机数菜单的后续选项主要就是生成服从各种分布的随机数据,其输入的内容主要是:1.生成分布数据的样本量为多少2.存储数据的栏3.确定分布的参数值给定,如正态分布的均值和标准差,卡方分布的自由度,F分布的分子和分母自由度。以下是生成卡方分布的示例:1.样本量为102.生成10组,分别存储于C1-C103.自由度给定为5对话框的输入和数据输出结果如图。其它的分布数据生成类似。l 很多时候我们因为没有现成的分布概率表,所以无从查起,minitab中提供了这个功能,如附图所示菜单操作,它提供了多种分布的概率密度函数值、累积概率密度及分位数值得计算。在出现的对话框中,请求选择的也是这三
7、个值,任君选择,三个值得图形含义见附图2。示例需求标准正态分布的均值位置的累积概率。对话框输入如图,结果如下:Cumulative Distribution Function Normal with mean = 0 and standard deviation = 1xP(X=x0 0.5示例2需计算标准正态分布的0.9分位数,操作如图,输出结果如下:Inverse Cumulative Distribution Function Normal with mean = 0 and standard deviation = 1P(X Basic Statistics Graphical Sum
8、mary,其对华框输入很简单,如图1,例如对以下数据的分析,分析结果如图2。date20.676020.480720.238819.502719.297122.300317.781819.903720.380920.054620.016220.707421.327620.538619.619618.970819.923220.348320.661220.607718.027319.956219.554720.637021.643120.290420.724119.221419.985219.02991-Sample ZStat Basic Statistics 1-Sample Z单样本Z检验
9、,假设检验的一种,检验样本的均值水平,总体的标准差已知(一般来源于可靠有效的历史数据结果或某些特殊场合)的情况。例如针对以下数据,检验原假设为样本均值等于34,检验的对话框操作如图。date30.108530.134829.116731.398030.363230.146031.388830.430830.654731.045630.494629.555431.423031.961930.547429.290029.760630.512531.106129.694829.546129.801628.872730.445529.864930.556330.051728.671830.304731
10、.4132minitab输出结果为,P值近似为0,说明拒绝原假设,均值不等于34。One-Sample Z: date Test of mu = 34 vs not = 34The assumed standard deviation = 1Variable N Mean StDev SE Mean 95% CI Z Pdate 3030.28870.8032 0.1826(29.9309, 30.6466)-20.330.000点击1-sample t test对话框的options,弹出对话框如图,其中可以自行输入置信度水平和选择假设检验的备择假设形式。1-sample t test单样本
11、t检验与单样本Z检验虽然在操作上比较相同,但其应用是不同的,单样本t检验主要针对总体标准差未知的情况。针对上例的数据,采用1-samplet检验,操作如图,结果如下:One-Sample T: date Test of mu = 34 vs not = 34Variable N Mean StDevSE Mean 95% CI T Pdate 3020.08020.9415 0.1719(19.7286, 20.4318)-80.980.000(options复选对话框的操作意义相同)2-sample t testStat Basic Statistics 2-Sample t双样本t检验,比
12、较两个水平是否有显著差别或者两个水平的大小比较问题。在进行检验时,首先确定数据的正态性和方差其性,因为双样本t检验是在总体呈正态分布的基础上进行的,而且方差不同检验的方法也不同。假设对以下数据的检验,先验证正态性及方差齐性,然后进行双样本t检验,菜单操作如图。输出结果如下,我们从p值可以得出结论,两个工厂间存在显著的差别。Two-Sample T-Test and CI: 甲工厂, 乙工厂 Two-sample T for 甲工厂 vs 乙工厂 N MeanStDevSE Mean甲工厂10 50.25 1.18 0.37乙工厂1055.1750.662 0.21Difference = mu
13、 (甲工厂) - mu (乙工厂)Estimate for difference:-4.9267895% CI for difference:(-5.82624, -4.02731)T-Test of difference = 0 (vs not =): T-Value = -11.51P-Value = 0.000DF = 18Both use Pooled StDev = 0.9573甲工厂 乙工厂49.2619 54.483451.1988 55.978651.1832 56.100650.0621 54.611751.1369 55.123750.7307 55.140049.2937
14、 54.692551.7491 54.385447.9031 56.061549.9637 55.1736对话框的补充1.提供3种数据输入形式 数据在一栏,水平标志在一栏,选择Samples in one column,在Samples中输入数据所在栏,在Subscripts输入水平标志。 两个水平的数据分别在两栏,选择Samples in different columns,在First和second中分别输入两个水平数据所在的栏。 已知两个水平的样本量、均值和标准差而没有详细的样本数据,则选择Summarized data,在Sample size、Mean、Standard deviat
15、ion中分别输入两个水平的样本量、均值和标准差。2.Assume equal variances选项,如果两个水平方差相等,则点选此项,否则不选,minitab将执行不同的分析方法。3.graphs复选对话框,选择将出现如图1的对话框,可以选择生成置信区间图或箱线图。4.options复选对话框,选择将出现如图2的对话框,可以确定分析的置信度水平,以及检验时的水平间的差值和备选假设的模式。注意这是的备择假设模式如果是大于或小于是,minitab默认将第一个样本放在前面,第二个样本放在后面。Paired t在介绍成对t检验前,先将以下成对t检验的概念* 我们在进行2 sample t检验时,差异
16、仅由因素水平不同引起,但有时候却并不是这样,那就是除了因素水平不同引起的差异外(我们要检验的),那就是每次实验还受另外一个变量的影响,也就是说,这个变量对每次实验的两个水平的影响相同,但对多次实验之间的影响就有区别,这时候就不能简单的将两个水平的样本进行比较,而是对两个水平的差值进行比较,这样就将另外的变量的影响排出了,计算的结果也就可靠,就好像控制图内组内和组间的概念,因素水平的影响就反映在组内(若干个同一次实验)了。 举个通俗的例子,我们要比较两种鞋底的耐磨程度,于是选择20个人进行实验,每个人两只脚分别穿一种鞋底作的鞋,在这里,我们可以看到,除了两种鞋底的不同引起的耐磨效果不同外,20个
17、人体重的不同也是一个影响,这是要单独的考量鞋底不同的影响,就要排除体重这个变量,怎么办呢,成对T检验,就是这样一个概念,将每个人的磨损情况做差值进行分析。*菜单操作Stat Basic Statistics Paired t如图只要了解了pairet t 与 2 sample t 的区别,其对话框的操作类似,数据分别存储在两个栏内,在对话框直接选择进入first 和 second复选框内就可以。graph、option操作意义相同。1.如何进行等方差检验后续会讲到及minitab操作2.方差等和不等是2sample t 检验有何不同请看附图,主要是统计参数和自由度的计算不同。1 Proport
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Minitab 实战
限制150内