数据分析教程幻灯片.ppt
《数据分析教程幻灯片.ppt》由会员分享,可在线阅读,更多相关《数据分析教程幻灯片.ppt(98页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据分析教程第1页,共98页,编辑于2022年,星期六MINITAB=Mini+Tabulator=MINITAB=Mini+Tabulator=小型小型+计算机计算机q介绍 于1972年,美国宾夕法尼亚 州立大学用来作统计分析、教育用而开发,目前已出版 Window 用版本 Vesion12.2,并且已在工学、社会学等所有领域被广泛使用。特别是与Six-sigma关联,在GE、AlliedSignal等公司已作为基本的程序而使用。q 优点 以菜单的方式构成,所以无需学习高难的命令文,只需拥有基本的统计知识便可使用。图表支持良好,特别是与Six-sigma有关联的部分陆续地在完善之中。Mini
2、tab什么是什么是 Minitab?Minitab?第2页,共98页,编辑于2022年,星期六一般统计一般统计-基础统计 -回归分析 -分散分析 -多变量分析 -非母数分析 -TABLE(行列)-探索性 资料(数据)分析 品质管理品质管理-品质管理工具 -测定系统分析 -计量值数据分析 -计数值数据分析 -管理图分析 -工程能力分析信赖性信赖性 及及 数据分析数据分析-分布分析 -数据的回归分析 -受益分析 实验计划实验计划-要因 实验计划 -反应表面 实验计划 -混合 实验计划 -Robust 实验计划 Minitab什么是什么是 Minitab?Minitab?第3页,共98页,编辑于20
3、22年,星期六MinitabMinitab Minitab 操作操作Minitab 初始画面方法 2.利用 Minitab 图标 运行的方法 把 MinitabMinitab安装到电脑时,开始菜单 及 Minitab 公文包里生成Minitab的 运行图标。运行Minitab的方法有利用开始菜单及选择运行图标两种。方法 1.利用开始菜单 运行 Minitab 的方法 第4页,共98页,编辑于2022年,星期六Session window:直接输入 Minitab 的命令或显示类似统计表的文本型结果文 件的窗口 WorKsheets:用于直接输入数据或可以修改的窗口,具有类似 Excel中的 s
4、pread sheet功能Info窗:简要显示已使用的变量信息的窗口History窗:储存已使用过的所有命令,并帮助已使用过的命令可重复使用Graph窗:显示各种统计图表,同时可以打开15个窗口MinitabMinitab Minitab 画面画面 构成构成第5页,共98页,编辑于2022年,星期六File:有关文件管理所需的副菜单的构成Edit:编辑 Worksheet data,外部 data 的 link 及 command link editor 副菜单 Manip:Worksheet data 的 Split、Sort、Rank、Delete、Stack/Unstack 等副菜单 C
5、alc:利用内部函数的数据计算及利用分布函数的数据生成Stat:是分析统计资料的副菜单,由基础统计、回归分析、分散分析、品质管理、时针序列 分析、离散资料分析、非母数统计分析等构成 Graph:为编辑 Graph的Graph Layout,Chart副菜单及文字Graph构成Editor:不使用菜单,使用命令直接作业及Clipboard setting等副菜单Window:由控制 Window 画面构成的副菜单及 管理 Graph 画面的副菜单构成 MinitabMinitab Minitab 菜单菜单 构成构成第6页,共98页,编辑于2022年,星期六 打开打开新建:File-New(pro
6、ject,worksheet)打开保存的 Project :File-Open project打开保存的 Worksheet :File-Open Worksheet打开保存的 Graph :File-Open Graph用ODBC打开 :File-Quary Database打开TXT :File-Others file-Import special txt 保存保存保存为当前文件名:File-Save(project,worksheet)另存为:File-Save as(project,worksheet)TXT保存:File-Other file-Export special txt注注
7、)Open Graph)Open Graph 下方的下方的 Save as Save as 为根据选择的窗口可更为根据选择的窗口可更 改保存内容。改保存内容。打印打印打印当前选择 window :File-Print练习)把 当前的 Worksheet 保存为 Temp.mtw,并关闭后重新打开 MinitabMinitab Minitab 菜单菜单(File)(File)第7页,共98页,编辑于2022年,星期六恢复已删除资料清除 Cell(s)的数据删除 Cell(s)的数据 下端的 cell 移动复制 Cell(s)粘贴 Cell(s)LinK粘贴Link 管理选择所有 cell 编辑最
8、后操作的对话框打开命令编辑器一般选项Cell 用鼠标拖动工作窗口按鼠标的右键会出现 pop up menu 通过此项可编辑把 Col/Row 的全部作为工作的对象 时,选择上端/左侧。指定变量名 :在 C1(Col名)下端的 cell 上输入变量名。输入 Data :把数据和文字输入到下端的 cell 上 但,要是先输入 数值把变量属性变更为数值变量后不能输入文字。删除 Data :把相关 cell 用鼠标 drag 后按 Del 键 相关 cell 的内容被删除掉,并且下端的 cell 向上移动。练习)在 AUTO.MTW上 1)删除 4,5 Row后把 C4,C5的 DATA 变更为 23
9、4 2)把 C2 Col 移动到 C5 3)把 C4 Column Size 变更为 12 MinitabMinitab Minitab 菜单菜单(Edit)(Edit)第8页,共98页,编辑于2022年,星期六从活动 Worksheet 中复制数据,制作 subset Worksheet。把活动 Worksheet 分成两个以上新的 Worksheet把一列以上的数据移到多个列上把多个列上的数据合成一个列 交换行和列的位置对齐排列数据数据上注明序位删除特定列的行把多个列的文字数据合并为一个列数据按变换条件交换变更 Data的属性把数据在Session窗口里输出把多个 Worksheet 合并
10、为一个 Worksheet删除行、常数、行列把列上内容复制到其它列上MinitabMinitab Minitab 菜单菜单(Manip)(Manip)第9页,共98页,编辑于2022年,星期六练习)把 EXH_AOV.MTW 的 Durability 和 Carpet 保存在新的 Worksheet 后,(1)把 Durability 为 Unstack (2)用上面 Unstack 的内容 把 C7的 data保存到 C8 Subscript。练习)在 AUTO.MTW中,(1)Age 按 No.M 的顺序排列。(2)按 Yes.M 的顺序排列的 No.F 保存到 C11。Minitab习题
11、习题第10页,共98页,编辑于2022年,星期六把多数的 col 使用函数计算后,保存到新的 col 上把1个 col 的统计值保存到新的 col 上用1个以上的 col 计算统计值后,保存到新的 col 上变换为标准化资料把数据属性变更为数值属性把数据属性变更为文字属性生成 Pattern 数据把 X、Y、Z 的值用 3D 图象方式组合后生成 Mesh 数据生成在回归分析中要使用的指示变量指定 Random 数据的基准点生成符合分布函数的 Random 数据生成符合分布函数的概率,并用数据保存行列MinitabMinitab Minitab 菜单菜单(Calc)(Calc)第11页,共98页
12、,编辑于2022年,星期六练习)把 EXH_AOV.MTW 的 Durability 和 Carpet保存到新的 Worksheet 后 (1)把 Durability 和 Carpet 相加的值保存到 Dura-Carpet 上。(2)把 Durability-Carpet保存到 Dura-Carpet 上。练习)把 EXH_AOV.MTW 的 Durability 和 Carpet保存到新的 Worksheet 后 (1)求 Durability 的 基础统计值。(2)Durability的Range保存到 C5。练习)把 EXH_AOV.MTW 的 Durability 和 Carpet
13、保存到新的 Worksheet 后 (1)把 Durability 正态化。(2)把 Durability 标准化为3和4之间的数据。练习)生成 1 15 的奇数,每个数二回,全体集合反复三回的数据。练习)把 Red Blue White Black 生成各值是二回,全体反复二回的数据。练习)生成从 1996.04.017.30之间按一周间隔形成的数据。练习)生成 1996年 4月 1日、97年 7月 30日、98年 12月 25日为各二回,全体为三回形成的数据。练习)在平均 300,标准偏差5的正态分布当中抽出 40个 sample 保存到 C5上。Minitab习题习题第12页,共98页,
14、编辑于2022年,星期六MinitabMinitab Minitab 菜单菜单(Window)(Window)q window window:集合了把 MinitabMinitab的所有 windowwindow 调节的命令和总体管理的 Graph,WorksheetGraph,Worksheet的命令等,全面性 WindowWindow 的运营命令。指定把各个 window 都显示,或者用小图标来显示 把 Tool bar 与 Status bar 隐藏或显示 使总括 Graph window 的 window活性化 使管理 Worksheet 的 window活性化 活性 window 用
15、 Vmark 表示,用 Vmark标记打开 window 第13页,共98页,编辑于2022年,星期六第14页,共98页,编辑于2022年,星期六2.2.基础统计基础统计第15页,共98页,编辑于2022年,星期六基础统计量输出基础统计量保存对母平均的推定及检定对母比率的推定及检定相关分析公分散分析正态性检定Minitab基础统计基础统计 两个母集团的分散的同一性检定第16页,共98页,编辑于2022年,星期六资料应为连续性的列资料,同时应为数值资料。能输出图表。VariablesVariables:选择需要分析的 Col(变量)By variableBy variable:使用集团(Gvou
16、p)变量计算基础统计量-N:data 数值 -Mean:平均-Median:中央值 -TrMean:调整平均-StDev:标准偏差 -SE Mean:Standard Erro of Mean-Minimum:最小值 -Maximum:最大值-Q1:1/4数 -Q3:3/4数Minitab基础统计量基础统计量 (Display Descriptive Statistics)第17页,共98页,编辑于2022年,星期六 Histogram of dataHistogram of data:制作 HistgramHistogram of data with normal curveHistogra
17、m of data with normal curve:制作 Histogram和正态分布曲线Dotplot of dataDotplot of data:制作 Dotplot Boxplot of dataBoxplot of data:制作 BoxplotGraphical summaryGraphical summary:把统计值用Graph输出Normality TestNormality Test:正态性检定 A-SquaredA-Squared:越接近零时判断为接近正态P-ValueP-Value:比留意水准大时为正态性Minitab基础统计量基础统计量 (Display Desc
18、riptive Statistics)第18页,共98页,编辑于2022年,星期六计算统计量并保存在当前的 Worksheet 在选择两个以上的 Col 时,变量名区分为 1,2。当指定 By variable时,随着相关 Variable的种类按 Row 方向保存。-First quartile:1/4数-Third quartile:3/4数-Interquartile range:Q3-Q1-Skewness:歪度分布的对称性,越接近0 越满足对称性-Kurtosis:添度分布的尖的程度为 0时正态分布,负数为完满,正数时 比正态分布尖-MSSD:把前后数据差的乘方除以2-N nonmi
19、ssing:填满的Col数-N missing:空 Col 数-Cumulative N:Col的DATA数-Percent:集团占有率-Cum percent:累积占有率Minitab保存基础统计量保存基础统计量 (Store Descriptive Statistics)第19页,共98页,编辑于2022年,星期六-留意水准:犯第一种错误的最大概率 -P-Value:犯一种错误的概率的推定值-驳回领域:驳回假设的部分领域 -两侧检定:驳回领域存在于两端的检定-单侧检定:驳回领域存在于分布一端时的检定 Minitab活用活用 Minitab Minitab 的假设检定的假设检定第20页,共9
20、8页,编辑于2022年,星期六知道标准偏差时的母平均推定和检定 检定母平均是否已知道的特定值Variables:选定要分析的 ColConfidence interval:指定计算信赖区间的信赖度Test mean:检定对象值(检定时指定)Alternative:设定对立假设Sigma:输入标准偏差p 值比留意水准小时驳回归属假设mu:归属假设,mu not:对立假设结果解释结果解释:p值比留意水准小 故驳回归属假设,即母平均不等于5。Test mean 指定的情况Minitab1-Sample Z1-Sample ZEXH_STAT.MTWOne-Sample Z:ValuesTest of
21、 mu=5 vs mu not=5The assumed sigma=0.2Variable N Mean StDev SE MeanValues 9 4.7889 0.2472 0.0667Variable 95.0%CI Z PValues (4.6582,4.9196)-3.17 0.002第21页,共98页,编辑于2022年,星期六结果解释结果解释:信赖区间为最小 4.6582,最大4.9196(信赖度为 95%时)图像对 Test 与 Confidence interval 的输出 不同。Test 时 Ho值追加表示。Test Minitab1-Sample Z1-Sample Z第
22、22页,共98页,编辑于2022年,星期六不知标准偏差时母平均的推定和检定Variables:指定要分析的 Col Confidence interval:指定计算信赖区间的信赖度Test mean:指定检定时对象值 Alternative:设定对立假设StDev:标准偏差SE Mean:平均误差CI:信赖区间mu:归属假设,mu not:对立假设P值比留意水准小时驳回Ho,即p值指脱离的概率。结果解释结果解释:p值小于5%留意水准,故驳回归属假设,即平均不等于5Test mean 指定的情况指定的情况Minitab1-Sample t1-Sample tEXH_STAT.MTW第23页,共9
23、8页,编辑于2022年,星期六不知标准偏差时两个母平均差的推定和检定Samples in one column(stack形态):在1Col中比较两个 集团 Sample in different columns(unstack形态)-First:选择第一个 Col -Second:选择第二个 Col Alternative:设定对立假设Confidence level:设定信赖水准Assume equal variance:假设两个集团的母分散一致结果解释结果解释:p值大于 5%有益水准,故选择归属假设,即两个母平均在95%信赖区间无差异Minitab2-Sample t2-Sample t
24、Two-Sample T-Test and CI:BTU.In,DamperTwo-sample T for BTU.InDamper N Mean StDev SE Mean1 40 9.91 3.02 0.482 50 10.14 2.77 0.39Difference=mu(1)-mu(2)Estimate for difference:-0.23595%CI for difference:(-1.464,0.993)T-Test of difference=0(vs not=):T-Value=-0.38 P-Value=0.704 DF=80Furnace.mtw第24页,共98页,
25、编辑于2022年,星期六有关对应的两个母集团的母平均差的推定和检定First sampleFirst sample:选择第一个 data Col Second sampleSecond sample:选择第二个 data Col -1 Col 与 2 Col 的资料数应相同Confidence levelConfidence level:输入信赖度Test meanTest mean:输入对应差的检定平均值AlternativeAlternative:设定对立假设结果解释结果解释:p值小于留意水准 5%,故驳回归属 假设,即两个母平均间有差EXH_STAT.MTWMinitabPaired t
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分析 教程 幻灯片
限制150内