DPS数据处理详解ppt课件.ppt
《DPS数据处理详解ppt课件.ppt》由会员分享,可在线阅读,更多相关《DPS数据处理详解ppt课件.ppt(156页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、DPSDPS数据处理数据处理系统及应用系统及应用DPSDPS介绍介绍一、DPS 基本操作1.文件基本操作打开文件:可以打开DPS数据文件;文本文件;或Excel数据文件新建文件:保存文件:n n文件打印2.数据输入和复制1)数据输入建立新的DPS文件后,便可进行输入数据操作,DPS中以单元格为单位进行数据的输入,选中单元格即可输入数据。n nDPS中数据类型分为3类:数值型;字符型;日期型。DPS根据输入数据的格式自动判断数据属于什么类型。如日期型的数据输入格式为:“月/日/年”、“月-日-年”或“时;分;秒”。如输入的数据由数字与小数点构成,如输入的数据由数字与小数点构成,DPS自动将自动将
2、其识别为数值型其识别为数值型。数据数据统计分析要求是数值数据数据统计分析要求是数值型数据。型数据。数值型数据显示为蓝色数值型数据显示为蓝色。n n字符型数据显示为黑色。点击工具栏的(设置单元格格式)按钮,弹出“单元格属性”对话框,可以改变当前数据块中的文字字体、字号、对齐方式等格式。2)数据复制)数据复制可以在不同单元格之间复制数据,也可以在不同工作表之间复制数据。可以一次复制一个数据,也可以同时复制一批数据。复制方法:(1)同word;(2)利用填充柄复制 即选中单元格数据,然后缓慢移动鼠标到单元格的右下角,当鼠标形状变为黑色实心“十”字后,拖动鼠标到目标单元格即可完成复制。3.数据删除,行
3、列插入、删除数据删除,行列插入、删除数据删除数据删除:直接选中单元格数据敲Delete删除整行、整列插入、删除整行、整列插入、删除:用鼠标选中单元格,点击插入行按钮 ,会在该单元格上方插入一行。用鼠标选中单元格,点击插入列按钮 ,会在该单元格左方插入一列用鼠标选中要删除的行,点击删除行按钮 ,可删除该行。用鼠标选中要删除的列,点击删除列按 ,可删除该列。4.4.当前工作表规格定义当前工作表规格定义当前工作表规格定义当前工作表规格定义 DPSDPS工作表,每张表最大可为工作表,每张表最大可为255255列列6553565535行。在此行。在此范围内,工作表大小可根据需要自己设定。范围内,工作表大
4、小可根据需要自己设定。设定方法:设定方法:点击工具栏里的设置表格行列数按钮点击工具栏里的设置表格行列数按钮 (或点击数据编辑(或点击数据编辑表格尺寸),表格尺寸),DPSDPS会根据当前工作会根据当前工作表的大小给出一个工作表大小的缺省值对话框,表的大小给出一个工作表大小的缺省值对话框,可以重新输入行列数,调整工作表的大小。可以重新输入行列数,调整工作表的大小。但如果输入行数小于已有文件存放数据的最如果输入行数小于已有文件存放数据的最大行数时大行数时,系统会提示如下。此时,应将行数增加。二、文本转换数值及字符串转换数值二、文本转换数值及字符串转换数值二、文本转换数值及字符串转换数值二、文本转换
5、数值及字符串转换数值1.1.文本转换数值文本转换数值文本转换数值文本转换数值当从其他文本编辑器复制数据到当从其他文本编辑器复制数据到DPSDPS的电子表格时,会的电子表格时,会发现数据都是放在第一列里,而不是一个一个数据发现数据都是放在第一列里,而不是一个一个数据分布在单元格里。原因是原来数据之间是用空格隔开分布在单元格里。原因是原来数据之间是用空格隔开的,的,DPSDPS不能自动识别这种格式,只能以字符串的格式不能自动识别这种格式,只能以字符串的格式直接放进来。直接放进来。解决方法解决方法:点击数据编辑点击数据编辑“文本转换为数值文本转换为数值”,可将文本行里的各个数值分离开,放在后面各个单
6、元可将文本行里的各个数值分离开,放在后面各个单元格里格里注意:复制过来的文本数据应该放在DPS系统工作表的第一列里面,否则,不能转换。2.字符串转换数值字符串转换数值 DPS中,数据应在“英文数字”方式下输入。如果忘记,在“全角、中文汉字输入方式下输入了字符型全角数字,这些全角型数字,在单元格里显示呈黑色。DPS系统不能对这些数据进行统计分析计算。如果输入了字符型全角数字,解决方法:点击数据编辑“字符串转换为数值”即可,三、数据统计分析及其建模基本步骤三、数据统计分析及其建模基本步骤1.数据统计分析基本步骤数据统计分析基本步骤 在DPS电子表格中输入数据 定义数据块 进入菜单选统计菜单,执行统
7、计分析。定义数据块:将鼠标移至数据块块首,按下左键拖到块尾位置即可。2.数学模型分析基本步骤数学模型分析基本步骤1)在DPS电子表格中输入数据,在下方公式编辑区输入模型。2)先定义公式块 再定义数据块 点数学模型 单因变量模型参数估计 麦夸特法 当弹出“置初值并用空格隔开”对话框时选默认 选OK 结束 在DPS系统内,各因子都用x1、x2、xm表示,所有常数都用c1、c2、cm表示。所以,在数学模型分析时,要将方程中的自变量和因变量换成x1、x2、xm;将所有常数换成c1、c2、cm。四、图表处理四、图表处理DPS常用图表处理:常用图表有二维和三维图,可以绘条形图、折线图、阶梯图、饼图等。定义
8、数据块后点击按钮 ,或点“数据分析”“常用图表”在图形选择对话框中选择图类型(2D、3D)下一步 显示图形 标出坐标轴代表的项目名称、符号、单位以及图题、图注、图例等。过程见下面图:得到如下所示图:选相应项作图。n nQ-Q图n n利用Q-Q图也可判断数据是否符合正态分布规律,即可作数据正态分布检验。n n在Q-Q图上,若所有数据散点分布在一条直线附近时,表明符合正态分布,否则,不符合正态分布。DPS数据处理系统及应用数据处理系统及应用n一、用户界面一、用户界面n n公式编辑区:用于数学模型分析时,数学公式的编辑、定义。n n电子表格区(即数据编辑器):用于数据编辑和数据计算。在此区内完成各种
9、数据编辑和计算操作,输出统计结果。1系统主菜单n n 系统主菜单均有下拉菜单。当把待分析的数据编辑好并定义成数据矩阵块后,点击主菜单,在其下拉菜单中选择相应的操作即可。2主要主菜单、下拉菜单命令及应用n n1)数据分析菜单)数据分析菜单n nDPS 数据分析下拉菜单常用命令:n n基本参数估计基本参数估计n n数据分析数据分析基本参数估计基本参数估计n n试验资料经整理后,可以计算一系列的统计指标,以说明资料的特征和对资料进行进一步统计分析。n n例:现取甜菜块根蔗例:现取甜菜块根蔗糖含量糖含量100100个样本资料个样本资料中的中的4040个,做基本参个,做基本参数估计示例。数估计示例。n
10、n步骤步骤:将数据在电子表格区将数据在电子表格区(即数据编辑器)输(即数据编辑器)输入后,入后,定义成数据定义成数据块,块,然后然后点数据分点数据分析析基本参数估基本参数估计计。就会立即得到基。就会立即得到基本参数:本参数:(见软件见软件)11.813.19.28.714.111.916.77.412.815.312.616.114.610.413.414.614.91512.112.610.112.410.811.311.612.27.513.411139.2715.114.912.614.113.410.66.511基本参数估计输出结果中的基本参数基本参数估计输出结果中的基本参数:(1)总
11、和(sum):样本数的总和(2)均值(Mean):平均值,是分析计量资料的基本统计量,均值表示一组性质相同的观察值的平均水平。平均值包括:算术平均值、几何平均值、中位数。在基本参数估计中的均值是指算术平均值算术平均值。计算式为:算术平均值主要适用于描述具有对称分布资料的集中趋势。当数据为正态分布时常用算术平均值,在一组等精度的测量中,算术平均值为最佳值或最可信赖值。几何平均值:它是n个观测值的连乘积开n次方的根,记作G 它用于反映对数正态分布或近似对数分布资料以及等比级数资料的集中趋势。对一组测量数值取对数,所得图形的分布曲线呈对称分布时,常用几何平均值。中位数(值):中位数是指观测值由大到小
12、或由小到大依次排列,居于中间位置的数据。记作Me (n为奇数)(n为偶数)在环境与资源研究中收集的数据,有时会比较分散,个别是离群较远,所以,对比较分散的数据往往要用中位数来表征平均特征。中位数不受极端数值的影响,在总体标志值差异很大时,具有较强的代表性。(3)平均偏差(adev)平均偏差是描述个体值间的变异,即观察值的离散度的指标之一。平均偏差较小,表示观察值围绕均数的波动较小,若平均偏差大,则观察值围绕均数的波动较大。平均偏差计算式为:(4)极差(Range)极差描述个体值间差异变异范围,极差越大,样本变异范围越大,反之,极差越小,样本变异范围越小。极差计算公式:(5)方差(VAR)Var
13、iance 方差是衡量观察值间的离散程度。方差较小,表示观察值围绕均数的波动较小。方差小时,其估计值就比较可靠,方差越小指标越稳定。方差计算式:(6)标准差(SD)std.Deviation 它描述个体观察值间的变异程度的大小,即观察值的离散程度。标准差较小,表示观察值围绕均数的波动较小,说明数据越集中。标准差越大,说明数据越分散。可用标准差表示试验精度。标准差小些好。SD计算公式:当观察值呈正态分布或近似正态分布时,可将均数及标准差同时写出。如(7)标准误(SE)std.Error 标准误差 它描述样本均数变异程度及抽样误差的大小,即样本统计量与总体参数的接近程度。SE叫做样本平均数的标准误
14、差,简称为标准误。标准误小,表示抽样误差小,则统计量较稳定并与参数较接近。可将统计量及其标准误同时写出,如(8 8)变异系数)变异系数(CVCV)又称离散系数,是用于衡量一系列测定值的相对离又称离散系数,是用于衡量一系列测定值的相对离散程度的一种特征数。变异系数无单位。散程度的一种特征数。变异系数无单位。变异系数是一个相对变异度量变异系数是一个相对变异度量,它是样本的标准差与,它是样本的标准差与均数的比值。均数的比值。变异系数变异系数CVCV小了好。小了好。注意:注意:a.a.两种单位不同的样本之间作变异程度比较时,不两种单位不同的样本之间作变异程度比较时,不能用标准差,要用变异系数。能用标准
15、差,要用变异系数。b.b.平均数不同的两个样本也不能用标准差进行比较,平均数不同的两个样本也不能用标准差进行比较,要用变异系数。要用变异系数。c.c.两个样本基数不一致或基数相差较大时,不能用两个样本基数不一致或基数相差较大时,不能用标准差,要用变异系数。标准差,要用变异系数。(9)正态性检验 正态性检验的目的就是要判定数据资料是否服从正态分布,或样本是否来自正态总体。正态性检验是检验各样本所属的总体参数差异显著性的前提条件。只有样本都来自正态总体或近似正态总体这个条件符合时,才能用t检验法和F检验法来检验各样本所属的总体参数差异显著性。就是说,在统计分析前先要对数据进行正态性检验,只有当符合
16、正态分布时,才能进行进一步统计分析。基本参数估计时DPS正态性检验结果格式如下:正态性检验(100个甜菜块根蔗糖含量的结果)偏度 表示以平均值为中心的分布的不对称度。如果样本符合正态分布时,偏度参数(系数)等于0,此例中偏度系数为 0.6373,属于负偏态,P0),表示相对尖锐的分布。峰值为负时(0),表示分布相对平坦。峰值为0时,表示是标准的正态分布。异常值检验n n操作步骤:n n先将待检验数据输入 定义为数据块 数据分析 异常值检验 弹出异常数据剔除检验对话框 选一种检验分析方法和显著水平 确定。n n如果有异常数据,则如果有异常数据,则异常数据就会变为红色或异常数据就会变为红色或系统有
17、具体提示系统有具体提示。n n检验方法有:检验方法有:3S3S法(法(33法)法)数据要服从正态分布数据要服从正态分布 狄克松(狄克松(DixsonDixson)法)法 格拉布斯(格拉布斯(GrubbsGrubbs)法)法数据要服从正态分布数据要服从正态分布例例 对某物理量测量对某物理量测量15次数据如下次数据如下,检检查有无异常值查有无异常值.序号x序号x10.4290.420.43100.4330.4110.4240.43120.4150.42130.3960.43140.3970.39150.480.32)试验设计菜单)试验设计菜单n n 完全随机及随机区组设计 完全随机分组(用于产生随
18、机数)单因素随机设计 二因素随机设计n n正交设计 30个正交表 2水平互作设计n n正交回归组合设计 3)试验统计菜单)试验统计菜单n n次数分布及平均数比较 n n完全随机设计 n n正交实验方差分析n n 二次回归(正交)旋转组合设计n n二次通用旋转组合设计n n 二次多项式回归分析n n新版本里几个设计,数据处理通用了新版本里几个设计,数据处理通用了:n n二次通用组合设计、n n二次正交旋转设计、n n二次正交回归设计,n n做统计分析时如果不做区组,都在实验统计下拉菜单里的实验优化分析实验优化分析二次多项式回归分析操二次多项式回归分析操作。作。4)多元分析)多元分析回归分析:n
19、n 线性回归 n n二次多项式逐步回归n n多因子及互作项逐步回归n n多因子及平方项逐步回归 5)数学模型)数学模型n n一元非线性回归模型(用于一元非线性回归)n n单因变量模型参数估计 n n二、二、t 检验检验n n主要用于检验两个处理平均数差异是否显著。条件是要主要用于检验两个处理平均数差异是否显著。条件是要求资料呈正态分布或近似正态分布。求资料呈正态分布或近似正态分布。n n1 1)单样本均数与总体均数比较的)单样本均数与总体均数比较的)单样本均数与总体均数比较的)单样本均数与总体均数比较的t检验检验检验检验n n用于检验一个样本均数与总体均数差异是否显著。用于检验一个样本均数与总
20、体均数差异是否显著。用于检验一个样本均数与总体均数差异是否显著。用于检验一个样本均数与总体均数差异是否显著。n n例例 随机测得随机测得7 7个儿童身高为:个儿童身高为:137137,133133,136136,129129,133133,130130,131cm,131cm,已知该班身高总体平均数为已知该班身高总体平均数为131cm131cm,检验,检验样本均数与总体均数差异是否显著。样本均数与总体均数差异是否显著。n n 步骤:步骤:n n按行输入按行输入7 7个数,第二行输入总体平均数个数,第二行输入总体平均数定义数定义数据块据块 选试验统计选试验统计 单样本平均数检验单样本平均数检验在
21、弹出在弹出的对话框中输入总体平均数的对话框中输入总体平均数131OK131OK137133136129133130131131n n2)配对样本配对样本t检验检验n n用于配对试验计量资料的比较n n步骤:n n按行输入数据定义数据块 选试验统计 两样本比较配对两处理t检验输出结果n n例:进口仪器:32 40 27 37 32 35 28 43 40 41 41 35 49 34 mmn n 国产仪器:43 44 30 34 30 31 26 26 42 40 42 43 37 43 mmn n3 3)两样本均值差异)两样本均值差异)两样本均值差异)两样本均值差异t t检验检验检验检验n n
22、方法:方法:n n (1 1)将两个处理的样本观察值分两行输入,并定义)将两个处理的样本观察值分两行输入,并定义成数据块。成数据块。n n (2 2)试验统计)试验统计两样本比较两样本比较student student t t 检验检验输出输出结果结果n n例例处理处理1 160 160 200 160 200 170 150 2101 160 160 200 160 200 170 150 210处理处理2 170 270 220 250 270 290 270 2302 170 270 220 250 270 290 270 230 160 160 200 160 200 170 150
23、210 160 160 200 160 200 170 150 210 170 270 220 250 270 290 270 230 170 270 220 250 270 290 270 230 Jrj Jrj n n4)小样本均值差异检验)小样本均值差异检验n n方法:n n (1)输入数据,并定义成数据块n n (2)试验统计两样本比较样本较少时平均数差异检验输出(显示)结果。n n例n n 处理1 0.96 1.14 1.59n n 处理2 1.29 1.31 1.6 1.88 2.21 2.27n n0.96 1.14 1.59n n1.29 1.31 1.6 1.88 2.21
24、2.27三、试验设计及统计分析三、试验设计及统计分析n n 一)全面试验设计一)全面试验设计n n(一)单因素完全随机设计(一)单因素完全随机设计n n1试验方案设计试验方案设计n n试验只考察一个主要因素,它有试验只考察一个主要因素,它有a个水平个水平A1,A2,Aa,比较这比较这a个水平对试验指标的影响,称个水平对试验指标的影响,称为单因素试验。单因素试验中,只考虑对指标影为单因素试验。单因素试验中,只考虑对指标影响最大的因素,其余因素固定不变。响最大的因素,其余因素固定不变。n n假定假定a个水平均重复个水平均重复m次,则总共要进行次,则总共要进行am次试次试验。如果验。如果a个水平试验
25、的实施顺序完全按随机原个水平试验的实施顺序完全按随机原则确定则确定,这种试验设计方法称为完全随机化单因完全随机化单因素试验设计。素试验设计。n例1 在无酒精啤酒的研究中,为了了解麦芽的浓度对发酵液中双乙酰生成量的影响。在发酵温度为7,非糖比为0.3,二氧化碳压力为0.06MPa,发酵时间为6天的试验条件下,考察麦芽汁浓度改变对双乙酰生成量的影响。n解:固定因素为:温度7;非糖比0.3,CO2压力0.06MPa;发酵时间6天。n考察因素为:麦芽汁浓度A,n因素A水平:A1=6%,A2=10%,A3=12%n每个水平重复次数:5次n试验指标:双乙酰含量mg/L(按专业要求此指标要低些)n目的:寻找
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- DPS 数据处理 详解 ppt 课件
限制150内