化工计算机数据与图形处理 (2)PPT讲稿.ppt
《化工计算机数据与图形处理 (2)PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《化工计算机数据与图形处理 (2)PPT讲稿.ppt(67页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、化工化工化工化工计计计计算机数据与算机数据与算机数据与算机数据与图图图图形形形形处处处处理理理理第1页,共67页,编辑于2022年,星期五主要内容主要内容4.1 线性回归4.1.1一元线性回归4.1.2 用“数据分析”线性拟合4.1.3 线性回归统计4.2 多元线性回归4.3 非线性回归4.4 Excel初步图形处理第2页,共67页,编辑于2022年,星期五回归分析简介回归分析简介 实验结果中,各物理量之间的关系极其重实验结果中,各物理量之间的关系极其重 要要 欧美学派:重视理论推导与探索;欧美学派:重视理论推导与探索;前苏联学派:重视实验数据拟合。前苏联学派:重视实验数据拟合。通常用通常用y
2、计算计算f(x)近似代表实验数据点近似代表实验数据点(xi ,yi)之间的关系。为此必须找到与数据之间的关系。为此必须找到与数据 (xi,yi)吻合最好的函数系数,这一过程称吻合最好的函数系数,这一过程称 为曲线拟合。为曲线拟合。第3页,共67页,编辑于2022年,星期五回归分析简介回归分析简介 最佳拟合的判据是实验数据点与拟合曲线的偏差的最佳拟合的判据是实验数据点与拟合曲线的偏差的平方和最小(最小二乘法),即:平方和最小(最小二乘法),即:用最小二乘法求最佳拟合参数的过程称为回归分析。用最小二乘法求最佳拟合参数的过程称为回归分析。第4页,共67页,编辑于2022年,星期五回归分析简介回归分析
3、简介回归分析是一种统计技术,用以定量表达实验变量回归分析是一种统计技术,用以定量表达实验变量之间的关系和相关程度。之间的关系和相关程度。目的之一是根据已知的体系变量间的函数关系(数目的之一是根据已知的体系变量间的函数关系(数学模型)已知,回归出系数;学模型)已知,回归出系数;另一目的是获得回归参数的另一目的是获得回归参数的标准偏差标准偏差和和相关系数相关系数以以确定模型是否适合实验数据。确定模型是否适合实验数据。第5页,共67页,编辑于2022年,星期五4.1 线性回归线性回归4.1.1 4.1.1 一元线性回归一元线性回归将一组数据拟合成一直线最简单:将一组数据拟合成一直线最简单:y=ax+
4、b在化工实验中最常见的应用是分析产物组成在化工实验中最常见的应用是分析产物组成时作标准曲线。时作标准曲线。示例:示例:在萃取分离乙苯和辛烷时,要用气相在萃取分离乙苯和辛烷时,要用气相色谱分析产品(乙苯色谱分析产品(乙苯-辛烷混合溶液)中乙苯辛烷混合溶液)中乙苯的含量。首先配制好一系列已知浓度的乙苯的含量。首先配制好一系列已知浓度的乙苯-辛烷标准溶液,用色谱逐个分析,得到峰面辛烷标准溶液,用色谱逐个分析,得到峰面积数据,与已知浓度拟合得到标准曲线。积数据,与已知浓度拟合得到标准曲线。第6页,共67页,编辑于2022年,星期五4.1.1 一元线性回归一元线性回归1.1.用函数用函数SLOPE()S
5、LOPE()和和INTERCEPT()INTERCEPT()SLOPE(ySLOPE(y值数列,值数列,x x值数列),返回线性回归值数列),返回线性回归直线的斜率直线的斜率aINTERCEPT(yINTERCEPT(y值数列,值数列,x x值数列),返回截距值数列),返回截距b 第7页,共67页,编辑于2022年,星期五4.1.1 一元线性回归一元线性回归2.2.用函数用函数LINEST()LINEST()LINESTLINEST可处理的线性方程的通式为:可处理的线性方程的通式为:y=ax+b 或或 y=a1x1+a2x2+amxm+bLINESTLINEST的语法为:的语法为:LINEST
6、(yLINEST(y值数列值数列,x,x值数列值数列,常数常数_ _逻辑逻辑,统计统计_ _逻辑逻辑)常数常数_ _逻辑是一逻辑值,指明是否强制使常数逻辑是一逻辑值,指明是否强制使常数b b为为0 0。如果它是如果它是TRUETRUE、1 1或被省略,回归参数包括截距或被省略,回归参数包括截距b b;如果它是如果它是FALSEFALSE或或0 0,则拟合不包括,则拟合不包括b b,即得到过原点,即得到过原点的直线的直线y=ax。第8页,共67页,编辑于2022年,星期五4.1.1 一元线性回归一元线性回归2.2.用函数用函数LINEST()LINEST()统计统计_ _逻辑是一逻辑值,指明是否
7、返回附加的逻辑是一逻辑值,指明是否返回附加的回归统计值。回归统计值。如果它是如果它是TRUETRUE或或1 1,LINESTLINEST除给出回归系数除给出回归系数ai和和b b外,还给出回归统计数组。外,还给出回归统计数组。第9页,共67页,编辑于2022年,星期五3.LINEST中的线性回归分析设有设有N个数据点(个数据点(xi,yi),总平方和为:),总平方和为:第10页,共67页,编辑于2022年,星期五3.LINEST中的线性回归分析 残差平方和残差平方和SS残差残差反映测量值反映测量值yi与按拟合函数计算值与按拟合函数计算值y计算计算的偏差,残差平方和越小,表明拟合越好。的偏差,残
8、差平方和越小,表明拟合越好。回归平方和反映在回归平方和反映在y的总平方和中由的总平方和中由x和和y的线性关系的线性关系引起的引起的y的变化,其数值越大越好。的变化,其数值越大越好。拟合好坏取决于拟合好坏取决于SS回归回归在在SS中所占比例,因此定义中所占比例,因此定义判定系数:判定系数:第11页,共67页,编辑于2022年,星期五3.LINEST中的线性回归分析R2表示回归分析方程的结果反映变量间关系的程度表示回归分析方程的结果反映变量间关系的程度的标志,若的标志,若R2 0为为正相关,直线的斜率为正;正相关,直线的斜率为正;R0为负相关,直线的为负相关,直线的斜率为负。斜率为负。R=0为不相
9、关,为不相关,x与与y无线性关系。无线性关系。第12页,共67页,编辑于2022年,星期五3.LINEST中的线性回归分析在实际工作中也经常用到在实际工作中也经常用到F-检验:检验:自由度自由度dfN-k,一元线性回归参数,一元线性回归参数k为为2。F-统计统计用以判定设计的关系式是否有效。用以判定设计的关系式是否有效。测量精度用测量精度用y值的标准误差值的标准误差SE(y)来估计:来估计:SE(y)越小,根据拟合直线预测的越小,根据拟合直线预测的y值越准确。值越准确。第13页,共67页,编辑于2022年,星期五3.LINEST中的线性回归分析y是随机的,因此由实验数据得到的回归参数是随机的,
10、因此由实验数据得到的回归参数a、b也也是随机的,即同一实验做若干次或不同人做同一实是随机的,即同一实验做若干次或不同人做同一实验,每次实验得到的验,每次实验得到的a、b值也不相同。统计上可以值也不相同。统计上可以用用a、b的标准偏差来衡量的标准偏差来衡量a、b数值的波动:数值的波动:第14页,共67页,编辑于2022年,星期五3.LINEST中的线性回归分析SE(a)、)、SE(b)的波动性与标准偏差)的波动性与标准偏差SE(y)的)的大小有关,也与大小有关,也与x值的波动性有关,值的波动性有关,x值越离散(也值越离散(也就是说就是说x取值区间越大),取值区间越大),SE(a)、)、SE(b)
11、的值)的值越小。此外,越小。此外,SE(b)还与测量点数)还与测量点数N有关,测量有关,测量次数越多,次数越多,SE(b)越小。)越小。第15页,共67页,编辑于2022年,星期五3.LINEST中的线性回归分析示例:乙苯辛烷标准曲线的回归示例:乙苯辛烷标准曲线的回归第16页,共67页,编辑于2022年,星期五4.1.2 使用“数据分析”线性拟合第17页,共67页,编辑于2022年,星期五4.1.2 使用“数据分析”线性拟合Excel“数据分析数据分析”步骤:步骤:以标准曲线制作为例以标准曲线制作为例1)打开)打开“工具工具”“数据分析数据分析”,出现,出现“数数据分析据分析”对话框。选其中的
12、对话框。选其中的“回归回归”,出现,出现“回归回归”对话框。对话框。2)在)在“输入输入”区域,分别在区域,分别在“Y值输入区域值输入区域”和和“X值输入区域值输入区域”内输入内输入y数据区域的引用:数据区域的引用:$K$2:$K$12和和x数据区域引用数据区域引用$J$2:$J$123)选取选取“标志标志”(注意与注意与Y、X输入区域一致!输入区域一致!)和和“置信度置信度”复选框,如果要强制回归直复选框,如果要强制回归直线过原点,则选中线过原点,则选中“常数为零常数为零”,本例不选。,本例不选。第18页,共67页,编辑于2022年,星期五4.1.2 使用“数据分析”线性拟合4)在在在在“输
13、出选项输出选项输出选项输出选项”区有区有区有区有3 3个单选框,用来指定回归分析数个单选框,用来指定回归分析数个单选框,用来指定回归分析数个单选框,用来指定回归分析数据输出的位置。据输出的位置。据输出的位置。据输出的位置。若选中若选中“新工作表组新工作表组新工作表组新工作表组”,则可在当前工作簿中插,则可在当前工作簿中插入新工作表,并由新工作表的入新工作表,并由新工作表的A1A1A1A1单元格开始粘贴计算单元格开始粘贴计算单元格开始粘贴计算单元格开始粘贴计算结果。如果需要给新工作表命名,可在右侧的编辑框结果。如果需要给新工作表命名,可在右侧的编辑框结果。如果需要给新工作表命名,可在右侧的编辑框
14、结果。如果需要给新工作表命名,可在右侧的编辑框中键入名称。中键入名称。中键入名称。中键入名称。若选中若选中若选中若选中“新工作簿新工作簿新工作簿新工作簿”,则可创建一个新工作簿,并在,则可创建一个新工作簿,并在,则可创建一个新工作簿,并在,则可创建一个新工作簿,并在新工作簿中的新工作表中粘贴结果。新工作簿中的新工作表中粘贴结果。新工作簿中的新工作表中粘贴结果。新工作簿中的新工作表中粘贴结果。若选中若选中“输出区域输出区域输出区域输出区域”,则计算结果粘贴在原工作,则计算结果粘贴在原工作表上。本例选中此项,要求在右边的编辑框内输入表上。本例选中此项,要求在右边的编辑框内输入“汇总输出表汇总输出表
15、汇总输出表汇总输出表”左上角单元格的位置。左上角单元格的位置。左上角单元格的位置。左上角单元格的位置。第19页,共67页,编辑于2022年,星期五4.1.2 使用“数据分析”线性拟合第20页,共67页,编辑于2022年,星期五4.1.2 使用“数据分析”线性拟合5)单击确定,给出汇总输出表单击确定,给出汇总输出表单击确定,给出汇总输出表单击确定,给出汇总输出表(SUMMARY OUTPUT),(SUMMARY OUTPUT),(SUMMARY OUTPUT),(SUMMARY OUTPUT),其中包其中包括回归统计、方差分析和回归系数及统计括回归统计、方差分析和回归系数及统计第21页,共67页
16、,编辑于2022年,星期五4.1.3 线性回归统计1.1.1.1.自由度自由度自由度自由度dfdfdfdf的概念的概念的概念的概念在方差分析表中有在方差分析表中有在方差分析表中有在方差分析表中有3 3种自由度:种自由度:种自由度:种自由度:回归平方和回归平方和回归平方和回归平方和SS回归回归回归回归的自由度:的自由度:的自由度:的自由度:dfdf回归回归回归回归m m m mk k k k-1-1残差平方和残差平方和SSSS残差残差的的自由度:自由度:dfdfdfdf残差残差N N N N-k k k k总平方和总平方和总平方和总平方和SSSS的的的的自由度:自由度:自由度:自由度:dfdfd
17、fdfSSSSSSSSN N N N-1-1-1-1m m m m:自变量:自变量:自变量:自变量x x的系数数目,的系数数目,的系数数目,的系数数目,k k k k:线性回归参数的数目,:线性回归参数的数目,N N N N:实验点的数目。:实验点的数目。回归方差回归方差回归方差回归方差MSMSMSMS回归回归回归回归=SS回归回归/df/df回归回归残差方差残差方差残差方差残差方差MSMS残差残差残差残差=SSSS残差残差残差残差/df/df残差残差残差残差第22页,共67页,编辑于2022年,星期五4.1.3 线性回归统计2.2.2.2.回归统计的作用回归统计的作用回归统计的作用回归统计的
18、作用回归统计可决定回归系数的值及其有效性,例如用最回归统计可决定回归系数的值及其有效性,例如用最回归统计可决定回归系数的值及其有效性,例如用最回归统计可决定回归系数的值及其有效性,例如用最小二乘法拟合的曲线是否有效,回归参数的精度及置小二乘法拟合的曲线是否有效,回归参数的精度及置信区间,回归方程拟合好坏等。信区间,回归方程拟合好坏等。信区间,回归方程拟合好坏等。信区间,回归方程拟合好坏等。残差平方和在一定程度上反映了拟合好坏。然而在检残差平方和在一定程度上反映了拟合好坏。然而在检残差平方和在一定程度上反映了拟合好坏。然而在检残差平方和在一定程度上反映了拟合好坏。然而在检验回归线有无意义、因变量
19、验回归线有无意义、因变量验回归线有无意义、因变量验回归线有无意义、因变量y y与自变量与自变量与自变量与自变量x x间是否真符合间是否真符合回归方程所示的函数关系、需要定量反映拟合好坏时回归方程所示的函数关系、需要定量反映拟合好坏时回归方程所示的函数关系、需要定量反映拟合好坏时回归方程所示的函数关系、需要定量反映拟合好坏时,还要经常用到相关系数,还要经常用到相关系数,还要经常用到相关系数,还要经常用到相关系数R R和和F-统计。统计。第23页,共67页,编辑于2022年,星期五4.1.3 线性回归统计3 3 相关系数相关系数R R和和F-统计统计从相关系数从相关系数R检验表中查到在某一自由度检
20、验表中查到在某一自由度dfdf和指定置和指定置信水平信水平下的相关系数临界值下的相关系数临界值Rdf,,若计算得到的,若计算得到的相关系数相关系数R大于大于Rdf,,则则x和和y显著相关显著相关。一般。一般R R应在应在0.990.99以上。以上。F-统计也有类似的统计也有类似的F检验表,根据给定的置信度可以检验表,根据给定的置信度可以查得临界值查得临界值F(df(df回归回归,dfdf残差残差),若计算的),若计算的F F值大于值大于F F检验表临界值,则检验表临界值,则x和和y显著相关。显著相关。第24页,共67页,编辑于2022年,星期五4.1.3 线性回归统计4 4 t-检验检验t-检
21、验常用于检验常用于比较两条比较两条回归曲线。同样,有现成的回归曲线。同样,有现成的t 检验表,表中列出在某一自由度检验表,表中列出在某一自由度df和指定置信水平和指定置信水平下的下的tdf,。以适当的方法计算。以适当的方法计算t值,与查得的临界值,与查得的临界值进行比较,若计算值大于等于临界值,则比较的值进行比较,若计算值大于等于临界值,则比较的两个量有显著差别,否则无显著差别。两个量有显著差别,否则无显著差别。注:上述检验必须在指定的置信度范围内进行,最注:上述检验必须在指定的置信度范围内进行,最常用的置信度为常用的置信度为95。若置信度太高(如。若置信度太高(如99),),一些有用的数据可
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 化工计算机数据与图形处理 2PPT讲稿 化工 计算机 数据 图形 处理 PPT 讲稿
限制150内