统计方法建模.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《统计方法建模.ppt》由会员分享,可在线阅读,更多相关《统计方法建模.ppt(129页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计方法建模 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望3.1 3.1 多元回归与最优逐步回归多元回归与最优逐步回归 3.2 3.2 主成份分析与相关分析主成份分析与相关分析3.3 3.3 判别分析判别分析3.4 3.4 聚类分析聚类分析3.5 3.5 模糊聚类分析模糊聚类分析3.6 3.6 马尔可夫链及其应用马尔可夫链及其应用3.7 3.7 存贮论存贮论3.1 多元回归与最优逐步回归多元回归与最优逐步回归一、数学模型一、数学模型二、模型的分析与检验二、模型的
2、分析与检验 三、回归方程系数的显著性检验三、回归方程系数的显著性检验四、回归方程进行预测预报和控制四、回归方程进行预测预报和控制五、最优逐步回归分析五、最优逐步回归分析一、数学模型一、数学模型设可控或不可控的自变量设可控或不可控的自变量设可控或不可控的自变量设可控或不可控的自变量 ;目标函数;目标函数;目标函数;目标函数 ,已测得的,已测得的,已测得的,已测得的n n组数据为:组数据为:组数据为:组数据为:(1.1)(1.1)其中其中其中其中 是系统的测试数据,相当是系统的测试数据,相当是系统的测试数据,相当是系统的测试数据,相当于如下模型:设多目标系统为于如下模型:设多目标系统为于如下模型:
3、设多目标系统为于如下模型:设多目标系统为:系统为简化问题,不妨设该系统为单目标系统,且由函数关系为简化问题,不妨设该系统为单目标系统,且由函数关系 ,可以设:,可以设:(1.2)可得如下线性模型可得如下线性模型 (1.3)为测量误差,相互独立,为测量误差,相互独立,。令令 可得可得可得可得 (1.41.4)(1.4)(1.4)称为线性回归方程的数学模型。称为线性回归方程的数学模型。称为线性回归方程的数学模型。称为线性回归方程的数学模型。利用最小二乘估计或极大似然估计,令利用最小二乘估计或极大似然估计,令利用最小二乘估计或极大似然估计,令利用最小二乘估计或极大似然估计,令 使,使,使,使,由方程
4、组由方程组由方程组由方程组 (1.5)(1.5)可得系数可得系数可得系数可得系数 的估计。的估计。的估计。的估计。令令令令 方阵可逆,由模型可得:方阵可逆,由模型可得:方阵可逆,由模型可得:方阵可逆,由模型可得:即有即有即有即有 (1.6)(1.6)可以证明可以证明可以证明可以证明(1.6)(1.6)与与与与(1.5)(1.5)是同解方程组的解,它是最优线性无偏是同解方程组的解,它是最优线性无偏是同解方程组的解,它是最优线性无偏是同解方程组的解,它是最优线性无偏估量,满足很多良好的性质,另文补讲估量,满足很多良好的性质,另文补讲估量,满足很多良好的性质,另文补讲估量,满足很多良好的性质,另文补
5、讲。二、模型的分析与检验二、模型的分析与检验设目标函数设目标函数设目标函数设目标函数 的平均值,的平均值,的平均值,的平均值,则由公式可计算得总偏差平方和,回归和剩余平则由公式可计算得总偏差平方和,回归和剩余平则由公式可计算得总偏差平方和,回归和剩余平则由公式可计算得总偏差平方和,回归和剩余平方和:方和:方和:方和:假设检验:假设检验:假设检验:假设检验:至少有一个不为零至少有一个不为零至少有一个不为零至少有一个不为零结论是:当结论是:当结论是:当结论是:当 当当当当 被拒绝以后,说明方程被拒绝以后,说明方程被拒绝以后,说明方程被拒绝以后,说明方程(2)(2)中系数不全为零,方程中系数不全为零
6、,方程中系数不全为零,方程中系数不全为零,方程配得合理。否则在被接受以后,说明方程配得不合适,配得合理。否则在被接受以后,说明方程配得不合适,配得合理。否则在被接受以后,说明方程配得不合适,配得合理。否则在被接受以后,说明方程配得不合适,即变量即变量即变量即变量 对目标函数都没有影响,对目标函数都没有影响,对目标函数都没有影响,对目标函数都没有影响,则要从另外因素去考虑该系统。则要从另外因素去考虑该系统。则要从另外因素去考虑该系统。则要从另外因素去考虑该系统。三、回归方程系数的显著性检验三、回归方程系数的显著性检验假设假设假设假设 备选假设备选假设备选假设备选假设 可以证得:可以证得:可以证得
7、:可以证得:(1.8)(1.8)或者或者或者或者 的对角线元素。的对角线元素。的对角线元素。的对角线元素。.当当当当 时,时,时,时,显著不为零,方程显著不为零,方程显著不为零,方程显著不为零,方程(1.2)(1.2)中中中中 第第第第 j j个变量作用个变量作用个变量作用个变量作用显著。若有某一个系数显著。若有某一个系数显著。若有某一个系数显著。若有某一个系数 假设被接受,假设被接受,假设被接受,假设被接受,则应从方程中剔除。然后从头开始进行一次回则应从方程中剔除。然后从头开始进行一次回则应从方程中剔除。然后从头开始进行一次回则应从方程中剔除。然后从头开始进行一次回归分析工作。归分析工作。归
8、分析工作。归分析工作。四、回归方程进行预测预报和控制四、回归方程进行预测预报和控制 经过回归分析得到经验回归方程为经过回归分析得到经验回归方程为经过回归分析得到经验回归方程为经过回归分析得到经验回归方程为 (1.9)(1.9)设要在某已知点上进行预测,可得点估计:设要在某已知点上进行预测,可得点估计:设要在某已知点上进行预测,可得点估计:设要在某已知点上进行预测,可得点估计:(1.10)(1.10)下面对预测预极值进行区间估计,可以证得下面对预测预极值进行区间估计,可以证得下面对预测预极值进行区间估计,可以证得下面对预测预极值进行区间估计,可以证得 其中其中其中其中 得得 的预测区间:的预测区
9、间:五、最优逐步回归分析五、最优逐步回归分析 在线性回归分析中,当经过检验,方程在线性回归分析中,当经过检验,方程在线性回归分析中,当经过检验,方程在线性回归分析中,当经过检验,方程(1.2)(1.2)作用显著,但作用显著,但作用显著,但作用显著,但 为显著为显著为显著为显著,说明说明说明说明 不起作用,要从方程中剔除出去,一切都要从不起作用,要从方程中剔除出去,一切都要从不起作用,要从方程中剔除出去,一切都要从不起作用,要从方程中剔除出去,一切都要从头算起,很麻烦。这里介绍的方法是光对因子头算起,很麻烦。这里介绍的方法是光对因子头算起,很麻烦。这里介绍的方法是光对因子头算起,很麻烦。这里介绍
10、的方法是光对因子 逐个检验,确认它在方程中的作用的显著程度,然后依大到小逐个检验,确认它在方程中的作用的显著程度,然后依大到小逐个检验,确认它在方程中的作用的显著程度,然后依大到小逐个检验,确认它在方程中的作用的显著程度,然后依大到小逐次引入变量到方程,并及时进行检验,去掉作用不显著的因逐次引入变量到方程,并及时进行检验,去掉作用不显著的因逐次引入变量到方程,并及时进行检验,去掉作用不显著的因逐次引入变量到方程,并及时进行检验,去掉作用不显著的因子,依次循环,到最后无因子可以进入方程,亦无因子被从方子,依次循环,到最后无因子可以进入方程,亦无因子被从方子,依次循环,到最后无因子可以进入方程,亦
11、无因子被从方子,依次循环,到最后无因子可以进入方程,亦无因子被从方程中剔除,这个方法称为最优逐步回归法。程中剔除,这个方法称为最优逐步回归法。程中剔除,这个方法称为最优逐步回归法。程中剔除,这个方法称为最优逐步回归法。从方程从方程从方程从方程(1.2)(1.2)中中中中,为方便计为方便计为方便计为方便计,设变量个数设变量个数设变量个数设变量个数 ,记记记记 可得可得可得可得 (1.12)(1.12)此时仍可得此时仍可得此时仍可得此时仍可得 是回归估计值是回归估计值是回归估计值是回归估计值回归方程为回归方程为回归方程为回归方程为 (1.13)(1.13)分别是分别是分别是分别是 的系数的系数的系
12、数的系数估计。为了减少误差积累与放大,进行数据中心化标估计。为了减少误差积累与放大,进行数据中心化标估计。为了减少误差积累与放大,进行数据中心化标估计。为了减少误差积累与放大,进行数据中心化标 准化处理:准化处理:准化处理:准化处理:(1.14)可得数学模型为:可得数学模型为:(1.15)经推导可得:经推导可得:,称为系数相关矩阵称为系数相关矩阵称为系数相关矩阵称为系数相关矩阵 由此可得经验回归方程:由此可得经验回归方程:由此可得经验回归方程:由此可得经验回归方程:(1.16)(1.16)然后以变换关系式代入可得然后以变换关系式代入可得然后以变换关系式代入可得然后以变换关系式代入可得 将将将将
13、(17)(17)式与式与式与式与(13)(13)式进行比较,可得:式进行比较,可得:式进行比较,可得:式进行比较,可得:(1.18)(1.18)只要算得只要算得只要算得只要算得(16)(16)式的式的式的式的 即可。注意到即可。注意到即可。注意到即可。注意到 其中其中其中其中 是对于因子是对于因子是对于因子是对于因子 的偏回归平方和,可以证明线性的偏回归平方和,可以证明线性的偏回归平方和,可以证明线性的偏回归平方和,可以证明线性方程中对变量方程中对变量方程中对变量方程中对变量 的多元线性回归方程中的多元线性回归方程中的多元线性回归方程中的多元线性回归方程中 的偏回归的偏回归的偏回归的偏回归平方
14、和为(平方和为(平方和为(平方和为(是原方程中的偏回归平方和):是原方程中的偏回归平方和):是原方程中的偏回归平方和):是原方程中的偏回归平方和):把系数矩阵把系数矩阵把系数矩阵把系数矩阵R R变成加边矩阵,记为变成加边矩阵,记为变成加边矩阵,记为变成加边矩阵,记为比较比较比较比较 ,设设设设 ,则相应变量则相应变量则相应变量则相应变量 作用作用作用作用最大,但是否显著大,要进行显著性检验,可以证最大,但是否显著大,要进行显著性检验,可以证最大,但是否显著大,要进行显著性检验,可以证最大,但是否显著大,要进行显著性检验,可以证得得得得当当当当 时,可将变量时,可将变量时,可将变量时,可将变量
15、引入方程中去。引入方程中去。引入方程中去。引入方程中去。现将这个循环步骤介绍如下:现将这个循环步骤介绍如下:现将这个循环步骤介绍如下:现将这个循环步骤介绍如下:第一步:挑选第一个因子第一步:挑选第一个因子第一步:挑选第一个因子第一步:挑选第一个因子1.对对对对 计算计算计算计算 的偏回归和的偏回归和的偏回归和的偏回归和 2.找出找出找出找出 决定决定决定决定3.F F检验检验检验检验 当当当当 时引入时引入时引入时引入 ,一般总可以引入的。,一般总可以引入的。,一般总可以引入的。,一般总可以引入的。第二步:挑选第二个因子第二步:挑选第二个因子第二步:挑选第二个因子第二步:挑选第二个因子首先变换
16、加边矩阵首先变换加边矩阵首先变换加边矩阵首先变换加边矩阵 则则则则 ,因子因子因子因子 的偏回归平方和的偏回归平方和的偏回归平方和的偏回归平方和 记记记记 决定可否引入决定可否引入决定可否引入决定可否引入 步骤:步骤:步骤:步骤:1.1.对对对对 ,计算,计算,计算,计算 的偏回归平方的偏回归平方的偏回归平方的偏回归平方 和和和和 。2.2.找找找找 出中最大的一个,记为出中最大的一个,记为出中最大的一个,记为出中最大的一个,记为 。3.3.对对对对 作显著性检验:作显著性检验:作显著性检验:作显著性检验:当当当当 时,要时,要时,要时,要 引入引入引入引入 。第三步:当引入第三步:当引入第三
17、步:当引入第三步:当引入 时,时,时,时,是否要剔除呢是否要剔除呢是否要剔除呢是否要剔除呢?即已有方程:即已有方程:即已有方程:即已有方程:检验检验检验检验 的偏回归平方和:的偏回归平方和:的偏回归平方和:的偏回归平方和:当当当当 时因子时因子时因子时因子 不剔除。同样的方法以不剔除。同样的方法以不剔除。同样的方法以不剔除。同样的方法以 时因子时因子时因子时因子 不剔除。不剔除。不剔除。不剔除。第四步:重复进行第二步到第三步。一直到没第四步:重复进行第二步到第三步。一直到没第四步:重复进行第二步到第三步。一直到没第四步:重复进行第二步到第三步。一直到没有可引入的新因子,也没有可剔除的因子。有可
18、引入的新因子,也没有可剔除的因子。有可引入的新因子,也没有可剔除的因子。有可引入的新因子,也没有可剔除的因子。最后方程为:最后方程为:最后方程为:最后方程为:(1.19)(1.19)并把并把并把并把(1.19)(1.19)式换算成类似的式换算成类似的式换算成类似的式换算成类似的(1.13)(1.13)式。式。式。式。3.2 主成份分析与相关分析主成份分析与相关分析一、数学模型一、数学模型二、主成份分析二、主成份分析三、主成份的贡献率三、主成份的贡献率这是一个将多个指标化为几个少数指标进行统计分析这是一个将多个指标化为几个少数指标进行统计分析这是一个将多个指标化为几个少数指标进行统计分析这是一个
19、将多个指标化为几个少数指标进行统计分析的问题,设有的问题,设有的问题,设有的问题,设有 维总体有维总体有维总体有维总体有 个随机指标构成一个个随机指标构成一个个随机指标构成一个个随机指标构成一个 维随机向量维随机向量维随机向量维随机向量 ,它的一个实现,它的一个实现,它的一个实现,它的一个实现为为为为 ;而且这个;而且这个;而且这个;而且这个 指标之间往指标之间往指标之间往指标之间往往相往相往相往相 互有影响,是否可以将它们综合成少数几个指互有影响,是否可以将它们综合成少数几个指互有影响,是否可以将它们综合成少数几个指互有影响,是否可以将它们综合成少数几个指标标标标 ,使它们尽可能充分反映原,
20、使它们尽可能充分反映原,使它们尽可能充分反映原,使它们尽可能充分反映原来的来的来的来的 个指标。个指标。个指标。个指标。例如加工上衣,有袖长、身长、胸围、肩宽、领围、例如加工上衣,有袖长、身长、胸围、肩宽、领围、例如加工上衣,有袖长、身长、胸围、肩宽、领围、例如加工上衣,有袖长、身长、胸围、肩宽、领围、袖口、袖深,袖口、袖深,袖口、袖深,袖口、袖深,等指标,是否可以找出主要几个等指标,是否可以找出主要几个等指标,是否可以找出主要几个等指标,是否可以找出主要几个指标,加工出来就可以了呢?例如主要以衣长、胸指标,加工出来就可以了呢?例如主要以衣长、胸指标,加工出来就可以了呢?例如主要以衣长、胸指标
21、,加工出来就可以了呢?例如主要以衣长、胸宽、型号宽、型号宽、型号宽、型号(肥瘦肥瘦肥瘦肥瘦)这样三个特征。这样三个特征。这样三个特征。这样三个特征。一、数学模型一、数学模型设设设设 为为为为 维随机向量,维随机向量,维随机向量,维随机向量,为为为为期望向量期望向量期望向量期望向量,为协方差矩阵,其中为协方差矩阵,其中为协方差矩阵,其中为协方差矩阵,其中 设将设将设将设将 综合成很少几个综合性指标,综合成很少几个综合性指标,综合成很少几个综合性指标,综合成很少几个综合性指标,如如如如 ,不妨设,不妨设,不妨设,不妨设 则有则有则有则有 要使要使要使要使 尽可能反映原来的指标的作用,则要使尽可能反
22、映原来的指标的作用,则要使尽可能反映原来的指标的作用,则要使尽可能反映原来的指标的作用,则要使 尽可能大,可以利用尽可能大,可以利用尽可能大,可以利用尽可能大,可以利用 乘子法乘子法乘子法乘子法:要对要对要对要对a a加以限制加以限制加以限制加以限制 否则加大否则加大否则加大否则加大 ,增大无意义。令增大无意义。令增大无意义。令增大无意义。令 设设设设 并使并使并使并使 可得方程组可得方程组可得方程组可得方程组(2.1)(2.1)的解为的解为的解为的解为 (2.2)(2.2)以以以以 左乘左乘左乘左乘(2.2)(2.2)之两边,得之两边,得之两边,得之两边,得 即即即即 由由由由(2.2)(2
23、.2)式可得式可得式可得式可得 (2.3)(2.3)要使满足要使满足要使满足要使满足(2.3)(2.3)的的的的a a非零,应有非零,应有非零,应有非零,应有 即入是即入是即入是即入是 的特征根,设的特征根,设的特征根,设的特征根,设 是是是是 的的的的 个特征根,只要取个特征根,只要取个特征根,只要取个特征根,只要取 ,再由再由再由再由 ,求出,求出,求出,求出V V的属于的属于的属于的属于 的特征向量的特征向量的特征向量的特征向量 ,在条件在条件在条件在条件 是唯一的是唯一的是唯一的是唯一的 维特征向量维特征向量维特征向量维特征向量 。于是得于是得于是得于是得 (2.4)(2.4)二、主成
24、份分析二、主成份分析 一般协方差方阵为非负定,对角线上各阶主子式都一般协方差方阵为非负定,对角线上各阶主子式都一般协方差方阵为非负定,对角线上各阶主子式都一般协方差方阵为非负定,对角线上各阶主子式都大于等于零,即特征值有:大于等于零,即特征值有:大于等于零,即特征值有:大于等于零,即特征值有:设前设前设前设前mm个都大于零,依次为个都大于零,依次为个都大于零,依次为个都大于零,依次为 ,相应的特征向量为相应的特征向量为相应的特征向量为相应的特征向量为 ,则,则,则,则,即为第一,即为第一,即为第一,即为第一,第二第二第二第二,第第第第 个主成份,由线性代个主成份,由线性代个主成份,由线性代个主
25、成份,由线性代数知识可知,不同的特征根对应的不同的特征向量数知识可知,不同的特征根对应的不同的特征向量数知识可知,不同的特征根对应的不同的特征向量数知识可知,不同的特征根对应的不同的特征向量线性无关,由于线性无关,由于线性无关,由于线性无关,由于V V是实对称阵,则是实对称阵,则是实对称阵,则是实对称阵,则 ,变换后的各主成份,变换后的各主成份,变换后的各主成份,变换后的各主成份 相互无关。即对相互无关。即对相互无关。即对相互无关。即对 进行了一次正交变换。进行了一次正交变换。进行了一次正交变换。进行了一次正交变换。在实际应用中,在实际应用中,在实际应用中,在实际应用中,V V阵往往是未知的,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 方法 建模
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内