K最近距离模型填补.doc
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《K最近距离模型填补.doc》由会员分享,可在线阅读,更多相关《K最近距离模型填补.doc(41页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、国内大学综合评价姓名学号学院年级专业联系电话相关学科成绩高等数学线性代数概率统计数学模型数学实验英语四级英语六级余肇飞弘深学院08理工综合4班100100978181524469张伟弘深学院08理工综合5班9492868080499433王国宁弘深学院08理工综合1班9394848484483未考一、摘要本问题要求对国内100所大学的不同指标数据进行研究,完善数据后分析不同地区,不同类型大学的差异并将后20所大学分类。同时建立评价体系进行评价并分析该评价体系的优缺点。对于问题1,本文就缺失数据的不同特点分别建立多元线性回归模型和K最近距离模型对数据进行估算,结果如下表:问题1的数据填补总表学校
2、因素填补值学校因素填补值学校12博士3288学校86硕士12078学校60正高3828学校95正高2877学校15教学成果15092.2178学校22理学566.2518学校17规划教材1191.4118学校71规划教材737.148学校41教学团队100学校17中级1865学校28实验中心29学校4理学100.63813学校10理学398.65391学校4工学5768.4647学校59理学264.0728学校3工学621.5161学校13经济学3635.8797学校22经济学123.2472学校84本科录取分数线2.对于问题2,本文主要分析教学水平,人才培养,科研能力三个评判标准。又将三个评
3、判标准进一步细分为26个指标。分别建立层次结构模型,构造判定矩阵并计算各个指标的相对权重,同时进行一致性检验证明其合理性。在此基础上制定了评分表,对各个学校三个评判标准打分并综合分析不同地区,不同类型大学的差异。对于问题3,本文建立模糊识别模型,利用择近原则,对后20所大学进行分类。结果如下表:问题3学校类型判别表学校81828384858687888990类型综合综合农林综合综合综合师范综合理工综合学校919293949596979899100类型综合综合综合综合综合农林综合师范综合综合对于问题4,本文在问题2的基础上评价各大学的教学水平,人才培养,科研能力。同时建立体积评判模型,综合考虑教
4、学水平,人才培养,科研能力三个评判标准,评价各大学的综合能力并进行排名。对于问题5,我们主要与广东管理科学研究院评价方法进行比较,就评价体系建立的原则,大学评价的侧重点,定量、定性方法,综合能力的重视,关于统一排名问题,文理比重问题进行了对比分析。关键词:大学评价线性回归k最近距离层次分析模糊识别体积评判模型 二.问题重述大学评价问题是一个非常重要而又极其复杂的多目标评价问题。大学评价是以大学教育的社会功能为依据,运用有效的技术和手段对大学活动的过程和结果进行测定、分析和比较并给以价值判断的过程。其根本的目的在于通过评价促使大学不断优化资源配置、提高利用效率,从而不断提高科研水平和人才培养质量
5、,如新生入学成绩低,就加强招生宣传工作等。更进一步还可以从大学评价和排名的变化和发展中洞察高等教育和大学发展的一些信息和意义。现有某年国内100所大学的不同指标数据(所有数据均为虚构),利用这些数据,完成以下任务:首先,请用适当方法进行完善存在缺漏的数据。其次,更具前80个学校的数据分析不同地区,不同类型大学的差异所在;以及试判断一下后20所大学属于什么样的办学类型(理工、综合、农林、师范、财经和医药等)。接下来用适当方法,对这些大学的综合实力和某些方面的能力(如科研能力)进行评价。最后,就你的评价方法与其他大学评价方法(主要是现在比较流行的评价方法)进行比较分析(如存在哪些优点和不足)。三、
6、模型假设及符号说明3.1模型假设 (1)相同地区的学校各项指标服从正态分布; (2)相同类型的学校各项指标服从正态分布; (3)学校的办学类型只与不同学科科研能力有关;(4)学校的综合能力只与教学水平,人才培养,科研能力有关;(5)教学水平,人才培养,科研能力对综合能力的影响权重相等。3.2符号说明符号说明中级初级精品课程特色专业规划教材教学团队双语课程实验中心本科录取分数线教学成果普通本科博士硕士正高副高学校i的第j种指标各类指标中数值最大者学校各指标得分第i所学校第s个评判标准所有学校的第s个指标中得分最大者评判标准归一化后得分科研能力得分教学水平得分人才培养得分正态型模糊子集 的从属函数
7、综合能力得分四任务一模型建立与求解4.1问题分析可以将数据缺失分为两类,一类缺失数据与其它变量有明显的线性关系,我们采用多元线性回归法进行填补。另一类缺失数据与其它变量没有明显的线性关系,我们采用K最近距离模型进行填补。4.2多元线性回归法填补数据:先对所给数据进行观察,找出相关因素,如下表4.1所示:表4.1 相关因素博士,硕士,正高,副高本科录取分数线,教学成果,普通本科教学成果,规划教材,教学团队,双语课程,实验中心,特色专业中级,正高,副高,初级实验中心,教学团队,精品课程,特色专业设中级为,初级为,精品课程为,特色专业为,规划教材为,教学团队为,双语课程为,实验中心为,本科录取分数线
8、为,教学成果为,普通本科为,博士为,硕士为,正高为,副高为以表中每行第一个因素为因变量,其余为自变量,去掉数据缺失的学校,用余下学校的数据通过spss 进行逐步多元线性回归,通过显著性检验,得到影响因素显著相关的关系回归方程, 由以上5个回归方程可得学校12的博士人数大约为3288人 ,学校86的硕士人数大约为12078人,学校60的正高人数大约为3828人,学校95的正高人数大约为2877人,学校84的本科录取分数线大约为2.,学校17规划教材大约为1191.4118,学校71的规划教材大约为737.148 ,学校17的中级人数大约为1865人,学校28的实验中心个数大约为29个。其中学校1
9、5的教学成果数据和学校41的教学团队的个数可以根据两个式子计算出两个值,即,学校15的教学成果大约为1206.83466和1811.601,学校41的教学团队个数大约为122和78个,两次算出的平均值为最终结果:学校15的教学成果大约为15092.21783,学校41的教学团队个数大约为100。4.3 K最近距离模型填补对于不同学科科研能力数据的完善,由于各学科与其他变量之间没有明显的线性关系,我们无法建立线性回归模型,但同种类型学校的科研能力有一定的联系,可以用科研能力相关的同种学校的数据来估算缺失数据的学校的数据。我们考虑建立K最近距离模型。其步骤如下:统计不同学校类型的学科科研能力数据。
10、求出具有缺失数据样本与其他样本的相关性矩阵。根据相关分析来确定与缺失数据样本相关性较大的的K个样本,用这K个样本分别与缺失数据样本建立回归模型,并估算缺失数据值。将这K个值加权平均来估计该样本的缺失数据值。不同学校类型的学科科研能力数据见附录表1:我们以学校10为例,完善其数据。学校10属于理工类学校,同种类型数据完善的学校还有31所,我们用Excel的数据处理功能求出这32所学校学科科研能力的相关系数矩阵R:我们提取与学校10有关的数据,如表4.2表4.2 相关系数表相关系数学校10学校6学校8学校9学校19学校21学校28学校34学校101.00000 0.99924 0.99984 0.
11、99955 0.99643 0.99980 0.99994 0.99911 相关系数学校35学校38学校39学校40学校44学校46学校47学校53学校100.99984 0.99786 0.99967 0.99951 0.99993 0.99982 0.99973 0.99997 相关系数学校54学校56学校57学校58学校62学校63学校64学校65学校100.99955 0.99975 0.99998 0.99984 0.99986 0.99997 0.99971 0.99955 相关系数学校67学校69学校71学校72学校74学校75学校76学校77学校100.99998 0.9991
12、8 0.99962 0.99936 0.99977 0.99652 0.99977 0.99952 我们选取与学校10相关系性较大的6所学校为样本,它们分别为学校28,学校44,学校53,学校57,学校63,学校67。分别设学校10,学校28,学校44,学校53,学校57,学校63,学校67的学科科研能力为,分别建立与的线性回归方程。用Excel求出结果为:代入6个学校理学的值,求得Y的值分别为:101.7298,84.68322,66.49446,45.34617,184.9498,1908.72。所以学校10的理学值为398.65391,同理可得学校4的理学值为100.63813,工学值为
13、5768.4647,学校59的理学值为264.0728,学校3的工学值为621.5161,学校13的经济学为3635.8797,学校22的经济学为123.2472,理学为566.2518。最终所有要填补数据见表4.3表4.3 数据填补总表学校因素填补值学校因素填补值学校12博士3288学校86硕士12078学校60正高3828学校95正高2877学校15教学成果15092.2178学校22理学566.2518学校17规划教材1191.4118学校71规划教材737.148学校41教学团队100学校17中级1865学校28实验中心29学校4理学100.63813学校10理学398.65391学校
14、4工学5768.4647学校59理学264.0728学校3工学621.5161学校13经济学3635.8797学校22经济学123.2472学校84本科录取分数线2.五任务二模型建立与求解 5.1问题分析对于不同地区,不同类型大学的差异分析,我们希望通过得分说明。我们需要将题目所给数据进行处理。运用评分的方法,得出各个学校,各个指标的评分表。在进行评分表制作之前,需要弄清楚各学校各指标之间的内在关系。本文将众多指标分为三大类(教学水平,人才培养,科研能力),作为大学评判标准。并通过层次分析法,解决学校各指标之间的内在关系以及影响评判标准指标的权重问题。5.2建立层次结构模型5.2.1建立教学水
15、平模型决定教学水平的指标分析决定教学水平的可能指标很多,我们结合本题所给数据表,尽量选择一些有代表性的、相对独立的对教学水平影响比较大的指标 。主要有规划教材,教学团队,双语课程,实验中心,教学成果,人才培养这六个指标。建立教学水平层次结构模型根据以上分析,可把教学水平的影响指标分为2个层次。(1)最高层即目标层A:教学水平(2)准则层1:规划教材(B1),教学团队(B2),双语课程(B3),实验中心(B4),教学成果(B5)精品课程(B6)。根据科学性、合理性、时效性和规范性的原则,建立层次结构模型,如图5.1。图5.1 教学水平层次结构图教学水平规划教材教学团队双语课程实验中心教学成果精品
16、课程构造判断矩阵与计算相对权重根据T. I. Saaty 提出的九分位标度,见附录表2,进行相对重要性评分,构成判断矩阵,矩阵中的元素表示同一层次中两个指标之间相对重要程度的比较值。运用两两项比较的方法,对各相关元素进行两两比较评分,根据中间层的若干指标,可得到若干两两比较的判断矩阵。设矩阵的第i行j列元素为,利用根法(即几何平均法)将矩阵的各个列向量采用几何平均,然后归一化,得到的列向量就是权重向量。其公式为利用MATLAB编程,可求得值,见附录程序1把权重向量也列于矩阵中,得到1个矩阵,见下表5.1 表5.1 权重向量表AB1B2B3B4B5B6W1B111/221/31/41/30.07
17、41B22131/21/31/20.1200B31/21/311/41/51/40.0481B432411/31/20.1697B54353120.3593B632421/210.2288一致性检验为了保证判断矩阵的可靠性,必须在排序前对判断矩阵做一致性检验。步骤如下:计算一致性指标其中是A的最大特征根,除特征根方法外,可用公式计算。查找相应的平均随机一致性指标见附录表3附录表2给出了115阶正互反矩阵计算1000次得到的平均随机一致性指标。计算一致性比例当时,认为判断矩阵的一致性是可以接受的。当时应该对判断矩阵作适当修正。由MATLAB求得(程序见附录程序1):故满足一致性要求。5.2.2建
18、立人才培养层次结构模型决定人才培养的指标分析决定人才培养的指标很多,我们同样选择一些有代表性的、相对独立的对人才培养影响比较大的指标。一般来说,影响人才培养的主要指标包括以下3 个大的方面:师资力量,学生水平,所获奖项。这3个主要方面又可进一步细分成具体的影响指标。其中师资力量包括正高,副高,中级。学生水平包括博士,硕士,本科生。所获奖项包括数学建模,挑战杯,优博论文。建立层次结构模型根据以上分析,可把影响人才培养的指标分为3个层次。(1)最高层即目标层C:人才培养(2)准则层1:师资力量(D1),学生水平(D2),所获奖项(D3)。(3)准则层2:正高(E1),副高(E2),中级(E3),博
19、士(E4),硕士(E5),本科生(E6),数学建模(E7),挑战杯(E8),优博论文(E9)。根据科学性、合理性、时效性和规范性的原则,建立层次结构模型,如图5.2。图5.2人才培养层次结构图人才培养师资力量学生结构获得奖项正高副高初级博士硕士本科数学建模挑战杯优博论文构造判断矩阵与计算相对权重与类似,根据九分位标度进行相对重要性评分,构成判断矩阵。该模型中一共有4 个判断矩阵,分别是目标层对准则层1的一个矩阵,准则层1对准则层2的3个矩阵。设矩阵的第i行j列元素为,利用根法(即几何平均法)求得权重向量。其公式为利用MATLAB编程,可求得值,见附录程序2把权重向量也列于矩阵中,得到4个矩阵。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最近 距离 模型 填补
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内