计量经济学大作业(共15页).docx
《计量经济学大作业(共15页).docx》由会员分享,可在线阅读,更多相关《计量经济学大作业(共15页).docx(15页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上基于线性回归的保险公司员工选拔模型一、研究背景随着中国改革开放的推进,保险行业也迎来了一个新的春天。尤其是加入WTO后以来,中国保险行业市场越来越完善,发展也越来越迅猛。但整体来看,中国保险业由于起步较晚,规模较小1,目前仍处于发展与挑战并存的机遇期。作为行业发展的一个必备力量,人才的选拔和任用将会直接决定一个企业的长远发展。想要使企业在激烈的市场竞争中获得一席之地,就必须把人力资源的管理放在首位,拥有和储备一大批在知识和技能上胜任保险工作需要的员工2(本文主要以保险代理人为研究对象)。因此如何选拔出保险行业最需要的员工成为摆在保险公司人力资源者面前的最主要问题。之前
2、对于人才招聘的研究大多是从人力资源的角度出发,比如最常见的员工胜任力模型、评价中心技术等等。这些研究大多是从传统的人才评价理论出发进行定性研究、问卷统计研究。而另一方面,在招聘的现实情况中,又存在其他一些“潜在招聘规则”。比如某些企业的招聘人员会下意识进行性别选择、户口选择(农业或非农业)、婚育情况选择、学历选择、工作经历要求等等,这些或软性、或硬性的选人指标,被很多人HR认为是最实用、最实际的招聘方法。普遍意义上来说,这些指标是可以提高公司员工的质量,但从另一个角度来考虑,它们也限制了人才的选拔,使得很多简历“不好看”,但是有实际能力的人才被埋没。造成这一现象的最主要原因就是,这些指标都是来
3、源于经验或者主观臆断,没有比较科学、数理的方法来验证。本文将尝试从新的研究角度出发,根据某一保险公司的真实数据,以计量经济学中线性回归模型为研究方法,探究保险公司员工(保险代理人)的保险业绩与哪些因素有关。以此来对保险公司更好地选拔员工和保险代理人提供建议。二、数据说明与文章框架本文中主要选取了泰康公司2014年保险代理人的实际工作业绩为数据。主要使用的数据是“代理人业务数据”和“TSR员工人员信息”表,数据真实可信。本文包括七个部分,除背景介绍外,首先会对数据进行初步处理和描述性统计。之后的模型介绍一节包括了对理论模型和计量经济学模型的原理介绍。随后进行模型结果的分析,包括参数估计、假设检验
4、、马尔科夫假设的验证等。文章还包括对模型反思与修正,以得到更好的模型形式。后一部分进行了以方差分析为主的拓展研究以验证回归分析的结果。最后根据以上的建模过程与结果进行政策建议。三、数据处理(一)数据处理1数据筛选首先将“TSR员工人员信息”中员工“姓名”与“美日泰康9-11月代理人业务数据”中“代理人”姓名一致的记录筛选出来。将“TSR员工人员信息”中的“姓名”、“出生日期”、“性别”、“户口性质”、“最高学历”、“婚姻状况”、“是否复职”、“生育”、“第一次参与工作时间”、“住房情况”属性保留,将“美日泰康9-11月代理人业务数据”中“代理人”、“年化标保”属性保留,将其按照“姓名”及“代理
5、人”的一致关系整理成一张新的表格。2记录剔除新生成表格中存在大量含有空数据的记录,为尽量多地保留各属性中包含的信息,现将含空数据的记录剔除,而不是将含空数据的属性剔除。剔除操作完成后,剩余46条员工信息记录。3变量转换对剔除后的数据按照“姓名”进行排序,然后将每个代理人的“年化标保”求和,生成新的属性“总业绩”。接着,利用“出生日期”数据计算出代理人在2015年的“年龄”,并生成新属性;利用“第一次参与工作时间”数据计算出截至2015年各代理人的“工作时间”,并生成新属性。最后,将“性别”、“户口性质”、“最高学历”、“婚姻状况”、“是否复职”、“生育”、“住房情况”这几个分类变量转化成虚拟变
6、量:“性别”属性转化为变量“是否为男性”;“户口性质”属性转化为变量“是否为非农业户口”;“最高学历”属性转化为变量“最高学历是否为初中”、“最高学历是否为高中”、“最高学历是否为中专”、“最高学历是否为大专”;“婚姻状况”属性转化为变量“是否已婚”;“生育”属性转化为变量“是否未育”;“住房情况”属性转化为变量“是否自有住房”、“是否租赁住房”。上述变量中,“1”代表“是”,“0”代表“否”。(二)数据的预研究首先对数据进行描述性统计针对数值型变量,描绘其直方图观察其大致分布;针对分类变量,绘制饼图观察各类别所占比例。1.直方图总业绩:年龄:工作时间:其中总业绩分布接近于幂律分布,原理应类似
7、于财富分布的“二八法则”;年龄分布接近于正态分布,主要集中在30岁左右;而工作时间并未有突出的分布形态规律。2.饼图(左侧饼图依据不同类别员工数量汇总绘制,右侧饼图依据不同类别员工业绩汇总绘制):性别:户口:婚姻状况:生育状况:最高学历:住房情况:观察以上各组中的左图,从直观上可得出以下结论:在保险业中,女性员工多于男性员工;农业户口员工所占比例较大;未婚员工多于已婚员工(这从一定程度上与“员工年龄集中在30岁左右”相呼应);拥有大专以上学历的员工少之又少,大专学历的员工为代理人主要组成部分3。对比上述各组中的左右两图可推知:男性员工业绩优于女性员工业绩;农业户口员工业绩优于非农业户口员工业绩
8、;未婚员工业绩优于已婚员工业绩;已育一子女员工的业绩优于已育两子女员工的业绩优于未育子女员工的业绩;大专学历员工业绩优于其他学历员工业绩;自有住房员工的业绩优于租赁租房员工的业绩。接下来,从跟深层次的角度挖掘各个解释变量与被解释变量之间的联系。四、模型介绍回归被用于研究可以测量的变量之间的关系。线性回归则被用于研究其中一类特殊的关系,即可以用直线或多维直线描述的关系。在本文中,我们建立多元回归模型如下:(一)理论模型经过上一节中对数据的预处理,同时考虑企业招聘中的现实情况,我们将初步建立一个多元回归模型。其中因变量为保险公司代理人的工作业绩,自变量包括性别、户口类型、最高学历、婚姻状况、生育状
9、况、住房情况这些虚拟变量和年龄、工作时间这两个数值型变量。初步设定回归模型都是线性关系。(二)计量经济学模型总结上述研究,建立计量经济学模型如下:y=0+1mid+2seni+3tec+4juni+5marry+6nonbab+7male+8nonagri+9ownh+10renth+11age+12wtime+总计有12个回归变量。其中mid、seni、tec、juni分别表示最高学历是否为初中、高中、中专、大专,marry表示是否已婚,nonbab表示是否未育,male表示是否为男性,nonagri表示是否为非农业户口,ownh表示是否自由住房,trenth表示是否租赁住房,age表示年龄
10、,wtime表示工作时间。1、2 是偏回归系数。举例来说,1表示其他变量保持不变的情况,学历是否为初中对于因变量工作业绩的影响。 (三)线性回归方程y=0+1mid+2seni+3tec+4juni+5marry+6nonbab+7male+8nonagri+9age+10wtime+11ownh+12renth由于总体回归参数1、2 未知,所以就必须用样本数据去估计。在这里采用的是最小二乘法估计参数。最小二乘法的简单表述为:找出让残差平方和最小的参数。即:本文主要运用SPSS来进行研究,具体结果与参数检验、显著性检验及模型进一步修正见下一部分。五、回归分析及前提检验(一)计算结果分析根据上述
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 经济学 作业 15
限制150内