欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    统计方法在大学英语四级成绩分析中的应用.pdf

    • 资源ID:69681297       资源大小:234.31KB        全文页数:6页
    • 资源格式: PDF        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    统计方法在大学英语四级成绩分析中的应用.pdf

    第 32 卷第 1 期2012 年 3 月数学理论与应用MATHEMATICAL THEORY AND APPLICATIONSVol32 No1Mar 2012统计方法在大学英语四级成绩分析中的应用李再兴胡杰史小凯赵颖旺范文凤黄丹景平(中国矿业大学,北京,100083)摘要本文以本校2005 级本科生为调查对象,考察影响大学生四级考试(College English Test Band Four,简称 CET 4)CET 4 成绩的因素 采用 Bootstrap 方法与 T 检验方法,分析得出:来自城市和农村的大学生 CET4 成绩存在差异;大一大二四学期英语水平不同的人 CET 4 成绩存在显著差异;文、理科大学生 CET 4成绩也存在差异 进一步,我们运用多元统计中回归分析的方法建立了 CET 4 成绩的回归模型,并利用 Lo-gistic 模型对四级通过率进行了预测关键词CET 4 成绩Bootstrap 检验T 检验多元回归分析Logistic 模型Statistical Analysis for CET 4Li ZaixingHu jieShi XiaokaiZhao YingwangFan WenfengHuang DanJing Ping(School of Science,China University of Mining Technology,Beijing,100083,China)AbstractThis paper surveys the impact factors on the performance of College English Test Band Four(CET 4 forshort)via a research on the undergraduate students enrolled in 2005 in our university It is found out by the Bootstrapmethod and the T test that the CET 4 performances have significant differences between the students from the ur-ban and the rural areas,between the freshmen and the sophomores,and between the students of science and art Amultivariate linear regression model and a Logistic model are established for analysing the results of the CET 4 andforecasting the passing ratesKey wordsCET 4Bootstrap testT testMultiple regression analysisLogistic model1引言英语的重要性众所周知,英语四级(CET 4)成绩是衡量大学生英语水平的一把尺子 根据现状以及对 CET 4 的了解,主观认为推断影响 CET 4 的因素可能有:1)学生高考英语成绩;2)学生大一大二英语学习成绩本文以本校2005 级本科生为调查对象,使用统计的方法来考察影响大学生 CET 4 成绩本文获得中央高校基本科研业务费的资助,以及北京市大学生科学研究与创业行动计划,中国矿业大学(北京)大学生创新性计划,和中国矿业大学(北京)理科“概率论与数理统计”课程建设的资助收稿日期:2012 年 1 月 30 日数学理论与应用的因素 具体来说,我们考察了本校 2005 级 876 名本科生,将原始数据整理得到下表表 1数据分布情况表项目户籍成绩等级文理科农村城市大一大二英语平均成绩 70 分以上大一大二英语平均成绩 70 分以下文科理科人数4184585423345673百分比 47 72%52 28%62 51%3749%4341%56 59%注:由教务处提供学生四学期的英语成绩及 CET 4 的首次考试成绩基于表 1 中已经分组的学生,我们采用 Bootstrap 方法和 t 检验两种方法检验了1)H01:农=城vs H02:农 城,检验来自农村与来自城市的学生四级考试成绩是否有差别;2)H11:高=低vs H12:高 低,检验平时英语成绩水平不同的人的四级考试成绩是否有差别;3)H21:文=理vs H22:文 理,检验文理科学生的四级考试成绩是否有差别,这三个假设检验问题在此基础上,我们建立了 CET 4 成绩和相关因素的回归方程,并利用 logistic 模型预测了学生的四级通过率2检验2 1Bootstrap 检验Bootstrap 方法中文译为“自助法”,自助法是一种重复抽样方法,也是一种以观察数据为依据的模拟方法 随着计算机的高速化,它广泛地应用在参数估计、假设检验、回归分析等许多统计领域中我们考察假设检验问题 1)H01:农=城vs H02:农 城记 X、Y 分别表示来自农村和城市的两组样本,根据经验和相关常识,假设这两组样本相互独立是合理的 我们采用 Bootstrap 方法如下:1 由已知数据计算 X、Y 的均值珔X、珔Y 之差的绝对值 T=珔X 珔Y=15 26702 由 X、Y 组合得一新向量 Z,其中Z1=X1,Z2=X2,Zm=Xm,Zm+1=Y1,Zm+2=Y2,Zm+n=Yn3 从 Z1,Z2,Zm+n中抽取 Bootstrap 样本,由得到的均值记为珔X*的均值,由得到的均值记为珔Y*的均值,两者之差的绝对值记为 T*=珔X*珔Y*4 重复第 3 步 B=2000 次,得到 B 个 Tb*,b=1,B,排序得到;001统计方法在大学英语四级成绩分析中的应用5 对给定显著性水平 =0 05,比较 T=15 2670 与 T*B (1)=8 1238 的大小由于 T T*B (1),则拒绝原假设,即认为两者有差别;由此得到的结论是:来自城市和农村的大学生 CET 4 成绩存在差异同理考虑第二个假设检验问题,由程序得数据 T=51 6569,T*B (1)=8 6429 故拒绝原假设,大一大二四学期英语水平不同的人 CET 4 成绩存在显著差异同理考虑第三个假设检验问题由程序得数据 T=34 5093,T*B(1 )=21 6370 所以文、理科大学生 CET 4 成绩也存在差异2 2T 检验通过过去大量的抽样试验和研究表明,在一些大中小学学校的学生成绩分布符合正态分布 由上一种检验法知两个样本相互独立,在 1,2未知的情况下,我们假设两个样本的方差相等即 21=22=2,建立如下假设:H0:1 2=0 vs H1:1 2 0t 检验统计量t=(x y)sw1m+1槡n,其中 s2w=(m 1)s2x+(n 1)s2ym+n 2从而检验问题的拒绝域为W=t t12(m+n 2)选定显著水平 =0 05,对所做的问题进行检验,结果如下:来自城市和农村的大学生 CET 4 成绩存在差异;大一大二四学期英语水平不同的人CET 4 成绩存在显著差异;文、理科大学生 CET 4 成绩也存在差异3多元线性回归本文采用多元回归分析对 CET 4 的成绩与大学四学期英语成绩的关系进行线性回归分析,它是处理多个变量间相互依赖关系的一种数理统计方法 变量间的相互依赖关系在实际问题中是大量存在的,回归分析是研究这种相互依赖关系的有效数学方法3 1多元线性回归模型的建立假设因变量 Y 与(x1,x2,xm)线性相关,收集到的 n 组数据(yt,xt1,xt2,xtm)(t=1,n)满足以下回归模型:yt=0+1xt1+mxmt+tt N(0,2),相互独立(t=1,2,n)3 2回归模型的结果及分析101数学理论与应用表 2回归结果项目回归方程城市y1=8927+1 011x1+1 261x2+1189x3+1 190 x4+2232x5农村y2=66049+0560 x1+0 933x2+1260 x3+1688x4+2355x5大一大二英语平均70 分y3=179 587+0 911x1+1593x2+1 425x3+1486x4+2 643x5大一大二英语平均 70 分y4=72836+0684x1+1 121x2+0 827x3+0458x4+1470 x5文科y5=108 051+0 672x1+1754x2+1 706x3+0481x4+2 675x5理科y6=48616+1009x1+1 277x2+0291x3+2596x4+1199x5总的y=77635+0 773x1+1094x2+1 225x3+1430 x4+2 323x5其中 y 表示 CET 4 的成绩,x1,x2,x3,x4,x5分别表示高考成绩及大一大二四学期的英语成绩3 3回归系数的显著性检验表 3回归系数检验结果P 值项目x1x2x3x4x5城市显著显著显著显著显著农村显著显著显著显著显著大一大二英语平均成绩70 分显著显著显著显著显著大一大二英语平均 70 分显著显著显著不显著显著文科显著显著显著不显著显著理科显著不显著不显著显著不显著总的显著显著显著显著显著其中取 =0 05,则在大一大二英语平均70 分与文科的学生中,x4的 p 值都大于,即x4在回归方程中不显著;在理科学生中 x2,x3,x5的 P 值均大于,说明 x2,x3,x5在该回归方程中不显著 这需要使用逐步回归的方法来考虑,这是我们下一步的研究内容4四级通过率预测 Logistic 回归模型预测结果4 1定义设 Y 服从两点分布,即Y=1,如果随机试验成功,0,如果随机试验失败,又设协变量 X=(1,x1,x2,xp)以及参数向量 =(0,1,2,p),记(X)=X=0+1x1+2x2+pxp 若给定 X 下,Y=1 的概率为 P(Y=1X)=e(X)1+e(X),则称(Y,201统计方法在大学英语四级成绩分析中的应用X)服从非条件 Logistic 回归模型4 2参数估计设(Y,X)服从 Logistic 回归模型,从总体(Y,X)中抽取一个容量为 n1+n2的随机样本(1,X1),(1,X2),(1,Xn1),(0,Xn1+1),(0,Xn1+n2),其中 Xi=(xi1,xip),i=1,2,n1+n2 由最大似然估计理论可得对数似然函数为lnL()=n1i=1(0+1xi1+pxip)n1+n2i=1ln(1+exp(0+1xi1+pxip)令lnL()0=n1n1+n2i=111+exp(0 1xi1 pxip)=0lnL()k=n1i=1xikn1+n2i=1xik1+exp(0 1xi1 pxip)=0,k=1,2,p用牛顿辛普松迭代法求解上述非线性方程组可得到最大似然估计 0,1,p继而可以得出倾向度的最大似然估计P(Y=1|X)=exp(0+1x1+pxp)1+exp(0+1x1+pxp)由此可知:如果知道一个学生的高考成绩及大学四学期英语成绩,即可预测出他过四级的概率表 4Logistic 回归的系数显著性检验是否显著项目012345Logistic 回归方程系数显著显著显著显著显著显著下表为用 2005 级 300 学生的成绩做检验表 5预测结果实际通过级别预测通过未通过预测正确率(%)通过情况(181)148338177%不通过情况(119)21988235%5结果讨论5 1结果分析由以上两种检验方法结果我们得出相同的结论,结果分析如下:1)城市与农村英语四级成绩存在差别主要是因为在 2005 级学生读中学时候农村与城市301数学理论与应用对英语的重视程度存在很大的差别,这导致他们进校的英语水平存在差异,虽然在大学接受的是同样的教育,但差异在很短时间内还是很难消除的2)平时成绩 70 分以上与 70 分以下的人四级成绩存在差异,这也说明了四级成绩与大学四学期英语成绩存在很大的相关性,这为我们下面的回归模型分析提供了很好的说服力3)文科与理科英语四级成绩存在差异,从我们的日常生活中就很容易发现,文科生与理科生对英语的重视程度是不一样的,理科生则偏重于那些逻辑证明,而对于英语则不那么重要,而文科生对于英语确是另一种态度,可以说乐在其中,因此就导致了这种差异由此可见,平常我们主观感觉的一些结论是正确的,具有理论保证的,学生在考四级之前的努力占有很大一部分的作用,而生活在不同环境的人对英语的重视程度及感兴趣程度也影响着英语四级的成绩的5 2几点建议1)学校在第四学期(考四级学期)要加强对学生英语各方面水平的强化训练;2)学校应想办法激起理科生学英语的兴趣;3)四级考试中,想要取得高分或是顺利通过,必须平时努力,积累,而非考前突击6总结总之,影响英语四级考试成绩是多方面的,而英语四级成绩的提高也不是一朝一夕能完成的,而光靠学校老师的努力也是不能成功的,因此学生自己也应该从自身具体条件出发,找到一套适合自己的学习英语的方法,与学校老师一起提高本校的四级通过率参考文献 1高惠璇 应用多元统计分析 M 北京:北京大学出版社,2006 2茆诗松、程依明、濮晓龙著 概率论与数理统计教程 M 北京:高等教育出版社,2004 3郝黎仁、樊元、郝哲欧等著 SPSS 实用统计分析 M 北京:中国水利水电出版社,2002 4茆诗松 统计手册 M 科学出版社,2003401

    注意事项

    本文(统计方法在大学英语四级成绩分析中的应用.pdf)为本站会员(asd****56)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开