欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    数据统计与分析.doc

    • 资源ID:17611788       资源大小:433.50KB        全文页数:59页
    • 资源格式: DOC        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    数据统计与分析.doc

    【精品文档】如有侵权,请联系网站删除,仅供学习与交流数据统计与分析.精品文档.附录1: 利用EpiData附加软件输入数据 本章的数据输入法是任选的,本着“萝卜白菜各有所爱”,不妨也一起介绍出来。不过第3章介绍的(以DATA LIST命令为首的)数据输入法,无需去另找附加的输入软件。EpiData是丹麦的一个非盈利组织编写的用以数据输入的免费软件,要获得该软件,需要通过Internet网登录http:/www.epidata.dk主页,根据相应的提示才可下载。 EpiData最早的版本Version 1.01发布于2000年10月,目前运用得较多的是EpiData version 3.0版,发布于2003年8月。下面简单介绍如何用EpiData3.0输入数据,并转换成SPSS能够分析的数据。打开EpiData程序文件,可以见到其最基本的窗口(见图18-1)。图18-1 EpiData 基本窗口 从EpiData的基本窗口来看,数据输入主要有6个步骤。(1)制作数据描述文件(Define Data);(2)建立数据文件(Make Data);(3)检查数据(Checks);(4)数据输入(Enter Data);(5)浏览数据文件资料(Document);(6)输出数据(Export Data)。 下面逐一加以介绍。1.制作数据描述文件(Define Data)(1)打开一个空白的数据描述文件 单击Define datanew .QES file,自动建立一个名字为untitled1的空的数据描述文件(见图18-2),数据描述文件的扩展名为QES,QES是questionaire的缩写。 图18-2 一个空白的数据描述文件窗口(2)把空白的untitled1文件存储成想要的文件名(如first.qes)方法是:单击filesave as命令,弹出一个对话框后,把untitled1改成 first.qes,然后保存。(3)输入数据描述信息在空白的数据描述文件里,编辑需要制作的数据描述文件,主要编写的信息包括变量名、变量标签、变量值的界定等,图18-3给出了关于“礼物赠送”调查中的数据描述文件。 图18-3 输入数据描述信息后的EpiData窗口输入的基本原则是:第一必须有一个变量的名字,如id,v1等;第二要对变量进行描述,如id “个案号”,v1 “您的性别”等;第三要用Shift + #号键定义输入的变量。变量有几个码,就打几个#键,如id #; V1 性别 # 。(4)输入完毕要存盘。方法:单击FileSave as first.qes命令存盘,或用Ctrl+S键也一样可以存盘。(5)预览输入变量的格式 寻找Preview Data Form(预览输入变量的格式)命令 ,方法是用Ctrl + T键,或者打开Make Data File工具条,见图18-4。 图18-4 打开一个预览数据窗口Preview Data Form功能的最大优点是:在不必建立数据文件的情况下,提前对数据输入格式进行检查,可以输入数据,看是否有问题,一旦发现问题,可以及时修正。 图18-5 预览一个数据描述文件信息的窗口 图18-6 建立数据文件步骤12.建立数据文件数据文件的扩展名是rec(recoder的缩写),建立的方法如下。 单击“2 Make Data File”Make Data File命令,弹出Create data file from .QES file)对话框,其中有两个选项,一个是Enter name of .QES file(说明数据描述文件的路径与名字),另一个是Enter name of data file(说明数据文件的路径与名字),然后单击OK键,生成first.rec文件。见图18-6和图18-7。 图18-7 建立数据文件步骤23.检查数据如果需要对输入数据的方式进行某种专门的规定,则可在Checks功能下进行,如果没有可修改的,则可直接输入数据,而不必经过这一步骤。单击图18-6中的Checks选项,即出现图18-8的对话框。图18-8 检查数据对话框 图18-9 数据输入对话框在上述对话框中,可以对变量标签、范围、是否跳答等进行界定。对话框中某些选择项的意义如下。Value label赋值(如sex income等)Range/legal规定变量值的范围(如10-80,99)Jumps跳答1>write 如果回答1 ,则跳到职业(S2):输入1>S2Must enter一定要输入某个值(如yes)RepeatNo 一般选择NO,对以前输入的某个值在出现类似情况时进行复制。修改完成之后或逻辑校验完成以后的数据存成fiest.chk。经常出现Checks无法进入,碰到这种情况,单击FileClose all命令,把所有打开的文档关闭即可。4数据输入方法:单击图18-6中的 Enter Data命令,出现对话框后选择first.rec名。若出现如图18-9所示的数据输入对话框,则输入数据,输入完毕单击Fileclose form命令即可。 5.浏览数据文件的信息单击图18-10中的Document,可以对数据文件资料的相关信息进行浏览,这些信息包括了数据文件的相关信息、数据输入注意事项、数据文件标记、数据清单、编码表、逻辑检查等。6.输出数据单击图18-10中的Export dataSPSS命令,打开对话框,在图18-11中寻找first.rec文件,然后单击“打开”按钮,出现Export Data对话框(见图18-12)后单击OK按钮,出现Information对话框(图18-13)后单击OK按钮,输出的数据以first.sps为名,见图18-14。 图18-10 数据输出步骤1 图18-11 数据输出步骤2图18-12 数据输出步骤3 图18-13 数据输出步骤4图18-14 数据输出结果图 图18-15 将EpiData数据转换为SPSS数据步骤1打开SPSS,单击FileOpenSyntaxfirst.spsSelect all命令,选定信息(见图18-15和图18-16),然后单击Run(运行),则可以在SPSS变量浏览界面看到已经转换好的数据,最后单击FileSave As命令,存储成用户自己可识别的*.sav文件(图18-17),便可进行各种统计分析。图18-16 将EpiData数据转换为SPSS数据步骤2 图18-17 由EpiData转换过来的SPSS数据界面附录2:数据统计与分析SPSS应用教程习题答案 本“习题答案”也适用于统计分析应用教程SPSS,LISREL & SAS实例精选书中的习题。 习题1答案1(1)答:有错误, 犯了水平互相嵌套的错误; 如“每周去 2次或 2次以上”把第1组的编码嵌套进去了。又比如:“每周去 3次或 3次以上”又把第2组的编码嵌套进去了。 (2)答:正确的编码方案如下: 1=每周去1次 2=每周去2次 3=每周去3次 4=每周去4次或4次以上 2答:该编码问题严重。 (1)80岁不能是缺失值, 缺失值可用00岁。 (2)职业不编码不行, 而必须编码为:1=工人 2=农民 等等。 (3)职业变量用全称(Occupation)超出8个字符。 (4)而且栏目位置占1列即可。 (5)颜色的第1个字母作为变量值会引起重复,应该用单词的前3-4个字符。 (6)Color 变量的栏目位置10被嵌套在“4-14”之内,这是严重的错误。 更正后的编码方案见图1-19:VariableCode栏目位置Age00岁是Missing Value1-2Occupation职业应编码为:1=工人 2=农民3=教师 4=干部5=医生 6=其它职业变量要缩写,如Occu,然后用变量标签注解Occu为“职业”3Color颜色用前三个字母作为变量值,比如: blu=蓝色(blue)bla=黑色(black)4图1-19 纠错后的编码方案3(1) 答:错。错在变量名超过8个字符。 (2) 答:错。错在变量名的首字符是数字领头。 (3) 答:错。错在变量名中间冒出一个空格。 (4) 答:对,#号可以作为变量名。但不提倡。习题2答案1答:合并后的大目标数据文件“BIGab.sav” 中仍然有30个Cases、但每个Cases各有(50+30)=80个变量,即v1、v2、v3、v4v50、x1、x2、x3、x4x30。2答:合并后的大目标数据文件“BIGab2.sav”中仍然是50个变量,即v1、v2、v3、v4v50。但是Cases数目增加为(20+30)=50个Cases。3答:请读者照着书中的方法去使用对话框。排序的命令如下:SORT CASES BY xh (D)sex. LIST xh sex score。4答:对话框的解法请按照书中介绍的去举一反三。命令解法如下:GET File=9293.sav.SELECT IF (location=2 AND sex=2). SORT Cases BY xh (D) sex.LIST xh sex score.5答:对话框的解法请按照书中介绍的去举一反三。命令解法如下:SAMPLE 0.20.LIST xh.6答:对话框的解法请按照书中介绍的去举一反三。命令解法如下: N 50. LIST xh.7答:对话框的解法请按照书中介绍的去举一反三。命令解法如下: WEIGHT BY location.8答案略。9答案略。 习题3答案1(1) 答:DATA LIST 命令本身应有终止符“.”。 (2) 答:在DATA LIST 命令中,File所调用的数据文件名必须用一对左撇号括住。 正确的写法是:DATA LIST File='Myf1.Dat'/v1 1-2 v2 3. (3) 答:栏目位置不够变量数目整除。 正确的写法是:DATA LIST/v1 To v12 10-33. (4) 答:数值标签要用一对左撇号括住,而且要加上命令的终止符“.”。 正确的写法是: VALUE LABEL Vf 1 '工人' 2 '农民' 3 '教师' 4 '医生'. (5) 答:命令后面应有终止符“.”。 正确的写法是: VALUE LABEL Vf 1 '工人' 2 '农民' 3 '教师' 4 '医生' 5 '干部'. (6) 答:定义缺失值时只能根据变量的栏目位置赋予一个唯一的值。 正确的写法是:MISSING VALUE v1 To v100 (-1). 或是:MISSING VALUE v1 To v100 (0). (7) 答:变量标签是唯一的;一个变量应该对应唯一的一个标签。 正确的写法是: VARIABLE LABEL Score1 '第一次考试的成绩' /Score2 '第二次考试的成绩'/Score3 '第三次考试的成绩2(1)答:此文件的前5个cases见表1-4。表1-4 文件的前5个casesCASESIdageHeight101231.65202221.70306211.75408211.76512211.68(2)答:学号为01的学生有最多的Score1(高考得分)。 (3)答:学号为12的学生家住农村。 (4)答:在Vm变量中,有4个Cases 的数据有效。 3答:至少有8处错误。 (1)A应改为(A) (2)Haircolor超过8个字符,应改为Haircolr (3)Weigh应改为WEIGHT (4)VALUE LABEL中的 Eyecolr应改为 Eyecolor (5)VALUE LABEL中的 Haircolor应改为8个字符以内,如Haircolr (6)MISSING VALUE 中的age(-1)应去掉,因为Data List 中尚未定义age。(7)正确的MISSING VALUE语句应改为:MISSING VALUE Height Weight(000). (8)List Variable语句应改为:List Variable=Height To Eyecolor.4答:“05 F Ll”中的Ll为字母(型),犯了类型不匹配的错误。 正确的写法是:05 F 005答:总体(population)是样本测量值的集合。对于感兴趣的整个组中,每个成员都对应一个这样的值。具体说来是某省的人口(总体)或工业产值(总体)中的某个指标测量值的集合,而不是那些人或物的集合。样本(sample)虽然也是一些值的集合,但不代表整个感兴趣的组。比如,一个样本可以是某省中某县的人口的集合或某县工业产值的集合。6答:由于总体与样本的不同,由此派生出参数与统计量的差别。(1)参数:参数(parameters)是总体的测量值,用希腊字母表示。(2)统计量:统计量(statistics)则是样本的测量值,用一般的英文字母表示(见本章内容)。7答:(1)均值:用以描述数据(值)分布的中心位置。定距以上的数据计算均值才有意义。比如,对于一个总体(某省)的人口,其平均值被称为总体均值(populationg mean),记为。对于某样本(某县)的人口,其平均人口则被称为样本均值(sample average)。总体均值和样本均值的计算公式是相同的。但是其他测量值不一定相同。此外,还有方差、标准偏差等概念。(2)标准偏差:也被称为标准差。表示某人的身高或收入等测量值偏离均值多少。比如甲班语文成绩的标准偏差为20,乙班语文成绩的标准偏差为30,那么,乙班语文成绩比甲班的语文成绩变化(波动)大。(3)方差:标准偏差的平方则是方差。方差表示数据内部的变异性。8答:统计学上,一般都是假设被统计的样本是来自正态分布(Normal distribution)的总体。正态分布是关于总体的一种理论分布,是有严格的数学定义的。从正态分布的总体中抽取的样本一般是服从正态分布的。正态分布的重要特征如下:(1)均值:均值是观察值的平均值(Mean value)。区间(Interval)型以上变量值的均值才有意义。 (2)众数:众数是最经常发生的频次。众数是对定类变量(Nominal)而言的。比如某班有男生25名、女生15名,那么,该班男生的人数是众数。(3)中位数:中位数是对次序(Ordinal)变量值而言的。中位数是比取值的一半大、同时又比取值的一半小的值。或者说,中位数的一半落在均值之上,同时,另一半则落在均值之下。中位数的取值方法有两种:单数情况下的观察值的中位数;双数情况下的观察值的中位数。(4)正态分布的均值、众数、中位数重叠:将正态分布的图形沿着中心位置对半折叠时,均值、众数、中位数三者重叠在一起。9.有哪些经验规则?答:如果数据来自服从正态分布的总体,可用下面的经验规则很快地概括出我们的数据。经验规则如下:· 68%的观察值是落在离均值一个标准偏差(1)的范围内。· 95%的观察值是落在离均值两个标准偏差(2)的范围内。· 99%的观察值是落在离均值三个标准偏差(3)的范围内。习题4答案下面是RECODE习题。1答:命令格式如下:RECODE v1,v2 (原值1=新值1)(原值2=新值2). (原值m=新值m)例如:RECODE age (0 thru 30=1)(30 thru 60=2)(60 thru 90=3)(90 thru hi=4). 2答:命令中允许使用的关键词如下: LO(或LOWEST)、HI(或HIGHEST)、THRU、 MISSING、ELSE、SYSMIS3.(1)答:语法正确,但结果不太理想。因为结果只剩下0和2 两组。 (2)答:语法正确,但结果不太理想。原因同上。 4.答:用“/”分隔。例如:RECODE Gage (1,2=1)(3,4=2)/sex(1=1)(2=0). 5.答:对。因为将变量A由原来的4组合并为两组。 6.(1)答:对。这是端点连接法。 (2)答:对。符合语法规则,但是会漏掉各组的端点值。 (3)答:对。符合语法规则。但结果只剩下100卡以内的一组数据。7.RECODE age(MISSING=00).MISSING VALUE age(-1). (进一步将系统缺失值“-1”改为用户缺失值) 8.答:RECODE INCOME (LO THRU 5000=1)(5000 THRU HI=2).9.答:RECODE sex(F=B)(M=A). 10.答:有以下4个变换命令。RECODE sex (1=1)(2=0).COMPUTE Gage=age.COUNT FM=F(1)M(2).IF(sex=2 AND location=2) GROUP=2.下面是Compute习题11.答:COMPUTE score=S1/S2*100.COMPUTE X=ABS(-7.8).12.答:见第4章。13.(1)答:Y1=7.8 (2)答:Y2=-16 (3)答:Y3=25 (4)答:Y4=-1 (5)答:A=10 (6)答:B=0.79 (7)答:C=2.2 (8)答:D=2 (9)答:E=2.72 (10)答:F=0下面是COUNT习题 14.(1) 答:真 (2) 答:真(3) 答:假15.(1) 答:真 (2) 答:真习题5答案下面是FREQUENCIES 习题答案。 1(1) 答:众数(2) 答:众数(3) 答:均值(4) 答:均值 (5) 答:众数 (6) 答:均值(7) 答:均值 2(1) 答:真 (2) 答:真 (3) 答:假 (4) 答:假 (5) 答:真 3. 答:已填补的频次见图5-24中打#标记的数据。图5-24 择偶标准的频率表 4. (1)答:画出的book变量的频率表见图5-25。 图5-25 book变量的频率表 (2)答:用直方图为宜。因为直方图可画出空缺的位置,便于一目了然地看出缺的是何种数据。 (3)答:直方图与条形图的主要区别见表5-1。表5-1 直方图与条形图的主要区别 直方图条形图 适用于区间 (定距)以上的数据,如:收入、年龄、工资、体重等。适用于标称 (定类)型以上的数据。如:性别、肤色、种族、国别等。 以图形的面积为频次以图形的条形为频次 变量的某种水平空缺时仍留空位置变量的某种水平空缺时,不留空位下面是Descriptive习题答案。5.(1)答:Compute pct=income1/income2*100. (2)答:COMPUTE sqrt1=SQRT(x*2).或 COMPUTE sqrt1=SQRT(x*x).(3)答:计算变量s的命令为:COMPUTE s=SQRT(a*a+b*b)*4. (4)答:COMPUTE max1=MAX(a,b,c). 6.(1)答:结果为13(2)答:结果为19 (3)答:结果为15 (4)答:结果为11 (5)答:结果为137.(1)答:结果为2 (2)答:结果为9 (3)答:结果为3 (4)答:结果为8 (5)答:结果为48.(1)答:其范围为:30岁以下的归入第1组,“30.5”岁以上的归入第2组。 (2)答:其范围为:20岁以下的归入第1组,“20.5”岁以上的归入第2组。 (3)答:其范围为:8-10岁的归入第1组,18-20岁的归入第2组,其余的忽略不计。 (4)答:其范围为:18岁以下的归入第1组,18岁-30岁的归入第2组,“30.5”岁45岁的归入第3组,“45.5”岁以上的归入第4组。 (5)答:其范围为:45岁以下的归入第1组,“45.5”岁以上的归入第2组。 (6)答:其范围为:40岁45岁的归入第1组,“45.5”岁以上的不分组。9.(1)答:无意义 (2)答:有意义 (3)答:排序后有意义10.(1)答:无意义 (2)答:有意义 (3)答:无意义11.(1)标称测量 (2)比例测量(3)次序测量(4)比例测量 (5)区间测量 (6)标称测量 12.答:中位数=(355+1)/2=178,即第178个个案为中位数。 13.(1)答:能。因为服从正态分布,其均值、中位数、众数均为0.09(2)答:能。因为服从正态分布,其均值、中位数、众数均为0.09(3)答:能。因为其方差等于标准偏差0.12的平方 (4)答:不能。因为服从正态分布,其峰态系数为0 14.答:需要。因为标准值的均值应是0。 15.答:其含义是女性占了80。 16.(1)答:假 (2)答:有可能,但不一定。 17.答:如果我是该公司的经理,我将用均值统计量描述高支付水平。因为该数据的离散性显著,只有采用均值统计量,才能描述高支付水平。 答:如果我是该公司的雇员,我将用中位数(或众数)描述低支付水平。因为该数据虽然离散性显著,但绝大多数人集中在低收入范畴,采用中位数(或众数)统计量,能描述实际低支付水平。 18.答:填补后的结果见表5-3。 表5-3 填补空缺值后的表格Mean 1.70Variance 0.1236Std Dev 1.06Maximum 4Minimum 0Mode 2Median 2Range 4 19.答:填补后的结果见表5-5。 表5-5 填补标准值Z后的表格StudentStudentStandard Score(Z)175 -0.52850.5380 020.解:Mean=60 Range=60 Minimum=30 Maximum=90 均不变。 只是N=99+1=100(人)。21.解答:略。习题6答案 1.答:有4名学生月伙食费漏答(0元,被当作极小值)。有19名学生月伙食费在500元以上,这些是极大值。 学生月伙食费100元的有5人,120元的有2人。其余照此分析。其中,&表示只列出部分的值。2.答:占半数学生的家中,兄弟姐妹有12人,中位数偏向均值之下。极大值1人,界外值1人。3.答:因为Sig值0.25>值0.05,所以没有理由拒绝原假设。说明方差相同。方差相同时数据可以不转换。又因为斜率=-2.286,查表6-1知,该数据可以不转换。 4.答案见书。 习题7答案 1.答:该程序运行之后,输出见图7-20。 图7-20 Crosstabs表格(已填充)2.(1) 答:正确。因为不带选项是允许的。 (2) 答:错误。因为 WITH关键词在此是非法的,可改为: CROSSTABS happy BY marital BY sex. 3.答:没有单个的测量值 (即统计量)能概括所有可能的结合测量,如标称测量的统计量LAMBDA虽好,却也不能用于次序数据的测量中。余者类推。 4.(1)答:见正文的图7-21,如果性别与地区是互为独立的两个变量,则观察图7-21各单元中的第2行频次。例如(1,1)单元中的行百分比为50.0%,(2,1)单元中的行百分比为60.0%等。(2)答:这个交叉表的自由度为:DF=(行-1)*(列-1)=(2-1)*(2-1)=1(3)答:独立性卡方检验的卡方值为0.166,详见图7-22。 图7-22 皮尔逊独立性卡方检验5.(1)答:编码方案见表7-2(供参考):表7-2 编码方案变量名变量标签变量类型栏位数据(变量值)编码Id个案号数值型1-2Sex性别数值型31=男2=女Age年龄数值型4-8比例测量(Ratio Measure)Dq家庭住址数值型91=城市2=农村Height学生身高数值型10-12比例测量(Ratio Measure)Weight学生体重数值型13-16比例测量(Ratio Measure)score1高考得分数值型17-19比例测量(Ratio Measure)score2高考满分数值型20-22比例测量(Ratio Measure)Mz民族数值型231=汉族 2=回族 3=朝鲜族4=满族 5=苗族 6=藏族 (2)答:根据(1)的编码方案,可建立以下的程序7.5。程序7.5: DATA LIST/ID 1-2 sex 3 age 4-8 dq 9 height 10-12(1) weight 13-16(1)score1 17-19 score2 20-22 mz 23. VARIABLE LABEL id '个案号' /sex '性别' /age '年龄' /dq '家庭住址' /height '学生身高' /weight '学生体重'/score1 '高考得分' /score2 '高考满分'/mz '民族'. VALUE LABEL sex 1 '男' 2 '女' /dq 1 '城市' 2 '农村' /mz 1 '汉族' 2 '回族' 3 '朝鲜' 4 '满族' 5 '苗族' 6 '藏族'. MISSING VALUE sex (9)age (00000) mz (0) WEIGHT(0000) height score1 score2(000).BEGIN DATA.01120.0011691200502640102121.5021711200497640103220.7511661100777900204119.2511761300770900205222.0011600980525640306119.5021731115527640107222.2511580905492600408220.2511601035494600509123.0021751355608720110119.75117012802654006END DATA.SAVE OUTFile='Score.sav'. 6.答: COMPUTE score=score1/score2*100.7.答:以下是所要求的命令。程序7.6:COMPUTE gscore=score. RECODE gscore(LO THRU 70=1)(70 THRU 75=2) (75 THRU 80=3)(80 THRU 85=4)(85 THRU HI=5). CROSSTABS age BY score/FORMAT=NOTABLE /STATISTICS=CHISQ CORR.CROSSTABS age BY gscore/CELL=ROW Column Total Count /STATISTICS=CHISQ LAMBDA.评价(略)。习题8答案下面是MEANS过程的习题答案。1.答:其命令为MEANS score BY vf BY location/MISSING=DEPENDENT. 2.(1)答:表达式有误。正确的写法是:IF (vf EQ 1 OR vf=2 OR vf=6) GROUP=1. (2)答:表达式有误。正确的写法是:IF (location=1 AND sex=1) GROUP=1. (3)答:表达式有误。正确的写法是:IF (age GE 20 AND age LE 23) GROUP=1. 3.(1)答:Means (2)答:Crosstabs (3)答:Frequences (4)答:Means (5)答:Crosstabs4.答:这个高考平均成绩的概括表如图8-24所示。图8-24 按城乡考生分组,并进一步按父亲职业分组的高考平均成绩下面是T-Test习题答案。 5.(1)答:jobcat8的为第1组,jobcat<8的为第2组。 (2)答:jobcat=1的为第1组,jobcat=3的为第2组。 (3)答:jobcat=1的为第1组,jobcat=2的为第2组。 6.(1)答:错误。错在缺少命令的终止符"."。正确的写法是: T-TEST GROUP=sex/VARIABLES=score/PAIRS=income1 income2. (2)答:错误。错在子命令PAIRS与GROUPS的位置颠倒了。正确的写法是: T-TEST GROUP=sex/VARIABLES=score/PAIRS=income1 income2. (3)答:错误。子命令PAIRS后面少了一个变量INCOME2,正确的写法是: T-TEST PAIRS=income1 income2. (4)答:正确。 (5)答:错误。错在括号内多了一个值。正确的写法是: T-TEST GROUPS=jobcat(1,2)/var=Score. 或T-TEST GROUPS=jobcat(1,3)/var=Score. 或T-TEST GROUPS=jobcat(2,3)/var=Score. 7.(1)答:假 (2)答:假 (3)答:真 (4)答:假 (5)答:假 (6)答:假 8.(1)答:用单尾检验。(2)答:用双尾检验。 9.答:有可能相等。 10.(1)答:两个总体的均值差为0。 (2)答:两个总体的均值差为0。 11.(1)答:当两个总体的方差相等时采用“合并方差”T检验。 (2)答:当两个总体的方差不等时采用“分离方差”T检验。12.(1) 答案如下:检测治疗1 与治疗3 时的命令为T-TEST PAIRS=T1 T3.检测治疗1 与治疗3 时的输出见图8-25。 图8-25 治疗1与治疗3 平均体重减轻的检验 比较治疗1 与治疗3平均体重减轻程度,首先应看治疗1 与治疗3,如此配对检验是否有效。从图8-25可以看到CORR=0.396,但双尾检验概率2-tail Sig值0.257太大。 因此治疗1 与治疗3,如此配对检验勉强有效。(CORR值越大,配对越有效) 然后,观察样本。 治疗1平均体重减轻了1.28公斤,其标准偏差为0.194; 治疗3平均体重减轻了1.47公斤,其标准偏差为0.255。 从此样本看,治疗1与治疗3 平均体重减轻的程度是不同的,治疗3的组间变异性也比治疗1的突出,所以,治疗3比治疗1,平均体重减轻的幅度大。 再推论到总体。 H0:假设两个总体的均值相等 验证如下: t-value=-2.35 其自由度DF=9 ,计算后得到双尾检验概率2-tail Sig为0.044;又 0.044<值0.0

    注意事项

    本文(数据统计与分析.doc)为本站会员(豆****)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开