华北理工卫生统计学实验指导.docx
《华北理工卫生统计学实验指导.docx》由会员分享,可在线阅读,更多相关《华北理工卫生统计学实验指导.docx(58页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、卫生统计学实验指导专业:班级:3.结果的保存(1)结果浏览窗口的内容可以保存为SPSS结果输出文件格式(*.SPO),保存的结果包含了 大纲和内容两部分。保存的文件以后可以在SPSS结果浏览窗口中打开。保存方法:File一Save/Save As;工具栏的保存按钮。(2)将结果浏览窗口的内容保存为其它文档格式(Word、Excel、PowerPoint、HMTL文档 或文本文档)保存方法:File-Export-图形对话框输出范围输出文件名输出文档内容输出文件格式保存位置保存为HTML文件,用网页浏览器查看Excel格式PowerPoint 格式保存为文本 文件,用记 事本浏览Word格式Ou
2、tput Document:输出全部内容,包括文字、统计图、统计表Output Document (No Charts):仅输出文字,包括统计表但不包括统计图Charts Only:仅输出统计图All Objects:输出窗口的全部结果项目All Visible Objects:输出全部可见结果项目,不包括被隐藏者Selected Objects:输出选择的项目四、通过数据编辑窗口输入数据(一)使用数据编辑窗口输入数据进入SPSS系统后会自动打开数据编辑窗口,在此窗口可直接输入数据。如果在数据编 辑窗口已有数据而又需要输入新数据时可以打开新的数据编辑窗口。(FileNewData)在数据编辑窗
3、口输入数据时可以直接输入数据值而不需要定义变量属性,也可以先定义 变量(数据属性)后再输入数据,还可以先输入数据后再定义变量属性。(二)定义变量定义变量就是定义变量的属性。变量属性包括:变量名、类型、宽度、小数位、变量标 签、变量值标签、缺失值、显示宽度、对齐、变量测度。在创建变量时,必须指定的变量属 性是变量名和变量类型,其它属性可以省略或者使用系统默认定义。变量名宽度标签缺失值 对齐方式变量名宽度标签缺失值 对齐方式类型小数位值标签列宽度 度量水1 ,变量名定义 在同一数据文件内,变量名不能重复。 首字符必须为字母或者汉字。变量名不能用”或者“-结尾。 变量名首尾字符外的其它字符除不能用“
4、? ”、”及空格5 种字符外,可以采用其它任何能用的字符。 变量名长度在1 64个字符之间。如果全部采用汉字则最多为32个汉字。 ALL, AND, OR, NOT, EQ, NE, GE, GT, LT, LE, TO, WITH, BY 等名字是系统保留名 字,不能作为变量名。 英文字母作为名字时,不区分大小写。2 .变量类型、宽度和小数点的定义指定每个变量的数据值类型,系统默认的是数字类型。新建变量时除非特别说明是其它 类型,否则都是数值类型。常用的类型有3种:数值型(Numeric):需要定义数值的宽度,整数位(Width)默认为8位,小数位数(Decimal Places)默认为2位
5、。日期型(Data):可从系统提供的日期显示形式中选择自己需要的。字符型(String):用户可定义字符长度以便输入字符。3 .变量测度的定义SPSS把变量测度(Measure)分为3种,即尺度型(Scale).等级型(Ordinal)和名 义型(Nominal),它们分别对应于定量变量,等级(有序)变量和定性变量。4 .变量标签定义可采用长达256个字符(128个汉字)对变量做出解释或标注,可以采用任意能输入的 字符标签。5 .变量值标签用来解释变量值的含义,此功能对等级变量或者定性变量编码时尤其有用。五、SPSS数据文件的存取1 .存取保存的SPSS文件SPSS创建的文件类型有多种,不同的
6、文件类型服务于不同的目的,在不同窗口内保存 和打开,这些文件类型统称为SPSS内部文件。SPSS常用的文件类型有2种,即:数据文件(Data),其扩展名为.SAV;输出结果文件(Output),其扩展名为.SPO或者.RTF。2.读取保存的数据文件无论是SPSS数据文件还是外部数据文件类型,读取数据文件的操作方式相似。3,读取Excel电子表格数据文件SPSS可以直接使用微软Excel电子表格建立的数据文件。但需要注意Excel电子表格 数据文件最好符合数据库文件建立的标准方式,即首行为变量名,同列数据类型相同。 SPSS读取Excel数据文件方式如下:File一Open一Data一文件类型选
7、择 Excel (礼 xls)y,4 (*1 rH*1 后,三 I 一y,4 (*1 rH*1 后,三 I 一5 M i ex- o s o f t. M i cxr o s o ft. yfeff 5 M i ex- o s o ft. 亲f?5 M i ex- o s o f t.*M i ex- o s o f t.叁拢75国(X):Open Fi_JLe2009 .1.11呻越女吩歹wExueZLEx u eslEx u a3LEx c e:lEx u e3L工工手工女阱名QI):父件经型(X):女阱名QI):父件经型(X):E用澈据.* =Eac c el (*Tscl s )选择合
8、适的数据文件,点“打开”后,显示下面所示对话框。Read variable names from the first row of data:指定是否首行作为变量名。选择后第 一行单元格内容作为变量名,不符合SPSS变量名命名规则的转换为符合规则的,否则使用 默认的名字v+n, n为变量序号。Worksheet:选择读取电子表格文件的表单名。默认读取第一个表单。Range:指定数据表格单元范围。Maximum width for string columns:指定单个单元格最大能容纳的字符数量。4.保存SPSS数据文件数据窗口内的数据必须保存才能被以后使用,否则,退出数据窗口后所有的修改将丢
9、失。如果不仅想保存数据窗口内的数据和数据修改,而且要更换数据文件名和类型,甚至挑 选部分变量保存,则选择FileSave as。Variable:选择数据文件中需要保留的变量。保存类型:选择SPSS创建不同的数据文件类型,默认为SPSS数据文件。如果想保存部分变量时,单击“Variable,弹出下面的对话框二尖姆返流 年龄性别 既往心梗 冠脉造影史 ST移位二尖姆返流 年龄性别 既往心梗 冠脉造影史 ST移位23456心绞痛24h内 心衰阿司匹林7d内 MR7910CancelHelp |Selected: 53 of 53 variables.Keep NameContinue画画画画画E画
10、1画画Only variables marked with an X will be saved to the specified data file.LabelOrder1Drop AllKeep:选择向,不选回。Keep All:选择全部变量。Drop All:删除全部变量。Contiune:完成选择,返回保存对话框。【练习题】例1某医生调查某地区儿童生长发育的情况,共调查了 106名7岁儿童,调查表如下所示, 请利用SPSS数据编辑窗口建立数据文件。某时某地区学龄儿童体检表个人信息学号 姓名 年龄 岁 年级 性别:男 女体检结果身高 厘米 体重 公斤 肺活量 毫升 例2某医生调查某地区儿
11、童生长发育的情况,共调查了 106名7岁儿童,调查表如下所示, 请利用SPSS数据编辑窗口建立数据文件。某时某地区学龄儿童体检表个人信息学校 姓名 年龄 岁年级 性别:男 女出生日期 年 月 日体检结果身高 厘米 体重 公斤 肺活量 毫升实验三:定量资料的统计描述【目的要求】熟悉描述定量资料集中趋势、离散趋势的指标、意义、应用条件,掌握各指标的SPSS分析 过程。【案例分析】案例1:某研究者收集到145名食物中毒病人的潜伏期如下表。145名食物中毒病人的潜伏期为描述食物中毒病人潜伏期的集中趋势和离散趋势,某研究者采用算术均数和标准差两 个统计指标。潜伏期人数017646123818322463
12、0036442482按照频率表法计算算术均数为:X 二 号=旦”=14.59(天)E/ 145计算标准差为2 1rln-12 1rln-110199.17145-1=8.42(天)你认为其选择的统计描述指标合理吗?为什么?应当怎样做?【SPSS操作】1. Frequencies 过程AnalyzeDescriptive StatisticsFrequencies选择频数分组变量Statistics选择相应 的基本统计量ContinueChartsHistogramsWith Normal CurvecontinueOK2. Descriptives 过程AnalyzeDescriptive S
13、talisliusDescriplives选 择 变 量Opt ions*0K3. Explore 过程AnalyzeDescriptive StatisticsExploreDependent List (分析变量)Factor List (分组标志)PlotsNormality plots with tests (正态性检验)0K【练习题】 一、填空题.描述定量资料集中趋势的指标有 O1 .描述定量资料资料离散趋势的指标有 o.抗体滴度宜用 描述集中趋势。2 .描述对称分布资料集中趋势和离散趋势的指标分别是 和 o.描述偏态分布资料集中趋势和离散趋势的指标分别是 和 o3 .定量变量可分为
14、 和 o二、选择题1 .描述一组偏态分布资料的变异度,以()指标较好.A.全距 B.标准差C.变异系数 D.四分位数间距E.方差.用均数和标准差可以全面描述()资料的特征.A.正偏态分布B.负偏态分布C.对称分布D.对数正态分布.比较身高和体重两组数据变异度大小宜采用().A.变异系数 B.方差C.极差 D.标准差E.四分位数间距.偏态分布宜用()描述其分布的集中趋势.A.算术均数 B.标准差C.中位数 D.四分位数间距E.方差.最小组段无下限或最大组段无上限的频数分布资料,可用()描述其集中趋势.A,均数 B.标准差C.中位数 D.四分位数间距E.几何均数.血清学滴度资料最常用来表示其平均水
15、平的指标是().A.算术平均数B.中位数C.几何均数D.变异系数E.标准差.变异系数越大说明()A.标准差越大B.标准差、平均数都大C.以均数为准变异程度大I).平均数小.已知某疾病患者10人的潜伏期(天)分别为:6, 13, 5, 9, 12, 10, 8, 11, 8, 12, 其潜伏期的平均水平约为()A. 9 天 B. 9. 5 天 C. 10 天 D. 11 天.对于同一组资料,哪个指标没有考虑到每个观察值的变异()A.方差 B.总体标准差C.变异系数D.四分位数间数.描述一组数值变量资料的分布特征时()A.应同时选用算术平均数和标准差B.应同时选用中位数和四分位数间距C.根据分布类
16、型选用相应的集中、离散趋势指标D.以上都不正确三、判断题.对数正态分布资料最好计算几何均数以表示其平均水平。()1 .不论数据呈什么分布,用算术均数和用中位数表示平均水平都一样合理。().理论上只有服从正态分布条件的变量的算术均数等于中位数。()2 .少数几个数据比大部分数据大几百倍,一般不宜用算术均数表示平均水平。().数据按等比级数分组时,不管分布如何,都应该计算几何均数表示平均水平。()3 .样本中位数不受样本中的极端值影响。().分组的连续分布资料,计算百分位数要求组距相等。()4 .对于连续分布资料,,单位相同时 也可用变异系数比较两个变量的相对离散度。().从同一连续分布总体中随机
17、抽样,样本含量越大,理论上从样本算得的变异系数越小。()5 .对于计量数据,不应按分组方式决定是否计算几何均数。()四、思考题1 .描述定量资料集中趋势的指标有哪些,各适用于什么情况,有什么优缺点?2 .描述定量资料离散趋势的指标有哪些,各适用于什么情况,有什么优缺点?3 .为什么要根据数据的性质和分布来选择不同的描述集中趋势和离散趋势的指标?【作业】1.从某地20岁男青年中随机抽查120名,根据他们的身高和体重测量结果计算均数和标准 差,算得身高x (厘米)为166.064.95,体重Y (公斤)为53.724.47。试判断两者离散 程度的大小。3.某研究者随机调查了唐山市2010年某单位3
18、0名44岁健康男性的体重指数(kg/n?)如下: 26. 32, 24.11,25. 80,18. 10,26.37,25. 01, 25. 61, 26. 96, 29. 76, 28. 74, 21.97, 22. 86,27. 34, 24.93,22. 09,27. 68,24.80,24. 57, 23. 66, 26. 70, 25. 39, 27. 13, 26. 78, 28. 70,26.61, 30.42,25. 14,22.54,26.78,26. 81。试编制体重指数数据的频数表,绘制直方图,概括其分布特征,并选择合适的统计量描述其集中趋势、离散趋势。(使用SPSS软件
19、分析)实验四:定性资料的统计描述【目的要求】.掌握相对数各指标的意义及其SPSS分析过程。1 .掌握应用相对数时的注意事项【案例分析】 案例1:某医生在一个有5万人口的社区进行肺癌调查,通过随机抽样共调查2000人,全 部调查工作在10天内完成,调查内容包括流行病学资料和临床实验室检查资料。调查结果 列于下表,该医生对表中资料进行统计分析,认为男性肺癌的发病率高于女性,而死亡情况 则完全相反。某社区不同性别人群肺癌调查情况性别检查人数有病人数死亡人数死亡率()发病率()男10506350.00. 57女9503266. 70. 32合计20009555.60. 45请讨论:1)该医生所选择的统
20、计指标正确吗?2)该医生对指标的计算方法恰当吗?3)应该如何作适当的统计分析?案例2:根据某医生统计了本医院从1960年至1999年的住院病例,得到表1和表2的数据, 根据表1,该医生认为“40年来,10种心脏病总的发病率逐年代增高”;根据表2,该医生 认为“在10种心脏病中,冠心病发病率迅速增高,从20世纪70年代起居心脏病中第一位”。 应如何评价这位医生的分析结论?这两份资料各有什么用处?表1 1960-1999年住院患者中心脏病患者的频率年度住院患者中10种心脏病患者的频率()年度住院患者中10种心脏病患者的频率()19604.619808.91970 7.31990200010. 1表
21、2 1960-1999年住院患者中心脏病患者中冠心病患者的频率年度10种心脏病住院患者中冠心 病患者的频率()年度10种心脏病住院患者中 冠心病患者的频率(%)I960-9. 381980 29.211970-30. 101990200051.45实验一:电子计算器的使用1目的要求1操作方法1练习题3实验二:SPSS简介4目的要求4操作方法4练习题11实验三:定量资料的统计描述 12目的要求12案例分析12SPSS 操作12练习题13作业14实验四:定性资料的统计描述 15目的要求15案例分析15SPSS 操作16练习题16作业17实验五:统计表与统计图 19目的要求19案例分析19练习题20
22、作业21实验六:常用概率分布 22目的要求22案例分析22练习题22作业24实验七:参数估计 25目的要求25案例分析25SPSS 操作25练习题25作业27实验八:t检验、z检验 29目的要求29案例分析29案例3:某医生对某地某年2-4岁儿童麻疹发病情况进行调查,以发病例数除以观察儿童数, 得到了两个年龄组儿童的麻疹发病率(下表),该医生认为:从发病率看,该地3-4岁的儿 童麻疹发病的危险性比2岁儿童低。你认为该医生的结论是否正确?某地某年3-4岁儿童麻疹发病情况年龄儿童总人数易感儿童书麻疹发病例数发病率(%)2-141378349334. 893-491822817118. 63【SPS
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 华北 理工 卫生 统计学 实验 指导
限制150内