《统计学资料类型》PPT课件.ppt
2023202320232023年年年年1 1 1 1月月月月21212121日日日日第四节第四节 变量及资料类型变量及资料类型变量类型变量类型资料类型资料类型v变量的类型决定资料的类型变量的类型决定资料的类型v一份统计资料中可能包括所有的变量类一份统计资料中可能包括所有的变量类型型2023202320232023年年年年1 1 1 1月月月月21212121日日日日一、医药统计中的变量类型一、医药统计中的变量类型v定量变量(数值变量):定量变量(数值变量):其变量值是定量的,其变量值是定量的,表现为数值大小,有度量衡单位。表现为数值大小,有度量衡单位。例如:患者的例如:患者的身高(身高(cm)、体重()、体重(kg)、血压()、血压(mmHg)、脉)、脉搏(次搏(次/分)、红细胞计数(分)、红细胞计数(1012/L)v分类变量:分类变量:表现为互不相容的类别或属性,也表现为互不相容的类别或属性,也称为定性变量。称为定性变量。分类变量分为分类变量分为无序无序和和有序有序两类:两类:变量按变量值的性质分为不同类型:变量按变量值的性质分为不同类型:2023202320232023年年年年1 1 1 1月月月月21212121日日日日无序分类变量:指所分类别或属性之间无程度无序分类变量:指所分类别或属性之间无程度和顺序的差别。按照所分类别或属性的数量,和顺序的差别。按照所分类别或属性的数量,还可以细分为:还可以细分为:二分类变量二分类变量,如男、女,中医的虚、实,阴、阳等;,如男、女,中医的虚、实,阴、阳等;多分类变量(名义变量)多分类变量(名义变量),如中医的六气,风、寒、,如中医的六气,风、寒、暑、湿、燥、火。暑、湿、燥、火。有序分类变量(等级变量):各类别之间有程有序分类变量(等级变量):各类别之间有程度的差别。度的差别。如:疾病的严重程度可以分为,轻、中、重;中医如:疾病的严重程度可以分为,轻、中、重;中医辨证中按脉的深浅,可以分为浮、中、沉。辨证中按脉的深浅,可以分为浮、中、沉。2023202320232023年年年年1 1 1 1月月月月21212121日日日日变变量量分类变量分类变量定量变量定量变量无序分类变量无序分类变量有序分类变量有序分类变量(等级变量)(等级变量)二分类变量二分类变量多分类变量多分类变量变量类型与资料类型示意图等级资料等级资料计计数数资资料料计量资料计量资料2023202320232023年年年年1 1 1 1月月月月21212121日日日日病历号病历号年龄年龄性别性别身高身高cmcm血型血型心电图心电图尿尿WBCWBC职业职业RBC10RBC101212/L/L1 13535女女165165A A正常正常-教师教师4.654.652 24444男男174174B B正常正常-工人工人5.215.213 32626男男180180O O正常正常+职员职员4.104.104 42525女女161161ABAB正常正常+农民农民3.923.925 54141男男171171A A异常异常+工人工人3.493.496 64545女女158158B B正常正常+工人工人5.485.487 75050女女160160O O异常异常+干部干部6.786.788 82828男男176176ABAB正常正常+干部干部7.107.109 93131男男162162O O正常正常+军人军人5.245.24变量类型的判断变量类型的判断2023202320232023年年年年1 1 1 1月月月月21212121日日日日二、医药统计中的资料类型二、医药统计中的资料类型v定量资料(计量资料或数值资料)定量资料(计量资料或数值资料)v分类资料:分类资料:分类资料分为分类资料分为计数资料计数资料和和等级资料等级资料两种:两种:计数资料包括:二分类资料和多分类资料计数资料包括:二分类资料和多分类资料按变量的类型整理成不同资料:按变量的类型整理成不同资料:Saturday,January 21,Saturday,January 21,Saturday,January 21,Saturday,January 21,2023202320232023住院号住院号年龄年龄身高身高体重体重住院天数住院天数职业职业文化程度文化程度分娩方式分娩方式妊娠结局妊娠结局20256552025655272716516571.571.55 5无无中学中学顺产顺产足月足月20256532025653222216016074.074.05 5无无小学小学助产助产足月足月20258302025830252515815868.068.06 6管理员管理员大学大学顺产顺产足月足月20225432022543232316116169.069.05 5无无中学中学剖宫产剖宫产足月足月20224662022466252515915962.062.01111商业商业中学中学剖宫产剖宫产足月足月20245352024535272715715768.068.02 2无无小学小学顺产顺产早产早产20258342025834202015815866.066.04 4无无中学中学助产助产早产早产20194642019464242415815870.570.53 3无无中学中学助产助产足月足月20257832025783292915415457.057.07 7干部干部中学中学剖宫产剖宫产足月足月个体个体individuals变量变量variables计量资料计量资料计数资料计数资料2023202320232023年年年年1 1 1 1月月月月21212121日日日日实例数据实例数据2023202320232023年年年年1 1 1 1月月月月21212121日日日日三类资料间关系三类资料间关系 例:一组例:一组20 40岁成年人的血压岁成年人的血压以以12kPa12kPa为界分为正常与异常两组,统计每组例数为界分为正常与异常两组,统计每组例数 8低血压低血压 8 8 正常血压正常血压 1212 轻度高血压轻度高血压 1515 中度高血压中度高血压 1717 重度高血压重度高血压计量资料计量资料等等级级资资料料计数资料计数资料2023202320232023年年年年1 1 1 1月月月月21212121日日日日第五节第五节 统计工作的基本步骤统计工作的基本步骤1.统计设计统计设计:包括调查、实验设计。:包括调查、实验设计。运用医学统计学的起点,也是高质量地完成整运用医学统计学的起点,也是高质量地完成整个研究的重要基础。个研究的重要基础。2.收集资料收集资料:在研究设计基础上,通过试验或调在研究设计基础上,通过试验或调查,取得准确可靠的原始资料查,取得准确可靠的原始资料3.整理资料整理资料:对资料进行清理、改错,数量化对资料进行清理、改错,数量化2023202320232023年年年年1 1 1 1月月月月21212121日日日日4.分析资料分析资料:包括统计描述、统计推断包括统计描述、统计推断将所得数据进行统计学处理的过程将所得数据进行统计学处理的过程5.5.作结论:作结论:在数据分析的基础上,应用统计学处在数据分析的基础上,应用统计学处理的结果,进行统计学推断。同时,依据相应的专理的结果,进行统计学推断。同时,依据相应的专业知识,作出专业性的结论业知识,作出专业性的结论2023202320232023年年年年1 1 1 1月月月月21212121日日日日第六节第六节SPSS统计软件说明统计软件说明SPSS-StatisticalPackageforSocialScience(社会科学统计软件包)现改名(社会科学统计软件包)现改名为为StatisticalProductandServiceSolutions(统计产品与服务解决方案)统计产品与服务解决方案)1.20世纪世纪60年代末,美国斯坦福大学的三位年代末,美国斯坦福大学的三位研究生研制开发了最早的统计分析软件研究生研制开发了最早的统计分析软件SPSS,同时成立了,同时成立了SPSS公司公司2.1975年在年在芝加哥芝加哥组组建了建了SPSS总总部部2023202320232023年年年年1 1 1 1月月月月21212121日日日日3.1984年开发了年开发了DOS操作系统下的操作系统下的PC+1.0版本版本4.1992年的年的DOS版升级为版升级为Windows版本,版本,即最初的即最初的4.0版版5.1999年升级到年升级到10.0版、版、2001年升级为年升级为11.0版、版、2003年年Windows操作平台下的最操作平台下的最新版本为新版本为12.0;目前已开发目前已开发14.0、15.0与著名统计软件与著名统计软件SAS相比,更适用于统计初相比,更适用于统计初学者或非统计学专业人员学者或非统计学专业人员2023202320232023年年年年1 1 1 1月月月月21212121日日日日SPSS软件的特点软件的特点v操作简便,方便自学操作简便,方便自学。v数数据据转转换换功功能能较较强强:可可存存取取和和转转换换多多种种数数据据类类型型,如如Spss(*.sav),Excel(*.xls),Text(*.txt),dBase(*.dbf)文件等。文件等。v数数据据管管理理功功能能强强大大且且操操作作直直观观:在在基基本本界界面面上上集集数数据据录录入入、转转换换、检检索索、统统计计分分析析、作作图、制表及编辑等功能于一身;图、制表及编辑等功能于一身;v可可用用SPSS命命令令编编程程,形形成成SPSS环环境境下下的的可执行文件可执行文件。2023202320232023年年年年1 1 1 1月月月月21212121日日日日SPSS软件的特点软件的特点v统计分析方法比较全面统计分析方法比较全面:包括一般统计描述、包括一般统计描述、简单列联表分析、均数比较、一般线性模型、混简单列联表分析、均数比较、一般线性模型、混合模型、相关回归、对数线性模型、聚类和判别、合模型、相关回归、对数线性模型、聚类和判别、因子分析、非参数检验、时间序列、生存分析及因子分析、非参数检验、时间序列、生存分析及缺失值估计等内容;缺失值估计等内容;vSPSS结果输出的管理也很有特色结果输出的管理也很有特色;v绘图和图形编辑功能也很方便、全面。绘图和图形编辑功能也很方便、全面。2023202320232023年年年年1 1 1 1月月月月21212121日日日日报告描述统计量报表均数比较通用线性模型混合模型相关回归对数线性模型聚类数据简化标度非参数检验时间序列生存分析多重响应分析条图三围条图线图面积图饼图高低图箱图误差图人口金字塔散点图直方图图形