统计资料.docx





《统计资料.docx》由会员分享,可在线阅读,更多相关《统计资料.docx(13页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计资料【关键词】统计学;医学;数据分析,统计HuCY,HuLP.JChinIntegrMed.2009;7(1):7478.ReceivedOctober9,2008;accptedDecember1,2008;publishedonlineJanuary15,2009.Indexed/abstractedinandfulltextlinkoutatPubMed.JournaltitleinPubMed:ZhongXiYiJieHeXueBao.Freefulltext(andPDF).ForwardlinkingandreferencelinkingviaCrossRef.DOI:10.3
2、736/jcim20090112OpenAccessHowtoidentifystatisticaldataChunyanHU,LiangpingHUConsultingCenterofBiomedicalStatistics,AcademyofMilitaryMedicalSciences,Beijing100850,ChinaKeywords:statistics;medicine;dataanalysis,statistical统计资料是统计分析的对象,正确识别统计资料是合理运用统计分析方法处理统计资料的首要前提;而科学完善的实验设计又是获得准确而又可靠统计资料的基本保证。1何为统计资料
3、1.1数据不等于统计资料某研究者提交了如下内容。请问:它们能否叫统计资料?6.55.16.13.93.57.72.11.99.67.97.67.84.66.16.42.87.62.54.68.14.86.95.12.06.46.04.58.08.08.66.44.96.46.84.73.47.71.22.80.52.63.26.57.63.55.75.42.37.42.74.26.46.97.26.76.54.07.31.14.92.52.91.93.61.42.54.42.5它们不叫统计资料,由于这些数据代表什么含义并不清楚,数据的单位是什么不清楚,能派什么用场也不清楚,它们只能叫68个数据
4、罢了。1.2仅有度量衡单位的数据仍不能称为统计资料假定前面给出的68个数据的单位是ng/ml,能否可称其为统计资料呢?仍然不能够!由于还缺少数据的名称,即数据的专业含义是什么,必须交代清楚,对其进行分析和讨论才能有的放矢,否则,只能是玩弄数字游戏。1.3仅有变量名及其取值的数据仍不能称为统计资料表1中有很多数据,其中的每一列都能被称为统计资料吗?有些似乎能够,有些则不能够。由于有些列仅有变量名,其专业含义并不清楚,如“G代表什么,其下方的“1与“2又分别代表什么,“X1的含义可通过其下方的“男、“女得知其代表“性别,但“X3X13的含义都不清楚,“X14代表联合用药情况。1.4有指标名称又有度
5、量衡单位的数据能否一定就可称为统计资料假定前面给出的68个数据所代表的指标为神经元特异性烯醇化酶neuronspecificenolase,NSE的含量,其单位是ng/ml,此时,它们能否就能叫统计资料?若要求不高,基本上能够称其为统计资料;若要求严格,还不能这样称呼。由于它们测自什么样的受试者并不清楚!比方有的测自正常人,有的测自不同疾病患者,甚至有的测自动物。表1冠心病人与正常人多项指标的观测结果1.5统计资料应具备4个基本要素应当讲,指标或变量名称、度量衡单位和详细取值是统计资料的3个基本要素。仅有这些基本要素可能还达不到特定的研究目的,也就是讲,统计资料还应包括实现特定研究目的所对应的
6、特定条件。比方讲,前面给出的68个数据是某年从某地区1860岁全部正常成年人中随机抽取的68人血液NSE酶的详细数值,而且,在获得这些数据时,测定的时间、地点、方法、仪器设备和测定者等都一样。这样条件下测得的NSE酶含量ng/ml所得的统计资料,运用适当的统计分析方法,才能够揣测该年该地区1860岁全部正常成年人血中NSE酶含量的1100%容许区间医学上习惯称为正常值范围和NSE酶含量总体平均值的1100%置信区间也有人称为可信区间。概括起来讲,统计资料应具备4个要素:影响因素测定条件、有明确专业含义的指标名称、度量衡单位和详细取值。由此可见,统计资料通常是复合型,一般至少含有2个变量,一个称
7、为影响因素,另一个称为观测指标及其取值。前面举的例子中,影响因素是受试者类型,仅测定了正常人,隐含的另一个水平是除这里定义的正常人以外的其别人,要使两组人具有较好的可比性,与其可构成对照的是某年从某地区1860岁全部非正常成年人中随机抽取的68人。下面的表2中,若给X5X11加上相应的度量衡单位,就是一个比拟正规且可到达一定研究目的的复合型统计资料。表2103例冠心病人与100例正常人多项指标的观测结果2统计资料的分类2.1定性与定量资料任何一个有一定实用价值的统计资料通常都是复合型统计资料,即至少有两类性质的资料,一类叫定性资料,另一类叫定量资料。通常影响因素是定性资料,而观测结果是定量资料
8、,但有时影响因素和观测结果都可包含定性与定量两类资料。2.2资料类型的两种划分方法资料类型的划分方法有传统与当代两种。现将这两种划分方法作一扼要介绍,并对其加以比拟。2.2.1资料类型的传统划分方法资料类型的传统划分方法是将资料分为计量资料、计数资料和等级资料3类。其定义如下。计量资料:测定每个观察单位某项指标量的大小,所得的资料称为计量资料。例如测得正常成年男子身高cm、体质量kg、血红蛋白g/L和总铁结合力mol/L等所得的资料。计数资料:将观测单位按某种属性或类别分组计数,得到各组观察单位数称为计数资料。例如某单位全体员工按ABO血型系统划分所得A型、B型、AB型、O型血的人数分别为15
9、98、2032、641、1823人;又例如某小学1年级至6年级的学生人数分别为90、100、86、95、112、96人。等级资料:将观测单位按某种属性的不同程度分组计数,得到各组观察单位数称为等级资料或半定量资料或有序资料。例如用某种治疗方法医治100名某病患者,最后盘点治愈、显效、好转、无效和死亡的人数分别为10、30、40、15和5人;又例如某医院检测1029例患者,其中眼晶状体混浊程度为+、+、+的分别有494、296、239人。2.2.2资料类型的当代划分方法资料类型的当代划分方法是将资料先粗分为定量资料和定性资料两大类,然后,再将定量资料划分为计量资料和计数资料两小类;将定性资料划分
10、为名义资料和有序资料两小类。其定义如下。定量资料:测定每个观察单位某项指标量的大小,所得的资料称为定量资料。计量资料:指标的取值能够带度量衡单位,甚至能够带小数标志测量的精度的定量资料,就叫计量资料。例如测得正常成年男子身高cm、体质量kg、血红蛋白g/L和总铁结合力mol/L等所得的资料,它们首先是定量资料,进一步细分,它们还是计量资料。计数资料:在定量资料中,若指标的取值能够带度量衡单位,但不能够带小数只能取整数,通常为正整数的定量资料,就叫计数资料。例如测得正常成年男子脉搏数次/min和引体向上的次数次/min。定性资料:观测每个观察单位某项指标质的状况,所得的资料称为定性资料。名义资料
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计资料

限制150内