《统计学专业毕业论文_1.docx》由会员分享,可在线阅读,更多相关《统计学专业毕业论文_1.docx(19页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计学专业毕业论文统计学是一个前景非常明朗的产业,各行各业都在应用统计学的技术。下面是学习啦我为大家整理的统计学专业毕业论文,供大家参考。统计学专业毕业论文篇一(医学科技论文统计学误用分析)1统计学应用中存在的常见问题1.1单因素方差分析(ANOVA)两两比拟误用独立样本t检验单因素方差分析设计3组以上的均数比拟,假如总体比拟有差异,需进行两两比拟,一般用SNK法或LSD法。但部分研究者却将资料进行拆分,应用独立样本t检验进行两两比拟,导致第类统计学错误发生率(假阳性率)增加,进而掉进了一个常见的统计陷阱,使所得结论可信度大大降低甚至得出错误结论。SNK法与LSD法固然并非等价,本质是一致的。
2、SNK法一般用于经方差分析结果具有统计学意义时才决定进行的两两事后比拟,而LSD法可用于方差分析缺乏以具有统计学意义时也能进行两两比拟1。比拟两种方法在SPSS的输出结果形式,SNK是分堆比拟,一目了然,对于组别数较多的研究更为好用,但没有详细P值,而LSD是在进行两两比拟时,能给出详细的P值。1.2两两比拟时检验水准的重新调定2检验或秩和检验3组以上整体比拟有差异时,需应用分割法进行两两比拟,这时检验水准应由原0.05调定为0.0167,否则会增加第类统计学错误的发生率。十分当P值处于0.01670.05时,根据P0.0167的标准,差异无统计学意义,而根据P0.05的标准,却有意义,与事实
3、相悖,出现假阳性,很容易得出错误结论。这种分割法有时很保守,当行列表资料分组多且为有序时可用Mantel-Haenszel卡方检验,也称线性趋势检验(testforlineartrend)或定序检验(Linear-by-Lineartest)2。统计途径:用SPSS进行计数资料的趋势检验,在输出结果中读取线性关联检验统计量(Linear-by-LinearAssociation,LLA),如P0.05可得出随着病种级别的升高,检测指标逐步升高的趋势。1.3临床诊断试验中的统计学方法应用在临床诊断试验研究中,经常选取单项计量指标或者联合计量指标以诊断某种疾病,若仅用初级统计学方法如t检验、单因素
4、方差分析等往往不能有效挖掘信息,此时应采用受试者工作特征曲线(ROC)对检测结果进行分析评价。ROC曲线分析基本原理是通过诊断界点的移动3,获得多对灵敏度和误诊率(1-特异度),以灵敏度为纵轴、误诊率为横轴,连接各点绘制曲线,然后计算曲线下的面积,面积越大诊断价值越高。ROC曲线很直观,能根据敏感性与特异性之和最大化原则自动产生最有效的诊断临界点。详细途径能够参考相关统计专著3。统计学处理一般描绘为:采用SPSS(版次)统计软件分析数据,对单项及联合检测结果作图绘成ROC曲线,计算曲线下面积(AUC)和标准误,其中联合检测结果变量即预测概率由Logistic回归产生(可以以用判别分析得出)。计
5、量资料应用-xs表示,运用独立样本t检验及单因素方差分析,两两比拟采用SNK及LSD法,计数资料采用2检验。检验水准为0.05。详细内容可据情而定。1.4重复测量资料的方差分析误用拆分文件的t检验或方差分析如研究共设3组,每位患者在3个时间点均查某项血指标,部分作者在处理此类数据时,常误将纵向(同一时间点3组的比拟)与横向(同组3个时间点的比拟)数据均应用拆分文件的t检验或单因素方差分析来处理,结果导致统计学第类错误发生。此组数据本质是重复测量资料,应采用重复测量资料的方差分析。SPSS中的统计途径:数据-分析-一般线性模型-重复度量。研究者能够参考相关书籍进行处理3。1.522析因设计及析因
6、方差分析实验是22析因设计时,分组有两个因素,A与B,故分组为A、B、O、A+B,这个设计在析因设计研究中很常用,但常会出现分组设计正确,却没有用析因设计方差分析。析因设计与单因素方差分析不同4,它不但能分析治疗效果中处理因素的单独效应和主效应,还能分析因素间的交互效应,并能提高检验效能。非统计专业的研究者进行析因分析可能稍有难度,可参考相关统计学书籍提供的统计步骤进行此类分析3。1.6Meta分析Meta分析是循证医学系统评价常用的方法5,应用时需注意统计学处理中计数资料采用比值比(OR)作为效应变量。详细途径:先进行异质性检验,当P0.05时,以为同质,选择固定模型;P0.05时,不同质,
7、此时可采用敏感性分析或分层分析等异质性处理,使之到达同质后再选择固定模型;若采用异质性处理仍未到达同质,则采用随机模型,以上统计途径均需交代清楚。Meta分析的结果是以森林树体现的,审校中我们经常碰到作者绘制的森林树左上角文献、比照、结果名称等内容显示为?,这是由于部分版本的RevMan软件不能输入中文,此时能够考虑省去,或用Photo-shop软件添加相应中文。Meta分析作为一种高级统计方法,专业性要求较高,作者可参考循证医学类权威杂志上的文章格式,如(中国循证医学杂志)中论著二次研究栏目的循证文章。2科技论文中统计学处理的相关表述2.1资料与方法中详细统计途径的描绘统计学处理的内容常位于
8、论文资料与方法的最后一段,一般来讲包括统计软件名称及版次、统计描绘、统计方法、检验标准等内容,亦可细致交待每个表格的详细统计方法。经典例子如下,统计学处理:采用SPSS(版次)统计软件分析数据。计量资料用均数标准差表示,采用单因素方差分析,两两比拟采用SNK法及LSD法。检验水准为0.05。上述内容包括了大致的统计方法,即详细的统计途径。此部分内容,没有绝对统一的规定6。常见的问题有:统计学方法描绘不全、内容过于简单、存在粘贴抄写痕迹等。如部分论文的统计学处理中提及以=0.05为检验水准,P0.05为差异有统计学意义这句话,这在统计学上本质是一个重复句,保留其一即可。2.2结果中详细P值的标注
9、如今的统计学处理手工计算的较少,一般均应用统计软件,最常用的软件如SPSS、SAS均能给出详细P值。但部分论文的结果表述中却未标明详细P值,作为科技论文是不够严谨的,建议作者在表述研究结果时注明详细P值,增加论文可信度的同时,可用于再次分析。2.3表格制作统计表设计需规范,应体现统计设计内容。部分表格存在内容割裂、组别名称违背表格简洁化原则、表下注释繁琐、横标目与纵标目颠倒等情况。建议作者写作论文时参阅相关统计学教程及杂志稿约。医学统计学教学在中国的医学教育十分是高层次教育中举足轻重。一项课题从一个好的创意开场到施行、结题,统计学方法始终贯彻其中。不管是临床试验研究、实验性研究、观察性研究,还
10、是临床测量误差与诊断试验,假如没有规范性的统计设计、准确的统计分析、科学的统计学解释与表述,很难获得学术上的认可1。目前在统计学的详细应用中,研究课题开场设计时就有统计学专家介入已成为较流行的趋势。很多专业统计学专家或研究者在不停的进行统计基础的研究,以创造更多的数理统计方法。对于非统计专业的研究者来讲,统计学的学习主要侧重于应用。在应用统计学教学中,一般分为4个档次或阶段来进行,首先通过学习医学统计学课本获取统计学思想、原理和方法,其次学习统计软件相关书籍把握数据到统计结果的转化,再学习统计表达与描绘书籍到达书写统计学报告能力,最后能够学习怎样出具统计审阅报告。医学科技工作者亦可根据这个顺序
11、学习以提高统计能力。统计学专业毕业论文篇二(医学期刊统计学错误研究)1统计设计存在的常见问题统计设计是整个研究中最重要的一环,是研究工作应遵循的根据。常见的统计设计问题有:忽视组间平衡性,样本缺乏代表性,样本例数缺乏,未设置对照组,未随机分组,未提出统计分析方法等。针对以上问题,在科研设计中一定要遵循实验设计的四大原则即随机、对照、平衡、重复的原则6。1.1不遵循或不重视随机化原则随机化是科研设计的重要原则,直接影响研究结果的可信度。随机化既要随机抽样,还要随机分组,并有足够的样本量作前提。然而,在医学论文中很多作者对此不够重视,主要表如今论文中统计处理随机化不突出,随机化缺失情况比拟常见,有
12、的论文甚至将随机误解为随意、随意,不采用随机化处理方法,导致结果缺乏可靠性。还有些文章中没有提出随机抽样的设计与方法,没有排除标准,给人随意选择病例之感,且病例数少,因而没有代表性,所得出的结论不可靠。部分文章固然注明了随机,但未提及采取什么方法进行随机化研究或两组间的例数相差甚远,不符合随机化的一般规律,没有临床参考价值7。1.2缺少对照研究或对照组设计不合理正确设立对照是临床或实验研究的一个核心问题,设立对照的意义在于讲明临床试验或实验研究中干涉措施的效应,减少或防止偏倚和机遇产生的误差对试验结果的影响。目前,国内很多期刊发表的论文对照组设计不合理现象比拟普遍,尤其有些作者对某种新药或新技
13、术在临床的应用观察研究中,不设对照组,缺乏对照观察,得出的结论缺乏科学性,令人怀疑。有的文章固然设立了对照组,但在分析结果时,却没有将试验组与对照组的结果进行比拟,而仅将各组间的本身前后进行比拟,进而使该研究失去对照意义。对照组选择不当,还表如今两组间重要的临床特征和基线情况相差太大,无可比性,如性别、年龄、病情、经济情况和文化程度等不一致,如有些论文将健康人或志愿者作为对照组,使结果遭到非处理因素的影响,产生偏倚或系统误差,使结论不可信7。1.3平衡性原则把握不够平衡性原则要务实验中的各组之间除处理因素不同外,其他可控制的非处理因素要尽可能保持一致。十分对疾病预后有重要影响的临床特性一定要在
14、组间分布平衡。各组间越平衡,可比性越强。有些作者在对病例进行分组时,忽视了平衡性原则,两组之间没有可比性,结论自然是错误的。详细表如今:有的文章对治疗组与对照组的相应统一指标没有设在平衡的水平上。对治疗组情况交代的比拟具体,而对对照组的年龄、性别、病情等不予交代,或所选对照组的年龄与治疗组不在一个年龄段,影响了作者对指标的观察7。1.4重复的原则把握不好所谓重复,一是指重复试验或平行试验,二是指各样本组的例数要有一定的数量,即样本的例数要足够大。固然随机化是加强非处理因素平衡性的重要方法,但当各组内例数过少时,尽管采用了随机化分组的方法,也难以保证非处理因素的平衡一致。在随机化分组的基础上,只
15、要样本例数足够大,才能使非处理因素平衡一致,同时也才能使抽样误差减小,加强样本对总体的代表性。一般来讲,在随机分组的前提下,样本例数越大,各组之间非处理因素的平衡性越好;但当样本量太大时,往往又会给整个实验和质量控制工作带来更多的困难,同时也会造成浪费。为此,在实验设计时,还应保证在实验结果具有一定可靠性的前提下,确定最少的样本例数。一般讲来,计数指标每组样本不得少于2030例,计量指标每组样本不得少于510例。在多因素分析时,一般以为样本例数至少为观察指标的510倍8。1.5样本的含量样本的含量的大小直接影响到结论的可靠性。样本量过少,则抽样误差大,结果可靠性差,且经不起重复验证;反之,盲目
16、加大样本量也会造成人、财、物的浪费,同时也造成非抽样误差增大。故应在保证研究结果准确可靠的前提下,确定最小的样本量。如某篇论文报道某药治疗的临床疗效,实际总例数为10例,其中6例有效,于是作者得出有效率为60%。显然,有限的病例数不能充分讲明该药能否有效,作者贸然得出结论,容易给别人造成假象甚至误导9。2统计方法选择与使用不当在选择统计方法之前,首先应确定研究资料是计数资料还是计量资料。只划分其类别而得到的资料为计数资料,也叫定性资料,如根据治疗结果计算出的治愈率、阴性率、阳性率等。测定某个详细数值而得到的资料为计量资料,如血压值、血细胞计数、血氧分压测定等很多物理诊断和化验检查的结果。目前,
17、医学论文中计数资料最常用的统计方法为2检验,计量资料最常用的统计方法为t检验。值得注意的是,各种假设检验方法均有其适用条件,应根据资料特点来选用最适当的方法。均数与标准差分别是描绘正态分布资料集中和离散趋势的指标。能否选用均数标准差来描绘某一资料的分布特征,关键看该资料能否符合正态分布。当资料不符合正态分布或方差不齐时,应将资料转换使之符合正态分布,方差齐性后再用t检验或方差分析,否则用秩和检验。有些作者在使用t检验时,未考虑到上述适用条件而盲目使用,造成统计学处理不当或统计学计算错误10。2.1统计指标应用不当2.1.1描绘计量资料的统计指标描述计量资料的统计指标主要有平均数指标(算术均数、
18、中位数M等)和变异指标(标准差s和四分位数间距Q等),在应用时一定要注意它们各自的适用范围。对于非对称分布资料,算术均数不能反映数据的平均水平,应采用中位数描绘。一般地,正态资料或对称资料用描绘,偏态资料用M和Q来描绘。在不能确定数据的分布类型时,应选用M和Q进行统计描绘。四分位数间距Q是75%分位数P75和25%分位数P25之差,即Q=P75-P25,所谓百分位数Px是将全部观察值分为两部分,理论上x%的观察值比它小,(100-x)%的观察值比它大,中位数M是50%分位数P50。、s、M、Px与Q可通过统计软件直接输出9。2.1.2描绘计数资料的统计指标描述计数资料的统计指标有绝对数和相对数
19、。绝对数是原始资料经汇总得到的小计或总计数。相对数是两个有关的绝对数之比,主要包括率和构成比(百分比)。医学论文中相对数应用的主要问题之一是分母较小。分母较小时,相对数的可靠性不能保证,在这种情况下,宜直接用绝对数进行描绘而不宜计算相对数。医学论文中相对数应用的主要问题之二是将构成比误用来讲明事物发生的强度。构成比只能反映事物的内部构成,不能讲明事物的发生强度。医学的研究对象主要是人以及与人体有关的各种因素。由于生物现象的变异较大,各种影响因素又扑朔迷离,研究常是抽样观察,使事物本质差异与抽样误差混杂,故需用统计方法透过偶尔现象来探测其规律性。假如不能正确运用统计学方法,造成统计学上的偏差或失
20、误,就很容易把本来成功的结果当成失败而放弃,或把失败的教训误以为成功的结论而加以宣传。在进行科研设计时要严格遵循科学的统计学分析方法,不能留下隐患,否则,再高明的统计学专家和统计学软件也无法弥补科研设计缺陷造成的损失。总之,统计学分析在医学研究和论文写作中意义重大。作者在撰写论文时,应注意识别、总结有代表性的、有借鉴意义的统计学领域的缺陷、失误或错误的多发点,十分留心易出现统计错误的险区,进而使论文中的统计学问题减到最低限度。认真检查、仔细核验,尽量避免上述错误,必要时还能够请统计学专家帮助把关12。2.2统计方法描绘或选择不当统计方法选择非常重要,它直接影响结论的可靠性12。临床资料的结果变
21、量可分为计数资料、计量资料和等级资料。计数资料指将观察对象按两种属性分类,如生存、死亡,治愈、未治愈,有效、无效等,通常转化为率。假如是两组间的比拟,则采用四格表2检验或其校正公式,假如是多组间率的比拟,则采用行列表资料2检验。计量资料指对某一个研究对象用定量的方法测定某项指标得到的资料,一般均有计量单位。通常资料呈正态分布时,两组间均数比拟用t检验,多组间均数比拟用方差分析和q检验。当资料不呈正态分布或方差不齐时,可以用秩和检验等非参数检验法。2.2.1统计方法描绘不清医学论文中常可发现作者未交代所用的统计方法,如是配对设计的t检验还是成组设计的t检验,是Ridit分析还是2检验,是作相关分
22、析还是作回归推断。统计方法交代不清或根本不予交代,使读者对论文结论的正确与否无法判定。有的作者只提一句经统计学处理后,就写出结论。有的甚至直接用P值讲明问题,笼统地以P0.05或0.01、P0.05便称结果差异有无显著性,P值的大小不讲明差值的大小,它还与抽样误差大小有关13。因而,还应写明详细的统计方法,如有特殊情况,还应讲明能否采用了校正,应写出描绘性统计量的可信区间,注明准确的统计量值和P值,然后根据P值大小作出统计学推断,并作出相应的医学专业结论。2.2.2假设检验方法交代不清不交代假设检验方法或假设检验方法交代的不详细、不清楚是医学科研论文中常见的错误。假如不交代假设检验方法或假设检
23、验方法交代的不详细,读者就无法考察论文的统计学方法选择的能否正确,无法核对计算结果能否准确。每一种假设检验方法都有其特定的适应条件和严格的适用范围。对于同一组资料,采用不同的假设检验方法可能得出截然相反的结论。如将配对设计的资料按成组设计资料的方法处理,将会损失样本提供的信息、降低检验效率,可能使本来有统计学意义的结果无统计学意义14。在论文写作时,不但要交代选用的是什么统计学方法,而且统计学方法要尽可能详细。如选择t检验,要讲明是配对t检验,还是成组t检验;选择方差分析时,要讲明是完全随机设计的方差分析,还是配伍组设计的方差分析。对于四格表资料,应讲明是一般四格表2检验、配对四格表2检验及四
24、格表资料的准确概率法等。2.2.3统计方法选择常见错误误用2检验。2检验有一定的适用条件,n40且理论数(T)5时,可用一般2检验;n40,但至少有1个T1且T5时,可用校正2检验;n40或T1时用2检验确实切概率法15。t检验误用于多组资料的比拟。在医学期刊中常会出现将t检验误用于多组资料的比拟。多组资料的比拟应该采用方差分析(F检验),当差异具有统计学意义时,再进一步作两两比拟。当各组均与一个对照组比拟时采用Dunnettt检验;当各组互相循环比拟时,则常采用Student-Newman-keuls(SNK)检验,又称q检验16。配对t检验与成组t检验误用。大部分论文只注明采用t检验,而未
25、注明是配对t检验还是成组t检验。配对t检验常用于处理前后的本身对照,即差值均数与总体均数0的比拟;成组t检验适用于成正态分布的两个小样本均数间的比拟。资料不呈正态分布时未用非参数检验。t检验F检验等适用于呈正态分布、方差齐且有确切的测量数值的资料,而非参数检验(如符号检验、秩和检验Wilcoxon法、秩检验-KruskalWallis法、Friedman法、Ridit分析、Seperman相关等)对资料无特殊要求,对按大小顺序、评分、等级、反响程度甚至色调深浅等资料都可进行分析比拟17-18。因而,对于多组计量资料的比拟,呈正态分布且方差齐时用F检验,方差不齐时可用变量变换,或采用秩和检验;对
26、于两个小样本均数的比拟或处理前后的比拟,方差齐时用成组t检验或配对t检验,方差不齐时用t检验19。3结果解释时存在的问题统计分析的结果是推翻无效假设或是不能推翻无效假设。无效假设在一般的统计检验为两组总体参数相等。推翻无效假设只能讲两组总体参数不相等而并不能讲两组相差很大。两组相差怎样要对可信区间进行研究观察后得出。由于统计检验不能得出差异的大小,因此结论不能讲有明显差异或有显著差异,也不能讲差异非常显著,更不能讲差异明显。在国外的统计书籍上的英语表达为significant,它的正确意义应当是有意义的、有重要性的。俄语为和日语中的有意也是这个意思。国内只要极个别的英汉词典把significa
27、nt误译为显著的。正确的讲法应当是差异有统计学意义或差异有高度统计学意义等20。在解释差异有统计学意义的结果时,有些人经常根据P值的大小作出对实验效应差异程度不同的专业结论21。例如某实验研究,比拟甲、乙两种治疗方法对某病的治疗效果(假定甲法的疗效优于乙法),若得到P0.001,则以为甲法极显著优于乙法;若得到P0.01,则以为甲法非常显著优于乙法;若得到P0.05,则以为甲法显著优于乙法。犯这种错误的原因是错误的理解了统计学中P值的概念7。统计学上根据假设检验原理推算出来的P值表示拒绝特定的无效假设可能犯假阳性错误的概率。P值的大小并非指差异的太小,只能反映两者一样或不一样。P值越小,讲明越
28、有理由以为两种处理方法效果不同,而不能反映比照的两组或多组之间差异的大小。差异的大小只能根据专业知识来确定。此外,甚至在部分投稿文章中未交代所采用的统计分析方法,也未见应用统计学的迹象,仅从各组数据的均数大小做出了统计推断。医学期刊论文中暴露出来的统计学错误,从外表上看是编辑部和审稿者把关不严所致。事实上,即便审稿时发现了上述错误,也无法改正。由于实验设计的错误只要在科研工作开场之前才有可能得到纠正。即便编辑工作者能够阻止有严重统计学问题的论文发表,也仅仅是治标罢了。怎样使广大医学论文作者在医学研究中正确应用统计学,提高科研质量才是治本7。4对策与建议众所周知,统计学是从事科学研究不可缺少的工
29、具。从试验设计、资料采集与表达、数据处理和结果分析,每一个环节都需要正确地运用统计知识,才能真正发挥统计学在科学研究中应起的作用。然而,在已出版和发表的一些学术专著和论文中、通过评审的科研成果和答辩的学位论文中,经常能够看到忽视、轻视和误用统计学的现象22。4.1提高编辑人员的统计学知识应完善编辑人员的知识构造,保证统计学应用的准确性。为此,可定期聘请统计学专家对审稿人员进行统计学知识培训。科技期刊的群体效应理论23以为,期刊编辑的专业构造应多元化,以利于编辑相互学习,实现知识互补。医学期刊编辑部可考虑聘用统计学专业的研究生作为编辑。编辑应将医学统计学作为本人的必修课,通太多种方式,如自学自修
30、,参加讲座或培训班学习统计学知识,有条件的编辑部,如医学院校学报编辑部,能够有计划地组织编辑参加本科生或研究生医学统计学课程的学习,可以鼓励编辑人员在职攻读统计学专业研究生学位。这样,能够提高全体编辑人员的统计学水平,最终使编辑和审稿人都能够发现论文中存在的统计学错误,并指导作者修改,正确进行医学论文中有关统计学分析的描绘24。另外,有关职能部门或学会可组织与医学统计学相关的培训班,聘请统计学专家讲课,对编辑人员进行定期统计学知识培训,加强科研设计、统计学知识的学习19。4.2加强医学统计学专家审稿医学研究论文专业性强,经常涉及统计学处理问题,有时会碰到统计方法复杂的稿件,这不仅需要本学科专家
31、审稿,而且需要医学统计专家把关,只要这样,才能保证论文所报道的研究成果的真实性和可靠性。医学期刊编委会中应有统计学专家,专门负责稿件统计学方面的审查工作。4.3强化作者的统计学意识目前,我国医学科研工作者对统计学的重视不够,没有认识到统计学的重要性。因而,要加强宣传,提高医学科研人员对统计学重要性的认识,强化他们的统计学意识,务必在科研工作中和撰写论文时做到正确应用统计学。另外,还能够对作者创办有关科研论文撰写知识的培训班,面向临床医生,十分是年轻医生定期培训。请有研究经历的专家讲授科研课题的设计方法、怎样正确运用统计学方法等。这些措施有利于强化作者的统计学意识,并树立其精品意识,有利于增加优质稿源,进而提高期刊学术质量19。总之,提高医学期刊中统计学应用的质量是一项长期而又艰巨的工作,它涉及到作者、编者、审者及读者等多个方面,需要大家共同努力,才能逐步减少以致消除统计学误用现象,进而提高医学论文的科学性14。有关统计学专业毕业论文推荐:1.浅谈统计学专业相关论文2.统计学本科毕业论文3.统计学毕业论文范文4.统计学毕业生论文5.统计学毕业论文6.统计学相关论文
限制150内