医学统计学第十章线性相关精品文稿.ppt
《医学统计学第十章线性相关精品文稿.ppt》由会员分享,可在线阅读,更多相关《医学统计学第十章线性相关精品文稿.ppt(52页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、医学统计学第十章线性相关第1页,本讲稿共52页例:某医院欲研究儿童的体重与体表面积的关系,测量了10名3岁男童体重与体表面积,数据见下表编号X(X,kg)Y(Y,103cm2)111.05.283211.85.299312.05.358412.35.292513.15.602613.76.014714.45.830814.96.102915.26.0751016.06.411合计133.457.266第2页,本讲稿共52页内容n相关关系与确定性关系n定量资料的相关n定性资料的相关n等级资料的相关n相关分析的正确应用第3页,本讲稿共52页10.1 相关关系与确定性关系n确定性关系:两变量间的函数
2、关系 圆的周长与半径的关系:C2R 速度、时间与路程的关系:LST X与Y的函数关系:Ya+bX n非确定性关系:两变量在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄的关系;年龄与血脂的关系;身高与体重的关系;体重与体表面积的关系;药物浓度与反应率的关系;第4页,本讲稿共52页相关关系与确定性关系(2)n当对事物的规律了解加深时,相关关系可以转变为确定性关系。n父亲患白化病X,(X=是,否);n子女患白化病Y,(Y=是,否);nX与Y的关系不确定。n当母亲患白化病时,X与Y的关系确定:X=是,则Y=是;X=否,则Y=否。(父亲为异常基因的携带者出外。)第5页,本讲稿共52
3、页相关关系(correlation)n当一个变量增大,另一个也随之增大(或减少),我们称这种现象为共变,或相关(correlation)。两个变量有共变现象,称为有相关关系。n相关关系不一定是因果关系。第6页,本讲稿共52页10.2 定量资料的相关n反映两定量指标间的相关关系用 Pearson 相关系数。(Pearson correlation coefficient)第7页,本讲稿共52页例10.1 10名3岁男童体重与体表面积的关系 编号 体重(X,kg)体表面积(Y,103cm2)111.05.283211.85.299312.05.358412.35.292513.15.602613.
4、76.014714.45.830814.96.102915.26.075 1016.06.411 合计133.457.266第8页,本讲稿共52页分析步骤n散点图n相关系数计算n相关系数的假设检验第9页,本讲稿共52页10名3岁男童体重与体表面积散点图1112131415165.05.56.06.5体重(kg),X体表面积Y(103cm2)第10页,本讲稿共52页Pearson相关系数的计算X 的离均差平方和:Y 的离均差平方和:X与Y 间的离均差积和:第11页,本讲稿共52页离均差平方和、离均差积和的展开:第12页,本讲稿共52页相关系数的性质n总体相关系数总体相关系数 n-1 r 1nr0
5、为正相关为正相关nr0为负相关为负相关nr0为零相关或无相关为零相关或无相关第13页,本讲稿共52页r=0(h)r 0(f)r-1(d)r1(b)0r1(a)-1r0(c)r 0(e)r 0(g)零相关正相关负相关完全正相关完全负相关零相关零相关零相关相关关系示意图第14页,本讲稿共52页相关系数的含义 符号符号:相关系数小于相关系数小于0 0为负相关;大于为负相关;大于0 0为正相关;等于为正相关;等于0 0为为零相关。零相关。数值数值:相关系数的绝对值越大,表示两变量间的相关程度相关系数的绝对值越大,表示两变量间的相关程度越密切;相关系数越接近于越密切;相关系数越接近于0 0,表示相关越不
6、密切。,表示相关越不密切。表达两变量间线性相关的程度和方向的一个统计指标 第15页,本讲稿共52页例10.1资料相关系数的计算第16页,本讲稿共52页10.2.2 相关系数的假设检验H 0:0,体重与体表面积无相关关系;H 1:0,体重与体表面积有相关关系。=0.05t t 服从自由度为n-2的 t t 分布。第17页,本讲稿共52页例10.1资料相关系数的假设检验自由度102,P0.001拒绝H0,接受H1。可以认为3岁男童体重与体表面积之间有正相关关系。第18页,本讲稿共52页10.2.3 总体相关系数的区间估计n相关系数 分布q相关系数=0 n样本相关系数的分布是对称的,当样本含量较大时
7、,近样本相关系数的分布是对称的,当样本含量较大时,近似正态分布似正态分布 q相关系数不等于0 n样本相关系数的分布是偏态样本相关系数的分布是偏态 第19页,本讲稿共52页-0.8-0.6-0.4-0.20.00100200300-1.000.51.01.52.0050100150200-2-1012050100150200 01234050100150200250 00.20.40.60.81.00100200300=0 =-0.8 =0.8(e)z(d)z(f)z第20页,本讲稿共52页z变换(双曲正切变换)nR.A.Fisher(1921)提出的其反变换其反变换 第21页,本讲稿共52页的
8、区间估计 nz值 的分布q变换值z近似服从均数为q标准差为 的正态分布n将相关系数r变换为z值,并按正态分布原理估计z的 100(1-)%的可信限然后再进行反变换,求出的可信区间第22页,本讲稿共52页以例10.1数据为例,试计算总体相关系数 的95%及99%可信区间 nz的95%可信区间:1.91981.960.3780=(1.1789,2.6607)nz的99%可信区间:1.91982.580.3780=(0.9446,2.8950)r的95%可信区间:0.82710.9903;r的99%可信区间:0.73730.9939 第23页,本讲稿共52页10.2.4 两样本相关系数的比较n例10
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 统计学 第十 线性 相关 精品 文稿
限制150内