chap两变量相关与回归实用.pptx





《chap两变量相关与回归实用.pptx》由会员分享,可在线阅读,更多相关《chap两变量相关与回归实用.pptx(80页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2023/4/131变量间的关系 确定性(函数)关系:xy 对应。随机性关系:xy不确定性。相关分析的统计指标:(1)正态分布的双变量计量:散点图直线趋势 Pearson相关系数。皮尔逊(2)不服从正态分布的双变量计量资料,或等级或相对数,或总体分布类型不知的资料:散点图直线趋势等级相关系数。(3)两个有关的分类变量:交叉分类的RC表独立性2检验和列联系数描述其相关性。第1页/共80页2023/4/13211直线相关(linear correlation)P85直线相关or 简单相关(simple correlation):两变量相互呈直线变化趋势的随机性关系。一、散点图、积差相关系数 1.散
2、点图第2页/共80页2023/4/1332.相关系数 (correlation coefficient):定量描述两变量间直线相关方向和密切程度的统计指标。(1)积差相关系数(Product-moment correlation coefficient)Pearson相关系数,相关系数:参数统计,双变量正态分布。-1r1,符号相关方向,绝对值密切程度。r0:正相关。r0表示自变量应变量,直线上升。b越陡 y随x变化率大。第19页/共80页2023/4/1320二、直线回归方程的建立与检验 建立:最小二乘法原则。检验:能否使用。使用:在样本数据范围内。预测:x估y。控制:y估x。第20页/共80
3、页2023/4/13211建立 回归直线a+bx。剩余误差(y-),残差:各实测值y至回归直线纵向距离。剩余平方和(residual sum of square)或残差平方和 SS剩余(y-)2 y-(a+bx)2 (6-9)最小二乘法(method of least squares):SS剩余最小。第21页/共80页2023/4/13222检验 n100,r 假设检验有统计学意义时:r0.7,两个变量高度相关;0.4r 0.7,中度相关;0.2r 0.4,低度相关。第22页/共80页2023/4/13233.决定系数决定系数(determining coefficient,相关指数corre
4、lation index,R2)R2=SS回/SS总=(SS总SS剩)/SS总=1SS剩/SS总 R2表示y的总变异中被x所决定的占多少。0R2 1,1,回归效果越好,强度。R2 密切程度(相关强度)。回归强度R2=SS回/lyy=(n1)sy2 r2/lyy=r2 第23页/共80页2023/4/1324例:两变量,df=100,r=0.20时,查附表11,P0.05,可认为两变量间存在直线相关。R2=0.202=0.04,y的变异只有4%与回归有关,两个变量直线相关的实际意义不大,除 x 外,还有其它因素等待我们去认识。由这样的资料求出的回归方程是无任何预测价值的。区别相关显著(r有统计学
5、意义)与相关强度第24页/共80页2023/4/13254回归系数的CI bt/2(n2)sbbt/2(n2)(s y/sx)两回归系数比较时可用CI作假设检验:无重叠不同 重叠同。第25页/共80页2023/4/1326【例6-3】例6-1资料3岁儿童体重与体表面积资料,建立直线回归方程并进行检验。【SPSS】L6-1.sav Analyze Regression Linear Regression,体重为Independent、体表面积为dependentStatistic,选Confidence intervals Continue OK。第26页/共80页2023/4/1327第27页
6、/共80页2023/4/1328第28页/共80页2023/4/13294 4 简单回归与相关的区别和联系 P95一、区别1.资料要求:(1)相关:X、Y 正态(2)回归:X、Y 正态 X 选定,Y 随机2.应用:(1)相关:X、Y相互关系(2)回归:X推Y3.计量单位:相关系数r无,回归系数b有单位第29页/共80页2023/4/1330二、联系(1)方向一致:r与b的正负号一致。(2)同一资料假设检验等价:tr=tb(3)r与b可相互推导获得。(4)用回归解释相关:R2=r2第30页/共80页2023/4/13315 5 回归分析的应用 P95一、应用1.描述变量间数量变化关系 :量-效关
7、系、配伍规律。【例6-4】医宗金鉴治积聚处方,y=1.967+0.735x,有统计学意义,R 2=0.9996,拟合度达99.96%,用回归方程描述名医治病用药的配伍规律准确有效。表6-2 6个治积聚方的川乌与茯苓用量处 方川乌x茯苓y新制阴阳攻积丸3024肥 气 丸3.64.5息 贲 丸3.04.5伏 梁 丸1.53.0痞 气 丸1.53.0奔 豚 丸1.53.0第31页/共80页2023/4/13322.预测y值容许区间即预测区间(prediction interval PI)x=x0时,y0值的(1)预测区间计算公式为:第32页/共80页2023/4/1333第33页/共80页2023/
8、4/13343.估计的CI:自变量x0,应变量估计值的总体均数 的(1)CI为:第34页/共80页2023/4/1335二、二、注意事项1.专业上要有意义:专业相关回归分析。2.选择合适的回归模型:散点图。直线趋势直线回归分析 曲线趋势曲线方程。3.不随意外延:以自变量的观测范围为限。第35页/共80页2023/4/1336L2:L2:6 6 曲线回归(curve linear regression)P97曲线拟合(curve fitting):根据样本资料找出能反映变量间关系的曲线回归方程的过程。散点图曲线类型:对数、指数、幂函数、Logistic等。曲线关系最小二乘法曲线直线化直线回归还原
9、得到曲线方程。统计软件对一组资料常可同时拟合多种模型:R 2接近1、标准估计误差SY较小、变量数最少,结构最简单的模型为首选。第36页/共80页2023/4/1337【例6-7】研究板蓝根注射液含量的稳定性,在pH=6.28,温度为78下,测得保温时间与含量破坏百分比的结果如下,作保温时间t与含量破坏百分比p间的曲线拟合。散点图线形模型或对数模型。线形模型:p=1.60+0.14t,R20.932,P0.05。对数模型:T=lnt,p=29.0+9.78T,还原t得到p=29.0+9.78lnt,R20.994,P 0.15(预设),CI不异质性校正。第46页/共80页2023/4/1347P
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- chap 变量 相关 回归 实用

限制150内