第十章相关与回归分析.ppt
《第十章相关与回归分析.ppt》由会员分享,可在线阅读,更多相关《第十章相关与回归分析.ppt(52页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、实践中的统计实践中的统计n n19471947年,宝丽来公司创始人年,宝丽来公司创始人年,宝丽来公司创始人年,宝丽来公司创始人Dr.Edwin LandDr.Edwin Land宣布,他们在研究即时显像的技术方面迈宣布,他们在研究即时显像的技术方面迈宣布,他们在研究即时显像的技术方面迈宣布,他们在研究即时显像的技术方面迈出了新的一步,这使得一分钟成像成为可能。紧接着,公司开始拓展用于大众摄影出了新的一步,这使得一分钟成像成为可能。紧接着,公司开始拓展用于大众摄影出了新的一步,这使得一分钟成像成为可能。紧接着,公司开始拓展用于大众摄影出了新的一步,这使得一分钟成像成为可能。紧接着,公司开始拓展用
2、于大众摄影的业务。宝丽来的第一台相机和第一卷胶卷诞生于的业务。宝丽来的第一台相机和第一卷胶卷诞生于的业务。宝丽来的第一台相机和第一卷胶卷诞生于的业务。宝丽来的第一台相机和第一卷胶卷诞生于19491949年。在那之后,他们不断地年。在那之后,他们不断地年。在那之后,他们不断地年。在那之后,他们不断地在化学、光学和电子学方面进行试验和发展,以生产具有更高品质、更高可靠性和在化学、光学和电子学方面进行试验和发展,以生产具有更高品质、更高可靠性和在化学、光学和电子学方面进行试验和发展,以生产具有更高品质、更高可靠性和在化学、光学和电子学方面进行试验和发展,以生产具有更高品质、更高可靠性和更为便利的摄影
3、系统。更为便利的摄影系统。更为便利的摄影系统。更为便利的摄影系统。n n宝丽来公司的另一项主要业务是为技术和工业提供产品,目前,它正致力于使即时宝丽来公司的另一项主要业务是为技术和工业提供产品,目前,它正致力于使即时宝丽来公司的另一项主要业务是为技术和工业提供产品,目前,它正致力于使即时宝丽来公司的另一项主要业务是为技术和工业提供产品,目前,它正致力于使即时显像技术在现代可视的通信环境下,成为日益增长的成像系统中的关键部分。为此,显像技术在现代可视的通信环境下,成为日益增长的成像系统中的关键部分。为此,显像技术在现代可视的通信环境下,成为日益增长的成像系统中的关键部分。为此,显像技术在现代可视
4、的通信环境下,成为日益增长的成像系统中的关键部分。为此,该公司推出了多种可进行即时显像的产品,以供专业摄影、工业、科学和医学之用。该公司推出了多种可进行即时显像的产品,以供专业摄影、工业、科学和医学之用。该公司推出了多种可进行即时显像的产品,以供专业摄影、工业、科学和医学之用。该公司推出了多种可进行即时显像的产品,以供专业摄影、工业、科学和医学之用。除此之外,公司还在磁学、太阳镜、工业偏振镜、化工、传统涂料和全息摄影的研除此之外,公司还在磁学、太阳镜、工业偏振镜、化工、传统涂料和全息摄影的研除此之外,公司还在磁学、太阳镜、工业偏振镜、化工、传统涂料和全息摄影的研除此之外,公司还在磁学、太阳镜、
5、工业偏振镜、化工、传统涂料和全息摄影的研制和生产方面有自己的业务。制和生产方面有自己的业务。制和生产方面有自己的业务。制和生产方面有自己的业务。n n用于衡量摄影材料感光度的测光计,可以提供许多有关于胶片特性的信息,比如它用于衡量摄影材料感光度的测光计,可以提供许多有关于胶片特性的信息,比如它用于衡量摄影材料感光度的测光计,可以提供许多有关于胶片特性的信息,比如它用于衡量摄影材料感光度的测光计,可以提供许多有关于胶片特性的信息,比如它的曝光时间范围。在宝丽来中心感光实验室中,科学家们把即时显像胶片置于一定的曝光时间范围。在宝丽来中心感光实验室中,科学家们把即时显像胶片置于一定的曝光时间范围。在
6、宝丽来中心感光实验室中,科学家们把即时显像胶片置于一定的曝光时间范围。在宝丽来中心感光实验室中,科学家们把即时显像胶片置于一定的温度和湿度下,使之近似于消费者购买后的保存条件,然后再对其进行系统地抽的温度和湿度下,使之近似于消费者购买后的保存条件,然后再对其进行系统地抽的温度和湿度下,使之近似于消费者购买后的保存条件,然后再对其进行系统地抽的温度和湿度下,使之近似于消费者购买后的保存条件,然后再对其进行系统地抽样检验和分析。他们选择专业彩色摄影胶卷,抽取了分别已保存样检验和分析。他们选择专业彩色摄影胶卷,抽取了分别已保存样检验和分析。他们选择专业彩色摄影胶卷,抽取了分别已保存样检验和分析。他们
7、选择专业彩色摄影胶卷,抽取了分别已保存113113个月不等的胶个月不等的胶个月不等的胶个月不等的胶卷,以便研究它们保存时间和感光速率之间的联系。数据显示,感光速率随保存时卷,以便研究它们保存时间和感光速率之间的联系。数据显示,感光速率随保存时卷,以便研究它们保存时间和感光速率之间的联系。数据显示,感光速率随保存时卷,以便研究它们保存时间和感光速率之间的联系。数据显示,感光速率随保存时间的延长而下降,它们之间相应变动的关系可用一条直线或线性关系近似表示出。间的延长而下降,它们之间相应变动的关系可用一条直线或线性关系近似表示出。间的延长而下降,它们之间相应变动的关系可用一条直线或线性关系近似表示出
8、。间的延长而下降,它们之间相应变动的关系可用一条直线或线性关系近似表示出。n n运用回归分析,宝丽来公司建立起一个方程式,它能反映出胶卷保存时间长短对感运用回归分析,宝丽来公司建立起一个方程式,它能反映出胶卷保存时间长短对感运用回归分析,宝丽来公司建立起一个方程式,它能反映出胶卷保存时间长短对感运用回归分析,宝丽来公司建立起一个方程式,它能反映出胶卷保存时间长短对感光速率的影响。光速率的影响。光速率的影响。光速率的影响。n nY=-19.8Y=-19.87.6x 7.6x 式中式中式中式中y y表示胶卷感光率的变动,表示胶卷感光率的变动,表示胶卷感光率的变动,表示胶卷感光率的变动,x x为胶卷
9、保存时间(月)为胶卷保存时间(月)为胶卷保存时间(月)为胶卷保存时间(月)n n从这一方程式可以看出,胶卷的感光速率平均每月下降从这一方程式可以看出,胶卷的感光速率平均每月下降从这一方程式可以看出,胶卷的感光速率平均每月下降从这一方程式可以看出,胶卷的感光速率平均每月下降7.67.6个单位。通过此分析得到个单位。通过此分析得到个单位。通过此分析得到个单位。通过此分析得到的信息,有助于宝丽来公司把消费者的购买和使用结合起来考虑,调整生产,提供的信息,有助于宝丽来公司把消费者的购买和使用结合起来考虑,调整生产,提供的信息,有助于宝丽来公司把消费者的购买和使用结合起来考虑,调整生产,提供的信息,有助
10、于宝丽来公司把消费者的购买和使用结合起来考虑,调整生产,提供顾客需要的胶卷。顾客需要的胶卷。顾客需要的胶卷。顾客需要的胶卷。事物之间的数量关系举例事物之间的数量关系举例n n某种商品的销售额某种商品的销售额(y)与销售量与销售量(x)之间的关系可之间的关系可表示为:表示为:销售额销售额=销售量销售量销售价格销售价格(p)用符号表示,即:用符号表示,即:y=p xn n圆的面积圆的面积(S)与半径之间的关系可表示为:与半径之间的关系可表示为:S=R2n n企业的原材料消耗额企业的原材料消耗额(y)与产量与产量(x1)、单位产量、单位产量消耗消耗(x2)、原材料价格、原材料价格(x3)之间的关系可
11、表示为:之间的关系可表示为:y=x1 x2 x3事物之间的数量关系举例事物之间的数量关系举例你怎么这你怎么这么高?么高?因为我爸爸因为我爸爸妈妈高。妈妈高。变量间的关系变量间的关系n n函数关系函数关系n n是一一对应的确定关系是一一对应的确定关系是一一对应的确定关系是一一对应的确定关系n n设有两个变量设有两个变量设有两个变量设有两个变量 x x 和和和和 y y,变量变量变量变量 y y 随随随随变量变量变量变量 x x 一起变化,并完全依赖于一起变化,并完全依赖于一起变化,并完全依赖于一起变化,并完全依赖于 x x,当变量当变量当变量当变量 x x 取某个数值时,取某个数值时,取某个数值
12、时,取某个数值时,y y 依确定的关系取相应的值,则称依确定的关系取相应的值,则称依确定的关系取相应的值,则称依确定的关系取相应的值,则称 y y 是是是是 x x 的函数,记为的函数,记为的函数,记为的函数,记为 y y=f f(x x),其其其其中中中中 x x 称为自变量,称为自变量,称为自变量,称为自变量,y y 称为因变量称为因变量称为因变量称为因变量n n以线性函数关系为例,各观测点以线性函数关系为例,各观测点以线性函数关系为例,各观测点以线性函数关系为例,各观测点落在一条线上落在一条线上落在一条线上落在一条线上 x xy y变量间的关系变量间的关系周周周周商业广告数商业广告数商业
13、广告数商业广告数销售额销售额销售额销售额1 1 1 12 2 2 2505050502 2 2 25 5 5 5575757573 3 3 31 1 1 1414141414 4 4 43 3 3 3545454545 5 5 54 4 4 4545454546 6 6 61 1 1 1383838387 7 7 75 5 5 5636363638 8 8 83 3 3 3484848489 9 9 94 4 4 459595959101010102 2 2 246464646某音像设备商店在过去的某音像设备商店在过去的3 3个月有个月有1010周周,利用周末电视广告进行促销利用周末电视广告进
14、行促销.管理管理人员想调查是否可以证实在广告展示次数和下一周期间的商店销售额间人员想调查是否可以证实在广告展示次数和下一周期间的商店销售额间有关系有关系,以百万元计的销售额的以百万元计的销售额的1010周的样本数据如下表周的样本数据如下表:n n相关关系相关关系相关关系相关关系n n变量间关系不能用函数关系变量间关系不能用函数关系变量间关系不能用函数关系变量间关系不能用函数关系精确表达精确表达精确表达精确表达n n一个变量的取值不能由另一一个变量的取值不能由另一一个变量的取值不能由另一一个变量的取值不能由另一个变量唯一确定个变量唯一确定个变量唯一确定个变量唯一确定n n当变量当变量当变量当变量
15、 x x 取某个值时,变量取某个值时,变量取某个值时,变量取某个值时,变量 y y 的取值可能有几个的取值可能有几个的取值可能有几个的取值可能有几个n n以线性相关关系为例,各观以线性相关关系为例,各观以线性相关关系为例,各观以线性相关关系为例,各观测点分布在直线周围测点分布在直线周围测点分布在直线周围测点分布在直线周围 周周周周商业广告数商业广告数商业广告数商业广告数销售额销售额销售额销售额6 6 6 61 1 1 1383838383 3 3 31 1 1 141414141101010102 2 2 2464646461 1 1 12 2 2 2505050508 8 8 83 3 3
16、3484848484 4 4 43 3 3 3545454545 5 5 54 4 4 4545454549 9 9 94 4 4 4595959592 2 2 25 5 5 5575757577 7 7 75 5 5 563636363变量间的关系变量间的关系n n1010名名名名2020多岁的女性一季的多岁的女性一季的多岁的女性一季的多岁的女性一季的“化妆品费化妆品费化妆品费化妆品费”和和和和“置装费置装费置装费置装费”如如如如下:下:下:下:化妆品费(元)化妆品费(元)化妆品费(元)化妆品费(元)置装费(元)置装费(元)置装费(元)置装费(元)A A 3000 3000 7000 700
17、0B B 5000 5000 8000 8000C C12000120002500025000D D 2000 2000 5000 5000E E 7000 70001200012000F F15000150003000030000GG 5000 50001000010000HH 6000 60001500015000I I 8000 80002000020000J J10000100001800018000n n“年龄年龄年龄年龄”和和和和“喜欢的品牌喜欢的品牌喜欢的品牌喜欢的品牌”有关系吗?有关系吗?有关系吗?有关系吗?第十章第十章 相关与回归分析相关与回归分析p253p253p253p2
18、53学习目标学习目标 Learning Objectivesn n1.理解相关系数理解相关系数n n2.描述线性回归模型描述线性回归模型n n3.解释最小二乘法解释最小二乘法n n4.评价模型评价模型01234012345销售销售广告广告讨讨论论内内容容简单线性简单线性相关分析相关分析简单线性简单线性回归分析回归分析相关关系及其类型相关关系及其类型P253相关分析要解决的问题相关分析要解决的问题相关与回归分析的步骤相关与回归分析的步骤Excel的相应应用的相应应用线性相关关系的量度线性相关关系的量度回归分析回归分析P262P262简单线性回归模型及其建立简单线性回归模型及其建立简单线性回归模型
19、的评价简单线性回归模型的评价利用回归方程进行预测利用回归方程进行预测应用相关与回归分析的注意事项应用相关与回归分析的注意事项相关关系及其类型p255p255n n相关关系相关关系现象之间存在的非确定性的数现象之间存在的非确定性的数量依存关系称为相关关系。量依存关系称为相关关系。完全相关完全相关不相关不相关不完全相关不完全相关相关关系的类型相关关系的类型 链接相关关系的类型p255p255正相关正相关负相关负相关直线相关直线相关曲线相关曲线相关相关关系的类型相关关系的类型n n单相关单相关单相关单相关l复相关复相关相关关系的类型相关关系相关关系非线性非线性相关相关线性线性线性线性相关相关相关相关
20、单单单单相相相相关关关关正正相相关关负负相相关关复复相相关关完全完全相关相关不不 相关相关按相关形式按相关形式按相关程度按相关程度按相关因素多少按相关因素多少不完全不完全不完全不完全相关相关相关相关相关分析要解决的问题相关分析要解决的问题n n变量之间是否存在关系?变量之间是否存在关系?n n如如果果存存在在关关系系,它它们们之之间间是是什什么么样的关系?样的关系?n n变量之间的关系强度如何?变量之间的关系强度如何?n n样样本本所所反反映映的的变变量量之之间间的的关关系系能能否代表总体变量之间的关系?否代表总体变量之间的关系?相关与回归分析的步骤相关与回归分析的步骤定性分析定性分析有无终止
21、终止初步判断初步判断(确定表现形式及方向)(确定表现形式及方向)定量分析定量分析(计算相关系数)(计算相关系数)建建 模模(数学模型表现相关关系)(数学模型表现相关关系)检检 验验(可信度及显著性检验)(可信度及显著性检验)运运 用用(分析、预测或模拟控制)(分析、预测或模拟控制)检检 验验(相关系数显著性检验)(相关系数显著性检验)变量线性相关关系的测度变量线性相关关系的测度p257p257n n相关表相关表相关表相关表将一变量的变量值按顺序排列,与之对应的另一变量将一变量的变量值按顺序排列,与之对应的另一变量将一变量的变量值按顺序排列,与之对应的另一变量将一变量的变量值按顺序排列,与之对应
22、的另一变量或多个变量的变量值依次排列形成的统计表或多个变量的变量值依次排列形成的统计表或多个变量的变量值依次排列形成的统计表或多个变量的变量值依次排列形成的统计表n n相相相相关图关图关图关图(散点图散点图散点图散点图)将两个变量间相对应的变量值用坐标点的将两个变量间相对应的变量值用坐标点的将两个变量间相对应的变量值用坐标点的将两个变量间相对应的变量值用坐标点的形式描绘出来。形式描绘出来。形式描绘出来。形式描绘出来。大致判断两个变量间的相关形态、方向及程度。大致判断两个变量间的相关形态、方向及程度。大致判断两个变量间的相关形态、方向及程度。大致判断两个变量间的相关形态、方向及程度。n n相关系
23、数相关系数相关系数相关系数度量变量之间线性相关关系密切程度的指标度量变量之间线性相关关系密切程度的指标度量变量之间线性相关关系密切程度的指标度量变量之间线性相关关系密切程度的指标n n简单相关系数简单相关系数简单相关系数简单相关系数与复相关系数与复相关系数与复相关系数与复相关系数前者:前者:前者:前者:测定直线相关条件下两测定直线相关条件下两测定直线相关条件下两测定直线相关条件下两个变量之间相关关系密切程度和方向;后者:个变量之间相关关系密切程度和方向;后者:个变量之间相关关系密切程度和方向;后者:个变量之间相关关系密切程度和方向;后者:反映多个变量反映多个变量反映多个变量反映多个变量 之之之
24、之间线性相关关系间线性相关关系间线性相关关系间线性相关关系n n样本相关系数样本相关系数样本相关系数样本相关系数与总体相关系数与总体相关系数与总体相关系数与总体相关系数前者:根据样本数据计算的,前者:根据样本数据计算的,前者:根据样本数据计算的,前者:根据样本数据计算的,记为记为记为记为r r;后者:根据总体全部数据计算的,记为;后者:根据总体全部数据计算的,记为;后者:根据总体全部数据计算的,记为;后者:根据总体全部数据计算的,记为 两变量线性相关关系的测度两变量线性相关关系的测度(简单)相关系数的理解(简单)相关系数的理解n n协方差协方差相关系数实质上是通过协方差相关系数实质上是通过协方
25、差来说明相关关系的密切程度的。对于一个来说明相关关系的密切程度的。对于一个含有含有 n个个体个个体,每个个体含有两个数据每个个体含有两个数据(x1,y1),(x2,y2),协方差定义如下:,协方差定义如下:两变量线性相关关系的测度两变量线性相关关系的测度(简单)相关系数的理解(简单)相关系数的理解n n协方差的理解协方差的理解协方差的理解协方差的理解以音像商店例子为例。散点以音像商店例子为例。散点以音像商店例子为例。散点以音像商店例子为例。散点图中加了一条垂直线(即图中加了一条垂直线(即图中加了一条垂直线(即图中加了一条垂直线(即x x的的的的平均值)和一条水平线(即平均值)和一条水平线(即平
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十 相关 回归 分析
限制150内