欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    第六讲应用统计精选PPT.ppt

    • 资源ID:88383479       资源大小:2.70MB        全文页数:51页
    • 资源格式: PPT        下载积分:18金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要18金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第六讲应用统计精选PPT.ppt

    第六讲应用统计1第1页,此课件共51页哦第六讲第六讲简单线性回归模型简单线性回归模型第2页,此课件共51页哦1n建立两个变量建立两个变量X和和Y间的关系模型,推断变量间的关系模型,推断变量Y如何如何依赖于变量依赖于变量X,从而可以用从而可以用X预测预测Y.n例:例:n广告费用和销售量广告费用和销售量n公司的市值与公司的市值与CEO的年薪的年薪n原始股的销售数量和期望价格原始股的销售数量和期望价格n证券市场收益率与某只股票的收益率证券市场收益率与某只股票的收益率n商品价格和销售量商品价格和销售量n装配线的速度和次品数量装配线的速度和次品数量n年收入与信用卡消费金额年收入与信用卡消费金额n年龄与手机话费年龄与手机话费n连锁店附近的人流与店的利润连锁店附近的人流与店的利润n气温与滑雪场门票销量气温与滑雪场门票销量n第3页,此课件共51页哦变量间的关系变量间的关系n 变量之间是否存在关系?如果存在,它们之间是什么样的关系呢?变量之间关系强度如何?样本所反映的变量之间的关系能否代表总体变量之间的关系?最简单直观的就是用散点图描述变量间的关系。4第4页,此课件共51页哦函数关系1.是一一对应的确定关系2.设有两个变量 x 和 y,变量 y 随变量 x 一起变化,并完全依赖于 x,当变量 x 取某个数值时,y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y=f(x),其中 x 称为自变量,y 称为因变量3.各观测点落在一条线上 x xy y5第5页,此课件共51页哦相关关系(correlation)1.变量间关系不能用函数关系精确表达2.一个变量的取值不能由另一个变量唯一确定3.当变量 x 取某个值时,变量 y 的取值可能有几个4.各观测点分布在直线周围 x xy y6第6页,此课件共51页哦相关关系(类型)7第7页,此课件共51页哦散点图(scatter diagram)不相关不相关不相关不相关 负线性相关负线性相关负线性相关负线性相关 正线性相关正线性相关正线性相关正线性相关 非线性相关非线性相关非线性相关非线性相关 完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关 8第8页,此课件共51页哦阿姆德比萨饼连锁店的问题阿姆德比萨饼连锁店的问题 阿姆得阿姆得(Armand)比萨饼连锁店坐落在美国的比萨饼连锁店坐落在美国的5个州内,它个州内,它们通常的位置是在大学旁边,而且管理人员相信附近大学的人们通常的位置是在大学旁边,而且管理人员相信附近大学的人数与这些连锁店的季度销售额是有关系的。下面是数与这些连锁店的季度销售额是有关系的。下面是10家连锁家连锁店附近大学的学生人数和季度销售收入的数据:店附近大学的学生人数和季度销售收入的数据:根据以上数据,你能否判断学生人数根据以上数据,你能否判断学生人数(x)如何影响到销售收如何影响到销售收入入(y)?根据一家连锁店附近大学的人数,你能够预测该家连锁店?根据一家连锁店附近大学的人数,你能够预测该家连锁店的季度销售收入吗?的季度销售收入吗?9第9页,此课件共51页哦描述学生人数和销售收入之间的关系描述学生人数和销售收入之间的关系n相关系数相关系数(0.95),散点图;,散点图;n根据这些你可以得到什么结论?根据这些你可以得到什么结论?10第10页,此课件共51页哦相关系数(correlation coefficient)1.对变量之间关系密切程度的度量2.对两个变量之间线性相关程度的度量称为简单相关系数3.若相关系数是根据总体全部数据计算的,称为总体相关系数,记为 4.若是根据样本数据计算的,则称为样本相关系数,记为 r11第11页,此课件共51页哦相关系数(计算公式)n 样本相关系数的计算公式或化简为12第12页,此课件共51页哦相关系数(取值及其意义)1.r 的取值范围是-1,12.|r|=1,为完全相关nr=1,为完全正相关nr=-1,为完全负正相关3.r=0,不存在线性线性关系4.-1r0,为负相关5.0F(1,n-2)29第29页,此课件共51页哦回归方程的方差分析表回归方程的方差分析表30第30页,此课件共51页哦阿姆德连锁店的情形阿姆德连锁店的情形 使用EXCEL对阿姆德连锁店的数据建立模型,并进行分析,基于EXCEL的输出结果,你对该模型有些什么认识?31第31页,此课件共51页哦用Excel进行回归分析n第第1步:选择步:选择“工具工具”下拉菜单下拉菜单n第第2步:选择步:选择“数据分析数据分析”选项选项n第第3步:在分析工具中选择步:在分析工具中选择“回归回归”,然后选择,然后选择“确定确定”n第第4步:当对话框出现时步:当对话框出现时 n 在在“Y值输入区域值输入区域”设置框内键入设置框内键入Y的数据区域的数据区域n 在在“X值输入区域值输入区域”设置框内键入设置框内键入X的数据区域的数据区域n 在在“置信度置信度”选项中给出所需的数值选项中给出所需的数值n 在在“输出选项输出选项”中选择输出区域中选择输出区域n 在在“残差残差”分析选项中选择所需的选项分析选项中选择所需的选项n 用用Excel进行回归分析进行回归分析32第32页,此课件共51页哦第33页,此课件共51页哦 输出各部分的内容n回归统计部分回归统计部分:相关系数R、判定系数R2、调整的判定系数 、标准误差 s、样本容量 n,各自含义已知。n系数估计和检验部分系数估计和检验部分:回归系数的估计和检验,给出回归系数0、1的点估计、区间估计和检验。n方差分析部分方差分析部分:对模型整体的检验,在一元回归分析中,H0:1=0,该假设与系数估计和检验部分中对回归系数1的检验相同,二者的p值也相同,但是统计量分布不同,本部分使用 F检验,系数部分使用t 检验。在多元回归分析中,二者的差异和作用才有显露。34第34页,此课件共51页哦 输出各数据之间的关系n各部分内部数据之间的关系:回归统计模块中 R、R2、之间的关系;系数模块中 (t Stat)i=bi/sbi;方差分析模块中 dfT=dfr+dfe、SST=SSR+SSE、MST=SST/dfT、MSR=SSR/dfr、MSE=SSE/dfe、F=MSR/MSE。n各模块外部数据之间的关系:R2=SSR/SST、s2=MSE第35页,此课件共51页哦使用你建立的模型(一)使用你建立的模型(一)n问题一:对于那些附近学校人数是1万的连锁店,他们的季度销售收入一定是一样吗?这种连锁店平均的季度销售收入平均的季度销售收入是多少?你能够给出一个估计吗?n问题二:某家连锁店附近学生总数约1万人,你能够给出它的季度销售收入的一个估计值吗?n点估计:11036第36页,此课件共51页哦使用你建立的模型(二)使用你建立的模型(二)n对于问题一,如何得到这种连锁店平均销售收入的一个95%的置信区间?(98.58,121.42)37第37页,此课件共51页哦使用你建立的模型(三)使用你建立的模型(三)n对于问题二,如何给出一个预测区间,使得这家连锁店的季度销售收入落在该区间里面的概率是1-?(76.13,143.87)38第38页,此课件共51页哦两种区间的关系两种区间的关系xp预测区间边界均值的置信区间39第39页,此课件共51页哦对模型作进一步的探讨对模型作进一步的探讨n回忆我们使用的模型;n对模型作了什么假定?n逻辑问题:如何判断我们的问题符合这些假定?n分析的方案:残差分析 40第40页,此课件共51页哦变差1.因变量 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面n由于自变量 x 的取值不同造成的n除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响2.对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差 来表示41第41页,此课件共51页哦通过残差你能够了解什么?通过残差你能够了解什么?n对误差项作的假定适合吗?1)等方差;2)相互独立;3)正态分布;n哪些数据属于异常值?n哪些观测属于对回归模型有很大影响的?42第42页,此课件共51页哦残差图残差图n关于自变量的残差图;n关于因变量的预测值的残差图;n学生化的标准残差图:43第43页,此课件共51页哦如何分析残差图如何分析残差图n如果模型是符合的,那么残差图上的散点应该落在一条水平带中间,除此之外,残差图上的点不应呈现出什么规律性。n使用EXCEL对阿姆德连锁店的数据产生残差图。你能得到什么结论?44第44页,此课件共51页哦非线性非线性线性线性X X45第45页,此课件共51页哦1方差不等方差相等XX46第46页,此课件共51页哦不独立不独立独立独立XX47第47页,此课件共51页哦异常值的检测异常值的检测n异常值是与其它点显示的趋势不合的点。检查它是否可能是被错误输入的数据。n检测异常值的方法:散点图;利用学生化标准残差基本服从标准正态分布来检测(落在2个标准差之外时)。48第48页,此课件共51页哦带有异常值的散点图示例49第49页,此课件共51页哦检测有影响的观测值检测有影响的观测值n什么是有影响的观测?什么是有影响的观测?n观测的杠杆率:观测的杠杆率:n高杠杆率的点意味着它的自变量距离别的自变量高杠杆率的点意味着它的自变量距离别的自变量的值距离较大的点。的值距离较大的点。n识别影响的观测识别影响的观测:杠杆率杠杆率6/n的观测的观测.50第50页,此课件共51页哦对于建立简单线性回归模型,对于建立简单线性回归模型,你知道了些什么?你知道了些什么?n什么情况下需要建立简单线性回归模型?n对模型的假定有哪些?n如何估计模型的参数?n如何检验模型及其参数的显著性?n如何使用你建立的模型进行预测?n如何分析你的问题符合对模型做的假定?51第51页,此课件共51页哦

    注意事项

    本文(第六讲应用统计精选PPT.ppt)为本站会员(石***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开