第5节数理统计.ppt





《第5节数理统计.ppt》由会员分享,可在线阅读,更多相关《第5节数理统计.ppt(17页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第5节数理统计 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望 数据本身虽然没有随机性,但由于数据数量太数据本身虽然没有随机性,但由于数据数量太 多,无法全部得到,只能抽样统计多,无法全部得到,只能抽样统计数理统计研究的数据带有随机性数理统计研究的数据带有随机性 数据的随机性主要有两个来源:数据的随机性主要有两个来源:实验有随机误差实验有随机误差数理统计的两个步骤数理统计的两个步骤 通过实验或观察收集必要的数据(抽样)通过实验或观察收集必要的数据(抽样)如何随机性
2、地收集这些数据和抽多少数据?标准标准 抽取抽取 个数据个数据 时,要使它们反映的信息时,要使它们反映的信息越多越好;它们分布应均匀,有越多越好;它们分布应均匀,有“代表性代表性”收集数据有两种方法收集数据有两种方法 抽样理论抽样理论(sampling theory)试验设计试验设计(experiment design)对收集的数据进行分析,以作决策对收集的数据进行分析,以作决策 有效地使用数据有效地使用数据 分析数据的方法:分析数据的方法:统计推断统计推断(statistical inference)二假设检验问题二假设检验问题 e.g.1 药效问题药效问题 对某一疾病研制了一种用于预防的新药
3、,现检验对某一疾病研制了一种用于预防的新药,现检验疗效设某地区猪患这种病的概率是疗效设某地区猪患这种病的概率是 0.25(这种病非(这种病非传染病,患病与其他猪无关)现选传染病,患病与其他猪无关)现选 12 头猪作实验,头猪作实验,结果发现,这些猪服药后均未患病,试讨论此药的疗结果发现,这些猪服药后均未患病,试讨论此药的疗效效 命题:命题:新药无效新药无效?Remark 这里说这里说“新药有效新药有效”,犯错误的概率是,犯错误的概率是3.2%确切地说,有确切地说,有97.8%的概率可认为新药有效的概率可认为新药有效 e.g.2 产品检验问题产品检验问题 给某产品包装,每给某产品包装,每 180
4、 个产品打成一包,要求合个产品打成一包,要求合格品为每包产品中次品数不超过格品为每包产品中次品数不超过 8 个现质检员任取个现质检员任取一包,从中抽取一包,从中抽取 4 个进行检测,发现其中有个进行检测,发现其中有 2 个次品,个次品,问该产品是否合格?问该产品是否合格?命题:命题:这包产品合格这包产品合格 上述两例有一个共同点:上述两例有一个共同点:利用观测结果(所取样本)利用观测结果(所取样本)对实际问题中的有关命题对实际问题中的有关命题“作正确与否作正确与否”的判断的判断 我们把这种需要作出判断的命题称为我们把这种需要作出判断的命题称为“统计假设统计假设”(statistical hyp
5、othesis),简称,简称“假设假设”判断它正判断它正确与否的方法称为确与否的方法称为“检验检验”(test),这类问题称为这类问题称为“假设检验假设检验”(hypothesis testing).Remark 这里肯定或否定命题都不能保证不犯错误,这里肯定或否定命题都不能保证不犯错误,只是我们以很高的概率来肯定或否定它只是我们以很高的概率来肯定或否定它e.g.3 骰子的均匀性骰子的均匀性 骰子每面向上的概率均为骰子每面向上的概率均为 1/6 时,认为是均匀的时,认为是均匀的检验时,比如检验时,比如“1 点向上点向上”的概率是否的概率是否 1/6?问题问题:一骰子掷了一骰子掷了 次,其中次,
6、其中 1 点出现了点出现了 次,问:命题次,问:命题“1 点出现的概率等于点出现的概率等于1/6”这一假设是否成立?这一假设是否成立?分析分析:1 点出现的频率点出现的频率 假设成立?假设成立?频率与概率的偏差频率与概率的偏差(不足十万分之四不足十万分之四)三估计问题三估计问题 1.概率分布的估计概率分布的估计 为估计某事件为估计某事件 发生的概率发生的概率 ,作,作 次实验或观测次实验或观测看看 发生了几次发生了几次 发生的频率发生的频率 可用来作为事件可用来作为事件 的概率的概率 的估计值。的估计值。越大,估计越好越大,估计越好 e.g.商店欲估计周日上午商店欲估计周日上午 8:0012:
7、00 间每分钟到达间每分钟到达的顾客人数的顾客人数 的分布,即估计的分布,即估计 观测了观测了 20 个周日,共个周日,共 分钟,记录下了每分钟,记录下了每分钟到达的顾客数(分钟到达的顾客数(4800个数据)个数据)设到达设到达 个顾客的分钟数为个顾客的分钟数为 ,记记分布律为分布律为 012即用到达即用到达 个顾客的频率个顾客的频率 来估计概率来估计概率 商店经理可根据这一估计来合理安排售货员商店经理可根据这一估计来合理安排售货员 2.其它参数的估计其它参数的估计 任何模型(包括确定性模型)总有待定参数,要通过任何模型(包括确定性模型)总有待定参数,要通过对实际问题的观测或试验来确定。由于观
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数理统计

限制150内