统计决策与贝叶斯估计.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《统计决策与贝叶斯估计.pptx》由会员分享,可在线阅读,更多相关《统计决策与贝叶斯估计.pptx(81页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、参数估计参数估计4/1/20234/1/2023第第1 1页页1 1、统计决策统计决策统计决策统计决策o一、统计决策的三个要素一、统计决策的三个要素 1 样本空间和分布族样本空间和分布族设总体设总体X的分布函数为的分布函数为 F(x;),是未知参数,若是未知参数,若是未知参数,若是未知参数,若设设X1,Xn是来自总体是来自总体X X的一个样本,则样本所有可能值组成的集合的一个样本,则样本所有可能值组成的集合称为样本空间,记为称为样本空间,记为XX参数估计参数估计4/1/20234/1/2023第第2 2页页 2 决策空间(判决空间)决策空间(判决空间)对于任何参数估计,每一个具体的估计值,就是
2、一对于任何参数估计,每一个具体的估计值,就是一个回答,称为一个决策,一个统计问题中可能选取的全个回答,称为一个决策,一个统计问题中可能选取的全部决策组成的集合称为决策空间,一个决策空间至少应部决策组成的集合称为决策空间,一个决策空间至少应有两个决策。有两个决策。3 损失函数损失函数 统计决策的一个基本假定是,每采取一个决策,必统计决策的一个基本假定是,每采取一个决策,必然有一定的后果,统计决策是将不同决策以数量的形式然有一定的后果,统计决策是将不同决策以数量的形式表示出来表示出来参数估计参数估计4/1/20234/1/2023第第3 3页页o常见的损失函数有以下几种常见的损失函数有以下几种 (
3、1)线性损失函数)线性损失函数 绝对损失函数绝对损失函数 (2)平方损失函数)平方损失函数 (3)凸损失函数)凸损失函数 (4)多元二次损失函数)多元二次损失函数参数估计参数估计4/1/20234/1/2023第第4 4页页o二、统计决策函数及风险函数二、统计决策函数及风险函数 1 统计决策函数统计决策函数 定义定义3.1:定义在样本空间上:定义在样本空间上XX,取值于决策空,取值于决策空间间A A 内的函数内的函数d(x),称为统计决策函数,简称,称为统计决策函数,简称决策函数决策函数 决策函数就是一个行动方案,如果用表达决策函数就是一个行动方案,如果用表达式处理,式处理,d(x)=d(x1
4、,x2,xn)本质上就是一个统本质上就是一个统计量计量参数估计参数估计4/1/20234/1/2023第第5 5页页 2 风险函数风险函数 决策函数决策函数 d(X),完全取决于样本,损失函数,完全取决于样本,损失函数 L(,d)也是样本也是样本X 的函数的函数,当样本取不同的值当样本取不同的值x时时,决策决策 d(X)可能可能不同,所以损失函数值不同,所以损失函数值 L(,d)也不同,不能判断决策的好也不同,不能判断决策的好坏,一般从总体上来评价、比较决策函数,取平均损失,坏,一般从总体上来评价、比较决策函数,取平均损失,就是风险函数就是风险函数 定义定义3.2 设样本空间,分布族分别为设样
5、本空间,分布族分别为XX,F*,决策空间为,决策空间为AA,损失函数为,损失函数为 L(,d),d(X)为决策函数为决策函数,为决策函数为决策函数d(X)的风险函数,的风险函数,R(,d),表示采取决策表示采取决策d(X)所所蒙受的平均损失(蒙受的平均损失(L(,d)的数学期望)的数学期望)参数估计参数估计4/1/20234/1/2023第第6 6页页优良性准则优良性准则优良性准则优良性准则 定义定义3.3 设设d1,d2 是统计问题中的两个决策函数,是统计问题中的两个决策函数,若其风险函数满足不等式若其风险函数满足不等式 则称决策函数则称决策函数d1 优于优于d2参数估计参数估计4/1/20
6、234/1/2023第第7 7页页 定义定义3.4 设设D=d(X)是一切定义在样本空间是一切定义在样本空间X X 上,上,取值于决策空间取值于决策空间A A 上上的决策函数全体,的决策函数全体,若存在一个决策函数若存在一个决策函数d*(X),使对任意一个,使对任意一个d(X)都有都有 则称则称d*(X)为一致最小风险决策函数,或一致为一致最小风险决策函数,或一致最优决策函数最优决策函数参数估计参数估计4/1/20234/1/2023第第8 8页页参数估计参数估计4/1/20234/1/2023第第9 9页页参数估计参数估计4/1/20234/1/2023第第1010页页问题总结问题总结o1
7、风险函数是二元函数,极值往往不存在或不唯一风险函数是二元函数,极值往往不存在或不唯一o2 在某个区间内的逐点比较不现实(麻烦)在某个区间内的逐点比较不现实(麻烦)o3 对应不同参数的,同一决策函数,风险值不相等对应不同参数的,同一决策函数,风险值不相等o4 由统计规律的特性决定不能点点比较由统计规律的特性决定不能点点比较o5 必须由一个整体指标来代替点点比较必须由一个整体指标来代替点点比较参数估计参数估计4/1/20234/1/2023第第1111页页2.2.贝叶斯估计贝叶斯估计 1)1)统计推断的基础统计推断的基础 经典学派经典学派的观点:的观点:统计推断是根据样本信息对统计推断是根据样本信
8、息对总体分布或总体的特征数进行推断,这里用到总体分布或总体的特征数进行推断,这里用到两种信息:两种信息:总体信息总体信息和和样本信息样本信息;贝叶斯学派贝叶斯学派的观点:除了上述两种信息以外,的观点:除了上述两种信息以外,统计推断还应该使用第三种信息:统计推断还应该使用第三种信息:先验信息。先验信息。参数估计参数估计4/1/20234/1/2023第第1212页页(1)总体信息总体信息:总体分布提供的信息。总体分布提供的信息。(2)样本信息样本信息:抽取样本所得观测值提供的信息。抽取样本所得观测值提供的信息。(3)先验信息先验信息:人们在试验之前对要做的问题在经人们在试验之前对要做的问题在经
9、验上和资料上总是有所了解的,这些信息对验上和资料上总是有所了解的,这些信息对 统计推断是有益的。先验信息即是抽样(试统计推断是有益的。先验信息即是抽样(试 验)之前有关统计问题的一些信息。一般说验)之前有关统计问题的一些信息。一般说 来,先验信息来源于经验和历史资料。先验来,先验信息来源于经验和历史资料。先验 信息在日常生活和工作中是很重要的。信息在日常生活和工作中是很重要的。参数估计参数估计4/1/20234/1/2023第第1313页页 基于上述三种信息进行统计推断的统计学称为基于上述三种信息进行统计推断的统计学称为贝叶斯统计学。贝叶斯统计学。它与经典统计学的差别就在于它与经典统计学的差别
10、就在于是否利用先验信息。贝叶斯统计在重视使用总是否利用先验信息。贝叶斯统计在重视使用总体信息和样本信息的同时,还注意先验信息的体信息和样本信息的同时,还注意先验信息的收集、挖掘和加工,使它数量化,形成先验分收集、挖掘和加工,使它数量化,形成先验分布,参加到统计推断中来,以提高统计推断的布,参加到统计推断中来,以提高统计推断的质量。忽视先验信息的利用,有时是一种浪费,质量。忽视先验信息的利用,有时是一种浪费,有时还会导出不合理的结论。有时还会导出不合理的结论。参数估计参数估计4/1/20234/1/2023第第1414页页 贝叶斯学派的基本观点:贝叶斯学派的基本观点:任一未知量任一未知量 都可看
11、都可看作随机变量,作随机变量,可用一个概率分布去描述,这个可用一个概率分布去描述,这个分布称为先验分布;分布称为先验分布;在获得样本之后,总体分在获得样本之后,总体分布、样本与先验分布通过贝叶斯公式结合起来布、样本与先验分布通过贝叶斯公式结合起来得到一个关于未知量得到一个关于未知量 新的分布新的分布后验分布后验分布;任何关于任何关于 的统计推断都应该基于的统计推断都应该基于 的后验分布的后验分布进行。进行。参数估计参数估计4/1/20234/1/2023第第1515页页o2)先验分布先验分布利用先验信息的前提利用先验信息的前提 (1)参数是随机的,但有一定的分布规律)参数是随机的,但有一定的分
12、布规律 (2)参数是某一常数,但无法知道)参数是某一常数,但无法知道目标:充分利用参数的先验信息对未知参数作出更目标:充分利用参数的先验信息对未知参数作出更准确的估计。准确的估计。贝叶斯方法就是把未知参数视为具有已知分布的随贝叶斯方法就是把未知参数视为具有已知分布的随机变量,将先验信息数字化并利用的一种方法,机变量,将先验信息数字化并利用的一种方法,一般先验分布记为一般先验分布记为()参数估计参数估计4/1/20234/1/2023第第1616页页3)3)3)3)贝叶斯公式的密度函数形式贝叶斯公式的密度函数形式贝叶斯公式的密度函数形式贝叶斯公式的密度函数形式(后验分布)后验分布)后验分布)后验
13、分布)设总体设总体X X 的分布密度函数的分布密度函数P(x;)在贝叶斯统计中在贝叶斯统计中记为记为P(x|),它表示在随机变量,它表示在随机变量取某个给定值取某个给定值时总体的时总体的条件概率密度函数;条件概率密度函数;P(x;)=P(x|)根据参数根据参数 的先验信息确定的先验信息确定先验分布先验分布();样本样本 x1,x2,xn 的的联合条件分布密度函数联合条件分布密度函数为为 这个分布综合了总体信息和样本信息这个分布综合了总体信息和样本信息;参数估计参数估计4/1/20234/1/2023第第1717页页 0 是未知的,它是按先验分布是未知的,它是按先验分布()产生的。产生的。为把先
14、验信息综合进去,不能只考虑为把先验信息综合进去,不能只考虑 0,对,对 的其它值发生的可能性也要加以考虑,故要的其它值发生的可能性也要加以考虑,故要用用()进行综合。这样一来,样本进行综合。这样一来,样本x1,xn和参数和参数 的的联合分布为联合分布为:f(x1,x2 ,xn,)=q(x1,x2 ,xn )(),简记为简记为 f(x,)=q(x )()这个联合分布把总体信息、样本信息和先验这个联合分布把总体信息、样本信息和先验信息三种可用信息都综合进去了;信息三种可用信息都综合进去了;参数估计参数估计4/1/20234/1/2023第第1818页页在有了样本观察值在有了样本观察值 x1,x2,
15、xn 之后,则应依之后,则应依据据 f(x,)对对 作出推断。由于作出推断。由于 f(x,)=h(x1,x2,xn)m(x1,x2,xn),其中其中m(x1,x2,xn)是是x1,x2,xn 的边际概的边际概率函数,它与率函数,它与 无关。因此能用来对无关。因此能用来对 作出推断作出推断的仅是条件分布的仅是条件分布h(x1,x2,xn),它的计算,它的计算公式是公式是 参数估计参数估计4/1/20234/1/2023第第1919页页 这个条件分布称为这个条件分布称为 的的后验分布,后验分布,它集中了它集中了总体、样本和先验中有关总体、样本和先验中有关 的一切信息。的一切信息。后验分布后验分布h
16、(x1,x2,xn)的计算公式就的计算公式就是用密度函数表示的贝叶斯公式。它是用总体和是用密度函数表示的贝叶斯公式。它是用总体和样本对先验分布样本对先验分布()作调整的结果,贝叶斯统作调整的结果,贝叶斯统计的一切推断都基于后验分布进行。计的一切推断都基于后验分布进行。参数估计参数估计4/1/20234/1/2023第第2020页页4 4)共轭先验分布)共轭先验分布)共轭先验分布)共轭先验分布o定义:设总体定义:设总体X 的分布密度为的分布密度为 p(x|),F*为为 的一个分布族,的一个分布族,()为为 的任意的任意一个先验分布,一个先验分布,()F*,若对样本的任若对样本的任意观测值意观测值
17、x,的后验分布的后验分布h(|x|x)仍在仍在F*内,内,称称F*为关于分布密度为关于分布密度 p(x|)的共轭先验分的共轭先验分布族,简称共轭族。布族,简称共轭族。o计算共轭先验分布的方法计算共轭先验分布的方法 参数估计参数估计4/1/20234/1/2023第第2121页页当给定样本的分布(似然函数)当给定样本的分布(似然函数)q(x|)和和先验分布先验分布();由贝叶斯公式得由贝叶斯公式得 h(x|)=()q(x)/m(x)由于由于m(x)不依赖于不依赖于,改写为改写为 h(x|)()q(x)上式不是正常的密度函数上式不是正常的密度函数,是是h(x|)的主要的主要部分部分,称为称为h(x
18、|)的核的核参数估计参数估计4/1/20234/1/2023第第2222页页o例例8 8 X1,X2,Xn来自正态分布来自正态分布N(,2)的一个样的一个样本,其中本,其中 已知,求方差已知,求方差 2的共轭先验分布的共轭先验分布参数估计参数估计4/1/20234/1/2023第第2323页页o例例9 9 X1,X2,Xn来自二项分布来自二项分布B(N,)的一个的一个样本,求样本,求 的共轭先验分布的共轭先验分布参数估计参数估计4/1/20234/1/2023第第2424页页o计算共轭先验分布的方法计算共轭先验分布的方法 1.h(|x|x)=)=()q(x|)/m(x),m(x)不依赖于不依赖
19、于 先求出先求出先求出先求出q q(x x|),),再选取与再选取与再选取与再选取与q q(x x|)具有相同具有相同具有相同具有相同形式的分布作为先验分布,就是共轭分布形式的分布作为先验分布,就是共轭分布形式的分布作为先验分布,就是共轭分布形式的分布作为先验分布,就是共轭分布 2.当参数当参数 存在适当的统计量时,设存在适当的统计量时,设存在适当的统计量时,设存在适当的统计量时,设X X 的分的分的分的分布密度为布密度为布密度为布密度为 p p(x x|),),T T(X X)是是是是 的充分统计量的充分统计量的充分统计量的充分统计量,再由定理再由定理3.13.1,求得共轭先验分布族,求得共
20、轭先验分布族参数估计参数估计4/1/20234/1/2023第第2525页页o定理定理3.1设设f()为任一固定的函数为任一固定的函数,满足满足 参数估计参数估计4/1/20234/1/2023第第2626页页 若后验分布若后验分布h(x)与与()属于同一个分布族,则属于同一个分布族,则称该分布族是称该分布族是 的的共轭先验分布共轭先验分布(族族)。o二项分布二项分布b(n,)中的成功概率中的成功概率 的共轭先验分布的共轭先验分布是贝塔分布是贝塔分布Be(a,b);泊松分布泊松分布P()中的均值中的均值 的共轭先验分布是伽的共轭先验分布是伽玛玛 分布分布(,);o指数分布中均值的倒数的共轭先验
21、分布是伽玛分指数分布中均值的倒数的共轭先验分布是伽玛分布布(,);o在方差已知时,正态均值在方差已知时,正态均值 的共轭先验分布是正的共轭先验分布是正态分布态分布N(,2);o在均值已知时,正态方差在均值已知时,正态方差 2的共轭先验分布是倒的共轭先验分布是倒伽玛分布伽玛分布I(,)。参数估计参数估计4/1/20234/1/2023第第2727页页5 5)贝叶斯风险)贝叶斯风险)贝叶斯风险)贝叶斯风险o定义:定义:称为决策函数称为决策函数d(X)在给定先验分布在给定先验分布()下下的贝的贝叶斯风险,简称叶斯风险,简称d(X)的贝叶斯风险的贝叶斯风险参数估计参数估计4/1/20234/1/202
22、3第第2828页页相当于随机损失函数求两次期望,一次相当于随机损失函数求两次期望,一次对对 后验分布,一次对后验分布,一次对X X 的边缘分布的边缘分布参数估计参数估计4/1/20234/1/2023第第2929页页6)6)贝叶斯点估计贝叶斯点估计贝叶斯点估计贝叶斯点估计定义:定义:设总体设总体X 的分布函数的分布函数F(x,)中参数中参数 为随机变量,为随机变量,()为为 的先验分布,若的先验分布,若在决策函数类在决策函数类D中存在一个决策函数中存在一个决策函数d*(X),使得对决策函数类,使得对决策函数类D中的任一决中的任一决策函数策函数d(X),均有,均有 则称为则称为d*(X)参数参数
23、 的贝叶斯估计量的贝叶斯估计量参数估计参数估计4/1/20234/1/2023第第3030页页定理定理3.2 设设 的先验分布为的先验分布为(),损失函数为,损失函数为 L(,d,d)=(=(-d-d)2 2,则则 的贝叶斯估计是的贝叶斯估计是 其中其中h(|x)|x)为参数为参数 的后验密度的后验密度。参数估计参数估计4/1/20234/1/2023第第3131页页参数估计参数估计4/1/20234/1/2023第第3232页页定理定理3.33.73.33.7,给出了各种损失函数下,给出了各种损失函数下的贝叶斯估计,不证的贝叶斯估计,不证参数估计参数估计4/1/20234/1/2023第第3
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 决策 贝叶斯 估计
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内