随机抽样.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《随机抽样.pptx》由会员分享,可在线阅读,更多相关《随机抽样.pptx(109页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1.随机抽样及其特点随机抽样及其特点2.直接抽样方法直接抽样方法3.挑选抽样方法挑选抽样方法4.复合抽样方法复合抽样方法5.复合复合挑选挑选抽样方法抽样方法6.替换抽样方法替换抽样方法7.随机抽样的一般方法随机抽样的一般方法8.随机抽样的其它方法随机抽样的其它方法作作 业业 本章叙述由己知分布抽样的各主要方法,并给出在粒子输运问题中经常用到的具体实例。 由巳知分布的随机抽样指的是由己知分布的总体中抽取简单子样。随机数序列随机数序列是由单位均匀分布的总体中抽取的简单子样,属于一种特殊的由已知分布的随机抽样问题。本章所叙述的由任意已知分布中抽取简单子样,是在假设随机数为已知量的前提下,使用严格的数
2、学方法产生的。 为方便起见,用XF表示由己知分布F(x)中产生的简单子样的个体。对于连续型分布,常用分布密度函数f(x)表示总体的己知分布,用Xf表示由己知分布密度函数f(x)产生的简单子样的个体。另外,在抽样过程中用到的伪随机数均称随机数。 对于任意给定的分布函数F(x),直接抽样方法如下: 其中,1,2,N为随机数序列。为方便起见,将上式简化为: 若不加特殊说明,今后将总用这种类似的简化形式表示,总表示随机数。NntXntFn, 2 , 1,inf)(tXtFF)(inf 下面证明用前面介绍的方法所确定的随机变量序列X1,X2,XN具有相同分布F(x)。 对于任意的n成立,因此随机变量序列
3、X1,X2,XN具有相同分布F(x)。另外,由于随机数序列1,2,N是相互独立的,而直接抽样公式所确定的函数是波雷尔(Borel)可测的,因此,由它所确定的X1,X2,XN也是相互独立的(P.R.Halmos, Measure theory, N.Y.Von Nosrtand,195045定理2)。)()()inf()()()(xFxFPxtPxXPxFntFnXnn 对于任意离散型分布: 其中x1,x2,为离散型分布函数的跳跃点,P1,P2,为相应的概率,根据前述直接抽样法,有离散型分布的直接抽样方法如下: 该结果表明,为了实现由任意离散型分布的随机抽样,直接抽样方法是非常理想的。 xxii
4、PxF)(I1ii1I1iiPP,当IFxX 二项分布为离散型分布,其概率函数为: 其中,P为概率。对该分布的直接抽样方法如下: nNnnNnPPCPnxP)1 ()(n0ii1n0iiPP,当nXF 泊松(Possion)分布为离散型分布,其概率函数为: 其中,0 。对该分布的直接抽样方法如下: !)(nePnxPnnn0ii1n0iii!i!,当enXF 掷骰子点数X=n的概率为: 选取随机数,如 则 在等概率的情况下,可使用如下更简单的方法: 其中表示取整数。61)( nXP661nnnXF16FX 中子或光子在介质中发生碰撞时,如介质是由多种元素组成,需要确定碰撞核的种类。假定介质中每
5、种核的宏观总截面分别为1,2,n,则中子或光子与每种核碰撞的概率分别为: 其中t12n。碰撞核种类的确定方法为:产生一个随机数,如果 则中子或光子与第I种核发生碰撞。 niPtii, 2 , 1I1ii1I1iiPP 假设中子与核的反应类型有如下几种:弹性散射,非弹性散射,裂变,吸收,相应的反应截面分别为el,in,f,a。则发生每一种反应类型的概率依次为 : 其中反应总截面telinfa。 taatfftinintelelPPPP 反应类型的确定方法为:产生一个随机数 收吸裂变非弹性散射弹性散射finelinelelPPPPPP 对于连续型分布,如果分布函数F(x) 的反函数 F1(x)存在
6、,则直接抽样方法是 :)(1 FXF 在a,b上均匀分布的分布函数为: 则 bxbxaabaxaxxF当当当10)()(abaXF 分布为连续型分布,作为它的一个特例是: 其分布函数为: 则 FX10,2)()(20 xxtdtdttfxFxx10,2)(xxxf 指数分布为连续型分布,其一般形式如下: 其分布函数为: 则 因为1也是随机数,可将上式简化为 0,1)()(0 xedteadttfxFaxxatx0,)(xeaxfax)1ln(1aXFln1aXF 连续性分布函数的直接抽样方法对于分布函数的反函数存在且容易实现的情况,使用起来是很方便的。但是对于以下几种情况,直接抽样法是不合适的
7、。1) 分布函数无法用解析形式给出,因而其反函数也无法给出。2) 分布函数可以给出其解析形式,但是反函数给不出来。3) 分布函数即使能够给出反函数,但运算量很大。 下面叙述的挑选抽样方法是克服这些困难的比较好的方法。 为了实现从己知分布密度函数f(x)抽样,选取与f(x)取值范围相同的分布密度函数h(x),如果 则挑选抽样方法为:)()(supxhxfMxhfhhXXXhMXf)()( 即从h(x)中抽样xh,以 的概率接受它。 下面证明xf 服从分布密度函数f(x)。证明:对于任意x )()(hhxhMxf)()()()(,)()()(hhhhhhhhfXhMXfPXhMXfdxxXxPXh
8、MXfdxxXxPdxxXxPdxxfdXXfdXXfdXXhXhMXfdXXhXhMXfddXXhddXXhhhdxxxhhhhhhdxxxhhhhXhMXfhhdxxxXhMXfhhhhhh)()()()()()()()()()()()()(0)()(0 使用挑选抽样方法时,要注意以下两点:选取h(x)时要使得h(x)容易抽样且M的值要尽量小。因为M小能提高抽样效率。抽样效率是指在挑选抽样方法中进行挑选时被选中的概率。按此定义,该方法的抽样效率E为: 所以,M越小,抽样效率越高。MdXXhXhMXfXhMXfPEhhhhhh1)()()()()( 当 f(x) 在0,1上定义时,取 h(x
9、)=1,Xh=, 此时挑选抽样方法为)(sup10 xfMxfXMf)( 令圆半径为R0,点到圆心的距离为r,则r的分布密度函数为 分布函数为 容易知道,该分布的直接抽样方法是其它当002)(020RrRrrf202)(RrrF0Rrf 由于开方运算在计算机上很费时间,该方法不是好方法。下面使用挑选抽样方法:取 则抽样框图为 00022)()(1)(RrMRrrhrfRrhh,2021Rrf 显然,没有必要舍弃12的情况,此时,只需取 就可以了,亦即 另一方面,也可证明 与 具有相同的分布 。 10 Rrf),max(210 Rrf),max(212)(rrF 在实际问题中,经常有这样的随机变
10、量,它服从的分布与一个参数有关,而该参数也是一个服从确定分布的随机变量,称这样的随机变量服从复合分布。例如,分布密度函数 是一个复合分布。其中Pn0,n=1,2,且 fn(x)为与参数n有关的分布密度函数,n=1,2, 参数n服从如下分布1)()(nnnxfPxf11nnPynnPyF)( 复合分布的一般形式为: 其中f2(x/y)表示与参数y有关的条件分布密度函数, F1(y)表示分布函数。 复合分布的抽样方法为:首先由分布函数F1(y) 或分布密度函数f1(y)中抽样YF1或Yf1,然后再由分布密度函数f2(x/ YF1)中抽样确定Xf2 (x/YF) 证明: 所以,Xf所服从的分布为f
11、(x)。)()()(12ydFyxfxf)/(12FYxffXXdxxfYdxdFYxfdxxXxpdxxXxpFYxff)()()()()(12)/(12 指数函数分布的一般形式为: 引入如下两个分布密度函数:其它当00)(1xdyyenxEnxyn其它当其它当00)(01)(211xeyyxfyynyfxyn 则 使用复合抽样方法,首先从f1(y)中抽取y 再由f2(x/ YF1)中抽取x 112)()()(dyyfyxfxEn),max(11211nnfY1211ln),max(ln1nnfnfYX 考虑另一种形式的复合分布如下: 其中0H(x,y)M,f2(x/y)表示与参数y有关的条
12、件分布密度函数,F1(y)表示分布函数。抽样方法如下:)()(),()(12ydFyxfyxHxf)/()/(12112),(FFYxffFYxfXXMYXH 证明: 抽样效率为:E=1/MdxxfdxydFyxfyxHydxdFyxfMyxHydxdFyxfMyxHdydxdFyxfdydxdFyxfMYXHPMYXHdxxXxPMYXHdxxXxPdxxXxPdxxxMyxHdxxxMyxHFfFffFfff)()()(),()()(),()()(),()()()()(),(),(,),()(121212),(012),(01212122122 为了实现某个复杂的随机变量 y 的抽样,将其
13、表示成若干个简单的随机变量 x1,x2,xn 的函数得到 x1,x2,xn 的抽样后,即可确定 y 的抽样,这种方法叫作替换法抽样。即),(21nxxxgy),(21nfXXXgY 散射方位角在0,2上均匀分布,则其正弦和余弦sin和cos服从如下分布:直接抽样方法为:其它当011111)(2xxxf2coscos2sinsin令=2,则在0,上均匀分布,作变换其中01,0,则(x,y) 表示上半个单位圆内的点。如果 (x,y) 在上半个单位圆内均匀分布,则在0,上均匀分布,由于sincosyx2222sincosyxyyxx222222222cossin22sinsinsincos2cosc
14、osyxxyyxyx 因此抽样sin和cos的问题就变成在上半个单位圆内均匀抽样 (x,y) 的问题。 为获得上半个单位圆内的均匀点,采用挑选法,在上半个单位圆的外切矩形内均匀投点(如图)。舍弃圆外的点,余下的就是所要求的点。抽样方法为:抽样效率E=/40.78521yx2221212221222122212sin,cos1 为实现散射方位角余弦分布抽样,最重要的是在上半个单位圆内产生均匀分布点。下面这种方法,首先在单位圆的半个外切正六边形内产生均匀分布点,如图所示。 于是便有了抽样效率更高的抽样方法:抽样效率222121222122212221221121332sin,33cos131,12
15、3906. 032E 标准正态分布密度函数为:引入一个与标准正态随机变量X独立同分布的随机变量Y,则(X,Y)的联合分布密度为:作变换2221)(xexf2)(2221),(yxeyxfsincosyx则(,)的联合分布密度函数为:由此可知,与相互独立,其分布密度函数分别为分别抽取, :222),(ef21)()(2212ffe212ln2从而得到一对服从标准正态分布的随机变量X和Y: 对于一般的正态分布密度函数 N(,2) 的抽样,其抽样结果为:ffffYYXX)2sin(ln2)2cos(ln22121ffYX 分布密度函数的一般形式为:其中n,k为整数。为了实现分布的抽样,将其看作一组简
16、单的相互独立随机变量的函数,通过这些简单随机变量的抽样,实现分布的抽样。设 x1,x2,xn 为一组相互独立、具有相同分布 F(x) 的随机变量,k为 x1,x2,xn 按大小顺序排列后的第k个,记为:10)1 ()!()!1(!)(1xxxknknxfknk),(21nkkxxxR则k的分布函数为:当 F(x)=x 时,不难验证,k的分布密度函数为分布。因此, 分布的抽样可用如下方法实现:选取n个随机数,按大小顺序排列后取第k个,即 ininkiinxFxFCxFk)(1)()(ininkiinxxCxFk)1 ()(),(21nkfRX1) 加抽样方法 2) 减抽样方法3) 乘抽样方法4)
17、 乘加抽样方法5) 乘减抽样方法6) 对称抽样方法7) 积分抽样方法 加抽样方法是对如下加分布给出的一种抽样方法: 其中Pn0, ,且 fn(x)为与参数n有关的分布密度函数,n=1,2,。 由复合分布抽样方法可知,加分布的抽样方法为:首先抽样确定n,然后由 fn(x)中抽样x,即:1)()(nnnxfPxf11nnPn1nn1n1nnPP,当nffXX 多项式分布密度函数的一般形式为: 将 f(x) 改写成如下形式: 则该分布的抽样方法为:0)(iiixaxf00)() 1(1)(iiiiiixfPxiiaxfn0ii1n0ii11PP),max(当nfX 设球壳内半径为R0,外半径为R1,
18、点到球心的距离为r,则r的分布密度函数为 分布函数为该分布的直接抽样方法是其它当03)(1030312RrRRRrrf3031303)(RRRrrF31303031)(RRRrf为避免开立方根运算,作变换:则 x0,1,其分布密度函数为:其中001)(RxRRr132)(33)()(200102201RxRRRxRRxf211020RRRR则x及r的抽样方法为:001432322101201)(),max(),max(33RXRRrXXXRRRfffff 减抽样方法是对如下形式的分布密度所给出的一种抽样方法: 其中A1、A2为非负实数,f1(x) 、f2(x)均为分布密度函数。 减抽样方法分为
19、以下两种形式:)()()(2211xfAxfAxf 以上两种形式的抽样方法,究竟选择哪种好,要看f1(x) 、f2(x)哪一个容易抽样,如相差不多,选用第一种方法抽样效率高。 (1)将f (x)表示为 令m表示f2(x)f1(x)的下界,使用挑选法,从f1(x)中抽取Xf1 抽样效率为:)()()()(12211xfxfAAxfxf111)()(12212211ffffXXXfXfmAAAmAAA211mAAE (2)将f (x)表示为 使用挑选法,从f2(x)中抽取Xf2 抽样效率为:22112)()()()(AxfxfAxfxfmEmAAmE2122221221211)()(ffffXXm
20、AAmAXfXfmAAmA分布的一个特例: 取A12,A21,f1(x)1,f2(x)2x,此时m0,则根据第一种形式的减抽样方法,有或 10),1 (2)(xxxf2211fX2121fX由于11可用1代替,该抽样方法可简化为:对于21的情况,可取 Xf1 ,因此与分布的推论相同。212fX),min(21fX 如下形式的分布称为乘分布: 其中H(x)为非负函数, f1(x)为任意分布密度函数。 令M为H(x)的上界,乘抽样方法如下: 抽样效率为:)()()(1xfxHxfME111)(fffXXMXH倒数分布密度函数为: 其直接抽样方法为:下面采用乘抽样方法,考虑如下分布族:其中 i =
21、1,2,该分布的直接抽样方法为:axxaxf1,1ln1)(afeaXlniifaXi 1) 1(1axxxaixfiii1,) 1(1)(11利用这一分布族,将倒数分布 f(x) 表示成:其中,乘法分布的抽样方法如下:该分布的抽样效率为:)()()(xfxHxfi,1)(,ln) 1(,ln) 1()(1111iiiixMxHaaiMxaaixHiifiaXa 1) 1(1 1) 1(21211) 1(ln1iaiaE麦克斯韦分布密度函数的一般形式为: 使用乘抽样方法,令该分布的直接抽样方法为:0,2)(23xexxfx2ln231fX0,32)(321xexfx此时则麦克斯韦分布的抽样方法
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 随机 抽样
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内