《推荐-CFA考试:投资分析的数量方法(投资工具).docx》由会员分享,可在线阅读,更多相关《推荐-CFA考试:投资分析的数量方法(投资工具).docx(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章:正态概率分布Chapter Common Probability Distributions本章简介IntroductionP226本章的内容,是四种概率分布及它们的应用,即: the uniform; the binomial; the normal; the lognormal。本章的其他数量工具: Hypothesis testing; regression analysis;time-series analysis。不连续的随机变量Discrete Random VariablesP227 定义和解释概率分布Probability Distributions概率分布Probab
2、ility Distributions,即将随机变量可能结果的概率予以特定。每个随机变量都有描述它的概率分布,概率分布的方式有两种: 概率函数probability functions。 累积分布函数cumulative distribution functionsdistribution functionscdf 区别:连续的随机变量和不连续discrete的随机变量随机变量,是一个未来结果不确定的数。随即变量有两种类型:不连续的随机变量discrete random variable、连续的随机变量continuous random variable。变量的结果能予以历数个数有限的随机变量
3、,为不连续的随机变量。 描述某特定变量可能结果的集合 定义一个概率函数Probability function并说明它的关键特征概率函数的表示方法是:PX x,它表示随机变量的值为x的概率。不连续随机变量的概率函数,可以缩写为px;连续随机变量的概率函数用fx表示,称之为概率密度函数Probability density functionsdensitypdf。概率函数有两个关键特征: 0px1; 随机变量X所有值的概率的总和等于1。 定义概率密度函数Probability density function 定义累积分布函数cumulative distribution function并根据
4、累积分布函数计算随机变量的概率累积分布函数cumulative distribution functionsdistribution functionscdf,表示随机变量的结果位于某一范围的概率。cdf函数的功能相当于累积相对频率。连续的或不连续的随机变量的结果的累积概率分布,可以记作FX PXx,或FX Px1Xx 2,或FXPXx。累积概率函数cdf函数的特征: 0Fx1; 随着x的增加,cdf函数或增加或保持不变。不连续的单项分布The Discrete Uniform DistributionP228 给定不连续的单项分布a discrete uniform distribution
5、,定义不连续的单一随机变量并计算概率单项分布Uniform Distribution,即随机变量所有可能结果的概率都相等。单项分布的应用: 它是为其它概率分布产生随机数以作为随机观察对象random observation的根底; 它可以用来描述结果概率相等的随机变量。贝诺里分布The binomial DistributionP230 给定贝诺里概率分布binomial Probability Distributions,定义贝氏随机变量Bernoulli Random variable并计算概率 贝诺里Binomial分布的功能贝诺里Binomial分布的功能:描述有两项可能结果的随机变量
6、的每一项结果的概率分布。其模型是:两项选择的价格模型the binomial Option Pricing Model,BOPM,即价格的上升或价格的下降。 贝氏随机变量Bernoulli Random variable贝诺里分布的建构元素是贝氏随机变量Bernoulli Random variable。假定某个能重复进行的试验有两个可能的结果,每次试验产生的结果必为其一,这样的试验称为贝诺里试验Bernoulli trial。在结果为成功时,那么Y1;在结果为失败时,那么Y0,那么贝氏随机变量Y的概率函数为:p1 pY1 pp0 pY0 1 p 贝诺里随机变量binomial Random
7、variable对n个贝诺里试验,有0n个“成功。如果单个贝诺里试验的结果是随机的,那么n个贝诺里试验的结果为“成功的总数也是随机的。定义贝诺里随机变量X为n个贝诺里试验中结果为成功的总数。用“Yi表示第i个贝诺里试验的结果为“1或“0i 1,2,n,那么:X Y 1Y 2 Y n 。贝诺里随机变量由参数p和n定义。p即每次试验结果为“成功的概率;n贝诺里试验的次数。对贝诺里分布,可作有如下假设: 对所有贝诺里试验,结果为“成功的概率是一个常数; 贝诺里试验相互独立。因此,贝诺里随机变量X可以完全用两个参数描述,即X Bn,p。贝氏随机变量Y是n 1的贝诺里随机变量的值,即:Y B1,p。 贝
8、诺里随机变量X Bn,p的概率函数PX = x的表示公式:px PXxnC xp x1 pn x nC x n!x!nx! X是贝诺里随机变量,表示n个贝诺里试验中的“成功的总数;Xx,是这n个贝诺里试验中成功的总数等于x。 px和PX x,表示n个贝诺里试验中,成功的总数等于x的概率。 nC x是在n个贝诺里试验中有x个成功的排列方式的数目。 p,是单个贝诺里试验的结果为成功的概率;1p,是单个贝诺里试验的结果为不成功的概率。 p x1 pn x,是每一个排列都具有的概率。 贝诺里随机变量概率函数的形状当单个贝诺里试验的结果为成功的概率p50%时,贝诺里分布式对称的。假设p50%,那么贝诺里
9、随机变量概率函数的图像就具有偏向性。 当p 50% 时,概率函数的会向右偏right-skewed,即图像的右部有较长的尾巴; 当p 50% 时,概率函数的会向左偏left-skewed。对同一贝诺里随机变量有p1、p2,如果p1p2 1,那么它们的图像呈镜像对称。 贝诺里随机变量bernoulli Random variable的预期值和方差贝诺里随机变量bernoulli Random variable的预期值和方差Meanweighted averageVarianceBinomial,B1,ppp1pBinomial,Bn,pnpnp1pBinomial,B5,0.52.5即5p1.2
10、5即5p1pBinomial,B5,0.10.5即5p0.45即5p1p连续的随机变量分布Continuous Random VariablesP240 给定连续的单项分布a continuous uniform distribution,定义连续的单项随机变量并计算概率连续的单一分布Continuous Uniform Distribution 连续的单项随机变量的概率密度函数pdf: 1ba axbfx 0 其他值 连续的单项随机变量的累积概率函数cdf: 0 xaFx= xaba a x b 1 xb 计算概率密度函数fx在定义域axb上的面积即累积概率值的数学方法是,对函数fx从a到b
11、积分integral,即:Paxbab fxdx可以用上述等式对,范围内的任意两个实数求积分。因为连续随机变量的值是无限的,所以,连续随机变量的值等于任一定点的概率为0。这对计算连续随机变量的累积概率函数cdf有重要意义:对任何连续的随机变量X,有Paxb Pa xb Pax b Pa xb。当axb 时,fx1/ba表示的是连续随机变量在区间axb的平均概率。正态分布The Normal DistributionP243 解释正态分布的关键特征 描述正态分布的两个参数:平均值Mean和方差 2或标准差。正态分布可以表示为:X N , 2。 正态分布的下述参数值:偏向性skewness0;峰度
12、kurtosis3,剩余峰度excess kurtosis 0。正态随机变量的平均值mean、中值median、众数mode都相等。 两个正态随机变量的线性叠加linear combination,还是正态分布。 区别:单变量univariance分布和多变量分布multivariance单变量分布univariate distribution,描述单个的随机变量;多变量分布multivariate distribution,描述的是一组随机变量的概率。当我们有一组资产时,我们可以将每一项资产的收益分布分别模型化,也可以将这些资产作为一组as a group来将它们的收益分布模型化。作为一组,
13、即考虑收益系列之间的统计关系,其中经常使用的模型就是多变量的正态分布multivariate normal distribution。n种证券的收益的多变量正态分布,可以用三个参数予以定义: 单个证券收益的平均值mean的清单; 证券收益方差的清单; 收益的所有互不相同的相关系数correlations的清单,共nn-1/2个。与单变量正态分布相比拟,相关系数correlations是多变量的正态分布的区别特征之一。 解释相关系数在多变量正态分布中的作用 定义标准正态分布standards normal distribution并解释如何使随机变量标准化 正态分布的概率密度函数pdf的表达式
14、x :fx exp x 22 2 2 当 0,1 时,该正态分布称之为标准standard正态分布或单位unit正态分布。对于正态分布,标准差越大,其相对于平均值的分布就越分散。利用标准差,我们能够对任何正态分布的结果的分散性作出概率报告: 大约有50%的观察对象,在区间 23的范围内; 大约有68%的观察对象,在区间 的范围内; 大约有95%的观察对象,在区间 2的范围内; 大约有99%的观察对象,在区间 3的范围内。 随机变量的标准化标准正态随机变量用Z N0 ,1表示。将随机变量 X N , 2标准化的公式:Z X 随机变量Xx 0 对应的标准正态随机变量Z z0 x 0 / 。其意义是
15、:对X N , 2,随机变量的值小于或等于x 0的概率,正好等于标准正态分布Z N0 ,1中随机变量的值小于或等于z0的概率z0x 0 。即:对X N , 2有PXx 0;对Z N0 ,1有NZz0。当z0x 0 时,那么PXx 0NZz0。 呈正态分布的随机变量的信置区间confidence intervals 正态随机变量X确实切信置区间confidence intervals: P x1.645s X x1.645s 90%;x也记作为样本平均值;s也记作为样本的标准差。 x和s是店测算point estimates。 P x1.96s X x1.96s 95%; P x2.58 s X
16、 x2.58s 99%; 使用标准正态分布standards normal distribution计算概率 标准正态随机变量累积分布函数表Nx的使用。比方查找PZ0.24的值即变量Z的值小于或等于0.24的概率,其步骤:在表的第一纵栏找到0.20,在表的第一横栏找到0.04,两者对应的值即为要找的概率。【例】 PZ 1.282 90% ,它表示有10%的值在图像的右边尾部,并且,P x1.282s X x1. 282s 80%。 PZ1.645 95%,它表示有5 %的值在图像的右尾部,或有10 %的值在90%的信心区间之外即左右两边尾部各有5 %的值在90%的信心区间之外。 了解以下关系,
17、有助于我们使用累积分布函数Nx表: 当x0时,x右边的分布概率PZx1.0 Nx; 对负数x,有:Nx= 1.0 Nx。因为:x右边的分布概率和面积,等于x左边的分布概率和面积,即:PZx Nx或PZx。正态分布的应用Application of the Normal Distribution 平均值方差分析法 平均值方差分析法mean-variance analysis平均值方差分析法,将整体的收益分布概括为平均值和方均差,进而对投资决策进行评价。 将新资产参加到投资组合中,为了实现获利须满足: ER newR f new CorrR new,R p ER pR f p即:新资产的“夏普比,
18、要大于投资组合p的“夏普比与新资产和投资组合P的相关系数的乘积。 马克维茨决策规那么Markowitz decision rule。对于资产A和B,投资者选择A而不选择B,其决策依据是: A的平均收益等于或大于B的平均收益,而A的收益的标准差更小; A的平均收益大于B的平均收益,而A与B收益的标准差相等。 定义亏空风险shortfall risk亏空风险shortfall risk,即在某段时间投资组合的价值会下降到能够接受的最低水平以下。如:某个已经界定收益方案的资产的价值下降到方案的债务之下,即为亏空风险shortfall risk。 计算平安首位比率safety-first ratio并
19、利用罗伊的平安首位标准选择最正确投资组合平安首位规那么Safety-first Rules,作为评估价值下滑风险downside risk的方法,关注的是亏空风险shortfall risk。假定R L 是投资者能接受的最低收益水平。按照Roy的平安首位标准:最优化的投资组合,就是能够使该组合的收益R p下降到临界水平R L以下的概率最小化的投资组合,即:PR p R L为最小值。当投资组合收益是正态分布的,我们使用标准方差能计算出PR p R L。投资组合的期望收益为ER p,那么单位标准差的ER pR L最大时,投资组合的PR p R L最小。ER pR L是平均收益mean return
20、到亏空标准的距离。用SFRatio表示平安首位比率safety-first ratio,那么:SFRatio = ER p-R L/ p应用Roy标准,对投资组合进行选择的步骤: 计算投资组合的SFRatio。 根据计算所得的SFRatio值评估标准正态累积分布函数cdf。收益值小于R L的概率就是NSFRatio,即:PR p R LNSFRatio=1NSFRatio。 选择上一步中概率最小的投资组合。SFRatio与“夏普比率的差异在于R L和R f无风险收益。平安首位规那么为“夏普比率提供了一个新的角度:在使用夏普比例评价投资组合时,假定投资组合收益是正态分布的,那么夏普比率高的投资组
21、合,是使投资组合收益小于无风险收益的概率最小的投资组合。 对数正态分布lognormal distribution和正态分布的关系 对数正态分布的概述对随机变量Y,如果它的自然对数Y为正态分布,那么Y为对数正态分布;反之亦然。对对数正态分布,有两点值得注意: 它的下界由0界定; 它偏向右边即它的右边由一个长的尾巴。假定Y是对数正态分布的,那么对数正态分布的两个参数是:Y的平均值和方差或标准差。这样就有两套平均值和标准差或方差:正态分布的平均值和标准差或方差;对数正态分布自身的平均值和标准差或方差。 求对数正态分布自身的平均值和标准差或方差假定正态随机变量X有预期值 和方均差 2。定义:Yexp
22、Xe x,Y是取对数的逆运算,即YX。X是正态随机变量,而Y是对数正态变量。那么: Y的预期值是exp 0.5 2,即EY exp0.5 2。其原因:对数正态分布扩展了,它能向上扩展但是不能向下扩展超过零,因此,分布的中心向右边移动,即增加了平均值。 对数正态分布自身的平均值L和方均差L2的计算公式:L exp 0.5 2L2 exp2 2exp 21 21区别:收益的连续复利和不连续复利 股票收益分布和股票价格的关系如果股票的连续复利收益率continuously compounded return是正态分布的,那么将来的股票价格必定是对数正态分布的。同样重要地,即使股票的连续复利收益不是正
23、态分布的,因为中心限制理论central limit theorem的作用,股票的价格也可用对数正态分布来描述。 连续复利收益率与持有期回报率holding period return的关系假定股票价格的一系列观察对象S0,S1,S2,ST ,是等间距的。现在的股票价格S0是一个确定的数不是随机变量,而股票的未来价格却是一个随机变量。价格比St+1 S t,等于1加上持有期回报率,即:S t+1S t 1R t+1,t 。连续复利收益率,是与持有期回报率R t+1,t相伴随的一个重要概念。连续复利收益用r t+1,t表示,那么根据EAR e rs 1可得EAR effective annual
24、 rate即R t+1,t,在期间t到t+1内,两者的关系是:r t+1,t St+1 S t1R t+1,t在期间0到T内T-horizon,连续复利收益率与持有期回报率HPR的关系是:r0, T S T S 0 rT,T1 rT1, T2 r0,1因此,S T S 0 expr 0, T。 独立的同一分布IID,independently and identically独立的同一分布含义。 独立,指投资者不能根据过去的收益预测未来的收益; 同一就是假定静止。假定单个期间的连续复利收益率rT,T 1,是平均值为、方差为 2的IID随机变量,那么在0到T期间内连续复利收益率r0, T的期望值为
25、:Er0, T ErT,T 1 ErT 1, T-2Er0,1 T 2r0, T 2T 比拟S T S 0 expr0, T和Y expX,我们可以将未来股票价格S T的模型作为对数正态随机变量。因为,r0, T至少应该是近似的正态随机变量。22给定持有期回报率HPR,计算收益的连续复利23解释蒙特卡洛模拟和历史模拟,并说明它们的应用和局限性 蒙特卡洛模拟的简介蒙特卡洛模拟的要旨,在爬梯之前要做的最后一件事,就是摇动梯子。就像摇动梯子让我们接近爬梯的风险一样,蒙特卡洛模拟让我们在实施一项政策前,对其进行试验。其目的,就是发现对复杂的金融问题的近似解决方法。作为蒙特卡洛模拟整体的一局部,就是通过
26、各种各样的假定,从概率分布中产生大量的随机样本,以模拟各种可能的风险。蒙特卡洛模拟的应用: 在实施一项政策或投资决策前,对其进行试验;评估处于风险中的价值Value at Risk; 对复杂的证券估价; 研究院用以测试他们的模型和投资工具。 蒙特卡洛模拟的步骤。 根据根底变量,明确规定感兴趣的问题的数量Specify the quantities of interest in terms of underlying variable。 明确规定时间坐标Specify a time grid。 对产生前在变量的风险因素,明确规定其分布假说Specify distributional assump
27、tions for the risk factors that drive the underlying variables。 使用计算机程序或空白表格spreadsheet函数,产生每一个风险因素的随机值。 使用上一步产生的随机观察对象,计算根底变量。 计算感兴趣的问题的数量。 返回到第4步重新操作,直到试验的详尽数据完成。 蒙特卡洛模拟,是分析方法的补充。它只提供统计数据,而不能提供精确的结果,而分析方法提供了更深刻的因果关系。 历史模拟historic simulation,or back simulation,从历史纪录中取样来模拟一个过程。第六章:取样和评估Chapter Sampl
28、ing and Estimation本章简介Introduction本章的主题:是如何取样?以及如何利用样本信息估算群体参数?取样的核心是中心限制理论和估算central limit theorem and estimation。取样Sampling 定义样本随机取样simple random sampling样本simple随机取样,即群体中的所有元素入选的概率都相等。两种随机取样的方法:简单的随机取样simple random sampling和分层次的随机取样stratified random sampling。两类数据:横截数据cross-sectional date和时间系列数据ti
29、me-series date。 定义并解释取样误差sampling error取样误差,即统计观察到的值和统计要估算的量之间的差。 定义取样分布sampling distribution一个统计的取样分布sampling distribution,是我们从同一群体中随机抽取规模相同的样本、并对样本进行统计计算,而得出的所有相互区别的可能值的分布。 区别:简单的随机取样和分层的随机取样stratified random sampling简单的随机取样simple random sampling,即样本的获得是任意的,群体中的每一个元素,都有同等的时机被选中。分层次的随机取样stratified
30、random sampling,即根据一个或多个分类标准,将群体进一步分为亚群体sub populationstrata。然后按每一层亚群体的相对规模,按比例地抽取简单的随机样本,并将这些样本集中起来。 时间系列time-series数据和横向cross-sectional数据 时间系列数据,是时间间隔相等地、不连续地收集到的一系列数据。横截数据,是在某一时间点上的个体、团体、地区或公司的特征的数据。样本平均值的分布Distribution of the sample mean 说明中心极限定律central limit theorem并说明它的重要性假定任一概率分布描述的群体有平均值 和限定
31、的方差2,当我们从群体中抽取规模为n的样本以计算样本平均值x时,如果n足够大n 30,那么可得: 样本平均值x的取样分布是近似的正态分布; 该取样分布的样本平均值x ,方差2x 2n 。中心极限理论: 能估计群体的平均值; 样本统计的标准差,就是统计的标准误差Standard Error of Statistic; 能够建构信心区间和测试假定。 计算和解释样本平均值的标准差standards error样本平均值的标准差s xStandard Error of Statistic的定义。样本统计的标准差Standard deviation,就是统计的标准差Standard Error。因此,样
32、本平均值x的标准差Standard Error的计算公式有二:x n ;或s x s n 。 ns2 x i x2 n1 i1群体平均值的点估算和区间估算Point and Interval Estimates of the Population Mean 鉴别和描述估算公式的必要特性the desirable properties估算公式Estimatorsestimation formulas和估算值estimate。估算值是我们使用估算公式对样本观察对象进行计算所得出的特定值。估算值和估算公式的区别:从群体中抽取不同的样本进行重复的抽样统计时,估算公式会产生不同的结果即估算值。 公正性u
33、nbiasedness。一个公正的估算公式,就是它的预期值即取样分布的平均值正好等于它要评估的参数。 有效性efficiency。如果某个公正的估算公式是有效的,那么除了该公式外,再没有另外一个公正的估算公式,就同样的参数得出具有更小方差的取样分布。 一致性consistency。如果估算公式具有一致性,那么随着取样规模的增大,准确的估算值接近群体参数值的估算值的概率也会增加。即随着取样规模无限扩大,估算值的取样分布越来越集中于我们要估算的参数的值。这三个特征,也是选择估算公式的三个标准。 区别群体参数的点估算a point estimate和信置区间估算a confidence interv
34、al estimate对平均值或其他参数的关注,集中于两个问题: 假定测试。它针对的问题是“参数值是等于某个特定值吗? 估算estimation。它针对的问题是“参数的值是什么?估算包括:点估算a Point Estimates和信置区间估算。 点估算a Point Estimates按照样本平均值计算而得的群体参数的单个估算值,称之为平均值的点估算。 群体平均值的信心区间Confidence Intervals for the Population Mean 信置区间的定义信置区间,即我们能够以给定的概率1信置度肯定该区间包括了它要测算的参数。这个区间称为该参数的1 信置区间。信置区间对参数
35、给出概率解释或实践解释。 按照概率解释,例如群体平均值95%的信置区间表示,在重复取样中,在长远上,有95%的这样信置区间将包括群体平均值。 按实践解释,我们有95%的信心肯定单个该区间95%的信置区间即能够包括群体平均值。 信置区间的建构Construction of Confidence Intervals参数的1% 信置区间的结构:点估算值 信赖因素 标准误差Point estimate Reliability factor Standard error。点估算值Point estimate,即一个样本统计的值;信赖因素Reliability factor,是以点估算值的假定分布和信置度
36、1为根据的一个数据;标准误差Standard error,是提供点估算值的样本统计的标准误差。 描述t- 分布的特征Students t- distribution t分布t -Distribution,是由单一参数即自由度dfdegrees of freedom定义的一个对称的概率分布。 t分布与正态分布的比拟。假定我们从一个正态分布中取样,那么比率zx n,是一个标准的正态分布平均值为0,标准差为1;比率t xsn,那么是t分布平均值为0,自由度为n1。这个用t表示的比率,不是正态分布,因为它是两个随机变量样本的平均值和标准差的比,而标准正态分布的定义只有一个随机变量x。然而,随着自由度的
37、增加,t分布接近于标准正态分布分布越锋利、尾巴越瘦。 计算和解释自由度degrees of freedom自由度的概念。对P40计算样本标准差s的公式,分母上的项n1就是使用该等式估算群体标准差的自由度数字。使用“自由度术语其原因为:在随机样本中,我们假定观察对象的选取是互不依赖的。假定计算有n个互不依赖的观察对象的样本的平均值,那么只有n1个观察对象是可以独立地选择的。n1也常常被作为根据t分布tDistribution确定信赖因素的自由度。 对群体方差或未知的正态分布,计算和解释群体平均值的信置区间 方差的呈正态分布的群体的平均值的信置区间从方差为2的正态群体分布中取样,那么群体平均值的1
38、% 信置区间为:x z / 2 n标准正态分布Z0,1信置区间的信赖因素Reliability Factors信置区间z / 2= 0.190%的信置区间Z 0. 05 = 1.645= 0.0595%的信置区间Z 0. 025= 1.96= 0.0199%的信置区间Z 0. 005 =2.575随着信置度的增加,信置区间越来越宽,对我们要估算的数据能给出的信息就越不精确。 方差未知的群体的平均值的信置区间的求解 方法一:z替换法the zAlternative从方差未知的任何分布的群体中取样,当取样规模较大时,那么群体平均值的1% 信心区间为:x z / 2 S n 方法二:t分布法tDis
39、tribution如果从一个方差未知的群体中取样,并且满足以下两个条件中的任一条件的,即: 样本较大; 样本较小但是群体呈正态分布或近似的正态分布。那么群体平均值的信心区间可以表示为:x t/ 2 S n计算信赖因素Reliability Factors的根据取样的群体样本规模较小的统计样本规模较大的统计方差的正态分布zz方差未知的正态分布tt或z方差的非正态分布Not availablez方差未知的非正态分布Not availablet或z 从任何类型的分布中抽取大量的样本,在群体方差未知时,计算和解释群体平均值的信置区间 对选择适当样本规模的问题进行讨论 讨论数据挖掘偏见date-mini
40、ng bias数据窥探偏见Date-snooping,即以刺探他人经验性结果来引导自己的分析而得出推论所产生的偏见。防止方法:检验新数据,以防止过分依靠过去的研究,来解释发现和得出结论。数据挖掘偏见Date-mining bias,指重复的钻研同一数据,直至有所发现。数据挖掘偏见的四点迹象:对数据挖掘太多而又缺乏信心Too much diggingToo little confidence;没有过去也没有将来No story No future。防止的方法是在样本数据之外测试交易规那么。 讨论样本选取偏见、现存关系偏见、超前偏见、时间期间偏见。 样本选择偏见Sample selection b
41、ias,即因为数据可获得性的原因,而将某项资产排除在分析之外,由此产生的问题为样本选择偏见。 现存关系偏见survivorship bias。如果测试设计没有考虑到已经关闭、被兼并或因其他原因离开了数据库的公司的账户,那么属于现存关系偏见。 超前偏见look-ahead bias。如果一项测试设计在测试数据上使用了不能获得的信息,那么会产生超前偏见。 时间期间偏见time-period bias。如果作为测试设计根据的时间期间,使结果在时间期间上特定化,属于时间期间偏见。要注意对取样期间长度的选择。第七章:假定测试Chapter Hypothesis Testing假定测试Hypothesis Testing 定义假定并描述假定测试的步骤假定,即对群体的说明。假定测试的步骤Steps in the Hypothesis Testing: 提出假定stating the hypothesis; 确定测试统计和它的概率分布Identifying the test statistic and its probability distribution; 有效度的特定化Specifying the significance level; 声明决定规那么Stat
限制150内