数据处理分析_P值的含义.doc
《数据处理分析_P值的含义.doc》由会员分享,可在线阅读,更多相关《数据处理分析_P值的含义.doc(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、P值是怎么来的从某总体中抽、这一样本是由该总体抽出,其差别是由抽样误差所致;、这一样本不是从该总体抽出,所以有所不同。如何判断是那种原因呢?统计学中用显著性检验赖判断。其步骤是:、建立检验假设(又称无效假设,符号为H0):如要比较A药和B药的疗效是否相等,则假设两组样本来自同一总体,即A药的总体疗效和B药相等,差别仅由抽样误差引起的碰巧出现的。、选择适当的统计方法计算H0成立的可能性即概率有多大,概率用P值表示。、根据选定的显著性水平(0.05或0.01),决定接受还是拒绝H0。如果P0.05,不能否定“差别由抽样误差引起”,则接受H0;如果P0.05或P 0.01,可以认为差别不由抽样误差引
2、起,可以拒绝H0,则可以接受令一种可能性的假设(又称备选假设,符号为H1),即两样本来自不同的总体,所以两药疗效有差别。统计学上规定的P值意义见下表P值 碰巧的概率 对无效假设 统计意义 P0.05 碰巧出现的可能性大于5% 不能否定无效假设 两组差别无显著意义 P0.05 碰巧出现的可能性小于5% 可以否定无效假设 两组差别有显著意义 P 0.01 碰巧出现的可能性小于1% 可以否定无效假设 两者差别有非常显著意义 理解P值,下述几点必须注意:P的意义不表示两组差别的大小,P反映两组差别有无统计学意义,并不表示差别大小。因此,与对照组相比,C药取得P0.05,D药取得P 0.01并不表示D的
3、药效比C强。 P0.05时,差异无显著意义,根据统计学原理可知,不能否认无效假设,但并不认为无效假设肯定成立。在药效统计分析中,更不表示两药等效。哪种将“两组差别无显著意义”与“两组基本等效”相同的做法是缺乏统计学依据的。统计学主要用上述三种P值表示,也可以计算出确切的P值,有人用P 0.001,无此必要。显著性检验只是统计结论。判断差别还要根据专业知识。样所得的样本,其统计量会与总体参数有所不同,这可能是由于两种原因kokofu 于 2010-3-25 22:12 补充以下内容实际上生物统计原理基于此呵呵。P值是最常用的一个统计学指标,几乎统计软件输出结果都有P值。了解p值的由来、计算和意义
4、很有必要。! I4 U* a R9 r- C0 A8 e9 t- v2 B, O$ U8 q8 : I4 w, S$ n- & c7 X一、P值的由来RAFisher(1890-1962)作为一代假设检验理论的创立者,在假设检验中首先提出P值的概念。他认为假设检验是一种程序,研究人员依照这一程序可以对某一总体参数形成一种判断。也就是说,他认为假设检验是数据分析的一种形式,是人们在研究中加入的主观信息。(当时这一观点遭到了Neyman-Pearson的反对,他们认为假设检验是一种方法,决策者在不确定的条件下进行运作,利用这一方法可以在两种可能中作出明确的选择,而同时又要控制错误发生的概率。这两种
5、方法进行长期且痛苦的论战。虽然Fisher的这一观点同样也遭到了现代统计学家的反对,但是他对现代假设检验的发展作出了巨大的贡献。)Fisher的具体做法是:3 p# A1 o0 ?3 V! I$ k8 R0 c. 5 G1 S1 U) w& G! * 假定某一参数的取值。0 M0 k1 j8 C1 L * 选择一个检验统计量(例如z 统计量或Z 统计量) ,该统计量的分布在假定的参数取值为真时应该是完全已知的。3 w) k( z5 M a* s T% j * 从研究总体中抽取一个随机样本4计算检验统计量的值5计算概率P值或者说观测的显著水平,即在假设为真时的前提下,检验统计量大于或等于实际观测
6、值的概率。4 + 9 M0 b1 G/ 9 v8 b: 3 x1 f* ) GF% a& f( 0 t; o * 如果P0.01,说明是较强的判定结果,拒绝假定的参数取值。/ : i# & d/ Z9 y* T3 z m% * 如果0.01P值0.05,说明结果更倾向于接受假定的参数取值。0 J, % _% i1 t$ W: 1 B4 j! t6 at7 N* ( - i7 s! 可是,那个年代,由于硬件的问题,计算P值并非易事,人们就采用了统计量检验方法,也就是我们最初学的t值和t临界值比较的方法。统计检验法是在检验之前确定显著性水平,也就是说事先确定了拒绝域。但是,如果选中相同的,所有检验
7、结论的可靠性都一样,无法给出观测数据与原假设之间之间不一致程度的精确度量。只要统计量落在拒绝域,假设的结果都是一样,即结果显著。但实际上,统计量落在拒绝域不同的地方,实际上的显著性有较大的差异。1 x1 A H Z7 d4 C H$ 因此,随着计算机的发展,P值的计算不再是个难题,使得P值变成最常用的统计指标之一。4 d6 4 K1 A/ p7 A- f, O二、P值的计算为理解P值的计算过程,用表示检验的统计量,表示根据样本数据计算得到的检验统计量值。4 I/ X D u3 q左侧检验 vs& - U: s; |2 V) K8 g! E/ U HP值是当时,检验统计量小于或等于根据实际观测样
8、本数据计算得到的检验统计量值的概率,即p值 =n: a6 T0 E: u2 C9 v- I8 k0 L右侧检验 vs( 1 5 z j; PP值是当时,检验统计量大于或等于根据实际观测样本数据计算得到的检验统计量值的概率,即p值 =& ?. S8 T: I+ M$ w* A. e- l5 B8 o% 双侧检验 vs5 ?( P, S* 7 R3 u* rT+ JP值是当时,检验统计量大于或等于根据实际观测样本数据计算得到的检验统计量值的概率,即p值 =$ g- O9 a8 B$ q4 h* b/ M3 I u3 O4 Q三、P值的意义P值就是当原假设为真时所得到的样本观察结果或更极端结果出现的
9、概率。如果P值很小,说明这种情况的发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P值越小,我们拒绝原假设的理由越充分。8 % R! Q( j, F. d总之,P值越小,表明结果越显著。但是检验的结果究竟是“显著的”、“中度显著的”还是“高度显著的”需要我们自己根据P值的大小和实际问题来解决。 Q# q% _8 9 b , E9 * c/ H6 r2 S7 , G v$ J. (#161). q _: Tb+ ! P2008/12/18 09:24/ V- _C* x! 补充几点关于p值的说法,欢迎大家讨论指正哈* d9 O* K. H% T2 T% I一 p值究竟是否等
10、于evidence?! K) R6 L1 o/ T# ?p值并不等于evidence,这一点是应用统计中经常犯的错误,正如correlation不等于causality一样。严格的来说,只有 likelihood才能衡量evidence。 p值小有很多原因,也有可能是样本太少,或者数据问题。这些都还好理解,最需要注意的一点是,p值不具有概率那样的可以拿来比较的性质。就是说,今天我对一个假设检验进行检验,发现p0.01,明天我重复了一遍,发现p0.001. 对于这两个结果我们能说他们不一样吗?很难。! IZ1 T! M4 t# W$ p* L& E二 p 值究竟是什么7 b& ; V4 4 h0
11、 R- t, r& e关于这一点,下面这篇文章是强烈推荐的5 |% t! c P/ e+ $ M( E* _1 L. dempster (1997) the direct use of likelihood in significance testing, statistics and computing 7。6 o1 Ya0 W j, ti2 z3 x一个很重要的结论是,在某些特定的假设检验,尤其是likelihood ratio testing上,p值实际上就是p(lrt1|x)。这是什么呢?这就是说,给定样本x, likelihood ratio1的概率。+ Ax 6 x: s: a5
12、所以说,从这个角度出发,站在我们无敌的likelihood 的理论角度出发,p值跟bayesian theory又联系在了一起。) w F7 m4 I+ L+ u神奇的地球。数据分析】统计学中p值的含义和显著差异性分析数据分析 2010-03-04 21:04:43 阅读702 评论0 字号:大中小 这个社会是残酷的,刚来公司,很多的职业技能尚不具备,但还是要硬着头皮答应经理“苛刻”的要求,无论实验的过程多么难,结果的可预测性多么小,我都会回答“OK!这不是打脸充胖子,也不是要面子,这就是职场,你不学习是不行的!即使有些东西你从来没有遇到过,甚至没有听说过,你也要因为需要去理解它,掌握它!你比
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据处理 分析 _P 含义
限制150内