质量专业基础理论与实务(初级)(DOC374)54487.docx
-
资源ID:48185596
资源大小:658.61KB
全文页数:469页
- 资源格式: DOCX
下载积分:50金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
质量专业基础理论与实务(初级)(DOC374)54487.docx
第一章概率统计基础知识 第一节质量特性性数据的统计计规律 一、总体、个个体与样本产品的质量量可以用一个个或多个质量量特性来表示示。这里的特特性可以是定定量的,也可可以是定性的的。例如灯泡泡的寿命,钢钢的成分等都都是定量特性性;而按规范范判定产品为为“合格”或“不合格”,则是一种种定性特征。在质量管理理中,通常研研究一个过程程中生产的全全体产品。在在统计中,将将研究、考察察对象的全体体称为总体。例例如某个工厂厂在一个月内内按照一定材材料及一定工工艺生产的一一批灯泡。总总体是由个体体组成的。在在上例中,这这批灯泡中的的每个特定的的灯泡都是一一个个体。如如果总体中包包含的个体数数不大,而对对产品质量特特性的观测(例如测量)手段不是破破坏性的,工工作量也不大大,那么有可可能对总体中中的每个个体体都进行观测测,以得到每每个个体的质质量特性值。但但是如果总体体中的个体数数N很大,甚甚至是无限的的,或者观测测是破坏性的的或观测的费费用很大,那那么不可能对对总体中的每每个个体都进进行观测。通通常的做法是是从总体中抽抽取一个或多多个个体来进进行观测。抽抽出来的这一一部分个体组组成一个样本本,样本中所所包含的个体体数目称为样样本量。通过过对样本的观观测来对总体体特性进行研研究,是统计计的核心。上述总体、个个体和样本的的概念是统计计的基本概念念,从上面的的叙述中,这这些概念都可可以是具体的的产品。但有有时为了表达达的方便,当当研究产品某某个特定的质质量特性X时时,也常把全全体产品的特特性看做为总总体,而把一一个具体产品品的特性值xx视为个体,把把从总体中抽抽出的由n个个产品的特性性值x1,x2,xn看做为一个个样本。例1.11-1从一一个工厂一个个月内生产的的一批灯泡中中抽取n=88个灯泡,进进行寿命试验验,得到这88个灯泡的使使用寿命为(单位为小时时):325,884,12444,8700,645,11423,11071,9992这这8个灯泡或或相应的使用用寿命即为一一个样本,样样本量n=88。从总体中抽抽取样本的方方法称为抽样样。为使抽取取的样本对总总体有代表性性,样本不能能是有选择的的,最好应是是随机抽取的的,关于这一一点,以后我我们还要详细细解释。二、频数(频率)直方方图及累积频频数(频率)直方图为研究一批批产品的质量量情况,需要要研究它的某某个质量特性性(这里为了了叙述简单起起见,仅讨论论一个质量特特性,有必要要时也可以同同时讨论多个个质量特性)X的变化规规律。为此,从从这批产品(总体)中抽抽取一个样本本(设样本量量为n),对对每个样本产产品进行该特特性的测量(观测)后得得到一组样本本观测值,记记为x1,x2,xn,这便是我我们通常说的的数据。为了研究数数据的变化规规律,需要对对数据进行一一定的加工整整理。直方图图是为研究数数据变化规律律而对数据进进行加工整理理的一种基本本方法。下面面用一个例子子来说明直方方图的概念及及其作法。例1.11-2食品品厂用自动装装罐机生产罐罐头食品,从从一批罐头中中随机抽取1100个进行行称量,获得得罐头的净重重数据如下:为了解这组组数据的分布布规律,对数数据作如下整整理:(1)找出出这组数据中中的最大值xxmax及最小小值xminn,计算它们们的差R=xxmax-xmin,R称称为极值,也也就是这组数数据的取值范范围。在本例例中xmaxx=356,xxmin=3332,从而RR=356-332=224。(2)根据据数据个数,即即样本量n,决决定分组数kk及组距h。一批数据究究竟分多少组组,通常根据据n的多少而而定,不过这这也不是绝对对的,表1.1-1是可可以参考的分分组数。选择k的原原则是要能显显示出数据中中所隐藏的规规律,组数不不能过多,但但也不能太少少。每一组的区区间长度,称称为组距。组组距可以相等等,也可以不不相等。组距距相等的情况况用得比较多多,不过也有有不少情形在在对应于数据据最大及最小小的一个或两两个组,使用用与其他组不不相等的组距距。对于完全全相等的组距距,通常取组组距h为接近近R/k的某某个整数值。在本例中,=100,取取k=9,RR/k=244/9=2.7,故取组组距h=3。(3)确定定组限,即每每个区间的端端点及组中值值。为了避免免一个数据可可能同时属于于两个组,因因此通常将各各组的区间确确定为左开右右闭的:(a0,aa1,(a1,a2,(ak-11,ak通通常要求a00<xmin,ak>xmax。在等等距分组时,aa1=a0+h,a2=a1+h,ak=ak-1+h,而而每一组的组组中值在本例中取取a0=331.5,则每组组的组限及组组中值见表11.1-2。(4)计算算落在每组的的数据的频数数及频率确定分组后后,统计每组组的频数,即即落在组中的的数据个数nni以及频率ffi=ni/n,列出出每组的频数数、频率表,见见表1.1-2。(5)作频频数频率直方方图在横轴上标标上每个组的的组限,以每每一组的区间间为底,以频频数(频率)为高画一个个矩形,所得得的图形称为为频数(频率率)直方图,如如图1.1-1。到在本本例中频数直直方图及频率率直方图的形形状是完全一一致的。这是是因为分组是是等距的。在分组不完完全等距的情情形,在作频频率直方图时时,应当用每每个组的频率率与组距的比比值fi/hi为高作矩形形。此时以每每个矩形的面面积表示频率率。(6)累积积频数和累积积频率直方图图还有另一种种直方图使用用的是累积频频数和累积频频率。以累积积频率直方图图为例,首先先要计算累积积频率Fi,Fi是将这一组组的频率与前前面所有组的的频率累加,也也即第1组的的F1=f1,第2组的的F2=f1+f2,一般的,FFi=fj。本例中的的各组Fi值也见表11.1-2。如果以每组组的累积频率率Fi为高作矩形形,所得的直直方图称为累累积频率直方方图,本例中中的累积频率率直方图如图图1.1-22所示。可以从直方方图获得数据据的分布规律律,其中包含含数据取值的的范围,以及及它们的集中中位置和分散散程度等信息息。应当引起注注意的是,如如果我们观测测的数据量(即样本量)n很大,而而分组又很细细,那么从频频率直方图及及累积频率直直方图可以分分别得到一根根光滑曲线,关关于这一点我我们将在本章章第三节详细细讨论。三、数据集集中位置的度度量对一组样本本数据,可以以用一些量表表示它们的集集中位置。这这些量中,常常用的有样本本均值、样本本中位数和样样本众数。(一)样本本均值样本均值也也称样本平均均数,记为,它它是样本数据据x1,x2,xn的算术平均均数:例1.11-3轴直直径的一个nn=5的样本本观测值(单单位:cm)为:15.09,155.29,115.15,115.07,115.21,则则样本均值为为:=15.009+15.29+155.15+115.07+15.211)=15.162 对对于n较大的的分组数据,可可利用将每组组的组中组xxi用频率fi加权计算近近似的样本均均值:例1.1-44在例111.2中,1100个罐头头的净量的均均值按分组计计算为:=333×0.01十3336×0.04十十339×0.11+357×0.01 =345008/1000=345.08样本均值是是使用最为广广泛的反映数数据集中位置置的度量。它它的计算比较较简单,但缺缺点是它受极极端值的影响响比较大。(二)样本本中位数样本中位数数是表示数据据集中位置的的另一种重要要的度量,用用符号Me或或表示。在确确定样本中位位数时,需要要将所有样本本数据按其数数值大小从小小到大重新排排列成以下的的有序样本:x(1),xx(2),x(n)其中xx(1)=xmin,x(n)=xmax分别是是数据的最小小值与最大值值。样本中位数数定义为有序序样本中位置置居于中间的的数值,具体体地说:例1.11-5对例例1.1-33中的5个轴轴直径数据进进行按从小到到大的重新排排序,得到如如下有序样本本:15.077,15.009,15.15,155.21,115.29 这里n=55为奇数,(n+1)/2=3,因因而样本中位位数Me=xx(3)=155.15。注意,在此此例中,中位位数15.115与均值115.1622很接近。与均值相比比,中位数不不受极端值的的影响。因此此在某些场合合,中位数比比均值更能代代表一组数据据的中心位置置。(三)样本本众数样本众数是是样本数据中中出现频率最最高的值,常常记为Modd。例如对例例1.1-22中的罐头净净量,1000个数据中,3344出现的的次数最多,为为12次,因因此Mod=344。样样本众数的主主要缺点是受受数据的随机机性影响比较较大,而且对对大的n,也也很难确定,有有时也不惟一一,此时较多多地采用分组组数据。在本本例中第5组组(343.5,3466.5的频频率为0.330,是所有有组中最高的的,因而该组组的组中值3345可以作作为众数的估估计。注意到到该数与前面面定的3444相差不大。四、数据分分散程度的度度量一组数据总总是有差别的的,对一组质质量特性数据据,大小的差差异反映质量量的波动。也也有一些用来来表示数据内内部差异或分分散程度的量量,其中常用用的有样本极极差、样本方方差、样本标标准差和样本本变异系数。(一)样本本极差样本极差即即是样本数据据中最大值与与最小值之差差,用R表示示。对于有序序样本,极差差R为: R=x(nn)-x(1)(1.1-4)例如在例11.1-3,55个轴直径数数据的极差RR=15.221-15.09=0.12。样本极差只只利用了数据据中两个极端端值,因此它它对数据信息息的利用不够够充分,极差差常用于n不不大的情况。(二)样本本方差与标准准差数据的分散散程度可以用用每个数据xxi离其均值的差差xi-来表示,xxi-称为xi的离差。对对离差不能直直接取平均,因因为离差有正正有负,取平平均会正负相相抵,无法反反映分散的真真实情况。当当然可以先将将其取绝对值值,再进行平平均,这就是是平均绝对差差:但是由于对对绝对值的微微分性质较差差,理论研究究较为困难,因因此平均绝对对差使用并不不广泛。使用用最为广泛的的是用离差平平方来代替离离差的绝对值值,因而数据据的总波动用用离差平方和和来表示,样本方方差定义为离离差平方和除除以n-1,用用s2表示:因为n个离离差的总和为为0,所以对对于n个独立立数据,独立立的离差个数数只有n-11个,称n-1为离差(或离差平方方和)的自由由度,因此样样本方差是用用n-1而不不是用n除离离差平方和。样本方差正正的算术平方方根称为样本本标准差,即即:注意标准差差的量纲与数数据的量纲一一致。在具体计算算时,离差平平方和也可用用以下两个简简便的公式:因此样本方方差计算可用用以下公式:对例1.11-3的轴直直径数据,离离差平方和、样样本方差及样样本标准差的的计算可列表表进行。为计算方便便,可以将数数据减去一个个适当的常数数,这样不影影响样本方差差及标准差的的计算结果。例例如,在本例例中,将每个个数据减去115,即可大大大减少计算算量。在实际际使用中还可可以利用计算算器来计算,特特别是许多科科学计算用的的计算器,都都具有平均数数、方差与标标准差的计算算功能。(三三)样本变异异系数样本标准差差与样本均值值之比称为样样本变异系数数,有时也称称之为相对标标准差,记为为cv:例如对例1.11-2的轴直直径数据,样样本变异系数数cv=0.0901/15.1662=0.00059。 第二节概率基础础知识 一、事件与与概率(一)随机机现象在一定条件件下,并不总总是出现相同同结果的现象象称为随机现现象。从这个个定义中可看看出,随机现现象有两个特特点:(1)随机机现象的结果果至少有两个个;(2)至于于哪一个出现现,人们事先先并不知道。抛硬币、掷掷骰子是两个个最简单的随随机现象。抛抛一枚硬币,可可能出现正面面,也可能出出现反面,至至于哪一面出出现,事先并并不知道。又又如掷一颗骰骰子,可能出出现1点到66点中某一个个,至于哪一一点出现,事事先也并不知知道。例1.22-1随机机现象的例子子:(1)一天天内进入某超超市的顾客数数;(2)一顾顾客在超市中中购买的商品品数;(3)一顾顾客在超市排排队等候付款款的时间;(4)一颗颗麦穗上长着着的麦粒个数数;(5)新产产品在未来市市场的占有率率;(6)一台台电视机从开开始使用到发发生第一次故故障的时间;(7)加工工机械轴的直直径尺寸;(8)一罐罐午餐肉的重重量。随机现象在在质量管理中中到处可见。认识一个随随机现象首要要的是能罗列列出它的一切切可能发生的的基本结果。这这里的基本结结果是指今后后的抽样单元元,故又称样样本点,随机机现象一切可可能样本点的的全体称为这这个随机现象象的样本空间间,常记为。“抛一枚硬硬币”的样本空间间=正面,反反面;“掷一颗骰骰子”的样本空间间=1,22,3,4,55,6;“一顾客在在超市中购买买商品件数”的样本空间间=0,11,2,;“一台电视视机从开始使使用到发生第第一次故障的的时间”的样本空间间=t:tt0;“测量某物物理量的误差差”的样本空间间=x:-<x<。(二)随机机事件随机现象的的某些样本点点组成的集合合称为随机事事件,简称事事件,常用大大写字母A、BB、C等表示示,如在掷一一颗骰子时,“出现奇数点”是一个事件,它由1点、3点、5点共三个样本点组成,若记这个事件为A,则有A=1,3,5。1.随机事事件的特征从随机事件件的定义可见见,事件有如如下几个特征征:(1)任一一事件A是相相应样本空间间中的一个子子集。在概率率论中常用一一个长方形示示意样本空间间,用其中一一个圆(或其其他几何图形形)示意事件件A,见1.2-1,这这类图形称为为维恩(Veenn)图。(2)事件件A发生当且且仅当A中某某一样本点发发生,若记1,2是中的两个样样本点(见图图1.21):当1发生生,且1A(表示1在A中),则则事件A发生生;当2发生生,且2A(表示2不在A中),则事件AA不发生。(3)事件件A的表示可可用集合,也也可用语言,但但所用语言应应是明确无误误的。(4)任一一样本空间都有一个最最大子集,这这个最大子集集就是,它对应的的事件称为必必然事件,仍仍用表示。如掷掷一颗骰子,“出现点数不超过6”就是一个必然事件。(5)任一一样本空间都有一个最最小子集,这这个最小子集集就是空集,它它对应的事件件称为不可能能事件,记为为。如掷一颗颗骰子,“出现7点”就是一个不不可能事件。例1.22-2若产产品只区分合合格与不合格格,并记合格格品为“0”,不合格品品为“1”。则检查两两件产品的样样本空间由下列四个个样本点组成成。=(00,0),(0,1),(1,0),(1,1)其中样本点点(0,1)表示第一件件产品为合格格品,第二件件产品为不合合格品,其他他样本点可类类似解释。下下面几个事件件可用集合表表示,也可用用语言表示。A=“至少少有一件合格格品”=(0,00),(0,11),(1,00);B=“至少少有一件不合合格品”=(0,11),(1,00),(1,11)C=“恰好有一件件合格品”=(0,11)(1,00);=“至多多有两件合格格品”=(0,00),(0,11),(1,00),(1,11);=“有三三件不合格品品”。现在我们转转入考察“检查三件产产品”这个随机现现象,它的样样本空间含有23=8个样本本点。=(00,0,0),(0,00,1),(0,1,00),(1,00,0),(0,1,11),(1,00,1),(1,1,00),(1,11,1)下面几个事事件可用集合合表示,也可可用语言表示示。A=“至少少有一件合格格品”=中剔去(11,1,1)的其余7个个样本点;B=“至少少有一件不合合格品”=中剔去(00,0,0)的其余7个个样本点;C1=“恰恰有一件不合合格品”=(0,00,1),(0,1,00),(1,00,0);C2=“恰恰有两件不合合格品”=(0,11,1),(1,0,11),(1,11,0);C3=“全全是不合格品品”=(1,11,1);C0=“没没有一件是不不合格品”=(0,00,0);2.随机事事件之间的关关系实际中,在在一个随机现现象中常会遇遇到许多事件件,它们之间间有下列三种种关系。(1)包含含:在一个随随机现象中有有两个事件AA与B,若事事件A中任一一个样本点必必在B中,则则称A被包含含在B中,或或B包含A,记记为AB,或或BA,这时时事件A的发发生必导致事事件B发生,如如图1.2-2所示。如如掷一颗骰子子,事件A=“出现4点”必导致事件件B=“出现偶数点点”的发生,故故AB。显然然,对任一事事件A,有A。(2)互不不相容:在一一个随机现象象中有两个事事件A与B,若若事件A与BB没有相同的的样本点,则则称事件A与与B互不相容容。这时事件件A与B不可可能同时发生生,如图1.2-3所示示,如在电视视机寿命试验验里,“电视机寿命命小于1万小小时”与“电视机寿命命超过4万小小时”是两个互不不相容事件,因因为它们无相相同的样本点点,或者说,它它们不可能同同时发生。两个事件间间的互不相容容性可推广到到三个或更多多个事件间的的互不相容,例例如在检查三三个产品的例例子(例1.2-2)中中,C1=“恰有一件不不合格品”,C2=“恰有两件不不合格品”,C3=“全是不合格格品”,C0=“没有不合格格品”是四个互不不相容事件。(3)相等等:在一个随随机现象中有有两个事件AA与B,若事事件A与B含含有相同的样样本点,则称称事件A与BB相等,记为为A=B。如如在掷两颗骰骰子的随机现现象中,其样样本点记为(x,y,其其中x与y分分别为第一与与第二颗骰子子出现的点数数,定义如下下两个事件:A=(xx,y):xx+y=奇数数B=(xx,Y):xx与y的奇偶偶性不同可可以验证A=B。(三)事件件的运算事件件的运算有下下列四种。(1)对立立事件,在一一个随机现象象中,是样本空间间,A为事件件,由在中而不在AA中的样本点点组成的事件件称为A的对对立事件,记记为。图1.2-4上的的阴影部分就就表示A的对对立事件。可可见就是“A不发生”,例如在检检查一匹布中中,事件“至少有一个个疵点”的对立事件件是“没有疵点”。对立事件件是相互的,AA的对立事件件是,的对立事件件必是A。特特别,必然事事件与不可能事事件互为对立事事件,即=,=。(2)事件件A与B的并并,由事件AA与B中所有有样本点(相相同的只计入入一次)组成成的新事件称称为A与B的的并,记为AAUB。如图图1.2-22所示。并事事件AB发生意味味着“事件A与BB中至少一个个发生”。(3)事件件A与B的交交,由事件AA与B中公共共的样本点组组成的新事件件称为事件AA与B的交,记记为AB或AB。如如图1.2-6所示,交交事件AB发发生意味着“事件A与BB同时发生”。事件的并和交可可推广到更多多个事件上去去(见图1.2-7)。(4)事件件A对B的差差,由在事件件A中而不在在B中的样本本点组成的新新事件称为AA对B的差,记记为A-B。如如图1.1-8所示。(四)概率率事件发生生可能性大小小的度量随机事件的的发生与否是是带有偶然性性的。但随机机事件发生的的可能性还是是有大小之别别,是可以设设法度量的。而而在生活、生生产和经济活活动中,人们们很关心一个个随机事件发发生的可能性性大小。例如如:(1)抛一一枚硬币,出出现正面与出出现反面的可可能性各为11/2。足球球裁判就是用用抛硬币的方方法让双方队队长选择场地地,以示机会会均等。(2)某厂厂试制成功一一种新止痛片片在未来市场场的占有率是是多少呢?市市场占有率高高,就应多生生产,获得更更多利润;市市场占有率低低,就不能多多生产,否则则会造成积压压,不仅影响响资金周转,而而且还要花钱钱去贮存与保保管。(3)购买买彩券的中奖奖机会有多少少呢?如19993年7月月发行的青岛岛啤酒股票的的认购券共出出售28733477400张,其中有有1800000张认购券券会中签,中中签率是万分分之6.2664(见19993年7月月30日上海海证券报)。上述正面出出现的机会、市市场占有率、中中签率以及常常见的废品率率、命中率等等都是用来度度量随机事件件发生的可能能性大小。一一个随机事件件A发生可能能性的大小用用这个事件的的概率P(AA)来表示。概概率是一个介介于0到1之之间的数。概概率愈大,事事件发生的可可能性就愈大大;概率愈小小,事件发生生的可能性也也就愈小。特特别,不可能能事件的概率率为0,必然然事件的概率率为1,即:P()=0,P()=1二、概率的的古典定义与与统计定义确定一个事事件的概率有有几种方法,这这里介绍其中中两种最主要要的方法,相相应于概率的的两种定义,即即古典定义及及统计定义。(一)古典典定义用概率的古古典定义确定定概率方法的的要点如下:(1)所涉涉及的随机现现象只有有限限个样本点,设设共有n个样样本点;(2)每个个样本点出现现的可能性是是相同的(等等可能性);(3)若被被考察的事件件A含有k个个样本点,则则事件A的概概率定义为:例1.22-3掷两两颗骰子,其其样本点可用用数对(x,yy表示,其中中x与y分别别表示第一与与第二颗骰子子出现的点数数。这一随机机现象的样本本空间为:=(xx,y),xx,y=1,22,3,4,55,6它共共含36个样样本点,并且且每个样本点点出现的可能能性都相同。(1)定义义事件A=“点数之和为为2”=(1,11),它只只含一个样本本点,故P(A)=1/36。(2)定义义事件B=“点数之和为为5”=(1,44),(2,33),(3,22),(4,11),它含含有4个样本本点,故P(B)=4/36=1/9。(3)定义义事件C=“点数之和超超过9”=(4,66),(5,55),(6,44),(5,66),(6,55),(6,66),它含含有6个样本本点,故P(C)=6/36 =11/6。(4)定义义事件D=“点数之和大大于3,而小小于7”=(1,33)(2,22),(3,11),(1,44)(2,33),(3,22),(4,11),(1,55),(2,44),(3,33),(4,22),(5,11),它含含有12个样样本点,故它它的概率P(D)=122/36 =1/3。用古典方法法获得概率常常需要排列与与组合的公式式。现概要介介绍如下:排列与组合合是两类计数数公式,它们们的获得都基基于如下两条条计数原理。(1)乘法法原理:如果果做某件事需需经k步才能能完成,其中中做第一步有有m1种方法,做做第二步有mm2种方法,做第k步步有mk种方法,那那么完成这件件事共有m11×m2××mk种方法。例如,甲城城到乙城有33条旅游线路路,由乙城到到丙城有2条条旅游线路,那那么从甲城经经乙城去丙城城共有3×2=6条旅旅游线路。(2)加法法原理:如果果做某件事可可由k类不同同方法之一去去完成,其中中在第一类方方法中又有mm1种完成方法法,在第二类类方法中又有有m2种完成方法法,在第k类类方法中又有有mk种完成方法法,那么完成成这件事共有有m1+m2+mk种方法。例如,由甲甲城到乙城去去旅游有三类类交通工具:汽车、火车车和飞机,而而汽车有5个个班次,火车车有3个班次次,飞机有22个班次,那那么从甲城到到乙城共有55+3+2=10个班次次供旅游选择择。(3)排列列:从n个不不同元素中任任取r(rn)个元素素排成一列称称为一个排列列。按乘法原原理,此种排排列共有n××(n-1)××(n-r+1)个个,记为Pn。若r=nn,称为全排排列,全排列列数共有n!个,记为PPn,即:Pn=nn(n-1)(n-r+1),pnn=n!(4)重复复排列:从nn个不同元素素中每次取出出一个作记录录,放回后再再取下一个,如如此连续取rr次所得的排排列称为重复复排列。按乘乘法原理,此此种重复排列列共有n个个。注意,这这里的r允许许大于n。例如,从110个产品中中每次取一个个做检验,放放回后再取下下一个,如此此连续抽取44次,所得重重复排列数为为104。假如上述述抽取不允许许放回,列所所得排列数为为10×9×8×7=50440。(5)组合合:从n个不不同元素中任任取r(rn)个元素素并成一组(不考虑其间间顺序)称为为一个组合,此此种组合数为为:规定0!=1,因因而=1。例如,从110个产品中中任取4个做做检验,所有有可能取法是是从10个中中任取4个的的组合数,则则不同取法的的种数为:这是因为取出的的4个产品的的全排列有44!=24种种。这24种种排列在组合合中只算一种种。例1.22-4一批批产品共有NN个,其中不不合格品有MM个,现从中中随机取出nn个(nN),问事事件Am=“恰好有m个个不合格品”的概率是多多少?从N个产品品中随机抽取取n个共有个不同的样本点点,它们组成成这个问题的的样本空间。其中“随机抽取”必导致这个样本点是等可可能的。以后后对“随机抽取”一词都可作作同样理解。下下面我们先计计算事件A00、A1的概率,然然后计算一般般事件Am的概率。事件A0=“恰好有0个个不合格品”=“全是合格品品”。要使取出出的n个产品品全是合格品品,那必须从从该批中N-M个合格品品中抽取,这这有种取法。故事件件A0的概率为事件A1=“恰恰好有1个不不合格品”,要使取出出的n个产品品只有一个不不合格品,其其他n-1个个是合格品,可可分二步来实实现。第一步步从M个不合合格品中随机机取出1个,共共有种取法;第二步步从NM个合合格品中随机机取出n-11个,共有种取法。依据乘乘法原则,事事件A1共含个样本点。故事事件A1的概率为:最后,要使使事件Am发生,必须须从M个不合合格品中随机机抽取m个,而而从N-M个个合格品中随随机抽取n-m个。依据据乘法原则,事事件Am共含有个样本本点。故事件件Am的概率是:其中r=minn(n,M)是m的最大大取值,这是是因为m既不不可能超过取取出的产品数数n,也不可可能超过不合合格品总数MM,即mnn和mM。综综合这两个不不等式,可知知mminn(n,M)=r。假如给定NN=10,MM=2和n=4,下面来来计算诸事件件Am的概率:而A3,AA4等都是不可可能事件。因因为10个产产品中只有22个不合格品品,而要从中中抽出3个或或4个不合格格品是不可能能的。例1.22-5(放放回抽样)抽抽样有两种形形式:不放回回抽样与放回回抽样。上例例讨论的是不不放回抽样,每每次抽取一个个,不放回,再再抽下一个,这这相当于n个个同时取出。因因此可不论其其次序。放回回抽样是抽一一个,将其放放回,均匀混混合后再抽下下一个。这时时要讲究先后后次序,现对对上例采取放放回抽样方式式讨论事件BBm=“恰好有m个个不合格品”的概率。从N个产品品中每次随机机抽取一个,检检查后放回再再抽第二个,这这样直到抽出出第n个产品品为止。由于于每次都有NN种可能,故故在放回抽样样的问题中共共有Nn种等可能的的样本点。事件B0=“全是合格品品”发生必须从从N-M个合合格品中用放放回抽样方式式随机抽取nn次,它共含含有(N-MM)n种取法,故故事件B0的概率为:事件B1=“恰好有一件件不合格品”发生,必须须从N-M个个合格品中用用放回抽样抽抽取n-1次次,而从M个个不合格品中中抽一次。这这样就有M(N-M)nn-1种取法法。再考虑到到不合格品出出现次序(不不合格品可能能在第一次抽抽样出现,也也可能在第二二次抽样中出出现,也可能在在第n次抽样样中出现)故故B1所含样本点点的个数共有有nM(N-M)n-11。故事件BB1的概率为:类似地,事事件Bm共含有个样本点。其中中组合数是由于考虑到mm个不合格品品在n次放回回抽样中出现现的次序所致致,故Bm发生的概率率为:特别,当m=nn时,P(BBn)=(M/N)n。假如给定NN=10,MM=2,n=4,在放回回抽样场合来来计算诸Bmm的概率。先先计算:这是在一次抽样样中,抽出不不合格品的概概率;这是在一次抽样样中,抽出合合格品的概率率。于是诸Bmm发生的概率率为:P(B0)=0.844=0.40096P(B1)=4×0.2×0.83=0.40096P(B4)=0.244=0.00016可见,在放放回抽样中,BB0和B1发生的可能能性最大,而而B4发生的可能能性很小,BB4在10000次中发生还还不到二次。(二)统计计定义用概率的统统计定义确定定概率方法的的要点如下:(1)与考考察事件A有有关的随机现现象是可以大大量重复试验验的;(2)若在在n次重复试试验中,事件件A发生knn次,则事件件A发生的频频率为:频率fn(A)确能反映事事件A发生的的可能性大小小;(3)频率率fn(A)将会会随着重复试试验次数不断断增加而趋于于稳定,这个个频率的稳定定值就是事件件A的概率。在在实际中人们们无法把一个个试验无限次次地重复下去去、只能用重重复试验次数数n较大时的的频率去近似似概率。例1.22-6说明明频率稳定的的例子(1)为了了验证掷一枚枚均匀硬币出出现正面的概概率为0.55,许多人做做了大量的重重复试验,图图1.2-110记录了前前400次掷掷硬币试验中中频率f(正正面)的变化化情况,在重重复次数N较较小时,f波波动剧烈,随随着N的增大大,f波动的的幅度在逐渐渐变小。历史史上有不少人人做过更多次次重复试验。其其结果(见表表1.2-11)表明,正正面出现的频频率逐渐稳定定在0.5。这这个0.5就就是频率的稳稳定值,也是是正面出现的的概率。这与与用古典方法法计算的概率率是相同的。(2)在英英语中某些字字母出现的频频率远高于另另外一些字母母。人们对各各类的英语书书刊中字母出出现的频率进进行了统计。发发现各个字母母的使用频率率相当稳定,其其使用频率见见表1.2-2。这项研研究在计算机机键盘设计(有方便的地地方安排使用用频率较高的的字母健)、印印刷铅字的铸铸造(使用频频率高的字母母应多铸一些些)、信息的的编码(使用用频率高的字字母用较短的的码)、密码码的破译等等等方面都是十十分有用的。三、概率的的性质及其运运算法则(一)概率率的基本性质质及加法法则则根据概率的的上述定义,可可以看出它具具有以下基本本性质:性质1:概概率是非负的的,其数值介介于0与1之之间,即对任任意事件A,有有:0P(AA)1特别,不可可能事件的概概率为0,必必然事件的概概率为1,即即:P()=0,P()=1性质2:若若是A的对立立事件,则:P(A)+P()=11或P()=11-P(A)性质3:若若A>B,则则:P(A-BB)=P(AA)-P(BB)性质4:事事件A与B的的并的概率为为:P(ABB)=P(AA)+P(BB)-P(AAB)这个性质称称为概率的加加法法则,可可以从图1.1-5中看看出。特别当当A与B不相相容时,由于于P(AB)=P()=0,则则:P(A UU B)=PP(A)+PP(B)性质5:对对于多个互不不相容事件AA1,A2,A3,也有类似似的性质:P(A1A2A3)=P(A1)+P(AA2)+P(AA3)+下面的例子子可帮助我们们理解这些性性质。例1.22-7抛三三枚硬币,至至少一个正面面出现(记为为事件A3)的概率是是多少?解:在抛三三枚硬币的随随机试验中,诸诸如(正,反反,正)这样样的样本点共共有8个。AA3中所含这样样的样本点较较多,但其对对立事件=“抛三枚硬币币,全是反面面”=(反,反反,反),只只含一个样本本点,从等可可能性可知PP()=1/8。再由性性质1,立即即可得:P(A3)=1-P()=1-11/8=7/8=0.8875例1.22-8一批批产品共1000件,其中中5件不合格格品,现从中中随机抽出110件,其中中最多有2件件不合格品的的概率是多少少?解:设A表表示事件“抽出10件件中恰好有ii件不合格品品”,于是所求求事件A=“最多有2件件不合格品”可表示为:A=A0A1 U A2并且A0,A1,A2为三个互不不相容事件,由由性质(5)P(A)=P(A0)+P(AA1)+P(AA2)。余下就就是用古典方方法算得:AAi的概率。据据A0的定义,从从100件产产品随机抽出出10件的所所有样本点共共有)个。要要使抽出的110件产品中中有0件不合合格品,即全全是合格品,则则10件必须须从95件合合格品中抽取取,所以:类似地可算算得:于是所求的概率率是:P(A)=0.58337+0.33394+00.07022=0.99933 可见见事件A发生生的概率很接接近于1,发发生的可能性性很大;而它它的对立事件件=“抽10件产产品中至少33件不合格品品”的概率P()=1-PP(A)=11-0.99933=0