质量专业基础理论与实务-初级.docx
《质量专业基础理论与实务-初级.docx》由会员分享,可在线阅读,更多相关《质量专业基础理论与实务-初级.docx(38页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、质量专业基础理论与实务-初级第一章概率统计基础学问 第一节质量特性数据的统计规律 一、总体、个体与样本 产品的质量可以用一个或多个质量特性来表示。这里的特性可以是定量的,也可以是定性的。例如灯泡的寿命,钢的成分等都是定量特性;而按规范判定产品为合格或不合格,则是一种定性特征。 在质量管理中,通常探讨一个过程中生产的全体产品。在统计中,将探讨、考察对象的全体称为总体。例如某个工厂在一个月内根据肯定材料及肯定工艺生产的一批灯泡。总体是由个体组成的。在上例中,这批灯泡中的每个特定的灯泡都是一个个体。假如总体中包含的个体数不大,而对产品质量特性的观测(例如测量)手段不是破坏性的,工作量也不大,那么有可
2、能对总体中的每个个体都进行观测,以得到每个个体的质量特性值。但是假如总体中的个体数 N 很大,甚至是无限的,或者观测是破坏性的或观测的费用很大,那么不行能对总体中的每个个体都进行观测。通常的做法是从总体中抽取一个或多个个体来进行观测。抽出来的这一部分个体组成一个样本,样本中所包含的个体数目称为样本量。通过对样本的观测来对总体特性进行探讨,是统计的核心。 上述总体、个体和样本的概念是统计的基本概念,从上面的叙述中,这些概念都可以是详细的产品。但有时为了表达的便利,当探讨产品某个特定的质量特性 X 时,也常把全体产品的特性看做为总体,而把一个详细产品的特性值 x 视为个体,把从总体中抽出的由 n
3、个产品的特性值 x 1 ,x 2 ,x n 看做为一个样本。 例 1.1-1从一个工厂一个月内生产的一批灯泡中抽取 n=8 个灯泡,进行寿命试验,得到这 8 个灯泡的运用寿命为(单位为小时): 325,84,1244,870,645,1423,1071,992这 8 个灯泡或相应的运用寿命即为一个样本,样本量 n=8。课 堂 是 师 生 活 动 的 主 要 场 所 , 课 堂 教 学 是 促 进 学 生 成 长 和 实 现 教 师 自 身 发 展 的 主 要 途 径 。追 求 课 堂 教 学 的 有 效 性 , 已 成 为 各 级 学 校 现 阶 段 深 化 课 程 改 革 和 推 进 素 质
4、 教 育 的 首 要 问 题 。初 中 数 学 课 堂 的 有 效 教 学 课 堂 是 师 生 活 动 的 主 要 场 所 , 课 堂 教 学 是 促 进 学 生 成 长 和 实 现 教 师 自 身 发 展 的 主 要 途 径 。追 求 课 堂 教 学 的 有 效 性 , 已 成 为 各 级 学 校 现 阶 段 深 化 课 程 改 革 和 推 进 素 质 教 育 的 首 要 问 题 。初 中 数 学 课 堂 的 有 效 教 学从总体中抽取样本的方法称为抽样。为使抽取的样本对总体有代表性,样本不能是有选择的,最好应是随机抽取的,关于这一点,以后我们还要具体说明。 二、频数(频率)直方图及累积频数
5、(频率)直方图 为探讨一批产品的质量状况,须要探讨它的某个质量特性(这里为了叙述简洁起见,仅探讨一个质量特性,有必要时也可以同时探讨多个质量特性)X 的改变规律。为此,从这批产品(总体)中抽取一个样本(设样本量为 n),对每个样本产品进行该特性的测量(观测)后得到一组样本观测值,记为 x 1 ,x 2 ,x n ,这便是我们通常说的数据。 为了探讨数据的改变规律,须要对数据进行肯定的加工整理。直方图是为探讨数据改变规律而对数据进行加工整理的一种基本方法。下面用一个例子来说明直方图的概念及其作法。 例 1.1-2食品厂用自动装罐机生产罐头食品,从一批罐头中随机抽取 100 个进行称量,获得罐头的
6、净重数据如下: 为了解这组数据的分布规律,对数据作如下整理: (1)找出这组数据中的最大值 x max 及最小值 x min ,计算它们的差 R=x max -x min ,R 称为极值,也就是这组数据的取值范围。在本例中 x max =356,x min =332,从而 R=356-332=24。质量专业理论与实务 课 堂 是 师 生 活 动 的 主 要 场 所 , 课 堂 教 学 是 促 进 学 生 成 长 和 实 现 教 师 自 身 发 展 课 堂 是 师 生 活 动 的 主 要 场 所 , 课 堂 教 学 是 促 进 学 生 成 长 和 实 现 教 师 自 身 发 展 的 主 要 途
7、径 。追 求 课 堂 教 学 的 有 效 性 , 已 成 为 各 级 学 校 现 阶 段 深 化 课 程 改 革 和 推 进 素 质 教 育 的 首 要 问 题 。初 中 数 学 课 堂 的 有 效 教 学 的 主 要 途 径 。追 求 课 堂 教 学 的 有 效 性 , 已 成 为 各 级 学 校 现 阶 段 深 化 课 程 改 革 和 推 进 素 质 教 育 的 首 要 问 题 。初 中 数 学 课 堂 的 有 效 教 学3 (2)依据数据个数,即样本量 n,确定分组数 k 及组距 h。 一批数据原委分多少组,通常依据 n 的多少而定,不过这也不是肯定的,表 1.1-1 是可以参考的分组数
8、。 选择 k 的原则是要能显示出数据中所隐藏的规律,组数不能过多,但也不能太少。 每一组的区间长度,称为组距。组距可以相等,也可以不相等。组距相等的状况用得比较多,不过也有不少情形在对应于数据最大及最小的一个或两个组,运用与其他组不相等的组距。对于完全相等的组距,通常取组距 h 为接近 R/k 的某个整数值。 在本例中,=100,取 k=9,R/k=24/9=2.7,故取组距 h=3。 (3)确定组限,即每个区间的端点及组中值。为了避开一个数据可能同时属于两个组,因此通常将各组的区间确定为左开右闭的: (a 0 ,a 1 ,(a 1 ,a 2 ,(a k-1 ,ak通常要求 a 0 lt;x
9、min ,a k gt;x max 。在等距分组时,a 1 =a 0 +h,a 2 =a 1 +h,a k =a k-1 +h,而每一组的组中值 在本例中取 a 0 =331.5,则每组的组限及组中值见表 1.1-2。 (4)计算落在每组的数据的频数及频率 确定分组后,统计每组的频数,即落在组中的数据个数 n i 以及频率f i =n i /n,列出每组的频数、频率表,见表 1.1-2。课 堂 是 师 生 活 动 的 主 要 场 所 , 课 堂 教 学 是 促 进 学 生 成 长 和 实 现 教 师 自 身 发 展 的 主 要 途 径 。追 求 课 堂 教 学 的 有 效 性 , 已 成 为
10、各 级 学 校 现 阶 段 深 化 课 程 改 革 和 推 进 素 质 教 育 的 首 要 问 题 。初 中 数 学 课 堂 的 有 效 教 学 课 堂 是 师 生 活 动 的 主 要 场 所 , 课 堂 教 学 是 促 进 学 生 成 长 和 实 现 教 师 自 身 发 展 的 主 要 途 径 。追 求 课 堂 教 学 的 有 效 性 , 已 成 为 各 级 学 校 现 阶 段 深 化 课 程 改 革 和 推 进 素 质 教 育 的 首 要 问 题 。初 中 数 学 课 堂 的 有 效 教 学 (5)作频数频率直方图 在横轴上标上每个组的组限,以每一组的区间为底,以频数(频率)为高画一个矩形
11、,所得的图形称为频数(频率)直方图,如图 1.1-1。到在本例中频数直方图及频率直方图的形态是完全一样的。这是因为分组是等距的。 在分组不完全等距的情形,在作频率直方图时,应当用每个组的频率与组距的比值 f i /h i 为高作矩形。此时以每个矩形的面积表示频率。 (6)累积频数和累积频率直方图 还有另一种直方图运用的是累积频数和累积频率。以累积频率直方图为例,首先要计算累积频率 F i ,F i 是将这一组的频率与前面全部组的频率累加,也即第 1 组的 F 1 =f 1 ,第 2 组的 F 2 =f 1 +f 2 ,一般的,F i = f j 。本例中的各组 F i 值也见表 1.1-2。
12、假如以每组的累积频率 F i 为高作矩形,所得的直方图称为累积频率直方图,本例中的累积频率直方图如图 1.1-2 所示。 可以从直方图获得数据的分布规律,其中包含数据取值的范围,以及它们的集中位置和分散程度等信息。质量专业理论与实务 课 堂 是 师 生 活 动 的 主 要 场 所 , 课 堂 教 学 是 促 进 学 生 成 长 和 实 现 教 师 自 身 发 展 课 堂 是 师 生 活 动 的 主 要 场 所 , 课 堂 教 学 是 促 进 学 生 成 长 和 实 现 教 师 自 身 发 展 的 主 要 途 径 。追 求 课 堂 教 学 的 有 效 性 , 已 成 为 各 级 学 校 现 阶
13、段 深 化 课 程 改 革 和 推 进 素 质 教 育 的 首 要 问 题 。初 中 数 学 课 堂 的 有 效 教 学 的 主 要 途 径 。追 求 课 堂 教 学 的 有 效 性 , 已 成 为 各 级 学 校 现 阶 段 深 化 课 程 改 革 和 推 进 素 质 教 育 的 首 要 问 题 。初 中 数 学 课 堂 的 有 效 教 学5应当引起留意的是,假如我们观测的数据量(即样本量)n 很大,而分组又很细,那么从频率直方图及累积频率直方图可以分别得到一根光滑曲线,关于这一点我们将在本章第三节具体探讨。 三、数据集中位置的度量课 堂 是 师 生 活 动 的 主 要 场 所 , 课 堂
14、教 学 是 促 进 学 生 成 长 和 实 现 教 师 自 身 发 展 的 主 要 途 径 。追 求 课 堂 教 学 的 有 效 性 , 已 成 为 各 级 学 校 现 阶 段 深 化 课 程 改 革 和 推 进 素 质 教 育 的 首 要 问 题 。初 中 数 学 课 堂 的 有 效 教 学 课 堂 是 师 生 活 动 的 主 要 场 所 , 课 堂 教 学 是 促 进 学 生 成 长 和 实 现 教 师 自 身 发 展 的 主 要 途 径 。追 求 课 堂 教 学 的 有 效 性 , 已 成 为 各 级 学 校 现 阶 段 深 化 课 程 改 革 和 推 进 素 质 教 育 的 首 要 问
15、 题 。初 中 数 学 课 堂 的 有 效 教 学对一组样本数据,可以用一些量表示它们的集中位置。这些量中,常用的有样本均值、样本中位数和样本众数。 (一)样本均值 样本均值也称样本平均数,记为 ,它是样本数据 x 1 ,x 2 ,x n 的算术平均数: 例 1.1-3轴直径的一个 n=5 的样本观测值(单位:cm)为:15.09,15.29,15.15,15.07,15.21,则样本均值为: = 15.09+15.29+15.15+15.07+15.21)=15.162 对于 n 较大的分组数据,可利用将每组的组中组 x i 用频率 f i 加权计算近似的样本均值: 例 1.1-4在例 11
16、.2 中,100 个罐头的净量的均值按分组计算为: =333 × 0.01 十 336 × 0.04 十 339 × 0.11+ +357 × 0.01 =34508/100=345.08 样本均值是运用最为广泛的反映数据集中位置的度量。它的计算比较简洁,但缺点是它受极端值的影响比较大。 (二)样本中位数 样本中位数是表示数据集中位置的另一种重要的度量,用符号 Me 或表示。在确定样本中位数时,须要将全部样本数据按其数值大小从小到大重新排列成以下的有序样本: x (1) ,x (2) ,x (n) 其中 x (1) =x min ,x (n) =
17、x max 分别是数据的最小值与最大值。 样本中位数定义为有序样本中位置居于中间的数值,详细地说:质量专业理论与实务 课 堂 是 师 生 活 动 的 主 要 场 所 , 课 堂 教 学 是 促 进 学 生 成 长 和 实 现 教 师 自 身 发 展 课 堂 是 师 生 活 动 的 主 要 场 所 , 课 堂 教 学 是 促 进 学 生 成 长 和 实 现 教 师 自 身 发 展 的 主 要 途 径 。追 求 课 堂 教 学 的 有 效 性 , 已 成 为 各 级 学 校 现 阶 段 深 化 课 程 改 革 和 推 进 素 质 教 育 的 首 要 问 题 。初 中 数 学 课 堂 的 有 效 教
18、 学 的 主 要 途 径 。追 求 课 堂 教 学 的 有 效 性 , 已 成 为 各 级 学 校 现 阶 段 深 化 课 程 改 革 和 推 进 素 质 教 育 的 首 要 问 题 。初 中 数 学 课 堂 的 有 效 教 学7例 1.1-5对例 1.1-3 中的 5 个轴直径数据进行按从小到大的重新排序,得到如下有序样本: 15.07 , 15.09 , 15.15 , 15.21 , 15.29 这 里 n=5 为 奇 数 ,(n+1)/2=3,因而样本中位数 Me=x (3) =15.15。 留意,在此例中,中位数 15.15 与均值 15.162 很接近。 与均值相比,中位数不受极端
19、值的影响。因此在某些场合,中位数比均值更能代表一组数据的中心位置。 (三)样本众数 样本众数是样本数据中出现频率最高的值,常记为 Mod。例如对例1.1-2 中的罐头净量,100 个数据中,344 出现的次数最多,为 12 次,因此 Mod=344。样本众数的主要缺点是受数据的随机性影响比较大,而且对大的 n,也很难确定,有时也不惟一,此时较多地采纳分组数据。在本例中第 5 组(343.5,346.5的频率为 0.30,是全部组中最高的,因而该组的组中值 345 可以作为众数的估计。留意到该数与前面定的 344 相差不大。 四、数据分散程度的度量 一组数据总是有差别的,对一组质量特性数据,大小
20、的差异反映质量的波动。也有一些用来表示数据内部差异或分散程度的量,其中常用的有样本极差、样本方差、样本标准差和样本变异系数。 (一)样本极差 样本极差即是样本数据中最大值与最小值之差,用 R 表示。对于有序样本,极差 R 为: R=x (n) -x (1) (1.1-4) 例如在例 1.1-3,5 个轴直径数据的极差 R=15.21-15.09=0.12。 样本极差只利用了数据中两个极端值,因此它对数据信息的利用不够充分,极差常用于 n 不大的状况。 (二)样本方差与标准差 数据的分散程度可以用每个数据 x i 离其均值 的差 x i - 来表示,x i - 称为 x i 的离差。对离差不能干
21、脆取平均,因为离差有正有负,取平均会正负课 堂 是 师 生 活 动 的 主 要 场 所 , 课 堂 教 学 是 促 进 学 生 成 长 和 实 现 教 师 自 身 发 展 的 主 要 途 径 。追 求 课 堂 教 学 的 有 效 性 , 已 成 为 各 级 学 校 现 阶 段 深 化 课 程 改 革 和 推 进 素 质 教 育 的 首 要 问 题 。初 中 数 学 课 堂 的 有 效 教 学 课 堂 是 师 生 活 动 的 主 要 场 所 , 课 堂 教 学 是 促 进 学 生 成 长 和 实 现 教 师 自 身 发 展 的 主 要 途 径 。追 求 课 堂 教 学 的 有 效 性 , 已 成
22、 为 各 级 学 校 现 阶 段 深 化 课 程 改 革 和 推 进 素 质 教 育 的 首 要 问 题 。初 中 数 学 课 堂 的 有 效 教 学相抵,无法反映分散的真实状况。当然可以先将其取肯定值,再进行平均,这就是平均肯定差: 但是由于对肯定值的微分性质较差,理论探讨较为困难,因此平均肯定差运用并不广泛。运用最为广泛的是用离差平方来代替离差的肯定值,因而数据的总波动用离差平方和 来表示,样本方差定义为离差平方和除以 n-1,用 s2 表示: 因为 n 个离差的总和为 0,所以对于 n 个独立数据,独立的离差个数只有 n-1 个,称 n-1 为离差(或离差平方和)的自由度,因此样本方差是
23、用n-1 而不是用 n 除离差平方和。 样本方差正的算术平方根称为样本标准差,即: 留意标准差的量纲与数据的量纲一样。 在详细计算时,离差平方和也可用以下两个简便的公式: 因此样本方差计算可用以下公式:质量专业理论与实务 课 堂 是 师 生 活 动 的 主 要 场 所 , 课 堂 教 学 是 促 进 学 生 成 长 和 实 现 教 师 自 身 发 展 课 堂 是 师 生 活 动 的 主 要 场 所 , 课 堂 教 学 是 促 进 学 生 成 长 和 实 现 教 师 自 身 发 展 的 主 要 途 径 。追 求 课 堂 教 学 的 有 效 性 , 已 成 为 各 级 学 校 现 阶 段 深 化
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 质量 专业 基础理论 实务 初级
限制150内