商务统计学演示教学.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《商务统计学演示教学.ppt》由会员分享,可在线阅读,更多相关《商务统计学演示教学.ppt(247页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、商务统计学前言一、商务统计课程的性质二、商务统计学习的方法一、统计学的性质(一)统计活动的内容与阶段 对各种数据资料的搜集、整理、分析和推断的活动过程称为统计活动,一项完整的统计活动过程可分为统计资料的搜集整理和统计资料的分析推断两大阶段。(二)统计学的定义与分科 统计学就是关于数据资料的搜集、整理、分析和推断的科学。关于统计资料的搜集整理和分析推断的理论与方法构成了统计学的全部内容。(1)理论统计学与应用统计学 (2)描述统计学与推断统计学二、统计学的作用(一)统计学在科学研究中的作用提出假说并判定假说的正确与否(二)统计学在生产中的作用通过试验分析找出最佳工艺,并对生产过程进行统计质量控制
2、。(三)统计学在管理中的作用抽样调查了解社会与市场,为决策提供依据;并可建立各种社会与经济发展模型,定量地模拟社会与经济的运行,既可分析社会与经济的发展及其结构变化,又可进行政策效果的评价。三、统计学的基本概念(一)总体和个体 组成统计活动研究对象的全部事物的全体集合,就称为统计总体,简称总体或母体;而总体中的各个事物则称为个体,总体中个体的数量称为总体容量。1、自然物体总体与人为划定个体的总体;2、有限总体与无限总体;3、具体总体与设想总体(抽象总体)。三、统计学的基本概念(二)统计指标及其测度(二)统计指标及其测度 用来测度统计活动研究对象某种特征数量的概念称为统计指标,简称指标。其中,测
3、度总体特征数量的概念称为总体指标,而测度个体特征数量的概念则称为个体指标。指标的测度计量尺度有(指标的测度计量尺度有(1 1)定类尺度,(2)定序尺度,(3)定距尺度,(4)定比尺度。三、统计学的基本概念(三)样本和统计推断 1、样本从总体中随机抽出的部分个体所组成的集合称为样本或子样,样本中所含个体的数目称为样本容量。2、统计推断根据样本观测资料来对总体的分布状况和分布特征进行推断。3、样本数据的分类(1)横截面数据,(2)时间序列数据。四、统计指标体系及其设计(一)统计指标体系的定义 反映总体及其所含个体的各个方面特征数量的一系列相互联系、相互补充的统计指标所形成的体系,称为统计指标体系。
4、(二)构建统计指标体系的意义(三)指标体系中指标的分类 1、水平指标(1)存量指标与流量指标,(2)实物指标与价值指标。2、比率指标(1)比例相对指标,(2)比值相对指标,(3)动态相对指标,(4)弹性相对指标,(5)强度相对指标。(四)指标体系设计的内容1 1、确定统计指标体系的框架;、确定统计指标体系的框架;2 2、确定每一个指标的内涵和外延;、确定每一个指标的内涵和外延;3 3、确定每个统计指标的计量单位;、确定每个统计指标的计量单位;4 4、确定每个统计指标的计算方法。、确定每个统计指标的计算方法。(五)指标体系设计的原则1、目的性原则2、科学性原则3、可行性原则4、联系性原则第二章
5、数据采集与整理一、数据采集的方式与程序二、现场调查三、试验观测四、数据的整理显示一、数据采集的方式与程序(一)数据采集根据统计指标体系的要求,对所研究总体中个体的相应指标进行观测记录取得数据的活动过程。(二)数据采集活动的基本要求采集到的数据资料要具有代表性和真实性。所谓代表性,是要求所观测到的样本必须对所研究总体具有代表性;而所谓真实性,则是要求所采集到的数据必须是真实的实际数据。(三)数据采集方式的分类现场调查和试验观测 一、数据采集的方式与程序(四)数据采集的程序 1、制定数据采集方案包括(1)采集数据的目的,(2)采集总体和观测单位,(3)观测指标数值登记表,(4)采集方式和组织,(5
6、)采集时间和期限。2、现场观测登记 3、数据整理显示二、现场调查(一)调查的取样方式 1、随机抽样调查 (1)简单随机抽样,(2)系统抽样,(3)分层抽样,(4)整群抽样。2、非随机抽样调查 (1)任意抽样,(2)立意抽样,(3)配额抽样。3、概率抽样和非概率抽样的特点比较二、现场调查(二)现场调查的观测方式 1、访问法 (1)口头访问当面访问或电话访问 (2)书面访问邮局或互联网邮件传递,以及登门送收 2、观察法二、现场调查(三)现场调查的问卷设计 1、提问方式 (1)封闭型提问 (2)开放型提问 2、提问次序三、试验观测(一)试验观测设计的原则 1、均衡分散性原则 2、整齐可比性原则(二)
7、试验观测的方法 1、完全随机试验观测 2、随机区组试验观测 3、拉丁方试验观测 4、正交试验观测四、数据整理与显示(一)构建观测资料数据库的意义与方法(二)观测数据的分类显示 1、观测个体的分类 (1)分类的功能与原则 (2)分类的方法 2、统计表的编制 (1)统计表的构成 (2)统计表的编制规则内容安排科学合理,形式设计简练美观。第三章 次数分布 一、次数分布的概念 二、次数分布表及其编制 三、次数分布图 四、次数分布的理论模型及其表示方法 五、离散变量概率分布模型 六、连续变量概率分布模型一、次数分布的概念(一)次数分布:观测变量的各个不同取值及其出现次数的顺序排列,称为变量的次数分布。(
8、二)总体次数分布和样本次数分布(三)次数分布的作用观测变量的次数分布包含了观测变量取值的全部信息。根据观测变量的次数分布,可以对观测变量的各种分布特征进行描述和分析。二、次数分布表及其编制(一)次数分布表的种类 1、单值分组次数分布表 2、组距分组次数分布表(二)组距分组次数分布表的编制方法 1、确定组数 等距分组的斯特吉斯公式:m=1+3.322lgN 2、确定组距 等距分组的参考组距:3、确定组限 4、计数各组的次数 5、列出次数分布表 三、次数分布图用线和面等形状来显示观测变量次数分布状况的几何图形,称为次数分布图。常用的次数分布图主要有柱状图、直方图和折线图等几种。四、次数分布的理论模
9、型(一)理论分布模型的概念与意义 随机变量取某个数值或在某个区间取值是一个随机事件,使用概率理论计算的随机变量在各个数值上或在各个区间内取值的概率分布,就是随机变量的理论分布,计算此理论分布的概率理论模型就是其理论分布模型。在现实生活中,各种观测变量的概率分布都可以用某个理论概论分布模型去近似描述。因此就可据此理论分布模型进行分析推断。四、次数分布的理论模型(二)理论分布模型的表示方法 1、概率分布表 2、概率分布图 3、概率分布函数式五、离散变量概率分布模型 记所考察的离散变量为x,假设该随机变量共可取m个不同的值,它取值为xi的概率为pi,并记随机事件x=xi的概率为P(x=xi),则离散
10、随机变量的概率分布可表示为:P(x=xi)=pi;i=1,2,m.在统计分析推断中,常用的离散变量概率分布模型主要有两点分布、二项分布、超几何分布和泊松分布等几种。(一)两点分布 假设总体中有两类共N个个体,其中取值为“是”的有N1个,取值为“非”的有N0个,则有:(二)二项分布 假设在0-1分布总体中,取“是”值的个体比例为p,取“非”值的比例为q,现从中有放回地随机抽取n个个体,记X为取“是”值的个体数目,则其中恰有n1个个体取“是”值、且有n0=n-n1个个体取“非”值的概率为:(三)超几何分布 假设0-1总体中共有N个个体,其中取“是”值的个体有N1个,取“非”值的个体有N0个。现从不
11、放回地随机抽取n个个体,记x为取“是”值的个体数目,则其中恰有n1个个体取“是”值、且有n0=n-n1个个体取“非”值的概率为:(四)泊松分布 泊松分布是稀有事件出现次数的理论分布模型,如自然灾害、意外事故、机器故障等事件出现的次数都近似地服从泊松分布。泊松分布概率模型为:六、连续变量概率分布模型 连续型随机变量的取值范围可以是数轴上的某个区间,也可以是整个数轴。由于它可以取无穷多个不同的数值,所以描述其概率分布的最完善方法是概率函数式。在理论分析中,描述连续变量概率分布的最常用的概率函数式是概率分布密度函数。在统计分析推断中,常用的连续随机变量概率分布模型主要有均匀分布、正态分布、2分布、t
12、分布和F分布等几种。(一)均匀分布 若随机变量x在区间a,b 上服从均匀分布,则该随机变量的概率密度函数为:(二)正态分布 若随机变量x服从正态分布,则其概率密度函数就为:(三)2分布分布 若随机变量z1、z2、zn都服从标准正态分布N(0,1),且两两之间相互独立,则这些标准正态变量的平方和x就服从2分布,其概率密度函数为:(四)t分布 若随机变量z N(0,1),x2(n),且二者相互独立,则:服从学生氏t分布,概率密度函数为:(五)F分布若随机变量xm2(m),xn2(n),旦二者相互独立,则:服从F分布,其概率密度函数为:第四章 分布特征测度一、分布中心二、离散程度三、偏度与峰度四、相
13、关程度一、分布中心测度的意义(一)分布中心的概念所谓分布中心,就是指随机变量的一切取值的散布中心。(二)测度分布中心的意义 1、随机变量的分布中心是随机变量一切取值的一个代表,可以用来反映其数值的一般水平。2、随机变量的分布中心可以揭示随机变量一切取值的次数分布在直角坐标系内的集中位置,可以用来反映随机变量分布密度曲线的中心位置,即对称中心或尖峰位置。二、分布中心测度指标 用来测度随机变量次数分布中心的指标可以有多种,其中在统计分析推断中常用的主要有算术平均数、中位数和众数等几种。(一一)算术平均数)算术平均数 1、定义算术平均数又称算术均值,是随机变量的所有观测值总和与观测值个数的比值。2、
14、计算方法(1)简单算术平均数简单算术平均数适用于未分组整理的各个单个观测数值,其计算公式为:(一一)算术平均数)算术平均数(2)加加权权算算术术平平均均数数适用于已分组整理的次数分布数据,其计算公式为:(一一)算术平均数)算术平均数(3)算算术术平平均均数数的的变变形形调调和和平平均均数数。对于由观测变量的各个分组和各组变量总值顺序排列所形成的分组数据。算术平均数的公式需变换成调和平均数的形式:当各组的变量总值mi相等时,就可简化为:(一一)算术平均数)算术平均数3 3、理论分布的算术平均数、理论分布的算术平均数数学期望数学期望 (1)定义 对于离散型随机变量,假设有n个不同的取值,其中取某个
15、数值xi的概率为pi,则该随机变量的数学期望可用算术平均数公式定义为:对于连续型随机变量,仍可用算术平均数定义其数学期望,不过因为连续变量求和要用定积分,所以定义中需要用定积分符号代替总和符号,即:(一一)算术平均数)算术平均数3 3、理论分布的算术平均数、理论分布的算术平均数数学期望数学期望 (2 2)例子)例子 例如,对于服从两点分布的随机变量x,其不同的取值只有1和0,其中取1的概率为p,取0的概率为q=1-p,则其数学期望为:又如,对于服从位置参数为且尺度参数为2的正态分布的随机变量x,由其概率密度函数可计算出其数学期望就是其位置参数。标准正态分布随机变量的数学期望为0。(一)算术平均
16、数 (3)数学期望的性质 若c为常数,则必有:E(c)=c 若c为任意常数,x为随机变量,则必有:E(cx)=cE(x)若x1、x2、xm均为随机变量,则必有:E(x1+x2+xm)=E(x1)+E(x2)+E(xm)若x1、x2、xm均为随机变量,且相互独立,则:E(x1x2xm)=E(x1)E(x2)E(xm)若x是随机变量,则必有:E(x)E(x)(二)中位数1 1、定义、定义 中位数是在按观测变量值的大小顺序排列所形成的变量值数列中点位置上的变量值。对于观测变量x,假设共取得n个观测值,各个观测值按大小顺序排列为x(1)、x(2)、x(n),则其中位数可定义为:(二)中位数2、组距分组
17、次数分布数据 的中位数计算(三)众数1、定义:众数是随机变量的观测值中出现次数或密度最大的变量观测值。2、组距分组次数分布数据计算众数 三三、均值、中位数和众数三者、均值、中位数和众数三者之间的关系之间的关系 对于对称分布,有:对于右偏分布,有:对于左偏分布,有:经验关系式:四、离散程度测度的意义离散程度测度的意义(一)离散程度的概念所谓离散程度,即观测变量各个取值之间的差异程度。(二)离散程度测度的意义 1、通过对随机变量取值之间离散程度的测定,可以反映各个观测个体之间的差异大小,从而也就可以反映分布中心指标对各个观测变量值代表性的高低。2、通过对随机变量取值之间离散程度的测定,可以反映随机
18、变量次数分布密度曲线的瘦俏或矮胖程度。五、离散程度测度指标离散程度测度指标 可用来测度观测变量值之间差异程度的指标有很多,在统计分析推断中最常用的主要有极差、平均差和标准差等几种。(一)极差极差又称全距,是观测变量的最大取值与最小取值之间的离差,也就是观测变量的最大观测值与最小观测值之间的区间跨度。极差的计算公式为:R=Max(xi)-Min(xi)(二)平均差平均差是随机变量各个取值偏差绝对值的算术平均数。由于所掌握数据形式的不同,平均差的计算有简单平均差和加权平均差两种不同的方式。(三)标准差标准差是随机变量各个取值偏差平方的平均数的算术平方根,是最常用的反映随机变量分布离散程度的指标。标
19、准差既可以根据样本数据计算,也可以根据观测变量的理论分布计算,分别称为样本标准差和总体标准差。1、样本标准差的计算样本标准差的计算(1)对于未分组整理的各个观测变量值数据,计算标准差应采用简单平均的方法。(2)对于已分组整理的分组次数分布数据,计算标准差应采用加权平均的方法。2、理论分布的标准差与方差理论分布的标准差与方差(1)定义 标准差是最常用的理论分布模型正态分布的参数之一,在理论分析中最常用来描述随机变量分布的离散程度。标准差的平方称为方差,与标准差有着同样的作用。随机变量x的理论分布的方差常记为Var(x)或2,其定义为:2=Var(x)=Ex-E(x)22、理论分布的标准差与方差理
20、论分布的标准差与方差(2)离散随机变量的方差 对于离散随机变量x,假设共有n个不同取值,取值xi的概率为pi,i=1、2、n,则方差为:例如,对于服从两点分布的随机变量x,其取值为1的概率为p,取值为0的概率为q=1-p,数学期望为E(x)=p,则其方差为:Var(x)=(1-p)2p+(0-p)2q=pq2、理论分布的标准差与方差理论分布的标准差与方差(3)连续随机变量的方差 对于连续型随机变量x,假设其分布密度函数f(x),则其方差的计算公式为:例如,对于服从位置参数为且尺度参数为2的正态分布的随机变量x,其数学期望等于其位置参数,其方差就是其尺度参数2,标准正态分布的方差为1。2、理论分
21、布的标准差与方差理论分布的标准差与方差(4)方差的性质 任何随机变量的方差均非负。Var(x)0 若c为常数,x为随机变量,则有:Var(cx)=c2Var(x)若随机变量x1、x2、xm均相互独立,则有:Var(x1+x2+xm)=Var(x1)+Var(x2)+Var(xm)若x为随机变量,c为任一常数,则有:E(x-c)2=Ex-E(x)2+c-E(x)2 对于任意随机变量x,均有:Var(x)=E(x2)-E(x)2(四)离散系数1、离散系数的概念各个衡量随机变量取值之间绝对差异的指标与算术平均数的比率,通称为离散系数。2、计算离散系数的意义消除量纲和数量级的差异,便于不同观测变量之间
22、的比较。3、计算公式六、测度偏度和峰度的意义(一)概念所谓偏度,就是观测变量取值分布的非对称程度;所谓峰度,就是观测变量取值分布密度曲线顶部的平坦程度或尖峭程度。(二)意义 1、加深人们对观测变量取值的散布状况的认识;2、将观测变量的偏度和峰度指标值与某种理论分布的偏度和峰度指标值进行比较,以判断观测变量的分布与某种理论分布的近似程度。七、偏度的测度(一)直观偏度系数一)直观偏度系数1、皮尔逊偏度系数皮尔逊偏度系数 2、鲍莱偏度系数鲍莱偏度系数 七、偏度的测度(二)矩偏度系数 1、矩的定义原点矩和中心矩 2、矩偏度系数八、峰度的测度矩峰度系数随机变量的四阶中心矩与其标准差的四次方相除,所得比率
23、就称为峰度系数,其计算公式为:九、相关程度测度的意义相关程度测度的意义(一)相关关系的概念 对于两个观测变量,若一个变量的取值除了受另一个变量取值的影响外,还受各种随机因素的影响,则变量间的这种非确定性关系就称为相关关系。(二)相关关系测度的意义 1、了解两个观测变量之间相关关系的方向;2、了解两个观测变量之间相互依赖关系的程度,为构建观测变量之间相互关系模型奠定基础。十、相关程度测度的指标相关程度测度的指标对两随机变量之间的相关关系及其密切程度进行测度,需要根据两变量观测值的复合分组次数分布进行,或在理论上根据两变量的联合概率分布模型进行。测度观测变量之间相关关系的指标主要有协方差和相关系数
24、两个。(一)协方差1、定义协方差是两个随机变量成对观测值偏差乘积的算术平均数。2、样本协方差(一)协方差3、总体协方差对于两随机变量的理论分布,也可类似地定义其协方差。两随机变量x和y的理论分布的协方差常记作Cov(x,y)或xy,其定义公式为:xy=Cov(x,y)=Ex-E(x)y-E(y)例如,对于联合分布为二元正态分布的随机变量x和y,可得二变量的协方差为:(一)协方差4、协方差的性质 随机变量x与y的协方差和y与x的协方差相等。Cov(x,y)=Cov(y,x)若随机变量x和y相互独立,则有:Cov(x,y)=0 若1和2为任意常数,则有:Cov(1x,2y)=12Cov(x,y)对
25、于任意三个随机变量,均有:Cov(x1+x2,y)=Cov(x1,y)+Cov(x2,y)Cov(x,y1+y2)=Cov(x,y1)+Cov(x,y2)对于任意两随机变量,均有:Cov(x,y)=E(xy)-E(x)E(y)(二)相关系数1、定义相关系数是两个随机变量的协方差对其两标准差之积的比率。2、总体相关系数3、样本相关系数(二)相关系数4、相关系数的取值范围相关系数r的数值介于-1和+1之间,其绝对值介于0和1之间。即有:-1r+15、相关系数的作用(1)相关系数的符号可反映两随机变量相互依存关系的方向。相关系数为正,称为正相关;相关系数为负,称为负相关。(2)相关系数的绝对值的大小
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 商务 统计学 演示 教学
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内