2021-2022年收藏的精品资料统计方法在税收分析中的应用.doc
《2021-2022年收藏的精品资料统计方法在税收分析中的应用.doc》由会员分享,可在线阅读,更多相关《2021-2022年收藏的精品资料统计方法在税收分析中的应用.doc(85页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 目录第一节 统计学概述知识准备一、 统计学的定义二、数据处理(一)统计数据的类型(二)数据预处理的基本步骤三、统计推断的基本原理介绍(一)几个基本概念(二)区间估计(三)假设检验四、相关分析与方差分析(一)相关分析与偏相关分析(二)方差分析第二节 税收收入运行的统计学分析一、税收收入运行的经济性(一)描述统计量(二)相关性分析(三)税收随GDP增长的弹性二、税收收入的内在增长趋势(一)税收收入运行随时间变动的趋势(二)税收增长率分析三、税收收入运行的季节性四、其他常用税收分析方法(一)税源质量的效能位差分析(二)同业税负分析第三节 多元统计分析方法一、聚类分析(一)定义(二)聚类的基本步骤(
2、三)实例:部分国家税收加社保负担率聚类分析二、主成分分析法和因子分析法(一)主成分分析法(二)因子分析法第四节 回归分析一、基本原理(一)一元回归模型(二)多元回归模型二、模型的基本假设和特殊情况处理(一)古典回归模型的假设(二)模型的检验统计量(三)几种特殊情况及处理方法第五节 指数一、加权综合指数(一)拉氏价格指数(二)帕氏价格指数(三)加权平均指数二、常用价格指数(一)消费者物价指数的定义(二)消费者物价指数的作用三、多指标综合评价指数的构建第六节 常用统计分析软件简介SPSS和EVIEWS应用实例一、描述统计量二、相关性分析三、图表演示四、回归分析五、预测六、时序模型季节性差分附: E
3、XCEL软件数据分析功能的应用第一节 数据整理第二节 图表功能一、柱形图二、散点图三、折线图第三节 分析功能一、抽样二、描述统计三、相关系数四、回归五、移动平均参考书目第一节 统计学概述知识准备一、 统计学的定义统计学是收集、处理、分析、解释数据并从数据中得出结论的科学,在多个科学领域有着日益重要的地位。统计学分为描述统计、推断统计、理论统计和应用统计。 统计学是与数据打交道的学科,包括数据收集、数据处理和数据分析。数据收集也就是取得统计数据,这是一切统计分析的立足点;数据处理是将数据用图表等形式展示出来,是数据特征的直观反映;数据分析则是选择适当的统计方法研究数据,并从数据中提取有用信息进而
4、得出结论,这是对数据的精细加工,数据分析的方法宜适当,应能说明问题。数据分析所用的方法可分为描述统计和推断统计。描述统计是指用图形、表格和数值方法来汇总数据的统计学。目的在于描述数据的统计特征,找出数据的基本规律。推断统计是指以一定的置信标准要求,根据样本数据来判断总体数量特征的归纳推理方法。二、数据处理(一)统计数据的类型1、定性数据和定量数据分类数据是指归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为文字表述的类别。例如,人口按性别分为男、女两类。顺序数据是只能归于某一有序类别的非数字型数据,如考试成绩分为优、良、及格、不及格等。数值型数据是按数字尺度测量的观测值,其结果为
5、具体数值。分类和顺序数据统称为定性数据或品质数据;数值型数据可称为定量数据或数量数据。2、 截面数据和时间序列数据横截面数据:在同一时刻或几乎同一时点所收集到的数据。如:多个企业当年利润总额、实缴税收、税负水平等。时间序列数据:在若干个连续时点内所收集到的数据。如:2000年-2005年每年福建省地方税收收入等。区分数据类型十分重要,因为对不同类型的数据应用不同的统计方法来处理。比如:对分类数据我们通常计算出各组频数或频率,计算其众数和异众比率,进行列联表分析和检验等;对于顺序数据可以计算其中位数和四分位差,计算等级相关系数;对于数值型数据可以用更多的统计方法进行分析,计算各种统计量、进行参数
6、估计和检验等。对于横截面数据可以计算集中度和离散度、进行聚类和主成分分析等;对于时间序列数据可以计算时间趋势,建立预测模型进行预测等。(二)数据预处理的基本步骤1、数据收集数据收集是一切统计工作的基础,搜集数据的方法有多种,可以采用统计报表、典型调查、重点调查或抽样调查。(1)统计报表制度指按照国家统一规定的各项要求,自下而上地定期向国家和主管部门报送基本统计资料的一种报告制度。优点:能保证统计资料的全面性和连续性,能保证统计资料的统一性和及时性,能满足各级部门对统计资料的需要。缺点:统计报表过多会增加基层负担,有可能由于虚报瞒报而影响统计资料质量。如:月度税收会统报表等。(2)普查指国家为详
7、尽了解某项重要的国情国力而专门组织的一次性全面调查优点:可以为抽样调查提供抽样框,可以收集统计报表所不能提供的反映重大国情国力的基本统计信息。缺点:由于需要大量的人力、物力和财力,不宜经常进行。如:经济普查、税源普查等。(3)重点调查为了解总体基本情况,在调查对象中只选择一部分重点单位进行调查的一种非全面调查组织方式优点:能以较少的投入和较快的速度取得总体基本情况及变动趋势的资料。缺点:只适用于客观存在着重点单位的情况。如:重点税源监控等。(4)典型调查在对调查对象有一定了解的基础上,有意识地选择少数典型单位进行调查的一种非全面调查组织方式。优点:一定条件下能估计总体指标数值,可以补充全面调查
8、的不足,可以用来研究新生事物。缺点:不能确定推断的把握程度,无法计算和控制推断误差。如:税源典型性个案分析。(5)抽样调查按照随机原则从调查对象中抽取一部分样本单位进行调查,再用样本资料推断把握总体的数量特征的一种非全面调查组织方式。优点:按随机原则抽取样本单位,目的是推断总体的数量特征,抽样误差可以事先计算并控制。能用较少的人力、物力和时间达到全面调查的目的,调查资料的准确性较高、受人为干扰的可能性较小。应用较广,为统计调查的发展方向。2、数据整理:数据整理是指将统计调查得到的原始资料进行科学的分组和汇总形成综合统计资料的工作过程。(1)数据审核:从完整性和准确性两方面审核数据。(2)数据筛
9、选:当数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选。(3)缺失数据处理:在样本数据中,可能出现部分数据点缺失或个别数据点异常波动的情况,几种处理不完备数据集的方法:(3.1)删除元组(3.2)数据补齐平均值填充、众数填充。(3.3)回归基于完整的数据集,建立回归方程模型,将已知属性值带入方程来求未知属性值。(4)数据排序:指按一定顺序将数据排列,以便研究者通过浏览数据发现一些明显的特征或趋势。也对进一步数据重新归类或分组提供方便。(5)数据分组:数据分组是根据统计研究需要,将原始数据按照某种标准划分成不同组别,分组后的数据称为分组数据。其目的在于观察
10、数据的特征。(5.1)几个基本概念频数:落在各类别中的数据个数。组距:一个组上下限间的差。组中值:每一组中上下限值的中间值。开口组组中值=上(下)限+(-)邻组组距/2极差:一组数据最大值和最小值之间的差,也称全距。众数:一组数据中出现次数最多的变量值,用于测度分类数据的集中趋势。中位数:指一组数据排序后处于中间位置上的变量。设一组数据为,按从小到大排序后为,则中位数为:平均数:是集中趋势的主要测度值A、简单平均数B、加权平均数,其中,即样本量。C、几何平均数(5.2)常用分组方法组距分组将变量值的一个区间作为一组,适合于连续变量和变量值较多的情况,分组区间需要遵循“不重不漏”的原则,可采用等
11、距分组,也可采用不等距分组。分组步骤:确定组数:根据 Sturges 提出的经验公式得组数K为:,n为样本数。计算组距:组距=极差/分组数确定组限,编制频数分布表。三、统计推断的基本原理介绍(一)几个基本概念1、概率与概率分布(1)概率:随机试验或观察中,某种事件或结果(随机事件)出现的可能性, 称为概率。基本性质: 非负性 0P(A)1,即事件发生的概率介于0和1之间。正则性 P()=1,即所有事件发生的概率之和恒为1。(2)概率分布:如果有某种形式能够表现出随机变量的取值及其概率,则称这种形式为随机变量的概率分布。 连续型随机变量的概率分布,其中 为密度函数。2、 集中度和离散度(1)样本
12、均值:为样本中各观测值的平均数。,为样本观测值,为频数。n为自由度,为样本数据-1。(2)离散度指标(2.1)样本方差:,为样本观测值,为频数。(2.2)样本标准差s:为样本方差的平方根。(2.3)离散系数:为一组数据的标准差与其相应平均数的比。注意:方差和标准差均是反映数据分散程度的绝对值,而离散系数是测度数据离散程度的相对统计量,消除量纲的影响,可直接用于不同样本间离散程度的比较。(2.4)偏斜度:反映以平均值为中心的不对称程度,正偏斜度表示不对称部分的分布更趋向正值,负偏斜度表示不对称部分的分布更趋向负值。在EXCEL中用SKEW()函数求值。(2.5)峰度表述分布的尖端程度,其中代表正
13、态分布的为常峰态。正峰值表示相对尖锐的分布,负峰值表示相对平坦的分布。在EXCEL中用KURT()函数求值。3、抽样与抽样分布(1)抽样(1.1)定义抽样即从总体中按一定原则抽取样本。优点:以样本特征推断总体,简单,方便。主要的抽样方法有:简单随机抽样,分层抽样,整群抽样、系统抽样,多阶段抽样。(1.2)抽样平均误差指每一个可能样本的估计值与总体指标值之间离差的平均数,即样本估计量的标准差。抽样误差是由于抽样的随机性引起的样本结果与总体真值之间的误差。抽样误差可以控制但不可避免。(1.3)影响抽样误差的因素:A、总体各单位的差异程度(即标准差的大小):标准差越大,抽样误差越大;B、样本单位数的
14、多少:样本单位数越大,抽样误差越小;C、抽样方法:不重复抽样的抽样误差比重复抽样的抽样误差小;D、抽样组织方式:简单随机抽样的误差最大。(2)几个主要的抽样分布(21)正态分布 N() 标准正态分布变换通过上述公式可将一般正态分布转化为标准正态分布N(0,1),再通过查标准正态分布即可求得X的概率。中心极限定理:设X1, X2,Xn是n个相互独立同分布的随机变量。在一定条件下, 它们的样本均值服从正态分布,即:。根据中心极限定理,独立同分布的样本,在大样本的情况下,近似服从正态分布,可以用正态分布的特征来研究样本特征。(a)正态分布(b)偏态分布正偏(右偏)负偏(左偏)(2.2)t分布 ,此为
15、自由度为n-1的t分布。应用:当抽样的样本容量为小样本(n 时,总体均值间存在差异。在实际工作中,方差分析过程常用方差分析表来表现,众多统计分析软件都可直接生成方差分析表,而常用的EXCEL软件,在数据分析的分析工具选择中就提供了单因素方差分析、可重复双因素方差分析、无重复双因素方差分析三种选择。第二节 税收收入运行的统计学分析一、税收收入运行的经济性税收收入来源于经济性税源,税收与经济运行有较强的正相关性。表:1994-2006年 福建省地方税收收入和GDP表(单位:亿元)年份GDP税收收入1994 1644 44 1995 2146 56 1996 2560 70 1997 2975 91
16、 1998 3287 102 1999 3550 115 2000 3765 130 2001 4073 159 2002 4468 173 2003 4984 202 2004 5763 244 2005 6569 284 2006 7502 366 从图中可以看出,税收收入和GDP成正相关关系,2001年和2006年是两个跳跃点,将曲线大致分为三段。(一) 描述统计量根据此表可知税收收入和GDP的95%置信区间,并可进行离散系数分析。税收收入的离散系数为:95.78/156.62=0.61GDP的离散系数为:1730.02/4098.92=0.42二者的离散系数都比较大,数据波动比较明显。
17、(二)相关性分析税收收入和GDP相关系数为0.9866,存在正相关性。也可进行偏相关分析,计算在税收收入与GDP和年份两变量都相关的条件下,通过控制其中一个变量的干扰,判断另两变量间的相关关系。如控制时间变量后,税收收入和GDP的偏相关系数为0.9372,仍存在明显正相关。(三)税收随GDP增长的弹性税收的GDP弹性定义为一定时期内,税收变动对于GDP变动的关系。弹性分为点弹性和线弹性。点弹性指当GDP增长一个百分点时,税收变动的百分比。线弹性指两个经济变量存在函数关系时,函数曲线的斜率。对数税收和对数GDP的回归系数近似为税收线弹性。如下图:Y=1.44X-3.035,R平方为0.9939,
18、系数1.44即为1994-2006年税收对GDP的线弹性。注意:由上述关系图可以看出2001年和2006年为明显跳跃点,若要更精确的求出弹性,应将时期分成三个阶段分别求弹性。二、 税收收入的内在增长趋势(一)税收收入运行随时间变动的趋势税收收入的运行除了具有和经济变量密切相关的特点外,其序列本身也具有随时间变化的内在规律性。税收收入随时间变化的走势图如下:对图中指数模型取对数,可以得到:对数税收= 0.1627年份-118.31此为半对数模型,根据半对数模型的特点,税收的增长率为16.3%。也可选择外推的时期数,作粗略预测。(二)税收增长率分析1、增长率:也称增长速度,它是时间序列中报告期观察
19、值与基期观察值之比减1后的结果,用%表示。由于对比基期的不同,增长率可以分为环比增长率和定基增长率。环比增长率是报告期观察值与前一时期观察值之比减1,说明现象的逐期增长变化程度;定基增长率是报告期观察值与某一固定时期观察值之比减1,说明现象在整个观察期内总的增长变化程度。环比增长率:定基增长率:平均增长率:也称平均增长速度,它是时间序列中逐期环比值(也称环比发展速度)的几何平均数减1后的结果,计算公式为:表示平均增长率,n为环比个数。2、增长率分析中应注意的问题:对于大多数时间序列,特别是有关社会经济现象的时间序列,经常利用增长率来描述其增长状况,尽管增长的计算和分析都比较简单,但在实际工作中
20、仍应注意不误用和滥用,不能单纯就增长率而论,应与绝对水平结合分析。3、平均增长率的计算实例实例:2001-2004年某省税收收入增长分别为11%、12%、13%和14%,要求计算这4年税收收入的平均增幅。实例:某省2001年税收收入159亿元,2006年税收收入365.76 亿元,求该省这几年的税收收入平均增幅。三、税收收入运行的季节性年度税收数据序列有明显的随时间增长的特征,而月度税收波动则呈现出一大月二小月交错分布,具有明显的季节性。2002年1月-2007年7月的全省月度税收走势图如下:对于此类波动数据类型,应选用季节性差分模型进行处理。四、其他常用税收分析方法(一)税源质量的效能位差分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2021 2022 收藏 精品 资料 统计 方法 税收 分析 中的 应用
限制150内