统计学数据到结论.ppt
《统计学数据到结论.ppt》由会员分享,可在线阅读,更多相关《统计学数据到结论.ppt(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计学从数据到结论第一章 一些基本概念1.1 统计是什么?统计是什么?统计是人类思维的一个归纳过程统计是人类思维的一个归纳过程站在一个路口,看到每过去站在一个路口,看到每过去20辆辆小轿车时,也有小轿车时,也有100辆自行车通过辆自行车通过而且平均每而且平均每10个轿车载有个轿车载有12个人个人于是,你认为小汽车和自行车在于是,你认为小汽车和自行车在这个路口的运载能力为这个路口的运载能力为24:100这是一个典型的统计思维过程这是一个典型的统计思维过程1.1 统计是什么?统计是什么?一般来说,统计先从现实世界收集数一般来说,统计先从现实世界收集数据(信息),如观测路口的交通据(信息),如观测路
2、口的交通然后,根据数据作出判断,称为模型然后,根据数据作出判断,称为模型模型是从数据产生的模型是从数据产生的模型也需要根据新的信息来改进模型也需要根据新的信息来改进不存在完美的模型不存在完美的模型模型的最终结局都是被更能够说明现模型的最终结局都是被更能够说明现实世界的新模型所取代实世界的新模型所取代统计学可以应用于几乎所有的领域统计学可以应用于几乎所有的领域:精算,农业,动物学,人类学,考古学,审计精算,农业,动物学,人类学,考古学,审计学,晶体学,人口统计学,牙医学,生态学,学,晶体学,人口统计学,牙医学,生态学,经济计量学,教育学,选举预测和策划,工程,经济计量学,教育学,选举预测和策划,
3、工程,流行病学,金融,水产渔业研究,遗传学,地流行病学,金融,水产渔业研究,遗传学,地理学,地质学,历史研究,人类遗传学,水文理学,地质学,历史研究,人类遗传学,水文学,工业,法律,语言学,文学,劳动力计划,学,工业,法律,语言学,文学,劳动力计划,管理科学,市场营销学,医学诊断,气象学,管理科学,市场营销学,医学诊断,气象学,军事科学,核材料安全管理,眼科学,制药学,军事科学,核材料安全管理,眼科学,制药学,物理学,政治学,心理学,心理物理学,质量物理学,政治学,心理学,心理物理学,质量控制,宗教研究,社会学,调查抽样,分类学,控制,宗教研究,社会学,调查抽样,分类学,气象改善,博彩等。气象
4、改善,博彩等。1.1 统计是什么?统计是什么?一句话,一句话,统统计计学学(statistics)是是用用以以收收集集数数据据,分分析析数数据据和和由由数数据据得得出出结结论论的的一一组组概概念念、原则和方法。原则和方法。以以归归纳纳为为主主要要思思维维方方式式的的统统计计不不是是以演绎为主的以演绎为主的数学数学统统计计可可应应用用于于各各个个不不同同学学科科,在在有有些些学学科科已已经经有有其其特特有有的的方方法法和和特特点点;如如生生物物统统计计(biostatistics)、经经济济计计量量学学(econometrics)以以及及目目前前很很热热门门的的生生物物信信息息(bioinfor
5、mation)和和数数据据挖挖掘掘(Data Mining)的的方方法法主主体都是统计。体都是统计。1.2 现实中的随机性和规律性,概率和机会现实中的随机性和规律性,概率和机会从中学起,我们就知道物理从中学起,我们就知道物理学的许多定律,例如学的许多定律,例如v=v0+at;F=ma等等等等但是在许多领域,很难用如但是在许多领域,很难用如此确定的公式或论述来描述此确定的公式或论述来描述一些现象。一些现象。1.2 现实中的随机性和规律性,概率和机会现实中的随机性和规律性,概率和机会一些现象既有规律性又有随一些现象既有规律性又有随机性机性(randomness)肺癌患者中(主动或被动)肺癌患者中(
6、主动或被动)吸烟的比例较大,这体现了吸烟的比例较大,这体现了规律性规律性而绝非每个吸烟的人都会患而绝非每个吸烟的人都会患肺癌,这体现了随机性肺癌,这体现了随机性1.2 现实中的随机性和规律性,概率和机会现实中的随机性和规律性,概率和机会再如,一般来说,白种人身再如,一般来说,白种人身材比黄种人要高些,这就是材比黄种人要高些,这就是规律性规律性但对于具体的一个白人和一但对于具体的一个白人和一个黄种人,就很难说谁高谁个黄种人,就很难说谁高谁矮了,这体现随机性矮了,这体现随机性1.2 现实中的随机性和规律性,概率和机会现实中的随机性和规律性,概率和机会什么是概率什么是概率(probability)?
7、新闻中最常见的是新闻中最常见的是“降水概率降水概率”从从某某种种意意义义说说来来,概概率率描描述述了了某某件件事事情发生的机会。情发生的机会。显显然然,这这种种概概率率不不可可能能超超过过百百分分之之百百,也不可能少于百分之零。也不可能少于百分之零。概概率率是是在在0和和1之之间间(也也可可能能是是0或或1)的一个数,描述某事件发生的机会。的一个数,描述某事件发生的机会。1.2 现实中的随机性和规律性,概率和机会现实中的随机性和规律性,概率和机会有些概率是无法精确推断的。有些概率是无法精确推断的。比如你明天感冒的概率比如你明天感冒的概率有些概率是可以知道的。有些概率是可以知道的。比比如如在在打
8、打桥桥牌牌时时得得到到一一手手黑黑桃桃的的概概率率 为为 1/635013559600,大大 约约 为为1.57477010-12(条条件件是是洗洗牌牌均均匀匀,没没有有作作弊弊)。实实际际上上得得任任何何特特定定的的一手牌的概率都是一样的,对吗?一手牌的概率都是一样的,对吗?1.3 变量和数据变量和数据一一节节火火车车车车厢厢有有多多少少坐坐位位是是一一个个固固定定的的数数目目,称称为为常常数数(constant)或者常量。或者常量。但但是是,开开车车后后,坐坐在在这这节节车车厢厢的的旅旅客客有有多多少少就就没没准准了了。这这有有随随机机性性。该该车车厢厢的的乘乘客客数为变量数为变量(var
9、iable)。1.3 变量和数据变量和数据一一个个学学校校的的注注册册在在校校男男女女生生比例是固定的,为常量比例是固定的,为常量但但是是,该该校校任任意意一一群群学学生生的的男男女女生生比比例例就就不不一一定定和和全全校校的的比比例例一一样样了了,它它为为变变量量(variable)。1.3 变量和数据变量和数据当当变变量量按按照照随随机机规规律律所所取取的的值值是是数数量量时时该该变变量量称称为为定定量量变变 量量 或或 数数 量量 变变 量量(quantitative variable);因因为为是是随随机机的的,也也称称为为随随机机变量变量(random variable)。如如身身高
10、高体体重重,购购买买某某商商品品的的人数等等人数等等1.3 变量和数据变量和数据象象性性别别,观观点点之之类类的的取取非非数数量量值值的的变变量量就就称称为为定定性性变变量量或或 属属 性性 变变 量量 或或 分分 类类 变变 量量(qualitative variable,或或categorical variable)。这这些些定定性性变变量量也也可可以以由由定定量量变变量量来来描描述述,如如男男女女生生的的数数目目,持持有有某某观观点点的的人人数数比比例例等等。等等。1.3 变量和数据变量和数据定定性性变变量量只只有有用用数数量量来来描描述述时时,才才有有可可能能建建立立数数学学模模型型,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 数据 结论
限制150内