(本科)[1]第一章统计学褒贬、诠释和史论《统计学》(第二版)ppt课件.ppt
-
资源ID:15609234
资源大小:1.53MB
全文页数:45页
- 资源格式: PPT
下载积分:20金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
(本科)[1]第一章统计学褒贬、诠释和史论《统计学》(第二版)ppt课件.ppt
课程主讲人:1第一章 统计学褒贬、诠释和史论统计学(第二版)第一章第一章 统计学褒贬、诠释和史论统计学褒贬、诠释和史论 Chapter 1 Praise, Criticism, Interpretation and History of Statistics第一节第一节 统计学的褒与贬统计学的褒与贬 一、统计学的褒扬一、统计学的褒扬 印裔美籍著名统计学家印裔美籍著名统计学家C R 拉奥拉奥( (Calyampudi Radhakrishna Rao,1920-)1920-)指出:指出:在终在终极的分析中,一切知识都是历史;在抽象的意义下,极的分析中,一切知识都是历史;在抽象的意义下,一切科学都是数学;在理性的基础上,所有的判断都一切科学都是数学;在理性的基础上,所有的判断都是统计学。人们可以强调科学定律不是靠权威的原则是统计学。人们可以强调科学定律不是靠权威的原则推进,不是由信仰或中世纪哲学所证明,统计是诉诸推进,不是由信仰或中世纪哲学所证明,统计是诉诸新知识的唯一的法庭。新知识的唯一的法庭。 统计活动是认识现象总体数量方面的活动,它经统计活动是认识现象总体数量方面的活动,它经历了四、五千年漫长的艰苦探索和发展过程。早在原历了四、五千年漫长的艰苦探索和发展过程。早在原始公社时期,就有结绳记事和计量的方法,始公社时期,就有结绳记事和计量的方法,周易正周易正义义中写到原始社会:中写到原始社会:“事大,大结其绳;事小,小事大,大结其绳;事小,小结其绳;结之多少,随物众寡。结其绳;结之多少,随物众寡。”这可谓统计萌芽。这可谓统计萌芽。 据晋皇甫谧(据晋皇甫谧(fu mi)(公元)(公元215215282282年)年)帝王帝王世纪丛书世纪丛书记载,早在记载,早在40004000多年前的夏禹王朝,为了多年前的夏禹王朝,为了治国治水的需要,曾进行过初步的国情统计,查明当治国治水的需要,曾进行过初步的国情统计,查明当时全国人口为时全国人口为1355392313553923人,土地为人,土地为2430802424308024顷。并依顷。并依照山川土质、人口物产及贡赋多寡,将全国分为九州。照山川土质、人口物产及贡赋多寡,将全国分为九州。公元前公元前30503050年,埃及建造金字塔和兴修大型灌溉系统年,埃及建造金字塔和兴修大型灌溉系统时,为了征集所需的财物和劳力,对全国人口、财产时,为了征集所需的财物和劳力,对全国人口、财产进行过调查。古希腊公元前进行过调查。古希腊公元前600600年就进行过人口普查。年就进行过人口普查。古罗马公元前古罗马公元前400400年就建立年就建立了出生、死亡登记制度。尤了出生、死亡登记制度。尤其是我国西周朝代建立的统计报告制度其是我国西周朝代建立的统计报告制度日报称日成,日报称日成,月报称月要,年报称岁会,被西方经济学家推崇为统月报称月要,年报称岁会,被西方经济学家推崇为统计学最早的萌芽。远古时期的统计活动搜集的数字资计学最早的萌芽。远古时期的统计活动搜集的数字资料,主要是为了满足当时奴隶主和封建王朝课税、徭料,主要是为了满足当时奴隶主和封建王朝课税、徭役等统治需要。役等统治需要。 统计在学术上作为一统计在学术上作为一门学科的历史只是始于门学科的历史只是始于1717世世纪中叶的欧洲,至今不过纪中叶的欧洲,至今不过300300多年多年。尤其是近代将概率。尤其是近代将概率论引入到统计学中,使统计学有了惊人的发展。由于论引入到统计学中,使统计学有了惊人的发展。由于人类社会现在正处在信息化时代,电脑在瞬息之间可人类社会现在正处在信息化时代,电脑在瞬息之间可以准确地处理大量的信息,通过处理后的大量信息,以准确地处理大量的信息,通过处理后的大量信息,经过筛选分析,对于社会现象来说,可以从中发掘规经过筛选分析,对于社会现象来说,可以从中发掘规律性,为制定方针政策提供依据;而对于自然现象来律性,为制定方针政策提供依据;而对于自然现象来说,可以发现控制他们的手段,为揭示科技奥秘提供说,可以发现控制他们的手段,为揭示科技奥秘提供依据。这就是所谓的大量统计信息当中存在着反映社依据。这就是所谓的大量统计信息当中存在着反映社会现象和自然现象的会现象和自然现象的“规律规律”或或“法则法则”。 赞誉一个人的学识用赞誉一个人的学识用“才高八斗,学富五车才高八斗,学富五车”,这也是足以证明此人大脑里摄入的知识信息量大,在这也是足以证明此人大脑里摄入的知识信息量大,在某种程度上可以说,已经掌握了社会想象或自然现象某种程度上可以说,已经掌握了社会想象或自然现象某领域中的某领域中的“规律规律”或或“法则法则”。正如西方学者。正如西方学者H G 威尔斯对统计的比喻:威尔斯对统计的比喻:“统计思维,如同读写能统计思维,如同读写能力一样,总有一天会成为讲求效率的公民所必需的本力一样,总有一天会成为讲求效率的公民所必需的本领。领。” 我国著名的统计学家陈希孺院士(我国著名的统计学家陈希孺院士(1934-20051934-2005,当当时中国统计学界唯一的院士)指出:时中国统计学界唯一的院士)指出:“我们现处在一我们现处在一个所谓个所谓信息爆炸信息爆炸时代,信息的一种最常见的形式时代,信息的一种最常见的形式就是数据。现代人在工作和生活中,不时地要从这大就是数据。现代人在工作和生活中,不时地要从这大量的、杂然纷陈的数据中发掘出事物的规律,做出正量的、杂然纷陈的数据中发掘出事物的规律,做出正确的判断,以决定适合的行动方针。可以说,这方面确的判断,以决定适合的行动方针。可以说,这方面的能力如何,实在是衡量一个人聪明与否的一个极重的能力如何,实在是衡量一个人聪明与否的一个极重要的外现指标。要的外现指标。仙人持玉尺,度君多少才仙人持玉尺,度君多少才。 要准确无误地测出一个人有多聪明,恐非仙人莫要准确无误地测出一个人有多聪明,恐非仙人莫办,可惜红尘十丈,何处去找那手持玉尺的仙人?但办,可惜红尘十丈,何处去找那手持玉尺的仙人?但处事是否得宜,是有客观检验的。古人说与其载之空处事是否得宜,是有客观检验的。古人说与其载之空言,不如见之于行事之深切著明。而统计学,正是这言,不如见之于行事之深切著明。而统计学,正是这样一种通过分析数据而达致尽可能正确的结论的技术。样一种通过分析数据而达致尽可能正确的结论的技术。掌握了它,就可以使你在工作和生活中少犯错误,赢掌握了它,就可以使你在工作和生活中少犯错误,赢得主动。也就是说,使你变得更聪明。得主动。也就是说,使你变得更聪明。” 主张以技术角度研判历史的睿智史学家黄仁宇,主张以技术角度研判历史的睿智史学家黄仁宇,在其在其万历十五年万历十五年书中指出:仅靠儒家的思想管理书中指出:仅靠儒家的思想管理一个国家是不够的,还得有点别的;中国必须从一个一个国家是不够的,还得有点别的;中国必须从一个靠尊卑有序来管理的国家,过渡到靠数目字来管理的靠尊卑有序来管理的国家,过渡到靠数目字来管理的国家。传统中国之所以未能成功转型,无关道德和个国家。传统中国之所以未能成功转型,无关道德和个人因素,而是在技术上不能实现人因素,而是在技术上不能实现“数目字管理数目字管理”。不。不过,在现实中的判断或决策,都应当尽量避开数字的过,在现实中的判断或决策,都应当尽量避开数字的误导。误导。 二、统计学的贬责二、统计学的贬责 由于有些人对统计学知识懂得不多,对统计方法更由于有些人对统计学知识懂得不多,对统计方法更是一知半解,因此,长期以来对统计方法论产生了种是一知半解,因此,长期以来对统计方法论产生了种种误解。比如,种误解。比如,怎能利用统计撒谎怎能利用统计撒谎一书中写道:一书中写道:“一份装帧精致的统计资料,胜过希特勒的一份装帧精致的统计资料,胜过希特勒的弥天大弥天大谎谎,它使人误入歧途,却不负任何责任。,它使人误入歧途,却不负任何责任。”这是由这是由于没有诚实的态度来深刻理解统计语言的作者和虚心于没有诚实的态度来深刻理解统计语言的作者和虚心领会统计语言含义的读者,结果造成以上表述语义上领会统计语言含义的读者,结果造成以上表述语义上荒诞不经,最终导致人们对统计的种种错觉。荒诞不经,最终导致人们对统计的种种错觉。 反对统计方法论的人说:反对统计方法论的人说:“统计分析经常意味着对统计分析经常意味着对有分歧的数字进行篡改,用意义含糊不清的办法去解有分歧的数字进行篡改,用意义含糊不清的办法去解决不明确的问题。决不明确的问题。”还有误用这样的比喻来批评人运还有误用这样的比喻来批评人运用统计:用统计:“它使用统计就如同一个醉汉使用街灯一样,它使用统计就如同一个醉汉使用街灯一样,是用来支撑他,而不是用来照明。是用来支撑他,而不是用来照明。” 1919世纪世纪7070年代美国著名作家马克年代美国著名作家马克 吐温(吐温(Mark Twain,18351835年年1111月月3030日日19101910年年4 4月月2121日,原名:萨日,原名:萨缪尔缪尔兰亨兰亨 克莱门(克莱门(Samuel Langhorne Clemens) ) ),常引用英国保守党领袖,常引用英国保守党领袖曾两度出任英曾两度出任英国首相国首相(1868(1868187418741880)1880)本杰明本杰明迪斯雷利迪斯雷利( (Benjamin Disraeli, , 1st Earl(第一伯爵)(第一伯爵)of Beaconsfield,18041804年年1212月月2121日日18811881年年4 4月月1919日,原日,原名:名:Benjamin DIsraeli) )的名言:的名言:“世界上有三种谎话:世界上有三种谎话:谎言、糟透的谎言、统计数据(谎言、糟透的谎言、统计数据(There are three kinds of lies: lies, damned lies, and statistics)”)”。显然,这是显然,这是一种情绪逐渐加重的语句,蕴涵的意思为:比谎言更一种情绪逐渐加重的语句,蕴涵的意思为:比谎言更糟糕的是糟透的谎言,而比糟透的谎言更糟糕的是统糟糕的是糟透的谎言,而比糟透的谎言更糟糕的是统计数据。其本意是嘲讽官僚为了政绩而操纵统计数据,计数据。其本意是嘲讽官僚为了政绩而操纵统计数据,导致统计数据虚假、失真,从而无形地剥夺了公众的导致统计数据虚假、失真,从而无形地剥夺了公众的知情权。知情权。 其实,统计数据本身并无罪,随着统计法的实施和其实,统计数据本身并无罪,随着统计法的实施和完善,统计数据造假现象正在根除,但是,由于一些完善,统计数据造假现象正在根除,但是,由于一些官员或学者动辄引用统计数据支撑自己的观点或立场,官员或学者动辄引用统计数据支撑自己的观点或立场,在各种场合几乎见不到没有数目字的决策或主张。人在各种场合几乎见不到没有数目字的决策或主张。人们普遍认为,只有得到数字支持的判断才是可靠的,们普遍认为,只有得到数字支持的判断才是可靠的,只有数字化的决策才是科学的。社会各阶层对数据的只有数字化的决策才是科学的。社会各阶层对数据的痴迷和滥用,从而出现了像本杰明痴迷和滥用,从而出现了像本杰明迪斯雷利和马克迪斯雷利和马克 吐温一样的对统计数据愤世嫉俗地诅咒。以喜爱调侃吐温一样的对统计数据愤世嫉俗地诅咒。以喜爱调侃和幽默文风著称的李敖,也曾引用过这句讽刺统计学和幽默文风著称的李敖,也曾引用过这句讽刺统计学的话,不过,读者怀疑李敖是否真正认知统计学。本的话,不过,读者怀疑李敖是否真正认知统计学。本杰明杰明迪斯雷利也是一位小说家,作为本杰明迪斯雷利也是一位小说家,作为本杰明迪斯迪斯雷利、马克雷利、马克吐温和李敖的读者,对上面这句话就应吐温和李敖的读者,对上面这句话就应当像对待他们创作小说中的情节一样,都可以认为是当像对待他们创作小说中的情节一样,都可以认为是虚构的,不能当真!虚构的,不能当真! 统计以定量方式反映现实,人们必须恰当地使用均统计以定量方式反映现实,人们必须恰当地使用均值、百分数等指标数据描述社会经济现象。统计数据值、百分数等指标数据描述社会经济现象。统计数据就如同望远镜,它既可以把小东西放大,又可以把大就如同望远镜,它既可以把小东西放大,又可以把大东西放小。德国学者瓦尔特东西放小。德国学者瓦尔特克莱默在克莱默在统计数据的统计数据的真相真相书中表述道:书中表述道:“增长率的增长率是统计学家的增长率的增长率是统计学家的毒药柜毒药柜,他们既可以把一个平淡无奇的数据吹嘘,他们既可以把一个平淡无奇的数据吹嘘夸张成为让人为之激动不已的指标,又能够把正面的、夸张成为让人为之激动不已的指标,又能够把正面的、良好的数据全部淹没在一大堆看起来丝毫没有任何价良好的数据全部淹没在一大堆看起来丝毫没有任何价值的指标中,通常来说,统计学家并不使用真正的、值的指标中,通常来说,统计学家并不使用真正的、真实的基础数据。真实的基础数据。” 美国著名统计学家达菜尔美国著名统计学家达菜尔哈夫在哈夫在统计陷阱统计陷阱论著中写到,从大类上分,操纵统计数据方法有:样论著中写到,从大类上分,操纵统计数据方法有:样本选择偏差、平均数误导、遗漏部分数据本选择偏差、平均数误导、遗漏部分数据( (对比、显著对比、显著性等性等) )、平面图形、平面图形( (偷换维度偷换维度) )等方法。等方法。 三、统计学的正名三、统计学的正名 由于统计学与不确定性有关,所以,常被人滥用来由于统计学与不确定性有关,所以,常被人滥用来作为作为“谋生谋生”的手段,由此统计学就无故地背上了的手段,由此统计学就无故地背上了“臭名昭着臭名昭着”的恶名。的恶名。 尽管统计学不像以上说的那样,但是在一定程度上尽管统计学不像以上说的那样,但是在一定程度上至少反映了这样两种情况:一是统计数据被滥用;二至少反映了这样两种情况:一是统计数据被滥用;二是统计知识普及程度不够。也许有些人提出他们明知是统计知识普及程度不够。也许有些人提出他们明知是不能证明的假设,或者,也许有些人事先已经做出是不能证明的假设,或者,也许有些人事先已经做出了结论,却再去挑选样本或篡改数据反过来证明他们了结论,却再去挑选样本或篡改数据反过来证明他们的结论,这些都是故意滥用统计方法的做法。的结论,这些都是故意滥用统计方法的做法。 我们似乎都有一种数字情结或崇拜症,特别迷信数我们似乎都有一种数字情结或崇拜症,特别迷信数字。毫无疑问,人类已经昂首阔步地跨进了数字化时字。毫无疑问,人类已经昂首阔步地跨进了数字化时代,我们每天都生活在数字(包括数字通讯)的汪洋代,我们每天都生活在数字(包括数字通讯)的汪洋大海中。大海中。 “爱爱”与与“恨恨”就如同就如同“形形”与与“影影”,它们总是,它们总是相互伴随、形影不离。凡是有人喜爱的,就会有人憎相互伴随、形影不离。凡是有人喜爱的,就会有人憎恨,统计数据的处境和遭遇也不例外。恨,统计数据的处境和遭遇也不例外。 “官出数字,数字出官官出数字,数字出官”流行语已经家喻户晓,招流行语已经家喻户晓,招致众多诟病;相关性与因果性混淆使用,导致诉诸权致众多诟病;相关性与因果性混淆使用,导致诉诸权威的逻辑性谬误;依据小样本衍生出规律性结论,犯威的逻辑性谬误;依据小样本衍生出规律性结论,犯了以偏概全的错误。毋庸置疑,只有学会了统计,才了以偏概全的错误。毋庸置疑,只有学会了统计,才能能“驾御驾御”数据,就能够知道怎样说理!数据,就能够知道怎样说理! 第二节第二节 统计学的诠释统计学的诠释 英国统计一词英国统计一词Statistics的词源出自中世纪拉丁语的词源出自中世纪拉丁语Status和和Statista。Status译为各种现象的状态和情况;译为各种现象的状态和情况;Statista译为通晓政治和熟知各国国情者。以这个词根译为通晓政治和熟知各国国情者。以这个词根Stat构成的意大利语构成的意大利语Stato, ,则表示国家以及有关各国则表示国家以及有关各国的国家结构和国情知识的总称。的国家结构和国情知识的总称。 1749 1749年,德国哥廷根大学的高特弗里德年,德国哥廷根大学的高特弗里德 阿亨瓦阿亨瓦尔(尔(Gttfried Achenwall,1719171917921792年)在他的年)在他的近近代欧洲各国国势学论代欧洲各国国势学论中率先使用中率先使用“统计学统计学”这个名这个名词,他把词,他把“国势学国势学”(“Staatenkunde”)命名为)命名为Statistik,即统计学。直到,即统计学。直到1818世纪末,德语统计一词世纪末,德语统计一词Statistik才由齐默尔曼(才由齐默尔曼(E A W Zimmerman)译成英语译成英语Statistics,同时赋予了它用数字表述事实这,同时赋予了它用数字表述事实这一新内涵。在我国古代,统计与合计、总计意思相近。一新内涵。在我国古代,统计与合计、总计意思相近。现代意义上的统计,大约是在现代意义上的统计,大约是在2020世纪初期世纪初期才传入我国。才传入我国。 统计一词统计一词Statistics的英文大致有下面三种含义:的英文大致有下面三种含义: 1 1它表示事实、数字、图形和表格。在这个意它表示事实、数字、图形和表格。在这个意义上,这个词为复数。义上,这个词为复数。 2 2他表示从样本资料推算出来的数量群。在这他表示从样本资料推算出来的数量群。在这个意义上,这个词也为复数。个意义上,这个词也为复数。 3 3它表示拥有它自己的术语、方法论和知识体它表示拥有它自己的术语、方法论和知识体系的学科。在这个意义上,这个词为单数。系的学科。在这个意义上,这个词为单数。 而在我国国内普遍把统计一词释为这样三种涵义,而在我国国内普遍把统计一词释为这样三种涵义,即统计工作、统计资料和统计学。统计工作是指搜集、即统计工作、统计资料和统计学。统计工作是指搜集、整理、分析和提供数字资料的实践活动;统计资料是整理、分析和提供数字资料的实践活动;统计资料是指统计实践活动过程所取得的各项数字资料;统计学指统计实践活动过程所取得的各项数字资料;统计学是关于大量数据资料的收集、整理、描述和分析,以是关于大量数据资料的收集、整理、描述和分析,以认识客观现象总体数量特征和数量关系的科学。它们认识客观现象总体数量特征和数量关系的科学。它们三者关系是:统计工作与统计资料是统计活动过程与三者关系是:统计工作与统计资料是统计活动过程与成果的关系,而统计工作与统计学是统计实践与理论成果的关系,而统计工作与统计学是统计实践与理论的关系。的关系。 统计学(统计学(Statistics)根据它的研究对象和应用范围,)根据它的研究对象和应用范围,可以分为描述统计(可以分为描述统计(Descriptive Statistics)和统计推)和统计推断(断(Inference Statistics)。描述统计是以卡尔)。描述统计是以卡尔 皮尔逊皮尔逊(KPearson,1857185719361936年年)为代表,它是对搜集)为代表,它是对搜集到的大量数据资料进行加工、整理、列表、图示,以到的大量数据资料进行加工、整理、列表、图示,以及计算综合指标,用以探索数据内在的数量规律。推及计算综合指标,用以探索数据内在的数量规律。推断统计是以费歇尔(断统计是以费歇尔(RAFisher,1880188019621962年年)为创始人,它是借助抽样技术,从样本推断母体,以为创始人,它是借助抽样技术,从样本推断母体,以达到认识总体数量特征,对不确定的事物做出决策。达到认识总体数量特征,对不确定的事物做出决策。推断统计有估计和检验两种形式。统计估计是以从总推断统计有估计和检验两种形式。统计估计是以从总体中抽取有限样本为依据,从而对总体的某一数值做体中抽取有限样本为依据,从而对总体的某一数值做出估计;统计推断是事先作出某种假设,根据总体分出估计;统计推断是事先作出某种假设,根据总体分布特征,以实验所得的数据或以样本数据计算结果,布特征,以实验所得的数据或以样本数据计算结果,来检验事先的假设是否可以接受。应用统计就是描述来检验事先的假设是否可以接受。应用统计就是描述统计和推断统计的方法的具体应用。统计和推断统计的方法的具体应用。 由此可知,统计学具有研究现象数量方面的特点。由此可知,统计学具有研究现象数量方面的特点。 因而,统计学研究对象就是指人们所要认识的独因而,统计学研究对象就是指人们所要认识的独立存在于人的主观意识之外的事物客体,即现象总体立存在于人的主观意识之外的事物客体,即现象总体的数量方面的数量方面现象总体的数量特征和数量关系。现象总体的数量特征和数量关系。 统计学研究对象客体具有数量性、总体性和变异统计学研究对象客体具有数量性、总体性和变异性的特点。性的特点。 一是数量性。一切客观事物都有质与量的两个方一是数量性。一切客观事物都有质与量的两个方面。统计对现象的定量认识是建立在定性认识的基础面。统计对现象的定量认识是建立在定性认识的基础上的,统计研究是密切联系现象的质来研究现象的量上的,统计研究是密切联系现象的质来研究现象的量的,仅这一点与数学研究抽象的数量关系是迥然不同的,仅这一点与数学研究抽象的数量关系是迥然不同的。的。 二是总体性。由于个别现象通常有其特殊性和偶二是总体性。由于个别现象通常有其特殊性和偶然性,所以统计研究应从个别入手,通过对个别单位然性,所以统计研究应从个别入手,通过对个别单位的具体事实的调查登记,以达到认识现象总体特征的的具体事实的调查登记,以达到认识现象总体特征的目的;而又由于总体现象具有相对普遍性和稳定性,目的;而又由于总体现象具有相对普遍性和稳定性, 所以总体现象表现出的特征带有一般的规律性,因而,所以总体现象表现出的特征带有一般的规律性,因而,统计的数量研究应当是对现象总体中各单位普遍存在统计的数量研究应当是对现象总体中各单位普遍存在的事实进行大量观察和综合分析,以得出反映现象总的事实进行大量观察和综合分析,以得出反映现象总体的数量特征,而不能仅从对个别或少量不具有代表体的数量特征,而不能仅从对个别或少量不具有代表性的单位的观察和分析,匆忙得出一般性结论。性的单位的观察和分析,匆忙得出一般性结论。 三是变异性。统计上把总体各单位由于随机因素三是变异性。统计上把总体各单位由于随机因素引起的标志表现的差异称为变异。统计研究同类现象引起的标志表现的差异称为变异。统计研究同类现象总体的数量特征,它的前提条件是总体各单位至少有总体的数量特征,它的前提条件是总体各单位至少有一种特征表现存在着差异,并且该差异不是由某种固一种特征表现存在着差异,并且该差异不是由某种固定的原因事先给定的。若总体各单位不存在任何差异,定的原因事先给定的。若总体各单位不存在任何差异,如同用同一细胞如同用同一细胞“克隆克隆”的动物无差异一样,那么也的动物无差异一样,那么也就用不着统计;若总体各单位之间的差异是按照已知就用不着统计;若总体各单位之间的差异是按照已知条件事先可以推论的,那么也无需用统计方法。条件事先可以推论的,那么也无需用统计方法。 第三节第三节 统计学的史论统计学的史论 未渗入系统统计理论的统计实践活动经历了漫长未渗入系统统计理论的统计实践活动经历了漫长的艰苦探索过程,时至封建社会末期,统计活动发展的艰苦探索过程,时至封建社会末期,统计活动发展到了一定程度,积累了一定的经验、材料和方法,客到了一定程度,积累了一定的经验、材料和方法,客观上要求统计实践上升到理论。真正意义上的统计学观上要求统计实践上升到理论。真正意义上的统计学理论的研究开始于古希腊亚里斯多德时代,自这时起,理论的研究开始于古希腊亚里斯多德时代,自这时起,统计学历经了三大发展时期。统计学历经了三大发展时期。 一、古典统计学时期一、古典统计学时期 在公元前在公元前3 3世纪至公元世纪至公元1717世纪期间,出现了具有浓世纪期间,出现了具有浓厚的哲学色彩的用文字记述政情的统计。最早始于古厚的哲学色彩的用文字记述政情的统计。最早始于古希腊的亚里斯多德(希腊的亚里斯多德(Aristotle, ,公元前公元前384384322322年),年),他用文字对希腊城邦政情进行比较叙述,撰写了许多他用文字对希腊城邦政情进行比较叙述,撰写了许多有关城邦政情的论文。为此,被后人称为有关城邦政情的论文。为此,被后人称为“城邦纪要城邦纪要形态的统计形态的统计”。 到到1717世纪和世纪和1818世纪,在欧洲特别是在德国,城邦世纪,在欧洲特别是在德国,城邦纪要形态的统计受到空前的重视,并被广泛的应用,纪要形态的统计受到空前的重视,并被广泛的应用,逐渐形成了一个学派逐渐形成了一个学派记述学派或称国势学派,这是记述学派或称国势学派,这是统计学史上第一个学派。统计学史上第一个学派。 (一)记述学派(一)记述学派 这是一个有统计学之名,而无统计学之实的学派。这是一个有统计学之名,而无统计学之实的学派。这一学派的代表人物是德国的海尔曼这一学派的代表人物是德国的海尔曼康令康令(HConring,1606160616811681年)和高特弗雷德年)和高特弗雷德 阿亨阿亨瓦尔(瓦尔(G Achenwall,1719171917721772年)。康令将国家土年)。康令将国家土地、生产及其他的数字资料作为地、生产及其他的数字资料作为“国情纪要国情纪要”课程的课程的教材。阿亨瓦尔所编教材。阿亨瓦尔所编近代欧洲各国国势学论近代欧洲各国国势学论,对,对欧洲各国的物产、人口、土地、兵力等状况也作了详欧洲各国的物产、人口、土地、兵力等状况也作了详细的叙述和比较。细的叙述和比较。 国势学原意是记述国家的显著事项的学说,它是国势学原意是记述国家的显著事项的学说,它是研究各国基本制度的学问,当然,它也是当时用来歌研究各国基本制度的学问,当然,它也是当时用来歌颂普鲁士君主政体的。尽管阿亨瓦尔于颂普鲁士君主政体的。尽管阿亨瓦尔于17491749年把国势年把国势学定名为统计学,但是,它实际上只是徒有其名。准学定名为统计学,但是,它实际上只是徒有其名。准确地说,它是一种历史科学。因而,这也就是后来出确地说,它是一种历史科学。因而,这也就是后来出现现“统计是静态的历史,历史是动态的统计统计是静态的历史,历史是动态的统计”之说的之说的原因之一。原因之一。 然而,到此间后期,继承记述学派衣钵的人逐渐然而,到此间后期,继承记述学派衣钵的人逐渐分化,出现了主张专用文字记述的文字记述学派和主分化,出现了主张专用文字记述的文字记述学派和主张用统计表、图形记述的图表学派。即便后期有了学张用统计表、图形记述的图表学派。即便后期有了学派内部分化和论争,但是他们仍然还没有摆脱派内部分化和论争,但是他们仍然还没有摆脱“城邦城邦纪要纪要”的巢臼,最终依然表现为纯粹哲学形态的统计的巢臼,最终依然表现为纯粹哲学形态的统计分析。理所当然,国势学是属于实质性的社会科学。分析。理所当然,国势学是属于实质性的社会科学。不过,真正以总体数量比较的方法研究分析社会经济不过,真正以总体数量比较的方法研究分析社会经济问题却是起源于英国伦敦,其主要理论和方法是出自问题却是起源于英国伦敦,其主要理论和方法是出自 政治政治算术算术一书中。一书中。 (二)政治算术学派(二)政治算术学派 这是一个无统计学之名,而有统计学之实的学派。这是一个无统计学之名,而有统计学之实的学派。这一学派的代表人物是英国的威廉这一学派的代表人物是英国的威廉 配第(配第(W Petty,1623162316871687年)和约翰年)和约翰 格朗特(格朗特(J Graunt,1620162016741674年)。威廉年)。威廉 配第的代表作是配第的代表作是政治算术政治算术和和爱爱尔兰的政治解剖尔兰的政治解剖。政治算术政治算术成书于成书于1671167116761676年,遗憾的是却是在配第去世之后的年,遗憾的是却是在配第去世之后的16901690年才在伦敦年才在伦敦出版发行。应当指出的是,配第的著作带有鲜明的政出版发行。应当指出的是,配第的著作带有鲜明的政治倾向,它是为当时新兴资产阶级服务的。治倾向,它是为当时新兴资产阶级服务的。 英国是最早完成资产阶级革命的国家。随着资本英国是最早完成资产阶级革命的国家。随着资本主义经济的兴起,英国、法国和荷兰不断向国外扩张,主义经济的兴起,英国、法国和荷兰不断向国外扩张,然而,英国统治者在这场争霸过程中总是感到严重不然而,英国统治者在这场争霸过程中总是感到严重不安。为此,配第在他的这两本著作中,以数字资料为安。为此,配第在他的这两本著作中,以数字资料为基础,用计算和对比的方法,分析英、法、荷三国的基础,用计算和对比的方法,分析英、法、荷三国的政治、经济、军事等方面的实力,论证出英国可以超政治、经济、军事等方面的实力,论证出英国可以超过法国和荷兰而称雄世界,以实证分析的结果批驳了过法国和荷兰而称雄世界,以实证分析的结果批驳了英国的悲观论调。配第的政治算术原本应从属于他的英国的悲观论调。配第的政治算术原本应从属于他的政治经济学的一种研究方法,他给政治算术下的定义政治经济学的一种研究方法,他给政治算术下的定义是是“对于人口、土地、资本、产业的真实情况的认识对于人口、土地、资本、产业的真实情况的认识方法。方法。”他主张用数字、重量和尺度来表达自己想说他主张用数字、重量和尺度来表达自己想说的问题。只进行诉诸人们感觉的议论,而不采用比较的问题。只进行诉诸人们感觉的议论,而不采用比较级或最高级的词语进行形而上学的思辨式议论。他不级或最高级的词语进行形而上学的思辨式议论。他不仅利用数字说话,而且还开始利用朴素的图表形式概仅利用数字说话,而且还开始利用朴素的图表形式概括和显现数字资料。鉴于此,马克思称誉配第为括和显现数字资料。鉴于此,马克思称誉配第为“政政治经济学之父,在某种程度上也可以说是统计学的创治经济学之父,在某种程度上也可以说是统计学的创始人始人”。而恩格斯在。而恩格斯在反杜林论反杜林论中则说:中则说:“配第创配第创 造造政治算术政治算术,即一般所说的统计。,即一般所说的统计。” 不过,发表第一篇关于政治算术文章的人却不是不过,发表第一篇关于政治算术文章的人却不是配第,而是配第的好友格朗特。格朗特是一名商人。配第,而是配第的好友格朗特。格朗特是一名商人。1717世纪中叶,欧洲各国发生了周期性的瘟疫,人口大世纪中叶,欧洲各国发生了周期性的瘟疫,人口大量死亡,于是,格朗特在量死亡,于是,格朗特在16621662年发表了一篇年发表了一篇对死亡对死亡表的自然与政治观察表的自然与政治观察的论文。该的论文。该论文以人口问题为论文以人口问题为研究中心,利用大量数据对社会人口变动进行统计分研究中心,利用大量数据对社会人口变动进行统计分析,从而发现人口的出生与死亡率经久不变,据此创析,从而发现人口的出生与死亡率经久不变,据此创立了立了“大量恒静大量恒静”定律(定律(Law of Inertia of Large Numbers)。)。“大量恒静大量恒静”定律是指某一事物的某一定律是指某一事物的某一性质或状态在反复观察或反复试验中保持不变。它成性质或状态在反复观察或反复试验中保持不变。它成为当时统计学的基本原理。格朗特根据这一定律按照为当时统计学的基本原理。格朗特根据这一定律按照不同年龄的死亡率与人口寿命编制出了最早的生命表。不同年龄的死亡率与人口寿命编制出了最早的生命表。 1818世纪的德国牧师世纪的德国牧师苏斯米尔希(苏斯米尔希(J P Sssmilch,1707170717671767年)被视为系统地论述政治算术的人。他年)被视为系统地论述政治算术的人。他写了一本写了一本神定秩序神定秩序一书。他是以一书。他是以“神定秩序神定秩序”来来说明社会现象的。其实,他论证的并非神的秩序,而说明社会现象的。其实,他论证的并非神的秩序,而是通过大量观察,证明了大数法则的存在。直到是通过大量观察,证明了大数法则的存在。直到18501850年,德国经济学家克尼斯(年,德国经济学家克尼斯(Kniex,1821182118961896年)在年)在独立科学之统计学独立科学之统计学中,主张将政治算术更名为统中,主张将政治算术更名为统计学,至此统计学才成为有政治算术真正统计内容的计学,至此统计学才成为有政治算术真正统计内容的有名有实的统计学。有名有实的统计学。 综观上述可知,政治算术学派是以数量分析为特综观上述可知,政治算术学派是以数量分析为特征,且研究客观现象数量关系。就其内容和方法来看,征,且研究客观现象数量关系。就其内容和方法来看,政治算术应当是统计学的正统起源。不过,从其本质政治算术应当是统计学的正统起源。不过,从其本质上来讲,他仍然未能在根本上从政治经济学中分化出上来讲,他仍然未能在根本上从政治经济学中分化出来。这一派所探讨的规律还都是一些用数字表示的实来。这一派所探讨的规律还都是一些用数字表示的实质性的社会经济规律,因此,政治算术还是属于质性的社会经济规律,因此,政治算术还是属于实质实质 性的社会科学。性的社会科学。 二、近代统计学时期二、近代统计学时期 近代统计学起源于近代统计学起源于1919世纪概率论(又称或然率的世纪概率论(又称或然率的数学理论)的思想方法被引进统计学。数学理论)的思想方法被引进统计学。 早在早在1616世纪初就开始了或然率的研究端倪,当时世纪初就开始了或然率的研究端倪,当时在意大利在意大利数学家数学家试图解决机遇游戏及其赌博输赢的得试图解决机遇游戏及其赌博输赢的得点问题。点问题。1717、1818世纪世纪许多数学家探讨了这个问题,如许多数学家探讨了这个问题,如瑞士的贝努里家族。佳科瑞士的贝努里家族。佳科 伯努里(伯努里(Jokob Bernouili,1645164517051705年)系统论证了概率的客观存在。他在年)系统论证了概率的客观存在。他在17331733年出版的年出版的概率原理概率原理一书中率先提出大数法一书中率先提出大数法则则伯努里定理。伯努里定理。17861786年法国数学家和统计学家拉年法国数学家和统计学家拉普拉斯(普拉斯(P S Laplace,1749174918271827年)撰写了一年)撰写了一篇关于巴黎人口的出生、婚姻、死亡的文章,文中提篇关于巴黎人口的出生、婚姻、死亡的文章,文中提出根据法国特定地方的出生率来推算全部人口的问题。出根据法国特定地方的出生率来推算全部人口的问题。 当时,法国的资产阶级革命推翻了统治法国当时,法国的资产阶级革命推翻了统治法国200200多多年的波旁王朝,处死国王,并宣布共和。拉普拉斯的年的波旁王朝,处死国王,并宣布共和。拉普拉斯的建议受到新政权的赞同,于是抽取建议受到新政权的赞同,于是抽取1799179918021802年年3030个个县市人口资料来推算全国人口数,并测出了误差区间。县市人口资料来推算全国人口数,并测出了误差区间。就它的统计方法论而言,他的确是一个巨大创举,从就它的统计方法论而言,他的确是一个巨大创举,从此正式开始实现了统计学与概率论的联系。拉普拉斯此正式开始实现了统计学与概率论的联系。拉普拉斯认为应以研究自然科学的方法来研究社会现象。比利认为应以研究自然科学的方法来研究社会现象。比利时的阿道夫时的阿道夫凯特勒(凯特勒(L A J Quetelet,1796179618741874年年)对此深受启发,他为了学习概率论曾专门就)对此深受启发,他为了学习概率论曾专门就学于拉普拉斯。凯特勒开辟了运用概率论认识随机现学于拉普拉斯。凯特勒开辟了运用概率论认识随机现象数量规律性的理论和方法的新领域。象数量规律性的理论和方法的新领域。18671867年德国数年德国数学家威特斯坦(学家威特斯坦(T Wittstein)发表了)发表了数理统计学数理统计学及其在经济学和保险学中的应用及其在经济学和保险学中的应用的论文,并将凯特的论文,并将凯特勒创建的新领域命名为数理统计学。随着数理统计学勒创建的新领域命名为数理统计学。随着数理统计学的产生和进一步发展,关于统计学究竟是研究的产生和进一步发展,关于统计学究竟是研究 客观现象规律性的实质性科学还是方法性科学这一问客观现象规律性的实质性科学还是方法性科学这一问题有不同回答,后来逐渐形成了两大学派题有不同回答,后来逐渐形成了两大学派近代数理近代数