社会统计学导言精.ppt
社会统计学导言第1页,本讲稿共27页课程基本信息o课程性质:课程性质:该课程为我院社会学专业、社会工作专业的该课程为我院社会学专业、社会工作专业的专业基础核心课程。专业基础核心课程。o课程学时:课程学时:48 学时学时o课程学分:课程学分:3学分学分o课程考核形式:课程考核形式:考试考试o课程考核方法:课程考核方法:闭卷考试闭卷考试 第2页,本讲稿共27页 统计名言统计名言 科学只有当它利用了数学的时候,它才达到了完善的程度。马克思马克思 对于追求效率的公民而言,统计思维总有一天会和读写能力一样必要。H.G.Wells第3页,本讲稿共27页模型选择是艺术,而不是科学。William Navidi 统计名言统计名言第4页,本讲稿共27页课程目标o掌握基本的统计原理掌握基本的统计原理o理清统计学的重要概念理清统计学的重要概念o奠定进一步学习的良好基础奠定进一步学习的良好基础o能在自己的学习、工作中予以简单应用能在自己的学习、工作中予以简单应用o思维的训练与培养思维的训练与培养第5页,本讲稿共27页 统计是什么?统计是什么?o统计是人类思维的一个归纳过程统计是人类思维的一个归纳过程o站在一个路口,看到每过去站在一个路口,看到每过去20辆小轿辆小轿车时,也有车时,也有100辆自行车通过辆自行车通过o而且平均每而且平均每10个轿车载有个轿车载有12个人个人o于是,你认为小汽车和自行车在这于是,你认为小汽车和自行车在这个路口的运载能力为个路口的运载能力为24:100o这是一个典型的统计思维过程这是一个典型的统计思维过程第6页,本讲稿共27页统计是什么?统计是什么?o一般来说,统计先从现实世界收集数据一般来说,统计先从现实世界收集数据(信息),如经济增长(信息),如经济增长o然后,根据数据作出判断,称为模型然后,根据数据作出判断,称为模型o模型是从数据产生的模型是从数据产生的o模型也需要根据新的信息来改进模型也需要根据新的信息来改进o不存在完美的模型不存在完美的模型o模型的最终结局都是被更能够说明现实世模型的最终结局都是被更能够说明现实世界的新模型所取代界的新模型所取代第7页,本讲稿共27页统计学可以应用于几乎所有的领域统计学可以应用于几乎所有的领域:精算,农业,动物学,人类学,考古学,审计学,晶精算,农业,动物学,人类学,考古学,审计学,晶体学,人口统计学,牙医学,生态学,经济计量学,体学,人口统计学,牙医学,生态学,经济计量学,教育学,选举预测和策划,工程,流行病学,金融,教育学,选举预测和策划,工程,流行病学,金融,水产渔业研究,遗传学,地理学,地质学,历史研究,水产渔业研究,遗传学,地理学,地质学,历史研究,人类遗传学,水文学,工业,法律,语言学,文学,人类遗传学,水文学,工业,法律,语言学,文学,劳动力计划,管理科学,市场营销学,医学诊断,气劳动力计划,管理科学,市场营销学,医学诊断,气象学,军事科学,核材料安全管理,眼科学,制药学,象学,军事科学,核材料安全管理,眼科学,制药学,物理学,政治学,心理学,心理物理学,质量控制,物理学,政治学,心理学,心理物理学,质量控制,宗教研究,社会学,调查抽样,分类学,气象改善,宗教研究,社会学,调查抽样,分类学,气象改善,博彩等。博彩等。第8页,本讲稿共27页统计是什么?统计是什么?一句话一句话o统计学(statistics)是用以收集数据,分析数据和由数据得出结论的一组概念、原则和方法。第9页,本讲稿共27页o以以归归纳纳为为主主要要思思维维方方式式的的统统计计不不是是以以演演绎绎为主的为主的数学数学o统统计计可可应应用用于于各各个个不不同同学学科科,在在有有些些学学科科已已经经有有其其特特有有的的方方法法和和特特点点;如如生生物物统统 计计(biostatistics)、经经 济济 计计 量量 学学(econometrics)以以及及目目前前很很热热门门的的生生物物信信息息(bioinformation)和和数数据据挖挖掘掘(Data Mining)的的方法主体都是统计。方法主体都是统计。统计是什么?统计是什么?第10页,本讲稿共27页你想过下面的问题吗?你想过下面的问题吗?o当当你你买买了了一一台台电电视视时时,被被告告知知三三年年内内可可以以免免费费保保修修。你你想想过过厂厂家家凭凭什什么么这这样样说说吗吗?说说多多了了,厂厂家家会会损损失失;说说少少了了,会会失失去去竞竞争争,也也是损失。到底这个保修期是怎样决定的呢?是损失。到底这个保修期是怎样决定的呢?o大大学学排排名名是是一一个个非非常常敏敏感感的的问问题题。不不同同的的机机构构得得出出不不同同的的结结果果;各各自自都都说说自自己己是是客客观观、公公正正和和有有道道理理的的。到到底底如如何何理理解解这这些些不不同同的的结果呢?结果呢?第11页,本讲稿共27页你想过下面的问题吗?你想过下面的问题吗?o任任何何公公司司都都有有一一个个信信用用问问题题。当当然然,在在这这些些公公司司试试图图得得到到贷贷款款时时并并没没有有不不还还贷贷的的不不良良记记录录。如如何何根根据据它它们们的的财财务务和和商商业业资资料料来来判判断断一个公司的信用等级呢?一个公司的信用等级呢?o我我国国东东部部和和西西部部的的概概念念是是一一个个比比较较笼笼统统的的概概念念。如如何何能能够够根根据据需需要要,选选择择一一些些指指标标来来把把各省,或各市县甚至村进行分类呢?各省,或各市县甚至村进行分类呢?o疾疾病病传传播播时时,如如何何能能够够通通过过感感染染者者入入院院前前后后的的各各种种因因素素得得到到一一个个疾疾病病传传染染方方式式的的模模型型呢呢?第12页,本讲稿共27页你想过下面的问题吗?你想过下面的问题吗?o如如何何通通过过大大众众调调查查来来得得到到性性别别、年年龄龄、职职业业、收收入入等等各各种种因因素素与与公公众众对对某某项项事事物物(比比如如商商品品或或政政策)的态度的关系呢?策)的态度的关系呢?o一一个个从从来来没没有有研研究究过过红红楼楼梦梦的的统统计计学学家家如如何何根根据据比比较较写写作作习习惯惯得得出出红红楼楼梦梦从从哪哪一一段段开开始始就就不不是曹雪芹的手笔了呢?是曹雪芹的手笔了呢?o如如何何才才能能够够客客观观地地得得到到某某个个电电视视节节目目的的收收视视率率,以确定广告的价格是否合理呢?以确定广告的价格是否合理呢?第13页,本讲稿共27页你如何理解下面说法?你如何理解下面说法?o“明天降水概率为明天降水概率为4040”o“我冬天去新加坡度假的概率为我冬天去新加坡度假的概率为1010”o“该节目收视率是该节目收视率是30%30%”o“调查结果表明调查结果表明20%20%的观众喜欢某节目的观众喜欢某节目”o“抽样调查结果的误差为抽样调查结果的误差为3%3%”o“支持率的支持率的9595置信区间为置信区间为(25%,30%)(25%,30%)”o“某学校排名第一某学校排名第一”o“某县是贫困县某县是贫困县”第14页,本讲稿共27页你如何理解下面说法?你如何理解下面说法?o“某国的综合竞争力排名第某国的综合竞争力排名第4343位位”o“该国家属于发展中国家该国家属于发展中国家”o“该药品疗效该药品疗效99%99%”o“该国贫富差距大该国贫富差距大”o“这个县收入比那个县高这个县收入比那个县高”o“该结果统计显著该结果统计显著”o“消费价格指数为消费价格指数为120%120%”o“他的血压已经正常了他的血压已经正常了”第15页,本讲稿共27页可以想象出的统计应用例子可以想象出的统计应用例子o如何确定观众如何确定观众/听众是否忠实于某节目听众是否忠实于某节目(专栏专栏)o如何对电视节目排名次如何对电视节目排名次o什么因素影响一个节目的收视率什么因素影响一个节目的收视率o如何按照各种不同环境估计某商店的顾客人数如何按照各种不同环境估计某商店的顾客人数o如何按照各种指标评价雇员如何按照各种指标评价雇员o如何把地区如何把地区(市县镇等市县镇等)按照各种指标分类按照各种指标分类o如何确定红楼梦第几回不是曹雪芹所写如何确定红楼梦第几回不是曹雪芹所写o如何确定一个产品的可靠性如何确定一个产品的可靠性o如何进行偏差较少的民意调查如何进行偏差较少的民意调查o如何根据一些财务数据发现漏税的嫌疑单位如何根据一些财务数据发现漏税的嫌疑单位?第16页,本讲稿共27页你相信统计结果吗?你相信统计结果吗?o数据可以有误或作假数据可以有误或作假o统计方法(有意或无意)使用不当可以误统计方法(有意或无意)使用不当可以误导。有低级误导和高级误导。导。有低级误导和高级误导。o常识判断和直觉是重要的常识判断和直觉是重要的第17页,本讲稿共27页关于美国选举的两个例子(关于美国选举的两个例子(1 1)o谁会在谁会在19361936年的选举中获胜?年的选举中获胜?Alf LondonAlf London还还是是F FD DR R(罗斯福)?(罗斯福)?oLiterary Digest(Literary Digest(文摘文摘)送出一千万份问卷送出一千万份问卷(返回二百四十万份)后,预测(返回二百四十万份)后,预测LondonLondon会赢。会赢。o而而GallopGallop(盖洛普)只问了(盖洛普)只问了50005000人说罗斯福人说罗斯福会赢。会赢。o最后罗斯福和盖洛普都赢了,文摘倒闭了。最后罗斯福和盖洛普都赢了,文摘倒闭了。第18页,本讲稿共27页关于美国选举的两个例子(关于美国选举的两个例子(2 2)o谁会在谁会在19481948年的选举中获胜?年的选举中获胜?Thomas DeweyThomas Dewey还是还是Harry Truman Harry Truman(杜鲁门)?(杜鲁门)?oCrossley,GallopCrossley,Gallop(盖洛普)(盖洛普),Roper,Roper所有都所有都预测预测DeweyDewey会赢(每个机构用了会赢(每个机构用了50005000个问卷)个问卷)。o最后(包括盖洛普)他们都输了,而杜鲁门最后(包括盖洛普)他们都输了,而杜鲁门赢了。赢了。第19页,本讲稿共27页统计和数学的区别统计和数学的区别o数学思维是以演绎为主数学思维是以演绎为主o统计思维是以归纳为主统计思维是以归纳为主,兼有演绎兼有演绎o统计各领域利用几乎所有存在的统计各领域利用几乎所有存在的数学内容数学内容.o但统计本身的数学是为具体目标服务但统计本身的数学是为具体目标服务的的,自己一般不形成数学体系自己一般不形成数学体系第20页,本讲稿共27页计算机的计算机的重要性o由于统计和数据打交道由于统计和数据打交道,没有计算机的没有计算机的发展统计就没有前途发展统计就没有前途.o计算机和统计的发展相辅相成计算机和统计的发展相辅相成第21页,本讲稿共27页 统计、计算机与统计软件统计、计算机与统计软件o现代生活越来越离不开计算机了现代生活越来越离不开计算机了o最最初初的的计计算算机机仅仅仅仅是是为为科科学学计计算算而而设设计和建造的。计和建造的。o统统计计是是大大型型计计算算机机的的最最早早用用户户,现现在仍然是数值计算的主要用户在仍然是数值计算的主要用户第22页,本讲稿共27页 统计、计算机与统计软件统计、计算机与统计软件o计计算算机机的的使使用用,从从计计算算机机语语言言到到“傻傻瓜瓜式式”地点击鼠标地点击鼠标o输输出出结结果果也也从从数数字字输输出出到到各各种种可可以以想想象象得到的形式。得到的形式。o输输入入数数据据,点点鼠鼠标标做做一一些些选选项项,就就可可得得到到漂亮结果漂亮结果o但其中充满了危险的陷阱但其中充满了危险的陷阱第23页,本讲稿共27页统计、计算机与统计软件统计、计算机与统计软件o计计算算机机无无法法识识别别你你的的统统计计方方面面的的错错误误o错错误误的的方方法法、错错误误的的数数据据形形式式都都必必然然输输出出错错误误的的结结果果(虽虽然然看看上上去去可可能能很很漂亮),得到大量垃圾漂亮),得到大量垃圾o另另外外,统统计计软软件件输输出出的的结结果果太太多多、很很难都理解难都理解第24页,本讲稿共27页第25页,本讲稿共27页第26页,本讲稿共27页o卢淑华:社会统计学(第3 版),北京大学出版社,2005 年。o李沛良:社会研究的统计应用,社会科学文献出版社,2001年。o布莱洛克:社会统计学,中国社会科学出版社,1988 年。o布莱洛克:社会统计学,重庆大学出版社,2010年。教材及参考书目教材及参考书目第27页,本讲稿共27页