社会统计学笔记.pdf
《社会统计学笔记.pdf》由会员分享,可在线阅读,更多相关《社会统计学笔记.pdf(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第一章科学方法与社会研究历程1社会学研究 :就是运用科学的方法来搜集和分析社会事实,以理解社会现象之间的关系。2科学研究 :就是运用客观的、逻辑的和系统的方法来搜集事实及分析事实。3社会学研究的整个历程,大致上可以分为三个阶段: (1)筹划,(2)执行,(3)总结。4初步探索步骤: (1)收集有关的文献, (2)咨询那些对研究的题目有经验、有知识的人,进行了解,(3)观察个案。5假设 :就是根据我们对问题的了解,假定现象与现象之间的关系。就是假定某一现象的变化与另一种现象的变化具有某种关系。假设的方式 :函数式(要求变项之数值有高低之分) 、差异式(不存在高低之分)6较为常用的研究方式:实验法
2、、社会调查法。(皆可验证假设)实验法的逻辑:有意的改变A 变项,然后看看B 变项是否随着变化;如果B 变项显然是随着A 变项的变化而变化,就说明A 变项对 B 变项有影响。社会调查法特点:在研究过程中不改变社会现状,只求就地取材,然后以统计方法推算变项与变项之间的关系。7能够有效地验证假设的实验法称为典型或理想实验法8社会调查法可以分为两大类:一是叙述性调查(重点是报道社会事实,较少分析社会事实(即变项)之间的因果关系) ,一是解释性调查(目的是要证明不同的变项之间是否有因果关系) 。9全体调查 :就是从所有研究对象中搜集资料。抽样调查 :就是从全体的研究对象中科学的抽出一个数目较少的样本,然
3、后据此样本的资料推论全体的情况。10 个案研究 :就是选择一个或几个个案(即研究对象) ,作深入的接触和观察,目的是对所研究的问题作深入的了解。11横剖研究 :指的是在同一时期搜集资料,目的是理解各种社会现象(即变项)在某时期的相关情况的研究。纵贯研究: 是指在不同时期搜集的,目的在了解社会现象(即变项)在不同时期中的变动情况的研究。12 纵贯研究分为两种:趋势研究、同组研究(指的是在不同时期调查相同的样本) 。同组分析的问题:遗失个案的问题。同组研究要求调查相同的个案,但在第一次调查的样本可能在第二次调查时一部分已丢失。13指标合并方法:类型法、指数构成法、尺度法类型法 :是将各指标交互分类
4、。指数构成法 :是用简明而合理的公式,来综合各指标。尺度法 :是据各指标之间的关系来计算总值,使研究对象高低有序。14 个人变项 :以个人为研究对象的变项。群体变项 :以地区或群体为研究单位的。15 区群谬误 :以群体研究单位研究的出的结论推论到以个人为研究单位时所犯的错误。微体谬误 :以个人为研究单位,把研究结论推及于群体或整个社区时所犯的错误。16 定类层次 : 是指变项的值只能把研究对象分类,即只能决定研究对象是同类抑或不同类,具有 =与/=的数学特质。定序层次 :就是能确定值的次序,即变项的值能把研究对象排列高低或大小,具有与的数学特质。定距层次 :就是能确定值与值之间的距离,即变项之
5、值与值间的距离是可以知道的,因而具有加与减的数学特质。定比层次 :最高的测量层次,其数值中的零是绝对的、固定的, 因而除了上面讲的特质之外,也具有乘与除的数学特质。17 界定母体 :就是清楚说明研究对象的范围,即所研究的人物、时间和地点。18 统计方法分两类:叙述统计法(帮助简化资料的方法) 、推论统计法(就是根据抽样取出的资料推论出母体的情况) 。19 试点研究 :即抽取若干研究对象来试验整套计划是否可行。20 搜集资料的方法:访问、观察和档案资料。固定答题 :是由研究员预先设计了若干可能的答案,由答者选择。自由答题: 就是让答者随着自己的意思回答,研究员不提供可能的答案。优缺点比较: 固定
6、答题的好处是便于统计分析,但所提供的答案不一定适当。自由答题的好处,是让答者充分表达他的意思,较为准确,但答者可能啰嗦和花样众多,访问时费时间且分析起来也不容易。观察法 :就是以耳闻目睹的方式,实地了解研究对象的行为。观察法分为:参与观察法和非参与观察法。参与观察法 :就是研究员要参加所研究的活动,从而获取资料, 其身份好像一位情报员。非参与观察法:就是研究员的身份是旁观者。21 整理资料时,一般分为两步:校对(就是查看所收集的资料有没有错) 、编码(把资料作简明的记录和分类) 。22 测量效度 :是指所得的资料是否与测量的目标相吻合。测量信度 :是指用相同的方法重复测量变项时的资料是否吻合。
7、信度高不等于效度高,因为重复的测量所得的资料,即使是吻合的(信度高) ,却可能是重复的错误(效度低) 。第二章简化一个变项之分布1集中趋势测量法:就是找出一个数值来代表变项的资料分布,以反映资料的集结情况。意义 在于可以根据这个代表值(或称典型值)来估计或预测每个研究对象(即个案)的数值。众值 :就是次数最多的值。 (以长远来说,以众值做预测所犯的错误总数是最小的)中位值 :就是在一个序列的中央位置之值,即高于此值的有50%的研究个案,低于此值的也有 50%。 (长远来说,以中位值去估计定序变量的数值,所犯的错误总数是最小的)均值 :将变项的各个数值相加,求取一个平均的数值。(长远来说,以均值
8、估计定距变项的资料,错误最小)2离散趋势测量法:是要求出一个值来表示个案与个案之间的差异情况。离异比率 :就是非众值的次数与全部个案数目的比率。质异指数 :其作用是求出各个类别之间在理论上最多的可能差异中实际上出现了多少差异。四分位差 :是将个案由低至高排列,然后分为四个等分,则第一个四分位置的值与第三个四分位置的值的差异。3离散趋势测量法与集中趋势测量法是有互补作用的。二法并用,就可以一方面知道资料的代表值, 有助于估计和预测的工作,另一方面可以知道资料的差异情况,反映估计或预测时会犯的错误。4标准正态分布:以标准差为单位的正态分布。均值是0,标准差是1 第三章简化两个变项之分布1相关 :是
9、指一个变项的值与另一个变项的值有连带性。换言之,如果一个变项的值发生变化,另一个变项的值也有变化,则两个变项就是相关了。正相关 :是指一个变项的值增加时,另一变项也增加。负相关 :是指一个变项的值增加时,另一变项的值却减少。2不对称关系 :X 影响 Y,而 Y 不会影响X。对称关系 :不确定或不区分影响的方向。3交互分类 :同时依据两个变项的值,将所研究的个案分类。列联表 :综合了两个变项的共同分布的统计表。条件次数表的缺点:难于比较不同条件下的次数分布,这是因为作为基数的边缘次数的值各不相同。因此,为求相互比较从而知道两个变项间的关系,就必须将各个基数标准化。将所有基数都变成100,各个条件
10、次数就随而变为百分率。4在制定条件百分表时的准则:每个表的顶端要有表号和标题。绘表时所用的线条,要尽可能简洁。在表上层的自变项每个值之下的%号,表示下列的数值都是百分率。表下层括弧内的数值,表示在计算百分率时所根据的个案总数。表内百分率数值的小数位要保留多少,视乎研究的需要,但最好是有一致性。以自变项作为计算百分率的方向,是社会学研究的常规。然而,也有例外的情况:如果依变项在样本内的分布不能代表其在总体内的分布,则百分率的计算要根据依变项的方向。5相关测量法 :就是以一个统计值表示变项与变项之间的关系。这个值,通常称为相关系数。第四章相关测量法与测量层次1Lambda相关测量法,又称为格特曼的
11、可预测度系数,基本逻辑是:以一个定类变项的值来预测另一个定类变项的值时,如果以众值作为预测的准则,可以减少多少误差。Lambda 相关测量法的特点是:以众值作为预测的准则,不理会众值以外的次数分布。2级序相关法的基本逻辑是要求出:根据任何两个个案在某变项上的等级来预测他们在另一个变项上的等级时,可以减少的误差是多少。同序对 :某对个案在两个变项上的相对等级相同。异序对: 若果不相同则称为异序对。3肯德尔的tau 系数的基本逻辑:计算同序对数与异序对数之差在全部的可能对数中所占的比例。4斯皮尔曼rho 系数的特点 :是在计算每个个案在两个变项上的等级时,不仅要区别二者的高低差异,而且还要计算二者
12、差异的确切数值。基本逻辑 :求出在最大可能的等级差异总值中,实际的等级差异所占的比例是多少。统计值是由 -1 到+1,其平均值有PRE 性质。5简单线性回归分析法:根据一个直线方程式,以一个自变项的数值来预测一个依变项的数值。目的 :是要找出一个错误最小的方法来预测依变项的数值。回归系数b 的大小 ,就表示X 对 Y 的影响有多少。如果b=0,表示 X 对 Y 没有影响,即 X 变但 Y 不变。如果b 值越大,就表示X 变化时所引起的Y 变化愈大。 b 值有正负之分:如果是正值就表示X 对 Y 有正向效果,即X 增大, Y 也增大;如果是负值就表示 X 对 Y 有负向效果,即X 增大, Y 却
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 社会 统计学 笔记
限制150内