《社会统计学公式汇总及要点(共5页).doc》由会员分享,可在线阅读,更多相关《社会统计学公式汇总及要点(共5页).doc(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上社会统计学公式汇总及要点 2011.09.09-09.10 (仅供参考,如不能显示公式,请安装Microsoft 公式3.0)一、归类总结之一测量层次特质数学特质单变项:X定类变项只分类Mo、V比例、比率、对比值、次数分布、长作图、圆瓣双变项:X、Y定序变项不仅分类,有大小、高低、程度等Mo、V、Md、Q累加次数、累加百分率定距变项不仅分类,有大小、高低、程度,还可加减Mo、V、Md、Q、S(S2)同上定比变项最高测量层次加减乘除二、归类总结之二2个定类、tau-y 1. 集中趋势测量法:Mo 、Md 、 2. 离散趋势测量法:V、Q、S2. 有下标,表示不对称3.
2、具有消减误差比例意义的有:r2、E2、G、dy、tau-y、rs2(rs 斯皮尔曼系数)4. 参数检定: Z、t、F非参数检定:x2、U、H、K-S、走动检定 P2012个定序G、dy2个定距R、b,即r=rxy,b=bxy定类+定距E定类+定序同:、tau-y 大多数社会学者将定序看作定类,即2个定类。三、归类总结之三: 理解如下:(红色字体为特别关注的公式)变项X 变项Y可计算检定法两个定类定类 定类、tau-y x2定类+定序定类定序同 上两个定序定序定序G、dyZ(n100)、t(n30)两个定距定距定距r、b,即r=rxy,b=bxyF、r (n30)定类+定距定类定距E只能用F检定
3、定序+定距定序定距E只能用F检定四、归类总结之四:有关计算题1第二章、第四或第六章、第七八章2相关系数第四章; 定类、定序、定距第四章; 假设、推论检定第七、八章3一个变项,1个样本:(n100): (n30): , df=b-141个变项,2个样本1 2n=n1+n2100 五、归类总结之五:有关消减误差比例1.有 消减误差比例意义,且 对称、G、Q拉系数、rs2、r2、rxy.12、Ry.122= Ry.x1x222有 消减误差比例意义,且 不 对称dy、tau-y、E2、CR2(特征值)3.无 消减误差比例意义,且 对称、V系数、C系数、tau-a、tau-b、tau-c、Vs、r4.无
4、 消减误差比例意义,且 不 对称b、E六、其他细节1显著度的表达两端检定:; 一端检定:; ; F(df1,df2) ; x2(df)2. 有无自由度的表达G、r、F、x2 结果解释加上“其显著度水平达到或没有达到水平”3. 有关r 净相关系数 (两个定距变项)r=rxy.1 引入第三个变项时对X、Y变项产生共同影响。 rx(y-1) 引入第三个变项时,只对Y产生影响,无消减误差意义。 ry(x-1) 引入第三个变项时,只对X产生影响,无消减误差意义。计算公式表(一)(红色字体为特别关注的公式)1. 众值Mo=次数最多之值。2. 中位项 Md位置=, Md=L+W, Md =L+W 有三种情况
5、:单个数奇、偶、区间。 fm:原始次数;cfm-1:累加次数 P483. 均值= P494. 离异比率V= P525. 四分位差由低到高排列,分四个等分计算Q1、Q3位置,Q1位置=, Q3位置=,Q= Q3- Q1有单个数(n为偶数时会出现偏离)、区间之分。(有几种Q,就有几种S计算法)当为区间表格时(n/4)计算向上累加数cf ; Q1位置=, Q3位置= ; Q1=L1+W1, Q3= L3+W3;Q= Q3- Q1 P575. 标准差单个数:S=, 区间:S= P60对S的解释:如以均值来估计各个个案的数值,所犯的错误平均是S。 用均值作估计变项数值时所犯错误的大小。 S2 方差:就是
6、标准的平方值,其意义与标准差相同。计算公式表(二)二个变项1.两个定类变项My=Y变项的众值次数, Mx=X变项的众值次数, n=全部个案数目。my=X变项的每个值(类别)之下Y变项的众值次数,mx=Y变项的每个值之下X变项的众值次数,tau-y= (E1=,E2=)n=全部个案数目,f=某条件次数,Fy=Y变项的某个边缘次数,Fx=X变项的某个边缘次数。2. 两个定序变项G=Ns是同序对数,Nd是异序对数 对G检定,只有两种检定法:Z、t。dy=Ns是同序对数,Nd是异序对数,Ty是只在依变项Y上同分的对数。因为dy系数是以X预测Y,如果两个个案在X上有高低之分,就要预测或估计他们在Y上的相
7、对等级。因上分母要加上Ty。rs=斯皮尔曼rho系数。常出现在填空选择,一般不考计算题。3. 两个定距变项Y=bX+a, a=b= 简单线性回归分析X是自变项数值,自变项数值,b是回归系数,表示回归张的斜率,a是截距,即回归线与Y轴的交点,Y是根据回归方程式所预测的Y变项的值。r=rxy=积矩相关测量法r系数与简单线性回归分析都是假定X与Y的关系具有直线的性质。4.定类+定项, ni是每个自变项Xi的个案数目。=每类的平均值,每个竖列平方的和。 E值无负值,因为是定类变项。相关比率与非线性相关又称为eta平方系数(E2),是以一个定类变项X为自变项,以一个定距变项Y为依变项。是根据自变项的每一
8、个值来预测或估计依变项的均值。E是假定X是非线性关系。E值从0-1,其E2具有消减误差的意义。5.定类+定序=两个定类,大部分的社会学研究都采用Lambda或tau-y系数来测量6.定序+定距因此社会学家常改用 相关比率即将定序变项看做是定类变项。 E 参数值的估计: 间距估计:均值、百分率、积矩相关求总体的均值M已知:n,(样本的均值),可信度为95%,求M。(S是样本的标准差)已知:n,可信度95%,样本比率p,求总体比率P。(百分率(或比例)的间距估计) 已知:,可信度,M或e,求n。 (决定样本的大小)已知:可信度,p,P or e,求n。计算公式表(三)假设的检定:两个变项之相关 Z
9、(5个)、t(4)、F(2个)Z检定法(大样本)、t检定法(小样本):定矩变项、随机抽样、总体正态分布。1、Z检定法2、t 检定法(大样本)n100 (单均值)(小样本)n30以t值来表示样本的均值在标准化抽样中分布中的位置。两个均值的差异n=n1+n2100两个小样本n1+n2100,df=(n1-1)+(n2-1)=(自由度)单百分率(单均值)小样本n30八: P188,df=Ns+Nd-2两个百分率的差异一个变项两个样本的比率。两个随机样本百分率之相差的抽样分布接近正态分布。分母就是标准误差。Z对G的检定八:P188-18 93、F检定 (方差分析)4、x2检定 (非参数检定法)F对E检定df1=k-1,df2=n-k。(df1=1,df2=n-2)自由度df=(r-1) (c-1) (r横 c列) 都是定类变项,用来检定是否相关。H1 :X与Y相关H0 :X与Y不相关(总体中) X 1 2 A1 A2 (A1 、A2 :X的边续次数:行)(B1 、B2: Y的边续次数:列)由E派生F对r检定其中:f是根据所抽取的样本而计算出来的实际次数,e是与每个实际次数相应的预期次数,A与B分别是X与Y两个变项的边缘次数,n是样本大小,r与c分别是表的行数与列数。专心-专注-专业
限制150内