《STATA实用教程.pdf》由会员分享,可在线阅读,更多相关《STATA实用教程.pdf(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 书名 STATA 实用教程 作者 王天夫,李博柏 出版 中国人民大学出版社 ISBN 978-7-300-09639-1 分类号 C812 关键词 统计分析应用软件 时间 2008 备注 第一章 接触 STATA 小而功能强大;数据存储在内存中,运算速度快;语法简单,结果易读;可编程 cd direction /*调整默认目录,当路径中存在空格时要加引号*/set memory number /*内存设定,默认单位为 KB,可自定 MB*/exit /*退出*/第二章 STATA 命令 prefix:command varlist=exp.if exp.using filename in r
2、ange weigh:,options 命令前缀 命令 变量串 表达式 条件式 使用文件 个案范围 权重 选项 var|var#-var#|var*/*表示单变量、多变量、以 var 开头的变量*/in#|in-#|in#/#/*表示第#个、倒数第#个、从第#到第#个变量*/help commandname /*帮助*/第三章 使用 STATA 数据文件 一、读取数据 use filename,clear /*读取全部数据,选项 clear 表示清空内存*/use var1 var#using filename /*将数据部分变量读进内存*/use in#/#using filename /*
3、将数据部分个案读进内存*/use if var=#using filename /*将数据特定个案读进内存*/use filename if var=#/*同上*/二、数据的标签与注释 label data“text”/*标签用于对数据整体的说明,这是贴标签的命令*/notes:“text”/*注释用于记录操作过程,这是写注释的命令*/note /*这是读注释的命令*/三、数据的显示 browse if /*弹出数据表格窗口,if 表达式可以弹出满足条件的 数据表格窗口*/describe /*显示数据的整体信息,如样本量、变量个数、变量列表*/codebook varname#/*显示具体某
4、个变量的编码、格式等*/list varname#in /*以列表形式显示指定的若干变量*/四、数据存储 save filename,replace 五、数据压缩 compress /*数据压缩与变取值的存储格式有关,节约内存*/第四章 变量的属性和运算*变量标签,对变量本身进行说明 label variable varname“text”/*贴标签*/*数值标签,说明变量下各取值的含义 label define labelname#text1#text2,modify /*定义数值标签*/label value varname labelname /*将数值标签赋予某变量*/label li
5、st labelname /*显示某数值标签内容*/,nolabel /*在命令结果中显示原始取值*/*rename oldvarname newvarname /*变量重命名*/sort varlist /*排序(从小到大)*/gsort-varname#/*排序(从小到大)*/command varlist if varnameexp./*条件输出*/by varname:command varlist,sort /*对某一变量所有取值的条 件输出,先进行 sort 操作,或增加,sort 选项*/generate newvarname=exp.ifin /*生成新变量*/replace
6、varname=exp.ifin /*替换已有变量的值,一般使 用 generate 进行新变量的生成,但是 generate 的缺点是其条件表达会导致缺失值生 成,因此用 replace 进行弥补,这两个命令组合使用*/recode varname exp.nonmising|else exp.,generate(newvarname)/*变 量重新编码,其中 nonmissing 是指将其他非缺失值编码为#,else 则是将其他所有值 编码为#;选项 generate 可以在不改变原有变量的同时生成编完码的新变量*/generate newvarname=autocode(oldvarna
7、me,#,min,max)generate newvarname=recode(oldvarname,#,#)*连续变量变成非连续变量的五种策略*其他 Stata 中的函数 round(x),int(x),uniform(),invnormal(uniform()egen 命令 计算器功能:display normal(#),display invnorm(#),display 1-normal(#)第五章 命令程序(do.文件)1)注释:/*text*/,或*text(整行)2)超长命令的处理 Stata 会默认分段符为提交命令的标志。在.do 文件的编写过程中,我们如果遇到非分段不可的情况
8、,有两种解决方案:第一,将用/*/隔离,这样就只有换行的效果而Stata 不会执行命令;第二,改变提交命令的符号。3)中断分页符 在.do 文件中中断分页符,在命令行开始时添加 set more off,其反向过程为 set more on。这个命令在窗口提交命令时也适用,在窗口时,还可以直接按 Q 取消-more-显示 4)记录文件(log)log using filename,smcl|text /*开始命令记录,并在内存生成文档*/log close /*结束命令记录*/log off|on /*暂停/重启命令记录*/5)嵌套 do /*在.do 文件中嵌套其他.do 文件*/第六章 数
9、据描述、制表、比较与检验*列出数据与查看数据 list varname#in,clean codebook varname#*使用 summarize 计算描述性统计量 summarize varname#,detail*使用 tabstat 计算描述性统计量 tabstat varname#,stats()tabstat varname,stats()by(varname)tabstat varname#,stats()by(varname)*计算置信区间 ci varname#cii count mean dev|count p.*单变量频次表 tabulate varname table varname *两变量列联表 tabulate varname1 varname2,options tabi#,options*多个表格与多维表格 bysort varname:table varname1 varname2,options table varname1 varname2 varname3*显示描述性统计量的列联表 ta varname,summ(varname)ta varname1 varname2,sum(varname)means table varname1 varname2,contents()
限制150内