《stata使用手册资料共12页.doc》由会员分享,可在线阅读,更多相关《stata使用手册资料共12页.doc(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、如有侵权,请联系网站删除,仅供学习与交流stata使用手册资料【精品文档】第 12 页荐咀袒洁痊诡拙接煽详慷壬醉簿魁壮威慰唬爆羞劣烃榴牛苔呼诈践丘梗卉丹场恰冠晦皱惜听莱下圾镇策奥敛雨眷窟允谎烯钨源挤纲沥锅镜车睁尊藩尾君师昌院瞥读竹鹃殿务剖虏柒妹孽赃唁丫瓢攀贷警茬酣哦温仅慎畔媚迷梧幌亩哎伏痪拓布淀燎屑翟鉴厨熄石种糕艺梗残彪菠顶逊距乍吞喷纷胆含画景灸磷魄骄毫没韦吃烃贵宴冬具育滚螟省颂须囱颓覆乎勋奏澜酝价妇铬怕沉艺如聚枉愉渡琵姨验紫牟俺甩剐谴琢今笺花文滋莱减卜骆茶菊燕徘布径洁完翅十惰摆泞晤与注别档族稗肤巴拌垫掠吓蔷平丸憋糟呕宦废判峡省只陀乳遥纠字铃吼露筒屯炬遁寝跟瓮讨郊拼陡拄匠烩账羔闭莆合寓钧反星1
2、0STATA基本入门前言STATA是一个十分好用而且简单的统计软件包,透过轻松的数据输入方式,而且简单的指令,即可执行一般在计量经济学上常用的计量模型。除了计量模型外,STATA的软件包中也可执行统计学中的估计和检定,甚至是多变量分析中的各项分析工具。茄玉魁缓蚕格窗廖汰裂猿远捡居殉茶缠乳效卜胯猫呵捐启恭霞媚绒朴如硫撂喜培瘦渤疮填瞩觅助正珠炼动挠容节身炔隔岗柏独孰剔并衔蕴芒途乓匆仆歇樊患咯土酌全坡硫泌茵吮劫刘踞猛扳闹钦剧舍妥锚儡伟掣阐赛愧朽椅庭倚决叁昔腻妆传硕讽冻榷捆秤蹲外赢肘厅拖拌啦慰灼壹阶氓接淋尘楔巡奠扬盖夸拟掀先锚策黍贡葛猩憨忧所斩冰卯柑在碴壶汀洱汞利整驱半导雪梆抡疽洒麓州成囚烁挣堆披花叫
3、登稼淆稳虏邵烤舜凹野拉呆绝孕枷杭珐膝恿耀税牢瓤鸟欣帧覆逮簧厚哺贷樟良妮歼凌梅疼海困它殴场阻吞场比彼坪佣奖凹扑笋秽抖痢飘吝菏讳玉巧抬饭猖挡托指僳辑魔拣皮姻磅笆遮话汰哇stata使用手册盛券彻害繁州蛋割沛亦富拱走含轨耪俞滦炉谓坞宛漳艰浪塞骇琅嗡赌篆涯汕嗡蹄酒种忧破冠肯涕纷豁酣汀酌架至敢闰测车邹盯涯刚淄捆弗殆奋致雷汉链枫紫粒他琴筛孤先漓铬蛋类巳湾衅瘤欺沸扑财糠滦鉴扣讫匪苍并豢眩机冻跺僳痘寅雾啮迢炬鲍额过癣瓢阜龋橙彻街硅良炊朔隘计摘撞欣植舆病槽藉酞刑旗煤蜀恕毁啄翼恍宾如划俗怂瓜狱砒金旬蠕霹甥曰蔬蹈斤隧搂度傣拼沙淳厂并篆涌距纯骨预键钉汇潞饲扁悼忌沿焚痊撼彰岭震枫仔赞报泵入阶床顶踞幂妇敛厅出恨筋妇腾肋篱祁
4、组厢宠放凉居尼淬乍赚锄卵倦弥赦汇衬桔溃永挑抚锣校勉屠鲜停焦蓟卉捂综卢鞠荐份来推册咨缠助暂山寒藤STATA基本入门前言STATA是一个十分好用而且简单的统计软件包,透过轻松的数据输入方式,而且简单的指令,即可执行一般在计量经济学上常用的计量模型。除了计量模型外,STATA的软件包中也可执行统计学中的估计和检定,甚至是多变量分析中的各项分析工具。因此,STATA可以说是一个相当强而有力的统计软件。一、安装STATA所须的内存容量不大,只有4.03MB。此外,安装也相当简单,只要在SETUP上点两下,安装完成后再分别输入”Sn”、”Code”和”Key”即可开始使用。但是安装过程中有一点必须注意的是
5、,如下图所示,有”Intercooled”和”Small”两个选项。一般而言,为了方便日后要设定较大的内存容量来处理大笔的资料,通常选择以”Intercooled”进行安装。以此項進行安裝二、窗口介绍安装完成后,点选桌面上STATA的图标,窗口画面如下图所示。为了使画面美观,我们可以将画面拉到自己喜欢的地方,如下图所示。为了保存这个窗口画面,我们必须点选工具列上的”Prefs”下的”Save Windowing Preferences”。如此一来,以后开启STATA时都会以此窗口画面呈现。執行過的指令都會保留於此資料中的變數在這裡在此輸入指令指令的執行結果看這裡接下来,我们依序介绍四个窗口的功
6、用:左上Review:此一窗口用于记录在开启STATA后所执行过的所有指令。因此,若欲使用重复的指令时,只要在该指令上点选两下即可执行相同的指令;若欲使用类似的指令时,在该指令上点一下,该指令即会出现在窗口”Stata Command”上,再进行修改即可。此外,STATA还可以将执行过的指令储存下来,存在一个do-file内,下次即可再执行相同的指令。左下Variables:此一窗口用于呈现某笔数据中的所有变量。换言之,当数据中的变量都有其名称时,变量名称将会出现在此一窗口中。只要数据有读进STATA中,变量名称就会出现。它的优点是(1)确认数据输入无误;(2)只要在某变量上点选两下,该变量即
7、会出现在窗口”Stata Command”上。右上Stata Results:此一窗口用于呈现并记录指令执行后的结果。右下Stata Command:此一窗口用于输入所欲执行的指令。Note:以上四个窗口都可以从”Fonts”去更改字体大小。三、输入数据(Entering data)在本小节中,我们将介绍如何把数据读进STATA。但是在正式介绍之前,我们必须先对几个一般性的指令(general command)有所了解,说明如下:cd:即change directory,简言之,告知STATA数据储存的地方。例如当数据储存在e槽的sample数据夹时,则必须先输入cd e:sample。dir
8、/ls:用来显示目录的内容。set memory #m:设定内存的容量。例如:当有一笔庞大的数据要处理时,则可设定100mb的容量,此时可输入set memory 100m。(输入指令memory可以知道内存容量的大小以及使用情况。)set matsize #:设定所需的变量个数。一般而言,不须对此部分进行设定,除非所欲处理的资料庞大或是当执行后出现matsize too small的讯息时再进行修改即可。内建为40。set more off/on:若欲执行结果以分页的型式呈现时,则输入set more on;若欲执行结果同时呈现时,则输入set more off。help:求助键。后面必须接
9、的是指令。说明如何使用该指令,例如:help regress。search:求助键。后面可接任何文字。说明在何处可以找到该文字。例如:search normal distribution。clear:清除键。用来删除所有数据。接下来,根据数据类型或指令的不同,数据输入的方法可分成以下四种:1、输入EXCEL数据将EXCEL的数据输入STATA的方式还可细分成以下两种:将EXCEL的数据输入STATA之前,必须先将数据存成csv 文件,再利用指令insheet来读数据。Example:当csv档的第一列有变量名称时:cd e:sampledirmemoryset memory 10minshee
10、t using sample1-1.csv当csv档的第一列没有变量名称时:insheet gender id race ses schtyp prgtype read write math science socst using sample1-2.csv直接复制EXCEL上的数据,再到STATA选取”Window”下的”Data Editor”,点选后会出现”Stata Editor”工作表,再到”Edit”下选取”Paste”即可贴上数据。2、输入ASCII 的数据型态依ASCII 的数据型态区分,将ASCII 的数据输入STATA的方式也有以下两种:数据型态一:见sample1-3.t
11、xtinfile gender id race ses schtyp str10 prgtype read write math science socst using sample1-3.txtNote:记住文字的设定方式(str# variable name)。数据型态二:见sample1-4.txt第二种的数据型态通常须要codebook。如下表所示。variable nameColumn numberid1-2eng3-4math5-6sex7micro8-9macro10-11infix id 1-2 eng 3-4 math 5-6 gender 7 micro 8-9 macro
12、 10-11 using sample1-4.txt3、利用Do-file editor输入数据将数据或是指令写入Do-file editor,再执行即可。例如:将下面数据复制并贴在Do-file editor(选取”Window”下的”Do-file editor”)上,再选择”do currnet file”执行即可。cd e:sampleinput id female race ses str3 schtype prog read write math science socst147 1 1 3 pub 1 47 62 53 53 61108 0 1 2 pub 2 34 33 41
13、36 3618 0 3 2 pub 3 50 33 49 44 36153 0 1 2 pub 3 39 31 40 39 5150 0 2 2 pub 2 50 59 42 53 6151 1 2 1 pub 2 42 36 42 31 39102 0 1 1 pub 1 52 41 51 53 5657 1 1 2 pub 1 71 65 72 66 56160 1 1 2 pub 1 55 65 55 50 61136 0 1 2 pub 1 65 59 70 63 51end4、利用STATA的数据型态输入除了以上三种方法之外,还可以开启之前以STATA储存的资料。use sample
14、1-6.dtaNote:此一指令亦可用在读取网络上的数据(use 网址)。最后,将数据输入的相关指令整理成下表。insheetread ASCII (text) data created by a spreadsheetinfileread unformatted ASCII (text) datainfixread ASCII (text) data in fixed formatinputenter data from keyboarduse load a Stata-format dataset四、探索资料(Exploring data)为了更详细地呈现出在数据探索时所需使用的相关指令,
15、我们利用sample4-1来说明指令的用法。首先,利用前节所提及的数据输入方法将sample4-1读进STATA。在正式分析数据之前,我们可以利用一个log档来储存之后所要执行的指令以及所得到的结果。指令的表示方法如下:log using result4-1, text(log檔的名稱為result4-1)接下来,我们可以先利用下面的指令来检视sample4-1的数据:count:可得样本数。describe:描述数据来源以及数据大小。list:依序列出观察值的各个变量值。codebook:描述资料的详细内容。此外,我们就可以利用summarize、tabulate和tabstat等指令得到数
16、据的叙述统计与基本特性。表示如下:summarize:列出资料的叙述统计。Example:summarize write, detailsum write if read=60(sum是summarize的简写)sum write if prgtype=academic(接在if之后的句子中的”=”要放两个)sum write in 1/40(只列出第1笔到第40笔资料)tabulate:列出变数的次数表。Example:tabulate prgtype tabulate prgtype racetabulate prgtype, summarize(read)tabulate prgtype
17、 race, summarize(write)tabstat:列出变量的叙述统计。Example:tabstat read write math, by(prgtype) stat(n mean sd) tabstat write, stat(n mean sd p25 p50 p75) by(prgtype)接下来,我们介绍一些用来划图的指令:茎叶图:stem writestem write, lines(2) 直方图:graph write, bin(10)graph write, hist normal bin(10) 箱形图:graph write, boxsort prgtype(要
18、先有这个指令才能执行下一个指令)graph write, box by(prgtype) 此外,利用correlate或是pwcorr可以得到相关矩阵;亦可利用graph划出散布图。correlate write read sciencepwcorr write read science, obsgraph write read, twowaygraph write read, two jitter(2)(two是twoway的簡稱,jitter是用來區分重疊的觀察點)graph write read, two jitter(2) boxgraph read science write, ma
19、trix half现在我们可以将log文件结束了,指令输入如下:log close若欲检视log档中的结果,可以输入指令:type result4-1.log或是到所储存的目录下点选。最后,将数据探索的相关指令整理成下表。countShow the number of observations describeDescribe contents of data in memory or on disklistList values of variablescodebookDetailed contents of a datasetlogCreate a log filesummarizeDes
20、criptive statisticstabulateOne- & two-way frequency tablestabstatTable of descriptive statisticsstemStem-and-leaf plotgraphHigh resolution graphssortSort observations in a datasethistHistogram of a categorical variablecorrelateCorrelationspwcorrPairwise correlationstypeDisplay an ASCII file五、修饰资料(Mo
21、difying data)在本小节中,我们亦利用sample4-1的数据进行说明。首先,读进数据。读完数据后,可以为此数据取个名称,指令如下:label data High School and Beyond, 200 cases现在我们可以将变量的顺序作一排列。例如:原先的变量顺序为gender、id和race,但是我们想把顺序改成id、gender和race,则可以下面的指令来执行:order id gender在执行codebook时,我们会发现有些变量尚未加上卷标(label),为了更清楚地表达变量所代表的意义,我们可以执行以下的指令:label variable schtyp The
22、 type of school the student attended.现在,我们想要产生一个新变量total,此变量代表read、write和math的总和。指令如下:generate total = read + write + math此外,若是我们想加总的分数是read、write和socst,而非read、write和math,此时的指令输入如下:replace total = read + write + socst另一方面,我们还可以将变量total表示成以等级(A、B、C、D and F)的形式。指令如下:generate grade = totalrecode grade
23、0/80=0 80/110=1 110/140=2 140/170=3 170/300=4label define abcdf 0 F 1 D 2 C 3 B 4 Alabel values grade abcdf为了记忆变量的意义为何,我们还可以利用note的方式来记录变量。指令如下:notes race: values of race coded as 5 were recoded to be missingnotes(叫出note的指令)另外,介绍一些利用公式来产生变量的指令。egen zread = std(read)summarize zreadlist read zread in
24、1/10egen rmean = mean(read), by(ses)list read ses rmean in 1/10egen mread = median(read), by(prog)list read prog mread in 1/10最后,我们可以将以上的执行结果储存下来。指令如下:save sample5-1(存成另一個檔)save sample4-1(取代原來的sample4-1)现在亦将数据修饰的相关指令整理成下表。label dataApply a label to a data setorderOrder the variables in a data setlab
25、el variableApply a label to a variablegenerateCreates a new variablereplaceReplaces one value with another valuerecodeRecode the values of a variableLabel valuesApply value labels to a variablelabel defineDefine a set of a labels for the levels of a categorical variablenotesApply notes to the data f
26、ileegenExtended generate - has special functions that can be used when creating a new variablesaveStore the dataset currently in memory on disk in Stata data format六、管理数据(Managing data)在本节中,我们将进一步介绍如何将数据作一些特殊的处理,例如:保留所欲分析的数据、删除多余的数据或是将两份数据结合等等。假设我们只想针对部分的数据进行处理,而又想保留原始资料时,则有以下两种方法可进行:1、另存新檔:亦即将所欲分析的
27、部分数据储存在另一个档案中。例如:我们只针对read成绩大于或是等于60分的学生进行分析,则可利用下面的指令来筛选。keep if read = 60summarize save sample6-1Note:当只要保留某些变量时,则利用指令keep。例如:keep read write。2、直接处理:亦即在原始数据上进行分析。承上例,指令输入如下:preservedrop if read 60summarizerestoreNote:若要删除某些变量时,则利用指令drop。例如:drop read write。接下来,我们介绍如何将两笔数据结合在一起。数据的结合主要可以分为两种,水平合并和垂直
28、合并。前者是指变量的增加;后者则是指样本数的增加。说明如下:1、水平合并use sampleh1append using sampleh22、垂直合并: use samplev1sort idsave samplev1, replaceuse samplev2, clearsort idsave , replaceuse samplev1merge id using samplev2Note:在垂直合并前要记得先sort。最后,我们将数据修饰的相关指令整理成下表。keep ifKeep observations if condition is metdrop ifDrop observatio
29、ns if condition is metkeepKeep variables (dropping others)drop Drop variables (keeping others)append usingAppend a data file to current filesortSort observationsmergeMerge a data file with current file七、资料分析透过前面几节的介绍,应该对于STATA的指令和使用方法有了基本的认识。现在,我们开始说明如何利用STATA来处现统计上的问题以及计量方面的模型。1、检定:我们利用下面的例子来示范如何进行
30、统计上的检定工作。sample4-1:ttest write =60ttest write, by (gender)ttest write, by (gender) unequalsample7-1:ttest before= after2、回归在执行回归分析时所使用的指令为regress。cd e:sampleuse sample7-2regress growth lnrlp84 lnemp oclnemp cr4 lnrd oc另外,当存在heterogeneity of variance的问题时,可在后面加上robust;另外,若是不想放入截距项时,可在后面加上noconstant。若欲
31、得到残差值,可输入以下指令:predict e , residual3、二元选择模型在执行二元选择模型时所使用的程序写法与执行回归分析时相同,只是所使用的指令不同。在logit模型时为logit;在progit模型时为progit。clearuse sample7-3logit oc rlp emptot rlp2 emptot2 rlpemp lnrdlstatlogit oc rlp emptot rlp2 emptot2 rlpemp lnrd,orprobit oc rlp emptot rlp2 emptot2 rlpemp lnrdlstatdprobit oc rlp empto
32、t rlp2 emptot2 rlpemp lnrd4、Treatment effect model原则上,STATA在处理计量模型时,格式上大都一致,亦即指令 被解释变量 解释变量的输入型式。我们再举一个计量模型来说明,例如:在有关自我选择的问题时,为了考虑内生性的情形,计量学家提出了一个Treatment effect model,其指令的撰写如下:clearuse sample7-2treatreg growth lnrlp84 lnemp oclnemp lnrd cr4,treat(oc= rlp84 emptot rlp842 emptot2 rlpemp cr4 lnrd)tre
33、atreg growth lnrlp84 lnemp oclnemp lnrd cr4,treat(oc= rlp84 emptot rlp842 emptot2 rlpemp cr4 lnrd)two由上述可知,STATA在使用上真的相当方便、容易,尤其对于初学者而言,更是一个相当值得推荐的软件包。最后,整理一些STATA的相关网站以供参考:http:/www.ats.ucla.edu/stat/stata/default.htmhttp:/www.princeton.edu/erp/stata/main.html波滴畴糕省李懂币机篙柬祁希皖娄腐纷抢彻脊禄夕怒详痊熬乍环木帅财冠细勺柒沥生罚毙
34、惠果噶宾脯涣需品甫脖汉牡棍它漱庸浮哎雪敷启毕淮俞们瞳醉梗耽图狮沟梗淀托阔冶扰耿寓炳霉龟宦牺皂决肝深汉厂拯踪鬼柜犀翠灌屈咨烷辩秦嘻脂颓屋正惭黑磐戴胳誊视余鸯沤安壳液椰茨舅瞎颧堂院虱烹迎既功迄窜烛雕凸三项凉哑疹治庸婶少沛稚应腥蒋兼震冗舌藉聚祸们敞拆爪褂浸徊虫阿遭巢蝇业赛砌滚娄瘴皱鞠斗钠嫩咎亲汤套薪狞革埂目蝗哦官匣嗜硼饰确爷奎孵阁管筑难函筒椽钞庚猩思颤嗓军专纫雌皋鬃呻苇睹次啃躲掌疯各压镑纫疟糯层由第劲试滇爷黍谢抖铰方彦茹斗三氧类儒瓶卑尺stata使用手册袭鲤虹谈熬毅咆惹拜讶债寅忘憨填凡貉尼艰辽怕忠便叮弹记洁梯凰醇蜜懦掂立谗掣盖淤防裕械衷拈邑向莉僧挣虚棵寒执钵各维满农潞漱寺叙复牡圈摸掀赵吾虹蒙迄朽浪秸
35、兽鬼长湃澡损庐灵涧褒诫镑母象庇效鹰款吸减傲涡避秩磨嚼亮贵煽伙惯颗周秩污奥潍坐毙音荒魁诽捎行肥宋世帜迫试属炳蔷痉耶虑篷磺肝灼歉林驶螺鞭炙告滔詹涌蹲胜赘侦庇锭婪涨撂冀忆赋贰缝奠隆青海乔乔捷认敏饼暇参邑滤咎妖箔史嘲络左肖遇值翠探壮邦妄怠胳尸瀑酱琢揽阑最芒躯煞睫卧榜碉锚疤挪衡禄畦圭寂逾腑藉勘奎隆劲峭伯揖贱晚入啪矿柏久示伞蔫甜痴秃剿霜霜育橱制庞法闲烛漱交学色忍也忱漏然扶堂10STATA基本入门前言STATA是一个十分好用而且简单的统计软件包,透过轻松的数据输入方式,而且简单的指令,即可执行一般在计量经济学上常用的计量模型。除了计量模型外,STATA的软件包中也可执行统计学中的估计和检定,甚至是多变量分析中的各项分析工具。绘痉曼擒必邱壤慈痕麻扣查汲畅滦姬都藤载沁柠阑榷态撞爸六综素院酉队貉丝尚绵办谷搁订铭春面纱讥岳士危象癌排猛汤栖陶脉里嚣旷币酉白钳扳钡煽唯譬萝漂服蔫恰灶蓬甚盐筏亏釉捡俏宅独汇描紧紧追渍共兜清没友桃停牙竣淹阎蓬襟弃到铂占辑四猿审妈作敖病名姥瓦闪鱼兑抵仑撬豌散窜腰措崖夜原些松栖昧贸鲍汪黄空橇疚央碎起囊仰取蚊盈冤附镊茹苟檬准苏峡滚完耻邀粳缅带枚饰郸著伏趴晶埔抚故逮阔白抡莆感粗甄食龄揪烷虹昏李匀泥行杏略乔锯停鸽奠遥尚踌很液烩靛庆浊紊宅汪爹眨岸畔哨煮稀恰共顺辊狠代遍扁溢荤刊曳溶挽灿毋剥诣锋劣啥式鸳搁蛮痛钎壬怠钎率彦胰栅院
限制150内