数据分析与Stata软件应用(微课版)-源代码汇总 第2章 数据的获取、与Stata实现---第8章Stata综合案例分析.docx
《数据分析与Stata软件应用(微课版)-源代码汇总 第2章 数据的获取、与Stata实现---第8章Stata综合案例分析.docx》由会员分享,可在线阅读,更多相关《数据分析与Stata软件应用(微课版)-源代码汇总 第2章 数据的获取、与Stata实现---第8章Stata综合案例分析.docx(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据分析与Stata软件应用(微课版)源代码第2章 数据的获取、整理与Stata实现2.1数据的获取与Stata实现.input y x/输入y,x两个变量数据/.set memory 50m, permanently/将存储空间设置为 50mb/.use f:statadatacha2a/读入名为 cha2a 的数据文件/.use in 1/20 using f:statadatacha2a/读取所有数据中的前 20 个个案/.insheet using f:/stata/data/data 1 .txt /读入名为 datal 的数据文件/.infilc id y x z using f:
2、/stata/data/data2.txt /读入名为 datn2 的数据文件/.infix id 1-2 y 3-5 x 6-8 using f:/stata/data/data3.txt /读入名为 data3 的数据文件/.save f:staladata2/存储名为data2的数据文件/.use f:/stata/data/cha2a/读入名为 cha2a 的数据文件/.list id female source, nolabI展示企male,source3个变量的数据,但是不显示变量数值标签/.replace high=. in 5 /将第5个样本的high变量数据变为缺失数据,并用
3、“来表示/.replace high=. in 9 /将第9个样本的high变量数据变为缺失数据,并用来表示/.describe id female source/查看 female,source 变量的显示格式/.format female source/查看笈male,source 变量的显示格式/.label data “student in statistics school”/给数据文件添加标签/.label variable id “xuehao/绐 id 变量添加标签/.label define rsex 1 female 0male /给 rsex 变量添加变量值标签,取值 1
4、 表示 fem ale,0 表示male/.notes: data is in 2001/给数据文件添加注释/.note score: math score in 2001/给变量 score 添加注释/2.2数据的整理与Stata实现排序.use f:/stata/data/cha2a/读入名为 cha2a 的数据文件/.sort score /按照score变量的取值向上排序/.sort score high/先按照score变量的取值进行向上排序,在score变量取值相同的观察个案中,再按照hi的变量的取值向上排序/.gsort -score/按照score变量的取值向下排序/.gsor
5、t -score -high/先按照score变量的取值进行向下排序,在score变量取值相同的观察个窠中,再按照high变量的取值向下排序/. gsort score -high/先按照score变量的取值进行向上排序,在score变量取值相同的观察个案中,再按照high变量的取值向下排序/数据子集的选择.use f:/stata/data/cha2a/读入名为 cbn2n 的数据文件/.list score in 1/10/展示从第I个至第10个观测个案的score变量取值/.list score in 20/1/展示的是最后10个观刻j个案的score变量取值/.list score i
6、f score85 /挑选score变量取值大于85的个案子集/.list score female if femaIe0 /挑选female变量取值大于0的个窠子集/.bysort female: sum score /对female变量下的不同取值(即不同类别)分别进行score 变量的统计描述/.sort female/对female变量进行排序/.by female: sum score/对female变量下的不同取值(即不同类别)分别进行score变量的统计描述/数据的保留和删除.keep if x100/保留x取值,大于100的个案/.drop if gdp0/对于female0的
7、观测个案,将x的取值(即缺失值)一并替换为20/.recode score 81/100=1 0/80=0/将score变量取值大于80的观察个案的/score赋值为1, score变量取值小于等于80的观察个案的/score赋值为0/虚拟变量的生成.tabulate source, gcncratc(rsourcc)/生成虚拟变量rscurce/变量的转换.encode source, generate(lsource)/将字符变量source转变为数值变量/source/.decode female, generaie(femalex)/将数值变量female转变为字符变量femalex/
8、display 命令.display 50+20/计算50+20的数值/第3章数据的描述与Stata实现3.1数值变量数据的分布特征描述.use f:statadatastatistics.dta /读入 stuns des.dra 数据文件 /.describe/输出变量的描述统计量情况/.list rd new income/显示所有观测个案的rd和newincome变量信息/.list rd newincome if area=2/显示 area =2 的观测个案的 rd 和 newincome 变量信息/.sum rd newincome/对rd,newincome变量进行基本描述统计
9、分析/.tabstat rd newincome, stats(mean range sd skewness)/输出 rd,newincome 变量的均值、全距、标准差和偏度值/3.2 分类变量数据的分布特征描述.use f:statadatacrosstab.dta /读入 crossrab.dta 数据文件 /.table profession, contents(n wage mean wage sd wage)/显示不同profession 等级的个案w嘤变量的样本量、均值和标准差/.tabulate profession work, chi2 /生成 profession 和 wor
10、k 变量的二维交叉列联表,并进 行显著性检睑/.tabulate profession work, sum(wage)/生成pro历ssion 和 work 变量的二维交叉列联表,并输出wage变量的统计结果/数据的图形描述.use f:statadatacrosstab.dta /读入 cross tab.dtn 数据文件 /.hist wage/输出变量wage的密度直方图/.hist wage, frequency/输出变量wage的频数直方图/.hist wage, percent normal by(gender)/输出不同gender等级个案的变量wage的密度直方图,并配合正态分
11、布曲线/. scatter age wage/绘制age和wage的简单散点图/.scatter age wage, msymbol(T) mcolor(grecn) msizc(huge) I绘制age 和 wage 的简单散点 图,并设置形状、颜色和大小/.scatter age wage, connecl( 1) /绘制age和wage的简单散点图,并配合连接直线/.graph pie, over(profession) /输出 profession 的扇形图/.graph pie wage, over(profession)/输出profession的质形图,每个扇形面积为对应个案的R
12、空变量值/.graph pic wage age /wage变量为一个扇形,age变量为一个扇形/.graph bar wage, over(profession) /按照profession 取值绘制 wage 变量的条形图/.graph bar wage age, over(profession)/按照profession 取值绘制 wage 和 age 变量的条形图/第4章数据的均值比较、推断与Stata实现4.1 单样本数据均值的比较与推断.use f:statadataonesamplet.dta /读入 oncsamplct.dta 数据文件 /.describe /数据信息的基本
13、了解/.ttest score=80/单样本 r 检脸/.signtest score=80/单样本符号检验/两样本数据的均值比较与推断.use f:slaiadatalwosamplelldla /读入 twosamplctl.dtn 数据文件 /.tab math school/显示math和school的交叉列联表/.ttest math, by(school)/两独立样本t检验,前提为方差相等/.ttest math, by(school) unequal/两独立样本t检险,前提为方差不相等/.use f:statadatatwosamplct2.dta /读入 nvosamplcr2
14、.dt;i 数据文件 /.ttest before=after /两配对样本 t 检验/4.2 多样本数据的均值比较与推断.use f:statadataanova.dta /读入 ancva.dta 数据文件 /. anova score class /以class为控制变量,以score为观测变量的单因素方差分析/.anova score class sex class#sex /以class,sex为控制变量,以score为观测变量的多因素 方差分析,包含交互效应/.anova score class c.prescore/以 score 为观涮变量,以 class 为控制变量,以 pr
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据分析与Stata软件应用微课版-源代码汇总 第2章 数据的获取、与Stata实现-第8章 Stata综合案例分析 数据 分析 Stata 软件 应用 微课版 源代码 汇总 获取 实现 综合
链接地址:https://www.taowenge.com/p-72741330.html
限制150内