应用统计学数据管理讲稿.ppt
《应用统计学数据管理讲稿.ppt》由会员分享,可在线阅读,更多相关《应用统计学数据管理讲稿.ppt(79页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、应用统计学数据管理第一页,讲稿共七十九页哦 在在数数据据文文件件建建立立好好之之后后,还还需需要要对对数数据据进进行行必必要要的的加加工工处处理理。对对同同一一个个数数据据往往往往需需要要从从各各种种不不同同的的侧侧面面进进行行研研究究,采采取取多多种种统统计计方方法法进进行行分分析析,而而不不同同的的统统计计方方法法对对数数据据文文件件结结构构的的要要求求不不尽尽相相同同,这这就就需需要要对对数数据据文文件件的的结结构构进进行行重重新新调调整整或或转转换换,以便适合于相同的统计方法。以便适合于相同的统计方法。数据管理数据管理 文件级别的数据管理文件级别的数据管理 变量级别的数据管理变量级别的
2、数据管理第二页,讲稿共七十九页哦文件级别的数据管理(文件级别的数据管理(1)SPSS中中的的Data菜菜单单提提供供了了文文件件级级别别的的数数据据管管理理,可可以以对整个数据文件进行加工整理。对整个数据文件进行加工整理。第三页,讲稿共七十九页哦 Insert Variable:插入变量:插入变量 Insert Cases:插入记录:插入记录 Go to Case:到达某条记录:到达某条记录 简单命令简单命令(这些功能都可以用鼠标在数据表界面(这些功能都可以用鼠标在数据表界面 直接完成,很少用菜单操作,在此不详述)直接完成,很少用菜单操作,在此不详述)Sort Cases:记录排序:记录排序
3、Split File:记录拆分:记录拆分 Select Cases:记录筛选:记录筛选 Weight Cases:记录加权:记录加权 常用的简单过程常用的简单过程(使用频繁,必须掌握)(使用频繁,必须掌握)文件级别的数据管理(文件级别的数据管理(2)第四页,讲稿共七十九页哦 Define Variable Properties:定义数据字典:定义数据字典 Copy Variable Properties:将预定义的数据:将预定义的数据 字典直接引入当前数据文件,即复制外部数据字典直接引入当前数据文件,即复制外部数据 文件属性到当前数据文件文件属性到当前数据文件 变量与数据文件属性向导变量与数据
4、文件属性向导(对大型或连续性数据分析项(对大型或连续性数据分析项目非常有用)目非常有用)Transpose:数据转置:数据转置 Restructure:数据文件的重新排列:数据文件的重新排列 数据重构向导数据重构向导文件级别的数据管理(文件级别的数据管理(3)第五页,讲稿共七十九页哦 Add Cases:纵向合并:纵向合并 Add Variable:横向合并:横向合并 文件合并过程(文件合并过程(Merge Files)Define Dates:定义日期变量过程,用于时间序列数据:定义日期变量过程,用于时间序列数据 Aggregate:数据汇总过程:数据汇总过程 Identify Duplic
5、ate Cases:查找重复记录:查找重复记录 其他过程其他过程文件级别的数据管理(文件级别的数据管理(4)正交设计过程(正交设计过程(Orthogonal Design)第六页,讲稿共七十九页哦单变量排序单变量排序:SPSS提供了一种简易操作方法,提供了一种简易操作方法,即在数据表格的变量名处单击右键,弹出右图即在数据表格的变量名处单击右键,弹出右图多变量排序:多变量排序:使用使用Sort Cases过程来进行,过程来进行,查看详情查看详情记录排序记录排序第七页,讲稿共七十九页哦记录排序记录排序第八页,讲稿共七十九页哦选中选中District,选择升序选钮(默认),将,选择升序选钮(默认),
6、将District选入选入Sort by 框框选中选中Region,选择降序选钮,将,选择降序选钮,将Region选入选入Sort by 框框记录排序记录排序第九页,讲稿共七十九页哦注意:注意:在多重排序中,指定排序变量名的次序很关键,首先安第一个变量排在多重排序中,指定排序变量名的次序很关键,首先安第一个变量排序,对于与第一个变量取值相同的记录考虑按第二个变量排序序,对于与第一个变量取值相同的记录考虑按第二个变量排序排序后,原来记录数据的排序将被打乱,对于时间序列数据,排序后,原来记录数据的排序将被打乱,对于时间序列数据,若未存放有记录标志的变量,应注意保存原数据的排列顺序,若未存放有记录标
7、志的变量,应注意保存原数据的排列顺序,以免数据混乱以免数据混乱记录排序记录排序第十页,讲稿共七十九页哦记录拆分记录拆分第十一页,讲稿共七十九页哦1.1.选中此框不拆分文件选中此框不拆分文件2.2.按所选变量拆分文件,各组分析结果放在一起便于比较按所选变量拆分文件,各组分析结果放在一起便于比较3.3.按所选变量拆分文件,各组分析结果单独放置按所选变量拆分文件,各组分析结果单独放置4.4.用于选择拆分数据文件的变量用于选择拆分数据文件的变量5.5.要求将数据按所用拆分变量排序要求将数据按所用拆分变量排序6.6.数据集很大,且拆分变量已排序,选此可节省运行时间数据集很大,且拆分变量已排序,选此可节省
8、运行时间123456记录拆分记录拆分第十二页,讲稿共七十九页哦记录筛选记录筛选第十三页,讲稿共七十九页哦123451.1.分析所有记录分析所有记录2.2.分析满足条件的记录,分析满足条件的记录,按按IfIf按钮按钮设定筛选条件设定筛选条件3.3.从原数据中按某种条件抽从原数据中按某种条件抽样,按样,按SampleSample进行设定进行设定4.4.基于时间或记录序号选择基于时间或记录序号选择记录,按记录,按RangeRange进行设定进行设定5.5.使用筛选指示变量选择记录,非使用筛选指示变量选择记录,非0 0值的记录被选中值的记录被选中6.6.未选中的记录被隔离未选中的记录被隔离7.7.未选
9、中的记录被删除未选中的记录被删除67记录筛选记录筛选第十四页,讲稿共七十九页哦记录筛选记录筛选第十五页,讲稿共七十九页哦记录加权记录加权第十六页,讲稿共七十九页哦 设设置置作作为为权权重重的的变变量量,如如第第一一行行表表示示agecat1 gender1的的人人共共33个个,accid表示人数,应设为权重表示人数,应设为权重记录加权记录加权第十七页,讲稿共七十九页哦定义数据字典定义数据字典第十八页,讲稿共七十九页哦变量名、测量尺度等变量名、测量尺度等变量列表变量列表频数、标签、频数、标签、缺失值设定等缺失值设定等拷贝变量属性拷贝变量属性自动生成值标签自动生成值标签定义数据字典定义数据字典第十
10、九页,讲稿共七十九页哦数据转置数据转置第二十页,讲稿共七十九页哦 Transpose:该该过过程程用用于于对对数数据据进进行行行行列列转转置置,即即原原来来的的一一条条记记录录转转成成为为一一个个变变量量,而而变变量量则则转转成成为为一一个个记记录录,两两次次Transpose过程后数据集会恢复原样(点此过程后数据集会恢复原样(点此见具体操作)。见具体操作)。数据转置数据转置第二十一页,讲稿共七十九页哦将变量将变量Group、x选入选入variable框,再点击框,再点击OK键键转置前的数据集转置前的数据集转置后的数据集转置后的数据集 注:未选中的变量注:未选中的变量id其数据信息在转置后丢失
11、其数据信息在转置后丢失数据转置数据转置第二十二页,讲稿共七十九页哦数据文件重新排列数据文件重新排列第二十三页,讲稿共七十九页哦Restructure:此过程是用来改变数据的排列格式,即长此过程是用来改变数据的排列格式,即长型格式和宽型格式之间的互转。型格式和宽型格式之间的互转。数据文件重新排列数据文件重新排列第二十四页,讲稿共七十九页哦数据文件重新排列数据文件重新排列第二十五页,讲稿共七十九页哦 数据数据anxiety转换前后的长型格式和型格式转换前后的长型格式和型格式数据文件重新排列数据文件重新排列第二十六页,讲稿共七十九页哦文件纵向合并文件纵向合并第二十七页,讲稿共七十九页哦 *:当前数据
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 统计学 数据管理 讲稿
限制150内