欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    应用统计学数据管理讲稿.ppt

    • 资源ID:84340480       资源大小:4.11MB        全文页数:79页
    • 资源格式: PPT        下载积分:18金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要18金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    应用统计学数据管理讲稿.ppt

    应用统计学数据管理第一页,讲稿共七十九页哦 在在数数据据文文件件建建立立好好之之后后,还还需需要要对对数数据据进进行行必必要要的的加加工工处处理理。对对同同一一个个数数据据往往往往需需要要从从各各种种不不同同的的侧侧面面进进行行研研究究,采采取取多多种种统统计计方方法法进进行行分分析析,而而不不同同的的统统计计方方法法对对数数据据文文件件结结构构的的要要求求不不尽尽相相同同,这这就就需需要要对对数数据据文文件件的的结结构构进进行行重重新新调调整整或或转转换换,以便适合于相同的统计方法。以便适合于相同的统计方法。数据管理数据管理 文件级别的数据管理文件级别的数据管理 变量级别的数据管理变量级别的数据管理第二页,讲稿共七十九页哦文件级别的数据管理(文件级别的数据管理(1)SPSS中中的的Data菜菜单单提提供供了了文文件件级级别别的的数数据据管管理理,可可以以对整个数据文件进行加工整理。对整个数据文件进行加工整理。第三页,讲稿共七十九页哦 Insert Variable:插入变量:插入变量 Insert Cases:插入记录:插入记录 Go to Case:到达某条记录:到达某条记录 简单命令简单命令(这些功能都可以用鼠标在数据表界面(这些功能都可以用鼠标在数据表界面 直接完成,很少用菜单操作,在此不详述)直接完成,很少用菜单操作,在此不详述)Sort Cases:记录排序:记录排序 Split File:记录拆分:记录拆分 Select Cases:记录筛选:记录筛选 Weight Cases:记录加权:记录加权 常用的简单过程常用的简单过程(使用频繁,必须掌握)(使用频繁,必须掌握)文件级别的数据管理(文件级别的数据管理(2)第四页,讲稿共七十九页哦 Define Variable Properties:定义数据字典:定义数据字典 Copy Variable Properties:将预定义的数据:将预定义的数据 字典直接引入当前数据文件,即复制外部数据字典直接引入当前数据文件,即复制外部数据 文件属性到当前数据文件文件属性到当前数据文件 变量与数据文件属性向导变量与数据文件属性向导(对大型或连续性数据分析项(对大型或连续性数据分析项目非常有用)目非常有用)Transpose:数据转置:数据转置 Restructure:数据文件的重新排列:数据文件的重新排列 数据重构向导数据重构向导文件级别的数据管理(文件级别的数据管理(3)第五页,讲稿共七十九页哦 Add Cases:纵向合并:纵向合并 Add Variable:横向合并:横向合并 文件合并过程(文件合并过程(Merge Files)Define Dates:定义日期变量过程,用于时间序列数据:定义日期变量过程,用于时间序列数据 Aggregate:数据汇总过程:数据汇总过程 Identify Duplicate Cases:查找重复记录:查找重复记录 其他过程其他过程文件级别的数据管理(文件级别的数据管理(4)正交设计过程(正交设计过程(Orthogonal Design)第六页,讲稿共七十九页哦单变量排序单变量排序:SPSS提供了一种简易操作方法,提供了一种简易操作方法,即在数据表格的变量名处单击右键,弹出右图即在数据表格的变量名处单击右键,弹出右图多变量排序:多变量排序:使用使用Sort Cases过程来进行,过程来进行,查看详情查看详情记录排序记录排序第七页,讲稿共七十九页哦记录排序记录排序第八页,讲稿共七十九页哦选中选中District,选择升序选钮(默认),将,选择升序选钮(默认),将District选入选入Sort by 框框选中选中Region,选择降序选钮,将,选择降序选钮,将Region选入选入Sort by 框框记录排序记录排序第九页,讲稿共七十九页哦注意:注意:在多重排序中,指定排序变量名的次序很关键,首先安第一个变量排在多重排序中,指定排序变量名的次序很关键,首先安第一个变量排序,对于与第一个变量取值相同的记录考虑按第二个变量排序序,对于与第一个变量取值相同的记录考虑按第二个变量排序排序后,原来记录数据的排序将被打乱,对于时间序列数据,排序后,原来记录数据的排序将被打乱,对于时间序列数据,若未存放有记录标志的变量,应注意保存原数据的排列顺序,若未存放有记录标志的变量,应注意保存原数据的排列顺序,以免数据混乱以免数据混乱记录排序记录排序第十页,讲稿共七十九页哦记录拆分记录拆分第十一页,讲稿共七十九页哦1.1.选中此框不拆分文件选中此框不拆分文件2.2.按所选变量拆分文件,各组分析结果放在一起便于比较按所选变量拆分文件,各组分析结果放在一起便于比较3.3.按所选变量拆分文件,各组分析结果单独放置按所选变量拆分文件,各组分析结果单独放置4.4.用于选择拆分数据文件的变量用于选择拆分数据文件的变量5.5.要求将数据按所用拆分变量排序要求将数据按所用拆分变量排序6.6.数据集很大,且拆分变量已排序,选此可节省运行时间数据集很大,且拆分变量已排序,选此可节省运行时间123456记录拆分记录拆分第十二页,讲稿共七十九页哦记录筛选记录筛选第十三页,讲稿共七十九页哦123451.1.分析所有记录分析所有记录2.2.分析满足条件的记录,分析满足条件的记录,按按IfIf按钮按钮设定筛选条件设定筛选条件3.3.从原数据中按某种条件抽从原数据中按某种条件抽样,按样,按SampleSample进行设定进行设定4.4.基于时间或记录序号选择基于时间或记录序号选择记录,按记录,按RangeRange进行设定进行设定5.5.使用筛选指示变量选择记录,非使用筛选指示变量选择记录,非0 0值的记录被选中值的记录被选中6.6.未选中的记录被隔离未选中的记录被隔离7.7.未选中的记录被删除未选中的记录被删除67记录筛选记录筛选第十四页,讲稿共七十九页哦记录筛选记录筛选第十五页,讲稿共七十九页哦记录加权记录加权第十六页,讲稿共七十九页哦 设设置置作作为为权权重重的的变变量量,如如第第一一行行表表示示agecat1 gender1的的人人共共33个个,accid表示人数,应设为权重表示人数,应设为权重记录加权记录加权第十七页,讲稿共七十九页哦定义数据字典定义数据字典第十八页,讲稿共七十九页哦变量名、测量尺度等变量名、测量尺度等变量列表变量列表频数、标签、频数、标签、缺失值设定等缺失值设定等拷贝变量属性拷贝变量属性自动生成值标签自动生成值标签定义数据字典定义数据字典第十九页,讲稿共七十九页哦数据转置数据转置第二十页,讲稿共七十九页哦 Transpose:该该过过程程用用于于对对数数据据进进行行行行列列转转置置,即即原原来来的的一一条条记记录录转转成成为为一一个个变变量量,而而变变量量则则转转成成为为一一个个记记录录,两两次次Transpose过程后数据集会恢复原样(点此过程后数据集会恢复原样(点此见具体操作)。见具体操作)。数据转置数据转置第二十一页,讲稿共七十九页哦将变量将变量Group、x选入选入variable框,再点击框,再点击OK键键转置前的数据集转置前的数据集转置后的数据集转置后的数据集 注:未选中的变量注:未选中的变量id其数据信息在转置后丢失其数据信息在转置后丢失数据转置数据转置第二十二页,讲稿共七十九页哦数据文件重新排列数据文件重新排列第二十三页,讲稿共七十九页哦Restructure:此过程是用来改变数据的排列格式,即长此过程是用来改变数据的排列格式,即长型格式和宽型格式之间的互转。型格式和宽型格式之间的互转。数据文件重新排列数据文件重新排列第二十四页,讲稿共七十九页哦数据文件重新排列数据文件重新排列第二十五页,讲稿共七十九页哦 数据数据anxiety转换前后的长型格式和型格式转换前后的长型格式和型格式数据文件重新排列数据文件重新排列第二十六页,讲稿共七十九页哦文件纵向合并文件纵向合并第二十七页,讲稿共七十九页哦 *:当前数据集中的变量:当前数据集中的变量 +:新添加数据集中的变量:新添加数据集中的变量 左框:新、老数据文件中不匹配的变量名左框:新、老数据文件中不匹配的变量名 右框:已匹配的变量名,选择完成后单击右框:已匹配的变量名,选择完成后单击OK即可即可 Add Cases:纵向合并,从外部数据文件中增加记录到当前数:纵向合并,从外部数据文件中增加记录到当前数 据文件中,相互合并的数据文件中应该有相同的变量。据文件中,相互合并的数据文件中应该有相同的变量。文件纵向合并文件纵向合并第二十八页,讲稿共七十九页哦文件横向合并文件横向合并第二十九页,讲稿共七十九页哦1.未被纳入的变量列未被纳入的变量列2.被纳入合并后新数据集的变量列表被纳入合并后新数据集的变量列表3.记录匹配使用的关键变量记录匹配使用的关键变量 Add Variables:横向合并,:横向合并,从外部数据文件增加变量到当从外部数据文件增加变量到当 前数据文件,两个数据集要有一个一一对应的关键变量进前数据文件,两个数据集要有一个一一对应的关键变量进 行匹配合并,且记录应按关键变量升序后再合并。行匹配合并,且记录应按关键变量升序后再合并。123文件横向合并文件横向合并第三十页,讲稿共七十九页哦数据汇总数据汇总第三十一页,讲稿共七十九页哦分组变量分组变量被汇总变量被汇总变量数据汇总数据汇总第三十二页,讲稿共七十九页哦 定义汇总函数定义汇总函数 定义新产生汇总变量的定义新产生汇总变量的 名称和标签名称和标签FunctionName&Label数据汇总数据汇总第三十三页,讲稿共七十九页哦查找重复记录查找重复记录第三十四页,讲稿共七十九页哦希望查找重复值的变量希望查找重复值的变量重复记录按该变量的取值排序重复记录按该变量的取值排序设设定定第第一一个个还还是是最最后后一一个个重复记录为主记录重复记录为主记录查找重复记录查找重复记录第三十五页,讲稿共七十九页哦 PrimaryLast0表示相应的记录为重复记录表示相应的记录为重复记录查找重复记录查找重复记录第三十六页,讲稿共七十九页哦变量级别的数据管理(变量级别的数据管理(1)SPSS中中的的Transform菜菜单单提提供供了了变变量量级级别别的的数数据据管管理,可以对变量进行操作。理,可以对变量进行操作。第三十七页,讲稿共七十九页哦 计算新变量计算新变量(Compute):最常用):最常用 Recode:对变量值进行分组合并:对变量值进行分组合并 Visual Bander:连续变量的可视化分段:连续变量的可视化分段 Count:表示某个变量的取值中是否出现某个值,或:表示某个变量的取值中是否出现某个值,或 某个区间某个区间 Rank Cases:变量编秩:变量编秩 Automatic Recode:对记录按某个变量值的大小排序:对记录按某个变量值的大小排序 变量转换变量转换变量级别的数据管理(变量级别的数据管理(2)第三十八页,讲稿共七十九页哦 Create Time Series:建立时间序列:建立时间序列 Replace Missing Values:缺失值替代:缺失值替代 Random Number Seed:设定随机种子:设定随机种子 专用过程专用过程变量级别的数据管理(变量级别的数据管理(3)控制命令控制命令 Run Pending Transforms:用于执行编程中被:用于执行编程中被 挂起的数据整理操作挂起的数据整理操作专用于时间序专用于时间序列模型列模型第三十九页,讲稿共七十九页哦例例1 数数据据fee.sav是是上上海海和和杭杭州州16名名住住院院病病人人的的费费用用数数据据,计计算算上上海的住院病人平均每天的住院费用,要求结果取整。海的住院病人平均每天的住院费用,要求结果取整。计算新变量计算新变量第四十页,讲稿共七十九页哦输入新变量名输入新变量名perfee计算新变量计算新变量第四十一页,讲稿共七十九页哦计算新变量计算新变量输入条件表达式输入条件表达式第四十二页,讲稿共七十九页哦计算新变量计算新变量选选择择函函数数输入函数表达式输入函数表达式第四十三页,讲稿共七十九页哦计算新变量计算新变量第四十四页,讲稿共七十九页哦例例2 在在数数据据fee.sav中中生生成成新新变变量量grade,当当住住院院总总费费用用小小于于5000元元时时取取值值为为“相相对对较较低低”,大大于于等等于于5000元元且且小小于于7000元元取取值值为为“中中等等”,大大于于等等于于7000元元且且小小于于10000元元为为“较较高高”,大大于于等等于于10000元元为为“很高很高”。变量值分组合并变量值分组合并第四十五页,讲稿共七十九页哦新变量名新变量名grade选入原变量选入原变量totaltotal变量值分组合并变量值分组合并第四十六页,讲稿共七十九页哦变量值分组合并变量值分组合并第四十七页,讲稿共七十九页哦 三三种种Range的的设设置置,所所有有的的范范围围均均包包含含了了端端点点,而而前前面面设设定定的的变变换换会会优优于于后后面面的的变变换换,因因此此应应该该将将大大于于等等于于10000元元最先设定,而将小于最先设定,而将小于5000元最后设定。元最后设定。变量值分组合并变量值分组合并第四十八页,讲稿共七十九页哦变量值分组合并变量值分组合并第四十九页,讲稿共七十九页哦变量值分组合并变量值分组合并第五十页,讲稿共七十九页哦变量值分组合并变量值分组合并第五十一页,讲稿共七十九页哦务必选上务必选上该项该项变量值分组合并变量值分组合并第五十二页,讲稿共七十九页哦变量值分组合并变量值分组合并第五十三页,讲稿共七十九页哦 recode过程提供了精确分组的功能,但如果希望进行的分过程提供了精确分组的功能,但如果希望进行的分 组是有规律的,比如等距分组,或等样本量分组,使用组是有规律的,比如等距分组,或等样本量分组,使用 recode过程进行操作就显得非常麻烦,且可视化程度不高。过程进行操作就显得非常麻烦,且可视化程度不高。此时可以考虑使用此时可以考虑使用visual bander过程进行可视化分段。过程进行可视化分段。连续变量的可视化分段连续变量的可视化分段第五十四页,讲稿共七十九页哦例例3 仍仍以以数数据据fee.sav为为例例,按按变变量量total将将病病人人分分为为5组组,5000元元以以下为第一组,下为第一组,5000元以上的按等间距的方式分元以上的按等间距的方式分4组。组。连续变量的可视化分段连续变量的可视化分段第五十五页,讲稿共七十九页哦连续变量的可视化分段连续变量的可视化分段第五十六页,讲稿共七十九页哦连续变量的可视化分段连续变量的可视化分段第五十七页,讲稿共七十九页哦设定分段规则设定分段规则连续变量的可视化分段连续变量的可视化分段第五十八页,讲稿共七十九页哦连续变量的可视化分段连续变量的可视化分段自动填充自动填充值标签值标签第五十九页,讲稿共七十九页哦连续变量的可视化分段连续变量的可视化分段第六十页,讲稿共七十九页哦例例4 仍以数据仍以数据fee.sav为例,查看变量为例,查看变量total中是否出现值中是否出现值6890。查看特定变量值查看特定变量值第六十一页,讲稿共七十九页哦查看特定变量值查看特定变量值第六十二页,讲稿共七十九页哦查看特定变量值查看特定变量值第六十三页,讲稿共七十九页哦查看特定变量值查看特定变量值第六十四页,讲稿共七十九页哦查看特定变量值查看特定变量值第六十五页,讲稿共七十九页哦例例5 仍以数据仍以数据fee.sav为例,根据城市分组计算住院总费用的为例,根据城市分组计算住院总费用的 秩次。秩次。变量编秩变量编秩第六十六页,讲稿共七十九页哦变量编秩变量编秩第六十七页,讲稿共七十九页哦 用于定义秩次类型,默认为用于定义秩次类型,默认为rankrank(秩分数)(秩分数)变量编秩变量编秩第六十八页,讲稿共七十九页哦 用于定义对相同值观测量的处理方式用于定义对相同值观测量的处理方式 默认值为取平均秩次。默认值为取平均秩次。变量编秩变量编秩第六十九页,讲稿共七十九页哦变量编秩变量编秩第七十页,讲稿共七十九页哦将字符变量转换为数值变量将字符变量转换为数值变量例例6 仍以数据仍以数据fee.sav为例,将字符型变量为例,将字符型变量city转化成数值变量转化成数值变量newcity。第七十一页,讲稿共七十九页哦将字符变量转换为数值变量将字符变量转换为数值变量新变量名新变量名第七十二页,讲稿共七十九页哦将字符变量转换为数值变量将字符变量转换为数值变量第七十三页,讲稿共七十九页哦将字符变量转换为数值变量将字符变量转换为数值变量第七十四页,讲稿共七十九页哦第七十五页,讲稿共七十九页哦第七十六页,讲稿共七十九页哦第七十七页,讲稿共七十九页哦第七十八页,讲稿共七十九页哦第七十九页,讲稿共七十九页哦

    注意事项

    本文(应用统计学数据管理讲稿.ppt)为本站会员(石***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开