SPSS期末大作业-完整版 .pdf
《SPSS期末大作业-完整版 .pdf》由会员分享,可在线阅读,更多相关《SPSS期末大作业-完整版 .pdf(46页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据分析方法与软件应用期末大作业1 第 1 题:基本统计分析1 分析: 本题要求随机选取80%的样本, 因而需要选用随机抽样的方法,在此选择随机抽样中的近似抽样方法进行抽样。其基本操作步骤如下:数据选择个案随机个案样本大约( A)80 所有个案的 %。1、基本思路:(1)由于存款金额为定距型变量,直接采用频数分析不利于对其分布形态的把握,因而采用数据分组,先对数据进行分组再编制频数分布表。此处分为少于500 元, 5002000元, 20003500 元,35005000 元,5000 元以上五组。分组后进行频数分析并绘制带正态曲线的直方图。(2)进行数据拆分,并分别计算不同年龄段储户的一次存
2、取款金额的四分位数,并通过四分位数比较其分布上的差异。操作步骤:(1)数据分组: 【转换重新编码为不同变量】,然后选择存取款金额到【数字变量输出变量( V) 】框中。在【名称(N) 】中输入“存取款金额1” ,单击【更改(H) 】按钮;单击【旧值和新值】按钮进行分组区间定义。存取款金额 1频率百分比有效百分比累积百分比有效1.00 82 34.6 34.6 34.6 2.00 76 32.1 32.1 66.7 3.00 10 4.2 4.2 70.9 4.00 22 9.3 9.3 80.2 5.00 47 19.8 19.8 100.0 合计237 100.0 100.0 (2) 【分析
3、描述统计 频率】;选择“存款金额分组”变量到【变量(V) 】框中;单击【图标( C) 】按钮,选择【直方图】和【在直方图上显示正态曲线】;选中【显示频率表格】 ,确定。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 46 页 - - - - - - - - - 数据分析方法与软件应用期末大作业2 (3) 【数据 拆分文件】,选择“年龄”变量到【分组方式】框中,选中【比较组】和【按分组变量排序文件】 ,确定;【分析 描述统计 频率】,选择“存款金额”到【变量】框中,单击【统
4、计量】按钮,选择【四分位数】继续 确定。统计量存( 取)款金额20岁以下N 有效1 缺失0 百分位数25 50.00 50 50.00 75 50.00 2035岁N 有效131 缺失0 百分位数25 500.00 50 1000.00 75 5000.00 3550岁N 有效73 缺失0 百分位数25 500.00 50 1000.00 75 4500.00 50岁以上N 有效32 缺失0 百分位数25 525.00 50 1000.00 75 2000.00 结果及结果描述:频数分布表表明,有一半以上的人的一次存取款金额少于2000 元,且有34.6%的人的存取款金额少于500 元,19.
5、8%的人的存取款金额多于5000 元,下图为相应的带正态曲线的直方图。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 46 页 - - - - - - - - - 数据分析方法与软件应用期末大作业3 统计量表格表明, 年龄在 20 岁以下的人有1 人,其存取款金额的四分位差是0 (50-50)元,年龄在 2035 岁之间的人有131 人,其存取款金额的四分位差是4500(5000-500)元,年龄在 3550 岁之间的人有73 人,其存取款金额的四分位差是4000(450
6、0-500)元,年龄在 50 岁以上的人有32 人,其存取款金额的四分位差是1475 (2000-525)元。可见,2035,3550 两个年龄段的离散程度比较大,其余两个年龄段的离散程度较小。2、基本思路:本问题涉及到两个变量户口和物价趋势,考虑两者之间的联系,因而需要用到交叉列联表。该列联表的行变量为户口,列变量为物价趋势,需要在列联表中输出各种百分比、期望频数、剩余、标准剩余,显示各交叉分组下频数分布柱形图,并利用卡方检验方法,对城镇和农村储户对物价趋势的态度是否一致进行分析。操作步骤:(1)【分析描述统计交叉表】,选择“户口”到【行】框中,选择“物价趋势”到【列】框中;并选中【显示复式
7、条形图】(2)单击【单元格】按钮,选中【观测值】、【期望值】、【行】、【列】、 【总计】各框继续;(3)单击【统计量】,选中【卡方】框继续;结果及其结果分析:户口 * 物价趋势交叉制表物价趋势合计上升稳定下降户口城镇户口计数21 131 18 170 期望的计数20.1 122.7 27.3 170.0 户口 中的 % 12.4% 77.1% 10.6% 100.0% 物价趋势中的 % 75.0% 76.6% 47.4% 71.7% 总数的 % 8.9% 55.3% 7.6% 71.7% 农村户口计数7 40 20 67 期望的计数7.9 48.3 10.7 67.0 户口 中的 % 10.4
8、% 59.7% 29.9% 100.0% 物价趋势中的 % 25.0% 23.4% 52.6% 28.3% 总数的 % 3.0% 16.9% 8.4% 28.3% 合计计数28 171 38 237 期望的计数28.0 171.0 38.0 237.0 户口 中的 % 11.8% 72.2% 16.0% 100.0% 物价趋势中的 % 100.0% 100.0% 100.0% 100.0% 总数的 % 11.8% 72.2% 16.0% 100.0% 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - -
9、- - - 第 3 页,共 46 页 - - - - - - - - - 数据分析方法与软件应用期末大作业4 卡方检验值df 渐进 Sig. (双侧 ) Pearson 卡方13.276a2 .001 似然比12.159 2 .002 线性和线性组合7.750 1 .005 有效案例中的 N 237 a. 0 单元格 (0.0%) 的期望计数少于 5 。最小期望计数为 7.92 。上面交叉列联表 表明,I 共有 237名被访者,其中170名有城镇户口,67名是农村户口,占样本总数的71.7%,28.3%;认为物价趋势为上升、稳定、下降的人数分别为28、171、38,各占总数的 11.8%,72
10、.2%,16.0%。II 对不同户口的人群进行分析:城镇户口的人数总共有170人, 对物价稳定趋势为上升、稳定、下降的比例分别为12.4%、77.1%、10.6%,认为物价趋势稳定的人数多于总比例,认为物价趋势下降的人数少于总比例;农村户口的总人数为67人,对物价稳定趋势为上升、稳定、下降的比例分别为10.4%、59.7%、29.9%,认为物价趋势稳定的人数少于总比例,认为物价趋势下降的人数多于总比例;III 对物价趋势不同态度的人群分析:认为物价上升的人数总共有28人,其中城镇户口和农村户口所占比例分别为75%,25%,有城镇户口的比例略高于总比例;认为物价稳定的人数总共有 171人,其中城
11、镇户口和农村户口所占比例分别为76.6%,23.4%,有城镇户口的比例略高于总比例;认为物价下降的人数总共有28人,其中城镇户口和农村户口所占比例分别为 47.4%, 52.6%,有城镇户口的比例明显低于总比例;总体来说,不同户口的人群对物价趋势的态度存在一定的一致性。从所得卡方检验结果来看,概率p值为 0.001,小于显著性水平,因此拒绝原假设,认为行列变量具有较强的相关性。3 、对居民一次存款金额分别按照收入水平进行分类,得到均值、中位数、方差和偏名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - -
12、- - - 第 4 页,共 46 页 - - - - - - - - - 数据分析方法与软件应用期末大作业5 度。3、基本思路本题中的分类变量为收入水平,因而需按照收入水平对数据进行拆分,然后分别计算一次存款金额的均值、中位数、方差和偏度。操作步骤:【数据拆分文件】 ,选择“收入水平”变量到【分组方式】框中,选中【比较组】和【按分组变量排序文件】,确定;【分析描述统计频率】,选择“存款金额” 到【变量】框中,单击【统计量】按钮,选中【均值】、【中位数】、【方差】、【偏度】继续确定。结果及其分析:统计量存(取) 款金额300元以下N 有效41 缺失0 均值2043.17 中值300.00 方差3
13、0740437.195 偏度4.066 偏度的标准误.369 300800元N 有效137 缺失0 均值4314.15 中值1000.00 方差134185788.508 偏度6.490 偏度的标准误.207 8001500元N 有效46 缺失0 均值5687.67 中值1750.00 方差116385836.002 偏度4.415 偏度的标准误.350 1500元以上N 有效13 缺失0 均值11026.92 中值7000.00 方差197942756.410 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 -
14、- - - - - - 第 5 页,共 46 页 - - - - - - - - - 数据分析方法与软件应用期末大作业6 偏度2.193 偏度的标准误.616 第 2 题:基本统计分析2 用随机抽样中的近似抽样方法选取85% 的样本 , 数据选择个案随机样本大约( A)85所有个案的 % 。第一问基本思路:由于存款金额是定距型变量,考虑先进行数据分组再编制频数分布表。进行数据拆分, 分别计算“300以下” 、 “300-800” 、 “800-1500” 、 “1500以上”收入的四分位数,并通过四分位数比较上述四者分布上的差异。操作步骤: 【转换重新编码为不同变量 (R ) 】 ;选择“存款
15、金额” 到【数字变量输出变量( V) 】框中;在【名称( N) 】中输入“存款金额分组” ,单击【更改( H ) 】按钮;单击【旧值和新值】按钮进行分组区间定义。存款金额分组频率百分比有效百分比累积百分比有效1.00 85 34.3 34.3 34.3 2.00 77 31.0 31.0 65.3 3.00 16 6.5 6.5 71.8 4.00 25 10.1 10.1 81.9 5.00 45 18.1 18.1 100.0 合计248 100.0 100.0 【分析描述统计频率】 ;选择“存款金额分组” 变量到【变量(V) 】框中;单击【图标( C) 】按钮,选择【直方图】和【在直方图
16、上显示正态曲线】;选中【显示频率表格】,确定。【数据拆分文件】,选择“收入水平”变量到【分组方式】框中,选中名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 46 页 - - - - - - - - - 数据分析方法与软件应用期末大作业7 【比较组】和【按分组变量排序文件】,确定;【分析描述统计频率】,选择“存款金额”到【变量】框中,单击【统计量】按钮,选择【四分位数】继续确定。统计量存(取) 款金额300元以下N 有效43 缺失0 百分位数25 200.00 50 300
17、.00 75 1000.00 300800元N 有效148 缺失0 百分位数25 500.00 50 1000.00 75 4475.00 8001500元N 有效41 缺失0 百分位数25 710.00 50 2000.00 75 6000.00 1500元以上N 有效16 缺失0 百分位数25 3000.00 50 4450.00 75 9750.00 第二问基本思路: 该问题中设计到两个变量, 应采用交叉分组下的频数分析,行变量为“年龄”,列变量为“未来收入状况的变化趋势”,在列联表中输出观测频数、期望频数、各种百分比,显示各交叉分组下频数分布柱形图,并利用卡方检验,针对各年龄段对“未来
18、收入状况的变化趋势”的态度是否一致进行分析。操作步骤: 【分析描述统计交叉表】,选择“年龄”到【行】框中,选择“未来收入情况” 到【列】框中;单击【单元格】 按钮,选中【观测值】、【期望值】、【行】、【列】、【总计】各框继续;单击【统计量】,选中【卡方】框继续;选中【显示复式条形图】确定。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 7 页,共 46 页 - - - - - - - - - 数据分析方法与软件应用期末大作业8 年龄 * 未来收入情况交叉制表未来收入情况合计增加基本不
19、变减少年龄20岁以下计数0 2 1 3 期望的计数.7 1.8 .5 3.0 年龄 中的 % 0.0% 66.7% 33.3% 100.0% 未来收入情况中的 % 0.0% 1.3% 2.4% 1.2% 总数的 % 0.0% 0.8% 0.4% 1.2% 2035岁计数35 65 27 127 期望的计数28.2 77.3 21.5 127.0 年龄中的 % 27.6% 51.2% 21.3% 100.0% 未来收入情况中的 % 63.6% 43.0% 64.3% 51.2% 总数的 % 14.1% 26.2% 10.9% 51.2% 3550岁计数16 55 10 81 期望的计数18.0
20、49.3 13.7 81.0 年龄中的 % 19.8% 67.9% 12.3% 100.0% 未来收入情况中的 % 29.1% 36.4% 23.8% 32.7% 总数的 % 6.5% 22.2% 4.0% 32.7% 50岁以上计数4 29 4 37 期望的计数8.2 22.5 6.3 37.0 年龄中的 % 10.8% 78.4% 10.8% 100.0% 未来收入情况中的 % 7.3% 19.2% 9.5% 14.9% 总数的 % 1.6% 11.7% 1.6% 14.9% 合计计数55 151 42 248 期望的计数55.0 151.0 42.0 248.0 年龄中的 % 22.2%
21、 60.9% 16.9% 100.0% 未来收入情况中的 % 100.0% 100.0% 100.0% 100.0% 总数的 % 22.2% 60.9% 16.9% 100.0% 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 8 页,共 46 页 - - - - - - - - - 数据分析方法与软件应用期末大作业9 卡方检验值df 渐进 Sig. ( 双侧 ) Pearson 卡方12.895a6 .045 似然比13.905 6 .031 线性和线性组合.017 1 .895
22、有效案例中的 N 248 a. 3 单元格 (25.0%) 的期望计数少于 5 。最小期望计数为 .51 。第三问基本思路: 首先按照户口对数据进行拆分,然后计算存款金额的统计量:均值、四分位数和标准差。操作步骤: 【数据 拆分文件】,选择“户口”变量到【分组方式】框中,选中【比较组】和【按分组变量排序文件】 ,确定;【分析描述统计频率】 ,选择“存款金额”到【变量】框中,单击【统计量】按钮,选中【均值】、【四分位数】、【标准差】继续确定。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - -
23、第 9 页,共 46 页 - - - - - - - - - 数据分析方法与软件应用期末大作业10 统计量存(取) 款金额城镇户口N 有效178 缺失0 均值4476.84 标准差8813.369 百分位数25 500.00 50 1000.00 75 5000.00 农村户口N 有效70 缺失0 均值2856.47 标准差8317.295 百分位数25 300.00 50 775.00 75 2000.00 第 3 题:基本统计分析 3利用居民储蓄调查数据, 从中随机选取 85% 的样本,进行频数分析,实现以下分析目标:1. 分析储户一次存款金额的分布,基本描述统计量,并对城镇储户和农村储户
24、进行比较;2. 分析不同年龄的储户对什么合算的认同是否一致。3. 检验城镇储户的一次存款金额的均值为5000元, 是否可信 ? 利用居民储蓄调查数据,从中随机选取85% 的样本,进行频数分析,实现以下分析目标:基本思路:首先通过随机抽样中的近似抽样方式,对居民储蓄调查数据进行抽样。操作步骤:选择菜单数据选择个案随机个案样本,样本尺寸填大约所有个案 85% 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 10 页,共 46 页 - - - - - - - - - 数据分析方法与软件应用
25、期末大作业11 ?分析储户一次存款金额的分布, 基本描述统计量, 并对城镇储户和农村储户进行比较;基本思路:(1)由于存(取)款金额数据为定距型变量,直接采用频数分析不利于对其分布形态的把握, 因此考虑依据第三章中的数据分组功能对数据分组后再编制频数分布表。(2)进行数据拆分,并分别计算城镇储户和农村储户的一次存(取)款金额的四分位数,并通过四分位数比较两者分布上的差异。操作步骤:转换重新编码为不同变量选择存(取)款金额,输出变量名称填存款金额分组, 单击旧值和新值, 对数据进行分组, 分为 0-500、501-2000、2001-3500、3501-5000、5000 以上五个组。最后点击确
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS期末大作业-完整版 2022 SPSS 期末 作业 完整版
限制150内