操作篇 07_数据分析工具.pdf
《操作篇 07_数据分析工具.pdf》由会员分享,可在线阅读,更多相关《操作篇 07_数据分析工具.pdf(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、计算机辅助英语教学与研究计算机辅助英语教学与研究(操作篇讲义)(操作篇讲义)浙江师范大学外语学院 夏建新 2006 年 10 月 7Excel的数据分析工具与图表工具的数据分析工具与图表工具 操作练习对象:操作篇操作篇 07_练习库练习库 05.xcl 7.1 描述统计工具描述统计工具 常用统计分析术语:对于一组数据(即样本观察值),要想获得它们的一些常用统计量,可以使用 Excel 提供的统计函数来实现。例如 AVERAGE(平均值)、STDEV(样本标准差)、VAR(样本方差)、KURT(峰度系数)、SKEW(偏度系数)、MEDIAN(中位数,即在一组数据中居于中间的数)、MODE(众数,
2、即在一组数据中出现频率最高的数值)等。但最方便快捷的方法是利用 Excel 提供的描述统计工具,它可以给出一组数据的许多常用统计量,包括:平均值 标准差 区域 计数 标准误差(标准误)样本方差 最大值 第 K 个最大值 中值(中位数)峰值(样本峰度)最小值 第 K 个最小值 模式(众数)偏斜度(样本偏度)总和 置信度 项项 目目 步步 骤骤 对“操作篇_07_练习 库 _05”中“Sheet1”的“总分”项进行描述统计分析。1.在“操作篇_07_练习库 05”中选中“sheet1”2.工具数据分析描述统计确定 3在“输入区域”对话窗中输入i1:i269 4.选中“标志位在第一行”或者:3在“输
3、入区域”对话窗中输入i2:i269 4.不选中“标志位在第一行”5在“输出区域”对话窗中输入 L1 (这是确定统计结果的起始显示位置。也可以选别的位置,以布局合理为原则)。6选中“汇总统计”7确定 操作结果如下所示(EXCEL 97 版):总分 平均 68.77239标准误差 0.50796中位数 69众数 70标准差 8.315663方差 69.15025峰度-0.14525偏度-0.31406区域 44最小值 45最大值 89求和 18431观测数 268置信度(95.0%)1.000117该表数据解释:?“总分”项的平均分为68.77239;标准误为 0.50796;中位数为 69;众数
4、为 70;标准差为 8.315663(注意:此处是估算的标准差,而非计算的标准差。);方差为 69.15025;峰值(峰度)-0.14525;偏斜度(偏度)为-0.31406:全距(区域)为 44;最低分为 45;最高分为 89;分数总和为 18431;有效数据为 268 个。?从“平均数”、“中值”与“众数”这三者的接近、峰值和偏斜度也非常接近 0 这两点可以大致判定这些数据来自一正态分布总体(或可以说:该总体呈正态分布)。?标准差的平方就是方差。?标准差除以样本数的平方根就是标准误差(标准误)。附:Excel 2000 版 总分 平均 68.77239标准误差 0.50796中值 69模式
5、 70标准偏差 8.315663样本方差 69.15025峰值-0.14525偏斜度-0.31406区域 44最小值 45最大值 89求和 18431计数 268 课堂练习与思考课堂练习与思考 对“操作篇 07_练习库 05”中“Sheet2”进行描述统计操作,看看有何发现。7.2 排位与百分比排位与百分比 利用 Excel 的这个功能,可以便捷地做出一个数据列表,把某个总体中每个成员(数据)在该总体中的大小次序排名和相应的百分比排位一一列出。操作:针对“操作篇操作篇 07_练习库练习库 05.xcl”Sheet 2 中的总分进行操作。?工具数据分析排位与百分比排位确定?输入区域:输入 D1:
6、D37(选中“标志位”)或者输入 D2:D37(不选“标志位”)?分组方式:列?输出区域,指的是数据输出的位置,比如我们定在 F1。得到如下结果(本处篇幅所限,只选前 10 名的数据):点 成绩 排位 百分比90 92 1 100.00%10 89 2 99.30%43 88 3 98.60%79 88 4 98.00%39 87 5 97.30%20 87 6 96.60%92 87 7 96.00%36 87 8 95.30%64 87 9 94.70%23 86 10 94.00%7.3 直方图工具直方图工具 对于上例中“总分”项的描述统计,如果要粗略地了解其分布情况,可以使用直方图来实
7、现。一般手工作直方图的具体步骤是:先根据数据的最大值、最小值取一个区间(a,b),其下限比最小的数据稍小,其上限比最大的数据稍大。将这一区间分为 k 个小区间,小区间的长度记为,称为组距。小区间的端点称为组限。通常当 n 较大时 k 取 1020,当 n50 时,则 k 取 56。k 值取得过大会出现某些小区间内频数为零的情况(般应设法避免)。计算出落在每个小区间内的数据的频数 f(即数据的个数)。最后自左至右依次在各个小区间上作以(f/n)/为高的小矩形。这样的图形就叫直方图。直方图的意义:直方图中小矩形的面积就等于数据落在该小区间的频率 fn。由于当 n 很大时,频率接近于概率,因而般来说
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 操作篇 07_数据分析工具 操作 07 数据 分析 工具
限制150内