欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    最新CDA题库.docx

    • 资源ID:34715009       资源大小:186.49KB        全文页数:185页
    • 资源格式: DOCX        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    最新CDA题库.docx

    Four short words sum up what has lifted most successful individuals above the crowd: a little bit more.-author-dateCDA题库CDA题库1现有两个投资项目甲和乙,已知甲、乙方案的期望值分别为10%、25%,标准离差分别为20%、49%,那么(A)。 A、 甲项目的风险程度大于乙项目的风险程度 B、 甲项目的风险程度小于乙项目的风险程度 C、 甲项目的风险程度等于乙项目的风险程度 D、 不能确定2多个方案比较时,标准离差越小的方案,其风险(B) A、 越大 B、 越小 C、 两者无关 D、 无法判断3在Excel2003中,柱形图类型属于图表中的(B) A、 复合类型 B、 标准类型 C、 简单类型 D、 自定义类型4n个标准正态分布的平方和为(A) A、 卡方分布 B、 t分布 C、 F分布 D、 正态分布5(B)是依据样本估计总体分布中所含的未知参数或未知参数的函数。通常它们是总体的某个特征值,如数学期望、方差和相关系数等。 A、 区间估计 B、 点估计 C、 参数估计 D、 无偏估计6(C)用于计算间隔不等的连续时点序列的评价发展水平。 A、算术平均数 B、 几何平均数 C、 加权平均数 D、 调和平均数7当置信水平一定时,置信区间的宽度(A) A、 随着样本量的增大而减小 B、 随着样本量的增大而增大 C、 与样本量的大小无关 D、 与样本量的平方根成正比8下列不能描述变量离期望值大小的指标是( D) A、 变异系数 B、 标准差 C、 方差 D、 相关系数9EXCEL中,求标准差的函数是(D) A、 AVERAGE B、 MEDIAN C、 MODE D、 STDEV10结构化数据根据连续性可分为(B) A、 品质数据和数值型数据 B、 连续型数据和离散型数据 C、 截面数据、时间序列数据和面板数据 D、 一手数据和二手数据11结构化数据根据时间特点可分为(C) A、 品质数据和数值型数据 B、 连续型数据和离散型数据 C、 截面数据、时间序列数据和面板数据 D、 一手数据和二手数据12某企业拟进行一项存在一定风险的完整工业项目投资,有甲、乙两个方案可供选择。已知甲方案净现值的期望值为1000万元,标准差为300万元;乙方案净现值的期望值为1200万元,标准差为330万元。下列结论中正确的是(B)。 A、 甲方案优于乙方案 B、 甲方案的风险大于乙方案 C、 甲方案的风险小于乙方案 D、 无法评价甲、乙方案的风险大小13参数估计分为(A) A、 点估计和区间估计 B、 区间估计和无偏估计 C、 点估计和无偏估计 D、 区间估计和一致估计14求C5和H5两单元格平均值的函数形式是(B) A、 AVERAGE(C5:H5) B、 AVERAGE(C5,H5) C、 SUM(C5:H5)/2 D、 SUM(C5,H5)15下列四项中,不正确的提法是(C) A、 SQL语言是关系数据库的国际标准语言 B、 SQL语言具有数据定义、查询、操纵和控制功能 C、 SQL语言可以自动实现关系数据库的规范化 D、 SQL语言称为结构查询语言16无量纲化后各变量的标准差为(B) A、 0 B、 1 C、 -1 D、 原标准差17在Excel2003中,数据源发生变化时,相应的图表(B) A、手动跟随变化 B、 自动跟随变化C、不跟随变化D、不受任何影响18事件A的概率 P(A)必须满足 (C) A、 0P(A)1 B、 P(A)=1 C、 0P(A)1 D、 P(A)=0或119EXCEL中,求中位数的函数是(B) A、 AVERAGE B、 MEDIAN C、 MODE D、 STDEV20标准正态分布的均值为(A) A、 0 B、 1 C、 -1 D、 不能确定21启动Excel后自动建立的工作簿文件中自动带有电子工作表有(B) A、 4个 B、 3个 C、 2个 D、 1个22在Excel中,能够很好地通过矩形块反映每个对象中不同属性值大小的图表类型是(C)。 A、 饼图 B、 折线图 C、 柱形图 D、 散点图23在Excel中,能反映出同一属性数据变化趋势的图表类型是(A) A、 折线图 B、 散点图 C、 饼图 D、 气泡图24生活中“最佳”、“最受欢迎”等与(C)有关 A、 平均数 B、 中位数 C、 众数 D、 标准差25下列调查中,适合用全面调查方式的是(A) A、 了解某班学生“50米跑”的成绩 B、 了解一批灯泡的使用寿命 C、 了解一批炮弹的杀伤半径 D、 了解一批袋装食品是否含有防腐剂26估计量的含义是指(A) A、用来估计总体参数的统计量的名称 B、 用来估计总体参数的统计量的具体数值 C、 总体参数的名称 D、 总体参数的具体取值27在10件同类产品中,其中8件为正品,2件为次品从中任意抽出3件的必然事件是(D)A、 3件都是正品 B、 至少有1件是次品 C、 3件都是次品 D、 至少有1件是正品28指出下面的说法哪一个是正确的(A) A、 置信水平越大,估计的可靠性越大 B、 置信水平越大,估计的可靠性越小 C、 置信水平越小,估计的可靠性越大 D、 置信水平的大小与估计的可靠性无关29对居民收入与消费支出的几组不同样本数据拟合的直线回归方程如下,你认为(B )回归方程可能是正确的。 A、 y=125-10x B、 y=-50+8x C、 y=150-20x D、 y=-15-6x30要了解一批电视机的使用寿命,从中任意抽取30台电视机进行试验,在这个问题中,30是(C) A、 个体 B、 总体 C、 样本容量 D、 总体的一个样本1根据数据量级别,数据可分为(AB)。 A、 传统数据 B、 大数据 C、 结构化数据 D、 非结构化数据2下列关于统计量的表述中,正确的有(ABCD) A、 估计统一总体参数可以用多个不同统计量 B、 统计量是样本的函数 C、 统计量不含有未知参数 D、 统计量的分布成为抽样分布3互联网生成的数据包括(ABC) A、 电子商务 B、 移动互联网APP C、 网络游戏 D、 传感器数据4访问法包括(ABCD) A、 小组访谈法 B、 街头访问 C、 企业调研 D、 网上调查5数据库是一个(ABCD)数据集合A、 长期存储在计算机内的 B、 有组织的 C、 可共享的 D、 统一管理的6数据转换的类型有(ABCD) A、 变量计算 B、 加权处理 C、 标准化 D、 分类汇总7描述数据离散趋势的统计量有(ABCD) A、 极差 B、 方差 C、 标准差 D、 变异系数8数据清洗工作主要包括处理(ABCD) A、 缺失数据清洗 B、 异常数据清洗 C、 逻辑错误数据清洗 D、 重复数据清洗9字段合并是将多个单元格的文字或数字合并成一个单元格。常用(BC) A、 VLOOKUP B、 & C、 CONCATENATE D、 MID10可采集到的网站访问数据包括(ABCD) A、 访问者属性 B、 访问者访问网站的频率 C、 每次访问停留的时间 D、 访问者浏览路径11数据产生的主要来源有(ABCD) A、 局域网 B、 离线储存数据 C、 互联网 D、 物联网12下列可描述相关关系的图表类型有(AC) A、 散点图 B、 饼图 C、 气泡图 D、 瀑布图13描述数据集中趋势的统计量有(ABD) A、 平均数 B、 中位数 C、 标准差 D、 众数14如果参与分类的变量较多时(比如大于1000),可以选用的方法是(BC) A、 层次聚类法 B、 K-均值聚类法 C、 两步聚类法 D、 混合聚类法15下列可描述数据走势或趋势的图表类型有(ABC) A、 柱形图 B、 折线图 C、 面积图 D、 饼图1VCD连锁店各个商店的每月销售额(万元)和每月用在以上两种媒介的广告支出(见下表所示数据)。利用SPSS进行多元回归分析。(1)在SPSS中,将销售额选入因变量。(2)建立多元回归方程,其中电视广告支出的系数为12.041. (3)观察SPSS的回归结果输出,广播广告支出的系数是否通过检验。是(4)分别使用向前引入法和向后剔除法进行多元回归,两者输出的模型结果是否相同。是2以下数据是某公司一年以来的销售额,试采用EXCEL数据分析描述统计功能,对成绩进行分析汇总给出相关统计指标。 求平均销售额(保留两位小数)(93945.92) 求销售额中位数(75402.5) 求销售额的标准差(保留一位小数)(44667.3) 求销售额的最大值(174498)3以下数据是20个不同产品的两个参数,用SPSS软件按要求进行排序。 排序依据为L1,要求升序排列时,排在第六位的产品编号为(12)。 排序依据为L2,要求降序排列时,排在第十位的产品编号为(9)。 排序依据为L1和L2,要求先按L1升序排列,后按L2降序排列,排在第9位的产品编号为(2)。 排序依据为L1和L2,要求先按L1降序排列,后按L2升序排列,排在第6位的产品编号为(15)。4某对外汉语培训中心对在该中心学习的外国留学生进行了一项汉语学习动机问卷调查。使用李克特五级式量表。第一级为最不喜欢,第五级为最喜欢。随机抽取18人参加调查。 整理数据如下(1)观察Bartlett球度检验的P值,说明应该(拒绝)原假设。(答案填写“接受”或“拒绝”)(2)结果中,(成分得分系统矩阵)是将因子表示成变量的组合。(答案填写“成分矩阵”,“成分转换矩阵”,“成分得分系数矩阵”或“成分得分协方差矩阵”)(3)观察结果中给出的各变量的信息被提取的比例,说明提取比例最低的是(汉语戏剧)。(答案填写“兴趣”,“书法”,“汉语歌曲”或“汉语戏剧”)(4)这里选取了(3)个因子。(答案填写阿拉伯数字“1,2,3”)5聚类分析在市场细分中应用广泛,可以帮助企业对市场上的产品进行分类,从而更准确地指定营销策略。例如,某饮料企业收集了市场上16种饮料的热量、咖啡因、钠含量和价格4种变量数据,如下表所示。(1)将处理过(消除量纲)的变量使用K-means聚成3类,从输出的方差分析表中看出,在显著性水平为0.05条件下,聚类在“钠”这个指标上是否有显著差异?(是) (填“是”或“否”)(2)将处理过(消除量纲)的变量使用K-means聚成3类,编号为8的饮料属于第(1)类。(答案填写阿拉伯数字“1,2,3”)(3)将处理过(消除量纲)的变量使用系统聚类法聚成2至4类,从输出的结果看出编号为5的饮料和编号为(6)的饮料距离最近。(答案填写阿拉伯数字“1,2,3”)(4)使用系统聚类法,若分成4类,编号为7的饮料属于第(3)类。(答案填写阿拉伯数字“1,2,3”)6某地1983年至1993年财政收入及棉花产量的资料如下:(1)简单指数平滑方法能做(1)期预测.(答案填写阿拉伯数字“1,2,3”)(2)棉花产量选用(简单指数平滑)方法做预测。(答案填写“回归直线”,“简单指数平滑”,“holt指数平滑”或“Winter指数平滑”)(3)利用SPSS的holt指数平滑方法预测1999年该地区的财政收入为(157.46)元。(保留两位小数)(4)财政收入除了可以选用holt指数平滑法预测,还可以选用(回归直线)方法做预测。(答案填写“回归直线”,“简单指数平滑”,“哑变量回归法”或“Winter指数平滑”) 7某百货公司从1995年到2001年的季度收入情况如下:单位:百万美元用SPSS进行时间序列季节分解预测注意:本案例预测时使用的时间序列的乘积模型如下: Y = T × S × I (即:长期趋势 × 季节指数 × 不规则因素)(1)计算出1995年第一季度的季节指数(0.9126)(保留四位小数)(2)计算出1995年第一季度的非季节变化收入(10168.7458)(保留四位小数)(3)第(4)个季节的季节指数最大.(答案填写阿拉伯数字“1,2,3”)(4)用趋势项对时间t做线性回归,建立的回归方程中的常数项系数为(8977.463)。(保留3位小数)8用SPSS软件对以下输入数据做异常值分析和处理。 对这些数据做异常值查找时,可选择“分析”->“描述统计”->(探索)。(可填答案“频率”、“描述”、“探索”、“交叉表”) 完成第一步操作后,我们只找异常值,则需要在统计量中选择(界外值)。(可填答案“描述性”、“M_估计量”、“界外值”、“百分位数”) 在输出结果中列出的五个最大值中排在第一的数值是(174498) 在输出结果中列出的五个最小值中排在第一的数值是(4765)9用SPSS软件做替换缺失值处理,完成下列题目。1.用连续均值填补缺失值后,10月销售额为(83.02)2.用附近点的平均值填补缺失值后,10月销售额为(116.48)3.用线性插值填补缺失值后,10月销售额为(115.1)4.用点的线性趋势填补缺失值后,10月销售额为(115.77)10用SPSS软件处理下列重复数据,完成下列题目。 需要给重复个案做标记,产生一个新标记变量的SPSS操作是选定“数据”选项下的(标识重复个案)选项。(可填答案“标识异常个案”、“标识重复个案”、“个案选择” 标记重复个案新生成的变量用(0)标记重复个案。(可填答案为0或1) 标记重复个案新生成的变量用(1)标记基本个案。(可填答案为0或1) 删除重复数据时,需要选定数据->选择个案->选定如果条件满足框输入重复标记=1,输出框选择(删除未选定个案)。(可写答案:“过滤掉未选个案”、“将选定个案复制到新数据集”、“删除未选定个案”) 11某班20名学生考试成绩如下表所示,采用EXCEL数据分析描述统计功能,对成绩进行分析汇总给出相关统计指标。 求这20名学生的考试成绩均分(保留一位小数)(83.7) 求这20名学生的考试成绩的中位数(83) 求这20名学生的考试成绩的众数(83) 求这20名学生的考试成绩标准差(保留两位小数)(7.66) 12某百货公司从1995年到2001年的季度收入情况如下:单位:(百万美元)用SPSS进行季节哑变量多元回归预测(1)协变量应放置(数值)类型的变量.(答案填“数值”,“字符”,“日期”,“二进制”)(2)SPSS选用的参照项是第(4)季度.(答案填写阿拉伯数字“1,2,3”)(3)虚拟变量1的参数估计值为(-4561.141)(保留三位小数)(4)此案例建立的哑变量回归方程中有(3)个虚拟变量.(答案填写阿拉伯数字“1,2,3”) 13我国钢材消费量(万吨)与国民收入(亿元)的资料如下。利用SPSS进行一元回归分析。(1)令钢材消费量为(因变量)。(答案填写“自变量”或“因变量”)(2)建立回归方程,用最小二乘法进行参数估计,求出a,b(a为斜率,b为截距)。算出b的值为(-460.5282)。(结果保留3位小数)(3)观察SPSS结果中的模型汇总表,回归直线对样本数据点是否拟合良好 (是)(填“是”或“否”)(4)若1981年至1985年,国民收入以4.5%的速度递增,则国民收入见下表。利用SPSS预测1981年的钢材消费量为(3006.69)万吨。(四舍五入保留两位小数)14以下数据是百度2011年-2014年各季度的营业收入,试采用EXCEL数据分析描述统计功能,对成绩进行分析汇总给出相关统计指标。 求营业收入的均值(保留两位小数)(69.18) 求营业收入的中位数(保留两位小数)(62.50) 求营业收入的标准差(保留整数)(32) 求营业收入的最大值(135.2) 15 下表是某单位年终奖金分配表,采用EXCEL数据分析描述统计功能,求解该单位年终奖金分配中的最高金额、最低金额、平均金额、中间金额、众数金额等。 求该单位年终奖金分配中的最高金额(50000) 求该单位年终奖金分配中的最低金额(6000) 求该单位年终奖金分配中的平均金额(22750) 求该单位年终奖金分配中的众数金额(15000)四、 判断题1中位数具有不唯一性(×)2聚类分析中,各变量的取值不应有数量级上的过大差异()3原假设是指研究者想收集证据予以反对的假设,通常指参数没有变化或变量之间没有关系 。()4分销网络的区位选择属于间接的短期刺激(×)5标准差越大,正态分布曲线越平坦,概率分布密度越低。()6顾客要求提供的产品或服务比较优秀,但并不是“必须”的产品属性或服务行为是兴奋型需求。(×)7在多元线性回归模型中,解释变量可以有相关性(×)8描述数据成分关系时,若成分过多可使用复合饼图或复合条饼图。()9标准差越大,正态曲线越高越陡峭。(×)10KANO模型定义了四个层次的顾客需求。(×)11客户获取通常发生在客户生命周期中的考察期()12bigint是SQL的数据类型。()13拟合优度R方越大,回归直线的拟合程度越好()14正态分布曲线的两个尾端无限接近横轴且理论上不会与之相交。()15异常值是指一批数据中的个别值,其数值明显偏离该批数据的其余值,也称离群值。()一、 单选题1无量纲化后各变量的标准差为(B) A、 0 B、 1 C、 -1 D、 原标准差2在Excel 中,数据类型包括(D) A、 数值型数据 B、 字符型数据 C、 逻辑型数据 D、 以上全部3下列调查中,适合用全面调查方式的是(A) A、 了解某班学生“50米跑”的成绩 B、 了解一批灯泡的使用寿命 C、 了解一批炮弹的杀伤半径 D、 了解一批袋装食品是否含有防腐剂4下列调查方式中适合的是(C)A、 要了解一批节能灯的使用寿命,采用普查方式B、 调查你所在班级同学的身高,采用抽样调查方式C、 环保部门调查某段水域的水质情况,采用抽样调查方式D、 调查全市中学生每天的就寝时间,采用普查方式5估计量的含义是指(A) A、 用来估计总体参数的统计量的名称 B、 用来估计总体参数的统计量的具体数值 C、 总体参数的名称 D、 总体参数的具体取值6在Excel 2010的单元格中,输入函数=sum(10,25,13),得到的值为(B) A、 25 B、 48 C、 10 D、 287n个标准正态分布的平方和为(A) A、 卡方分布 B、 t分布 C、 F分布 D、 正态分布8下列四项中,不属于数据库特点的是(C) A、 数据共享 B、 数据完整性 C、 数据冗余很高 D、 数据独立性高9在Excel 2010的工作表中,假定C3:C6区域内保存的数值依次为10、15、20和45,则函=AVERAGE(C3:C6)的值为(B) A、 22 B、 22.5 C、 45 D、 9010已知甲、乙两班学生统计学考试成绩:甲班平均分为70分,标准差为7.5分;乙班平均分为75分,标准差为7.5分。由此可知两个班考试成绩的离散程度(A )。 A、 甲班较大 B、 乙班较大 C、 两班相同 D、 无法作比较11Excel2003工作簿文件的默认扩展名为(A) A、 xls B、 doc C、 mbd D、 ppt12(B)用于计算平均发展速度 A、 算术平均数 B、 几何平均数 C、 加权平均数 D、 调和平均数13在SQL中,用来显示数据库信息的系统存储过程是(D) A、 sp-dbhelp B、 sp-db C、 sp-help D、 sp-helpdb14(A)用于计算时期序列的平均发展水平或间隔相等的连续时点序列的平均发展水平。 A、 算术平均数 B、 几何平均数 C、 加权平均数 D、 调和平均数15在Excel2003中,柱形图类型属于图表中的(B) A、 复合类型 B、 标准类型 C、 简单类型 D、 自定义类型16EXCEL中,求中位数的函数是(B) A、 AVERAGE B、 MEDIAN C、 MODE D、 STDEV17当向Excel2003工作簿文件中插入一张电子工作表时,默认的表标签中的英文单词为(A) A、 Sheet B、 Book C、 Table D、 List18下列不能描述变量离期望值大小的指标是(D ) A、 变异系数 B、 标准差 C、 方差 D、 相关系数19标准离差率是标准离差与(D)相比求出的相对数。 A、 投资报酬 B、 风险报酬 C、 原始投资 D、 期望值20下列说法正确的为(C ) A、 概率就是频率 B、 概率为1的事件可以不发生 C、 概率为0的事件一定不会发生 D、 概率不可以是一个无理数21服从参数为x的泊松分布数学方差为(A) A、 x B、 1/x22求C5和H5两单元格平均值的函数形式是(B) A、 AVERAGE(C5:H5) B、 AVERAGE(C5,H5) C、 SUM(C5:H5)/2 D、 SUM(C5,H5)23SQL中基本查询语句是(A) A、 SELECT B、 SELECT FROM C、 WHERE D、 CREAT24变异系数越大,表示风险程度越(A) A、 大 B、 小 C、 不变 D、 等于零25任一随机事件出现的概率为(D) A、 在-1到1之间 B、 小于0 C、 不小于1 D、 在0与1之间26在Excel 2003中,图表被建立在(A) A、 二维坐标系中 B、 一维坐标系中 C、 三维坐标系中 D、 更高维坐标系中27目前,(A)数据库系统已经逐渐淘汰了网状数据库和层次数据库,成为当今最为流行的商用数据库系统。 A、 关系 B、 面向对象 C、 分布 D、 层次28一个95%的置信区间是指(C) A、 总体参数有95%的概率落在这一区间内 B、 总体参数有5%的概率未落在这一区间内 C、 在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数。 D、 在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数。29结构化数据根据采集方式可分为(D) A、 品质数据和数值型数据 B、 连续型数据和离散型数据 C、 截面数据、时间序列数据和面板数据 D、 一手数据和二手数据30计算平均数的基本要求是所要的平均数的总体单位应是(B ) A、 大量的 B、 同质的 C、 差异的 D、 少量的二、 多选题1访问法包括(ABCD) A、 小组访谈法 B、 街头访问 C、 企业调研 D、 网上调查2在SQL中,对象的数据类型包括的属性有(ABCD) A、 数据种类 B、 数据的长度或大小 C、 数值的精度 D、 数值中的小数位数3如果参与分类的变量较多时(比如大于1000),可以选用的方法是(BC) A、 层次聚类法 B、 K-均值聚类法 C、 两步聚类法 D、 混合聚类法4热力图的作用有(ABD) A、 考察访问者是否按照产品预设的逻辑进行操作 B、 是否有一些没有被发现的习惯或行为 C、 考察访问者访问流程 D、 对于访问者在导航页的点击哪些是正确的,哪些是有问题的5数据产生的主要来源有(ABCD) A、 局域网 B、 离线储存数据 C、 互联网 D、 物联网6一组数据的(AC)一定是原始数据中的真实值。 A、 众数 B、 平均数 C、 中位数(数据个数为奇数) D、 中位数(数据个数为偶数)7根据数据量级别,数据可分为(AB)。 A、 传统数据 B、 大数据 C、 结构化数据 D、 非结构化数据8下列关于统计量的表述中,正确的有(ABCD) A、 估计统一总体参数可以用多个不同统计量 B、 统计量是样本的函数 C、 统计量不含有未知参数 D、 统计量的分布成为抽样分布9非全面调查包括(ABC) A、 重点调查 B、 典型调查 C、 抽样调查 D、 人口普查10如果参与分类的变量是连续变量,则适用的聚类方法有(ABC) A、 层次聚类法 B、 K-均值聚类法 C、 两步聚类法 D、 混合聚类法11根据结构化水平,数据可分为(ACD) A、 结构化数据 B、 大数据 C、 半结构化数据 D、非结构化数据12下列可描述相关关系的图表类型有(AC) A、 散点图 B、 饼图 C、 气泡图 D、 瀑布图13数据排序的优点有(ABCD) A、 发现差异 B、 便于浏览 C、 把握离散程度 D、 发现异常值14概率密度曲线(AC) A、 位于X轴的上方 B、 位于X轴的下方 C、 与X轴之间的面积为1 D、 与X轴之间的面积不定15流量渠道可分为(ABCD) A、 直接访问 B、 引介访问 C、 搜索访问 D、 广告系列四、 判断题1网站数据可通过WEB日志和JS标记获取。()2主键能够唯一标识表中某一记录的属性。()3客户获取是指吸引有价值的潜在客户,将他们变成现实客户的过程。()4变异系数又称标准离差率,是一个相对指标,表示标准差偏离期望值的程度。()5客户为企业提供的价值,即从客户的角度来感知企业提供产品和服务的价值(×)6均值决定正态曲线的具体位置()7卡方分布的曲线随着自由度的增大逐渐趋于对称。()8客户获取通常发生在客户生命周期中的考察期()9变异系数用来描述数据的集中趋势。(×)10计量单位相同时,如果两组数据的均值相差悬殊,离散系数可能比标准差等绝对指标更有意义。()11在Excel 2003中,工作簿是以文件形式存在的,工作表存在于工作簿中。()12数据与信息是不可分离的,数据是信息的表达,信息是数据的内涵。()13因子得分是各变量的线性组合()14生活日用品的价格弹性大(×)15一种预测方法的好坏取决于预测误差的大小。()一、 单选题1在天气预报中,有“降水概率预报”,例如预报“明天降水概率为78%”,这是指(D) A、 明天该地区有78%的地区降水,其他22%的地区不降水 B、 明天该地区约有78%的时间降水,其他时间不降水 C、 气象台的专家中,有78%的人认为会降水,另外22%的专家认为不降水 D、 明天该地区的降水的可能性为78%2下列四项中,不属于数据库特点的是(C) A、 数据共享 B、 数据完整性 C、 数据冗余很高 D、 数据独立性高3在Excel 2010的工作表中,假定C3:C6区域内保存的数值依次为10、15、20和45,则函=AVERAGE(C3:C6)的值为(B) A、 22 B、 22.5 C、 45 D、 904结构化数据根据连续性可分为(B) A、 品质数据和数值型数据 B、 连续型数据和离散型数据 C、 截面数据、时间序列数据和面板数据 D、 一手数据和二手数据5时间序列线性趋势可以采用的估计方法有(D) A、 winters指数平滑 B、 移动平均法 C、 季节分解法 D、 holt指数平滑法6结构化数据根据采集方式可分为(D) A、 品质数据和数值型数据 B、 连续型数据和离散型数据 C、 截面数据、时间序列数据和面板数据 D、 一手数据和二手数据7一组数据2,4,3,5,7,3,8的中位数为(C) A、 3 B、 5 C、 4 D、 68加权算术平均数的大小(D) A、 受各组次数f的影响最大 B、 受各组标志值x的影响最大 C、 只受各组标志值x的影响 D、 受各组次数f和各组标志值x的共同影响9可供分析的数据通常具有不同量纲,使得各个变量之间不具有综合性,而数据分析方法大多对变量有特殊的要求,比如符合正态分布或者变量之间具有可比性。(C) A、 变量计算 B、 加权处理 C、 标准化 D、 分类汇总10在SQL中,创建数据库用的命令是(D) A、 CREATE SCHEMA B、 CREATE TABLE C、 CREATEVIEW D、 CREATE DATABASE11(C)是将各个数值乘以相应的权数,然后加总求和得到总体值再除以总的单位数。 A、 算术平均数 B、 几何平均数 C、 加权平均数 D、 调和平均数12在Excel工作表中,单元格A1至A10中分别存放的数据为1,1,2,3,5,8,13,21,36,57,单元格A12中存放这十个数值的最大值,下列正确的函数是(A) A、 MAX(A1:A10) B、 COUNT(A1:A10) C、 AVERAGE(A1:A10) D、 SUM(A1:A10)13参数估计分为(A) A、 点估计和区间估计 B、 区间估计和无偏估计 C、 点估计和无偏估计 D、 区间估计和一致估计14在SQL中,用来显示数据库信息的系统存储过程是(D) A、 sp-dbhelp B、 sp-d

    注意事项

    本文(最新CDA题库.docx)为本站会员(1595****071)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开