2022年CPDA考试真题与答案-1.docx
精品学习资源一、 单项选择题1. “大数据”是指规模超过1000TB的数据集;正确答案: ×2. 概率为 0 的大事是不行能大事,概率为1 的大事是必定大事;正确答案: ×3. 将总体中的各单位按某一标志排列,再依固定间隔抽选调查单位的抽样方式为等距抽样;正确答案: 4. 统计图中的散点图主要用来观看变量之间的相关关系;正确答案: 5. 抽样误差是指在调查过程中由于观看、测量等过失所引起的误差;正确答案: ×6. Datahoop1.2版中 K-means聚类分析要求输入的数据必需是数值型数据;正确答案: 7. 假如大事 A,B 互斥,且 PA>0,PB>0,就 A , B 独立;正确答案: ×8. SQL 中删除表的命令是“ DELETE TABLE”;正确答案: ×9. 聚类分析中,各变量的取值在数量级上不能有过大的差异;正确答案: 10. 假如某产品的生产和销售正处于市场成长期,其营销重点应当是延长产品寿命;欢迎下载精品学习资源正确答案: ×11. 需求定价法的核心思想是力求在需求高涨时收取较低价格,而当需求低落时就收取较高价格;正确答案: ×12. 使用索引可以快速拜望数据库中的数据,所以可以在数据库中尽量多的建立索引;正确答案: 13. 线性回来模型的拟合优度可接受可决系数进行评判;可决系数越高, 模型拟合成效越好; 可决系数越小,模型拟合成效越差;正确答案: ×14. 一个时间序列中包含长期趋势、季节变动、循环变动和不规章变动,一般将四个因素一一分解之后进行分析;正确答案: ×15. 决策树中包含根结点、叶结点、内部结点和外部结点;正确答案: ×二、 单项选择题1. 检查反常值常用的统计图形是A 、柱状图B、箱线图 C、帕累托图D、气泡图正确答案: B2. 什么是 KDD ? A 、数据挖掘与学问发觉B、领域学问发觉欢迎下载精品学习资源C、文档学问发觉D、动态学问发觉正确答案: A3. 东北人养了一只鸡和一头猪; 一天鸡问猪: 主人呢?猪说: 出去买蘑菇了; 鸡听了撒丫子就跑;猪说:你跑什么?鸡叫道: “有本领主人买粉条的时候你小子别跑!以上对话表达了数据分析方法中的 A 、关联B、聚类C、分类D、自然语言处理正确答案: A4. 假设检验中显著性水平是 A 、推断时犯取伪错误的概率B、推断时取伪弃真的概率 C、正确推断的概率D、是推断的可信度正确答案: B5. 矩估量的基本原理是A 、用样本矩估量总体矩B、使得似然函数到达最大C、使得似然函数到达最小D、小概率大事在一次试验中是不行能发生的正确答案: A6. SQL 查询语句中 HAVING子句的作用是A 、指出分组查询的范畴B、指出分组查询的值 C、指出分组查询的条件D、指出分组查询的内容正确答案: C欢迎下载精品学习资源7. 以下哪项关于决策树的说法是错误的 A 、冗余属性不会对决策树的精确率造成不利的影响B、子树可能在决策树中重复多次C、决策树算法对于噪声的干扰特殊敏捷D、查找最正确决策树是 NP 完全问题正确答案: C8. 以下哪种方法不属于于监督学习模型A 、决策树B、线性回来C、关联分析D、判别分析正确答案: C9 考虑下面的频繁 3- 项集的集合: 1 ,2,3 , 1 ,2,4 ,1 ,3, 4 , 1 ,3, 5 ,2 ,3 ,4 ,2 , 3,5 , 3 ,4, 5 假定数据集中只有5 个项,假设接受合并策略,就由候选产生过程得到 4- 项集不包含A 、1 , 2 , 3 , 4 B、1 , 2 , 3, 5 C、1 , 2 , 4 , 5 D、1 , 3 , 4 , 5正确答案: C10. 以下不属于原始数据来源的是 A 、行政记录B、统计调查C、统计年鉴D、试验正确答案: C11. 以下不属于分类算法的是 A 、C4.5 算法B、规律回来欢迎下载精品学习资源C、KNN 算法D、TF-TDF 算法正确答案: D12. 相关分析与回来分析的一个重要区分是A 、前者争论变量之间关系的亲热程度,后者争论变量间的变动关系,并用方程式表示B、前者争论变量之间的变动关系,后者争论变量间关系的亲热程度C、两者都争论变量间的变动关系 D、两者都不争论变量间的变动关系正确答案: A13. 数据仓库是随着时间变化的,下面的描述不正确的选项是A 、数据仓库随时间的变化不断增加新的数据内容B、捕捉到的新数据会掩盖原先的快照C、数据仓库随时间变化不断删去旧的数据内容D、数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合正确答案: C14. 资金的时间价值是 A 、同一资金在同一时点上价值量的差额B、同一资金在不同时点上价值量的差额C、不同资金在同一时点上价值量的差额D、不同资金在不同时点上价值量的差额正确答案: B15. 描述一组对称或正态分布数据的离散程度时,最适宜选择的指标是A 、极差B、标准差C、均值D、变异系数正确答案: B16. 以下有关 Apriori 算法的说法中不正确的选项是 欢迎下载精品学习资源A 、Apriori 算法是关联分析中最常用的算法之一;B、应用 Apriori 算法时,需要先设定模型的最小支持度、最小置信度等阈值;C、应用 Apriori 算法时,输入的数据可以是连续型数据也可以是离散型数据;D、Apriori 算法扫描数据库的次数依靠于最大频繁项集中项的数量;正确答案: C17. 当置信水平确定时,置信区间的宽度 A 、随着样本量的增大而减小B、随着样本量的增大而增大C、与样本量的大小无关D、先随着样本量的增大而减小,到确定程度后会随着样本量的增大而增大;正确答案: A18. 一种商品价格变动与由此引起另外一种商品需求量相对变动的比率称为A 、需求价格弹性B、供应价格弹性C、需求交叉弹性D、供应交叉弹性正确答案: C19. 分类器成效检验中的精确率是指A 、推测正确的数据在总数据中的比例B、推测为正的数据在总数据中的比例C、推测为正的数据中实际为正的数据所占比例 D、实际为正的数据中被推测为正的数据所占比例正确答案: C20. 给出以下结论:1 在回来分析中,可用指数系数R 方的值判定模型的拟合成效,R 方越大,模型的拟合成效越好;2 在回来分析中,可用残差平方和判定模型的拟合成效,残差平方和越大,模型的拟合成效越好;3 在回来分析中, 可用相关系数 r 的值判定模型的拟合成效,r 越小, 模型的拟合成效越好;欢迎下载精品学习资源4 在回来分析中,可用残差图判定模型的拟合成效,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适带状区域的宽度越宽,说明模型的拟合精度越高 以上结论中,正确的有个A 、1 B、2C、3D、4正确答案: A21. 维度规约是在以下哪个步骤的任务?A 、频繁模式挖掘B、降维C、数据预处理D、数据流挖掘正确答案: C22. 假设属性 income 的最大最小值分别是 12000 元和 98000 元;利用最大 - 最小标准化的方法将属性的值映射到 0 至 1 的范畴内;对属性 income 的 73600 元将被转化为 A 、0.751B、0.163C、0.457D、0.716正确答案: D23. 假定用于分析的数据包含属性age ;数据元组中 age 的值如下按递增序 : 13 , 15 , 16 ,16 ,19 ,20 ,20 ,21 ,22 ,22 ,25 ,25 ,25 ,30 ,33 ,33 ,35 ,35 ,36 ,40 ,45 , 46 ,52 ,70, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3;其次个箱子值为A 、15.7 B、18.3C、19.7D、以上都不对正确答案: B欢迎下载精品学习资源24. EXCEL 中,求标准差的函数是 A 、AVERAGE B、MEDIANC、MODE D、STDEV正确答案: D25. 人们购买制冷用空调主要是为了在夏天获得凉快空气, 这属于空调产品整体概念中的 A 、有形产品B、直接产品C、核心产品D、主要产品正确答案: C26. 贝叶斯决策是依据进行决策的一种方法;A 、极大似然概率B、先验概率C、边际概率D、后验概率正确答案: D27. 某人欲为子女筹措250000元的留学经费, 估量在 8 年内的每年年初在银行存入一笔款项,如银行存款年利率为8 ,每年应存入金额为A 、23502.87B、23505.20C、12698.6D、21762.67正确答案: D28. 指数平滑法可以用以下哪种指标来反映对时间序列资料的修正程度A 、平滑常数B、指数平滑数初始值C、跨过期欢迎下载精品学习资源D、季节指数正确答案: A29. 某牙膏厂原先生产两面针药物牙膏,现在又增加牙刷生产,这属于 A 、同心多元化B、水平多元化C、集团多元化D、相关多元化正确答案: B30. 净现值、内部收益率、获利指数指标之间的数量关系是 A 、当 NPV>0 时, IRR>i , PI<1 B、当 NPV>0 时, IRR>i , PI>1 C、当 NPV<0 时, IRR>i , PI<1 D、当 NPV<0 时, IRR>i , PI>1正确答案: B三、 多项选择题1. 以下关于皮尔森相关分析表达正确的选项是 A 、两变量独立,两者的皮尔森相关系数必定等于 0 B、两变量皮尔森相关系数不等于 0 ,两者必定不独立C、皮尔森相关系数是否等于零,不能指明两变量是否独立D、两变量不独立,两者的皮尔森相关系数必定不等于 0正确答案: AB2. 在实际数据中, 元组在某些属性上缺少值是常有的;描述处理该问题的各种方法有: A 、直接删除B、使用属性的平均值填充空缺值C、使用一个全局常量填充空缺值D、使用与给定元组属同一类的全部样本的平均值正确答案: ABCD3. 描述变量离期望值大小的指标是欢迎下载精品学习资源A 、方差B、变异系数C、标准差 D、期望正确答案: ABC4. 以下属于分类器评判或比较尺度的有A 、推测精确度B、召回率C、模型描述的简洁度D、F1-Score正确答案: ABD5. 以下关于规律回来的说法正确的选项是A 、应用规律回来时,反常值会对模型造成很大的干扰;B、规律回来的自变量必需是分类变量,因此要对连续型变量进行离散化处理;C、规律回来对模型中自变量的多重共线性较为敏捷;D、规律回来属于分类算法;正确答案: ACD6. 以下项目中,其变动可以转变盈亏平稳点位置的因素有A 、单价B、单位变动成本C、销量D、固定成本正确答案: ABCD7. 关于基准收益率的表述,正确的选项是A 、基准收益率越高越好B、基准收益率越低越好,但不能低于银行贷款利率C、可以接受项目加权平均资金成本为基础确定基准收益率 D、可以接受国家有关部门或行业统一发布的行业基准收益率正确答案: CD欢迎下载精品学习资源8. 数据离散化是指为了数据分析的需要,将连续数据转换为离散型数据的过程;数据离散化的方法有A 、随机取值B、等距离散法C、数值规约 D、等频离散法正确答案: BD9. 依据分析内容和侧重面不同,风险分析的方法有A 、敏捷性分析B、概率分析C、经济效益分析D、盈亏平稳分析正确答案: ABD10. 以下说法正确的有A 、评判推测精度是通过测量与分析推测误差进行的B、确定误差是实际观测值与推测值的离差C、相对误差反映实际观测值与推测值之间差异的相对程度D、平均误差反映实际观测值与推测值之间的平均差异正确答案: ABCD11. 以下公式正确的选项是A 、流淌资金流淌资产流淌负债B、流淌资产 = 应收账款 + 存货C、流淌负债 = 应对账款 + 预收账款D、流淌资金本年增加额= 本年流淌资金上年流淌资金正确答案: ACD12. 如下哪些不是基于规章的分类器的特点A 、规章集的表达才能远不如决策树好B、基于规章的分类器都对属性空间进行直线划分,并将类指派到每个划分C、无法被用来产生更易于说明的描述性模型D、特殊适合处理类分布不平稳的数据集欢迎下载精品学习资源正确答案: AC13. 以下有关随机森林算法的说法正确的选项是A 、随机森林算法的分类精度不会随着决策树数量的增加而提高;B、随机森林算法对反常值和缺失值不敏捷;C、随机森林算法不需要考虑过拟合问题;D 、决策树之间相关系数越低、每棵决策树分类精度越高的随机森林模型的分类成效越好;正确答案: ABD14. 以下算法中对缺失值敏捷的有A 、Logistic回来B、SVM 算法C、CART 决策树D、淳朴贝叶斯正确答案: AB15. 层次聚类的聚类方式有 A 、凝聚方式聚类B、分解方式聚类C、Q 型聚类D、R 型聚类正确答案: AB16. 方差分析的基本假设前提包括A 、各处理条件下的样本均来自正态总体B、各处理条件下的样本相互独立C、各处理条件下样本的方差都相等D、各处理条件下样本均值相等,方差可以不等正确答案: ABC17. 依据性质,推测方法大致可分为;A 、定性推测B、情形推测欢迎下载精品学习资源C、时间序列推测D、回来推测正确答案: ACD18. 以下关于统计量的表述中,正确的有A 、估量同一个总体参数可以用多个不同的统计量B、统计量是样本的函数C、统计量不含有总体的参数D、统计量是随机变量正确答案: ABD19. 在假设检验中,犯一类错误的概率和犯其次类错误的概率的关系是A 、只能直接把握 ,不能直接把握B、 和 不行能同时减小C、在其他条件不变的情形下,增大 ,必定后减小D、在其他条件不变的情形下,增大 ,必定后增大E、增加样本容量可以同时减小 和正确答案: ACE20. 概率密度曲线A 、位于 X 轴的上方B、在 X 轴上下摇摆C、与 X 轴之间的面积为 1 D、与 X 轴之间的面积为 0正确答案: AC欢迎下载