CPDA考试真题与答案 4.doc
《CPDA考试真题与答案 4.doc》由会员分享,可在线阅读,更多相关《CPDA考试真题与答案 4.doc(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、如有侵权,请联系网站删除,仅供学习与交流CPDA考试真题与答案 4【精品文档】第 9 页一、 判断题 1.数据可分为结构化数据和非结构化数据等。正确答案: 2.大数据与传统数据有着本质上的差别,因此之前处理数据的方法和软件都不再适用,大数据分析有专用的软件和方法。正确答案: 3.数据分析的核心是数据,因此数据的获取和处理十分关键。正确答案: 4.Apriori算法可用于分类预算。正确答案: 5.一组数据的众数和中位数都是唯一的。正确答案: 6.资金的时间价值体现在资金会随着时间而增值,如银行存款会增加利息。正确答案: 7.茎叶图不仅能够反映数据的分布情况,还能显示数据的原始信息。正确答案: 8
2、.在多元回归分析中,检验方程的拟合优度用调整后的R的平方效果更好。正确答案: 9.在对不同项目进行风险衡量时,可以用标准差作为标准,标准差越大,方案风险水平越高。正确答案: 10.时间序列若无季节变动,则其各月(季)季节指数为0.正确答案: 11.一个硬币掷 10 次,其中 5 次正面向上的概率是0.5。正确答案: 12.DBSCAN算法对异常值敏感,因此要在聚类前进行异常值分析。正确答案: 13.在假设检验中,当我们做出拒绝原假设而接受备择假设的结论时,表示原假设是错误的。 正确答案: 14.召回率(recall)指预测为正的样本中实际为正的样本所占比例。正确答案: 15.逻辑回归只能用于二
3、分类问题,即输出只有两种,分别代表两个类别。正确答案: 二、 单选题1.Apriori算法用下列哪个做项目集(Itemset)的筛选?A、最小信赖度(Minimum Confidence)B、最小支持度(Minimum Support)C、交易编号(TransactionID)D、购买数量正确答案: B 2.为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.00340.01,这意味着( )A、南方和北方女婴出生体重的差别无统计学意义B、南方和北方女婴出生体重差别很大C、由
4、于P值太小,南方和北方女婴出生体重差别无意义D、南方和北方女婴出生体重差别有统计学意义但无实际意义正确答案: D 3.预测分析中将原始数据分为训练数据集和测试数据集等,其中训练数据集的作用在于( )A、用于对模型的效果进行无偏的评估B、用于比较不同模型的预测准确度C、用于构造预测模型D、用于选择模型正确答案: C 4.一个射手连续射靶22次,其中3次射中10环,7次射中9环,9次射中8环,3次射中7环则射中环数的中位数和众数分别为( )A、8,9B、8,8 C、8.5,8D、8.5,9正确答案: B 5.一般来说,当居民收入减少时,居民储蓄存款也会相应减少,二者之间的关系是( )A、负相关B、
5、正相关C、零相关D、曲线相关正确答案: B 6.下表为一交易数据库,请问A C 的信赖度(Confidence)为( )A、75%B、50%C、60%D、66.7%正确答案: D 7.如何利用体重以简单贝式分类(Naive Bayes)预测性别?A、选取另一条件属性B、将体重正规化为到01 之间C、将体重离散化D、无法预测正确答案: C 8.以下哪个属于时间序列的问题?( )A、信用卡发卡银行侦测潜在的卡奴B、基金经理人针对个股做出未来价格预测C、电信公司将人户区分为数个群体D、以上皆是正确答案: B 9.数据缺失(Null Value)处理方法可分为人工填补法及自动填补法,下列哪种填补法可得
6、到较准确的结果?A、填入一个通用的常数值,例如填入未知/UnknownB、把填补遗缺值的问题当作是分类或预测的问题C、填入该属性的整体平均值D、填入该属性的整体中位数正确答案: B 10.某市有各类书店500家,其中大型50家,中型150家,小型300家。为了调查该市图书销售情况,拟抽取30家书店进行调查。如果采用分层等比例抽样法,下列在大型、中型、小型书店中样本的正确分配量为( )A、5、15、10B、7、10、13C、10、10、10D、3、9、18正确答案: D 11.以下哪种方法不属于有监督学习模型( )A、线性回归B、决策树C、主成分分析D、随机森林正确答案: C 12.下列关系中,
7、属于正相关关系的有( )A、合理限度内,施肥量和平均单位产量之间的关系B、产品产量与单位产品成本之间的关系C、商品的流通费用与销售利润之间的关系D、流通费用率与商品销售量之间的关系正确答案: A 13.某公司在进行市场调研,以决定是否推出一款新产品。调研得出的结论是:出现有利结果的概率为60%,出现不利结果的概率为40%。如果结果有利,则产品成功的概率为70%;如果结果不利,则产品失败的概率会达到75%。如果产品成功,该公司预期年利润将达到5 000 000元;如果产品失败,该公司每年将损失2 000 000元。那么,这款新产品的年利润期望值为( )A、1 500 000元B、1 640 00
8、0元 C、2 000 000元D、2 650 000元正确答案: B 14.在类神经网络中计算误差值的目的是( )A、调整隐藏层个数B、调整输入值C、调整权重(Weight)D、调整真实值正确答案: C15.某次英语考试的标准差为 5.1 分,考虑到这次考试的题目太难,评分时给每位应试者都加了 10 分,加分后成绩的标准差是( )A、10B、15.1C、5.1D、信息不足,无法计算。正确答案: C 16.下列对 C4.5 算法的说法中不正确的是( )A、每个节点的分支度只能为2B、使用 gain ratio 作为节点分割的依据C、可以处理数值型态的字段D、可以处理空值的字段正确答案: A 17
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- CPDA考试真题与答案 CPDA 考试 答案
限制150内