《自然语言处理技术与应用》 试卷及答案 试题B卷.docx
《《自然语言处理技术与应用》 试卷及答案 试题B卷.docx》由会员分享,可在线阅读,更多相关《《自然语言处理技术与应用》 试卷及答案 试题B卷.docx(10页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、期末考试试题B卷(开卷)适用班级:人工智能2001/2002专业:人工智能技术服务 考试时长:120分钟得分阅卷入一、选择题(单项选择共15题,每题2分,共3() 分)1.自然语言处理的发展大致分为3个阶段:(),20世纪70年 代和21世纪。A. 19世纪晚期B. 19世纪中期C. 19世纪早期D.20世纪50年代2.以下哪个不属于文件对象的方法?()A. file.read(size)B. file.write(str)C. file.readline()D. file.close()3.为了保证无论是否出错都能正确地关闭文件,可以使用()来实现。A. breakB. for循环语句C.
2、tryfinallyD. if.else4.目前的分词方法主要有三种:基于规则的分词方法、基于统计的 分词方法以及()。A.基于语法的分词方法B.基于语种的分词方法C.基于语言的分词方法D.基于语义的分词方法5.采用jicba搜索引擎模式对“南京市长江大桥”进行分词,得到的结果 为()A.南京、市长江大桥B.南京市7长江大桥C.南京/南京市/京市/市长/长江/长江大桥/大桥D.南京/京市/南京市/长江/大桥/ K江大桥6.词性标注的正确与否会直接影响到之后的()、语义分析是中文 自然语言处理的基础之一。A.词法分析B.语言分析C.句子分析D.句法分析7 .关于Stanford parser下面
3、说法不正确的是:()A. Stanford parser的底层是由Java实现的,因此需要确保安装JDK。B. Stanford parser的Python封装是在NEFK库中实现的,因此,需 要安装NLTK库。C. NETK是一款Python的自然语言处理工具,但主要针对中文。D. Stanford parser至于概率统计进行句法分析。8 .RNN的应用场景不包括()。A.生成图像描述B.语音识别C.视频标记D.自动拍照9 .当处理序列问题发现,当前时刻的输出既与前面时刻输入有关,又与未来时 刻输出有关,应选择哪个模型更为合适()A.CNNB. RNNC.双向LSTMD. GMM10 .关
4、于one-hot编码说法不正确的是()。A. one-hot编码是一位有效编码B.每个状态都有自己独立的寄存器位C.随着语料库词语的增加,词向量的维度高且稀疏D.计算词与词之间的相似性11 .基于主题模型方法使用的算法是()。A. TF-IDF 算法B. LDA算法C. TextRank 算法D. KNN算法12. TF-IDF算法中使用哪个函数对数据集进行分词,去停用词().A. posB. corpus_pathC. preprocessD. idCdic13 .根据代码确定fit_prior:为True的含义()。class sklearn.naive_bayes.Multinomina
5、lNB(alpha= 1.0, fit_prior=True, class_prior=None)A.不去学习类别先验概率B.训练模型C.追加训练模型D.用模型进行预测14 .基于词典的情感分析方法的最大特点是()。A.简单B.方便C.复杂D.快速15 .自然语言理解的简称是什么?()。10.6A.NLPB.ANNC. NLUD. APL得分阅卷入二、判断题(对的打 ,错的打X,共10 题,每题1分,共10分)1 .句法分析的主要任务是:识别出句子所包含的句法成分,以及这 些成分之间的关系。()1.1. jieba分词工具提供了词性标注功能。jieba分词是结合规则和统 计的方式,也就是说同时
6、使用词典匹配和 HMM o()3. Stanford parser 的底层是由 python 实现的。()4. re.match尝试从字符串的起始位置匹配一个模式,如果起始位置 匹配不成功的话,就返回noneo()5. re.match尝试从字符串的起始位置匹配一个模式,如果起始位置匹 配不成功的话,就返回noneo()6 .自然语言处理(Natural Language Processing, NLP)是计算机科学领域以及大数据领域的一个重要的研究方向。()7 .基于语义的分词方法通常包括三个部分:分词子系统、句法语义子 系统、总控部分。()8 .条:牛随机场(CRF)也是一种基于马尔科夫思
7、想的统计模型。之前的模型都假设每个状态均只与它前面的状态有关。()9 .命名实体识别(NER)的目的在于识别语料中人名、地名、组织 机构名等命名实体。()10 .LTP的主要模型中SentenceSplitter是分句模型。()得分 阅卷入 三、填空题(共13题,每空1分,共20分)1 .自然语言处理的发展历程分别是:19世纪早期、2 .目前的分词方法主要有三种:基于规则的分词方法、以 及基于语义的分词方法。3 .命名实体识别分为 和基于统计的命名实体识别O4 .的目的在于识别语料中人名、地名、组织机构名等 命名实体。5 .根据句法结构的表示形式不同,最常见的句法分析任务可 以分为以下三种:、
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 自然语言处理技术与应用 自然语言处理技术与应用 试卷及答案 试题B卷 自然语言 处理 技术 应用 试卷 答案 试题
限制150内