《自然语言处理技术与应用》试卷及答案试题B卷.docx

上传人：太**

文档编号：93885509

上传时间：2023-07-15

格式：DOCX

页数：10

大小：24.97KB

( 4.5 )

《《自然语言处理技术与应用》试卷及答案试题B卷.docx》由会员分享，可在线阅读，更多相关《《自然语言处理技术与应用》试卷及答案试题B卷.docx（10页珍藏版）》请在淘文阁 - 分享文档赚钱的网站上搜索。

1、期末考试试题B卷（开卷）适用班级：人工智能2001/2002专业：人工智能技术服务考试时长：120分钟得分阅卷入一、选择题（单项选择共15题，每题2分，共3（）分）1.自然语言处理的发展大致分为3个阶段：（），20世纪70年代和21世纪。A. 19世纪晚期B. 19世纪中期C. 19世纪早期D.20世纪50年代2.以下哪个不属于文件对象的方法？（）A. file.read（size）B. file.write（str）C. file.readline（）D. file.close（）3.为了保证无论是否出错都能正确地关闭文件，可以使用（）来实现。A. breakB. for循环语句C.

2、tryfinallyD. if.else4.目前的分词方法主要有三种：基于规则的分词方法、基于统计的分词方法以及（）。A.基于语法的分词方法B.基于语种的分词方法C.基于语言的分词方法D.基于语义的分词方法5.采用jicba搜索引擎模式对“南京市长江大桥”进行分词，得到的结果为（）A.南京、市长江大桥B.南京市7长江大桥C.南京/南京市/京市/市长/长江/长江大桥/大桥D.南京/京市/南京市/长江/大桥/ K江大桥6.词性标注的正确与否会直接影响到之后的（）、语义分析是中文自然语言处理的基础之一。A.词法分析B.语言分析C.句子分析D.句法分析7 .关于Stanford parser下面

3、说法不正确的是：（）A. Stanford parser的底层是由Java实现的，因此需要确保安装JDK。B. Stanford parser的Python封装是在NEFK库中实现的，因此，需要安装NLTK库。C. NETK是一款Python的自然语言处理工具，但主要针对中文。D. Stanford parser至于概率统计进行句法分析。8 .RNN的应用场景不包括（）。A.生成图像描述B.语音识别C.视频标记D.自动拍照9 .当处理序列问题发现，当前时刻的输出既与前面时刻输入有关，又与未来时刻输出有关，应选择哪个模型更为合适（）A.CNNB. RNNC.双向LSTMD. GMM10 .关

4、于one-hot编码说法不正确的是（）。A. one-hot编码是一位有效编码B.每个状态都有自己独立的寄存器位C.随着语料库词语的增加，词向量的维度高且稀疏D.计算词与词之间的相似性11 .基于主题模型方法使用的算法是（）。A. TF-IDF 算法B. LDA算法C. TextRank 算法D. KNN算法12. TF-IDF算法中使用哪个函数对数据集进行分词，去停用词（）.A. posB. corpus_pathC. preprocessD. idCdic13 .根据代码确定fit_prior:为True的含义()。class sklearn.naive_bayes.Multinomina

5、lNB(alpha= 1.0, fit_prior=True, class_prior=None)A.不去学习类别先验概率B.训练模型C.追加训练模型D.用模型进行预测14 .基于词典的情感分析方法的最大特点是()。A.简单B.方便C.复杂D.快速15 .自然语言理解的简称是什么？()。10.6A.NLPB.ANNC. NLUD. APL得分阅卷入二、判断题(对的打 ,错的打X,共10 题，每题1分，共10分)1 .句法分析的主要任务是：识别出句子所包含的句法成分，以及这些成分之间的关系。()1.1. jieba分词工具提供了词性标注功能。jieba分词是结合规则和统计的方式，也就是说同时

6、使用词典匹配和 HMM o()3. Stanford parser 的底层是由 python 实现的。()4. re.match尝试从字符串的起始位置匹配一个模式，如果起始位置匹配不成功的话，就返回noneo()5. re.match尝试从字符串的起始位置匹配一个模式，如果起始位置匹配不成功的话，就返回noneo()6 .自然语言处理(Natural Language Processing, NLP)是计算机科学领域以及大数据领域的一个重要的研究方向。()7 .基于语义的分词方法通常包括三个部分：分词子系统、句法语义子系统、总控部分。()8 .条:牛随机场(CRF)也是一种基于马尔科夫思

7、想的统计模型。之前的模型都假设每个状态均只与它前面的状态有关。（）9 .命名实体识别（NER）的目的在于识别语料中人名、地名、组织机构名等命名实体。（）10 .LTP的主要模型中SentenceSplitter是分句模型。（）得分阅卷入三、填空题（共13题，每空1分，共20分）1 .自然语言处理的发展历程分别是：19世纪早期、2 .目前的分词方法主要有三种：基于规则的分词方法、以及基于语义的分词方法。3 .命名实体识别分为和基于统计的命名实体识别O4 .的目的在于识别语料中人名、地名、组织机构名等命名实体。5 .根据句法结构的表示形式不同，最常见的句法分析任务可以分为以下三种：、

8、依存句法分析以及深层文法句法分析。6 . LSTM 的三重门分别是：、和 O7 . GRU中有两个门，决定前一状态有多少信息写入到当前候选集上，决定前一时刻的状态信息写入到当前状态中的程度。8 .在Python中，匹配下面生成词典的正确函数是：diet =corpora.（words）9 .从实现上考虑自动文摘所采用的方法可以分为和 O10 .影响聚类算法结果的主要因素有、11 .基于词典的情感分析方法的分类效果取决于 o12 .基于词典的情感分析方法的最大特点是 o13 .聊天机器人按照功能需求来划分，可以分为两种，分别为和 O得分阅卷入四、综合应用题一（5分）请采用了今日头条公开的分类

9、数据作为训练语料库，进行Word2vec 训练。得分阅卷人五、综合应用题二（15分）将以下内容保存为凶文档，并使用TextRank算法对以下内容进行文本摘要。我与父亲不相见已二年余了，我最不能忘记的是他的背影。那年冬天，祖母死了，父亲的差使也交卸了，正是祸不单行的日子，我从北京到徐州，打算跟着父亲奔丧回家。到徐州见着父亲，看见满院狼藉的东西，又想起祖母，不禁簌簌地流下眼泪。父亲说，“事己如此，不必难过，好在天无绝人之路!”回家变卖典质，父亲还了亏空;乂借钱办了丧事。这些日子，家中光景很是惨淡，一半为了丧事，一半为了父亲赋闲。丧事完毕，父亲要到南京谋事，我也要回北京念书，我

10、们便同行。到南京时，有朋友约去游逛，勾留了一日;第二日上午便须渡江到浦口，下午上车北去。父亲因为事忙，本已说定不送我，叫旅馆里一个熟识的茶房陪我同去。他再三嘱咐茶房，甚是仔细。但他终于不放心，怕茶房不妥帖;颇踌躇了一会。其实我那年已二十岁，北京已来往过两三次，是没有甚么要紧的了。他踌躇了一会，终于决定还是自己送我去。我两三回劝他不必去;他只说，“不要紧，他们去不好!我们过了江，进了车站。我买票，他忙着照看行李。行李太多了，得向脚夫行些小费，才可过去。他便又忙着和他们讲价钱。我那时真是聪明过分，总觉他说话不大漂亮，非自己插嘴不可。但他终于讲定了价钱;就送我上车。他给我拣定了靠车门

11、的一张椅子；我将他给我做的紫毛大衣铺好坐位。他嘱我路上小心，夜里警醒些，不要受凉。乂嘱托茶房好好照应我。我心里暗笑他的迂;他们只认得钱，托他们直是白托!而且我这样大年纪的人，难道还不能料理自己么?唉,我现在想想，那时真是太聪明了！我说道，“爸爸，你走吧。”他望车外看了看，说，“我买几个橘子去。你就在此地，不要走动。“我看那边月台的栅栏外有几个卖东西的等着顾客。走到那边月台，须穿过铁道，须跳下去又爬上去。父亲是一个胖子，走过去自然要费事些。我木来耍去的，他不肯，只好让他去。我看见他戴着黑布小帽，穿着黑布大马褂，深青布棉袍，蹒跚地走到铁道边，慢慢探身下去，尚不大难。可是他穿过铁道

12、，要爬上那边月台，就不容易了。他用两手攀着上面，两脚再向上缩;他肥胖的身子向左微倾，显出努力的样子。这时我看见他的背影，我的泪很快地流下来了。我赶紧拭干了泪，怕他看见，也怕别人看见。我再向外看时，他己抱了朱红的橘子望回走了。过铁道时，他先将橘子散放在地上，自己慢慢爬下，再抱起橘子走。到这边时，我赶紧去搀他。他和我走到车上，将橘子一股脑儿放在我的皮大衣上。于是扑扑衣上的泥土，心里很轻松似的，过一会说，“我走了;到那边来信!”我望着他走出去。他走了几步，回过头看见我，说，“进去吧，里边没人。”等他的背影混入来来往往的人里，再找不着了，我便进来坐下，我的眼泪又来了。近几年来，父亲和我

13、都是东奔西走，家中光景是一日不如一日。他少年出外谋生，独力支持，做了许多大事。那知老境却如此颓唐!他触目伤怀，自然情不能自己。情郁于中，自然要发之于外;家庭琐屑便往往触他之怒。他待我渐渐不同往口。但最近两年的不见，他终于忘却我的不好，只是惦记着我，惦记着我的儿子。我北来后，他写了一信给我，信中说道，“我身体平安，惟膀子疼痛利害，举箸提笔，诸多不便，大约大去之期不远矣。“我读到此处，在晶莹的泪光中，又看见那肥胖的，青布棉袍，黑布马褂的背影。唉!我不知何时再能与他相见!得分阅卷人六、综合应用题三（20分）编写Python代码实现垃圾邮件分类。Python文本与语音应用设计期末考试试题

14、B卷答题纸适用班级：人工智能2001/2002专业：人工智能技术服务得分阅卷人一、选择题（单项选择共15题，每题2分，共30分）12131415得分阅卷人二、判断题（对的打J,错的打X,共 1（）题，每题1分，共1。分）123456789.10.得分阅卷人三、填空题（共13题，每空1分，共20分）1011.12.期末考试试题B卷答案适用班级：人工智能2001/2002专业：人工智能技术服务得分阅卷人一、选择题（单项选择共15题，每题2分，共30分）1. C2. D3. C4. D5. D6. D7. C8. D9. C10. D11. B12.CI3.AI4.A15.C得分

15、阅卷人二、判断题（对的打，错的打义，共 10题，每题1分，共1（）分）9.对10.对得分阅卷人二、填空题（共13题，每空1分，共20分）1.20世纪70年代、21世纪2 .基于统计的分词方法3 .基于规则的命名实体识别4 .命名实体识别53 .短语结构句法分析54 遗忘门、输入门、输出门55 重置门更新门56 Dictionary57 抽取式摘要(extractive summarization)生成式摘要(abstractivesummarization)58 .分类准则、特征选取、模式相似性测度59 .情感词典的完整性12 .简单13 .检索式问答型多轮对话型四、综合应用题一（5分）五、综合应用题二（15分）六、综合应用题三（20分）

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

15 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 自然语言处理技术与应用自然语言处理技术与应用试卷及答案试题B卷自然语言处理技术应用试卷答案试题

淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：《自然语言处理技术与应用》试卷及答案试题B卷.docx
链接地址：https://www.taowenge.com/p-93885509.html

《自然语言处理技术与应用》 试卷及答案 试题B卷.docx

《自然语言处理技术与应用》试卷及答案试题B卷.docx