欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    《自然语言处理技术与应用》 试卷及答案 试题B卷.docx

    • 资源ID:93885509       资源大小:24.97KB        全文页数:10页
    • 资源格式: DOCX        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    《自然语言处理技术与应用》 试卷及答案 试题B卷.docx

    期末考试试题B卷(开卷)适用班级:人工智能2001/2002专业:人工智能技术服务 考试时长:120分钟得分阅卷入一、选择题(单项选择共15题,每题2分,共3() 分)1.自然语言处理的发展大致分为3个阶段:(),20世纪70年 代和21世纪。A. 19世纪晚期B. 19世纪中期C. 19世纪早期D.20世纪50年代2.以下哪个不属于文件对象的方法?()A. file.read(size)B. file.write(str)C. file.readline()D. file.close()3.为了保证无论是否出错都能正确地关闭文件,可以使用()来实现。A. breakB. for循环语句C. tryfinallyD. if.else4.目前的分词方法主要有三种:基于规则的分词方法、基于统计的 分词方法以及()。A.基于语法的分词方法B.基于语种的分词方法C.基于语言的分词方法D.基于语义的分词方法5.采用jicba搜索引擎模式对“南京市长江大桥”进行分词,得到的结果 为()A.南京、市长江大桥B.南京市7长江大桥C.南京/南京市/京市/市长/长江/长江大桥/大桥D.南京/京市/南京市/长江/大桥/ K江大桥6.词性标注的正确与否会直接影响到之后的()、语义分析是中文 自然语言处理的基础之一。A.词法分析B.语言分析C.句子分析D.句法分析7 .关于Stanford parser下面说法不正确的是:()A. Stanford parser的底层是由Java实现的,因此需要确保安装JDK。B. Stanford parser的Python封装是在NEFK库中实现的,因此,需 要安装NLTK库。C. NETK是一款Python的自然语言处理工具,但主要针对中文。D. Stanford parser至于概率统计进行句法分析。8 .RNN的应用场景不包括()。A.生成图像描述B.语音识别C.视频标记D.自动拍照9 .当处理序列问题发现,当前时刻的输出既与前面时刻输入有关,又与未来时 刻输出有关,应选择哪个模型更为合适()A.CNNB. RNNC.双向LSTMD. GMM10 .关于one-hot编码说法不正确的是()。A. one-hot编码是一位有效编码B.每个状态都有自己独立的寄存器位C.随着语料库词语的增加,词向量的维度高且稀疏D.计算词与词之间的相似性11 .基于主题模型方法使用的算法是()。A. TF-IDF 算法B. LDA算法C. TextRank 算法D. KNN算法12. TF-IDF算法中使用哪个函数对数据集进行分词,去停用词().A. posB. corpus_pathC. preprocessD. idCdic13 .根据代码确定fit_prior:为True的含义()。class sklearn.naive_bayes.MultinominalNB(alpha= 1.0, fit_prior=True, class_prior=None)A.不去学习类别先验概率B.训练模型C.追加训练模型D.用模型进行预测14 .基于词典的情感分析方法的最大特点是()。A.简单B.方便C.复杂D.快速15 .自然语言理解的简称是什么?()。10.6A.NLPB.ANNC. NLUD. APL得分阅卷入二、判断题(对的打 ,错的打'X',共10 题,每题1分,共10分)1 .句法分析的主要任务是:识别出句子所包含的句法成分,以及这 些成分之间的关系。()1.1. jieba分词工具提供了词性标注功能。jieba分词是结合规则和统 计的方式,也就是说同时使用词典匹配和 HMM o()3. Stanford parser 的底层是由 python 实现的。()4. re.match尝试从字符串的起始位置匹配一个模式,如果起始位置 匹配不成功的话,就返回noneo()5. re.match尝试从字符串的起始位置匹配一个模式,如果起始位置匹 配不成功的话,就返回noneo()6 .自然语言处理(Natural Language Processing, NLP)是计算机科学领域以及大数据领域的一个重要的研究方向。()7 .基于语义的分词方法通常包括三个部分:分词子系统、句法语义子 系统、总控部分。()8 .条:牛随机场(CRF)也是一种基于马尔科夫思想的统计模型。之前的模型都假设每个状态均只与它前面的状态有关。()9 .命名实体识别(NER)的目的在于识别语料中人名、地名、组织 机构名等命名实体。()10 .LTP的主要模型中SentenceSplitter是分句模型。()得分 阅卷入 三、填空题(共13题,每空1分,共20分)1 .自然语言处理的发展历程分别是:19世纪早期、2 .目前的分词方法主要有三种:基于规则的分词方法、以 及基于语义的分词方法。3 .命名实体识别分为 和基于统计的命名实体识别O4 .的目的在于识别语料中人名、地名、组织机构名等 命名实体。5 .根据句法结构的表示形式不同,最常见的句法分析任务可 以分为以下三种:、依存句法分析以及深层文法句法分析。6 . LSTM 的三重门分别是:、和 O7 . GRU中有两个门,决定前一状态有多少信息写入到 当前候选集上,决定前一时刻的状态信息写入到当前状态中的程度。8 .在Python中,匹配下面生成词典的正确函数是:diet =corpora.(words)9 .从实现上考虑自动文摘所采用的方法可以分为和 O10 .影响聚类算法结果的主要因素有、11 .基于词典的情感分析方法的分类效果取决于 o12 .基于词典的情感分析方法的最大特点是 o13 .聊天机器人按照功能需求来划分,可以分为两种,分别为 和 O得分阅卷入四、综合应用题一(5分)请采用了今日头条公开的分类数据作为训练语料库,进行Word2vec 训练。得分 阅卷人 五、综合应用题二(15分) 将以下内容保存为 凶 文档,并使用TextRank算法对以下内容进行文本摘要。我与父亲不相见已二年余了,我最不能忘记的是他的背影。那年 冬天,祖母死了,父亲的差使也交卸了,正是祸不单行的日子,我从 北京到徐州,打算跟着父亲奔丧回家。到徐州见着父亲,看见满院狼 藉的东西,又想起祖母,不禁簌簌地流下眼泪。父亲说,“事己如此, 不必难过,好在天无绝人之路!”回家变卖典质,父亲还了亏空;乂借钱办了丧事。这些日子,家中 光景很是惨淡,一半为了丧事,一半为了父亲赋闲。丧事完毕,父亲 要到南京谋事,我也要回北京念书,我们便同行。到南京时,有朋友约去游逛,勾留了一日;第二日上午便须渡江到 浦口,下午上车北去。父亲因为事忙,本已说定不送我,叫旅馆里一 个熟识的茶房陪我同去。他再三嘱咐茶房,甚是仔细。但他终于不放 心,怕茶房不妥帖;颇踌躇了一会。其实我那年已二十岁,北京已来往 过两三次,是没有甚么要紧的了。他踌躇了一会,终于决定还是自己 送我去。我两三回劝他不必去;他只说,“不要紧,他们去不好!我们过了江,进了车站。我买票,他忙着照看行李。行李太多了, 得向脚夫行些小费,才可过去。他便又忙着和他们讲价钱。我那时真 是聪明过分,总觉他说话不大漂亮,非自己插嘴不可。但他终于讲定 了价钱;就送我上车。他给我拣定了靠车门的一张椅子;我将他给我做 的紫毛大衣铺好坐位。他嘱我路上小心,夜里警醒些,不要受凉。乂 嘱托茶房好好照应我。我心里暗笑他的迂;他们只认得钱,托他们直是 白托!而且我这样大年纪的人,难道还不能料理自己么?唉,我现在想想, 那时真是太聪明了!我说道,“爸爸,你走吧。”他望车外看了看,说,“我买几个橘子 去。你就在此地,不要走动。“我看那边月台的栅栏外有几个卖东西的 等着顾客。走到那边月台,须穿过铁道,须跳下去又爬上去。父亲是 一个胖子,走过去自然要费事些。我木来耍去的,他不肯,只好让他 去。我看见他戴着黑布小帽,穿着黑布大马褂,深青布棉袍,蹒跚地 走到铁道边,慢慢探身下去,尚不大难。可是他穿过铁道,要爬上那 边月台,就不容易了。他用两手攀着上面,两脚再向上缩;他肥胖的身子向左微倾,显出努力的样子。这时我看见他的背影,我的泪很快地 流下来了。我赶紧拭干了泪,怕他看见,也怕别人看见。我再向外看时,他 己抱了朱红的橘子望回走了。过铁道时,他先将橘子散放在地上,自 己慢慢爬下,再抱起橘子走。到这边时,我赶紧去搀他。他和我走到 车上,将橘子一股脑儿放在我的皮大衣上。于是扑扑衣上的泥土,心 里很轻松似的,过一会说,“我走了;到那边来信!”我望着他走出去。他 走了几步,回过头看见我,说,“进去吧,里边没人。”等他的背影混 入来来往往的人里,再找不着了,我便进来坐下,我的眼泪又来了。近几年来,父亲和我都是东奔西走,家中光景是一日不如一日。 他少年出外谋生,独力支持,做了许多大事。那知老境却如此颓唐!他 触目伤怀,自然情不能自己。情郁于中,自然要发之于外;家庭琐屑便 往往触他之怒。他待我渐渐不同往口。但最近两年的不见,他终于忘 却我的不好,只是惦记着我,惦记着我的儿子。我北来后,他写了一 信给我,信中说道,“我身体平安,惟膀子疼痛利害,举箸提笔,诸多 不便,大约大去之期不远矣。“我读到此处,在晶莹的泪光中,又看见 那肥胖的,青布棉袍,黑布马褂的背影。唉!我不知何时再能与他相见!得分阅卷人六、综合应用题三(20分)编写Python代码实现垃圾邮件分类。Python文本与语音应用设计期末考试试题B卷答题纸适用班级:人工智能2001/2002专业:人工智能技术服务 得分 阅卷人 一、选择题(单项选择共15题,每题2分,共30分)12131415得分 阅卷人 二、判断题(对的打'J',错的打'X',共 1()题,每题1分,共1。分)123456789.10.得分 阅卷人 三、填空题(共13题,每空1分,共20分)1011.12.期末考试试题B卷答案适用班级:人工智能2001/2002专业:人工智能技术服务 得分 阅卷人 一、选择题(单项选择共15题,每题2分,共30分)1. C2. D3. C4. D5. D6. D7. C8. D9. C10. D11. B12.CI3.AI4.A15.C得分 阅卷人 二、判断题(对的打',错的打'义',共 10题,每题1分,共1()分)9.对10.对得分阅卷人 二、填空题(共13题,每空1分,共20分)1.20世纪70年代、21世纪2 .基于统计的分词方法3 .基于规则的命名实体识别4 .命名实体识别53 .短语结构句法分析54 遗忘门、输入门、输出门55 重置门更新门56 Dictionary57 抽取式摘要(extractive summarization)生成式摘要(abstractivesummarization)58 .分类准则、特征选取、模式相似性测度59 .情感词典的完整性12 .简单13 .检索式问答型多轮对话型四、综合应用题一(5分)五、综合应用题二(15分)六、综合应用题三(20分)

    注意事项

    本文(《自然语言处理技术与应用》 试卷及答案 试题B卷.docx)为本站会员(太**)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开