人工智能导论教案第7章 自然语言理解.docx
《人工智能导论教案第7章 自然语言理解.docx》由会员分享,可在线阅读,更多相关《人工智能导论教案第7章 自然语言理解.docx(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第7章自然语言理解教案课题自然语言理解课时4知识目标1 .了解自然语言处理的概念及发展历程。2 .熟悉自然语言处理的一般过程及应用。3 .熟悉自然语言理解的方法。4 .了解机器翻译的模式及应用。5 .了解语音识别系统的发展及应用。重点、难点1 .自然语言处理的过程2 .自然语言理解的方法3 .机器翻译的模式课程思政L通过自然语言处理的学习,培养学生不怕困难,勇于攻关,自 强不息的科学精神。2 .通过科大讯飞语音识别领域的科技成果案例,培养学生爱国主 义情怀,增强民族自信心、自豪感。3 .通过自然语言处理系统应用学习,培养学生勇攀科学高峰的 责任感和使命感。教学内容及进程:一、导入案例 美智力竞
2、答节目上演人机对决2011年2月14日,IBM的超级智能计算机“沃森”第一次参加美国王牌 问答节目危险边缘,人机大战真实上演。而这场激战之下暗流汹涌,可能 隐藏着改变人类未来的巨大力量。二、知识讲授7.1 自然语言处理概述自人类文明诞生以来,文字就是人类交流信息、记载历史和传播知识的 基本介质。不仅如此,文字作为人类语言的书写形式,还是人类文化思想和 智能的一种载体。所以,在人工智能研究中,如何让计算机识文断字就是一 个十分重要的课题。7.1.1 什么是自然语言处理自然语言处理简单来说,就是人类语言的机器处理,它研究能实现人与 计算机之间用自然语言进行有效通信的各种理论和方法,1 .自然语言自
3、然语言则是指人类日常使用的语言,包括口语和书面语等。2 .自然语言理解备注播放视频素 材通过危险 边缘,人机 大战案例, 引出自然语 言处理的概 念。简要介绍自 然语言处理 的概念根据自然语言的不同表现形式,自然语言理解可分为口语理解与文字理 解两方面。3.自然语言生成自然语言生成是按照定的语法和语义规则将计算机数据转化为自然语7.1.2 自然语言处理的发展历程自然语言处理的发展大致经历了 4个阶段。1 .萌芽期时期(1956年以前)2 .快速发展期(1957-1970年)3 .低谷发展期(19711993年)4 .繁荣发展时期(1994年至今)7.1.3 自然语言处理的应用自然语言处理可以应
4、用于很多领域,下面讲解几种常见的应用。(1)语音识别(2)机器翻译(3)自动文摘(4)句法分析(5)文本分类(6)信息检索(7)信息获取(8)信息过滤(9)自然语言生成(10)中文自动分词(11)语音合成(12)问答系统7.1.4 自然语言处理的一般过程计算机处理自然语言的一般过程可以概括为:语料获取、语料预处理、 特征工程、模型训练和指标评价。1 .语料获取介绍自然语 言处理的发 展历程通过实例介 绍自然语言 处理的应用1)已有语料。很多业务部门、公司等组织随着业务发展,都会积累大量 的纸质或者电子文本资料。那么,对于这些资料,在允许的条件下稍加整合, 把纸质的文本全部电子化就可以作为语料库
5、了。2)网上下载、抓取语料。如果现在个人手里没有数据怎么办呢?这个时 候,可以选择获取国内外标准开放数据集,比如国内的中文汉语有搜狗语料; 也可以借助八爪鱼等开源爬虫工具,从网上抓取特定数据,准备模型训练。2.语料预处理语料预处理即对输入的数据进行预处理,主要包括以下4个步骤。1)语料清洗2)分词,即将文本分成词语通过实例重 点介绍自然 语言处理的 过程3)词性标注,即给词语标上词类标签,4)去停用词,即去掉对文本特征没有任何贡献作用的字词3 .特征工程做完语料预处理之后,接下来需要考虑如何把分词之后的字和词语表示 成计算机能够计算的类型。词袋模型(Bag Of Word, BOW),即不考虑
6、词语原本在句子中的顺序,直 接将每一个词语或者符号统一放置在一个集合(如list)中,然后按照计数的 方式对出现的次数进行统计。词向量是将字、词语转换成向量矩阵的计算模型。目前常用的词的表示 方法是One-Hot,这种方法把每个词表示为一个很长的向量。4 .模型训|练选择好特征后,需要选择怎样的模型进行训练。5 .模型评价自然语言理解AI中研究历史最长、研究最多、要求最高的领域之是语音和语言处理。 微软创始人比尔盖茨曾经公开表示,“语言理解是人工智能领域皇冠上的明 珠”。但是相较于计算机视觉方面成熟的技术与应用,自然语言处理这颗明珠 的发展却没有那么顺利,因为要让计算机在不同语言、不同场景甚至
7、不同的 语境下理解人类的表达是一件很复杂的事情。7.2.1 自然语言理解的困难实例分析日 然语言理解 的困难造成自然语言理解困难的根本原因是,自然语言文本和对话的各个层次 上广泛存在各种各样的歧义性或多义性(Ambiguity)。1 .词法分析歧义2 .语法分析歧义3 .语义分析歧义4 .指代不明歧义5 .新词识别6 .有瑕疵的或不规范的输入7 .语言行为与计划的差异传统语言理解方法通过前面的讨论,可以认识到语言是非常复杂的。尽管如此,我们依然 希望计算机能够理解它,至少部分理解它。传统语言理解方法以句子分析为基本出发点,通过分析句子中的词法、 句法、语义,实现对一句话的细致拆解。1 .词法分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工智能导论 教案 第7章 自然语言理解 人工智能 导论 自然语言 理解
限制150内