计算机科学引论课件.ppt
《计算机科学引论课件.ppt》由会员分享,可在线阅读,更多相关《计算机科学引论课件.ppt(49页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、人工智能计算机科学引论2/23/20231Machine Structure智能什么是智能推理、计划、解决问题抽象思维连接复杂观点快速学习、从实践学习人类拥有这些能力但是使用起来很累科学是由懒惰者推动的l?!2/23/20232Machine Structure人工智能人工智能(AI:Artificial Intelligence)制造机器来完成需要使用人类智能的工作什么样的机器才能被认为有智能?图灵测试被测试的有一个人,另一个是声称自己有人类智力的机器。测试时,测试人与被测试人是分开的,测试人只有通过一些装置(如键盘)向被测试人问一些问题,这些问题随便是什么问题都可以。问过一些问题后,如果测
2、试人能够正确地分出谁是人谁是机器,那机器就没有通过图灵测试,如果测试人没有分出谁是机器谁是人,那这个机器就是有人类智能的。2/23/20233Machine Structure人工智能图灵测试全面通过图灵测试提问者可以提出任何问题尚遥遥无期局部通过图灵测试提问者只能提某个领域的问题已有先例lIBM Deep Blue2/23/20234Machine Structure人工智能实现人工智能的必要条件获得并理解人类的感知视、听、触、味、嗅目前可以被输入计算机的:视、听目前可被计算机全面“理解”的:没有!l只可部分理解有时候被叫做“模式识别”(Pattern Recognition)推理传统人工智
3、能技术关注的重点2/23/20235Machine Structure人工智能理解人类的感知理解听觉理解视觉理解自然语言(NL:Natural Language)自然语言是一种特殊的“感知”:视听觉只是其传播方式每一种感知被称作一种“媒体”(media)多媒体处理(Multimedia Processing):综合分析多种媒体的内容来对一个素材的内容进行理解2/23/20236Machine Structure人工智能理解人类的感知多媒体处理“处理”主要指提取其语义内容三维渲染、视频剪辑、声音合成等技术通常不叫做“多媒体处理”l不过仍然可被认为是“多媒体技术”l“多媒体处理”中也会用到一些相关
4、技术多媒体素材数学模型语义多媒体处理各种合成技术2/23/20237Machine Structure多媒体处理理解声音(audio)声音分类噪声(noise)乐音(music)语音(speech)声音识别检测风声、雨声、读书声爆炸声l较少语音识别(Speech Recognition)2/23/20238Machine Structure多媒体处理理解声音时域(time domain)声音信号本来的面目 波形图2/23/20239Machine Structure多媒体处理理解声音频域(frequency domain)声音信号在各个频率的能量分布乐音信号:有明显的谐波谐波:频率是基准频率整
5、数倍的声音分量2/23/202310Machine Structure多媒体处理理解声音频域早期声卡:频率合成FM:Frequency Modulation使用不同的加权权重即可获得不同音色l根据乐器的音色设置权重即可模拟不同乐器的声音振荡器f x 2f x 3音阶f x 4f x n输出2/23/202311Machine Structure多媒体处理理解声音频域白噪声:在整个频率域的强度大致相当2/23/202312Machine Structure多媒体处理理解声音频域语音:3.4KHz以下强度大,以上很快衰减2/23/202313Machine Structure多媒体处理理解声音第一
6、步:把声音信号变换到频域FFT:Fast Fourier transformDFT:Discrete Fourier transform第二步:把频率信息变换成特征倒谱(cepstrum):把频域信息再次进行频率变换lMFCClLPCC实际计算中这两步常常合并成一步2/23/202314Machine Structure多媒体处理理解声音特征(Feature)物理上:可以较好地反映某个特性的物理量数学上:一个矢量(Feature Vector)特征提取(Feature Extraction)从原始信号中计算出所需要的特征一旦原始信号被抽象成特征,对感知的理解问题就成为一个数学问题l把特征矢量转
7、换成语义的数学算法:分类2/23/202315Machine Structure多媒体处理理解声音分类(classification)把特征矢量转换成语义的数学算法l例:语音识别l把MFCC所组成的高维空间分解成不同的部分,每部分代表一个读音。如某个特征矢量落在某部分,则可知道该矢量代表的读音。aoptkey2/23/202316Machine Structure多媒体处理理解声音分类如何获得特征空间的划分方法?机器学习(Machine Learning)l采集一大堆样本,样本与语义的对应关系已知。于是,根据这个对应关系就可以知道特征空间中的某个区域所对应的语义是什么。l例:让100个人说“o
8、”,然后对其声音进行变换,发现其MFCC都落在图中的区域,则可知该区域对应“o”。2/23/202317Machine Structure多媒体处理理解声音机器学习第一步:获得一个训练集(Training Set)l特征矢量和所需要的语义的对应关系第二步:根据训练集训练出对特征空间的划分l模型(Model)第三步:根据所获得模型对新到特征矢量分类2/23/202318Machine Structure多媒体处理理解声音机器学习特征矢量是高维矢量l常用:10-1000维获得训练样本成本很高l必须标注样本和语义的对应关系,只能由人完成训练集在特征空间的分布是非常稀疏的2/23/202319Mach
9、ine Structure多媒体处理理解声音机器学习高级建模算法lSVM:Support Vector MachinelGMM:Gaussian Mixture ModellEM:Expectation MaximumlHMM:Hidden Markov Modell人工神经网络:Neural Networkl矢量量化:Vector Quantizationl不同应用需要不同的建模算法l目前的建模算法仍然不够完善2/23/202320Machine Structure多媒体处理理解图像基本方法:特征提取训练分类常用图像特征l颜色l主要颜色l颜色直方图l纹理lTamura 颜色特征l灰度共生矩阵
10、l形状l傅立叶描述子2/23/202321Machine Structure多媒体处理理解图像基本方法:特征提取训练分类但是:一幅图像中可能有多个语义l百闻不如一见草花树房子2/23/202322Machine Structure多媒体处理理解图像图像分割(segmentation)把图像分割成较小的区域l准则?l语义:尚未获得l特征:如果分割效果很好,则语义已经获得,分割本身已无意义l以特征为准则进行图像分割,其结果只能是特征空间上一致的,不可能是语义上一致的分割还是不分割?2/23/202323Machine Structure多媒体处理理解图像图像分割支持派:一定要分,否则难以提取合适的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机科学 引论 课件
限制150内