《现代语音学的发展现状及展望精品文稿.ppt》由会员分享,可在线阅读,更多相关《现代语音学的发展现状及展望精品文稿.ppt(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、现代语音学的发展现状及展望第1页,本讲稿共12页 实验语音学(简称“语音学”)是一门借助医学、声学、计算科学、心理学的知识和最先进的设备来揭示和研究语音产生的过程、语音的声学特性和人对于语声感知特性的科学。凡是依靠语音来进行交际的地方,不论是人和人,还是人和机器,都是可以找到语音学的足迹,语音学成为语言科学中最活跃、最贴近应用的一个分支学科。语音学有三个基本的分支:生理语音学生理语音学,声学语音学声学语音学和感知语感知语音学音学第2页,本讲稿共12页语音系统音段韵律元音辅音声调重音语调第3页,本讲稿共12页1,生理语音学(Physiological phonetics):语音的产生首先由肺气流
2、冲击声带使其产生开合振动,带音气流(嗓音、浊音)在声腔(口腔、鼻腔、咽腔)中产生共振,从而发出不同的语音(音素)1.1 声带发音状态及其振动机理的研究:声带振动是产生元音、浊辅音和韵律的决定性条件 1.1.1 利用频闪喉镜来研究声带的振动状态,声带振动周期;1.1.2 声带振动的理论:粘膜肌弹性空气动力学说。根据这 一学说,石坂谦三和Flanagan(1978)提出了双质量模型及 其等效电路.1.1.3 研究意义:语言学意义(元、辅音紧松问题);嗓音 医学;语音技术(语音编码压缩、语音合成、语音转换等)第4页,本讲稿共12页1,生理语音学(Physiological Phonetics):1.
3、2 声腔共鸣研究:1.2.1 发音动作的静态综合研究:普通话发音图谱1963 1.2.2 发音动作的X光电影及其后期图像处理;1.2.3 动态腭位研究;1.2.4 唇形动作研究及普通话视位;1.2.5 声腔形状与共振峰相互关系(言语产生声学理论):第5页,本讲稿共12页2.声学语音学(Acoustic Phonetics)语音表现为一种音频信号,是可感知的信息和计算机语音处理技术的物质基础。2.1 利用语音信号处理设备(Multi-speech,Praat,wavelet Minispeech.)来分析语音的声学特性,元音(单元音、复合元音)、辅音、声调各有自己特定的声学特征,这些特征 都与语
4、音的生理特征紧密相关;2.2 语音声学参数数据库:2.2.1 元音声学参数,声学元音图,生理与声学两者关系图;2.2.2 辅音声学参数;2.2.3 声学参数数据库:第6页,本讲稿共12页3.语音语料库建设 语言资源无论是对于语音应用技术还是基础研究来说都显得越来越重要了,在口语处理中就需要各种各样的库。3.1 语音系统分析需要一个能全面反映该语言语音特点的的语料库;3.2 基于数据驱动的语音合成需要一个大规模的语音库提供合成的所有语音 单元(以句子的形式);感情语料库等;3.3 语音识别、语音翻译需要特定的语料库;3.4 生理研究需要一个生理参数数据库以获得发音参数;3.5 语料库都需要标注(
5、音素和韵律),以便于进行声学和韵律特征分析;因此需要一套音素和韵律标注用的符号系统和平台,(如语言所提出的因此需要一套音素和韵律标注用的符号系统和平台,(如语言所提出的SAMPA-C,C-TOBI音段和韵律标注系统)音段和韵律标注系统)第7页,本讲稿共12页4.当前语音合成技术发展介绍:4.1 共振峰合成器 4.2 波形拼接合成器是当前的主流技术:通过统计方法(HMM)得到的声学参数模型具有良好的领域普适性,并且通过模型生成的语音参数更加平滑,不易发生拼接合成中常见的不连续现象 合成1 角色转换合成 歌唱合成:利用输入的乐谱信息控制合成语音的韵律特征 第8页,本讲稿共12页5.自动发音评估和诊
6、断技术 (Automatic Pronunciation Assessment and Diagnosis)这项语音技术是以语音自动识别语音自动识别(以统计方法作为基本技术)为基础、是计算机辅助语言学习系统和计算机辅助语言测试系统的的重要核心技术。在普通话及普通话作为第二语言的学习诊断系统研究实践中,语音学专家知识及其分析得到的规则已发挥了很大的作用,目的是寻找区分其发音的可量化的特征,利用这些特征构建分类器,完成发音质量自动评估和错误检测。第9页,本讲稿共12页5.1 最近,著名美籍华裔科学家李锦辉博士提出一项完全利用语音声学特征和语音规则系统来作为识别的模板,越来越多的学者也认同这一主张;
7、5.2中国科技大学魏思等人利用容易混淆的音素对的发音错误先验知识来修正后验概率,排除了常见典型错误和易混淆音素,提高了发音质量评估的性能并加强了常见典型错误的检测能力。5.3.S.M.Witt 提到,在语音频谱结构中,母语和非母语主要区别在于F2、F3以上共振峰的不同,在时域上充分利用VOT、GAP的不同作为区别性特征;5.4 Hiller等人在SPELL项目(自动识别)中利用声学语音学特征,其方法是:首先估计元音段的共振峰和基频,归一化处理后,分析得到所发元音在声学元音图上的位置,通过相似度来估计元音发音的准确性;5.5 董斌(中科院声学所)等针对普通话/z/和/zh/组辅音声学特征的不同,采用强頻集中区的能量分布作为区别性特征,对平、翘舌部位进行区分,收到了很好的效果;第10页,本讲稿共12页 语音学研究及其应用方面虽取得了不小进步,但现实显示出我国的语音研究与国际先进水平还存在不小的差距,还不能满足各相关学科的需要。因此要求一大批具有语言学的丰富知识,也要掌握声学、心理学、嗓音科学和计算机科学等相关知识的专门人才,完成一批蜚声国内外、造福人类的研究成果。第11页,本讲稿共12页第12页,本讲稿共12页
限制150内