工程硕士学位论文写作范例.docx





《工程硕士学位论文写作范例.docx》由会员分享,可在线阅读,更多相关《工程硕士学位论文写作范例.docx(35页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、工程硕士学位论文写作范例Study on the Pavement Material of Pervious Concrete(申请清华大学工程硕士专业学位论文)培 养 单 位:运算机科学与技术系工程领域:运算机技术申 请 人:李 某指导教师:某某某教 授联合指导教师:某某某高 工二九年三月工程硕士学位论文写作说明李某关于学位论文使用授权的说明本人完全了解清华大学有关保留、使用学位论文的规定,即:清华大学拥有在著作权法规定范畴内学位论文的使用权,其中包括:(1)已获学位的研究生必须按学校规定提交学位论文,学校可以采用影印、缩印或其他复制手段储存研究生上交的学位论文;(2)为教学和科研目的,学校
2、可以将公布的学位论文作为资料在图书馆、资料室等场所供校内师生阅读,或在校园网上供校内师生浏览部分内容。本人保证遵守上述规定。作者签名: 导师签名: 日 期: 日 期: 摘 要摘 要情感是人类智能的重要方面。为建立和谐的人机交互环境,运算机自然需要具有懂得情感和表达情感的能力。本文在声学层次上系统性地研究了情感的区分特点和感知特点,并提出了情感语音的叠加模型。论文的主要成果如下:1. 分析了. ,指出当前存在. 问题。研究了. 特点,提出了一种 算法,并通过. 实现了 。2. 提出了一种基于韵律强度的语音基频猜测算法,. 。3. 设计了一个自学习的特点权值训练算法,提高了. 。4 实现了. 平台
3、,验证了. 的有效性。关键词:关键词1关键词2关键词3关键词4关键词5VIIIAbstractAbstractWith the rapid development of information technology, computer becomes an indispensable tool in our daily life. To make human-computer interaction friendlier, researchers of relevant research fields apply themselves on the development of new hum
4、an-computer interaction technologies. Speech, as the most natural way in human communication, is also in the center of attention. And the HCI (human-computer interface) technologies, which based on speech recognition, speech synthesis, and natural language understanding, have been recognized as the
5、most promising research direction.In recent years, as the development of statistical methods for speech synthesis, large corpus based Text-to-Speech (TTS) system has been able to synthesize high quality speech. But compared with human natural speech, the synthesized speech still has some shortages,
6、especially in prosody expression. In this thesis, speech prosody in Chinese Putonghua is first studied, and a conclusion is made that one problem with current prosody modeling methods is lack of a global-level prosody planning process. It also points out that the prosodic parameters for global-level
7、 prosody planning, such as prosodic strength, is in need. In chapter 2, a new prosodic strength estimation method based on Parallel Encoding and Target Approximation (PENTA) Model is introduced. In this estimation method, prosodic strength is taken as a latent variable in phrase-level prosodic plann
8、ing process, and prosodic strength function, which is a mapping function between acoustic prosodic parameters and prosodic strength, is represented with Neural Network. Based on the correlation between prosodic strength and speech unit target completion degree, prosodic strength functions are traine
9、d automatically with a speech corpus.In chapter 3, an F0 generation method based on prosodic strength is proposed. In this new F0 prediction method, the global prosody planning problem is tackled through adding a global prosodic strength planning process before pitch prediction for speech units. It
10、has been widely accepted that, in human speech communication there is a prosody pre-planning process for each prosodic phrase before articulation, and then syllables are articulated according to their pre-planned prosodic results. In this method, prosodic strength is chosen as the latent variable fo
11、r phrase level prosodic planning, and the prosody planning process is simulated with prosodic strength modeling. So in prosodic prediction, a prosodic strength planning is first done for each prosodic phrase, and then pitch contour of each syllable is predicted based on its assigned prosodic strengt
12、h and its prosodic context information.One difficulty in speech synthesis for embedded platform is how to customize the speech corpus to meet the different requirements from different embedded platforms. On this problem, a self-learning feature weights training algorithm and a speech corpus customiz
13、ation algorithm are proposed in chapter 4. With this method, given the size of target speech corpus, sample numbers of syllable classes will be determined automatically, and the synthesis results of different syllable classes can be made sure to be balanced.Keywords: prosodic strength prosodic model
14、 pitch prediction speech corpus customization HMM目 录目 录第1章 引言11.1 论文背景及意义11.2 国内外研究现状21.2.1 语音合成技术的研究现状21.3 论文主要内容3第2章 汉语韵律分析52.1 汉语的特点分析52.1.1 汉语声调的声学特性52.2 汉语语音的韵律52.2.1 汉语的韵律层级结构72.2.2 汉语重音的韵律分析72.3 韵律分析模型研究现状82.3.1 Stem-ML模型82.3.2 PENTA模型82.4 问题的提出92.5 基于目标靠近(TA)模型的韵律强度(prosodic Strength)运算112.5
15、.1 Target完成程度的估量112.5.2 Prosodic strength函数的定义122.5.3 Prosodic strength的训练122.6 实验及结果分析122.7 小结15第5章 总结与展望17参考文献19致 谢21声 明21附录AXXX23个人简历、在学期间发表的学术论文与研究成果25主要符号对照表主要符号对照表GMM高斯混合模型(Gaussian Mixtures Model)HMM隐含马尔科夫模型(Hidden Markov Model)LPC线性猜测系数(Linear Prediction Coefficients)LPCC线性猜测倒谱系数(Linear Pred
16、iction Cepstral Coefficients)AMCC自适应Mel倒谱系数(Adaptive Mel Cepstral Coefficients)MFCCMel频域倒谱系数(Mel Frequency Cepstral Coefficients)UBM统一背景模型(Universal Background Model)UELS无偏对数频谱估量(Unbiased Estimation of Log Spectrum)TI文本无关(Text-Independent)TD文本相关(Text-Dependent)ASI自动说话人辨识(Automatic Speaker Identifica
17、tion)ASV自动说话人确认(Automatic Speaker Verification)VQ矢量量化(Vector Quantization)FAR错误接受率(False Acceptance Rate)FRR错误拒绝率(False Rejection Rate)GMM高斯混合模型(Gaussian Mixtures Model)HMM隐含马尔科夫模型(Hidden Markov Model)LPC线性猜测系数(Linear Prediction Coefficients)LPCC线性猜测倒谱系数(Linear Prediction Cepstral Coefficients)AMCC自
18、适应Mel倒谱系数(Adaptive Mel Cepstral Coefficients)MFCCMel频域倒谱系数(Mel Frequency Cepstral Coefficients)UBM统一背景模型(Universal Background Model)UELS无偏对数频谱估量(Unbiased Estimation of Log Spectrum)TI文本无关(Text-Independent)TD文本相关(Text-Dependent)ASI自动说话人辨识(Automatic Speaker Identification)ASV自动说话人确认(Automatic Speaker
19、Verification)VQ矢量量化(Vector Quantization)FAR错误接受率(False Acceptance Rate)FRR错误拒绝率(False Rejection Rate)第1章 引言第1章 引言1.1 论文背景及意义文本所研究的语音合成(TTS)是利用运算机将输入的文本信息,按照自然语言的发音规则转换成语音输出,即使运算机具有“读”的功能的一项技术。一个语音合成系统,要实现高质量的语音合成,第一需要对所要合成的文本信息有很好的懂得,这主要涉及到自然语言懂得的问题;要使合成的语音符合人的说话的韵律形式,就需要人的自然语音的韵律变化状态及字音转换方面的知识;最后要完
20、成以上所有信息到具体合成语音的声学实现,主要涉及到语音信号处理等方面。总之语音合成系统本身涉及声学、语言学、数字信号处理、多媒体技术等多个领域,是中文信息处理领域的一项前沿技术。 脚注实际的语音合成过程一样是将输入的文字序列转换成音韵序列,再由语音合成器生成语音波形。整个过程一样第一步为文本分析处理,即按照语义、语法等规则对文本进行分词和标注,并将文字序列转换成字的音节序列;第二步为韵律分析猜测,即根据语境、韵律规则和韵律模型,为每个音节或词组调整韵律参数,将音节序列转换成音韵序列。第三步语音声学合成,主要利用信号处理技术,按要求合成出符合上两步猜测结构的高质量的语音流。因此,语音合成系统在结
21、构上通常可分为文本分析处理、韵律处理和声学处理三大模块,如图1.1所示。其中在文本分析处理模块主要模拟人对自然语言的懂得过程,对输入的文本进行分析并给出后两个模块所需的各种发音提示,具体内容可划分为正则化、分词与词性标注、韵律结构猜测、字音转换等几个部分。其中正则化部分主要负责将自然文本中存在在非汉字字符转换为汉字字符,比如数字格式的日期等。由于汉语的文本中词与词之间没有自然的分界,而自然语音中的韵律的节奏和文本中的词的边界有很大的关系,因此分词也是文本分析的重要任务之一。然后就是字音转换部分,主要负责将输入的文字序列转变为音节的序列。韵律处理模块的主要功能是为合成语音规划出音段特点,如音高、
22、时长和音强等,使合成语音能正确表达语意,听起来更加自然。因此,它是合成语音音质好坏的关键。韵律处理模块将根据语调、重音和节奏,对每个发音单元进行韵律调整,调整后的输出是包含“韵律信息”的音韵序列。声学处理模块利用音韵序列中的相应参数,从语音数据库中选取合适的语音基元拼接成句,再经过韵律修饰,就可以输出自然连续的语音流。作为人机交互的核心技术之一,语音合成技术一直是语音研究的重要领域,而且近年在技术和应用方面都取得了很大的发展。随着电子运算机的运算和储备能力的迅猛发展,语音合成技术由早期的基于规则的参数合成,到基于小样本的拼接调整合成,并逐步发展为基于大语料库的拼接合成,到现在流行的基于隐马尔科
23、夫模型HMM的语音合成。与此同时,合成语音的自然度和音质都得到了明显的改善,基本可以实现人们的应用需求,从而促进了其在实际系统中的应用。目前,语音合成技术己经在自动应答呼叫中心(包括金融、电信和政府等)、电话信息查询(包括天气、交通和旅行等)、汽车导航以及电子邮件阅读等方面得到广泛的应用,同时针对娱乐和教育方面的应用也正在开展。总而言之,语音合成技术正在影响着现代社会的方方面面。1.2 国内外研究现状1.2.1 语音合成技术的研究现状1.2.1.1 三级节标题语音合成技术根据语音生成的方法大致可分为四种:发音参数合成方法,基于声道模型参数合成方法,拼接合成方法和基于统计模型的参数合成方法。其中
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 工程硕士 学位 论文 写作 范例

限制150内