基于AP算法的流行音乐标准化的研究与分类_数学建模论文(20页).doc
《基于AP算法的流行音乐标准化的研究与分类_数学建模论文(20页).doc》由会员分享,可在线阅读,更多相关《基于AP算法的流行音乐标准化的研究与分类_数学建模论文(20页).doc(20页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、-基于AP算法的流行音乐标准化的研究与分类_数学建模论文-第 19 页第六届“认证杯”数学中国数学建模网络挑战赛承 诺 书我们仔细阅读了第六届“认证杯”数学中国数学建模网络挑战赛的竞赛规则。我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。
2、我们允许数学中国网站()公布论文,以供网友之间学习交流,数学中国网站以非商业目的的论文交流不需要提前取得我们的同意。我们的参赛队号为:参赛队员 (签名) :队员1: 队员2:队员3: 参赛队教练员 (签名): 参赛队伍组别:第六届“认证杯”数学中国数学建模网络挑战赛编 号 专 用 页参赛队伍的参赛队号:(请各个参赛队提前填写好):竞赛统一编号(由竞赛组委会送至评委团前编号):竞赛评阅编号(由竞赛评委团评阅前进行编号):2013年第六届“认证杯”数学中国数学建模网络挑战赛题 目 基于AP算法的流行音乐标准化的研究与分类 关 键 词 特征向量提取;AP聚类算法;流行音乐 摘 要:据网站音乐库,结合
3、matlab软件提取样本音乐的相关数据。本文采用了特征向量提取法和AP聚类法等方法,对流行音乐风格划分问题进行了探究,成功地解决了音乐风格划分的问题,并建立了可以划分不同风格音乐的一系列模型。针对题中首要问题,我们引入流行音乐传统划分模型,并对可能影响到音乐风格划分的所有因素进行了客观分析。进而以音频作为划分不同音乐风格的主要因素,参考因素为:音乐的起源地、演奏者的派别等。根据音乐的音频特征结合物理学原理,我们认为音频特性可作为不同风格音乐划分的标准:由于音乐风格是一个模糊的概念,人们对音乐的分类往往带着主观因素。文中首先对音频文件中音频数据的特征向量进行提取,证明了传统音乐风格划分的模糊性。
4、其次,根据N个数据点之间的相似度,提出运用AP聚类法对音频数据进行聚类,对音乐的风格进行更进一步的描述,并建立以下模型: 利用本文模型,对“酷狗音乐”中热度较高的100首歌曲样本进行分类处理,得到理想类群A、B、C、D、E,为避免概念混淆,将各类群定义为对应的歌曲风格,并进一步对模型进行了优化。最后在模型检验中,通过典型数据的收集与模型验证,论证了对当前音乐的分类以及分类的标准是科学的。随着时代的不断进步,人们的价值观和文化观也在与时俱进。在预测中,采用第二个问题设计的算法以及分类标准,对互联网数据进行分析、量化,我们得出这样的结果:A、B、C三种风格的音乐占有广大的市场,其中以A风格的音乐占
5、有的市场最广,达到音乐市场总额的34%。参赛密码 (由组委会填写)参赛队号: 所选题目: 题AbstractTo explore pop music style classification,this paper is succeeded in solving the problem by adopting the feature vector extraction method and AP clustering algorithm and so on, and established a series of models that can be divided into music sty
6、les.For the first question, we analyzed all factors that will be likely to affect music style classification. Then the main factor is music audio, reference factors: music origin, the players faction and so on. Therefore, we believe that: an audio can only track and describe a song. So, we think tha
7、t the audio is the standard of different styles of music classification.Because the style of music is a fuzzy concept, people often have subjective emotion on classification of music. Firstly, analysis of traditional music division model proves that fuzzy music style. Secondly, we use AP clustering
8、algorithm to provide a further description for music classification, putting forward the method to different styles of music. The model is: By established own partition method for current music. Finally, to test the model to proved that our classification and classification standard is scientific.Wi
9、th the progress of the era, peoples values and culture are also advancing with the times. Therefore, we can only predict a short-term pop music market. In the forecast we used algorithm and classification standard designed in the second issue. After analyzing Internet data, we concluded the results:
10、 A, B, C these three kinds of music occupy a vast market. A style occupies the largest music market, reaching 34% of the total market.Key Words: Feature vector extracted; AP clustering algorithm; Popular music 一、 问题重述随着互联网的发展,流行音乐的主要传播媒介从传统的电台和唱片逐渐过渡到网络下载和网络电台等。网络电台需要根据收听者的已知喜好,自动推荐并播放音乐。由于每个人喜好的音乐可
11、能横跨若干种风格,区别甚大,需要分别对待。这就需要探讨如何区分音乐风格的问题。在流行音乐中,传统的风格概念包括Pop(流行)、Country(乡村)、Jazz(爵士)、Rock(摇滚)、R&B(节奏布鲁斯)、New Age(新世纪)等若干大类,它们分别可以细分成许多小类,有些小类甚至可以做更进一步的细分。而每首歌曲只能靠人工赋予风格标签。这样的做法有许多不足:有的类别之间关系不清楚,造成混乱;有的类别过度粗略或精细;有的类别标签没有得到公认;有的音乐归属则存在争议或者难以划归。根据以上描述,我们将如下问题进行探讨并解决:(1)以什么标准来区分音乐风格;(2)如何建立自然、合理的数学模型对流行音
12、乐进行分类;(3)对流行音乐市场进行分析以及基于流行音乐的大众审美观的研究。二、 问题分析目前,音乐风格的划分还没有一个定性的标准。人们对不同风格音乐进行分类主要是根据这种音乐的主旋律、这种音乐的起源地以及演奏这种音乐的音乐家派别这些因素。其中,我们认为音乐文件中的音频为音乐风格分类的主要因素,而音乐的起源地及演奏这种音乐的音乐家等为参考因素。一般的,我们可以根据某类音乐的起源地、弹奏这种音乐的音乐家这些参考因素,对不同风格的音乐进行粗略的分类。文中首先对其传统模型进行了建立与分析,像美国音乐家杰克逊一般演奏的音乐,我们可以将它划为Rock(摇滚),印第安州新起的音乐一般为Country(乡村
13、)。但是如果要对音乐风格进行细致的划分,我们就要根据这种音乐的主旋律来判定这种音乐的风格。对音乐的风格进行判定,我们引入音频。我们可以根据音频的不同,进行音乐风格的分类。对音频的描述,引入了特征向量提取法,我们的预期是通过特征向量的可视化,验证不同风格的音乐现有分类的合理性。但是,通过我们对实验图像2进行分析,特征向量提取图像显示出传统模型的不足。就此认为将音乐分为传统的6种风格是一种不合理的音乐划分标准。进而运用AP算法对实验数据进行聚类,提出一种自然地、合理地音乐划分标准。对于这个标准,我们用其他样品语音特征元素进行检验。最后进行模型分析。由于社会发展迅速,时代对人们的世界观和文化观影响很
14、大,所以流行音乐市场波动比较大。由此我们为了尽量的避免预测中出现的为题,我们将对流行音乐市场做一个短期的预测,而且题目中没有给出明确的数据,因此我们只能采用互联网数据并根据第二个问题中所得到的结论,进行市场预测和对人们价值观的评估。 综上,针对题中的问题,解决流程如下图所示: 图1 解决问题的流程图Fig. 1 the problem solving process diagram三、 模型假设1、 每首歌曲都有自身独特音频特征。 2、 互联网上所引用数据真实可靠。3、 一定量的样品音乐特征可以代表这一类音乐的总体特征。4、 在一个短中期时段内,人们对流行音乐的喜好没有大的波动。四、 符号说明
15、符号符号含义音频特征和歌曲特征之间的关联音频特征歌曲特征存放音乐内别的集合符号符号意义集合S中所有元素的事件短时平均能量帧能量帧能量比窗口长度每一帧的长度欧式距离对象半径Minpts核心对象D对象集五、 模型建立和求解5.1问题一音乐的不同风格不仅反映在其演奏者的派别和其产生的地域之上,而且还反映在歌曲不同的主旋律之上。虽然我们可以根据演奏者的派别、音乐的起源地对一些音乐进行风格的分类。但是这种分类的方法是不科学的。因此,对音乐进行不同风格的分类,我们主要的参考因素是音频。对于任何一种声音,我们将它用:音高、音长、强弱和音色这四种特征进行描述。因此,我们同样用这四种特征对音乐进行描述。我们将这
16、四种特征统称为:音频。音频是一个专业术语,人类能够听到的所有的声音都可以称为音频,它也可能包括噪音、录制的声音等各种人耳能听到的声音【1】。不管是歌曲还是其他任何一种声音,它们都有其唯一的特征音频。由此我们可以这样认为:一种音频对应一种声音。那么,我们就可以这样定义:一种音频它所对应的歌曲是唯一确定的,它们之间是具有一一对应的关系。用公式(1)表示如下:所以我们得出这样的结论:我们对音乐进行分类的标准是以音频特征进行不同风格音乐的分类。当然,为保证音乐风格分类的正确率,我们也可以将歌曲的起源地以及歌手派别作为音乐分类的参考因素。5.2问题二模型建立: 我们根据题目中音乐的不同风格的分类建立相应
17、的模型。然后对建立的模型进行论证。我们建立的模型其表达式如下:且各种风格的音乐何集合S緎之间满足如下关系: 根据以上建立的模型对题目中的分类方法进行分析评估。 5.2.1 音频分析 要进行不同风格音乐的分类,根据所建立的模型,我们首先要对音频进行分析。那么我们先假设一段音频信号流采样后的离散音频信号为:所以,连续信号中得到了个采样数据,其中是时刻得到的数据,在相对较短的时间内处理的时候,假设将这个数据分成组,那么每一组就是一个帧,每个帧包含个采样点,如果从每一组帧的个采样点可以提取特征点,最后得到 个特征点,就构成了音频数据流的特征,这些特征被用来进行音频数据流的分割,识别。由于这些特征点反映
18、在短时间内的平均能量不同,所以音乐在不同的时间段将出现平缓、高潮等不同的部分。其反映在函数上可以表示为: 5.2.2 音频信息 据前文定义:音频是不同风格音乐的分类标准。因此,我们采用时域分析法建立、和音频之间的关系,用和对音乐的音频特征进行描述。其函数表达式为: 5.2.3 音乐特征片段的提取每一种风格的音乐基本上可以看作是由平缓部分、高潮部分等部分构成,而往往决定这种音乐风格的是音乐的高潮部分。所以,我们采用和对音乐的高潮部分进行描述,描述对象可以看作是高潮部分出现的时间、次数以及强度等方面。因此特征的提取工作实际上可以看作为一个分类的过程:将每一个帧进行分类,将高潮部分和相对激烈的帧提取
19、出来作为特征向量【2】。我们将音乐归化为一系列的帧,对每一个帧运用公式计算帧能量。然后可以根据如下公式:计算得到静音阀值,并依据阀值对帧能量进行噪声过滤,得到剩下的声音片段是音乐原声。然后通过(6)式计算帧能量比,帧能量比较大的帧即可判断为特征片段的端点,而端点之间的帧可作为特征片段【3】。5.2.4.实验数据及图表分析我们很据模型中相应的算法编写特征提取函数,其返回值是各个端点之间的平均值和方差。在MATLAB实验模拟中,我们对每一种不同风格的音乐选取首歌曲为样本歌曲(歌曲清单见附录1)。在实验中采用的音频文件均是采样速率为44.1KHz,PCM编码标准为Wave文件。各个音频均取20秒作为
20、样本。利用MATLAB作出6种不同风格歌曲的特征向量分布图(matlab源码见附录2.1):图2 特征向量分布图Fig.2 the distribution of feature vector由上图可知明显的看到以下几点:1 各种不同风格音乐的区别之处主要表现在:其高潮段落之间的间隔大小、距离方差不相同。2 不同风格音乐的高潮出现时间也是不相同的。像Rock(摇滚乐)、Jazz(爵士乐)在其音乐一开始就表现为高潮部分并且出现高潮的部分比较集中。而像New Age(新世纪)、Country(乡村)音乐其高潮部分一般出现的时间比较晚,而且出现高潮的部分比较分散。3 不同风格的音乐在其音乐风格上截然
21、不同。但是,反映在MATLAB处理图像上,不同风格的音乐在其散点图上具有很大的相似度。像Jazz(爵士乐)和Country(乡村乐),虽然它们的风格截然不同,但它们的散点图却有很大的相似之处。4 Rock(摇滚乐)、Pop(流行音乐)和Jazz(爵士乐)它们的音频之间具有很大的相似。因此,它们的音频特征的散点分布图像具有一个共同的特点:高潮段落之间间隔较小并且距离方差较小,有明显的聚簇现象。5 我们可以明确的看出New Age(新世纪)和其他风格的音乐有明显的不同,所以,我们可以认为New Age(新世纪)风格的音乐最容易进行分类处理。图3 各样本特征向量分布对比图Fig.3 the bala
22、nce of the sample feature vector distribution由图3可以明确的看出,不同风格的音乐在其特征向量分布图像上有着明显的聚簇现象。由于,各种不同风格音乐的特征向量都具有很多的相似之处,故我们可以根据特征向量对不同风格的音乐进行划分。结论:题中将音乐划分为Pop(流行)、Country(乡村)、Jazz(爵士)、Rock(摇滚)、R&B(节奏布鲁斯)、New Age(新世纪)这6种风格的音乐是不科学的。针对这一不科学分类,我们利用AP聚类算法对音乐的风格进行重新的划分。5.3 AP算法的引入1.AP算法中的一些常用定义exemplar:聚类中心。simila
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 AP 算法 流行音乐 标准化 研究 分类 数学 建模 论文 20
限制150内