RBF在电信资费市场建模及计算智能决策支持系统中的运用.pdf
《RBF在电信资费市场建模及计算智能决策支持系统中的运用.pdf》由会员分享,可在线阅读,更多相关《RBF在电信资费市场建模及计算智能决策支持系统中的运用.pdf(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 http:/ RBF 在电信资费市场建模在电信资费市场建模 及计算智能决策支持系统中的运用及计算智能决策支持系统中的运用 王海丰1,曹长修2,赵敏3 重庆大学自动化学院自动化研究所(400044)E-mail: 摘摘 要:要:采用以最近邻聚类为学习算法的 RBF 径向基神经网络,对 ARPU 值变化进行建模。以每个区县实际的 ARPU 的数据为训练数据,并对模型的预测结果进行精度分析,结果显示此方法具有很高的准确性。并在文中还详细介绍了电信数据的获取和处理的方法。关键词:关键词:ARPU;RBF 网络;最近邻聚类;建模;智能决策 1引言 1引言 我国固定电话经历了前一时期的快速增长之后,固定
2、电话网规模在世界上的排名,从1985 年的 17 位上升到 1997 年的第二位,一直保持至今。2000 年固定电话用户已达到 1.44亿户,规模居世界第二位。我国的电话普及率也由 1978 年的 0.38 部/百人上升到 2000 年的20.1部/百人。2000年底,城市电话普及率达到39部/百人,其中北京1998年就达到80.16部/百人,上海为 73.97 部/百人。但这种快速的增长是建立在粗放经营的基础之上的。电话资费是消费者最为敏感的问题,随着大城市电话市场的饱和以及加入 WTO 后电信市场的集约化经营已刻不容缓,建立电信资费的数学模型,给消费者提供个性化的多种选择,是电信集约化发展
3、的重要任务。而电信运营商在推行各种个性化服务、追求利润最大化、成本最小化的时候最关心的就是ARPU(Average Revenue Per User)即平均每户每年收入。运营商在财务预算与投资预算时,ARPU 值成为决策者的首要参考对象。所以对 ARPU 值的预测在智能决策中起着很重要的作用。一些文章在对 ARPU 值进行预测的时候,采用回归分析,都属于内部数据挖掘。其结果预测精度不高。本文采用最近邻聚类学习算法的径向基函数神经网络(RBF)对 ARPU 预测。经过对结果的精度分析,此方法得到满意的结果。2.RBF 神经网络结构 2.RBF 神经网络结构 径向基函数神经网络(RBFNN)以其诸
4、多优点而广泛应用于模式识别、函数逼近、信号处理、系统建模和控制领域。RBF 网络源于高维空间的多变量函数的插值理论,网络由输入、隐含和输出 3 层组成,它的突出特点是隐含神经元的输出函数被定义为具有径向对称的基函数(径向基函数),而基函数的中心向量被定义为网络输入层到隐层的连接权向量。1 http:/ 这个特点使得隐层对输入样本有一个聚类的作用,其中,中心向量为类均值,它的个数代表聚类的类数。RBF 神经网络结构如图 1 所示,它实现了如下 图1 RBF 网络结构 Fig.1 Structure of RBF y=w0+1(|)niiwGuc=i式中,uRn:是输入向量;G()是从R+R的一个
5、非线性函数;CiRn(1iN)为RBF中心;wi(1iN)为连接权值;w0为偏置量;N为隐含层的神经元数;|欧氏范数。RBF 网络的性能密切依赖于给定中心,线性参数的RBF展开是在G()与中心矢量ci 固定的前提下得到的,典型的G()为高斯函数:G()=exp(-v2/a2),其中a为形状参数,可取实常数,也可以根据样本自适应地变化。本文选用高斯函数作为网络的激活函数,RBF 基函数中心的确定采用最近邻聚类学习算法。下面就针对实际问题探讨如何确定RBF 网络结构,并应用于电信资费市场建模及计算智能决策支持系统中的ARPU值的预测。3.数据预处理 3.数据预处理 31 数据清理与集成 31 数据
6、清理与集成 从电信提取的原始数据是“脏”数据,其中有些噪声、不正确的数据。并且不同的数据来自不同的系统或者数据文件。因此需要对他们处理使之成为可用的数据集。具体做法:利用spss软件,将12个月份的用户数据安电话号码汇总,去处1、9开头的电话号码。只统计连续12个月均有数据的电话号码。统计时按区县分开进行。获得各个区县的电话总数,每个电话号码12个月的消费总额,以及城镇拥有的电话总数。并从统计局获得各个区县的每个年度的社会经济指标。32 数据变换(规范化)32 数据变换(规范化)为了提高 RBF 的性能,要保证输入数据在一个较小的区间,如0,1.数据变化的方法有最小-最大规范化、Z-score
7、 规范法和小数定标规范化等。本文采用最小-最大规范化的方 2 http:/ 法。对连续的数据的数值变量,假定minA和maxA分别为属性A的最小和最大值,要将属性A映射到0,1区间,则计算公式如下:minmaxminAAAVV=4RBF 训练算法 4RBF 训练算法 神经网络的最大优点就在于对一些复杂的系统不需要知道其内部机理,只要确定输入输出向量,就可以构造一个网络结构来模拟这个系统,所以要构造网络结构首先要确定网络的输入输出变量。而影响 ARPU 值的因数很多,本文提取重要的几个内部数据和外部数据作为RBF 的输入数据。内部数据:用户总数,城镇拥有的电话总数。外部数据:人均年收入,农民年纯
8、收入,移动电话总数,地方财政总支出。单输出 y 为一年度的 ARPU 值。最近邻聚类学习算法的特点在于:隐单元的个数不需要事先确定,它可以在训练过程中自动调节;而且只需一次迭代即可产生一定精度的拟合结果,训练速度较快。其具体步骤如下:(1)选择高斯函数宽度r=0.05,定义一个矢量A(i)用于存放属于各类的输出矢量之和,个计数器B(i)用于统计属于各类的样本个数,其中i为类别数。(2)从第一个数据对(x1,y1)开始,在x1上建立一个聚类中心,令c1=x1,A(1)=y1,B(1)=1。这样建立的RBF网络,只有一个隐含单元,该隐单元的中心为c1,该隐单元到输出层的权矢量为w1=A(1)/B(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- RBF 电信 资费 市场 建模 计算 智能 决策 支持系统 中的 运用
限制150内