《数学模型对金融分析的优化及应用(1).docx》由会员分享,可在线阅读,更多相关《数学模型对金融分析的优化及应用(1).docx(28页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数学模型在金融分析中的应用及优化摘要:经济数学模型目前的应用主要用于量化交易市场,现代经济学日益朝着用数学表达经济内容和统计定量的方向发展,沿着这个方向,数学分析被用来解释经济增长、周期波动和经济资源重新分配等各种复杂的经济过程,在过去的50年中,经济学家们编制各类经济关系的数学模型,借助这些经济数学模型,人们开始对以前只能用一些模糊不清的概念来描绘的经济现象进行定量的说明,。本文首先介绍了数学模型和金融分析的基本概念,已经目前应用和发展的现状。其次,本文以“拍照赚钱”方案为例,研究了数学模型和数学工具在金融决策中的应用。本文分析了已经完成和未完成的“拍照赚钱”方案的定价策略和定价方案,指出了
2、定价规律和失败的原因。最后,基于之前的分析,本文利用建立的定价模型,提出了定价优化的方案。关键词:经济数学模型,金融分析,拍照赚钱,定价优化目 录第1章 绪 论11.1研究的背景和研究的意义11.1.1研究的背景11.1.2研究的意义21.2国内外发展及研究现状31.3研究方法4第二章 数学模型与金融分析的概述42.1数学模型概述42.1.1数学模型的概念42.1.2金融分析中数学模型的类别52.2金融分析概述62.2.1金融分析的概念62.2.2金融分析的特征62.3数学模型与金融分析的关系6第三章 数学模型在金融应用中的现状73.1数学模型催生了量化交易的发展73.2数学模型对金融风险管理
3、的应用83.3数学模型对函数的应用83.4数学模型对金融线性回归分析的应用8第四章 数学模型在金融应用中应用-基于“拍照赚钱”行业的兴起的案例分析94.1“拍照赚钱”项目介绍94.2描述性统计94.3项目分析方案的选择原因94.4模型假设与分析104.4.1“拍照赚钱”任务定价规律模型和任务完成率归一化模型104.4.2“拍照赚钱”的现状和特点154.4.3“拍照赚钱”任务定价规律模型的建立与求解15 4.5实证分析15 4.6任务未完成的原因15第五章 建立优化定价方案155.1定价规律及无法完成的原因155.2设计新的方案比较17 5.2.1优化方法185.2.2优化后的结果185.3预测
4、“拍照赚钱”模型19第六章 总结19附录20第一章 绪 论1.1研究的背景和研究的意义1.1.1研究的背景现代经济学日益朝着用数学表达经济内容和统计定量的方向发展,沿着这个方向,数学分析被用来解释经济增长、周期波动和经济资源重新分配等各种复杂的经济过程,在过去的50年中,经济学家们编制各类经济关系的数学模型,借助这些经济数学模型,人们开始对以前只能用一些模糊不清的概念来描绘的经济现象进行定量的说明,还产生了由于把数成功地应用于经济学而获得诺贝尔经济学奖的经济学家:拉格纳弗里希、简丁伯根、保罗A萨谬尔逊、西蒙库斯涅茨,他们无一例外地是将数学方法应用于经济科学的成功典范,如今,数学家们、经济学家们
5、和务实的企业家们及政治家们也正沿着经济一数学这条路线而达到了较好的相互了解,总之,经济科学和数学方法日益紧密地结合使计划方式显著改进,而且还在开拓着新的应用领域,创造出新的研究成果。模型可以拥有很多分类,如:生物数学分析模型,气象数学教学模型,经济发展数学模型,本文将著重论述经济学数学模型中数学模型对经济学中金融分析方面的优化与应用。1.1.2研究的意义 经济数学模型是指或相互制约的作用,数学抽象的语言描述和操作规则和经济变量之间的因果关系一(数学方程式的功能或符号表示)。它具有严密的逻辑推导能力,可以通过输入信息基础研究数据然后学生进行运算得出求解,准确地测定经济管理系统中各要素间的数量价格
6、等依存关系以及社会发展的目标公司可能。一般分为三类:(1)计量经济学模型.它综合考虑多种因素,描述中国经济管理系统中经济环境变量间复杂的可能关系,用于结构设计分析;预测企业未来时期GDP的发展;分析评价各种市场经济国家政策可能的影响。计量模型是不同的,它属于属于概率模型。(2) 投入和产出模型。它主要反映出、分析出与计量经济管理系统各部分(地区、部门、产品等)间的制衡关系,以生产的工艺或者信息技术发展联系我们作为一个基础,研究中国经济社会系统的内部控制结构,通过对最终实现产品和中间产品、总产品关系的分析,揭示经济进行系统各部分效用生产中的连锁关系,从而能够达到协调其中包括各种市场经济文化活动的
7、目的。(3)优化规划模型。它研究了确定的目标,如何最好地在各种使用有限的资源下,从而达到效益最好的结果,评估其对择优的程序,政策和其他措施的选择方案。 那么我们用经济学数学模型来阐述其对金融分析的应用及优化具有为更科学发展人类物质文明提供新的想法。1.2国内外发展及研究现状现在国内在金融领域,经济数学模型主要运用于量化交易以及任务定价。 数学模型便是侧面运用大数据的思维,大数据进行思维主要是通过一种强调其数据相关性,更多的采用其统计分析以及概率论去实现网络模型的,而大数据管理思维原始社会形态也并不是最近才有,不过是过去数据量太少,这种教学方法并不能广泛的使其应用,而计算机科学技术企业出现问题之
8、后,其带来的信息化革命,以及学生获得相关数据的成本降低了很多,使得这些数据的代表性和完备性成为一个可能,所以对于现在人们已经开始重视大数据思维了。特别是对于中国金融服务领域,目前也存在一些数据统计分析模型与机理模型之争,究竟谁更好用我觉得这些都是分析当前的环境和资源,如从形式,非结构化数据的内容,难以利用大数据分析技术来预测自己的规则的角度数据的需要,但我们发现应该因果逻辑关系模型法(如科学量化对冲模型),则可以使用数据的量小,反复测试分析所获取的许多有用的结论之后。在过去的50年中,经济学家们编制各类经济关系的数学模型,借助这些经济数学模型,人们开始对以前只能用一些模糊不清的概念来描绘的经济
9、现象进行定量的说明,事实证明,这样做是成功的,正是这条经济研究路线,产生了数理经济学和经济计量学,还产生了由于把数成功地应用于经济学而获得诺贝尔经济学奖的经济学家:拉格纳弗里希、简丁伯根、保罗A萨谬尔逊、西蒙库斯涅茨,他们无一例外地是将数学方法应用于经济科学的成功典范,如今,数学家们、经济学家们和务实的企业家们及政治家们也正沿着经济一数学这条路线而达到了较好的相互了解,总之,经济科学和数学方法日益紧密地结合使计划方式显著改进,而且还在开拓着新的应用领域,创造出新的研究成果。1.3研究方法 本文中拟采用的研究分析方法有三种,通过比较分析法、资料收集法和实证分析法相结合的研究方式来开展此次的研究内
10、容。比较分析法:本文通过比较世界各国发展金融系统对数学模型的应用,比较国内的不足与欠缺,来阐述国内金融市场应该优化的的道路。资料收集法:通过收集国内企业的项目数据的数学模型,来阐述数学模型对金融优化的大作用提供参考。实证分析法:本文通过对某项目因为数学模型的应用不足事实而导致一系列亏损问题,运用实证分析法分析其具体原因,归纳出经验和教训,为我国发展数学模型对金融的优化得出实践方法。第二章 数学模型与金融分析的概述 2.1数学模型概述2.1.1数学模型的概念数学学习模型(MathematicalModel)是一门新学科,是近些年经济发展结合起来的学科,是实际生活问题与数学教学理论研究相结合的一门
11、基础学科。在此基础上,利用数学概念和理论方法进行深入的分析和研究,从定性或定量的角度分析实际问题,为解决更多的实际问题提供准确的数据或可靠的指导。数学模型就是运用数理逻辑的分析方法和数学的分析语言建构的工程模型或科学。2.1.2金融分析中数学模型的类别经济研究和数学模型是在一些分析经济关系的重要工具。它是经济发展理论以及社会经济现实中间的一个重要环节。它的经济理论与经济现实已经被简化的指导下进行的,但在逼近的主要方面性质的条款,反映了经济现实,它是抽象关系的经济现实。它能通过作用于学生明确了思路、验证了理论、加工了信息、计算中求解、分析的作用。对量大面的广的、错综复杂、相互联系的数量经济关系进
12、行分析和研究,不能离开经济数学模型作为工具的帮助。在应用和分析模型时,把模型进行计算从而可以得出的结论与模型以外获得的数据管理信息技术相结合,作出一个重要的判断。用于评估所述模型的优劣正常条件应是均匀的拟合优度的实用度,也不可以被偏置。随着客观经济情况与变化,模型很是需要不断更新以及修改。经济数学模型是利用特定的系统方法,它是把重点放在经济单量不会反映,并且在每个点的描述是在经济关系和共同行动的数量。一个模型那就是一个信息系统。复杂的金融市场分析企业往往不是少数几个模型就能反映的,所以发展需要通过建立的是比较完整的模型理论体系。故而金融分析中仅有两个原因分析:其一为类似于项目定价金融数学模型,
13、其二为类似于量化交易分析金融数学模型。分别为微观层面宏观化处理,以及宏观层面微观量化处理。在经济数学模型的领域,按照经济数量的关系,一般分为三种:经济计量模型、投入产出模型、最优规划模型 。按模型的用途,还可分为经济结构进行分析研究模型、预测模型、政策模型、计划管理模型。这些问题分类互有联系,有时还可结合发展起来可以进行研究考察,如动态非线性模型、随机动态管理模型等等。2.2金融分析概述2.2.1金融分析的概念一般来说,金融是指从流通,流通,回收和贷款,存款和提取存款,外汇交易和其他经济活动撤回财政和货币的问题。金融(FINANCE或FINAUNCE)就是对现在我们已经有的企业资源管理进行研究
14、重新整合分析之后,实现经济利润和价值的等效流通。金融跨期最优分配决策是一般人的资源来开展不确定环境的行为。金融分析就一般就是寻找最优决策的分析与方式需要运用诸多的经济学术的方式来分析额定的金融目标,如:证券投资学就能分析证券投资,以及保险学,金融分析学等学术,范围奇广,涉猎类型繁多。需要专业的金融分析师。特许金融分析师(CFA)是证券公司投资与管理界的一种社会职业技术资格称号,在投资金融界被誉为“金领阶层“在美国企业以及其他欧洲是进入互联网金融服务行业的入场券,但是在目前我国经济真正拿到CFA的持有量少之又少。我国金融分析师目前仅有人力资源和中国某社会保障部门就业培训技术与指导中心,2013年
15、开展CETTIC金融分析师培训项目证书,主要针对全国金融行业从业人员的一份职业培训证书.2.2.2金融分析的特征简单的说,通过分析来判断金融商品的未来的前景。如股票 期货伦敦金等要分析他的未来走势,银行 地产 保险 国债 也要分析他未来的价值。金融分析需要运用诸多经济学术来分析额定金融目标,如:证券投资学分析证券投资,保险学,金融分析学等学术,范围奇广,涉猎类型繁多。2.3数学模型与金融分析的关系分析金融问题时,经济数学模型是金融分析的最有力工具,金融分析是经济数学模型的价值体现。两者相辅相成,换换相扣。在金融分析股票债券等金融产品的时候,需要运用数学模型降低金融风险,并且使其利益最大化。而经
16、济数学模型也算是为金融分析而存在的。第三章 数学模型在金融应用中的现状3.1.数学模型催生了量化交易的发展定量分析投资与传统进行定性投资从本质上来说是一个相同的,二者都基于中国市场非有效或弱有效的理论知识基础。两者之间最大的区别就是数量化投资管理是“定量定性思维”,而是强调了数据的重要性。量化进行交易则具有通过以下几方面的特点:纪律性。根据模型运行到决策的结果,而不是根据一个人的感觉。纪律性既可以克服自己人性中贪婪、恐惧和侥幸心理等弱点,又能有效克服我们人类的认知存在偏差。系统的。表现为“三多”。一个多层次,有三个层次对应的模型:大类资产配置,行业选择和特定资产选择;两个多角度,量化的投资核心
17、思想是宏观周期,市场结构,估值,成长性,盈利质量,分析师盈利预测,市场情绪等;三个多数据,是指对海量数据的精准处理.套利进行思想。定量分析投资企业通过学生全面、系统性的扫描捕捉信息错误定价、错误估值带来的机会,从而可以发现估值洼地,并且能够通过市场买入低估的资产、卖出高估的资产而获利。3.2数学模型对金融风险管理的应用数学学习模型有着相对完整的思维模式与逻辑结构,配合数学教育方面的大量知识,进而通过分析我国金融中的应用研究问题。在金融领域普遍应用的数学模型是很大的。金融服务领域主要包括了金融市场运行成本控制管理、金融企业风险信息管理、金融收益管理等几部分,投资者可以进行研究金融资产投资项目管理
18、时,要合理分析我国金融资源管理领域中各部分间的联系,明确各部分之间的利害关系,从而达到降低金融投资管理的风险性保障投资者的金融收益的效果。例如,为了降低金融投资风险,实现个人财务管理的科学分配,金融投资者将采用应用数学中的结构模型来建立金融投资管理的最佳目标,同时结合当前股票投资市场的市场,确定金融投资管理的最佳形式,从而确定金融股票投资管理的稳定投资方向。除此之外,建立一个数学学习模型在金融企业管理领域中的应用也非常广泛,具体体现在金融风险投资项目管理中不同进行管理金融理财的收益应用。数学模型不仅可以判断原发性和继发性的财务管理,同时也实现金融规划发展的现代结构。3.3数学模型对函数的应用函
19、数进行知识是数学学习知识中的重要组成部分,函数知识本身而言结构管理体系庞大,数据产业结构设计分析影响作用明确,目标准确性更强。在金融领域的功能应用率也很高,如果你要分析的自变量和因变量之间的关系,只要在相关的数据金融界变量的变化之间一定的比例关系,将能进一步完善金融许多变量之间的管理差异。运用函数模型在推进我国经济金融企业管理系统数据技术分析的合理性和准确性方面以及实现中国金融投资风险在一定程度都起到了一个重要的作用。此外,功能知识还包括衍生功能的部分,通过应用衍生功能可以使金融投资的最佳价值更加明确,实现金融基金运营管理结构的科学规划,从而为加强我国金融管理的稳定分析提供强有力的理论支持和具
20、体保障。 3.4数学模型对金融线性回归分析的应用线性回归结果分析是数学学习知识在金融服务领域中最为常用的形式之一。线性回归分析是数据分析和图像分析结合在一起,所以能够提供在金融部门的财务管理更加直观和强大的视觉参考。通过分析线性回归中相关数据的变化情况,直接将金融数据的波动在坐标轴上通过描点来表示,这样就能提高金融投资管理系统应用分析的准确性和直观性特征。例如:线性回归分析在某种财务分析的债券投资时,根据相关的财务管理的设置,操作和投资的规模设置键的条件管理这种债券,投资趋势运行,运行等投资进行多种相关因素的分析,以确定不同的数据集之间的关联,则确定这种投资键的操作。线性回归分析是一种较为直观
21、的分析模型。线性回归分析所需要的数据由于涉及到数据的精确化分析,由于线性回归分析所需的数据涉及对数据的准确分析,为金融领域的运营管理提供了更准确、更细致的管理依据,因此线性回归模型是促进我国财务管理模型科学发展的重要模型。第四章 数学模型在金融应用中应用-基于“拍照赚钱”行业的兴起的案例分析4.1“拍照赚钱”项目介绍“照片赚钱”是一个自我服务模式的移动互联网。用户可以下载APP,注册企业成为APP的会员,然后从APP上领取我们需要进行拍照的任务(比如上超市去检查通过某种社会商品的上架情况),赚取APP对任务所标定的酬金。在此基础上的自助服务众包平台的移动互联网,提供各种业务检查和信息收集,相比
22、市场研究调查的传统方式可以大大降低成本,有效地保证了调查数据的真实性,缩短调查周期。因此APP成为该平台进行运行的核心,而APP中的任务就是定价问题又是其核心技术要素。如果定价不合理,一些任务就会被忽视,导致商检失败。本文的分析目的有两个:分析已经完成项目的定价规律和任务未完成的原因第二,根据分析的定价规律,制定优化的定价方案。4.2描述性统计 表1是一个已结束部分项目的任务的数据描述统计,包含了每个工作任务的位置、定价和完成学习情况(“1”表示自己完成,“0”表示未完成); 所得数据中拥有已结束的项目中835个任务的经度和纬度位置,任务标价以及任务执行情况。在地图上找到了具体任务的位置。主要
23、分布在广东省深圳市,广州市,东莞市,清远市,惠州市这些比较发达的城市,故“拍照赚钱”任务发布较多,所给的酬金也比其他地区高。 按任务执行情况我们能把这835个任务分为完成和未完成两部分,其中完成的任务有521个,未完成314个,问题一要研究任务定价规律,可用分类后的的任务标价数字入手,故需对应统计量的分析入手。 首先,描述性统计分析,可得到最直观的数据规律,均值,总和,中位数可描述任务定价的数据集中趋势,方差,标准差,极值可描述定价的离散程度,而偏度和峰度可用来描述数据的总体分布形态,可知道双方差距,从而直接能观察出是不是服从正态分布,我们得到两类任务标价所对应的各统计量结果(见表1),两者频
24、率分布直方图(见表1)。表1 主要变量的描述性统计N平均值标准平均值误差中位数标准偏差方差偏度峰度极差最小值最大值平均值95%下限值置信区间已完成52269.820.210968.8334.818231.5182.320658567.5268.34未完成31367.9280.207168.2823.6647131.9654.420658569.4170.23由表1可知,已完成的任务标价均值,中位数均高于未完成任务的,说明表价高的完成率也比较高。由图1可看出量数据都有极端值。4.3项目分析方案的选择原因问题一要求根据附件一的具体数据,研究项目任务定价规律。因此,本文根据附件一的相关数据。从两方面
25、对问题进行考虑:第一、GPS经纬度位置数据,采用相关性分析,判断经纬度是否都与任务定价有关,如果有关,则可以据此建立线性回归模型,进行显著性检验,得出经度和纬度与任务定价的具体关系;第二、项目任务完成率,本文将任务价格划分区间,对不同区间任务执行情况的数据进行统计,计算不同定价区间的任务完成率,分析任务完成率与定价的关系。4.4模型假设与分析如果针对问题一,我们需要研究其原始数据的任务定价规律,我们必须也只能对原始数据作出如下假设:符号约定符号符号说明pp值r样本观测的相关系数c任务价格b隶属度归一化n会员领取任务数首先,用相关性、分析回归分析和归一化的方法建立“赚钱拍照”任务定价模型和任务完
26、成率模型,然后运用动态聚类分析、归一化和回归分析,建立任务定价预测模型。4.4.1 “拍照赚钱”任务定价规律模型和任务完成率归一化模型本文根据问题一的要求与所得数据,首先对经度,纬度,任务定价进行相关性分析,排除与任务定价无关的因素,从而确定任务定价线性回归模型;其次,对任务执行情况进行统计,找出任务完成率与任务定价之间的相关关系,进而得出任务定价的规律;最后,根据任务定价线性回归模型与任务定价的规律,找出任务未完成的原因。 4.4.2“拍照赚钱”的现状和特点据不完全信息统计,截止至2016年,中国发展移动通过互联网企业用户管理规模经济已经可以达到9亿,有近400个网站,APP总数达到300万
27、个,微信公众进行账号总数已经不能超过1000万个,而其中,超过60以上的网页都会有图片教学内容,可见版权图片以及市场的庞大,图片交易的需求不断增大,因此“拍照赚钱”也应运而生。市场的传统画面,最专业摄影师和设计师,专注于拍摄技巧和设计感的图像提供的图片,图片的应用往往局限于广告,设计和出版。而随着中国移动通过互联网信息时代的带来,新媒体、传媒有限公司、APP等公司对图片的需求暴增,对图片的要求则更侧重于生活场景化、生活化,手机进行拍照有了用武之地。与此同时,普及和手机的不断优化相机功能的智能手机,对于普通百姓图片制作的参与提供了充分的条件。因此,自新闻、视频等内容从专业技术制造企业走向一个用户
28、可以制造后,图片进行生产发展主力的变更可以说毫无悬念,这也就是意味着,在不久的将来,越来越多用户能在版权使用图片以及交易的蓝海中分一杯羹1。为了清楚的展示任务分布状况,将附件一中的任务经度与纬度两个数据批量导入地图软件地图慧地图2,可得下图1。图1 “拍照赚钱”任务地区分布图由图1可见,任务主要分布在主要经济发达的沿海地区广州,深圳,佛山,以及部分郊区,由于这些经济发达地区信息普及更广,所以照片需求更广。现在分布在这些区域拍照任务各式各样,诸如:道路任务,区域任务,随手拍照,高价专题,还有悬赏等等,通过这种拍照方式,可以得到更多具体的信息,为人们的生活提供更多便利,除此,人们通过日常随手拍照,
29、还可以赚钱,所以,“拍照”任务得到人们喜爱和推广。 4.4.3“拍照赚钱”任务定价规律模型的建立与求解(1)任务三个因素之间的相关性分析由于在问题一数据中出现了三个变量,分别是:任务经度、任务纬度与任务定价,为了解三个变量之间的相互关系,对经度,纬度和任务定价进行相关性分析,验证三个变量间相关关系。对于学生来自多元总体的数据,除了进行分析企业各个分量的取值特点外,更重要的是分析以及各个分量之间的相关法律关系,从不同的人口数据,除了分析每个变量的值的特性,但更重要的是分析的变量之间的相关性,这是多变量数据的相关性分析。设是二元总体,其样本进行数据基本上是来自一元总体X,而在中国实际发展情况中,许
30、多企业数据可以来自多元数据的总体,即来自总体,即来自总体,从中取得观测样本。其样本观测矩阵为样本观测矩阵为记 (1)则称为二元观测样本的均值向量。记 (2) (3) (4)则称为变量X的观测样本的方差,称为变量Y的观测样本的方差,称为变量X,Y的观测样本的协方差。称为观测样本的协方差矩阵。称 (5)为样本观测的相关系数3。因此对附件一给出的数据进行相关性分析,采用R软件的cor()函数计算相关矩阵,如表1所示。表1 纬度、经度与任务定价的相关系数表变量y1.000000000.120464301.00000000y0.120464301.00000000其中,表示纬度,表示经度,表示任务定价。
31、由表1可明显看到任务定价与纬度、经度的相关性系数分别为0.12046430、。由于纬度的相关性系数在区间之内,且相关系数约为0.12,表明纬度与任务定价具有正相关性;然而经度的相关性系数在区间之间,且相关系数仅为,表明经度与任务定价呈负相关,且相关性非常弱,几乎不相关。(2)任务定价线性回归模型为准确了解经度、纬度与任务定价之间的关系,我们对三个因素进行回归分析。在线性回归分析中,一般把变量分成为两类,一类是自变量X,可以使用表示,另一类是因变量Y。若是的一组观测值,则多元线性回归模型可以表示为: (6)其中和是未知参数,p2,称模型(6)为多元线性回归方程。根据数据,使用R软件的回归分析lm
32、()函数对经度、纬度与任务定价进行线性回归分析,可得方程 (7)通过线性回归发现经度和纬度的显著性检验结果分别为p1=0.597860.05,p2=0.002090.05,表示纬度回归系数较为显著,而经度的回归系数不显著,因此采用线性回归模型中的step()函数进行逐步回归,得到方程 (8)其中,。表明:所有数据都是显著的,根据线性回归方程可以得出结论:任务定价与经度并没有关系,与纬度有显著关系。(3)任务完成率模型除了考虑任务经度与纬度位置因素以外,还需进一步考虑任务完成率对定价的影响。本文根据附件一的数据,将定价划分为4个区间,并定义任务完成率归一化的公式 (9)其中:分别表示,的任务完成
33、率。通过上式(9),可以得到完成率归一化数据,如表2所示。表2 4个区间不同任务价格完成情况价格区间任务数任务完成数任务完成率完成率归一化51027654.12%18.88%20715474.40%25.95%785975.64%26.39%403382.50%28.78%根据表格2看出,任务定价区间为,的任务完成情况分别为25.95%,26.39%,28.78%,说明完成情况较好;但区间的任务完成情况仅为18.88%,说明完成情况较差;任务定价处于和两个区间的归一化任务完成率分别为28.78%和26.39%,完成率较高;以外,处于这两个定价区间的任务数量较少,仅占总任务数的14%。为了更直观
34、地看出完成百分比,使用Excel软件,画出饼状图,如图4所示。图4 任务完成率饼状图在图4任务完成率归一化饼状图,蓝色部分表示区间,橙色部分表示区间,灰色部分表示区间可以清楚看到,黄色部分表示区间,可见,完成率低的任务,定价也较低。4.5实证分析根据线性回归方程与任务完成率饼状图,可以总结“拍照赚钱”任务定价的规律有以下三条:(1)通过线性回归,得到线性回归方程(8),在进行逐步回归后得到,纬度显著性检验结果,表明“拍照赚钱”任务的定价和任务位置的纬度有显著关系;而任务位置的经度显著性检验结果显著,表明经度与任务定价几乎没有相关性。(2)通过表3得到,价格区间的任务完成率归一化结果的仅为18.
35、88%,但价格区间的任务完成率归一化结果高达28.78%,所以,可以明显看出,任务完成率低的任务,定价反而越高。(3)分析表3数据发现,在价格区间为里任务个数最多,占了总任务数量的大部分,但在价格区间内,任务数量仅占14%,可以明显得出:任务数量越多的拍照任务,其价格越低。4.6任务未完成的原因根据以上三条定价规律,可以总结得到:“拍照赚钱”的定价规律并不十分合理,不合理的价格影响任务的执行情况,所以任务未完成的主要影响原因有以下两点:任务定价不合理。对表3数据进行统计,88%的未完成任务的数量主要聚集在低价格区间。所以定价过低,是任务未完成的主要原因。(2)定价低的任务数量过多。根据表3可以
36、看出,定价区间低的任务数量占总任务数量的60%,当任务定价不占优势,且任务数量过多时,也会导致任务无法全部完成。因此,根据任务定价的规律和任务未完成的主要原因,本文将针对“拍照赚钱”任务定价不合理情况,建立优化的任务定价模型。第五章 建立优化定价方案5.1定价规律及无法完成的原因针对问题1,本文建立“拍照赚钱”任务定价规律模型与任务完成率模型。首先,根据表1的相关数据,对项目经度,纬度与任务定价进行相关性分析,得到任务定价与经度相关性较弱;其次,为得到较好的任务定价规律模型,对GPS的经纬度与任务定价进行回归分析,进而进行逐步回归分析,得到较理想的线性回归方程;再次,根据任务完成与未完成情况进
37、行数据统计,得到任务完成率模型,从而得到任务定价规律:(1)任务定价与任务位置的纬度有关。(2)任务数量越多,定价越低。最后,根据任务定价规律以及任务完成率模型,未完成任务的主要原因:定价不合理,最低定价过低。研究项目任务定价规律。因此,从两方面对问题进行考虑:第一、GPS经纬度位置数据,采用相关性分析,判断经纬度是否都与任务定价有关,如果有关,则可以据此建立线性回归模型,进行显著性检验,得出经度和纬度与任务定价的具体关系;第二、项目任务完成率,本文将任务价格划分区间,对不同区间任务执行情况的数据进行统计,计算不同定价区间的任务完成率,分析任务完成率与定价的关系。5.2 设计新的方案并比较针对
38、问题2,本文建立“拍照赚钱”任务定价预测模型。首先,根据数据,使用动态聚类法对任务定价进行分析,将任务定价划分为10个定价区间,统计任务定价区间的任务完成率,并进行任务完成率归一化处理,可知:当处于较低价格区间时,任务完成率较低;其次,针对定价较低的价格区间进行分析,使用价格区间均值,计算并调整价格梯度,得到新的定价方案;最后,根据数据的经纬度数据,建立任务定价与GPS经纬度之间的广义线性回归模型,将新方案得到的价格代入回归模型之中,从而得出任务完成率,并与原方案进行对比,得到结论:新方案下,任务完成概率明显提高,任务的完成情况更好。对数据进行分析,见问题一中存在不足,现根据数据重新对任务进行
39、定价,优化定价方案。首先对各项数据进行广义的线性回归,把经纬度、价格以及执行情况进行回归分析得出它们之间的关系,然后再对执行情况进行研究分析,计算完成率,最后对完成率进行归一化处理,看各个价格区间所占的比率。根据三者之间的关系和完成率情况得出新的定价方案。新的定价方案考虑到了两个因素,比问题一的定价模型更综合考虑,结果更可靠。5.2.1优化方法由于附件一中的任务定价有一定的区间与类别,为了更准确地划分原项目的定价区间和找到定价不合理的价格区间,对附件一中给出的835个任务的价格进行聚类分析。系统聚类法在一次形成类以后我们不能通过改变,这就要求进行一次分类分得比较准确,对分类管理方法研究提出具有
40、较高要求,相应的计算量自然也比较大,如:Q型系统聚类法,聚类的过程是在样本间距离矩阵的基础上进行,当样本容量很大时,需要占据足够大的计算机内存,而且在并类过程中,需要将每类样本和其他样本间的距离逐一加以比较,以决定应合并的类别,需要较长时间,所以对于大样本问题,Q型系统聚类分析可能会有因为计算机内存或者计算时间限制而无法进行计算,这给应用带来了一定的不便,基于这种情况,产生了动态聚类法。动态聚类又称为逐步聚类法,其基本理论思想是,开始先粗略地分一下类,然后可以按照某种最优设计原则进行修改不合理的分类,直至类分得比较科学合理为止,这样就形成提供一个企业最终的分类研究结果:这种方法具有计算量较少,
41、占计算机内容较少和方法简单的有点3。本文通过R软件,使用k-means()函数对任务定价进行动态聚类分类,根据聚类后的结果,把所有任务价格数据分成了十类,并使用(9)式进行归一化处理,将相同一类的数据按照数值大小排序得到一个价格区间,把不同定价区间的相关数据进行统计,如表3所示。表3 价格区间分类价格区间任务数任务完成率归一化结果类别3188.76%第一类1019.31%第二类5314.06%第三类3811.21%第四类10714.26%第五类6912.60%第六类2412.57%第七类8512.74%第八类1312.29%第九类2715.77%第十类从表中发现,价格区间为和任务完成效果较差,
42、任务完成率归一化百分比分别仅为8.76%,9.31%;价格区间为,的任务完成效果较好,任务完成率归一化百分比分别为14.06%,14.26%,15.77%;价格区间,的任务完成率均大于10%,完成效果比较理想。由表3可知,和两个区间的价格任务完成率归一化百分比在8%10%之间,处于十个,定价区间最低价格,为了分析其主要原因,使用Matlab软件的plot()函数画出不同区间的任务数,如图5所示。图5 不同价格区间任务数分布其中,横坐标表示不同的价格区间,纵坐标表示任务个数,深蓝色部分表示区间的任务数量,绿色表示区间的任务数量,浅蓝色表示区间的任务数量。由图5可知,大部分“赚钱拍照”任务数量的定
43、价处于和两个区间内,同时由表3可以知,这两个区间的任务数量之和最多,且区间的任务数高于其他区间的任务数量,然而任务完成率归一化后,百分比却最小。因此,这两个区间的定价明显不合理,从而导致任务不能顺利完成。5.2.2优化后的结果由图5 不同价格之间的分布情况和表3 价格区间相关数据得出;和两个区间的定价处于定价区间的定价较低区间,任务定价过低,不被会员所接受,所以导致任务不能顺利完成。因此,将针对定价不合理的和区间,重新制定合理的价格区间。使用Excel软件,通过计算各区间的长度,从而计算区间均值,可得以下公式 (10)根据上式(10),可计算出原十个定价区间价格均值为0.65,表示了不同价格区
44、间不同梯度的平均情况,为了将最低价格合理提高,重新制定合理价格区间较低假设将价格区间的梯度的平均情况提高,将原价格区间和的梯度提高为1,得到新的定价区间,将不变的原定价区间和调整后的新定价整理,得到新的定价区间,如表4所示。表4 新方案价格区间序号价格区间序号价格区间162738495将表4与表3进行比较,可以发现:任务最低定价由原来的65变为66,10个定价区间变为9个定价区间,这样,可以避免任务定价过低,导致部分任务无法顺利完成的情况。为了对新定价方案与旧方案进行比较,使用定价预测模型进行研究与讨论。5.3预测“拍照赚钱”模型广义线性回归模型(GLM)是常见正态线性关系模型的直接推广,它可
45、以更加适用于连续数据和离散数据,尤其是对于后者,如属性信息数据,技术研究数据。广义线性模型要求响应变量只依赖于线性形式的自变量,从而保持了线性自变量的思想,对线性回归模型进行了两个重要方面的推广:首先,通过设置连接功能,具有所述期望的线性参数关联的响应变量;第二,对误差的分布给出这样一个系统误差函数。推广线性模型可用于许多一般性问题。在线性回归中,模型的目标是将响应变量作为p个自变量的函数建立模型。在某些回归问题上,响应向量是分类的,经常是成功,或者失败,对于这些问题,正态线性模型显然是不合适的,这种发展情况下,可用logistic回归。依据题目,对于响应变量任务定价Y有p个自变量(或成为解释变量),记为,所以在p个自变量的作用下出现成功的概率可以记为:p=pY=1|,那么logsitic回归模型为 , (11) 其中称为常数项或截距,称为logistic的模型回归系数。从上式可以看出,logistic的非线性回归模型,自变量可以是连续变量,也可以是分类变量或者是哑变量(Dummy Variable)。对自变量任意取值,在时,式(11)的比值在0到1之间变化,这正是概率P的取值区间。对式(11)作logit变换,logistic回归模型可以变成以下线性形式: (12) 从式(12)可以看出,我们
限制150内