EMD与XGBoost组合...法对门诊量预测的研究与分析_陈娜.pdf
《EMD与XGBoost组合...法对门诊量预测的研究与分析_陈娜.pdf》由会员分享,可在线阅读,更多相关《EMD与XGBoost组合...法对门诊量预测的研究与分析_陈娜.pdf(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 ,研究与设计微型电脑应用 年第 卷第期作者简介:陈娜(),女,硕士,会计师,研究方向为预算管理、财务分析、成本核算;郁晓晨(),女,硕士,初级会计师,研究方向为医院成本管控、经济运行分析、医保与物价政策研究与管理。文章编号:()与 组合算法对门诊量预测的研究与分析陈娜,郁晓晨(上海市第六人民医院,财务处,上海 )摘要:利用 年上海某医院历史门诊量构建数据模型,预测一周日平均和一月日平均门诊量,提出用 组合算法在处理日门诊量预测和周门诊量预测。结果表明,该算法优于单 算法。医院门诊量是医院管理涉及的各种要素中最重要的因素之一,是否能够精确的预测门诊量,对医院的医疗资源配置有着重要的影响。由于医
2、院门诊量是一个非线性时间序列,本文首先利用经验模态分解()对门诊量序列进行平稳化处理,然后在此基础上增加温度等外部环境因素特征,结合 算法对门诊量进行预测。实验结果表明,本文提出的 组合算法不仅有着较好的预测精度,并且相较于以往的算法,进一步将预测的时间精确到日,效果明显优于单 算法。关键词:门诊量预测;时间序列;中图分类号:文献标志码:,(,):,(),:;引言在医院的日常管理中,门诊量无疑是重要的影响要素之一,在一定程度上反映了医院的规模、医疗水平。因此,若能正确的预测门诊量,提前做好医生、护士的调控分配,不仅可以很好的提高医院的工作效率,也可以大幅度提升病人的医疗体验感。本文以给医院管理
3、者提供决策支持为目的,对医院门诊量进行预测,为医疗卫生资源的合理配置提供依据。传统的门诊量预测通常使用灰色模型、差分整合移动平均自回归模型()等算法,或者将 模型与其他模型进行简单的组合,但是时间颗粒度较粗(通常为周、月、季度或年),预测效果仍有提升空间。本文考虑到医院的门诊量有着明显的时间特征,首先将其时间特征纳入考虑范畴,通过历史门诊量可以发现门诊量数据并不平稳,尤其是以天为单位的门诊量,波动尤为剧烈,因此我们利用对门诊量序列进行分解。以往结合的组合算法一般只考虑了时间序列的特征,并未考虑外部因素。一些外部特征与门诊量可能存在一定程度的相关性,因此在本文中,我们同时考虑了门诊量也受到天气、
4、温度等外部特征的影响,提出了分解和 的组合算法,利用上海某医院门诊情况来构建门诊量预测模型,分别预测未来天、天、天的门诊量之和。数据与方法 数据来源本文门诊数据来源于上海某医院 年月至 年月门诊报表,部分数据见表。,研究与设计微型电脑应用 年第 卷第期表上海某医院部分门诊量数据日期门诊量人次日期门诊量人次日期门诊量人次 本文天气数据来源于互联网,根据该医院所在区域检索历史天气情况,简单处理后部分数据见表。表上海某地区部分天气数据日期平均气温日期平均气温日期平均气温 相关技术 经验模态分解()经验模态分解()是由黄锷等提出的一种创造性的、新型自适应信号时频处理方法。基于该方法来处理非平稳非线性序
5、列有着优良的数值效果,目前已经在地球物理学领域、生物医学领域、结构分析领域、设备诊断领域、成像领域等得到应用。分解方法基于以下假设条件:数据至少有两个极值,一个最大值和一个最小值;数据局部时域特性由极值点间的时间尺度唯一确定;如果数据没有极值点但有拐点,则可通过对数据微分一次或多次求得极值,然后再通过积分获得分解结果。设有时间序列,分解可以将非线性、非平稳的数据序列分解为多个平稳单一的序列,即,其中为本征模函数。本征模函数必须满足以下两个条件:极值和过零点的数目必须相等,或者至多差一个;在任意数据点,局部最大值的包络和局部最小值的包络的平均必须为零。时间序列的分解过程如下。设有时间序列(),分
6、解可以将非线性、非平稳的数据序列()分解为多个平稳单一的序列,即()(),其中 ()为本征模函数。本征模函数必须满足以下两个条件:极值和过零点的数目必须相等,或者至多差一个;在任意数据点,局部最大值的包络和局部最小值的包络的平均必须为零。时间序列()的分解过程如下:()确定时间序列()的所有局部极值点,分别用曲线连接所有的极大值点和极小值点,如此得到时间序列的上下包络线,令上下包络线的平局值为();()令()()(),对()重复上述步骤,直至满足本征模函数的条件,即()是一个基本模式分量,这时得到新的序列()()();()对新的时间序列()重复上述步骤,分别提取出个基本模式分量。此时,时间序列
7、()变为一个单调序列,不包含任何模式的信息,即为原始序列的余项,()。至此,原始 时 间 序 列 被 分 解 为 多 个 分 量 和 一 个 残 差序列。.算法 是一种在 框架下实现的的机器学习算法,由于其出色的效率,被数据科学家广泛 的使用。对于 给 定 有个 特 征、大 小 为的 数 据 集,y()(,y),树型集成模型(即第个实例的预测值)可以表示为?y()(),()其中,(),(:,),表示树的数量,表示将实例映射到相应的叶子节点上的树的结构,表示树的叶子数量,表示叶子节点的分数。我们最小化以下正则化目标函数来得到模型需要的函数:()?y,y()()()其中,(),是用来衡量真实值y和
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- EMD XGBoost 组合 门诊 预测 研究 分析 陈娜
限制150内