2023年基于GRU神经网络的可移动性兴趣点的推荐系统.docx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《2023年基于GRU神经网络的可移动性兴趣点的推荐系统.docx》由会员分享,可在线阅读,更多相关《2023年基于GRU神经网络的可移动性兴趣点的推荐系统.docx(20页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2023年基于GRU神经网络的可移动性兴趣点的推荐系统史艳翠,张 弛(天津科技大学人工智能学院,天津 300457)近年来,随着个人手持终端设备的快速发展以及全球定位系统(global positioning system,GPS)定位技术的日渐成熟,研究人员和商业机构很容易获得大量的个人地理位置信息1.大型软件服务商也可以在用户授权的前提下获得丰富的位置和轨迹信息,进而为用户提供基于位置的服务2,例如定位、导航、移动中的搜索等功能服务.如何利用时空轨迹数据为用户提供便捷的推荐服务,这类问题成为科研人员关注的重点3.对个人活动空间的计算分析,可以挖掘出个体的移动模式、城市的热点区域、兴趣点分布
2、等信息4,为城市生活提供有力的数据支撑和高效的服务.在推荐系统研究领域中,基于兴趣点的推荐是应用较为广泛的推荐方法.目前基于兴趣点的推荐算法很大程度上依赖于以下两点:已有的轨迹中相似的时空运动轨迹5数据以及对个体和群体行为的分析结果.典型的应用场景有行人及车辆轨迹、社交网站签到等.上述应用场景都是以人类社会活动产生的数据为基础,通过对用户行为进行分析得到社会中人群的移动模式、城市的热点区域、兴趣点分布等信息,进而达到让城市生活更加便捷、减少道路拥堵等目的,最终产生了基于兴趣点的推荐系统.这类研究的对象往往都是静态兴趣点动态用户,并且研究的关注点大都集中在对动态用户轨迹的分析预测问题上,而缺少对
3、兴趣点位置变化的关注.然而,现实世界的需求是动态变化的,兴趣点并非都是静态的.本文针对可移动性兴趣点进行了研究.一个典型的场景是深圳普思英察科技有限公司(PerceptIn公司)在中国深圳工业园区部署的无人智能售货车.从用户的角度看,无人智能售货车是可移动的兴趣点; 从无人智能售货车的角度看,用户对其来说也是可移动的兴趣点.这种商业形式的推荐服务需要考虑移动性因素,这与传统静态形式的推荐服务有着本质上的区别.因此,在推荐系统研究中,将静态兴趣点拓展到可移动兴趣点的情景上并实现相应的推荐算法,是一个研究创新点,也是一个研究难点.这种扩展在现实生活中具有广泛的应用环境以及对应的推荐场景6. 本文主
4、要解决的问题、实现方法以及创新点如下:(1)通过赋予兴趣点时空轨迹来引入兴趣点的可移动性,并解决动态环境下推荐算法的需求问题.(2)对用户的时空轨迹信息进行提取,然后利用特征层级的迁移学习策略提升网络的预测能力和泛化能力,利用对比学习扩展训练数据的样本规模.为了使扩展后数据集的概率分布不变,本文使用了最大均值差异度量方法(maximum mean discrepancy,MMD)以及 TrAdaBoost最大期望(expectation maximization,EM)算法对其进行两步过滤,去除不符合要求的数据.(3)使用门控循环(gate recurrent unit,GRU)神经网络对用户
5、的未来时空轨迹进行预测,根据用户的聚集方向合理地调整附近的兴趣点位置.(4)最终结合预测的时空结果,为用户进行合理推荐,使得移动兴趣点与用户能够在一定的时空范围内进行交互.时空轨迹预测7的基本实现过程是对时空序列数据进行分析,进而完成建模并在此基础上进行预测8.可以将时空序列预测看作是对时间序列的分析在空间中的拓展,其中的时空关系会因为建模方法的不同而有所差异.Cliff等9在 1975年提出时空自相关移动平均模型 STARMA,并首次提出了时空序列建模的框架.Martin等10建立了时空自相关移动模型,该模型能够利用时空延迟算子将时间延迟和空间延迟连接起来,从而真正地建立时空一体化模型.对于
6、非平稳、非线性模型,则采用时空序列混合模型,将层次贝叶斯模型、状态空间模型和卡尔曼滤波等方法融合起来.近年来的神经网络11-12、支持向量机13等方法也被拓展并应用到时空序列建模和预测的研究中,比如时空序列神经网络 STANN14、时空序列支持向量机STSVR等.杨立宁等15提出基于奇异值分解模型和自回归积分滑动平均模型的时空序列分解和预测,该研究结果不仅大幅度降低了训练时间成本,还提高了预测精度.要解决将某个个体的时空运动预测结果推荐给其他用户的问题,则需要使用适合的时空信息推荐算法.目前有关时空轨迹的兴趣点推荐类型分为两类:一是地点推荐,例如为用户推荐商店、餐馆等; 二是行程推荐,例如为用
7、户推荐旅游路线、为用户导航较小代价的路线. 基于兴趣点的推荐系统的影响因素大致可归纳为 4类16,即地理因素影响、签到序列影响、社交网络影响和地点属性信息影响.地理因素影响是根据空间轨迹数据进行推荐,如Tobler等17在1970年提出第一地理学法则,该法则强调地理空间的距离是决定事物相似度的关键,距离越近,相似度越高.签到序列影响是基于时空数据进行推荐,如 Saleem等18提出的以树形位置轨迹模型为基础的同层聚类方法.该方法虽然可以形成较好的推荐结果,但对算力的需求过高.也有研究人员提出将一天的时间进行等分,将时间分段法与第一地理学法则进行融合,生成时间兴趣点推荐算法19.社交网络影响是根
8、据社交好友信息进行推荐,如 Gao等20提出轨迹相似度越高则彼此是好友关系的可能性越大,这样可以根据地理位置和社交关系为用户推荐兴趣点.地点属性信息影响是根据用户对被推荐地点的评价数据进行推荐,这类研究主要应用在影院评分、餐馆评分等方面.Zhao等21利用评价信息作为访问地点的词向量,在进行兴趣点的相似性度量后给出推荐结果.Yin等22-23提出了基于贝叶斯概率模型的推荐方法,计算出用户对新地点的感兴趣程度,结合城市热点和用户轨迹停留点生成兴趣点推荐列表.本文在已有的研究基础上,提出了一种复合神经网络结构,用于实现可移动性兴趣点的推荐,并且进一步提高推荐结果的准确率.本文算法主要包括3个网络模
9、块:模式GRU网络模块、点GRU网络模块以及门网决策模块.(1)模式 GRU 网络模块:通过融合迁移学习策略完成模式学习,其目的是学习其他数据集中的动态时空运动模式,进而训练出能够对模式进行预测的子网.在学习过程中利用归一化的方法对数据进行预处理,将不同范围的数据整合到同一范围内.(2)点 GRU网络模块:通过融合对比学习策略完成点学习,其目的是扩展目标训练集的样本数量.在保证扩展后样本概率分布不变的情况下,提高网络的泛化能力,训练出能够根据当前时空点预测下一位置的子网.(3)门网决策模块:在工作时起到切换开关的作用,负责根据输入的数据形式选择是模式 GRU的结果作为输出还是点GRU的结果作为
10、输出.图1(a)为本文方法网络的计算流程.输入数据由点 GRU网络模块、模式 GRU网络模块和门网决策模块共同接收,由 3个网络模块协同工作,输出最终结果.图1(b)为本文方法网络的数据和样本处理流程.其中有两条主线,即对比学习部分和迁移学习部分.对比学习部分:将主数据集分成测试集和训练集,然后利用对比学习策略将训练集数据样本进行扩展,利用本文提出的两步样本过滤法对扩展后的数据集进行过滤处理,以确保扩展后的数据集的样本概率分布不变,最终达到训练出有效的点 GRU网络的目的.迁移学习部分:与主数据集相似的外部数据集能够提供有用的时空信息,利用迁移学习可以学到不同数据集在时空运动上呈现出的共同规律
11、,这些共同规律也可看作是能有效提升网络预测性能的训练样本.这两部分的结果会在决策门网模块的控制下进行选择性输出,最终得到推荐结果.引入迁移学习和对比学习策略的目的以及优势在于:在已有数据集规模较小的情况下,仍然能够训练出预测准确度高、泛化能力强的模型.图1 网络的计算流程以及数据和样本处理流程Fig.1 Calculation process,data and sample processing flow of the network2.1 GRU网络在本文方法中,GRU 网络24负责分别与迁移学习策略和对比学习策略进行融合,使之能完成对点以及模式的预测.本文中 x代表数据集中一个用户产生的连
12、续时空位置信息,x = ,xt-1, xt, xt+1,.由于内部数据点存在时间顺序,因此 x本质为向量,但在后面处理过程中需要对 x内部的数据点进行逐个处理,为了方便,将其表示成集合的形式,其中xt为用户在 t时刻产生的数据(用户当前的时空位置),作为本文GRU网络的输入部分.表示由用户当前的时空位置状态所得的隐状态.式中:为 sigmoid函数; Wz、Wr为权重矩阵,用于线性变换; Uz和Ur分别为权重矩阵Wz、Wr变换后的表达形式; 为哈达玛积(Hadamard product); rt为一组重置单元,若关闭重置门 rtj,重置单元将使单元忘记先前的计算状态. 重置门rtj与更新门的计
13、算类似,为最终得到用户下一时刻的预测点yt作为本文GRU模块的输出式中表示进行矩阵加法操作.需要注意的是,GRU网络处理过程中涉及连续时空点中时间 t的概念,因此输入和输出的结果下标要注明 t,但在后面的决策门网模块中不涉及时间概念,因此下标省略了时间t.2.2 基于迁移学习的模式GRU训练利用迁移学习策略25训练模式 GRU.利用迁移学习扩展用于训练神经网络结构的数据集,本文方法需要将已有的用户时空轨迹数据、特征等高层知识进行转化,用于解决新的轨迹预测问题.即使是不同的时空轨迹数据集,其特征空间也具有一定的共同性,这样就可以采用样本级迁移方法解决本质上相同的问题.本文方法应用到主数据集和外部
14、数据集,其中主数据集分为训练集和测试集,外部数据集采用的是相同领域的时空点数据集合.利用从外部数据集提取到的时空轨迹对训练数据进行扩容,以实现运动模式这种高级知识的迁移学习.如图2所示,从时间和空间的数据点角度来看,在迁移学习过程中,应对用户的运动模式进行迁移学习,而并非对用户具体的时空点进行迁移.图2 直角坐标转换为模式GRU的训练数据格式Fig.2 Convert rectangular coordinates to training data format of the mode GRU譬如,A用户在甲地,B用户在乙地,考虑到甲、乙两地可能相隔甚远,且 A、B用户所用的交通工具不同,所以
15、 A、B两者的坐标无法直接进行匹配学习.但是,在加速时,无论A、B用户是步行还是驾驶车辆,A、B两者都会出现坐标逐渐稀疏,在减速过程中坐标则会逐渐密集,对于转弯等也有相似的运动模式.因此,应该对不同用户采集的数据使用密度聚类(density-based spatial clustering of applications with noise,DBSCAN)方法进行预先聚类,以解决轨迹中出现的因长时间驻留某地,而产生坐标重复采样的问题; 然后,利用归一化方法,消除用户产生数据的度量差异,利用外部数据集构建多个此种模式序列供GRU学习,进而完成时空轨迹模式的迁移,并将模式GRU输出的预测结果重新
16、映射到实际空间中,达到利用模式 GRU提供可借鉴的动态轨迹模式的目的.从数据层级上实现动态运动模式的迁移学习是一个比较容易实现的操作方法,但在本文中,该方法需要着重构建时空点链信息,供模式GRU进行学习. 2.3 基于对比学习的点GRU训练使用对比学习策略26对点GRU进行训练.对时空数据 x训练得到一个编码器 f,使得H ( f (x ) , f(x+)? H ( f (x ) , f(x-),其中:x+是和 x相似的正样本,x-是与x不相似的负样本,H是度量函数,用于度量样本的相似度.对比学习的损失函数LN可表示为其中E为期望.通常正负样本都将被应用,且正负样本区分度越大越好,而在本文,仅
17、使用生成的正样本对 GRU进行训练,以达到扩大 GRU的训练样本集和增强网络泛化性能的目的.如图3所示:已知用户A的运动轨迹,该轨迹所生成的正样本集用绿色标记,代表该用户可能走到的点(小范围区域); 而负样本集用红色标记,代表该用户不可能走到的点(远距离区域).期望通过上述编码器找到最大区分度的正样本,将正样本集合进行筛选后,供GRU训练使用. 图3 对比学习策略(生成区分度高的正负样本)Fig.3 Contrast learning strategies (generatingpositive and negative samples with high discrimination)本文采
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2023 基于 GRU 神经网络 移动性 兴趣 推荐 系统
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内