基于用户聚类的个性化推荐方法研究-熊琴巧.pdf
《基于用户聚类的个性化推荐方法研究-熊琴巧.pdf》由会员分享,可在线阅读,更多相关《基于用户聚类的个性化推荐方法研究-熊琴巧.pdf(56页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、江西财经大学JIANGX q。U。N。I。VE。Rg。lI。1。O。F FtNANCE&。E。C。ONO1。MICSII LIIIIIINIIIIIIlUlIINIIIllY3227687学校代码密级中图分类号UDC硕士学位论文MA STER DISSERTATIoN论文题目 叁主旦苤塞塑仝丝垡整莶壅选堑窒(中文)论文题目(英文)作 者申请学位Research on Personalized Recommendation Method旦签d!堕堕s盟坚!女煎!逊g熊琴巧 导 师 张富国 副教授塑 培养单位 信息管理学院学科专业 管理堂堂鱼兰堡 研究方向堡!垒釜垄生焦垦垂绫二。一七年六月万方数据
2、独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得江西财经大学或其他教育机构的学位或证书所使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。签名:垡丝鱼 日期:21 1 2:生:_关于论文使用授权的说明本人完全了解江西财经大学有关保留、使用学位论文的规定,即:学校有权保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。(保密的论文在解密后遵守此规定)
3、签名:朔勿 导师签名:雄日期:业L万方数据目 录1绪i仑111研究背景及意义l12国内外研究现状2121推荐系统中数据稀疏性问题研究现状2122基于二部图网络结构的推荐方法研究现状4123基于聚类的推荐方法研究现状513论文的主要工作和创新点814论文的组织结构815本章小结92相关理论与技术1021推荐系统概述一1022协同过滤推荐算法1123基于物质扩散的二部图推荐算法一1424聚类技术在推荐系统中的应用一16241常用的聚类方法17242基于聚类的推荐算法1925本章小结一203合并聚类用户评分的协同过滤推荐算法2 l31问题的提出一2132算法整体框架一2l33合并聚类用户评分的协同过
4、滤算法构建一22331用户聚类22332合并聚类邻居评分23333预测评分2334算法举例一243。5实验25351实验数据25352算法评价指标26353实验结果分析2736本章小结一294基于用户聚类的非均匀资源配置的物质扩散推荐算法3041算法提出依据一3042基于用户聚类的非均匀资源配置的物质扩散算法构建一31421用户聚类3 1422基于用户聚类关系配置初始资源值31423基于用户聚类的物质扩散32424产生推荐结果3243算法举例一3244实验33441实验数据33442算法评价指标33443实验结果分析34万方数据45本章小结375总结和展望3951全文总结一3952后续工作展望
5、一40参考文献41攻读硕士期间的科研成果45致射46II万方数据Contents1 Introduction-111 Researchbackgroundand significance112 Domestic and foreign research situation2121 Research status of data sparsity in recommended systems2122 Research status of recommendation methods based on bipartite networkstructIare-4123 Research status
6、 of recommendation methods based on clustering。513 The main work and innovations ofthe paper-814 S缸uc骶ofthepaper815 Summary ofthis chapter-92 Relevant theory and technology-lO21 Overviewofrecommended systems一1022 Collaborative filtering recommendation algorithm一l l23 Bipartite recommendation algorit
7、hm based on mass diffusion1 424 Application of clustering technology in recommended systems。1 6241 Commonly used clustering methods17242 Recommendation algorithm based on clusteringl 925 Summary ofthis chapter203 Merging clustering user ratings of collaborative filtering recommendationalgorithm-2131
8、 Problem introduction2l32Algorithmframework一2l33 Construction of algorithm based on user clustering to alleviate data sparsity。22331 Userclustering22332 Merging clustering neighborratings23333 Forecastratings2334 Example-2435 Experiment25351 Experimental data25352 Evaluationmetrics26353 Analysis ofe
9、xperimental results。2736 Smnmary ofthis chapter294 Nonuniform resource distribution mass diffusion recommendation algorithmm万方数据based on userclustering-3041 Algorithmbasis-3042 Construction of non-unifornl resource distribution Mass diffusionrecommendation algorithm based on user clustering-31421 Us
10、erclustering31422 Configuring initial resource values based on user clustering3 l423 Mass di儡sion based on user clustering3242。4 Produce recommendation results3243 Example13244 Experiment33441 Experimentaldata-33442 Evaluationmetrics-,-33443 Analysis ofexperimental results3445 Summary ofthis chapter
11、375 Summary and outlook3951 Summary ofthispaper3952 The furtherwork40Reference-,一4lScientific research achievements during master1 45Acknowledgment。46IV万方数据摘要近年来,互联网技术的迅猛发展使得Web成为人们获取信息的重要方式,用户在面对愈加丰富的信息海洋和各种类型的信息,反而迷失其中。推荐系统可以缓解“信息过载”引发的“信息迷失”问题。聚类技术应用到推荐中可以缓解数据稀疏、扩展性和冷启动等问题,但聚类技术的引入并不是都能提高推荐的效果。这是
12、由于聚类方法本身具有一定的缺陷,如聚类质量不高、聚类结果不稳定等,再把这种不是很好的聚类结果应用到推荐中,必然会造成推荐质量下降。如何巧妙地将聚类技术运用到推荐系统中来提高推荐结果的准确率是基于聚类的推荐研究的重点。本研究的思路是:通过聚类技术建立用户聚类模型,利用该模型产生的填充评分可以解决协同过滤中数据稀疏性问题,同时,利用该模型来配置物质扩散算法中非均匀的初始资源值。基于此研究思路提出了两个推荐算法,合并聚类用户评分的协同过滤推荐算法(UCCF)和基于用户聚类的非均匀资源配置的物质扩散推荐算法(UCMD)。该推荐算法主要利用了聚类技术,把产生的用户聚类模型引入到推荐中。本论文的主要研究内
13、容包括如下三个方面。(1)针对传统协同过滤推荐算法面临的数据稀疏闯题,提出一种合并聚类用户评分的协同过滤推荐算法。首先对用户聚类,把目标用户所在聚类的其他用户作为近邻,合并聚类邻居的评分可以产生新的评分项,把这些评分填充到原有评分记录里。在新的评分数据下,我们重新计算用户问的相似度,通过这样的方法查找到的近邻较传统方法查找到的准确性更高,根据更加精准的近邻集合计算得到的预测评分准确率也更高。(2)针对二部图网络结构的推荐算法中物品的初始资源值设置为0l的做法,提出一种基于用户聚类的非均匀资源配置的物质扩散推荐算法。首先根据用户对物品的评分对用户聚类,接着依据聚类模型,对目标用户选择过的物品和与
14、目标用户在同一个聚类的用户选择过的物品设置不同的初始资源,最后利用经典的物质扩散算法进行后续推荐。(3)利用MovieLens站点上真实的数据集测试本研究提出的合并聚类用户评分的协同过滤推荐算法(UCCF)和基于用户聚类的非均匀资源配置的物质扩散推荐算法(UCMD)。UCCF算法的实验结果表明:在利用用户聚类模型填充评分之后的数据上和没经过填充的评分数据上使用标准协同过滤算法,前者的平均绝对误差(MAE)要低得多。UCMD算法的实验结果表明:算法在分类准确率、排名权重、用户与用户之间的多样性指标上都优于标准的物质扩散,新颖性和标准物质扩散持平,算法在提高推荐准确率的同时也提高了推荐的多样性,而
15、且新颖性万方数据也保持在较高水平。关键词:推荐系统;数据稀疏;聚类;协同过滤;物质扩散万方数据AbstractRecently,the rapid development of Internet technology makes Web become animportant way for people to obtain information,however,”information overload”makespeople lost in the increasingly rich ocean of information and diverse types ofinformation,
16、the recommendation system Can help users to effectively solve the networkinformation lostThe application of clustering technology in recommendation canalleviate the problem of data sparsity,scalability and cold start,but the introduction ofclustering technology not all can improve the resultsThis is
17、 due to the clusteringmethod itself has some defects,such as the clustering quality is not high,the clusteringresults are unstable,The application of the clustering results to the recommendation willinevitably lead to the decline of recommendation qualityHow to apply the clusteringtechnology to the
18、recommendation system in order to improve the accuracy of therecommendation results is the focus of the research based on clusteringThe idea of this study is to establish a user clustering model,which can be used tosolve the problem of data sparsity in collaborative filtering and distribute non-unif
19、orminitial resource values in the mass diffusion algorithmBased on this idea,tworecommendation algorithms are proposed,merging clustering user ratings ofcollaborative filtering recommendation algorithm(UCCF)and nonuniform resourcedistribution mass diffusion recommendation algorithm based on user clu
20、stering(UCMD)The proposed algorithm mainly uses the clustering technology,the userclustering model is introduced to recommendationsThe main research contents of thisthesis include the following three aspects(1)In order to solve the problem of data sparsity in traditional collaborativefiltering recom
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 用户 个性化 推荐 方法 研究 熊琴巧
限制150内