Chapter11-林子雨-大数据技术原理与应用-大数据在互联网领域的应用(年1月29日版本)324612.pptx
《Chapter11-林子雨-大数据技术原理与应用-大数据在互联网领域的应用(年1月29日版本)324612.pptx》由会员分享,可在线阅读,更多相关《Chapter11-林子雨-大数据技术原理与应用-大数据在互联网领域的应用(年1月29日版本)324612.pptx(33页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、大数据技术原理与应用 厦门大学计算机科学系 林子雨 厦门大学计算机科学系 2016年版第第11章章 大数据在互联网领域的应用大数据在互联网领域的应用(PPT版本号:版本号:2016年年1月月29日版本)日版本)大数据技术原理与应用大数据技术原理与应用http:/ 厦门大学计算机科学系 林子雨 提纲11.1 推荐系统概述推荐系统概述11.2 推荐算法推荐算法 协同过滤协同过滤11.3 协同过滤实践协同过滤实践 电影推荐系统电影推荐系统欢迎访问大数据技术原理与应用教材官方网站:http:/ 林子雨 编著,人民邮电出版社ISBN:978-7-115-39287-9大数据技术原理与应用 厦门大学计算机
2、科学系 林子雨 11.1 推荐系统概述11.1.1 什么是推荐系统11.1.2 长尾理论11.1.3 推荐方法11.1.4 推荐系统模型11.1.5 推荐系统的应用大数据技术原理与应用 厦门大学计算机科学系 林子雨 11.1.1 什么是推荐系统互联网的飞速发展使我们进入了信息过载的时代,搜索引擎可以帮助我们查找内容,但只能解决明确的需求为了让用户从海量信息中高效地获得自己所需的信息,推荐系统应运而生。推荐系统是大数据在互联网领域的典型应用,它可以通过分析用户的历史记录来了解用户的喜好,从而主动为用户推荐其感兴趣的信息,满足用户的个性化推荐需求大数据技术原理与应用 厦门大学计算机科学系 林子雨
3、“长尾”概念于2004年提出,用来描述以亚马逊为代表的电子商务网站的商业和经济模式电子商务网站销售种类繁多,虽然绝大多数商品都不热门,但这些不热门的商品总数量极其庞大,所累计的总销售额将是一个可观的数字,也许会超过热门商品所带来的销售额因此,可以通过发掘长尾商品并推荐给感兴趣的用户来提高销售额。这需要通过个性化推荐来实现11.1.2 长尾理论大数据技术原理与应用 厦门大学计算机科学系 林子雨 热门推荐是常用的推荐方式,广泛应用于各类网站中,如热门排行榜。但热门推荐的主要缺陷在于推荐的范围有限,所推荐的内容在一定时期内也相对固定个性化推荐可通过推荐系统来实现。推荐系统通过发掘用户的行为记录,找到
4、用户的个性化需求,发现用户潜在的消费倾向,从而将长尾商品准确地推荐给需要它的用户,进而提升销量,实现用户与商家的双赢11.1.2 长尾理论大数据技术原理与应用 厦门大学计算机科学系 林子雨 推荐系统的本质是建立用户与物品的联系,根据推荐算法的不同,推荐方法包括如下几类:专家推荐:人工推荐,由资深的专业人士来进行物品的筛选和推荐,需要较多的人力成本基于统计的推荐:基于统计信息的推荐(如热门推荐),易于实现,但对用户个性化偏好的描述能力较弱基于内容的推荐:通过机器学习的方法去描述内容的特征,并基于内容的特征来发现与之相似的内容协同过滤推荐:应用最早和最为成功的推荐方法之一,利用与目标用户相似的用户
5、已有的商品评价信息,来预测目标用户对特定商品的喜好程度混合推荐:结合多种推荐算法来提升推荐效果11.1.3 推荐方法大数据技术原理与应用 厦门大学计算机科学系 林子雨 一个完整的推荐系统通常包括3个组成模块:用户建模模块、推荐对象建模模块、推荐算法模块:用户建模模块:对用户进行建模,根据用户行为数据和用户属性数据来分析用户的兴趣和需求推荐对象建模模块:根据对象数据对推荐对象进行建模推荐算法模块:基于用户特征和物品特征,采用推荐算法计算得到用户可能感兴趣的对象,并根据推荐场景对推荐结果进行一定调整,将推荐结果最终展示给用户11.1.4 推荐系统模型图11-1 推荐系统基本架构 大数据技术原理与应
6、用 厦门大学计算机科学系 林子雨 目前在推荐系统已广泛应用于电子商务、在线视频、在线音乐、社交网络等各类网站和应用中如亚马逊网站利用用户的浏览历史记录来为用户推荐商品,推荐的主要是用户未浏览过,但可能感兴趣、有潜在购买可能性的商品11.1.5 推荐系统的应用图11-2 亚马逊网站根据用户的浏览记录来推荐商品大数据技术原理与应用 厦门大学计算机科学系 林子雨 推荐系统在在线音乐应用中也逐渐发挥作用。音乐相比于电影数量更为庞大,个人口味偏向也更为明显,仅依靠热门推荐是远远不够的虾米音乐网根据用户的音乐收藏记录来分析用户的音乐偏好,以进行推荐。例如,推荐同一风格的歌曲,或是推荐同一歌手的其他歌曲11
7、.1.5 推荐系统的应用图11-3 虾米音乐网根据用户的音乐收藏来推荐歌曲大数据技术原理与应用 厦门大学计算机科学系 林子雨 推荐技术从被提出到现在已有十余年,在多年的发展历程中诞生了很多新的推荐算法。协同过滤作为最早、最知名的推荐算法,不仅在学术界得到了深入研究,而且至今在业界仍有广泛的应用协同过滤可分为基于用户的协同过滤和基于物品的协同过滤11.2.1 基于用户的协同过滤(UserCF)11.2.2 基于物品的协同过滤(ItemCF)11.2.3 UserCF算法和ItemCF算法的对比11.2 协同过滤大数据技术原理与应用 厦门大学计算机科学系 林子雨 基于用户的协同过滤算法(简称Use
8、rCF算法)在1992年被提出,是推荐系统中最古老的算法UserCF算法符合人们对于“趣味相投”的认知,即兴趣相似的用户往往有相同的物品喜好:当目标用户需要个性化推荐时,可以先找到和目标用户有相似兴趣的用户群体,然后将这个用户群体喜欢的、而目标用户没有听说过的物品推荐给目标用户UserCF算法的实现主要包括两个步骤:第一步:找到和目标用户兴趣相似的用户集合第二步:找到该集合中的用户所喜欢的、且目标用户没有听说过的物品推荐给目标用户11.2.1 基于用户的协同过滤(UserCF)大数据技术原理与应用 厦门大学计算机科学系 林子雨 11.2.1 基于用户的协同过滤(UserCF)图11-4 基于用
9、户的协同过滤(User CF)大数据技术原理与应用 厦门大学计算机科学系 林子雨 实现UserCF算法的关键步骤是计算用户与用户之间的兴趣相似度。目前较多使用的相似度算法有:泊松相关系数(Person Correlation Coefficient)余弦相似度(Cosine-based Similarity)调整余弦相似度(Adjusted Cosine Similarity)给定用户u和用户v,令N(u)表示用户u感兴趣的物品集合,令N(v)为用户v感兴趣的物品集合,则使用余弦相似度进行计算用户相似度的公式为:11.2.1 基于用户的协同过滤(UserCF)大数据技术原理与应用 厦门大学计算
10、机科学系 林子雨 由于很多用户相互之间并没有对同样的物品产生过行为,因此其相似度公式的分子为0,相似度也为0我们可以利用物品到用户的倒排表(每个物品所对应的、对该物品感兴趣的用户列表),仅对有对相同物品产生交互行为的用户进行计算11.2.1 基于用户的协同过滤(UserCF)图11-5 物品到用户倒排表及用户相似度矩阵大数据技术原理与应用 厦门大学计算机科学系 林子雨 得到用户间的相似度后,再使用如下公式来度量用户u对物品i的兴趣程度Pui:其中,S(u,K)是和用户u兴趣最接近的K个用户的集合,N(i)是喜欢物品i的用户集合,Wuv是用户u和用户v的相似度,rvi是隐反馈信息,代表用户v对物
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Chapter11 林子 数据 技术 原理 应用 互联网 领域 29 版本 324612
链接地址:https://www.taowenge.com/p-87250533.html
限制150内