智能推荐系统的发展趋势.docx
智能推荐系统的发展趋势随着科学技术的进步,移 动互联网快速发展,手机越来越便宜,拥有智能手机不再是一件遥不可及的事情,互联网 用户规模已接近增长的顶点。摄像头和信息处理软件(各种滤镜、剪辑等工具)技术的 进步让每一个人都可以轻松地生产高质量的内容,信息的产生以指数级噌长,我们的生活 中充斥着海量的信息。在上述背景下,怎么高效快速地获取对自己有价值的信息对每个互联网公民来说是 愈发重要的事情,推荐系统的出现可以轻松地应对这一棘手的难题。推荐系统作为一种高 效的信息过滤工具,可以很好地部分解决用户精准高效获取信息的问题(搜索、导航等 也是解决用户获取信息的手段),并且也是非常重要甚至是不可或缺的一种手段(在人 们需求不明确时,借助推荐系统获取信息是非常必要的,而每一个人都有不明确的需 求)。推荐系统作为一项技术在国内的发展时间不长,从2012年头条成立之初将推荐系统 作为核心产品功能到现在差不多有8年时间,在这8年中推荐系统的商业价值在国内逐步 得到认可和肯定,大家都认可推荐系统在内容分发、用户体验、商业变现等方面的重大价 值。推荐系统目前已经成为toC互联网产品的标配技术,任何一个toC产品要想很好地 为用户提供一种被动高效获取信息的工具,推荐系统是绕不过去的。在特定情况下人类需 求的不确定性、信息的爆炸式增长这两个条件让推荐系统成为一项长久而实用的技术,推 荐系统不会昙花一现,它会伴随着人类的发展而不断发展进化。在前面的一系列文章中,我们对推荐系统的算法、工程、评估、展示、交互、业务 等方方面面都进行了深入的介绍。虽然推荐系统在国内的出现只有短短8年,但是在各个 方面都取得了极大的进步,发展越来越快,各种新的方法、应用场景、产品形态层出不穷。 未来推荐技术会朝哪些方向发展?推荐行业又有哪些变化?推荐系统的应用场景和价值体 现又有什么新的特点呢?这些问题都值得我们深入思考。针对上述问题,作者结合自己对推荐系统的理解和行业判断,在这篇文章中讲讲推 荐系统的未来发展与变化。具体我会从政策及技术发展对推荐系统的影响、推荐系统的就 业变化、推荐系统的应用场景及交互方式、推荐算法与工程架构、人与推荐系统的有效协 同、推荐系统多维度价值体现等6个方面来讲解推荐系统的未来发展和变化。本文为读者 提供多角度来观察推荐系统的未来发展与变化,期望读者读完可以更好地把握推荐系统未来发展的脉络,对推荐系统的未来 变化有更深入的了解。的数据进行更加复杂模型的训练成为可能,更多的数据和更复杂的模型也会让最终的推荐 效果更好。这种复杂的模型可以是更深层的深度学习模型还可以是各种模型的混合推荐(读者可以参考混合推荐系统介绍这篇文章)。随着通信技术的发展,特别是5G技术的普及,信息传输的速度更快、传输费用更 便宜,我们可以在极短的时间内获得大量的信息,计算能力的增强和算法模型的发展让处 理信息更加快速及时,同时用户也趋向于获得及时快速的互动,在这些因素的影响下.推 荐系统正变得越来越实时。目前大火的信息流推荐就是很好的体现。实时推荐不光用户体 验好,并且还具备更好的商业价值(实时推荐增加了信息分发的效率,让单个推荐位的 产出大大提高),实时推荐是推荐系统未来最为重要的发展方向之一。要想做好实时推荐,除了算法外,对工程架构、交互方式等都需要进行相应调整。 在工程上需要采用流式处理技术(如Flink、Spork Steaming等)来进行特征处理与 模型训练,这样才可以更好地响应用户的实时操作。交互方式上也需要给用户提供更加自 然流畅的交互,目前在移动端的下拉刷新就是一种比较好的交互方式,当推荐场景拓展到家 庭智能设备、车载设备、甚至虚拟设备上时,交互方式都需要进行重大革新。作者在 实时个性化推荐介绍这篇文章第八节“实时推荐系统的未来发展”中对实时推荐系统未 来的发展方向进行了比较全面的介绍,读者可以参考学习。还有一个不得不提的点是特征工程,这是任何机器学习算法必须要面对的问题,随 着富媒体信息在所有信息中所占比重越来越大以及实时推荐对特征处理时效性的要求,这 个问题变得日益严峻。幸好深度学习等技术可以减少人工特征工程的难度,另外自动化特 征工程在某种程度上也可以缓解这个问题。关于特征工程未来发展及变化,读者可以参考 推荐系统之数据与特征工程第五节“推荐系统数据与特征工程未来趋势”中的相关介绍。目前的推荐算法都是部署在云端的,所有人共用一套推荐算法体系。随着边缘计算 技术的发展,未来是极有可能在终端上部署比较复杂的模型的,到那时就可以为每个用户 构建一个个性化的推荐算法模型,直接在终端给用户生成推荐结果。这种部署方式有几大 优点:一是推荐会更加及时,可以给用户更好的体验;二是每个人拥有自己量身定制的算 法,算法精准度也会更高;三是信息直接在终端进行处理,也更加安全可靠。实时个性 化推荐介绍第八节“实时推荐系统的未来发展”2中对这个情况进行了比较细致的描述, 读者可以参考。总之,随着机器学习算法自身的发展,随着硬件、信息处理技术、信息传输技术的 发展,未来的推荐系统在算法实现方案、工程架构等方面都会产生极大的变化,会出现更多的可能性。这些都是值得我们去期待、去思考、去探索的方向。五、在与推荐系统协作上凸显人的价值虽然以深度学习为代表的第三次人工智能浪 潮给学术界和产业界带来了极大的变化,机器学习在很多方面的能力达到甚至超越了人类。 但在涉及到创造和情感方面,在可预见的未来机器是无法取代人的。而为用户提供有价值 的信息和情感联系是好的、具备人文关怀的推荐系统必须要具备的能力,这就要求人和机 器有效协同,这也是未来很长一段时间推荐系统的常态。从数据过滤、特征选择、模型调整、结果干预、展示优化、效果调控等推荐系统的 各个维度人工都可以发挥极大的价值。推荐系统的人工调控这篇文章对人工怎么调控 推荐系统,人工在推荐系统中的定位和作用等进行了比较深入的介绍,读者可以学习了解。 加入了人工因素的推荐系统更有情感也更加可控。目前人工在推荐系统中所起的调控作用还比较粗暴,更多可能是对结果层面的干 预,未来人工怎么跟推荐系统更好地协同,怎样在推荐系统中发挥人的创造力和情感力量 是非常值得思考和探索的。六、关注推荐系统多维价值体现推荐系统作为一种获取商业价值的工具,已经被过 度商业化了。在用户体给上虽有所考虑、有所收敛,但是做得还不够。作者在推荐系统 的价值观这篇文章中对推荐系统应该从哪些维度来体现价值进行了比较深入的介绍,特 别是人文关怀、生态健康发展和弘扬社会正向价值观这3个方向上,给出了自己的思 考,这也是当前推荐系统价值体现中非常缺失的部分。随着科技的发展,特别是云计算将很多技术能力变成像水电煤一样可以方便获取的 资源,大家在技术能力上的差异会越来越小,这时能够让你脱颖而出的可能是你的产品能 不能打动用户、能不能跟用户产生共情。推荐系统作为一个跟用户强交互的产品,也是满 足这种趋势变化的。因此,未来能够做好推荐系统的企业一定是能做定义好推荐系统价值 的企业,不光要考虑商业价值,更应该考虑用户体验和人文关怀。总结这篇文章基于作者在推荐领域多年的实践经验和深入思考,从多个维度对推荐系统 的未来发展进行了总结和介绍。国家层面对大数据与人工智能技术的大力支持,有利于推荐系统行业获得更多的专 业人才,同时竞争也显著加剧。云计算等技术的发展让构建推荐系统就像购买商品一样方 便,创业公司可以更轻量、更便捷、低成本地在产品中整合推荐能力。政策层面的支持、技术的发展,对推荐行业就业也会产生深远影响。企业更需要推 荐算法的商业策略师更好地落地推荐算法,而推荐从业人员需要关注推荐系统的业务价值 产出。物联网、通信技术、硬件技术的发展,拓展了推荐系统的应用场景,推荐系统会应 用到更多的领域,包括家庭场景、车载场景、虚拟现实场景等。在这些新场景中推荐与人 的交互方式会发生极大的变化,语音交互、手势交互成为可能。在推荐算法上,最近几年深度学习已经在推荐上取得了非常好的效果,未来新的推 荐范式,如强化学习、迁移学习、半监督学习、联邦机器学习等都会在推荐系统中获得规 模化使用。技术的进步让推荐系统利用更多的富媒体数据训练模型成为可能,推荐系统也 会吏加实时化、个性化,甚至可能每个人都会拥有一套量身定制的个性化推荐引擎。推荐系统不光要获得商业价值,在用户体验、人文关怀、生态繁荣、弘扬正向价值 观等维度也需要有所突破,这些多维度的价值会越来越重要,会成为推荐系统的核心竞争 力。在这些价值发挥中人的作用就凸显出来,未来很长一段时间,人与机器是协同发展的, 推荐系统只有更多地注入人的情感和灵魂,才会有更好的发展。一、政策及技术发展对推荐系统的影响推荐系统的发展是与整个大环境和技术发展 趋势密不可分的,一定会受到国家政策层面和技术发展的影响。不过对推荐系统来说,我 认为政策和技术的影响是都正向的。下面我们就从政策和技术两个维度来分析。1 .政策层面随着智能化、数据化等概念的兴起,大数据与人工智能在科技发展中起 着越来越重要的作用,大数据与人工智能得到了国家层面的重视。要想发展好大数据与人 工智能,首先必须有相关人才。国内从2016年开始逐渐有一些高校开始开设大数据和人 工智能专业甚至创办大数据、人工智能学院,这类高校呈上涨趋势,目前全国开设了大数 据相关专业的高校超过282个(见参考文献1) o在2019年全国已经有35所高校获得 人工智能建设资格(见参考文献2) o除了国家政策层面的支持,这也间接说明这类专业 受到市场的青睬,就业前景较好,高校才愿意不遗余力地推进大数据与人工智能专业的建 设。教育层面对大数据与人工智能的支持,为依赖这些技术的业务和产品提供了源源不断 的人才储备。推荐系统本身就是人工智能中非常重要并且有极大业务价值的子领域,同时构建推 荐算法模型也依赖于对大规模用户行为数据的处理,大数据技术也是推荐系统必备的技术。 因此,推荐系统直接受益于国家在教育层面对大数据与人工智能的支持,未来有充足的人 才来源。上面提到的只是国家在教育层面的布局,其实国家将大数据与人工智能提到了战略 的高度,希望通过大数据与人工智能来革新各个产业。政策层面的大力支持,媒体的大势宣 导,今日头条的样板示范作用,让个性化推荐相关产品和业务得到更多投资人、公司管理 层的重视,这也有利于推荐系统在更多产品和业务中落地。2 .科技层面云计算技术是最近几年非常火的技术,云计算行业已经发展得越来越成 熟,大公司早已布局,并己成为盈利源泉,是业务的第三增长极,国9的殖亚马逊的AWS、微 软的Azure,国内有阿里云和腾讯云。经过近十年的发展,云计算基础设施已经相对健 全,未来会在SAAS服务和toB行业应用中大力发展,这其中就包括推荐SAAS服务。 创业公国只需要利用云平台提供的各种SAAS服务就可以轻松搭建推荐系统各个模块, 大大降低了推荐系统的准入门槛。除了云计算公司提供这类服务,toB的创业公司也在这 方面有所布局,也提供PAAS或者SAAS的推荐服务。构建一套完善、稳定、高效、低成本、灵活的推荐系统是一件非常困难的事情,涉 及到数据、算法、工程、产品交互、业务指标等方方面面,只有对这些知识点有深入全面 的了解,再结合公司的业务才能构建出具备商业价值的推荐系统。在这一背景下,创业公 司一般可以选择利用云服务来构建推荐业务,这种方式投入低,无固定成本,是非常好的选 择。只有中、大规模公司或者将推荐作为核心竞争力的公司才会自建一套推荐算法业务体系。2020年突如其来的新冠病毒疫情,给每个人的生活带来了极大的影响,限制了每个 人的线下活动,用户将更多时间用在了线上。有很多研究认为这些变化是持久的,不会随 着疫情的消失而消失。这也间接提升了推荐系统等互联网服务面对的用户规模,为推荐系 统的发展创造了新的机遇与挑战。上面这些变化,对推荐行业产生了深远的影响,对推荐系 统各方面都会带来极大的改变。最直接受到影响的是推荐系统就业的变化,这就是我们下 一节主要讲述的内容。二、推荐系统的就业我们在推荐算法工程师的成长之道这篇文章中讲到推荐系统 是一个非常好的职业选择,主要表现在就业范围广(推荐、搜索、广告技术一脉相承, 技术体系极为类似)、薪资高、有业务价值(读者可以参考这篇文章第一节”为什么说 推荐算法是好的职业选择”)。本节我们就来讲解在大环境和科技层面不断发展变化的情 况下推荐系统就业的变化。我们在第一节讲到各类高校开设大数据与人工智能课程、成立 相关院系,未来推荐相关的人才供给会更加充裕。大数据和人工智能是当下的热点,而推 荐系统是人工智能中非常重要并且有极大应用前景和商业价值的方向,人的从众本性会导致 对热点盲目追随崇拜,趋之若鹫.因此一定会有很多从其他方向转岗到推荐算法领域的人才。 虽然将来会有更多的企业提供推荐产品和服务,但我个人判断推荐方向的人才肯定会供过于 求,相关职位竞争压力极大。构建一套完善的推荐系统是一个非常复杂的系统工程,因此 才有这么多云计算公式和toB创业公司将推荐系统打造为高效易用的SAAS或者PAAS 服务了,在不久的将来,很多公司不会自己去从零开始搭建推荐算法团队了,而是直接购 买云平台或者toB公司的推荐服务。因此,推荐方向的工作形式和工作重点可能会有如下 几类变化。1 .推荐算法商业策略师是新的职业方向随着推荐系统相关的云产品越来越成熟,创 业公司会更倾向于直接购买推荐云服务,快速搭建自己的推荐算法产品,而不是从零开始 自己摸索。利用云产品的好处是轻量、快速,让公句将更多的精力放到核心业务上,轻装 上阵,快速发展业务。关于这一块的介绍,读者可以参考从零开始构建企业级推荐系统 这篇文章第二节3中的介绍。为了更好地将云推荐产品落地到企业中,对需要的人才技能 及要求会有变化,这时不需要特别懂具体的算法实施和工程,更多的是希望了解各类算法 的优缺点和应用场景,能将推荐算法跟本公司的业务结合起来,让推荐算法更贴合本公司 的业务情况,最终让推荐算法产生业务价值。这类人员需要了解推荐系统全流程,知道构建推荐系统可能遇到的困难,有全局把 控能力,善于沟通,有对商业的敏锐嗅觉。这样的人才我称为推荐算法商业策略师,他们 的主要工作是怎么基于推荐云服务招推荐落地到本公司的业务中。2 .在特定领域和场景下出现新的推荐形态随着科技的发展,特别是智能硬件、5G 通信技术、语音等新交互方式的发展,推荐系统的应用场景及交互方式会拓展到更多场景 和领域。在新的业务场景及新交互方式下,怎么构建推荐业务及推荐算法是非常值得思考 的一个问题,也是未来新的机会。读者可以参见下一节关于推荐场景及交互方式变化的介 绍。由于是新的行业和场景,短期云计算公司提供的推荐服务还很难覆盖到这些行业和场 景,因此,在这些新兴的行业和场景中,是需要企业自己来实现相关的推荐服务的 (当然云计算公司的产品可以提供一定的补充作用),这对于推荐算法从业人员来说也 是新的机遇。随着新领域的逐步成熟,云计算与toB服务公司也会涌入新赛道。提供推荐SAAS 或者PAAS服务的云计算公司或者toB创业公司也需要大量精通推荐算法和工程的专业 人才,在这些新领域提供推荐解决方案。3 .推荐从业者需要更加关注业务价值产出推荐系统本身就是一个比较偏业务和工程的方向,企业构建推荐系统的目的就是希 望借助推荐系统来获得更多的商业价值(读者可以参考推荐系统的商业价值这篇文 章对推荐系统的商业价值有更多了解)。在当前互联网红利见顶的情况下,原来那种通 过融资烧钱发展用户的粗放经营模式不再有市场。在当前竞争日益激烈的商业环境下,企 业从创立第一天就应该考虑商业变现的事情,需要在创业早期阶段就尝试商业化,学习这 方面的技能,积累相关经验,这样才更有可能生存下来。推荐系统作为一个非常有价值的变现工具,需要肩负起商业变现的责任,因此推荐 从业人员需要更加关注推荐系统的业务价值产出,并尽量量化推荐系统的价值,建立价值 产出的闭环体系。只有让老板看到推荐的价值,推荐业务才有更好的发展空间。4 .推荐系统相关技术培训市场更加火爆前面提到很多新兴toC互联网行业都将推荐系统作为核心功能,加上云计算和toB 创业公司对推荐工程师的大量需求,市面上对推荐算法人才的需求是比较旺盛的。推荐算 法工程师的工资水涨船高,吸引很多其他方向的工程师转行从事推荐算法相关工作,他们 没有推荐相关技能储备及项目经验,因此需要进行学习和培训。另外虽然很多高校开设了人 工智能方面的专业,但是大学所学课程跟企业对技能的要求还是有比较大的差距的,严重脱 节,这些学生要想在激烈的竞争环境中找到推荐相关工作,也需要找推荐相关实习或者参加相关职业技能培训I。这两个情况促使市面上出现很多从事推荐系统相关技能培训的 副业及相关技术培训创业公司。这些公司进行在线或者线下技能培训,这也间接提供了录 制推荐课程或者培训推荐技能的工作机会。三、推荐系统的应用场景及交互方式的多元化目前的推荐系统主要应用于PC端和移动端,特别是在移动端,占推荐系统产品的绝 大多数。未来随着智能化的发展,智能设备会出现在更多的场景中,这些场景中的应用当 然也可能需要借助推荐技术来进行信息的分发。同时这些场景不同于移动端,在交互方式 上会有变化,可以借助语音、手势等更多新的交互方式来与用户互动。下面我们就对3 个可行的推荐系统应用场景进行说明。1 .家庭场景国内最早在2015年5月份乐视智能电视发布,随后小米、微鲸、暴风、华为、传 统5大电视厂商(长虹、创维、TCL、海信、康佳)纷纷入局智能电视行业,国外电视 厂商也强势杀入智能电视市场。各类智能盒子(小米盒子、天猫魔盒等)种类繁 多,五花八门,家庭互联网进入智能时代。目前智能电视上唯一的杀手级应用就是看视频。 在智能电视上的操作主要是以遥控器为主(虽然很多智能电视具备语音交互能力,但是 目前还存在居多问题,导致交互能力有限),操作相对手机来说更为不便,因此个性化 推荐的作用就凸显出来,智能电视上是更适合做智能推荐的。作者所在公司开发的家庭智能软件产品电视猫,作为聚焦家庭智能终端(电视 机、智能盒子)上的视频应用,从2012年就开始构建个性化推荐系统,目前已有超过 15种智能推荐产品形态。推荐系统在提升用户体验、创造商业价值等方面产生了巨大的 价值。爱奇艺、腾讯视频、优酷等互联网视频巨头都已经布局智能电视端,并且它们都提 供了各种各样的智能推荐能力。在智能电视或者智能盒子上构建推荐系统,由于交互方式及展示方式的特点,以及 面对的是非移动多人场景,跟移动端有很大的差别,且更有难度,这里面是有很多点是值 得探索和挖掘的,比如怎么更好地跟用户交互、怎么识别多人场景并提供精准推荐能力。家庭场景中另外一个不得不说的智能硬件是智能音箱。前几年亚马逊的Echo在美 国大热,引爆了智能音箱市场,国内快速跟进,BAT、小米、科大讯飞等一众企业纷纷布 局,上演了智能音箱大战。国内目前每年有千万级的销售量,逐步成为家庭中仅次于智能 电视的现象级硬件产品。智能音箱以语音交互为主(带屏智能音箱也可以采用触控的 方式交互),智能音箱上的应用目前种类非常多,以音乐、故事知识、生活帮助(查 天气股票等)为主,除了音乐这类音频的产品可以非常自然地整合个性化推荐能力 (是手机上的个性化电台在智能音箱上可以自然延伸),目前还没有看到将智能推荐 应用到智能音箱中的其他场景(比如购物等)。由于交互方式、展现方式的限制,在除 音乐等音频之外的应用上,怎么整合智能推荐的精准推荐和信息分发作用,是一个比较难 的事情,也是一个非常值得探索的方向。2 .车载场景车载场景是一个非常重要的场景,用户规模巨大,同时也是一个比较特殊的场景。 在车载场景下司机的主要注意力在开车,车载智能设备的交互方式一定以语音交互为主, 应用也会有所局限,音乐、新闻等是主要的应用场景。推荐系统也会聚焦在音乐、新闻等 信息流推荐上,其他的智能推荐应用场景很难挖掘。这跟智能音箱类似,这里不再赘述。3 . VR (虚拟现实)/AR (增强现实)/MR (混合现实)场景虚拟现实/增强现实/混合现实等技术的发展,给人类提供了了解世界、获取信息的 一扇窗,目前这些智能设备还不够成熟,基于设备之上的应用也相对少(主要是游戏类、 视频类)。这类设备的交互方式以语音、手势、触控等为主。这类设备上生态还极不成 熟,内容也相对少,目前还不满足做智能推荐的条件,但是是一个比较值得期待的方向。 特别是当混合现实发展成熟时,就像谷歌眼镜那样,人可以在行动中获取信息,并可以整 合当下的环境信息,推荐系统一定有很多新奇的玩法。除了上面提到的三类应用场景,其他场景如智能冰箱上做智能推荐也是可行的。智 能冰箱可以记录家居生活中食物的消费情况,了解家庭的饮食习惯。基于对家庭消费习惯 的挖掘,进行精准的个性化食物推荐是非常可行的一种策略,这就跟电商直接联系起来了, 非常有商业价值,值得期待和探索。应用场景的变化一定伴随着交互方式的变化,在上述几类场景中主流的交互方式都 跟手机上的触屏交互不一样,因此应用场景对基于这些场景下的智能推荐的交互及展示方 式是有极大影响的。对于推荐系统UI交互和视觉展示的未来发展,读者可以参考推荐 系统的UI交互与视觉展示这篇文章第五节"推荐系统UI交互和视觉展示的展望”进行深 入了解。四、推荐算法与工程架构的发展推荐系统中最重要、最核心、最有技术含量的一个模块非推荐算法莫属了。目前主 流的、在工业界大量使用的推荐算法有基于内容的推荐、各类协同过滤算法等。这些传统 的推荐算法时至今日还在推荐系统中发挥着巨大的价值。随着机器学习技术、大数据技术、 云计算及软硬件的发展,会有更多新的学习范式应用于推荐系统中。除了算法层面的变化 外,通信技术的发展让实时推荐成为可能,推荐系统在数据处理、工程架构等方面也会迎来 新的发展与机会。下面我们就从算法和工程两个角度来梳理推荐推荐系统的未来发展。1 .推荐算法新的机会最近几年随着深度学习技术的发展,深度学习在推荐系统中的应 用也越来越广泛。深度学习由于可以获得比传统算法更好的精准度、不需要做复杂的人工特 征工程而受到推荐算法工程师的追捧,深度学习技术逐渐成了推荐系统中的主流技术。作 者在深度学习在推荐系统中的应用这篇文章中对深度学习在推荐中的应用进行了比较 全面的介绍,其中第七节“深度学习推荐系统的未来发展“中对深度学习在算法模型维度、工 程维度、应用场景维度、数据维度、产品呈现与交互维度等进行了探讨,读者可以参考和学 习。推荐系统本质上是一个交互式学习引擎,它会根据用户对推荐物品的反馈(是否浏 览、点击、购买等)来调整后续给该用户的推荐结果,这个过程是一个互动的过程,用 户与推荐系统互动得越多越频繁,推荐系统就越懂你,给你的推荐也会越精准。在机器学 习领域有一种学习范式就是互动式学习的典范,这就是强化学习(参见下面图1)o强 化学习中智能体通过与环境互动(action)获得环境的反馈(feedback),基于反馈 调整自己与环境的交互,形成新的交互方式与策略,最终通过多轮互动,智能体可以更好 地从环境中学习,获得更大的综合回报。如果我们在强化学习范式下考虑推荐系统,推荐算法就是智能体,而使用推荐系统 的人就是环境,推荐系统通过与人互动(推荐系统给人推荐标的物,而人对推荐的标的 物进行行为操作)更深入地了解人的行为特点、兴趣偏好。推荐系统从与人互动中不断 迭代,获得更好的推荐效果。强化学习在推荐系统中的应用,工业界已经有一些成果,感 兴趣的读者可以查看参考文献3、4、5、6,分别是今日头条、京东、YouTube将强化 学习应用于推荐中的案例。对强化学习感兴趣的读者可以学习参考文献7,这是强化学习之父Sutton写的一本 非常有影响力的书。随着推荐系统越来越趋向于实时化,我相信强化学习在推荐中的应用 一定是未来非常值得探索的方向,也一定会产生极大的商业价值。机器学习中另外一个非常重要的学习范式是迁移学习,所谓迁移学习简单来说是将 从一个领域获得的知识通过某种方式应用于另外一个领域(需要寻找到这两个领域之间 的某种关朕关系)。这种学习范式对人类来说是再平常不过的事情了,我们平时所说的 举一反三、触类旁通等就是人类大脑的迁移学习能力迁移学习在推荐系统中的应用目前有 少量尝试,读者可以查看参考文献8、9、10, 11, 12,这些都是迁移学习在推荐系统上的探索。我们在嵌入方法在推 荐系统中的应用第五节3中讲到盒马利用迁移学习将淘宝用户特征迁移到盒马中可以 很好地解决用户冷启动问题,这算是迁移学习在工业级推荐系统中一个比较好的应用案例。目前很多平台型的大公司都孵化出了很多产品,构建出了超大规模的产品矩阵,比 如阿里系下的产品、头条系下的产品等,在这些产品之间进行迁移学习是非常自然的事情。 另外云计算公司服务于非常多的同类型公司,这里面就有非常多迁移学习可以落地的场景, 云计算公同从一个公司构建推荐算法服务的经验和获得的算法成果都可以迁移到另外一家 同类型的公司中(当然需要考虑到信息安全和隐私,这在下面提到的联邦学习框架下是 可行的)。监督学习目前还是机器学习中最重要应用最广的学习范式,但是获得大量标准样本 是非常费时费力费钱的,怎么在没有大量标注样本的情况下学习是一个非常重要的问题 (在医学等领域标记样本不足是很自然的事情)。迁移学习提供了一种可行的方案,另 外一个可行的方式就是半监督学习(参见参考文献13),半监督学习利用标记样本和无 标记样本来进行学习,可以很好解决标记样本不足的问题。目前我们所获得的数据中无标 记数据量是非常巨大的,比如视频、音频、评论信息、标的物介绍文本等,这些信息在半监 督学习范式下都可以使用。参考文献14就是半监督学习在推荐系统上的尝试。这方面的 技术目前还很少看到在企业级推荐系统上的应用,但是一定是未来非常值得深入挖掘的一 个方向。目前国内的产品一般都是通过霸王协议来获取用户数据,多多少少都是不太符合人 性和道义的,随着用户隐私意识的噌强和法律层面对隐私保护的重视,未来推荐系统可能 更难获得更多的用户数据,这就要求推荐算法从更加保护用户隐私的方向努力,在这个方 向上联邦机器学习(见参考文献15)就是一种非常好的学习范式。联邦机器学习是一个 机器学习框架,能有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的要求下, 进行数据使用和机器学习建模。联邦机器学习在推荐系统中的应用己经在业界有比较好的 尝试了,未来肯定会是推荐系统发力的一个方向。关于用户隐私和联邦机器学习相关的知 识点读者可以参考推荐系统的价值观第三节3中的介绍。上面讲到了在推荐算法上未 来推荐系统可能的方向和变化,在数据处理及工程方面,推荐系统也会面对很多的调整、 变化与发展,下面我们就来简单梳理一下。2.推荐系统工程层面的发展变化现在主流的基于内容的推荐和协同过滤推荐算法都 只利用了部分用户数据进行模型训练,还远远没有将所有可用的信息综合起来进行推荐。这 一方面是数据量太大,二是数据处理复杂(特别是富媒体数据处理起来成本高技术复 杂),三是更多的数据对推荐算法性能及可拓展性的要求更高。在不久的将来随着特征工 程技术的进步、数据处理能力的增强、计算成本的降低以及算法自身的发展,获取更多