一种基于APP的行为采集系统的设计与实现.pdf
《一种基于APP的行为采集系统的设计与实现.pdf》由会员分享,可在线阅读,更多相关《一种基于APP的行为采集系统的设计与实现.pdf(58页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、北京大学硕士学位论文版权声明任何收存和保管本论文各种版本的单位和个人,未经本 论文作者授权,不得对本论文进行复制、抄录、拍照、修改 或以任何方式传播等行为。否则,引起有碍作者著作权益之 问题,将可能承担法律责任。北京大学硕士学位论文摘要随着智能手机的日益普及,移动终端已经成为人们获取信息的重要手段,企 业希望通过采集分析移动用户行为,了解用户的偏好,以移动平台为载体针对用 户进行个性化的精准营销。本文根据爱咔咔业务需求,描述了一种基于APP的用户行为采集系统的设计 与实现,为后端进行数据分析和个性化推荐提供完整准确的用户行为数据。本文 描述的基于APP的用户采集系统主要包括移动端、服务器端、管
2、理端三个部分。其中移动端部分运用浏览行为和特定行为的采集方法分别对显式用户行为和隐 式用户行为进行收集;通过数据暂存压缩和策略发送机制解决了离线数据收集和 网络流量占用的问题:通过使用统一的数据格式和接口,解决了不同移动平台的 数据兼容问题。系统还通过基于网络请求的参数统一配置机制,解决了各APP 的统一控制问题。在服务器端进行配置优化,满足了大并发请求的要求。在管理 端提供了对整个系统的监管页面。本文最后给出了系统的测试结果。关键词:APP;用户行为:行为采集;数据采集;显式用户行为;隐式用户行为北京大学硕士学位论文AbstractWith the growing popularity of
3、 smart phones,mobile terminals have become an important means for people to obtain information.Companies hope that by collecting and analyzing user behavior,to personalized precision marketing for the users on the mobile phone platform.Based on the business needs of Aikaka,this paper describes the d
4、esign and implementation of a user behavior based APP collecting system,providing complete and accurate data on user behavior to back-end data analysis and personalized recommendation systems.The APP-based user collecting system in this paper mainly includes three parts:the APP layer,service layer a
5、nd management layer.The APP layer uses different collecting methods for the explicit user behavior and implicit user behavior,uses temporary storage,compression and different transmission strategy for asynchronous transmission of the data in order to collect data when off-line,reduce data redundancy
6、,and network traffic occupied.Unified data formats and interfaces are used to solve multi-platform problem.The system also provides a web-based parameters unified configuration mechanism,unified APP control by the management layer.In the service layer configuration is optimized to meet the requireme
7、nts of a large number of concurrent requests.In the management layer a website is provided for the management of the entire system.Finally,the test results of the system arc given.Key Words:APP;User Behavior;Behavior Collecting;Explicit User Behavior;Implicit User Behavior北京大学硕士学位论文目录摘要.IAbstract.II
8、目录.III第一章绪论.11.1 项目背景和意义.11.2 国内外发展和现状.21.3 论文的主要工作.21.4 本文的组织结构.3第二章相关理论与技术介绍.42.1用户行为.42.1.1移动用户行为.42.1.2 用户行为特征和分类.52.1.3 显式用户行为.62.1.4 隐式用户行为.62.1.5 用户行为上下文.72.2行为采集.72.2.1 传统采集方式的缺点.72.2.2 隐式用户行为采集.82.2.3 显式用户行为采集.82.2.4 用户行为上下文采集.92.2.5 用户区分方法.92.3本章小节.10第三章系统需求及功能规约.113.1 应用场景.113.2 功能综述.123.
9、3 用户行为模型.133.4 设计目标.143.5 系统功能规约.143.5.1 功能模块.143.5.2客户端类库.153.5.3服务端接口.163.5.4 APP参数统一配置.173.5.5系统管理.173.6本章小节.17第四章系统设计与实现.194.1系统定位.194.2总体设计.194.3系统主要设计.224.3.1客户端初始化流程.224.3.2用户行为记录流程.224.4 APP端数据类型及发送策略设计.23III北京大学硕士学位论文4.5 APP端参数统一配置.244.6 iOS相关技术实现.254.6.1 iOS单例实现.254.6.2 iOS端网络异步访问技术.264.6.
10、3 iOS端异常退出捕获技术.264.7 基本功能模块设计.274.8 数据采集接口模块设计.294.8.1 浏览行为采集.294.8.2 特定行为采集.304.9 数据存储机制设计.314.10数据发送模块设计.344.11 数据接收模块设计.364.12 数据存储模块设计.374.13本章小节.38第五章系统部署与测试.395.1部署方案.395.1.1客户端部署.395.1.2服务端部署.405.2测试.405.2.1功能测试.405.2.2非功能测试.435.3缺陷及改进.47第六章总结与展望.486.1 回顾与总结.486.2 下一步工作展望.48参考文献.50北京大学学位论文原创性
11、声明和使用授权说明.52致谢.53IV北京大学硕士学位论文图表目录图3.1系统业务流程.1111 3。2 育3715图 3.3 客户数据图.16图4.1爱咔咔系统整体框图.19图4.3系统客户端功能框图21图4 4系统服务端功能框图.1图4.5客户端初始化流程图.22图4.6用户行为记录流程图.23图4.7系统配置更新时序图.29图 4,8 E3 并据流程图33图4.9发送数据流程图.35图4.10数据拆解流程图.37图5.1使用本系统前后内存占用对比.46图5.2使用本系统前后活跃内存占用详情.46表2-1移动用户行为关键绩效指标表.4表 4 1 用户基础信息字段表 27表5-1客户端测试硬
12、件环境.39表5-2客户端测试软件环境.39表5-3服务端部署配置.4054 月艮ab 44表5-5数据最对比测试表(单位:byte).47北京大学硕士学位论文第一章绪论1.1 项目背景和意义本文依托于“爱咔咔(Aikaka)”移动营销系统,该系统是应用于智能手机 上的在线会员卡系统,致力于为用户提供便捷的会员卡消费体验和及时的优惠信 息,为商户提供基于电子会员卡的移动营销方案。随着用户数量的快速增加,系 统对用户行为数据的采集需求也在加大。系统中每一位用户的每一次访问和操作 都需要以日志形式被记录下来。以日志文件形式为代表的文本数据文件是一种重 要的非结构化数据记录方式。日志型数据主要包括系
13、统操作日志、系统行为日志、交易流水数据、用户行为数据等多种数据内容。这些日志数据往往蕴藏着巨大的 分析价值:分析日志文件可以揭示用户的行为习惯、兴趣爱好,还可以帮助系统 管理员快速发现系统中可能存在的性能隐患等等。对各种日志文件进行完善的分 析可以为企业提供包括决策支持、精准营销等多种商业智能功能5。移动用户群包含的大量的用户行为信息是采集分析用户行为的理想数据源,同时其潜在的巨大市场以及友善、方便的交互方式也是精准服务和精准营销的良 好媒介2。移动用户和移动终端具有移动性特点,为个性化偏好提取技术提供 了丰富的数据来源;移动通讯网络具有人机相应的特点,用户的行为更真实、直 接的体现了用户偏好
14、信息口。基于行为的数据挖掘一般由以卜三部分组成:数据预处理、模式发现和模式 分析。而在数捱预处理中,又分为三个阶段:数据清洗、区分使用者和会话识别 10 o本文不仅要解决数据的采集问题,还需要涉及到数据预处理的一些相关问 题。当前的爱咔咔系统中,有一套正在使用的用户行为采集系统,但是系统存在 诸多问题,比如系统与当前业务逻辑耦合较大,导致业务无法方便变更,并且用 户行为采集接口与APP数据接口没有分离,容易导致APP数据接口压力过大,影 响正常的业务流程。北京大学硕士学位论文为满足客户对商业智能的需求,爱咔咔APP行为采集系统(AUBCS)需要对 用户的各种行为,包括界面访问跳转、界面驻留时间
15、、会员卡申请使用、优惠券 申请使用等进行完整详细的记录。这些数据的采集都需要在APP端进行,因此如 何在APP端进行用户行为的采集而不影响到APP原有业务逻辑及用户体验就成了 一个很大的挑战。同时,APP端需要将数据发送到服务器端,如何在服务器端应 对如此大数据量的访问请求也成为需要解决的关键问题。1.2 国内外发展和现状目前国内外在这方面比较成熟的两个产品如下:Google Analytics18是Google开发的针对Web端及移动端的数据统计分 析平台。任何开发者均可以将他们提供的功能集成到自己的网站或APP中,将数 据发送到Google,由Google的服务器进行分析处理,在Googl
16、e网站上查看处 理结果。Google Analytics为用户提供了功能强大、易于使用的报告平台,帮 助开发者了解到网站或APP中最受欢迎的部分,为客户营造更好的体验。Google Analytics还支持iOS客户端和Android客户端,方便进行不同平台之间的对比。友盟19是国内创新工场的一个针对移动应用的统计分析服务平台,同样提 供了一个公共的平台,针对移动应用进行数据的采集处理展示等。用户行为采集系统不仅要满足对行为数据的采集,更需要能够在特定的业务 环境下解决具体的业务问题。而Google Analytics和友盟等产品虽然提供了统 一的平台,但是无法针对特定的业务进行定制,不能满足
17、企业特定的业务需求。1.3 论文的主要工作论文的主要研究内容分为以下几个方面:1)通过调研,总结了移动用户行为与传统用户行为的异同,将用户行为划 分为显式用户行为和隐式用户行为,并针对不同类型的用户行为提出不 同的采集方法,并给出在iOS系统上的相关设计实现:2)通过爱咔咔的业务需求归纳出系统需要实现的功能,分析实现过程中的难点并提出解决方案;2北京大学硕士学位论文3)调研APP端统一配置技术,通过网络调用和APP端缓存技术实现了服务 端管理层对APP端统一配置机制;4)研究iOS端数据文件缓存技术,对比不同的存储方式,通过一进制文件 形式实现行为数据的缓存;5)研究数据发送策略,实现在APP
18、启动时、APP退出时和定时发送策略,满足不同数据的发送需求,并通过ASIHTTPRequest实现iOS端异步网 络访问机制;6)部署并测试系统,对系统中存在的问题提出改进建议。1.4 本文的组织结构本文的内容组织结构如下:第一章绪论,主要对项目的背景和意义,国内外相关技术发展现状,论文的 主要工作等做了阐述,并给出论文的组织结构;第二章用户行为与相关理论研究,介绍了用户行为的基本概念和分类,对比 了移动用户行为和传统用户行为的不同,对用户行为进行分类,针对不同类型的 行为数据给出了相应的采集方式;第三章系统需求及功能规约,讲解了系统整体的需求,并对系统中的功能给 出规约:第四章系统设计与实现
19、,描述了系统的应用场景和功能需求,论述了系统的 设计方案,按模块对系统的结构和设计细节进行了详细的说明,对系统的主要流 程进行梳理和描述,对主要模块的设计进行了阐述;第五章系统部署与测试,论述了系统客户端和服务端的部署方法,最后给出 测试结果,总结了系统的不足,并提出了改进方案;第六章总结与展望,通过对论文工作的总结,提出将来的研究重点与工作展 望。3北京大学硕士学位论文第二章相关理论与技术介绍2.1 用户行为2.1.1 移动用户行为传统的网站用户行为是指访客在进入网站后所有的操作。本文中描述的移动 用户行为特指移动用户对特定APP进行的操作行为。移动用户行为有以下关键绩效指标22:表27移动
20、用户行为关键绩效指标表KPI维度标准访问次数在一定时间范围内,所有的用户对APP的使用次数。UV(独立访客)在指定时段内不重复(仅计数一次)的访问者人数。PV(浏览量)APP界面的浏览量,用户每次进入界面即被计算一次。访问深度指用户每次使用APP进入的界面层数。停留时间指用户对APP中各界面访问的时长。跳出率单界面访问次数占总访问次数的百分比。基于移动APP的用户行为和基于传统WEB页面的用户行为有如下几个主要不同点:1)展示和操作形式:传统的WEB以页面为主,主要操作形式为鼠标键盘;移动设备的处理能力及显示能力与PC差别较大,移动设备以APP的界 面展示为主,界面相对小,展现的内容少而集中,
21、操作以触摸和滑动为 主,用户在手机上倾向于更少的输入20;2)网络能力:传统WEB数据可以实时发送,而移动设备由于受到网络带宽 和网络稳定性的制约及流量的限制,无法做到实时发送数据;3)对位置的依赖性:移动用户的行为与用户的位置有很大关系,如用户在 家和在商场中对同一 APP的操作就会产生很大的差别,而WEB用户一般4北京大学硕士学位论文的使用地点较为单一,不会因为在不同地点产生很大的操作差异L21;4)信息密度较低11:移动用户的使用时间较为零散,内容较有限,故相对于传统的WEB形式,信息的密度较低,同等时间段内包含的信息量较 少。2.1.2 用户行为特征和分类用户行为从分布上主要有以下两个
22、特征4:突发性:用户活动是有规律的,即在每天的特殊时段的用户活动的突发 现象是规律出现的:统计表明4,每天上午和晚上10点均会出现移动 用户的使用量突起,上午的使用量突起是和WEB统计结果相类似的,这 个时间段用户的活动较为频繁,而晚上10点以后WEB使用量没有明显 增长,移动用户则在这个时段产生了新的使用量增长,这是由于移动用 户有在睡前使用手机的习惯造成的;不均匀性:不同的用户发出的请求数量不同,即用户发出请求数的分布 是不均匀的,服从著名的80/20原则,即大部分移动用户发出的点击数 是很少的,而只有少数用户贡献了很大的点击数。在一个APP的用户群 中,注册用户基数可能会很大,但是真正活
23、跃的用户可能只占到总用户 数的10%-20%左右;而在一个APP的提供的各种功能中,最经常被使用 到的功能可能只占总功能数的较少一部分。而移动用户行为的主要特征体现在如下方面:用户数量增长迅速:据调查显示,智能手机用户(这里指每个月至少使 用一次智能手机的用户)占全部上网用户的比率从2011年的31%上升到 了 2012年的44机15年 操作系统分化:调查发现,在智能手机操作系统中,Android系统的占 有率为46乐iOS系统占有率为35哈且都呈现出上升趋势,而其他手机 操作系统如Windows Phone、BlackBerry等的占有率则持续降低。智能 手机用户呈现出多平台的趋势,有84%
24、的用户表示有过多设备(电视、手机、平板电脑)同时使用的经历15。内容获取成为主流功能:有93%的用户经常通过智能手机获取内容,有 5北京大学硕士学位论文一半的用户至少每天获取一次,其中有43%的用户通过各种APP进行内 容获取1容。APP的使用量增加:有96%的用户在一年内平均下载了 36个APP,其中 14%的用户下载的是付费应用15 o以上调研表明,进行基于APP的用户行为的采集,不仅要考虑到应对大量用 户大量数据的压力,还要能够兼容主流移动操作系统,对用户行为进行更全面的 采集。用户行为可以划分为以下几种类别:显式用户行为、隐式用户行为及用户行 为的上下文,针对每一种用户行为数据又有着不
25、同的采集方法。2.1.3 显式用户行为显式用户行为是指系统给用户以一定的引导,使用户直接向系统提供自己的 背景信息或者对系统中某些项目做出评价的行为3。显式用户行为的优点为数据噪声小、数据准确可靠、数据量较小,更加便于 分析,从中提取出的用户意图可靠性强。这是由于显式用户行为的触发都是事先 设计好的,目的性很强,对用户起到了引导的作用,而且显式用户行为主要形式 一般为采集用户基础信息或者意图信息,故能较明显的反映出用户的喜好。显式用户行为的缺点为数据质量的好坏很大程度上依赖于用户的配合程度 和系统交互界面的设计好坏,因此这类用户行为信息获取难度较大,且可能存在 较大的主观倾向3。在本系统中,显
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一种 基于 APP 行为 采集 系统 设计 实现
限制150内