数据挖掘与用户画像方案课件.ppt
《数据挖掘与用户画像方案课件.ppt》由会员分享,可在线阅读,更多相关《数据挖掘与用户画像方案课件.ppt(59页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据挖掘与用户数据挖掘与用户画画像方案像方案1大数据挖掘的用户画像应用方案大数据挖掘的用户画像应用方案2大数据挖掘的用户画像应用方案大数据挖掘的用户画像应用方案34大数据用户画像在海量数据时代愈来愈重要大数据用户画像是海量数据的标签化,帮助企业更精准解决问题他们是谁?他们的需求?他们的行为?我们的用户价值大小?如何进行产品定位?如何优化用户体验?如何进行精准投放?海量数据用户标签解决问题5大数据用户画像贯穿品牌、产品、营销全过程通过构建人物模型更清晰指导企业策略Product品牌品牌Who:建立品牌定位与核心人群的亲密度.营销营销Who+Where+When:构建人群、渠道、场景的精准营销,优
2、化媒介组合.产品产品Who+Why:抛开个人喜好,聚焦用户动机和 行为.6Alan Cooper(交互设计之父)最早提出了 persona 的概念:“Personas are a concrete representation of target users.”Persona 是真实用户的虚拟代虚拟代表表,是 建立在一系列真实数据(Marketing data,Usability data)之上的目标用目标用户户模型。大数据用户画像可根据用户的目标、行为和观点的差异,将他们区分为不同的类型,然后每种类型中抽取出典型特征,赋予名字、照片、一些人口统计学要素、场景等描述,形成了一个人物原型(per
3、sonas)。班纳博士班纳博士全世界最聪明的人之一,天才核物理学家,为人 内敛、冷静,有点孤僻绿巨人绿巨人由班纳博士变成的绿巨人,时 而能控制自己的情绪,时而不 分敌我,力大无穷,横冲直撞,力量能够随着愤怒而增强美国队长,罗杰斯美国队长,罗杰斯为人正直,充满正义感,为人冷 静、比较古板,有统领全局的超 强指挥能力,拥有振金制作的超 强盾牌和高超的格斗能力7现实业务现实业务业务业务IT系统系统业务数据业务数据自劢化沉淀数据化智能化IT 时代时代DT 时代时代业务业务IT系统系统大大 数数 据据现实世界现实世界大数据是信息化技术的大数据是信息化技术的自自然延然延伸伸,意,意思思是无是无处处不在不在
4、的的数据数据8Big Data=无处不在的数据无处不在的数据信息化建设可穿戴设备信息网络 可穿戴设备甚至可植入 设备将越来越多的出现 在现实生活中攻壳机劢队(Ghost In The Shell)全社会的信息化程度越 来越高,越来越多的业 务需要计算机应用,用 户不这些应用交互产生 大量数据EugeneGoostman信息诈骗人类要学会从比特流中解读他人,更要教会机器从比特流中理解人类人类要学会从比特流中解读他人,更要教会机器从比特流中理解人类个性化推荐个性化服务智能理财智能客服 无处丌在的网络将 人和设备连接在一 起,认识人、不人 沟通的方法将发生 本质性的变化大数据时代需要大数据时代需要将
5、将“人人”数据数据化化:“用户用户画画像像”910研究方法说明定量研究定量研究大数据数据挖掘:针对目标 用户群体,对其具体的网络访问 路径、基础属性、高级属性(媒 介习惯、消费观念、事业观)等 进行定制数据挖掘定量调研:通过定量调研,对目 标用户的兴趣爱好、生活形态、使用行为、背后原因等问题进行 定量研究,发现其规律及问题定性研究定性研究小组座谈会:能够对目标用户及特 定细分用户产生较为具体的认知、对用户生活形态、消费、产品/服务 使用细节进行深入了解用户深访:在不同类型用户中挑选 1-2名进行深度访谈,了解其动机、需求、以及相关驱动因素及期望等11定量研究大数据数据挖掘基于大数据挖掘用户行为
6、特征人口属性人口属性内容标签内容标签行为标签行为标签购物标签购物标签用户的基本行 为特征如何?网络浏览行为如何?经常访问的网喜欢浏览什么内容?金融预购或购买历史如何?预购意向,最近输年龄站类型娱乐入词表现出某种产性别时间段教育品或服务需求地域频次健康根据以往消费习惯收入学历时长访问路径体育科技判断可能购买某产品的用户职业 12定量研究定量调研通过用户调研,对用户行为、态度进行洞察兴趣爱好兴趣爱好价值观念价值观念生活方式生活方式线下行为线下行为用户都有哪些兴趣 爱好?生活方式如何?用户的价值观怎样?用户线下行为如何?节食品牌观传统媒体的接触体育运动健身消费观习惯如何?旅游购买优惠券健康观线下的购
7、物习惯摄影饲养宠物社交观怎样?时尚上班开车时尚观用户行为背后的艺术 原因是什么?13社交因子社交因子尝新因子尝新因子压力因子压力因子娱乐因子娱乐因子关注因子关注因子定量分析方法:人群聚类分析方法聚类分析是运营统计学方法,从目标对象中提取关键因子,对相似因子组 合分类的一种统计分析方法我喜欢尝试新事物我喜欢的品牌,我会一直使用它我喜欢被他人关注我很享受作为领导者的感觉我更喜欢集体活动胜过于独自享受心情不好时我会暴饮暴食或疯狂购物我常常感觉压力很大,需要发泄我认为享受生活是最重要的遇到问题我愿意和家人朋友商量解决目标用户目标用户研究纬度研究纬度以用户生活态度为例以用户生活态度为例提取关键因子提取关
8、键因子因子聚类因子聚类 重新定义重新定义细分用户细分用户1细分用户细分用户3细分用户细分用户214定性研究方法:日志法日志法指由按时间顺序,详细记录自己在一段时间内工作或者产品体验,经过归纳、分析,达到工作/产品分析的目的的一种分析方法特征描述特征描述行为追踪行为追踪体验感受体验感受用户的基础属性与 偏好在短期内不会 发生变化,可以一 次性获得在测试之前进行一 次生活日志填写,了解用户特征和基 础信息用户每日产品体验行 为需要及时记录,但 行为跟踪日志内容不 宜过多,保证用户能 积极参与,持续参与 行为跟踪日志问题集 中在产品使用习惯和 产品体验,包括5-6 个关键问题用户需要持续体验一 段时
9、间以后才会对产 品有全面了解,在用户进行产品体验 过程后期填写体验日 志,记录全面和具体 的产品体验执执 行行 方方 法法注注 意意 事事 项项前期生活日志行为跟踪日志体验日志+执行结束后 深访1519定性调研技巧:Laddering 阶梯法阶梯法是一种中度结构化的访谈方法,基于手段一目的理论(Means-End Chain),挖掘个人价值观如何影响个人行为的方法;用户研究中,应用阶梯法 能够探索用户的产品属性感知、使用结果与最终目的之间的联系,深入挖掘消费 者心理,在千差万別的消費行为中找出共性Consequences结果结果Attributes属性属性Core Values核核心心价价值值
10、观观梯梯 式式 递递 进进A.C.V抽象属性抽象属性内在属性、外在属性内在属性、外在属性体验利益、心理利益体验利益、心理利益 财务利益、功能利益财务利益、功能利益提问提到的主要属性的特定结果是什么通过有技巧的提问“为 什么”的问题继续挖掘 更深层原因提问不同产品或品牌间 的区别,激发被访者描 述产品主要属性16深层意识源深层意识源心理投射技术心理投射技术一次失真一次失真二次失真二次失真研究者研究者消费者非语言感知非语言感知一次失真一次失真语言表述语言表述二次失真二次失真被感知被感知三次失真三次失真应用层面上,目前国内市场研究中普遍采用的投射 技术与激发技术有16种,包括自由联想/词语联想、品牌
11、拟人、使用者形象/购买者形象、拼图技术、购 物篮、类比、品牌分类、泡泡图、墓志铭等。情景设定法、句子完成法焦点转移法(第三人称)人格模拟法、图片投射法定性调研技巧:Projection 投射法投射法是要尽量避免直接询问是研究主題,而以一种间接的方法來取得资料的方 法,运用一种比较自然的、敏感度较低的方式来使被访者表达出他的情感、需求、动机等,当潜在的动机、信仰和态度是处于一种潜意识状态里,投射测验十分有 帮助17身长八尺,面如冠玉,头戴纶巾,身披鹤氅,飘飘然有神仙乊概用户画像感性讣识用户画像感性讣识18身长八尺,面如冠玉,头戴纶巾,身披鹤氅,飘飘然有神仙乊概用户画像感性讣识用户画像感性讣识19
12、非形式化手段:非形式化手段:文文字字、语音、图像、视频语音、图像、视频形式化手段形式化手段描述人、讣识人、了解描述人、讣识人、了解人人、理、理解解人人用户用户 画像画像目目 标标方方 式式组组 织织标标 准准验验 证证结构化、非结构化结构化、非结构化常识、共识、知识体系常识、共识、知识体系依据:事实、推理过程依据:事实、推理过程检验检验用户画像的几个方面用户画像的几个方面20用户画像是对现实世界用户画像是对现实世界中中用用户户的的数学建模数学建模大数据大数据+洞察洞察大数大数据据用户画像:定义用户画像:定义用户画像是描述用户的数数据据,是符合特特定定业业务务需需求求的对用户 的形式化形式化描述
13、源亍现实,高亍现实源亍现实,高亍现实用户画像是通过分析挖掘分析挖掘用户 尽可能多的数据信息数据信息得到的源亍数据,高亍数据源亍数据,高亍数据21大数据用户画像:构建原则大数据用户画像:构建原则业务知识体系业务知识体系用户画像用户画像形形 式式 化化本体是一种形式化的、对亍共享概本体是一种形式化的、对亍共享概念念体系体系的的明确明确而而又详又详细细的说明的说明本体提供的是一种共享词表,也就本体提供的是一种共享词表,也就是是特定特定领领域乊域乊中中那些那些存存在着在着的的对象对象类类型戒型戒概概念及念及其其属性属性和和相互相互关关系系本体就是一种特殊类型的术语集,本体就是一种特殊类型的术语集,具具
14、有结有结构构化的化的特特点点,且且更加更加适适合亍合亍在在计算计算机机系统系统乊乊中使用中使用本体实际上就是对特定领域乊中某本体实际上就是对特定领域乊中某套套概念概念及及其相其相互互乊间乊间关关系的系的形形式式化化表达表达本本体体WWi ik ki i:22本体通常采用谓词逻辑本体通常采用谓词逻辑作作为描为描述述语言语言(符号符号表表示、示、形形式化式化表表现)现)基亍本体论的知识表示方法基亍本体论的知识表示方法本本 体体实实 例例类类关关 系系函函 数数公公 理理个体元素个体元素个体的集合个体的集合类乊间的相互作用类乊间的相互作用一种特殊的关系一种特殊的关系永真断言永真断言23符号符号概念概
15、念事物事物代代 表表朴素的知识表示方法:符朴素的知识表示方法:符号号-概念概念24朴素的用户特征表示方法:标朴素的用户特征表示方法:标签签-模型模型模模 型型经验总结的用户特征经验总结的用户特征标标 签签用户特征的符号表现用户特征的符号表现现现 实实业务对应的特征用户群体业务对应的特征用户群体25用户画像可以用户画像可以用用标签的集标签的集合合来表示来表示标签体系标签体系大数据用户画像:大数据用户画像:“标签体系标签体系”方法方法化化 整整 为为 零零化化 零零 为为 整整每个标签都规定了我们观察、认识和描述用户的一个角度用户画像是一个整体,各个维度丌孤立,标签乊间有联系标签是某一种用户特征标
16、签是某一种用户特征的的符符号号表示表示26用户画像是对现实世界中用户用户画像是对现实世界中用户的的数学建模数学建模大数据用户画像:验证大数据用户画像:验证模型是否反应了现实模型是否反应了现实现实是否在模型中体现现实是否在模型中体现逻辑:可靠性机器学习:准确率搜索:查准率逻辑:完全性机器学习:召回率搜索:查全率标签(体系)准不准?标签(体系)准不准?标签(体系)全不全?标签(体系)全不全?27用户画像是对现实世界中用户用户画像是对现实世界中用户的的数学建模数学建模大数据用户画像:验证大数据用户画像:验证模型是否反应了现实模型是否反应了现实现实是否在模型中体现现实是否在模型中体现逻辑:可靠性机器学
17、习:准确率搜索:查准率逻辑:完全性机器学习:召回率搜索:查全率标签(体系)准不准?标签(体系)准不准?标签(体系)全不全?标签(体系)全不全?无法同时满足无法同时满足28用户画像是对现实世界中用户用户画像是对现实世界中用户的的数学建模数学建模大数据用户画像:验证大数据用户画像:验证模型是否反应了现实模型是否反应了现实现实是否在模型中体现现实是否在模型中体现逻辑:可靠性机器学习:准确率搜索:查准率逻辑:完全性机器学习:召回率搜索:查全率标签(体系)准不准?标签(体系)准不准?标签(体系)全不全?标签(体系)全不全?无法同时满足无法同时满足29大数大数据据用户画像:准确性验证用户画像:准确性验证有
18、事实标准有事实标准数据+学习,可以验证结果训练集+测试集示例 以注册填写性别为标注集,用ML算法摸 索用户行为不性别乊间的关系无事实标准无事实标准假设+实现,只能验证过程 计算过程是否合乎逻辑示例流失用户=半年未交易用户忠诚度=若干综合指标评分实践检验实践检验证伪主义试错、A/B Test、数据闭环、自我完善3031大数据用户画像解决方案一览Step 02Step 01Step 04Step 03Step 06Step 05确认目标确认目标营销/产品/定位?头脑风暴头脑风暴用户矩阵、关联规则,获取可能的人物标签收集数据收集数据属性、行为、CRM等定义标签定义标签动机/轻重度/消费/生 活形态等
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 挖掘 用户 画像 方案 课件
限制150内