“网络购物平台客户行为数据分析和可视化表达”可视化报告.docx
-
资源ID:35617331
资源大小:355.57KB
全文页数:5页
- 资源格式: DOCX
下载积分:15金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
“网络购物平台客户行为数据分析和可视化表达”可视化报告.docx
网络购物平台客户行为数据分析报告一引言随着移动互联网和物联网的飞速开展,人类社会产生的数据以惊人的速度增 长。海量的数据几乎包含一切形式的结构化、半结构化以及非结构化的数据,如 网络日志、音频、视频、图片、地理位置信息等。如何高效地对这些数据进行采 集、存储、处理,并从中开掘到有价值的信息,是大数据分析处理需要解决的问 题。二、 分析目的网络购物中,消费者购物行为的任何一个细节都被服务器记录着。通过大数 据分析,商家可以了解消费者的偏好甚至预测其购买行为,如下列图所示。大数据 分析使得商家可以追踪用户的行为并确定最有效的方式以提升用户对购物平台 的忠诚度,根据用户的个性化需求提供相应的产品或服务以获得更大的市场占有 率。、一一 一一;、购买力、二LZLZL1*,.摘屐宿讪汞,一|上二二1而启而买福市:京欣 二二1W 腰围 '七二: ;二二二身高 L作矍一匚二二MB «»MB:孩子年龄;/凝存而淳】:是否有孩子:蒙不英否看不后购物忠诚度品牌偏好I蒙面每前喃泡高T认识大数据及其特征,认识大数据对人们日常生活的影响,了解数据采 集、分析和可视化表达的基本方法;学会选用恰当的软件工具或平台处理数据, 完成分析报告;理解对数据进行保护的意义。三、分析内容与步骤1 .分析内容(1)网购行为数据采集。(2)网购行为数据分析。(3)网购行为数据可视化表达。2 .分析步骤(1)确定数据来源。(2)确定数据分析方法。(3)用恰当工具可视化表达数据。四、分析工具和方法利用思维导图工具和“头脑风暴”的方法组建团队、明确任务;采用python 工具和可视化分析工具,实施探究。五、分析过程1 .确定数据来源我们所分析的网购数据,必须来源于某一个网购网站。为了方便学习,我们 利用虚拟机文件,搭建了一个“网络商城”。我们利用Python工具中的爬虫模 块,对数据抓取和分析。抓取数据的程序如下所示:(1)抓取页面设置。for i in range(O, 5):#循环5次,就是5个页面的商品数据payloa<l'page' = i+ 1 #此处为页码,根据网页参数具体设置 resp = re<|uests.get(url, j)ararns=|)ay 1(>a(!)soup = bs4.BeautifuISoup(resp.text, HhlniL|>arser,1)print(resp.url)#打印访问的网址resp.encoding =# 设置编码(2)抓取商品标题。= soup.ficlass_=re.8n】pile("hisk>ry-ile“】 producl")for j in all_title:soup_title = l)s4.BeautifulS<wp(str(j), nhtmLparser,r) title.appen(l(oup_title.a|,title,)(3)抓取商品价格。all_price = soup.fin(l_all(*s|)a!i iteniprofy=npriceH)for k in all_price:soup_price = l)s4.BeautifulSoup(str(kK HhtmLj>arserH) price.appeiKl(soiip_price.s|)an.striiig)(4)爬取商品订单量。all_on!er = *)iip£nd_all('a', c)ass_=re pile(Honler-niHn-an )for 1 in all_order:souporder = bs4.BeautifiilSoup(str(IX Hhtml.parsern)onler.appen(1(soup_onler.eni.string)(5)抓取出售商品的店铺名称。all_store = §oup.fin(Lall('div', class_=Hstore-name iHil-clearfixn)for m in all_store:M)up_store = bs4.BeautifulSoiip(str(m), MlitrnLj)arserM) slore.a|)|)en(l(sou|)_store.a.string)2 .确定数据分析方法数据分析一般包括特征探索、关联分析、聚类与分类、建立模型和模型评 价等。(1)大数据特征探索的主要任务是对数据进行预处理,发现和处理缺失值、 异常数据,绘制直方图,观察分析数据的分布特征,求最大值、最小值、极差等 描述性统计量。(2)关联分析就是分析并发现存在于大量数据之间的关联性或相关性,从 而描述一个事物中某些属性同时出现的规律和模式(3)聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给出 一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。(4)数据分类是大数据分析处理中最基本的方法。数据分类通常的做法是, 基于样本数据先训练构建分类函数或者分类模型(也称为分类器),该分类器具 有将待分类数据项映射到某一特点类别的功能。3 .用恰当工具可视化表达数据大数据可视化可以让人们快速抓住要点信息,让关键的数据点从人们的眼睛 快速通往心灵深处。从常用和实用的维度,大数据可视化的呈现类型主要分为探 索和解释两种不同的类型。探索类型可以帮助人们发现数据背后的价值,而解释 类型那么把数据简单明了地解释给人们。按照处理数据类型的不同,可视化呈现的 主要方式如下表所示。六' 分析结果1 .大数据是人们提取信息、做出决策的重要依据,是推动信息社会开展的重 要资源大数据的产生是与人类日益普及的网络行为所伴生的:物联网、云计算、移 动互联网、车联网、手机、电脑以及遍布地球各个角落的各种各样的传感器,无 一不是数据的来源或是承载的方式。互联网生成的数据量,不仅远超此前一切人 类所生成的数据量的总和,而且在以大爆发性的速度不断增长。大数据成为人们提取信息、做出决策的重要依据,是推动信息社会开展的重要资 源。2 .大数据采集的工具和方法是大数据采集的关键大数据的来源广泛(主要是互联网和物联网)、类型丰富、规模巨大。采集 大数据首先要明确大数据应用工程的需求,围绕选定的工程主题,制订大数据采 集的需求清单和内容大纲,采用适当的方法和工具进行采集。大数据作为一种工具,用在什么地方、掌握在谁手里都是次要的,关键是看 怎样利用这个工具。在平安的前提下,实现数据共享,真正创造数据价值,这才 是大数据真正的目的。3 . Python语言是大数据可视化表达的高效工具在大数据时代,复杂繁多且不同类型的数据大量涌来,往往超出了人们的处 理能力,人类的大脑也难以从堆积如山的数据中快速发现核心问题,而数据可视 化可以把枯燥乏味的海量数据以丰富的视觉效果呈现数据所反映的本质问题,有 效提升数据分析的效率。大数据可视化是指以图形、图像、地图、动画等生动、 易于理解的方式展示数据和诠释数据之间的关系、趋势与规律等,以便更好地理 解数据。大数据可视化可以让人们快速抓住要点信息,让关键的数据点从人们的眼睛 快速通往、心灵深处。大数据可视化呈现的形式千变万化,实现的工具众多。其 中,Python语言因其开源和包容的特性,嵌入了大量数据可视化的工具,深受大 家的喜爱。七、结语本章通过“网络平台的客户行为数据分析和可视化表达”工程,进行自主、 协作、探究学习,让同学们认识大数据及其特征,认识大数据对人们日常生活的 影响,了解数据采集、分析和可视化表达的基本方法;学会选用恰当的软件工具 或平台处理数据,完成分析报告;理解对数据进行保护的意义,从而将知识建构、 技能培养与思维开展融入运用数字化工具解决问题和完成任务的过程中,促进信 息技术学科核心素养达成,完成工程学习目标。