电商销售数据分析21957.pptx
《电商销售数据分析21957.pptx》由会员分享,可在线阅读,更多相关《电商销售数据分析21957.pptx(34页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、LOGO电商销售记录分析电商销售记录分析 严智强、贺强、刘瑞、严智强、贺强、刘瑞、崔亚松、臧茹歌崔亚松、臧茹歌Background网购流网购流行行电商崛电商崛起起消费人消费人群群消费习消费习惯惯潜在价潜在价值值消费记消费记录录消费喜消费喜好分析好分析市场方市场方向向Contentscontentscontents电商数据电商数据电商数据电商数据天猫手机销售数据分析天猫手机销售数据分析天猫手机销售数据分析天猫手机销售数据分析京东商城销售数据分析京东商城销售数据分析京东商城销售数据分析京东商城销售数据分析数据的数据的获取与获取与预处理预处理替代商替代商品的挖品的挖掘掘价格空价格空洞的发洞的发现现牛
2、仔裤销牛仔裤销售数据的售数据的分析分析用户消费用户消费记录的分记录的分析析淘宝网作为国内第一大电商,占有淘宝网作为国内第一大电商,占有近近50%市场份额,而天猫商城则是市场份额,而天猫商城则是所有优质店铺的集合,每月会产生所有优质店铺的集合,每月会产生大量销售数据,这里以天猫近一个大量销售数据,这里以天猫近一个月的手机销售数据进行分析,找出月的手机销售数据进行分析,找出这些数据隐含的价值。这些数据隐含的价值。天猫手机销售数据分析天猫手机销售数据分析天猫手机销售数据分析天猫手机销售数据分析数据的获取与预处理数据的获取与预处理 替代商品的挖掘替代商品的挖掘价格空洞的发现价格空洞的发现数据的获取与处
3、理数据的获取与处理构建一个爬虫脚本,从天猫上获取销量前构建一个爬虫脚本,从天猫上获取销量前600的手机的手机销售记录,并匹配出每条记录的机型、售价、销量。销售记录,并匹配出每条记录的机型、售价、销量。How to get the data爬虫脚本爬虫脚本#coding=gbkimport urllibimport ref1=open(rE:tmaoshoujihtml.txt)#此处存储了销量前此处存储了销量前600的网页地址的网页地址http=f1.readlines()f1.close()f2=open(rE:tmaoshouji.txt,a)for i in http:content=u
4、rllib.urlopen(i.strip().read()f2.write(content)f2.write(n)f2.write(#*50)f2.write(n)f2.close()f3=open(rE:tmaoshouji.txt)lines=for line in f3.readlines():lines+=line.strip()f3.close()pattern=rem title=(.*?).*?.*?target=_blank title=(.*?).*?(.*?)result=re.findall(pattern,lines)f4=open(rE:tmaoshoujiInfo
5、rmation.txt,w)#该文件中存储了每件手机的记录(机型、售价、销量)该文件中存储了每件手机的记录(机型、售价、销量)for item in result:for j in range(3):f4.write(itemj)f4.write(t)f4.write(n)f4.close()销量销量价格价格 散点图散点图 替代商品的挖掘替代商品的挖掘 我们认为,如果两件手机的售价和销我们认为,如果两件手机的售价和销量十分接近,则认为这两件手机互为替代量十分接近,则认为这两件手机互为替代商品。从网络营销的特点来看,从店铺的商品。从网络营销的特点来看,从店铺的角度出发,选择进价更低的手机可获得更
6、角度出发,选择进价更低的手机可获得更多利润。多利润。替代商品的挖掘替代商品的挖掘我们以欧氏距离小于等于我们以欧氏距离小于等于2为标准为标准sqrt(a.price-b.price)2+(a.sales_number-b.sales_number)2)=2将手机聚类,找出互为替代的手机。将手机聚类,找出互为替代的手机。替代商品的挖掘替代商品的挖掘from _future_ import divisionfrom math import sqrt#coding=gbkf1=open(rE:tmaoshoujiInformation.txt)records=f1.readlines()f1.clos
7、e()price=number=product=for i in range(len(records):item=recordsi.split(t)price.append(item0)product.append(item1)number.append(item2)for i in range(len(price):for j in range(i+1,len(price):distance=sqrt(pow(float(pricei)-float(pricej),2)+pow(int(numberi)-int(numberj),2)if distance=2:#if the distanc
8、e minuse 2,we consider the two is replaced product print producti,t,productj else:pass所得结果所得结果结果发现,下列每一组中的手机互为替代商品结果发现,下列每一组中的手机互为替代商品(a)UMO/优摩优摩 w9220 Yusun/语信语信 T28(b)Huawei/华为华为 C8812 ZTE/中兴中兴 N807(c)OPPO U705T TCL Y910T(d)Coolpad/酷派酷派 8150D ZTE/中兴中兴 V889D(e)K-Touch/天语天语 E800 UMO/优摩优摩 W800 七喜七喜 T
9、D710(f)UMO/优摩优摩 W800 七喜七喜 TD710 Konka/康佳康佳 E5680(g)UniscopE/优思优思 U1201 Huawei/华为华为 Y300-0000(h)Coolpad/酷派酷派 8050 Coolpad/酷派酷派 E239(i)Motorola/摩托罗拉摩托罗拉 XT800 索爱正品索爱正品SA-I960 安卓安卓4.0(j)Coolpad/酷派酷派 8020 Haier/海尔海尔 HT-I600(k)七喜七喜 H750 Gionee/金立金立 C620(l)Lenovo/联想联想 A790E 广信广信 ef58(m)Huawei/华为华为 c8810 S
10、amsung/三星三星 s6108(n)AUX/奥克斯奥克斯 V930 TCL Y710(o)Philips/飞利浦飞利浦 W8355 ONN/欧恩欧恩 V8 16G版版(p)TCL Y710 Gionee/金立金立 GN705w价格空洞的发现价格空洞的发现经过分析,我们发现,作为中高端机营销,可选择经过分析,我们发现,作为中高端机营销,可选择3500-4000的价格空洞。可在较小压力下打入市场。的价格空洞。可在较小压力下打入市场。京东商城销售数据分析京东商城销售数据分析牛仔裤销售数据分析牛仔裤销售数据分析 用户消费记录的分析用户消费记录的分析从生产厂家的角度来说,如果得到大量消从生产厂家的角
11、度来说,如果得到大量消费者的尺码大小及颜色偏好,则对生产和费者的尺码大小及颜色偏好,则对生产和销售是非常有利的。因此,我们统计了京销售是非常有利的。因此,我们统计了京东女性牛仔裤的销售记录,从中得到各尺东女性牛仔裤的销售记录,从中得到各尺码和颜色在总的销售数据中的比例,从而码和颜色在总的销售数据中的比例,从而指导生产。指导生产。通过用户的消费记录,分析出用户的喜好通过用户的消费记录,分析出用户的喜好品牌,从而当该品牌有新产品推出和促销品牌,从而当该品牌有新产品推出和促销活动时优先推荐给这些用户。活动时优先推荐给这些用户。牛仔裤销售数据分析牛仔裤销售数据分析用户尺码大小用户尺码大小 颜色偏好颜色
12、偏好数据获取与预处理数据获取与预处理 以爬虫程序从京东商城获取牛仔裤销售记以爬虫程序从京东商城获取牛仔裤销售记录,并过滤出每个用户所购买的颜色、尺录,并过滤出每个用户所购买的颜色、尺码。码。数据获取与预处理数据获取与预处理#coding=gbkimport reimport urllibpage=16,16,16,16,16,16,16,16,15,15,15,15,15,15,15,14,14,14,14,14,13,13,13,13,13,13,12,12,12,12,12,12,12,12,12,12#page记录了每件商品的评论页面数目记录了每件商品的评论页面数目f1=open(rC:
13、UsersYANZHIQIANGDesktopjdongNiuZaiKuAdd.txt)#goods存储商品评论地址存储商品评论地址goodslist=f1.readlines()f1.close()s1=rE:jdongniuzaikupinglunAdds3=.txtfor i in range(0,len(goodslist):for j in range(1,pagei+1):content=urllib.urlopen(goodslisti.strip()+str(j)+-0.html).read()print goodslisti.strip()+str(j)+-0.html sa
14、ve=s1+str(i)+s3 f2=open(save,a)f2.write(content)f2.write(goodslisti.strip()+page+str(j)+downloaded n)f2.write(#n)f2.close()s1=rE:jdongniuzaikupinglunAdds3=.txt数据获取与分析数据获取与分析for i in range(0,35):s=s1+str(i)+s3 f=open(s)lines=for line in f.readlines():lines+=line.strip()f.close()color=r颜颜.*?色:色:(.*?)s
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 销售 数据 分析 21957
限制150内