数据仓库与数据挖掘分析.doc
《数据仓库与数据挖掘分析.doc》由会员分享,可在线阅读,更多相关《数据仓库与数据挖掘分析.doc(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Adventure Works分销商销售数据分析-Womens Tights一、概述Womens Tights型号共三种产品,分别为“Womens Tights,L”、“omens Tights,M”和“omens Tights,S”。这三种商品在拿大、法国和英国均有销售。在Adventure WorksDW数据库中查询得知三种产品的总销售额如下:表 1 三种商品销量对比English Product NameSales AmountWomens Tights, L$93,554.46Womens Tights, M$17,727.64Womens Tights, S$90,550.91总计$
2、201,833.01 查询命令为:SELECT DimProduct.EnglishProductName AS 产品, SUM(FactResellerSales.SalesAmount) AS 销售额FROM DimProduct INNER JOIN FactResellerSales ON DimProduct.ProductKey = FactResellerSales.ProductKeyGROUP BY DimProduct.EnglishProductName, DimProduct.ModelNameHAVING (DimProduct.ModelName = Womens
3、Tights) 从上表可以看出,Womens Tights, L与Womens Tights, S的销量相当,而Womens Tights, M的销量明显低于另两种,其销量只占总销量的9%。会有如此大的差距呢?下面运用OLAP技术进行分析。为叙述方便,下文用“M”简称Womens Tights, M,用“L”表示Womens Tights, L,用“S”表示Womens Tights, S。 二、多维数据集的设计1、事实表的设计:本任务主要考查销售额,因此需要的销售额、运费和税额三个主要指标;2、维度表的设计:影响销售的因素有很多,如销售商、销售团队、区域、时间、促销手段等,所以此处设计了雇员
4、、分销商、促销、产品、订单日期、销售区域等维度。 三、数据分析 1、将销售数据按年度分割,以确认是否与时间有关以年度为列字段,产品名称为行字段,销售额为数据字段设计立方体。表 2 分年度销售额Sales AmountCalendar YearEnglish Product Name20022003总计Womens Tights, L$54,257.97$39,296.49$93,554.46Womens Tights, M$12,508.33$5,219.30$17,727.64Womens Tights, S$56,129.63$34,421.28$90,550.91总计$122,895.9
5、3$78,937.08$201,833.01图 1 分年度销售额直方图从上图来看,2002年和2003年Womens Tights,M的销量都明显低于另两种商品,且2003年的销量还不及2002年的一半,下降的幅度较另外两种更明显。为进一步分析M的销售额是否爱时间的影响,对两年的销售数据按周进行钻取,如下表所示:表 3 三种产品分周销售额YearWeekWomens Tights, LWomens Tights, MWomens Tights, S总计M所占比重200227$8,130.34$1,529.80$8,817.50$18,477.648.28%31$12,040.01$2,609.
6、65$12,441.75$27,091.419.63%36$8,739.59$2,429.68$9,582.15$20,751.4211.71%40$7,677.33$1,484.80$7,045.04$16,207.179.16%44$10,144.89$2,204.71$10,445.66$22,795.259.67%49$7,525.82$2,249.70$7,797.52$17,573.0412.80%20031$4,139.45$3,689.51$7,828.960.00%14$6,829.58$1,529.80$5,688.17$14,047.5510.89%18$9,403.75
7、$1,934.74$8,129.29$19,467.789.94%23$8,965.86$1,754.77$7,159.42$17,880.059.81%5$4,904.35 $4,949.34$9,853.690.00%9$5,053.52 $4,805.55$9,859.060.00%总计$93,554.46$17,727.64$90,550.91$201,833.018.78%从表3看出,在有销售的各周里,M的销售额占总销售额的比重均低(最高也仅12.8%)。这说明M的销售额显著低于L和S这个现象不受时间影响,按时间再继续向下钻取已无必要。2、按销售区域分割: 以销售区域为列字段,以产品
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 数据 挖掘 分析
限制150内