基于数据挖掘技术的汽车销售状态分析与应用_刘世军.docx
《基于数据挖掘技术的汽车销售状态分析与应用_刘世军.docx》由会员分享,可在线阅读,更多相关《基于数据挖掘技术的汽车销售状态分析与应用_刘世军.docx(90页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 THE ANALYSIS AND APPLICATION OF AUTOMOBILE SALES STATUS BASED ON DATA MINING TECHNOLOGY A Thesis Submitted to Southeast University For the Degree of Master of Engineering By Liu Shijun Supervised by Associate Professor Chong Zhihong Senior engineer Li Bailiang College of Software Engineering Southe
2、ast University 2016.6 东 南 大 学 学 位 论 文 独 创 性 声 明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得 的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含 其他人已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构 的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均 已在论文中作了明确的说明并表示了谢意。 东 南 大 学 学 位 论 文 使 用 授 权 声 明 东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位 论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保
3、存论文。本人 电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论 文被查阅和借阅,可以公布(包括以电子信息形式刊登)论文的全部内容或中、 英文摘要等部分内容。论文的公布(包括以电子信息形式刊登)授权东南大学研 究生院办理。 摘 要 在互联网 +和大数据背景下,汽车企业管理和营销更加依赖对客户行为、偏 好数据的收集和分析挖掘,支持潜在市场开拓、客户粘性维护等公司营销的各个 环节。潜在汽车客户分析是建立品牌和客户关系的重要技术环节,通过店展厅、 来电客户访问、来店拜访、 WEB 在线分析客户的行为等渠道收集客户行为和偏 好,从中进行挖掘潜在客户,有效支持市场推广效果。从多种渠道
4、收集的信息具 有大数据的基本特性:数据容量大、非结构化、实时性强等特点,对数据分析带 来挑战,造成挖掘结果准确性问题。针对上述问题,本文侧重通过无导师的数据 分析技术研究客户聚类问题,支持精准潜在客户识别问题的解决。基本方法是基 于主成分分析法的特征构建和两阶段聚类分析方法,同时为了快速有效地分析和 利用已有客户,提出了基于改进的 Hash 快速属性约简算法的汽车客户分析模型, 具体取得以下的主要成果: 1. 本文立足于基于主成分分析法和两阶段聚类分析法的汽车潜在客户开发 和管理的研究。根据汽车客户选择的数据自身特点,聚 类分析能够自动进行数据 信息的挖掘,其具有低成本、占用内存资源少、简单易
5、行的特点。采用主成分分 析法提取汽车客户分类的主要影响因子,并在此基础上,利用两阶段聚类分析法 进行潜在汽车客户分析。 2. 分析基于 Hash 快速属性约简算法,并分析其具有的特点及存在的缺陷。 针对其缺陷或者低效性提出了改进方案,其可以有效地提高约简算法效率,使得 计算复杂度进一步降低。实验发现可以提高效率达到 20 30%。通过系统计算的 复杂度和效率性,总结出了改进算法的优越性。 3. 基于上述两个分析方法,开发了汽车销售状态分 析系统,利用历史销售 客户数据库信息和以往的调研数据信息产生决策树,为销售人员针对不同的客户 制定不同的销售策略提供帮助,并进一步探索汽车销售服务行业的潜在客
6、户策略。 利用以往销售数据库的信息产生约简属性,指导销售人员根据客户的信息推荐不 同的汽车配置,这对于汽车销售产业更好地实践客户服务具有一定的指导价值。 关键字:数据挖掘;聚类分析 ;汽车销售 ; Hash Abstract Under the background of Internet plus and big data, auto enterprise management and marketing are more dependent on the data collection and analysis of the customer behavior, preferences,
7、and support every link of company sailing such as the potential market development and customer support maintenance. Potential auto customer analysis is an important technology of the brand and customer relationship, which is mainly through the exhibition, store call customer visit and shop visit, W
8、EB data mining of on-line analysis of customer behavior and preferences to mining potential customers and effective support for market promotion effect. Collected from a variety of sources of information exists the basic characteristic of the big data which is large data capacity, unstructured, stro
9、ng real-time. It brings a challenge for data analysis, and leads to the accuracy problem of the mining results. For the above problem, through the analysis of the data without a mentor, the customer clustering analysis is on research. It is solved the accurate potential customers to identify. The me
10、thod based on principal component analysis (PCA) and two stages of clustering analysis of the analysis of the potential auto customer is proposed. Moreover, in order to analysis and make use of the existing customers quickly and efficiently, the improved Hash summarized. 3. Intelligent analysis plat
11、form is developed. It makes use of historical sales customer database information and previous research data information to generate the decision tree to help sales provide different sales strategy according to different customers. It could enhance the customer loyalty and satisfaction strategy in t
12、he automobile sales and service. The aim of the system is to direct sales personnel to recommend different car configuration according to the customers information through the attribute reduction results of previous sales database information which 目 录 “ 摘 M . I ABSTRACT . II $ - 章 绪 论 . 1 1. 1 研究背景
13、 . 1 1.2 国内外研究现状 . 4 L 2.1 数据挖掘技术 . 4 1.2. 2 大数据挖掘下的汽车销售 . 5 1.3 论文研究内容 . 9 1.4 论文组织结构 . 10 第二章相关知识介绍 . 11 2. 1 汽车行业数据挖掘技术概述 . 11 2. 1. 1 数据挖掘技术的定义 . 11 2. 1.2 汽车数据挖掘技术的发展 . 11 2. 1. 3 汽车数据挖掘技术过程 . 12 2. 1. 4 汽车数据挖掘技术的功能 . 13 2. 1. 5 汽车数据挖掘技术的常用算法 . 14 2_ 2 基于主成分析法的特征选择 . 16 2. 3 数据挖掘聚类分析 . 19 2. 3.
14、 1 数据挖掘聚类分析 . 19 2. 3. 2 聚类分析的方法 . 20 2. 3. 3 层次聚类算法 . 23 2. 3. 4 两阶段聚类分析 . 24 2. 4 信息系统属性约简 . 25 2. 5 本章小结 . 28 第 =章基于主成分分析和两阶段聚类分析的汽车潜在客户分析模型 . 29 需求分析和问题定义 . 29 2 两阶段聚类分析在汽车潜在客户分析中的应用 . 30 3.2. 1 汽车潜在客户分析 . 31 3. 2. 2 两阶段聚类分析的汽车潜在客户分析流程 . 35 3.2.3 两阶段聚类分析在汽车潜在客户分析中的应用 . 38 3.2.4 两阶段聚类分析在汽车潜在客户分析中
15、改进 . 38 3. 3 本章小结 . 39 第 四 章 基 于 HASH 快速属性约简的聚类算法改进 . 40 4. 1 需求分析及问题定义 . 40 4.2 基于 HASH 快速属性约简聚类算法 . 41 4. 2_ 1 基本定义以及性质 . 41 4. 2. 2 基于 Hash 快速属性约简算法的三种子算法 . 42 4. 2. 3 基于 Hash 快速属性约简算法的分析 . 44 4. 2. 4 基于 Hash 快速属性约简聚类算法 . 47 4. 3 基于 HASH 快速属性约简聚类算法的改进方案 . 47 4. 3. 1 改进方案的算法 . 47 4. 3. 2 改进方案的分析 .
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 数据 挖掘 技术 汽车 销售 状态 分析 应用 刘世军
限制150内