数据挖掘在Web中的应用案例分析.doc
《数据挖掘在Web中的应用案例分析.doc》由会员分享,可在线阅读,更多相关《数据挖掘在Web中的应用案例分析.doc(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、如有侵权,请联系网站删除,仅供学习与交流数据挖掘在Web中的应用案例分析【精品文档】第 4 页数据挖掘在Web中的应用在竞争日益激烈的网络经济中,只有赢得用户才能最终赢得竞争的优势。作为一个网站,你知道用户都在你的网站上干什么吗?你知道你的网站哪些部分最为用户喜爱、哪些让用户感到厌烦?什么地方出了安全漏洞?什么样的改动带来了显著的用户满意度提高、什么样的改动反而丢失了用户?你怎样评价你的网站广告条的效率、你知道什么样的广告条点击率最高吗?“知己知彼,才能百战不殆”,你真的了解自己吗?挑战的背后机会仍存,所有客户行为的电子化(Click Stream),使得大量收集每个用户的每一个行为数据、深入
2、研究客户行为成为可能。如何利用这个机会,从这些“无意义”的繁琐数据中得到大家都看得懂的、有价值的信息和知识是我们面临的问题。问题:1. 根据你所学的知识,思考从网站中所获取的大量数据中,我们能做哪些有意义的数据分析? 基于WEB 使用的挖掘,也称为WEB 日志挖掘(Web Log Mining)。与前两种挖掘方式以网上的原始数据为挖掘对象不同,基于WEB 使用的挖掘面对的是在用户和网络交互的过程中抽取出来的第二手数据。这些数据包括:网络服务器访问记录、代理服务器日志记录、用户注册信息以及用户访问网站时的行为动作等等。WEB 使用挖掘将这些数据一一纪录到日志文件中,然后对积累起来的日志文件进行挖
3、掘,从而了解用户的网络行为数据所具有的意义。我们前面所举的例子正属于这一种类型。 基于WEB 内容的挖掘:非结构化 半结构化文本文档 超文本文档Bag of words n-grams 词短语 概念或实体 关系型数据TFIDF 和变体机器学习统计学(包括自然语言处理)归类 聚类发掘 抽取规则 发掘文本模式 建立模式. 基于WEB 结构的挖掘:半结构化 数据库形式的网站 链接结构超文本 文档链接边界标志图 OEM 关系型数据 图形Proprietary 算法 ILP (修改后)的关联规则发掘高频的子结构 发掘网站体系结构 归类 聚类. 基于WEB 使用的挖掘:交互形式服务器日志记录 浏览器日志记
4、录关系型表 图形Proprietary 算法 机器学习 统计学 (修改后的)关联规则站点建设 改进与管理 销建立用户模式.2. 根据你所学的数据挖掘知识,谈谈哪些数据挖掘技术可以应用于Web中,以这些数据挖掘技术可以完成哪些功能?Web Mining 技术已经应用于解决多方面的问题,比如基于WEB 内容和结构的挖掘极大的帮助了我们从浩瀚的网络资源中更加快速而准确的获取所需要的资料,而基于使用的数据挖掘之威力,更是在商业运作上发挥的淋漓尽致,具体表现在:(1) 对网站的修改能有目的有依据稳步的提高用户满意度发现系统性能瓶颈,找到安全漏洞,查看网站流量模式,找到网站最重要的部分,发现用户的需要和兴
5、趣,对需求强烈的地方提供优化,根据用户访问模式修改网页之间的连接,把用户想要的东西以更快且有效的方式提供给用户,在正确的地方正确的时间把正确的信息提供给正确的人。(2) 测定投资回报率 测定广告和促销计划的成功度 找到最有价值的ISP 和搜索引擎 测定合作和结盟网站对自身的价值(3) 提供个性化网站 对大多数WEB 应用来说,让用户感到真个网站是完全为他自己定制的个性化网站,是WEB 站点成功的秘诀。针对不同的用户完全按照其个人的兴趣和爱好(数据挖掘算法得到的用户访问模式)向用户动态的提供要浏览的建议自动提供个性化的网站。3. 通过对问题(1)和(2)的回答,你认为用户和网站经营者分别可以得到
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 挖掘 Web 中的 应用 案例 分析
限制150内