基于用户群体行为分析的搜索引擎自动性能评价.ppt
《基于用户群体行为分析的搜索引擎自动性能评价.ppt》由会员分享,可在线阅读,更多相关《基于用户群体行为分析的搜索引擎自动性能评价.ppt(47页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、基于用户群体行为分析的搜索引擎自动性能评价,清华大学智能技术与系统国家重点实验室马少平2008年4月12日,南昌,提纲,研究背景信息检索系统的评价方法基于用户行为分析的搜索引擎性能评价演示系统:搜索仪结论与未来工作,研究背景,Web的发展带来了什么?信息量的急剧增长1994年,面向个人用户的浏览服务诞生2002年,Web上所存储的数据超过500,000 TB知识的获取空前简单与繁荣“在信息化时代,知识实际上已经不是资源,智慧才是资源。”从Web中有效的获取知识成为人们的必需技能高科技企业员工1/3的时间用于查找资料,研究背景,网络信息检索工具成为人们生活和工作中的重要信息获取手段全球范围内84
2、%的互联网用户使用搜索引擎,其中超过一半的人几乎每天使用。 2007年1月,我国网民总人数为13700万人。95%以上的中国网民使用过搜索引擎,84.5%的用户将搜索引擎作为得知新网站的主要途径。商用搜索引擎竞争日趋激烈。,研究背景,性能评价对搜索引擎的重要作用对搜索引擎用户而言:挑选最有利于获取信息的手段对搜索引擎工程师而言:算法及数据处理方式有效性的判断对搜索引擎广告商而言:挑选最有效的广告投放手段,研究背景,搜索引擎评价的考察方式搜索引擎作为网络服务供应商的属性形式:用户问卷调查举例:CNNIC中国搜索引擎市场调查报告搜索引擎作为网络信息检索工具的属性形式:传统的信息检索评价方法在网络环
3、境中的应用。举例:TREC VLC/Web/Terabyte track,SEWM评测等,作为信息检索研究人员,我们的考察重点,提纲,研究背景信息检索系统的评价方法基于用户行为分析的搜索引擎性能评价演示系统:搜索仪结论与未来工作,信息检索系统的评价方法,评价在信息检索研究中发挥着重要的作用评价在信息检索系统的研发中一直处于核心的地位,以致于算法与其效果评价方式是合二为一的(Saracevic, SIGIR 1995)信息检索系统评价的起源Kent等人第一次提出了关于Precision和Recall(开始称为relevance)的概念(Kent, 1955),信息检索系统的评价方法,信息检索系统
4、评价的起源(续)Cranfield-like evaluation methodologyCranfield在上世纪伍十年代末到六十年代初提出了基于查询样例集、标准答案集和语料库的评测方案,被称为IR评价的“grand-daddy”确立了评价在信息检索研究中的核心地位Gerard Salton 与 SMART 系统Sparck-Jones 的著作 “Information retrieval experiment”在线:http:/www.itl.nist.gov/iaui/894.02/projects/irlib/,信息检索系统的评价方法,网络信息检索系统效果评价的现状数据对象繁杂,标注困
5、难Voorhees 估计,对一个规模为800万的文档集合进行针对1个查询主题的相关性评判需要耗费1名标注人员9个月的工作时间TREC提出pooling方法,在保证评价结果可靠性的基础上大大减少了评判工作量缺点:处理的查询数目少,针对小规模的查询集合,仍需要耗费十余名标注人员1-2个月的工作时间提高搜索引擎评价方法的自动化程度势在必行,信息检索系统的评价方法,如何提高搜索引擎评价的自动化程度?,查询样例选取,标准答案标注,查询样例集合,标准答案集合,检索系统查询结果,信息检索系统的评价方法,核心问题: 如何提高答案标注的自动化程度利用伪相关反馈的方法进行结果自动标注伪相关反馈的结果被认为是答案S
6、oboroff et.al, 2001; Nuray et.al, 2003; Beitzel et.al., 2003标注的准确程度和可靠性不高对查询词的近义词集合进行标注根据结果网页的查询词及近义词词频进行评判Amitay et.al, 2004初始标注工作量大,评判的可靠性不高,信息检索系统的评价方法,核心问题: 如何提高答案标注的自动化程度利用用户行为分析方法Joachims et.al.(1997) 创建了一个元搜索接口,将不同搜索引擎的结果加以混杂,把用户点击不同结果的情况加以记录,并以此作为评判依据用户行为分析的思路值得肯定缺点:改变用户检索习惯、个体用户行为不可靠等我们的研究思
7、路通过对搜索引擎记录下的用户行为日志进行分析,不额外增加用户负担。使用用户群体,而不是个体的点击行为作为依据,提纲,研究背景信息检索系统的评价方法基于用户行为分析的搜索引擎性能评价演示系统:搜索仪结论与未来工作,基于用户行为分析的性能评价,总体思路基于Cranfield方式进行评价丰富的研究经验:评价指标、查询样例选取策略等便于与传统的手工标注评价方式进行比较基于用户关注程度进行查询样例选取基于用户行为信息进行答案自动标注个体用户可能在点击过程中出现谬误用户群体的点击信息则是很大程度上可靠的统计用户群体的点击行为,进而对查询对应的结果进行标注,搜索引擎效果自动评价,基于用户关注程度进行查询样例
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 用户 群体 行为 行动 分析 搜索引擎 自动 性能 机能 评价
限制150内