《智能算法在图书管理系统中的应用概要(共6页).doc》由会员分享,可在线阅读,更多相关《智能算法在图书管理系统中的应用概要(共6页).doc(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上智能算法在图书管理系统中的应用研究摘 要 智能算法在管理大型数据库及挖掘其中有效知识方面 具有良好的性能,因此,众多研究人员将该类算法引入到提升图书 管理系统性能的研究中。本文将介绍几类基于关联分析技术和基于 聚类分析技术的智能算法,并展望未来智能算法在图书管理系统中 的应用前景。关键词 智能算法 图书管理系统 关联分析 聚类分 析1. 引言随着图书馆馆藏资源的不断增加,图书馆资源管理的难度也不断 加剧。从上世纪八十年代图书馆管理的自动化变革开始到如今大多 数图书馆自动化管理系统的使用时间均已超过 15年。在 15年间产 生的各类历史数据如资源搜索记录、读者借阅记录、
2、图书采购记录 等, 已变成一笔宝贵的财富, 然而, 受到现有管理系统功能的限制, 这些数据仅能作简单的存储及查询,其无法进行开发利用。在对图 书管理系统的多年开发和研究中,人们发现各类智能算法的数据挖 掘能力将能够大大提升图书管理系统的管理能力及对数据的利用 深度。本文将概括介绍近年来提到的一些智能算法在图书管理系统 中的应用实例,并展望智能算法在图书管理系统中的应用前景。 2. 智能算法在图书管理系统中的应用智能算法是指在各类复杂问题中,能够从大量复杂、模糊、随机的应用数据中找出数据产生规律,并对其进行自我启发式优化的计 算机算法。通过智能算法从各类大型管理系统的数据库中挖掘出来 的规律和知
3、识可以用在查询响应、 决策支持、 信息管理等许多方面。 通过研究人员多年的研究,该类算法在图书馆系统中的应用研究已 取得一定成果,本部分将着重介绍几类经常被提到的算法利用方式 及实验效果。2.1 关联分析算法关联规则挖掘技术由 r.agrawal 于 1993年提出,其强大的数据挖 掘能力,在金融业、工业领域及图书管理系统等大型数据库中得到 充分运用 1。关联规则分析技术算法的主要思想是首先寻找给定数据集中的频 繁项集,然后通过频繁项集生产强关联规则 2。在针对图书管理 系统的应用研究中,其主要包含三个步骤:第一步:将相关读者数 据经过预处理形成读者数据事务库;第二步,迭代识别事务数据库 中所
4、有支持度不低于用户设定阀值 min_sup的频繁项集;第二步, 在频繁项集中构造所有满足最小置信度阀值 min_conf的关联规则, 得到相应的读者行为规律。算法的复杂度主要受到项数、事务数、 事务平均宽度等因素限制,因此在实际应用中存在以下缺陷:频繁 扫描数据库、不适用于稠密集的关联规则挖掘、可能生成的关联规 则过于庞大等。针对这些缺陷,近年来不少学者提出了改进策略, 如基于逆向运算的优化策略、基于哈希表的优化策略、基于划分的优化策略等 3。在关于将关联分析算法应用到图书管理系统的研 究中,主要包括以下几类:(1 2009年鲍静提出了一类基于数据预处理技术和经典关联分析 方法 apriori
5、 算法的读者借阅挖掘工具,并利用该工具对安徽省图 书馆图书流通数据进行关联挖掘,仿真实验结果表明,通过引入兴 趣度对挖掘出的关联规则进行分析,证明该读者借阅挖掘工具可以 实现对读者兴趣度的分析,从而帮助图书馆馆员为读者提供个性化 服务 4;(2 2010年陈康提出利用改进的 eclat 算法设计图书推荐系统, 该改进算法源自 zaki 提出的一种比较典型的深度优先搜索和交叉 计数的频繁模式挖掘算法。改进算法充分利用了垂直数据表示和交 叉技术的高效优势,直接在垂直数据表示的数据集上通过广度优先 搜索和交叉计数产生频繁项集。仿真实验结果表明该算法可以在大 数据量的情况下实现关联规则的高效挖掘,产生
6、的知识库在图书推 荐系统中取得了良好的应用效果 5;(3 2011年林郎蝶、王灿辉提出了一类基于划分优化策略的改进 apriori 算法 l-apriori 算法,该算法利用中国图书馆分类 法将图书按分类号信息进行分类形成子图书馆,算法首先在各子 图书馆中进行关联规则的挖掘,再将所挖掘到的关联规则进行整 合,从而得到最终的挖掘结果 3。该算法的优势在于通过划分优 化后, l-apriori 算法的空间复杂度仅为 apriori 算法的 1/n,其中 n 为子图书馆的个数。2.2 聚类分析算法聚类分析(cluster analysis是数据挖掘技术中的一种典型方 法,该类算法可在要划分的类未知的
7、情况下,将数据对象分组成不 同的类。聚类的基本方法在建立基于分析对象的数据矩阵或相异度 矩阵中,通过计算对象之间的距离来衡量对象之间的相似性或相异 性,从而对数据对象进行分类。由于该技术仿真了一个无监督的学 习过程,因此被广泛应用于各类大型数据库中。现有的聚类技术种 类很多,主要有层次方法、划分方法、基于密度的方法、基于网格 的方法、基于模型的方法等 2。目前,在针对图书管理系统的研 发中,研究人员尝试将多种基于聚类分析技术的算法使用在图书管 理系统中,并在仿真实验中取得了一些成果。下面内容将具体介绍 几类算法。(1 2010年武建伟、俞晓红、陈文清等人提出了利用基于密度的 动态协同过滤算法改
8、进现有的图书推荐系统 6。与传统的静态协 同过滤算法不同,动态协同过滤算法首先利用模糊隶属函数根据读 者借阅图书的时间长度筛选出读者对借阅图书的兴趣度,并利用基 于密度的 db-scan 算法在按中图法划分的区域中进行聚类操作,从 而建立用户的兴趣模型。在数据的增长和变化中,用户的兴趣聚类 区域密度及权重将发生变化,从而实现动态的协同过滤推荐 6。 在仿真实验中,作者以洛阳理工学院图书管理系统读者借阅数据为实验对象进行仿真计算。结果表明,改进后的动态算法在邻居数从 5增加到 26时,其平均绝对偏差值均小于静态算法 0.05,说明基 于密度动态的协同过滤推荐算法在预测读者兴趣度方面精度更高 6。
9、(2 2011年杨雪霞提出利用遗传算法(genetic algorithm , ga 为模糊 k-prototypes 寻找初始聚类中心的 ga-fkp 算法,并取得了 良好的仿真实验效果 7。 模糊 k-prototypes (fuzzy k-prototypes , fkp 算法可以针对由多类型数据构成且分类模糊的数据集合进行 分类,然而 fkp 算法存在易陷入局部最优解和初始化敏感的缺点, 为解决这个问题,杨雪霞提出了利用遗传算法帮助 fkp 算法进行选 取初始参数, 然后通过 kfp 算法对个体进行优化从而得到最终结果。 在 ga-fkp 算法的数据结构中对遗传算法在知识表示方面的缺陷
10、做 了很好的处理:使用聚类中心来表示组成问题的结果,即一个聚类 中心向量表示一个基因,而所有聚类中心则组成了遗传算法中的个 体,如公式 2-1所示。个体 y 中的每个基因表示如公式 2-2所示。 公式 2-1公式 2-2其中,表示个体结构,为 i 位置基因, n 为样本数, k 为目标聚类 数 7。利用该类编码方式,解决了遗传算法与 kfp 算法间的接口 问题,使得两类算法可以相互融合,从而形成适合处理读者细分问 题的 ga-fkp 算法。在仿真实验中,作者选用了河南师范大学图书馆 2006 年到 2010 年的读者数据集进行细分,通过细分结果可以帮 助馆员了解不同类型读者对图书的利用状况,从
11、而为读者提供更好 的个性化服务。 (3)2011 年茹蓓、赵芳提出了利用 k-means 算法分析读者借阅行 为,为图书馆管理提供有用信息。k-means 算法是去类算法中的经 典算法之一,该算法首先接收输入量 k,并把 n 个数据对象划分为 k 个聚类,然后基于对象之间的距离来计算相异度8。算法的主要 流程包含四个步骤:第一步,随机选择 k 个对象,以每个对象为中 心来代表数据集将被分成的 k 个类; 第二步,根据“距离中心最近” 的原则,寻找与对象相似的类并将其划分到相应的类中;第三步, 完成对象分配后,计算每一个类中所有对象的平均值,作为新的中 心;第四步,根据“距离中心最近”的原则,重
12、新划分所有对象。 反复执行第三步和第四步,直到所有产生的类没有变化为止。利用 该算法,可以将分散的读者借阅数据进行有效划分,找出读者借阅 行为中的规律,从而帮助图书馆管理人员制定相应的服务方案及馆 藏发展计划。 3.前景展望 随着图书管理系统研究的不断深入,及读者对服务质量要求的不 断提升。图书馆的作用早已不仅仅只是借阅图书。为各类读者提供 个性化服务,为学校提供教学、科研和发展规划的有效信息资源已 成为当前图书馆员的工作目标。然而,要从海量的系统数据中,挖 掘出并准确把握住不同读者的需求,找出最有效的资源是当前图书 馆界的难题。智能算法的出现,为解决这一难题提供了很好的解决 方案,因此,众多
13、研究人员进入到这一领域进行了积极尝试并获得 了良好的实验效果。随着研究的不断深入,相信这些算法将不断成 熟,并最终应用到实际的图书管理系统中。 参考文献: 1赵霞彤.数据挖掘技术在图书管理系统中的应用d.南京:南 京邮电大学,2009. 2朱福喜,杜有福,夏定纯.人工智能引论m.武汉大学出版 社,2006.283-305. 3林郎蝶,王灿辉.apriori 算法在图书推荐服务中的应用与研究 j.计算机技术与发展,2011,5(21:22-28. 4鲍 静.关联规则挖掘及其在图书流通数据中的应用研究d. 合肥:合肥工业大学,2007. 5陈康.基于 eclat 算法的图书推荐系统仿真j.计算机仿 真,2010,9(27:311-314. 6武建伟,俞晓红,陈文清.基于密度的动态协同过滤图书推荐算 法j.计算机应用研究,2010,27(8:3013-3015. 7杨雪霞.基于聚类的图书馆读者细分算法研究与应用j.福建 电脑,2011,6:9-10. 8茹 蓓,赵 芳.聚类算法在图书馆中的应用j.新乡学院学报: 自然科学版,2011,1(28:41-43. 专心-专注-专业
限制150内