《人工智能之知识库讲课稿.ppt》由会员分享,可在线阅读,更多相关《人工智能之知识库讲课稿.ppt(42页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、人工智能(rn n zh nn)知识库第一页,共42页。报告(bogo)提纲相关相关(xinggun)文献文献A知识库的相关知识库的相关(xinggun)内容内容本知识库下一步的工作方向本知识库下一步的工作方向第二页,共42页。近期(jn q)看过的文献1.知识(zh shi)库方面的文献(19)aai07-analogy.pptOracle数据库系统和知识(zh shi)库建造.doc从 SQL优化角度对医院信息系统进行优化.pdf基于Lucene的全文检索系统的研究与应用.nh基于Native XML数据库的知识(zh shi)库系统应用研究.pdf基于Oracle Text的电子银行知识
2、(zh shi)库系统设计.pdf基于Oracle XML DB的学科知识(zh shi)库设计与实现.pdf基于Oracle数据库系统的知识(zh shi)库建造.pdf基于SQL Server数据库和C+实现专家系统外壳.pdf基于数据库的保质设计制图综合知识(zh shi)库研究.pdf基于知识(zh shi)的产品设计数据库的设计与实现.pdf基于知识(zh shi)的故障诊断方法综述.pdf学术论文导航系统知识(zh shi)库的构建与实现.pdf数据库系统中SQL语句优化.pdf类比推理研究的回顾与展望.pdf面向对象电网知识(zh shi)库系统的研究与实践.pdf运用ACCES
3、S数据库建立高原知识(zh shi)库管理系统.pdf智能故障诊断技术综述.pdf中医专家系统技术综述及新系统实现研究.pdf2.Oracle方面的文献(方面的文献(5)ORACLE中中SQL执行原理及性能优执行原理及性能优化研究化研究.pdfORACLE数据库中数据库中SQL优化解析优化解析.pdfOracle数据库性能的优化设计数据库性能的优化设计.pdfSQL Server环境环境(hunjng)下的下的SQL优化方法探讨优化方法探讨.pdf基于基于Oracle XML DB的的XML文档存文档存取技术取技术.pdf第三页,共42页。知识库的基本概念 知识是智能的基础。人类制定决策的过程
4、是一个“数据信息知识”的层次结构。数据用来表示事实信息是数据的“浓缩(nn su)”及对数据进行组合、概括、校对、比较、分类以及其它处理过程,转变成方便人们做出决策的形式,即信息知识,它是人类制定决策的基础。第四页,共42页。第五页,共42页。知识(zh shi)的特性 1)知识的相对性在一定条件及环境下,知识是正确的和可信任的。其中“在一定条件及环境下”这一限定是必不可少(b b k sho)的,它是知识正确性的前提。因为任何知识都是在一定的条件和环境下产生的,所以也只有在这种条件及环境下才是正确的。第六页,共42页。2)知识的不确定性。由于(yuy)现实世界的复杂性,信息可能是精确的,也可
5、能是模糊的;关联可能是确定的,也可能是不确定的。这就使得知识并不总是只有“真”或“假”两种状态,而是在“真”或“假”之间还存在许多中间状态,即存在为“真”的程度问题。a、由随机性引起的不确定性:b、由模糊性引起的不确定性;c、由不完全性引起的不确定性;d、由经验性引起的不确定性。第七页,共42页。(3)知识的可表示(biosh)与可利用性知识可以用语言、文字、图形、神经元网络等,并通过相应形式加以利用和掌握。第八页,共42页。知识(zh shi)的表示 对知识进行表示的过程(guchng)就是把知识编码成某种数据结构的过程(guchng)。第九页,共42页。目前对人类知识的结构及机制的研究还没
6、有完全成熟。总体可以分为两大类:符号表示法和连接机制表示法:符号表示法是用各种包含具体含义的符号,以各种不同(b tn)的方式和次序组合起来表示知识的一类方法。它主要用来表示逻辑性知识。连接机制表示法是用神经网络技术表示知识的一种方法。它把各种物理对象以不同(b tn)的方式及次序连接起来,并在其间互相传递及加工各种包含有具体意义的信息,以此来表示相关的概念及知识。第十页,共42页。专家系统国内外研究(ynji)现状和技术发展趋势专家系统知识的获取是一个逐步积累的过程,专家系统的开发也是一个逐步发展(fzhn)、不断完善的过程。因此,专家系统的创建是一个复杂的应用系统工程,需要在不断补充和完善
7、中逐步提高系统的性能和水平。第十一页,共42页。专家系统的构建方法:第一类是传统的符号(fho)推理(Symbolic Reasoning)方法规则推理(Rule-Based Reasoning,简称RBR)模型推理(Model-Based Reasoning,简称MBR)案例推理(Case-Based Reasoning,简称CBR)第十二页,共42页。第二类是软计算(Soft Computing,简称SC)方法模糊推理(Fuzzy Reasoning)人工神经网络(Anificial Neural Network,简称ANN)(神经网络故障诊断虽然有它独特的优越性,但也存在一些困难。主要表
8、现在三方面:一是训练样本获取困难;二是忽视了领域专家的经验知识(zh shi);三是网络权值形式表达方式难以理解。)第十三页,共42页。第三类是混合智能推理(tul)(Integrating Reasoning)方法 第十四页,共42页。模型(mxng)推理 就是将被求解的问题描述为结构、功能、行为信息,用结构化的领域知识进行问题求解的推理方法。基于模型的推理是通过对相关领域研究对象的结构和知识的精化与归纳,通过抽象描述表达出研究对象的特性和行为,建立该对象的数学模型、物理模型或结构模型以及相应(xingyng)的逻辑关系,并将其作为深知识在推理过程中使用。推理过程是一个结点被建立或否定的搜索
9、过程。第十五页,共42页。第十六页,共42页。基于规则(guz)的推理规则是可分解为前提和结论两部分的,能表达因果关系的知识,一般表示形式为:“如果A则B,其中A为前提,B为结论。基于(jy)规则的诊断方法具有知识表示简单、自然、一致性好、推理过程易于理解,诊断速度快等优点。该方法一般采用BNF(Backus-Naur Form)语法形式,将知识表示为一组规则的有序集合,非常接近于人类思维方式和自然形式的“ifthen”结构,易实现求解过程中的分析、综合和推理。第十七页,共42页。基于规则(guz)的专家系统,是使用一套包含在知识库内的规则(guz)对工作存储器内的问题信息(事实)进行处理,通
10、过推理机推断出新的信息的计算机程序,其工作模型如图:第十八页,共42页。基于(jy)规则的专家系统动物识别专家系统该系统的知识库由15条规则组成,可识别7种动物,规则的基本格式(g shi)是:IF(如果)THEN(则)第十九页,共42页。规则 I1 如果(rgu)该动物有毛发则 它是哺乳动物 规则 I2 如果(rgu)该动物能产乳则 它是哺乳动物规则 I3 如果(rgu)该动物有羽毛则 它是鸟类动物规则 I4 如果(rgu)该动物能飞行 它能生蛋则 它是鸟类动物规则 I5 如果(rgu)该动物是哺乳动物 它吃肉则 它是食肉动物 规则 I6 如果(rgu)该动物是哺乳动物 它长有爪子 它长有利
11、齿 它眼睛前视则 它是食肉动物 规则 I7 如果(rgu)该动物是哺乳动物 它长有蹄则 它是有蹄动物规则 I8 如果(rgu)该动物是哺乳动物 它反刍则 它是有蹄动物,并且是偶蹄动物第二十页,共42页。规则 I9 如果 该动物是食肉动物 它的颜色是黄褐色 它有深色的斑点 则 它是猎豹 规则 I10 如果 该动物是食肉动物 它的颜色是黄褐色 它有黑色条纹(tio wn)则 它是老虎规则 I11 如果 该动物是有蹄动物 它有长腿 它有长颈 它的颜色是黄褐色 它有深色的斑点 则 它是长颈鹿规则 I12 如果 该动物是有蹄动物 它的颜色是白的 它有黑色条纹(tio wn)则 它是斑马 规则规则 I13
12、 如果如果(rgu)该动物是鸟类该动物是鸟类 它不会飞它不会飞 它有长颈它有长颈 它有长腿它有长腿 它的颜色是黑色和白色相杂它的颜色是黑色和白色相杂 则则 它是鸵鸟它是鸵鸟规则规则 I14 如果如果(rgu)该动物是鸟类该动物是鸟类 它不能飞行它不能飞行 它能游泳它能游泳 它的颜色是黑色和白色它的颜色是黑色和白色 则则 它是企鹅它是企鹅 规则规则 I15 如果如果(rgu)该动物是鸟类该动物是鸟类 它善于飞行它善于飞行 则则 它是海燕它是海燕第二十一页,共42页。海燕ALBATROSS企鹅(q)PENGUIN驼鸟 OSTRICH斑马 ZEBRA长颈鹿 GIRAFFE虎TIGER黑豹 CHEET
13、A见程序第二十二页,共42页。基于(jy)案例的专家系统 这是一种基于人的认知过程的推理策略,是一种人们在生活中经常用来求解问题的方法。其核心思想是:专家系统在进行某个问题的求解时,往往把以前使用过的与该问题相同或类似的案例联系起来,运用以前解决该案例的经验(jngyn)、知识和方法,来解决当前问题。基于案例的专家系统的目标就是运用计算机来得到类比推理和领域专家的记忆,并提供出类似该问题的解。该方法方便了知识的获取,简化了知识的维护,增加了解决问题的效率和解答的质量,提高了用户的满意程度。第二十三页,共42页。CBR是以自然界的两大原则(yunz)为理论前提的1)世界是规则的相似的问题有相似的
14、求解方法和过程;2)事物总是会重复出现的人们遇到的相同或相似的问题或事物总会重复出现的。第二十四页,共42页。预测:例如设备故障预测或股票市场的行为(xngwi)。评估:例如银行业或保险业的风险分析,项目成本的估计。诊断:例如医学诊断或设备故障诊断。设计:通过改进以前的产品开发出新的产品。计划:从旧的计划制订出新的决策计划。配置:从旧的进度表产生新的进度表。第二十五页,共42页。类比推理(li b tu l)类比是人类应用过去的经验来求解新问题的一种思维过程。类比学习是把两个或两类事物或情形进行比较,找出它们在某一抽象层上的相似关系,并以这种关系为依据,把某一事物或情形的有关知识加以适当整理(
15、或变换)对应(duyng)到另一事物或情况,从而获得求解另一事物或情形的知识。根据已知域的情况,用类比来回答关于另一未知域的问题,主要是一个解决问题的过程。第二十六页,共42页。Retrieval检索Elaboration细化 Mapping映射(yngsh)Justification纠正第二十七页,共42页。第二十八页,共42页。类比(lib)学习描述:设有两个具有相同或相似的论域:源域S和目标域T,已知S中的元素a和T中的元素b具有相似的性质P,即P(a)P(b),a还具有性质Q,即Q(a),根据(gnj)类比推理,b也具有性质Q.即,P(a)Q(a),P(a)P(b)Q(b)Q(a)第二
16、十九页,共42页。类比学习一般(ybn)步骤:(1)找出源域与目标域的相似性质P,找出源域中另一个性质Q和性质P对元素a的关系:P(a)Q(a);(2)在源域中推广P和Q的关系为一般关系,即对于所有的变量x来说,存在(cnzi)P(x)Q(x);(3)从源域和目标域映射关系,得到目标域的新性质,即对于目标域的所有变量x来说,存在(cnzi)P(x)Q(x);(4)利用假言推理:P(b),P(x)Q(x)Q(b),最后得出b具有性质Q从上述步骤可见,类比学习实际上是演绎学习和归纳学习的组合。步骤(2)是一个归纳的过程,即从个别现象推断出一般规律;而步骤(4)则是一个演绎过程,即从一般规律找出个别
17、现象。第三十页,共42页。类比学习(xux)的过程:联想搜索匹配检验相似程度修正变换求解(qi ji)更新知识库第三十一页,共42页。类比求解过程(guchng)要明确的问题问题特征(tzhng)怎样抽取相似性测度及计算方法如何确定如何搜索相似的问题怎样找出对应关系,如何匹配老问题的解如何变换地到新问题的解如何更新知识库第三十二页,共42页。基于(jy)案例推理的专家系统包含的基本研究领域问题案例获取 案例表示(biosh)案例索引 检索模板检索 类似于关系数据库的SQL查询分层检索 决策树为基础关联检索 邻近检索案例的修改学习和归纳第三十三页,共42页。知识库建立需要(xyo)考虑的问题充分
18、表示领域知识 有利于对知识的使用便于(biny)对知识的组织、维护和管理 便于(biny)理解与实现第三十四页,共42页。知识库管理系统 知识库管理系统是知识库系统设计中必不可少的。具体来说知识库管理系统所具有的功能(gngnng)如下:1)知识库管理系统应具有传统数据库管理系统的切功能(gngnng),包括对数据、知识的有效存取、数据处理等。2)有一个描述性语言用于对知识的操作与处理。第三十五页,共42页。知识库管理系统的特性(txng)1)知识库管理系统所管理的知识限于事实和规则;2)知识库管理系统应能管理大量的知识;3)知识库管理系统所采用的语言大多数是逻辑语言,如用谓词逻辑表示;4)知
19、识库管理系统的核心是一个推理系统(Inference Engine),它完成(wn chng)对知识的操纵,其中主要包括对知识的一致性检查、知识的演绎检索等。第三十六页,共42页。SQL处理过程从SQL执行原理可知,影响SQL语句(yj)性能的关键是前两步。一方面硬解析相当消耗资源(CPU时间、内存、栓锁等),频繁解析导致响应时间更长(效率低),系统支持同时在线的用户数更少(并发性差);另外,生成的执行计划的优劣主要依赖于统计信息的准确性。因此,SQL性能优化的重点是:尽量避免重复解析,充分重用SQL第三十七页,共42页。第三十八页,共42页。知识库存放(cnfng)的知识 有效的SQL语句(
20、yj)。待复核的SQL语句(yj)。驳回的SQL语句(yj)。历史的SQL语句(yj)。第三十九页,共42页。知识库中还可以(ky)放的知识1当一个用户有数据库请求时,先判断是读还是写,如果是写的话,就直接(zhji)返回写入服务器,这样当写服务器写完数据以后,差不多可以在3秒内返回其他两台机器。2,当遇到一个读的请求时,根据监控返回来的数据判断,根据刚才的权值返回一个当前最空闲的机器。需要注意的是,这时最好做一个记录器,用以保持一段时间的数值,可以让管理员自行设定,更好地做到几台数据库的压力平衡。3如果为主的写入服务器突然坏掉,程序可以自动把备份的服务器切换过来,用刚才的备份服务器当作写服务
21、器,然后做一个报警系统,用以通知管理员。同样,当监控服务器发现其他两台读服务器坏掉时,也会自动通知管理员,来处理服务器的异常情况,这样就可以保证系统的稳定运行,而且易于管理和维护。4限制由数据库用户 db2admin 发出的读取操作,当 read 操作返回的数据行数大于 N 时,终止这个操作。5限制由数据库用户 db2admin 发出的 DML 活动,当预计的 SQL COST 运行时间大于 200 秒时,将不允许该活动继续运行。6创建 Limits。这里,需要对某一个用户源发出的某一类工作做出限制。如某个 CASE 中用户源就是 DB2ADMIN,工作类型就是 READ。7.用户特定的需求。第四十页,共42页。下一步(y b)的工作选择知识(zh shi)的表示确定知识(zh shi)的推理形式构建知识(zh shi)库知识(zh shi)的增加知识(zh shi)的删除知识(zh shi)的约减知识(zh shi)的修改知识(zh shi)库的优化(检索、排序)第四十一页,共42页。第四十二页,共42页。
限制150内