《基于知识的数据库技术.ppt》由会员分享,可在线阅读,更多相关《基于知识的数据库技术.ppt(59页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据库系统与技术(7)-基于知识的数据库技术汤 庸 博士 计算机科学系协同软件研究开发中心1 协同软件研究开发中心n 知识的概念 n 知识表达与推理n 知识库系统 n 基于知识的数据库技术n 主动数据库技术n 决策支持系统n 数据挖掘技术知识库技术2 协同软件研究开发中心n 1 数据、信息与知识n 数据是对事实的一种表达形式,包括数字、字符和图形。数据可以通过人工或自动化装置进行处理。n 信息是对人有用的、能够影响人们行为的数据。信息通过对数据加工处理而产生。n 知识是人类对客观规律的认识,是系统的有条理的信息。一般地,知识是数据经过一系列加工,如归纳、综合、比较、分类、联想等得到的上层信息。
2、1.知识的概念 3 协同软件研究开发中心n 例如,摄氏39度是一个数据,如果用来表示一个人体温,则成为一种信息;对于医生或具有保健常识的人来说,如果一个人的体温达到摄氏39度,则其正在发烧,需要及时治疗,这就称为一种知识。n 1.知识的概念 4 协同软件研究开发中心n 2.知识的要素n 概念给出知识的最基本内容,是知识的最底层基础,通常以名词形式出现,例如花,红色,太阳,风,雨等。n 事实是知识所表示的有关问题涉及到的事物、环境的常识性知识,如事物的分类、属性、事物之间的关系、科学事实和客观事实等。事实建立了概念之间的联系。事实是静态地为人们所共享、最低层次的0层的知识,通常以“是”的形式出现
3、。n 规则由事实组成,建立了事实间的联系。规则是有关问题中与事物的行动、动作相联系的因果关系知识,这种知识是动态的,通常以“如果则”的形式出现。例如启发式规则:如果下雨,则出门带伞。1.知识的概念(2)5 协同软件研究开发中心n 3 知识的类型n 过程型知识过程型知识针对特定问题,用一系列过程来表达具体的处理步骤,优点是执行效率高,但它也有不少缺点:n 不易表示大量知识,且表示的知识难于理解和修改。n 只适合表达完全正确的知识,稍有含糊的知识就难于用程序表达。n 只适合于处理完整、准确的数据。n 过程型知识表示要求待处理的问题具有成熟的解法和完整、准确的数据,同时这也大大地限制了它的适用范围。
4、n 描述型知识n 事实知识描述有关对象、事件以及行为等特征。例如“鸟会飞”、“雪是白色的”等。n 判断型知识是指对事实的判断和推断的过程,基于主观理解和感情色彩对客观事件的解释和推理过程,例如“他看起来很开心”。1.知识的概念(3)6 协同软件研究开发中心n 元知识n 组织知识的元知识。这种元知识用来刻画知识的内容和一般特征,描述知识的分类、综合信息等。n 利用知识求解问题方向的元知识。这类元知识对领域知识的运用起到指导作用。例如,在问题求解中所用到的推理方法,为解决一个特殊任务而完成活动的计划、组织和选择方面的知识。n 从知识源获取知识的元知识。这类知识源包括书本、大脑和其他知识系统。1.知
5、识的概念(4)7 协同软件研究开发中心1 谓词逻辑方法在知识库中目前大都采用“概念-事实-规则”三级层次的知识构造体系。这种体系的知识表示方法也很多,在人工智能和知识工程学科中知识表示方法已经成为一个专门领域。由于谓词逻辑本身很好的一些基本特点,当前的知识库系统中一般采用谓词逻辑表示方法。知识表达与推理8 协同软件研究开发中心2 产生式方法产生式知识表达方法也称为产生式规则知识表示方法,该方法可以方便地描述事实、规则并进行不确定性推理,具有和图灵机一样的表达能力。产生式表示的特点:产生式表示格式固定,形式单一,规则(知识单位)间相互较为独立,没有直接关系使知识库的建立较为容易,处理较为简单的问
6、题是可取的。另外推理方式 单纯,也没有复杂计算。特别是知识库与推理机是分离的,这种结构给知识的修改带来方便,无须修改程序,对系统的推理路径也容易做出解释。所以,产生式知识表示方法常作为构造专家系统知识表示方法的第一选择。知识表达与推理9 协同软件研究开发中心知识表达与推理产生式系统结构10 协同软件研究开发中心3 语义网络表示法逻辑表示法和产生式表示法常用于表示有关论域中各个不同状态间的关系,然而用于表示一个事物同其各个部分间的分类知识就不方便了。槽(slot)与填槽表示方法便于表示这种分类知识。语义网络和框架表示方法就属于其中的两种。知识表达与推理11 协同软件研究开发中心4 框架表示法19
7、75年 Minsky的 论 文“A framework for representing knowledge”中提出了框架理论。其基本观点是人脑已存储有大量典型情景,当人面临新的情景时,就从记忆中选择一个以框架形式存放的知识空框,其具体内容依新的情景而改变,对这空框的细节加工修改和补充,形成对新情景的认识又重新记忆于人脑中。框架理论将框架视作知识单位,将一组有关的框架连接起来便形成框架系统。系统中不同框架可以有共同结点,系统的行为由系统内框架的变化来表现。推理过程是由框架间的协调来完成的。框架表示法是一种适应性强、概括性高、结构化良好、推理方式灵活又能把陈述性知识与过程性知识相结合的知识表示方
8、法。知识表达与推理12 协同软件研究开发中心n 1 Prologn Prolog是一种基于一阶谓词的逻辑程序设计语言,它是由R.Kowalskv和A.Colmerauer首先提出的,它在AI和知识库的实现技术中具有重要作用。Prolog语言作为数据库系统中演绎推理公理系统的语言,具有很强的逻辑描述能力和推理能力。它使数据库系统和知识库系统两者具有共同的坚实的数学基础。实际上,利用Prolog的演绎推理及处理数据库中的检索等过程就是证明定理的过程。因此,在逻辑上Prolog对应于数学的证明论。知识库语言13 协同软件研究开发中心n 2 Datalogn Datalog语言是Prolog语言的一种
9、特殊形式,由于prolog语言是一种适应面较为广泛的通用语言,它在数据库、知识库领域中虽然也能适应,但是也存在一定的不足之处,这主要是数据库及知识库领域中具有一定的特殊性。n 知识数量有限:在知识库中,知识个数是有限的;n 操作受限:在知识库中,一般只有知识操作而很少有计算操作。n 因此在实际上需要对prolog进行一定的限制,使其在知识库领域中发挥更大作用,而Datalog即是Prolog的一种适应于知识库的改进形式语言,是一种受限的Prolog语言,适用于知识库。知识库语言14 协同软件研究开发中心n 3 LISPn LISP(LISt Processing),由约翰.麦卡锡在1960年创
10、造的一种基于演算的函数式编程语言。约翰.麦卡锡1960年发表了一篇非凡的论文,这篇论文展示了在只给定几个简单的操作符和一个表示函数的记号的基础上,如何构造出一个完整的编程语言。麦卡锡称这种语言为Lisp,意为List Processing,因为其主要思想之一是用一种简单的数据结构表(list)来代表代码和数据。经过几十年的发展,LISP有很多种版本,各个实现中的语言不完全一样。1980年代Guy L.Steele编写了Common Lisp试图进行标准化,这个标准被大多数解释器和编译器所接受。在Unix/Linux系统中,还有一种Emacs Lisp非常流行,并建立了自己的标准。由于LISP的
11、符号处理能力非常强,所以也被认为是一种人工智能程序设计语言,经常被用于知识表达和处理系统的开发。知识库语言15 协同软件研究开发中心n 1 知识库n 从知识存储的角度来看,知识库可以简单看为是知识的集合。当然,这些知识包括概念、事实与规则。由于概念一般均包含在事实内,实际上知识库中主要包含事实与规则两个部分,而仅由事实组成的知识库只能认为是广义的知识库。n 知识库中的事实与数据库中的元组具有相同的含义,它是由若干确定的概念(常值)组成。知识库中的规则具有一定的通用性,比如以下规则:如x和y是兄弟,y和z是兄弟,则x和z是兄弟。n 从知识使用的角度来看,知识库是由知识和知识处理机构组成。知识库在
12、形式上是一个知识域,该知识域中除了事实、概念和规则等知识基本要素外,还包含有推理、归纳、演绎等知识处理方法,以及逻辑查询语言、语义查询优化、人机交互界面等。n 一般而言,从知识存储角度出发的知识库概念比较常用,也比较符合知识库使用的实际情况。知识库与知识库系统16 协同软件研究开发中心n 知识库管理系统应当具有以下功能:n 支持传统数据库管理系统的一切功能n 具有一种对知识进行操纵和处理的描述性语言n 这 种 观 点 是 Ulman在 其 名 著“Principle of database and knowledge system”中提出的。他将KDMS看作是DBMS的扩充,即在功能上KBMS
13、应当包含DBMS,并且在此基础上用一种描述性语言例如逻辑语言来操纵与处理知识数据库中的知识(包括事实与规则)。知识库与知识库系统(Cont)17 协同软件研究开发中心知识库与知识库系统(Cont)知识库系统组成18 协同软件研究开发中心知识库与知识库系统(Cont)知识库系统19 协同软件研究开发中心数据库与知识库n 数据库与知识库是关系非常密切的两个概念,正如数据与知识的关系一样,知识库可以看作是数据库的一种特例。本节从数据库与知识库、数据库系统与知识库系统、数据库管理系统与知识库管理系统,以及数据库应用开发与知识库应用开发方面简要的比较数据库与知识库的各自侧重点。20 协同软件研究开发中心
14、基于知识的数据库技术n 主动数据库n 数据挖掘n 决策支持系统n,21 协同软件研究开发中心n 面 向 外 部 应 用:支 持 外 部 应 用,为 外 部 应 用 提 供 主 动服 务 的 方 面 包 括 情 形 监 控、报 警、支 持 实 时 处 理、支持 合 作 与 协 同 工 作、支 持 推 理、数 据 交 换 与 配 置 管 理策略的施加等。n 面 向 数 据 库 本 身:主 动 数 据 库 设 施 还 可 以 用 来 实 现 或扩 展DBMS 本 身 的 一 些 功 能,包 括:完 整 性 控 制、安全 性 控 制、导 出 数 据 处 理、面 向 对 象 数 据 模 型 中 继 承机
15、制的定义与应用和性能测度。1.主动数据库的应用需求22 协同软件研究开发中心n 实际应用经常遇到的主动性需求:lMIS中的预警功能l 系统的实时监控功能l 例外或错误情况的主动处理和自动恢复功能l 系统瞬时状态的输出或关键点状态的输出l 协同工作或协同解决问题l 灵活而方便的实时处理能力l 方便而灵活的人机交互接口l 自适应和学习功能l 演绎推理功能l 更强的系统交互性l 原有数据库功能的加强和集成也需要主动性的帮助1.主动数据库的应用需求(2)23 协同软件研究开发中心n 传 统 的 数 据 库 管 理 系 统 只 能 根 据 用 户 的 命 令 被动 地 完 成 相 应 的 动 作,被 动
16、 地 为 用 户 服 务,唯一 称 得 上 主 动 完 成 的 一 类 工 作 是 对 各 种 约 束 条件 的 检 查,例 如,数 据 完 整 性,一 致 性,安 全性等。n 主 动 数 据 库 的 一 个 突 出 的 思 想 是 让 数 据 库 系 统具 有 各 种 主 动 进 行 服 务 的 功 能,并 以 种 统 一而方便的机制来实现各种主动性需求1.主动数据库的应用需求(3)24 协同软件研究开发中心n 功能组成:ADBSDBS+EB+EMlDBS(Database System):等 同 于 一 般 的 传 统 数据 库 系 统,主 要 用 来 存 储 数 据 和 对 数 据 进
17、行 维 护、管 理 与运用;lEB(Event Base):也 是 一 个 数 据 库,用 来 存 储 规则 和 对 规 则 进 行 维 护、管 理 与 应 用,是 由 事 件 驱 动 的 一 组知 识 组 成 的 集 合(规 则 集 合),称 为“事 件 库/规 则 库”,其 中 每 一 项 知 识 表 示 在 相 应 的 事 件 发 生 时,如 何 来 主 动地执行其中包含的由用户预先设定的动作;lEM(Event Monitor):随 时 监 视EB中 的 事 件 是 否 已 经 发 生的 监 视 模 块,一 旦 监 视 到 某 事 件 已 经 发 生 时 就 主 动 地 触 发系统按照
18、EB中指明的相应知识执行其中预先设定的动作。2主动数据库组成与结构25 协同软件研究开发中心2主动数据库组成与结构(2)26 协同软件研究开发中心n 主动(ECA)规则n 事件n 条件n 动作事 件 驱 动 的“事 件 条 件 动 作”规 则 的 语 义 是:“一 旦 指 定 的 事 件 发 生,计 算 机 就 主 动 触 发 执行 其 后 的 条 件 判 断 规 则。即 如 果 条 件 为 真,则执行其后的动作。3.1ECA规则的构成27 协同软件研究开发中心n 事 件 是 在 数 据 库 系 统 在 运 行 过 程 当 中 某 特 定 时 刻 发 生 的,对 系 统有 特 定 意 义 的
19、事 情,包 括 基 本 事 件 和 复 合 事 件,复 合 事 件 事 是 有基 本 事 件 经 过 各 种 事 件 运 算 构 成 的,复 合 事 件 是 一 种 表 达 复 杂 事件 的 手 段,使 用 户 可 以 根 据 实 际 需 要 定 义 复 杂 事 件,方 便 了 规 则的设计、维护与传送。n 条 件 是 关 于 当 前 或 某 个 特 定 事 件 的 数 据 库 状 态 的 一 种 假 定,用 某种 逻 辑(例 如 模 糊 逻 辑)中 的 任 意 的 一 个 合 法 的 逻 辑 公 式 来 表 示 一个 条 件,对 于 条 件,可 以 依 据 逻 辑 运 算 将 条 件 定 义 成 简 单 的 条 件,也可以构造出很复杂的条件。n 动 作 时 数 据 库 可 以 执 行 的 一 组 操 作 序 列,这 些 序 列 中 可 以 有 系 统预 先 定 义 的 一 些 标 准 动 作,也 可 以 由 用 户 定 义 复 杂 的 动 作,或 是用 某 种 程 序 设 计 语 言 表 现 的 一 个 过 程,而 这 些 单 个 地 动 作 可 以 组合成动作序列,共同完成更加复杂的操作。3.1ECA规则的构成(2)28
限制150内