欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    管理高可用性精选PPT.ppt

    • 资源ID:42296307       资源大小:1.08MB        全文页数:17页
    • 资源格式: PPT        下载积分:18金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要18金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    管理高可用性精选PPT.ppt

    管理高可用性管理高可用性2022/9/141第1页,此课件共17页哦教学目标教学目标l理解系统可用性的概念理解系统可用性的概念l了解系统停机的主要原因了解系统停机的主要原因l掌握如何进行计算故障保护掌握如何进行计算故障保护l掌握如何进行数据故障保护掌握如何进行数据故障保护l掌握如何进行数据改变保护掌握如何进行数据改变保护l掌握如何进行系统改变保护掌握如何进行系统改变保护2022/9/142第2页,此课件共17页哦教学难点和重点教学难点和重点l系统可用性的概念系统可用性的概念l系统停机的主要原因系统停机的主要原因l如何进行计算故障保护如何进行计算故障保护l如何进行数据故障保护如何进行数据故障保护l如何进行数据改变保护如何进行数据改变保护l如何进行系统改变保护如何进行系统改变保护2022/9/143第3页,此课件共17页哦教学过程教学过程17.1 概述概述 17.2 计算机故障保护计算机故障保护 17.3 防止数据故障防止数据故障 17.4 避免计划内停机避免计划内停机 2022/9/144第4页,此课件共17页哦17.1 概述概述l可用性是一项度量计算机系统正常运行时间的指标。这可用性是一项度量计算机系统正常运行时间的指标。这项指标无论系统处于何种状态,例如系统维护或系统升项指标无论系统处于何种状态,例如系统维护或系统升级,都应该保证系统正常使用。可用性是解决应用程序级,都应该保证系统正常使用。可用性是解决应用程序可以正常使用的时间的问题,可伸缩性描述应用程序可可以正常使用的时间的问题,可伸缩性描述应用程序可以接受的并发用户访问的数量问题。以接受的并发用户访问的数量问题。l在设计高度可用的在设计高度可用的IT网格基础架构时,所面临的一大网格基础架构时,所面临的一大挑战是检查和解决所有可能的停机原因。图挑战是检查和解决所有可能的停机原因。图17-1显示显示了一系列停机原因,这些原因可以归为两大类:意外停机了一系列停机原因,这些原因可以归为两大类:意外停机和计划停机。和计划停机。2022/9/145第5页,此课件共17页哦17.2 计算机故障保护计算机故障保护 l当计算机系统或数据库服务器意外故障并导当计算机系统或数据库服务器意外故障并导致服务中断时,计算机就会发生故障,如致服务中断时,计算机就会发生故障,如图图17-2所示。在大多数情况下,这是由于所示。在大多数情况下,这是由于硬件故障。硬件故障。l这些类型的故障可利用快速数据库故障恢复这些类型的故障可利用快速数据库故障恢复和集群技术来解决。和集群技术来解决。2022/9/146第6页,此课件共17页哦带有真正应用集群的企业网格带有真正应用集群的企业网格 l真正应用集群真正应用集群(real application cluster,RAC)使得使得企业可以构建支持多个操作系统的服务器,并可提企业可以构建支持多个操作系统的服务器,并可提供出色的可用性和可伸缩性。在真正应用集群环境供出色的可用性和可伸缩性。在真正应用集群环境中,中,Oracle可在一个集群中运行于两个或更多个系统之可在一个集群中运行于两个或更多个系统之上,并可以同时访问一个共享数据库。这使得一个数据上,并可以同时访问一个共享数据库。这使得一个数据库系统可以跨越多个硬件系统,同时对应用程序而言仍库系统可以跨越多个硬件系统,同时对应用程序而言仍是一个统一的数据库系统,从而为用户的应用程序带来是一个统一的数据库系统,从而为用户的应用程序带来出色的可用性和可伸缩性优势,包括:出色的可用性和可伸缩性优势,包括:容量规划的灵活性和经济高效性,进而使得企业可以随着业容量规划的灵活性和经济高效性,进而使得企业可以随着业务的扩展根据需求进行扩展。务的扩展根据需求进行扩展。集群故障容错,特别是计算机故障。集群故障容错,特别是计算机故障。2022/9/147第7页,此课件共17页哦绑定数据库崩溃恢复绑定数据库崩溃恢复 l造成意外停机的一个最常见的原因是系统故障或崩溃。系统造成意外停机的一个最常见的原因是系统故障或崩溃。系统故障是由于硬件故障、电源故障和操作系统或服务器崩溃造故障是由于硬件故障、电源故障和操作系统或服务器崩溃造成的。这些故障导致的中断次数取决于受影响的用户数量,成的。这些故障导致的中断次数取决于受影响的用户数量,以及服务恢复的速度。以及服务恢复的速度。l高可用性系统设计用于在故障发生后,自动快速进行故障恢复。关键高可用性系统设计用于在故障发生后,自动快速进行故障恢复。关键系统的用户希望系统的用户希望IT部门能够承诺快速实现故障恢复,并可以预测部门能够承诺快速实现故障恢复,并可以预测故障时间。停机时间如果比承诺时间长,就会对运营造成直接故障时间。停机时间如果比承诺时间长,就会对运营造成直接的影响,导致收入损失,生产效率降低。的影响,导致收入损失,生产效率降低。lOracle数据库提供了非常快速的系统故障和崩溃恢复。数据库提供了非常快速的系统故障和崩溃恢复。2022/9/148第8页,此课件共17页哦17.3 防止数据故障防止数据故障 l数据故障是指丢失、损坏或破坏关键企业数据,如数据故障是指丢失、损坏或破坏关键企业数据,如图图17-3所示。数据故障的原因比计算机故障更加错综所示。数据故障的原因比计算机故障更加错综复杂,可能由于存储硬件、人为错误、损坏或站点故复杂,可能由于存储硬件、人为错误、损坏或站点故障而引起。障而引起。l非常重要的一点是,要设计一款解决方案来防止数非常重要的一点是,要设计一款解决方案来防止数据故障并提供故障恢复。系统或网络故障可能会妨据故障并提供故障恢复。系统或网络故障可能会妨碍用户访问数据,但发生数据故障后,如果没有正碍用户访问数据,但发生数据故障后,如果没有正确的备份或恢复技术,则会导致需要数小时的恢复确的备份或恢复技术,则会导致需要数小时的恢复时间,甚至丢失数据。时间,甚至丢失数据。l在在Oracle Database10g中,极大地增强了数据保护中,极大地增强了数据保护能力。能力。2022/9/149第9页,此课件共17页哦防止存储故障防止存储故障 l利用利用Oracle数据库的自动存储管理数据库的自动存储管理(ASM)特性。特性。ASM在在Oracle内核中提供了一个垂直集成的文件系统和数据卷管理器,内核中提供了一个垂直集成的文件系统和数据卷管理器,大大减少了提供数据库存储的工作,提高了可用性,而无需购大大减少了提供数据库存储的工作,提高了可用性,而无需购买、安装和维护专用存储产品,并且为数据库应用提供了独有买、安装和维护专用存储产品,并且为数据库应用提供了独有的能力。的能力。ASM将其文件分布在所有可用存储器上,以实现最佳性能,将其文件分布在所有可用存储器上,以实现最佳性能,而且它还可以镜像,防止数据丢失。而且它还可以镜像,防止数据丢失。ASM扩展了扩展了SAME(全部条全部条带化和镜像带化和镜像)概念,并提高了灵活性,从而可以在数据库文概念,并提高了灵活性,从而可以在数据库文件级进行镜像,而无需在整修磁盘级进行镜像。件级进行镜像,而无需在整修磁盘级进行镜像。l更重要的是,更重要的是,ASM消除了与管理数据和磁盘相关的复杂性;消除了与管理数据和磁盘相关的复杂性;它大大简化了设置镜像、添加磁盘和拆卸磁盘的过程。它大大简化了设置镜像、添加磁盘和拆卸磁盘的过程。2022/9/1410第10页,此课件共17页哦防止人为错误防止人为错误 l几乎所有关于停机原因的研究都发现,人为几乎所有关于停机原因的研究都发现,人为错误是导致停机的最大原因。人为错误包错误是导致停机的最大原因。人为错误包括:误删除重要数据;或括:误删除重要数据;或update语句中不语句中不正确的正确的where子句更新了比预定更多的行。子句更新了比预定更多的行。要尽可能防止人为错误,当预防措施失败要尽可能防止人为错误,当预防措施失败后,需要撤消以前的操作。后,需要撤消以前的操作。lOracle数据库提供了易用且强大的工具,数据库提供了易用且强大的工具,有助于管理员快速诊断发生的错误,并从有助于管理员快速诊断发生的错误,并从错误中得以恢复。错误中得以恢复。2022/9/1411第11页,此课件共17页哦 Oracle的闪回技术的闪回技术 l当授权用户犯错,需要使用工具来更正这些错误。当授权用户犯错,需要使用工具来更正这些错误。Oracle Database 10g提供了一系列人为错误更正技术,这些技术称为闪回提供了一系列人为错误更正技术,这些技术称为闪回技术。闪回技术从根本上改变了数据恢复方式。技术。闪回技术从根本上改变了数据恢复方式。l过去,数据库在几分钟内就可能损坏,但需要几小时才能恢复。过去,数据库在几分钟内就可能损坏,但需要几小时才能恢复。利用闪回技术,更正错误的时间与错误发生时间几乎相同。而利用闪回技术,更正错误的时间与错误发生时间几乎相同。而且它非常易用,使用一条短命令便可恢复整个数据库,而不必且它非常易用,使用一条短命令便可恢复整个数据库,而不必执行复杂的程序。闪回技术提供了一个执行复杂的程序。闪回技术提供了一个SQL界面,能够快速分界面,能够快速分析和修复人为错误。闪回技术为本地数据损坏提供了细粒度的外析和修复人为错误。闪回技术为本地数据损坏提供了细粒度的外部分析和修复,如当错误删除客户订单时。闪回技术还支持修复部分析和修复,如当错误删除客户订单时。闪回技术还支持修复更广泛的损坏,同时快速避免长时间停机。更广泛的损坏,同时快速避免长时间停机。2022/9/1412第12页,此课件共17页哦基于基于SQL的的Log Miner日志分析程序日志分析程序 lOracle日志文件包含有关日志文件包含有关Oracle数据库活动和历史数据库活动和历史的大量实用信息。日志文件包含执行数据库恢复所需的大量实用信息。日志文件包含执行数据库恢复所需的全部数据。它们还记录了数据库中的数据和元数据的全部数据。它们还记录了数据库中的数据和元数据的所有变化。的所有变化。lLog Miner是一个关系工具,支持使用是一个关系工具,支持使用SQL来阅读、来阅读、分析和翻译重做的日志文件。利用分析和翻译重做的日志文件。利用Log Miner分析日志分析日志文件,可以跟踪或审核数据变化、提供调整和容量规划文件,可以跟踪或审核数据变化、提供调整和容量规划的补充信息、检索复杂应用调试的关键信息,或恢复被的补充信息、检索复杂应用调试的关键信息,或恢复被删除的数据等删除的数据等 2022/9/1413第13页,此课件共17页哦防止数据损坏防止数据损坏 l数据损坏通常由数据损坏通常由IO系列中的故障组件导致。例如,数据系列中的故障组件导致。例如,数据库将库将IO作为更新交易的结果。该数据库作为更新交易的结果。该数据库IO将在各个组件将在各个组件中进行传输,包括:操作系统的中进行传输,包括:操作系统的IO代码、文件系统、卷管代码、文件系统、卷管理器、设备驱动程序、主机总线适配器、存储控制器和磁理器、设备驱动程序、主机总线适配器、存储控制器和磁盘驱动器,直至最后被写入。盘驱动器,直至最后被写入。IO堆栈中任何组件发生错堆栈中任何组件发生错误或硬件故障,都可能误或硬件故障,都可能“变换变换”数据中的一些位,进数据中的一些位,进而导致错误数据被写入数据库中。这一损坏可能是数而导致错误数据被写入数据库中。这一损坏可能是数据库控制信息或用户数据,它们对于数据库的正常工据库控制信息或用户数据,它们对于数据库的正常工作至关重要。同样,磁盘故障也可能损坏数据库,而作至关重要。同样,磁盘故障也可能损坏数据库,而需要使用备份文件来恢复数据库。需要使用备份文件来恢复数据库。2022/9/1414第14页,此课件共17页哦17.4 避免计划内停机避免计划内停机 l计划内停机同样会对业务运营造成破坏,特别是对于需要支持多个时计划内停机同样会对业务运营造成破坏,特别是对于需要支持多个时区的用户的全球而言,情况尤为严重。在这种情况下,设计一种可最区的用户的全球而言,情况尤为严重。在这种情况下,设计一种可最大限度地减少中断的系统至关重要。计划内停机包括例行操作、定期大限度地减少中断的系统至关重要。计划内停机包括例行操作、定期维护和部署新设备等。维护和部署新设备等。l例行操作指频繁进行的维护任务,包括备份、性能管理、用例行操作指频繁进行的维护任务,包括备份、性能管理、用户管理和批处理。定期维护,如安装补丁和重新配置系统,户管理和批处理。定期维护,如安装补丁和重新配置系统,只是偶尔进行,以更新数据库、应用程序、操作系统、中间只是偶尔进行,以更新数据库、应用程序、操作系统、中间件或网络。部署新设备包括硬件、操作系统、数据库、应用件或网络。部署新设备包括硬件、操作系统、数据库、应用程序、中间件或网络的重大升级。在这里,不仅需要考虑升程序、中间件或网络的重大升级。在这里,不仅需要考虑升级所需的时间,同时还需要考虑变化可能对整体应用产生的级所需的时间,同时还需要考虑变化可能对整体应用产生的影响。影响。2022/9/1415第15页,此课件共17页哦避免数据改变导致的停机避免数据改变导致的停机 2022/9/1416第16页,此课件共17页哦避免系统改变导致的停机避免系统改变导致的停机 l系统改变也是影响系统可用性的一个重要原系统改变也是影响系统可用性的一个重要原因,如图因,如图17-6所示。所示。l避免系统变化导致的停机的方法包括滚动补避免系统变化导致的停机的方法包括滚动补丁更新、滚动版本升级等。丁更新、滚动版本升级等。2022/9/1417第17页,此课件共17页哦

    注意事项

    本文(管理高可用性精选PPT.ppt)为本站会员(石***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开