计算机新技术学术讲座精选文档.ppt
《计算机新技术学术讲座精选文档.ppt》由会员分享,可在线阅读,更多相关《计算机新技术学术讲座精选文档.ppt(132页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、计算机新技术学术讲座计算机新技术学术讲座本讲稿第一页,共一百三十二页个人简介个人简介复旦大学计算机软件与理论复旦大学计算机软件与理论 博士博士东南大学电子商务系东南大学电子商务系 副教授副教授东南大学经济决策与信息管理研究所东南大学经济决策与信息管理研究所 副所长副所长主要研究方向:主要研究方向:数据库数据库/数据仓库、数据挖掘与知识发现、智能信息处理。已在数据仓库、数据挖掘与知识发现、智能信息处理。已在国内外计算机类核心期刊发表论文十余篇,其中多篇论文被国内外计算机类核心期刊发表论文十余篇,其中多篇论文被EIEI检检索。索。研究课题:研究课题:n数据挖掘数据挖掘应应用平台研制及用平台研制及应
2、应用用 (国家(国家863863项目)项目)n智能交通数据挖掘平台(信息产业部攻关项目)智能交通数据挖掘平台(信息产业部攻关项目)n环球多市场金融信息平台(上海市科委攻关项目)环球多市场金融信息平台(上海市科委攻关项目)2本讲稿第二页,共一百三十二页主要内容主要内容n计算机硬件与互联网技术计算机硬件与互联网技术n计算机软件技术计算机软件技术n智能信息处理技术智能信息处理技术3本讲稿第三页,共一百三十二页计算机硬件与互联网技术计算机硬件与互联网技术n集群计算技术集群计算技术n网格计算技术网格计算技术n普适计算普适计算n本体论与语义网络本体论与语义网络4本讲稿第四页,共一百三十二页集群计算技术集群
3、计算技术n什么是集群什么是集群n集群是使用两台或两台以上的服务器组成的集群是使用两台或两台以上的服务器组成的服务器集合,用以提供高性能的不停机服务,服务器集合,用以提供高性能的不停机服务,每台服务器均承担部分计算任务和容错任务,每台服务器均承担部分计算任务和容错任务,但是整体上表现为一个单一系统。但是整体上表现为一个单一系统。n与传统的并行计算模型相比,集群中各节点与传统的并行计算模型相比,集群中各节点的复杂度中等,但是在单一系统映像、可靠的复杂度中等,但是在单一系统映像、可靠性和可伸缩性上更优越。由于集群大多使用性和可伸缩性上更优越。由于集群大多使用标准的商用部件,因此能够大幅度降低企业标准
4、的商用部件,因此能够大幅度降低企业成本,如下页表所示。成本,如下页表所示。5本讲稿第五页,共一百三十二页集群计算技术集群计算技术特征特征MPPSMP集群集群分布式系统分布式系统节点个数节点个数100-100010-10010010-1000节点复杂性节点复杂性低低中中中中高高中中高高节点通信节点通信消息传递、共消息传递、共享变量享变量共享存储器共享存储器消息传递消息传递共享文件、共享文件、PRC、消息、消息单一系统映像单一系统映像部分支持部分支持支持支持完全支持完全支持不支持不支持任务调度任务调度主机单一队列主机单一队列单一运行队列单一运行队列多队列协同多队列协同独立运行队列独立运行队列系统可
5、用性系统可用性中中低低高高中中系统可扩展性系统可扩展性低低中(中(100CPU以下)以下)高高中中6本讲稿第六页,共一百三十二页集群计算技术集群计算技术n集群系统的组成部分集群系统的组成部分n后台共享存储设备后台共享存储设备n集群内部网络通讯集群内部网络通讯n公共网络公共网络n虚拟的前台界面虚拟的前台界面n无虚拟内存的的集群系统无虚拟内存的的集群系统n为了进一步提高集群系统的效率,使用高速网络将各为了进一步提高集群系统的效率,使用高速网络将各主机的内存连接起来,当一个任务的内存不够时,它主机的内存连接起来,当一个任务的内存不够时,它可以通过远程缺页的方式使用远程结点的内存,这样可以通过远程缺页
6、的方式使用远程结点的内存,这样可以通过高速网络共享全局内存。可以通过高速网络共享全局内存。7本讲稿第七页,共一百三十二页集群计算技术集群计算技术n无虚拟内存集群系统的难点无虚拟内存集群系统的难点n整个资源的分配概念发生了变化,它是基于内存的资源整个资源的分配概念发生了变化,它是基于内存的资源分配;分配;n一个结点可能需要访问另外一个结点的内存,这就需要解决一个结点可能需要访问另外一个结点的内存,这就需要解决结点内存的所有权和自治问题;结点内存的所有权和自治问题;n需要解决全局内存管理问题(集中式还是分散式),通过需要解决全局内存管理问题(集中式还是分散式),通过全局内存管理,应能达到减少网络流
7、量,降低延迟和数据全局内存管理,应能达到减少网络流量,降低延迟和数据本地优化的目的。本地优化的目的。目前的操作系统还没有实现上述的处理,我们需要重构操作系目前的操作系统还没有实现上述的处理,我们需要重构操作系统以方便内存资源共享。统以方便内存资源共享。8本讲稿第八页,共一百三十二页集群计算技术集群计算技术n集群的分类集群的分类n科学计算集群科学计算集群n该集群主要用于大规模数值计算,解决复杂的科该集群主要用于大规模数值计算,解决复杂的科学问题。这种集群上一般运行专用软件,能够将学问题。这种集群上一般运行专用软件,能够将数据分布到不同的服务器上进行解决。针对不同数据分布到不同的服务器上进行解决。
8、针对不同的科学计算任务,一般有以下两种方式:的科学计算任务,一般有以下两种方式:n任务分片方式:将任务分成多个子任务并分配任务分片方式:将任务分成多个子任务并分配到各节点,每个节点单独运行出结果,最后汇到各节点,每个节点单独运行出结果,最后汇总计算结果;总计算结果;n并行计算方式:各个节点可以进行具有强藕合并行计算方式:各个节点可以进行具有强藕合关系的运算,运算中交换大量数据。关系的运算,运算中交换大量数据。9本讲稿第九页,共一百三十二页集群计算技术集群计算技术n负载均衡集群负载均衡集群n该集群的目的是使负载尽量在各个节点中该集群的目的是使负载尽量在各个节点中均衡分布,如计算负载、网络流量负载
9、等。均衡分布,如计算负载、网络流量负载等。n高可用性集群高可用性集群n该集群的目的是使服务系统的运行速度和响该集群的目的是使服务系统的运行速度和响应速度尽可能快,通过将程序运行在冗余节应速度尽可能快,通过将程序运行在冗余节点上,集群具有更好的容错性。点上,集群具有更好的容错性。n高可用性集群可以分为主从方式、双机备高可用性集群可以分为主从方式、双机备份方式和多机备份方式。份方式和多机备份方式。10本讲稿第十页,共一百三十二页集群计算技术集群计算技术n并行数据库集群并行数据库集群n近年来兴起的集群类型,同时具有并行计算、高近年来兴起的集群类型,同时具有并行计算、高可用性和负载均衡等多种特征,主要
10、用于高端数可用性和负载均衡等多种特征,主要用于高端数据库领域,如据库领域,如OracleRAC和和IBMDB2EEE。nOracleRAC系统每台主机拥有独立的系统每台主机拥有独立的CPU和内和内存,但是共享磁盘空间,主要针对于大量用户并存,但是共享磁盘空间,主要针对于大量用户并行的访问,行的访问,I/O冲突采用数据库的锁机制解决;冲突采用数据库的锁机制解决;nDB2EEE中各计算机拥有独立的中各计算机拥有独立的CPU、内存和磁、内存和磁盘,并且高速相连,对每一次访问,每个节点查盘,并且高速相连,对每一次访问,每个节点查询本地表中的相应结果,返回给协调程序,最后询本地表中的相应结果,返回给协调
11、程序,最后汇总成最终查询结果。汇总成最终查询结果。11本讲稿第十一页,共一百三十二页网格计算技术网格计算技术n网格的基本概念网格的基本概念n什么是网格(什么是网格(GRID)n网格是以网格是以Internet技术和分布计算技术为基础,技术和分布计算技术为基础,将地理上分散的各类计算资源、存储资源、数据将地理上分散的各类计算资源、存储资源、数据资源、应用资源、仪器设备等构成统一的虚拟环资源、应用资源、仪器设备等构成统一的虚拟环境,采用开放标准的协议,实现资源的有效共享,境,采用开放标准的协议,实现资源的有效共享,为动态参与的、由多机构所形成的虚拟组织协同为动态参与的、由多机构所形成的虚拟组织协同
12、完成高性能计算、信息处理等各类应用,提供可完成高性能计算、信息处理等各类应用,提供可扩展的、安全的、一致的、不同等级质量的服务。扩展的、安全的、一致的、不同等级质量的服务。网格是集群系统的进一步发展。网格是集群系统的进一步发展。12本讲稿第十二页,共一百三十二页网格计算技术网格计算技术n网格计算的产生背景网格计算的产生背景n分布式计算、高性能计算、大规模的资源共享、分布式计算、高性能计算、大规模的资源共享、协同工作、数据密集型的科学计算。协同工作、数据密集型的科学计算。n网格的本质特征是网格的本质特征是n分布与资源共享分布与资源共享n高度抽象高度抽象n自相似自相似n动态性和多样性动态性和多样性
13、n高可扩展性高可扩展性n网格计算的示例(见下页图所示)网格计算的示例(见下页图所示)13本讲稿第十三页,共一百三十二页网格计算技术网格计算技术Tier 1Tier 1Tier2 Centre 1 TIPSOnline SystemOffline Processor Farm 20 TIPSCERN Computer CentreFermiLab 4 TIPSFrance Regional Centre Italy Regional Centre Germany Regional Centre InstituteInstituteInstituteInstitute 0.25TIPSPhysic
14、ist workstations100 MBytes/sec100 MBytes/sec622 Mbits/sec1 MBytes/secPhysics data cachePBytes/sec 622 Mbits/sec or Air Freight(deprecated)Tier2 Centre 1 TIPSTier2 Centre 1 TIPSTier2 Centre 1 TIPSCaltech 1 TIPS622 Mbits/secTier 0Tier 0Tier 2Tier 2Tier 4Tier 414本讲稿第十四页,共一百三十二页网格计算技术网格计算技术n网格的系统结构(见下页图
15、所示)网格的系统结构(见下页图所示)n网格结点:地理上独立的计算和信息中心,由网格结点:地理上独立的计算和信息中心,由Internet上孤立、异构的各类资源组成;上孤立、异构的各类资源组成;n网格中间件:网格体系结构的核心部分,其功能是屏网格中间件:网格体系结构的核心部分,其功能是屏蔽网格资源层中计算资源的分布、异构性,向网格应蔽网格资源层中计算资源的分布、异构性,向网格应用层提供透明、一致的服务接口,如远程进程管理、用层提供透明、一致的服务接口,如远程进程管理、资源分配、存储访问和安全控制等。资源分配、存储访问和安全控制等。n网格应用工具层:提供更为专业化的服务和组建不同类型的网格应用工具层
16、:提供更为专业化的服务和组建不同类型的应用。应用。n网格应用层:应用层包括各种应用软件的研究、高速网网格应用层:应用层包括各种应用软件的研究、高速网格的建设等,它可以使用户方便地共享网格中的各种资格的建设等,它可以使用户方便地共享网格中的各种资源。源。15本讲稿第十五页,共一百三十二页网格计算技术网格计算技术16本讲稿第十六页,共一百三十二页网格计算技术网格计算技术n典型的网格系统(典型的网格系统(1)Globus系统系统n什么是什么是GlobusnGlobus是一个研究性的项目,其主要的研究目是一个研究性的项目,其主要的研究目标是网格基础技术研究,以及相应软件的开发和标是网格基础技术研究,以
17、及相应软件的开发和标准的制定。标准的制定。Globus是网格技术的典型代表,是网格技术的典型代表,也是目前事实上的规范。也是目前事实上的规范。nGlobus是一种软件基础设施,它以单一虚拟机是一种软件基础设施,它以单一虚拟机的方式处理分布异构的计算资源,其核心在于的方式处理分布异构的计算资源,其核心在于GlobusMetacomputingToolkit(GMT),它提供,它提供了建构一个计算网格所需的基本服务,如安全、了建构一个计算网格所需的基本服务,如安全、资源定位、管理和调度、通讯服务等。资源定位、管理和调度、通讯服务等。17本讲稿第十七页,共一百三十二页网格计算技术网格计算技术nGlo
18、bus的五层结构的五层结构应用层应用层多科学模拟多科学模拟光线追踪光线追踪汇聚层(面汇聚层(面向问题)向问题)联合求解器,联合求解器,分布式数据文档分布式数据文档检查点,作业管理,故障避免,检查点,作业管理,故障避免,分段运输分段运输汇聚层(通汇聚层(通用)用)资源发现,资源代理,系统监控,社团授权,收回证书资源发现,资源代理,系统监控,社团授权,收回证书资源层资源层访问计算,访问数据,访问系统结构,状态与性能信息访问计算,访问数据,访问系统结构,状态与性能信息连接层连接层通信(通信(IP),服务发现(),服务发现(DNS),认证,授权,代理),认证,授权,代理构造层构造层存储系统,计算机,网
19、络,代码库,目录存储系统,计算机,网络,代码库,目录18本讲稿第十八页,共一百三十二页网格计算技术网格计算技术n典型的网格系统(典型的网格系统(2)TeraGrid系统系统nTeraGrid网格系统基本情况与主要应用网格系统基本情况与主要应用nTeraGrid网格系统最初包括网格系统最初包括4个节点,后扩充到个节点,后扩充到9节点,节点间通过节点,节点间通过10-30GB/s的专用网络互联,的专用网络互联,具有超强的计算能力和存储能力。具有超强的计算能力和存储能力。n协作进行分布式数据集的分析和交换:各节点进协作进行分布式数据集的分析和交换:各节点进行独立的数据分析,整个项目的完成依赖于快速行
20、独立的数据分析,整个项目的完成依赖于快速和频繁的分析结果交换,如研究宇宙射线项目;和频繁的分析结果交换,如研究宇宙射线项目;n多个机构共享的分布式模拟:例如规模庞大的地多个机构共享的分布式模拟:例如规模庞大的地震模拟计算在不同的节点进行,任何节点的科学震模拟计算在不同的节点进行,任何节点的科学家可以通过高速网络快速获取各个不同阶段的计家可以通过高速网络快速获取各个不同阶段的计算结果;算结果;19本讲稿第十九页,共一百三十二页网格计算技术网格计算技术n网格计算的关键技术网格计算的关键技术n安全技术安全技术n网格安全机制相当复杂,各种自治资源交互时既网格安全机制相当复杂,各种自治资源交互时既不能影
21、响资源本身的可用性,又不能在系统中引不能影响资源本身的可用性,又不能在系统中引入漏洞。入漏洞。nGlobus提出了网格安全基础设施提出了网格安全基础设施GSI,GSI主主要集中在网络的传输层和应用层,采用要集中在网络的传输层和应用层,采用X1509认认证和安全套接层(证和安全套接层(SSL)通信协议,)通信协议,GSI中的主中的主要安全技术包括安全认证、安全身份相互鉴别、要安全技术包括安全认证、安全身份相互鉴别、通信加密等。通信加密等。20本讲稿第二十页,共一百三十二页网格计算技术网格计算技术n异构系统的单一系统映像技术异构系统的单一系统映像技术n网格包含多种异构资源,实现异构机器间的合作网格
22、包含多种异构资源,实现异构机器间的合作和转换,向用户提供统一、透明的服务是首要问和转换,向用户提供统一、透明的服务是首要问题。题。nGlobus中使用使用轻量级目录访问协议中使用使用轻量级目录访问协议(LDAP)作为访问该信息的接口。)作为访问该信息的接口。通过使用通过使用LDAP服务器,服务器,MDS在公共接口中提供了中间件在公共接口中提供了中间件信息,从而将统一的图像放在全异资源的顶部。信息,从而将统一的图像放在全异资源的顶部。21本讲稿第二十一页,共一百三十二页网格计算技术网格计算技术n网格统一资源管理技术网格统一资源管理技术n网格资源管理包括资源信息的组织、查询与更新网格资源管理包括资
23、源信息的组织、查询与更新等,等,网格资源分为计算类和非计算类资源。网格资源分为计算类和非计算类资源。n计算类资源信息包括所有网格结点及网络的静态计算类资源信息包括所有网格结点及网络的静态和动态信息,如结点计算能力、存储能力、网络和动态信息,如结点计算能力、存储能力、网络结构和性能指标;非计算类资源信息指网格中服结构和性能指标;非计算类资源信息指网格中服务于系统和用户的信息,如网格用户信息、软件务于系统和用户的信息,如网格用户信息、软件信息、服务功能信息等。信息、服务功能信息等。nGlobus使用使用GRAM处理资源请求、执行远程应处理资源请求、执行远程应用、分配资源等任务,并根据计算资源的情况
24、,用、分配资源等任务,并根据计算资源的情况,把资源更新信息发送给把资源更新信息发送给MDS。22本讲稿第二十二页,共一百三十二页网格计算技术网格计算技术n网格技术的缺陷和局限网格技术的缺陷和局限n网格系统对数据通讯速率要求很高,影响了系统效率或提高网格系统对数据通讯速率要求很高,影响了系统效率或提高了成本;了成本;n网格系统的维护费用比集群等高得多;网格系统的维护费用比集群等高得多;n由于目前网络带宽比由于目前网络带宽比CPU资源昂贵得多,且因特网成本资源昂贵得多,且因特网成本降低的速度低于芯片成本降低的速度,因此网格系统目降低的速度低于芯片成本降低的速度,因此网格系统目前比较适合于计算复杂、
25、但数据传输量小的应用。对于前比较适合于计算复杂、但数据传输量小的应用。对于大多数应用,集群系统方案综合看来更优越。大多数应用,集群系统方案综合看来更优越。23本讲稿第二十三页,共一百三十二页网格计算技术网格计算技术n网格技术在数字油藏模拟中的应用网格技术在数字油藏模拟中的应用n背景背景n当前被模拟的油藏模型从几十万个单元到几千万当前被模拟的油藏模型从几十万个单元到几千万个单元,个单元,运行平台主要是专业的并行机。随着运行平台主要是专业的并行机。随着老油区开发难度的增大,油藏模型的面积和数量老油区开发难度的增大,油藏模型的面积和数量将会明显地增加和扩大,继续用传统的并行计算将会明显地增加和扩大,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机 新技术 学术 讲座 精选 文档
限制150内