基于Linux的虚拟主机信息监控系统的设计与实现.pdf
《基于Linux的虚拟主机信息监控系统的设计与实现.pdf》由会员分享,可在线阅读,更多相关《基于Linux的虚拟主机信息监控系统的设计与实现.pdf(61页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、国内图书分类号:T P 3 9 3 1工学硕士学位论文基于L i n u x 的虚拟主机信息监控系统的设计与实现硕士研究生:导师:申请学位级别:学科、专业:所在单位:答辩日期:授予学位单位:陈潇潇杨明极工学硕士检测技术与自动讹装置测控技术与通信工程学院2 0 0 5 年3 月哈尔滨理工大学哈尔滨理工大学工学硕士学位论文一III I-基于L i n u x 的虚拟主机信息监控系统的设计与实现摘要随着互联网的迅速发展,以虚拟主机作为信息发布平台的大量小规模网站的数目逐渐增多,它们对互联网的信息繁荣做出了很大的贡献的同时也带来了一些问题,比如一些非法有害信息的发布与传播,因此迫切需要从技术手段上对虚
2、拟主机进行有效的监管。现有的网络监控产品,大多只用于监控网络设备的故障和性能,而网络安全产品主要是用于防范黑客的入侵,安全部门虽然在网络的出口配置信息过滤装置,但因为在网络主干上数据包过于密集,能够分析和记录的数据有限,因此对于虚拟主机这样的信息发布平台,目前市场上还很少有相应的信息监控产品。本文所开发的虚拟主机信息监控系统正是从这一需求出发,针对互联网安全主管机构、互联网服务提供商等客户对网站监管、发布信息安全控制的实际需要,提出的互联网信息监控系统解决方案。本系统以当前流行的L i n u x 系统为平台。基于n e t f i l t e r 功能框架,利用其完善的包过滤技术,以内核模块
3、的方式实现了信息监控功能,并结合i p t a b l e s 和网桥通过对以太网帧的转发,实现了透明网关。同时,该系统还结合了良好的日志审计功能和简单入侵检测功能,更增强了系统的安全性和可管理性。通过对已完成系统的实际测试表明,本系统具有低成本、易管理、可伸缩的系统特性,可以轻松怏捷的开展互联网信息监控工作,提高监控效率,加大监控力度,有效降低成本,减少人力投入,具有广阔的应用前景。关键词L i n u x:虚拟主机:信息过滤:n e t f i l t e rhttp:/北京虚拟主机D e s i g na n di m p l e m e n to fv i r t u a lh o s
4、 ti n f o r m a t i o nm o n i t o r i n gs y s t e mb a s e do nl i n u xA b s t r a c tT h en u m b e ro f s m a l】h o s t sw h i c hb a s e do nv i r t u a lh o s tb e c o m e sm o r ea n dm o r ew i t ht h ef a s tg r o wo fi n t e m e t T h e ym a k eal o to fc o n t r i b u t i o nt ot h ei n
5、f o r m a t i o np r o s p e r i t yo fi n t e r a c t,y e tt h e r ea r es o m ep r o b l e m ss u c ha sr e l e a s ea n ds p r e a do fi l l e g a la n dh a r m f u li n f o r m a t i o n S oi ti sv e r yu r g e n tt ot a k ee f f e c t i v em e t h o dt oa d m i n i s t e rt h e、:,i r t u a lh o
6、 s ti nt e c h n i q u e M a n yn e t w o r km o n i t o r i n gp r o d u c t sn O Wt h a tC a r lo n l yu s e df o rf i n d i n gt h ef a u l ta n dm e a s u r i n gt h ep e r f o r m a n c eo fn e t w o r kd e v i c e,a n ds o m eo t h e ri n t e r a c ts e c u r i t yp r o d u c tu s e df o rp r
7、e v e n t i n gt h ei n t r u d eo f h a c k e r S e c u r i t yo r g a n i z a t i o nC a l li n s t a l la l li n f o r m a t i o nf i l t e r i n gd e v i c ea tt h ee x p o r to ft h en e t w o r k,b u tt h e r eS Om a n yp a c k e tt h r o u g hi tt h a tn l a k e 7i th a r dt oa n a l y z ea n
8、 dr e c o r de n o u g hd a t a S ot h en e e do fas y s t e mt h a tC a nm o n i t o rt h ei n f o r m a t i o n0 i 2t h ev i r t u a lh o s ta tr e a l-t i m ei sv e r yu r g e n t O u rs y s t e mu s e dt h ep o pt e c h n o l o g yo fp a c k e t+f i l t e r i n gt h a tb a s e dn e t f i l t e r
9、f r a m e w o r ki nL i n u x r e a l i z e dt h ei n f o r m a t i o nf i l t e r i n gf u n c t i o n,a n dw i n li p t a b l e sa n db r i d g er e a l i z e dt h ef u n c t i o nt oc a p t u r et h ep a c k e t A tt h es s i n et i m e,t h i ss y s t e ms u p p o r tl o ga u d i t 腼j t i O na n
10、ds i m p l eI D Sf u n c t i o n r e i n f o r c et h es y s t e m Ss e c u r i t ya n de a s yt om a n a g e n I et e s tr e s u ko f o u rf m i s h e ds y s t e mi n d i c a t e dt h a tt h i ss y s t e mh a st h ep r o p e r t yo fc h e a p,e a s yt om a n a g ea n de x t e n s i b l e,a n dm a k
11、 ei te a s ya n de f f e c t i v et om o n i t o rt h ei n f o r m a t i o no fi n t e m e tw i t hg o o dp e r f o r m a n c e W eb e l i e v et h a to u rs y s t e mw i l lb eu s e dw i t t yv d t hg r e a tp r o m i s e K e y w o r dl i n u x;v i r t u a lh o s t;i n f o r m a t i o nf i l t e r
12、i n g;n e t f i l t e r一一http:/北京虚拟主机哈尔滨理工大学工学硕士学位论文I 1 课题背景及意义第1 章绪论随着互联网技术的不断快速发展和完善,因其独具的传播快速高效而备受关注,现在互联网技术已经成为人们日常生活中的一部分,根据C N N I C 发布的第十四次中国互联网络发展统计报告中的数字,中国互联网行业经过十几年的发展,目前已经积累9 0 0 0 多万的互联网用户,在两年之内,中国的网民数量可能超过美国,成为世界最大的网民群体【“。最好的信息必须通过严肃、核实、准确、平衡和公正的手法发布到大众那里,由于互联网的方便快捷,人们可以随意在互联网发布自己的信息,这
13、样就有可能会出现与事实不相符的虚假新闻,使新闻的真实性、权威性大打折扣,甚至成为了一些别有用心的人传播不利于社会稳定和长治久安的信息的途径,使大量的黄色、反动、邪教、网络犯罪的信息充斥网络【2 l。如何保证互联网给人们的生活带来快捷的同时,减少乃至杜绝网络中大量的非法有害信息成为困扰国家信息安全部门的一个难题。根据统计分析,目前的互联网以中文为主要信息途径的带有非法有害信息的网站分为两大类:一类为在境外托管服务器的大型网站,另一类为在国内租用虚拟主机网站空间的小规模网站,而后一类网站占据了中文网站的8 0 以上。如何控制非法有害信息的肆意流行,并在第一时间掌握有害信息传播的情况,已经成为国家各
14、部门非常关心的问题。要在根本上解决有害信息的传播,就要对信息浏览的起点,即虚拟主机做好监督和管理工作。但是,鉴于目前中国虚拟主机运营体系所存在的管理上的漏洞以及技术上的缺陷,还无法及时控制非法有害信息在以虚拟主机为平台的网络上传播。目前国内外现有的网络监控产品,大多只用于监控网络设备的故障和性能,而网络安全产品主要是用于防范黑客的入侵,安全部门虽然在网络的出口配置信息过滤装置,但因为在网络主干上数据包过于密集,能够分析和记录的数据有限,从信息安全的需要出发,迫切需要一种能针对以虚拟主机为平台的流通信息进行实时监控和分布式检测的系统1 3】。因此,如何能根据虚拟主机的特点,从而实现一个真正能够实
15、时监控虚拟主机网站内容的系统成了追在眉睫的问题。http:/北京虚拟主机堕玺鎏耋三奎兰王兰璧圭兰垒l 婆1 2 信息过滤技术的现状“信息过滤”这个概念是在1 9 8 2 年由D e n n i n g 提出来的1 4),信息过滤主要包含普通网站网页上的有害信息过滤、电子邮件中的有害信息的过滤和病毒邮件的过滤。目前,市场上的各种信息过滤产品大多局限性比较大,大体分为两类:单机版和网络版。单机版的代表性产品有联想蓝眼睛智能信息过滤系统,该系统采用了地址库过滤和页面分析双重查杀的方式,过滤掉了互联网有声信息的访阀,但对有害信息的审计和控制方面因为其采用单机模式而十分有限。网络版产品国内的代表性产品有
16、微创信息过滤平台,通过使用M i c r o s o RI S AS e r v e r 的W e bP r o x y 功能,实现对局域网访问I n t e m e t 的控制、过滤、访问量统计等功能。通过w e bs e r v i c e 连接中心服务器,进行数据收集、分析报表,因为其采用代理模式势必对原网络拓扑结构产生很大的影响,产品的适应性和过滤性能将受到很大的影响。1 2 1 文本过滤技术现状各个过滤系统在对非法信息过滤的功能上都使用文本过滤。到目前为止,世界上对文本过滤技术的研究非常广泛,研究文本过滤的单位和国体都取得了一定的成果。其中,中国科学院计算技术研究所的文本过滤系统,自
17、适应过滤平均准确率为2 4 5,批过滤平均准确率为4 0 5。微软剑桥研究院的文本过滤系统,自适应过滤平均准确率为2 4 0 5,批过滤平均准确率为3 4 3。复旦大学的文本过滤系统,自适应过滤平均准确率为2 6 5。批过滤平均准确率为3 1 7。文本过滤技术是一种很必要却不可靠的技术,它的完善还需要走很长的路扭。文本过滤项目韵任务定义是【6 l:给定一个主题描述(印用户需求),建立一个能从文本流中自动选择最相关文本的过滤模板(F i l t e r i n gP r o f i l e)。随着文本流的逐渐进入,过滤系统自动地接受或拒绝文本,并得到文本相关与否的反馈信息,再根据反馈信息自适应地
18、修正过滤模板。它主要包含三个子任务:分流、批过滤、自适应过滤。分流(R o u t i n g)子任务:用户需求固定,提供对应于该用户需求的训练文本集中的相关文本,从用户需求构造查询语句来查询测试文本集。批过滤(B a t c hF i l t e r i n g):它和分流子任务很类似:用户需求固定,提供对应于被用户需求的训综文本集中的相关文本,构造过滤系统,对测试文本集中的每一文本做出接受或拒绝的决策;不同的是分流任务要求按相似度从大到小的顺序检索出一批文本,而批过滤则要求将文本分成相关和不相关两类。自适应过滤(A d a p t i v eF i l t e r i n g):它要求仅仅
19、从主题描述出发,不提供或http:/北京虚拟主机哈尔滨理工大学工学硕士学位论文#E 目l=_-l E 目-I E j _ _ _-E =I _ _-I ll _ E!1 0 目l _-口_ l l d I l l-_ I _!目=!E-_ _ _-=,_ _ _ _只提供很少的训练文本,逐-,N 断输入文本流中的文本是否相关。对“接受”的文本,能得到用户的反馈信息,用咀白适应地修正过滤模板。而被“拒绝”的文本是不提供反馈信息的。这是最接近真实环境也是最困难的子任务。各信息过滤系统都是通过:首先建立关键词库、系统知识的语料库学习,再到真实文本有害度的判定,然后应用到实际的工作环境中进一步完善文本
20、过滤的功能。在实际工作环境中,随着过滤的文本数量增加,系统不断的添加相应的关键字到关键字库里,然后定时更新探针端的关键字库,从而实现功能不断完善,过滤更加准确全面的功能。本课题由于制作成本较低,因此在文本过滤领域不做更多的研究,对于较大的文本采用B M 算法,对于模式中重复部分很少时,需要比较的字符数比输入字符串小的模式来说,采用B M 算法效率是当前模式匹配算法里效率最高的,对于较小的文本用K M P 算法进行比对1 7】。1 2 2 包过滤技术现状信息过滤产品底层实现的核心技术便是对网络封包的截获,邀同时也是实现防火墙、网络嗅探以及入侵检测等多种网络安全系统的核心技术【8 1。网络封包,又
21、称作网络数据包(D a t a g r a m)I”,是指通过网络传输的数据的基本单元,包含一个包头(h e a d e r)和数据本身,其中包头描述了数据的目的地以及和其它数据之间的关系。需要通过网络传输的原始数据被按照一定的大小和标准进行层层分组打包,并加上相应的包头封装为一个个独立的封包,以网络封包的形式进行传送。网络封包截获技术指的就是在网络封包传输的过程中对其进行拦截。由于现代操作系统已经封装了所有的网络底层操作【1 0 l,自动实现了网络封包级的传输控制,所以要完成对网络封包的拦截就需要通过操作系统或直接嵌入到操作系统中来实现。通过对截获的网络封包进行分析和过滤,可以达到网络窃听、
22、流量监控、恶意网络数据隔离等目的,因此网络封包截获技术是构建防火墙、网络监控、入侵检测等网络安全系统的基础。在截取数据的过程中,在链路层实现网络数据的读写是关键。即如何实现直接读写网卡数据帧。当前广泛采用的技术有以下几种l:r 1 直接针对网卡进行编程即通过对网卡中各种寄存器进行编程控制,完成数据分组的正确发送和接收。以这种方式实现截取数据具有速度快、性能好的优点。但是这种实现方式需要详细了解网卡的硬件设计。2 面向网卡驱动程序进行编程当前各网卡硬件厂商提供的网卡驱动程序大都遵守某种统一规范,常见的有N O V E L L 公司的I P X 网卡驱动程序;遵http:/北京虚拟主机哈尔滨理工大
23、学工学硕士学位论文循O D I(O p e nD a t aL i n kI n t e r f a c e)规范的M L I D(M u l t i p l eL i n kI n t e r f a c eD r i v e r)网卡驱动程序;M i e r o s o f t 公司的N D I S(N e t w o r kD e v i c eI n t e r f a c eS p e c i f i c a t i o n);以及F T P 公司的P a c k e tD r i v e r 网卡驱动程序。这些规范通过提供统一的A P I调用来为上层程序提供网络数据分组的发送和接收
24、服务。面向网卡驱动程序编程来实现起来比较容易,而且在一定范围内具有可移植性。3 利用第三方工具网络上已有不少网包获取工具,部分获取工具还具有一定的分析、统计功能,比如s 1 1 i i f,t c pd u m p,s n o o p 等。由于这些工具对信息的处理方式均采用复制的方式,没有主动的控制措施,因此仅靠这些工具来获取网络信息仍然不是够的。同时这些工具还有只能用于局域网方式、只能对包进行截取,不具有信息重组功能等限制。在本论文的实现中,对于网络封包的截取采用了基于L i n u x 的n e t f i l t e r 技术。与其他操作系统相比,L i n u x 的主要优势体现在以下
25、方面【1 2】:、1 可以运行在3 8 6 以上及各种R I S C 体系结构的机器上L i n u x 最早诞生于微机环境,它的一系列版本都充分利用了x 8 6C P U 的任务切换能力,使x 8 6C P U 的效能发挥得淋漓尽致,而这一点连W i n d o w s 都没有做到。此外,它可以很好地运行在由各种主流R I S C 芯片(A l p h a,M I P S,P o w e rP C,U l t r aS P A R C,H P-P A 等)搭建的机器上。2 L i n u x 是U n i x 的完整实现从发展背景看,L i n u x 是从一个比较成熟的操作系统(U n i
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 Linux 虚拟主机 信息 监控 系统 设计 实现
限制150内