学士学位论文--“百度搜索引擎”下的“百度知道”系统的设计和实现.doc
《学士学位论文--“百度搜索引擎”下的“百度知道”系统的设计和实现.doc》由会员分享,可在线阅读,更多相关《学士学位论文--“百度搜索引擎”下的“百度知道”系统的设计和实现.doc(36页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、长春工业大学人文信息学院 08411XX XXX 毕业论文摘 要本论文主要阐述“百度搜索引擎”下的“百度知道”系统的设计思想和实现的关键技术。论文针对互联网使用人员共享知识解决提问的需求,采用面向对象设计的方法和JSP,Struts等技术,分析、设计并实现了百度知道系统。该系统具有用户登录、注册,发布、回答、查询以及处理问题等功能,测试表明该系统达到了预期的要求。论文包括以下几个部分:第一部分系统分析,通过对用户需求的分析,说明了* * * *。第二部分概要设计, 设计了*,* * * *。第三部分详细设计,设计了* * * *。第四部分系统实现,通过*完成了*系统的*模块。达到*。关键字:J
2、SP Struts 搜索引擎(注:本文仅供参考,本文中出现的内容,不允许复制)AbstractThe thesis is design of System that about Baidu Know System of Baidu Search-engine. On the other hand, it expounds the part of design of model and key technology of implementation. With the requirement of the person who uses Internet to share knowledge
3、and to resolve problems,it adopts OOP(Object Oriented Programming) and JSP, Struts technology to analyze, design and implements this system. The system includes the functions that register and question, answer, select and handle the question of user. The test of whole system shows that it has come u
4、p the expectation.The thesis mainly includes the following parts: 1. Source of the Problem. 2. Requirement and Analysis. 3. System Design. 4. Detailed Design. 5. System Implementation.The system is WEB development application and is based on B/S model. So that I chose the popular WEB development tec
5、hnology which is based on MVC development model, that is JavaBean、JSP、Servlet and I also used Struts Framework for this application. The development tools are mainly included Dreamweaver 8,Eclipse3.2、MyEclipse5.1. JUDE is my UML tool. The database for server is SQL server 2000.The development of app
6、lication includes three part: the databases of design、the design of web pages and the coding work. All coding of pages mainly used the JSP and Struts tags. For coding part is completely base on struts framework.Key words: JSP Struts Search engine目录(注意:行间距25)第一章 系统分析11.1 问题来源11.2 选题背景21.2.1问题定义21.2.2
7、选题意义21.3系统功能分析31.4数据流图4第二章 基础理论知识62.1 MVC模式概述62.2 MVC如何工作72.3 Struts概述8第三章 概要设计93.1 系统概述93.2 功能分析93.3 数据库分析113.3.1实体的分析113.3.2实体的属性113.3.3实体之间的联系123.4 数据库的概念设计133.5 数据库的逻辑结构设计143.6数据库的物理设计16第四章 详细设计184.1 数据库连接模块的创建194.2 用户模块的详细设计204.3 问题模块的详细设计214.3.1百度知道的主要功能设计214.3.2百度知道的页面及主要核心算法设计224.4 开发工具及环境24
8、第五章 系统实现265.1 用户模块的实现265.2 问题模块的实现27结束语30参考文献31 共5 页 第V页长春工业大学人文信息学院 0441208 谭天宇 毕业论文第一章 系统分析1.1 问题来源百度,2000年1月创立于北京中关村,是全球最大的中文网站 、最大的中文搜索引擎。百度每天响应来自138个国家超过数亿次的搜索请求。用户可以通过百度主页,在瞬间找到相关的搜索结果,这些结果来自于百度超过十数亿的中文网页数据库。同时,用户不必访问百度主页,也可以搜索信息。超过20万个搜索联盟会员,通过各种方式将百度搜索结合到自己的网站,使用户在上网的任何时候都能进行百度搜索。百度还提供WAP与PD
9、A搜索服务,即使身边没有PC机,用户也可以通过手机或掌上电脑等无线平台进行百度搜索。百度知道()是一个基于搜索的互动式知识问答分享平台,于2005年6月21日发布,并于2005年11月8日转为正式版。和大家习惯使用的搜索服务有所不同,“百度知道”并非是直接查询那些已经存在于互联网上的内容,而是用户自己根据具体需求有针对性地提出问题,通过积分奖励机制发动其他用户,来创造该问题的答案。 同时,这些问题的答案又会进一步作为搜索结果,提供给其他有类似疑问的用户,达到分享知识的效果。百度知道的最大特点,就在于和搜索引擎的完美结合,让用户所拥有的隐性知识转化成显性知识,用户既是百度知道内容的使用者,同时又
10、是百度知道的创造者,在这里累积的知识数据可以反映到搜索结果中。通过用户和搜索引擎的相互作用,实现搜索引擎的社区化。百度知道可以说是对过分依靠技术的搜索引擎的一种人性化完善。1.2 选题背景1.2.1问题定义之所以搜索引擎这么火,大家这么依赖,是因为技术的进步,搜索引擎技术的进步非常的快。技术进步快,实际上是需求在推动。搜索最近两年来变得这么火,实际上是需求在推动搜索技术和产业推动。宽带越来越普及,上网越来越容易,上网的人越来越多,信息量越来越大。现在已经是非常繁荣的大路,这里面的内容很多很多,搜索一下初中的初恋情人,可能也会查找他的名字。“用户提出任何一个问题,很快就会有人帮助回答,通过投票选
11、出的最佳答案,往往又作为搜索结果被分享到更多用户”,这一简单、便捷的模式受到了网民的热烈欢迎,同时也改变着网民的日常生活习惯。网友表示,“生活上一遇到解决不了的问题,我第一个想到的就是上百度知道”,目前,百度知道每天解决超过5万个问题,也就意味着,通过用户的互动参与,两天时间即可编辑完成一本十万个为什么。1.2.2选题意义众所周知,百度知道已经是一套开发过并且比较成熟完善的正在互联网上广泛使用的系统了,而之所以我选择这个系统作为我的毕业设计主要是因为现实中的该系统是由PHP语言开发的,而在大学期间的所学使我对于Java,JSP语言有了浓厚兴趣,一方面可以利用自己所学的知识实现一套正规的系统,更
12、加锻炼自己和提高自己的技术水平,另外实用JSP语言版本开发与真实的系统实现方式不同也大大的增加我开发的兴趣。所以我选择百度知道这个系统作为我的毕业设计。1.3系统功能分析要开发一个应用系统,首先要了解用户对整个系统的具体要求,确定系统应该实现的功能和系统应该具有的性能;设计应用软件时所使用的设计平台,所开发的应用软件的运行环境;通过调查分析去了解系统的业务流程,确定数据库设计中需要的数据结构;还要分析系统中的数据流和长期使用的数据存储等等,这些都是需求分析中应该完成的任务。本章采用软件工程的方法对“百度知道”模块进行了需求分析。“百度知道”是一个基于搜索的互动式知识问答分享平台。它实现登录用户
13、在线提问回答并解决问题共享知识的过程。该平台的维护为自动维护,由定义规则进行数据的维护,默认不设网站管理员角色。1.用户角色:普通用户(只有查询权限,无需登录)、信息发布用户(提问和回答问题的用户)2.功能模块划分:(1)问题信息查询(普通用户)1)按照问题的栏目进行问题信息查询2)按照问题的标题内容进行问题信息的查询3)按照问题的状态(解决,待解决)来进行问题信息的查询4)查询全部信息(2)问题信息的管理(注册用户)1)提出问题2)对自己提出的提问进行信息处理3)回答待解决的问题4)问题信息查询每一个模块的功能详见总体设计。1.4数据流图根据该系统问题的需求进行分析,使用数据流图示描述数据处
14、理过程。数据流图从数据传递和加工的角度,以图形的方式刻画数据流从输入到输出的传输变换过程。数据流图是结构化系统分析的主要工具,它表示了系统内部信息的流向,并表现系统的逻辑处理功能。结果信息用户信息注册请求游客用户1接收请求 用户表 D1游客用户(数据流图描述数据处理过程,起点和终点必须是人,用矩形表示;处理过程是动作,用圆角矩形表示;数据存储就是数据表,用开口矩形表示;请大家注意,参考软件工程书画图)查询信息问题 信息登录请求回答显示主页修改信息注册用户 问题表 D2提问显示问题问题列表回答问题注册用户 问题表 D2 回答表 D3注册用户结果结果修改信息问题编号提问请求图1-2 问题模块的数据
15、流图 回答表 D3显示问题列表指定问题回答列表结果结果图1-1 用户模块的数据流图名字:问题列表别名:描述:问题列表所有问题的分类统计列表,待解决10个,已解决和最佳问题各5个定义:待解决问题以解决问题最佳问题位置:百度知道首页名字:回答列表别名:描述:针对某一问题的所有回答定义:回答列表回答编号回答内容回答者编号问题编号回答状态位置:问题页面名字:问题编号别名:问题ID描述:唯一标识问题的字段定义:问题编号数字位置:问题表数据流图中的一些专业词汇在数据字典中解释如下:(请注意:数据字典是解释前面的数据流图中出现的容易产生歧义的词,没有数据流图只出现数据字典是毫无意义的。在数据流图中没有的词出
16、现在数据字典中也是毫无意义的。)第二章 基础理论知识百度知道系统的设计采用了JSP,Struts框架来实现,因此从采用了MVC结构模式进行开发。整个开发的过程也是完全按照Struts框架结构进行的。下面了解一下MVC开发模式和Struts框架技术。2.1 MVC模式概述MVC本来是存在于Desktop程序中的,M是指数据模型,V是指用户界面,C则是控制器。使用MVC的目的是将M和V的实现代码分离,从而使同一个程序可以使用不同的表现形式。比如一批统计数据你可以分别用柱状图、饼图来表示。C存在的目的则是确保M和V的同步,一旦M改变,V应该同步更新。 模型视图控制器(MVC)是Xerox PARC在
17、八十年代为编程语言Smalltalk80发明的一种软件设计模式,至今已被广泛使用。最近几年被推荐为Sun公司J2EE平台的设计模式,并且受到越来越多的使用 ColdFusion 和 PHP 的开发者的欢迎。模型视图控制器模式是一个有用的工具箱,它有很多好处,但也有一些缺点。MVC模式是“Model-View-Controller”的缩写,中文翻译为“模式-视图-控制器”。MVC应用程序总是由这三个部分组成。Event(事件)导致Controller改变Model或View,或者同时改变两者。只要Controller改变了Models的数据或者属性,所有依赖的View都会自动更新。类似的,只要C
18、ontroller改变了View,View会从潜在的Model中获取数据来刷新自己。MVC模式最早是Smalltalk语言研究团提出的,应用于用户交互应用程序中。Smalltalk语言和java语言有很多相似性,都是面向对象语言,很自然的SUN在potstone(宠物店)事例应用程序中就推荐MVC模式作为开发Web应用的架构模式。MVC模式是一种架构模式,其实需要其他模式协作完成。在J2EE模式目录中,通常采用service to worker模式实现,而service to worker模式可由集中控制器模式,派遣器模式和Page Helper模式组成。2.2 MVC如何工作MVC是一个设计
19、模式,它强制性的使应用程序的输入、处理和输出分开。使用MVC应用程序被分成三个核心部件:模型、视图、控制器。它们各自处理自己的任务。1.视图 视图是用户看到并与之交互的界面。对老式的Web应用程序来说,视图就是由HTML元素组成的界面,在新式的Web应用程序中,HTML依旧在视图中扮演着重要的角色,但一些新的技术已层出不穷,它们包括Macromedia Flash和类XHTML,XML/XSL,WML等一些标识语言和Web services。2.模型 模型表示企业数据和业务规则。在MVC的三个部件中,模型拥有最多的处理任务。例如它可能用像EJBs和ColdFusion Components这样
20、的构件对象来处理数据库。被模型返回的数据是中立的,就是说模型与数据格式无关,这样一个模型能为多个视图提供数据。由于应用于模型的代码只需写一次就可以被多个视图重用,所以减少了代码的重复性。3.控制器 控制器接受用户的输入并调用模型和视图去完成用户的需求。所以当单击Web页面中的超链接和发送HTML表单时,控制器本身不输出任何东西和做任何处理。它只是接收请求并决定调用哪个模型构件去处理请求,然后用确定用哪个视图来显示模型处理返回的数据。 现在我们总结MVC的处理过程,首先控制器接收用户的请求,并决定应该调用哪个模型来进行处理,然后模型用业务逻辑来处理用户的请求并返回数据,最后控制器用相应的视图格式
21、化模型返回的数据,并通过表示层呈现给用户。2.3 Struts概述Struts最早是作为Apache Jakarta项目的组成部分问世运作。项目的创立者希望通过对该项目的研究,改进和提高Java Server Pages、Servlet、标签库以及面向对象的技术水准。Struts这个名字来源于在建筑和旧式飞机中使用的支持金属架。它的目的是为了减少在运用MVC设计模型来开发Web应用的时间。你仍然需要学习和应用该架构,不过它将可以完成其中一些繁重的工作。除此之外,Struts的优点主要集中体现在两个方面:Taglib和页面导航。Taglib是Struts的标记库,灵活动用,能大大提高开发效率。另
22、外,就目前国内的JSP开发者而言,除了使用JSP自带的常用标记外,很少开发自己的标记,或许Struts是一个很好的起点。Struts 是MVC的一种实现,它将 Servlet和 JSP 标记(属于 J2EE 规范)用作实现的一部分。Struts继承了MVC的各项特性,并根据J2EE的特点,做了相应的变化与扩展。第三章 概要设计百度知道是一个基于搜索的互动式知识问答分享平台。和大家习惯使用的搜索服务有所不同,“百度知道”并非是直接查询那些已经存在于互联网上的内容,而是用户自己根据具体需求有针对性地提出问题,通过积分奖励机制发动其他用户,来创造该问题的答案。 同时,这些问题的答案又会进一步作为搜索
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 学士学位 论文 百度 搜索引擎 知道 系统 设计 实现
限制150内