毕业设计(论文)新闻自动提取系统.doc
《毕业设计(论文)新闻自动提取系统.doc》由会员分享,可在线阅读,更多相关《毕业设计(论文)新闻自动提取系统.doc(35页珍藏版)》请在三一办公上搜索。
1、摘 要新闻自动提取系统是伴随Internet的发展而出现的,它实现了既让用户享受到Internet的新闻服务,又提高了企业或公司的网络安全性和资源利用效率的双重功能。系统用Delphi自动地从Internet上将网上新闻用二级文本分析技术提取出来并存储进数据库,然后再用ASP.net通过访问SQL Server数据库将新闻发布,供局域网内的用户浏览和查询。系统具有自动性、经济安全、易改变性和开发工具新的特点。新闻的提取、数据库更新及网页内容的更新全部是自动实现的,不需要人工干预,这就大大节省了人力资源;系统只有一台主机与Internet相连,提高了安全性,也节约了费用;系统采用模块式编程方法,
2、当某部分改动时只需改写少量代码就能保证系统重新正确运行;系统用下一代Windows系统工具ASP.net开发,所以有很强的沿用性。关键词:新闻提取;NGWS;Internet;N级网页ABSTRACTThe automatic news extract system is born with the development of internet. It implements two functions at the same time, one is to let users share internet news service, the other is to improve the e
3、nterprise or companys network security and resource efficiency.The system uses two-level text analysis to extract news from internet then store them to database automatically, after that use ASP.net as developing tools to access the database and distribute the news to local area network for users to
4、 explore and query information that they need.The features of news extract system are automatism, security and price, flexibility, new developing tool. The main feature of the system is news extract, database access and web refresh are automatic implemented, its no need to intervene by man, so much
5、more labor is saved;In the whole system there is only one mainframe is connected to internet, the security is improved, the expense is less as well;The system takes module programming coded method, when some part needs to be changed, rewrite several lines of code can make the system function correct
6、ly as before;The last part of the system is developed by ASP.net , which is called NGWS(next generation windows system),so it can be used for a long time.Keyword: News Extract;Next Generation Windows System;Internet;N-level web目 录第1章 新闻自动提取系统概述11.1系统功能和组成11.2系统的特点及技术创新2第2章 开发工具介绍32.1 DELPHI6.0简介32.2
7、 SQL SERVER简介52.3 新一代网页开发工具ASP.NET8第3章 需求分析123.1构建新闻自动提取系统的必要性和功能123.2新闻自动提取的可行性12第4章 系统总体设计14第5章 详细设计175.1技术难点与解决方案175.2 DELPHI新闻提取185.3 DELPHI数据库访问部分25第6章 系统测试29结束语30参考文献31致 谢32第1章 新闻自动提取系统概述1.1系统功能和组成1.1.1系统简介新闻自动提取是指一台计算机作为主机将Internet上的新闻自动提取到本机,然后以网页的形式发布出去,供局域网内的其它用户访问浏览。而新闻自动提取系统就是运行在主机上完成上述功
8、能的一套软件。1.1.2系统功能(1) 本系统可提供多个网站的新闻,用户能选择自己喜爱的网站;(2) 系统已将新闻分成教育、体育、财经、娱乐等多类,用户可依兴趣选择类别,系统还提供了简单的模糊查询的功能;(3) 本系统的新闻随着internet上网站的更新而变化,也可将新闻存储起来,形成一个可查询的信息库;(4) 本系统可扩展为图片、MP3、MTV等自动提取系统。1.1.3系统组成系统前端开发工具为Delphi和ASP.net,后台数据库为SQL Server,因此,系统也由三大部分组成:SQL Server部分,Delphi部分,ASP.net部分。(1) SQL Server部分这部分要创
9、建数据库、数据表、表结构及对数据库的安全性和数据进行管理,也包括建立用户登录、数据冗余等控制。(2) Delphi部分这部分用Delphi定时访问Internet的各大网站,将其上的新闻提取出来,并依靠Delphi的数据库访问机制按新闻类别存入相应的数据表,这部分还有对数据库进行清空、查看等功能。(3) ASP.net部分这部分主要将数据库中的新闻发布出来,并实现按关键字对新闻内容的简单查询,实际还实现了添加、删除、排序等功能。1.2系统的特点及技术创新1.2.1系统特点(1) 整个系统完全是自动执行的,包括新闻提取、数据库更新、网页内容的更新,这就使网络管理员从繁重的人工下载中解脱出来;(2
10、) 系统具有良好的扩展性,它可扩展为图片、MP3、MTV等许多自动提取系统;(3) 在数据库设计时和数据插入时考虑到了数据冗余的控制。(4) 由于系统用到的主要编程工具是Delphi和ASP.net,所以系统有很好的网络性能。1.2.2系统创新(1) 整个新闻提取过程完全靠程序实现,而且库中的内容随各大网站新闻内容的变化而自动刷新,刷新的间隔在最初设定,不需要人工干预,这是系统最突出的特点;(2) 在用Delphi提取新闻内容时,从理论上不但可以提取出各大类主页中所有二级新闻的内容,而且经改进后可获取多级新闻内容,这是在理论上的重大突破;(3) 提取经济、娱乐、体育等类新闻的标题可直接从二级页
11、的网页标题提取,大大化简了对标题的提取,也更直观;(4) 系统对每类新闻都有一个备份表用于存储所有提取过的新闻,这样用户不但可以选择看最近的新闻,也可看历史上的新闻;(5) 系统提供了让用户根据自己的兴趣按关键字选择想要的新闻,即模糊搜索功能。第2章 开发工具介绍2.1 Delphi6.0简介2.1.1 Delphi的基本功能简介Delphi是当前最强大,最灵活的基于Windows的可视化应用程序开发工具。它将可视化技术与Object Pascal语言完美结合,具有良好的数据库访问能力,是一个非常强大的应用程序开发组件的集合,被喻为“第四代编程语言”。Delphi 6.0是Borland公司继
12、Delphi 5.0后的又一力作。Delphi的功能十分强大,这里只分类介绍如下:(1) 灵活的VCL(Visual Component Libarary)组件1VCL是Delphi最重要的组成部分。在设计时添/删除组件、自定义组件、使用面向对象技术继承其它组件的行为,这些能力都是决定Delphi效率的关键因素。在许多场合,编写VCL组件都采用固定的面向对象的程序设计方法。(2) 强大的数据库功能Delphi具有所有工具中最灵活的数据库结构,对大多数基于数据库平台的应用程序来说,BDE(Borland Database Engineer)的功能已足够强大,程序设计人员无需直接同数据库文件打交道
13、,就可以操作和处理各个数据库文件。(3) 完善的网络编程功能 作为一种流行的编程语言,优良的网络性能是十分重要的。Delphi提供了很多与网络的接口,使用起来非常方便,而且Delphi程序可在Windows和Unix操作系统下运行,无需改变代码,所以说Delphi有强大的网络功能是当之无愧的。2.1.2 Delphi 6.0的新特性2(1) Delphi 6.0通过完全基于SOAP的网络服务和XML数据交换支持,从根本上简化了在互联网上构筑下一代电子商务的程序。XML及网络服务技术和Delphi 6.0的无缝融合为工业标准化的网络服务和互联网上B2B、B2C和P2P的集成带来了唯一的快速开发工
14、具。(2) WebSnap使得Delphi能够直接融入当今的网站开发团队。通过WebSnap,Delphi程序能够无缝地集成到网站和使用现今流行的HTML开发环境(如Dreamweaver、FrontPage、VBScript和JavaScript)的网站开发团队中。(3) 编写单一源代码的Windows/Linux程序。Delphi 6.0和Kylix兼容,使用交叉平台的CLX控件库和可视化设计器编写的高性能、可移动式的Windows程序能在Linux上用Borland Kylix轻松编译。(4) 支持最新的Windows 2000/Me和Office 2000图形用户接口。通过Action
15、Bands、ActionManagers和Shell Controls可以轻松制作最流行的、符合微软UI最新趋势的动态用户界面。通过让最终用户完全自定义他们自己的UI使用来排除复杂的用户界面。2.1.3 Delphi的IDE环境当我们打开Delphi 6.0的时候,首先进入的就是它的集成开发环境(Integrated Development Environment,IDE),我们编写、运行和调试程序就是在这个环境中完成的。在Delphi 6.0中,集成开发环境由碟码编辑器、调试器、工具栏、图像编辑器和数据库工具组成,所有这些以集成的方式进行操作。(1) 主菜单主菜单是位于屏幕最顶端的主控窗口的
16、菜单栏,通过它几乎可以访问所有的Delphi的提供工具。(2) 工具条工具条提供了一组快捷的按钮来让用户能迅速访问到Delphi 6.0中常用功能。(3) 控件模板位于主控窗口工具条右边的就是控件模板,通常我们也将它们称为Delphi的组件。Delphi 6.0将很多功能相近的控件放在同一个控件组中。按一般情况来说,只需要双击一个控件就可以把它放到应用程序的窗体中去。使用Delphi进行编程大部分情况就是使用各种控件,只要掌握了基本控件的使用方法,你就可以很方便地编制出一般的应用程序了。(4) 窗体设计器当你第一次运行Delphi 6.0的时候,在整个界面的中间可以看到一个标题用程序的外观进行
17、设置,它是整个Delphi应用程序设计的基础。在Delphi 6.0的窗体设计器是所见即所得的,你可以在窗体上任意放置自己所需要的可视或者是不可视控件。(5) 代码编辑器位于窗体设计器的下方的那一块编辑区域称为代码编辑器。在Delphi 6.0中,代码编辑器由两部分组成,左侧是一个代码分析器,它可以让你很方便地找到应用程序中的类、各种定义的方法和变量等。右侧则是用户输入代码的地方,我们从代码编辑器窗体上的标签可以看到,现在打开的文件是Unit1Pas文件,每一个编辑的文件都可以打开在一个标签页中,你可以通过点击标签的方法方便地在工程的各个文件之间进行切换。代码编辑器是程序员编程的一个环境,几乎
18、所有的代码都在这个地方进行输入、运行和调试。Delphi 6.0提供的代码编辑器除了具有一般文字编辑器的功能外,还有很多体贴的设计。例如当你在输入代码时,Delphi会自动分析你的代码,以各种不同的颜色和状态来区别不同的代码、函数和关键字。例如,在默认的设置中,关键字是黑体的,数字是蓝色的,而注释的段落则是斜体的,这样能方便程序员整理和组织自己的代码。另外值得一提的是,在Delphi中,代码编辑器有一种很神奇的功能,称为Code Insight,当输入Delphi所能识别的对象名称并打上一个“”的时候,Delphi会自动分析这个对象所具有的属性和方法,把它直接放在“”后面的下拉列表中去,这样你
19、可以直接在下拉列表框中选择所需要的东西就行了。同时,当你在写程序需要调用一个过程或方法的时候,只要输入了该方法的名称,然后加一个“(”,Delphi就可以智能地将所需要的参数依次列出;在应用程序调试的时候,如果将光标放在某个变量或表达式上停留一段时间,Delphi就会自动列出表达式的值。(6) 对象观察器在Delphi 6.0整个界面的最右边,有一个称为“Object Inspector”的窗体,它就是对象观察器了。一个对象观察器由两个标签页组成:Properties(属性)和Event(事件),当我们在窗体设计器中选中一个控件,它所对应的属性和事件就会列在这个对象观察器中。以上介绍了Delp
20、hi的IDE编程环境,如果要了解其性能,还需动手实际编写程序。2.2 SQL Server简介2.2.1 SQL Server的文件系统和特点 Microsoft公司的SQL Server是一个完全的数据库管理系统。SQL Server是一种使用传统的Transact-SQL语言,基于客户机服务器,并且在两者间传送请求和答复的关系型数据库管理系统。SQL Server使用客户机服务器体系结构将所有的工作分解为客户机任务和服务器任务,由两者分别完成。在SQL Server 2000中,数据库文件可以分为三种类型:主文件、辅助文件、日志文件,扩展名分别为:.mdf,.ndf,.ldf。每个数据库中
21、都有一个主文件,主文件是一个数据库的起点。辅助文件的个数没有限制,可以有一个或者多个辅助文件,也可以没有辅助文件。这主要是看数据库本身的大小和复杂情况。数据库的事务日志文件记录了数据库中所进行的一切改变。它在恢复数据库时非常重要,它保存了所有当系统出错时恢复数据库时所需要的信息。缺省情况下,事务日志记录的尺寸为数据文件的1/4,每一个数据库必须有一个日志,而且,事务日志必须与数据存在不同的文件中。在SQL Server2000中,使用文件组来管理具有相似特征的一组文件。一个主文件或者辅助文件只能属于一个文件组,日志文件是独立的,不属于任何文件组。而一个文件组也只属于一个数据库。在SQL Ser
22、ver 2000中,对数据库的一切操作,都可以通过两种方式进行:一种是通过图形化的工具:Enterprise Manager,另一种是通过使用Transact-SQL语言,直接进行对数据库的操作。前一种方式,比较直观,操作简单。后一种方式,比较复杂,需要对Transact-SQL语言语法特别熟悉。SQL Server2000是Microsoft公司于2000年8月推出的最新数据库引擎,商务数据仓库的数据库解决方案,它具有以下几个特点:(1) 熟悉的界面作为大型电子SQL Server 2000与SQL Server 7.0就界面而言并没有太大差别,相信许多曾经使用过SQL Server7.0的
23、读者见到2000时会有一种十分熟悉的感觉,这方便了用户从7.0版本到2000的升级:(2) 更加强大的数据引擎SQLServer2000拥有增强的数据引擎,高级的管理方式,这样就大大降低了检索的开销。此外SQL Server 2000支持XML,HTTP,并与Web相结合,使其功能更加强大。(3) 与Windows 2000更好的结合(4) MS SQL Server 2000相对其他数据库产品,更好地利用了Win2000的优势。此外SQL Server 2000还支持高达32个CPU,64GB。2.2.2 数据库管理系统的基本概念(1) 数据库的安全性在计算机系统中,安全措施一般是分级设置的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 毕业设计 论文 新闻 自动 提取 系统

链接地址:https://www.31ppt.com/p-3982850.html