【广告策划PPT】TRS信息发布检索系统新讲义.ppt
《【广告策划PPT】TRS信息发布检索系统新讲义.ppt》由会员分享,可在线阅读,更多相关《【广告策划PPT】TRS信息发布检索系统新讲义.ppt(95页珍藏版)》请在三一办公上搜索。
1、TRS 全文检索系统 应用培训,TRS 培训部 2003年,内容安排,TRS全文检索系统介绍TRS数据库服务器及管理员工具的安装及卸载TRS数据库服务器启动及关闭方法TRS数据库系统各种对象概念及其属性TRS数据库的各种字段类型、索引类型和索引策略等TRS数据库各级权限机制,权限管理和权限检查的规则等数据加载的方法以及数据文件的格式说明数据库检索表达式的语法规则以及运算符、函数、键值等,系统概述(1),TRS(Text Retrieval System)信息发布检索系统是由TRS公司开发的一个体系结构先进、功能强大的面向文本数据的数据库管理系统,广泛地用于各种信息数据库、以及信息门户的建设。T
2、RS全文数据库服务器的核心技术为全文检索,它为各种格式文档的存储、管理和检索提供动力。它的主要功能和性能如下:1.“零”空间膨胀率(-10%至20%)。2.基于成本优化的查询算法(索引分区技术,多线程并行运算技术,面向全文检索的Cache技术),使得G级数据库查询速度达到亚秒级,并支持大量并发用户的同时访问。3.多线程设计,支持SMP体系结构。4.支持跨平台计算:支持NT4.0,Linux,Sun Solaris,IBM AIX,HP-UX,Compaq True Unix,SGI IRIX,SCO Unix。5.除了提供规范的C/C+API外,还提供COM和JavaBeans组件,可以使用符
3、合工业标准的开发工具进行快速开发(ASP和JSP)。6.支持Unicode(WCS2)。,系统概述(2),7.采用开放的数据存贮管理机制,通过TRS for RDBMS Gateway,可以透明地连接oracle、db2、sql server、sybase和informix五个主流的数据库管理系统。8.领先的中文信息处理技术:内嵌汉语自动分词系统,支持按词索引、按字索引、按关键词索引、二元组索引,大大提高检索的准确性和响应时间。9.检索信息快、准而且全:允许使用文中的任意字、词、句和片段进行检索,提供了基于文献内容而不仅仅是文献外部特征的全文检索手段。TRS所提供的按词和按用户自定义关键词进行
4、索引和检索,以及基于知识词典的扩展检索功能,满足了特殊应用领域的高查准率和高查全率的要求。10.检索功能强大:全方位检索手段,提供了多达48种检索运算符。包括外部特征与正文内容的各种逻辑组合检索、位置检索、二次检索、渐进检索、历史检索、词根检索、大小写敏感检索、概念检索、对检索结果按与检索表达式的相关性和重要性程度排序等。11.安全性好:具有系统级、数据库级、记录级和字段级四级安全控制机制。12.提供功能强大的TRS管理员工具:数据库维护、数据库的安全性控制、数据的完整性和一致性、数据库备份和恢复、用户管理等功能。,人民日报:水利网:吉大图书馆:http:/http:/,应用实例,Cel转换,
5、体系结构,安装目录结构及作用启动和关闭,TRS数据库服务器,硬件及软件环境l运行中文版Microsoft Windows NT Server 4.0(Service Pack3)以上版本操作系统的小型机、服务器、工作站、Pentium及其兼容机。l 内存 64MB 以上,建议使用128MB内存。l一个可用空间在100 MB 以上的独立硬盘或分区用于安装服务器。l 操作系统可使用的对换空间最好在100MB以上。局域网连接设备。,服务器在Windows下安装,运行安装介质上setup.exe 产生目录:TRS4 安装过程中需要:输入产品的key 设定服务器缺省端口号 选择将服务器登记到Window
6、sNT系统服务中 选择服务器启动方式等操作,安装步骤,产品KEY,在序列号中输入产品键值。产品键值是由厂家根据您的机器号生成的,所以这时您需要与厂家联系,将上面对话框中显示的机器号告诉厂家以获得相应的产品键值。,服务器网络端口号,知识词典和示例数据库加载完成后,安装程序显示如图所示的对话框,要求你输入服务器的网络端口号。默认为8888,此时可以修改。,登录NT服务及选择启动方式,TRS Server 目录结构,TRSHome 目录,bin,system,dict,ibase,temp,oem,目录结构相关说明,bin:存放服务器所有可执行程序、动态连接库及版本信息文件。system:存放数据词
7、典、系统配置及KEY文件,该目录下的文件是服务器的核心文件,不能破坏,否则服务器将无法正常启动和运行。除配置文件以及KEY文件外,其他文件均由服务器自动维护。ibase:服务器存放数据库的缺省目录,包括数据库的全部数据和索引。TRS允许用户设置并使用其他的目录来存储数据库。dict:存放服务器缺省的知识词典及用户定义的词典。oem:主要用来存放为TRS系统配置的OEM产品。用于文本过滤。temp:系统的临时文件公用区。,T40hostid.exe:获得安装机器的ID,用于产生服务器运行时所必须的KEY。T40server.exe/t40shutdown.exe:启动/关闭服务器的程序。T40m
8、aster.exe:服务器管理员-list:查看当前登录用户的相关信息;-password:查看系统管理员(system)的口令T40service.exe:将TRS服务器作为一个NT服务时,用于管理该服务的命令行程序。T40console.exe:将TRS服务器作为一个NT服务时,用于管理该服务的图形界面程序,即TRS控制台。,Bin目录下系统命令,服务器的启动/关闭(1),TRS服务器启动后,占用TCP/IP的8888端口,用户在启动时可指定端口号(必须大于1024)。方法:1.命令行直接启动/关闭 启动:执行/bin/t40server.exe 端口号 关闭:执行/bin/t40shut
9、down.exe 端口号,服务器的启动/关闭(2),方法:2.命令行启动/关闭做为NT系统服务的TRS服务器 启动:执行trshomebint40service-start 前提条件:一:操作系统必须是Windows NT/2000;二:在操作系统文件 NT目录system32driversetcservices中已经加入trs4 xxxx/tcp这个服务端口;三:TRS服务器已经作为NT系统服务进行了注册。关闭:执行trshome/bin/t40service-stop,服务器的启动/关闭(3),方法:3.用TRS控制台启动/关闭作为NT系统服务的TRS服务器 启动:在TRS控制台的菜单中选
10、取“启动服务”功能。关闭:在TRS控制台的菜单中选取“关闭服务”功能。4.在操作系统启动时自动引导 首先登记TRS服务到NT系统服务中,并将启动方式设置为“自动”。每次重新启动时,操作系统将自动启动TRS 服务器。【说明】无论是用哪一种方式关闭服务器,所使用的端口号必须与启动服务器时的端口号一致。服务器关闭时并不是立即退出,它必须等待所有正在执行的服务请求完成后才彻底结束,但是这时服务器不再响应新的服务请求。如果系统中已没有任何名为t40server的进程时,则表示服务器正式关闭。有时候需要强制“杀死”TRS服务器,虽然可以用任务管理器完成,但是还需手工清除TRS服务器所创建的共享内存映射文件
11、等。用命令t40shutdown kill 端口号可自动完成所有这些操作,当系统文件NT目录system32driversetcservices中存在trs4 xxxx/tcp时,其中的端口号可以省略。,服务器升级,要求:(1)服务器升级包中包含的文件(参见手册)必须放在同一目录下。(2)在进行服务器升级前,注意先备份原来的数据,然后关闭服务器。再运行安装包下t40update即可完成TRS服务器系统文件的自动更新。(3)如果所运行的t40update处在服务器的bin目录下,则只会进行数据词典的更新,而不会进行服务器系统文件的复制。,服务器在Unix下安装,安装前准备工作(1),确定是否使用
12、支持大文件的安装包 如果你要求TRS服务器支持大文件(即largefile,有的系统称超过2G的文件为大文件,而有的系统则认为超过1G的文件就是大文件),则必须使用支持大文件的安装包进行安装,同时还必须保证用来存储数据库文件的文件系统允许大文件的读写,即清除文件系统本身对大文件的“人为”限制,例如:SUN Solaris要用mount_ufs命令的largefiles选项mount文件系统,无论操作系统是64位的,还是32位的;IBM AIX要将系统的/etc/security/limits配置文件中的fsize参数设为-1,并用smit工具将文件系统的属性设置成“Large File Ena
13、bled”,无论操作系统是64位的,还是32位的。,安装前准备工作(2),确定服务器的用户帐号 TRS服务器的各种文件必须驻留在操作系统的一个用户帐号之下,因此在安装之前要首先为TRS服务器确定一个操作系统用户,以下简称为服务器帐号。操作系统中已有的任意一个用户帐号都可作为服务器帐号,但最好还是专门创建一个用户帐号作为服务器帐号。服务器帐号所在的硬盘或分区的可用空间应在100MB以上,对服务器帐号在硬盘空间使用上的限制不能小于100MB。,安装包命名说明,安装包的命名有下列四种形式:TRS4.nnBxxxxGB.MACHINE.OS.tar TRS4.nnBxxxxBIG5.MACHINE.O
14、S.tar TRS4DEMO.nnBxxxxGB.MACHINE.OS.tar TRS4DEMO.nnBxxxxBIG5.MACHINE.OS.tar 其中:TRS4表示该安装包是一个TRS4服务器的正式发行包;TRS4DEMO表示该安装包是一个TRS服务器的演示包(只有一个License,自安装日起一个月内有效);nn是编译环境的机器字位数,如64,L32表示在32位环境下支持64位文件;Bxxxx是该服务器的生产批号,如B1000;GB表示该服务器使用以简体中文内码(GB2312、GBK、GB18030)为主体(缺省)字符集;BIG表示该服务器使用以繁体中文内码为主体(缺省)字符集。MAC
15、HINE表示该服务器运行所需硬件环境,一般指机器的CPU名称;OS表示该服务器运行所需软件环境,即操作系统及其版本号;tar表示该包是用tar命令归档而成的。如:TRS4.64B1000GB.RS6000.AIX43.tar。,安装相关说明,安装请具体参照用户手册“服务器在Unix下的安装”进行。安装成功后可以在trs服务器帐号下执行bin目录下的t40server/t40shutdown 端口号启动和关闭trs服务器。也可以在root帐号下启动。因为即使此时TRS服务器是由root启动的,服务器运行时的实际用户帐号和用户组仍然是服务器帐号和它所在的用户组,而不是root。另外,对于核心版本在
16、2.2以下的Linux操作系统,服务器要求在root账号下启动,虽然在服务器帐号也能成功启动服务器,但其运行效率远不及由root启动时高。有时候需要强制“杀死”TRS服务器,虽然可以用kill命令完成,但是比较烦琐,并且还要手工清除TRS服务器所创建的IPC资源(如共享内存、信号量等)。用命令t40shutdown kill 端口号可自动完成所有这些操作,当系统文件etc/services中存在trs4 xxxx/tcp时,其中的端口号可以省略。,小结,必须记住产品序列号,可以备份SYSTEMKEY文件。在使用TRS信息检索系统之前,必须保证先启动TRS服务器。掌握TRS服务器的启动和关闭方法
17、。熟悉TRS服务器的目录结构。,TRS管理员(ADMIN),作用安装与卸载启动与退出基本概念:TRS对象及对象属性使用,ADMIN 作用,TRS管理员是TRS信息发布检索系统的客户端管理工具,主要用于对各种TRS对象进行管理、设计和维护等,并具备完整的检索、浏览和维护功能。,安装与卸载,软件需求:中文Windows95/98/nt/2000;TRS数据库服务器;IE4.0以上版本安装:执行安装介质中的setup.exe卸载从菜单选择卸载程序进行目录结构:TRS4TRSAdminbin:存放可执行文件、动态连接库和帮助文件等。TRS4TRSAdminNavigate:存放数据库/视图的导航文件。
18、TRS4TRSAdminTemp:存放TRS管理员执行过程中生成的临时文件。,启动与退出,前提条件:TRS服务器处于启动状态双击桌面上“TRS管理员4.0”图标输入:TRS 服务器地址端口号用户帐号名口令字第一次进入用系统默认管理员帐号名(system)和口令字(manager)登录可退出登录并用其他用户的身份重新登陆,用户组 用户 数据库(数据库字段)视图(视图字段)词典 文件格式,TRS基本概念:对象,用户组,TRS具有独立于操作系统的用户组管理机制,使系统方便实现数据安全的措施之一。TRS系统的用户组是各种类型用户的集合;TRS系统可支持多达65535个用户/用户组。系统安装时,将自动创
19、建两个用户组/用户:administrator/system/和guest/pub。用户组名与用户组名之间,以及用户组名与用户名之间不能重复。创建用户时如果没有给用户指定组,则默认放在系统的匿名组中。,用 户,TRS具有独立于操作系统的用户管理机制。要访问TRS系统,必须首先拥有一个用户帐号,用户帐号是实现系统和数据安全的主要手段。SYSTEM:system属于Administraor组,是系统的超级用户,不能修改名称,不能被注销,可由自己修改口令。PUB:PUB属于Guest组,是公共用户,不能修改名称,不允许设置口令,能被System注销,拥有登录权限(CONNECT用户)。,用户级权限,
20、用户级权限对应于用户的类型。TRS系统有五种类型的用户级权限:超级用户(SYSTEM)系统中只有一个 系统数据库管理员(DBA)用户组数据库管理员(GDA)系统资源用户(RESOURCE)系统登录用户(CONNECT)超级用户只能是SYSTEM,在建新用户时不可选。,超级用户SYSTEM所拥有的权限,维护系统配置。创建和注销用户组,维护所有用户组的属性。创建和注销用户,维护所有用户的属性。创建文件格式,维护文件格式的属性。蕴涵系统数据库管理员的所有权限。,系统数据库管理员(DBA)所拥有的权限 不经授权就可对系统中的所有数据库、视图以及词典对象进行所有操作。(但不能创建用户、用户组、文件格式)
21、蕴涵用户组数据库管理员的所有权限。用户组数据库管理员(GBA)所拥有的权限 不经授权就可对系统中与该用户处在同一用户组的用户所拥有的所有数据库、视图,以及词典对象进行所有操作。蕴涵系统资源用户的所有权限。,用户级权限(1),系统资源用户(RESOURCE)所拥有的权限 有权在系统中创建数据库、视图,以及词典对象。蕴涵系统登录用户的所有权限。系统登录用户(CONNECT)所拥有的权限 有权登录到系统中。经过授权,可对系统中其他用户所拥有的数据库、视图,以及词典对象进行相应的操作。,用户级权限(2),数据库对象,创建、修改TRS数据库对象加载数据库记录,掌握记录入库格式检索数据库,掌握检索表达式的
22、写法维护数据库对象,掌握数据库的复制、记录的复制、数据库优化等,数据库,数据库是TRS系统中的主要数据对象,它物理地存储了用户加载到系统中的所有数据资料。每个TRS系统可管理多达数十亿个数据库。数据库实际上是一个数据表,表的每一行是一个数据记录,每一列则是一个数据字段,行列的交叉点即为字段值。,数据库规模,数据库的规模主要指两个方面:能够容纳的最大记录数和数据库文件的最大容量。如果是64位文件系统和64位操作系统,则最多可容纳40多亿条记录。如果采用64位文件系统,则单个文件的容量实际上没有限制。另外,理论上TRS允许每个记录的最大长度为256M字节,每个字段值的最大长度为16M字节(如以AL
23、ONE方式存储字段值的长度不受此限制)。但在实际中,如果一个记录(或字段值)太长,会引起操作系统忙于虚拟内存的交换,使机器性能急剧下降,所以系统人为地限制一个记录的最大长度为机器物理内存兆字节数的64的倍数(最小为1)兆字节,如物理内存为128M,则允许的最大记录长度为2M字节。,数据库对象的创建,【说明】必须是具有Resource及以上权限的用户才可以创建数据库。进入创建数据库对话框有三种方法:方法一:选择“文件|新建”命令,在“新建”对话框里双击数据库图标;方法二:在对象管理窗口里切换到“数据库”标签,然后按工具栏上的按钮;方法三:在对象管理窗口里切换到“数据库”标签,然后在对象管理框按鼠
24、标右键,出现菜单后选择新建。【注】数据库名称必须填写,数据库级权限,数据库权限、视图权限和词典权限统称数据库级权限。数据库权限共有五种:记录检索权(SELECT):拥有这种权限的用户,能够对数据库进行检索操作。数据更新权(UPDATE):拥有这种权限的用户,能够对数据库进行数据加载、记录插入和修改操作。数据索引权(INDEX):拥有这种权限的用户,能够对数据库的索引进行创建、删除和验证操作。数据库结构修改权(ALTER):拥有这种权限的用户,能够对数据库的属性及结构进行修改操作,包括增加和删除字段,以及修改字段的属性。数据库删除权(DROP):拥有这种权限的用户,能够删除数据库。,数据库属性,
25、数据库存放的路径:必须是系统配置中的数据和索引路径之一,缺省为系统配置中的第一个数据路径。存放位置:有一类应用:TRS系统只管理和维护索引,而数据存储 在其它系统中就是通过此项设置的。此项如果不为空,内容是存储服务器的有关信息的字符串,如“ORACLE”,则表明实际数据集中存储在一个数据宿主服务器中,TRS系统只管理和维护索引。如果为空,则表明由TRS系统负责管理数据库的数据存放的位置。缺省值为空。词典:数据库所用词典,缺省为系统配置中的缺省分词及停用词 典名。,词典,TRS的全文检索不单是一种快速的字串匹配系统,要获得良好的检索效果,必须使用一系列知识词典。词典对象是TRS系统中非常重要的基
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 广告策划PPT 广告 策划 PPT TRS 信息 发布 检索系统 讲义
链接地址:https://www.31ppt.com/p-2910368.html