欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > DOC文档下载  

    TRS全文检索服务器.doc

    • 资源ID:2397175       资源大小:1.71MB        全文页数:232页
    • 资源格式: DOC        下载积分:8金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要8金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    TRS全文检索服务器.doc

    全文检索服务器用 户 手 册版本:V4.x目 录关于本手册1读者对象1手册组织1用户反馈2联系地址3第一部分 系统概述第1章 基本概念41.1 用户组41.2 用户51.3 数据库71.4 数据库字段111.5 视图141.6 视图字段151.7 数据格式171.8 词典181.8.1 分词词典201.8.2 附加分词词典201.8.3 停用词典211.8.4 附加停用词典221.8.5 稀疏词典221.8.6 主题词典221.8.7 同义词典251.8.8 反义词典251.8.9 其它词典26第2章 字段与索引272.1 字段类型272.1.1 日期型字段272.1.2 数值型字段282.1.3 字符串型字段282.1.4 短语型字段292.1.5 全文型字段292.1.6 二进制型字段302.2 索引类型302.3 索引策略312.3.1 按词索引策略312.3.2 按字索引策略322.3.3 按关键词索引策略322.3.4 二元组索引策略33第3章 权限343.1 权限级别343.1.1 用户级权限343.1.2 数据库级权限353.1.3 字段级权限363.1.4 记录级权限363.2 权限管理373.3 权限检查383.3.1 用户组操作383.3.2 用户操作383.3.3 数据库操作383.3.4 数据库字段操作403.3.5 视图操作403.3.6 视图字段操作413.3.7 数据格式操作423.3.8 词典操作42第4章 数据库加载与检索444.1 数据库加载444.2 数据库检索444.2.1 运算符444.2.2 运算符的等价关系484.2.3 运算符与字段的关系494.2.4 统计函数514.2.5 检索函数514.2.6 统计表达式524.2.7 检索表达式534.2.8 检索键值554.2.9 特殊键值59第5章 系统配置605.1 物理内存数605.2 用户实例最大空闲时间605.3 用户实例最小空闲时间615.4 检索超时时间615.5 检索结果记录的排序限制615.6 最大检索历史步数625.7 最大下载结果记录数625.8 空闲状态起止始时间625.9 缺省数据库属性635.10 缺省知识词典集635.11 数据库路径集635.12 缺省数据库备份设备635.13 临时文件存放路径63第二部分 系统安装第6章 服务器在WINDOWS下的安装676.1 TRS 服务器目录结构676.2 安装前的准备工作716.2.1 软件及硬件环境716.2.2 确认安装方式716.3 安装步骤726.4 安装后的工作776.4.1 启动服务器776.4.2 关闭服务器796.4.3 服务器升级806.5 安装失败后的处理816.5.1 安装失败的原因及解决方法816.5.2 安装失败后的清理工作81第7章 服务器在UNIX下的安装827.1 TRS 服务器目录结构827.2 安装前的准备工作857.2.1 软件及硬件环境857.2.2 确定服务器的用户帐号867.2.3 确认安装方式867.3 安装步骤877.4 安装后的工作897.4.1 启动服务器897.4.2 关闭服务器907.4.3 服务器升级917.5 安装失败后的处理927.5.1 安装失败的原因及解决方法927.5.2 安装失败后的清理工作92第8章 管理员工具的安装938.1 TRS管理员简介938.2 TRS管理员的目录结构938.3 系统安装要求948.4 安装过程948.5 卸载过程998.6 安装过程中的问题100第9章 关于数据镜像模块1019.1 功能描述1019.2 实施准备1029.2.1 主节点的准备工作1029.2.2 子节点的准备工作1029.3 镜像初始化1029.3.1 手工初始化1039.3.2 自动初始化1039.4 镜像的运行1039.5 新增镜像的子节点1049.6 新增镜像的数据库1049.7 当镜像数据库被破坏时104第10章 服务器工具10510.1 服务器管理员10510.1.1 指定与服务器连接的端口号10510.1.2 列出服务器中所有在线客户端的信息10610.1.3 强制清除指定的用户实例10610.1.4 获取系统超级用户的口令10610.1.5 刷新日志缓冲区10710.1.6 在线备份服务器系统10710.1.7 恢复服务器系统10710.2 数据库加载工具10710.2.1 指定与服务器连接的端口号10810.2.2 命令开关选项10810.2.3 指定目标数据库10910.2.4 指定源数据文件10910.2.5 指定控制文件109第11章 配置文件11011.1 服务器运行参数配置文件11011.2 服务器数据镜像配置文件12211.3 插件配置文件125第三部分 数据库加载格式规范第12章 准备加载13112.1 数据库的准备13112.2 准备加载文件132第13章 数据文件13413.1 TRS格式文件13413.1.1 标准格式13513.1.2 字段内部标识号标记格式13913.1.3 字段顺序号标记格式14113.1.4 无字段标记格式14213.1.5 全文格式14313.1.6 注释信息14413.1.7 标记引导符前缀14513.2 国际标准格式14713.2.1 ISO2709记录格式14713.2.2 XML记录格式14813.3 批处理数据文件150第14章 加载多媒体数据15214.1 加载DOCUMENT字段的多媒体数据15214.1.1 数据格式控制符15314.1.2 存储方式控制符15414.1.3 加载格式说明15514.2 加载BIT字段的多媒体数据15714.3 应用举例158第15章 控制文件16015.1 控制文件的格式16015.2 控制文件的变量16015.2.1 RECORD_FILE_FORMAT16215.2.2 BIT_FORMAT_DEFAULT16215.2.3 HTML_BASE_DEFAULT16215.2.4 DATA_PATH_DEFAULT16315.2.5 DATE_CENTURY_DEFAULT16315.2.6 IGNORE_RECORD_CRYPT16315.2.7 FILE_SUFFIX_PRIOR16415.2.8 SYNC_CREATE_INDEX16415.2.9 CLASS_BIT_STORE16415.2.10 CLASS_DOCUMENT_STORE16515.2.11 WAIVE_DOCUMENT_AFFIX16515.2.12 WAIVE_OEMFILTER_TEXT16615.2.13 KEEP_TEXT_ACTUAL16615.2.14 CHECK_TEXT_ITERATIVE16615.2.15 MULTI_VALUE_SEPARATER16715.2.16 SECTION_TAG_PREFIX16715.2.17 START_RECORD_FROM16715.2.18 PROCESS_RECORD_NUMBER16815.2.19 MAX_COMMIT_NUMBER16815.2.20 MAX_ERROR_NUMBER16815.2.21 COLUMN_NAME_SEQUENCE16815.2.22 XML_SEGMENT_MARK16915.2.23 XML_NEWLINE_MARK17015.2.24 XML_HITSHOW_MARK17015.2.25 XML_FILTER_CDATA17115.2.26 XML_OVERWRITE_PI17215.3 控制文件举例173第16章 日期的入库格式174第17章 词典的加载177附录A TRS保留字180附录B TRS错误信息1821. 系统调用错误表(17000 17399)1822. 虚拟平台模块错误表(17400 17499)1863. 网络调用错误表(17500 17999)1884. 数据库索引模块错误表(18000 18499)1905. 数据库检索模块错误表(18500 18899)1926. 分词系统错误表(18900 18999)1937. 远过程调用错误表(19000 19499)1948. 系统KEY错误表(19500 19999)1949. 数据词典模块错误表(20000 20999)19410. 应用程序接口错误表(21000 21999)20011. 命令语言错误表(22000 22999)201附录C WIN32错误信息203关于本手册本手册介绍的主要内容可以分为以下各个部分。第一部分介绍TRS全文检索服务器主要特点、TRS中各对象的定义和作用、TRS的体系结构,第二部分介绍了TRS全文检索服务器和管理员工具(客户机)的在安装前的准备工作、具体的安装步骤,以及安装后的工作,第三部分介绍在TRS数据库加载前组织各种数据文件所必须遵循的格式规范。本手册没有涉及任何TRS工具的使用方法和TRS数据库加载工具的使用方法,是一个了解TRS概念和TRS全文检索服务器的说明性手册。 读者对象本手册的读者为TRS 系统安装人员、TRS系统管理员,以及任何希望对TRS系统有一个全面深入详细了解的TRS用户。手册组织本手册的内容由三部分组成,第一部分:系统概述;第二部分:系统安装;第三部分:数据库加载格式规范。具体组织如下: 第1章 基本概念第2章 字段与索引第3章 权限第4章 数据加载与检索第5章 系统配置第6章 服务器在Windows下的安装第7章 服务器在UNIX系统下的安装第8章 管理员工具的安装第9章 关于数据镜像模块第10章 服务器工具第11章 配置文件第12章 准备加载第13章 数据文件第14章 加载多媒体数据第15章 控制文件第16章 日期的入库格式第17章 词典的加载附录A TRS保留字附录B TRS错误信息附录C WIN32错误信息用户反馈TRS公司感谢您使用TRS 产品。如果您发现本手册中有错误或者产品运行不正确,或者您对本手册有任何意见和建议,请及时与TRS公司联系。您的意见将是我们做版本修订时的重要依据。联系地址 TRS总部营销服务中心:北京市海淀区花园东路10号高德大厦401室邮编:100083电话:010-82038858传真:010-82038878Email:info产品研发中心:北京 北四环中路35号健翔桥 北京信息工程学院图书馆三层邮编:100101电话:010-64859900 传真:010-64879084 Email:trs 上海分公司上海市成都北路333号 招商局广场南楼1505室邮编:200041电话:021-52981607/08传真:021-32013912Email:trs.sh 广州分公司广州市先烈路76号 中侨大厦16层H室邮编:510070电话:020-87320136传真:020-87320141Email:trs.gz 成都办事处 成都市洗面桥街29号四川咨询产业大厦1309室邮编:610041电话:028-85533146传真:028-85533516Email:trs.cdWebsite:.第一部分 系统概述第1章 基本概念第2章 字段与索引第3章 权限第4章 数据加载与检索第5章 系统配置第1章 基本概念TRS系统中的对象包括:l 用户组l 用户l 数据库l 数据库字段l 视图l 视图字段l 数据格式l 词典所有这些对象都具有一致的命名规则:l 对象名可以是中文,英文或中英文的组合,最长为31个字符。l 对象名内英文字母的大小写无关。l 对象名只能包括A-Z,a-z,0-9,_,或汉字。l 除数据格式外,对象名不能是TRS保留字(关键词)。l 同一属域内的对象不能重名。1.1 用户组 TRS具有独立于操作系统的用户组管理机制。用户组的设立,使得系统对数据的安全控制更加完善,也更加简单方便。每个TRS系统可支持多达65535个用户组。用户组对象具有下列属性:l 名称名称是TRS用户组对象名,即用户组名。用户组名与用户组名之间,以及用户组名与用户名之间不能重复。l 注释信息注释信息是对TRS用户组对象进行说明的信息。 系统安装时,将自动创建两个用户组:ADMINISTRATOR和GUEST。系统还有一个匿名用户组。1.2 用户 TRS具有独立于操作系统的用户管理机制。要访问TRS系统,必须首先申请一个用户帐号。用户帐号是实现系统及数据安全的主要手段,也是系统记费的主要依据。每个TRS系统可支持多达65535个用户。用户对象具有下列属性:l 名称名称是TRS用户对象名,即用户帐号名,也就是用户名。用户名与用户名之间,以及用户名与用户组名之间不能重复。l 登录口令登录口令是该用户登录到TRS系统时必须输入的口令。设置登录口令的目的主要是为了保证用户帐号的私用性。l 登录互斥开关登录互斥开关决定该用户是否允许同时从多个不同的IP地址进行登录。l 密级密级定义了该用户在TRS系统的接触机密数据的级别。数值越小,级别越高。对于数据库中使用密级加密的数据记录,只有当用户的密级值不大于记录的密级值时,才能看到该记录的内容。l 类型用户的类型实际上是用户在TRS系统中的权限级别。TRS系统有四种用户类型:² 系统数据库管理员(DBA)² 用户组数据库管理员(GDA)² 系统资源用户(RESOURCE)² 系统登录用户(CONNECT)l 所属用户组即该用户所在的用户组。用户也可属于匿名用户组。l 最大检索历史步数最大检索历史步数是指用户在进行数据库查询时,需要保存的最大检索历史步数。保存的检索历史可以在以后检索中直接引用,而不需要重新检索。l 最大下载记录数最大下载记录数是指用户在进行数据库查询时,允许一次下载的最大检索结果记录数。l 缺省附加分词词典该用户在创建数据库时,如果数据库的附加分词词典指定为缺省值,则系统自动为数据库指定这里所给出的附加分词词典。l 缺省附加停用词典该用户在创建数据库时,如果数据库的附加停用词典指定为缺省值,则系统自动为数据库指定这里所给出的附加停用词典。l 缺省稀疏词典该用户在创建数据库时,如果数据库的稀疏词典指定为缺省值,则系统自动为数据库指定这里所给出的稀疏词典。l 注释信息注释信息是对TRS用户对象进行说明的信息。 系统安装时,将自动创建两个用户:SYSTEM和PUB。SYSTEM是TRS系统的超级用户,其主要特征有:l 是DBA用户。l 属于ADMINISTRATOR用户组。l 不能被注销。l 不能修改名称。l 可由自己修改口令。l 可创建和注销其它任何用户。l 可清除任何用户的口令。l 可修改任何用户的除口令以外的任何属性。l 可授予或收回任何用户的任何权限。PUB是TRS系统的一个公共用户,其只要特征有:l 是CONNECT用户。l 属于GUEST用户组。l 不能修改名称。l 没有口令,也不允许设置口令。l 可被SYSTEM用户注销。l 对TRS系统数据对象的操作,必须通过相关的权限检查。TRS用户还有其它一些特点:l 每一个用户组中允许有多个DBA用户。l 每一个用户组中允许有多个GDA用户。l 任何用户可修改“自己”的某些属性,这些属性包括:² 登录口令² 登录互斥开关² 最大检索历史步数² 缺省附加分词词典² 缺省附加停用词典² 缺省稀疏词典² 注释信息其它项只能由SYSTEM用户管理。1.3 数据库 数据库是TRS系统中的主要数据对象,它物理地存储了用户加载到系统中的所有数据资料。每个TRS系统可管理多达数十亿个数据库。数据库实际上是一个物理数据表,表的每一行是一个数据记录,每一列则是一个数据字段,行与列的交叉点即为字段值。数据库的规模主要指两个方面:能够容纳的最大记录数和数据库文件的最大容量。一个数据库的最大记录数取决于操作系统的位数和TRS所采用的文件系统的位数:在32位文件系统中,最多可容纳4亿多条记录,而在64位文件系统中,如果是32位操作系统,则最多可容纳20多亿条记录,如果是64位操作系统,则最多可容纳40多亿条记录。制约数据库文件最大容量的唯一因素是文件系统的位数,如果TRS采用了32位文件系统,则单个文件的大小不能超过2G字节(NT平台不能超过4G字节),但如果采用64位文件系统,则单个文件的容量实际上没有限制。操作系统与文件系统的位数没有必然的联系,许多32位操作系统都支持64位文件系统,如WIN32、Linux、Solaris等,所以在32位操作系统上,TRS也尽可能地采用64位文件系统。每个记录的最大长度为256M字节,每个字段值的最大长度为16M字节(但以独立文件方式,即ALONE方式存储的字段值的长度不受此限制)。但在实际中,如果一个记录(或字段值)太长,会引起操作系统忙于虚拟内存的交换,使机器性能急剧下降,所以系统人为地限制一个记录的最大长度为机器物理内存兆字节数的64的倍数(最小为1)兆字节,如物理内存为128M,则允许的最大记录长度为2M字节。数据库对象具有下列属性:l 名称名称是TRS数据库的对象名,即数据库名,是访问、维护和管理该数据库的入口。数据库名不能与属于同一用户的其它数据库、视图以及各种词典同名。l 别名别名是该数据库名的别称,一般是为了方便使用而给出的数据库名的缩写,或其英文名称。数据库别名与数据库名具有同等的地位。一个数据库可以定义多个别名。l 所有者所有者表明哪个用户拥有该数据库。所有者与名称(别名)唯一确定一个数据库对象。所有者对该数据库能够进行任何操作,而不受其它数据安全控制的制约。l 缺省检索字段缺省检索字段是指在对该数据库进行查询时,检索表达式中没有明确指定检索目标字段的子表达式所默认的目标字段。l 分词词典分词词典是该数据库按词索引时所引用的词典。如果不为数据库指定分词词典,则该数据库将按字索引。l 附加分词词典附加分词词典是该数据库按词索引时所引用的扩充词典。l 停用词典停用词典是该数据库按词索引时所引用的不允许索引的词典。l 附加停用词典附加停用词典是该数据库按词索引时所引用的不允许索引的扩充词典。l 稀疏词典稀疏词典该数据库按词索引时所引用的允许索引的词典。如果不为数据库指定稀疏词典,则该数据库索引所有不属于停用词典和附加停用词典中的词汇。l 公共访问权限公共访问权限是指TRS系统中所有用户对该数据库所拥有的权限。对数据库可设置的公共访问权限共有五种:² 记录检索权² 数据更新权² 数据索引权² 数据库结构修改权² 数据库删除权l 词根索引开关词根索引开关决定数据库的短语型和全文型字段数据中的英文串是否按词根进行索引。如果设置该开关,则索引不区分大小写。l 大小写敏感开关大小写敏感开关决定数据库的字符型、短语型和全文型字段数据中的英文串是否区分大小写进行索引。l 数字索引开关数字索引开关决定数据库的短语型和全文型字段数据中的数词是否进行索引。l 二元组索引开关二元组索引开关决定数据库的短语型和全文型字段是否建立二元组索引。l 压缩索引开关压缩索引开关决定数据库是否建立压缩索引。不压缩索引时,索引与检索速度会稍有提高,但空间膨胀率会显著增大,所以在实际使用时总是压缩索引,以获得较好的时空比。l 数据字符集数据字符集是指存储在数据库中的非英文数据所使用的字符集。TRS系统支持的字符集有:² 简体中文(GB2312、GBK、GB18030)² 繁体中文(BIG5)² 纯英文(ENGLISH)l 数据宿主系统有一类应用:TRS系统只管理和维护索引,而数据存储在其它系统中。数据宿主系统就是用来描述存储数据的系统的信息。描述信息对TRS没有实际的意义,如果数据库没有数据宿主系统,则TRS系统负责管理数据库的数据。l 数据存放路径数据存放路径指明数据库数据文件的存储目录。l 注释信息注释信息是对TRS数据库对象进行说明的信息。在定义数据库时,对每一个属性都必须给出其正确取值。在数据库加载之前,对数据库的属性可以进行任意修改。在加载了数据后,下列属性不再允许修改:l 数据字符集l 数据宿主系统l 数据存放路径当创建了索引后,下列属性不再允许修改:l 分词词典l 附加分词词典l 停用词典l 附加停用词典l 稀疏词典l 缺省检索字段l 词根索引开关l 大小写敏感开关l 数字索引开关l 二元组索引开关l 压缩索引开关1.4 数据库字段 数据库字段是TRS系统对不同数据类型进行存储和管理的主要依据,也是对数据库进行查询的唯一入口,所有的查询操作都是在一定的字段上进行的。每个数据库可定义1到1023个字段。数据库字段对象具有下列属性:l 名称名称是TRS数据库字段的对象名,即字段名,是访问、维护和管理该数据库字段的入口。字段名不能与同一数据库中的其它字段同名。l 别名别名是该字段名的别称,一般是为了方便使用而给出的字段名的缩写,或其英文名称。字段别名与字段名具有同等的地位。一个字段可以定义多个别名。l 所属数据库所属数据库指示该字段是哪个数据库的字段。所属数据库与名称(别名)唯一确定一个数据库字段对象。l 数据类型数据类型即字段类型,它决定了该字段所能存储的数据类型。TRS能够存储和索引六种类型的数据:² 日期型(DATE)² 数值型(NUMBER)² 字符串型(CHAR)² 短语型(PHRASE)² 全文型(DOCUMENT)² 二进制型(BIT)l 缺省字段值缺省字段值是指在数据库加载时,对于未给出字段值的DATE、NUMBER或CHAR型字段所对应的缺省取值。l 字段值格式该属性对于不同的字段类型有不同的意义:² 对于CHAR型字段,字段值格式是指数据库加载时,给出的字段值所必须遵循的格式。² 对于DATE和NUMBER型字段,字段值格式是指输出字段值时使用的格式,并且由外部完成字段值的格式化。² 对于其他类型的字段,该属性没有意义。l 字段值范围字段值范围是指在加载数据时,DATE、NUMBER或CHAR型字段的合法取值的集合。l 字段显示名字段显示名是在用户界面上该字段的对应名字。l 显示区宽度显示区宽度是字段值在用户界面上显示区域的缺省宽度单位数。l 显示区高度显示区高度是字段值在用户界面上显示区域的缺省高度单位数。l 公共查询开关公共查询开关决定是否允许TRS系统中的所有用户在该字段上进行查询。l 禁止索引开关禁止索引开关决定该字段是否建立索引。BIT字段始终不建索引。l 多值允许开关多值允许开关决定在一个记录中该字段是否允许存在多个值。PHRASE和DOCUMENT字段始终不允许多个字段值。l 值唯一性开关值唯一性开关决定在数据库的所有记录中,该字段(DATE、NUMBER或CHAR型字段)是否允许出现重复的字段值。l 空值禁止开关空值禁止开关决定在一个记录中该字段(DATE、NUMBER或CHAR型字段)是否允许没有字段值。l 最大长度或精度该属性对于不同的字段类型有不同的意义:² 对于CHAR型字段,该属性表示单个字段值的最大取值长度,超过规定长度的字符将被忽略。字符串型单个字段值的最大长度是255个字节。² 对于NUMBER型字段,该属性表示字段值的小数位精度,或整数位的位数。支持三种子类型,具体如下:限定值说明0 6数据为小数位精度为0到6位的实数。限定值即为小数位的精度。表示范围是32位二进制单精度浮点数。表示整数时可确保7位十进制有符号整数,即:±9999999。100 114数据为小数位精度为0到14位的实数。限定值减去100后,即为小数位的精度。表示范围是64位二进制双精度浮点数。表示整数时可确保15位十进制有符号整数,即:±999999999999999。32数据为0到32位十进制有符号整数。表示范围是:±99999999999999999999999999999999。² 对于其他类型的字段,该属性没有意义。l 索引属性索引属性是指DOCUMENT字段的倒排索引项所包含的索引属性名表。TRS系统支持的倒排索引属性包括:² 段落(SEG)² 句子(SEN)² 位置(POS)在指定DOCUMENT字段的倒排索引属性名表时,可以使用其中之一,或者多个的组合。l 索引存放路径索引存放路径指明该字段的索引文件的存储目录。l 注释信息注释信息是对TRS数据库字段对象进行说明的信息。在定义数据库字段时,对每一个属性都必须给出其正确取值。在数据库加载之前,对数据库字段的属性可以进行任意修改。在加载了数据后,下列属性不再允许修改:l 数据类型l 缺省字段值l 字段值格式l 字段值范围l 多值允许开关l 值唯一性开关l 空值禁止开关l 最大长度或精度当创建了索引后,下列属性不再允许修改:l 禁止索引开关l 索引属性l 索引存放路径除了可定义的字段外,每个数据库都有一个固定的名为DOCID的逻辑字段。该字段的内容是数据库记录的物理记录号,可用来查询数据库记录。一个记录加载到数据库以后就有了一个唯一的物理记录号,除非对该记录进行修改,其值将始终保持不变。1.5 视图 视图是TRS系统中的一种辅助数据对象。TRS系统支持对数据库记录和字段进行直接的授权机制来实现数据的安全保密性控制,但有时显得有些烦琐。通过视图来限制某些用户对数据库字段和记录的查询,就可以用一种简便的方式间接地完成对数据库记录和字段查询权的控制。 视图实际上是一个逻辑数据表,它是逻辑地从一个或多个数据库中抽取一个或多个字段并满足指定条件的记录。视图并不物理地存储数据,只是描述了组成该视图的数据所遵循的逻辑。每个TRS系统可管理多达数十亿个视图,每个视图中可包含1到128个数据库。视图对象具有下列属性:l 名称名称是TRS视图的对象名,即视图名,是访问、维护和管理该视图的入口。视图名不能与属于同一用户的其它视图、数据库以及各种词典同名。l 别名别名是该视图名的别称,一般是为了方便使用而给出的视图名的缩写,或其英文名称。视图别名与视图名具有同等的地位。一个视图可以定义多个别名。l 所有者所有者表明哪个用户拥有该视图。所有者与名称(别名)唯一确定一个视图对象。所有者对该视图能够进行任何操作,而不受其它数据安全控制的制约。l 缺省检索字段缺省检索字段是指在对该视图进行查询时,检索表达式没有明确指定检索目标字段的子表达式所默认的目标字段。l 公共访问权限公共访问权限是指TRS系统中所有用户对该视图所拥有的权限。对视图可设置的公共访问权限共有三种:² 记录检索权² 视图结构修改权² 视图删除权l 所含数据库所含数据库是指该视图中所包含的数据库。视图中不能包含视图。l 记录选取条件记录选取条件实际上是一个对该视图所包含的每个数据库进行检索的检索表达式。记录抽取条件中的检索目标字段(包括缺省的目标字段)动态地对应于该视图所包含的每个数据库中的字段,而不是该视图的字段。l 注释信息注释信息是对TRS视图对象进行说明的信息。 一般情况下,视图只能用于数据的查询,而不支持对数据的“增、删、改”等操作,但TRS系统支持一种特殊的视图:数据库自动分裂模式视图,简称为自动模式视图。这种视图不但支持对数据记录的维护,而且随着数据记录的增加,能够自动分裂数据库,以维持数据库的规模。1.6 视图字段 视图字段是对视图进行查询的唯一入口,所有的查询操作都是在一定的字段上进行的。每个视图可定义1到1023个字段,每个字段可映射1到64个数据库中的某个字段。视图字段对象具有下列属性:l 名称名称是TRS视图字段的对象名,即字段名,是访问、维护和管理该视图字段的入口。字段名不能与同一视图中的其它字段同名。l 别名别名是该字段名的别称,一般是为了方便使用而给出的字段名的缩写,或其英文名称。字段别名与字段名具有同等的地位。一个字段可以定义多个别名。l 所属视图所属视图指示该字段是哪个视图的字段。所属视图与名称(别名)唯一确定一个视图字段对象。l 数据类型数据类型即字段类型,它表明了该字段所映射的数据库字段所存储的数据类型。对应于数据库字段,视图字段也有六种类型:² 日期型(DATE)² 数值型(NUMBER)² 字符串型(CHAR)² 短语型(PHRASE)² 全文型(DOCUMENT)² 二进制型(BIT)l 字段显示名字段显示名是上用户界面上该字段的对应名字。l 显示区宽度显示区宽度是字段值在用户界面上显示区域的缺省宽度单位数。l 显示区高度显示区高度是字段值在用户界面上显示区域的缺省高度单位数。l 公共查询开关公共查询开关决定是否允许TRS系统中的所有用户在该字段上进行查询。l 数据库字段映射数据库字段映射决定了该字段对应于哪些数据库中的哪个字段。l 注释信息注释信息是对TRS视图字段对象进行说明的信息。1.7 数据格式 数据格式用来说明多媒体数据的格式类型。在数据库加载时,TRS系统将根据数据格式确定相应的数据存储方式,使用相应的分词方法;在数据输出时,TRS系统将根据数据格式对数据进行相应的处理,便于浏览。每个TRS系统可管理多达1023个数据格式对象。数据格式对象具有下列属性:l 名称名称是TRS数据格式的对象名,即数据格式名,是访问、维护和管理该数据格式的入口。数据格式名不能重复。l 所属类即该数据格式属于哪种格式类型。TRS系统把数据格式划分成六种类型:² 纯文本(TEXT)² 格式文档(DOC)² 图像(IMAGE)² 音频(AUDIO)² 视频(VIDEO)² 自定义(BIT)l 文件后缀文件后缀是指该数据格式的数据文件通常使用的文件名后缀。l 压缩开关压缩开关决定该数据格式的数据是否需要进行无损压缩。l 注释信息注释信息是对数据格式对象进行说明的信息。TRS系统在安装时,将自动创建下列数据格式对象(名称):l BIT(不确定格式的二进制数据)l TEXT(文本数据格式)l WORD(Microsoft Word文件格式)l WS(WordStar文件格式)l WP(WordProfect文件格式)l XCL(Microsoft Excel文件格式)l WPS(金山WPS文件格式)l S2(方正、华光二扫文件格式)l DOC(不确定格式的文档文件格式)l AUDIO(不确定格式的音频文件格式)l IMAGE(通用图象文件格式)l VIDEO(不确定格式的视频文件格式)l AVI(AVI动画文件格式)l MPEG(MPEG压缩动画文件格式)l WAVE(Wave音频文件格式)l MIDI(MIDI音频文件格式)l CDA(CD音频文件格式)l PS(PostScript文件格式)l GIF(GIF图象文件格式)l TIF(TIF图象文件格式)l PCX(PCX图象文件格式)l BMP(BMP图象文件格式)l JPEG(JPEG图象文件格式)l HTML(HTML超文本文件格式)l PDF(Adobe PDF文件格式)l PPT(Microsoft Power Piont文件格式)l RTF(Rich Text文件格式) TRS系统允许用户自己定义新的数据格式,或者修改已有的数据格式。数据格式一旦定义,就不允许删除,所以必须谨慎,只有超级用户(即SYSTEM用户)有权创建新的数据格式。1.8 词典 TRS的全文检索不单是一种快速的字串匹配系统,要获得良好的检索效果

    注意事项

    本文(TRS全文检索服务器.doc)为本站会员(文库蛋蛋多)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开