欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > DOC文档下载  

    基于.NET中医中英双语平行语料资料库系统毕业设计(论文)word格式.doc

    • 资源ID:4022160       资源大小:810.50KB        全文页数:41页
    • 资源格式: DOC        下载积分:8金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要8金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    基于.NET中医中英双语平行语料资料库系统毕业设计(论文)word格式.doc

    摘要语料库是语言事实的采样,由大量收集的书面语或口语构成,并通过计算机储存和处理,用于语言学研究的文本库。它为语言教学和研究提供了自然出现的真实语料和科学的研究方法,在这些领域正发挥越来越大的作用。近年来,无论是在语言信息处理领域还是语言学研究领域,语料库的重要作用均已经得到充分的认可,国际国内在语料库的建设和研究方面均做了大量的工作。世界上已经出现了为数不少的大型单语语料库,尤其是英语语料库,汉语语料库的建设虽然起步较晚,但也取得了可观的进展,然而我们的国粹中医,在其汉英语料库的建设才刚刚起步,目前国内中医英语缺乏统一标准,中医术语的翻译存在许多的不足,这对于将我国传统医学推向世界产生了一定的阻碍。在这种背景下并且得到中国外语教育基金、江西省教育科学“十一五”规划课题、江西师范大学青年成长基金、江西师范大学实验室开放专项基金等单位的大力支持和资助,我们得以顺利构建一个专用于中医领域的中医英语语料库翻译平台。本文介绍了在.Net环境下采用“分层思想:表示层、业务逻辑层和数据访问层”,借助于AJAX技术、JavaScript、C#语言、SQL Server2000数据库管理系统构建了一个层次清晰、界面友好的B/S版“中医中英双语平行语料库”。该系统实现了自动分词、语料正确性检查、分词搜索等核心技术。本系统虽然只是对中医中英双语平台语料库的一种尝试和实现,但是为中医教学和中医翻译者提供一个基于Internet的语料搜索平台,为中医语料库的建设献出一份力。【关键字】中英双语语料库、中医专业英语、AJAX应用。【Abstract】Corpus is the language fact sampling, which is made up of the massive collections written language or the spoken language constitution, and uses in the linguistics research text storehouse through the computer storage and processing. It has provided the real language material and the science research technique for the language teaching and the research for which naturally appears, and is playing the more and more major role in these domains. In recent years, in regardless of the language information processing domain or the linguistics research area, the corpus vital role already obtains the full approval, and domestic has done the massive work in the corpus construction and the research aspect. In the world many large-scale single corpus already appeared, in particular English corpus, Chinese corpus construction although starts late, but has made the considerable progress. However, our national essence Chinese medicine, only then just started in its Chinese English corpus construction. At present domestic Chinese medicine English lacks the unification standard, and Chinese medicine terminology translation has many insufficiencies, which has produced the certain hindrance to pushing our country tradition medicine to the world. And having obtained the support of Chinese foreign language education fund, the Jiangxi Province education science project of “Eleven and five plan”, the Jiangxi Normal University youth growth fund, and the Jiangxi Normal University laboratory open fund, we can smoothly construct a Chinese medicine China and Britain bilingual corpus teaching platform.This article introduced how to construct a level-clear and interface-friendly Chinese medicine China and Britain bilingual corpus teaching platform based on web using "the lamination thought under Net the environment: Expressed the level, the service logic level and the data accessing level ", and with the aid of to the AJAX technology, JavaScript, the C# language, SQL Server2000 database management system. This system has realized the following technology: the automatic participle, language material accuracy inspection, participle search, and so on.Although this system is only one kind of attempt and realization to the Chinese medicine China and Britain bilingual corpus, but provides a searching platform based on the Internet corpus for the Chinese medicine teaching and the Chinese medicine translator, and offers up strength for the Chinese medicine corpus construction. Keywords The Chinese and British bilingual language materials storehouse, The Chinese medicine specialized English, AJAX application.目 录第1章 绪论11.1引言11.2论文的组织11.3本人所做的工作2第2章 系统相关技术及开发工具介绍32.1 采取B/S操作模式32.2三层Browser/Server结构32.3 .Net平台42.3.1 什么是.Net42.3.2 什么是ASP.Net52.3.3什么是C#72.3.4什么是ADO.Net72.3.5什么是AJAX82.3.6 什么是XML8第3章 系统的分析与设计93.1 可行性分析93.2 术语定义93.3系统定义103.4 运行环境和开发工具113.5 数据库设计113.5.1数据库关系模型113.5.2数据库主要表结构说明123.6语料库切片标准16第4章 系统设计与具体功能的实现184.1 系统功能概述184.1.1主要功能184.2 前台检索功能设计与实现184.2.1 Web语料库的在线检索功能184.2.2 检索功能的实现194.3 后台数据更新维护功能的设计与实现214.3.1 后台管理登录214.3.2 语料数据的入库功能22第5章 关键技术的实现245.1分层设计思想245.1.1数据模型245.1.2数据访问层255.1.3 业务逻辑层265.1.4 表示层265.2 自动标识关键词及删除关键词标签技术275.3 使用JavaScript插入标签和检查语料的正确性305.3.1插入标签功能305.3.2关键词标签合法性检查315.3.3中文和英文语料中的标签匹配检查335.3.4调用远程函数实现自动分词34第6章 结束语366.1系统总结366.2个人总结366.3下一步工作36参考文献37致谢38第1章 绪论1.1引言12320世纪70年代以来,语料库语言学迅猛发展,单语语料库建设展露出勃勃生机。至90年代,双语平行语料库开始受到语言学界和自然语言处理学界的青睐。近年来,双语平行语料库在机器翻译和机器辅助翻译中的应用已经得到越来越多的认可,基于双语平行语料库的各种方法不仅能够改进机器自动翻译的质量,还可以加强机器辅助翻译中的人机交互。它在两种语言对比研究、翻译和机器翻译、翻译教学、双语词典编撰等方面都具有极大的应用价值。然而,在语言学的各个领域都积极利用语料库这个强有力的工具时,中医中英双语平行语料库的建设和开发却在国内刚刚起步还没有统一的标准。因此,在中医英语研究的领域内,是否有必要建立中英双语平行语料库,建立平行语料库是否切实可行,以及如何建立平行语料库,这一系列问题是中医中英双语研究者必须直面的重大课题。作为一门新兴的语言学分支学科,语料库语言学对语言研究的许多领域产生越来越大的影响,在语言教学中也得到广泛的应用。就对外中医汉英教学而言,语料库以中医英语词典电子文本为生语料,实现了词语索引、词语入库关键字提取、词语搭配分析和分类主题词提取等功能,为编写中医教学和研究提供真实的语料和相关的语言信息。基于语料库的研究有助于考察中医领域的汉语和英语在实际使用中的意义和用法,有助于从中医汉英翻译的实际使用情况中发现和修正语言规律,促进世界各国对中医的研究和发展。随着因特网的普及和网络技术、语言技术的飞快发展,建设基于WEB的对外中医汉英双语平行教学语料库并开发在线检索程序,是语料库建设的一个发展方向,可满足更大范围的语料检索需求,实现语料库的资源共享,为全国乃至全世界对中医的研究提供语言支持,因此具有较大的现实意义和实用价值。1.2论文的组织本论文简要介绍了中医语料库的领域知识以及平台的功能设计分析,主要阐述了对中医汉英双语平行翻译教学平台的功能实现和一些核心技术。第一章简述了系统开发背景、特点以及本人所做的主要工作。第二章简述了系统开发的相关技术和运行平台。第三章简单说明了系统的总体分析和设计等。第四章描述了系统具体功能的实现。第五章详细阐述了系统开发过程中所使用的关键技术的实现。1.3本人所做的工作在该平台的过程中,我参与前期系统分析设计、数据库设计和语料预加工,并完成了基于Web的语料库后台维护管理功能、前台数据搜索功能的开发等最终实现的一系列工作。我在中医中英双语平行语料库翻译教学平台这个项目中是负责开发B/S模式的版本,在实现功能中涉及到许多算法和AJAX等一些较新的技术。第2章 系统相关技术及开发工具介绍在确定系统的开发前景、意义、目标后,就是选择相关的技术及工具来开发系统。在模式上,我们选择B/S的操作模式,这样可以方便用户的查询和管理员的管理,无须安装客户端,只要打开浏览器即可使用。2.1 采取B/S操作模式B/S(Browser/Server)结构即浏览器和服务器结构。它是随着Internet技术的兴起,对C/S结构的一种变化或者改进的结构。在这种结构下,用户工作界面是通过WWW浏览器来实现,极少部分事务逻辑在前端(Browser)实现,但是主要事务逻辑在服务器端(Server)实现,形成所谓三层3-tier结构。这样就大大简化了客户端电脑载荷,减轻了系统维护与升级的成本和工作量,降低了用户的总体成本(TCO)。以目前的技术看,局域网建立B/S结构的网络应用,并通过Internet/Intranet模式下数据库应用,相对易于把握、成本也是较低的。它是一次性到位的开发,能实现不同的人员,从不同的地点,以不同的接入方式(比如LAN, WAN, Internet/Intranet等)访问和操作共同的数据库;它能有效地保护数据平台和管理访问权限,服务器数据库也很安全 。特别是在.Net这样的预编译语言和AJAX技术出现之后,B/S架构Web软件更是方便、快捷、高效。2.2三层Browser/Server结构B/S结构是真正的三层结构,它以访问Web数据库为中心,HTTP为传输协议,客户端通过浏览器(Browser)访问Web服务器和与其相连的后台数据库,我们称之为B/S(Browser/Server)模式。其三级结构组成如图2.1所示。客户端Web服务器后台数据库客户端图2.1三层结构图图中从左到右,分为三个层次:第一层是客户端即浏览器,主要完成客户和后台的交互及最终查询结果的输出功能。在客户端向指定的Web服务器提出服务器请求,Web服务器用HTTP协议把所需文件资料传给用户,客户端接受并显示在WWW浏览器上;第二层Web服务器是功能层,完成客户的应用功能,即Web服务器接受客户请求,并与后台数据库连接,进行申请处理,然后将处理结果返回Web服务器,再传至客户端;第三层数据库服务器是数据层。数据库服务器应客户请求独立地进行各种处理。与传统的C/S模式相比,B/S结构把处理功能全部移植到了服务器端,用户的请求通过浏览器发出,无论是使用和数据库维护上都比传统模式更加经济方便。而且使维护任务层次化:管理员负责服务器硬件日常管理和维护,系统维护人员负责后台数据库数据更新维护。由以上的比较分析可知,三层结构也可以理解为增加了Web服务器的C/S模式。2.3 .Net平台892.3.1 什么是.Net微软的.Net平台堪称为新一代的互联网平台。对于技术开发人员来说,.Net平台的两大特性是非常卓越的,首先是其所提供的公共语言运行时,也就是公用语言运行平台,另一方面就是庞大而全面的统一编程类。其架构下图2.2所示。图2.2 .Net技术架构C#语言是微软公司针对.Net平台才推出来的一门新语言,作为.Net平台的第一语言,它几乎集中了所有关于软件开发和软件工程研究的最新成果。其不但继承了C+、Java等面向对象的强大功能特性,同时还是继承了VB、Delphi等编程语言的可视化快速开发功能,其是当前第一个完全面向组件的语言。.Net平台中的程序设计主要分为以下四个方面:Web Forms、Windows Forms、Web Service及Windows Service,该平台主要使用Web Service中的ASP.Net技术设计实现。.Net应用体系结构如图2.3所示。图2.3 .Net应用体系结构2.3.2 什么是ASP.NetASP.net 是一种建立在通用语言上的程序构架,能被用于一台Web服务器来建立强大的Web应用程序。ASP.net提供许多比现在的Web开发模式强大的的优势。(1)执行效率的大幅提高 ASP.net是把基于通用语言的程序在服务器上运行。不像以前的ASP即时解释程序,而是将程序在服务器端首次运行时进行编译,这样的执行效果,当然比一条一条的解释强很多。ASP.Net动态编译过程如图2.4所示。(2)世界级的工具支持 ASP.net构架是可以用Microsoft(R)公司最新的产品 Visual S开发环境进行开发,WYSIWYG(What You See Is What You Get所见即为所得)的编辑。这些仅是ASP.net强大化软件支持的一小部分。 (3)强大性和适应性 ASPX文件请求Engine解析GendPageClass生成回应请求Instantiate回应Code-behindclassPageClassInstantiate, Process & Render编译因为ASP.net是基于通用语言的编译运行的程序,所以它的强大性和适应性,可以使它运行在Web应用软件开发者的几乎全部的平台上。通用语言的基本库,消息机制,数据接口的处理都能无缝的整合到ASP.net的Web应用中。ASP.net同时也是language-independent语言独立化的,所以,你可以选择一种最适合你的语言来编写你的程序,或者把你的程序用很多种语言来写,现在已经支持的有C#(C+和Java的结合体),VB.net,Jscript。将来,这样的多种程序语言协同工作的能力保护您现在的基于COM+开发的程序,能够完整的移植向ASP.net。图2.4 ASP.NET 动态编译(4)简单性和易学性 ASP.net是运行一些很平常的任务如表单的提交客户端的身份验证、分布系统和网站配置变得非常简单。例如ASP.net页面构架允许你建立你自己的用户分界面,使其不同于常见的VB-Like界面。另外,通用语言简化开发使把代码结合成软件简单的就像装配电脑。 (5)安全性 基于Windows认证技术和每应用程序配置,你可以确性你的原程序时绝对安全的。2.3.3什么是C#C# (C sharp) 是微软对这一问题的解决方案。C#是一种最新的、面向对象的编程语言。它使得程序员可以快速地编写各种基于Microsoft .NET平台的应用程序,Microsoft .NET提供了一系列的工具和服务来最大程度地开发利用计算与通讯领域。 正是由于C#面向对象的卓越设计,使它成为构建各类组件的理想之选无论是高级的商业对象还是系统级的应用程序。使用简单的C#语言结构,这些组件可以方便的转化为XML 网络服务,从而使它们可以由任何语言在任何操作系统上通过Internet进行调用。 最重要的是,C#使得C+程序员可以高效的开发程序,而绝不损失C/C+原有的强大的功能。因为这种继承关系,C#与C/C+具有极大的相似性,熟悉类似语言的开发者可以很快的转向C#。2.3.4什么是ADO.NetADO.NET是由.NET framework为与数据库中的数据进行交互而提供的一组对象类的名称。我们知道,面向对象编程的有关主要优点是可以把各种复杂的功能封装在一个自包含的单元中,接着要处理的就是个定义好的接口中,它由一些方法和属性组成。ADO.NET可以与许多类型的对象交互,不仅有存储在数据库中的数据,还有存储在电子邮件服务器、文本文件、应用程序文档(例如Excel电子表格)和XML中的数掂。下面是可以连接的数据源列表:企业级的RDBMS,例如Oracle,Microsoft SQL Server,IBM DB2桌面数据库,例如Access文件和目录系统,例如Windows FAT32用逗号分隔开的文本文件,或长度固定的文本文件非数据库文件,例如Excel电子表格基于XML的数据其优点是上面的列表不是固定的。ADO.NET连接的结构是可以为目前还没有想像出来的数据源格式编写供应程序、驱动程序和适配器。ADO.NET允许从源中选择相当抽象的数据。数据库管理员只需授予使用数据的一个视图的权限接口。即使没有访问数据源其它内容的权限,也可以使用ADO.NET把数据放在ASP.NET页面上。2.3.5什么是AJAX AJAX的全称是Asynchronous JavaScript and XML,即异步JavaScript和XML。这是一种多项成熟技术的组合,其目的是让Web应用获得与用户快速、即时交互的能力。AJAX所组合的技术,包括: JavaScript,Java脚本语言(注意,此Java非Sun公司的Java) DHTML,Dynamic HTML,动态HTML XML,Extensible Markup Language,可扩展标记语言 CSS,Cascading Style Sheets,层叠样式表单 DOM,Document Object Model,文档对象模型 微软的称为XMLHttpRequest的对象 在AJAX技术下,用户会感觉到网页与普通桌面应用一样,响应迅速,而不是像传统网页那样,任何操作都需要等待页面的刷新。AJAX是如何做到这一点的呢?有两个秘密:第一,其实AJAX也会刷新页面,只不过,AJAX可以只刷新部分页面,而不是整个页面;第二,AJAX的页面刷新是异步的,就是说,用户可以继续他的其他操作,而不必等候刷新完成。 当用户浏览一个基于AJAX的Web应用时,用户的请求被提交给一个称为AJAX引擎(AJAX Engine)的代理,这个AJAX引擎负责接收用户请求,从Web服务器上获取响应,并更新浏览器内容。形象地说,传统的Web应用中,浏览器是直接和Web服务器打交道的,而在AJAX应用中,浏览器和Web服务器之间出现了一个来回跑腿的“中介”,而且这个 “中介”相当的勤快,所以,能够给浏览器提供更好的服务,从而使用户获得更满意的应用体验。2.3.6 什么是XMLXML 的全称是“可扩展标记语言”提供一种描述结构化数据的方法。与主要用于控制数据的显示和外观的 HTML 标记不同,XML 标记用于定义数据本身的结构和数据类型。XML 使用一组标记来描绘数据元素。每个元素封装可能十分简单也可能十分复杂的数据。您可以定义一组无限制的 XML 标记。XML 是一种简单、与平台无关并被广泛采用的标准。XML 相对于 HTML 的优点是它将用户界面与结构化数据分隔开来。这种数据与显示的分离使得集成来自不同源的数据成为可能。第3章 系统的分析与设计3.1 可行性分析1516可行性分析(Feasibility Analysis)也称为可行性研究,是指在允许的成本、性能要求下,分析每项需求实施的可行性,提出需求实现的相关风险,包括与其它需求的冲突,对外界因素的依赖和技术障碍。可行性分析包括操作可行性、技术可行性、经济可行性和进度可行性。下面是对中医汉英双语平行翻译教学平台Web版的可行性分析。(1)操作可行性:鉴于Web系统的特点,采用AJAX增加用户界面的友好性,可以使系统操作员很好的掌握使用方法。在开发过程中,我们还尽量给操作员以方便,考虑到操作员的实际情况,对句子语料和段落语料的录入提供自动分词和分句功能。这样就大大提高工作效率。而且该系统简单易操作,易维护,减少了不必要的麻烦。(2)技术可行性:从目前比较流行的数据库开发、管理软件来看;该平台的语料数据可能比较庞大,所以考虑使用SQL Server2000作为后台数据存储管理,ASP.Net和SQL Server2000的结合无疑是在实际应用中较为成功的一种解决方案。(3)经济可行性:本项目得到中国外语教育基金、江西省教育科学“十一五”规划课题、江西师范大学青年成长基金、江西师范大学实验室开放专项基金的资助,开发经费没有问题。(4)进度可行性:鉴于本系统的目标要求和特点,能够保证在预期的时间内完成该系统的研究和设计。综上所述,此系统开发目标已明确,在技术和经济等方面都可行,并且投入少、见效快。因此系统的开发是完全可行的。3.2 术语定义第三代语料库:信息领域术语动态更新是我们提出的基于第三代语料库语言知识动态更新体系中的一个领域中词汇层次的动态更新,它不同于此前的人工词典编撰及修订,这主要体现在以下几个方面:(1) 术语的发现与更新是基于领域内大规模真实文本的。(2) 更新是以流通为基础的,更新的主要内容包括:新术语的出现、被淘汰术语的消亡、术语流通度(circulation) 的变化等;(3) 术语的更新可以由机器辅助人工标注到机器自动标注后人工进行校对最后走向全自动化。这些都必须有一个动态语料库来支持,这个语料库就是我们所说的第三代语料库。KWIC:关键词居中检索局部性原理:由P.Denning在1968年提出的,起初是对计算机程序执行情况的研究得出的结论。零客户端:B/S设计模式是在三层C/S模式上的改进,采用B/S模式的软件,客户端只需要安装一个通用的IE浏览器即可运行,而不需要如何系统自身的任何应用程序3.3系统定义1. 系统来源:教育部基金课题2. 系统目标:l 通过对本项目的研究,我们项目组将采用比较先进的软件开发技术,推出的软件将有以下的特点:n 适于重要专业的双语教学和翻译工作n 在十万级记录上能有响应比有比较好的性能,C/S版的响应时间基本处于零等待的状态,B/S的等待时间处于用户可等待的范围内。提供简单友好的系统界面,使用户能在稍加摸索就能很方便得使用系统。n 提供段段对齐,句句对齐等多种对齐等方式。n 能有很好的扩充性能,能在系统上稍加修改,即可成为一个通用的英语双语预料库翻译教学平台,适用于英语双语教学和辅助翻译。l 市场推广:n 本项目拟实现C/S和B/S两种模式版本的产品,不仅可以提供中医英语进行课堂双语教学,还可为中医英语学习或翻译者提供一个自学平台,为中医英语翻译教学创新奠定基础,培养学生研究性学习的能力。n 本项目产品稍加修改,便可成为一个通用的英语语料库翻译教学平台,可适用于我校各学科的双语教学,具有很好的应用前景和推广价值。l 系统整体结构如图3.1所示中 医 英 语 语 料 库 翻 译 教 学 平 台前 台 检 索 显 示后 台 维 护 更 新语料检索语料生成语料统计分析语料显示语句结构导入语料更改语料删除语料单独载入图3.1 系统整体结构图3.4 运行环境和开发工具1、运行环境l Windows2000 Server、Windows XP、Windows Server 2003l SQL Server2000数据库管理系统l IIS6.0l Microsoft Internet Explorer 5.5以上2、开发工具l Microsoft Visual Studio .Net 2005l Dreamweaver MX 20043.5 数据库设计11203.5.1数据库关系模型按照关系名属性名称解释,格式编写。1、 英文词语编号,英语文本,词性,词语长度2、 中文词语编号,中文文本,词性,词语长度3、 词语翻译对照编号,中文词语编号,英文词语编号,翻译来源,翻译频率统计4、 英文句子句子编号,句子内容,句长5、 英文关键字编号,英文句子编号,词语编号6、 中文句子句子编号,句子内容,句长7、 中文关键字编号,中文句子编号,词语编号8、 中英句子翻译对照翻译编号,中文句子编号,英文句子编号,翻译来源,翻译频率统计9、 中文段落段落编号,段落内容,段落长度10、 中文段落关键字编号,中文段落编号,词语编号11、 英文段落段落编号,段落内容,段落长度12、 英文段落关键字编号,英文段落编号,词语编号13、 中英文翻译对照编号,英文段落,中文段落,对齐方式,翻译来源14、 语料来源表来源编号,来源名称,来源描述,备注15、 语料主题表主题编号,主题名称,主题父结点,主题描述,备注3.5.2数据库主要表结构说明、语料来源表(MOLMaterial Of Language语言原材料) 该表用于存储语料来源信息,表结构如图3.1所示。表3.1 语料来源表字段名称字段说明数据类型可否为空主外键说明描述MOL_ID语料来源序号intNP唯一标识该来源记录,种子自增1MOL_mane来源名称Char(50)YNMOL_Desc来源描述Varchar(200)YNMOL_Dom备注Varchar(100)YN2 、语料主题表 TOL(Title of Language )语言主题该表用于存储语料来源信息,表结构如图3.2所示。表3.2 语料主题表字段标识字段名称数据类型可否为空主外键说明描述TOL_ID主题编号intNP唯一标识该主题记录,种子自增1TOL_name主题名称Char(20)YNTOL_farther主题父结点Varchar(20)YN建立结点分类不同的语料属于不同的主题 TOL_desc主题描述Varchar(100)YNDom备注Varchar(100)YN3、英文词语表E_Word(English Word)英语词语该表用于存储英文词语信息,表结构如表3.3所示。表3.3 英文词语表字段标识字段名称数据类型可否为空主外键说明描述EW_ID编号longintNN唯一标识该主题记录,种子自增1EW_content英语文本varChar(200)YN集聚索引EW_nature词性Varchar(20)YNEW_long词语长度intYNdemo备注Varchar(100)YN4、中文词语表C_Word(Chinese Word)中文词语该表用于存储中文词语信息,表结构如表3.4所示。表3.4 中文词语表字段标识字段名称数据类型可否为空主外键说明描述EW_ID编号longintNN唯一标识该主题记录,种子自增1EW_content中文语文本varChar(200)YN集聚索引EW_nature词性Varchar(20)YNEW_long词语长度IntYNdemo备注Varchar(100)YN5、中英词语翻译对照Word_EC(Word of Chinese to English)该表用于存储中英词翻译对照信息,使中文词语表和英文词语表关联起来,表结构如表3.5所示。表3.5 中英词语翻译对照表字段标识字段名称数据类型可否为空主外键说明描述WEC_ID编号 longintNP唯一标识该主题记录,种子自增1WEC_ew中文词语编号longintYF(C_Word(CW_ID)WEC_cw英文词语编号loongintYF(E_Word(EW_ID)WEC_form翻译来源intYF(MOL(MOL_ID)WEC_fre翻译频率统计Varchar(100)YNWEC_ TOL主题编号YF(TOL (TOL_ID)demo备注Varchar(100)N6、英文句子E_Sentence(English Sentences)该表用于存储英文句子信息,表结构如表3.6所示。表3.6 英文句子表字段标识字段名称数据类型可否为空主外键说明描述ES_ID句子编号longintNP唯一标识该来源记录,种子自增1ES_content句子文本Varchar(1500)YNES_nature句子来源intYF(MOL(MOL_ID)ES_long句子长度inYN7、英文关键字表 E_SKey (English Sentence Key Word )该表用于存储英文关键字信息,表结构如表3.7所示。表3.7 英文关键字表字段标识字段名称数据类型可否为空主外键说明描述ESK _ID关键字编号longintNP唯一标识该来源记录,种子自增1续表3.7 英文关键字表字段标识字段名称数据类型可否为空主外键说明描述ESK_ESID英文句子编号longintYF(C_Sentence(ES_ID))ESK_EWID词语编号longintYF(E_Word(EW_ID)8、中文句子C_Sentence(Chinese Sentence)该表用于存储中文句子信息,表结构如表3.8所示。表3.8 中文词语表字段标识字段名称数据类型可否为空主外键说明描述CS_ID句子编号longintNP唯一标识该来源记录,种子自增1CS_content句子文本Varchar(1500)YNCS_nature句子来源intYF(MOL(MOL_ID)CS_long句子长度inYN9、中文关键字表 C_SKey (Chinese Sentence Key Word )该表用于存储中文关键字信息,表结构如表3.9所示。表3.9 中文关键字表字段标识字段名称数据类型可否为空主外键说明描述CSK _ID关键字编号longintNP唯一标识该来源记录,种子自增1CSK_ESID英文句子编号longintYF(C_Sentence(ES_ID))CSK_EWID词语编号long

    注意事项

    本文(基于.NET中医中英双语平行语料资料库系统毕业设计(论文)word格式.doc)为本站会员(laozhun)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开