基于.NET中医中英双语平行语料资料库系统毕业设计(论文)word格式.doc
《基于.NET中医中英双语平行语料资料库系统毕业设计(论文)word格式.doc》由会员分享,可在线阅读,更多相关《基于.NET中医中英双语平行语料资料库系统毕业设计(论文)word格式.doc(41页珍藏版)》请在三一办公上搜索。
1、摘要语料库是语言事实的采样,由大量收集的书面语或口语构成,并通过计算机储存和处理,用于语言学研究的文本库。它为语言教学和研究提供了自然出现的真实语料和科学的研究方法,在这些领域正发挥越来越大的作用。近年来,无论是在语言信息处理领域还是语言学研究领域,语料库的重要作用均已经得到充分的认可,国际国内在语料库的建设和研究方面均做了大量的工作。世界上已经出现了为数不少的大型单语语料库,尤其是英语语料库,汉语语料库的建设虽然起步较晚,但也取得了可观的进展,然而我们的国粹中医,在其汉英语料库的建设才刚刚起步,目前国内中医英语缺乏统一标准,中医术语的翻译存在许多的不足,这对于将我国传统医学推向世界产生了一定
2、的阻碍。在这种背景下并且得到中国外语教育基金、江西省教育科学“十一五”规划课题、江西师范大学青年成长基金、江西师范大学实验室开放专项基金等单位的大力支持和资助,我们得以顺利构建一个专用于中医领域的中医英语语料库翻译平台。本文介绍了在.Net环境下采用“分层思想:表示层、业务逻辑层和数据访问层”,借助于AJAX技术、JavaScript、C#语言、SQL Server2000数据库管理系统构建了一个层次清晰、界面友好的B/S版“中医中英双语平行语料库”。该系统实现了自动分词、语料正确性检查、分词搜索等核心技术。本系统虽然只是对中医中英双语平台语料库的一种尝试和实现,但是为中医教学和中医翻译者提供
3、一个基于Internet的语料搜索平台,为中医语料库的建设献出一份力。【关键字】中英双语语料库、中医专业英语、AJAX应用。【Abstract】Corpus is the language fact sampling, which is made up of the massive collections written language or the spoken language constitution, and uses in the linguistics research text storehouse through the computer storage and proces
4、sing. It has provided the real language material and the science research technique for the language teaching and the research for which naturally appears, and is playing the more and more major role in these domains. In recent years, in regardless of the language information processing domain or th
5、e linguistics research area, the corpus vital role already obtains the full approval, and domestic has done the massive work in the corpus construction and the research aspect. In the world many large-scale single corpus already appeared, in particular English corpus, Chinese corpus construction alt
6、hough starts late, but has made the considerable progress. However, our national essence Chinese medicine, only then just started in its Chinese English corpus construction. At present domestic Chinese medicine English lacks the unification standard, and Chinese medicine terminology translation has
7、many insufficiencies, which has produced the certain hindrance to pushing our country tradition medicine to the world. And having obtained the support of Chinese foreign language education fund, the Jiangxi Province education science project of “Eleven and five plan”, the Jiangxi Normal University y
8、outh growth fund, and the Jiangxi Normal University laboratory open fund, we can smoothly construct a Chinese medicine China and Britain bilingual corpus teaching platform.This article introduced how to construct a level-clear and interface-friendly Chinese medicine China and Britain bilingual corpu
9、s teaching platform based on web using the lamination thought under Net the environment: Expressed the level, the service logic level and the data accessing level , and with the aid of to the AJAX technology, JavaScript, the C# language, SQL Server2000 database management system. This system has rea
10、lized the following technology: the automatic participle, language material accuracy inspection, participle search, and so on.Although this system is only one kind of attempt and realization to the Chinese medicine China and Britain bilingual corpus, but provides a searching platform based on the In
11、ternet corpus for the Chinese medicine teaching and the Chinese medicine translator, and offers up strength for the Chinese medicine corpus construction. Keywords The Chinese and British bilingual language materials storehouse, The Chinese medicine specialized English, AJAX application.目 录第1章 绪论11.1
12、引言11.2论文的组织11.3本人所做的工作2第2章 系统相关技术及开发工具介绍32.1 采取B/S操作模式32.2三层Browser/Server结构32.3 .Net平台42.3.1 什么是.Net42.3.2 什么是ASP.Net52.3.3什么是C#72.3.4什么是ADO.Net72.3.5什么是AJAX82.3.6 什么是XML8第3章 系统的分析与设计93.1 可行性分析93.2 术语定义93.3系统定义103.4 运行环境和开发工具113.5 数据库设计113.5.1数据库关系模型113.5.2数据库主要表结构说明123.6语料库切片标准16第4章 系统设计与具体功能的实现18
13、4.1 系统功能概述184.1.1主要功能184.2 前台检索功能设计与实现184.2.1 Web语料库的在线检索功能184.2.2 检索功能的实现194.3 后台数据更新维护功能的设计与实现214.3.1 后台管理登录214.3.2 语料数据的入库功能22第5章 关键技术的实现245.1分层设计思想245.1.1数据模型245.1.2数据访问层255.1.3 业务逻辑层265.1.4 表示层265.2 自动标识关键词及删除关键词标签技术275.3 使用JavaScript插入标签和检查语料的正确性305.3.1插入标签功能305.3.2关键词标签合法性检查315.3.3中文和英文语料中的标签
14、匹配检查335.3.4调用远程函数实现自动分词34第6章 结束语366.1系统总结366.2个人总结366.3下一步工作36参考文献37致谢38第1章 绪论1.1引言12320世纪70年代以来,语料库语言学迅猛发展,单语语料库建设展露出勃勃生机。至90年代,双语平行语料库开始受到语言学界和自然语言处理学界的青睐。近年来,双语平行语料库在机器翻译和机器辅助翻译中的应用已经得到越来越多的认可,基于双语平行语料库的各种方法不仅能够改进机器自动翻译的质量,还可以加强机器辅助翻译中的人机交互。它在两种语言对比研究、翻译和机器翻译、翻译教学、双语词典编撰等方面都具有极大的应用价值。然而,在语言学的各个领域
15、都积极利用语料库这个强有力的工具时,中医中英双语平行语料库的建设和开发却在国内刚刚起步还没有统一的标准。因此,在中医英语研究的领域内,是否有必要建立中英双语平行语料库,建立平行语料库是否切实可行,以及如何建立平行语料库,这一系列问题是中医中英双语研究者必须直面的重大课题。作为一门新兴的语言学分支学科,语料库语言学对语言研究的许多领域产生越来越大的影响,在语言教学中也得到广泛的应用。就对外中医汉英教学而言,语料库以中医英语词典电子文本为生语料,实现了词语索引、词语入库关键字提取、词语搭配分析和分类主题词提取等功能,为编写中医教学和研究提供真实的语料和相关的语言信息。基于语料库的研究有助于考察中医
16、领域的汉语和英语在实际使用中的意义和用法,有助于从中医汉英翻译的实际使用情况中发现和修正语言规律,促进世界各国对中医的研究和发展。随着因特网的普及和网络技术、语言技术的飞快发展,建设基于WEB的对外中医汉英双语平行教学语料库并开发在线检索程序,是语料库建设的一个发展方向,可满足更大范围的语料检索需求,实现语料库的资源共享,为全国乃至全世界对中医的研究提供语言支持,因此具有较大的现实意义和实用价值。1.2论文的组织本论文简要介绍了中医语料库的领域知识以及平台的功能设计分析,主要阐述了对中医汉英双语平行翻译教学平台的功能实现和一些核心技术。第一章简述了系统开发背景、特点以及本人所做的主要工作。第二
17、章简述了系统开发的相关技术和运行平台。第三章简单说明了系统的总体分析和设计等。第四章描述了系统具体功能的实现。第五章详细阐述了系统开发过程中所使用的关键技术的实现。1.3本人所做的工作在该平台的过程中,我参与前期系统分析设计、数据库设计和语料预加工,并完成了基于Web的语料库后台维护管理功能、前台数据搜索功能的开发等最终实现的一系列工作。我在中医中英双语平行语料库翻译教学平台这个项目中是负责开发B/S模式的版本,在实现功能中涉及到许多算法和AJAX等一些较新的技术。第2章 系统相关技术及开发工具介绍在确定系统的开发前景、意义、目标后,就是选择相关的技术及工具来开发系统。在模式上,我们选择B/S
18、的操作模式,这样可以方便用户的查询和管理员的管理,无须安装客户端,只要打开浏览器即可使用。2.1 采取B/S操作模式B/S(Browser/Server)结构即浏览器和服务器结构。它是随着Internet技术的兴起,对C/S结构的一种变化或者改进的结构。在这种结构下,用户工作界面是通过WWW浏览器来实现,极少部分事务逻辑在前端(Browser)实现,但是主要事务逻辑在服务器端(Server)实现,形成所谓三层3-tier结构。这样就大大简化了客户端电脑载荷,减轻了系统维护与升级的成本和工作量,降低了用户的总体成本(TCO)。以目前的技术看,局域网建立B/S结构的网络应用,并通过Internet
19、/Intranet模式下数据库应用,相对易于把握、成本也是较低的。它是一次性到位的开发,能实现不同的人员,从不同的地点,以不同的接入方式(比如LAN, WAN, Internet/Intranet等)访问和操作共同的数据库;它能有效地保护数据平台和管理访问权限,服务器数据库也很安全 。特别是在.Net这样的预编译语言和AJAX技术出现之后,B/S架构Web软件更是方便、快捷、高效。2.2三层Browser/Server结构B/S结构是真正的三层结构,它以访问Web数据库为中心,HTTP为传输协议,客户端通过浏览器(Browser)访问Web服务器和与其相连的后台数据库,我们称之为B/S(Bro
20、wser/Server)模式。其三级结构组成如图2.1所示。客户端Web服务器后台数据库客户端图2.1三层结构图图中从左到右,分为三个层次:第一层是客户端即浏览器,主要完成客户和后台的交互及最终查询结果的输出功能。在客户端向指定的Web服务器提出服务器请求,Web服务器用HTTP协议把所需文件资料传给用户,客户端接受并显示在WWW浏览器上;第二层Web服务器是功能层,完成客户的应用功能,即Web服务器接受客户请求,并与后台数据库连接,进行申请处理,然后将处理结果返回Web服务器,再传至客户端;第三层数据库服务器是数据层。数据库服务器应客户请求独立地进行各种处理。与传统的C/S模式相比,B/S结
21、构把处理功能全部移植到了服务器端,用户的请求通过浏览器发出,无论是使用和数据库维护上都比传统模式更加经济方便。而且使维护任务层次化:管理员负责服务器硬件日常管理和维护,系统维护人员负责后台数据库数据更新维护。由以上的比较分析可知,三层结构也可以理解为增加了Web服务器的C/S模式。2.3 .Net平台892.3.1 什么是.Net微软的.Net平台堪称为新一代的互联网平台。对于技术开发人员来说,.Net平台的两大特性是非常卓越的,首先是其所提供的公共语言运行时,也就是公用语言运行平台,另一方面就是庞大而全面的统一编程类。其架构下图2.2所示。图2.2 .Net技术架构C#语言是微软公司针对.N
22、et平台才推出来的一门新语言,作为.Net平台的第一语言,它几乎集中了所有关于软件开发和软件工程研究的最新成果。其不但继承了C+、Java等面向对象的强大功能特性,同时还是继承了VB、Delphi等编程语言的可视化快速开发功能,其是当前第一个完全面向组件的语言。.Net平台中的程序设计主要分为以下四个方面:Web Forms、Windows Forms、Web Service及Windows Service,该平台主要使用Web Service中的ASP.Net技术设计实现。.Net应用体系结构如图2.3所示。图2.3 .Net应用体系结构2.3.2 什么是ASP.NetASP.net 是一种
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 NET 中医 双语 平行 语料 资料库 系统 毕业设计 论文 word 格式
链接地址:https://www.31ppt.com/p-4022160.html