汉字编码的误区究竟在哪里.doc
《汉字编码的误区究竟在哪里.doc》由会员分享,可在线阅读,更多相关《汉字编码的误区究竟在哪里.doc(15页珍藏版)》请在三一办公上搜索。
1、汉字编码的误区究竟在哪里汉字编码的误区究竟在哪里?毕可生-评一篇不科学的科学评述雪汉文汉字编码关系到汉字在下个世纪走向世界的大事,关系到电脑在中国的发展与普及,也关系到中华文化发展前途。这都是不言而喻的。作为一个退休的社会学家,只有两年不到的电脑学习与使用经验和知识。本来是不宜对汉字编码方向这样的专业问题说三道四。但是,看了新华文摘1995年第8期转载的科技日报记者陈和利先生的汉字编码:何时走出误区一文后。感到这虽是一篇似乎是专业性的文章,但是看来他谈的问题,却是一个涉及电脑使用与普及的社会问题。新华文摘又加以转载,其重要是可想而知的。如果按照陈先生提出来的方向和原则走下去,依我的浅见所及,不
2、是走出误区,恰巧却是走进了误区。因此,我不得不提出我的陋见,以就正于方家。陈先生在开头的一段中就说:并不成熟的中国计算机用户群,面对数百种之多的汉字编码方案,会显得无所适从;面对复杂的拆字规则,键位记忆,许多非专业录入人员知难而退;我国人均计算机输入方案的不成熟,正在造就一种最后终将会被淘汰的新兴职业-计算机录入员。这就是我国目前汉字编码现状。在这一段中,作者首先就为我们描绘了汉字编码一幅不真实的悲惨现状,接着以最终将会被淘汰的新兴职业,计算机录入员为依据来反证,汉字编码的不成熟。这真是所谓求之于牝牡骊黄之外,说得俚俗点就叫磨轴不转,死打驴。录入员的存在与面对数百种之多的汉字编码方案可说毫无关
3、连。相反倒恰恰证明了,汉字编码方案的成熟才会出现专业的录入人员。因为,计算机的录入人员虽然面对众多的汉字编码方案,但她们选择的多半就是一种汉字编码的最成熟的方案。一般来说这种方案多半就是五笔字型的最新版本。但是,这是专业录入员存在的一个并不重要的理由。专业录入人员的存在更重要的理由是因为她(他)们的专业性技术。陈先生大概不知道录入员的专业性的技术的内容究竟是些什么?所以,才认为录入员只是在那里搞汉字编码的输入。其实,汉字编码只是录入员电脑使用操作技术的一个方面,甚至是一个最好学最单纯的方面。除了汉字编码外,录入员更多的是要学会电脑操作系统(DOSwindows9XXP等),编辑、排版、打印等操
4、作技术以及多种相关软件的使用技术等。此外,如果是涉及工程和科技方面的录入员,那么,她(他)们至少还要懂得和学会使用几种高级算法语言。而且,也正是因为有了成熟的汉字编码方案,才能产生高速度的熟练录入技术。以五笔形和仓颉等形码为例,专业录入员的高速度是每分钟击键300次输入120个汉字是及格水平,而每分钟击键500次,辅入200字,是竞赛水平!说句老实话,我的速度大约是每分钟30至50字(并不是因为拆字规则和键盘问题,我以后会说到)。作为一位科技日报的记者,您的速度如何?如果她(他)们只有和我们一样的速度,岂不是连饭碗也要砸了?为了速度和专业性技术我们将永远需要专业的录入人员。这就像西方的打字员一
5、样。正是因为有了快捷面成熟的字母输入键盘技术才产生了熟练的高速度,也才有了这样一门专业。打字机与电脑相比要便宜得多、简单得多、历史也长得多。但是,西方作为秘书类职业的打字员仍然没有失业,所以,电脑录入员这一职业,既不是因为汉字编码的不成熟而产生,更不会因汉字编码的成熟而消失,把专业录入员的存在归罪于汉字编码的问题,不过是一种诬枉的口实。它只是陈先生要用以引起下文,为某类汉字编码创造罪名的一个前奏。陈先生表面上肯定了五笔字型取得的丰硕成果。他说:我国的许多计算机专家对汉字编码进行了呕心沥血的探索,取得了丰硬成果,打破了汉字是计算机应用与推广一大障碍的神话,也研究出了一些较为成功的汉字输入法,如五
6、笔字型。可是,接着陈先生就说道:汉字结构复杂低重码的方案(即指高速度-笔者注)必然带来较高的难度,这是一个无法解决的矛盾。这就奇怪了,一方面说五笔字型等汉字编码方案打破了汉字不能进入电脑的神话;一方面却又说低重码必然带来高难度是无法解决的矛盾。这不是自相矛盾吗?那么,按陈先生的意见取得的丰硕成果,打破的神话又是什么呢?其实所谓的丰硕成果和打破了神话,就是指解决了低重码和高难度的矛盾。并不是解决了汇编语言和机器语言的问题,因为,那是工程师们的事,不是汉字编码者的事。如果说我们汉字编码解决的只是高重码、低速度的汉字的编码输入法,那么全拼音法,就是这样一种方案,而这种方案在70年代,所谓的汉字不能进
7、入计算机的神话时代就有了,何用等到80年代中期再来解决?这也就是当时文改先生们嚷着非要实现汉字拉丁化最重要的理由!看起来,陈先生根本不知道像五笔字型这一类汉字编码所取得的丰硕成果究竟是什么?只是大势所趋,不得不人云亦云地跟着说两句捧场的话而已,心里却是不以为然的。快和慢,难和易总是相对而言,所以陈先生说:快速度必然会产生高难度这是无法解决的矛盾,这说法本身就不合逻辑,也不科学。汉字是表意文字,她的同音字太多,这是世所周知的事实。她的标准音节只有415个,按GB一、二级字库的七千(实为6763个)汉字来说平均每个音节下就有17个同音字。就这17个字在提示行上翻页,就够翻两页的。而糟糕的是汉字的同
8、音字并不是平均分配在415个音节下面,而是有多有少,多的如YI,JI等音节,都有一百多同音字,至于有五、六十个同音字的音节就更多了,如QI,SHI,LI,LU,FU等等。即使加上四声的区别也只有1295个音节,平均下来每个音节也有五六个同音字。那么,如果以全拼音不带四声进入电脑汉字输入,只在提示行里翻页、选字就够忙活的了。其次,中国地域广大,方言和方音异常复杂,就中国东南方的六大方言区来说,不要说四声,就是字的读音也是大不相同。至于长江以北加上云、贵、川的广大北方官话区,字的读音虽还大体相近,可是四声就千差万别了。这就是汉字音码输入法重码很多的先天原因。这也就是上文提到有人过去说的,汉字进不了
9、计算机的根本原因,但是,汉字的形码输入法,却巧妙地避开了汉字音码的难点,按照汉字原来自己的构字规律,以笔画和偏旁部首为基本单位,依汉字的字形进行输入,一举取得了成功。不但基本解决了重码问题,而且,获得了世界上任何拼音文字无法比拟的高速度!这也就是上文所提取得了丰硕成果的具体的内容。但是,就在大家都在庆幸打破了汉字不能进入电脑的神话之际,陈先生不得不跟着学说两句外,却提出了低重码-形码与高难度是无法解决的矛盾!那么事实究竟是怎样的呢?在陈先生的全文中,始终吞吞吐吐;半明半暗地使用似乎是专业术语而含糊其词的所谓的高重码、低重码,让我一语道破吧!实际上前者就是指的拼音码,而后者指的就是形码即五笔字形
10、一类的形码。为了说明陈先生的无法解决的矛盾,不妨以陈先生文章中情有独钟的高重码、低速度的拼音码为例与形码作一比较。原先汉语拼音本来是为给汉字标音之用,以及作为教普通话和识字的一种辅助工具。但是,当初在文改先生影响下制定的中小学汉语拼音教学方案,借口推广普通话,实际上却是把拼音方案当文字来学。这给除了北京地区能说标准普通话的孩子以外的广大的说方言和说带各种方音腔普通话的孩子带来极大的困难,尤其是那艰涩四声的记忆。因此,今天中小学语文课中,用于教汉语拼音的时间,在小学要占总教课时数的五一六分之一,中学约在七分之一。这还不算学生们用于大量完成练习和自学的时间。说拼音码输入法好学,是完全忘记了这一段花
11、费的时间和苦难的学习历程,这是其一。其次,说得直白一些,汉字本身就是一种表达人的思维和信息传递的形码书写符号。文改先生曾得意地作为汉字音化根据的形声字,恰巧仍是一种标准的形码,而同音假借才是一种音码。所以,古人才在汉字的发展中大量减少同音假借而代之以大量的形声字。而且,特别要在这里顺便指出的是,今天包括大学生在内的年轻人错别字多发生在同音字上的根本原因,就是只教拼音,不教汉字表意结构的明显的恶果。陈先生的文章中指出说:汉字的结构复杂,低重码必然带来高难度。又说:形码的拆字复杂,难记难认等等。这些论断实在是文改先生百年一贯制攻击汉字难学难认在汉字编码间邀上的翻版。我这里就进一步,对五笔字型和拼音
12、更具体地比较一下两者的难易。按五笔字型将汉字归纳为由横、竖、撇、捺(含点)、折(汉字隶变以后两千年来的基丰笔画就是如此)五种基本笔画所构成。这显然比26个拉丁字母要少得多。五种笔画又组成了130个部首偏旁(现在的任何一种字典所用的部首偏旁都在210-240个之间);这也比415个音节要少得多。而汉字就是用这130个部首偏旁,按左右、上下、杂合三种构字形式构成汉字。所以,这也比四声要简单。如果,现在的中小学肯用教汉语拼音的二十分之二的时间去教汉字的五笔字型的拆分和结构以及字的表意内涵,那么,我相信不但汉字的形码输入学会了,按五笔字型编的字典会查了,弥补了拼音识字法的弊端,学生的同音错别字也会大大
13、减少。从总体上看,究竟哪种汉字编码好学也就清楚了。这里我还想从我自己的亲身体会来谈谈我学习五笔字型汉字输入法的体会。两年以前,我65岁的时候,决心夹在一班青年人中参加了一次某学院开设的二十个夜晚的电脑短训班。十次听课,十次上机,而且,五笔字型只是学习的项目之一。两三个月之后,我才有机会得到一架我可长期使用的电脑。根据我的这点经验来说,被陈先生描绘的,形码-五笔字型学习难的问题,恕我说一句不客气的话,陈先生完全是在那里危言耸听。先说学习时间,我认为从背诵六首口诀(五首部首口诀和一首高频字口诀)到学会拆字和熟悉键盘,有一个月的时间也就够了。我是通过一种叫星汉五笔字型学习软件学习的。一个月后,我的最
14、高速度是每分钟60个汉字。在我的学习过程中,我并没遇到什么复杂的拆字规则。五首部首偏旁口诀背下来,拆字也就会了。我认为它比我们按部首查字典的过程,简单多了。我的按部首查字典至今还会碰到极个别的字查不到,只好求助于数笔画。可是,至今我在使用五笔字型的拆字上极少遇到问题。至于说到键盘记忆,人脑就是如此的神奇,在一个键位上是只有一个符号还是有两三个,以至五六个符号,只要你记住了,以后在使用中,那感觉是一样的。曾有位比我约大一旬的文改老先生,对五笔字型仍在咕咕嘻嘻地说,要记130个部首偏旁的键位是如何困难等等,我实在是不好意思说请他不妨亲自试一试的话。可是,现在我却要请陈先生不妨试一试再来发言好不好?
15、看键位记忆究竟有多难,否则怎么能规定及格水平每分钟是120个汉字呢?又怎样能进行盲打呢?我在一年多使用五笔字型的过程中,始终保持一个相对的低速度,完全不是因为五笔字型的被称作复杂的拆字规则,键位记忆的问题,而是因为我们这一代人,经过了简化字的改来改去,平时又使用-些信手字和繁体字,所以经常会记不起标准的简化字怎么写。例如:来字,我就经过双人木,三小,一米三种来的写法,明显的显竟被改得面目全非了等等,这是一,我多半是边思考边输入,也边修改,此其二。最后,究竟是年老了,运动神绝有些退化了,手指不太听脑子的指挥了。如此而已。我想我的这点经验已经足够否定陈先生对汉字形码的否定而有余了。形码的难学被陈先
16、生强调到极致,甚至不惜歪曲人们学习习得性技能的一般性规律来加以夸大。陈文中说:低重码方案(实指形码-如五笔字型)需要专门学习、记忆、训练才能掌握,稍一不用还会忘记。这里首先一个问题是什么样的方案是不用学习的?陈先生是不是认为,只要是对着计算机键盘的A、B、C、D上手就可拟捅出汉字来了?如果陈先生认为如此,那么这也是电脑操作和汉字输入的一种神话。事实上,要用电脑打出汉字来,先要学会DOS系统,这已是我上文说过的,就是陈先生实际上钟情的音码也还有个键位指法的学习和熟练过程。至于说经过学习、记忆、训练才能掌握的习得性技能(即如形码),稍一不用还会忘记。这又是学习的一个神话!既然是经过训练才掌握了的技
17、能,如果稍一不用还会忘记,那不是太危险了吗?好在,经过训练掌握习得性技能的经验,我们人人都有过,而且,中国人也不是得了健忘症。比如说:缝纫、编织、财会、算盘、汽车驾驶和车、钳、铆、焊等技术,以至像外科手术这样的大技能,是不是都是稍一不用还会忘记?习得性技能,多年不用生疏起来是难免的,但稍一不用还会忘记则无此可能!就说汉语拼音吧,中、小学生花了那末大力气进行学习,考入大学之后,几年不用,除了说标准普通话的人外,至少四声又会时时掌握不住了。但是,学会了的技能;经过一个较长时期不用后,再有一个很短期的自我复习,又会熟练起来,这才是常人的普遍规律。至于说几年不用或经常不用电脑,这与汉字编码的难易,是完
18、全扯不到一起来的,更与计算机的推广使用风马牛不相及!陈先生还对日本的汉字输入所取得的成就,钦羡之情溢于言表。我倒不是因为经过抗战对日本侵害中国怀恨于心,所以存有成见。但日本的汉字输入,早就不是什么问题,根本就不是像陈先生说的:十几年前,日文中的汉字同样是困扰日本的难题。当时,日本的局面和我们很相像,人们发明了几百种输入方案,当时推出的日文(此处,陈先生脱漏了汉字两字,这是很大的错误。下同)形玛输入法,虽然具有重码少,速度较快的优点,但折字复杂,干扰思维,难学难记,脱离日文(汉字)教学,因此也造就了计算机的专业录入员。当时的日文(汉字)拼音码虽然重码多,是我国汉字音码的8倍,但具有简单易学、与教
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 汉字编码 误区 究竟 哪里

链接地址:https://www.31ppt.com/p-5224408.html