admin管理员组

文章数量:1530846

2024年3月26日发(作者:)

新华字典笔画查字改造部首查字法 实

现直接翻页查字

2011年最给力的时装搭配.

2010年01月14日

改造部首查字法,实现直接翻页查字

刘春华

自《说文解字》以来,部首查字法已成为汉语字典的主要检索方法,即使按

音序编排的汉语字典,也大多要附部首查字法。但是,部首法的低效、繁难又一

直倍受责难。既然还没有找到更好的方法来替代部首法,我们不妨对它进行适当

改造,以实现直接翻页查字。

先来看一下部首法查字的全过程:

①确定汉字部首;

②数部首的笔画数;

③根据部首笔画数,在部首表中查到该部首在检字表中的页码;

④翻到检字表的相应页码;

⑤数目标字的"余部"(汉字除部首外的剩余部分)的笔画数;

⑥在检字表中查到目标字在字典正文的页码;

⑦翻到字典正文的相应页码查到目标字。

查字过程真是"一步三回头",没法不令人气馁!最癌症病例让人望而生畏的

是要数两次笔画,其次是要查两次页码翻两次页。

仔细分析一下,查字过程虽然非常繁琐,但涉及到的汉字特征实际上只有部

首和笔画数(包括部首和"余部"的笔画数)。第一次数笔画和翻页是针对部首,第

二次则是针对"余部"。也就是说,部首查字法的实质是用汉字的部首和"余部"特

征来确定汉字的排序位置。我们不喜欢数笔画,就用部首的首笔代替部首的笔画

数,用"余部"首笔和末笔代替"余部"的笔画数,这样我们就用4个特征来"定位"

一个汉字:部首首笔、部首、"余部"首笔、"余部"末笔;每一个特征,再用一个

字母来代表,就形成了4个字母的编码;将它用于汉语字典的排(序)检(索),就

可实现直接翻页查字。

事情就这么简单。

事情没这么简单。

关键是如何用字母来代表所述的汉字特征。

一个汉字提取4个特征,实际上只涉及汉字的两类特缘来网征:部首和笔画。

对照一下,传统的部首查字法也涉及两类汉字特征:部首和笔画数。

部首和笔画与字母的对应关系是成败的关键。由于基本笔画的种类较少,因

此最关键的是部首与字母的对应关系。

1.笔画

采用横、竖、撇、点(捺)、折五种基本笔画。为了离散重码,根据是否与其

它笔画相交,将横画对应两个字母。为叙述方便,两种横画分别称为相交横和非

交横。

笔画与字母的对应:相交横a,非交横e,竖i,撇o,点(捺)u,折v。我们注

意到,按字母排序,也正好是横、竖、撇、点(捺)、折(横画虽然对应两个字母,

但仍然全部排在其它笔画的前面),这当然不是巧合。

2.部首

采用《汉字统一部首表(草案)》规定的201部部首。

部首包括成字部首和非成字部首,其与字母的对应关系如下:

(1)成字部首一律采用拼音首字母。例如:寸c、长c、刀d、斤j、舌s、

舟z,还有:髟b、缶f、酉y、聿y、豸z、隹z、艮g、鬲g、厶s、殳s、豕s、

臼j、耒l、黾m、疋p、毋w、兀w、龠y、黍s,等等。

(2)非成字部首采用三种方式安排与字母的对应关系。

①大部分非成字部首采用其习惯名称关键字的拼音首字母,例如:宀b、疒

b、刂d、阝e、钅j、犭q、彳r、罒s、饣s、礻s、攵w、衤y,爫z,等等。

②3个非成字部首作形似安排,其中两个与字母相似:匚c、凵u,一个与成

字部首相似:屮j("屮"与"巾"相似)。

③11个常用的非成字部首采用指定字母:忄(

f、灬h、氵i、扌u、o、冫q、辶[辵]v

)n、亻l、艹p、讠a、纟

上述11个指定字母的非成字部首需要重点记忆。下面的顺口溜可能有助于

记忆:

顺口溜解释

竖心女,单人恋忄(竖心)--n(女);亻(单人)--l(恋)

草头偏爱言字边艹(草头)--p(偏);讠(言字边)--a(爱)

竹头o,走之v(竹头)--o;辶(走之)--v

提手u键两点牵扌(提手)--u;冫(两点)--q(牵)

风吹绞丝四点火纟(绞丝)--f(风);灬(四点)--h(火)

三点水落一条线氵(三点水)--i(一条线)

有了上述笔画和部首与字母的对应关系,很容易实施编码。

但,还有改进的余地。

我们注意到,大部分汉字的"余部"末笔部位也属于部首结构,例如"愉"的末

笔部位是"刂","寨"的末笔部位是"木"。如果用部首结构代替末笔,由于部首对

应的字母种类数是笔画的好几倍,可以大幅度减少重码。当然,也有一些字的"余

部"末笔部位不属于部首结构,例如"壤、拖"等,它们就仍然采用末笔。

现在可以总结编码规则了:先依次取部首首笔、部首、"余部"首笔,最后在

"余部"末笔部位取末笔部位码(简称"末位码"),如果末笔部位有部首结构,取部

首,否则取末笔。

编码举例:

输-acod部首首笔相交横a、部首车c、余部(俞)首笔撇o、余部末位码

d(刂)。

施-ufov部首首笔点u、部首方f、余部首笔撇o、末笔折v(余部末笔所在

部位不属于部首结构)。

権-amoe部首首笔相交横a、部首木m、余部首笔撇o、末笔非交横e(余部

末笔部位不属于部首结构)。

如果是部首字,依次取字的前三笔和末笔。举例:

鱼-ovie首笔撇o、次笔折v、三笔竖i、末笔非交横e。

有一点很重要:不需要拆分汉字!

部首查字法本来就没有"汉字拆分"一说。

另外,它还在相当程度上保留了部首法对汉字按部首分类排序的特点:在部

首之前先取部首首笔,使得按码序排列的汉字具有良好的排序效果,所有汉字均

按部首首笔分类、大部分汉字按部首分类排序,其中讠、氵、口、亻、忄、、

艹、扌、辶、攵、禾、女等所含字量大的部首项下的全部汉字按部首"清一色"

排序。

重码情况:gb2312-80字符集6763字范围的静态重码比例为39.23%。一般

辞书(例如《新华字典》和《现代汉语词典》)单字字头一万多个,重码率还会升

高一些,但不会影响字典的直接翻页查字,因为字典并非"一页一字",而且打开字

典,我们一次看到的是两页!对于收字量大的大型辞书,可以在余部首笔和末位

码之间增加一码,取余部次笔,这样可以大幅度降低重码,满足大型辞书直接翻页

查字的要求。重码汉字的精确排序可以沿用笔序法。

既然已经将部首查字法改造成了汉字编码,为什么不同时用于汉字输入呢?

作为一种不拆分汉字的形码,简单易学,又符合文字规范,用于输入汉字非常

方便,但它不能作为"主力"输入法,因为重码偏多。

我们将第一码"部首首笔"换成"汉字首音(拼音首字母)"就构成了音形码。

由于"汉字首音"的种类比"部首首笔"多好几倍,音形码的重码率大幅度降低,在

gb2312-80字符集3755一级字范围的静态重码比例为6.36%。再引入超大词库

的词码和简码,音形码可以担当"主力"输入法,满足专业录入员的输入速度要求。

上述形码和音形码都属于"三合一汉字编码及键盘输入法"(简称"三合一")

的成员,此外,三合一中还包括音码(全拼)和笔画码。三合一集音码、形码、音

形码于一体,不需要切换,可随机使用各种方式输入汉字:常用字、词可用音形

码输入;不认识的字可用形码输入;编码困难的字可用拼音或笔画输入。

形码是理想的字典查字法,但用于汉字输入时只能作为辅助输入方式,主要

用于输入不常用字(可应用于大汉字集直至全汉字集)。三合一作为输入法,已超

出本文范围,宜另文讨论。

最后一个问题:汉字部首的确定。由于汉字部首的确定方法尚未统一,"三

合一"暂且采用李行健先生主编的《学生规范字典》、《中学生规范词典》和

《现代汉语规范词典》三部辞书的部首检字表的方法确定汉字部首。希望尽快

出台国家标准的汉字部首规范

历史上的今天:

爱迪生简介.托马斯·阿尔瓦·爱迪生简介2011-04-06在线新华字典全省

中考确定提前十天2011-04-06

本文标签: 部首字母笔画查字字典