Discuz!NT
欢迎 游客 , 注册 | 登录 | 界面 | 简洁版本 | 在线 | 帮助
分栏模式|网站首页|语言学网文

本主题被查看4587次, 共5个帖子, 1页, 当前为第1页     选择页数: 1      跳转到第   上一主题   下一主题
标题: 汉字工程反思录:大水泛滥
kingsky
 

来自:
状态: 离线
kingsky@kingsky.org kingsky@kingsky.org
只看楼主 2007-12-04 06:40
汉字工程反思录:大水泛滥

大水泛滥


--大陆收字最多的字典--《中海字海》里的奇迹



Xieyan Hincha



95年,在汉堡天地书店寄来的一份新书目录上,有一本《中华海字海》。目录介绍说:《中华字海》是当今世界上收字最多的字典,收字85.000多。看见这个数儿,感到很惊讶,因为不久前刚出齐的《汉语大字典》的收字数是56.000左右56.000是编者给的数;实际上,我数《笔画检字表》,得出54.709);怎么在大约4年的时间里,大字典的收字数会一下子涨了3万?

翻开《字海》,马上就可以感觉到,这部字典在学界引起了非同小可的反响;学者们是把它当成中国词典史上的又一个里程碑来庆祝的:(1)国家教育委员会副主任、原国家语言文字工作委员会主任柳斌先生;(2)北京大学教授、中国音韵学会名誉会长周祖谟先生;(3)人民教育出版社审编、北京外国语大学客座教授、北京市语言学会会长张志公先生;(4)中国社会科学院语言研究所所长、研究员、中国语言学会会长刘坚先生为《字海》题了词;(5)中国辞书学会会长、中国社会科学院语言文字应用研究所研究员曹先擢先生从日本发来了41行的贺诗;(6)中国人民大学教授、国家应用文字工作委员会委员、中国应用学会副会长胡明扬先生为《字海》写了序。

《字海》的编者在前言里说:我国历史上极负盛名的《说文解字》、《康熙字典》、《中华大字典》和当代的《汉语大字典》无疑是中国文字史和字典史上巍峨的几座丰碑。《中华字海》共收录汉字八万五千余个,这是继上述字典之后,迄今为止世界上收汉字最多的一部字典。

从这段话,可以知道编者自己对《字海》有什么样的认知:《字海》不仅可以跟中国文字史和字典史上的几座丰碑平起平坐,而且还在收字数量上超过了丰碑;丰碑里的丰碑!

《字海》里的那么多字儿是哪儿来的?它是不是真的跟那些学者的高度赞扬相称?是不是真的配当中国文字史和字典史上的又一里程碑呢?这得看这部字典的编纂是否能够经得住现代语言学的检验了!

我曾经把《字海》翻看过7遍。这使我对里面收录的汉语楷书单字有了一些具体的了解。《字海》当中出现的很多怪现象使我赢得了这样的看法:《字海》并不像学者们夸奖的那么好,也不像编者所说的那样,几乎成丰碑了。下面就把那些怪现象拿出来展览一下。

1.《字海》里的简体字

在字典的凡例(p.6)里,编者说:字典收录的简化字有两类:《简化字总表》和1977年颁布的《第二批汉字简化方案(草案)》里面的简化字。

看过字典之后,我发现里面不仅只收录了这两个字表中的简化字,而且还收录了其他好几种简体字,但编者却没提。

1.1.民国时期的简体字

1935年,民国政府教育部公布了《第一批简体字表》;它是在集合清朝末年以来简体字研究成果的基础上制定的。这个字表收录了324个简体字。

《第一批简体字表》公布之后,在推行的过程中受到了很大的阻力,民国政府在第二年就只好把它废除了。这个字表里的55个简体字,在1955年大陆文字改革委员会颁布《简化字总表》的时候,没有被采用(参见谢世涯。《新中日简体字研究》。语文出版社。198919932次印刷。p.168-173)。在《字海》
当中,我找到了《第一批简体字表》中,15个生命维持不到一年(Aug.1935--2. Feb. 1936) 的简体字(因为计算机字库原因,只给出15个简体字所在的页码和它们的繁体字形。)
(1) p.2

(
2) p.12

(3) p. 16

(
4)p. 114

(5) p. 194

(6) p. 220

(7) p. 220

(8) p. 226

(9) p. 390

(10) p. 480

(11) p. 942

(12) p. 951

(13) p. 971

(14) p. 1342

(15) p. 1557
()+

1.2. 1955年《汉字简化方案(草案)》里的简化字

1955年,文字改革委员会拟定了一个《汉字简化方案(草案)》。这个《草案》是一个内部征求意见稿,没在社会上公开过。《草案》当中收录了798个简化字(参见谢世涯。同上。p.217)。其中55个在1956年正式公布的《简化字总表》里没有被采用。这也就是说,《草案》里的55个备选形体只不过是桌面上设计的符号,而非文字。
《字海》收录了22个这个《草案》中的符号:

符号所在页码
繁体字
符号所在页码
繁体字
(1) p.14


(2) p. 36


(3) p. 99


(4)p. 194


(5) p. 258


(6)p. 273


(7) p. 393


(8)p. 721


(9) p. 722



(10) p. 903


(11) p.
994




(12)p. 1046


(13) p. 1105


(14)p. 1115


(15) p. 1275


(16)p. 1293


(17) p. 1331


(18)p. 1357


(19) p. 1372


(20)p. 1625


(21) p.
1749


(22)p. 1772

漿

1.3. 新加坡废止使用的简体字

1969年,新加坡教育部的汉字简化委员会公布了一个收有502个简体字的《简体字表》。1974年,新加坡教育部又颁布了一个收录2248个简体字的《简体字总表》(参见谢世涯。同上。p.69)。由于这两个简体字表给新加坡的社会用字造成了混乱,引起舆论界和有识之士的反对。他们一致认为,新加坡没有必要去简化出另外一套与汉字发源地中国相异的字体,因此新加坡教育部在1976年又一次公布了《简化字总表》。这次颁布的《简化字总表》跟中国大陆的《简化字总表》一模一样。新加坡教育高级政务部长蔡崇语在国会说:我们目前采用的简化字,实际上是把中国简体字引进过来。(参见谢世涯。同上。p.116)
我把《502简体字汇》(香港:东亚书店。出版日期不详)跟《简化字总表》对比过,其中有74个形体跟《简化字总表》里的不同。这就是说,这74个形体在新加坡1976年颁布《简化字总表》之后就作废了。不过,对《字海》的编者,即使是作废字还是可以被废物利用的。《字海》收录了19个新加坡废字:

简体字所在页码
繁体字
简体字所在页码
繁体字
(1) p. 18


(2) p. 206


(3) p. 494


(4) p. 558


(5) p. 822


(6) p. 1161


(7) p. 1314


(8) p. 1316


(9) p. 1335


(10) p. 1389


(11) p. 1393


(12) p. 1450


(13) p. 1454


(14) p. 1454


(15) p. 1456


(16) p. 1463


(17) p. 1517


(18) p.
1581


(19) p. 1638



1.4.日本《常用汉字表》里的简体字

1981年,日本政府颁布了收有798个简体字的《常用汉字表》(参见谢世涯。同上。p.450)。谢世涯在p.487—p.491上列出了4类中日两国简体字字形不同的4个表
格。我把这4个表格里面的字儿数了,得出的结果是:日本《常用汉字表》里跟大陆简化字不同的有224个。日本《常用汉字表》虽然带有汉字的字样,但是,这些字是用于记录日语的,而非汉语。《字海》的编者,把97个《常用汉字表》了的字,从日本引进到了中国,从日语引进到汉语,并且给它们带上了汉语楷书单字的帽儿。
97个字一一列出太多,这里只给出6个例子,证明日本字在《字海》里存在:

日本字所在页码
汉字
日本字所在页码
汉字
(1) p. 1


(2) p. 24


(3) p. 72


(4) p. 221


(5) p. 378


(6) p. 407



1.5. 1977年颁布的《第二次汉字简化方案(草案)

1977年,大陆文字改革委员会颁布了《第二次汉字简化方案(草案)》。这个《草案》有两个表:第一表收录的简化字有248个;第二表有605个,总数为853个(参见谢世涯。同上。p.6)1986624日,国务院发布了《国务院转批国家语言文字工作委员会关于废止《第二次汉字简化方案(草案)》和纠正社会用字混乱现象的指示的通知》。自这个《通知》下达之日起,《第二次汉字简化方案(草案)》就停止使用了。《字海》的编者在凡例当中说了,字典收录了这个草案当中的字形;在此我就把例子省了。
1992年,也就是《字海》出版两年前,中华人民共和国新闻出版署和国家语言文字工作委员会联合发布了《关于发布出版物汉字使用管理规定的通知》。这个通知的第3条明确地指出了《第二次汉字简化方案(草案)》里的字是不规范的;第7(3)还规定了:古代历史文化学术研究著述和语文工具书中必须使用繁体字、异体字的部分不适用第5条、第6条。通知的这个条款只允许字典使用繁体字和异体字,但没让字典收录上述5种简体字,何况这5种简体字中还包括了外国字和外语字。
额外补充一下:给《字海》题词的柳斌先生,在1992年的时候,是发布《出版物汉字使用管理规定》的国家语言文字工作委员会的主任;给《字海》作诗的曹先擢先生是副主任(参见《中国语言学年鉴1992》。北京:语文出版社,1993, p.102)。不知道这二位先生是不是了解《汉字使用管理规定》第11条里的处罚内容,还是在1994年给《字海》这块丰碑揭幕时,一高兴,就忘了。

《字海》收录上述5种简体字的一览表

简体字出处
数量
1935年《第一批简体字表》
15
1955年《简化字方案(草案)
22
新加坡502《简体字表》
19
日本《常用汉字表》
97
1977年《第二批简化字方案(草案)
853
总计
1006

《字海》的正编和遗补加起来共1781页,收录字头数为85568个,平均每页列字头48个。这1006个简体字占《字海》篇幅约为21页。



潘悟云 最后编辑于 2007-12-10 19:16:51
#1  
kingsky
 

来自:
状态: 离线
kingsky@kingsky.org kingsky@kingsky.org
只看楼主 2007-12-07 22:45
2. 类推简化字

2. 类推简化字

Xieyan Hincha




类推简化字是指那些按照《简化字总表》所列的可作简化偏旁用的简化字和简化偏旁的简化规则,把超出《简化字总表》以外的繁体字简化,造出来的字儿。

《简化字总表》里面没有收录的、人们自行类推简化的个别字,后来被收入到了《现代汉语通用字表》,变成了标准汉字,但其余的并没有得到国家标准的承认。我在这儿用的类推简化字指的是没有拿到国家标准通行证的类推简化字。

为什么会出现类推简化字呢?源头可以追溯到《简化字总表》的说明那里。《说明》第2点的最后一段有这么一句话:未收入第三表的字,凡用第二表的简化字或简化偏旁作为偏旁的,一般应该同样简化

什么叫一般应该呢?《说明》里没有再进一步说明。标准定得含含糊糊,《说明》,说而不明,就为人工制造类推简化字留下了活口儿,使攀登字典收字高峰的编者有了钻空子的机会。

据《字海》编者给字头的解释:X字的类推简化字,我在字典里一共找到了4542类推简化字。这4542字头,占字典收字数量的5%;篇幅约90页。大笔一挥,就类推出这么多的字。要是让学生去学这么多字的话,足够他们在无涯的学海里乘舟苦苦飘荡个6年的;《六年制小学语文统编教材生字表》里收的字数才3189个。

对我来说,最有趣的是:查看《字海》编者到底是怎么类推出简化字,也就是从什么字(源头字)类推出简化字的。我把《字海》收录的类推简化字分为10类。

2.1.繁体字已正式简化了,还类推出简化字

繁体字
页码
简化字
页码
类推简化字
页码
(1)
p. 94

p. 661

p. 74
(2)
p. 306

p.255
/
p. 296
(3)
p. 1558

p.100
()+
p.1558

3个例子以类推简化字在《字海》里的页码排序。就例(2)和例(3)需要说明的是:

A.(2)的类推简化字在《新华字典》(1998年修订本。p.383)、《现代汉语词典》(1996年修订本。p.975)和《现代汉语规范字典》(顾问吕叔湘、李行健主编。语文出版社,1998p.406)里都被列为字头,作为[pín]”规范简化字。

B.(3)的类推简化字在《新华》(同上。p.152)、《现汉》(同上。p.424)同样也作为字头,为[gé]规范简化字;《规范字典》里没有。

按照《简化字总表》,简化为简化为。对这两组繁体字、简化字,《简化字总表》没有再作过多的解释。《现代汉语通用字表》里没有例(2)和例(3)的类推简化字。虽然有的字典把它们作为简化字,但是,因为《简化字总表》和《现代汉语通用字表》毕竟是国家标准,高于字典,所以我依这两个国家标准把它们归属到了类推简化字

2.2. 由讹字类推出简化字

讹字就是写错了的字儿。即使是上初小的学生也知道,写错字是要改的、写错字是要被老师扣分的。就是这么一个连小孩都明白的道理,上千年来,汉语词典学界就一直没反应过来。

讹字,在古代出版的字典里就有了。古代的科学当然没有现在这么发达,古人把讹字收入字典,还可以原谅;即使不原谅,也没办法,反正他们人早已经不在了。到了现代信息的时代,如果还把现代词典学抛到一边儿,仍然沿用古人编字典的土法,把讹字收入字典的话,还可以使人认为,现代字典编纂者拿继承传统当幌子,懒着去动脑子,躺在古人身上睡大觉。但是,情况并不是这样的,有些字典编纂人,并不完全甘心沿用古人的老方法,还想干出点创新填补空白之类的事业,于是弄出了把讹字进行类推简化的花样出来。实例如下:

正字
页码
讹字
页码
讹字的类推简化字
页码
(1)
p.1164

+(上半)/
p.1058

+(上半)/
p.1164
(2) +
p.1634

p.1634
+
p.1634

2.3. 由异体字类推出的简化字

《字海》凡例第13条明确说明了带有X表示这个字头是个异体字。

什么叫异体字?

异体字这个名称大家都熟悉,而且这个词也很常用。可是要搞清楚它的意思,并不那么容易。

A.《中国大百科全书语言文字卷》(1988年版。p.448)给它的解释是:指汉字通常写法之外的一种写法,也称或体

那么,什么叫通常写法呢?

举一个具体的例子:我们现在写的简化字,原来是用于民间的手头字,也就是俗字,而辞书长期把当成标准字形,这两个[luàn]字形,哪个是通常写法呢?通常写法以哪个时代、什么为标准呢?《百科》解释名词咋能这样糊弄?

B.《汉语大词典》(1997年缩印三卷本。p.4640)异体字的解释为:音同义同而形体不同的字。即俗体、古体、或体之类。

音同义同而形体不同的字指的是正体、俗字、古体等音义相同的一组字;一组字中的单个字形之间的关系互为异体。而即俗体、古体、或体之类。把上句的一组字变成了俗体、古体、或体等单个字形,这是前后矛盾。另外,或体就是异体的别称;用或体解释异体等于没解。

C.“异体字还有另外的意思:跟规定的正体字同音同义而写法不同的字, ... ...”(《现汉》。p.1492)

按照《现汉》去理解异体字的人比较多。那么就应该接着看看什么叫正体。《现汉》(p.1607)给出了三个解释:1.规范的汉字字形;2.楷书;3.拼音文字的印刷体。《现汉》给正体的哪个解释适用于对异体字解释里的正体呢?

《现汉》给正体字的解释里还用了规范这个词。那么就请看看《现汉》自己给规范的解释吧:1.约定俗成或明文规定的标准;2.合乎规范;3.使合乎规范(《现汉》。p.474)2.3.规范去解释规范等于没解释,可以不管它,只看1.:约定俗成的标准和明文规定的标准,问题又出来了:要是两种标准并行的话,哪个是规范呢?
什么是异体字?在工具书了绕了一大圈儿也没让人搞明白。为什么解释不清楚这个词呢?是辞典编者无能,还是异体字不是术语,没法定义?我认为是后者;异体字是一个假冒的专业术语。既然用异体字已经用习惯了,我也就随大流跟着糊里糊涂用它吧。

《字海》里4542个类推简化字当中,挺大一部分是从异体字类推简化过来的。对异体字,汉语学界普遍采取的态度是:整理异体字、淘汰异体字。这也是官方的语言文字政策。1955年,文字改革委员会公布了《第一批异体字整理表》。有的学者说:这个《整理表》里的异体字本来已经死了多年,又拿出来整理一把,就如同把死人挖出来再枪毙一次。哈,哈,开个玩笑,现在回归正题:正式的说法是:这个《整理表》收异体字810组,共淘汰了1055个异体字(《整理表》说明2.)。即使在重新颁布的《简化字总表》、《通用字表》的基础上,被淘汰的异体字实际数量不是1055个,而是少了26个,但官方要整理和淘汰异体字的语言文字政策是没变的。《字海》号称国家现行的有关汉字使用规定我们必须遵守,这一点是不能含糊的。(见《前言》。p.4),不仅往字典里放了很多的异体字,而且还从异体字类推出简化字。这是遵守规定不含糊,还是违反规定不含糊

《字海》里从异体字类推的简化字比较多,这里我只给出几个例证;排序按类推异体字的页码:

正字
页码
异体字
页码
异体类推字
页码
(1)
p.1676

p.49
/
p.48
(2)
p.1000
譿
p.1480
+
p.1480
(3)
p.399

p.1464
+
p.1464
(4)+(右半) p.1535
+()//
p.1535
+(上部)//
p.1553
(5)
p.992
/+
p.1590
/+
p.1590

2.4.从一个繁体字类推出两个简化字

汉字简化,不仅是使字形的笔画减少,让人书写方便,而且还减少了汉字使用的数量。《简化字总表》把原先的2260个繁体字减化2236个简化字。《总表》在大多情况下,把繁体字和简化字进行了一对一的简化,在少数情况下也有将两个以上的繁体字合并为一个简化字的,但绝对没有从一个繁体字简化出一对双胞胎的。《字海》里就有从一个繁体生出俩的。

繁体
页码


类推No.1
页码
类推No.2
页码
(1)+()
p.1489

+()
p.1642
+()
p.1480
(2)
p.1591
/+
p.1587

p.1591
(3)
p.1682

()+
p.1682
()+
p.1696
(4)
p.1693
+

p.1682
+
p.1693
(5)
p.1695
+
p. 1683
+
p.1695
(6)
p.1697
+
p.1681
+
p.1697

(2)类推简化字No.2在《新华》(p.289)和《现汉》(p.767)都作为字头出现,但在《简化字总表》、《通用字表》和《规范字典》里没有。


2.5.从俗字类推出来的简化字

《字海》没有直接使用俗字类推简化字这个名称。如果给一个字头的解释是:X的类推简化字,而X出自《宋元以来俗字谱》,或《敦煌俗字谱》,我则把这个简化字定为从俗字类推出来的。举例如下:

正字
页码
俗字
页码
从俗字类推字
页码

(1)
p.1388
/
p.195
/
p.194
(2)
p.1327
+()
p.1392
+()
p.1329
(3)
p.1645
()/
p.1643
()/
p.1641

(1)(2)的俗字来自《宋元以来俗字谱》;例(3)的俗字来自《敦煌俗字谱》。对例(1)俗字/,《字海》给出的解释是:1.,为俗字;2.[péi]古代传说中的河神名,见《集韵》。对类推简化字/,《字海》给的解释是:/的类推简化字。因/俗字在先,所以把/算作是俗字的类推简化字。

2.6. 从方言字类推出来的简化字

《字海》中收入的字头当中,有些来源于《广州话方言词典》、《四川方言词典》、《简明香港方言词典》、《吴下方言考》。我把据这些字典里的字形加以类推简化的字称为从方言字类推出来的简化字。

关于方言字的问题,我补充介绍一下学界的观点。1999年,中国社会科学院语言研究所组织编写的《现代汉语方言大词典》41卷全部出齐了。在这套大词典分卷简介中,关于方言字字形问题怎么办的问题,编者是这样写的:汉语方言词典采用繁体字。这主要是普通话中已规范简化字字形有限,而各地方言都有一些方言字、俗字和生僻字,这些字大都没有规范的简化字字形,如果采用简化字,势必比照普通话的简化原则来自造简化字,其结果是,字形虽然简化了,但仍可能出现新的不便和麻烦。”(见:www.cass.net.cn,fjbjj.html)
方言字是否简化、如何简化?这个问题还没有解决的时候,《字海》就将一些方言字自行提前简化了。不可思议的是,还把香港方言字也类推简化了。香港在回归之前、之后,一直使用的是没有简化的传统汉字。国家语言文字工作委员会都不能决定香港的文字政策,《字海》有什么资格为香港人作主、给香港人指出文字改革方向呢?

方言字
页码
类推简化字
页码
出处
(1)+
p.965
+
p.954
广州话方言词典
(2)+
p.1073
+()
p.1072
四川方言词典
(3)+
p.1424
+
p.1418

广州方言词典
(4)+
p.1534
+
p.1534
简明香港方言词典
(5)+
p.1544
+
p.1544
简明香港方言词典
(6)/+
p.1583
/+
p.1583
吴下方言考
(7)+
p.1589
+
p.1579
吴下方言考

(1)(3)(4)方言字见于国家标准《图文电视广播用汉字编码字符集香港子集》(GB/T15564-1995)(见《字符集和信息编码国家标准汇编》()。中国标准出版社编。中国标准出版社,1998. p.1555)

2.7. 从计量、元素字类推出的简化字

1977年,国家文字改革委员会和国家标准计量局发布了《关于部分计量单位名称统一用字的通知》。《通知》规定,/是被淘汰了的字。《字海》不但收录了被淘汰的/(p.198),而且还收录了一个类推简化字/(p.125)

旧时表示元素的一些用字,已经早就不使用了。《字海》收了这些字,并且还将它们进行了类推简化,不知全国自然科学名词审定委员会和中国物理学会名词委员会是否答应。比如:

旧字
页码
类推简化字
页码
现用元素字
(1)
p.1524
+
p.1524
锇;镅
(2)+
p.1525
+
p.1525

(3)
p.1527
+
p.1527


2.8. 从朝鲜本《龙龛手镜》类推出来的简化字

把从朝鲜本《龙龛》里面的字类推简化的例子,我出于偶然,撞到了三个。排序按类推简化字页码。关于朝鲜本《龙龛》,我将在后面的朝鲜汉字章节中还要讲到。

朝鲜《龙龛》字
页码
类推简化字
页码
(1) /
p.294
/()+
p.266
(2)/
p.548

/
p.575
(3)/
p.669
/
p.668

(3)/字形在《字海》同页上被两次设为字头;字头倒数第1个(字见朝鲜本《龙龛》)和倒数第6个(字见《正字通》)。

2.9. 类推简化规则不可寻的简化字

《字海》里列出的某些类推简化字,其简化规则超出了《简化字总表》。这里举出几个例子;排序按类推简化字。

繁体
页码
类推简化字
页码
(1)+勞:的异体
p.91
+

p.74