Discuz!NT
欢迎 游客 , 注册 | 登录 | 界面 | 简洁版本 | 在线 | 帮助
分栏模式|网站首页|语言学网文

本主题被查看1794次, 共5个帖子, 1页, 当前为第1页     选择页数: 1      跳转到第   上一主题   下一主题
标题: 统计方法在训诂学中的运用
时世平
 

来自:
状态: 离线
shpchy@sina.com shpchy@sina.com
只看楼主 2004-06-04 15:13
统计方法在训诂学中的运用
训诂学是一门传统的解释词语和研究语义的学科。凡称为学,必有学术上的方法。历代训诂
学者在训诂实践中使用过各种方法。除形训、声训、义训等传统公认的三大方法外,不少学
者专家还提到诸如据文证义 、比较互证法 等方法。但在训诂实践中,还有许多普遍使用并
行之有效的训诂方法,值得加以研究和总结。胡朴安先生指出:“训诂学方法之新趋势,惟
有甲骨今文之考证,与统计学的推测二法而已”  。并且自己实践性的统计了《论语》中
“仁”字出现的概率及其意义。
统计学是本世纪初才发展起来的一门新兴学科。统计学(statistics)来自state+
istics,指的是收集对国家极端重要的人口和经济信息。迄今为止统计方法已经发展成为在
自然科学、人文科学和社会科学广泛应用的科学分析方法。在自然科学领域,使用统计方法
进行定量分析早已屡见不鲜。随着各种学科横向交叉的兴起和繁荣,统计方法也被引进到语
言学中,从而打破了语言学千百年来应用人文科学方法进行研究的稳固阵地,开始向其它学
科汲取营养,丰富自己。描写语言学、应用语言学、实验心理语言学、社会语言学、计算语
言学等无不应用到统计方法。就是在传统的语言文字研究领域,其重要作用也是不可取代
的。单就训诂学而言,其要旨可简括为“找证据”。单文孤证,为训诂家所不取,广征博
引,文多而证广,才能得出切实可靠的结论,这种广泛搜集材料以为证据,已略含有统计之
意义。从现在训诂实践看,统计方法越来越发挥着不可取代的重要作用。特别是计算机的出
现,方便了对语言材料的统计分析,有时甚至于可以进行接近于穷尽性的统计。近些年来 ,
应用统计方法阐明问题的例子随处可见,也确实解决了不少疑难问题。
训诂学上的统计方法,就是对某种特定范围内的语言材料或语言现象进行全面考察,通过确
定的数据来描述考察结果,并由此推导出相应的结论。这就决定了训诂学上统计方法主要有
两种:一是归纳统计方法,也叫描写统计方法。就是对研究对象在特定范围内进行统计、分
类,直观地展示出研究对象各种性质的方法,或是在各种条件(环境、性质、特征等)下的
分布规律。二是推断统计方法,就是在全部语言材料中抽取一部分具有典型意义的样品进行
统计分析,由部分语言材料的性质推知语言的一般性质,再用已知的语言的一般性质去指导
具体语言材料或语言现象的研究。但是需要提出的是,使用描写统计方法不一定要使用推断
统计方法,但使用推断统计方法要首先使用描写统计方法。
统计方法只所以能在语言研究中成立,是因为语言的社会性和概率论。语言是人类重要的交
际工具,组成语言系统的各种符号,都是约定俗成的。因此,作为训释对象的词语,在同一
语言系统中必然存在若干同一用法、同一意义的用例。如果找不出这种相同的用例,词义理
解可能不正确,如果能“揆之本文而协,验之他卷而通”,则证明结论是正确的。
例如郭锡良《古代汉语》(天津教育出版社)文选部分《左传·郑伯克段於鄢》“庄公寤
生,惊姜氏,故名曰寤生,遂恶之”。郭本对“寤”解释:通“牾”,逆,倒着。《古汉语
常用字字典》 解释3:逆,不顺,并引用此句。这两种解释一种承认“寤”是通假字,一种
认为“寤”本就有“逆,不顺”之义项。到底哪个解释对呢?笔者困惑于这个问题,便用统
计方法结合其他训诂方法来解决。
“寤生”一词,晋杜预释为“寤寐而庄公已生,故惊而恶之”,一直到明末清初,“寤生”
一直被理解为“睡着生”。这个解释不符合现实逻辑,孩子顺利生产,母亲没有受罪,没有
理由“惊而恶之”。《诗经·生民》歌颂后稷的吉兆和优秀品质,首先就是“先生如达”,
即所谓“达生”。与之相反,就是不达不顺,即“逆生”。尤其在那个生产力和科学技术低
下的时代,“逆生”才有可能受到母亲的厌恶。所以“寤”不应该理解为寤寐之“寤”。
“寤”《说文》“寐觉而有言曰寤”,没有“逆,不顺”义项。《王力古汉语字典》“寤,
睡醒”,没有“逆,不顺”义项。笔者借助于计算机检索,统计了《国语》《战国策》《尚
书》《孟子》《论语》《礼记》《易经》《仪礼》《孝经》等古籍经典,“寤”字均未出
现。只有《诗经》“寤”出现15次,统计如下:(注:句末数字为出现频率)
《关雎》寤寐2;《柏舟》寤辟有摽;《终风且暴》寤言不寐2;《考盘》独寐寤言、独寐寤
歌、独寐寤宿;《泽陂》寤寐无为3;《下泉》忾我寤叹3;《大东》契契寤叹,都是“睡
醒”之义,而无“逆,不顺”义。根据语言的社会性,我们可以断定“寤”没有“逆,不
顺”义项,由此断定《古汉语常用字字典》解释3:“逆,不顺”的释义是错误的。我们可
以得出结论:“寤”应是通假,表示“逆生”之意。
郭本之注释:“通‘牾’,逆,倒着”,笔者认为郭本释义是正确的。但是通“牾”之说不
妥。查《说文》,没有“牾、忤、迕、逜”字,只有“啎”字。《说文》“啎,逆也。”
《王力古汉语字典》“牾:①啎的误字②通“逆、遇见”分析到此,我们得出结论:“寤
生”之“寤”是“啎” 的通假字,郭氏之通“牾”说是错误的,错误的原因是“啎”与
“牾”字形非常接近,因而形讹。
随着近些年来计算机的应用 ,全面统计由于数据准确、全面而越来越受到重视。但语言事实
毕竟太过庞杂,要对全部的语言材料进行统计在实践中是不现实的,因为语言材料越多,越
费人力物力,并且冗余度太大,不够经济,即使是借助于最先进的统计仪器设备。所以抽样
统计就成为广泛采用的方法,因此目前所见任何形式的统计都是在部分语言材料中利用样本
抽样进行的。所谓样本 ,就是由总体的部分个体组成的集合。样本中所含个体的个数叫做样
本容量。根据样本的分析对总体的特性进行估计和推断 ,这就是抽样统计。
一般说来,为了估计和推断的正确性,样本必须尽可能反映总体的特性,即必须是具有代表
性的。为此,抽取样本应尽量保证总体中的每个个体被抽到的机会是均等的。就样本来讲,
容量越大,所得结论可信度越高。但这就产生了一个现实问题,样本容量多大才算合理?这
个问题很复杂,所以在采用统计方法时,应慎重考虑,力求将样本限定在合适的范围内。例
如:
郭锡良《古代汉语》常识部分讲到程度副词时,提到“程度副词‘颇’在古代有两种意思,
一是程度偏高,略近‘很,甚’”,郭本举例如下:“唯袁盎明绛侯无罪,绛侯得释,盎颇
有力”(《史记·袁盎晁错列传》)。一是表示种度低,“稍、略”,一般说来,在古代多
此种用法。
程度副词“颇”始见于《史记》。它来源于形容词“颇”。但是一种语言形式,在产生之初
就表示截然相反的两种语义,是不可能的。因此可以对“颇”字进行统计研究。纵见历来对
于“颇”字之解释,“颇”字存在的问题是其具有“程度偏高”这个意义,要是有,何时
有?这里我们借鉴洪成玉教授对于此字的考释成果。
首先对《史记》中“颇”进行完全统计:共166例(其中人名90例, 形容词“偏颇”义3
例,程度副词73例)。根据我们的研究问题,其中73例程度副词“颇”就成了我们的样本。
    其次为了验证“颇”是否只表示程度浅这种语义,我们从73例用法中抽样选取被大多著
作认为表程度深的两例作为我们的分析对象。一例是“唯袁盎明绛侯无罪,绛侯得释,盎颇
有力” ;一例是“其后漕稍多,而渠下之民颇得以溉田矣” 。通过这样抽取样本,保证了
样本数量精而少,只要分辨清楚这两个用例,就可以初步确定结论。借助于史料记载,利用
“据文证义”方法分析这两例中的“颇”,得出结论是:“颇”实际在两例中仍然表示“程
度浅”的用法。
为了增加结论的可信性,我们随机抽取同时代的其它作品作为共时性样本。①《论衡》中
“颇”共24例,全部用作副词,“颇”的语义仍然是偏或稍,或表示有保留、有分寸地肯定
或否定。②许慎笔下的“颇”也是偏或稍的意思。③《汉书》作者班固在行文时所用副词
“颇”都是表示偏或少的意思。
为了对这个结论进行辅证,我们可以再抽取历时性样本。①最早给“颇”作解释的《广雅·
释诂》:“颇,少也。” ②唐人注释中关于“颇”的副词用法以及注释共有7处,都是注解
为“颇,少也。” 同时隋唐以至宋代的字书、韵书,如《玉篇》《广韵》《集韵》《类
篇》等,虽都收有“颇”字,但不见有释“颇”为“甚”的。③《六臣注文选》有“颇”注
释的文章,最晚的是任彦升的《天监三年策秀才文》。任彦升生于公元460年,卒于公元508
年,是南北朝时期人。由此,至少在南北朝时期“颇”用作副词时,语义是“少”;同时可
以推证,在隋唐时期,副词“颇”是表示程度浅的意思。统计至此,我们可以得出:至少在
唐代以前,“颇”只表示程度浅一种语义。
这样,通过不断的不重复抽样,同时根据训诂实践的需要,分层抽样,多方取样,借助于不
同的样本,最终达到训诂的目的,“精而少”的解决我们所面临的训诂难题。
以上例子说明,统计方法对于挖掘语言事实,把握语言规律有很重要的意义。它在一定程度
上避免了语言事实的模糊性、片面性和主观性,而以它的准确性、客观性享誉研究领域。但
统计方法并不是完美无缺了。史有为先生说 :“语言是柔性的……面对柔性的语言 ,每一种
方法都不能包打天下,每一种分析都只具有相对的性质。都只是暂时的安置,都只能反映近
似的部分性质。”统计方法也是一样 ,它虽然有着其它方法无法企及的优点,但由于自身的
局限,也有着不可掩盖的缺点,并不能“放之四海而皆准”,使用者在采用这种方法之前 ,
应根据具体情况 ,三思而后行。
#1  
boshousheng
 

来自:
状态: 离线
boshousheng2009@yahoo.com.cn boshousheng2009@yahoo.com.cn
2004-06-11 20:45
上帖平实而有导向性(帖子内空)
内空
#2  
sublexical
 

来自:
状态: 离线
sublexical@hotmail.com sublexical@hotmail.com
2004-06-26 23:55
这样的方法应该不是统计
这样的方法连最基本的描述统计都不是,至多还只是比较大规模的检索而已。
#3  
boshousheng
 

来自:
状态: 离线
boshousheng2009@yahoo.com.cn boshousheng2009@yahoo.com.cn
2004-07-02 01:32
关于其他朋友的说法,关于统计
    有朋友跟我说上帖平庸没有新意,包括例子都是常见的了.
    有朋友跟我说,上帖不是统计.


    其实我们经常把这种做法叫"穷尽式统计",最简单的做法.但是对一些传统学科来说,这
种最简单的做法就很不错了.
    这种穷尽式的"检索",得到一个数字,我们可以看作是静态统计(起点终点两点式).其他
的高深的我们可以说是动态统计.
#4  
本主题被查看1794次, 共5个帖子, 1页, 当前为第1页     选择页数: 1      跳转到第







现在的时间是 2009-01-10 08:22:00
沪ICP备010383

版权所有 东方语言学网Eastling.Org  
         Powered by Discuz!NT 1.0.2656    Copyright © 2001-2009 Comsenz Inc.
Processed in 0.064 seconds