基于语料库的现代汉语“黄”字义项分布研究The Distribution of Meaning Items of " Huang" in Modern Chinese Based on Corpus
李仕春;
摘要(Abstract):
《现代汉语词典》以往版本中常用词的释义基本依靠语感通过做卡片的方式编纂,每个词占有的语料非常有限,因此多数常用词义项的划分比较粗疏、存在义项漏收的情况。相对于过去靠人工搜集语料,用语料库技术搜集语料的优势在于可以在极短的时间内搜集到几百万字的语料,这在词典学史上具有里程碑式的、划时代的方法论意义。文章运用语料库技术的方法,以个案研究的形式对"黄"字在现代汉语中的义项分布情况进行了描写,认为按照《现代汉语词典》的释义原则,《现代汉语词典》(第6版)中"黄"字的义项漏收了7个!由此可见,把语料库技术和词典编纂结合起来,丰富并补充常用词的义项是一项刻不容缓的工作。
关键词(KeyWords): 语料库;语料;方法;新义项
基金项目(Foundation): 国家社会科学基金重点项目“语料库视野下的现代汉语单音多义词义项分布研究”(14AYY018);; 西南大学中央高校基本业务费专项资金创新团队项目(SWU1609105);西南大学科研基金人才引进项目(SWU1509502)
作者(Author): 李仕春;
Email:
DOI: 10.16497/j.cnki.1672-335x.2016.05.015
参考文献(References):
- [1]张志毅,张庆云.词汇语义学[M].北京:商务印书馆,2005.
- [2]章宜华.与新时期词典学理论和编纂方法的创新[J].辞书研究,2010,(1):57-69.
- [3]李仕春.汉英中型语文词典义项精细度对比研究[J].长江学术,2016,(3):115-121.
- [4]张志毅,长召其.辞书编纂现代化的新理念——人机接口工具使用的智能发挥[A].乐嘉民,亢世勇.辞书编纂现代化研究[C].上海:上海辞书出版社,2009.42.
- (1)根据我们研究,对于常用词来说,要保证所抽取语料在量上的充足性最适宜的条数就是30000条共计160多万字,如果低于这个数字常用词的新义项则不宜发现,如果高于这个数字就会做一些无用功。
- (2)《现代汉语词典(第5版)》(2007),凡例第6页:词类标注说明《现汉》是“区分词与非词的基础上给单字条目、多字条目标注词性的。”本文“黄”字各义项词性的标注采用《现汉》的方法。
- (3)本文全部语料取自北大CCL语料库中的现代汉语语料库。
- (4)我们以《现汉》中“黄”字义项的最低使用频率作为标准,凡是使用频率高于最低使用频率的就定为义项,例如在我们建的"黄"字语料库中,《现汉》第三个义项“指蛋黄等黄颜色的可食用的东西”共8条,使用频率是8÷30000≈0.026%,其使用频率最低,我们新发现的义项“娇嫩”、“年龄小,涉世浅”、“成熟”、“枯萎”、“(人脸)干枯,(年龄)大”等的使用频率都高于0.026%,所以我们把它们就定为义项。虽然“黄”的义项“脓”在我们建的语料库中只有11条语料,但其使用频率约为0.034%,还是高于“黄”字的最低使用频率,所以我们也把它定为义项。
文章评论(Comment):
|
||||||||||||||||||
|