利用标注者一致性数据估计多义词义项区分度

引用

摘要：

多义词义项区分度指的是在实际语料中,人们为多义词选择合适义项的难易程度.本文探讨了一种测量多义词义项区分度的方法,试图量化表示义项区分度.我们认为,这个问题的难点在于多义词词典定义的不确定性:词典在定义多义词时缺乏强一致性的标准,以及不同人对词典定义的理解是不同的.这使得一方面基于词典的研究结果总是受到来自词典定义的挑战,另一方面研究者本身的主观性也多少削弱了研究结果的可靠程度.本文利用标注者一致性作为衡量多义词义项区分度的指标.结果显示,标注者一致性可以有效地表示多义词义项区分度,并且对进一步分析多义词义项的区别特征有指示作用.而且,多义词义项区分度大小与词典定义的清晰程度以及词频高低无关,而与区别特征与义项之间的映射关系有关,这也能够解释词典编纂者与使用者之间的差异.

关键词：多义词义项区分度、标注者一致性、Cohen’s Kappa、词义标注、多义词教学

所属期刊栏目：34

资助基金：本文是华东师范大学2018年度人文社会科学青年跨学科创新研究团队项目“语言演化及其认知心理机制研究”2018ECNU-QKT007

在线出版日期：2020-08-13（万方平台首次上网日期，不代表论文的发表时间）

页数：共10页

页码：392-401

英文信息展示

期刊专题