利用标注者一致性数据估计多义词义项区分度
多义词义项区分度指的是在实际语料中,人们为多义词选择合适义项的难易程度.本文探讨了一种测量多义词义项区分度的方法,试图量化表示义项区分度.我们认为,这个问题的难点在于多义词词典定义的不确定性:词典在定义多义词时缺乏强一致性的标准,以及不同人对词典定义的理解是不同的.这使得一方面基于词典的研究结果总是受到来自词典定义的挑战,另一方面研究者本身的主观性也多少削弱了研究结果的可靠程度.本文利用标注者一致性作为衡量多义词义项区分度的指标.结果 显示,标注者一致性可以有效地表示多义词义项区分度,并且对进一步分析多义词义项的区别特征有指示作用.而且,多义词义项区分度大小与词典定义的清晰程度以及词频高低无关,而与区别特征与义项之间的映射关系有关,这也能够解释词典编纂者与使用者之间的差异.
多义词义项区分度、标注者一致性、Cohen’s Kappa、词义标注、多义词教学
34
本文是华东师范大学2018年度人文社会科学青年跨学科创新研究团队项目“语言演化及其认知心理机制研究”2018ECNU-QKT007
2020-08-13(万方平台首次上网日期,不代表论文的发表时间)
共10页
392-401