利用语义词典Web挖掘语言模型的无指导译文消歧
为了解决困扰词义及译文消歧的数据稀疏及知识获取问题,提出-种基于wleb利用n-gram统计语言模型进行消歧的方法.在提出词汇语义与其n-gram语言模型存在对应关系假设的基础上,首先利用Hownet建立中丈歧义词的英文译文与知网DEF的对应关系并得到该DEF下的词汇集合,然后通过搜索引擎在Web上搜索,并以此计算不同DEF中词汇n-gram出现的概率,然后进行消歧决策,在国际语义评测SemEval-2007中的Multilingual Chinese English Lexieal Sample Task测试集上的测试表明,该方法的Rmar值为55.9%,比其上该任务参评最好的无指导系统性能高出12.8%.
词义消歧、无指导译文消歧、语言模型、Web挖掘、知识获取
20
TP39L(计算技术、计算机技术)
Supposed by the National Natural Science Foundation of China under Grant No.60435020国家自然科学基金:the National High-Tech Research and Development Plan of China under Grant Nos.2006AA012150,2006AA010108国家高技术研究发展计划863
2009-06-09(万方平台首次上网日期,不代表论文的发表时间)
共9页
1292-1300