10.3321/j.issn:1002-0470.2005.01.001
基于矢量空间模型和最大熵模型的词义问题解决策略
针对单义词的词义问题构建了融合触发对(trigger pair)的矢量空间模型用来进行词义相似度的计算,并以此为基础进行了词语的聚类;针对多义词的词义问题应用融合远距离上下文信息的最大熵模型进行了有导词义消歧的研究.为克服以往词义消歧评测中通过人工构造带有词义标记的测试例句而带来的覆盖程度小、主观影响大等问题,将模型的评测直接放到了词语聚类和分词歧义这两个实际的应用中.分词歧义的消解正确率达到了92%,词语聚类的结果满足进一步应用的需要.
矢量空间模型、最大熵模型、触发对、词语聚类、词义消歧
15
TP3;TN9
国家自然科学基金60175020;国家高技术研究发展计划863计划2002AA117010-09
2005-03-31(万方平台首次上网日期,不代表论文的发表时间)
共6页
1-6