期刊专题

10.3969/j.issn.1008-0821.2015.04.035

词语相似度算法研究综述

引用
词语相似度计算方法在信息检索、词义消歧、机器翻译等自然语言处理领域有着广泛的应用.现有的词语相似度算法主要分为基于统计和基于语义资源两类方法,前者是从大规模的语料中统计与词语共现的上下文信息以计算其相似度,而后者利用人工构建的语义词典或语义网络计算相似度.本文比较分析了两类词语相似度算法,重点介绍了基于Web语料库和基于维基百科的算法,并总结了各自的特点和不足之处.最后提出,在信息技术的影响下,基于维基百科和基于混合技术的词语相似度算法以及关联数据驱动的相似性计算具有潜在的发展趋势.

词语相似度、语义资源、语料库、维基百科、WordNet

35

TP18(自动化基础理论)

2015-05-19(万方平台首次上网日期,不代表论文的发表时间)

共6页

172-177

相关文献
评论
暂无封面信息
查看本期封面目录

现代情报

1008-0821

22-1182/G3

35

2015,35(4)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn