期刊专题

10.13413/j.cnki.jdxblxb.2014.06.25

问答社区问句中多字词表达提取

引用
基于互动问答社区问句中多字词表达和问句理解的关系,提出针对互动问答社区问句进行多字词表达抽取,并基于互动问答社区问句中多字词表达的特点,提出适用于互动问答社区的多字词表达提取方法.该方法在利用互信息和停用词表的方法从问句中抽取候选多字词表达的基础上,将候选多字词表达分为正确串、残缺串、冗余串和错误串4类,借助搜索引擎对查询串的优化和候选多字词表达在互联网上的检索结果,设计候选多字词表达校正方法,实现对多字词表达的提取.以新浪爱问知识人问题库中的问句进行实验,结果表明,多字词表达抽取的准确率、召回率和 F 值分别达到84%,52%和0.64,验证了该方法的有效性.

多字词表达、问句理解、互信息、搜索引擎

TP391.1(计算技术、计算机技术)

国家自然科学基金61171159,61271304;北京市教委科技发展计划重点项目暨北京市自然科学基金 B 类重点项目KZ201311232037

2014-12-12(万方平台首次上网日期,不代表论文的发表时间)

共9页

1230-1238

相关文献
评论
暂无封面信息
查看本期封面目录

吉林大学学报(理学版)

1671-5489

22-1340/O

2014,(6)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn