期刊专题

10.3969/j.issn.1002-137X.2011.09.034

一种基于稀疏编码的语义标注方法

引用
语义标注是实现语义网的一个重要研究内容,目前已有很多标注方法取得了不错的效果.但这些方法几乎都没有注意到本体所描述的知识往往稀疏地分布在文档中,也未能有效地利用文档的组织结构信息,使得这些方法对质量较差的文档的标注不理想.为此提出了一种基于稀疏编码的本体语义自动标注方法(Semantic Annotation Method based on Sparse Coding,SAMSC),该方法先按本体知识描述从文档中识别出一定的语义作为初始值,再通过迭代解析文档段落结构和描述主题,完成本体知识与文档资源的相关系数矩阵计算,最后在全局文档空间中通过最小化损失函数来实现用本体对文档的语义标注.实验表明,该方法能有效地对互联网中大量良莠不齐的文档进行自动语义标注,对质量差的文档资源能取得让人接受的结果.

本体、语义标注、段落结构、SAMSC

38

TP301(计算技术、计算机技术)

福建农业科技重大项目2010N5008;福建省自然科学基金A0810013

2012-01-14(万方平台首次上网日期,不代表论文的发表时间)

共6页

150-154,181

暂无封面信息
查看本期封面目录

计算机科学

1002-137X

50-1075/TP

38

2011,38(9)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn