10.16353/j.cnki.1000-7490.2023.04.012
学术文献中的知识单元抽取及其分布特征识别研究
[目的/意义]图书情报领域的知识计量研究长期停留在知识载体计量层面,难以深入挖掘细粒度的知识属性特征.文章试图从学术文献的文本片段层面开展知识单元粒度的知识计量研究.[方法/过程]首先,提出基于"人工标注—规则归纳—机器识别—规则补充"流程的知识单元抽取方法;其次,通过该方法构建知识描述规则库,并抽取知识单元;最后,对知识单元的主题、结构等属性信息进行数理统计分析,得到知识单元在这些属性上的分布特征.[结果/结论]基于"人工标注—规则归纳—机器识别—规则补充"流程构建的知识描述规则库收敛性较好,可以较为准确地从学术文献中提取知识单元文本片段.在此基础上进行的知识单元分布特征分析,能够较为准确地揭示文献知识单元在主题、结构上的分布特征,真正将知识计量的粒度从知识载体缩小至知识单元.
知识单元、知识抽取、知识计量、知识分布、学术评价、自然语言处理
46
TP391.41;P641;TH16
河南省哲学社会科学规划项目;中央高校基本科研业务费资助创新资助项目;中央高校基本科研业务费项目
2023-05-04(万方平台首次上网日期,不代表论文的发表时间)
共9页
90-98