基于容错Earley解析算法的领域语义文法自动学习方法
精细化的领域文本分析是高质量领域知识获取的重要前提,它通常依赖于大量某种形式的语义文法产生式,但总结这些文法通常耗时耗力.对此,文中提出了 一种基于容错Earley解析算法的语义文法自动学习方法,根据种子文法自动生成新的语义文法(包括词类和文法产生式),以减少人工成本.该方法利用优化后的容错Earley解析器,对输入的语句进行容错解析,然后根据容错解析生成的解析树产生候选语义文法,最后对候选语义文法进行过滤或纠正得到最终的语义文法.在5种不同疾病的中医医案的实验中,该方法的词类学习的正确率达到63.88%,文法产生式学习的正确率达到81.78%.
容错Earley解析;语义文法;文法学习;过滤算法;语义纠正
48
TP391(计算技术、计算机技术)
科技部重点研发计划课题;北京市科技新星计划交叉学科合作课题;国家重点研发计划重点专项;国家自然科学基金
2021-12-08(万方平台首次上网日期,不代表论文的发表时间)
共11页
276-286