10.11925/infotech.2096-3467.2017.0442
基于条件随机场的法言法语实体自动识别模型研究
[目的]法言法语实体的自动识别是实现裁判文书文本挖掘的重要的基础性工作.[方法]采用爬虫方法获取数据,人工方式进行语料标注,利用NLPIR加载法律领域词典对语料进行分词,结合法言法语的内部和外部特征构建基于条件随机场的特征模板,自动识别语料中的法言法语.[结果]融入法言法语内部和外部特征的条件随机场模型,自动识别法言法语的实验效果良好,模型的调和平均值达到90%以上.[局限]法言法语实体自动识别模型在领域的扩展上有一定的局限性.[结论]基于条件随机场对法言法语实体实现自动抽取是可行的.
裁判文书、条件随机场模型、法言法语实体
G350(情报学、情报工作)
国家社会科学基金项目“转型期公众道德需求的司法应对研究”项目13BFX006的研究成果之一
2017-12-18(万方平台首次上网日期,不代表论文的发表时间)
共7页
46-52