10.3969/j.issn.1671-1815.2009.17.068
基于XML /Schema甲骨文语料库语料标注的研究
对语料库进行语料标注是实现原始语料信息计算机可读的关键.采用XML+XML Schema对甲骨文语料库进行结构化标注,使不同类型的数据表示成统一的格式,方便数据的交换与共享.给出了一种依据XML文档中使用的词汇集,对词汇集进行建模来约束XML文档中使用的元素和属性及其之间的结构关系和数据类型.根据定义好的XMLSchema使用XML对甲骨文信息进行结构化标注,可以准确地描述数据的结构及数据类型.
语料库、元数据、信息抽取、XML、schema
9
TP311.12(计算技术、计算机技术)
国家自然科学基金60875081
2009-10-27(万方平台首次上网日期,不代表论文的发表时间)
共4页
5185-5188