ReDE:一个基于正则表达式的生物数据抽取方法
从异构生物数据源抽取数据,建立查询分析平台是目前研究的热点,而抽取过程会涉及大量相互依赖的元数据,充分利用这种依赖关系可降低维护工作量.基于正则表达式(RE)提出了ReDE抽取方法:通过围绕RE组建立分析树,设计了基于RE的关系数据库模式生成算法和通用抽取与组装算法,其特点是:RE是惟一的元数据,易于管理和维护.该方法奠定了生物数据库辅助设计工具和高自动化抽取工具的基础,已用于构建国内第1个整合的生物信息在线数据仓库.
生物数据源、数据抽取、元数据、正则表达式、抽取算法
42
TP311.13(计算技术、计算机技术)
新材料领域项目2002AA231011;上海市重大科技项目02DJ14013
2006-01-12(万方平台首次上网日期,不代表论文的发表时间)
共8页
2184-2191