10.3969/j.issn.1000-0135.2007.02.014
GFL:用于族性化学结构的标引图形形式语言
为了满足日益增长的对专利检索的需求,国家高技术研究发展计划(863计划)启动了族性化学结构数据库系统的研究与开发.族性化学结构数据库系统主要涉及两方面的关键技术:(1)族性化学结构的计算机表达,(2)族性化学结构的检索算法.本文主要讨论族性化学结构的计算机表达.存在于化学专利原始文献中的族性化学结构是用具有一定规范的自然语言表述的.为了能在计算机系统中储存与检索这些信息,自然语言表述的族性化学结构必须转换为计算机可以接受的无歧义的形式语言.这个过程叫做族性化学结构的标引.国际上一般采用的基于结构片断的族性化学结构标引形式语言开发于20世纪70~80年代,这种形式语言与化学家采用的图形自然语言相去甚远,标引速度慢,成本高.本文介绍在ISIS/Draw绘图功能基础上发展起来的标引族性化学结构的图形形式语言,它的主要特点是与化学家日常使用的图形自然语言接近,规则简单易于掌握,从而提高标引效率,降低族性化学结构数据库系统的实现成本.
族性化学结构、马库什结构、标引、图形形式语言、计算机检索
G35(情报学、情报工作)
国家高技术研究发展计划863计划2003AA2Z3603
2007-04-19(万方平台首次上网日期,不代表论文的发表时间)
共7页
253-259