10.3881/j.issn.1000-503X.15386
癌症标志本体构建与应用
目的 构建一种可溯源的癌症标志知识本体,支持基因突变、癌症标志和细胞系等相关数据整合、标准化和关联,并基于该本体实现新知识发现.方法 基于"七步法"和现阶段本体的构建方法,明确癌症标志本体覆盖范围、框架结构、可复用的术语和新增术语;以结直肠癌为例,利用文本挖掘和文本分类技术对PubMed文献中结直肠癌标志相关知识进行提取,利用癌症标志本体对提取的知识进行规范化表达.结合癌症体细胞突变目录中已有的癌症标志证据和进一步语义检索,实现新知识的发现.结果 最终构建癌症标志本体包含类 9910 个,实例 6138 个,实现 2310 篇涉及结直肠癌标志文献摘要和26 个结直肠癌标志相关证据的语义表示.与癌症体细胞突变目录数据集相比,本研究发现与结直肠癌相关的多个基因的癌症标志的新证据.结论 本研究有助于整合癌症分子层面的致病机制,了解基因突变在癌症发生过程中的具体作用,实现癌症标志知识的快速发现.
结直肠癌、本体、癌症标志
45
R735.3;Q756(肿瘤学)
中国医学科学院医学与健康科技创新工程重大协同创新项目;中国医学科学院医学与健康科技创新工程重大协同创新项目;国家社会科学基金
2023-09-08(万方平台首次上网日期,不代表论文的发表时间)
共9页
618-626