10.3321/j.issn:1671-5489.2009.06.026
基于距离最大熵值的蛋白质结构域边界检测系统
首次将蛋白质结构域边界检测问题归结为非平衡数据学习问题, 提出一种新的欠采样方法, 即在支持向量机特征空间中对与正类样本具有距离最大熵值的负类样本进行采样. 以经过筛选的蛋白质结构域数据库作为实验数据, 支持向量机学习系统的平均预测准确率可达80%, 同时具有较高的敏感性和特异性.
蛋白质结构域边界、支持向量机、非平衡数据学习、基于距离的最大熵
47
TP391.4(计算技术、计算机技术)
国家自然科学基金60873146,60703025,60973092;高等学校博士学科点专项科研基金20070183055
2010-01-18(万方平台首次上网日期,不代表论文的发表时间)
共4页
1237-1240