期刊专题

10.3969/j.issn.1002-137X.2012.07.033

通过评估示例中概念的重要性来解决多示例学习问题

引用
在多示例学习问题中,训练数据集里面的每一个带标记的样本都是由多个示例组成的包,其最终目的是利用这一数据集去训练一个分类器,使得可以利用该分类器去预测还没有被标记的包.在以往的关于多示例学习问题的研究中,有的是通过修改现有的单示例学习算法来迎合多示例的需要,有的则是通过提出新的方法来挖掘示例与包之间的关系并利用挖掘的结果来解决问题.以改变包的表现形式为出发点,提出了一个解决多示例学习问题的算法——概念评估算法.该算法首先利用聚类算法将所有示例聚成d簇,每一个簇可以看作是包含在示例中的概念;然后利用原本用于文本检索的TF-IDF(Term Frequency-Inverse Document Frequency)算法来评估出每一个概念在每个包中的重要性;最后将包表示成一个d维向量——概念评估向量,其第i个位置表示第i个簇所代表的概念在某个包中的重要程度.经重新表示后,原有的多示例数据集已不再是“多示例”,以至于一些现有的单示例学习算法能够用来高效地解决多示例学习问题.

多示例学习、重新表示、单示例学习、概念评估

39

TP181(自动化基础理论)

2012-12-05(万方平台首次上网日期,不代表论文的发表时间)

共4页

144-147

暂无封面信息
查看本期封面目录

计算机科学

1002-137X

50-1075/TP

39

2012,39(7)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn