面向数字资源的自动标签模型
针对数字资源标签数量不足,获取困难的问题,提出了一种新的自动标签方法,对于收集的公共文化资源数据集和其它公开数据集,能够有效的进行标签扩展.提出过程依据神经网络理论和生成学习理论,采用隐含狄利克雷分布(latent dirichlet allocation,LDA)和Word2Vec方法分别对资源和初始标签进行处理,生成资源和初始标签的表示向量,然后以此两种向量作为深度结构语义模型的输入,建立面向数字资源的自动标签模型.从结果来看,该方法的标签扩展效果在精确度、平均排序倒数、平均准确率等指标上表现上总体优于文中提到的其它对比方法,能够解决某些情况下资源标签不足的问题,提高资源的利用率.
标签扩展、隐含狄利克雷分布、Word2Vec
25
TP181(自动化基础理论)
国家科技支撑计划2015BAK25B00
2020-09-04(万方平台首次上网日期,不代表论文的发表时间)
共7页
144-150