基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
围绕基于用户点击数据的文本聚类展开研究.利用点击数据将查询文本表征为图像点击特征图,并在此上训练深度点击模型.为了应对文本噪声,引入可刻画文本可靠性的权重,提出基于弱监督深度学习的文本聚类算法来迭代更新文本权重和深度模型.将该算法应用于基于点击特征的图像识别中,通过合并相似文本,为图像构建紧凑的文本集点击特征向量,实现高效的图像识别.在Clickture-Dog和Clickture-Bird两个公开点击数据集上进行验证,结果表明:用图像点击特征图来表征查询文本可有效解决原始点击特征向量的稀疏和不连续性,帮助获得优秀识别率;弱监督深度聚类模型不仅帮助学习强大的文本表征,还能有效选择高质量文本数据训练模型,进一步提高性能.
推荐文章
基于主动学习策略的半监督聚类算法研究
K-均值算法
主动学习策略
半监督学习
聚类
基于词条属性聚类的文本特征选择算法
文本特征选择
词条属性
词位置
词间关联性
关联规则算法
K-均值算法
基于文本挖掘的聚类算法研究
文本挖掘
K-means
K-medoids
准确率
召回率
基于文本挖掘的聚类算法研究
文本挖掘
K-means
K-medoids
准确率
召回率
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于弱监督深度学习的文本聚类算法及应用
来源期刊 计算机应用与软件 学科 工学
关键词 图像识别 深度聚类 用户点击数据 查询合并 弱监督学习
年,卷(期) 2019,(4) 所属期刊栏目 人工智能与识别
研究方向 页码范围 171-177
页数 7页 分类号 TP3
字数 6875字 语种 中文
DOI 10.3969/j.issn.1000-386x.2019.04.027
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 谭敏 杭州电子科技大学计算机学院 4 1 1.0 1.0
2 张宏源 杭州电子科技大学计算机学院 1 1 1.0 1.0
3 张海超 杭州电子科技大学计算机学院 2 5 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (1)
同被引文献  (13)
二级引证文献  (0)
1993(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
图像识别
深度聚类
用户点击数据
查询合并
弱监督学习
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用与软件
月刊
1000-386X
31-1260/TP
大16开
上海市愚园路546号
4-379
1984
chi
出版文献量(篇)
16532
总下载数(次)
47
总被引数(次)
101489
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导