基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对目前短文本词汇量少、表达形式多样,导致同种类文本聚类方法无效的问题,提出一种利用中文维基百科的丰富词汇间关系对短文本的隐喻词进行扩充的方法,以解决短文本包含信息少、词汇表达形式多样的不足.实验结果表明,该算法可有效提升短文本的聚类效果.
推荐文章
基于LSTM自动编码机的短文本聚类方法
自然语言处理
短文本
聚类
长短期记忆网络
自动编码机
基于特征词向量的短文本聚类算法
短文本
特征词
词向量
相似度计算
聚类
基于自身特征扩展的短文本分类方法
短文本
稀疏
信号弱
扩展
离散度
相关度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于隐喻词扩展的短文本聚类算法
来源期刊 吉林大学学报(理学版) 学科 工学
关键词 文本聚类 短文本 维基百科 文本扩展
年,卷(期) 2018,(6) 所属期刊栏目 计算机科学
研究方向 页码范围 1447-1452
页数 6页 分类号 TP393
字数 4368字 语种 中文
DOI 10.13413/j.cnki.jdxblxb.2018.06.27
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 左万利 吉林大学计算机科学与技术学院符号计算与知识工程教育部重点实验室 88 1273 20.0 31.0
2 王英 吉林大学计算机科学与技术学院符号计算与知识工程教育部重点实验室 99 713 15.0 23.0
3 王烨 吉林大学计算机科学与技术学院符号计算与知识工程教育部重点实验室 5 40 3.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (41)
共引文献  (35)
参考文献  (11)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(8)
  • 参考文献(0)
  • 二级参考文献(8)
2010(4)
  • 参考文献(1)
  • 二级参考文献(3)
2011(10)
  • 参考文献(1)
  • 二级参考文献(9)
2012(4)
  • 参考文献(0)
  • 二级参考文献(4)
2013(9)
  • 参考文献(2)
  • 二级参考文献(7)
2014(6)
  • 参考文献(4)
  • 二级参考文献(2)
2015(2)
  • 参考文献(1)
  • 二级参考文献(1)
2016(2)
  • 参考文献(1)
  • 二级参考文献(1)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文本聚类
短文本
维基百科
文本扩展
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
吉林大学学报(理学版)
双月刊
1671-5489
22-1340/O
大16开
长春市南湖大路5372号
12-19
1955
chi
出版文献量(篇)
4812
总下载数(次)
6
总被引数(次)
24333
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导