基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对微博文本高维、稀疏的特点,比较基于同义词词林等外部知识库的文本扩展策略,利用Word2vec训练微博语料,并构建微博上下文相关词词表,通过种子词表和微博标签信息去扩展微博文本流中的关键词,最后提出了提取微博文本关键词及区分词向量中相似词和相关词的方法.实验结果证明,微博短文本经过Word2vec词向量相关词及微博标签扩展后,其聚类效果有了明显提高.
推荐文章
基于文本聚类与兴趣衰减的微博用户兴趣挖掘方法
微博
single-pass聚类
LDA模型
用户兴趣挖掘
兴趣衰减
基于SOM聚类的微博话题发现
话题发现
词向量模型
文本相似度
短文本
SOM聚类
聚类算法在高校学生微博的应用研究
聚类算法
热门话题
微博
高校
文本
算法改进
基于稀疏特征的中文微博短文本聚类方法研究
微博
短文本
聚类
LDA
文本表示
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 微博文本聚类中特征扩展策略研究
来源期刊 计算机工程与应用 学科 工学
关键词 微博文本 高维稀疏 关键词提取 相似词 相关词 特征扩展 聚类
年,卷(期) 2017,(13) 所属期刊栏目 大数据与云计算
研究方向 页码范围 90-94,195
页数 6页 分类号 TP301
字数 6219字 语种 中文
DOI 10.3778/j.issn.1002-8331.1606-0438
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张仰森 北京信息科技大学智能信息处理研究所 104 721 15.0 23.0
2 段旭磊 北京信息科技大学智能信息处理研究所 5 25 3.0 5.0
3 郭正斌 北京信息科技大学智能信息处理研究所 3 21 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (44)
共引文献  (170)
参考文献  (10)
节点文献
引证文献  (3)
同被引文献  (10)
二级引证文献  (4)
1973(1)
  • 参考文献(0)
  • 二级参考文献(1)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1979(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(5)
  • 参考文献(0)
  • 二级参考文献(5)
2007(5)
  • 参考文献(0)
  • 二级参考文献(5)
2008(5)
  • 参考文献(1)
  • 二级参考文献(4)
2009(6)
  • 参考文献(0)
  • 二级参考文献(6)
2010(5)
  • 参考文献(0)
  • 二级参考文献(5)
2011(5)
  • 参考文献(1)
  • 二级参考文献(4)
2012(5)
  • 参考文献(2)
  • 二级参考文献(3)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(2)
  • 参考文献(1)
  • 二级参考文献(1)
2015(2)
  • 参考文献(2)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(3)
  • 引证文献(2)
  • 二级引证文献(1)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
2020(3)
  • 引证文献(1)
  • 二级引证文献(2)
研究主题发展历程
节点文献
微博文本
高维稀疏
关键词提取
相似词
相关词
特征扩展
聚类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导