基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
面向社交媒体的事件聚类旨在根据事件特征实现短文本聚类.目前,事件聚类模型主要分为无监督模型和有监督模型.无监督模型聚类效果较差,有监督聚类模型依赖大量标注数据.基于此,该文提出了一种半监督事件聚类模型(SemiEC),该模型在小规模标注数据的基础上,利用LSTM表征事件,并基于线性模型计算文本相似度,进行增量聚类.然后,利用增量聚类产生的标注数据对模型再训练,结束后对不确定样本再聚类.实验表明,SemiEC的性能相比基准模型有较大提升.
推荐文章
基于半监督学习的应用流分类方法
流量分类
半监督学习
特征选择
基于隐马尔可夫模型的中文文本事件信息抽取
隐马尔可夫模型
事件信息抽取
触发词
事件要素
基于半监督学习的K-均值聚类算法研究
半监督聚类
改进的K-均值算法
动态管理种群的粒子群算法
基于半监督学习方法的磨煤机故障预警
磨煤机
DBSCAN聚类
故障预警
随机森林
半监督学习方法
预测
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于半监督学习的中文社交文本事件聚类方法
来源期刊 中文信息学报 学科 工学
关键词 社交媒体事件聚类 增量聚类 文本相似度
年,卷(期) 2022,(2) 所属期刊栏目 情感分析与社会计算|Sentiment Analysis and Social Computing
研究方向 页码范围 152-159
页数 8页 分类号 TP391
字数 语种 中文
DOI 10.3969/j.issn.1003-0077.2022.02.017
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
社交媒体事件聚类
增量聚类
文本相似度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息学报
月刊
1003-0077
11-2325/N
16开
北京海淀区中关村南四街4号
1986
chi
出版文献量(篇)
2723
总下载数(次)
5
总被引数(次)
45413
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导