原文服务方: 计算机应用研究       
摘要:
互联网中存在大量的短文本信息流,需要对其进行会话抽取,将相同主题的内容合并到同一会话中。会话中的内容、时间和用户关系都会对会话抽取的性能产生影响,针对该问题提出了一种基于多策略的会话抽取算法。首先,基于内容、时间和用户关系进行会话分割得到会话片段;然后,利用词向量计算内容语义相似度,并结合时间信息计算会话片段间的相关度,对其进行聚类,实现会话抽取。在三个来源于真实聊天记录的数据集上进行实验的结果表明,本方法优于传统方法,综合F值分别提高了38.5%、15.7%和26.8%。
推荐文章
基于短文本信息流的热点话题检测
短文本
信息流
热点话题
决策树
Top-k相似短文本快速抽取算法
语义相似
top-k
排序融合
短文本信息流中的用户建模与应用
用户建模
用户向量
Skip-gram模型
用户标签推荐
用户聚类
基于短文本及情感分析的微博舆情分析
微博
热点事件
短文本聚类
情感分析
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于多策略的短文本信息流会话抽取
来源期刊 计算机应用研究 学科
关键词 会话抽取 短文本 短文本信息流 词向量 聊天记录
年,卷(期) 2016,(4) 所属期刊栏目 算法研究探讨
研究方向 页码范围 997-1002
页数 6页 分类号 TP391.1
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2016.04.008
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 席耀一 解放军信息工程大学信息系统工程学院 14 100 6.0 9.0
2 王波 解放军信息工程大学信息系统工程学院 19 157 7.0 12.0
3 李天彩 解放军信息工程大学信息系统工程学院 6 58 4.0 6.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (30)
共引文献  (20)
参考文献  (9)
节点文献
引证文献  (2)
同被引文献  (7)
二级引证文献  (3)
1986(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(5)
  • 参考文献(0)
  • 二级参考文献(5)
2005(4)
  • 参考文献(0)
  • 二级参考文献(4)
2006(6)
  • 参考文献(0)
  • 二级参考文献(6)
2007(2)
  • 参考文献(1)
  • 二级参考文献(1)
2008(4)
  • 参考文献(1)
  • 二级参考文献(3)
2010(4)
  • 参考文献(1)
  • 二级参考文献(3)
2011(3)
  • 参考文献(1)
  • 二级参考文献(2)
2012(3)
  • 参考文献(2)
  • 二级参考文献(1)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
会话抽取
短文本
短文本信息流
词向量
聊天记录
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导