基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
文本数据流中概念的频繁漂移导致有效信息不足,从而使得漂移检测和数据流分类准确率下降.针对该问题,引入潜在狄利克雷分布模型并考虑文本数据流隐含的语义信息,提出一种新的概念漂移检测算法.计算相邻模块中词和主题特征空间的语义相似度,其中主题的相似度根据主题-单词概率分布进行评估,当2个特征空间相似度都较低时判断为发生概念漂移.实验结果表明,与DDM、CDRDT、DWCDS、HDDM-W-Test和REDLLA算法相比,该算法对文本数据流中概念漂移的检测性能均有所提升,尤其在概念频繁漂移时可以显著减少漏检数量.
推荐文章
数据流中概念漂移检测的集成分类器设计
数据挖掘
数据流
概念漂移
基于相对熵的数据流概念漂移检测算法
数据流
概念漂移
相对熵
决策树
一种基于随机空间树的数据流异常检测算法
数据流
异常检测
随机空间树
单窗口策略
AUC得分
运行时间
基于距离的数据流在线检测算法研究
数据流
滑动窗口
k-距离
异常检测
信息熵
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于语义的文本数据流概念漂移检测算法
来源期刊 计算机工程 学科 工学
关键词 概念漂移 语义 漂移检测 潜在狄利克雷分布模型 文本数据流分类
年,卷(期) 2018,(2) 所属期刊栏目 先进计算与数据处理
研究方向 页码范围 24-30
页数 7页 分类号 TP181
字数 6873字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 胡学钢 合肥工业大学计算机与信息学院 314 3156 27.0 39.0
2 张玉红 合肥工业大学计算机与信息学院 32 260 10.0 14.0
3 储光 合肥工业大学计算机与信息学院 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (37)
共引文献  (18)
参考文献  (10)
节点文献
引证文献  (1)
同被引文献  (5)
二级引证文献  (0)
1967(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(4)
  • 参考文献(1)
  • 二级参考文献(3)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(3)
  • 参考文献(1)
  • 二级参考文献(2)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(3)
  • 参考文献(0)
  • 二级参考文献(3)
2010(5)
  • 参考文献(1)
  • 二级参考文献(4)
2011(7)
  • 参考文献(1)
  • 二级参考文献(6)
2012(7)
  • 参考文献(2)
  • 二级参考文献(5)
2013(4)
  • 参考文献(0)
  • 二级参考文献(4)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(3)
  • 参考文献(3)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
概念漂移
语义
漂移检测
潜在狄利克雷分布模型
文本数据流分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导