基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对互联网上论坛和新闻网站发布的海量自然语言文本,该文设计一个话题识别与跟踪系统,将海量的数据分类整理并聚合形成各个话题.该系统的核心采用SVM方法进行文本分类,基于知识库和网络流算法实现话题的聚合,测试结果表明,文章分类的正确率达到92%,聚类的正确率达到88%,具有较高的应用价值.
推荐文章
移动互联网网络管理系统的设计与实现
移动IPv6
快速移动IPv6
层次移动IPv6
移动子网
简单网络管理协议
管理信息库
通用互联网信息采集系统的设计与初步实现
互联网信息采集系统
网络信息挖掘
Spider
移动互联网KQI评测方法及系统实现
移动互联网业务感知
KPI(KeyPerformanceIndicator关键性能指标)
KQI(KeyQualityIndicators关键质量指标)
互联网视听节目监控管理 系统的设计与实现
互联网视听节目监控
敏感内容分析
色情图像识别
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 互联网话题识别与跟踪系统设计及实现
来源期刊 计算机工程 学科 工学
关键词 话题识别与跟踪 信息检索 支持向量机 分类 聚类
年,卷(期) 2008,(19) 所属期刊栏目 人工智能及识别技术
研究方向 页码范围 212-214
页数 3页 分类号 TP393
字数 3317字 语种 中文
DOI 10.3969/j.issn.1000-3428.2008.19.072
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 赵泽宇 复旦大学信息化办公室 20 262 5.0 16.0
2 闫华 复旦大学信息化办公室 24 135 6.0 10.0
3 闵可锐 复且大学计算机科学与工程系 1 36 1.0 1.0
4 赵迎宾 复且大学计算机科学与工程系 1 36 1.0 1.0
5 刘昕 复且大学计算机科学与工程系 1 36 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (36)
同被引文献  (47)
二级引证文献  (80)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2010(2)
  • 引证文献(2)
  • 二级引证文献(0)
2011(3)
  • 引证文献(3)
  • 二级引证文献(0)
2012(8)
  • 引证文献(7)
  • 二级引证文献(1)
2013(14)
  • 引证文献(7)
  • 二级引证文献(7)
2014(18)
  • 引证文献(6)
  • 二级引证文献(12)
2015(14)
  • 引证文献(0)
  • 二级引证文献(14)
2016(15)
  • 引证文献(3)
  • 二级引证文献(12)
2017(9)
  • 引证文献(3)
  • 二级引证文献(6)
2018(16)
  • 引证文献(2)
  • 二级引证文献(14)
2019(14)
  • 引证文献(2)
  • 二级引证文献(12)
2020(3)
  • 引证文献(1)
  • 二级引证文献(2)
研究主题发展历程
节点文献
话题识别与跟踪
信息检索
支持向量机
分类
聚类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
总被引数(次)
317027
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导