基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
网络信息资源的迅猛膨胀推进了信息检索技术的发展和成熟,但将现有的技术应用于海量实时网络数据时,传统的信息检索算法仍存在种种不足之处.本文中以CERNET华(东)北地区的海量实时网络数据环境为依托,研究和设计了两段向量簇聚类信息检索算法,通过插入聚类和优化聚类两阶段的操作,提供高效的信息处理能力.同时,基于簇聚类树实现了群发邮件甄别的应用,对网络数据中的垃圾邮件进行过滤,进一步地提高检索效率.
推荐文章
面向海量数据的语音敏感信息检测系统
语音搜索
语音识别
关键词检测
面向海量数据的空间co-location模式挖掘新算法
网格微分算法
质心
σ2微分格
空间实例压缩率
基于问答社区的海量问句检索关键技术研究
问答系统
问答对
问答社区
语义分析
语义向量空间模型
一种准实时海量信息全文检索系统的实现
全文检索
实时海量信息
加载索引模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种面向海量实时数据的信息检索算法
来源期刊 华南理工大学学报(自然科学版) 学科 工学
关键词 信息检索 簇聚类 两段向量 邮件甄别
年,卷(期) 2004,(z1) 所属期刊栏目
研究方向 页码范围 6-10
页数 5页 分类号 TP391
字数 4305字 语种 中文
DOI 10.3321/j.issn:1000-565X.2004.z1.002
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 丁伟 东南大学计算机科学与工程系 56 958 15.0 30.0
2 林容容 东南大学计算机科学与工程系 4 27 3.0 4.0
3 倪良胜 东南大学计算机科学与工程系 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (7)
共引文献  (10)
参考文献  (3)
节点文献
引证文献  (1)
同被引文献  (6)
二级引证文献  (1)
1975(1)
  • 参考文献(1)
  • 二级参考文献(0)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(2)
  • 参考文献(0)
  • 二级参考文献(2)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2010(1)
  • 引证文献(1)
  • 二级引证文献(0)
2011(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
信息检索
簇聚类
两段向量
邮件甄别
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
华南理工大学学报(自然科学版)
月刊
1000-565X
44-1251/T
大16开
广州市天河区五山路华南理工大学内
46-174
1957
chi
出版文献量(篇)
6648
总下载数(次)
17
总被引数(次)
75046
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导