基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了提高文本信息检索的查准率和缩短检索时间,提出了一种基于多策略的文档过滤算法.该算法根据潜在词性特征初步生成候选词,采用基于标题的特征词发现扩充候选词,使用改进的TFIDF对候选词的特征进行加权合成,去除不符合条件词,求出用户需求向量和待过滤文档向量的相似度,将相似度大于一定阈值的文档提供给用户.从实验参数确定、策略对结果的影响两方面论证了文档信息过滤算法的可行性.实验结果表明,基于多策略的文档信息过滤算法能够提高信息检索的查准率,改善信息检索的质量.
推荐文章
信息过滤系统中用户文档更新策略研究
信息过滤
兴趣变化
相关度反馈
用户文档高级交互
基于开放域抽取的多文档概念图构建研究
开放域抽取
多文档
概念图构建
基于多模板匹配和可信度分析的中文文档图像关键词过滤方法
关键词识别
多模板匹配
Boyer-Moore算法
可信度分析
基于内容理解的不良信息过滤技术研究
不良信息过滤
色情信息过滤
图像过滤
内容理解
内容安全
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于多策略的文档信息过滤技术的应用研究
来源期刊 计算机工程与设计 学科 工学
关键词 信息检索 信息过滤 文本特征抽取 TFIDF+ 空间向量模型
年,卷(期) 2009,(5) 所属期刊栏目 计算机应用
研究方向 页码范围 1262-1266
页数 5页 分类号 TP391.1|TP301.4
字数 7256字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 韩燮 中北大学电子与计算机科学技术学院 156 869 14.0 18.0
2 杨陟卓 中北大学电子与计算机科学技术学院 2 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (3)
共引文献  (20)
参考文献  (2)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
信息检索
信息过滤
文本特征抽取
TFIDF+
空间向量模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与设计
月刊
1000-7024
11-1775/TP
大16开
北京142信箱37分箱
82-425
1980
chi
出版文献量(篇)
18818
总下载数(次)
45
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导