基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
文本过滤是指从大量的文本数据流中寻找满足特定用户需求的文本的过程.首先从任务、测试主题、语料库和评测指标等方面介绍了文本检索领域最权威的国际评测会议--文本检索会议(TREC)及其中的文本过滤项目,然后详细地描述了基于向量空间模型的文本过滤系统.该系统由训练和自适应过滤两个阶段组成.在训练阶段,通过特征抽取和伪反馈建立初始的过滤模板,并设置初始阈值;在过滤阶段,则根据用户的反馈信息自适应地调整模板和阈值.该系统参加了2000年举行的第9次文本检索会议的评测,取得了很好的成绩,在来自多个国家的15个系统中名列前茅,其中自适应过滤和批过滤的平均准确率分别为26.5%和31.7%.
推荐文章
基于向量空间模型的文本检索系统
向量空间模型
VSM
文本检索
信息获取
基于向量空间模型的文本自动分类系统的研究与实现
文本分类
中文信息处理
向量空间模型
基于词汇链的文本过滤模型
词汇链
向量空间
用户模板
文本表示
WordNet
基于向量空间模型结合语义的文本相似度算法
文本相似度
向量空间模型
语义
词频
召回率
特征项
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于向量空间模型的文本过滤系统
来源期刊 软件学报 学科 工学
关键词 文本检索 文本过滤 文本分类 机器学习 向量空间模型
年,卷(期) 2003,(3) 所属期刊栏目 模式识别与人工智能
研究方向 页码范围 435-442
页数 8页 分类号 TP181
字数 6199字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 吴立德 复旦大学计算机科学与工程系 78 2759 24.0 52.0
2 黄萱菁 复旦大学计算机科学与工程系 49 2106 18.0 45.0
3 夏迎炬 复旦大学计算机科学与工程系 4 308 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (43)
参考文献  (3)
节点文献
引证文献  (278)
同被引文献  (128)
二级引证文献  (641)
1991(1)
  • 参考文献(1)
  • 二级参考文献(0)
1992(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(4)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(4)
  • 二级引证文献(0)
2003(4)
  • 引证文献(4)
  • 二级引证文献(0)
2004(13)
  • 引证文献(12)
  • 二级引证文献(1)
2005(24)
  • 引证文献(22)
  • 二级引证文献(2)
2006(46)
  • 引证文献(32)
  • 二级引证文献(14)
2007(68)
  • 引证文献(31)
  • 二级引证文献(37)
2008(84)
  • 引证文献(27)
  • 二级引证文献(57)
2009(76)
  • 引证文献(27)
  • 二级引证文献(49)
2010(87)
  • 引证文献(17)
  • 二级引证文献(70)
2011(83)
  • 引证文献(23)
  • 二级引证文献(60)
2012(69)
  • 引证文献(16)
  • 二级引证文献(53)
2013(91)
  • 引证文献(21)
  • 二级引证文献(70)
2014(59)
  • 引证文献(11)
  • 二级引证文献(48)
2015(48)
  • 引证文献(5)
  • 二级引证文献(43)
2016(51)
  • 引证文献(13)
  • 二级引证文献(38)
2017(39)
  • 引证文献(2)
  • 二级引证文献(37)
2018(45)
  • 引证文献(9)
  • 二级引证文献(36)
2019(28)
  • 引证文献(5)
  • 二级引证文献(23)
2020(4)
  • 引证文献(1)
  • 二级引证文献(3)
研究主题发展历程
节点文献
文本检索
文本过滤
文本分类
机器学习
向量空间模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
国家高技术研究发展计划(863计划)
英文译名:The National High Technology Research and Development Program of China
官方网址:http://www.863.org.cn
项目类型:重点项目
学科类型:信息技术
论文1v1指导