基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
自适应信息过滤中一个大的挑战在于其数据稀疏问题.因此,在对输入的文本流进行过滤的同时学习最优阈值非常重要.提出了一种新颖的阈值优化算法.该算法可以通过少量的正例进行快速的学习,所需数据的获得具有增量性,故而其计算量及所需的存储空间很小.此外,该算法还具有高效、健壮、实用性强等优点.在第10届国际文本检索会议(TREC10)上,复旦大学的自适应信息过滤系统使用了该阈值优化算法,并取得了第3名的成绩.其T10U和T10F分别达到了0.215和0.414.
推荐文章
考虑人因指标的过程报警阈值自适应优化方法
人因指标
报警阈值
自适应
关联规则
新阈值函数的自适应去噪
信号处理
信号去噪
阈值函数
自适应
融合动态概率阈值和自适应变异的鲸鱼优化算法
鲸鱼优化算法
Fuch混沌映射
动态概率阈值
自适应变异
基于模糊阈值的自适应图像分割方法
图像分割
模糊阈值
自适应分割
直方图
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 自适应信息过滤中使用少量正例进行阈值优化
来源期刊 软件学报 学科 工学
关键词 自适应信息过滤 向量空间模型 阈值优化 检出率 相关反馈
年,卷(期) 2003,(10) 所属期刊栏目 数据库技术
研究方向 页码范围 1697-1705
页数 9页 分类号 TP391
字数 1463字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 吴立德 复旦大学计算机科学系 78 2759 24.0 52.0
2 黄萱菁 复旦大学计算机科学系 49 2106 18.0 45.0
3 胡恬 复旦大学计算机科学系 4 96 3.0 4.0
4 夏迎炬 复旦大学计算机科学系 4 308 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (22)
同被引文献  (12)
二级引证文献  (27)
1991(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2004(1)
  • 引证文献(1)
  • 二级引证文献(0)
2005(2)
  • 引证文献(2)
  • 二级引证文献(0)
2006(4)
  • 引证文献(4)
  • 二级引证文献(0)
2007(4)
  • 引证文献(3)
  • 二级引证文献(1)
2008(6)
  • 引证文献(3)
  • 二级引证文献(3)
2009(6)
  • 引证文献(3)
  • 二级引证文献(3)
2010(2)
  • 引证文献(0)
  • 二级引证文献(2)
2011(2)
  • 引证文献(0)
  • 二级引证文献(2)
2012(2)
  • 引证文献(0)
  • 二级引证文献(2)
2013(6)
  • 引证文献(6)
  • 二级引证文献(0)
2014(3)
  • 引证文献(0)
  • 二级引证文献(3)
2015(3)
  • 引证文献(0)
  • 二级引证文献(3)
2016(2)
  • 引证文献(0)
  • 二级引证文献(2)
2018(4)
  • 引证文献(0)
  • 二级引证文献(4)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
自适应信息过滤
向量空间模型
阈值优化
检出率
相关反馈
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
国家高技术研究发展计划(863计划)
英文译名:The National High Technology Research and Development Program of China
官方网址:http://www.863.org.cn
项目类型:重点项目
学科类型:信息技术
论文1v1指导