基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
当前,文本过滤技术基本上停留在关键词阶段,无法处理同义和概念之间的上下住关系,因此,准确率和召回率达到一定值后,无论如何改进算法也无法再取得突破进展.文章试图从语义的角度突破这个困境,对常识知识库HowNet在文本过滤中的应用,以及文本过滤中所涉及的关键技术,包括基于概念的文本表示方法、用户模板表示方法、文本过滤算法进行了研究和探讨.实验结果表明,基于概念的方法的确可以提高文本过滤的性能.
推荐文章
基于词汇链的文本过滤模型
词汇链
向量空间
用户模板
文本表示
WordNet
倾向性文本的概念图过滤技术的研究
文本过滤
概念图
倾向性文本
语义分析
基于概念扩充的文本过滤模型
概念扩充
向量空间
用户模板
文本表示
wordnet
基于概念的文本表示模型
文本表示模型
概念
概念距离
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于概念的文本过滤模型
来源期刊 计算机工程与应用 学科 工学
关键词 文本过滤 HowNet 用户模板
年,卷(期) 2006,(4) 所属期刊栏目 数据库与信息处理
研究方向 页码范围 186-188
页数 3页 分类号 TP311
字数 3920字 语种 中文
DOI 10.3321/j.issn:1002-8331.2006.04.057
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘林 北京师范大学信息网络中心 7 27 2.0 5.0
2 赵丰年 北京师范大学信息网络中心 1 20 1.0 1.0
3 商建云 北京师范大学信息网络中心 1 20 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (3)
共引文献  (77)
参考文献  (3)
节点文献
引证文献  (20)
同被引文献  (37)
二级引证文献  (160)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(2)
  • 参考文献(1)
  • 二级参考文献(1)
1994(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2007(3)
  • 引证文献(3)
  • 二级引证文献(0)
2008(11)
  • 引证文献(7)
  • 二级引证文献(4)
2009(14)
  • 引证文献(3)
  • 二级引证文献(11)
2010(29)
  • 引证文献(3)
  • 二级引证文献(26)
2011(18)
  • 引证文献(0)
  • 二级引证文献(18)
2012(24)
  • 引证文献(1)
  • 二级引证文献(23)
2013(16)
  • 引证文献(2)
  • 二级引证文献(14)
2014(14)
  • 引证文献(0)
  • 二级引证文献(14)
2015(11)
  • 引证文献(1)
  • 二级引证文献(10)
2016(15)
  • 引证文献(0)
  • 二级引证文献(15)
2017(12)
  • 引证文献(0)
  • 二级引证文献(12)
2018(9)
  • 引证文献(0)
  • 二级引证文献(9)
2019(3)
  • 引证文献(0)
  • 二级引证文献(3)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
文本过滤
HowNet
用户模板
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导