作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
文本抽取是信息检索的一个重要问题.设计并实现了一个利用IFilter接口的过滤器组件,抽取非文本文件的文本信息的程序.对这一设计过程论述了其主要的关键技术.
推荐文章
基于Matlab文本文件哈夫曼编解码仿真
数据压缩
Huffman编解码
Matlab
二叉树
数据文本文件数字信号特征的提取
数字信号
特征提取
参数计算
文本自动分类关键技术研究
中文分词
向量空间模型
文本分类
支持向量机
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于IFilter的非文本文件中抽取文本的关键技术
来源期刊 电脑知识与技术 学科 工学
关键词 文本抽取 非文本文件 IFilter接口 过滤器组件
年,卷(期) 2011,(27) 所属期刊栏目 软件设计开发
研究方向 页码范围 6682-6683
页数 分类号 TN393.09
字数 2099字 语种 中文
DOI 10.3969/j.issn.1009-3044.2011.27.053
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 徐辉 广西财经学院信息与统计学院 24 61 4.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (1)
参考文献  (1)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文本抽取
非文本文件
IFilter接口
过滤器组件
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电脑知识与技术
旬刊
1009-3044
34-1205/TP
大16开
安徽省合肥市
26-188
1994
chi
出版文献量(篇)
58241
总下载数(次)
228
总被引数(次)
132128
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导