原文服务方: 成都大学学报(自然科学版)       
摘要:
为了对新闻类信息进行搜索和数据分析,需要从大量保存新闻类信息的WORD文件中进行信息检索.使用人工直接检索WORD文件的方式效率较低,因此,考虑从WORD文件中抽取有用信息来构建新闻信息数据库,然后在数据库中进行数据搜索和新闻数据处理.提出一种新闻类WORD格式文件数据抽取算法,使用该算法从批量新闻类WORD文件中高效自动读取文件内容,清洗无用数据,并抽取有用信息数据构建数据库.
推荐文章
一种智能网络磁盘文件数据容错算法
智能网络磁盘
IND
文件数据
容错
算法
一种大容量数据文件抽取算法的优化研究
大容量数据
抽取算法
自适应
快速写入
优化
使用"格式文件"将徕卡仪器数据导出成cass格式的方法
徕卡仪器矿山测量固定点文件测量点文件导出C
a
s
s格式
股票交易数据文件的抽取算法研究
股票交易数据
DAY文件
数据抽取算法
数据挖掘
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种新闻类WORD格式文件数据抽取算法研究
来源期刊 成都大学学报(自然科学版) 学科
关键词 新闻类 WORD格式 数据抽取 清洗数据 批量文件自动读取 数据库
年,卷(期) 2022,(2) 所属期刊栏目 信息科学与工程
研究方向 页码范围 151-156
页数 5页 分类号 TP311.13
字数 语种 中文
DOI 10.3969/j.issn.1004-5422.2022.02.008
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
新闻类
WORD格式
数据抽取
清洗数据
批量文件自动读取
数据库
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
成都大学学报(自然科学版)
季刊
1004-5422
51-1216/N
16开
1982-01-01
chi
出版文献量(篇)
1947
总下载数(次)
0
论文1v1指导