基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
新闻正文信息提取对信息检索、存储和舆情监测等具有极其重要的意义.为实现新闻信息的正确提取,考虑到DOM等几种技术的优势,结合DOM技术、动态型网页信息抽取技术和行决分布算法等技术优点,重点研究了新闻信息的提取方法,尤其针对动态网页的信息提取,设计了一套有效的新闻正文信息提取方法.实验结果表明,该方法能有效实现新闻的正文信息抽取,准确率高,具有一定推广价值.
推荐文章
基于统计的自动化Web新闻正文抽取
Web新闻
正文抽取
自动化标签检测
基于DBSCAN算法的网页正文提取
主题爬虫
正文提取
DBSCAN算法
密度
基于FFT的网页正文提取算法研究与实现
中文信息处理
Web页面
信息提取
页面结构
FFT
区域分割
基于标记窗的网页正文信息提取方法
标记窗
提取
文档对象模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 新闻正文信息在线提取方法研究
来源期刊 软件导刊 学科 工学
关键词 信息抽取 DOM技术 动态型网页 行块分布算法
年,卷(期) 2017,(4) 所属期刊栏目 软件理论与方法
研究方向 页码范围 9-13
页数 5页 分类号 TP301
字数 5138字 语种 中文
DOI 10.11907/rjdk.162557
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王年丰 华中师范大学物理科学与技术学院 4 13 1.0 3.0
2 费潇潇 华中师范大学物理科学与技术学院 3 12 1.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (25)
共引文献  (59)
参考文献  (7)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1979(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(4)
  • 参考文献(0)
  • 二级参考文献(4)
2005(6)
  • 参考文献(1)
  • 二级参考文献(5)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(4)
  • 参考文献(2)
  • 二级参考文献(2)
2008(3)
  • 参考文献(0)
  • 二级参考文献(3)
2009(8)
  • 参考文献(0)
  • 二级参考文献(8)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(2)
  • 参考文献(2)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
信息抽取
DOM技术
动态型网页
行块分布算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件导刊
月刊
1672-7800
42-1671/TP
16开
湖北省武汉市
38-431
2002
chi
出版文献量(篇)
9809
总下载数(次)
57
总被引数(次)
30383
论文1v1指导