基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出一种提取Web中的菜单和导航指示器等关键信息的方法,首先利用由W3C提出的文档对象模型技术提取出关键信息和与关键信息结构相似的其他信息,将得到的信息融合成信息列表,再利用熵原理从信息列表中识别出网站的真正关键信息。实验结果验证了方法的有效性。
推荐文章
基于DOM的中文人物WEB信息提取
信息提取
文档对象模型
影响因子
中文人物
一种垂直页面分割与信息提取方法的研究
页面分割
信息获取
垂直网站
内容聚集度
分割标签
前缀匹配
基于DOM的Web信息抽取
DOM
包装器
抽取规则
信息抽取
一种基于DOM的Web信息提取方法
Web信息提取
DOM
XPath
XSLT
基于DOM的网页结构判断
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于DOM的Web关键信息提取方法
来源期刊 现代计算机:上半月版 学科 工学
关键词 WEB内容挖掘 信息提取 关键信息 DOM
年,卷(期) xdjsjzxk_2011,(6) 所属期刊栏目
研究方向 页码范围 3-6
页数 4页 分类号 TP399
字数 语种
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (8)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
WEB内容挖掘
信息提取
关键信息
DOM
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
现代计算机:中旬刊
月刊
1007-1423
44-1415/TP
广州市海珠区新港西路135号中山大学园B
46-205
出版文献量(篇)
9067
总下载数(次)
3
论文1v1指导