基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
Web技术的发展导致Web数据激增,其中Deep Web数据占主要部分.实体识别是开展模式识别、数据集成等Deep Web关键技术研究的首要前提.为提高实体识别的效率和准确性,提出了基于模板的Deep Web实体识别信息抽取方法.该方法拥有三个不同的处理阶段:其中基于DOM树抽取规则的模板训练阶段最为关键,抽取规则通过结构分析和语义分析两个阶段完成,此外该方法还包含着数据准备和实体信息抽取两个辅助阶段.最后经实验验证所提方法在提升实体识别准确性的同时具有较好的信息抽取效率.
推荐文章
面向Deep Web数据自动抽取的模板生成方法
Deep,Web
数据抽取
模板生成
文法推断
基于信息增益的 Web 人物关系抽取
关系抽取
信息增益
模板匹配
多分类
自然语言处理
基于启发式信息的Deep Web结果模式获取方法
Deep Web
结果模式
网页数据特征矩阵
启发式信息
基于模板的Web信息自动提取方法
信息提取
模板化
自动识别
分隔标记
结构化
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于模板的Deep Web实体识别信息抽取方法研究
来源期刊 辽宁大学学报(自然科学版) 学科 工学
关键词 Deep Web 实体识别 模板 语义分析 DOM树
年,卷(期) 2017,(2) 所属期刊栏目 数学与信息技术
研究方向 页码范围 97-104
页数 8页 分类号 TP311.1|TP391.1
字数 5748字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 徐红艳 辽宁大学信息学院 40 299 9.0 16.0
2 冯勇 辽宁大学信息学院 39 274 8.0 15.0
3 王嵘冰 辽宁大学信息学院 31 165 5.0 12.0
4 党小婉 辽宁大学信息学院 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (47)
共引文献  (61)
参考文献  (10)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1980(1)
  • 参考文献(0)
  • 二级参考文献(1)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(3)
  • 参考文献(1)
  • 二级参考文献(2)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(8)
  • 参考文献(0)
  • 二级参考文献(8)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(7)
  • 参考文献(0)
  • 二级参考文献(7)
2008(5)
  • 参考文献(0)
  • 二级参考文献(5)
2009(3)
  • 参考文献(0)
  • 二级参考文献(3)
2010(7)
  • 参考文献(2)
  • 二级参考文献(5)
2011(7)
  • 参考文献(3)
  • 二级参考文献(4)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Deep Web
实体识别
模板
语义分析
DOM树
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
辽宁大学学报(自然科学版)
季刊
1000-5846
21-1143/N
大16开
沈阳市皇姑区崇山中路66号
8-147
1974
chi
出版文献量(篇)
1909
总下载数(次)
2
总被引数(次)
9019
论文1v1指导