作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为高效便捷地获取互联网上发布的真实事件信息,提出了一种无监督的互联网事件抽取框架.该框架利用DOM树模型的平行结构特性对表格页面进行事件抽取,并以表格页面抽取的事件作为种子采总结详情页面的对应模式,进一步使用总结的模式在详情页面中抽取.在大量网站页面中应用该框架,并将抽取结果与常用的包装器生成算法进行比较,结果表明了该框架的有效性以及在详情页面中的抽取质量优于包装器算法.
推荐文章
互联网通用地址体系框架
互联网体系结构
地址体系
通用框架
构件设计
原型系统
"互联网+"时代管理会计框架创新设计
'互联网+'时代
管理会计框架
创新设计
物联网与互联网
物联网
自然物联网
人造物联网
电子信息物联网
互联网
互联网出版探析
互联网出版
网络出版
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 无监督的互联网事件抽取框架
来源期刊 计算机工程与设计 学科 工学
关键词 信息抽取 互联网事件抽取 表格网页 详情网页 无监督
年,卷(期) 2011,(3) 所属期刊栏目 信息化技术
研究方向 页码范围 910-913,917
页数 分类号 TP393
字数 4200字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 何一鸣 复旦大学计算机科学技术学院 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
信息抽取
互联网事件抽取
表格网页
详情网页
无监督
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与设计
月刊
1000-7024
11-1775/TP
大16开
北京142信箱37分箱
82-425
1980
chi
出版文献量(篇)
18818
总下载数(次)
45
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导