基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
信息抽取模式的自动获取不仅能极大地减少所需的工作量,而且对于信息抽取系统的可扩充性和可移植性都至关重要.该文提出的采用开放语料库的跨领域模式自动获取方法是采用开放的训练语料库来自动生成领域无关的抽取模式,借助模式和实例之间的二元性,不断获取新的语料对系统进行训练,从而克服以往训练语料库规模较小的缺点.该方法尽可能减少了领域相关性,领域移植的代价很小.由于采用开放语料,该文提出了一种通过机器学习使用统计模型来自动选取用于模式生成和评价的正反实例的方法.根据在投资领域的测试结果,该方法获得了较好的效果,模式抽取的平均查准率达到92%,平均召回率达到42.4%.
推荐文章
语料库辅助的大学英语阅读新模式构想
语料库
阅读教学
阅读模式
关于旅游英语语料库的运用
旅游英语
语料库
标示语翻译
运用
基于Web检索的陕北民歌语料库设计
语料库
陕北民歌
频度统计
Web检索
基于计算机语料库的英语写作教学模式的研究
计算机语料库
英语写作教学
正确度
熟练度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 采用开放语料库的跨领域模式自动获取
来源期刊 计算机仿真 学科 工学
关键词 模式自动获取 开放语料库 跨领域 模式和实例的二元性 统计判断模型 正反实例判断
年,卷(期) 2005,(4) 所属期刊栏目 社会科学领域仿真
研究方向 页码范围 259-263,293
页数 6页 分类号 TP391
字数 6512字 语种 中文
DOI 10.3969/j.issn.1006-9348.2005.04.072
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李芳 上海交通大学计算机系 98 1052 15.0 30.0
2 张冬茉 上海交通大学计算机系 29 317 10.0 17.0
3 曾兴杰 上海交通大学计算机系 1 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (3)
同被引文献  (4)
二级引证文献  (13)
2005(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2008(3)
  • 引证文献(2)
  • 二级引证文献(1)
2009(4)
  • 引证文献(0)
  • 二级引证文献(4)
2010(2)
  • 引证文献(1)
  • 二级引证文献(1)
2011(1)
  • 引证文献(0)
  • 二级引证文献(1)
2015(3)
  • 引证文献(0)
  • 二级引证文献(3)
2016(2)
  • 引证文献(0)
  • 二级引证文献(2)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
模式自动获取
开放语料库
跨领域
模式和实例的二元性
统计判断模型
正反实例判断
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机仿真
月刊
1006-9348
11-3724/TP
大16开
北京海淀阜成路14号
82-773
1984
chi
出版文献量(篇)
20896
总下载数(次)
43
论文1v1指导