基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了构建实体关系网络、改进和完善基于概念的信息检索,提出一种不针对特定属性类型的从机读词典中抽取概念实例的属性值信息的方法.首先,通过手工标注和遴选等方式生成初始实体一属性值对集并抽取出粗糙模式实例集;其次,经过对模式实例集的聚类合并和扩充处理得到若干组的模式实例,每一组代表一个属性类型;最后.从词典中抽取出新实体词汇的属性值信息.在模式实例集的处理中引入了同义词扩展和词汇语义相似度计算以提高模式实例的覆盖率.实验中针对<现代汉语规范词典>中的电子领域词汇进行抽取,取得了较好的效果.
推荐文章
关于词典本质属性的思考
词典
属性
语言性
文化性
社会性
机器可读词典中词汇属性信息的获取
信息抽取
自举
序列比对
语义相似度
面向军事装备实体的属性抽取
军事装备实体
属性抽取
统计分析
频繁模式挖掘
基于规则
基于Ontology的文本信息抽取
信息抽取
Ontology
概念模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 泛化类型的机读词典属性信息抽取
来源期刊 计算机应用与软件 学科 工学
关键词 信息抽取 模式实例 相似度 泛化类型
年,卷(期) 2011,(4) 所属期刊栏目 基金项目论文
研究方向 页码范围 1-3,16
页数 分类号 TP391.1
字数 5202字 语种 中文
DOI 10.3969/j.issn.1000-386X.2011.04.001
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陆汝占 上海交通大学计算机科学与工程系 67 936 16.0 28.0
2 王随涛 上海交通大学计算机科学与工程系 1 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (11)
共引文献  (35)
参考文献  (5)
节点文献
引证文献  (2)
同被引文献  (0)
二级引证文献  (0)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(3)
  • 参考文献(3)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
信息抽取
模式实例
相似度
泛化类型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用与软件
月刊
1000-386X
31-1260/TP
大16开
上海市愚园路546号
4-379
1984
chi
出版文献量(篇)
16532
总下载数(次)
47
总被引数(次)
101489
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导