基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为提高中文开源数据集间属性关系识别的准确率,提出一种数据驱动的细粒度对齐方法,综合利用属性的扩展、定义域等对属性间的同义、包含、相关等关系进行统一识别.方法首先利用统计理论确定属性的数据类型,并给出类型感知的属性相似度计算方法.在此基础上,将属性关系识别建模为多分类问题,抽取有效特征对不同关系进行描述并用于随机森林模型的构建.实验结果表明,该方法中属性数据类型判别的准确率达94.6%,最终对同义、包含、相关关系识别的F1值分别为71.3%,57.3%及59.9%.相比只关注同义属性的传统方法,细粒度属性对齐方法不仅提高了同义属性识别的准确性,而且可识别出相互包含和相关的属性,证明了其在中文开源数据集上的有效性.
推荐文章
基于HBase的细粒度访问控制方法研究
HBase
访问控制
细粒度权限
数据库角色
一种基于属性加密的细粒度云访问控制方案
多授权
访问控制
权限树
属性群
IP网络的NGOSS的细粒度设计方法
下一代运营维护支持系统
细粒度
商务无关的软件组件
面向ASP页面资源的细粒度访问控制方法研究
ASP
授权策略
细粒度
访问控制
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 数据驱动的细粒度中文属性对齐方法
来源期刊 东南大学学报(自然科学版) 学科 工学
关键词 中文属性对齐 属性数据类型判别 属性相似度 异构数据集成 知识图谱构建
年,卷(期) 2017,(4) 所属期刊栏目
研究方向 页码范围 660-666
页数 7页 分类号 TP182
字数 6521字 语种 中文
DOI 10.3969/j.issn.1001-0505.2017.04.006
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 付琨 中科院空间信息处理与应用系统技术重点实验室 44 461 12.0 19.0
3 黄廷磊 中科院空间信息处理与应用系统技术重点实验室 16 59 4.0 5.0
5 梁霄 中科院空间信息处理与应用系统技术重点实验室 7 17 3.0 3.0
11 张伟莉 中科院空间信息处理与应用系统技术重点实验室 1 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (77)
共引文献  (180)
参考文献  (13)
节点文献
引证文献  (3)
同被引文献  (11)
二级引证文献  (0)
1954(1)
  • 参考文献(0)
  • 二级参考文献(1)
1959(1)
  • 参考文献(0)
  • 二级参考文献(1)
1970(1)
  • 参考文献(0)
  • 二级参考文献(1)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(19)
  • 参考文献(4)
  • 二级参考文献(15)
2010(4)
  • 参考文献(0)
  • 二级参考文献(4)
2011(3)
  • 参考文献(0)
  • 二级参考文献(3)
2012(6)
  • 参考文献(2)
  • 二级参考文献(4)
2013(9)
  • 参考文献(1)
  • 二级参考文献(8)
2014(5)
  • 参考文献(0)
  • 二级参考文献(5)
2015(5)
  • 参考文献(1)
  • 二级参考文献(4)
2016(7)
  • 参考文献(2)
  • 二级参考文献(5)
2017(3)
  • 参考文献(3)
  • 二级参考文献(0)
2017(3)
  • 参考文献(3)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
中文属性对齐
属性数据类型判别
属性相似度
异构数据集成
知识图谱构建
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
东南大学学报(自然科学版)
双月刊
1001-0505
32-1178/N
大16开
南京四牌楼2号
28-15
1955
chi
出版文献量(篇)
5216
总下载数(次)
12
总被引数(次)
71314
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导