基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
实体识别是将一个或多个数据源中描述同一现实世界实体的数据对象分到同一组的过程,它在数据清洗、数据集成、数据挖掘中起着至关重要的作用.然而,实体的特征具有随时间演化的特性,这使得实体识别面临巨大的挑战.传统的实体识别方法解决了特征随着时间规律性的改变问题,但没有考虑到数据的不规律变化.该文提出了基于分类的方法解决特征不规律演化的实体识别问题.该方法首先利用机器学习中改进的随机森林的方法计算记录的相似性,接着提出了一个新型的两阶段聚类算法完成记录聚类过程,最后通过在真实数据集上的对比试验证明了该算法的有效性.通过在真实数据集上的实验,证明了该方法能够有效提高演化实体的识别准确性.
推荐文章
基于语义图嵌入的实体与关系联合识别方法
实体识别
关系识别
联合学习
图神经网络
基于最大相似度的伪随机交织器盲识别方法
伪随机交织器
Turbo码
最大相似度
盲识别
数据ETL过程中的实体识别方法
数据ETL
相似重复记录
实体识别算法
实体识别过程框架
基于随机Dropout深度信念网络的移动用户行为识别方法
行为识别
深度信念网络
深度学习
Dropout
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于随机森林的实体识别方法
来源期刊 集成技术 学科 工学
关键词 实体识别 聚类 随机森林 记录相似度
年,卷(期) 2018,(2) 所属期刊栏目
研究方向 页码范围 57-68
页数 12页 分类号 TP315
字数 8858字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 于戈 东北大学计算机科学与工程学院 426 6587 38.0 64.0
2 申德荣 东北大学计算机科学与工程学院 111 1289 18.0 32.0
3 寇月 东北大学计算机科学与工程学院 68 816 12.0 26.0
4 聂铁铮 东北大学计算机科学与工程学院 69 854 13.0 27.0
5 杨萌 东北大学计算机科学与工程学院 1 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (3)
参考文献  (11)
节点文献
引证文献  (2)
同被引文献  (12)
二级引证文献  (0)
1969(1)
  • 参考文献(0)
  • 二级参考文献(1)
1979(1)
  • 参考文献(1)
  • 二级参考文献(0)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(2)
  • 参考文献(2)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(2)
  • 参考文献(1)
  • 二级参考文献(1)
2007(2)
  • 参考文献(1)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
实体识别
聚类
随机森林
记录相似度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
集成技术
双月刊
2095-3135
44-1691/T
大16开
深圳市南山区西丽深圳大学城学苑大道1068号
2012
chi
出版文献量(篇)
677
总下载数(次)
2
总被引数(次)
1808
论文1v1指导