基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对Distant Supervision关系抽取方法训练语料存在大量噪声的问题,提出一种基于主题模型的噪声标注识别方法.该方法首先分析了中文Distant Supervision实体关系抽取方法面临的关系句子实例结构复杂的问题,然后利用自定义的模式以及模式聚类实现模式表示与聚合,最后使用主题模型识别噪声标注.实验结果表明,文章方法能有效识别噪声标注,用滤除噪声标注后的数据训练实体关系抽取模型,实验证明经过噪声滤除后实体关系抽取性能得到显著改善.
推荐文章
基于主题模型的汉语动词隐喻识别
隐喻识别
主题模型
LDA
机器学习
自然语言处理
基于联合模型的中文嵌套命名实体识别
嵌套命名实体识别
序列化标注模型
联合模型
感知器算法
基于众包标注的中文微博命名实体识别
舆论监测
众包标注
EM算法
中文微博
命名实体识别
基于条件随机场的中文地址要素识别方法
地址编码
中文地址要素
自然语言处理
条件随机场
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于主题模型的中文Distant Supervision噪声标注识别方法
来源期刊 信息工程大学学报 学科 工学
关键词 distant supervision 关系抽取 噪声标注识别 主题模型 关系模式
年,卷(期) 2016,(3) 所属期刊栏目 信息处理技术
研究方向 页码范围 303-308
页数 6页 分类号 TP391
字数 5676字 语种 中文
DOI 10.3969/j.issn.1671-0673.2016.03.010
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李弼程 102 1583 19.0 37.0
2 席耀一 14 50 3.0 6.0
3 唐浩浩 3 4 1.0 2.0
4 周杰 11 104 4.0 10.0
5 刘绍毓 2 29 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (2)
共引文献  (19)
参考文献  (1)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
distant supervision
关系抽取
噪声标注识别
主题模型
关系模式
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
信息工程大学学报
双月刊
1671-0673
41-1196/N
大16开
郑州市科学大道62号
2000
chi
出版文献量(篇)
2792
总下载数(次)
2
总被引数(次)
9088
论文1v1指导