原文服务方: 计算机应用研究       
摘要:
针对中文人物社会关系标注语料库的匮乏和人物关系分类过于粗糙的问题,采用一种简单的方式标注了八类主要人物社会关系.为了有效地降低特征向量的维数避免维数灾难,并尽可能去除噪声特征以提高关系抽取的准确率,提出一种基于动词和名词抽取与x2统计量法(CHI)相结合的特征选择方法,并使用TF-IDF计算特征权重.通过SVM分类器进行实验,F值和正确率都得到了提高;为了充分利用数据集对该特征选择方法的效果进行测试,使用k-折交叉验证检验该方法的有效性,实验表明通过该方法产生的分类模型具有较强的区分能力和泛化能力.
推荐文章
基于时空数据的社会关系发现
用户关系
事件模型
社交网络
关系权重
考虑社会关系影响差异和动态性的社会化推荐
协同过滤
社交网络
矩阵分解
社交信任
差异性
动态性
基于卷积神经网络的中文人物关系抽取方法
文本挖掘
人物关系抽取
卷积神经网络
分类
词向量特征
基于信息增益的 Web 人物关系抽取
关系抽取
信息增益
模板匹配
多分类
自然语言处理
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于动词名词和CHI特征选择的中文人物社会关系抽取
来源期刊 计算机应用研究 学科
关键词 人物关系抽取 人物关系标注 特征选择 CHI SVM分类器
年,卷(期) 2017,(6) 所属期刊栏目 算法研究探讨
研究方向 页码范围 1631-1635
页数 5页 分类号 TP391.1
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2017.06.007
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 曾辉 华东交通大学信息工程学院 22 51 4.0 6.0
2 熊李艳 华东交通大学信息工程学院 32 92 6.0 8.0
3 黄晓辉 华东交通大学信息工程学院 8 26 3.0 5.0
4 唐佳丽 华东交通大学信息工程学院 1 8 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (16)
共引文献  (110)
参考文献  (11)
节点文献
引证文献  (8)
同被引文献  (36)
二级引证文献  (17)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(3)
  • 参考文献(1)
  • 二级参考文献(2)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(5)
  • 参考文献(0)
  • 二级参考文献(5)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(2)
  • 参考文献(2)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(4)
  • 引证文献(4)
  • 二级引证文献(0)
2019(14)
  • 引证文献(3)
  • 二级引证文献(11)
2020(7)
  • 引证文献(1)
  • 二级引证文献(6)
研究主题发展历程
节点文献
人物关系抽取
人物关系标注
特征选择
CHI
SVM分类器
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导