基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
利用语义角色标注技术对文献进行标注,以句子为最小单位进行文献的语义相似度检测.提取文献中所有词语的上位词,为每篇文献形成句子-词-语义角色-上位词四部图.语义相似的句子对比参照四部图确定,最终计算出两篇文献相似句子的Jaccard系数作为两篇文献的语义相似度.实验结果表明,所识别出的语义相似度较字粒度Jaccard系数法、词粒度Jaccard系数法、Winnowing Jaccard系数法等高出13%,然而受语料库限制,本方法还有很大的提升空间.
推荐文章
语义角色标注研究综述
自然语言处理
语义角色标注
机器学习
基于依存树的中文语义角色标注
最大熵分类器
语义角色标注
依存树
基于条件随机场的语义角色标注
语义角色标注
条件随机场
参数估计
特征选择
基于依存关系的语义角色标注
语义角色标注
依存分析
依存关系
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于语义角色标注的文献相似度检测研究
来源期刊 图书情报工作 学科 社会科学
关键词 语义角色标注 科技文献 相似度检测
年,卷(期) 2014,(12) 所属期刊栏目 知识组织
研究方向 页码范围 130-135
页数 分类号 G350
字数 语种 中文
DOI 10.13266/j.issn.0252-3116.2014.12.020
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王晓笛 山东理工大学科技信息研究所 5 42 5.0 5.0
2 祝娜 山东理工大学科技信息研究所 7 95 5.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (1)
参考文献  (9)
节点文献
引证文献  (7)
同被引文献  (55)
二级引证文献  (3)
1990(1)
  • 参考文献(1)
  • 二级参考文献(0)
1995(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(2)
  • 参考文献(2)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(2)
  • 引证文献(2)
  • 二级引证文献(0)
2017(4)
  • 引证文献(2)
  • 二级引证文献(2)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
2020(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
语义角色标注
科技文献
相似度检测
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
图书情报工作
半月刊
0252-3116
11-1541/G2
16开
北京中关村北四环西路33号
2-412
1980
chi
出版文献量(篇)
11437
总下载数(次)
32
总被引数(次)
130230
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导