作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
构建领域本体的首要任务是获取领域相关的概念,这些概念很多是由常用词典库中没有收录的领域合成词组成,因此抽取领域合成词对于领域本体的构建至关重要。本文基于语言规则和统计技术,提出一种结合改进互信息和语言模板的领域合成词抽取方法。首先利用改进的互信息算法抽取由多字词单位构成的高频次候选领域合成词,在此基础上,利用语言模板匹配抽取低频次候选领域合成词,最后由专家进行检验,得到领域合成词集。实验结果表明,该算法的领域合成词提取准确率达到88.22%,适用于从大规模网页文本中自动高效地抽取领域合成词。
推荐文章
领域自适应的合成词词性标注研究
词性标注
支持向量机
基于转换学习
合成词
领域自适应
中文合成词识别及分词修正
合成词
词共现有向图
词性标注
分词修正
自然语言处理
一种基于概念抽取的相关词推荐模型
Web搜索
概念抽取
相关度
领域自适应的合成词词性标注研究
词性标注
支持向量机
基于转换学习
合成词
领域自适应
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种领域合成词的抽取方法
来源期刊 太赫兹科学与电子信息学报 学科 工学
关键词 领域本体 互信息 语言模板 领域合成词
年,卷(期) 2014,(6) 所属期刊栏目 电磁场与微波
研究方向 页码范围 870-873,878
页数 5页 分类号 TN911.7|TP391.1
字数 3639字 语种 中文
DOI 10.11805/TKYDA201406.0870
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘剑 中国科学院计算技术研究所 66 379 12.0 17.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (43)
共引文献  (49)
参考文献  (10)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(3)
  • 参考文献(0)
  • 二级参考文献(3)
1998(2)
  • 参考文献(1)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(5)
  • 参考文献(2)
  • 二级参考文献(3)
2005(5)
  • 参考文献(1)
  • 二级参考文献(4)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(7)
  • 参考文献(1)
  • 二级参考文献(6)
2008(5)
  • 参考文献(0)
  • 二级参考文献(5)
2009(7)
  • 参考文献(0)
  • 二级参考文献(7)
2010(4)
  • 参考文献(2)
  • 二级参考文献(2)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
领域本体
互信息
语言模板
领域合成词
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
太赫兹科学与电子信息学报
双月刊
2095-4980
51-1746/TN
大16开
四川绵阳919信箱532分箱
62-241
2003
chi
出版文献量(篇)
3051
总下载数(次)
7
总被引数(次)
11167
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导