基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了适应信息时代的迅速发展,提高从汉语文献中自动提取主题词的准确率,给出一种基于语义理解的汉语文献主题词自动提取算法模型.该模型以中文文本为处理对象,结合领域背景,构建概念语义网络作为分词词典和知识库,用概念之间的联系和匹配取代传统的字面匹配,克服了仅局限于表面形式的缺陷;把自然语言处理从目前基于关键词层面提高到基于知识的层面,从而在概念层次上理解文献主题,突破了传统的关键词匹配的局限,在一定程度上解决了词汇差异问题.该方法能对自然语言进行某种程度的语义理解,利用领域知识来实现主题词的规范标引.实验表明,采用本方法对测试文档进行主题词提取的准确率可达到71.03%,与传统方法相比提高了近1.87倍.
推荐文章
基于语义关联的中文网页主题词提取方法研究
语义关联
中文网页
主题词
权重
基于增量词集频率的文本主题词提取算法研究
增量词集频率
主题词
自然语言处理
基于主题词表和 FCA的网页语义概念树构建研究
本体
语义概念树
形式概念分析
词语相似度
基于语义关联的中文网页主题词提取方法研究
语义关联
中文网页
主题词
权重
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于语义的汉语文献主题词提取算法研究
来源期刊 吉林大学学报(信息科学版) 学科 工学
关键词 自然语言处理 主题词提取 概念语义网络
年,卷(期) 2005,(5) 所属期刊栏目 计算机科学与技术
研究方向 页码范围 535-540
页数 6页 分类号 TP391
字数 5039字 语种 中文
DOI 10.3969/j.issn.1671-5896.2005.05.016
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王树明 吉林大学计算机科学与技术学院 15 159 6.0 12.0
2 胡明 长春工业大学计算机科学与工程学院 35 397 9.0 19.0
3 唐培丽 长春工业大学计算机科学与工程学院 9 88 5.0 9.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (22)
共引文献  (134)
参考文献  (9)
节点文献
引证文献  (29)
同被引文献  (81)
二级引证文献  (180)
1957(1)
  • 参考文献(0)
  • 二级参考文献(1)
1958(2)
  • 参考文献(0)
  • 二级参考文献(2)
1969(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1987(1)
  • 参考文献(1)
  • 二级参考文献(0)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(4)
  • 参考文献(0)
  • 二级参考文献(4)
1996(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(3)
  • 参考文献(1)
  • 二级参考文献(2)
2000(4)
  • 参考文献(1)
  • 二级参考文献(3)
2001(4)
  • 参考文献(1)
  • 二级参考文献(3)
2002(2)
  • 参考文献(1)
  • 二级参考文献(1)
2003(4)
  • 参考文献(4)
  • 二级参考文献(0)
2005(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2006(1)
  • 引证文献(1)
  • 二级引证文献(0)
2007(3)
  • 引证文献(2)
  • 二级引证文献(1)
2008(6)
  • 引证文献(3)
  • 二级引证文献(3)
2009(8)
  • 引证文献(3)
  • 二级引证文献(5)
2010(20)
  • 引证文献(8)
  • 二级引证文献(12)
2011(17)
  • 引证文献(3)
  • 二级引证文献(14)
2012(20)
  • 引证文献(2)
  • 二级引证文献(18)
2013(28)
  • 引证文献(2)
  • 二级引证文献(26)
2014(27)
  • 引证文献(2)
  • 二级引证文献(25)
2015(25)
  • 引证文献(2)
  • 二级引证文献(23)
2016(17)
  • 引证文献(1)
  • 二级引证文献(16)
2017(8)
  • 引证文献(0)
  • 二级引证文献(8)
2018(15)
  • 引证文献(0)
  • 二级引证文献(15)
2019(11)
  • 引证文献(0)
  • 二级引证文献(11)
2020(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
自然语言处理
主题词提取
概念语义网络
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
吉林大学学报(信息科学版)
双月刊
1671-5896
22-1344/TN
大16开
长春市南湖大路5372号
1983
chi
出版文献量(篇)
2333
总下载数(次)
2
总被引数(次)
16807
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导