基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
中文术语识别与抽取是中文文本信息处理的基础,对于提高中文文本索引与检索、文本挖掘、本体构建、潜在语义分析等的处理精度有着重要的意义。文章以互信息和信息熵理论为基础,提出一种基于统计技术的中文术语半自动抽取方法,并且以互联网新闻话题数据为对象进行了实验验证,结果表明所提方法能够有效支持中文术语的抽取。
推荐文章
基于互信息的中文术语抽取系统
术语抽取
互信息
语料
统计与规则相融合的领域术语抽取算法
领域术语抽取
词语度
领域度
左右信息熵扩展
边界检测
词频-逆文档频率
中文领域本体学习中术语的自动抽取
领域术语抽取
领域主题一致度
领域本体学习
多字词候选术语
字符串分解
一种基于角色匹配的事件抽取方法
事件抽取
事件模式
语义角色标注
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于统计技术的中文术语抽取方法
来源期刊 中国科技术语 学科 地球科学
关键词 互信息 信息熵 中文术语抽取
年,卷(期) 2014,(5) 所属期刊栏目 术语学研究
研究方向 页码范围 10-14
页数 5页 分类号 TP311|NO4|HO83
字数 3535字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘剑 66 379 12.0 17.0
5 刘伍颖 6 88 4.0 6.0
6 唐慧丰 9 419 4.0 9.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (40)
共引文献  (46)
参考文献  (6)
节点文献
引证文献  (14)
同被引文献  (52)
二级引证文献  (34)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(3)
  • 参考文献(0)
  • 二级参考文献(3)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(5)
  • 参考文献(2)
  • 二级参考文献(3)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(7)
  • 参考文献(1)
  • 二级参考文献(6)
2008(5)
  • 参考文献(0)
  • 二级参考文献(5)
2009(7)
  • 参考文献(0)
  • 二级参考文献(7)
2010(2)
  • 参考文献(1)
  • 二级参考文献(1)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(5)
  • 引证文献(2)
  • 二级引证文献(3)
2017(7)
  • 引证文献(4)
  • 二级引证文献(3)
2018(13)
  • 引证文献(2)
  • 二级引证文献(11)
2019(16)
  • 引证文献(4)
  • 二级引证文献(12)
2020(6)
  • 引证文献(1)
  • 二级引证文献(5)
研究主题发展历程
节点文献
互信息
信息熵
中文术语抽取
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中国科技术语
双月刊
1673-8578
11-5554/N
大16开
北京东皇城根北街16号
2-947
1985
chi
出版文献量(篇)
2413
总下载数(次)
9
论文1v1指导