基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
设计了一个将统计方法与规则方法相结合的专业领域内术语抽取算法.针对专业领域术语的特点,利用多种衡量字符串中各字之间结合"紧密程度"的统计量,先使用阈值分类器抽取出双字候选项;然后再对这些候选项向左右进行一定程度的扩充,从中筛选出符合要求的多字候选项;最后将所得候选项进行过滤,得到最终结果.据此实现了一个以未切分标注的生语料为输入、以专业领域术语为输出的抽取程序,在对多个领域内的语料进行测试后对实验结果进行分析,指出其中存在的问题,对未来的工作作出了展望.
推荐文章
统计与规则相融合的领域术语抽取算法
领域术语抽取
词语度
领域度
左右信息熵扩展
边界检测
词频-逆文档频率
中文领域本体学习中术语的自动抽取
领域术语抽取
领域主题一致度
领域本体学习
多字词候选术语
字符串分解
基于BLSTM_attention_CRF模型的新能源汽车领域术语抽取
领域术语抽取
attention机制
双向长短时记忆网络
条件随机场
词典
规则
基于多策略的专业术语抽取处理技术的研究
术语抽取
自然语言处理
术语处理
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于多策略的专业领域术语抽取器的设计
来源期刊 计算机工程 学科 工学
关键词 自然语言处理 术语抽取 多策略
年,卷(期) 2005,(14) 所属期刊栏目 人工智能及识别技术
研究方向 页码范围 159-160
页数 2页 分类号 TP339
字数 2801字 语种 中文
DOI 10.3969/j.issn.1000-3428.2005.14.057
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陆汝占 上海交通大学计算机系 67 936 16.0 28.0
2 田怀凤 上海交通大学计算机系 3 121 3.0 3.0
3 王立 上海交通大学计算机系 10 135 4.0 10.0
4 杜波 上海交通大学计算机系 2 111 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (101)
同被引文献  (91)
二级引证文献  (685)
2005(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2006(4)
  • 引证文献(2)
  • 二级引证文献(2)
2007(41)
  • 引证文献(8)
  • 二级引证文献(33)
2008(85)
  • 引证文献(11)
  • 二级引证文献(74)
2009(63)
  • 引证文献(13)
  • 二级引证文献(50)
2010(94)
  • 引证文献(14)
  • 二级引证文献(80)
2011(86)
  • 引证文献(8)
  • 二级引证文献(78)
2012(57)
  • 引证文献(8)
  • 二级引证文献(49)
2013(69)
  • 引证文献(8)
  • 二级引证文献(61)
2014(55)
  • 引证文献(6)
  • 二级引证文献(49)
2015(61)
  • 引证文献(4)
  • 二级引证文献(57)
2016(65)
  • 引证文献(6)
  • 二级引证文献(59)
2017(34)
  • 引证文献(2)
  • 二级引证文献(32)
2018(31)
  • 引证文献(6)
  • 二级引证文献(25)
2019(36)
  • 引证文献(5)
  • 二级引证文献(31)
2020(4)
  • 引证文献(0)
  • 二级引证文献(4)
研究主题发展历程
节点文献
自然语言处理
术语抽取
多策略
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
总被引数(次)
317027
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导