基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
设计了一个将统计方法与规则方法相结合的专业领域内术语抽取算法.针对专业领域术语的特点,利用多种衡量字符串中各字之间结合"紧密程度"的统计量,先使用阈值分类器抽取出双字候选项;然后再对这些候选项向左右进行一定程度的扩充,从中筛选出符合要求的多字候选项;最后将所得候选项进行过滤,得到最终结果.据此实现了一个以未切分标注的生语料为输入、以专业领域术语为输出的抽取程序,在对多个领域内的语料进行测试后对实验结果进行分析,指出其中存在的问题,对未来的工作作出了展望.
推荐文章
基于多策略的专业术语抽取处理技术的研究
术语抽取
自然语言处理
术语处理
基于多策略融合的专利术语自动抽取
专利术语
术语抽取
PageRank
术语区别度
义原信息
统计与规则相融合的领域术语抽取算法
领域术语抽取
词语度
领域度
左右信息熵扩展
边界检测
词频-逆文档频率
基于术语长度和语法特征的统计领域术语抽取
自然语言处理
术语抽取
支持向量机
术语长度
语法特征
词长比
领域相关性
领域一致性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于多策略的专业领域术语抽取器的设计
来源期刊 计算机工程 学科 工学
关键词 自然语言处理 术语抽取 多策略
年,卷(期) 2005,(14) 所属期刊栏目 人工智能及识别技术
研究方向 页码范围 159-160
页数 2页 分类号 TP339
字数 2801字 语种 中文
DOI 10.3969/j.issn.1000-3428.2005.14.057
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陆汝占 上海交通大学计算机系 67 936 16.0 28.0
2 田怀凤 上海交通大学计算机系 3 121 3.0 3.0
3 王立 上海交通大学计算机系 10 135 4.0 10.0
4 杜波 上海交通大学计算机系 2 111 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (101)
同被引文献  (91)
二级引证文献  (685)
2005(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2006(4)
  • 引证文献(2)
  • 二级引证文献(2)
2007(41)
  • 引证文献(8)
  • 二级引证文献(33)
2008(85)
  • 引证文献(11)
  • 二级引证文献(74)
2009(63)
  • 引证文献(13)
  • 二级引证文献(50)
2010(94)
  • 引证文献(14)
  • 二级引证文献(80)
2011(86)
  • 引证文献(8)
  • 二级引证文献(78)
2012(57)
  • 引证文献(8)
  • 二级引证文献(49)
2013(69)
  • 引证文献(8)
  • 二级引证文献(61)
2014(55)
  • 引证文献(6)
  • 二级引证文献(49)
2015(61)
  • 引证文献(4)
  • 二级引证文献(57)
2016(65)
  • 引证文献(6)
  • 二级引证文献(59)
2017(34)
  • 引证文献(2)
  • 二级引证文献(32)
2018(31)
  • 引证文献(6)
  • 二级引证文献(25)
2019(36)
  • 引证文献(5)
  • 二级引证文献(31)
2020(4)
  • 引证文献(0)
  • 二级引证文献(4)
研究主题发展历程
节点文献
自然语言处理
术语抽取
多策略
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
总被引数(次)
317027
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导