基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为摆脱中文自动分词过程中对庞大 词库和复杂分词处理程序的依赖,提出了中文关键词信息的提取方法,该方法采用基于2-grams的短语标引来进行中文关键词的抽取。首先采用2-grams方法提取出权重较大的2元关键词,再抽取能充分标引文章内容的短语关键词,以提高对文档内容的表达能力。
推荐文章
基于主题特征的关键词抽取
关键词抽取
主题特征
主题模型
装袋决策树
关键词抽取策略研究
关键词抽取
词频
间距
词性
重要度
基于贝叶斯推理和TFIDF算法的中文关键词智能抽取
TFIDF
文本挖掘
贝叶斯统计
关键词提取
基于组合词和同义词集的关键词提取算法
组合词
同义词集
中文网页
关键词提取
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于2—grams短语标引的关键词自动抽取
来源期刊 绍兴文理学院学报:自然科学版 学科 工学
关键词 短语标引 自动抽取 中文文本分类 关键词抽取 2-grams 中文信息处理 自动分词
年,卷(期) sxwlxyxbzrkxb_2002,(3) 所属期刊栏目
研究方向 页码范围 52-54
页数 3页 分类号 TP391.12
字数 语种
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈治平 湖南大学电气与信息工程学院 42 947 18.0 30.0
2 张海燕 湖南大学电气与信息工程学院 23 325 9.0 18.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2002(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
短语标引
自动抽取
中文文本分类
关键词抽取
2-grams
中文信息处理
自动分词
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
绍兴文理学院学报:自然科学版
季刊
1008-293X
33-1209/C
浙江省绍兴市环城西路508号
出版文献量(篇)
672
总下载数(次)
0
论文1v1指导