作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
n-grams语言模型作为文本分类中常用的特征,具有结构简单、易筛选、携带语义量大以及对分类贡献值高等优点.但由于其固有的结构特点,在使用普通的选择加权及匹配算法时会造成权值区分不明显,并产生大量稀疏数据,使得建立的分类模型不准确,进而导致最终分类结果的偏差.为解决上述问题,根据词性、语义及词汇的内在偏序关系,提出一种结合词汇、词性和语义的特征选择加权及匹配算法,使n-grams特征权值区分明显的同时避免在训练和测试过程中产生大量稀疏数据.在美国当代英语语料库和北京BBC汉语语料库中的实验结果表明,与传统的n-grams特征选择加权及匹配算法相比,基于多尺度的n-grams特征选择加权及匹配算法中得到的n-grams特征权值区分明显且稀疏数据大幅减少,在支持向量机(Support Vector Machine,SVM)中的分类效果更好.
推荐文章
基于字矩阵交运算的n-grams特征选择加权算法
汉语单双字识别
字矩阵
交运算
特征选择
特征加权
基于多尺度支撑域描述子的多光谱图像匹配算法
多光谱图像匹配
特征描述子
外点去除
基于尺度不变Harris特征的准稠密匹配算法
尺度不变Harris特征
准稠密匹配
局部非极大值抑制
三维重建
基于多尺度特征映射匹配的图像表示方法
空间金字塔
响应匹配
多尺度窗口
图像表示
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于多尺度的n-grams特征选择加权及匹配算法
来源期刊 智能计算机与应用 学科 工学
关键词 n-grams 特征选择 特征加权 偏序集 词性 语义近似度
年,卷(期) 2020,(1) 所属期刊栏目 学术研究与应用
研究方向 页码范围 61-66
页数 6页 分类号 TP391.1
字数 3808字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘世兴 辽宁机电职业技术学院信息工程系 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (4)
共引文献  (14)
参考文献  (3)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1995(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
n-grams
特征选择
特征加权
偏序集
词性
语义近似度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
智能计算机与应用
双月刊
2095-2163
23-1573/TN
大16开
哈尔滨市南岗区繁荣街155号(哈工大新技术楼916室)
14-144
1985
chi
出版文献量(篇)
6183
总下载数(次)
26
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导