原文服务方: 计算机应用研究       
摘要:
数据表达方法和文本分类的效果密切相关.文本分类中常用的数据表达方法主要包括基于词典的共现频率方法、基于隐性语义空间(LSA/SVD)的方法、基于神经网络语言模型的方法.提出一种利用单词的统计特征创建文本分类中特征空间的表达方法.该方法利用单词的七种常见的统计特征,通过相关性分析选取相对独立的统计特征创建特征空间.该方法能够有效降低文本向量空间的维度,同时降低了语义空间内的计算复杂度.情感分类实验的结果表明,与现有的单词的数据表达方法相比,该方法能够显著提高分类算法的准确率和召回率.
推荐文章
基于特征权重的词向量文本表示模型
TF-IDF模型
N-Gram模型
Glove模型
文本表示
结合情感词网的中文短文本情感分类
同义词
情感词网
情感分类
短文本
一种改进的带有情感信息的词向量学习方法
情感分析
词向量
语义
分类
文本分类中一种特征选择方法研究
文本分类
特征选择
分散度
集中度
频度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种利用情感词统计信息构造文本特征表示的方法
来源期刊 计算机应用研究 学科
关键词 数据表达 统计特征 情感分类
年,卷(期) 2019,(7) 所属期刊栏目 系统应用开发
研究方向 页码范围 2087-2092
页数 6页 分类号 TP391.1
字数 语种 中文
DOI 10.19734/j.issn.1001-3695.2018.01.0035
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 马宏伟 山东建筑大学计算机科学与技术学院 19 504 5.0 19.0
2 韩彤晖 山东建筑大学计算机科学与技术学院 2 4 1.0 2.0
3 杨东强 山东建筑大学计算机科学与技术学院 2 4 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (1)
参考文献  (4)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
2002(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2015(2)
  • 参考文献(1)
  • 二级参考文献(1)
2016(2)
  • 参考文献(1)
  • 二级参考文献(1)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
数据表达
统计特征
情感分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导