基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着互联网整体水平的提高,大量基于维吾尔文的网络信息不断建立,引起了对不同领域的信息进行情感倾向性分析的迫切需要.该文考虑到维吾尔文没有足够的情感训练语料和完整的情感词典,结合机器学习方法和词典方法的优点,构建一个分类器模型LCUSCM(Lexicon-based and Corpus-based Uyghur Text Sentiment Classification Model),先用自己构建的维吾尔文情感词典对语料进行高质量的情感分类,分类过程中对词典进行递归扩充,再根据每条句子的情感得分,从词典分类的结果中选择一部分语料来训练一个分类器并改进第一步的分类结果.此方法的正确率比单独使用机器学习方法提高了9.13%,比词典方法提高了1.82%.
推荐文章
利用N-gram和语义分析的维吾尔语文本相似性检测方法
维吾尔语
文本相似性检测
N-gram统计模型
潜在语义分析
基于deep belief nets的维吾尔语句子级情感分析
维吾尔语
情感分类
深度学习
深度信念网络
词语嵌入
维吾尔语褒贬情感词典构建研究
维吾尔语
情感极性判别
点互信息算法
语料库
结合情感词典的主动贝叶斯文本情感分类方法
主动学习
文本情感分类
情感词典
朴素贝叶斯
不确定采样策略
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 词典与机器学习方法相结合的维吾尔语文本情感分析
来源期刊 中文信息学报 学科 工学
关键词 维吾尔文 情感词典 情感分析 机器学习
年,卷(期) 2017,(1) 所属期刊栏目 情感分析与社会计算
研究方向 页码范围 177-183,191
页数 8页 分类号 TP391
字数 6801字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 吾守尔·斯拉木 新疆大学信息科学与工程学院新疆多语种重点实验室 148 619 13.0 18.0
2 伊尔夏提·吐尔贡 新疆大学信息科学与工程学院新疆多语种重点实验室 3 21 3.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (1)
共引文献  (275)
参考文献  (7)
节点文献
引证文献  (12)
同被引文献  (28)
二级引证文献  (2)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(8)
  • 引证文献(8)
  • 二级引证文献(0)
2020(4)
  • 引证文献(2)
  • 二级引证文献(2)
研究主题发展历程
节点文献
维吾尔文
情感词典
情感分析
机器学习
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息学报
月刊
1003-0077
11-2325/N
16开
北京海淀区中关村南四街4号
1986
chi
出版文献量(篇)
2723
总下载数(次)
5
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导