基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对自杀意念检测,建立一个可迁移性强的自杀词典,并提出词性特征,以提高基于n-gram特征的自杀意念检测模型的分类准确率.采用对比实验与控制变量的方式,以n-gram特征、语言特征(词汇特征、词性特征)为输入特征,以随机森林、支持向量机算法为驱动,重点研究语言特征对模型性能的影响,同时探究在不同特征下不同分类算法训练模型的性能表现.结果表明:语言特征对模型性能有大幅提升,通过比较发现,基于n-gram特征与语言特征的模型性能优于基于n-gram特征和词典特征的模型和基于n-gram特征的模型,其中在随机森林算法下性能提升约20%.
推荐文章
基于多文本特征融合的中文微博的立场检测
立场检测
情感分析
文本特征表示
微博
文本分类
基于情绪特征的中文微博用户性别识别
性别识别
中文微博
情绪风格特征
情绪词特征
中文微博情感倾向性分析特征工程
情感倾向性分析
中文微博
特征工程
微博语言的复杂网络特征研究
微博
语言特征
语言网络
复杂网络
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于中文微博语言特征的自杀意念检测
来源期刊 中北大学学报(自然科学版) 学科 工学
关键词 自杀意念 语言特征 支持向量机 随机森林
年,卷(期) 2019,(4) 所属期刊栏目 自动化与计算机
研究方向 页码范围 350-357
页数 8页 分类号 TP311
字数 7933字 语种 中文
DOI 10.3969/j.issn.1673-3193.2019.04.010
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 宋文爱 中北大学软件学院 107 470 11.0 16.0
2 许立鹏 中北大学软件学院 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (82)
共引文献  (27)
参考文献  (25)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(1)
  • 二级参考文献(0)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(2)
  • 参考文献(1)
  • 二级参考文献(1)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(6)
  • 参考文献(1)
  • 二级参考文献(5)
2002(5)
  • 参考文献(2)
  • 二级参考文献(3)
2003(8)
  • 参考文献(0)
  • 二级参考文献(8)
2004(8)
  • 参考文献(0)
  • 二级参考文献(8)
2005(10)
  • 参考文献(1)
  • 二级参考文献(9)
2006(4)
  • 参考文献(1)
  • 二级参考文献(3)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(5)
  • 参考文献(3)
  • 二级参考文献(2)
2009(5)
  • 参考文献(1)
  • 二级参考文献(4)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(3)
  • 参考文献(0)
  • 二级参考文献(3)
2012(6)
  • 参考文献(0)
  • 二级参考文献(6)
2013(6)
  • 参考文献(1)
  • 二级参考文献(5)
2014(9)
  • 参考文献(1)
  • 二级参考文献(8)
2015(5)
  • 参考文献(4)
  • 二级参考文献(1)
2016(3)
  • 参考文献(3)
  • 二级参考文献(0)
2017(4)
  • 参考文献(4)
  • 二级参考文献(0)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
自杀意念
语言特征
支持向量机
随机森林
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中北大学学报(自然科学版)
双月刊
1673-3193
14-1332/TH
大16开
太原13号信箱
1979
chi
出版文献量(篇)
2903
总下载数(次)
7
总被引数(次)
15437
论文1v1指导