基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
建议挖掘作为一项新兴研究任务,具有重要的应用价值.针对传统建议语句分类方法所存在的规则复杂、标注工作量大、特征维度高、数据稀疏等问题,提出一种基于PU学习的建议语句分类方法.首先,使用简单规则从无标注评论集合中选择建议语句的正例集合;然后,为了降低特征维度,缓解数据稀疏性,在自编码神经网络(Autoencoder)特征空间中使用Spy技术划分可靠反例集合;最后,利用正例集合和可靠反例集合来训练多层感知机(MLP)对剩余的无标注样例进行分类.该方法在中文数据集上的F1值和准确率值分别达到81.98%和82.67%,实验结果表明,该方法能够有效地对建议语句进行分类,且不需要对数据进行人工标注.
推荐文章
基于集成 PU 学习数据流分类的入侵检测方法
入侵检测
集成分类
数据流
学习
基于SVM主动学习技术的 PU 文本分类
支持向量机
主动学习
PU
文本分类
Rocchio
基于SVM主动学习技术的 PU 文本分类
支持向量机
主动学习
PU
文本分类
Rocchio
一种基于改进PU学习理论的推送内容过滤策略
PU学习理论
信息推送
内容过滤
文本分类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于PU学习的建议语句分类方法
来源期刊 计算机应用 学科 工学
关键词 建议挖掘 建议语句分类 PU学习 自编码器 多层感知机
年,卷(期) 2019,(3) 所属期刊栏目 人工智能
研究方向 页码范围 639-643
页数 5页 分类号 TP391
字数 7533字 语种 中文
DOI 10.11772/j.issn.1001-9081.2018081759
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张璞 重庆邮电大学计算机科学与技术学院 23 124 7.0 10.0
2 刘畅 重庆邮电大学计算机科学与技术学院 13 19 3.0 3.0
3 李逍 重庆邮电大学计算机科学与技术学院 3 4 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (61)
共引文献  (71)
参考文献  (8)
节点文献
引证文献  (2)
同被引文献  (1)
二级引证文献  (0)
1977(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(3)
  • 参考文献(0)
  • 二级参考文献(3)
2009(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(5)
  • 参考文献(0)
  • 二级参考文献(5)
2011(6)
  • 参考文献(0)
  • 二级参考文献(6)
2012(11)
  • 参考文献(0)
  • 二级参考文献(11)
2013(10)
  • 参考文献(1)
  • 二级参考文献(9)
2014(5)
  • 参考文献(0)
  • 二级参考文献(5)
2015(5)
  • 参考文献(4)
  • 二级参考文献(1)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(2)
  • 参考文献(1)
  • 二级参考文献(1)
2018(3)
  • 参考文献(1)
  • 二级参考文献(2)
2019(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
建议挖掘
建议语句分类
PU学习
自编码器
多层感知机
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
论文1v1指导