基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
近年来,使用机器学习算法从导游投诉文本数据中识别出导游违规行为,辅助旅游监管人员工作,为旅游监管提供依据,成为一个必然趋势.然而导游投诉文本存在着语料单一、难以获取等困难,如何对这些导游投诉文本进行文本增强以满足导游违规行为识别需要,是一个迫切需要解决的问题.针对这一问题,提出了一种基于EDA(easy data augmentation)和回译的导游投诉文本混合增强方法.从EDA和回译两个角度对导游投诉文本进行增强,将两种方法返回的增强投诉语料进行混合,得到最终的增强文本;并将该方法在实际的导游违规行为识别系统中进行了应用与验证.通过大量实验对该方法与传统的EDA文本增强方法、回译文本增强方法进行了分析与对比,实验数据表明,基于EDA和回译的导游投诉文本混合增强方法相对于其他两种传统文本增强方法具有更高的准确率和更优秀的文本增强效果,应用在实际的导游违规行为识别系统中得到了87.54%的准确率,相比原始数据集准确率提升了7.4%.
推荐文章
基于混合克隆量子遗传策略的文本特征选择方法
特征选择
文本分类
量子遗传
克隆算法
试谈可译和不可译
翻译
可译性
不可译性
基于改进CFSFDP算法的电信投诉文本聚类方法
CFSFDP算法
文本聚类
电信投诉
密度
距离
差分进化
基于USB和EDA的硬件加密系统
USB
EDA
FPGA
数据加密
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于EDA和回译的导游投诉文本混合增强方法
来源期刊 计算机技术与发展 学科
关键词 导游违规行为识别 文本增强 EDA 回译 混合增强
年,卷(期) 2021,(3) 所属期刊栏目 大数据分析与挖掘
研究方向 页码范围 21-26
页数 6页 分类号 TP391
字数 语种 中文
DOI 10.3969/j.issn.1673-629X.2021.03.004
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (13)
共引文献  (32)
参考文献  (3)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(2)
  • 参考文献(0)
  • 二级参考文献(2)
2014(1)
  • 参考文献(0)
  • 二级参考文献(1)
2015(2)
  • 参考文献(0)
  • 二级参考文献(2)
2016(3)
  • 参考文献(1)
  • 二级参考文献(2)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
导游违规行为识别
文本增强
EDA
回译
混合增强
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导