作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
英语自动评分系统在信息化时代下得到长足发展,但现有研究成果对于文本特征的分析和提取依然没有很大进展.针对这一问题,提出基于词向量聚类的文本特征提取算法,并借助随机森林模型对作文大赛中8个作文子集进行预测,并与人工评分结果进了加权分析,研究发现:首先,基于词向量聚类的分析可以从单词频率、词汇大小和分布位置3方面表征文本句式的多样性与复杂性;其次,通过模块化的评分思路对英语自动评分系统进行了4层架构设计:契合度特征生成模块、文本特征生成模块、非文本特征生成模块以及学习模型评估模块;最后,将预测成果进行二次加权分析发现,随机森林模型的英语自动评分效果较好,二次加权K值普遍在0.78以上,最高值为0.905,平均值为0.862,各项参数高于通用评分方法10%~18%,基于Bagging方法的随机森林算法在获取了精确的聚类向量特征后,可以在样本数量不够的情况下有效避免过度拟合误差.该研究为人工智能背景下英语作文自动评分方向的研究提供一定参考和借鉴.
推荐文章
文本聚类在大学英语作文自动评分中应用
文本聚类
自动作文评分
大学英语
写作教学
基于相似度的词聚类算法
词相似度
词聚类
统计语言模型
基于空间聚类与随机森林的稻米富集镉影响因素筛选研究
稻米
空间聚类
随机森林
相关性分析
基于模糊核聚类的多类支持向量机
支持向量机
多类分类
模糊核
二叉树
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于词向量聚类及随机森林的英语作文自动评分研究
来源期刊 微型电脑应用 学科 工学
关键词 英语作文 自动评分 聚类分析
年,卷(期) 2020,(6) 所属期刊栏目 研究与设计
研究方向 页码范围 104-107
页数 4页 分类号 TP319
字数 3747字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 赵瑞雪 辽宁何氏医学院国际教育学院 10 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (69)
共引文献  (6)
参考文献  (9)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1966(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(3)
  • 参考文献(1)
  • 二级参考文献(2)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(6)
  • 参考文献(0)
  • 二级参考文献(6)
2012(8)
  • 参考文献(0)
  • 二级参考文献(8)
2013(8)
  • 参考文献(0)
  • 二级参考文献(8)
2014(8)
  • 参考文献(0)
  • 二级参考文献(8)
2015(9)
  • 参考文献(0)
  • 二级参考文献(9)
2016(7)
  • 参考文献(0)
  • 二级参考文献(7)
2017(10)
  • 参考文献(0)
  • 二级参考文献(10)
2018(4)
  • 参考文献(1)
  • 二级参考文献(3)
2019(6)
  • 参考文献(6)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
英语作文
自动评分
聚类分析
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
微型电脑应用
月刊
1007-757X
31-1634/TP
16开
上海市华山路1954号上海交通大学铸锻楼314室
4-506
1984
chi
出版文献量(篇)
6963
总下载数(次)
20
总被引数(次)
28091
论文1v1指导