基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
【目的】将语音识别技术应用到农产品价格信息采集中,面向非特定人和限定词汇量的汉语普通话连续语音识别,提出一种适合于农产品价格采集环境的语音识别鲁棒性方法;以隐马尔科夫模型为基础,训练出适合该环境下的声学模型,以缓解因测试环境和训练环境不匹配而导致的识别率降低,进一步提高识别率。【方法】在数据采集和处理阶段,首先根据要识别的限定词汇按照一定的语法规则构建转换文法,利用该文法生成的脚本指导训练集和测试集录音;然后选择不同的农产品价格采集环境和不同的说话人进行语音采集,并进行准确的人工切分,最后构建出语音语料库;在模型训练阶段,选择自左向右无跳转结构的连续混合密度隐马尔科夫模型,对训练集中的数据提取39维的MFCC特征向量,用于模型训练。首先以单音素为建模单元,并分别训练基于隐马尔科夫模型的男声模型、女声模型及男女混合声学模型;然后,考虑到单音素稳定性差和易受协同发音现象影响等因素,以上下文相关的三音素为识别单元建模,重新训练上述模型;针对三音子建模单元带来的模型数量大量增加,进而造成的训练样本不足问题,采用决策树状态聚类方法来改善该问题;决策树的构建过程中,利用语音学知识,根据声母发音方式、发音部位的不同以及韵母构成、韵头的不同,划分出若干声韵母集合实现了二值问题集的设计;在此基础上,用增加混和高斯分量的方法来进一步使得模型描述更加精确;最后,为了解决信道的乘性噪声问题,在采用上述策略的同时利用CMN和CVN方法来缓解测试环境与训练环境不匹配问题,最终训练得到了相应的男声模型和女声模型。在测试阶段,对采用上述各方法后得到的不同模型,分别采用相同的测试集进行试验,得出不同方法下的句子识别率、词识别率以及精准度。【结果】三音子声学模型的识别性能明显优于单音素声学模型,女声模型和男声模型的性能均优于男女混合声学模型,决策树聚类方法对识别率的提高不明显但可以明显减少三音子模型的数量,混合高斯分量的增加对识别率具有一定提高但同时带来计算量的增加,CMN和CVN方法可以明显提高系统的识别性能。通过对不同地点和不同说话人进行测试,最终识别率男性为95.04%,女性为97.62%。【结论】语音识别技术应用到农产品价格信息采集过程中是可行的。本文提出了一种农产品价格采集环境下提高语音识别率的方法,试验证明通过该方法训练出的模型具有较好的识别性能,本研究方法为日后应用系统的开发奠定了基础。
推荐文章
我国主要农产品价格波动特征研究
hp滤波
农产品生产价格指数
波动周期
谁是影响农产品价格波动的“元凶”?
农产品价格
价格波动
流通环节
正常运行
探究问题
运动过程
消费者
工业品
基于GIS的农产品价格聚类的可视化
GIS
空间插值
聚类
可视化
内蒙古农产品价格影响因素实证分析
农产品
VAR模型
价格影响因素
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于语音识别的农产品价格信息采集方法
来源期刊 中国农业科学 学科
关键词 语音识别 农产品价格 信息采集 倒谱均值方差归一化(CMVN) 决策树聚类
年,卷(期) 2015,(3) 所属期刊栏目
研究方向 页码范围 449-459
页数 11页 分类号
字数 语种 中文
DOI 10.3864/j.issn.0578-1752.2015.03.05
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (231)
共引文献  (140)
参考文献  (22)
节点文献
引证文献  (9)
同被引文献  (56)
二级引证文献  (19)
1966(1)
  • 参考文献(0)
  • 二级参考文献(1)
1972(1)
  • 参考文献(0)
  • 二级参考文献(1)
1974(1)
  • 参考文献(0)
  • 二级参考文献(1)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1976(3)
  • 参考文献(0)
  • 二级参考文献(3)
1979(1)
  • 参考文献(0)
  • 二级参考文献(1)
1980(2)
  • 参考文献(0)
  • 二级参考文献(2)
1981(1)
  • 参考文献(0)
  • 二级参考文献(1)
1985(2)
  • 参考文献(0)
  • 二级参考文献(2)
1988(2)
  • 参考文献(0)
  • 二级参考文献(2)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(7)
  • 参考文献(1)
  • 二级参考文献(6)
1991(4)
  • 参考文献(0)
  • 二级参考文献(4)
1992(3)
  • 参考文献(0)
  • 二级参考文献(3)
1993(3)
  • 参考文献(0)
  • 二级参考文献(3)
1994(4)
  • 参考文献(0)
  • 二级参考文献(4)
1995(10)
  • 参考文献(0)
  • 二级参考文献(10)
1996(3)
  • 参考文献(0)
  • 二级参考文献(3)
1997(7)
  • 参考文献(0)
  • 二级参考文献(7)
1998(6)
  • 参考文献(0)
  • 二级参考文献(6)
1999(3)
  • 参考文献(0)
  • 二级参考文献(3)
2000(14)
  • 参考文献(1)
  • 二级参考文献(13)
2001(9)
  • 参考文献(1)
  • 二级参考文献(8)
2002(12)
  • 参考文献(0)
  • 二级参考文献(12)
2003(17)
  • 参考文献(1)
  • 二级参考文献(16)
2004(8)
  • 参考文献(2)
  • 二级参考文献(6)
2005(16)
  • 参考文献(0)
  • 二级参考文献(16)
2006(16)
  • 参考文献(1)
  • 二级参考文献(15)
2007(19)
  • 参考文献(0)
  • 二级参考文献(19)
2008(19)
  • 参考文献(2)
  • 二级参考文献(17)
2009(19)
  • 参考文献(2)
  • 二级参考文献(17)
2010(15)
  • 参考文献(1)
  • 二级参考文献(14)
2011(8)
  • 参考文献(1)
  • 二级参考文献(7)
2012(10)
  • 参考文献(6)
  • 二级参考文献(4)
2013(4)
  • 参考文献(2)
  • 二级参考文献(2)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(5)
  • 引证文献(4)
  • 二级引证文献(1)
2018(9)
  • 引证文献(2)
  • 二级引证文献(7)
2019(13)
  • 引证文献(2)
  • 二级引证文献(11)
研究主题发展历程
节点文献
语音识别
农产品价格
信息采集
倒谱均值方差归一化(CMVN)
决策树聚类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中国农业科学
半月刊
0578-1752
11-1328/S
大16开
北京中关村南大街12号
2-138
1960
chi
出版文献量(篇)
9193
总下载数(次)
12
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导