基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
唇部视觉信息作为语音识别的辅助信息一直受到广泛关注,为更好的提取唇部视觉信息,提出一种基于稀疏深度信念网络(Deep Belief Network,DBN)和双向长短期记忆网络(Bidirectional Long Short-Term Memory,BiLSTM)的视觉语音识别算法.该算法通过在DBN的目标函数后引入混合的l1/2范数和l1范数来实现DBN的稀疏表示,以此稀疏DBN对唇部视觉信息进行稀疏瓶颈特征的提取,再将提取的瓶颈特征送入BiLSTM进行特征的学习分类.实验表明,该算法能有效的识别唇部视觉信息.
推荐文章
基于AdaBoost-LSTM模型的语音情绪识别研究
语音识别
情绪识别
Adaboost-LSTM
基于三维卷积与双向LSTM的行为识别研究
行为识别
三维卷积
双向LSTM
双中心loss
联合训练
计算机视觉
基于DBN的辐射源信号识别算法
雷达辐射源
时频变换
识别
深度信念网络
分类器
基于深度图像和稀疏表示的多手势识别算法
深度图像
稀疏表示
多目标手势
手势分割
手势识别
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于稀疏DBN和双向LSTM的视觉语音识别算法
来源期刊 数据通信 学科 工学
关键词 稀疏深度信念网络 双向长短期记忆网络 视觉语音识别 稀疏表示
年,卷(期) 2019,(3) 所属期刊栏目 技术方案
研究方向 页码范围 9-15
页数 7页 分类号 TP391
字数 5239字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈恳 宁波大学信息科学与工程学院 51 233 9.0 12.0
2 王一鸣 宁波大学信息科学与工程学院 3 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1954(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
稀疏深度信念网络
双向长短期记忆网络
视觉语音识别
稀疏表示
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
数据通信
双月刊
1002-5057
11-2841/TP
大16开
北京市海淀区学院路40号
82-891
1980
chi
出版文献量(篇)
2014
总下载数(次)
6
论文1v1指导