基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目前语音识别系统的输入都是线性PCM格式的音频文件,然而在实际应用中,需要识别各种格式音频文件以及视频流中的音频,在开始识别前,需要进行音频格式转换并从视频流中进行音频提取.因此,音频格式的转换和从视频中分离出音频信号已成为语音识别系统一种必需的预处理过程.文中介绍了一种将Microsoft的DirectShow技术应用于Windows平台的多种压缩音频格式转换为Windows PCM WAV格式以及从多媒体视频中分离音频信号的方法,并分析了常见音频压缩编码格式经转换后对语音识别系统性能的影响.这对于语音识别技术在实际中的应用有着重要的意义.
推荐文章
基于DirectShow的音视频捕捉和压缩存储
多媒体 视频 音频 DirectShow COM
MPEG-2音视频编辑软件的实现方案
MPEG-2
视频编辑
Direetshow
DES
时间线
采用DirectShow和IP组播技术定制音视频通信系统
DirectShow
Socket 网络编程
IP 组播技术
面向对象
基于DirectShow的无线音视频采集与传输系统的研究
DirectShow
音视频采集
RTP/RTC
实时传输
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 DirectShow技术在音频格式转换及音视频分离方面的应用
来源期刊 计算机应用 学科 工学
关键词 DirectShow 语音识别 音频格式转换 音视频分离
年,卷(期) 2005,(z1) 所属期刊栏目 软件技术与方法
研究方向 页码范围 387-390
页数 4页 分类号 TP37
字数 4815字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 潘接林 中国科学院声学研究所 23 215 7.0 14.0
2 徐燃 中国科学院声学研究所 1 18 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (18)
同被引文献  (5)
二级引证文献  (17)
2005(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2006(2)
  • 引证文献(2)
  • 二级引证文献(0)
2007(3)
  • 引证文献(2)
  • 二级引证文献(1)
2008(2)
  • 引证文献(2)
  • 二级引证文献(0)
2009(6)
  • 引证文献(6)
  • 二级引证文献(0)
2010(3)
  • 引证文献(1)
  • 二级引证文献(2)
2011(4)
  • 引证文献(0)
  • 二级引证文献(4)
2012(6)
  • 引证文献(1)
  • 二级引证文献(5)
2013(5)
  • 引证文献(2)
  • 二级引证文献(3)
2014(2)
  • 引证文献(1)
  • 二级引证文献(1)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
DirectShow
语音识别
音频格式转换
音视频分离
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
总被引数(次)
209512
论文1v1指导