基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
文章以动窗离散傅立叶变换为基础获取说话人的长时平均频谱(即短时频谱的长时平均),然后将长时平均频谱经过能量归一化和频率归一化后作为"文本无关"话者识别的语音特征.分析之前,语音样本经过频域预加权和时域汉明窗加权处理,并利用帧能量门限自动去除了样本中的寂静段.通过在小人群范围内对该方法的大量实验,得到很好的话者识别效果.另外,作为"文本无关"话者识别的一个重要辅助手段,文章还利用短时频谱分析给出了话者语音样本的窄带三维语图和宽带三维语图,它们能清晰地给出话者语音的时变频率特征.
推荐文章
基于分类器与阵列搜索算法的文本无关说话人识别
说话人识别
小波神经网络
初始值
阵列神经网络
基于帧变换的与文本无关语种辨识系统的实现
语种辨识
混合高斯模型
帧似然概率
用于文本无关的话者识别的超音段信息提取
话者确认
超音段信息
基音
文本无关
基于长时频谱统计参数的说话人识别
长时频谱
LPC
说话人识别
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于长时平均频谱的"文本无关"话者识别
来源期刊 声学技术 学科 工学
关键词 说话人识别 文本无关 长时平均频谱 三维语图
年,卷(期) 2002,(1) 所属期刊栏目 论文与报告
研究方向 页码范围 59-62
页数 4页 分类号 TN912.34
字数 2320字 语种 中文
DOI 10.3969/j.issn.1000-3630.2002.01.015
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王宏 南京航空航天大学电子系 10 80 5.0 8.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (9)
同被引文献  (4)
二级引证文献  (7)
2002(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2003(1)
  • 引证文献(1)
  • 二级引证文献(0)
2005(3)
  • 引证文献(3)
  • 二级引证文献(0)
2006(1)
  • 引证文献(1)
  • 二级引证文献(0)
2008(1)
  • 引证文献(1)
  • 二级引证文献(0)
2009(4)
  • 引证文献(2)
  • 二级引证文献(2)
2010(1)
  • 引证文献(0)
  • 二级引证文献(1)
2011(1)
  • 引证文献(0)
  • 二级引证文献(1)
2016(2)
  • 引证文献(1)
  • 二级引证文献(1)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
说话人识别
文本无关
长时平均频谱
三维语图
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
声学技术
双月刊
1000-3630
31-1449/TB
大16开
上海市小木桥路456号
1982
chi
出版文献量(篇)
3200
总下载数(次)
7
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导