基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
本文提出在压缩域上直接对MPEG音频信号进行分析,达到电视节目实时分析检索目的.算法分为三步:首先利用压缩域特征对音频信号进行分割,然后应用分层方法把分割出来的音频片段粗分成音乐、语音和其它三个基本类别;由于话者身份是语音信号中的重要检索线索,最后利用隐马尔可夫链实现了与文本无关的话者识别,并用识别出来的话者身份对语音信号和其相应的视频进行标注
推荐文章
电视节目制作中的压缩格式
Motion-JPEG压缩
DV压缩
MPEG-2压缩
人脸识别技术在电视节目内容监管中的应用
电视节目内容监管
人脸识别
应用思路
对电视节目策划的探讨
电视节目
策划
阐述
作用
问题
有效措施
浅谈电视节目的创新
电视节目
创新
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于压缩域特征话者识别的电视节目分类检索
来源期刊 模式识别与人工智能 学科 工学
关键词 压缩域 隐马尔可夫链 话者识别 电视节目检索
年,卷(期) 2002,(1) 所属期刊栏目 论文与报告
研究方向 页码范围 21-27
页数 7页 分类号 TP391.4
字数 6825字 语种 中文
DOI 10.3969/j.issn.1003-6059.2002.01.004
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 庄越挺 浙江大学人工智能研究所 100 2810 28.0 50.0
2 潘云鹤 浙江大学人工智能研究所 204 7394 51.0 80.0
3 吴飞 浙江大学人工智能研究所 225 2325 27.0 39.0
4 刘骏伟 浙江大学人工智能研究所 7 207 5.0 7.0
5 郑科 浙江大学人工智能研究所 5 71 4.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (8)
节点文献
引证文献  (6)
同被引文献  (0)
二级引证文献  (60)
1975(1)
  • 参考文献(1)
  • 二级参考文献(0)
1985(1)
  • 参考文献(1)
  • 二级参考文献(0)
1989(1)
  • 参考文献(1)
  • 二级参考文献(0)
1993(1)
  • 参考文献(1)
  • 二级参考文献(0)
1995(1)
  • 参考文献(1)
  • 二级参考文献(0)
1997(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(2)
  • 参考文献(2)
  • 二级参考文献(0)
2002(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2004(1)
  • 引证文献(1)
  • 二级引证文献(0)
2005(3)
  • 引证文献(3)
  • 二级引证文献(0)
2006(3)
  • 引证文献(0)
  • 二级引证文献(3)
2007(9)
  • 引证文献(2)
  • 二级引证文献(7)
2008(2)
  • 引证文献(0)
  • 二级引证文献(2)
2009(3)
  • 引证文献(0)
  • 二级引证文献(3)
2010(1)
  • 引证文献(0)
  • 二级引证文献(1)
2012(6)
  • 引证文献(0)
  • 二级引证文献(6)
2013(14)
  • 引证文献(0)
  • 二级引证文献(14)
2014(6)
  • 引证文献(0)
  • 二级引证文献(6)
2015(1)
  • 引证文献(0)
  • 二级引证文献(1)
2016(5)
  • 引证文献(0)
  • 二级引证文献(5)
2017(6)
  • 引证文献(0)
  • 二级引证文献(6)
2018(4)
  • 引证文献(0)
  • 二级引证文献(4)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
压缩域
隐马尔可夫链
话者识别
电视节目检索
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
模式识别与人工智能
月刊
1003-6059
34-1089/TP
16开
中国科学院合肥智能机械研究所安徽合肥董铺岛合肥1130信箱
26-69
1989
chi
出版文献量(篇)
2928
总下载数(次)
8
总被引数(次)
30919
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导