基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
MPEG-4首次作为国际标准正式定义了视位(Viseme)的概念,它是指与某一音位相对应的嘴、舌头、下腭等可视发音器官所处的状态.本文通过对汉语发音时各可见部分器官动作和发音规则的研究,将汉语发音分为28个基本静态视位.利用语音信息从AVI文件中自动抽取出这些基本视位图像,从MPEG-4所规定的68个面部动画参数(FAP)中提取出28个来描述这些口形,并实现了部分FAP参数的自动测量.最后,我们给出一个视位研究应用的实例.
推荐文章
汉语语音声调提取技术方法研究
基音周期
基音检测
声调提取
语音合成
汉语语音同步的三维口型动画研究
语音可视化
协同发音模型
口型动画
语音动画
基于DPI技术的语音视频流量监控系统设计与实现
DPI技术
语音视频监控系统
网络协议
流量监控架构
基于字统计语言模型的汉语语音识别研究
统计语言模型
N-gram文法
汉语语音识别
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 汉语语音视位的研究
来源期刊 应用声学 学科 工学
关键词 视位 面部动画参数 文本-语音转换系统 文本-可视语音转换系统
年,卷(期) 2002,(3) 所属期刊栏目 研究报告
研究方向 页码范围 29-34
页数 6页 分类号 TP391
字数 4673字 语种 中文
DOI 10.3969/j.issn.1000-310X.2002.03.007
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 蔡莲红 清华大学计算机系 74 978 18.0 30.0
2 王志明 清华大学计算机系 5 100 5.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (4)
共引文献  (3)
参考文献  (1)
节点文献
引证文献  (27)
同被引文献  (18)
二级引证文献  (123)
1973(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2004(2)
  • 引证文献(1)
  • 二级引证文献(1)
2005(4)
  • 引证文献(3)
  • 二级引证文献(1)
2006(6)
  • 引证文献(3)
  • 二级引证文献(3)
2007(18)
  • 引证文献(3)
  • 二级引证文献(15)
2008(15)
  • 引证文献(2)
  • 二级引证文献(13)
2009(13)
  • 引证文献(2)
  • 二级引证文献(11)
2010(12)
  • 引证文献(3)
  • 二级引证文献(9)
2011(12)
  • 引证文献(1)
  • 二级引证文献(11)
2012(13)
  • 引证文献(2)
  • 二级引证文献(11)
2013(12)
  • 引证文献(2)
  • 二级引证文献(10)
2014(15)
  • 引证文献(3)
  • 二级引证文献(12)
2015(12)
  • 引证文献(2)
  • 二级引证文献(10)
2016(3)
  • 引证文献(0)
  • 二级引证文献(3)
2017(5)
  • 引证文献(0)
  • 二级引证文献(5)
2018(6)
  • 引证文献(0)
  • 二级引证文献(6)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
视位
面部动画参数
文本-语音转换系统
文本-可视语音转换系统
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
应用声学
双月刊
1000-310X
11-2121/O4
16开
北京海淀北四环西路21号
2-561
1982
chi
出版文献量(篇)
1890
总下载数(次)
4
总被引数(次)
11949
论文1v1指导