基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
音频特征向量已广泛应用于音频分类的研究,该表示形式虽能有效体现音频的固有特性,但无法表示音频信息多语义特性及各语义间的相关性.提出了基于张量统一内容定位(TUCL)的音频语义表征方式,将音频语义描述表示为三阶张量,并构建多语义张量空间.在此空间中,张量语义离散度(TSD)能有效聚集具有相同语义的音频资源,通过计算各音频资源的TSD来完成对音频资源的分类,并构建了RBF张量神经网络(RBFTNN)来自适应学习分类模型.实验结果表明,在多语义分类的情况下,TSD算法的分类性能明显优于当前典型的高斯混合模型(GMM)算法;通过与支持向量机(SVM)学习模型相比可知,基于TSD的RBFTNN模型分类学习的准确率明显优于基于TSD的SVM模型.
推荐文章
基于双向长短时记忆单元和卷积神经网络的多语种文本分类方法
多语种文本分类
长短时记忆单元
卷积神经网络
基于叠层循环神经网络的语义关系分类模型
叠层循环神经网络
多句法结构
Bi-Tree-LSTM
注意力机制
关系分类
基于卷积神经网络的植物图像分类方法研究
卷积神经网络
图像特征
图像分类
全卷积网络
植物图像
数据集
基于RBF神经网络的图形分类方法
图形分类
傅立叶变换
RBF神经网络
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于张量神经网络的音频多语义分类方法
来源期刊 计算机应用 学科 工学
关键词 语义离散度 多语义分类 语义表征 张量语义空间 神经网络
年,卷(期) 2012,(10) 所属期刊栏目 人工智能
研究方向 页码范围 2895-2898
页数 分类号 TP18|TP391
字数 4660字 语种 中文
DOI 10.3724/SP.J.1087.2012.02895
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 邢玲 西南科技大学信息工程学院 21 189 6.0 13.0
2 马强 西南科技大学信息工程学院 10 49 3.0 6.0
3 朱敏 西南科技大学信息工程学院 5 8 2.0 2.0
4 贺梅 西南科技大学信息工程学院 1 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (22)
参考文献  (8)
节点文献
引证文献  (2)
同被引文献  (12)
二级引证文献  (0)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(2)
  • 参考文献(2)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
语义离散度
多语义分类
语义表征
张量语义空间
神经网络
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
论文1v1指导