基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出一种新的用于识别视频中字幕文字的方法.鉴于视频中文字的大小、颜色、渲染风格和分辨率的不同,以及视频中各种复杂背景的影响,识别视频中的叠加文字是一个尚未解决的问题.目前,大多数视频叠加文字识别方法都基于视频文字的二值化和传统OCR引擎的结合.然而,二值化过程容易引入噪声和文字笔划信息的丢失.另外,传统OCR技术主要专注于高分辨率的扫描打印文档,这些文档具有背景单一、噪声少和笔划信息较完整的特点.因此,传统OCR引擎用于识别叠加文字二值化后的结果可能不够鲁棒.为解决这个问题,直接从未二值化的叠加视频文字图像中提取Gabor特征用于训练二层字符识别器.实验结果表明,本文提出的方法在多字体视频叠加中文文字识别上有良好的效果.
推荐文章
一种基于多模板匹配的字符识别方法
倾斜校正
字符分割
多模板匹配
一种快速实用的车牌字符识别方法
字符识别
模板匹配
图像细化
Hausdorff距离
一种基于字符分割与字符识别的LPR方法
车牌识别(LPR)
字符分割
字符识别
BP网络
基于字典学习的模糊车牌中文字符识别
中文字符识别
字典学习
主成分分析
Softmax回归
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种免除二值化的视频叠加中文字符识别方法
来源期刊 中国科学院大学学报 学科 工学
关键词 视频叠加文字 OCR Gabor 最近原型分类(NPC)
年,卷(期) 2018,(3) 所属期刊栏目 计算机科学
研究方向 页码范围 402-408
页数 7页 分类号 TP393
字数 语种 中文
DOI 10.7523/j.issn.2095-6134.2018.03.015
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 田洁 中国科学院大学计算机与控制学院 9 128 5.0 9.0
2 王伟强 中国科学院大学计算机与控制学院 12 382 6.0 12.0
3 孙翼 中国科学院大学计算机与控制学院 3 20 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (6)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
视频叠加文字
OCR
Gabor
最近原型分类(NPC)
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中国科学院大学学报
双月刊
2095-6134
10-1131/N
大16开
北京玉泉路19号(甲)
82-583
1984
chi
出版文献量(篇)
2247
总下载数(次)
2
总被引数(次)
15229
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导