基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
本文提出了一种基于统计模型和相邻字符的学习,在图像中提取多种语言文本的方法。三种相邻字符可以用高斯混合模型和通过“伪概率”定义的贝叶斯结构识别来表示。基于该模型,完整的文本提取由二值化图像根据相邻字符或非字符的判别,标识每个相连部件,基于数字结构的方法用来检测和连接每个分割的字符。Voronoi分割方法考虑建立相邻的连接部件。在本文的提取算法中,进一步提出了运用基于最大——最小相似性(MMS)训练算法的判别标准来评估参数。提取中英文文本的实验结果表明,在试验数据集中,MMS训练算法可实现93.56%的准确率和98.55%的重复利用率。实验也显示了MMS提供的重要特性,并与最大相似性(ML)标准和最大分类误差(MCE)训练作了比较。
推荐文章
脱机手写女书字符图像多方向文本行提取
女书
多方向文本行
脱机手写
最小外接矩形
Delaunay三角剖分
链接模型
混合高斯模型和Radon变换用于声呐图像背景抑制
水下运动目标
混合高斯模型
Radon变换
声呐背景抑制
基于混合高斯模型MRF场的CT图像分割
工业CT图像
混合高斯模型
马尔科夫模型
图像分割
基于高斯混合模型的纹理图像的分割
高斯混合模型
EM算法
最大似然估计
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 在图像中提取多种语言文本的高斯混合模型和相邻字符的学习
来源期刊 图象识别与自动化 学科 工学
关键词 文本提取 文本分析 字符识别 图像检索 高斯混合模型 识别训练 EM算法
年,卷(期) 2010,(1) 所属期刊栏目
研究方向 页码范围 23-33
页数 11页 分类号 TN912.34
字数 语种
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2010(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文本提取
文本分析
字符识别
图像检索
高斯混合模型
识别训练
EM算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
图象识别与自动化
半年刊
上海中山北路3185号
出版文献量(篇)
298
总下载数(次)
1
总被引数(次)
0
论文1v1指导