基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出了一种从含有表格的文本图像的页面中提取文字的算法.该算法通过模板扫描形成包围图像前景像素的矩形框,从而提取出前景像素,进而组合矩形框形成模式链.利用模式的最大黑游程、长、宽三个统计特征实现对模式的分类.实验结果表明,该算法不仅对普通的表格有效,而且还可以从倾斜的表格及流程图中成功地提取出文字.本算法只适用于二值图像.
推荐文章
桌面云应用中文字增强技术的初步研究
桌面云
文字检测
最大稳定极值区域
Adaboost算法
C4.5决策树
视频文本图像增强算法研究
OCR
文字增强
Shannon 插值
Niblack 二值化
改进的 Niblack 二值化
基于几何约束的文本图像倾斜角检测算法
文本图像
倾斜检测
字符顶点
几何约束
基于生成式对抗网络的中文字体风格迁移
风格迁移
生成式对抗网络
卷积神经网络
残差网络
深度学习
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 表格文本图像中文字的提取算法
来源期刊 数据采集与处理 学科 工学
关键词 文本图像 页面分割 模式 文字提取
年,卷(期) 2004,(4) 所属期刊栏目 理论与试验研究
研究方向 页码范围 381-385
页数 5页 分类号 TP751|O4
字数 2545字 语种 中文
DOI 10.3969/j.issn.1004-9037.2004.04.005
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 何振亚 东南大学无线电系 81 1227 19.0 33.0
2 黄贤武 苏州大学电子信息学院 65 993 16.0 29.0
3 王加俊 苏州大学电子信息学院 66 515 12.0 19.0
4 李艳玲 苏州大学电子信息学院 8 24 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (4)
参考文献  (6)
节点文献
引证文献  (4)
同被引文献  (1)
二级引证文献  (12)
1992(2)
  • 参考文献(1)
  • 二级参考文献(1)
1996(2)
  • 参考文献(1)
  • 二级参考文献(1)
1999(2)
  • 参考文献(1)
  • 二级参考文献(1)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2006(1)
  • 引证文献(1)
  • 二级引证文献(0)
2007(3)
  • 引证文献(2)
  • 二级引证文献(1)
2008(1)
  • 引证文献(0)
  • 二级引证文献(1)
2010(5)
  • 引证文献(1)
  • 二级引证文献(4)
2011(4)
  • 引证文献(0)
  • 二级引证文献(4)
2012(1)
  • 引证文献(0)
  • 二级引证文献(1)
2013(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
文本图像
页面分割
模式
文字提取
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
数据采集与处理
双月刊
1004-9037
32-1367/TN
大16开
南京市御道街29号1016信箱
28-235
1986
chi
出版文献量(篇)
3235
总下载数(次)
7
总被引数(次)
25271
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导