维汉英混排文档识别

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

维汉英混排文档识别

靳简明, 王华, 丁晓青

文章导航 > 电子与信息学报 > 2006 > 28(7): 1188-1191

靳简明, 王华, 丁晓青. 维汉英混排文档识别[J]. 电子与信息学报, 2006, 28(7): 1188-1191.

引用本文:

靳简明, 王华, 丁晓青. 维汉英混排文档识别[J]. 电子与信息学报, 2006, 28(7): 1188-1191.

Jin Jian-ming, Wang Hua, Ding Xiao-qing. Uyghur, Chinese and English Multilingual Document Recognition[J]. Journal of Electronics & Information Technology, 2006, 28(7): 1188-1191.

Citation:

Jin Jian-ming, Wang Hua, Ding Xiao-qing. Uyghur, Chinese and English Multilingual Document Recognition[J]. Journal of Electronics & Information Technology, 2006, 28(7): 1188-1191.

靳简明, 王华, 丁晓青. 维汉英混排文档识别[J]. 电子与信息学报, 2006, 28(7): 1188-1191.

引用本文:

靳简明, 王华, 丁晓青. 维汉英混排文档识别[J]. 电子与信息学报, 2006, 28(7): 1188-1191.

Jin Jian-ming, Wang Hua, Ding Xiao-qing. Uyghur, Chinese and English Multilingual Document Recognition[J]. Journal of Electronics & Information Technology, 2006, 28(7): 1188-1191.

Citation:

Jin Jian-ming, Wang Hua, Ding Xiao-qing. Uyghur, Chinese and English Multilingual Document Recognition[J]. Journal of Electronics & Information Technology, 2006, 28(7): 1188-1191.

维汉英混排文档识别

计量
- 文章访问数: 2454
- HTML全文浏览量: 196
- PDF下载量: 1100
- 被引次数: 0
出版历程
- 收稿日期: 2004-11-15
- 修回日期: 2005-03-31
- 刊出日期: 2006-07-19

Uyghur, Chinese and English Multilingual Document Recognition

摘要: 维、汉、英是特点完全不同的文字。该文依据多层次语言判断和适当干预的多语言字符识别系统设计原则首次实现了维、汉、英混排文本识别系统。识别系统首先根据维、汉、英文字的各自特点实现字符块语言属性的初步判断，然后针对每种文字设计不同的字符切割算法。字符识别可信度用来判断字符语言属性和字符切分结果是否正确。实验结果表明，各种维、汉、英混排文本识别率达到96.4%以上。
- 混排文本识别;字符切割;字符识别;维吾尔文
Abstract: The characteristics of Uyghur, Chinese and English scripts are totally different. A Uyghur, Chinese and English multilingual document recognition system is implemented the first time based on the multilingual OCR system design principle, which includes multi-layer character language estimation and suitable adjustment. At first, the language property of each text block is estimated according to the characteristics of Uyghur, Chinese and English scripts. After that, language-oriented character segmentation algorithms are performed on text blocks, and the character recognition confidence is used to judge whether the results of character segmentation and language property estimation of a text block are right. Experimental results show the recognition accuracy of Uyghur, Chinese and English multilingual documents achieves 96.4% and above.

参考文献(0)

资源附件(0)

计量

文章访问数: 2454
HTML全文浏览量: 196
PDF下载量: 1100
被引次数: 0

/

下载: 全尺寸图片幻灯片

分享

用微信扫码二维码

分享至好友和朋友圈

返回