CN101339617A - 手机拍照翻译装置 - Google Patents

手机拍照翻译装置 Download PDF

Info

Publication number
CN101339617A
CN101339617A CNA2007100435408A CN200710043540A CN101339617A CN 101339617 A CN101339617 A CN 101339617A CN A2007100435408 A CNA2007100435408 A CN A2007100435408A CN 200710043540 A CN200710043540 A CN 200710043540A CN 101339617 A CN101339617 A CN 101339617A
Authority
CN
China
Prior art keywords
unit
engine
translation
photographing
interface
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007100435408A
Other languages
English (en)
Inventor
杨健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI SPEED COMMUNICATION TECHNOLOGY Co Ltd
Original Assignee
SHANGHAI SPEED COMMUNICATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI SPEED COMMUNICATION TECHNOLOGY Co Ltd filed Critical SHANGHAI SPEED COMMUNICATION TECHNOLOGY Co Ltd
Priority to CNA2007100435408A priority Critical patent/CN101339617A/zh
Publication of CN101339617A publication Critical patent/CN101339617A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明公开了一种手机拍照翻译装置,包括:一个拍摄单元;一个用户界面单元;一个字符特征图像识别引擎(OCR engine)单元;一个翻译引擎单元,一个图像预处理单元。本发明公开的手机拍照翻译装置,使对字符特征图像识别在手持设备上的加载、拍照设备拍摄印刷体文字的获取处理、识别文字校正与显示的人机交互向导、对数字图像识别字符的识别、对翻译识别文字以及储存识别结果都变得十分方便,概括起来,本发明对所需要的资料能及时翻译,具有高效的输入功能,为手机功能提供了新的发展机遇。

Description

手机拍照翻译装置
技术领域
本发明涉及数字图像处理领域、模式识别领域、及嵌入式设备领域,特别涉及一种手持设备拍照翻译设备。
背景技术
随着手持设备的发展和普及,手机已经越来越成为人们日常生活随身携带的电子设备,而如何将需要翻译的资料高效输入,并将资料及时翻译,为手机功能提供新的发展机遇。
发明内容
本发明的目的是提供一种拍照翻译装置。
本发明的目的是通过以下技术方案实现的:
一种拍照翻译装置,包括:
字符特征图像识别(OCR)引擎单元,用于将文字资料数字图像中的字符转换成字符标准内码。
一个翻译引擎单元,用于翻译OCR识别出来的文字资料;
一个至少具有130万像素并具有微距功能的拍摄单元,用于拍摄获取名片的数字图像;
一个图像预处理单元,用于将拍摄的图像转换成翻译引擎单元所能识别的图像格式,将图像进行二值化压缩,用于提升识别速度;
一个用户界面单元,用于与用户交互,向导用户使用该功能界面。
其中,该OCR引擎单元包括:
引擎库单元,用于存储字符特征向量;
引擎设置单元,用于设置运行模式或数字图像参数;
引擎启动单元,用于分配运行空间、将引擎库装载入内存,启动引擎为可执行状态;
引擎版面分析单元,用于划分版面,分割翻译单词区域,将可识别字符用连通区域框定;
引擎识别单元,用于识别连通区内的数字图像,根据数字图像直观形象提取特征进行识别,输出字符内码;以及
引擎关闭单元,释放内存空间,关闭引擎。
该引擎库单元包括:
翻译库单元,用于存放词与翻译内容的对照表;以及
翻译接口单元,用于提供输入翻译字,获取翻译结果的接口。
图像预处理单元:从照相设备单元获取数字图像,该图像分辨率在1280×960以上,Jpg图像经过硬件解码转为16位rgb图像,从16位rgb图像转化为8位灰度bmp格式图像,然后对图像进行二值化处理;
二值图像是指整幅图像画面内仅黑(灰度值为0)白(灰度值为1)二值的图像,在它们上面不呈现出灰度的变化。在数字图像处理中,二值图像占有非常重要的地位。这是因为在实用的图像处理***中,要求处理的速度高、成本低,信息量大的浓淡图像处理花销太大,不是上策。而且二值化后的图像能够用几何学中的概念进行分析和特征描述,比起灰度图像来说方便得多。因而二值图像处理目前已成为图像处理中的一个独立的、重要分支而获得广泛的应用。
设表示像素在(i,j)位置的灰度值,二值化处理为下式所示。
f ( i , j ) = 1 f ( i , j ) ≥ t 0 f ( i , j ) ≤ t
这里t为二值化阈值(Threshold)。像素的8-邻域(8-Neighbor),除去d-近邻的像素外,余下的对角线上的4个像素,称为(i,j)的非直接邻域,符号是:i-近邻。某个像素的连接数可以用这个像素的8-邻域值f(x0)…f(x7)来计算。
N c = Σ k = 0,2,4,6 [ ( 1 - f ( x k ) ) - ( 1 - f ( x k ) ) ( 1 - f ( x k + 1 ) ) ( 1 - f ( x k + 2 ) ) ]
当xk=x8时,令x8=x0
对于一个像素的8-邻域的所有可能存在的值,按照上式进行计算,其连接数总是取0-4之间的值。文字的自动识别过程中,需要把二值图像进行细化,还可以大大减少冗余的信息。
二值化图像细化图像
Figure A20071004354000052
本发明的优点是:对所需要翻译的资料具有高效输入,对资料能有及时翻译,为手机功能提供了新的发展机遇。
用户界面单元可以包括:
预览界面,版面分析界面,选词界面,翻译界面。
附图说明
图1为本发明实施例的结构框图;
图2为本发明实施例的流程示意图;
图3为本发明实施例的engine流程示意图。
图4-1~图4-4示出了本发明实施例的操作流程示意图。
具体实施方式
下面根据图1~图4-4给出本发明一个较好实施例,并予以详细描述,以使本领域的技术人员更易于理解本发明的结构特征和功能特色,而不是用来限定本发明的范围。
请参阅图1所示,具有拍照翻译功能的手机,包括图像预处理部件1、用户界面2、图像识别引擎3、字典引擎4和照相设备5,其中:用户界面2包括并列设置的预览界面21、分词界面22、校正界面23和翻译界面24;图像识别引擎3包括并列设置的引擎设置31、资料版面分析引擎32、字符识别引擎33和引擎关闭34;字典引擎4包括字典库41和翻译接口42;照相设备5包括相机退出单元51、相机拍照单元52、相机调节单元53和相机预览单元54。
请参阅图2所示的照相流程100,
S1001、初始化一OCR引擎初始化、相机初始化和字典引擎初始化;
S1002、资料预览一相机预览、预览调节;
S1003、资料拍摄一相机拍摄和图像转换;
S1004、版面分析一单词分块;
S1005、选词识别一选择单词、识别单词和单词校正;
S1006、翻译结果一调用字典引擎、显示结果;
在上述流程各步骤中,在S1006翻译结果中,若判断还需继续进行便跳回执行S1005,进行选词识别;若判断过程结束,则跳至S1007,退出一手机拍摄翻译处于退出状态。
在S1005选词识别步骤中,判断选词无法进行,便执行S1007,退出,手机拍摄翻译处于待机状态。
在S1002,资料预览步骤中,判断资料不需拍摄,便跳至S1007,退出,手机拍摄翻译处于待机状态。
在S1001初始化步骤中,判别拍摄翻译不需进行,便执行S1007,退出,手机拍摄翻译处于待机状态。
在S1004版面分析步骤中,或S1003资料拍摄步骤中发现图像不理想需重新拍摄,则跳回S1002,再执行资料预览步骤。
请参阅图3,其示出了本发明的引擎流程200的示意图,如图所示,
S2001,启动;
S2002,启动名片图像识别引擎;
S2003,设置名片图像属性。
S2004,名片图像处理
S2005,名片字输出
S2006,还有字输出吗?若有字输出,则跳回执行S2004。否则,执行S2007
S2007,关闭名片图像
S2008,程序结束。
请参阅图4-1~图4-4
其给出了本发明的用户操作流程:即1′、拍摄资料,预览资料图像;
2′、点击“识别”,几秒钟后,名片上出现栏目画框;例如,通过键盘或触笔选择了“precdent”栏目;3′、弹出通过识别的英文单词,precedent,如果识别有误可以再修改,点击翻译。4′、显示该单词的中文翻译,重复执行“继续”+“翻译”操作后,可以完成对整段资料每个单词的翻译。

Claims (4)

1、一种手机拍照翻译装置,包括:
一个OCR引擎单元,用于将文字资料数字图像中的字符转换成字符标准内码;
一个翻译引擎单元,用于翻译OCR识别出来文字资料;
一个至少具有130万像素并且有微距功能的拍摄单元,用于拍摄获取名片的数字图像;
一个图像预处理单元,用于将拍摄的图像转换成翻译引擎单元所能识别的图像格式,将图像进行二值化压缩,以提升识别速度;以及一个用户界面单元,用于与用户交互,向导用户使用该界面。
2、根据权利要求1所述的手机拍照翻译装置,其特征在于,所述的ORC引擎单元包括:引擎库单元,用于存储字符特征向量;引擎设置单元,用于设运行模式或数字图像参数;引擎启动单元,用于分配运行空间,将引擎库装载入内存,启动该引擎启动单元为可执行状态;引擎面版分析单元,用于划分版面,分割翻译单词区域,将可识别字符用连通区域框定;引擎识别单元,用于识别连通区域内的数字图像,根据数字图像的直观形象提取特征进行识别,输出字符内码;引擎关闭单元,释放内存空间,关闭上述各个引擎单元。
3、根据权利要求2所述的手机拍照翻译装置,其特征在于,所述的引擎库单元包括:
翻译库单元,用于存放词与翻译内容的对照表;
翻译接口单元,用于提供输入翻译字,是获取翻译结果的接口。
4、根据权利要求1所述的手机拍照翻译装置,其特征在于,所述的用户界面单元,包括:预览界面、版面分析界面、选词界面和翻译界面。
CNA2007100435408A 2007-07-06 2007-07-06 手机拍照翻译装置 Pending CN101339617A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2007100435408A CN101339617A (zh) 2007-07-06 2007-07-06 手机拍照翻译装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2007100435408A CN101339617A (zh) 2007-07-06 2007-07-06 手机拍照翻译装置

Publications (1)

Publication Number Publication Date
CN101339617A true CN101339617A (zh) 2009-01-07

Family

ID=40213682

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007100435408A Pending CN101339617A (zh) 2007-07-06 2007-07-06 手机拍照翻译装置

Country Status (1)

Country Link
CN (1) CN101339617A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102223433A (zh) * 2010-04-19 2011-10-19 辜进荣 摄像手机字符信息的识别检索匹配方法
CN102355532A (zh) * 2011-10-21 2012-02-15 镇江科大船苑计算机网络工程有限公司 基于Android智能名片摄像扫描的信息传送方法
CN102737238A (zh) * 2011-04-01 2012-10-17 洛阳磊石软件科技有限公司 基于手势动作的字符识别***、方法、及其应用
CN102982326A (zh) * 2011-09-02 2013-03-20 汉王科技股份有限公司 文字处理方法、装置和电子翻译笔
CN103699527A (zh) * 2013-12-20 2014-04-02 上海合合信息科技发展有限公司 图像翻译***及图像翻译方法
CN103716453A (zh) * 2012-10-02 2014-04-09 Lg电子株式会社 移动终端以及移动终端的控制方法
CN104881405A (zh) * 2015-05-22 2015-09-02 东莞中山大学研究院 一种基于智能手机实现拍照翻译的方法及智能手机
CN105468226A (zh) * 2014-09-11 2016-04-06 深圳富泰宏精密工业有限公司 图片浏览***及方法
CN106649294A (zh) * 2016-12-29 2017-05-10 北京奇虎科技有限公司 一种分类模型的训练及其从句识别方法和装置
CN106855854A (zh) * 2016-12-29 2017-06-16 北京奇虎科技有限公司 一种英文信息的识别方法和装置
CN108829644A (zh) * 2013-09-27 2018-11-16 夏普株式会社 信息处理装置、记录介质以及显示翻译结果的方法
CN108985201A (zh) * 2018-06-29 2018-12-11 网易有道信息技术(北京)有限公司 图像处理方法、介质、装置和计算设备
CN110245362A (zh) * 2019-06-19 2019-09-17 京东方科技集团股份有限公司 一种翻译装置及翻译***

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102223433A (zh) * 2010-04-19 2011-10-19 辜进荣 摄像手机字符信息的识别检索匹配方法
CN102737238A (zh) * 2011-04-01 2012-10-17 洛阳磊石软件科技有限公司 基于手势动作的字符识别***、方法、及其应用
CN102982326B (zh) * 2011-09-02 2016-05-25 汉王科技股份有限公司 文字处理方法、装置和电子翻译笔
CN102982326A (zh) * 2011-09-02 2013-03-20 汉王科技股份有限公司 文字处理方法、装置和电子翻译笔
CN102355532A (zh) * 2011-10-21 2012-02-15 镇江科大船苑计算机网络工程有限公司 基于Android智能名片摄像扫描的信息传送方法
CN103716453A (zh) * 2012-10-02 2014-04-09 Lg电子株式会社 移动终端以及移动终端的控制方法
CN109101467A (zh) * 2013-09-27 2018-12-28 夏普株式会社 信息处理装置、记录介质以及信息处理装置的动作方法
CN108829644A (zh) * 2013-09-27 2018-11-16 夏普株式会社 信息处理装置、记录介质以及显示翻译结果的方法
CN103699527A (zh) * 2013-12-20 2014-04-02 上海合合信息科技发展有限公司 图像翻译***及图像翻译方法
CN105468226A (zh) * 2014-09-11 2016-04-06 深圳富泰宏精密工业有限公司 图片浏览***及方法
CN104881405A (zh) * 2015-05-22 2015-09-02 东莞中山大学研究院 一种基于智能手机实现拍照翻译的方法及智能手机
CN106649294A (zh) * 2016-12-29 2017-05-10 北京奇虎科技有限公司 一种分类模型的训练及其从句识别方法和装置
CN106855854A (zh) * 2016-12-29 2017-06-16 北京奇虎科技有限公司 一种英文信息的识别方法和装置
CN108985201A (zh) * 2018-06-29 2018-12-11 网易有道信息技术(北京)有限公司 图像处理方法、介质、装置和计算设备
CN110245362A (zh) * 2019-06-19 2019-09-17 京东方科技集团股份有限公司 一种翻译装置及翻译***
CN110245362B (zh) * 2019-06-19 2023-10-13 京东方科技集团股份有限公司 一种翻译装置及翻译***
US11853711B2 (en) 2019-06-19 2023-12-26 Boe Technology Group Co., Ltd. Translation pen and translation system

Similar Documents

Publication Publication Date Title
CN101339617A (zh) 手机拍照翻译装置
CN110188365B (zh) 一种取词翻译的方法和装置
US8626236B2 (en) System and method for displaying text in augmented reality
CN101339618A (zh) 手机名片识别装置
EP2472372A1 (en) Input method of contact information and system
US7623742B2 (en) Method for processing document image captured by camera
US9251428B2 (en) Entering information through an OCR-enabled viewfinder
US20120131520A1 (en) Gesture-based Text Identification and Selection in Images
US20140143721A1 (en) Information processing device, information processing method, and computer program product
US8897594B2 (en) Image reader, mobile terminal apparatus, and non-transitory computer readable medium
CN103678260A (zh) 一种便携式电子名片簿及处理方法
CN110674814A (zh) 一种图片识别翻译方法、终端及介质
CN101702242B (zh) 一种自动填写固定格式文件的方法及终端
EP2439676A1 (en) System and method for displaying text in augmented reality
CN105975554B (zh) 基于移动终端的大数据搜索方法及装置
Hung et al. Implementing an android application for automatic vietnamese business card recognition
US10965801B2 (en) Method for inputting and processing phone number, mobile terminal and storage medium
US20060290789A1 (en) File naming with optical character recognition
KR20150091948A (ko) 폰트를 인식하고 폰트정보를 제공하는 시스템 및 그 방법
Kaur Text recognition applications for mobile devices
CN110795918B (zh) 确定阅读位置的方法、装置及设备
US20060210171A1 (en) Image processing apparatus
KR101626500B1 (ko) 광학 문자 인식을 기반으로 한 단어 정리 시스템 및 방법
JP4597644B2 (ja) 文字認識装置、プログラムおよび記録媒体
CN103186581A (zh) 一种通过手机快速对书本生僻字发音进行获取的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20090107