CN1734467A - 一种拍照录入文本的手机及其录入方法 - Google Patents
一种拍照录入文本的手机及其录入方法 Download PDFInfo
- Publication number
- CN1734467A CN1734467A CN 200410091832 CN200410091832A CN1734467A CN 1734467 A CN1734467 A CN 1734467A CN 200410091832 CN200410091832 CN 200410091832 CN 200410091832 A CN200410091832 A CN 200410091832A CN 1734467 A CN1734467 A CN 1734467A
- Authority
- CN
- China
- Prior art keywords
- image
- text
- mobile phone
- typing
- contrast
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 230000000877 morphologic effect Effects 0.000 claims abstract description 8
- 238000012805 post-processing Methods 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 7
- 238000012937 correction Methods 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 abstract 1
- 238000005516 engineering process Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000008676 import Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 208000029549 Muscle injury Diseases 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 230000001915 proofreading effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
本发明涉及一种手机拍照录入文本的方法。为解决现有技术中使用者必须手动输入问题的问题,本发明的手机拍照录入文本的方法包括如下步骤:通过手机的影像输入单元从外部采集待输入的文本图像,利用对比识别算法分析该文本图像的形态特征,将录入的图片信息转化为相应的所需要的文本格式。本发明同时还提供一种拍照录入文本的手机。该手机包括一影像输入单元,用于通过该影像输入单元从外部采集待输入的文本图像;和一对比校对模块,用于利用对比识别算法分析该文本图像的形态特征,将录入的图片信息转化为相应的所需要的文本格式。
Description
【技术领域】
本发明涉及移动通讯领域,尤其涉及一种拍照录入文本的手机及其录入方法。
【背景技术】
目前人们在用手机输入联系人信息时,只能通过键盘或手写笔等人工方式实现。同样,手机用户在发短信、彩信或者邮件时,也需要通过键盘或者手写笔进行输入,必要时还需通过键盘进行大量的烦琐的编辑处理。过度的使用键盘和手写笔很容易导致键盘、手写笔和输入屏的损坏,从而降低了手机的使用寿命。另一方面,有报道称,频繁的使用手指录入文本,也很容易导致手指的肌肉受伤。
针对这些缺点,手机研发人员一般是通过改进手机的文本录入软件,或者改进手机键盘按钮的设计来实现快捷简便的文本输入。但是,这些努力都无法根本上解决上述问题。
【发明内容】
本发明要解决的技术问题是提供一种手机拍照录入文本的方法,以解决现有技术中使用者必须手动输入问题的问题。
本发明要解决的另一个技术问题是提供一种拍照录入文本的手机。
为解决上述技术问题,本发明提供一种手机拍照录入文本的方法,其包括如下步骤:通过手机的影像输入单元从外部采集待输入的文本图像,利用对比识别算法分析该文本图像的形态特征,将录入的图片信息转化为相应的所需要的文本格式。
其中,该对比识别算法可为欧氏空间对比法、松弛对比法、动态程序对比法,或类神经网络的数据库建立及对比方法。在影像输入单元从外部采集待输入的文本图像之后,可通过一影像前处理模块对该文本图像进行影像正规化、去除噪声、影像矫正的处理之后在进行比对识别分析。在通过影像前处理模块对文本图像进行处理之后,可通过一文字特征抽取模块对该文本图像进行定位、切分和识别以抽取出图像的文字特征。在通过对比识别算法分析该文本图像之后,可通过一字词后处理模块对识别的文字进行校正。在后处理模块校正之后,可通过人工对识别的文字进行校正。
本发明还提供一种拍照录入文本的手机。该手机包括一影像输入单元,用于通过该影像输入单元从外部采集待输入的文本图像;和一对比校对模块,用于利用对比识别算法分析该文本图像的形态特征,将录入的图片信息转化为相应的所需要的文本格式。
其中,该手机可进一步包括一前处理模块,用于对该文本图像进行影像正规化、去除噪声、影像矫正的处理。该手机可进一步包括一文字特征抽取模块,用于对该文本图像进行定位、切分和识别以抽取出图像的文字特征。该手机可进一步包括一后处理模块,用于对对比校对模块识别的文字进行校正。
本发明方法利用手机的拍照功能,将文字图片信息以照片的形式拍摄下来。利用模式识别算法分析文字图片的形态特征,将录入的信息转行为对应的所需要的格式。
比如名片信息,通过手机将拍摄的名片上的信息转行为手机内对应的联系人格式,以简化联系人的信息输入。同样,也可以把在网页上或报纸上的一些有趣的信息,以本发明方法录入手机,然后发给亲朋好友。
【附图说明】
下面结合附图及实施例对本发明进行详细说明:
图1是本发明具体实施例中的手机实现拍照录入文本功能的方块图。
【具体实施方式】
随着手机产业的发展,是手机的各种新技术新功能也不断涌现。特别是手机的拍照,摄像技术近几年得到了飞速提升。手机的摄像分辨率由以前的10万像素,30万像素已经发展到现在的100万像素及以上。手机分辨率的提升为手机拍照文本图像录入处理***提供了有利的硬件环境。
下面结合图1,说明一下本发明可实现拍照录入文本的手机的一个具体实施例。
如图1所示,为实现通过拍照录入文本,本实施例中的手机主要包括一影像输入单元,用于通过该影像输入单元从外部采集待输入的文本图像;一前处理模块,用于对该文本图像进行影像正规化、去除噪声、影像矫正的处理;一文字特征抽取模块,用于对该文本图像进行定位、切分和识别以抽取出图像的文字特征;一对比校对模块,用于利用对比识别算法分析该文本图像的形态特征,将录入的图片信息转化为相应的所需要的文本格式;一数据库模块,提供文字图像完特征数据库,包含所有欲识别的字集文字;一后处理模块,用于对对比校对模块识别的文字进行校正;和一人工校正模块,用于最后人工进行最后校正确认。
其中,图像采集模块由摄像头和图像处理器构成。图像处理器处理由摄像头摄取的文字图像,并通过屏幕显示出来。为更好的实施后面的图像转换文字的步骤,摄像头的分辨率越高越好,最好大于100万像素。
上述前处理模块主要进行影像正规化、去除噪声、影像矫正等的影像处理以及图文分析、文字行与字分离的文件前处理。
上述文字特征抽取模块用于对该文本图像进行定位、切分和识别并抽取出图像的文字特征。文字特征抽取模块主要对统计特征和结构特征进行抽取分析。例如:对于文字区域内的黑/白点数比,当文字区分好几个区域时,一个个的区域黑/白点数比之联合,就成了一个数值向量。文字影像细线化后,取得字的笔划端点、交叉点之数量及位置,或以笔划段为特征,配合特殊的比对方法进行对比分析。
该数据库模块主要提供文字图像的特征数据库,包含所有欲识别的字集文字。这个特征数据库是根据与输入文字一样的特征抽取方法所得的特征群组。该数据库模块还包括一字词数据库模块。该字词数据库模块是为字词后处理建立的词库。
该对比识别模块主要根据不同的特征特性,选用不同的数学距离函数,利用各种特征比对方法的相异互补性,识别出结果。比对识别方法主要有:欧氏空间的比对方法、松弛比对法(Relaxation)、动态程序比对法(DynamicProgramming,DP),以及类神经网络的数据库建立及比对、HMM(Hidden MarkovModel)以及专家***(Experts System)等方法。
该手机还包括一输出模块,用于将录入信息按所预定要求的格式输出。
下面以一具体实施例说明本发明手机录入文本的方法。
本实施例中,该方法包括如下步骤:
(a)通过手机的影像输入单元从外部采集待输入的文本图像;
(b)通过一影像前处理模块对该文本图像进行影像正规化、去除噪声、影像矫正的处理;
(c)通过一文字特征抽取模块对该文本图像进行定位、切分和识别并抽取出图像的文字特征;
(d)利用对比识别算法分析该文本图像的形态特征,将录入的图片信息转化为相应的所需要的文本格式;
(e)再通过一字词后处理模块对识别的文字进行校正;
(f)在后处理模块校正之后,可进一步通过人工对识别的文字进行校正。
其中,在本实施例中,主要对字符采用复合特征的分类方法。字符集选择3755个一级汉字。字体选择最常用的字体,字号选择从小五号到一号汉字,主要针对20个点之内的小字体。在汉英混排时,汉语优先;汉字粘连时,进行动态优化切分。
在识别前,先进行页面切分,把页面分割成一个一个的文字段落,擦除图形块,保留文字块。按照文字块先后顺序进行识别,以期处理图文混排的页面时,能达到更好的识别效果,并排除图形的干扰,加快文字的识别速度。
本发明方法经实施后证明可实现汉、英双语同时混排,且识别率高,可达98%以上。可以识别黑白、灰度、彩色图像,可以读取多种图像格式,并能对识别结果进行电子文档版面复原功能,所见即所得。
总之,该本发明方法极大简化了手机文本图像录入工作,实现文字图像自动输入,是一种快捷、省力、高效的手机文字图像输入方法。同时对录入的文字图像信息可以随意编辑,增加相应的文字图像效果。
应当指出的是,本领域普通技术人员应当熟知图像转为文本信息的各种技术。本发明的主要构思在于通过摄像功能录入文本图像,再利用图像转文本的各种技术实现文本的间接录入。因此,现有技术中各种图像转文本的技术都应涵盖于本发明的权利要求范围之内。
需要说明的是,上述说明仅是对本发明较佳实施例的详细描述,叙述仅为说明本发明的可实现性及其突出效果,具体特征并不能用来作为对本发明的技术方案的限制,本发明的保护范围应以本发明所附权利要求书为准。
Claims (10)
1.一种手机拍照录入文本的方法,该手机包含一用于实现拍照功能的影像输入单元,其特征在于其包括如下步骤:通过该影像输入单元从外部采集待输入的文本图像,利用对比识别算法分析该文本图像的形态特征,将录入的图片信息转化为相应的所需要的文本格式。
2.如权利要求1所述录入文本的方法,其特征在于该对比识别算法为欧氏空间对比法、松弛对比法、动态程序对比法,或类神经网络的数据库建立及对比方法。
3.如权利要求1所述录入文本的方法,其特征在于在影像输入单元从外部采集待输入的文本图像之后,通过一影像前处理模块对该文本图像进行影像正规化、去除噪声、影像矫正的处理之后在进行比对识别分析。
4.如权利要求3所述录入文本的方法,其特征在于在通过影像前处理模块对文本图像进行处理之后,通过一文字特征抽取模块对该文本图像进行定位、切分和识别以抽取出图像的文字特征。
5.如权利要求1所述录入文本的方法,其特征在于在通过对比识别算法分析该文本图像之后,通过一字词后处理模块对识别的文字进行校正。
6.如权利要求5所述录入文本的方法,其特征在于在后处理模块校正之后,通过人工对识别的文字进行校正。
7.一种拍照录入文本的手机,其特征在于其包括
一影像输入单元,用于通过该影像输入单元从外部采集待输入的文本图像;
一对比校对模块,用于利用对比识别算法分析该文本图像的形态特征,将录入的图片信息转化为相应的所需要的文本格式。
8.如权利要求7所述的手机,其特征在于该手机进一步包括一前处理模块,用于对该文本图像进行影像正规化、去除噪声、影像矫正的处理。
9.如权利要求7所述的手机,其特征在于该手机进一步包括一文字特征抽取模块,用于对该文本图像进行定位、切分和识别以抽取出图像的文字特征。
10.如权利要求7所述的手机,其特征在于该手机进一步包括一后处理模块,用于对对比校对模块识别的文字进行校正。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200410091832 CN1734467A (zh) | 2004-12-24 | 2004-12-24 | 一种拍照录入文本的手机及其录入方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200410091832 CN1734467A (zh) | 2004-12-24 | 2004-12-24 | 一种拍照录入文本的手机及其录入方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1734467A true CN1734467A (zh) | 2006-02-15 |
Family
ID=36076883
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200410091832 Pending CN1734467A (zh) | 2004-12-24 | 2004-12-24 | 一种拍照录入文本的手机及其录入方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1734467A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101881999A (zh) * | 2010-06-21 | 2010-11-10 | 安阳师范学院 | 甲骨文视频输入***及实现方法 |
CN101702242B (zh) * | 2009-11-23 | 2012-07-04 | 中兴通讯股份有限公司 | 一种自动填写固定格式文件的方法及终端 |
CN103347126A (zh) * | 2013-06-27 | 2013-10-09 | 苏州创智宏云信息科技有限公司 | 一种短信*** |
CN104268814A (zh) * | 2014-10-11 | 2015-01-07 | 北京网秦天下科技有限公司 | 生成电子病历的方法和装置 |
CN105096677A (zh) * | 2015-08-19 | 2015-11-25 | 北京京东方多媒体科技有限公司 | 一种教学***及其工作方法 |
CN105956588A (zh) * | 2016-04-21 | 2016-09-21 | 深圳前海勇艺达机器人有限公司 | 智能扫描及朗读文字的方法及其机器人装置 |
CN108090488A (zh) * | 2017-12-18 | 2018-05-29 | 广东广业开元科技有限公司 | 一种基于大数据ocr物联网的人工智能工会信息录入*** |
CN109936772A (zh) * | 2018-12-27 | 2019-06-25 | 深圳创维-Rgb电子有限公司 | 智能电视的输入方法、智能电视、移动终端及存储介质 |
CN110110097A (zh) * | 2019-05-13 | 2019-08-09 | 江苏省质量技术监督信息中心 | 一种基于模式识别技术在标准化文献元数据提取实现方法 |
-
2004
- 2004-12-24 CN CN 200410091832 patent/CN1734467A/zh active Pending
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101702242B (zh) * | 2009-11-23 | 2012-07-04 | 中兴通讯股份有限公司 | 一种自动填写固定格式文件的方法及终端 |
CN101881999A (zh) * | 2010-06-21 | 2010-11-10 | 安阳师范学院 | 甲骨文视频输入***及实现方法 |
CN101881999B (zh) * | 2010-06-21 | 2012-11-21 | 安阳师范学院 | 甲骨文视频输入***及实现方法 |
CN103347126A (zh) * | 2013-06-27 | 2013-10-09 | 苏州创智宏云信息科技有限公司 | 一种短信*** |
CN104268814A (zh) * | 2014-10-11 | 2015-01-07 | 北京网秦天下科技有限公司 | 生成电子病历的方法和装置 |
CN105096677A (zh) * | 2015-08-19 | 2015-11-25 | 北京京东方多媒体科技有限公司 | 一种教学***及其工作方法 |
CN105956588A (zh) * | 2016-04-21 | 2016-09-21 | 深圳前海勇艺达机器人有限公司 | 智能扫描及朗读文字的方法及其机器人装置 |
CN108090488A (zh) * | 2017-12-18 | 2018-05-29 | 广东广业开元科技有限公司 | 一种基于大数据ocr物联网的人工智能工会信息录入*** |
CN109936772A (zh) * | 2018-12-27 | 2019-06-25 | 深圳创维-Rgb电子有限公司 | 智能电视的输入方法、智能电视、移动终端及存储介质 |
CN110110097A (zh) * | 2019-05-13 | 2019-08-09 | 江苏省质量技术监督信息中心 | 一种基于模式识别技术在标准化文献元数据提取实现方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108664996B (zh) | 一种基于深度学习的古文字识别方法及*** | |
Koga et al. | Camera-based kanji ocr for mobile-phones: Practical issues | |
CN101059840A (zh) | 一种用手机拍照方式的文字输入方法 | |
CN1630302A (zh) | 可自动录入文字、图像的手机及其录入与处理方法 | |
CN101140617A (zh) | 电子设备及其文本录入的方法 | |
CN107451582A (zh) | 一种图文识别***及其识别方法 | |
CN1881994A (zh) | 一种用于移动设备的手写输入及手势识别的方法和装置 | |
CN1550069A (zh) | 基于偏旁的自适应笔划顺序*** | |
CN103065146A (zh) | 用于电力通信机房哑设备标识牌的文字识别方法 | |
CN1734467A (zh) | 一种拍照录入文本的手机及其录入方法 | |
CN1878182A (zh) | 名片输入识别手机及其识别方法 | |
CN1371043A (zh) | 数码操作*** | |
CN1734466A (zh) | 用于识别图像中的字符的字符识别装置和字符识别方法 | |
CN1263302A (zh) | 基于笔和手势的文稿编辑技术 | |
CN115830620B (zh) | 一种基于ocr的档案文本数据处理方法及*** | |
CN1459073A (zh) | 识别并处理数字图像中的命令的方法和装置,其中用户通过例如将其环绕而标记命令 | |
CN1271537C (zh) | 一种将手写笔记转换为文字文本的方法 | |
CN2634766Y (zh) | 一种手机的文字扫描识别装置 | |
CN110852359B (zh) | 基于深度学习的家谱识别方法及*** | |
CN1136496C (zh) | 简化拼音-触摸屏鼠标式汉字输入方法 | |
CN1841277A (zh) | 一种在手写输入法中显示汉字拼音的方法 | |
CN1256689C (zh) | 一种包含手写体文本的电子文档的保存方法 | |
Sahu et al. | Prescription reading system for visually impaired people using NLP | |
CN1105985C (zh) | 手写读音中文输入装置和方法 | |
JPH11110412A (ja) | カメラが捕捉した画像に関する情報を処理し、表示するシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |