CN101600032B - 信息处理装置、信息处理方法、控制程序及记录介质 - Google Patents
信息处理装置、信息处理方法、控制程序及记录介质 Download PDFInfo
- Publication number
- CN101600032B CN101600032B CN2009101427215A CN200910142721A CN101600032B CN 101600032 B CN101600032 B CN 101600032B CN 2009101427215 A CN2009101427215 A CN 2009101427215A CN 200910142721 A CN200910142721 A CN 200910142721A CN 101600032 B CN101600032 B CN 101600032B
- Authority
- CN
- China
- Prior art keywords
- information
- district
- insert
- explaining
- article
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/169—Annotation, e.g. comment data or footnotes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
Abstract
一种用于处理含有字符信息图像数据的信息处理装置,图像数据处理包括***解释说明信息,该解释说明信息与图像数据中的字符信息相对应。该信息处理装置包括一个图像数据采集单元、一个解释说明信息检索单元、一个可***区域信息确定单元和一个***样式确定单元。图像数据采集单元采集含有字符信息的图像数据,其字符信息由含有首字符串的多个字符所构成。解释说明信息检索单位检索与首字符对应的字符解释说明信息。依据所采集图象数据中的字符坐标数据,可***区信息确定单元计算第一个可***区域信息,该区域用于***第一条解释说明信息。***样式确定单元依据可***区信息确定第一条***解释说明信息的样式。
Description
技术领域
本发明涉及信息处理装置、信息处理方法、控制程序及记录介质,特别是,在输出信息中***对应图像字符的解释说明信息的处理方法。
背景技术
随着利用电子化数据信息通信技术的广泛使用,图像形成装置和图像处理装置,如打印机和传真机,已经成为更有效处理电子化数据的不可缺少的装置。许多这类图像处理装置的设计为多功能图像处理装置,这类装置配备图像扫描功能、图像成像功能、通信功能或类似的其他功能。这类装置可用于打印机、传真机、扫描仪、复印机等。
这种多功能的图像处理装置可用于输出图像数据,在输出图像数据的文档中可以添加翻译内容。例如,日本JP平5-266075-A专利公开了在文本行之间添加翻译术语的方法。具体来说,当一行包括一个需要翻译的字时,通过扩大行与行之间的行空,翻译术语就可以***文本的行空,此外,可以通过删去文件中的图表等非文本信息来保证***文字的空间。
然而,日本JP平5-266075-A专利所描述的方法可能会改变源文件的原始布局,或在文件被复制时,可能会删除包含在源文件中的信息。例如,如果在图像数据相邻行之间扩大行距,在一个页面上的行数就不可避免减少了。其结果是,文件每页的布局就会改变,与源文件总页数相比,复制图像文件的总页数就会增加。此外,如果包含在源文件中的图表信息被删除,就会很难或不可能理解文件的内容。
例如,通过使用脚注就可能解决上述的布局缺陷,也就是将翻译术语***每页源文件底部。当使用脚注方式时,数字或符号可以***脚注字的附近,而在其它地方显示与翻译术语相关的数字或符号。脚注是与文件正文分离的解释性说明。例如,对一本书,脚注可以添加到正文每一页的下面。
在一个单词附近***翻译术语(称为“直接***”),以尽可能增强文件的可读性。但是,如果没有足够的空间保证在要解释单词的附近***翻译术语,翻译术语就可能会以很小的字体显示。为了避免这种情况,可以用脚注方式代替直接***,即在要翻译的单词附近***符号。然而,使用者必须判断是否使用直接***或脚注,这对用户可能是不方便的。
选择直接***或脚注方式的不方便性,可能有以下几种情形:当源文件复制时,要求用一种语言写成的源文件翻译成另一种语言的情形;或者,当复制源文件时,要在正文中添加难懂技术术语解释说明或者特别定义术语的情形。翻译或解释说明可能是字典的信息,但不仅仅限于字典的信息。翻译信息关联到单词及其意义,技术术语信息关联到技术行话和往往难懂的的含义。
在输入数据信息(例如,源文件)中,要为指定的字符信息***指定的信息,需要在直接***或脚注方式之间进行选择,这可能会导致用户的不便。
发明内容
本发明的第一方面是:一种用于图像数据处理的信息处理装置,所处理的图象数据含有字符信息,图像数据处理的过程包括给图像数据中的字符信息***相应解释说明的过程,信息处理装置包括:一个图像数据采集单元,用于采集含有字符信息的图像数据,其中,该字符信息由含有首字符串的多个字符构成;一个解释说明信息检索单元,用于检索对应于该首字符串的第一条解释说明信息;一个可***区信息确定单元,用于计算预备***解释说明信息的可***区信息,可***区中的第一可***区用于***该第一条解释说明信息,通过该图象数据中的字符的坐标数据确定该第一可***区;一个***样式确定单元,用于根据该可***区信息中的第一可***区信息确定该第一条解释说明信息的***样式,该***样式含有***该第一条解释说明信息的***条件。
本发明的第二方面是:一种处理含有字符信息图像数据的方法,图像数据的处理包括在图像数据中***解释说明信息的过程,该解释说明信息与图像数据中的字符信息相对应,该方法包括:采集含有该字符信息的图像数据,该字符信息由含有首字符串的多个字符构成;检索对应于该首字符串的第一条解释说明信息;计算预备***解释说明信息的可***区信息,可***区中的第一可***区用于***该第一条解释说明信息,通过该图像数据中的字符的坐标数据确定该第一可***区;根据该可***区信息中的第一可***区信息确定第一条解释说明信息的***样式,该***样式含有***该第一条解释说明信息的***条件。
本发明的第三方面是:一种计算机可读介质存储方法。它是一个由处理字符信息图像数据的可机读指令所组成的程序。这个程序指挥一个控制器来进行图像数据处理,实现给字符信息***相应解释说明信息到图像数据中的操作。该操作的步骤包括:采集含有该字符信息的图像数据,该字符信息由含有首字符串的多个字符构成;检索对应于该首字符串的第一条解释说明信息;计算预备***解释说明信息的可***区信息,可***区中的第一可***区用于***该第一条解释说明信息,通过该图像数据中的字符的坐标数据确定该第一可***区;根据该可***区信息中的第一可***区信息确定第一条解释说明信息的***样式,该***样式含有***该第一条解释说明信息的***条件。
附图说明
参照附图,从以下详细说明中很容易更全面地理解上述内容,并带来许多附带的优势和特点,其中:
图1是本发明实施形态涉及的图像处理装置一例,表示图像处理装置的硬件配置框图;
图2是本发明实施形态涉及的图像处理装置一例,表示图像处理装置中涉及的功能单元框图;
图3是本发明实施形态涉及的图像处理装置一例,表示图像处理装置中信息***控制单元框图;
图4是一个流程图,表示使用字符信息识别单元识别字符信息的过程;
图5表示一个图像处理装置输入信息的例子,在该例子中一句日文句子用作输入信息;
图6是本发明实施形态涉及的图像处理装置一例,表示一个信息输入的例子,该例子中,给每个字符引入了***边界;
图7是本发明实施形态涉及的图像处理装置一例,表示一个信息输入的例子,该例子中,引入了含有多个字符行的***边界;
图8表示一个图5输入信息字符占据区信息的例子;
图9表示一个即将输出数据的例子;
图10表示一个信息输入的例子,在该例子中一句日文语言用作输入信息;
图11是一个流程图,表示使用信息***控制单元在文档中***信息的过程;
图12表示一个图10输入信息字符可***区信息的例子;
图13是一个流程图,表示使用信息***控制单元***信息的过程;
图14表示一个例子过程,该过程引入图10输入信息的可***区;
图15表示一个例子过程,该过程计算输入信息中指定字符的可***区信息;
图16表示一个具有指定尺寸解释说明信息的例子;
图17表示一个字符占据区信息的例子,其字符占据区信息包括了图10输入信息的***方式信息;
图18是本发明实施形态涉及的图像处理装置一例,表示一个解释说明信息***方式的例子;
图19是本发明实施形态涉及的图像处理装置一例,表示另一种解释说明信息输入***方式的例子;
图20表示另外一个分割可***区的实例过程;
图21表示另外一个分割多个可***区的实例过程;
图22是本发明实施形态涉及的图像处理装置一例,表示另一种解释说明信息***方式的例子;
图23是本发明实施形态涉及的图像处理装置一例,表示另一种解释说明信息***方式的例子;
图24表示对同一单词在解释说明信息数据库中具有多种意义的一个例子;
图25是本发明实施形态涉及的图像处理装置一例,表示另外一种在可***区***解释说明信息的例子,解释说明信息采用了图24中的信息;
图26是本发明实施形态涉及的图像处理装置一例,表示另外一个在可***区***解释说明信息***方式例子,解释说明信息采用了图24中的信息;
图27是本发明实施形态涉及的图像处理装置一例,表示另外一个在可***区***解释说明信息***方式例子,解释说明信息采用了图24中的信息;
图28是本发明实施形态涉及的图像处理装置一例,表示另外一个在可***区***解释说明信息***方式例子,解释说明信息采用了图24中的信息;
附图目的是说明本发明的实施例,不应被理解为仅适用于此范围。除非明确指出,不要考虑所附图纸尺寸的大小,而且在不同讨论中,相同或相似的参照数字对应相同或相似的部件。
具体实施方式
现在详细说明本发明的实施例。应当指出的是,尽管象第一、第二等术语在本文中可用来修饰各种元件、部件、区域、层次和/或节,但应当认识到,这些修饰语并没有限制各种元件、部件、区域、层次和/或节,因为,这是一个关联修饰术语,只是用来区别一个元件、部件、区域、层次和/或节和另一个元件、部件、区域、层次和/或节。因此,在不背离本发明的情况下,例如,第一个元件、部件、区域、层次和/或节在下文讨论中也可能称为第二个元件、部件、区域、层次和/或节。
此外,应该指出的是,此处使用的术语不止是为了说明具体的示例,而且也不打算把这些术语限于本发明。因此,举例来说,如本文中使用的单数形式的“a”、“an”和“the”还也可以包括其复数形式,除非上下文清楚地表明并非如此。而且,在本说明中使用术语“包括(includes)”和/或“包括(including)”以明确指出存在的特点、数目、步骤骤、操作、元件和/或部件,但并不排除存在或附加一个或多个其他特点、数目、步骤骤、操作、元件和/或部件。
更进一步说,尽管附图扩大了说明范围,但为清楚起见采用了专用术语,本披露发明内容并不限于如此选择的特定术语,而且,还应认为每一个具体内容都包括了所有以类似方式操作的等同技术内容。
下面参照附图,根据一个实施例,对一种信息处理装置进行说明。例如,信息处理装置既可以是一种图像处理装置,也可以是图像生成装置,以后,就将这种图像处理装置作为后面说明的实施例。这种图像处理装置可能是一个多功能的图像处理装置,它包括多种功能,例如扫描功能、打印功能以及复印功能,而且还不仅仅限于这些功能。
这种图像处理装置可进行图像输出操作,例如,将图像显示在屏幕上,将图像打印到纸上,或将图像复印到某种介质上。当对这种图像进行输出操作时,输入信息(或数据)被分析,然后这个图像输出到某种介质上(如纸张,屏幕等),在输出图像中还***了解释说明信息。这种解释说明信息可以是目标单词的译文和为目标单词添加或指定的解释性说明,而且不仅仅限于这些。在本说明中,术语字“word”至少意味着任何语言具有确定意义的一个字,或一个字符,但不仅仅局限于此。例如,术语字“word”可能意味着多个字组成的一个短语。此外,输入信息(或数据)可以是任何语言撰写的,如中文、英语、日语,但也不仅限于此。这种图像处理装置可用于分析输入信息(或数据),当将输入的信息(或数据)输出到某一输出介质(如纸张,屏幕等)上时,还可以在输入信息(或数据)中***解释说明信息。
参照一个实施例涉及的图像处理装置,图1表示图像处理装置1的典型硬件配置方框图。如图1所示,图像处理装置1可以具有一个类似信息处理终端(例如,服务器、个人电脑PC等)的配置。例如,图像处理装置1可以包括一个中央处理单元10(CPU 10)、一个随机存储器20(RAM 20)、动力部(engine)30、一个只读存储器40(ROM40)、非易失性随机存储器50(NVRAM 50)、一个接口60(I/F60)、和一条连接这些单元的总线90。图像处理装置进一步可以包括液晶显示器70(LCD,70)和一个通过接口I/F60连接的操作单元80。
用作计算单元的中央处理单元CPU10整体控制图像处理装置1的运行。随机存储器RAM 20是一种易失存储器,用于高速数据的读/写,而且,在中央处理单元(CPU 10)处理数据或信息时,随机存储器(RAM20)也可以用作工作存储区。动力部30可以是图像处理动力部,它可以对图像数据执行扫描过程、打印过程或类似的图像数据处理过程。只读存储器(ROM 40)是一种只读的非易失性存储器,只读存储器(ROM 40)可以存储程序(如,防火墙软件)。
非易失性随机访问存储器(NVRAM 50)是一种用于数据读/写的非易失性存储器,而且可以储存操作***(OS)、多种控制程序、应用程序和应用程序的运行参数。接口(I/F 60)通过总线(bus 90)和网络连接各种硬件,并控制图像处理装置的数据流。液晶显示器(LCD 70)可以作为用户接口显示图像或视觉信息,也可以用于显示图像处理装置1的运行状态。用户查看液晶显示器(LCD 70)就可以知道图像处理装置1的运行状态。操作单元80可以用作另一个用户接口,用于用户输入信息或数据到图像处理装置1。操作单元80可以是键盘、鼠标器或类似的装置,但不仅限于此。
在这种硬件配置下,存储在存储介质(如,只读存储器ROM 40、非易失性随机访问存储器NVRAM 50、硬盘驱动器HDD,光盘驱动器)上的程序可以读到随机存储器(RAM 20)中,而且,中央处理单元CPU 10按照程序进行指定操作即可将程序读到随机存储器RAM 20中。用这种软件和具有特定功能硬件的协同方式,图像处理装置1就可以进行特定的操作。
图2表示一个图像处理装置1的典型框图。例如,这个图像处理装置可以包括一个控制器100、一个自动送纸器(ADF)101、一台扫描仪102、一个排纸盘103、一个网络接口I/F104、一个显示面板105、一个供纸器106,一个打印动力部107、一个排纸盘108和一个解释说明信息数据库DB109。
控制器100可包括多个单元。例如,可以包括主控单元111、动力部控制单元112、输入/输出(I/O)控制单元113、图像处理单元114和一个信息***控制单元120。在图2中,电信号在各单元之间可沿实线箭头进行传输,而纸张(用作记录介质)在各单元之间可沿虚线箭头进行传送。当加载到随机存储器(RAM 20,参见图1)的程序激活中央处理单元CPU10时,该控制器100就可以进行操作。
网络输入/输出(I/F104)是一个接口。比如,它可以用来在图像处理装置和客户端之间信息通信。网络输入/输出接口I/F 104可以使用图1所示的输入输出接口I/F 60。例如,通过网络接口I/F104,当客户端发送一个打印作业命令给图像处理装置时,控制器100就会接收到这个打印作业命令。然后,该控制器100就会根据这个打印命令,执行指定的图像生成操作。
显示面板105可能是一种平板显示器,或者是用来显示图像或视觉信息的类似装置。通过这个接口,用户能了解图像处理装置1的运行状态。显示面板105也可以用作一个输入接口(例如,触摸屏),用来给图像处理装置1输入信息或数据。用户可以通过操作显示屏105,给图像处理装置1输入需要输入的信息或数据。显示面板105可能就是LCD 70和图1所示的操作单元80。
解释说明信息数据库DB109可以存储信息或数据。例如,存储字词和与其意义相关联的“字典”数据信息,存储难懂术语和与其意义相关联的“技术术语”信息,但还不限于此。这个解释说明信息数据库109可以存储在非易失性随机访问存储器NVRAM 50(参见图1)中、也可以存储在硬盘驱动器(HDD)或者类似的装置中,这些装置都应是可以存储数据或信息的非易失性储存器。
主控单元111可以控制为传送指定命令而在控制器100中所涉及的上述单元。动力部控制单元112既可用作控制单元,也可用作驱动单元,对打印动力部107、扫描仪102或类似装置进行控制和驱动。输入输出控制单元(I/O 113)用来从网络接口(I/F 104)接收信息(例如,打印作业指令),然后,转送这个信息给主控单元111。继而,当主控单元111发布输出命令给接口控制单元(I/O 113)时,输入输出控制单元(I/O 113)就会将信息传送给一个网络中的装置,该装置通过接口104连接到网路中。
在主控单元111的控制下,根据打印作业命令所含的信息,图像处理单元114就会生成图像信息,这种图像信息中会含有使用打印动力部107生成图像所要用到的信息。另外,图像处理单元114处理由扫描仪102扫描得到的扫描图像数据,并生成图像生成所要用到的图像数据。这些图像数据可以存储在硬盘中,或通过网络接口(I/F 104)传送给客户端。
在主控单元111的控制命令下,信息***控制单元120分析输入信息或数据,并嵌入指定类型的信息到将要输出的图像数据中,这种图像会输出到指定的介质(如,打印机,显示器)上。参照解释说明信息数据库109,这个信息***控制单元120分析和***指定类型的信息。这样,按照一个实施例,这个信息***控制器120就实现了所说的信息***功能。
例如,当图像处理装置1用作打印机时,输入输出I/O控制单元113可以从USB总线或连接局域网(LAN)的接口(I/F104)获得打印作业指令。当收到打印作业指令时,主控单元111就会将含有图像信息或数据的打印作业指令传送给信息***控制单元120。在主控单元111的控制下,信息***控制单元120就会将指定类型的信息(如,翻译术语,解释说明)***到要输出的图像数据中,这样,所生成的含有***的信息的图像数据就可以输出了。后面将详细说明信息***控制器120所执行的这种信息***过程。
***信息后,信息***控制器120会将含有***信息的图像数据传送给主控单元111。然后,根据在主控单元111指令下,利用信息***控制器120所生成的含有***信息的图像数据,图像处理单元114会生成成图像信息。由图像处理单元114生成的这些成像信息接着就可以传送到硬盘HDD,并临时存储在硬盘HDD上。
在主控单元111的控制下,动力部控制单元112驱动供纸器106输送一张打印纸给打印动力部107。继而,动力部控制单元112从硬盘HDD读取所存储的成像信息,并将这些成像信息输送给打印动力部107。在动力部控制单元112收到成像信息后,在供纸器106送入的图像记录纸上,打印动力部107完成成像工作。因此,打印动力部107可以作为一个图像成像单元。尤为特别的是,打印动力部107的成像方法不仅适合于喷墨打印机,而且也适合于光电图形装置或类似装置,且不限于此。在打印动力部107完成成像作业后,图像记录纸就被送到排纸盘108。
在这种图像处理装置1中,信息***控制单元120可以给前面所描述的将要输出的成像数据中***不同类型的信息,如,翻译译文和解释说明说明。参照图3,下面介绍信息***控制单元120。
例如,图3表示信息***控制单元120的框图,图中还连接了主控单元111和解释说明信息数据库DB 109。如图3所示,信息***控制单元120可能包括一个输入数据采集单元121、一个字符信息识单元122、一个信息***处理单元123,以及一个输出信息生成单元124。通过随机存储器RAM 20(参见图1)所加载的确定程序,中央处理单元CPU 10就可以控制这个信息***控制器120。
输入信息采集单元121采集输入信息或数据(以下,用输入信息),所采集的输入信息将用于输出确定的图像,并且,在所采集的输入信息中,可以***各种类型的信息,如,翻译译文和解释说明信息等类似的信息。当扫描仪102扫描文档并生成图像信息或数据时,或者,当含有图像信息或数据的打印作业命令通过网络接口I/F 104输入到图像处理装置1时,输入信息就可以传送到图像处理装置1。输入信息采集单元121也可以从主控单元111收到输入信息。接着,输入信息采集单元121将输入信息传送给字符信息识别单元122。这样,输入信息采集单元121实现了输入信息的采集。
字符信息识别单元122识别包含在输入信息中的字符信息,其输入信息由输入信息采集单元121采集。例如,字符信息可能包括字母、数字、符号以及任何语言所使用的字符。利用光学图像字符识别技术(OCR),字符信息识别单元122可识别包含在图像信息或数据中的字符,通过打印作业指令可以输入这些图像信息或数据。结果,一个图像字符就变成了一个字符编码信息,这种字符编码信息就可以看成是文本信息。
参照图4、5、6和7,下面对字符信息识别单元122进行说明,通过图4可以理解字符信息识别单元122进行字符识别的工作过程。图4是字符信息识别单元122识别字符过程的流程图。
在S401步骤,通过输入信息采集单元121,字符信息识别单元122接收或获取输入信息(例如,图像数据)。例如,图5所示的源图像500可以作为输入信息。在图5中,输入信息是图像信息或数据,这种图像含有白色的背景下的黑色语句,该黑色语句由日文文字写成,并且,这些黑色语句串显示在白色的背景下。
在S402步骤,当源图像500(见图5)被采集为输入信息后,字符信息识别单元122就可以把输入信息识别为一个字符串(例如,黑颜色的字符)。
在S403步骤,字符信息识别单元122为每一个字符(如,黑颜色字符)引入了一个外接矩形框,如图6所示。对需要辨识字符(如,黑色字符),图6表示字符信息识别单元122引入外接矩形框过程的举例。在图6引入外接矩形框时,字符信息识别装置122就会关联相邻的外接矩形框,并在一个给定的长度内朝一个方向扩展外接矩形框,在图7所示的第S404步骤,就可以引入了一道线。图7表示字符信息识别单元122引入一道线的示例过程
在S404步骤,一条线的引入过程就是将邻近的外接矩形框在水平方向和垂直方向相关联的过程。如果输入信息含有一个在垂直方向可读的语句,字符信息识别单元122就沿垂直方向连接邻近的外接矩形框。另一方面,如果输入信息含有一个在水平方向可读的语句,字符信息识别单元122就沿水平方向连接邻近的外接矩形框。如图7所示,输入信息含有在水平方向可读的语句。因此,字符信息识别单元122沿水平方向连接相邻的外接矩形框,结果就引入了一条水平直线。
对源图像500(见图5),执行如图7所示的第S404步骤,就可以分割出501到504的行图像。进一步说,如果文件是用由英文字构成的句子所组成,那么,字符信息识别单元122就可以逐字分割文件,这样的逐字分割将在后面进行说明。
在上述行分割过程(参阅图7)后,在第S405步骤,字符信息识别单元122会对每一个分割的行图像进行字符识别。接着,字符信息识别单元122还会对分割行中的每一个字符进行识别。确切地说,分割行中的字符只能看做图像,如同照片图像一样。通过检测字符特征以及利用模式匹配字典,可以获得与字符图像相匹配的编码文本数据。这样,在S405步骤,图像数据可以被认为是文本代码。这种的字符识别可通过现有的方法来进行。
在进行如图4所示的字符识别作业并得到文本编码信息时,字符信息识别单元122可以生成一种字符占据区信息,该信息把所识别的字符和该识别字符占据区信息相互关联,并***输入信息(例如,输入图像信息)中。图8表示图4字符识别作业所生成的一个字符占据区信息。如图8所示,字符占据区信息可以含有S404步骤分割每一行的字符信息(以下简称,行字符信息)和对应每一行的字符占据区信息。如果输入的信息是英语句子,字符信息识别单元122可以逐字分割输入信息,在S405步骤生成的是字-字符信息,从而代替行-字符信息,这种情况将会在后面解释。
参见图8,当字符占据区信息生成时,字符信息识别单元122就会生成一个如图9所示的透明文本数据510。透明文本数据510与源图象500(例如,输入信息)的图象字符数据相对应,透明文本数据510是人眼不可见的无形数据。如图9所示,信息识别单元122可以将透明文本数据510重叠在源图像500上。这样,源图像500是一种图像信息(或数据),它可以用透明文本数据510去覆盖。这样,源图像500(图像数据自身)和透明文本数据510(含有文本编码的文本数据)叠合的图像数据可以作为输出图像数据进行输出。如图9所示,透明文本数据具有行-字符信息。
如图9所示,将透明文本数据510覆盖到源图像500上面,在图形图像中的图像字符信息就可以用文本数据进行检索。当原始数据存储在便携式文件(PDF)中时,这种双向数据格式可能很有用。字符信息识别单元122可以将如图9所示的输出信息传送给信息***处理单元123。这样,信息***处理单元123可以具有图像数据采集单元的功能,图像数据采集单元的功能是获取图像数据。
参照解释说明信息数据库DB 109,在字符信息识别单元122所生成的预备输出图像数据中,信息***处理单元123***给定类型的信息(如,翻译译文,解释说明信息)。给定类型的信息可以包括预备输出图像数据所含字符信息相对应的解释说明信息。例如,***的给定类型信息可以是翻译译文,解释说明等类似的信息。以下将这样的***信息称为解释说明信息。这种解释说明信息可能包括翻译译文、解释说明、评语或类似的信息,具体地说,这种解释说明信息可以解释指定的信息。
进一步说,信息***处理单元123会生成***样式信息,***样式信息会传送给输出信息生成单元124。***样式信息包括了如何在预备输出的数据中***解释说明信息(如,翻译译文,解释说明)的具体信息。信息***处理单元123进行信息***的过程将在后面进行讨论。
根据从***信息处理单元123所得到的***样式信息,在预备输出信息中***给定解释说明信息(例如,翻译译文,解释说明)后,输出信息生成单元124会生成新的预备输出信息。根据一个实施例,如上所述,信息***控制单元120就完成了一次***信息的过程。
参照图10和图11,介绍信息***控制单元120***解释说明信息的***过程。图10表示图像处理装置1所获取输入图像信息,输入图像信息可能是一个用英语写的文件(以后称为“英文文档”)。确切地说,当英文文档输入并显示为一幅图象时,外文翻译译文(例如,日本语)可***英文文档。图11是信息***控制单元120完成***过程的流程图。
在第S1101步骤,比如说,通过自动送纸器ADF 101,输入信息采集单元121接收并获得了输入信息(见图10)。输入信息采集单元121会将这些输入信息传送给字符信息识别单元122。
在第S1102步骤,从输入信息采集单元121接收到输入信息后,字符信息识别单元122按照图4所示的流程进行字符识别作业。在图4中,日语文件(见图5)作为输入信息,如图8所示,字符占据区信息含有坐标数据,这些坐标数据指明了每一个行图像所占据的区域。一方面,在图10中,英语文档被用作输入信息,则可以分割出对应“一个单词”的占据区,并确定其单词对应的占据区和坐标数据。由于相邻单词之间设置有空格,可以很容易地实现这种单词的逐词分割。
据此,字符信息识别单元122可以生成图12所示的字词占据区域信息,其中包括该词占据区坐标数据和对应单词的词-字符信息(以下简称,词-字符信息)。字符信息识别单元122将这种字词占据区信息传送给预备输出数据(见图10)和信息***处理单元123。
在第S1103步骤,收到来自字符信息识别单元122的字词占据区信息和预备输出数据(见图10)后,从字词占据区信息中,信息***处理单元123至少可以选择一个词。据此,在第S1103步骤,从含有字符占据区信息的多个字词中,信息***处理器123就确定了需要添加解释说明信息(如,翻译译文)的词。因此,信息***处理单元123就具有了字符信息采集单元的功能。
在第S1104步骤,参照解释说明信息数据库DB 109,信息***处理单元123对所选定的词进行字典式检索。在查完字典后,在第S1105步骤,信息***处理单元123判断S1103步骤所选词对应的翻译译文(用作解释说明信息)是否在解释说明信息数据库DB 109中存在。
如果相应的翻译译文存在时(S1105步骤的“是”),在第S1106步骤,字符信息***处理器123就从解释说明信息数据库DB 109取回翻译译文(用作解释说明信息)。因此,字符信息***处理器123可以用作解释说明信息检索单元,它可以检索或获取所选定字词的指定解释说明信息。
在第S1106步骤,取回解释说明信息之后,第S1107步骤,根据含有S1103步骤选定的字(以下,可以称为“目标字”)的行与邻近行之间的空白区信息,信息***处理器123决定要***解释说明信息的***样式。
在S1107步骤的基础上,信息***处理单元123就会生成***样式信息,这种样式信息将需要被***的解释说明和它的***样式联系到一起。***样式信息可以包括被***词的字体信息、要被***解释说明信息的行数、解释说明信息要占据的区域位置(例如,在目标字,或脚注的附近)或与此相类似的信息。稍后将说明S1107步骤的详细细节。
在第S1107步骤以后,要检查在预备输出数据中包含的所有单词是否都被选中了。如果所有的单字都已被选中(S1108步骤的“是”),信息***处理单元123就把所生成的***样式信息输送到输出信息生成单元124。根据在S1109步骤信息***处理单元123所生成的***样式信息,输出信息生成单元124就会生成输出数据,该输出数据包括预备输出数据和预备输出数据中所***的解释说明信息(例如,翻译译文,解释说明),本过程就此结束。
在第S1107步骤以后,要检查在预备输出数据中包含的所有单词是否都被选中了。如果不是所有的单字都已被选中(S1108步骤的“否”),处理就会回到第S1103步骤。
此外,如果没有执行字典搜索(S1104步骤),并且也没有在解释说明信息数据库DB 10中找到解释说明(S1105步骤的“否”),就不要执行S1106步骤和S1107步骤(例如,跳过S1106和S1107步骤),然后,直接执行第S1108步骤。
参照图13,图11表示S1107步骤的过程细节。在S1106步骤,信息***处理单元123取回翻译译文后,信息***处理单元123计算一个空白区域(以下简称″可***区”),该区域用作S1301步骤选定目标字所对应翻译译文(用作解释说明信息)的可***区。通过这样的计算过程,信息***处理单元123就可以确定用于***翻译译文的可***信息。因此,信息***处理单元123可用作可***区信息确定单元。
参照图14和图15,下面介绍解释可***区的计算过程。在图14的例子中,选定“document”为目标字,并计算目标字“document”所需的可***区。如图14所示,在含有目标字的行与相邻行之间的空白区域处,信息***处理单元123可以确定一个可***区(参见图14中的虚线)。更确切地说,在这样的空白区域处,可以为指定的目标字确定一个所需要的可***区域。例如,信息***处理器123可以为“document”目标字设置一个满足需要的可***区(见由虚线所画的矩形区),这种可***区通常设置在“document”目标字的附近区域。
如图14所示,参照图12给出的字符占据区信息,信息***处理单元123计算由(Xa,Ya)-(Xb,Yb)坐标数据所确定的可***区域。这种字符占据区域信息含有图像字符信息和指明这个字符在文档中位置的坐标数据。例如,目标字“document”的图像就是与坐标数据(X3,Y3)-(X4,Y4)相互关联,。
一般来说,根据每个单词的这种坐标数据,在源图像中,就可以确定该单词占据的区域。然后,根据输入信息中所含的这种字符坐标数据,参照源图像信息,即可在指定区域内确定构成一个词的具体字符串,该词就可以转换成一个编码的文本数据(如,透明文本数据)。
按照下面的步骤,在坐标为(Xa,Ya)-(Xb,Yb)的区域,就可以***“document”目标字的翻译译文。首先,参照字符占据区信息(见图12),信息***处理单元123将坐标数据(X3,Y3)-(X4,Y4)与“document”目标字相关联。参照字符占据区信息(见图12),信息***处理单元123利用“X3”和“X4”则可分别计算出“Xa”和“Xb”。由此,信息***处理单元123可以找出一个可***区域,该区域匹配或或对应目标字的宽度。下一步骤,信息***处理单元123就可以利用“Y4”计算“Ya”。再下一步骤,参照字符占据区信息(见图12),利用在垂直方向邻近“document”目标字的“and”和“U.S.”词的上端坐标(见图14),信息***处理单元123可以计算“Yb”。对一个指定字,采用上述过程,用于定义可***区域(见图14中的虚线)的坐标信息就可以计算出来。
如图14所示,为了计算出***翻译译文或类似解释说明信息所需的可***区宽度W和高度H,信息***处理单元123可以计算出坐标“(Xa,Ya)-(Xb,Yb)”。图5表示可***区宽度W和高度H的计算过程。利用所计算出的宽度“W”和高度“H”,信息***处理单元123就可以定义一个可***区。通过这样的过程,信息***处理单元123就可以得到可***区的外边界限制。
如上所述,在第S1301步骤,信息***处理单元123可以计算出可***区。
在第S1302步骤,信息***处理单元123确定了在S1106步骤所取回的解释说明信息(见图11)的***样式。在第S1302步骤,为了保证所取回的解释说明信息适合在S1301步骤计算所得的可***区,信息***处理单元123将会调整其***样式,如,字体的大小和解释说明在介质(如,纸张,屏幕)上需要出现的行数等参数。图16表示信息***处理单元123执行S1302步骤的示例。在图16中,英语单词“document”的日语译文是其解释说明。图16示出了一个日文词语,它写成“文書”,它的日文发音接近“bunsho”。因为日语使用了几种字符(如,汉字(或中文),片假名、平假名),这不同于仅使用字母的英语,日语可以使用图16所示的独特的字。
在S1302步骤,信息***处理单元123检查翻译译文的宽度“Fw”和高度“FH”。如图16所示,***翻译译文(即解释说明信息)所需的宽度和高度是“Fw”和“FH”。信息***处理单元123要确定一种字体的大小,以便用这种字体可以将翻译译文恰好***到宽度和高度分别为“W”和“H”的可***区域。为选择上述字体的大小,保证翻译译文适合于宽度和高度分别为“W”和“H”的可***区域,信息***处理单元123给翻译译文(即解释说明信息)会选定一种适当的字体大小,保证W≥Fw和H≥FH关系的成立。
一般说来,翻译译文(即解释说明信息)可插在相邻两行的行空中,其中一行含有要被解释的目标字。而且,翻译译文(即解释说明信息)可插在多个行的行空中,这取决于翻译译文所含字母和字符的数量,以及可***区域的的宽度“W”。比如,如果翻译译文(即解释说明信息)可插在多个行的行空中,这样的话,翻译译文就可以使用更大的字体大小,某些情况下,这可能会更好。
这样,在S1302步骤,当考虑利用多个行空来***其翻译译文(即解释说明信息)时,信息***处理单元123就可以给翻译译文(即解释说明信息)选择最大的可用字体。确定最大可用字体的过程由信息***处理单元123中的字体决策单元来实现。
在S1302步骤,信息***处理单元123给要***的翻译译文(即解释说明信息)计算出最大的可用字体。
在S1303步骤,信息***处理单元123将所计算出的字体大小和预先设置字体大小的阈值进行比较。字体大小的阈值是一种字体大小,用这种字体,翻译译文的字母或字符才具有可读性。由于人类的眼睛无法识别太小的字母或字符,翻译译文字体的大小应该要大于一个给定的字体大小。因此,人类眼睛可辨认的最小的字体可以设置成字体的阈值。
如果电脑的字体等于或大于阈值(S1303步骤的“是”),信息***处理单元123就会决定把翻译译文直接***可***区,在S1304步骤确定的目标字应邻近该可***区域。在本说明中,当一个翻译译文按上述方法***可***区域时,这种***方式称为“直接***”。这样,在比较计算字体与阈值字体的基础上,信息***处理单元123就决定了解释说明信息的***样式。因此,信息***处理单元123可用作***样式决策单元。
如果电脑字体小于阈值(S1303步骤的“否”),信息***处理单元123就决定在可***区域不***翻译译文,而将翻译译文***另一个可***区域,如,将翻译译文作为S1305步骤的注脚。因此,当一个翻译译文的显示字体太小,人类的眼睛不很容易辨认是,就应该使用脚注***样式。脚注可能意味着另一个可***区域,比如,正文的底部区域,但也不限于此。
在S1304步骤或者S1305步骤后,在第S1306步骤,根据在S1302步骤所确定的***样式或者在S1305步骤所确定的***样式(如,脚注),信息***处理单元123会生成***样式信息。然后,这个过程结束。
因此,如上所述,在目标字邻近的可***区或脚注区,给预备输出数据添加一条解释说明的过程可以看成是在不同区域***一段翻译译文(解释说明信息)。一段翻译译文(解释说明信息)可以***到设置在目标字附近的可***区,也可以被添加到另一个区,如,脚注区,设置在目标字附近的可***区称为“第一可***区”,而脚注区可称为“第二可***区”。
总的来说,解释说明信息,如翻译译文或注释,最好是尽可能***靠近目标字的区域(如可***区)。然而,如果宽度为W和H的可***区太小,而这个太小的可***区容不下宽度为FW和FH的翻译译文(即:解释说明信息),那么,翻译译文的字体就应当改小。其结果是,人类的眼睛很难辨识所***的翻译译文。从***信息的可读性来看,最好是执行如图13所示的过程,用指定的字体,以判断解释说明信息是***第一可***区,还是***另一个可***区,如脚注区。
在S1303步骤,字体大小的阈值必须预先设定。字体阈值的大小可以设置为按指定标准人眼能够辨识的最小字体。例如,使用日本工业标准(JIS)的美式字磅(point)、手写字磅或其它可用字体标准。确切地说,例如,许多文件所采用的字体10.5字磅可以设定为字体大小的阈值,官方公报常用的8字磅也可以设定为字体大小的阈值,但不限于此。
进一步说,字体阈值的大小可以根据输入图像信息字体的大小(以下简称,输入字体大小)来确定。例如,在如图4所示的字符识别过程中,输入字体大小可根据输入图像信息中所用字体的大小来确定。输入字体大小可根据图4中第S404步骤分割行的高度来确定。然后,分割行的高度(即,输入字体大小)乘以某一百分比,就可以获得合适的***解释说明信息字体大小的阈值。例如,输入字体大小可以乘50%,75%或80%。而且,当输入字体大小乘以100%时,字体大小的阈值就会与输入字体的大小相同。
再者,在图13所示过程中,解释说明信息可能被***到可***区(S1304步骤),或者可能被***到注脚区(S1305步骤)。然而,解释说明信息还可以***到可***区和脚注区以外的任何区域。例如,解释说明信息可以插到句尾、页眉、页脚、另一页等,但不限于此。
图17表示可***信息表的一个例子,此可***信息表是为图11第S1109步骤生成输出信息所准备的。如图17所示,信息***处理单元123会在图11第S1109步骤生成这个可***信息表,这个可***信息表会含有预备***的解释说明、可***区和***样式信息。***样式信息应包括如何***解释说明信息的方式:一种情况是,解释说明信息可″直接″***可***区;另一种情况是,解释说明信息作为“脚注″***。因此,如果这个解释说明信息可″直接″***,***样式信息就应包括预备***解释说明信息的字体信息。另一方面,如果这个解释说明信息作为″脚注″***,***样式信息就应包括参照符号信息,该参照符号是目标字和脚注的一种关联。
图18表示解释说明信息直接***可***区的一个示例,而图19表示解释说明信息直接***脚注区的一个示例。图18和图19都是***英文单词“document”的日语翻译译文“文書(在日本读作“bunsho”)的例子,当这个解释说明信息***脚注区时,在第一可***区,***一个参照符号,如数字、标记或类似的符号。在图19中,参照符号是“*1”,该符号将英语单词“document”和日语翻译译文“文書”对应起来。具体说就是,将参照符号“*1”***到邻近“document”的可***区,并且,相同的参照符号“*1”被***到不同位置的脚注区,就脚注“*1:文書”而言,这个参照符号“*1”建立了解释说明信息(如:日语翻译译文)和英文单词“document”之间的对应关系。
图19所示的***方式可能是很有用的,即使解释说明信息不能直接***可***区,这种方式也很容易把目标单词和解释说明信息关联起来。当输出信息生成单元124生成含有要***解释说明信息的输出信息时(参见图18和图19),输出信息生成单元124会将这个输出信息传送给主控单元111。通过上述过程,信息***控制器的120就完成了在指定文档或类似的地方***解释说明信息的过程。
进一步说,当***解释说明信息时,最好还是解释说明信息生成在另外一层上,这一层是类似于透明文本数据510的透明文本数据,它可以覆盖到图9所示的预备输出图像上。如果在另一层上生成解释说明信息,那么,解释说明信息、输入信息500和透明文本信息510就很容易分离。
更进一步说,解释说明信息可以被添加到透明文本数据510之上(以下,称为加层)。如果解释说明信息添加到透明文本数据510之上,解释说明信息和透明文本数据510就可以作为一个添加层很容易地从输入信息500中分离。
如以上所述,在图像处理装置1中、信息***控制器120可以完美地在输入图像信息中***解释说明信息或类似的说明,而不改变输入信息的格式。在图18和图19中,***了输入文件中一个字的翻译译文;另外,除了这种翻译译文外,也可以***难于理解技术术语的注释,或作者特别定义术语的注释,而且还不限此。
难于理解的术语,或作者专门定义的术语以及对应的解释说明信息可以存储在解释说明信息数据库DB 109中。明确地说,难于理解的术语/作者专门定义的术语和所对应的的解释说明信息关联后,可以存入解释说明信息数据库DB 109中。在S1104步骤(见图11)中,对难于理解的术语或作者专门定义的术语,信息***处理单元123采用字典搜索方式,从解释说明信息数据库DB 109中,可以索回难于理解术语/作者专门定义术语所对应的的解释说明信息。
在上述情况下,图像处理装置1可以用作打印机,这样,信息***控制器120就可以用来***翻译译文或类似的注释。然而,与此相类似,图像处理装置1还可用作扫描仪。当图像处理装置1用作扫描仪时,输入输出I/O控制单元113就接收扫描命令。用户按下显示屏105上的启动键,就可以输入扫描命令;或外部主机装置通过网络接口I/F 104也可以输入扫描命令。当输入一个扫描命令时,接口I/O控制单元113传送一个扫描指挥信号给主控单元111。当主控单元111接收到来自接口I/O控制单元113的扫描指令信号时,主控单元111就用扫描指令信号控制动力部控制单元112。
然后,动力部控制单元112就驱动自动送纸器ADF 101,自动送纸器ADF 101就会传送一页放置在ADF 101上需要扫描的文件到扫描仪102。接着,动力部控制单元112就驱动扫描仪102扫描自动送纸器ADF 101传过来的被扫描文件。与此相类似,当被扫描的文档直接搁置在扫描仪102上时,动力部控制单元112就同样地控制扫描仪102对搁置在扫描仪102上的被扫描的文档进行扫描。如此,扫描仪102就完成了文档的图像扫描。
在上述图像扫描作业中,扫描器102使用光束和扫描装置(例如,电荷藕合器件CCD)扫描文件,并生成一个基于光信息的扫描图像数据。动力部控制单元112把扫描仪102所生成的扫描图像数据传输给图像处理单元114。在主控单元111的控制下,根据从动力部控制单元112收到的扫描图像数据,图像处理单元114就会生成图像信息或数据。
在主控单元111的控制下,图像处理单元114所生成图像信息或数据会传送给信息***控制器120。至此,图像处理单元114所生成图像信息或数据可用作输入信息。信息***控制器120执行图11和图13所示的作业,完成解释说明信息***,并生成含有指定输出样式信息的输出信息。根据用户指令,信息***控制器120所生成的输出信息可以存储在硬盘(HDD)上,也可以通过输入输出接口I/O控制单元113,如,网络输入/输出接口(I/F104),传送到外部的主机装置。
另外,图像处理装置1可以用作复印机,该复印机具有信息***控制器120类似的功能。当图像处理装置1用作复印机时,动力部控制单元112接受来自扫描器102的扫描图像数据,并且,在主控单元111的控制下,将扫描得到的图像信息或数据传送给信息***控制器120;或将图像处理单元114所生成的图像信息或数据传送给信息***控制器120。因此,扫描图像数据或图像处理单元114所生成的图像信息都可以作为输入信息。信息***控制器120执行上述信息***处理,并生成输出信息。在主控单元111的控制下,利用信息***控制器120所生成的图像信息,动力部控制单元112驱动打印动力部107,打印动力部107类似于一台打印机。
进一步说,在上述这个过程中,在S1302步骤,多行行空可以用来***解释说明信息。然而,如果一段解释说明信息(例如:翻译译文)分成多行,并存储为PDF或类似的格式,而当这样的解释说明信息被检索时,可能检索不到这样的解释说明信息,因为,这种分隔状态的解释说明信息不能被视为一条解释说明信息。在S1302步骤,若一段解释说明信息(例如:翻译译文)分成多行***,这样就会引起不便。为了避免这种不便,一段解释说明信息(例如:翻译译文)就不要分成多行***。具体地说,通过改变字体的大小就可以将解释说明信息***一个行空内。如果为了使解释说明信息可以适合于一个可***行空内,就可能要用少于阈值的字体来***解释说明信息,那么,这条解释说明信息就应作为脚注***。采用这种方案,解释说明信息就不会分成多行***,这样,解释说明信息就可以被检索到。
再者,在上述情况中,可***区的宽度可能大体上与目标字的宽度相匹配,在图14中可以看到目标字“document”和与此相匹配的对应可***区。但如图20所示,可***区的宽度也可以大于目标字的宽度。在图20的情况下,在目标字可***区的邻近两边,不存在需要***解释说明信息的目标字。
进一步说,在目标字可***区的邻近两边,即使存在需要***解释说明信息的目标字。如图21所示,***区的宽度也可以设置为大于目标字的宽度
现在介绍一种修改可***区大小(如,宽度)的方法。举例来说,在该方法中,参照另外一条解释说明信息所对应的邻近可***区的大小(如,宽度),并考虑在一个行空中,第一可***区和邻近可***区可以相互靠近,就可以修改第一条解释说明信息所对应的第一可***区的大小(如,宽度)。
在图21中,目标字“document”所对应可***区的宽度可设定为大于目标字“document”的宽度。但是,目标字“original”刚好在目标字“document”的前面,而目标字“establishing”刚好在目标字“document”的后面,对应“original”的可***区和对应“establishing”的可***区的宽度可以分别设定为小于“original”和“establishing”的宽度,这样,通过减少邻近前后两边可***区域的宽度,对应“document”的可***区宽度就可以设定为大于“document”的宽度。
同样地,如图20、21所示,目标字“document”的可***区也可以增大。在图21中,在目标字“document”前后的目标字所对应的可***区设定得比较小。如果目标字“document”前后目标字所对应的解释说明信息***这个较小可***区,那么,参照所***的解释说明信息,文本图像就会容易阅读和理解。因此,在图21的示例中,根据邻近目标字所对应的解释说明信息的长度,如,“original”和“establishing”,信息***处理单元123可以修改或更正目标字“original”和“establishing”对应的可***区的大小。
如上所述,在图20和21中,信息***处理单元123可以调整可***区的大小。尤其是在图13的S1302步骤,考虑目标字邻近字前后目标字的处理情况,信息***处理单元123可以修改或更正在S1301步骤计算得到的可***区的宽度。因此,当被***解释说明信息具有较小的宽度(图16中的“FW”)时,信息***处理单元123可以为所对应的可***区设置一个较小的宽度;或者当被***解释说明信息具有较大的宽度(图16中的“FW”)时,信息***处理单元123可以为所对应的可***区设置一个较大的宽度。这样,根据所要***解释说明信息的宽度,就可以调节所对应的可***区宽度。举例来说,在图14、20和21中,在处理了相邻目标字“original”、“document”和“establishing”的相互关系之后,就可调整“original”、“document”和“establishing”分别所对应可***区。
进一步说,如图22所示,图18-21中解释说明信息的***方式还可以组合。在图22中,目标字“original”和“establishing”的解释说明信息以脚注的方式***,但“document”的解释说明信息却直接***了可***区。当每一个邻近目标字的被***解释说明信息的宽度较大时,图22所示的组合***方式是很有效的。例如,图22的***方式会极大地减少在一个文档中增加脚注的频率,文档就可以很容易地阅读和理解。一般来说,如果一个文档中含有太多的脚注,这样的文件是不容于阅读和理解的。
图22的***方式,对一个容易理解并很少需要确认解释说明信息的字,恰好使用了脚注***方式,而对一个难于理解并很需要确认翻译译文(即:解释说明信息)的字,恰好使用了直接***方式。例如,如果在解释说明信息数据库DB 109中,对每一条解释说明信息添加一个信息难度水平信息(以后称为信息难度),就可以采用上述不同***方式的选择性用法了。因此,参照信息难度,信息***处理单元123就可以决定:对一个具有更高难度的解释说明信息,采用直接***可***区的***方式,而对一个具有较低难度的解释说明信息,采用脚注***方式。
进一步骤,如图22所示,因为一个目标字一般都具有多个涵义,还可以***这个目标字所对应的多个解释说明信息。稍后会将这种情况将作为第二个例子进行说明。
再者,在上述情况中,一个英文句子可以作为输入信息,而一种日语翻译译文也可以***英文句子中(见图10、18和19)。进一步骤,如图5所示,以另一种语言(例如:日语句子)写成的输入信息也可以当作输入信息。如果输入信息是英文句子或其它类似语言的句子,如图12和图14所示,这种句子很容易逐词分开为一个又一个的单字。然而,如果输入信息是用屈折语(例如:日语)写的,与英语相比,这些信息可能很难分成单个的字。因此,如果输入信息是日语写成的,在图11中的S1103,信息***处理单元123就会进行形态分析来分割日语的字,通过分割,日语句子也可以***到外语翻译译文(例如,英文译文)中,这就与用英文句子用作输入信息相类似。用由一种已有的方法就可以进行这种形态分析。
另外,在上述过程中,也可以将具体的解释说明信息***脚注区(称为第二可***区),如图19所示,脚注区的解释说明信息含有一个参照标记,同时,这个标记或类似的符号也***了可***区(称为第一可***区),该标记对应其解释说明信息的目标字。但是,有时句字之间的行空(第一可***区)太小,甚至小到一个标记都插不进去。对这种情况,图23给出另一个例子,给目标字加下划线来指出目标字附有翻译译文或解释性说明。如图23所示,将目标字和所对应的翻译译文在脚注区相关联。这种***方式只适合在正文部分的强调字词,帮助理解句子的解释说明信息可以以脚注方式***。
在图23中,为了指出目标字是附有文本翻译译文或解释性说明的,给目标字加了下划线。进一步骤,例如,代替下划线的强调方式,可以改变目标字的字体、粗体和目标字的颜色来强调目标字,以表明所强调的目标字是附有文本翻译译文或解释性说明的。如图23所示,参照图13第S1301步骤所计算的可***区(例如,宽度),信息***处理单元123即可完成图23所示的过程。
在上述情况下,打印、扫描或复印就可以生成图像信息或数据,这种图像信息或数据就是输入信息,这种输入的图像信息可能需转换成所描述的文本数据。但是,输入信息也可以是一个具有编码的文本文件的信息。对这种情况,就可以将图11第S1102步骤忽略掉。
另外,在上述过程中,在图13第S1301步骤,根据图12中的字词据区信息,完成可***区的计算。然而,输入信息在文档的行与行之间存在空白行空,留行空是文档的习惯和格式。在这种情况下,在图13第S1301步骤,根据文档的格式信息,信息***处理单元123就能很容易地计算可***区的面积。在图像数据中,也含有这种相邻行空区的“格式信息”,当图像在个人电脑显示器上显示时,或者,通过打印机输出图像时,也要使用这种相邻行空的“格式信息”。
进一步说,在图18和图19的例子中,解释说明信息从可***区的左端开始***。然而,通过调整***样式信息,信息***处理单元123也可以从***区的中间位置开始***解释说明信息。
再者,在上述过程中,如图10所示,输入信息由白色背景上的黑色字符串所构成的。然而,输入信息的背景颜色和字符颜色并不局限于白色和黑色。因此,信息***处理单元123执行具体的***信息处理,会依赖于输入信息的背景颜色和颜色字符。例如,在图4中,对黑色字符进行分割,以实现字符识别。然而,参照输入信息的背景颜色和字符颜色,也可以分割其他颜色的字符。通过人工、或字符色彩传感器以及信息***处理单元123可以改变需要分割字符的颜色。
此外,在上述过程中,如图14所示,在含有目标字的行和邻近后一行之间,可以设置一个可***区。并且,可***区也可以设置在含有目标字的行和邻近前一行之间。
如图17所示,在的第一个实施例中,信息***处理单元123撷取一个目标词对应的一种翻译译文(即解释说明信息)。但是,一个目标词可能不止对应一种翻译译文。在第二个实施例中,解释说明信息数据库DB 109对一个字存储了多涵义的解释说明信息。
根据第二个实施例,图24表示信息存储数据库DB 109存储多种解释说明信息的示例。如图24所示,解释说明信息数据库DB109存储了单词“original”的多个翻译译文。在这种情况下,在图11第S1106步骤,信息***处理单元123可检索到多种翻译译文作为解释说明信息。然后,在图13第S1302和S1303,采用适当的***方式,多种翻译译文可能会作为解释说明信息***到可***区。
在第二个实施例中,在S1302和S1303步骤,信息***处理单元123确定信息***样式。具体来说,使用等于或大于某一阈值的字体,信息***处理单元123确定全部解释说明信息是否可以***可***区,这里的全部解释说明信息是从解释说明信息数据库DB 109中撷取的对应一个目标词的多条解释说明信息。如果确定一个可***区可以容纳全部解释说明信息,那么,信息***处理单元123就会将撷取的全部解释说明信息***到该可***区。图25是全部解释说明信息***到一个可***区的例子。
一种情况是,如果确定一个可***区不足以容纳全部解释说明信息,那么,信息***处理单元123可以删除其中一条检索到的解释说明信息,以减少要***解释说明信息的条数,并且,也可以决定修改信息***样式。在这种删除过程后,如果判定可***区可以容纳数量减少了的解释说明信息,信息***处理单元123就执行图13的第S1306步骤。图26就是这种情况的的例子,图24所示的某些翻译译文被删除后***到在正文中。在图26中,“原作”(在日语中发音为“gensaku”,意义是“原著”)和“独創的な人(在日语中发音为“dokuso teki na hito”,意义是“创意人”)两条翻译译文从图24中多条翻译译文中被删除掉,其结果如图26所示,在正文中只***了剩余翻译译文。
此外,即使将所检索的解释说明信息的数量减少到一条,如果能够判定解释说明信息不适合可***区,信息***处理单元123就会执行一次图13中S1305步骤的过程(即,用脚注方式***)。
在这种过程中,一个目标字甚至可以对应多种含意,这些含意的解释说明信息被储存在解释说明信息数据库DB 109中,在正文中能***的解释说明信息的数量应尽可能大。
一方面,在上述过程中,如果采用等于或大于阈值的字体,所有的被检索的解释说明信息与可***的区域不匹配,信息***处理单元123可以删除所检索索回解释说明信息中的一条信息。例如,当删去解释说明信息时,根据可***区的宽度和高度,信息***处理单元123可确定删去解释说明信息的顺序。如果采用阈值的字体,***解释说明信息所需的空间比可***区略大时,信息***处理单元123***可以删除一条或多条字数较少的解释说明信息;另一方面,如果采用阈值的字体,***解释说明信息所需的空间比可***区大得多时,信息***处理单元123***可以删除一条或多条字数较多的解释说明信息。
此外,如图24所示,如果解释说明信息数据库DB 109存储了一个词的多种含意,则应为每一种含意设置含义的优先级。例如,如果解释说明信息数据库DB109设置了优先级,信息***处理单元123就应首先删除具有最低优先级的含意。依据这种方案,具有最高优先级的解释说明信息就有可能用作要***的解释说明信息。
进一步骤,根据图13中第S1301步骤计算得到的可***区信息,信息***处理单元123可以从多种含意中选择任何一条解释说明信息。例如,如图27所示,如果可***区较大,信息***处理单元123可以选择一个较长的解释说明信息。另外,如图28所示,如果可***区较小,信息***处理单元123可以选择一个较短的解释说明信息。图27和图28中用虚线表示这种可***区。
再者,当一个用作解释说明信息的多种含意被检索时,所有检索到的含意可以全部***一个可***区内。在这种情况下,信息***处理单元123不得对多种含意进行删除处理,而是如图13过程所示,全部用作解释说明信息(例如,翻译译文)。
如上所述,在第二实施例中,对一个目标字,即使检索到多种含意(如,翻译译文、解释性注释)作为解释说明信息,在正文中,图像处理装置1可以恰当地***解释说明信息(例如,翻译译文),这会有助于更好地理解输入信息(例如,英文句子)。
正如上述实施例所述,在给源图像中所含的指定字符***所对应解释说明信息后,就可以输出所采集的图像数据,按照上述图像处理的方法,同时很容易保持原采集图像数据的格式布局。
如上所述,可以有许多另外的修改和变化。因此,应当认为在本发明权利要求范围内,除非特别说明,本发明所披露的内容都可以实现。例如,在本发明所披露的内容和权利要求范围内,不同例子的内容和/或说明可以互相组合,或者互相替换。
Claims (16)
1.一种用于图像数据处理的信息处理装置,所处理的图象数据含有字符信息,图像数据处理的过程包括给图像数据中的字符信息***相应解释说明的过程,信息处理装置包括:
一个图像数据采集单元,用于采集含有字符信息的图像数据,其中,该字符信息由含有首字符串的多个字符构成;
一个解释说明信息检索单元,用于检索对应于该首字符串的第一条解释说明信息;
一个可***区信息确定单元,用于计算预备***解释说明信息的可***区信息,可***区中的第一可***区用于***该第一条解释说明信息,通过该图象数据中的字符的坐标数据确定该第一可***区;
一个***样式确定单元,用于根据该可***区信息中的第一可***区信息确定该第一条解释说明信息的***样式,该***样式含有***该第一条解释说明信息的***条件。
2.根据权利要求1所述的信息处理装置,其特征在于:
该***样式确定单元,用于根据该第一可***区确定***样式,并且所确定的该***样式适合在该第一可***区***该第一条解释说明信息。
3.根据权利要求2所述的信息处理装置,其特征在于:
该***样式确定单元包括:
一个字体大小确定单元,用于确定***字体的大小,其中,字体的大小是***样式的条件之一,所确定的字体用来***该第一条解释说明信息。
4.根据权利要求3所述的信息处理装置,其特征在于:
为保证该第一可***区适合该第一条解释说明信息的***,该字体大小确定单元,用于确定字体大小为预定值,并将所确定的字体大小的预定值与预先设置的字体大小阈值进行比较;
该***样式确定单元,用于判断所确定的字体大小是否能够在第一可***区***该第一条解释说明信息。
5.根据权利要求4所述的信息处理装置,其特征在于:
当为***该第一条解释说明信息所确定的字体大小的预定值小于预先设置的字体大小阈值时,该***样式确定单元,用于将该第一条解释说明信息***该第一可***区,而不是将该第一条解释说明信息***不同于该第一可***区的第二可***区。
6.根据权利要求1所述的信息处理装置,其特征在于:
该***样式确定单元,用于确定用于该第一可***区的行空的行数,该行空的行数是***样式的条件之一。
7.根据权利要求1所述的信息处理装置,其特征在于:
该解释说明信息检索单元,用于为该首字符串获取多种解释说明;
该***样式确定单元,用于从多种解释说明中至少选择其中一种解释说明,并确定所选择的解释说明的***样式,选择的解释说明对应于该首字符串。
8.根据权利要求1所述的信息处理装置,其特征在于:
该***样式确定单元,用于根据第二条解释说明信息的长度和对应于该第二条解释说明信息的与该首字符串相邻的第二个字符串,修改对应于该首个字符串的该第一可***区的大小。
9.根据权利要求1所述的信息处理装置,其特征在于:
该可***区信息确定单元,用于在与该首字符串相邻的空白区确定该第一可***区。
10.根据权利要求1所述的信息处理装置,其特征在于:
该可***区信息确定单元,用于在含有该首字符串的第一行与相邻的第二行之间确定该第一可***区。
11.根据权利要求1所述的信息处理装置,其特征在于:
该可***区信息确定单元,用于确定该第一可***区的宽度,该第一可***区的宽度能够允许***该第一条解释说明信息。
12.根据权利要求1所述的信息处理装置,其特征在于:
该可***区信息确定单元,用于确定该第一可***区的边界限制,该第一可***区用于***该第一条解释说明信息。
13.根据权利要求1所述的信息处理装置,其特征在于:
该可***区信息确定单元,用于确定该第一可***区的坐标数据,该第一可***区用于***该第一条解释说明信息。
14.根据权利要求1所述的信息处理装置,其特征在于:
该解释说明信息检索单元,用于检索翻译译文,该翻译译文能够作为对应于该首字符串的该第一条解释说明信息。
15.根据权利要求1所述的信息处理装置,其特征在于:
该解释说明信息检索单元,用于检索说明注释,该说明注释能够作为对应于该首字符串的该第一条解释说明信息。
16.一种处理含有字符信息图像数据的方法,图像数据的处理包括在图像数据中***解释说明信息的过程,该解释说明信息与图像数据中的字符信息相对应,该方法包括:
采集含有该字符信息的图像数据,该字符信息由含有首字符串的多个字符构成;
检索对应于该首字符串的第一条解释说明信息;
计算预备***解释说明信息的可***区信息,可***区中的第一可***区用于***该第一条解释说明信息,通过该图像数据中的字符的坐标数据确定该第一可***区;
根据该可***区信息中的第一可***区信息确定第一条解释说明信息的***样式,该***样式含有***该第一条解释说明信息的***条件。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008146115 | 2008-06-03 | ||
JP2008146115A JP2009294788A (ja) | 2008-06-03 | 2008-06-03 | 情報処理装置、情報処理方法、制御プログラム及び記録媒体 |
JP2008-146115 | 2008-06-03 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101600032A CN101600032A (zh) | 2009-12-09 |
CN101600032B true CN101600032B (zh) | 2012-10-31 |
Family
ID=41334531
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009101427215A Expired - Fee Related CN101600032B (zh) | 2008-06-03 | 2009-06-02 | 信息处理装置、信息处理方法、控制程序及记录介质 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8290312B2 (zh) |
EP (1) | EP2148280A1 (zh) |
JP (1) | JP2009294788A (zh) |
CN (1) | CN101600032B (zh) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4626356B2 (ja) * | 2005-03-25 | 2011-02-09 | 富士ゼロックス株式会社 | 付加情報を含む電子文書を編集する方法、装置およびプログラム |
JP2010218098A (ja) | 2009-03-16 | 2010-09-30 | Ricoh Co Ltd | 情報処理装置、情報処理方法、制御プログラム及び記録媒体 |
JP4999938B2 (ja) | 2010-01-07 | 2012-08-15 | シャープ株式会社 | 文書画像生成装置、文書画像生成方法及びコンピュータプログラム |
JP5482223B2 (ja) * | 2010-01-22 | 2014-05-07 | 株式会社リコー | 情報処理装置、情報処理方法 |
US9069550B2 (en) * | 2010-11-29 | 2015-06-30 | International Business Machines Corporation | System and method for adjusting inactivity timeout settings on a display device |
JP5604276B2 (ja) * | 2010-12-02 | 2014-10-08 | シャープ株式会社 | 文書画像生成装置および文書画像生成方法 |
JP5631362B2 (ja) * | 2011-08-08 | 2014-11-26 | キヤノン株式会社 | 画像処理装置、画像処理方法およびプログラム |
CN103568607B (zh) * | 2012-07-20 | 2017-04-26 | 精工爱普生株式会社 | 印刷*** |
KR20150006740A (ko) * | 2013-07-09 | 2015-01-19 | 류중하 | 문자에 대한 기호 이미지 구성 방법, 및 기호 이미지에 대한 대응되는 문자의 분석 방법 |
CN104346616B (zh) * | 2013-08-09 | 2017-12-12 | 北大方正集团有限公司 | 字符识别装置和字符识别方法 |
JP2015041309A (ja) * | 2013-08-23 | 2015-03-02 | 株式会社ナカヨ | 文書表示中に参照情報を表示する方法 |
CN104572605B (zh) * | 2013-10-16 | 2019-03-08 | 北大方正集团有限公司 | 脚注排版的实现方法和装置 |
JP2015172792A (ja) * | 2014-03-11 | 2015-10-01 | 株式会社リコー | 翻訳システム、情報処理装置、情報処理方法およびプログラム |
JP2018054638A (ja) * | 2015-02-11 | 2018-04-05 | 藤田 一郎 | 外国語学習用プログラム及び方法 |
JP6398945B2 (ja) | 2015-10-29 | 2018-10-03 | コニカミノルタ株式会社 | 情報付加文書生成装置、プログラム |
JP6551680B2 (ja) * | 2015-11-19 | 2019-07-31 | コニカミノルタ株式会社 | 画像形成装置 |
US9442923B1 (en) | 2015-11-24 | 2016-09-13 | International Business Machines Corporation | Space constrained text translator |
US9639528B1 (en) * | 2016-01-29 | 2017-05-02 | Sap Se | Translation-based visual design |
US10503808B2 (en) | 2016-07-15 | 2019-12-10 | Sap Se | Time user interface with intelligent text reduction |
US10140260B2 (en) | 2016-07-15 | 2018-11-27 | Sap Se | Intelligent text reduction for graphical interface elements |
JP6610471B2 (ja) * | 2016-08-31 | 2019-11-27 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置 |
CN108133214B (zh) * | 2017-12-25 | 2021-01-26 | 广东小天才科技有限公司 | 一种基于图片纠正的信息搜索方法及移动终端 |
JP7105210B2 (ja) | 2019-03-26 | 2022-07-22 | 富士フイルム株式会社 | 画像処理方法、プログラム、及び画像処理システム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0115947A2 (en) * | 1983-01-28 | 1984-08-15 | Fujitsu Limited | Character insertion means for word processing systems |
US5604853A (en) * | 1991-05-18 | 1997-02-18 | Fujitsu Limited | Text editor using insert, update and delete structures for undo and redo operations |
WO2004012099A2 (en) * | 2002-07-31 | 2004-02-05 | Adobe Systems Incorporated | Glyphlets |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04311262A (ja) * | 1991-04-10 | 1992-11-04 | Fujitsu Ltd | 辞書情報表示装置 |
JPH05266074A (ja) | 1992-03-24 | 1993-10-15 | Ricoh Co Ltd | 対訳画像形成装置 |
JP3269842B2 (ja) | 1992-03-24 | 2002-04-02 | 株式会社リコー | 対訳画像形成装置 |
JPH0962670A (ja) * | 1995-08-24 | 1997-03-07 | Sharp Corp | 自動ルビ付加装置 |
JPH09284446A (ja) * | 1996-04-18 | 1997-10-31 | Ricoh Co Ltd | 情報処理装置およびデジタル複写機および情報記憶媒体 |
JP2003122737A (ja) * | 2001-10-10 | 2003-04-25 | Seiko Epson Corp | ディジタルコンテンツ作成システム及びディジタルコンテンツ作成プログラム、並びにディジタルコンテンツ作成方法 |
JP4008280B2 (ja) * | 2002-04-15 | 2007-11-14 | シャープ株式会社 | 表示方法、表示装置、表示プログラム、および表示プログラムを記録した記録媒体 |
US20030200078A1 (en) * | 2002-04-19 | 2003-10-23 | Huitao Luo | System and method for language translation of character strings occurring in captured image data |
JP4383157B2 (ja) * | 2003-05-15 | 2009-12-16 | 株式会社リコー | 画像処理装置、プログラム及び記憶媒体 |
JP2006261821A (ja) * | 2005-03-15 | 2006-09-28 | Fuji Xerox Co Ltd | 画像形成装置および画像読み取り装置 |
JP2006268372A (ja) * | 2005-03-23 | 2006-10-05 | Fuji Xerox Co Ltd | 翻訳装置、画像処理装置、画像形成装置、翻訳方法及びプログラム |
JP2006277103A (ja) * | 2005-03-28 | 2006-10-12 | Fuji Xerox Co Ltd | 文書翻訳方法および文書翻訳装置 |
JP2006331258A (ja) * | 2005-05-30 | 2006-12-07 | Sharp Corp | 訳振り装置、画像処理装置、プログラム、及び記録媒体 |
US7697757B2 (en) * | 2005-06-15 | 2010-04-13 | Hewlett-Packard Development Company, L.P. | Computer assisted document modification |
-
2008
- 2008-06-03 JP JP2008146115A patent/JP2009294788A/ja active Pending
-
2009
- 2009-06-01 US US12/475,881 patent/US8290312B2/en not_active Expired - Fee Related
- 2009-06-02 EP EP09161697A patent/EP2148280A1/en not_active Withdrawn
- 2009-06-02 CN CN2009101427215A patent/CN101600032B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0115947A2 (en) * | 1983-01-28 | 1984-08-15 | Fujitsu Limited | Character insertion means for word processing systems |
US5604853A (en) * | 1991-05-18 | 1997-02-18 | Fujitsu Limited | Text editor using insert, update and delete structures for undo and redo operations |
WO2004012099A2 (en) * | 2002-07-31 | 2004-02-05 | Adobe Systems Incorporated | Glyphlets |
Also Published As
Publication number | Publication date |
---|---|
US8290312B2 (en) | 2012-10-16 |
EP2148280A1 (en) | 2010-01-27 |
US20090296124A1 (en) | 2009-12-03 |
CN101600032A (zh) | 2009-12-09 |
JP2009294788A (ja) | 2009-12-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101600032B (zh) | 信息处理装置、信息处理方法、控制程序及记录介质 | |
US8320019B2 (en) | Image processing apparatus, image processing method, and computer program thereof | |
JP3962721B2 (ja) | 文書処理装置及び文書処理方法 | |
RU2437152C2 (ru) | Устройство обработки изображений, способ и компьютерная программа обработки изображений | |
US8073255B2 (en) | Keyword generation process | |
EP2354966A2 (en) | System and method for visual document comparison using localized two-dimensional visual fingerprints | |
US7528986B2 (en) | Image forming apparatus, image forming method, program therefor, and storage medium | |
JP4393161B2 (ja) | 画像処理装置及び画像処理方法 | |
JP2007193409A (ja) | 画像処理装置および画像処理方法 | |
JP4208780B2 (ja) | 画像処理システム及び画像処理装置の制御方法並びにプログラム | |
JP2006023945A (ja) | 画像処理システム及び画像処理方法 | |
US8508795B2 (en) | Information processing apparatus, information processing method, and computer program product for inserting information into in image data | |
JP2008109394A (ja) | 画像処理装置及びその方法、プログラム | |
KR102613255B1 (ko) | 화상 처리 방법 및 화상 처리 시스템 | |
JP4673200B2 (ja) | 印刷処理システムおよび印刷処理方法 | |
JP2008022159A (ja) | 文書処理装置及び文書処理方法 | |
US8144988B2 (en) | Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program | |
US8355577B2 (en) | Image processing apparatus and method | |
JP2006221569A (ja) | 文書処理システム、文書処理方法、プログラムおよび記憶媒体 | |
JP2007148486A (ja) | 文書閲覧支援方法および文書閲覧支援システム並びに文書処理装置およびプログラム | |
US7675641B2 (en) | Method and device for converting scanned text to audio data via connection lines and lookup tables | |
JP6205973B2 (ja) | 変更履歴出力装置、プログラム | |
US8125691B2 (en) | Information processing apparatus and method, computer program and computer-readable recording medium for embedding watermark information | |
JP2008193580A (ja) | 情報処理装置 | |
JP3424942B2 (ja) | 対訳画像形成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20121031 Termination date: 20190602 |