CN102169590B

CN102169590B - 文件图像生成装置、文件图像生成方法以及计算机程序

Info

Publication number: CN102169590B
Application number: CN201110045533.8A
Authority: CN
Inventors: 九津见毅; 藤原爱; 佐田以知子
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2010-02-25
Filing date: 2011-02-25
Publication date: 2013-11-06
Anticipated expiration: 2031-02-25
Also published as: US20110209044A1; JP2011175569A; CN102169590A; US8458583B2

Abstract

本发明提供能够保持原文图像中的原文的版面，并且提高原文和原文的补充说明(例如为译文)的可读性的文件图像生成装置、文件图像生成方法以及计算机程序。原文(411)的译文(421)配置在第一行的原文(411)与第二行的原文(412)的行间区域，但是在行间区域窄的情况下，译文(421)重叠到原文(411)。这时，将原文(411)的颜色变更为视认性低的颜色，将译文(421)的颜色设定为视认性高的颜色。

Description

文件图像生成装置、文件图像生成方法以及计算机程序

技术领域

本发明涉及用于生成表示带补充说明文件的带补充说明文件图像的文件(document)图像生成装置、文件图像生成方法以及计算机程序，该带补充说明文件在原文的行间区域附加了补充说明。

背景技术

以往，提出了如下的技术：由图像读取装置读取记录在记录用纸或者书籍等的图像，并对读取的图像(以下，称为原文图像)所表示的原文进行翻译(参照(日本)特开2009-53838号公报、(日本)特开2005-157412号公报)。

特开2009-53838号公报所记载的翻译装置生成将翻译了原文的结果(以下，称为译文)以鲁比(ruby)状附加到原文的行间区域的翻译文件。

但是，在行间区域窄的情况下，翻译装置用行间区域的背景色填充原文之后配置译文。

另一方面，特开2005-157412号公报所记载的机器翻译装置生成并列配置了原文和译文的对照表。

在本说明书中，不区分存在于行间的区域和相当于行间的区域(例如，横写时的第一行上侧的区域、或者最终行下侧的区域等)而都称为行间区域。此外，行间区域为宽/窄意味着，行间区域在正交于原文的可读方向(例如，若为横写则是纵方向)的方向上的长度为充分/不充分。

进一步，在本说明书中，字符意味着英数字、汉字、假名(日文字符)、以及符号等。

但是，特开2005-157412号公报所记载的机器翻译装置所生成的对照表没有保持原文图像中的原文的版面(layout)。因此，在参照原文的版面的情况下，不仅需要对照表，还另外需要原文图像。

另一方面，特开2009-53838号公报所记载的翻译装置所生成的翻译文件保持原文图像中的原文的版面。但是，在用背景色填充了原文的情况下，为了参照原文，不仅需要翻译文件，还另外需要原文图像。

但是，如果不仅行间区域窄而且没有用背景色填充原文，则由于原文的字符与译文的字符重叠，因此难以阅读原文和译文两方。

因此，为了避免原文与译文的字符的重叠，而考虑减小译文的字符大小，但是由过小的字符构成的译文是难以阅读的。

发明内容

本发明鉴于上述情况而完成，其主要目的在于，提供通过设为对具有某一颜色的原文和具有其他颜色的补充说明进行合成的结构，从而能够保持原文图像中的原文的版面，并且提高原文和补充说明的可读性的文件图像生成装置、文件图像生成方法以及计算机程序。

在本发明中，文件图像生成装置具备设定部件、生成部件、以及合成部件。这样的文件图像生成装置实现本发明的文件图像生成方法。此外，本发明的计算机程序使用计算机的硬件要素通过软件实现本发明的文件图像生成装置所具备的各种部件。

原文具有某一颜色。

补充说明是与原文有关的文本(例如，作为原文的翻译结果的译文)。

设定部件将补充说明的颜色设定为与原文的颜色不同的其他颜色。这时，与原文的颜色不同的其他颜色是指，例如在色调、饱和度、亮度、以及透明度等中，至少一项与某一颜色的色调、饱和度、亮度、以及透明度等不同的颜色。某一颜色和其他颜色的各自既可以是彩色也可以是非彩色。

生成部件生成补充说明层(layer)。补充说明层表示具有设定部件所设定的其他颜色的补充说明。

合成部件通过对使用原文图像而构成的原文层与生成部件所生成的补充说明层进行合成，从而生成带补充说明文件图像。

这时所生成的带补充说明文件图像表示带补充说明文件，在带补充说明文件中，具有其他颜色的补充说明被附加到具有某一颜色的原文的行间区域。

由于原文层使用原文图像而构成，原文层所表示的原文的版面等同于原来的原文图像中原文的版面。即，保持原文的版面。

行间区域与包含在补充说明的各字符的字符大小相比窄的情况下，存在如下的情况：在带补充说明文件图像中，看得出包含在原文的字符与包含在补充说明的字符重叠。

但是，由于原文与补充说明具有互相不同的颜色，因此相比于原文与补充说明具有相同的颜色的情况，原文和补充说明的各自的可读性提高。即，原文和补充说明两方都是容易阅读的。

当然，行间区域与包含在补充说明的各字符的字符大小相比宽的情况下，具有互相不同的颜色的原文和补充说明的各自的可读性也提高。

在本发明中，文件图像生成装置还具备判定部件和变更部件。

例如，某一颜色为黑色或者藏青色等深色的情况下，具有某一颜色的原文一般容易看见(即视认性(visibility)高)。因此，只将补充说明的颜色设定为与原文的颜色不同的其他颜色，则担心补充说明与原文相比难以看见(即视认性低)、或者由于视认性都高的原文与补充说明相互干扰而导致原文和补充说明两方都变得难以阅读。

因此，判定部件判定原文的颜色是否满足规定的条件。在上述的例子的情况下，判定部件判定某一颜色是否为浅色。

在原文的颜色不满足规定的条件的情况下、即判定部件判定为否的情况下，变更部件将原文的颜色变更为满足规定的条件的某一颜色。在上述的例子的情况下，变更部件将原文的颜色从深色变更为浅色。

在原文的颜色满足规定的条件的情况下，不变更原文的颜色。在上述的例子的情况下，原文的颜色依然是浅色。

设定部件将补充说明的颜色设定为不满足规定的条件的其他颜色。在上述的例子的情况下，设定部件设定深色作为补充说明的颜色。

然后，合成部件对原文层和补充说明层进行合成。

这时所生成的带补充说明文件图像表示带补充说明文件，该带补充说明文件在具有满足规定条件的某一颜色的原文的行间区域附加了具有不满足规定条件的其他颜色的补充说明。从而，在上述的例子的情况下，能够提高补充说明的视认性。而且，能够抑制由于视认性都高的原文与补充说明相互干扰而导致原文和补充说明两方都变得难以阅读的不适情况。

当然，根据判定部件的判定基准即规定的条件，可以与上述的例子相反，将原文的颜色从淡色变更为深色，并将补充说明的颜色设定为淡色。这时，能够提高原文的视认性。而且，能够抑制由于视认性都高的原文与补充说明相互干扰而导致原文和补充说明两方都变得难以阅读的不适情况。

在本发明中，设定部件作为其他的颜色而设定视认性比原文的颜色还低的颜色、视认性比原文的颜色还高的颜色，而且能够切换视认性比原文的颜色还低的颜色与视认性比原文的颜色还高的颜色。

以下，将视认性低的颜色称为难以看见的颜色，将视认性高的颜色称为容易看见的颜色。

合成部件使选择部件和切换部件附属到带补充说明文件图像。

获得了带补充说明文件图像的用户使用选择部件在优先原文的视认性的方式、以及优先补充说明的视认性的方式中选择其中一方。另外，通过选择部件的选择，不限定于用户手动进行的结构，也可以是根据某个条件自动进行的结构。例如，若原文为日语(或者英语)则优先原文(或者补充说明)的视认性，若补充说明为原文的注音假名(或者译文)则优先原文(或者补充说明)的视认性。

在通过选择部件选择了优先原文的视认性的方式的情况下，切换部件将补充说明的颜色切换成难以看见的颜色。这时，带补充说明文件图像表示在具有容易看见的颜色的原文的行间区域附加了具有难以看见的颜色的补充说明的带补充说明文件。

另一方面，在通过选择部件选择了优先补充说明的视认性的方式的情况下，切换部件将补充说明的颜色切换成容易看见的颜色。这时，带补充说明文件图像表示在具有难以看见的颜色的原文的行间区域附加了具有容易看见的颜色的补充说明的带补充说明文件。

以上的结果，在优先原文(或者补充说明)的视认性的方式下，能够使原文(或者补充说明)的视认性比补充说明(或者原文)还提高。换言之，本发明的文件图像生成装置能够按照通过选择部件选择的优先顺序，在原文和补充说明中使其中一方的视认性比另一方还提高。

在本发明中，设定部件对每个规定单位设定补充说明的颜色，其中，补充说明应被分割成规定单位。这里，规定单位是字符单位、单词/词组单位、行单位、句子单位、或者与在原文中具有相同的字符颜色的连续的字符串对应的字符串单位等。

这时，本发明的文件图像生成装置能够进一步提高补充说明的可读性。或者，本发明的文件图像生成装置能够将撰写了原文的作者的意图反映到补充说明。

例如，原文由多个英文句子构成、补充说明由将各英文句子译成日文的结果即多个日文句子构成的情况下，对应于某一英文句子的日文句子的颜色与对应于其他英文句子的日文句子的颜色互相不同时，与各日文句子的颜色互相相同时相比更能提高各日文句子的可读性。

或者，原文由多个单词构成、某一单词与其他单词相比具有容易看见的颜色(所谓强调色)的情况下，在补充说明中对应于具有强调色的单词的语句的颜色与对应于不具有强调色的单词的语句的颜色互相不同时，能够将在原文中的单词之间的差别化反映到补充说明。

在本发明中，原文的颜色不满足规定的条件的情况下，变更部件生成颜色变更层。这里，将满足规定的条件、而且视认性比原文图像中的原文所具有的某一颜色还低的某一颜色称为变更后的颜色。

此外，合成部件对变更部件所生成的颜色变更层、原文层以及补充说明层进行合成。

这时所生成的带补充说明文件图像表示在具有变更后的颜色的原文的行间区域附加了具有不满足规定条件、而且与变更后的颜色相比容易看见的颜色的补充说明的带补充说明文件。

其结果，原文的视认性变低，补充说明的视认性变高。

但是，从这样的带补充说明文件图像去除了颜色变更层的状态下的带补充说明文件图像，表示包含了具有与原文图像中的原文所具有的某一颜色相同的某一颜色的原文的带补充说明文件。即，通过切换颜色变更层的使用/不使用，从而能够将原文所具有的某一颜色进行变更/返回到变更前。

即，本发明的文件图像生成装置不对原文层所表示的原文本身追加操作，而能够改变原文的视认性。

颜色变更层例如为层整体具有规定的透明度的罩(mask)层，通过合成该罩层、原文层以及补充说明层而生成的带补充说明文件图像，表示包含了透过罩层的状态下的原文的带补充说明文件。透过罩层的状态下的原文与不透过罩层的原文、即原来的原文相比，看起来浅，因此视认性低。

在本发明中，颜色变更层是在与原文层中的原文的配置位置对应的位置配置了具有规定的透明度的填充图形的层(以下，称为图形层)。

假设作为颜色变更层而使用了层整体具有规定的透明度的罩层的情况下，担心包含在原文层的原文以外的对象(例如为图形)也被罩层覆盖。这时，以透过罩层的状态表示原文以外的对象，因此产生不应降低视认性的对象的视认性没必要地下降的不适情况。

另一方面，作为颜色变更层而使用了上述的图形层的情况下，只有原文被填充图形覆盖。这时，在带补充说明文件图像中，以透过填充图形的状态表示原文，但如通常那样表示原文以外的对象。从而，能够防止不应降低视认性的对象的视认性的下降。

即，本发明的文件图像生成装置能够容易地使降低所需部分的视认性的情况和维持所需部分以外的视认性的情况并存。

在本发明中，颜色变更层是在与原文层中的原文的配置位置对应的位置配置了具有规定的透明度的矩形符号的层(以下称为字符层)。

假设，作为颜色变更层而使用了层整体具有规定的透明度的罩层的情况下，担心包含在原文层的原文以外的对象(例如为图形)也被罩层覆盖。这时，以透过罩层的状态表示原文以外的对象，因此产生不应降低视认性的对象的视认性没必要地下降的不适情况。

另一方面，作为颜色变更层使用了上述的字符层的情况下，只有原文被矩形符号覆盖。这时，在带补充说明文件图像中，以透过矩形符号的状态表示原文，但是如通常那样表示原文以外的对象。从而，能够防止不应降低视认性的对象的视认性的下降。

在本发明中，对应分割原文的规定单位的每一个配置一个矩形符号。这里，规定单位是字符单位、行单位、段单位、列(column)单位、或者页单位等。因此能够适当地设定各矩形符号的纵横的倍率。

例如，在字符单位的情况下，原文中的一个字符被一个矩形符号覆盖。这时，矩形符号的纵横比对应于一个字符的纵横比。此外，矩形符号的配置位置对应于原文中的一个字符的配置位置。

以上的结果，本发明的文件图像生成装置能够使用具有规定的透明度的矩形符号来降低原文的视认性。

在本发明中，对应分割原文的规定单位的每一个紧密配置多个矩形符号。其中，多个矩形符号的各自的字符大小互相相等。这里，规定单位是字符单位、行单位、段单位、列单位、或者页单位等。因此，适当地设置各矩形符号的配置位置。

例如，在字符单位的情况下，原文中的一个字符被多个矩形符号无间隙地覆盖。

在本发明中，对应分割原文的规定单位的每一个配置一个或者多个矩形符号。这里，规定单位是字符单位、单词/词组单位、或者行单位等。因此，能够适当地设定各矩形符号的纵横的倍率、以及/或者各矩形符号的配置位置。

例如，在字符单位的情况下，与字符“a”、“e”相比，字符“d”、“f”在上方具有突出的部分，字符“p”、“q”在下方具有突出的部分。

因此，设定纵横的倍率使得覆盖字符“a”、“e”的矩形符号成为正方形状的情况下，设定纵横的倍率使得覆盖字符“d”、“f”、“p”、“q”的矩形符号成为纵向稍长的长方形状。

或者，进行设定使得覆盖字符“d”、“f”的矩形符号的配置位置与覆盖字符“p”、“q”的矩形符号的配置位置在上下方向上不同。

在本发明中，设成矩形符号的颜色与原文的背景色相对应。这时，变更部件例如将矩形符号的色调、饱和度、以及亮度设定成与背景的色调、饱和度、以及亮度相同，只将透明度设定成规定的透明度。

在带补充说明文件图像中，具有与背景的颜色对应的颜色的矩形符号不显眼、或者几乎看不见(即，视认性非常低)。因此，能够抑制矩形符号没必要地降低原文和补充说明的视认性的不适情况。

在本发明中，文件图像生成装置还具备限制部件。

在行间区域窄的情况下，包含在补充说明的字符重叠于矩形符号的情况是难以避免的。但是包含于补充说明的字符完全或者大幅地重叠于矩形符号的情况下，担心补充说明的视认性下降。

因此，限制部件将在补充说明层中配置了补充说明所包含的字符的范围、与颜色变更层中配置了矩形符号的范围的重复，限制为规定量以下。

因此，限制部件适当地设定矩形符号的字符大小、纵横的倍率、以及/或者配置位置，或者适当地设定包含在补充说明的字符的字符大小、纵横的倍率、以及/或者配置位置，使得包含在补充说明的字符与矩形符号不会过量地重叠。

以上的结果，本发明的文件图像生成装置在行间区域窄的情况下，也能够抑制补充说明的视认性的降低。换言之，能够容许在一定比例以下的范围内补充说明所包含的字符重叠于矩形符号。

在根据本发明的文件图像生成装置、文件图像生成方法以及计算机程序的情况下，能够保持原来的原文图像中的原文的版面。而且，能够提高原文和补充说明的可读性。

其结果，如果参照带补充说明文件图像的话，与原文和补充说明一起，也能够参照原来的原文图像中的原文的版面。即，不需要参照原来的原文图像。因此，即使只保存带补充说明文件图像，并删除原来的原文图像，也不会产生特殊的问题。因此，本发明的文件图像生成装置、文件图像生成方法以及计算机程序能够有助于有效地保存必要的图像。

进一步地，此外不需要避免原文与补充说明的字符的重叠，因此在生成带补充说明文件图像的情况下，能够将补充说明中包含的字符的字符大小设定成适当大的字符大小。即，能够进一步提高补充说明的可读性。

通过以下的基于附图的详细的叙述，本发明的上述的以及进一步的目的和特征将会变得更加清楚。

附图说明

图1是示意性地表示本发明的实施方式1的文件图像生成装置的结构的方框图。

图2是用于说明由本发明的实施方式1的文件图像生成装置生成文件图像的步骤的功能方框图。

图3(a)～(b)是表示由本发明的实施方式1的文件图像生成装置所读取的原文图像的一例的示意图。

图4(a)～(b)是表示由本发明的实施方式1的文件图像生成装置所生成的文件图像的一例的示意图。

图5是表示由本发明的实施方式1的文件图像生成装置所执行的文件生成处理的步骤的流程图。

图6是表示由本发明的实施方式1的文件图像生成装置所生成的颜色变更层的一例的示意图。

图7是表示用于将文件图像显示到显示单元的文件显示处理的步骤的流程图。

图8(a)～(b)是表示原文图像和文件图像各自的其他的一例的示意图。

图9是用于说明由本发明的实施方式1的文件图像生成装置所生成的原文信息的概念图。

图10(a)～(b)是用于说明字符串的调整的概念图。

图11(a)～(b)是用于说明由本发明的实施方式1的文件图像生成装置所生成的原文译文信息的概念图。

图12是用于说明由本发明的实施方式1的文件图像生成装置所生成的译文书写格式信息的概念图。

图13是用于说明由本发明的实施方式2的文件图像生成装置生成文件图像的步骤的功能方框图。

图14是表示由本发明的实施方式2的文件图像生成装置所执行的文件生成处理的步骤的流程图。

图15是表示由本发明的实施方式2的文件图像生成装置所生成的颜色变更层的一例的示意图。

图16(a)～(b)是表示由本发明的实施方式2的文件图像生成装置所生成的颜色变更层的其他的一例的示意图。

图17(a)～(b)是用于说明译文与矩形符号的重叠的限制的示意图。

图18是示意性地表示本发明的实施方式3的文件图像生成装置的结构的方框图。

具体实施方式

以下，基于表示其实施方式的附图对本发明进行详细叙述。

实施方式1：

图1是示意性地表示本发明的实施方式1的文件图像生成装置1的结构的方框图。

文件图像生成装置1使用具有彩色扫描仪功能和彩色复印功能等的数字复合机而构成。文件图像生成装置1经由未图示的LAN可通信地连接到PC(个人计算机)3。

文件图像生成装置1具备图像读取单元11、发送单元12、图像记录单元13、词典DB(数据库)14、以及图像处理单元2。

图像读取单元11使用彩色扫描仪而构成，光学性地通过彩色读取在放置于图像读取单元11的记录用纸或者书籍等中记录的图像。由图像读取单元11所读取的彩色图像(即，原文图像)被提供到发送单元12、图像记录单元13、或者图像处理单元2.

图像处理单元2基于所提供的原文图像而生成文件图像。所生成的文件图像被提供到发送单元12或者图像记录单元13.

这里，文件图像是PDF(Portable Document Format，可移植文件格式)格式的电子文件图像，作为本发明的实施方式中的带补充说明文件图像而起作用。

发送单元12使用网络适配器而构成，将所提供的原文图像或者文件图像发送到PC3。原文图像被提供到发送单元12的情况是文件图像生成装置1作为彩色扫描仪装置而起作用的情况。

图像记录单元13使用电子照片方式或者喷墨方式等的彩色打印机而构成，将基于所提供的原文图像或者文件图像的彩色图像记录到记录用纸。原文图像被提供到图像记录单元13的情况是文件图像生成装置1作为彩色打印机装置而起作用的情况。

以下，对原文图像被提供到图像处理单元2、并且文件图像被提供到发送单元12的情况进行例示。

词典DB14预先存储到文件图像生成装置1所具备的未图示的大容量存储装置。词典DB14中存储有用于执行后述的S19的处理所必要的各种数据。

PC3具备接收单元31、显示单元32、控制单元33、以及操作单元34。

控制单元33是PC3的控制中枢，将未图示的RAM作为工作区域而使用，按照存储于未图示的ROM或者非易失性的大容量存储装置的计算机程序对PC3的各单元进行控制，执行各种处理。

接收单元31使用网络适配器而构成，接收从文件图像生成装置1发送的文件图像。

显示单元32使用液晶显示面板而构成，显示基于文件图像的彩色图像。

操作单元34使用键盘和鼠标而构成。PC3的用户通过操作操作单元34，从而将各种指示输入到PC3。所输入的指示被提供到控制单元33。

图2是用于说明由文件图像生成装置1生成文件图像的步骤的功能方框图。

图像处理单元2使用MPU而构成。图像处理单元2按照用于实现本发明的实施方式中的文件图像生成方法的计算机程序(即，本发明的实施方式中的计算机程序)，执行各种处理。其结果，图像处理单元2作为字符区域提取单元20、字符识别单元21、翻译单元22、设定单元23、层生成单元24、判定单元25、变更单元26、以及合成单元27而起作用。

另外，图像处理单元2可以与作为文件图像生成装置1的控制中枢而起作用的控制单元兼用。或者，图像处理单元2也可以是使用一个或者多个图像处理专用的ASIC而构成的结构。

图3(a)、(b)的各自是表示由文件图像生成装置1所读取的原文图像400的一例的示意图。

图3所示的原文图像400表示在白底上以横写记载了黑字的原文411、412，而且在原文411、412的右侧记载了图画410的文件。第一行的原文411是英文单词“generated”，第二行的原文412是英文单词“image”。

原文411、412是本发明的实施方式中的多行的原文的一例，原文图像400所表示的原文411、412所具有的颜色为黑色。此外，原文411、412的背景的颜色(即背景色)为白色。

在本实施方式中，对后述的如图4所示的译文421、422以鲁比状被附加到位于原文411、412的下侧的行间区域的情况进行例示。因此，具体来说，原文411、412的行间区域是位于原文411与原文412之间的空白区域、以及位于原文412的下方的空白区域。

图3(a)所示的原文图像400是行间区域(这时，行间区域的纵向长度)宽的情况下的例子，图3(b)所示的原文图像400是行间区域窄的情况下的例子。

图4(a)、(b)的各自是表示由文件图像生成装置1所生成的文件图像4的一例的示意图。

图4(a)所示的文件图像4是图像处理单元2基于图3(a)所示的原文图像400生成的文件图像，图4(b)所示的文件图像4是图像处理单元2基于图3(b)所示的原文图像400生成的文件图像。

文件图像4是对后述的原文图像层41、译文层42、以及颜色变更层43进行合成而构成的。在图4中省略了后述的填充图形的图示。

图4所示的文件图像4表示，与图3所示的原文图像400同样地，在白底以横写记载了原文411、412，而且在原文411、412的右侧记载了图画410的文件。即，文件图像4保持原文图像400中的原文411、412以及图画410的版面。

其中，文件图像4所表示的原文411、412所具有的颜色为浅黑色。即，原文411、412的颜色从原来的颜色(即，原文图像400所表示的原文411、412所具有的颜色)被变更。

而且，文件图像4所表示的文件是在位于原文411与原文412之间的行间区域以横写记载了红字的译文421、在位于原文412的下方的行间区域以横写附加了红字的译文422的文件。

译文421是将原文411译成日文的日文单词“生成する”，译文422是将原文412翻译成日文的日文单词“画像”。这样的译文421、422是本发明的实施方式中的补充说明的一例，文件图像4所表示的译文421、422所具有的颜色为红色。

这样，在文件图像4所表示的文件中，具有红色的译文421、422被附加到具有浅黑色的原文411、412的行间区域。即，文件图像4所表示的文件是本发明的实施方式中的带补充说明文件的一例，文件图像4是本发明的实施方式中的带补充说明文件图像的一例。

如图3(a)所示，当原文411、412的行间区域宽的情况下，即使如图4(a)所示地将译文421、422附加到原文411、412的行间区域，译文421、422所包含的字符也不会重叠于原文411、412所包含的字符。

因此，原文411、412的可读性不会因译文421、422而受损，译文421、422的可读性也不会因原文411、412而受损。

而且，文件图像4所表示的原文411、412具有浅黑色，译文421、422具有红色。即，两者的颜色互相不同。因此，与两者的颜色相同的情况相比，提高原文411、412和译文421、422两方的可读性。

另一方面，如图3(b)所示，当原文411、412的行间区域窄的情况下，如图4(b)所示地将译文421、422附加到原文411、412的行间区域，则译文421、422所包含的字符重叠于原文411、412所包含的字符。

因此，假设在文件图像4所表示的原文411、412和译文421、422各自具有相同的颜色的情况下，原文411、412和译文421、422两方的可读性受损。

但是，文件图像4所表示的原文411、412具有浅黑色，译文421、422具有红色。即，两者的颜色互相不同。因此，与两者的颜色相同的情况相比，提高原文411、412和译文421、422两方的可读性。

而且，在文件图像4中，译文421、422具有与原文411、412的颜色相比还容易看见的颜色。因此，译文421、422与原文411、412相比容易看见(即，译文421、422的视认性提高)。

但是，在文件图像4所表示的原文411、412具有原来的颜色(即黑色)、译文421、422具有与原文411、412的颜色相比难以看见的颜色(例如为蔚蓝色)的情况下，在文件图像4中，原文411、412与译文421、422相比变得容易看见(即，原文411、412的视认性提高)。

本实施方式中的文件图像4具有优先原文411、412的视认性的方式(以下，称为原文优先模式)、优先译文421、422的视认性的方式(以下，称为译文优先模式)，用户可以选择其中一方。因此，在选择了译文优先模式的情况下，如图4(a)、(b)所示，文件图像4中的原文411、412和译文421、422分别用浅黑色和红色描画。另一方面，在选择了原文优先模式的情况下，原文411、412和译文421、422分别用黑色和蔚蓝色描画。这里，描画是指，例如显示于显示部32、或者由图像记录单元13记录在记录用纸。

而且，原文优先模式和译文优先模式的任意的情况下，图画410的颜色不被改变。从而，图画410的视认性不会变化。

这里，对颜色的视认性的高低进行说明。

在背景色为白色的情况下，一般地，亮度低的颜色、饱和度高的颜色、或者不透明度高的颜色等是容易看见的颜色，亮度高的颜色、饱和度低的颜色、或者透明度高的颜色等是难以看见的颜色。换而言之，与背景色的色差大(或者小)的颜色是容易看见的颜色(或者难以看见的颜色)。

在本实施方式中，将黑色和红色设为容易看见的颜色。此外，将浅黑色和蔚蓝色设为难以看见的颜色。

另外，也可以是将红色和藏青色等彩色设为容易看见的颜色，将黑色和灰色等非彩色设为难以看见的颜色。

如以上那样，在本实施方式的文件图像4中，原文411、412和译文421、422的一方具有容易看见的颜色，另一方具有难以看见的颜色。这里，容易看见的颜色与难以看见的颜色具有互补色关系(即，在色调环中配置在互相相向的位置)的情况下，进一步提高具有容易看见的颜色的一方的视认性。

具有互补色关系的颜色的组合例如为蓝紫色与黄色、或者红色与蓝绿色等。这时，蓝紫色为容易看见的颜色，黄色为难以看见的颜色。此外，红色与蓝绿色由于在视认性上没有大的差别，因此通过深淡来对视认性进行差别化。即，深红色(或者深蓝绿色)为容易看见的颜色，淡蓝绿色(或者淡红色)为难以看见的颜色。

另外，文件图像4中的原文411、412与译文421、422的两方也可以具有互相不同的容易看见的颜色(例如，一方为黑色而另一方为红色)。此外，在行间区域宽的情况下，原文411、412与译文421、422的两方也可以具有相同的容易看见的颜色(例如为黑色)。

图5是表示由文件图像生成装置1所执行的文件生成处理的步骤的流程图。在图像读取单元11读取了原文图像的情况下，图像处理单元2执行文件生成处理。这时，图像处理单元2作为图2所示的字符区域提取单元20～合成单元27而起作用。以下，参照图2和图5说明文件生成处理。

字符区域提取单元20基于原文图像提取包含在原文图像的字符区域(S11)。在图3所示的原文图像400的情况下，包含原文411、412，不包含图画410的区域为字符区域。

接着，字符区域提取单元20分别生成表示字符区域层的字符区域层数据、以及表示原文图像层的原文图像层数据。

这里，字符区域层是表示在S11提取出的字符区域的层。

此外，原文图像层使用由图像读取单元11所读取的原文图像而构成。具体地，在原文图像层中包含以规定的格式(例如为JPEG格式)压缩了由图像读取单元11所读取的原文图像(例如为BMP格式的图像)的图像。原文图像层作为本发明的实施方式中的原文层起作用。

基于图3所示的原文图像400而生成的原文图像层41(参照图4)包含原文411、412和图画410。原文图像层41中的原文411、412和图画410各自的颜色以及背景色，分别与原文图像400中的原文411、412和图画410的颜色以及背景色相同。

另外，也可以是如下的结构：例如为了减少原文图像层41的数据量，实施以代表颜色置换原文图像层41所包含的颜色中的类似颜色的图像处理。这时，原文图像400所包含的颜色与原文图像层41所包含的颜色，严格来说不同。

其中，进行了图示，使得图3所示的原文图像400中的原文411、412的颜色与图4所示的文件图像4中的原文411、412的颜色不同，其理由在于，因为在文件图像4中包含了后述的颜色变更层。

通过执行S12的处理，至少生成了字符区域层数据之后，图像处理单元2执行后述的S13的处理。S13～S15的处理也可以与原文图像层数据的生成处理并行地执行。

字符识别单元21对在S12中生成的字符区域层数据实施字符识别处理(S13)。为了执行S11和S13的处理、即从字符区域的提取到字符识别为止的处理，能够利用众所周知的光学式字符读取技术。

此外，字符识别单元21生成包含原文的信息的原文信息(S14)。

原文信息是在S13中识别的各个字符的字符码、字符号、区域号、颜色、字体种类、字符大小、位置坐标、行内位置、以及倾斜等信息(参照后述的图9)。其中，在图9所示的原文信息中，代替字符码而字符本身作为“识别结果”被记载。

本实施方式中的字符号是对各字符发行的识别号，是在可读方向上增加的正整数。

区域号是对字符所属的区域发行的识别号。字符所属的区域是配置了字符所属的段或者列等的区域、或者字符所属的页本身等。

颜色的信息由R值、G值、B值、以及透明度构成。

字符大小的单位是点(point)。

位置坐标是各字符的左端位置的X坐标、上端位置的Y坐标、右端位置的X坐标、以及下端位置的Y坐标。以下，将这些称为左X坐标、上Y坐标、右X坐标、以及下Y坐标。此外，X坐标和Y坐标各自的单位与字符大小的单位相同地为点。此外，X轴的正方向为可读方向，Y轴的正方向为可读方向的反方向。即，在本实施方式中，X轴的正方向为右方向，Y轴的正方向为上方向。

行内位置的信息是对各字符位于行首、位于行尾、位于行中间、位于行首且行尾进行区分的信息。这里，字符位于行首且行尾的情况是，一行只存在一个字符的情况。在图9所示的原文信息中，对位于行首的字符分配识别号“1”，对位于行尾的字符分配识别号“2”，对位于行中间的字符分配识别号“0”。另外，对在一行只存在一个字符的字符例如分配识别号“3”。

S14的处理结束之后，判定单元25基于在S14中生成的原文信息判定原文的颜色是否满足规定的条件(S15)。

因此，判定单元25对原文信息所包含的各字符的R值、G值、B值、以及透明度各自的平均值或者众数值(mode value)等进行运算，并将运算结果看作原文的颜色。

此外，在本实施方式中，如果原文的颜色为难以看见的颜色，则判定单元25判定为满足规定的条件。

因此，判定单元25将原文的R值、G值、B值、以及透明度与规定的基准值进行比较，或者使用原文的R值、G值、B值、以及透明度进行规定的运算，并将运算结果与规定的基准值进行比较。接着，判定单元25根据比较结果判定规定条件的满足/不满足。

具体地，如果原文的颜色为浅黑色或者蔚蓝色，则判定单元25判定为满足规定的条件，如果原文的颜色为黑色或者红色，则判定为不满足规定的条件。

如以上那样的判定单元25作为本发明的实施方式中的判定部件而起作用。

在原文的颜色满足规定的条件的情况下(S15中是)，由于原文的颜色为难以看见的颜色，因此即使具有原来的颜色，在译文优先模式下原文也不会显眼。因此，图像处理单元2不执行下面的S16～S18的处理，而执行后述的S19以后的处理。

在原文的颜色不满足规定的条件的情况下(S15中否)，由于原文的颜色为容易看见的颜色，因此如果具有原来的颜色，在译文优先模式下导致原文显眼。因此，图像处理单元2为了将原文的颜色变更为难以看见的颜色，从而执行下面的S16～S18的处理。

为了将原文的颜色变更为难以看见的颜色，假设直接变更原文图像层中的原文的颜色，则担心在原文优先模式下原文变得难以显眼。

因此，在本实施方式中使用颜色变更层。其中，本实施方式中的颜色变更层为图形层。

图6是表示由文件图像生成装置1所生成的颜色变更层43的一例的示意图。

在图6中表示了对原文图像层41、后述的译文层42、以及颜色变更层43进行合成而构成的文件图像4。在图6中省略了译文的图示。

在图6所示的原文图像层41中包含了两行的原文413、414和图画410。第一行的原文413为由四个英文字符构成的英文单词“apcd”，第二行的原文414为由三个英文字符构成的英文单词“bqr”。原文图像层41中的原文413、414具有黑色。

在图6所示的颜色变更层43中包含了填充图形430。

填充图像430例如为多边形状，边框线和内部具有相同的颜色。即，填充图形430的内部用与边框线相同的颜色填充。

填充图形430具有覆盖了原文图像层41中的字符区域整体、而没有覆盖字符区域以外(例如为图画410所存在的区域)的形状和尺寸。此外，颜色变更层43中的填充图形430的配置位置是与原文图像层41中的字符区域的配置位置(进而为原文413、414的配置位置)对应的位置。

这里，将透明度的下限值设为“0”、将上限值设为“100”的情况下，背景的透明度是“0”(即，完全不透明)。而且，填充图形430是具有大于“0”小于“100”的规定的透明度的白色(以下，称为透明的白色)。即，填充图形430的边框和内部各自的R值、G值、以及B值与背景的R值、G值、以及B值相同，填充图形430的边框和内部各自的透明度比背景的透明度高。

因此，用户的眼几乎看不见文件图像4中的填充图形430。

而且，文件图像4表示透过填充图形430的状态下的原文413、414。因此，文件图像4中的原文413、414具有浅黑色。那是因为，透过透明的白色的状态下表示的黑色是浅黑色。

同样，图4所示的原文411、412由于透过具有透明的白色的未图示的填充图形的状态下被表示，因此具有浅黑色。

另外，也可以与背景色无关地设定填充图形430的颜色。这时，填充图形430的颜色不限定于透明的白色，例如也可以是透明的蔚蓝色。

此外，在原文图像层41中的原文413的颜色为黑色、原文414的颜色为蔚蓝色的情况下，填充图形430也可以具有覆盖原文图像层41中的原文413所存在的区域、不覆盖原文414和图画410所存在的区域的形状和尺寸。

填充图形不限定于对字符区域整体的每一个、或者每个单词设定的结构，也可以是对应分割译文的规定单位的每一个(例如每个字符、每个段、每个列、或者颜色相同且在可读方向上相邻的字符串等)设定的结构。

如以上那样，在使用颜色变更层的情况下，通过适当地设定填充图像的形状、尺寸、以及配置位置，从而能够只将在原文图像层中具有容易看见的颜色的原文，用比原来的颜色还浅的颜色进行表示。换而言之，能够防止将这样的原文以外(即，原文图像层中具有难以看见的颜色的原文、以及图形等)用比原来的颜色还浅的颜色表示的情况。

如图2和图5所示，变更单元26为了在后述的S18中生成表示颜色变更层的颜色变更层数据，首先使用在S12中生成的原文图像层数据来检测原文的背景色(S16)。

接着，变更单元26基于在S16中检测出的背景色来设定填充图形的颜色，并基于在S14中生成的原文信息，对每个规定单位设定填充图形的形状、尺寸、以及配置位置等(S17)。在图6所示的例子中，规定单位为字符区域整体。

而且，变更单元26生成颜色变更层数据(S18)，该颜色变更层数据表示包含了在S17中设定的填充图形的颜色变更层。S18的处理的结果，例如对应于图6所示的原文图像层41而生成包含填充图形430的颜色变更层43。

如以上那样的变更单元26作为本发明的实施方式中的变更部件起作用。

另外，在颜色变更层43中包含多个填充图形430、430、...的情况下，填充图形430、430之间可以相隔配置，也可以紧密配置，也可以部分重叠。

但是，在文件图像只具有原文优先模式的情况下，图像处理单元2不需要执行S15～S18的处理。此外，在文件图像只具有译文优先模式的情况下，图像处理单元2也可以代替S15～S18的处理，而执行直接变更原文图像层中的原文的颜色的处理。

在S15中“是”的情况下、或者S18的处理结束之后、或者与S16～S17的处理的执行并行，翻译单元22基于词典DB14所具有的数据和在S14中生成的原文信息执行翻译处理(S19)。

例如，在原文信息所包含的一行的字符为字符“g”、“e”、“n”、“e”、“r”、“a”、“t”、“e”、“d”的情况下，翻译单元22通过参照词典DB14，查明这些字符形成英文单词“generated”，而且通过将英文单词“generated”翻译成日文，从而得到日文单词“生成する”。在该例子中，英文单词“generated”为原文，日文单词“生成する”为译文。

此外，翻译单元22生成包含原文和译文两方的信息的原文译文信息(S20)。

原文译文信息具有与原文信息相同的信息、表示原文内容的信息、表示译文内容的信息、以及表示原文与译文的关联的信息。这里，表示原文与译文的关联的信息是表示原文所包含的规定单位的语句(以下称为原文语句。例如为英文单词“generated”)与对应于原文语句的译文(以下称为译文语句。例如为日文单词“生成する”)的关联的信息(参照后述的图11)。这里，规定单位的语句例如为单词、词组、或者句子等。

S20的处理结束之后，设定单元23基于在S20中生成的原文译文信息设定译文的书写格式(S21)，并生成表示对每个译文语句设定的书写格式的译文书写格式信息(S22)。

译文书写格式信息中包含译文语句的颜色、字体种类、字符大小、位置坐标、以及倾斜等信息(参照后述的图12)。

例如，日文单词“生成する”的字符大小基于英文单词“generated”的字符大小而设定。一般，译文侧的字符大小被设定成原文侧的字符大小以下。并且，为了提高译文的易读性，译文的字符大小被设定成规定的下限字符大小以上。

此外，基于相对于英文单词“generated”的范围(以下，称为相对行间区域)的纵向长度和横向长度，日文单词“生成する”的位置坐标被设定在英文单词“generated”的下侧的行间区域内。

在相对行间区域的纵向长度和横向长度为日文单词“生成する”的纵向长度和横向长度以上的情况下，日文单词“生成する”被配置在相对行间区域的内部。

另一方面，相对行间区域的纵向长度小于日文单词“生成する”的纵向长度的情况下，日文单词“生成する”被配置成各字符的至少上部位于相对行间区域的上方(即，英文单词“generated”所存在的区域)。因此，译文侧的字符的上Y坐标存在于原文侧的字符的上Y坐标与下Y坐标之间即可。

另外，译文被配置在原文的上侧的情况下，译文侧的字符的下Y坐标存在于原文侧的字符的上Y坐标与下Y坐标之间即可。

同样地，在译文被配置在纵写的原文的右侧(或者左侧)的情况下，译文侧的字符的左X坐标(或者右X坐标)存在于原文侧的字符的右X坐标与左X坐标之间即可。

而且，此外日文单词“生成する”的颜色根据英文单词“generated”的颜色被设定，使得能够根据模式的切换而切换原文优先模式用的颜色与译文优先模式用的颜色。因此，图像处理单元2例如在后述的S23中生成的译文层数据中，将决定字符的颜色的参数设为变量。而且，图像处理单元2在后述的S24中使切换命令附属到文件图像，该切换命令在选择了原文优先模式的情况下将意味蔚蓝色的数值代入到该变量，在选择了译文优先模式的情况下将意味红色的数值代入到该变量。

在本实施方式中，英文单词“generated”的颜色与英文单词“image”的颜色相同，因此日文单词“生成する”的颜色与日文单词“画像”的颜色相同。另外，即使英文单词“generated”的颜色与英文单词“image”的颜色相同，也可以设定各颜色使得日文单词“生成する”的颜色与日文单词“画像”的颜色不同。

这里，考虑英文单词“generated”的颜色与英文单词“image”的颜色不同的情况(例如，英文单词“generated”为蓝色，英文单词“image”为绿色)。

这样的情况下，对每个单词设定译文的颜色时，设定成日文单词“生成する”的颜色与日文单词“画像”的颜色互相不同(在上述的例子中，例如日文单词“生成する”为淡蓝色，日文单词“画像”为淡绿色)。

此外，对字符区域整体的每一个设定译文的颜色时，设定成日文单词“生成する”的颜色与日文单词“画像”的颜色相同(在上述的例子中，例如日文单词“生成する”和日文单词“画像”都是黄色)。

另外，也可以对每个字符、每个段、或者每个列等设定译文的颜色。

在译文的颜色中，原文优先模式用的颜色是与原文优先模式中的原文的颜色(即原文的原来的颜色。具体地为原文图像层中的原文所具有的颜色)相比还难以看见的颜色即可。因此，设定单元23基于原文译文信息所包含的原文的颜色的信息其本身而设定译文的颜色。

另一方面，译文优先模式用的颜色是与译文优先模式中的原文的颜色(即原文的变更后的颜色。具体地为文件图像中透过颜色变更层的状态下的原文所具有的颜色)相比还容易看见的颜色即可。因此，设定单元23基于原文译文信息所包含的原文的颜色的信息、填充图形的颜色求原文的变更后的颜色，并根据所求出的颜色来设定译文的颜色。

如以上那样，S21中的设定单元23作为本发明的实施方式中的设定部件而起作用。

S22的处理结束之后，层生成单元24基于在S22中生成的译文书写格式信息，生成表示译文层的译文层数据(S23)。在译文层中包含具有在S21中设定的书写格式的译文。例如为图4所示的译文层42的情况下，包含译文421、422。译文层作为本发明的实施方式中的补充说明层起作用，层生成单元24作为本发明的实施方式中的生成部件起作用。

在S23的处理结束、且在S18中执行的颜色变更层数据的生成处理结束之后，合成单元27生成文件图像(S24)，该文件图像包含在S12中生成的原文图像层数据、在S18中生成的颜色变更层数据、以及在S23中生成的译文层数据。即，合成单元27合成原文图像层、颜色变更层、以及译文层。

其中，在S15中判定为“是”的情况下，不执行S18的处理，因此S24中的合成单元27生成包含在S12中生成的原文图像层数据、以及在S23中生成的译文层数据的文件图像。即，合成单元27合成原文图像层和译文层。

而且，S24中的合成单元27在生成文件图像时，使选择命令和切换命令附属到文件图像。

选择命令用于选择原文优先模式和译文优先模式的其中一方。具体地说，选择命令是用于执行后述的图7的S34和S40的处理的命令。

切换命令在选择了原文优先模式的情况下用于将译文的颜色切换成难以看见的颜色，在选择了译文优先模式的情况下用于将译文的颜色切换成容易看见的颜色。具体地说，切换命令是在选择了原文优先模式的情况下用于执行图7的S36～S38的处理的命令，在选择了译文优先模式的情况下用于执行图7的S32的处理的命令。

如以上那样的合成单元27作为本发明的实施方式中的合成部件起作用。此外，选择命令和切换命令作为本发明的实施方式中的选择部件和切换部件起作用。

S24的处理结束之后，图像处理单元2结束文件生成处理。

如图1所示，在S24的处理中生成的文件图像被发送到PC3。PC3将所接收的文件图像保存到未图示的保存单元。

用户通过对PC3的操作单元34进行操作，将文件显示指示输入到PC3，该文件显示指示用于将期望的文件图像显示到显示单元32。

本实施方式中的文件图像默认地以译文优先模式显示。

用户在文件图像以译文优先模式显示的情况下，期望原文优先模式下的显示时，通过对操作单元34进行操作从而将原文优先指示输入到PC3。相反，在文件图像以原文优先模式显示的情况下，期望译文优先模式下的显示时，用户通过对操作单元34进行操作，从而将译文优先指示输入到PC3。

而且，用户想要结束文件图像的显示时，通过对操作单元34进行操作从而将显示结束指示输入到PC3，该显示结束指示用于将期望的文件图像显示到显示单元32。

图7是表示用于将文件图像显示到显示单元32的文件显示处理的步骤的流程图。在接收到至少一个文件图像的情况下，直到所接收的文件图像全部被删除，由控制单元33执行文件显示处理。

控制单元33判定是否输入了文件显示指示(S31)，在还没有输入的情况下(S31中否)，反复执行S31的处理。

在输入了文件显示指示的情况下(S31中是)，控制单元33在文件图像所包含的译文层数据中将译文的颜色切换成容易看见的颜色(S32)，接着将文件图像显示到显示单元32(S33)。

S33的处理的结果，在显示单元32中显示文件图像4，例如如图4所示，该文件图像4包含用浅黑色描画的原文411、412和用红色描画的译文421、422。即，文件图像4以译文优先模式显示。

接着，控制单元33判定是否输入了原文优先指示(S34)，在没有输入的情况下(S34中否)，判定是否输入了显示结束指示(S35)，在没有输入的情况下(S35中否)，将处理返回到S34。这时，在显示单元32中继续显示在S33中显示的文件图像。

在输入了原文优先指示的情况下(S34中是)，控制单元33在文件图像所包含的译文层数据中将译文的颜色切换成难以看见的颜色(S36)。接着，控制单元33判定文件图像是否包含颜色变更层(S37)，在包含的情况下(S37中是)，从文件图像临时去除颜色变更层数据(S38)。

S38的处理结束之后、或者文件图像不包含颜色变更层数据的情况下(S37中否)，控制单元33代替当前显示的文件图像，而将新的文件图像显示到显示单元32(S39)。

S39的处理的结果，在显示单元32中显示文件图像4(参照图4)，例如该文件图像4包含用黑色描画的原文411、412和用蔚蓝色描画的译文421、422。即，文件图像4以原文优先模式显示。

接着，控制单元33判定是否输入了译文优先指示(S40)，在没有输入的情况下(S40中否)，判定是否输入了显示结束指示(S41)，在没有输入的情况下(S41中否)，将处理返回到S40。这时，在显示单元32中继续显示在S39中显示的文件图像。

在输入了译文优先指示的情况下(S40中是)，控制单元33将处理返回到S32。其结果，在执行了S33的处理的情况下，再次显示例如如图4所示包含用浅黑色描画的原文411、412和用红色描画的译文421、422的文件图像4。

在输入了显示结束指示的情况下(S35中是、或者S41中是)，控制单元33将处理返回到S31。

图8是表示原文图像和文件图像各自的其他的一例的示意图。

在图8(a)、(b)中例示了文件的内容与图3和图4所示的原文图像400和文件图像4不同的原文图像500和文件图像5。文件图像5是本发明的实施方式中的带补充说明文件图像的一例，文件图像5所表示的文件是本发明的实施方式中的带补充说明文件的一例。

图8(a)所示的原文图像500表示在白底以横写记载了黑字的原文511，而且在原文511的右侧记载了图画510的文件。原文511是三行的英文句子“X-ray crystallographic analysis also confirmed the molecular structure.”。更详细地，原文511是在第一行配置了语句“X-ray crystallographic”，并在行尾换行之后，在第二行配置了语句“analysis also confirmed”，并在行尾换行之后，在第三行配置了语句“the molecular structure.”。

在本实施方式中，例示对这样的英文句子所包含的单词或者词组的每一个以鲁比状一并记载了对应于该单词或者词组的日文语句的情况。

图8(b)所示的文件图像5是图像处理单元2基于原文图像500生成的，对原文图像层51、译文层52、以及颜色变更层53进行合成而构成。其中，省略了颜色变更层53所包含的填充图形的图示。

与如图8(a)所示的原文图像500相同，文件图像5表示在白底以横写记载了原文511、而且在原文511的右侧记载了图画510的文件。而且，在文件图像5所表示的文件中，具有红色的译文521被附加到具有浅黑色的原文511的行间区域。

更详细地，在原文511中包含原文语句51a、51b、51c、51d，在译文521中包含作为原文语句51a、51b、51c、51d的翻译结果的译文语句52a、52b、52c、52d。而且，译文语句52a、52b、52c、52d被配置在原文语句51a、51b、51c、51d的相对行间区域。

原文语句51a是语句“X-ray crystallographic analysis”，原文语句51b是语句“confirmed”，原文语句51c是语句“molecular”，原文语句51d是语句“structure”。

译文语句52a是语句“X線結晶解析”，译文语句52b是语句“確認する”，译文语句52c是语句“分子の”，译文语句52d是语句“構造”。

由字符区域提取单元20在S11中执行字符区域提取处理，接着在S12中执行字符区域层和原文图像层生成处理，而且，由字符识别单元21在S13中执行字符识别处理，接着在S14中执行原文信息生成处理，从而得出原文图像500的原文信息。

图9是用于说明由文件图像生成装置1所生成的原文信息的概念图。在图9中表示了对原文信息的一部分进行了汇总的信息。

具体地，在图9中表示了例如作为字符识别结果而得到的各个字符(以下，称为识别字符)的字符号、左X坐标、上Y坐标、右X坐标、下Y坐标、区域号、行内位置、以及字符大小，而省略了各个识别字符的颜色、字体种类、以及倾斜等。

这里，图9中的位置坐标和字符大小各自的单位为点。其中，在识别字符为所谓半角英文数字的情况下，实际的字符大小为图9所示的值的一半。

此外，在图9中例示了从字符号2617号开始到2646号为止的识别字符“X”、“-”、“r”、“a”、“y”、...、“a”、“n”、“a”、“l”、“y”、“s”、“i”、“s”，这些是原文511所包含的从第1号到第30号为止的字符。

字符号2622号的识别字符“”是配置在英文单词“X-ray”与英文单词“crystallographic”之间的空格符号。

如果是通常的英文句子，在英文单词“crystallographic”与英文单词“analysis”之间也存在空格符号。但是，在原文511中，英文单词“crystallographic”配置在第一行的行尾，英文单词“analysis”配置在第二行的行首。因此，省略了应存在于英文单词“crystallographic”与英文单词“analysis”之间的空格符号。因此，如图9所示，作为行尾的字符的字符号2638号的字符“c”与作为行首的字符的字符号2639号的字符“a”之间不存在空格符号。

基于如图9所示的原文信息，S19中的翻译单元22执行翻译处理。

首先，翻译单元22参照表示行内位置的信息，形成并列配置从位于行首的识别字符到位于行尾的识别字符而构成的字符串。对图8所示的原文511，形成第一字符串“X-ray crystallographic”、第二字符串“analysis alsoconfirmed”、以及第三字符串“the molecular structure.”。

接着，翻译单元22对所形成的字符串，执行词素解析、局部句子构造解析、词性估计等自然语言处理。其结果，确定字符串所包含的单词、以及由多个单词构成的词组。

然后，翻译单元22在所确定的单词和词组中选择应翻译成日文的单词和词组。

例如，由于英文单词“also”是众所周知其翻译的单词(换而言之，难度小的单词)，因此不翻译成日文。此外，由于英文单词“the”、空格符号“”、以及句号“.”不具有特别重要的意思，因此不翻译成日文。

接着，翻译单元22将所选择的单词和词组的各自翻译成日文。当存在多个翻译的情况下，翻译单元22例如根据位于应翻译成日语的单词或者词组前后的单词或者词组的翻译，判定最适当的翻译。

图10是用于说明字符串的调整的概念图。此外，图11是用于说明由文件图像生成装置1所生成的原文译文信息的概念图。在图11中表示了原文语句与译文语句的关联。图10(a)与图11(a)相对应，图10(b)与图11(b)相对应。

在图10(a)中表示了第一字符串“X-ray crystallographic”、第二字符串“analysis also confirmed”、以及第三字符串“the molecular structure.”(参照图8)。

从这样的第一～第三字符串选择应翻译成日文的单词和词组的情况下，选择在图11(a)所示的“原文语句”的栏上记载的单词。具体地，从第一字符串选择单词“X-ray”和单词“crystallographic”，从第二字符串选择单词“analysis”和单词“confirmed”，从第三字符串选择单词“molecular”和“structure”。

将这样选择的单词分别翻译成日文的情况下，得到在图11(a)所示的“译文语句”的栏上记载的语句。具体地，得到将单词“X-ray”翻译成日文的语句“X線”，得到将单词“crystallographic”翻译成日文的语句“結晶学の”，得到将单词“analysis”翻译成日文的语句“分析”。同样地，得到将单词“confirmed”、“molecular”、“structure”翻译成日文的语句“確認する”、“分子の”、“構造”。

但是，在原文511中，单词“X-ray”、“crystallographic”、“analysis”形成词组“X-ray crystallographic analysis”，将词组“X-ray crystallographic analysis”翻译成日文的情况下，则得到语句“X線結晶解析”。

即，在原样保持如图10(a)所示的第一字符串、第二字符串、以及第三字符串的情况下，担心产生错误翻译。

为了抑制这样的错误翻译的发生，本实施方式中的翻译单元22在基于原文信息形成字符串时，执行如以下的换行处理。

换行处理是对原文的换行处(原文511的情况下为第一行和第二行各自的行尾)的前后进行连结的处理。其中，原文为英文句子的情况下，在与连结后的原文的换行处相当的位置***空格符号，

具体地，在原文511的情况下，翻译单元22形成将第一字符串“X-raycrystallographic”、空格符号、第二字符串“analysis also confirmed”、空格符号、第三字符串“the molecular structure.”、空格符号按其顺序并列配置而构成的字符串(以下，称为连结字符串)。这时，得到如图10(b)所示的连结字符串“X-ray crystallographic analysis also confirmed the molecular structure.”。在图10(b)中，用箭头进行指示而表示***的空格符号。

在原文译文信息中包含原文511的连结字符串、表示原文511的换行处的换行处信息。翻译单元22作为换行处信息，例如对各第一～第三字符串各个发行识别号，并生成关联了发行的行号、在连结字符串中***空格符号的位置的信息。在下述的处理中，使用连结字符串和换行处信息就能够容易地再现第一～第三字符串。

这里，在第一字符串与第二字符串之间、以及在第二字符串与第三字符串之间***空格符号的理由是因为，英文句子的换行处一般为英文单词的边界的情况较多。在日文的情况下，不需要***空格符号。

另外，原文511包含多个句子的情况下，翻译单元22形成包含全部的多个句子的连结字符串。

从这样的连接字符串选择应翻译成日文的单词和词组的情况下，选择在图11(b)所示的“原文语句”的栏上记载的单词或者词组。具体地，选择词组“X-ray crystallographic analysis”、以及单词“confirmed”、“molecular”、“structure”(即，原文语句51a、51b、51c、51d)。

将这样选择的单词和词组分别翻译成日文的情况下，得到在图11(b)所示的“译文语句”的栏上记载的语句。具体地，得到将词组“X-raycrystallographic analysis”翻译成日文的语句“X線結晶解析”。同样地，得到将单词“confirmed”、“molecular”、“structure”翻译成日文的语句“確認する”、“分子の”、“構造”。以上的结果，得到译文语句52a、52b、52c、52d。

即，通过形成如图10(b)所示的连结字符串，从而能够降低产生错误翻译的可能性。

如以上那样执行从而得到原文与译文的组合之后，S20中的翻译单元22生成原文译文信息。

接着，设定单元23在S21的处理中设定译文的书写格式，在S22的处理中生成译文书写格式信息。

图12是用于说明由文件图像生成装置1生成的译文书写格式信息的概念图。

在图12中例示了表示对各个译文语句52a、52b、52c、52d设定的书写格式的译文书写格式信息。这样的译文书写格式信息是基于如图11(b)所示的原文译文信息而生成的信息，基于生成的译文书写格式信息，S23中的层生成单元24生成图8(b)所示的译文层52。

译文书写格式信息使用多行(在图12中为四行)的数据来表示一个译文语句(例如为译文语句52a)的书写格式。在译文书写格式信息的各行中，配置了一个或者并列配置了多个表示书写格式的参数，在末尾配置了用于区分各行的行尾字符。

在包含行尾字符Tz的行中配置了一个小数点以下6位的实数值。该参数意味着识别字符的横向宽度相乘比率(单位为％)。其中，可以省略包含行尾字符Tz的行，在省略的情况下，识别字符的横向宽度相乘比率成为规定的数值(例如为100.000000)。

在包含行尾字符Tm的行中，在开头侧并列配置了六个小数点以下4位的实数值，在末尾侧并列配置了两个小数点以下2位的实数值。从第一参数到第四参数为止意味着译文语句的倾斜(即旋转)。译文语句的旋转角度在逆时针转向上具有角度θ的情况下，第一参数意味着“cosθ”，第二参数意味着“sinθ”，第三参数意味着“-sinθ”，第四参数意味着“cosθ”。第五和第六参数意味着译文语句的左X坐标和下Y坐标。

在包含行尾字符Tf的行中，在开头侧配置了一个字符串，在末尾侧配置了一个小数点以下1位的实数值。第一参数意味着表示译文语句的字体种类的字体名称标签。图中的第一参数“/FJH”意味着“Shift JIS/MS黑体/横写”。第二参数意味着译文语句的字符大小。

译文语句的字体种类一般与原文语句的字体种类相同。

在包含行尾字符Rg的行中，并列配置了三个小数点以下1位的实数值。从第一参数到第三参数为止意味着译文语句的颜色的R值、G值、以及B值。图中的第一～第三参数“1.00.00.0”意味着红色。

在包含行尾字符Tj的行中，配置了一个位于半角符号“<”与“>”之间的十六进制的数值。该参数意味着包含在译文语句的字符的字符码。例如，参数“<827790fc8c8b8fbb89f090cd>”意味着译文语句52a的字符串“X線結晶解析”。

但是，如图8(b)所示，原文语句51a是由三个单词构成的词组。但是，原文语句51a配置在第一行和第二行中，并且与原文语句51a对应的译文语句52a被附加到第一行下侧的行间区域，因此观看文件图像5的用户可能难以掌握原文语句51a与译文语句52a的关联性。

因此，考虑对原文语句51a赋予下划线。这样的下划线包含在译文层52。

在对原文语句赋予下划线的情况下，设定单元23生成表示下划线的书写格式的信息，并且层生成单元24将生成的信息包含到译文层数据中即可。

另外，为了区分附加了译文语句的原文语句、没有附加译文语句的单词/词组，也可以是对所有的原文语句的各个赋予下划线的结构。

接着，详细地说明将译文语句配置到相对行间区域的步骤。

以下，将第n(n为自然数)个原文语句称为原文语句[n]，将位于原文语句[n]之后(或者之前)的第{n+1}个(或者第{n-1}个)原文语句称为原文语句[n+1](或者原文语句[n-1])。例如，如果原文语句51a(或者原文语句51b)为原文语句[n]，则原文语句[n+1]是原文语句51b(或者原文语句51c)。而且，对与原文语句[n-1]、[n]、[n+1]对应的信息，同样地附加[n-1]、[n]、[n+1]。

设定单元23使用在原文译文信息中的如图10(b)所示的连结字符串、表示如图11(b)所示的原文语句与译文语句的关联的信息，首先求出原文语句[n]的开头字符和末尾字符各自为连结字符串中的第几个字符，同样也对原文语句[n+1]求出。

而且，设定单元23使用包含在原文译文信息中的换行处信息，运算出原文语句[n]的开头字符和末尾字符各自为第L行的第C个字符(L、C各自为“0”以上的整数)，同样也对原文语句[n+1]进行运算。

具体地，原文语句51a的开头字符和末尾字符是第0行的第0个字符和第1行的第7个字符。原文语句51b的开头字符和末尾字符是第一行的第14个字符和第22个字符。原文语句51c的开头字符和末尾字符是第二行的第4字符和第12字符。

接着，设定单元23将原文语句[n]的开头字符的左X坐标设为相对行间区域[n]的左X坐标(即，相对行间区域[n]的开始端X坐标)，同样地也求出相对行间区域[n+1]的左X坐标。

而且，设定单元23判定原文语句[n]的末尾字符与原文语句[n+1]的开头字符是否位于同一行。

如原文语句51a、51b那样，在原文语句[n]的末尾字符与原文语句[n+1]的开头字符位于同一行的情况下，设定单元23求从相对行间区域[n+1]的左X坐标减去了规定值的X坐标，作为相对行间区域[n]的右X坐标(即，相对行间区域[n]的结束端X坐标)。这里，从相对行间区域[n+1]的左X坐标减去了规定值的X坐标是从相对行间区域[n+1]的左X坐标向左只偏移了规定值的位置的X坐标，规定值例如为原文语句[n]的字符大小的1/2的值。

另一方面，如原文语句51b、51c那样，在末尾字符与开头字符位于不同的行的情况下，设定单元23求原文语句[n]的末尾字符所处的行的行尾的字符，将该字符的右X坐标设为相对行间区域[n]的右X坐标。

如以上那样执行从而求出了相对行间区域[n]的开始端和结束端的情况下，如果是原文语句51a的话，能够将相当于从第0行的第0个字符到第一行的第13个字符左右为止的区域作为相对行间区域而使用。因此，相对行间区域[n]的横向长度[n](后述)充分长。

即使在译文语句52a的字符数目非常多、并且译文语句52a的末尾字符被配置到不包含于原文语句51a的英文单词“also”的下侧的情况下，如果如上述那样对原文语句51a赋予下划线，则不担心用户会误认为英文单词“also”的翻译也包含在译文语句52a中。

另外，原文语句[n]与原文语句[n+1]之间存在没有附加译文的单词/词组(例如为原文语句51a与原文语句51b之间的英文单词“also”)的情况下，设定单元23也可以将相对行间区域[n]的结束端X坐标设为从该单词/词组的左X坐标减去了规定值的X坐标。

相对行间区域[n]的开始端X坐标作为译文语句[n]的开始端X坐标而使用。此外，相对行间区域[n]的结束端X坐标作为译文语句[n]的结束端X坐标的上限值而使用。

在求出了相对行间区域[n]的开始端X坐标和结束端X坐标之后，设定单元23求相对行间区域[n]的横向长度[n]。

这时，如原文语句51b那样，原文语句[n]的开头字符和末尾字符位于相同的行的情况下，设定单元23通过从相对行间区域[n]的结束端X坐标减去相对行间区域[n]的开始端X坐标，从而求出横向长度[n]。

另一方面，如原文语句51a那样，原文语句[n]的开头字符和末尾字符位于不同的行的情况下，设定单元23通过对从行尾的字符的右X坐标减去相对行间区域[n]的开始端X坐标的减算结果、从相对行间区域[n]的结束端X坐标减去行首的字符的左X坐标的减算结果进行相加，从而求出横向长度[n]。

以下，例示原文语句[n]的开头字符和末尾字符都位于第L行的情况。

设定单元23求译文语句[n]的字符大小。因此，设定单元23首先求第L行的Y坐标和第{L+1}行的Y坐标。第L行(或者第{L+1}行)的Y坐标是包含在第L行(或者第{L+1}行)的各个字符的下Y坐标的平均值。

接着，设定单元23求相对行间区域[n]的纵向长度[n]。

纵向长度[n]是从第L行的Y坐标减去第{L+1}行的Y坐标，再减去包含在第{L+1}行的字符的字符大小的值。因此，如果纵向长度[n]大(或者小)，则相对行间区域[n]宽(或者窄)。

而且，设定单元23比较对原文语句[n]的字符大小乘上规定下限率(例如为40％)的下限字符大小、对原文语句[n]的字符大小乘上规定上限率(例如为80％)的上限字符大小、以及相对行间区域[n]的纵向长度[n]。考虑译文语句的易读性，而预先设定规定下限率和规定上限率。

如果纵向长度[n]为下限字符大小以上、且上限字符大小以下，则设定单元23使用相对行间区域[n]的纵向长度[n]作为译文语句[n]的字符大小。

另一方面，如果纵向长度[n]小于下限字符大小(或者超过上限字符大小)，则设定单元23使用下限字符大小(或者上限字符大小)作为译文语句[n]的字符大小。

如以上那样，基于相对行间区域[n]的纵向长度[n]和原文语句[n]的字符大小的两方而求译文语句[n]的字符大小。因此，即使原稿图像存在变形，也不会担心原文语句[n]的字符大小与译文语句[n]的字符大小大幅背离。

接着，设定单元23求原文语句[n]的横向宽度相乘比率(配置在图12所示的包含行尾字符Tz的行的参数)。

因此，设定单元23对译文语句[n]的字符大小与包含在译文语句[n]的字符的字符数目进行乘法运算，并判定乘法运算结果是否为相对行间区域[n]的横向长度[n]以下。

乘法运算结果为横向长度[n]以下的情况下，设定单元23将横向宽度相乘比率设为100％。

乘法运算结果超过横向长度[n]的情况下，设定单元23将对横向长度[n]用乘法运算结果除上之后再乘上“100”的值设为横向宽度相乘比率。这时，横向宽度相乘比率小于100％。

设定了小于100％的横向宽度相乘比率的译文语句[n]所包含的字符，在横方向上被压缩。因此，横向宽度相乘比率越小，译文语句[n]越变得难以阅读。

因此，设定单元23判定横向宽度相乘比率是否小于规定的倍率(例如为100％)，在小于规定倍率的情况下，判定在原文语句[n]的可读方向上是否可以延长相对行间区域[n]。如果可以的话，由于在本实施方式中是横写，因此在左右方向上延长相对行间区域[n]。另外，在纵写的情况下在上下方向上延长。

这时，设定单元23求从相对行间区域[n]的结束端X坐标到译文语句[n+1]的开头字符的左X坐标为止的距离，所求出的距离为规定距离以上的情况下，判定为可以向右方向延长相对行间区域[n]。这时，设定单元23将相对行间区域[n]的结束端X坐标延长到从开头字符的左X坐标减去规定值的X坐标为止。

所求出的距离小于规定距离的情况下，设定单元23求从相对行间区域[n]的开始端X坐标到译文语句[n-1]的末尾字符的右X坐标为止的距离，在所求出的距离为规定距离以上的情况下，判定为可以向左方向延长相对行间区域[n]。这时，设定单元23将相对行间区域[n]的开始端X坐标延长到对译文语句[n-1]的末尾字符的右X坐标加上规定值的X坐标为止。

如以上那样延长相对行间区域[n]之后，设定单元23求延长后的横向长度[n]，并基于所求出的横向长度[n]，求横向宽度相乘比率[n]。

另外，在原文语句[n-1]与原文语句[n]之间配置了一个以上的单词的情况下，也可以将相对行间区域[n]的开始端X坐标延长到对原文语句[n]的左边相邻的单词的开头字符(或者中心字符)的右X坐标加上规定值的X坐标为止。这时，用户能够容易掌握原文语句[n]与译文语句[n]的关系。

最后，说明求译文语句[n]的左下端的Y坐标Tm_j_y[n]的步骤。为此，设定单元23预先求出原文语句[n]的左下端的Y坐标。作为原文语句[n]的左下端的Y坐标而考虑以下的Y坐标ye_L[n]和后述的Y坐标ye_W[n]。

首先，对考虑原文的行的倾斜、以原文的一行单位求原文语句[n]的左下端的Y坐标ye_L[n]的情况进行说明。

设定单元23使用以下的式(1)来计算第L行的原文的横向长度linewidth[L]。其中，将原文的字符大小设为Tf_e[L]，将字符数目设为plainlen[L]，将字符间隔设为Tc_e[L]，将横向宽度相乘比率设为Tz_e[L]。

linewidth[L]＝

{(Tf_e[L]+Tc_e[L])×plainlen[L]/2-Tc_e[L]/2}×(Tz_e[L]/100)...(1)

接着，设定单元23通过对第L行所包含的各个字符的下Y坐标进行平均，从而求第L行的原文的下端Y坐标ye_average[L]。

而且，设定单元23考虑行的倾斜，求第L行的原文的左下端的Y坐标ye_0[L]。因此，设定单元23将第L行的原文的下端Y坐标ye_average[L]看作第L行的原文的中心部分的下端Y坐标。具体地，设定单元23使用以下的式(2)计算Y坐标ye_0[L]。其中，将第L行的原文的倾斜系数设为Tm_sin_e[L](＝sinθ)。

ye_0[L]＝ye_average[L]-(linewidth[L]/2)×Tm_sin_e[L]...(2)

接着，设定单元23使用以下的式(3)来计算原文语句[n]的左下端的Y坐标ye_L[n]。其中，将原文语句[n]的左X坐标设为Tm_j_x[n]，将原文的左X坐标设为xj_0[L]。

ye_L[n]＝ye_0[L]+(Tm_j_x[n]-xj_0[L])×Tm_sin_e[L]...(3)

这里，(Tm_j_x[n]-xj_0[L])是原文语句[n]的第L行的原文中的相对X坐标。此外，(Tm_j_x[n]-xj_0[L])×Tm_sin_e[L]是以第L行的原文的左下端为基点的原文语句[n]的左下端的Y轴方向上的位移。

接着，对考虑原文的行的倾斜、以原文语句单位求原文语句[n]的左下端的Y坐标ye_W[n]的情况进行说明。

设定单元23使用以下的式(4)来计算原文语句[n]的横向长度w_width[n]。其中，将原文语句[n]的字符大小设为Tf_e[n]，将字符数目设为plainlen[n]，将字符间隔设为Tc_e[n]，将横向宽度相乘比率设为Tz_e[n]。

w_width[L]＝

{(Tf_e[n]+Tc_e[n])×plainlen[n]/2-Tc_e[n]/2}×(Tz_e[n]/100)...(4)

接着，设定单元23通过对原文语句[n]所包含的各个字符的下Y坐标进行平均，从而求原文语句[n]的下端Y坐标ye_average_w[n]。

而且，设定单元23考虑行的倾斜，求原文语句[n]的左下端的Y坐标ye_W[n]。因此，设定单元23将原文语句[n]的下端Y坐标ye_average_w[n]看作原文语句[n]的中心部分的下端Y坐标。具体地，设定单元23使用以下的式(5)计算Y坐标ye_W[n]。其中，将第L行的原文的倾斜系数设为Tm_sin_e[n](＝sinθ)。

ye_W[n]＝ye_average_w[n]-(w_width[n]/2)×Tm_sin_e[n]...(5)

设定单元23可以是在通过使用式(3)而求出的Y坐标ye_L[n]与通过使用式(5)而求出的Y坐标ye_W[n]之中，只求一个的结构，也可以是求出两方，并基于对所求出的两方进行比较的结果来选择一个的结构。以下，例示后者的情况。

通过使用式(3)、式(5)而求出了Y坐标ye_L[n]和Y坐标ye_W[n]的两方之后，设定单元23比较Y坐标ye_L[n]与Y坐标ye_W[n]。在两者近似的情况下(例如，两者的差值的绝对值为原文语句[n]的字符大小Tf_e[n]的40％以下的情况)，设定单元23选择Y坐标ye_W[n]。另一方面，两者背离的情况下(例如，两者的差值的绝对值超过字符大小Tf_e[n]的40％的情况)，设定单元23选择Y坐标ye_L[n]。

而且，设定单元23将所选择的Y坐标ye_W[n]或者Y坐标ye_L[n]设为译文语句[n]的左上端的Y坐标yj[n]。即，在本实施方式中，求出Y坐标yj[n]，使得原文语句[n]的左下端与译文语句[n]的左上端一致。

另外，设定单元23也可以将对所选择的Y坐标ye_W[n]或者Y坐标ye_L[n]的值加上适当的微小值(例如为1.5点)的值，代入到Y坐标yj[n]。这时，译文语句[n]的上部稍微重叠到原文语句[n]的下部，因此能够使原文语句[n]与译文语句[n]的关联更加易懂，而不牺牲原文语句[n]和译文语句[n]各自的可读性。

译文语句[n]的左下端的Y坐标Tm_j_y[n]与译文语句[n]的左上端的Y坐标yj[n]的差异，等同于译文语句[n]的字符大小Tf_j[n]。因此，设定单元23通过从Y坐标yj[n]减去字符大小Tf_j[n]，从而求出Y坐标Tm_j_y[n]。

但是，这样求出的Y坐标Tm_j_y[n]为第{L+1}行的原文的上端Y坐标ye_average_upper[L+1]以下的情况是，因行间区域[n]窄而译文语句[n]重叠到第{L+1}行的原文的情况。此外，优选为介于译文语句[n]的下端与第{L+1}行的原文的上端之间至少存在规定间隔int”(例如为1.5点)的空白。

因此，设定单元23比较所求出的Y坐标Tm_j_y[n]与上端Y坐标ye_average_upper[L+1]。如果是{Tm_j_y[n]+int}≥ye_average_upper[L+1]，设定单元23则采用求出的Y坐标Tm_j_y[n]，如果是{Tm_j_y[n]+int}＜ye_average_upper[L+1]，则使用以下的式(6)求Y坐标Tm_j_y[n]。

Tm_j_y[n]＝ye_average_upper[L+1]+int...(6)

其结果，译文语句[n]的左上端的Y坐标yj[n]成为对通过式(6)求出的Y坐标Tm_j_y[n]加上译文语句[n]的字符大小Tf_j[n]的值。换言之，译文语句[n]的左上端向上方移动。

例如，如图3和图4所示，如以上那样的文件图像生成装置1能够得到保持原文图像400的版面，并提高了原文411、412的两方的可读性的文件图像4。

另外，文件图像4除了原文图像优先模式和译文优先模式之外，还可以具有用于阅览原文图像400的原文图像阅览模式。在原文图像阅览模式下，文件图像4以临时去除了译文层42和色彩变更层43的状态(即，与原文图像400相同的状态)显示在显示单元32。

实施方式2：

图13是用于说明由本发明的实施方式2的文件图像生成装置1生成文件图像的步骤的功能方框图。

在硬件上，本实施方式中的文件图像生成装置1是与实施方式1的文件图像生成装置1相同的结构。此外，对与实施方式1对应的部分赋予相同的符号，并省略其说明。

比较图13所示的图像处理单元2与实施方式1的图2所示的图像处理单元2则可知，在本实施方式中，变更单元26不使用表示原文图像层的原文图像层数据。另一方面，变更单元26生成后述的字符配置信息。设定单元23使用所生成的字符配置信息。

图14是表示由文件图像生成装置1所执行的文件生成处理的步骤的流程图。图14所示的文件生成处理的S11～S15、S19、S20、S22～S24与实施方式1的图5所示的文件生成处理的S11～S15、S19、S20、S22～S24相同。

实施方式1的颜色变更层包含具有规定的透明度的填充图形，但本实施方式的颜色变更层包含具有规定的透明度的矩形符号。即，本实施方式中的颜色变更层是字符层。

如图14所示，原文的颜色不满足规定的条件的情况下(S15中否)，变更单元26对每个规定单位设定矩形符号的颜色、字符大小、纵横的倍率、以及配置位置等(S51)。如以下的图15和后述的图16所示，在本实施方式中规定单位为单词。

图15是表示由文件图像生成装置1所生成的颜色变更层43的一例的示意图。

在图15中表示了对原文图像层41、译文层42、以及颜色变更层43进行合成而构成的文件图像4。原文图像层41和译文层42与图6所示的原文图像层41和译文层42相同。

原文413、414所包含的英文字符中，与英文字符“a”、“c”、“r”相比，英文字符“p”、“q”是在下侧具有突出的部分的纵向稍长的字符，英文字符“b”、“d”是在上侧具有突出的部分的纵向稍长的字符。

在图15中用虚线表示的矩形符号431是所谓的黑色四角形符号。

这里，矩形符号431具有如下的字符大小(参照图16)，能够用一个矩形符号431完全覆盖英文字符“a”、“c”、“r”的各个，能够用纵向紧密配置的两个矩形符号431完全覆盖原文413、414所包含的英文字符“b”、“d”、“p”、“q”的各个。因此，用一个矩形符号431无法覆盖各自包含多个字符的原文413、414。

图14所示的S51中的变更单元26与背景色无关地，将矩形符号431的颜色设定成规定的颜色。这里所使用的规定的颜色期望是透明度高的颜色(例如为半透明的蔚蓝色)。这时，使用矩形符号431而构成的矩形符号432、433(后述)由于具有难以看见的颜色，因此不显眼。

另外，为了设定矩形符号431的颜色，变更单元26也可以与实施方式1的图5所示的S16的处理相同地检测背景色。这时，变更单元26将矩形符号431的颜色设定成与检测出的背景色对应的颜色。具体地，变更单元26将矩形符号431的R值、G值、以及B值设成与背景的R值、G值、以及B值相同，将矩形符号431的透明度设成比背景的透明度高的透明度。其结果，在用户的眼中几乎看不见文件图像4所表示的矩形符号432、433。

此外，图14所示的S51中的变更单元26将矩形符号431的字符大小设定成规定的字符大小。

另外，变更单元26也可以根据例如原文所包含的字符的字符大小设定矩形符号431的字符大小。

而且，S51中的变更单元26对配置了原文413、414的各个(即各单词)的矩形区域(以下，称为原文区域)进行运算。这时，变更单元26求原文区域的左X坐标、上Y坐标、右X坐标、下Y坐标、以及原文区域的纵向长度和横向长度。

这里，例如原文413(或者原文414)的原文区域的左X坐标和下Y坐标是，在原文413(或者原文414)所包含的各个字符的左X坐标和下Y坐标中最小的值。同样地，原文413(或者原文414)的原文区域的右X坐标和上Y坐标是，在原文413(或者原文414)所包含的各个字符的右X坐标和上Y坐标中最大的值。

接着，变更单元26通过用矩形符号431的纵向长度和横向长度除上原文413(或者原文414)的原文区域的纵向长度和横向长度，从而设定矩形符号431的纵横的倍率。在原文413(或者原文414)的原文区域的情况下，矩形符号431的纵横的倍率为纵向三倍和横向四倍(或者纵向横向都是三倍)。

对矩形符号431乘上这样设定的倍率的情况下，能够得到覆盖原文413的最小面积的矩形符号432(或覆盖原文414的最小面积的矩形符号433)。

而且，此外S51中的变更单元26分别设定矩形符号432、433的配置位置。这时，矩形符号432、433各自的左X坐标、上Y坐标、右X坐标、以及下Y坐标等同于原文413、414的原文区域各自的左X坐标、上Y坐标、右X坐标、以及下Y坐标。

S51结束之后，变更单元26生成颜色变更层数据(S52)。在图15的情况下，在S52中生成的颜色变更层数据所表示的颜色变更层是颜色变更层43，在颜色变更层43中，具有规定的透明度的矩形符号432、433被配置到与原文图像层41中的原文413、414的配置位置对应的位置。矩形符号432、433能够完全地覆盖原文413、414的原文区域。

另外，通过执行S51和S52的处理而生成的颜色变更层43不限定于图15所示的颜色变更层43。

图16(a)、(b)各自是表示由文件图像生成装置1所生成的颜色变更层43的其他的一例的示意图。图16(a)、(b)各自所示的文件图像4是与图15所示的文件图像4大致相同的结构。

其中，图15所示的颜色变更层43包含各一个矩形符号432、433，但是，图16(a)所示的颜色变更层43包含总计21个(更详细地说，与原文413的原文区域对应的12个、以及与原文414的原文区域对应的9个)矩形符号431、431、...。此外，图16(b)所示的颜色变更层43包含总计11个(更详细地说，对原文413的6个、以及对原文414的5个)矩形符号431、431、...。

首先，说明图16(a)所示的颜色变更层43。

矩形符号431具有与图15所示的矩形符号431相同的颜色和字符大小，纵横的倍率是纵向横向各自都为一倍。在该颜色变更层43中，对规定单位即单词的每一个紧密配置了多个矩形符号431、431、...。

因此，图14所示的S51中的变更单元26首先将矩形符号431的颜色、字符大小、以及纵横的倍率设定成规定的颜色、规定的字符大小、以及规定的字符倍率(这时，1×1倍)。

此外，S51中的变更单元26分别对原文413、414的原文区域进行运算。这时，变更单元26求原文区域的左X坐标、上Y坐标、右X坐标、下Y坐标、以及原文区域的纵向长度和横向长度。

接着，变更单元26基于原文区域的纵向长度和横向长度以及矩形符号431的纵向长度和横向长度，求用于完全覆盖原文区域所需的最小限度的矩形符号431、431、...的个数。在原文413(或者原文414)的原文区域的情况下，用于完全覆盖原文区域所需的最小限度的矩形符号431、431、...的个数是12个(或者9个)。

然后，变更单元26求各矩形符号431的配置位置。例如，在原文413(或者原文414)的原文区域的情况下，位于原文区域的最左上的矩形符号431的左X坐标和上Y坐标等同于原文区域的左X坐标和上Y坐标。

接着，说明图16(b)所示的颜色变更层43。

在该颜色变更层43中，对规定单位即单词的每一个，根据该单词所包含的字符的形状配置了多个矩形符号431、431、...。

此外，S51中的变更单元26分别对原文413、414求配置字符的区域(以下，称为字符配置区域)。在这里所求出的字符配置区域中，反映各字符的形状。具体地，变更单元26求原文413(或者原文414)所包含的各字符的左X坐标、上Y坐标、右X坐标、以及下Y坐标。

然后，变更单元26设定矩形符号431、431、...的配置位置，使得各字符配置区域完全被覆盖。

另外，变更单元26也可以根据各字符的形状来设定矩形符号431的纵横的倍率。这时，例如与英文字符“a”、“c”、“r”的各自对应的矩形符号是将矩形符号431扩大成1×1倍的符号，与英文字符“b”、“d”、“p”、“p”的各自对应的矩形符号是将矩形符号431扩大成1×2倍的符号.

如图14所示，在S52的处理结束之后，变更单元26生成字符配置信息(S53)。这里，字符配置信息是例如配置了图15所示的矩形符号432、433各自的区域的左X坐标、上Y坐标、右X坐标、以及下Y坐标。为了限制译文与矩形符号的重叠，而使用字符配置信息。

S53结束之后，图像处理单元2将处理转移到S19。

图17是用于说明译文423、424与矩形符号434的重叠的限制的示意图。译文423、424被附加到原文415的行间区域。图17(a)表示译文423、424与矩形符号434的重叠被限制之前的状态，图17(b)表示译文423、424与矩形符号434的重叠被限制之后的状态。

如图17所示，原文415是英文字符“A”，译文423是平假名“っ”，译文424是平假名“し”。与平假名“っ”相比，平假名“し”在上方具有突出的部分。

译文423、424互相相邻地配置在同一行。

矩形符号434覆盖原文415的原文区域。行间区域窄的情况下，难以避免译文423、424被配置成重叠到原文区域。因此，如图17(a)所示，译文423是上半部分(即上部1/2)左右重叠到矩形符号434，译文423是上部3/4左右重叠到矩形符号434。

这里，考虑将配置了译文所包含的字符的范围与配置了颜色变更层中的矩形符号的范围的重复限制到规定量以下(具体地50％以下)。这时，虽然容许配置了译文423的范围与配置了矩形符号434的范围的重复，但不容许配置了译文424的范围与配置了矩形符号434的范围的重复。

为了将译文424与矩形符号434的重复限制到规定量以下，考虑了向下侧偏移译文424的配置位置，但这时担心译文424重叠到原文415的下一行的原文。因此，在本实施方式中，通过减小译文424所包含的字符的字符大小，从而将译文424与矩形符号434的重复限制到规定量以下。这时，为了防止因配置在同一行的字符之间的字符大小的不一致引起的可读性和美观等的恶化，需要使译文423的字符大小一致于减小后的译文424的字符大小。

如图17(b)所示，译文423、424所包含的各字符的字符大小比图17(a)的字符大小还减小。因此，译文423不重叠于矩形符号434，译文424是上部1/2左右重叠到矩形符号434。即，译文423、424与矩形符号434的重叠被限制。

如图14所示，S20的处理结束之后，设定单元23基于在S20中生成的原文译文信息、在S53中生成的字符配置信息来设定译文的书写格式(S54)。这时，如实施方式1中说明的那样，设定单元23临时设定字符大小之后，判定具有临时设定的字符大小的译文与矩形符号的重复是否为规定量以下。而且，在译文与矩形符号的重复超过规定量的情况下，设定单元23将译文的字符大小设定为比临时设定的字符大小还适当小的字符大小。

这样的设定单元23作为本发明的实施方式中的限制部件而起作用。

S54结束之后，图像处理单元2将处理转移到S22。

另外，设定单元23也可以是在判定为译文与矩形符号的重复超过规定量的情况下，将处理返回到S51的结构。这时，变更单元26重新设定矩形符号的字符大小和配置位置等，使得译文与矩形符号的重复成为规定量以下。

如以上那样的文件图像生成装置1起到与实施方式1的文件图像生成装置1相同的效果。

实施方式3：

图18是示意性地表示本发明的实施方式3的文件图像生成装置6的结构的方框图。

在本实施方式1、2中，例示了使用数字复合机而构成的文件图像生成装置1，但是在本实施方式中例示使用PC而构成的文件图像生成装置6。

文件图像生成装置6具备控制单元61、显示单元62、操作单元63、I/F(接口)单元64、驱动器单元65、以及存储单元66。

控制单元61是文件图像生成装置6的控制中枢，使用未图示的RAM作为工作区域来对装置的各单元进行控制，此外执行各种处理。

驱动器单元65例如使用CD-ROM驱动器而构成，并从设置在自身的记录介质8读取各种信息。

记录介质8例如为光盘，在记录介质8中存储了计算机程序8P。计算机程序8P作为本发明的实施方式中的计算机程序而起作用。

存储单元66使用非易失性的大容量存储装置而构成，存储有词典DB60。

控制单元61从设置在驱动器单元65的存储介质8读取计算机程序8P，将所读取的计算机程序8P存储到存储单元66。此外，控制单元61将计算机程序8P加载到RAM，并按照所加载的计算机程序8P来实现本发明的实施方式的文件图像生成方法。

显示单元62例如使用液晶显示器而构成，由控制单元61进行控制，并显示基于文件图像的彩色图像。

操作单元63使用键盘和鼠标而构成，该键盘和鼠标用于用户对文件图像生成装置6进行操作。用户通过对操作单元63进行操作，从而将各种指示输入到文件图像生成装置6。所输入的指示被提供到控制单元61。

I/F单元64用于连接文件图像生成装置6与文件图像生成装置6的外部的图像读取装置71和图像记录装置72。

图像读取装置71是彩色扫描仪装置、或者作为彩色扫描仪装置起作用的数字复合机等，光学性地通过彩色读取在放置于图像读取装置71的记录用纸或者书籍等中记录的图像。由图像读取装置71所读取的彩色图像(即原文图像)被发送到文件图像生成装置6。

文件图像生成装置6的控制单元61经由I/F单元64接收从图像读取装置71发送的原文图像。

控制单元61基于接收的原文图像来生成文件图像。因此，控制单元61执行与实施方式1的图5或者实施方式2的图14所示的文件生成处理相同的文件生成处理。这时，控制单元61作为本发明的实施方式中的判定部件、变更部件、设定部件、生成部件、合成部件、以及限制部件而起作用。

此外，控制单元61在生成了至少一个文件图像时，直到所生成的文件图像全部被删除为止，执行与实施方式1的图7所示的文件显示处理相同的文件显示处理。其结果，将基于文件图像的彩色图像显示到显示单元62。

或者，控制单元61经由I/F单元64，将所生成的文件图像发送到图像记录装置72。

图像记录装置72是彩色打印机装置、或者作为彩色打印机装置起作用的数字复合机等，将基于所接收的文件图像的彩色图像记录到记录用纸。

另外，不限定于从外部接收原文图像的结构。例如，也可以是通过用户一边观看显示单元62一边操作操作单元63从而生成原文图像的结构。

此外，不限定于从原文自动地生成译文的结构。例如，也可以是用户生成译文并提供到文件图像生成装置6的结构。

而且，由文件图像生成装置6所生成的文件图像，例如也可以被实施方式1的PC3利用。

在本实施方式1～3中，对并列记载了原文和译文的带补充说明文件进行了例示，但不限定于此，也可以是并列记载了原文、原文的注释、或者原文的阅读假名、发音符号、或者拼音符号等的带补充说明文件。而且，原文不限定于英语，译文不限定于日语。

而且，此外原文图像和文件图像的各自不限定于彩色图像，也可以是黑白图像。

此外，文件图像生成装置1、6也可以以PDF以外的格式生成文件图像。

这里，对以往技术与本发明的实施方式1、2的差异进行说明。

特开2009-53838号公报所记载的翻译装置根据背景色来决定译文的颜色。

特开2005-157412号公报所记载的机器翻译装置以明确表示原文所包含的单词与翻译了该单词的语句的对应关系为目的，决定两者的字符颜色。

如以上那样，以往的技术没有根据原文的颜色来决定译文的颜色。此外，专利文献1、2中没有记载如下的技术：该技术兼顾获得在保持了原文图像中的原文的版面的状态下的文件图像的情况、与即使行间区域窄也确保原文和译文各自的可读性的情况。

本发明可以以多种方式实施而不脱离本发明的实质特点的精神，因此上述的实施方式用于例示而不是用于限制。本发明的范围是通过权利要求确定的，而不是通过之前的描述，因此通过权利要求而包含处于权利要求范围、或者其类似中的所有变更。

Claims

1.一种文件图像生成装置，包括：

接受单元，接受原始图像；

提取单元，从由所述接受单元接受的原始图像提取原文；

补充说明生成单元，生成由所述提取单元提取出的原文的补充说明；

补充说明颜色设定单元，设定由所述补充说明生成单元生成的所述补充说明的颜色；以及

文件图像生成单元，使用由所述补充说明颜色设定单元设定的颜色，生成在由所述接受单元接受的原始图像中附加有由所述补充说明生成单元生成的补充说明的文件图像，其中，

在由所述文件图像生成单元生成的文件图像中，所述原文的颜色与所述补充说明的颜色不同，

所述文件图像生成装置还包括：

选择单元，从优先所述原文的视认性的原文优先模式与优先所述补充说明的视认性的补充说明优先模式选择一方，其中，

在所述选择单元选择了所述原文优先模式的情况下，所述文件图像中的原文的视认性变得比补充说明的视认性高，

在所述选择单元选择了所述补充说明优先模式的情况下，所述文件图像中的补充说明的视认性变得比原文的视认性高。

2.如权利要求1所述的文件图像生成装置，还包括：

层生成单元，生成表示由所述接受单元接受的原始图像的原始层、表示由所述补充说明生成单元生成的补充说明的补充说明层，其中，

所述文件图像生成单元通过合成由所述层生成单元生成的原始层和补充说明层，从而生成所述文件图像。

3.如权利要求2所述的文件图像生成装置，还包括：

判定单元，判定由所述提取单元提取出的原文的颜色是否满足规定的条件；以及

原文颜色变更单元，在所述判定单元判定为不满足规定的条件的情况下将所述文件图像中的所述原文的颜色变更为满足所述规定的条件的颜色，在所述判定单元判定为满足规定的条件的情况下不变更所述文件图像中的所述原文的颜色，其中，

由所述补充说明颜色设定单元设定的颜色不满足所述规定的条件。

4.如权利要求1所述的文件图像生成装置，其中，

在所述选择单元选择了所述原文优先模式的情况下，并且所述文件图像中的背景的颜色为白色的情况下，所述文件图像中的原文的亮度变得比补充说明的亮度低，

在所述选择单元选择了所述补充说明优先模式的情况下，并且所述文件图像中的背景的颜色为白色的情况下，所述文件图像中的补充说明的亮度变得比原文的亮度低。

5.如权利要求1所述的文件图像生成装置，其中，

在所述选择单元选择了所述原文优先模式的情况下，并且所述文件图像中的背景的颜色为白色的情况下，所述文件图像中的原文的饱和度变得比补充说明的饱和度高，

在所述选择单元选择了所述补充说明优先模式的情况下，并且所述文件图像中的背景的颜色为白色的情况下，所述文件图像中的补充说明的饱和度变得比原文的饱和度高。

6.如权利要求1所述的文件图像生成装置，其中，

在所述选择单元选择了所述原文优先模式的情况下，并且所述文件图像中的背景的颜色为白色的情况下，所述文件图像中的原文的不透明度变得比补充说明的不透明度高，

在所述选择单元选择了所述补充说明优先模式的情况下，并且所述文件图像中的背景的颜色为白色的情况下，所述文件图像中的补充说明的不透明度变得比原文的不透明度高。

7.如权利要求1至3的任一项所述的文件图像生成装置，还包括：

分割单元，分割由所述补充说明生成单元生成的补充说明从而生成多个分割补充说明，其中，

所述补充说明颜色设定单元对由所述分割单元生成的分割补充说明的每一个，设定由所述补充说明生成单元生成的补充说明的颜色。

8.如权利要求3所述的文件图像生成装置，其中，

所述层生成单元还生成颜色变更层，

所述原文颜色变更单元使用所述层生成单元生成的颜色变更层来执行所述原文的颜色的变更处理，

所述文件图像生成单元通过合成由所述层生成单元生成的原始层、补充说明层、以及所述颜色变更层，从而生成所述文件图像。

9.如权利要求8所述的文件图像生成装置，其中，

由所述层生成单元生成的颜色变更层具有填充图形，该填充图形具有规定的透明度，

所述颜色变更层中的所述填充图形的位置对应于所述原始层中的所述原文的位置。

10.如权利要求9所述的文件图像生成装置，其中，

所述填充图形是矩形。

11.如权利要求10所述的文件图像生成装置，还包括：

分离单元，分离由所述提取单元提取出的原文从而生成多个分离原文，其中，

在由所述层生成单元生成的颜色变更层中，对由所述分离单元生成的分离原文的每一个配置一个所述填充图形。

12.如权利要求10所述的文件图像生成装置，还包括：

在由所述层生成单元生成的颜色变更层中，对由所述分离单元生成的分离原文的每一个配置多个所述填充图形。

13.如权利要求12所述的文件图像生成装置，还包括：

倍率设定单元，根据由所述分离单元生成的各分离原文所包含的字符的形状来设定所述多个所述填充图形的纵横的倍率。

14.如权利要求12所述的文件图像生成装置，还包括：

配置位置设定单元，根据由所述分离单元生成的各分离原文所包含的字符的形状来设定所述多个所述填充图形的配置位置。

15.如权利要求9所述的文件图像生成装置，还包括：

填充图形颜色设定单元，将所述填充图形的颜色设定为与由所述接受单元接受的原始图像的背景的颜色对应的颜色。

16.如权利要求9所述的文件图像生成装置，还包括：

限制单元，调整所述补充说明层中的补充说明的位置和所述颜色变更层中的填充图形的位置，限制所述文件图像中的补充说明的位置与填充图形的位置的重复。

17.一种文件图像生成方法，包括以下步骤：

接受原始图像；

从所接受的所述原始图像提取原文；

生成所提取的所述原文的补充说明；

设定所生成的所述补充说明的颜色；以及

使用所设定的所述颜色，生成在所接受的所述原始图像中附加有所生成的所述补充说明的文件图像，其中，

在所生成的所述文件图像中，所述原文的颜色与所述补充说明的颜色不同，

所述文件图像生成方法还包括：

选择步骤，从优先所述原文的视认性的原文优先模式与优先所述补充说明的视认性的补充说明优先模式选择一方，其中，

在所述选择步骤中选择了所述原文优先模式的情况下，所述文件图像中的原文的视认性变得比补充说明的视认性高，

在所述选择步骤中选择了所述补充说明优先模式的情况下，所述文件图像中的补充说明的视认性变得比原文的视认性高。

18.如权利要求17所述的文件图像生成方法，还包括以下步骤：

生成表示所接受的所述原始图像的原始层和表示所生成的所述补充说明的补充说明层，其中，

所生成的所述文件图像合成有所生成的所述原始层和所述补充说明层。