JP6579332B2 - 画像形成装置、文書電子化プログラムおよび文書電子化方法 - Google Patents

画像形成装置、文書電子化プログラムおよび文書電子化方法

Info

Publication number
JP6579332B2
JP6579332B2 JP2016149069A JP2016149069A JP6579332B2 JP 6579332 B2 JP6579332 B2 JP 6579332B2 JP 2016149069 A JP2016149069 A JP 2016149069A JP 2016149069 A JP2016149069 A JP 2016149069A JP 6579332 B2 JP6579332 B2 JP 6579332B2
Authority
JP
Japan
Prior art keywords
document
image
original
corrected
retouched
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2016149069A
Other languages
English (en)
Other versions
JP2018019300A (ja
Inventor
陽介 樫本
陽介 樫本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2016149069A priority Critical patent/JP6579332B2/ja
Priority to CN201710555352.7A priority patent/CN107666548A/zh
Priority to US15/660,415 priority patent/US20180032485A1/en
Publication of JP2018019300A publication Critical patent/JP2018019300A/ja
Application granted granted Critical
Publication of JP6579332B2 publication Critical patent/JP6579332B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00795Reading arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B41PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
    • B41JTYPEWRITERS; SELECTIVE PRINTING MECHANISMS, i.e. MECHANISMS PRINTING OTHERWISE THAN FROM A FORME; CORRECTION OF TYPOGRAPHICAL ERRORS
    • B41J3/00Typewriters or selective printing or marking mechanisms characterised by the purpose for which they are constructed
    • B41J3/44Typewriters or selective printing mechanisms having dual functions or combined with, or coupled to, apparatus performing other functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/106Display of layout of documents; Previewing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00132Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture in a digital photofinishing system, i.e. a system where digital photographic images undergo typical photofinishing processing, e.g. printing ordering
    • H04N1/00167Processing or editing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00474Output means outputting a plurality of functional options, e.g. scan, copy or print

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Processing Or Creating Images (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、手書きによって修正された加筆修正済み原稿に基づいて文書を電子化する画像形成装置、文書電子化プログラムおよび文書電子化方法に関する。
従来、手書きによって修正された加筆修正済み原稿に基づいて文書を電子化する文書編集装置が知られている(例えば、特許文献1参照。)。
特開平11−272654号公報
しかしながら、特許文献1に記載された文書編集装置においては、加筆修正済み原稿の元原稿に含まれる文字の位置を変更することなく、加筆部分によって指示された文字を元原稿に追加するので、電子化された文書、すなわち、電子化文書において文字のレイアウトが不自然になるという問題がある。
そこで、本発明は、加筆修正済み原稿に基づいた電子化文書におけるレイアウトの適切性を向上することができる画像形成装置、文書電子化プログラムおよび文書電子化方法を提供することを目的とする。
本発明の画像形成装置は、原稿から画像を読み取る読取デバイスと、手書きによって修正された加筆修正済み原稿の画像を前記読取デバイスによって取得する画像取得手段と、前記画像取得手段によって取得された前記加筆修正済み原稿の画像から加筆部分を抽出する加筆部分抽出手段と、前記加筆修正済み原稿の元原稿に含まれる領域を前記元原稿から抽出する領域抽出手段と、前記領域抽出手段によって抽出された前記領域に基づいて前記元原稿のレイアウトの指針を判断するレイアウト指針判断手段と、前記加筆部分抽出手段によって抽出された前記加筆部分によって指示された修正内容で、前記レイアウト指針判断手段によって判断された前記指針に応じて前記元原稿を編集して電子化文書を生成する原稿編集手段とを備え、前記レイアウト指針判断手段は、文字の前記領域同士の連続性を判断し、前記原稿編集手段は、前記レイアウト指針判断手段によって連続性があると判断された複数の前記領域同士が連続しているものとして前記元原稿を編集することを特徴とする。
この構成により、本発明の画像形成装置は、加筆修正済み原稿の画像から抽出した加筆部分によって指示された修正内容で元原稿を編集して電子化文書を生成する場合に、加筆修正済み原稿の元原稿に含まれる領域のうち文字の領域同士の連続性を判断し、連続性があると判断した複数の領域同士が連続しているものとして元原稿を編集するので、加筆修正済み原稿に基づいた電子化文書におけるレイアウトの適切性を向上することができる。
本発明の画像形成装置において、前記レイアウト指針判断手段は、複数の前記領域の間における文字の内容の連続性に基づいて前記領域同士の連続性を判断しても良い。
この構成により、本発明の画像形成装置は、複数の領域の間における文字の内容の連続性に基づいて領域同士の連続性を判断するので、領域同士の連続性の判断の適切性を向上することができる。したがって、本発明の画像形成装置は、加筆修正済み原稿に基づいた電子化文書におけるレイアウトの適切性を向上することができる。
本発明の画像形成装置において、前記レイアウト指針判断手段は、複数の前記領域の間における段落の形式の連続性に基づいて前記領域同士の連続性を判断しても良い。
この構成により、本発明の画像形成装置は、複数の領域の間における段落の形式の連続性に基づいて領域同士の連続性を判断するので、領域同士の連続性の判断の適切性を向上することができる。したがって、本発明の画像形成装置は、加筆修正済み原稿に基づいた電子化文書におけるレイアウトの適切性を向上することができる。
本発明の画像形成装置は、前記加筆修正済み原稿の画像から前記元原稿を再現する元原稿再現手段を備え、前記加筆部分抽出手段は、色に基づいて前記加筆修正済み原稿の画像から前記加筆部分を抽出し、前記元原稿再現手段は、前記加筆部分抽出手段によって抽出された前記加筆部分を前記加筆修正済み原稿の画像から取り除くことによって前記元原稿を再現しても良い。
この構成により、本発明の画像形成装置は、元原稿自体がなくても、加筆修正済み原稿があれば、元原稿を再現することができるので、利便性を向上することができる。
本発明の文書電子化プログラムは、原稿から画像を読み取る読取デバイスを備える画像形成装置に、手書きによって修正された加筆修正済み原稿の画像を前記読取デバイスによって取得する画像取得手段と、前記画像取得手段によって取得された前記加筆修正済み原稿の画像から加筆部分を抽出する加筆部分抽出手段と、前記加筆修正済み原稿の元原稿に含まれる領域を前記元原稿から抽出する領域抽出手段と、前記領域抽出手段によって抽出された前記領域に基づいて前記元原稿のレイアウトの指針を判断するレイアウト指針判断手段と、前記加筆部分抽出手段によって抽出された前記加筆部分によって指示された修正内容で、前記レイアウト指針判断手段によって判断された前記指針に応じて前記元原稿を編集して電子化文書を生成する原稿編集手段とを実現させ、前記レイアウト指針判断手段は、文字の前記領域同士の連続性を判断し、前記原稿編集手段は、前記レイアウト指針判断手段によって連続性があると判断された複数の前記領域同士が連続しているものとして前記元原稿を編集することを特徴とする。
この構成により、本発明の文書電子化プログラムを実行する画像形成装置は、加筆修正済み原稿の画像から抽出した加筆部分によって指示された修正内容で元原稿を編集して電子化文書を生成する場合に、加筆修正済み原稿の元原稿に含まれる領域のうち文字の領域同士の連続性を判断し、連続性があると判断した複数の領域同士が連続しているものとして元原稿を編集するので、加筆修正済み原稿に基づいた電子化文書におけるレイアウトの適切性を向上することができる。
本発明の文書電子化方法は、手書きによって修正された加筆修正済み原稿の画像を読取デバイスによって取得する画像取得ステップと、前記画像取得ステップによって取得された前記加筆修正済み原稿の画像から加筆部分を抽出する加筆部分抽出ステップと、前記加筆修正済み原稿の元原稿に含まれる領域を前記元原稿から抽出する領域抽出ステップと、前記領域抽出ステップによって抽出された前記領域に基づいて前記元原稿のレイアウトの指針を判断するレイアウト指針判断ステップと、前記加筆部分抽出ステップによって抽出された前記加筆部分によって指示された修正内容で、前記レイアウト指針判断ステップによって判断された前記指針に応じて前記元原稿を編集して電子化文書を生成する原稿編集ステップとを備え、前記レイアウト指針判断ステップは、文字の前記領域同士の連続性を判断するステップであり、前記原稿編集ステップは、前記レイアウト指針判断ステップによって連続性があると判断された複数の前記領域同士が連続しているものとして前記元原稿を編集するステップであることを特徴とする。
この構成により、本発明の文書電子化方法は、加筆修正済み原稿の画像から抽出した加筆部分によって指示された修正内容で元原稿を編集して電子化文書を生成する場合に、加筆修正済み原稿の元原稿に含まれる領域のうち文字の領域同士の連続性を判断し、連続性があると判断した複数の領域同士が連続しているものとして元原稿を編集するので、加筆修正済み原稿に基づいた電子化文書におけるレイアウトの適切性を向上することができる。
本発明の画像形成装置、文書電子化プログラムおよび文書電子化方法は、加筆修正済み原稿に基づいた電子化文書におけるレイアウトの適切性を向上することができる。
本発明の一実施の形態に係るMFPのブロック図である。 加筆修正済み原稿に基づいて文書を電子化する場合の図1に示すMFPの動作のフローチャートである。 図2に示す加筆修正済み原稿の画像の一例を示す図である。 図3に示す加筆修正済み原稿の加筆部分の画像を示す図である。 図3に示す加筆修正済み原稿の元原稿の画像を示す図である。 複数の領域に分離された、図5に示す元原稿の画像を示す図である。 複数の領域に分離された元原稿の画像であって、図6に示す例とは異なる例の画像を示す図である。 複数の領域に分離された元原稿の画像であって、図6および図7に示す例とは異なる例の画像の一部を示す図である。 図6に示す画像から生成される原稿レイアウト情報を示す図である。 図2に示す編集処理のフローチャートである。 文字の領域を新たに追加した場合の図9に示す原稿レイアウト情報の一部を示す図である。 (a)図1に示すMFPが「題」を認識しない場合の領域の一例を示す図である。 (b)図1に示すMFPが「題」を認識する場合の領域の一例を示す図である。 図3に示す加筆修正済み原稿に基づいた電子化文書を示す図である。 図13に示す文書に対するレイアウトを示す図である。 加筆修正済み原稿の画像の一例であって、図2に示す例とは異なる一例を示す図である。 図15に示す加筆修正済み原稿の元原稿の画像を示す図である。 複数の領域に分離された、図16に示す元原稿の画像を示す図である。 図15に示す加筆修正済み原稿に基づいた電子化文書を示す図である。 図18に示す文書に対するレイアウトを示す図である。
以下、本発明の一実施の形態について、図面を用いて説明する。
まず、本実施の形態に係る画像形成装置としてのMFP(Multifunction Peripheral)の構成について説明する。
図1は、MFP10のブロック図である。
図1に示すように、MFP10は、種々の操作が入力されるボタンなどの操作デバイスである操作部11と、種々の情報を表示するLCD(Liquid Crystal Display)などの表示デバイスである表示部12と、原稿から画像を読み取る読取デバイスであるスキャナー13と、用紙などの記録媒体に印刷を実行する印刷デバイスであるプリンター14と、図示していない外部のファクシミリ装置と公衆電話回線などの通信回線経由でファックス通信を行うファックスデバイスであるファックス通信部15と、LAN(Local Area Network)、インターネットなどのネットワークを介さずに有線または無線によって直接に、または、ネットワーク経由で、外部の装置と通信を行う通信デバイスである通信部16と、各種のデータを記憶している半導体メモリー、HDD(Hard Disk Drive)などの不揮発性の記憶デバイスである記憶部17と、MFP10全体を制御する制御部18とを備えている。
記憶部17は、手書きによって修正された原稿(以下「加筆修正済み原稿」と言う。)に基づいて文書を電子化するための文書電子化プログラム17aを記憶している。文書電子化プログラム17aは、MFP10の製造段階でMFP10にインストールされていても良いし、SDカード、USB(Universal Serial Bus)メモリーなどの記憶媒体からMFP10に追加でインストールされても良いし、ネットワーク上からMFP10に追加でインストールされても良い。
記憶部17は、ヘッダーやフッターに関するレイアウトや、本文の段組に関するレイアウトなど、特定のレイアウトを示す特定レイアウト情報17bを記憶することが可能である。記憶部17は、MFP10の利用者毎、または、MFP10の利用者が所属するグループ毎に特定レイアウト情報17bを記憶していても良い。なお、MFP10は、予め想定される原稿を学習することによって特定レイアウト情報17bを生成することができる。例えば、MFP10は、特定の利用者の原稿が2段組である頻度が特定の頻度以上である場合に、この利用者の特定レイアウト情報17bに、本文の2段組のレイアウトを含めることができる。
記憶部17は、文字のサイズ、フォント、太さ、文字間距離などの属性を示す文字属性情報17cを記憶することが可能である。文字属性情報17cは、ヘッダー、フッター、本文など、文字が含まれる場所に応じた文字の属性を示していても良い。また、記憶部17は、MFP10の利用者毎、または、MFP10の利用者が所属するグループ毎に文字属性情報17cを記憶していても良い。なお、MFP10は、予め想定される原稿を学習することによって文字属性情報17cを生成することができる。
制御部18は、例えば、CPU(Central Processing Unit)と、プログラムおよび各種のデータを記憶しているROM(Read Only Memory)と、制御部18のCPUの作業領域として用いられるRAM(Random Access Memory)とを備えている。制御部18のCPUは、制御部18のROMまたは記憶部17に記憶されているプログラムを実行する。
制御部18は、記憶部17に記憶されている文書電子化プログラム17aを実行することによって、加筆修正済み原稿の画像をスキャナー13によって取得する画像取得手段18aと、画像取得手段18aによって取得された加筆修正済み原稿の画像から、手書きによる修正の指示の部分、すなわち、加筆部分を抽出する加筆部分抽出手段18bと、加筆修正済み原稿の画像から、手書によって修正される前の原稿、すなわち、元原稿を再現する元原稿再現手段18cと、文字の領域および図の領域のうち元原稿に含まれる領域を元原稿から抽出する領域抽出手段18dと、領域抽出手段18dによって抽出された領域に基づいて元原稿のレイアウトの指針を判断するレイアウト指針判断手段18eと、加筆部分抽出手段18bによって抽出された加筆部分によって指示された修正内容で加筆修正済み原稿の元原稿を編集して電子化文書を生成する原稿編集手段18fとを実現する。
次に、加筆修正済み原稿に基づいて文書を電子化する場合のMFP10の動作について説明する。
図2は、加筆修正済み原稿に基づいて文書を電子化する場合のMFP10の動作のフローチャートである。
制御部18は、加筆修正済み原稿に基づいて文書を電子化する指示が操作部11を介して入力されると、図2に示す処理を実行する。
図2に示すように、画像取得手段18aは、スキャナー13にセットされた加筆修正済み原稿からスキャナー13によって画像20(例えば、図3参照。)を読み取る(S101)。
図3は、加筆修正済み原稿の画像20の一例を示す図である。
図3に示す画像20は、例えば赤色など、特定の色の筆記具で手書きによって修正の指示31〜38が元原稿の画像40に加えられたものの画像である。
指示31は、ヘッダーの右端に「1/2」という文字を追加する指示である。
指示32は、「文書」という文字と、「構成」という文字との間に「の」という文字を追加する指示である。指示32は、文字の挿入を指示するための記号32aを含んでいる。
指示33は、「いいい」という3つの文字を削除する指示である。指示33は、文字の削除を指示するための記号33aによって構成されている。
指示34は、「ううう」という行と、「えええええ」という行とを入れ替える指示である。指示34は、行の入れ替えを指示するための記号34aによって構成されている。
指示35は、「かかか」という文字と、「かかかかか」という文字との間に「トトトトト」という文字を追加する指示である。指示35は、文字の挿入を指示するための記号35aを含んでいる。
指示36は、図を削除する指示である。指示36は、図の削除を指示するための記号36aによって構成されている。
指示37は、図を移動する指示である。指示37は、図の移動を指示するための記号37aによって構成されている。
指示38は、「図 3−2」という文字を削除する指示である。指示38は、文字の削除を指示するための記号38aによって構成されている。
図2に示すように、加筆部分抽出手段18bは、S101の処理の後、S101において読み取った画像20から加筆部分の画像30(例えば、図4参照。)を、特定の色に基づいて抽出する(S102)。
図4は、図3に示す加筆修正済み原稿の加筆部分の画像30を示す図である。
図2に示すように、元原稿再現手段18cは、S102の処理の後、S101において読み取った画像20から、S102において抽出した画像30を取り除くことによって元原稿の画像40(例えば、図5参照。)を再現する(S103)。ここで、元原稿再現手段18cは、画像20のうち元原稿の画像40に加筆部分の画像30が重なっている部分については、元原稿の色に加筆部分の色が重なったことによる加筆部分の色の変化に基づいて元原稿の色を再現したり、周辺色、すなわち、元原稿の画像40のうち加筆部分の画像30が重なっていない部分の色から補完したりすることができる。
図5は、図3に示す加筆修正済み原稿の元原稿の画像40を示す図である。
図2に示すように、領域抽出手段18dは、S103の処理の後、S103において再現した元原稿の画像40から文字または図の領域を抽出する(S104)。ここで、領域抽出手段18dは、画像40に文字が存在する場合、画像40から文字の領域を抽出する。また、領域抽出手段18dは、画像40に図が存在する場合、画像40から図の領域を図毎に抽出する。なお、領域抽出手段18dは、文字の領域を抽出する場合、画像40における文字同士の距離の変化や、図の領域の配置などから、文字の領域を複数抽出することができる。
図6は、複数の領域に分離された元原稿の画像40を示す図である。
図6に示す画像40は、文字の領域41〜45と、図の領域46、47とに分離されている。ここで、領域42は、段落42a、42b、42c、42dを含んでいる。また、領域43は、題43aおよび段落43b、43cを含んでいる。
図2に示すように、レイアウト指針判断手段18eは、S104の処理の後、文字の領域が存在するか否かを判断する(S105)。
レイアウト指針判断手段18eは、文字の領域が存在するとS105において判断すると、文字の領域のそれぞれに対してOCR(Optical Character Recognition)によって文字を認識する(S106)。
レイアウト指針判断手段18eは、文字の領域が存在しないとS105において判断するか、S106の処理が終了すると、加筆修正済み原稿の全てのページを処理したか否かを判断する(S107)。
制御部18は、加筆修正済み原稿の全てのページは処理していない、すなわち、加筆修正済み原稿に未だ処理していないページが存在するとS107において判断されると、後続のページについてS101〜S106の処理を実行する。
レイアウト指針判断手段18eは、加筆修正済み原稿の全てのページを処理したとS107において判断すると、加筆修正済み原稿の元原稿の全てのページのそれぞれに対して、S104において抽出された文字の領域および図の領域のそれぞれのレイアウトを示す原稿レイアウト情報を生成する(S108)。
例えば、レイアウト指針判断手段18eは、元原稿の同一ページ内に含まれる文字の領域同士の連続性と、元原稿の隣接するページ同士に含まれる文字の領域同士の連続性とを判断し、判断結果を原稿レイアウト情報に含める。
レイアウト指針判断手段18eは、例えば図7に示すように、同一ページ71内に含まれる文字の領域同士の連続性として、領域71aおよび71b同士や、領域71cおよび71d同士などのように、上下方向に隣接する領域同士の連続性を判断する。また、レイアウト指針判断手段18eは、元原稿のレイアウトが2段組み以上のレイアウトである場合には、同一ページ内に含まれる文字の領域同士の連続性として、図7に示す領域71bおよび71c同士などのように、最も下の領域と、この領域が所属する段の右隣の段の最も上の領域との連続性を判断する。
レイアウト指針判断手段18eは、元原稿の隣接するページ同士に含まれる文字の領域同士の連続性として、図7に示すページ71の最後の領域である領域71d、および、ページ71の次のページであるページ72の最初の領域である領域72aなどのように、隣接する2つのページのうち前のページにおける右下の領域と、後のページにおける左上の領域との連続性を判断する。
レイアウト指針判断手段18eは、S106において認識した文字を使用して複数の領域同士の連続性を判断することができる。すなわち、レイアウト指針判断手段18eは、複数の領域の間における文字の内容の連続性に基づいて領域同士の連続性を判断することができる。例えば、レイアウト指針判断手段18eは、1つの語、1つの句、1つの節または1つの文が2つの領域に跨っていると判断することができる場合、これらの領域の間における文字の内容の連続性があると判断することができ、その結果、これらの領域同士の連続性があると判断することができる。
レイアウト指針判断手段18eは、複数の領域の間における段落の形式の連続性に基づいて領域同士の連続性を判断することができる。例えば、レイアウト指針判断手段18eは、対象の領域における最後の行の最後の列に存在する文字が例えば句点などの通常の文の終了文字や空白文字ではなく、この領域の次の領域における最初の行の最初の列に存在する文字が例えば空白文字などの通常の文の開始文字でない場合、これらの領域の間における文字の内容の連続性があると判断しても良い。また、レイアウト指針判断手段18eは、対象の領域における最初の行の最初の列がインデントされていない場合に、この領域と、この領域の前の領域との間における文字の内容の連続性があると判断しても良い。
また、レイアウト指針判断手段18eは、各領域について、元原稿の画像40の横方向における開始位置(左端位置)、中心位置および終了位置(右端位置)を求めるとともに、元原稿の画像40の縦方向における開始位置(上端位置)および終了位置(下端位置)を求める。そして、レイアウト指針判断手段18eは、求めたそれらの位置が一致する領域同士が存在する場合、それらの領域をそれらの位置に合わせることをレイアウトとして判断する。それらの位置が一致する場合、あえてそのように配置している可能性が高いからである。なお、レイアウト指針判断手段18eは、連続性があると判断した領域同士の横方向における幅を、実際に領域に含まれる文字列の幅に関わらず、統一して捉える。例えば、図8に示す例では、レイアウト指針判断手段18eは、1行に6文字の幅である領域73と連続性があると判断した領域74について、実際には1行に「あああ。」の4文字しか存在しないが、領域73と統一して1行に6文字の幅の領域として捉える。
また、レイアウト指針判断手段18eは、領域間の距離を求める。そして、レイアウト指針判断手段18eは、求めたそれらの距離が2行分などの特定の距離以下である場合、それらの領域間の距離を維持することをレイアウトとして判断する。
図9は、画像40から生成される原稿レイアウト情報を示す図である。
例えば、レイアウト指針判断手段18eは、図9において線分51で示すように、領域41〜43を横方向における開始位置が一致させられるものとして判断する。また、レイアウト指針判断手段18eは、図9において線分52で示すように、領域42および43を横方向における終了位置が一致させられるものとして判断する。また、レイアウト指針判断手段18eは、図9において線分53で示すように、領域44〜47を横方向における中心位置が一致させられるものとして判断する。また、レイアウト指針判断手段18eは、例えば、領域41および42の間の距離54、領域42および43の間の距離55、領域44および46の間の距離56、領域44および47の間の距離57、領域45および47の間の距離58がそれぞれ維持されるものとして判断する。
図2に示すように、原稿編集手段18fは、S108の処理の後、S102において抽出した加筆部分の指示内容に応じて元原稿の画像40の編集処理を実行して(S109)、図2に示す動作を終了する。
図10は、S109の編集処理のフローチャートである。
図10に示すように、原稿編集手段18fは、元原稿の画像40をコピーすることによって、編集対象の画像を生成する(S131)。
次いで、原稿編集手段18fは、S101において読み取った画像20と、S102において抽出した加筆部分の画像30とに基づいて、加筆部分を、それぞれの間の距離や、それぞれの内容に応じて分離する(S132)。例えば、原稿編集手段18fは、図4で示す例では、画像30に含まれる加筆部分を、指示31〜38に分離する。
原稿編集手段18fは、S132の処理の後、S132において分離した加筆部分のうち未だ対象にしていない1つを対象にする(S133)。
次いで、原稿編集手段18fは、現在の対象の加筆部分の指示内容の種類を判断する(S134)。
原稿編集手段18fは、指示内容が指示31、32、35のように「文字の追加」であるとS134において判断すると、現在の対象の加筆部分の文字をOCRによって認識する(S135)。
次いで、原稿編集手段18fは、現在の対象の加筆部分の文字を追加する位置を特定する(S136)。
具体的には、原稿編集手段18fは、S136において、現在の対象の加筆部分の文字を追加する位置が、特定レイアウト情報17bおよび原稿レイアウト情報に規定されている文字の領域内に具体的に指定されている場合、その位置を特定する。
また、原稿編集手段18fは、S136において、現在の対象の加筆部分の文字を追加する位置が、特定レイアウト情報17bおよび原稿レイアウト情報に規定されている文字の領域内に具体的に指定されていない場合、特定レイアウト情報17bおよび原稿レイアウト情報と、現在の対象の加筆部分の加筆修正済み原稿における位置とに基づいて、新たな領域のレイアウトを特定する。例えば、原稿編集手段18fは、編集対象の画像の横方向において、他の領域が開始位置で揃えて配置されている場合に、この開始位置の付近に現在の対象の加筆部分の開始位置が配置されるとき、現在の対象の加筆部分の開始位置も他の領域と揃えて配置する。編集対象の画像の横方向における領域の開始位置について説明したが、編集対象の画像の横方向における領域の中心位置、終了位置や、編集対象の画像の縦方向における領域の開始位置、終了位置についても同様である。また、原稿編集手段18fは、現在の対象の加筆部分の領域と、現在の対象の加筆部分の領域の隣の領域との間の距離を、付近の領域同士の間の距離に揃えても良い。また、原稿編集手段18fは、現在の対象の加筆部分に関して、編集対象の画像の横方向における領域の開始位置、中心位置、終了位置や、編集対象の画像の縦方向における領域の開始位置、終了位置に法則性が無い場合などに、現在の対象の加筆部分の手書き位置を、現在の対象の加筆部分を追加する位置として特定しても良い。例えば、原稿編集手段18fは、図11に示すように、領域43の下側に文字の領域48を新たに追加する場合、横方向における領域48の開始位置、終了位置をそれぞれ線分51、52で規定し、領域43および領域48の間の距離59を、領域42および領域43の間の距離55と揃える。
原稿編集手段18fは、S136の処理の後、現在の対象の加筆部分の文字の属性を特定する(S137)。例えば、原稿編集手段18fは、現在の対象の加筆部分の文字を追加する領域が存在する場合、現在の対象の加筆部分の文字を追加する領域において、現在の対象の加筆部分の文字を追加する位置の周辺の文字の属性を取得し、取得した属性を現在の対象の加筆部分の文字の属性として特定する。
原稿編集手段18fは、S137の処理の後、編集対象の画像に対して、S135において認識した文字を、S136において特定した位置に、S137において特定した属性、または、文字属性情報17cで示す属性で追加する(S138)。
例えば、原稿編集手段18fは、現在の対象の加筆部分の文字を追加する位置が、特定レイアウト情報17bおよび原稿レイアウト情報に規定されている文字の領域内における特定の行の間の位置など、領域内における途中の位置である場合、この位置に現在の対象の加筆部分の文字を追加することによって、現在の対象の加筆部分の文字より後ろの部分を、現在の対象の加筆部分の文字の追加分だけ後ろにずらす。なお、原稿編集手段18fは、領域内の段落に文字を追加する場合に、追加部分より後ろの部分を後ろにずらすとき、ずらした後も段落を維持する。ここで、原稿編集手段18fは、領域内でインデントされている行を段落の開始の行として判断し、途中から最後まで空白が存在する行や、後続の段落の開始の行の直前の行や、領域内の最後の行を段落の終了の行として判断する。また、原稿編集手段18fは、現在の対象の加筆部分の文字を追加することによって、この文字を含む領域より後ろの部分を、この領域のサイズが大きくなった分だけ、必要に応じて後ろにずらす。ただし、原稿編集手段18fは、追加する文字を含む領域より後ろにおいて、領域同士の間の距離が2行分などの特定の距離より大きい場合、領域同士の間の距離が特定の距離になるまでは、この領域同士のうち後ろ側の領域を後ろにずらさない。
なお、原稿編集手段18fは、S106における文字の認識によって「・・・章 ・・・」などの特定の形式を認識したり、文字のサイズの変化を認識したりすることによって、文字の領域内における「題」の行を認識することができる。したがって、原稿編集手段18fは、領域内で「題」の後続の段落自体がインデントされている場合に、この領域内における「題」の後続の全ての行をそれぞれ段落と誤検出することを防止することができる。例えば、原稿編集手段18fは、図12(a)に示すように、領域60において行61が「題」であることを認識しない場合、後続の全ての行のそれぞれを段落として認識してしまう。すなわち、原稿編集手段18fは、図12(a)に示すように、段落62〜67が存在すると誤認識してしまう。一方、原稿編集手段18fは、図12(b)に示すように、領域60において行61が「題」であることを認識する場合、段落68および69を正しく認識することができる。
原稿編集手段18fは、指示内容が「図の追加」であるとS134において判断すると、現在の対象の加筆部分の手書きの図を追加する位置を特定する(S139)。
具体的には、原稿編集手段18fは、S139において、特定レイアウト情報17bおよび原稿レイアウト情報と、現在の対象の加筆部分の加筆修正済み原稿における位置とに基づいて、新たな領域のレイアウトを特定する。例えば、原稿編集手段18fは、編集対象の画像の横方向において、他の領域が開始位置で揃えて配置されている場合に、この開始位置の付近に現在の対象の加筆部分の開始位置が配置されるとき、現在の対象の加筆部分の開始位置も他の領域と揃えて配置する。編集対象の画像の横方向における領域の開始位置について説明したが、編集対象の画像の横方向における領域の中心位置、終了位置や、編集対象の画像の縦方向における領域の開始位置、終了位置についても同様である。また、原稿編集手段18fは、現在の対象の加筆部分の領域と、現在の対象の加筆部分の領域の隣の領域との間の距離を、付近の領域同士の間の距離に揃えても良い。また、原稿編集手段18fは、現在の対象の加筆部分に関して、編集対象の画像の横方向における領域の開始位置、中心位置、終了位置や、編集対象の画像の縦方向における領域の開始位置、終了位置に法則性が無い場合などに、現在の対象の加筆部分の手書き位置を、現在の対象の加筆部分を追加する位置として特定しても良い。
原稿編集手段18fは、S139の処理の後、編集対象の画像に対して、現在の対象の加筆部分の手書きの図を、S139において特定した位置に追加する(S140)。
例えば、原稿編集手段18fは、現在の対象の加筆部分の手書きの図を追加することによって、この図が追加された領域より後ろの部分を、この領域が追加された分だけ、必要に応じて後ろにずらす。
原稿編集手段18fは、指示内容が指示33、36、38のように「削除」であるとS134において判断すると、現在の対象の加筆部分で削除することが指定されている箇所を特定する(S141)。
次いで、原稿編集手段18fは、編集対象の画像に対して、S141で特定した箇所を削除する(S142)。
例えば、原稿編集手段18fは、領域において途中の部分を削除する場合、この領域において削除部分より後ろの部分を、削除部分の削除分だけ前にずらす。なお、原稿編集手段18fは、領域内の段落から文字を削除する場合に、削除部分より後ろの部分を前にずらすとき、ずらした後も段落を維持する。ここで、原稿編集手段18fは、文字の領域内における「題」の行を認識することができるので、領域内で「題」の後続の段落自体がインデントされている場合に、この領域内における「題」の後続の全ての行をそれぞれ段落と誤検出することを防止することができる。また、原稿編集手段18fは、特定の部分を削除することによって、この部分を含んでいた領域より後ろの部分を、この領域のサイズが小さくなった分だけ、必要に応じて前にずらす。
原稿編集手段18fは、指示内容が指示34、37のように「移動」であるとS134において判断すると、現在の対象の加筆部分で移動することが指定されている箇所を特定する(S143)。
次いで、原稿編集手段18fは、現在の対象の加筆部分で指定されている移動先の位置を特定する(S144)。
次いで、原稿編集手段18fは、編集対象の画像に対して、S143で特定した箇所を、S144において特定した位置に移動する(S145)。
例えば、原稿編集手段18fは、S143で特定した箇所を移動先に追加する場合、この箇所が追加された部分より後ろの部分を、この箇所が追加された分だけ、必要に応じて後ろにずらす。ただし、原稿編集手段18fは、文字を追加する場合に、追加する文字を含む領域より後ろにおいて、領域同士の間の距離が2行分などの特定の距離より大きいとき、領域同士の間の距離が特定の距離になるまでは、この領域同士のうち後ろ側の領域を後ろにずらさない。また、原稿編集手段18fは、S143で特定した箇所を移動元において削除する場合、この箇所が削除された部分より後ろの部分を、この箇所が削除された分だけ、必要に応じて前にずらす。なお、原稿編集手段18fは、領域内の段落に文字を追加する場合に、追加部分より後ろの部分を後ろにずらすとき、ずらした後も段落を維持する。また、原稿編集手段18fは、領域内の段落から文字を削除する場合に、削除部分より後ろの部分を前にずらすとき、ずらした後も段落を維持する。ここで、原稿編集手段18fは、文字の領域内における「題」の行を認識することができるので、領域内で「題」の後続の段落自体がインデントされている場合に、この領域内における「題」の後続の全ての行をそれぞれ段落と誤検出することを防止することができる。
原稿編集手段18fは、S138、S140、S142またはS145の処理の後、S132において分離した加筆部分のうち未だ対象にしていないものが存在するか否かを判断する(S146)。
原稿編集手段18fは、S132において分離した加筆部分のうち未だ対象にしていないものが存在するとS146において判断すると、原稿レイアウト情報を更新して(S147)、S133の処理を実行する。
原稿編集手段18fは、S132において分離した加筆部分のうち未だ対象にしていないものが存在しないとS146において判断すると、図10に示す動作を終了する。
例えば、MFP10は、図3に示す加筆修正済み原稿に基づいて文書を電子化する場合、図2に示す動作を実行することによって編集対象の画像として最終的に図13に示す文書を生成する。したがって、MFP10は、図13に示す文書をプリンター14によって印刷したり、記憶部17に記憶することができる。
なお、図13に示す文書に対してレイアウトを示すと、図14に示すようになる。図14に示す画像は、図6に示す元原稿の画像40と比較して、次のように修正されている。
領域41は、指示32に応じて「の」が追加されている。領域41は、横方向における開始位置と、縦方向における開始位置および終了位置とが変化していない。
領域42は、指示33に応じて「いいい」という3つの文字が削除されている。また、領域42は、指示34に応じて「ううう」という行と、「えええええ」という行とが入れ替えられている。領域42は、横方向における開始位置および終了位置と、縦方向における開始位置とが変化していない。領域42は、1行減った分だけ、縦方向における終了位置が上がっている。
領域43は、指示35に応じて「トトトトト」という文字が追加されている。領域43は、横方向における開始位置および終了位置と、縦方向における終了位置とが変化していない。領域43は、領域42が1行減った分だけ、縦方向における開始位置が上がっている。
領域45は、指示38に応じて削除されている。
領域46は、指示36に応じて削除されている。
領域47は、指示37に応じて移動させられている。領域47は、横方向における中心位置が変化していない。領域47は、縦方向における終了位置と、領域44の縦方向における開始位置との距離60が、元原稿の画像40における領域44と、領域46との距離56(図9参照。)と等しい。
領域49は、指示31に応じて「1/2」という文字がヘッダーに追加されている。なお、原稿編集手段18fは、特定レイアウト情報17bに応じてヘッダー内のレイアウトを設定している。
図15は、加筆修正済み原稿の画像220の一例を示す図である。
図15に示す画像220は、1ページ目の原稿の画像221と、2ページ目の原稿の画像222とからなる。例えば赤色など、特定の色の筆記具で手書きによって修正の指示231〜234が元原稿の画像40に加えられたものの画像である。
指示231は、「かかか」という文字と、「かかかかか」という文字との間に「トトトトト」という文字を追加する指示である。指示231は、文字の挿入を指示するための記号231aを含んでいる。
指示232は、「けけ」という2つの文字を削除する指示である。指示232は、文字の削除を指示するための記号232aによって構成されている。
指示233は、「ここここ」という4つの文字を削除する指示である。指示233は、文字の削除を指示するための記号233aによって構成されている。
指示234は、「せせ」という文字と、「せせ」という文字との間に「の」という文字を追加する指示である。指示234は、文字の挿入を指示するための記号234aを含んでいる。
図16は、図15に示す加筆修正済み原稿の元原稿の画像240を示す図である。
図17は、複数の領域に分離された元原稿の画像240を示す図である。
図17に示す画像240は、文字の領域241〜246に分離されている。ここで、領域242は、段落240a、240b、240c、240dを含んでいる。また、領域243は、題240eと、段落240fと、段落240gの一部とを含んでいる。また、領域244は、段落240gの一部と、段落240h、240i、240jとを含んでいる。領域245は、題240kと、段落240lの一部とを含んでいる。また、領域246は、段落240lの一部と、段落240mとを含んでいる。
レイアウト指針判断手段18eは、S108において、領域243および領域244の間における文字の内容の連続性や、領域243および領域244の間における段落の形式の連続性に基づいて、領域243および領域244の間に連続性があると判断する。同様に、レイアウト指針判断手段18eは、S108において、領域245および領域246の間における文字の内容の連続性や、領域245および領域246の間における段落の形式の連続性に基づいて、領域245および領域246の間に連続性があると判断する。
また、レイアウト指針判断手段18eは、S108において、1行に6文字の幅である領域245と連続性があると判断した領域246について、実際には最大でも1行に空白を含めて「 せせせせ」の5文字しか存在しないが、領域245と統一して1行に6文字の幅の領域として捉える。
例えば、MFP10は、図15に示す加筆修正済み原稿に基づいて文書を電子化する場合、図2に示す動作を実行することによって編集対象の画像として最終的に図18に示す文書を生成する。したがって、MFP10は、図18に示す文書をプリンター14によって印刷したり、記憶部17に記憶することができる。
なお、図18に示す文書に対してレイアウトを示すと、図19に示すようになる。図19に示す画像は、図17に示す元原稿の画像40と比較して、次のように修正されている。
領域241および242は、変化していない。
領域243および244は、指示231に応じて「トトトトト」という文字が追加されている。また、領域243および244は、指示232に応じて「けけ」という文字が削除されているとともに、指示233に応じて「ここここ」という文字が削除されている。領域243は、横方向における開始位置および終了位置と、縦方向における開始位置および終了位置とが変化していない。領域244は、段落243および段落244からなる連続した領域において、段落240fが1行増え、段落240hが1行減り、1行の段落240iが削除されることによって、1行分だけ縦方向における終了位置が上がっている。
領域245は、縦方向における段落244の終了位置が1行分だけ上がっているので、縦方向における開始位置が1行分だけ上がっている。しかしながら、領域245は、領域245および領域246からなる連続した領域に含まれる段落240lを全て含むことによって、1行分だけ縦方向における幅が増えるので、縦方向における終了位置が変化していない。また、領域245は、横方向における開始位置および終了位置が変化していない。
領域246は、領域245および領域246からなる連続した領域に含まれる段落240lを領域245が全て含むことによって、1行分だけ縦方向における幅が減るので、1行分だけ縦方向における終了位置が上がっている。また、領域246は、縦方向における開始位置と、横方向における開始位置および終了位置とが変化していない。
以上に説明したように、MFP10は、加筆修正済み原稿の画像から抽出した加筆部分によって指示された修正内容で元原稿を編集して電子化文書を生成する場合に、加筆修正済み原稿の元原稿に含まれる領域のうち文字の領域同士の連続性を判断し、連続性があると判断した複数の領域同士が連続しているものとして元原稿を編集するので、加筆修正済み原稿に基づいた電子化文書におけるレイアウトの適切性を向上することができる。
MFP10は、複数の領域の間における文字の内容の連続性に基づいて領域同士の連続性を判断するので、領域同士の連続性の判断の適切性を向上することができる。したがって、MFP10は、加筆修正済み原稿に基づいた電子化文書におけるレイアウトの適切性を向上することができる。
MFP10は、複数の領域の間における段落の形式の連続性に基づいて領域同士の連続性を判断するので、領域同士の連続性の判断の適切性を向上することができる。したがって、MFP10は、加筆修正済み原稿に基づいた電子化文書におけるレイアウトの適切性を向上することができる。
なお、MFP10は、複数の領域の間において、文字の内容の連続性と、段落の形式の連続性との両方を満たす場合のみに、これらの領域同士に連続性があると判断しても良い。
MFP10は、元原稿自体がなくても、加筆修正済み原稿があれば、元原稿を再現することができるので、利便性を向上することができる。なお、MFP10は、元原稿の画像を記憶部17に記憶しておいて、加筆修正済み原稿から元原稿を再現することなく、記憶部17に記憶している元原稿の画像を使用しても良い。
本発明の文書電子化方法の一部は、MFP10ではなく、例えば、PC(Personal Computer)などのコンピューターによって実現されても良い。
本発明の画像形成装置は、本実施の形態においてMFPであるが、MFP以外の画像形成装置であっても良い。
10 MFP(画像形成装置)
13 スキャナー(読取デバイス)
17a 文書電子化プログラム
18a 画像取得手段
18b 加筆部分抽出手段
18c 元原稿再現手段
18d 領域抽出手段
18e レイアウト指針判断手段
18f 原稿編集手段
20 画像(加筆修正済み原稿の画像)
30 画像(加筆部分の画像)
40 画像(元原稿の画像)
220 画像(加筆修正済み原稿の画像)
240 画像(元原稿の画像)
240a、240b、240c、240d、240f、240g、240h、240i、240j、240l、240m 段落
241〜246 領域(文字の領域)

Claims (9)

  1. 原稿から画像を読み取る読取デバイスと、
    手書きによって修正された加筆修正済み原稿の画像を前記読取デバイスによって取得する画像取得手段と、
    前記画像取得手段によって取得された前記加筆修正済み原稿の画像から加筆部分を抽出する加筆部分抽出手段と、
    前記加筆修正済み原稿の画像から前記加筆修正済み原稿の元原稿を再現する元原稿再現手段と、
    前記元原稿再現手段によって再現された前記元原稿から文字または図の領域を抽出する領域抽出手段と、
    前記領域抽出手段によって抽出された前記領域に基づいて前記元原稿のレイアウトの指針を判断するレイアウト指針判断手段と、
    前記加筆部分抽出手段によって抽出された前記加筆部分によって指示された修正内容で、前記レイアウト指針判断手段によって判断された前記指針に応じて前記元原稿を編集して電子化文書を生成する原稿編集手段と
    を備え、
    前記レイアウト指針判断手段は、複数の前記領域の間における段落の形式の連続性に基づいて文字の前記領域同士の連続性を判断し、
    前記原稿編集手段は、前記レイアウト指針判断手段によって連続性があると判断された複数の前記領域同士が連続しているものとして前記元原稿を編集し、
    前記レイアウト指針判断手段は、前記領域における最後の行の最後の列に存在する文字が文の終了文字および空白文字のいずれでもなく、この領域の次の領域における最初の行の最初の列に存在する文字が文の開始文字でない場合、これらの領域の間における段落の形式の連続性があると判断することを特徴とする画像形成装置。
  2. 原稿から画像を読み取る読取デバイスと、
    手書きによって修正された加筆修正済み原稿の画像を前記読取デバイスによって取得する画像取得手段と、
    前記画像取得手段によって取得された前記加筆修正済み原稿の画像から加筆部分を抽出する加筆部分抽出手段と、
    前記加筆修正済み原稿の画像から前記加筆修正済み原稿の元原稿を再現する元原稿再現手段と、
    前記元原稿再現手段によって再現された前記元原稿から文字または図の領域を抽出する領域抽出手段と、
    前記領域抽出手段によって抽出された前記領域に基づいて前記元原稿のレイアウトの指針を判断するレイアウト指針判断手段と、
    前記加筆部分抽出手段によって抽出された前記加筆部分によって指示された修正内容で、前記レイアウト指針判断手段によって判断された前記指針に応じて前記元原稿を編集して電子化文書を生成する原稿編集手段と
    を備え、
    前記レイアウト指針判断手段は、複数の前記領域の間における段落の形式の連続性に基づいて文字の前記領域同士の連続性を判断し、
    前記原稿編集手段は、前記レイアウト指針判断手段によって連続性があると判断された複数の前記領域同士が連続しているものとして前記元原稿を編集し、
    前記レイアウト指針判断手段は、前記領域における最初の行の最初の列がインデントされていない場合に、この領域と、この領域の前の領域との間における段落の形式の連続性があると判断することを特徴とする画像形成装置。
  3. 前記加筆部分抽出手段は、色に基づいて前記加筆修正済み原稿の画像から前記加筆部分を抽出し、
    前記元原稿再現手段は、前記加筆部分抽出手段によって抽出された前記加筆部分を前記加筆修正済み原稿の画像から取り除くことによって前記元原稿を再現する場合に、前記加筆修正済み原稿の画像のうち前記元原稿の画像に前記加筆部分の画像が重なっている部分については、前記元原稿の色に前記加筆部分の色が重なったことによる前記加筆部分の色の変化に基づいて前記元原稿の色を再現することを特徴とする請求項1または請求項2に記載の画像形成装置。
  4. 前記加筆部分抽出手段は、色に基づいて前記加筆修正済み原稿の画像から前記加筆部分を抽出し、
    前記元原稿再現手段は、前記加筆部分抽出手段によって抽出された前記加筆部分を前記加筆修正済み原稿の画像から取り除くことによって前記元原稿を再現する場合に、前記加筆修正済み原稿の画像のうち前記元原稿の画像に前記加筆部分の画像が重なっている部分については、前記元原稿の画像のうち前記加筆部分の画像が重なっていない部分の色から補完することを特徴とする請求項1または請求項2に記載の画像形成装置。
  5. 前記レイアウト指針判断手段は、複数の前記領域の間における文字の内容の連続性に基づいて前記領域同士の連続性を判断することを特徴とする請求項1から請求項4までのいずれかに記載の画像形成装置。
  6. 原稿から画像を読み取る読取デバイスを備える画像形成装置に、
    手書きによって修正された加筆修正済み原稿の画像を前記読取デバイスによって取得する画像取得手段と、
    前記画像取得手段によって取得された前記加筆修正済み原稿の画像から加筆部分を抽出する加筆部分抽出手段と、
    前記加筆修正済み原稿の画像から前記加筆修正済み原稿の元原稿を再現する元原稿再現手段と、
    前記元原稿再現手段によって再現された前記元原稿から文字または図の領域を抽出する領域抽出手段と、
    前記領域抽出手段によって抽出された前記領域に基づいて前記元原稿のレイアウトの指針を判断するレイアウト指針判断手段と、
    前記加筆部分抽出手段によって抽出された前記加筆部分によって指示された修正内容で、前記レイアウト指針判断手段によって判断された前記指針に応じて前記元原稿を編集して電子化文書を生成する原稿編集手段と
    を実現させ、
    前記レイアウト指針判断手段は、複数の前記領域の間における段落の形式の連続性に基づいて文字の前記領域同士の連続性を判断し、
    前記原稿編集手段は、前記レイアウト指針判断手段によって連続性があると判断された複数の前記領域同士が連続しているものとして前記元原稿を編集し、
    前記レイアウト指針判断手段は、前記領域における最後の行の最後の列に存在する文字が文の終了文字および空白文字のいずれでもなく、この領域の次の領域における最初の行の最初の列に存在する文字が文の開始文字でない場合、これらの領域の間における段落の形式の連続性があると判断することを特徴とする文書電子化プログラム。
  7. 原稿から画像を読み取る読取デバイスを備える画像形成装置に、
    手書きによって修正された加筆修正済み原稿の画像を前記読取デバイスによって取得する画像取得手段と、
    前記画像取得手段によって取得された前記加筆修正済み原稿の画像から加筆部分を抽出する加筆部分抽出手段と、
    前記加筆修正済み原稿の画像から前記加筆修正済み原稿の元原稿を再現する元原稿再現手段と、
    前記元原稿再現手段によって再現された前記元原稿から文字または図の領域を抽出する領域抽出手段と、
    前記領域抽出手段によって抽出された前記領域に基づいて前記元原稿のレイアウトの指針を判断するレイアウト指針判断手段と、
    前記加筆部分抽出手段によって抽出された前記加筆部分によって指示された修正内容で、前記レイアウト指針判断手段によって判断された前記指針に応じて前記元原稿を編集して電子化文書を生成する原稿編集手段と
    を実現させ、
    前記レイアウト指針判断手段は、複数の前記領域の間における段落の形式の連続性に基づいて文字の前記領域同士の連続性を判断し、
    前記原稿編集手段は、前記レイアウト指針判断手段によって連続性があると判断された複数の前記領域同士が連続しているものとして前記元原稿を編集し、
    前記レイアウト指針判断手段は、前記領域における最初の行の最初の列がインデントされていない場合に、この領域と、この領域の前の領域との間における段落の形式の連続性があると判断することを特徴とする文書電子化プログラム。
  8. 手書きによって修正された加筆修正済み原稿の画像を読取デバイスによって取得する画像取得ステップと、
    前記画像取得ステップによって取得された前記加筆修正済み原稿の画像から加筆部分を抽出する加筆部分抽出ステップと、
    前記加筆修正済み原稿の画像から前記加筆修正済み原稿の元原稿を再現する元原稿再現ステップと、
    前記元原稿再現ステップによって再現された前記元原稿から文字または図の領域を抽出する領域抽出ステップと、
    前記領域抽出ステップによって抽出された前記領域に基づいて前記元原稿のレイアウトの指針を判断するレイアウト指針判断ステップと、
    前記加筆部分抽出ステップによって抽出された前記加筆部分によって指示された修正内容で、前記レイアウト指針判断ステップによって判断された前記指針に応じて前記元原稿を編集して電子化文書を生成する原稿編集ステップと
    を備え、
    前記レイアウト指針判断ステップは、複数の前記領域の間における段落の形式の連続性に基づいて文字の前記領域同士の連続性を判断するステップであり、
    前記原稿編集ステップは、前記レイアウト指針判断ステップによって連続性があると判断された複数の前記領域同士が連続しているものとして前記元原稿を編集するステップであり、
    前記レイアウト指針判断ステップは、前記領域における最後の行の最後の列に存在する文字が文の終了文字および空白文字のいずれでもなく、この領域の次の領域における最初の行の最初の列に存在する文字が文の開始文字でない場合、これらの領域の間における段落の形式の連続性があると判断するステップであることを特徴とする文書電子化方法。
  9. 手書きによって修正された加筆修正済み原稿の画像を読取デバイスによって取得する画像取得ステップと、
    前記画像取得ステップによって取得された前記加筆修正済み原稿の画像から加筆部分を抽出する加筆部分抽出ステップと、
    前記加筆修正済み原稿の画像から前記加筆修正済み原稿の元原稿を再現する元原稿再現ステップと、
    前記元原稿再現ステップによって再現された前記元原稿から文字または図の領域を抽出する領域抽出ステップと、
    前記領域抽出ステップによって抽出された前記領域に基づいて前記元原稿のレイアウトの指針を判断するレイアウト指針判断ステップと、
    前記加筆部分抽出ステップによって抽出された前記加筆部分によって指示された修正内容で、前記レイアウト指針判断ステップによって判断された前記指針に応じて前記元原稿を編集して電子化文書を生成する原稿編集ステップと
    を備え、
    前記レイアウト指針判断ステップは、複数の前記領域の間における段落の形式の連続性に基づいて文字の前記領域同士の連続性を判断するステップであり、
    前記原稿編集ステップは、前記レイアウト指針判断ステップによって連続性があると判断された複数の前記領域同士が連続しているものとして前記元原稿を編集するステップであり、
    前記レイアウト指針判断ステップは、前記領域における最初の行の最初の列がインデントされていない場合に、この領域と、この領域の前の領域との間における段落の形式の連続性があると判断するステップであることを特徴とする文書電子化方法。
JP2016149069A 2016-07-28 2016-07-28 画像形成装置、文書電子化プログラムおよび文書電子化方法 Expired - Fee Related JP6579332B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2016149069A JP6579332B2 (ja) 2016-07-28 2016-07-28 画像形成装置、文書電子化プログラムおよび文書電子化方法
CN201710555352.7A CN107666548A (zh) 2016-07-28 2017-07-10 图像形成装置以及文档电子化方法
US15/660,415 US20180032485A1 (en) 2016-07-28 2017-07-26 Image forming apparatus for digitizing document based on revised and corrected original document by hand writing, method and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016149069A JP6579332B2 (ja) 2016-07-28 2016-07-28 画像形成装置、文書電子化プログラムおよび文書電子化方法

Publications (2)

Publication Number Publication Date
JP2018019300A JP2018019300A (ja) 2018-02-01
JP6579332B2 true JP6579332B2 (ja) 2019-09-25

Family

ID=61010075

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016149069A Expired - Fee Related JP6579332B2 (ja) 2016-07-28 2016-07-28 画像形成装置、文書電子化プログラムおよび文書電子化方法

Country Status (3)

Country Link
US (1) US20180032485A1 (ja)
JP (1) JP6579332B2 (ja)
CN (1) CN107666548A (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200092714A (ko) 2019-01-25 2020-08-04 휴렛-팩커드 디벨롭먼트 컴퍼니, 엘.피. 분산 렌더링 서비스를 제공하는 화상형성장치
CN110014754B (zh) * 2019-03-25 2020-08-07 深圳市银之杰科技股份有限公司 一种打印鉴伪批量盖章一体机及处理方法
US10764448B1 (en) 2019-04-24 2020-09-01 Kyocera Document Solutions Inc. Information processing apparatus and image forming apparatus performing file conversion of handwriting comment and comment extraction method
JP2021152884A (ja) * 2020-03-20 2021-09-30 株式会社リコー 表示装置、表示方法、プログラム、情報処理装置
JP2023023593A (ja) * 2021-08-05 2023-02-16 京セラドキュメントソリューションズ株式会社 画像処理装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05108791A (ja) * 1991-10-18 1993-04-30 Ricoh Co Ltd 画像編集装置
JP2000293521A (ja) * 1999-04-09 2000-10-20 Canon Inc 画像処理方法、装置及び記憶媒体
US7526129B2 (en) * 2005-06-23 2009-04-28 Microsoft Corporation Lifting ink annotations from paper
JP4900371B2 (ja) * 2008-12-04 2012-03-21 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置
US9779091B2 (en) * 2014-10-31 2017-10-03 Adobe Systems Corporation Restoration of modified document to original state

Also Published As

Publication number Publication date
US20180032485A1 (en) 2018-02-01
CN107666548A (zh) 2018-02-06
JP2018019300A (ja) 2018-02-01

Similar Documents

Publication Publication Date Title
JP6579332B2 (ja) 画像形成装置、文書電子化プログラムおよび文書電子化方法
JP4181892B2 (ja) 画像処理方法
JP4854491B2 (ja) 画像処理装置及びその制御方法
US8520006B2 (en) Image processing apparatus and method, and program
JP4502385B2 (ja) 画像処理装置およびその制御方法
JP4785655B2 (ja) 文書処理装置及び文書処理方法
KR100788444B1 (ko) 로그 데이터 기록 장치 및 로그 데이터 기록 방법
JP2019128727A (ja) スキャン画像に関連する情報を設定するための装置、方法、およびプログラム
JP2004265384A (ja) 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
JP7262993B2 (ja) 画像処理システム、画像処理方法、画像処理装置
JP2010009509A (ja) 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体
JP2011237840A (ja) 文書処理装置
US11245803B2 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program
JP2024016222A (ja) タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム
JP6579331B2 (ja) 画像形成装置、文書電子化プログラムおよび文書電子化方法
JP7379876B2 (ja) 文字認識装置、文書ファイル生成方法、文書ファイル生成プログラム
JP5696394B2 (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
JP2008282149A (ja) 画像処理装置、画像処理方法、画像処理プログラム
JP2007226353A (ja) 画像読取方法,プログラム,および画像読取装置
JP2007226350A (ja) 画像読取方法,プログラム,および画像読取装置
JP2011146852A (ja) 制御装置及び制御方法
JP6844574B2 (ja) 画像処理装置、及び画像処理方法
JP7030505B2 (ja) スキャン画像に関連する情報を設定するための装置、方法、およびプログラム
JP2004326490A (ja) 画像処理方法
JP5884552B2 (ja) 画像処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180529

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190313

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190415

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190731

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190813

R150 Certificate of patent or registration of utility model

Ref document number: 6579332

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees