JP2020178168A - 画像形成装置 - Google Patents
画像形成装置 Download PDFInfo
- Publication number
- JP2020178168A JP2020178168A JP2019077116A JP2019077116A JP2020178168A JP 2020178168 A JP2020178168 A JP 2020178168A JP 2019077116 A JP2019077116 A JP 2019077116A JP 2019077116 A JP2019077116 A JP 2019077116A JP 2020178168 A JP2020178168 A JP 2020178168A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- document
- character
- data
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
- Editing Of Facsimile Originals (AREA)
Abstract
【課題】集約された画像を分割する際に、分割された画像を並び替える手間を抑制できる画像形成装置を提供する。【解決手段】画像形成装置100は、学習部218と、撮像部2と、分割部211と、第1抽出部212とを備える。学習部218は、文字と文字との繋がりを推定するために、文書を含む文書データを学習する。撮像部2は、複数の文書が集約されて形成されたシートを撮像して、撮像データを生成する。分割部211は、撮像データを文書ごとに分割して、分割データを生成する。分割データは、第1分割データと第1分割データと異なる第2分割データとを含む。第1抽出部212は、第1分割データから第1文字を抽出し、第2分割データから第2文字を抽出する。学習部218は、第1文字と第2文字とが入力されることで、第1文字と第2文字との繋がりの程度を示す推定結果を出力する。【選択図】図2
Description
本発明は、画像形成装置に関する。
特許文献1に記載の画像処理装置は、判定手段と、第1サムネイル生成手段と、表示手段とを備える。判定手段は、入力されたドキュメントが、その1ページにN(N≧2)ページ分の原稿内容がまとめられているN−upドキュメントであるか否かを判定する。第1サムネイル生成手段は、判定手段によってN−upドキュメントであると判定された場合に、Nページの各々のサムネイルである第1サムネイルを生成する。表示手段は、第1サムネイルをプレビュー表示する。特許文献1に記載の画像処理装置の表示手段は、1upドキュメントをプレビュー表示できる。
しかしながら、N−upドキュメントのように複数の画像が集約された画像を、画像ごとに分割する場合、画像の順序が連続するように並ばないことがある。したがって、特許文献1に記載の画像形成装置では、ユーザーには、画像の順序を並び替える手間が発生する。
本発明は上記課題に鑑みてなされたものであり、集約された画像を分割する際に、分割された画像を並び替える手間を抑制できる画像形成装置を提供することを目的とする。
本発明に係る画像形成装置は、文書を示す文書データに基づいて、シートに文書を形成する。画像形成装置は、学習部と、撮像部と、分割部と、第1抽出部とを備える。前記学習部は、文字と文字との繋がりを推定するために、前記文書を含む文書データを学習する。前記撮像部は、複数の文書が集約されて形成されたシートを撮像して、撮像データを生成する。前記分割部は、前記撮像データを1ページ分の前記文書ごとに分割して、複数の分割データを生成する。前記第1抽出部は、前記分割データの各々から文字を抽出する。前記分割データは、第1分割データと前記第1分割データと異なる第2分割データとを含む。前記第1抽出部は、前記第1分割データが含む第1文書から第1文字を抽出し、前記第2分割データが含む第2文書から第2文字を抽出する。前記第1文書は、前記1ページ分の分割データによって表される文書を示す。前記第2文書は、前記第1文書と異なる前記1ページ分の分割データによって表される文書を示す。前記第1文字は前記第1文書の記載が始まる位置を示す文頭又は前記第1文書の記載が終わる位置を示す文末のうち、いずれか一方の位置に含まれる文字である。前記第2文字は前記第2文書の記載が始まる位置を示す文頭又は前記第2文書の記載が終わる位置を示す文末のうち、前記第1文字が含まれる位置と異なる位置の文字である。前記学習部は、前記第1文字と前記第2文字とが入力されることで、前記第1文字と前記第2文字との繋がりの程度を示す推定結果を出力する。
本発明の画像形成装置によれば、集約された画像を分割する際に、分割された画像を並び替える手間を抑制できる。
以下、本発明の実施形態について、図面を参照しながら説明する。なお、図中、同一又は相当部分については同一の参照符号を付して説明を繰り返さない。また、本発明の実施形態において、X軸、Y軸、及びZ軸は互いに直交し、X軸及びY軸は水平方向に平行であり、Z軸は鉛直方向に平行である。
[実施形態1]
まず、図1を参照して、本発明の実施形態1に係る画像形成装置100の構成について説明する。図1は、画像形成装置100の構成を示す図である。画像形成装置100は、カラー複合機である。また、画像形成装置100は、パーソナルコンピューターと通信可能に接続されていてもよい。
まず、図1を参照して、本発明の実施形態1に係る画像形成装置100の構成について説明する。図1は、画像形成装置100の構成を示す図である。画像形成装置100は、カラー複合機である。また、画像形成装置100は、パーソナルコンピューターと通信可能に接続されていてもよい。
図1に示すように、画像形成装置100は、画像形成ユニット1、画像読取ユニット2、原稿搬送ユニット3、及び操作表示部4を備える。画像形成ユニット1は、シートPに画像を形成する。
画像読取ユニット2は、シートRに形成された画像を読み取り、画像を表す撮像データを生成する。具体的には、画像読取ユニット2は、シートRを撮像してシートRを表す撮像データを生成する。シートRは、原稿である。シートRは、画像が形成されたシートPを示す。画像は文書を含む。また、画像は複数の文書が集約された画像を含む。画像読取ユニット2は、「撮像部」の一例に相当する。画像読取ユニット2は、コンタクトガラス、LED(Light Emitting Diode)、ミラー、キャリッジ、結像レンズ、及び、CCD(Charge Coupled Device)を備えている。LED及びミラーは、キャリッジによって支持されている。
画像読取ユニット2によるシートRの画像読取方法には、フラットベッド読取モード、及び、ADF(Auto Document Feeder)読取モードの2種類の方法が存在する。フラットベッド読取モードでは、原稿載置用ガラス上に載置されたシートRの画像を読み取る。ADF読取モードでは、原稿搬送ユニット3によってシートRを搬送させ、シートRが読取位置を通過する際に、シートRの画像を読み取る。原稿搬送ユニット3がシートRを移動させながら、CCDがシートRの画像の読み取りを行い、画像を表す撮像データを生成する。シートRは、例えば、普通紙、コピー紙、再生紙、薄紙、厚紙、又は光沢紙、又はOHP(Overhead Projector)シートである。
原稿搬送ユニット3は、シートRを画像読取ユニット2に搬送する。
操作表示部4は、タッチパネル41と、操作ボタン42とを有する。タッチパネル41は、表示装置43とタッチセンサー45とを有する。表示装置43は種々の画像を表示する。表示装置43は、例えば液晶表示装置(Liquid Crystaal Display:LCD)である。タッチセンサー45はユーザーからの操作を受け付ける。また、操作ボタン42はユーザーからの操作を受け付ける。
タッチパネル41は、ユーザーからの操作を受け付ける度に、ユーザーからの操作の内容を示す操作情報を生成する。具体的には、タッチパネル41には、複数のアイコンが表示される。そして、ユーザーは、アイコンをタップする。タッチパネル41は、操作情報として、アイコンがタップされたことを示す情報を生成する。
操作表示部4は、ユーザーからの操作に基づいて、タッチパネル41に表示する画像を変更する。具体的には、操作表示部4は、タッチパネル41に表示された複数のアイコンのうち、ユーザーによって操作されたアイコンに対応する画像をタッチパネル41に表示する。また、操作表示部4は、タッチパネル41に表示する画像に対応する情報を、記憶部22から読み出す。
画像形成ユニット1は、搬送機構11、給送部12、トナー供給部13、画像形成部14、定着部15、排出部16、制御部21及び記憶部22を含む。画像形成ユニット1は、搬送路Lを有する。
搬送路Lは、給送部12から排出部16までシートPを案内する。搬送路Lは、給送部12から排出部16まで延びる。
搬送機構11は、シートPを搬送する。具体的には、搬送機構11は、シートPを画像形成部14及び定着部15を経由して排出部16まで搬送する。また、搬送機構11は、定着部15で画像が定着されたシートPを反転して画像形成部14へ搬送できる。
給送部12は、シートPを搬送路Lへ供給する。シートPは、例えば、普通紙、コピー紙、再生紙、薄紙、厚紙、又は光沢紙、又はOHP(Overhead Projector)シートである。
トナー供給部13には、複数のトナーコンテナが装着される。複数のトナーコンテナのうちの1つは、シアン色のトナーが収納される。複数のトナーコンテナのうちの1つは、マゼンタ色のトナーが収納される。複数のトナーコンテナのうちの1つは、イエロー色のトナーが収納される。複数のトナーコンテナのうちの1つは、黒色のトナーが収納される。
画像形成部14は、画像をシートPに形成する。具体的には、画像形成部14は、複数のシートPに複数の画像を形成する。画像形成部14は、転写部を含む。転写部は、画像をシートPに転写する。その結果、シートPに画像が形成される。
画像形成部14は、複数の画像形成部を含む。複数の画像形成部のうちの1つは、シアン色のトナー像を形成する。複数の画像形成部のうちの1つは、マゼンタ色のトナー像を形成する。複数の画像形成部のうちの1つは、イエロー色のトナー像を形成する。複数の画像形成部のうちの1つは、ブラック色のトナー像を形成する。
画像形成部14は、転写部と、像担持体と、帯電部と、露光部と、現像部とを含む。
転写部は、トナー画像をシートPに転写する。転写部は、中間転写ベルトを含む。中間転写ベルトは、無端状のベルトである。中間転写ベルトには、複数色のトナー像が形成される。具体的には、中間転写ベルトには、複数の画像形成部14が中間転写ベルトにトナー像を形成する。この結果、複数色のトナー像が中間転写ベルト上で重畳され、中間転写ベルト上に画像が形成される。そして、中間転写ベルトに形成された画像は、シートPに転写される。その結果、シートPに画像が形成される。
像担持体は、ドラム形状であり、回転軸を有する。像担持体は、回転軸を中心に時計回りに回転する。像担持体は、外周面側に感光層を有する。
帯電部は像担持体の感光層を所定の電位に帯電する。露光部は、像担持体の感光層にレーザー光を照射して露光する。露光部は画像データに基づいて像担持体を露光する。この結果、像担持体に静電潜像が形成される。
現像部は像担持体上の静電潜像を現像する。現像部は現像ローラーを有する。現像ローラーは、像担持体にトナーを供給し、像担持体上の静電潜像を現像してトナー画像を形成する。この結果、像担持体の外周面にトナー画像が形成される。
転写部は、像担持体の外周面に形成されたトナー画像をシートPに転写する。その結果、シートPにトナー画像が転写される。
定着部15は、シートPを加熱及び加圧し、シートPに形成された画像をシートPに定着する。具体的には、定着部15は、シートPを加熱及び加圧し、シートPに形成されたトナー画像をシートPに定着する。
排出部16は、シートPを画像形成装置100の外部へ排出する。定着部15がトナー画像をシートPに定着させた後、搬送機構11はシートPを定着部15から排出部16まで搬送する。そして、排出部16はトナー画像の定着したシートPを画像形成装置100の外部に排出する。
制御部21は、画像形成装置100の動作を制御する。制御部21は、プロセッサーと記憶装置とを含む。プロセッサーは、例えばCPU(Central Processing Unit)を含む。プロセッサーは、記憶装置に記憶された制御プログラムを実行して、操作表示部4、搬送機構11、給送部12、画像形成部14、定着部15、及び排出部16を制御する。
記憶部22は、記憶装置を含む。具体的には、記憶部22は、半導体メモリーのようなメモリーを備え、HDD(Hard Disk Drive)を備えてもよい。記憶部22は、制御プログラムを記憶している。
次に図2を参照して、制御部21の構成を詳しく説明する。図2は、本実施形態に係る制御部21の構成を示す図である。制御部21は、学習部218、分割部211、及び第1抽出部212を含む。制御部21は、制御プログラムを実行することで、学習部218、分割部211、及び第1抽出部212として機能する。
分割部211は、画像読取ユニット2が生成した撮像データを1ページ分の文書ごとに分割して、複数の分割データを生成する。分割データは、第1分割データと第2分割データとを含む。第2分割データは、第1分割データと異なる分割データを示す。
第1抽出部212は、分割データの各々から文字を抽出する。具体的には、第1抽出部212は、第1分割データが含む第1文書から第1文字を抽出する。第1文書は、1ページ分の分割データによって表される文書を示す。第1文字は、第1文書の文頭又は文末のうち、いずれか一方の位置に含まれる文字である。具体的には、第1文字は第1文書の記載が始まる位置を示す文頭又は第1文書の記載が終わる位置を示す文末のうち、いずれか一方の位置に含まれる文字である。
また、第1抽出部212は、第2分割データが含む第2文書から第2文字を抽出する。第2文書は、第1文書と異なる1ページ分の分割データによって表される文書を示す。第2文字は第2文書の記載が始まる位置を示す文頭又は第2文書の記載が終わる位置を示す文末のうち、第1文字が含まれる位置と異なる位置の文字である。
また、第1文字と第2文字との各々は、単一の文字、単語、及び形態素を含む。形態素は、意味を持つ最小の単位の表現要素を示す。したがって、複数の言語に対応できる。この結果、複数の言語の文字と文字との繋がりを推定できる。
学習部218は、文字と文字との繋がりを推定するために、文書データを学習する。この結果、文書データに基づいて、文字と文字との繋がりを容易に推定できる。
学習は、機械学習を含む。機械学習は、例えば教師あり学習、教師なし学習、及び強化学習を含む。機械学習は、例えば、ニューラルネットワーク(Neural Network)又はサポートベクターマシン(Support Vector Machine)によって実行される。ニューラルネットワークは、入力層、隠れ層(中間層)、及び出力層を有する。ニューラルネットワークは、誤差逆伝播法(バックプロパゲーション)により、出力層での出力値と最適解との誤差を少なくする。
また、機械学習は、深層学習(ディープラーニング)であってもよい。深層学習は、入力層、2層以上の隠れ層、及び出力層を有するニューラルネットワークによって構成される。具体的には、深層学習は、例えば、畳み込みニューラルネットワーク(Convolutional Neural Network)、再帰型ニューラルネットワーク(Recurrent Neural Network)、ボルツマンマシン(Boltzman machine)によって構成される。
また、本実施形態の学習部218は、第1文字と第2文字とが入力されることで、第1文字と第2文字との繋がりの程度を示す推定結果を出力する。したがって、文書に記載されている文字に基づいて、ユーザーが文書を並び変える必要がない。この結果、集約された画像を分割する際の、文書を並び変える手間を抑制できる。
例えば、一般的に、会議で使用した「2in1」のような集約された文書を保管する際に、ユーザーは画像形成装置の分割機能を利用する。複数の文書が集約された資料を分割する場合、画像読取ユニット2がシートRを読み取った方向などから、文書が順序通りに並ばないことがある。このような場合、ユーザーは文書を目視で確認し、文脈に基づいて、自ら文書の順序を並び替えて文書を保管する。しかしながら、学習部218が文字と文字との繋がりの程度を推定するため、ユーザーは、推定結果に基づいて、文書を並び替えることができる。この結果、文書を並び替える手間を抑制できる。
また、本実施形態の学習部218が学習する文書データは、画像形成装置100がシートPに形成する文書を示すデータである。画像形成装置100が複数の文書を集約して1枚のシートPに形成する文書の文書データを学習部218が学習する。したがって、学習部218に入力される第1文字と第2文字とは、文書データに含まれるため、学習部218の学習精度は向上する。この結果、推定結果の精度が向上する。
例えば、画像形成装置100は、会議で使用する文書をシートPに形成する。具体的には、画像形成装置100に入力される文書データに基づいて、画像形成装置100は、会議で使用する文書をシートPに形成する。シートPには、複数の文書が集約される。そして学習部218は、文書データを学習する。その後、画像読取ユニット2は、シートRを読み取って、撮像データを生成する。シートRは、複数の文書が集約されたシートPである。更に、撮像データの文書をもとに分割データは生成される。また、学習部218には、分割データから取得された第1文字と第2文字とが入力される。つまり、学習部218に入力される第1文字と第2文字とは、既に学習部218が学習した学習データに含まれる。したがって、学習部218は、精度の良い推定結果を出力できる。なお、学習データは、記憶部22に記憶されている。
なお、学習部218が学習する文書データは、画像形成装置100に入力された文書データを含んでもよい。したがって、実際にシートPに形成されなかった文書の画像データも、学習部218は学習できる。
また、本実施形態の学習部218は、文書データと、文書データに対応するページ番号とを更に学習する。この結果、学習精度が向上し、文字と文字との繋がりを推定する精度が向上する。
また、学習部218は、文書データに対して、自然言語処理を実行する。自然言語処理は、自然言語をコンピューターに処理させる一連の技術である。自然言語は、人間と人間とが意思疎通のために使用する言語である。自然言語処理は、形態素解析、構文解析、意味解析及び文脈解析を含む。
学習部218は、文書データに対して、形態素解析を実行する。形態素解析は、意味を持つ最小の単位の形態素に区分する処理である。学習部218は、文書データに含まれるテキストを記憶部22に記憶された辞書データに基づいて、文書を形態素に区分する。そして、学習部218は、形態素解析の結果に基づいて、構文解析を実行する。構文解析は、形態素と形態素との関連性を解析する処理である。関連性は、例えば、形態素と形態素との修飾関係である。更に、学習部218は、構文解析の結果に基づいて、意味解析を実行する。意味解析は、構文解析の結果に基づいて、構文木を決定する処理である。構文木は、構文解析の経過及び結果を木構造で示すものである。更に、学習部218は、意味解析の結果に基づいて、文脈解析を実行する。文脈解析は、文と文との関連性を解析する処理である。文は、主語と述語を含み、完結した1つの陳述を示す。学習部218は、自然言語処理の結果に基づいて、学習する。自然言語処理の結果は、学習データとして記憶部22に記憶される。
引き続き、図2を参照して、制御部21の構成を詳細に説明する。制御部21は、第1決定部213を更に含む。制御部21は、制御プログラムを実行することで、第1決定部213として機能する。
第1決定部213は、分割データの順序を決定する。具体的には、第1決定部213は、学習部218の推定結果に基づいて、分割データの順序を決定する。更に具体的には、第1決定部213は、第1文字と第2文字とを学習部218に入力し、学習部218が出力する第1文字と第2文字との繋がりの程度を示す推定結果に基づいて、第1分割データと第2分割データとの順序を決定する。
したがって、文書に記載されている文字に基づいて、ユーザーが文書を並び変える必要がない。この結果、集約された画像を分割する際の、文書を並び変える手間を抑制できる。
また、実施形態1の第1抽出部212は、第1文書の文末に位置する第1文字を抽出し、第2文書の文頭に位置する第2文字を抽出する。そして、第1決定部213は、第1文字と第2文字とを学習部218に入力し、学習部218から出力された推定結果に基づいて、第1分割データと第2分割データとの順序を決定する。したがって、第1文書と第2文書と続けて読むことができる。この結果、集約されてばらばらになった文書を1つの繋がりのある文書とすることができる。
また、実施形態1の第1抽出部212は、第1文字と第2文字とを抽出する。第1文字は、第1文書の文末に位置する。第2文字は、第2文書の文頭に位置する。そして、第1決定部213は、第1文字と第2文字とを学習部218に入力し、学習部218から出力された推定結果に基づいて、第1分割データと第2分割データとの順序を決定する。したがって、第1文書と第2文書と続けて読むことができる。この結果、集約されてばらばらになった文書を1つの繋がりのある文書とすることができる。
次に、図2と図3とを参照して、操作表示部4に表示された選択画面50を説明する。図3は、タッチパネル部41に表示された選択画面50を示す図である。選択画面50は、画像形成装置100のコピー機能を選択する操作ボタン42を操作することで、タッチパネル部41に表示される。選択画面50には、用紙選択アイコン51、縮小/拡大アイコン52、濃度設定アイコン53、両面/分割設定アイコン54、ページ集約設定アイコン55、ソート/仕分け設定アイコン56、機能一覧アイコン57、及び、お気に入りアイコン58が表示されている。
用紙選択アイコン51は、シートPのサイズを選択する場合に、ユーザーによって操作される。縮小/拡大アイコン52は、シートPに形成された画像を拡大又は縮小する場合に、ユーザーによって操作される。濃度設定アイコン53は、コピー濃度を設定する場合に、ユーザーによって操作される。両面/分割設定アイコン54は、両面又は片面の設定、及び「2in1」のような複数の画像が集約された画像を、画像ごとに分割する場合にユーザーによって操作される。ページ集約設定アイコン55は、「2in1」のようなページ集約を設定する場合に、ユーザーによって操作される。ソート/仕分け設定アイコン56は、ソート有無のような仕分け条件を設定する場合に、ユーザーによって操作される。機能一覧アイコン57は、各種の機能を説明する機能一覧画面をタッチパネル41に表示する場合に、ユーザーによって操作される。お気に入りアイコン58は、ユーザーが使用する頻度が高いアイコンをタッチパネル41に表示する場合に、ユーザーによって操作される。
また、図3に示すように、ユーザーH1の手の指(例えば、人差し指)によって、両面/分割設定アイコン54がタップされる。この操作に応じて、タッチパネル部41は、両面/分割設定アイコン54に対応する画面を表示する。なお、手は、タッチパネル41に表示されない。
次に、図2〜図4を参照して、両面/分割設定アイコン54に対応する画面を説明する。図4は、分割データを示す分割画像Dを表示した表示画面110を示す図である。図4に示すように、表示画面110は、第1表示領域111と第2表示領域112とを含む。
第1表示領域111は、撮像データを示す撮像画像RG1を表示するプレビュー画像113と戻るボタン114とが表示される。図4に示す撮像画像RG1は、2つの画像を1枚のシートRに集約した「2in1」の画像である。撮像画像RG1は、撮像データが複数の文書を含む場合、撮像画像RG1も複数表示される。戻るボタン114は、図3に示す選択画面50に戻るためのボタンである。
第2表示領域112には、分割データを示す複数の分割画像Dが表示される。複数の分割画像Dの各々は、1ページ分の分割データによって表される画像を示す。図4に示す複数の分割画像Dは、第1分割画像D1と第2分割画像D2とを含む。
第1分割画像D1は、例えば、複数のページのうちの2ページ目の文書を示す画像である。第1分割画像D1は、文書を含む。第1分割画像D1は、第1文頭領域BS1と第1文末領域ES1とを含む。
第1文頭領域BS1は、第1分割画像D1に含まれる文書のうち、文頭部分が位置する領域を示す。文頭部分は、1ページ分の分割データによって表される画像に含まれる文書のうち、文書の記載が始まる位置を含む。図4に示す第1文頭領域BS1には、「multifunction devices・・・・」という文字列が位置する。
第1文末領域ES1は、第1分割画像D1に含まれる文書のうち、文末部分が位置する領域を示す。文末部分は、1ページ分の分割データによって表される画像に含まれる文書のうち、文書の記載が終わる位置を含む。図4に示す第1文末領域ES1には、「・・・・optimally」という文字列が位置する。
第2分割画像D2は、例えば、複数のページのうちの1ページ目の文書を示す画像である。第2分割画像D2は、文書を含む。第2分割画像D2は、第2文頭領域BS2と第2文末領域ES2とを含む。
第2文頭領域BS2は、第2分割画像D2に含まれる文書のうち、文頭部分が位置する領域を示す。図4に示す第2文頭領域BS2には、「Tokkyo Co.,Ltd.・・・・」という文字列が位置する。
第2文末領域ES2は、第2分割画像D2に含まれる文書のうちの文末部分が位置する領域を示す。図4に示す第2分割画像D2の第2文末領域ES2には、「・・・・printers and」という文字列が位置する。
また、図4に示す第1分割画像D1は、第1表示領域111から第2表示領域112へ向かう方向の上流側に位置する。図4に示す第2分割画像D2は、第1表示領域111から第2表示領域112へ向かう方向の下流側に位置する。したがって、図4では2ページ目の第1分割画像D1が上流側に位置し、1ページ目の第2分割画像D2が下流側に位置する。
図4に示す第1分割画像D1と図4に示す第2分割画像D2とに撮像画像RG1を分割する場合、制御部21は、操作表示部4が分割設定を行う表示画面110を表示するように、操作表示部4を制御する。図4に示す表示画面110を操作表示部4のタッチパネル41に表示する場合、図3に示す両面/分割設定アイコン54のタッチ操作を2回行う。なお、タッチ操作が1回の場合、両面設定の画面が操作表示部4に表示される。分割設定アイコン54が2回タッチ操作された場合、画像読取ユニット2は、シートRを撮像してシートRを表す撮像データを取得する。シートRは、画像が形成されたシートである。シートRに形成された画像は、複数の画像が集約された画像である。画像読取ユニット2が撮像した撮像データは、制御部21に送信される。
制御部21は、撮像データを受信する。そして、制御部21は、撮像データの所定領域の輝度を取得する。所定領域は、複数の画像が集約された場合に、互いに隣り合う画像と画像との間に形成される領域を示す。また、集約する画像の数に応じて、所定領域のパターンが変更される。集約された画像が2つの場合、所定領域のパターンは、例えば、撮像画像を2つに分断する1本の直線の形状となる。集約された画像が4つの場合、所定領域のパターンは、例えば、撮像画像を4つに分断する十字の形状となる。
また、制御部21は、所定領域の輝度が所定の階調か否かを判定する。所定の階調は、例えば、白色を示す。そして、分割部211は、白色の階調を示す所定領域に基づいて、撮像データを分割する。例えば、分割部211は、撮像データを第1分割データと第2分割データとに分割する。
更に、制御部21は、分割データに対して文字認識処理を実行する。文字認識処理は、典型的には、光学的文字認識(Optical Character Recognition:OCR)処理である。制御部21は、分割データに対して文字認識処理を実行して、文字画像を検索する。具体的には、制御部21は、複数の方向から分割データに対して文字認識処理を実行する。したがって、文字画像を検索する精度が向上する。この結果、制御部21は、検索した文字画像に基づいて、精度のよいテキスト情報を取得できる。
また、複数の画像を集約する場合、画像データの向きを変更して集約される。そして、分割部211の分割データの向きは、撮像データが画像読取ユニット2に撮像された際の向きと同じになる。したがって、分割データに含まれる文書の向きは、一般的に認識される文字の向きと異なる。制御部21は、複数の方向から分割データに対して文字認識処理を行い、文字画像を最も多く検索できた向きに分割データの向きを修正する。この結果、ユーザーが分割データを確認する際に、分割データを認識することが容易となる。
そして、制御部21は、第1分割データを示す第1分割画像D1を図4に示す第2表示領域112に表示するように、操作表示部4を制御する。制御部21は、第1分割データを示す第2分割画像D2を図4に示す第2表示領域112に表示するように、操作表示部4を制御する。
次に、図2〜図5を参照して、第1決定部213が第1分割データと第2分割データとの順序を決定するまでの処理を説明する。図5は、分割データを示す分割画像Dを表示した表示画面110を示す別の図である。図5に示すように、表示画面110は、第1表示領域111と第2表示領域112とを含む。
第1表示領域111には、撮像データを示す撮像画像RG1を表示する。撮像画像RG1は、プレビュー画像113と戻るボタン114とを含む。第2表示領域112には、分割データを示す複数の分割画像Dが表示される。図5に示す複数の分割画像Dは、第1分割画像D1と第2分割画像D2とを含む。
図5に示す第1分割画像D1は、第1表示領域111から第2表示領域112へ向かう方向の下流側に位置する。図5に示す第2分割画像D2は、第1表示領域111から第2表示領域112へ向かう方向の上流側に位置する。したがって、図5では1ページ目の第2分割画像D2が上流側に位置し、2ページ目の第1分割画像D1が下流側に位置する。つまり、ページ番号が上流側から昇順に並んでいる。
また、図5に示す第2分割画像D2の第2文末領域ES2に位置する文字と、第1分割画像D1の第1文頭領域BS1に位置する文字とは、文字と文字とを繋げて意味を成す文字列である。具体的には、図5に示すように、第2文末領域ES2に位置する「and」という単語と、第1分割画像D1の第1文頭領域BS1に位置する「multifunction」という単語とは、「and multifunction」という単語の列となっている。
図5に示すように、文字と文字とを繋げて意味をなす文字列とする場合、第1抽出部212は、分割データの各々から文字を抽出する。例えば、制御部21が分割データごとに生成したテキストデータに基づいて、第1抽出部212は、文字又は文字列を抽出する。具体的には、第1抽出部212は、図4に示す第1分割画像D1に含まれる文書の第1文頭領域BS1から「multifunction」という単語を抽出する。第1分割画像D1に含まれる文書は、「第1文書」の一例に相当する。第1文頭領域BS1から抽出した単語は、「第1文字」の一例に相当する。そして、第1抽出部212は、図4に示す第2分割画像D2に含まれる文書の第2文末領域ES2から「and」という単語を抽出する。第2分割画像D2に含まれる文書は、「第2文書」の一例に相当する。第2文末領域ES2から抽出した単語は、「第2文字」の一例に相当する。
そして、第1決定部213は、学習部218に第1文字と第2文字とを入力する。更に学習部218は、第1文字と第2文字との繋がりの程度を示す推定結果を出力する。例えば、学習部218には、第2文末領域ES2の「and」と第1文頭領域BS1の「multifunction」とが入力される。そして、学習部218は、「and」と「multifunction」との繋がりの程度を示す推定結果を出力する。
また、第1抽出部212は、図4に示す第1分割画像D1の第1文末領域ES1と第2分割画像D2の第2文頭領域BS2とから文字を抽出してもよい。具体的には、第1抽出部212は、図4に示す第1分割画像D1の第1文末領域ES1から「optimally」という単語を抽出する。第1抽出部212は、図4に示す第2分割データを示す第2分割画像D2の第2文頭領域BS2から「Tokkyo」という単語を抽出する。
そして、第1決定部213は、学習部218に第1文字と第2文字とを入力する。更に学習部218は、第1文字と第2文字との繋がりの程度を示す推定結果を出力する。例えば、学習部218には、第1文末領域ES1の「optimally」と第2文頭領域BS2の「Tokkyo」とが入力される。そして、学習部218は、「optimally」と「Tokkyo」との繋がりの程度を示す推定結果を出力する。
そして、第1決定部213は、学習部218が出力する第1文字と第2文字との繋がりの程度を示す推定結果に基づいて、第1分割データと第2分割データとの順序を決定する。具体的には、「and」と「multifunction」との繋がりの程度を示す推定結果と「optimally」と「Tokkyo」との繋がりの程度を示す推定結果とを比較して、繋がりの程度が大きい推定結果に基づいて、第1決定部213は第1分割データと第2分割データとの順序を決定する。
更に、制御部21は、第1決定部213の決定に基づいて、操作表示部4が第1分割画像D1と第2分割画像D2とを表示するように、操作表示部4を制御する。したがって、図5に示すように、第1分割画像D1と第2分割画像D2とは、ページの順に並ぶ。この結果、第1分割画像D1と第2分割画像D2とを続けて読むことができる。
また、学習部218の推定結果と第1決定部213の決定結果とは、学習部218に学習される。したがって、学習部218は、文書データとページ番号と推定結果と決定結果とで再学習する。この結果、精度の良い推定結果を出力できる。
次に、図6を参照して、実施形態1の制御部21が実行する処理を説明する。図6は、制御部21が実行する処理のフローチャートを示す。制御部21が実行する処理は、ステップS101〜ステップS108を含む。
ステップS101において、制御部21は、操作表示部4が選択画面50を表示するように、操作表示部4を制御する。処理は、ステップS102に進む。
ステップS102において、制御部21は、操作表示部4から取得した信号が画像データを分割する指示を含むか否かを判定する。画像データを分割する指示を含まない場合(ステップS102において、No)、処理は終了する。画像データを分割する指示を含む場合(ステップS102において、Yes)、処理はステップS103に進む。
ステップS102でYesの場合、ステップS103において、制御部21は、画像読取ユニット2が生成した撮像データを取得する。処理は、ステップS104に進む。
ステップS104において、分割部211は、撮像データを文書ごとに分割して、分割データを生成する。処理は、ステップS105に進む。
ステップS105において、制御部21は、分割データに対して文字画像の検索を実行し、文書に対応するテキスト情報を取得する。処理は、ステップS106に進む。
ステップS106において、制御部21は、文字画像の取得率に基づいて、分割データの向きを修正する。具体的には、制御部21は、文字画像を最も多く検索できた向きに分割データの向きを修正する。処理は、ステップS107に進む。
ステップS107において、制御部21は、第1決定処理を実行する。第1決定処理については、図7を参照して後述する。処理は、ステップS108に進む。
ステップS108において、学習部218は、文書データとページ番号と推定結果と決定結果とを学習する。処理は、終了する。
次に、図7を参照して、制御部21が実行する第1決定処理を説明する。図7は、第1決定処理のフローチャートを示す図である。第1決定処理は、ステップS201〜ステップS210を含む。図7に示す第1決定処理は、図6に示すステップS107に対応する。
ステップS201において、第1抽出部212は、第1分割データが含む第1文書の第1文末領域ES1から第1文字を抽出する。処理は、ステップS202に進む。
ステップS202において、第1抽出部212は、第2分割データが含む第2文書の第2文頭領域BS2から第2文字を抽出する。処理は、ステップS203に進む。
ステップS203において、第1決定部213は、第1文書の文末に位置する第1文字と第2文書の文頭に位置する第2文字とを学習部218に入力する。処理は、ステップS204に進む。
ステップS204において、学習部218は、第1文字と第2文字との繋がりの程度を示す推定結果を出力する。処理は、ステップS205に進む。
ステップS205において、第1抽出部212は、第1分割データが含む第1文書の第1文頭領域BS1から第1文字を抽出する。処理は、ステップS206に進む。
ステップS206において、第1抽出部212は、第2分割データが含む第2文書の第2文末領域ES2から第2文字を抽出する。処理は、ステップS207に進む。
ステップS207において、第1決定部213は、第1文書の文頭に位置する第1文字と第2文書の文末に位置する第2文字とを学習部218に入力する。処理は、ステップS208に進む。
ステップS208において、学習部218は、第1文字と第2文字との繋がりの程度を示す推定結果を出力する。処理は、ステップS209に進む。
ステップS209において、制御部21は、他に分割データがあるか否かを判定する。他に分割データがある場合(ステップS209において、Yes)、処理はステップS201に戻る。他に分割データがない場合(ステップS209において、No)、処理はステップS210に進む。
ステップS209でNoの場合、ステップS210において、第1決定部213は、第1分割データと第2分割データとの順序を決定する。処理は図6に示すステップS108に戻る。
[実施形態2]
次に、図8を参照して、実施形態2の画像形成装置100を説明する。実施形態2の画像形成装置100は、第2抽出部214、第2決定部215、判定部216、及び選択部217を有する点で、実施形態1の画像形成装置100と異なる。以下、実施形態2について、実施形態1と異なる事項について説明し、実施形態1と重複する部分についての説明は割愛する。
次に、図8を参照して、実施形態2の画像形成装置100を説明する。実施形態2の画像形成装置100は、第2抽出部214、第2決定部215、判定部216、及び選択部217を有する点で、実施形態1の画像形成装置100と異なる。以下、実施形態2について、実施形態1と異なる事項について説明し、実施形態1と重複する部分についての説明は割愛する。
図8は、実施形態2の制御部21の構成を示す図である。制御部21は、分割部211、第1抽出部212、第1決定部213、学習部218、第2抽出部214、及び第2決定部215を含む。制御部21は、制御プログラムを実行することで、分割部211、第1抽出部212、第1決定部213、学習部218、第2抽出部214、及び第2決定部215として機能する。分割部211、第1抽出部212、第1決定部213、及び学習部218については、実施形態1と同様のため、説明を省略する。
第2抽出部214は、文書の所定領域に位置する記号を抽出する。記号は、文字及び数字を含む。文書の所定領域は、文書のヘッダーの領域又は文書のフッターの領域を含む。したがって、第2抽出部214は、文書に付されたページ番号を取得できる。
第2決定部215は、第2抽出部214の抽出結果に基づいて、第1分割データと第2分割データとの順序を決定する。第1決定部213の結果に合わせて第2決定部215の結果も取得できる。この結果、精度良く第1分割データと第2分割データとの順序を決定できる。
次に、図8〜図10を参照して、第2決定部215が第1分割データと第2分割データとの順序を決定する処理を説明する。図9は、分割データを示す分割画像Dを表示した表示画面110を示す図である。図9に示すように、表示画面110は、第1表示領域111と第2表示領域112とを含む。
第1表示領域111は、撮像データを示す撮像画像RG2を表示するプレビュー画像113と戻るボタン114とが表示される。図9に示す撮像画像RG2は、4つの画像を1枚のシートRに集約した「4in1」の画像である。
第2表示領域112には、分割データを示す複数の分割画像Dが表示される。図9に示す複数の分割画像Dは、第1分割画像D1と第2分割画像D2と第3分割画像D3と第4分割画像D4とを含む。
第1分割画像D1は、例えば、複数のページのうちの3ページ目の文書を示す画像である。第1分割画像D1は、文書を含む。第1分割画像D1は、第1文頭領域BS1と第1文末領域ES1と第1抽出領域CT1とを含む。図9に示す第1分割画像D1の第1文頭領域BS1には、「arranges・・・・」という文字列が位置する。図9に示す第1分割画像D1の第1文末領域ES1には、「・・・which provides」という文字列が位置する。図9に示す第1分割画像D1の第1抽出領域CT1には、「3」という記号が位置する。
第2分割画像D2は、例えば、複数のページのうちの4ページ目の文書を示す画像である。第2分割画像D2は、文書を含む。第2分割画像D2は、第2文頭領域BS2と第2文末領域ES2と第2抽出領域CT2とを含む。図9に示す第2分割画像D2の第2文頭領域BS2には、「comprehensive services・・・・」という文字列が位置する。図9に示す第2分割画像D2の第2文末領域ES2には、「・・・・in the UK.」という文字列が位置する。図9に示す第2分割画像D2の第2抽出領域CT2には、「4」という記号が位置する。
第3分割画像D3は、例えば、複数のページのうちの1ページ目の文書を示す画像である。第3分割画像D3は、文書を含む。第3分割画像D3は、第3文頭領域BS3と第3文末領域ES3と第3抽出領域CT3とを含む。図9に示す第3分割画像D3の第3文頭領域BS3には、「Tokkyo Co.,Ltd.・・・・」という文字列が位置する。図9に示す第3分割画像D3の第3文末領域ES3には、「・・・・printers and」という文字列が位置する。図9に示す第3分割画像D3の第3抽出領域CT3には、「1」という記号が位置する。
第4分割画像D4は、例えば、複数のページのうちの2ページ目の文書を示す画像である。第4分割画像D4は、文書を含む。第4分割画像D4は、第4文頭領域BS4と第4文末領域ES4と第4抽出領域CT4とを含む。図9に示す第4分割画像D4の第4文頭領域BS4には、「multifunction devices・・・・」という文字列が位置する。図9に示す第4分割画像D4の第4文末領域ES4には、「・・・・optimally」という文字列が位置する。図9に示す第4分割画像D4の第4抽出領域CT4には、「2」という記号が位置する。
また、図9に示す第1分割画像D1と第3分割画像D3とは、第1表示領域111から第2表示領域112へ向かう方向の上流側に位置する。第2分割画像D2と第4分割画像D4とは、第1表示領域111から第2表示領域112へ向かう方向の下流側に位置する。したがって、3ページ目を示す第1分割画像D1は、2ページ目を示す第4分割画像D4よりも上流に位置する。
また、図9に示す第1分割画像D1と第2分割画像D2とは、プレビュー画像113から戻るボタン114へ向かう方向の上流側に位置する。第3分割画像D3と第4分割画像D4とは、プレビュー画像113から戻るボタン114へ向かう方向の下流側に位置する。したがって、3ページ目を示す第1分割画像D1及び4ページ目を示す第2分割画像D2は、1ページ目を示す第3分割画像D3及び2ページ目を示す第4分割画像D4よりも上流に位置する。したがって、3ページ目を示す第1分割画像D1は、1ページ目を示す第3分割画像D3よりも上流に位置する。つまり、図9に示す第1分割画像D1〜第4分割画像D4は、順序通り並んでいない。
図10は、分割データを示す分割画像Dを表示した表示画面110を示す別の図である。図10に示すように、表示画面110は、第1表示領域111と第2表示領域112とを含む。
第1表示領域111は、撮像データを示す撮像画像RG2を表示するプレビュー画像113と戻るボタン114とが表示される。第2表示領域112には、分割データを示す複数の分割画像Dが表示される。図10に示す複数の分割画像Dは、第1分割画像D1と第2分割画像D2と第3分割画像D3と第4分割画像D4とを含む。
また、図10に示す第3分割画像D3と第1分割画像D1とは、第1表示領域111から第2表示領域112へ向かう方向の上流側に位置する。第4分割画像D4と第2分割画像D2とは、第1表示領域111から第2表示領域112へ向かう方向の下流側に位置する。したがって、1ページ目を示す第3分割画像D3は、2ページ目を示す第4分割画像D4よりも上流に位置する。また、3ページ目を示す第1分割画像D1は、第4ページ目を示す第2分割画像D2よりも上流に位置する。
また、図10に示す第3分割画像D3と第4分割画像D4とはプレビュー画像113から戻るボタン114へ向かう方向の上流側に位置する。図10に示す第1分割画像D1と第2分割画像D2とはプレビュー画像113から戻るボタン114へ向かう方向の下流側に位置する。したがって、第2ページ目を示す第4分割画像D4は、第1分割画像D1及び第2分割画像D2よりも上流に位置する。つまり、図10に示す第1分割画像D1〜第4分割画像D4は、昇順に並んでいる。
図10に示すように、第1分割画像D1〜第4分割画像D4を昇順に並べる場合、第2抽出部214は、分割データの各々から記号を抽出する。例えば、制御部21が分割データごとに生成したテキストデータに基づいて、第2抽出部214は、文字を抽出する。具体的には、第2抽出214は、図9に示す第1分割画像D1の第1抽出領域CT1から「3」という数字を抽出する。第2抽出214は、第2分割画像D2の第2抽出領域CT2から「4」という数字を抽出する。第2抽出214は、第3分割画像D3の第3抽出領域CT3から「1」という数字を抽出する。第2抽出214は、第4分割画像D4の第4抽出領域CT4から「2」という数字を抽出する。
そして、第2決定部215は、第2抽出部214の抽出結果に基づいて、第1分割データ、第2分割データ、第3分割データ、及び第4分割データの順序を決定する。したがって、1分割データ、第2分割データ、第3分割データ、及び第4分割データが順番に並ぶ。この結果、ユーザーが分割データを並べる手間を抑制できる。
引き続き、図9と図10とを参照して、分割データが2以上の場合の第1抽出部212と第1決定部213との処理を説明する。実施形態2の制御部21は、第1決定部213の決定結果と第2決定部215の決定結果とを取得できる。
制御部21が分割データごとに生成したテキストデータに基づいて、第1抽出部212は、文字を抽出する。具体的には、第1抽出部212は、図9に示す第1分割画像D1に含まれる文書の第1文頭領域BS1から「arranges」という単語を抽出する。第1分割画像D1に含まれる文書は、「第1文書」の一例に相当する。第1文頭領域BS1から抽出した単語は、「第1文字」の一例に相当する。
そして、第1抽出部212は、図9に示す第2分割画像D2に含まれる文書の第2文末領域ES2から「UK.」という単語を抽出する。第2分割画像D2に含まれる文書は、「第2文書」の一例に相当する。第2文末領域ES2から抽出した単語は、「第2文字」の一例に相当する。
そして、第1抽出部212は、図9に示す第3分割画像D3に含まれる文書の第3文末領域ES3から「and」という単語を抽出する。第3分割画像D3含まれる文書は、「第2文書」の一例に相当する。第3文末領域ES3から抽出した単語は、「第2文字」の一例に相当する。
そして、第1抽出部212は、図9に示す第4分割画像D4に含まれる文書の第4文末領域ES4から「optimally」という単語を抽出する。第4分割画像D4含まれる文書は、「第2文書」の一例に相当する。第4文末領域ES4から抽出した単語は、「第2文字」の一例に相当する。
そして、第1決定部213は、学習部218に第1文字と第2文字とを入力する。更に学習部218は、第1文字と第2文字との繋がりの程度を示す推定結果を出力する。
例えば、学習部218には、第2文末領域ES2の「UK.」と第1文頭領域BS1の「arranges」とが入力される。そして、学習部218は、「UK.」と「arranges」との繋がりの程度を示す第1推定結果を出力する。
例えば、学習部218には、第3文末領域ES3の「and」と第1文頭領域BS1の「arranges」とが入力される。そして、学習部218は、「and」と「arranges」との繋がりの程度を示す第2推定結果を出力する。
例えば、学習部218には、第4文末領域ES4の「optimally」と第1文頭領域BS1の「arranges」とが入力される。そして、学習部218は、「optimally」と「arranges」との繋がりの程度を示す第3推定結果を出力する。
そして、第1決定部213は、学習部218が出力する第1文字と第2文字との繋がりの程度を示す推定結果に基づいて、第1分割データと第2分割データとの順序を決定する。具体的には、第1推定結果、第2推定結果、及び第3推定結果を比較して、繋がりの程度が大きい推定結果に基づいて、第1決定部213は第1分割データと第2分割データとの順序を決定する。
更に、第1抽出部212は、分割画像Dごとに、同様の処理を繰り返す。また、第1抽出部212が処理を実行する毎に、第1決定部213は第1分割データと第2分割データとの順序を決定する。そして、制御部21は、第1決定部213の決定結果に基づいて、図10に示すように、第1分割画像D1〜第4分割画像D4をページの順序に表示する。この結果、第1分割画像D1〜第4分割画像D4を続けて読むことができる。
引き続き、図8〜図10を参照して、実施形態2の制御部21について更に詳しく説明する。制御部21は、判定部216、及び選択部217を更に含む。制御部21は、制御プログラムを実行することで、判定部216、及び選択部217として機能する。
判定部216は、第1決定部213の決定結果と第2決定部215の決定結果とが一致するか否かを判定する。したがって、第1決定部213の決定結果と第2決定部215の決定結果とが一致する場合は、第1決定部213と第2決定部215との精度が高いと判断できる。また、第1決定部213の決定結果と第2決定部215の決定結果とが一致しない場合は、第1決定部213と第2決定部215とのいずれか一方の精度が低いと判断できる。この結果、判定部216の判定結果をトリガーに、第1決定部213と第2決定部215の優劣を判断できる。
選択部217は、第1決定部213の決定結果と第2決定部215の決定結果とのうちのいずれか一方の決定結果を選択する。具体的には、決定結果が一致すると判定部216が判定する場合、選択部217は第1決定部213の決定結果を選択する。また、決定結果が一致しないと判定部216が判定する場合、選択部217は第1決定部213の決定結果と第2決定部215の決定結果とのうちのいずれか一方の決定結果を選択する。第1結果と第2結果とが異なる場合、第1結果と第2結果とのうち、どちらかの結果が優先される。したがって、精度よく第1文書と第2文書の順序を決定できる決定部の結果を採用できる。この結果、ユーザーが第1分割データと第2分割データとの順序を決定する手間を抑制できる。
例えば、ユーザーは、決定結果が一致しない場合、第2決定部215の決定結果を選択することを予め記憶部22に記憶させる。したがって、決定結果が一致しないと判定部216が判定する場合、選択部217は、第2決定部215の決定結果を選択する。この結果、学習部218の学習が進んでいない場合、第2決定部215の決定結果を選択することで精度良く分割データの順序を決定できる。
また、学習部218の学習が進んだ場合、ユーザーは第1決定部213の決定結果を選択することを予め記憶部22に記憶させる。したがって、決定結果が一致しないと判定部216が判定する場合、選択部217は、第1決定部213の決定結果を選択する。この結果、学習が進んで精度が向上した推定結果に基づいて決定された第1決定部213の決定結果を選択できるため、精度良く分割データの順序を決定できる。
次に、図11を参照して、実施形態2の制御部21が実行する処理を説明する。図11は、制御部21が実行する処理のフローチャートを示す。制御部21が実行する処理は、ステップS301〜ステップS310を含む。図11に示すステップS301〜ステップS307は、図6に示すステップS101〜ステップS107に対応しており、同様の処理を実行する。
ステップS307の後に、ステップS308において、制御部21は、第2決定処理を実行する。第2決定処理は、図12を参照して後述する。処理は、ステップS309に進む。
ステップS309において、制御部21は、選択処理を実行する。選択処理は、図13を参照して後述する。処理はステップS310に進む。
ステップS310において、学習部218は、文書データとページ番号と推定結果と第1決定部213の決定結果と第2決定部215の決定結果とを学習する。処理は、終了する。
次に、図12を参照して、第2決定処理を説明する。図12は、制御部21が実行する第2決定処理のフローチャートを示す。制御部21が実行する第2決定処理は、ステップS401〜ステップS403を含む。第2決定処理は、図11に示すステップS308に対応する。
ステップS401において、第2抽出部214は、分割データに含まれる文書の抽出領域CTに位置する記号を抽出する。処理はステップS402に進む。
ステップS402において、制御部21は、他の分割データがあるか否かを判定する。他の分割データがある場合(ステップS402において、Yes)、処理はステップS401に戻る。他の分割データがない場合(ステップS402において、No)、処理はステップS403に進む。
ステップS403において、第2決定部215は、第1分割データと第2分割データとの順序を決定する。処理は、図11に示すステップS309に戻る。
次に、図13を参照して、選択処理を説明する。図13は、制御部21が実行する選択処理のフローチャートを示す。制御部21が実行する選択処理は、ステップS501〜ステップS503を含む。選択処理は、図11に示すステップS309に対応する。
ステップS501において、判定部216は、第1決定部213の決定結果と第2決定部215の決定結果とが一致するか否かを判定する。決定結果が一致する場合(ステップS501において、Yes)、処理はステップS502に進む。決定結果が一致しない場合(ステップS501において、No)、処理はステップS503に進む。
ステップS502でNoの場合、ステップS503において、選択部217は予め定められた決定結果を選択する。処理は、図11に示すステップS310に戻る。
ステップS502でYesの場合、ステップS502において、選択部217は第1決定部213の決定結果を選択する。処理は、図11に示すステップS310に戻る。
以上、図面を参照しながら本発明の実施形態を説明した。但し、本発明は、上記の実施形態に限られるものではなく、その要旨を逸脱しない範囲で種々の態様において実施することが可能である。また、上記の各実施形態に開示されている複数の構成要素を適宜組み合わせることによって、種々の発明の形成が可能である。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。図面は、理解しやすくするために、それぞれの構成要素を主体に模式的に示しており、図示された各構成要素の厚み、長さ、個数、間隔等は、図面作成の都合上から実際とは異なる。また、上記の実施形態で示す各構成要素の速度、材質、形状、寸法等は一例であって、特に限定されるものではなく、本発明の構成から実質的に逸脱しない範囲で種々の変更が可能である。
(1)実施形態2の選択部217は、決定結果が一致しないと判定部216が判定する場合、選択部217は予め定められた決定部の決定結果を選択した。しかし、制御部21は、決定結果が一致しない場合、ユーザーに分割データの順序を決定させてもよい。そして、ユーザーが決定した順序を学習部218が学習する。したがって、学習部218は精度良く学習できる。この結果、学習部218は、精度の良い推定結果を出力できる。
本発明は、画像形成装置の分野に利用可能である。
2 画像読取ユニット(撮像部)
21 制御部
100 画像形成装置
211 分割部
212 第1抽出部
213 第1決定部
214 第2抽出部
214 第2抽出
215 第2決定部
216 判定部
217 選択部
218 学習部
CT 抽出領域(所定領域)
P シート
R シート
21 制御部
100 画像形成装置
211 分割部
212 第1抽出部
213 第1決定部
214 第2抽出部
214 第2抽出
215 第2決定部
216 判定部
217 選択部
218 学習部
CT 抽出領域(所定領域)
P シート
R シート
Claims (10)
- 文書を示す文書データに基づいて、シートに文書を形成する画像形成装置であって、
文字と文字との繋がりを推定するために、前記文書を含む文書データを学習する学習部と、
複数の文書が集約されて形成されたシートを撮像して、撮像データを生成する撮像部と、
前記撮像データを1ページ分の前記文書ごとに分割して、複数の分割データを生成する分割部と、
前記分割データの各々から文字を抽出する第1抽出部と、
を備え、
前記分割データは、第1分割データと前記第1分割データと異なる第2分割データとを含み、
前記第1抽出部は、
前記第1分割データが含む第1文書から第1文字を抽出し、
前記第2分割データが含む第2文書から第2文字を抽出し、
前記第1文書は、前記1ページ分の前記分割データによって表される文書を示し、
前記第2文書は、前記第1文書と異なる前記1ページ分の前記分割データによって表される文書を示し、
前記第1文字は前記第1文書の記載が始まる位置を示す文頭又は前記第1文書の記載が終わる位置を示す文末のうち、いずれか一方の位置に含まれる文字であり、
前記第2文字は前記第2文書の記載が始まる位置を示す文頭又は前記第2文書の記載が終わる位置を示す文末のうち、前記第1文字が含まれる位置と異なる位置の文字であり、
前記学習部は、前記第1文字と前記第2文字とが入力されることで、前記第1文字と前記第2文字との繋がりの程度を示す推定結果を出力する、画像形成装置。 - 前記学習部が学習する前記文書データは、前記画像形成装置がシートに形成する前記文書を含むデータである、請求項1に記載の画像形成装置。
- 前記学習部は、前記文書データと、前記文書データに対応するページ番号とを更に学習する、請求項1又は請求項2に記載の画像形成装置。
- 前記第1文字と前記第2文字との各々は、単一の文字、単語、及び形態素を含む、請求項1又は請求項2に記載の画像形成装置。
- 前記第1抽出部は、
前記第1文書の文末に位置する前記第1文字を抽出し、
前記第2文書の文頭に位置する前記第2文字を抽出する、請求項1から請求項4のいずれか1項に記載の画像形成装置。 - 前記第1抽出部は、
前記第1文書の文頭に位置する前記第1文字を抽出し、
前記第2文書の文末に位置する前記第2文字を抽出する、請求項1から請求項5のいずれか1項に記載の画像形成装置。 - 前記学習部の推定結果に基づいて、前記第1分割データと前記第2分割データとの順序を決定する第1決定部を更に備える、請求項1から請求項6のいずれか1項に記載の画像形成装置。
- 前記文書の所定領域に位置する記号を抽出する第2抽出部と、
前記第2抽出部の抽出結果に基づいて、前記第1分割データと前記第2分割データとの順序を決定する第2決定部と
を更に備える、請求項7に記載の画像形成装置。 - 前記第1決定部の決定結果と前記第2決定部の決定結果とが一致するか否かを判定する判定部と、
前記第1決定部の決定結果又は前記第2決定部の決定結果を選択する選択部と
を更に備え、
前記第1決定部の決定結果と前記第2決定部の決定結果とが一致しないと前記判定部が判定する場合、前記選択部は前記第1決定部の決定結果と前記第2決定部の決定結果とのうちのいずれか一方の決定結果を選択する、請求項8に記載の画像形成装置。 - 前記学習部は、前記文書データと、前記文書データに対応するページ番号と、前記推定結果と、前記第1決定部の決定結果と、前記第2決定部の決定結果とを学習する、請求項8又は請求項9に記載の画像形成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019077116A JP2020178168A (ja) | 2019-04-15 | 2019-04-15 | 画像形成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019077116A JP2020178168A (ja) | 2019-04-15 | 2019-04-15 | 画像形成装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020178168A true JP2020178168A (ja) | 2020-10-29 |
Family
ID=72937115
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019077116A Pending JP2020178168A (ja) | 2019-04-15 | 2019-04-15 | 画像形成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2020178168A (ja) |
-
2019
- 2019-04-15 JP JP2019077116A patent/JP2020178168A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4311738B2 (ja) | 画像形成装置およびその制御方法、並びにコンピュータプログラム | |
US7797150B2 (en) | Translation system using a translation database, translation using a translation database, method using a translation database, and program for translation using a translation database | |
JP5138736B2 (ja) | 文字入力装置及び文字入力方法 | |
US20100138757A1 (en) | Display control apparatus, image forming apparatus, and computer-readable recording medium storing display control program | |
US10810383B2 (en) | Image processing apparatus for comparing documents in different languages | |
JP5880052B2 (ja) | 文書処理装置及びプログラム | |
JP5631925B2 (ja) | 画像形成装置 | |
US10902223B2 (en) | Image processing apparatus | |
JP2020178168A (ja) | 画像形成装置 | |
US8970919B2 (en) | Display/input device and image forming apparatus including display/input device | |
JP2011155548A (ja) | ファイル作成装置、ファイル作成プログラム、及びファイル作成方法 | |
JP6601143B2 (ja) | 印刷装置 | |
JP2006276918A (ja) | 翻訳装置、翻訳方法およびプログラム | |
JP2018077794A (ja) | 画像処理装置、及び画像形成装置 | |
JP5618921B2 (ja) | 文字入力装置およびそれを備えた画像形成装置 | |
JP2007034430A (ja) | 翻訳装置、翻訳方法およびプログラム | |
JP7409102B2 (ja) | 情報処理装置及び画像形成装置 | |
JP5742279B2 (ja) | 指示書実行装置、指示書実行プログラム、及び画像形成システム | |
JP5712327B2 (ja) | 表示入力装置及びこれを備えた画像形成装置 | |
US11044372B2 (en) | Image forming apparatus | |
JP2013030916A (ja) | 画像処理装置及びこれを備えた画像形成装置 | |
US20230039512A1 (en) | Image processing apparatus and image forming apparatus capable of classifying respective images of plurality of pages of original document based on plurality of topic words | |
JP2010067208A (ja) | 表示制御装置、画像形成装置、及び表示制御プログラム | |
JP2023031411A (ja) | 画像形成装置 | |
JP2022075031A (ja) | 画像処理装置 |