JP2021028770A - 情報処理装置及び表認識方法 - Google Patents

情報処理装置及び表認識方法 Download PDF

Info

Publication number
JP2021028770A
JP2021028770A JP2019147653A JP2019147653A JP2021028770A JP 2021028770 A JP2021028770 A JP 2021028770A JP 2019147653 A JP2019147653 A JP 2019147653A JP 2019147653 A JP2019147653 A JP 2019147653A JP 2021028770 A JP2021028770 A JP 2021028770A
Authority
JP
Japan
Prior art keywords
item name
information processing
different
processing apparatus
table area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019147653A
Other languages
English (en)
Inventor
良介 大館
Ryosuke Odate
良介 大館
新庄 広
Hiroshi Shinjo
広 新庄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2019147653A priority Critical patent/JP2021028770A/ja
Priority to US16/819,257 priority patent/US20210042555A1/en
Priority to CN202010471657.1A priority patent/CN112347831A/zh
Publication of JP2021028770A publication Critical patent/JP2021028770A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】結合した異なる複数の表を意味的に分解し、認識することを可能にする。【解決手段】異なる表領域が結合してなる結合表領域を含む入力画像に対して表認識を行う情報処理装置は、入力画像のうち少なくとも結合表領域に対して文字認識処理を行い、文字認識処理の結果得られた文字列から項目名を抽出し、結合表領域内において、一つの項目名を起点とした列または行内において一方向に進んだ位置に一つの項目名と異なる項目名を検出したら、異なる項目名以降を異なる表領域として認識する。【選択図】図6

Description

本発明は、情報処理装置及び表認識方法に関する。
文字認識技術の普及により、人が行っていた作業の自動化が進んでいる。例えば、文書の記載内容をデータベースへ入力する作業は、文字認識処理を活用することで自動化されている。近年は、表の記載内容のデータベース化も文字認識処理を活用して自動化されている。
文書画像内の表の記載内容を自動的にデータベース化するためには、文字認識処理を用いて表中から文字列を取得し、取得した文字列の中から表の項目名及び当該項目名に対応する項目値を抽出する必要がある。なお、項目名とは情報の種別を示す文字列を指し、一般的に表の最上行や最左列に記載される事が多い。また、項目値とは項目名に対応する記載内容を指す。前記の項目名及び項目値に該当する文字列を表から取得する処理を、本明細書では表認識と呼ぶ。
表認識の実現のため、文字認識処理で取得した文字列を、予め準備した項目名辞書と照合することで、表中に記載された項目名の座標を特定し、対応する項目値を特定する方法が検討されている。
例えば、特許文献1には、文書データからその属性および属性内容を含む領域を表領域と推定する表領域推定部と、前記表領域中の文字を認識する文字認識部と、前記文字認識部による認識結果に基づいて前記属性を認識する属性認識部と、前記属性認識部によって認識された前記属性に対応する位置の文字列を前記属性内容として前記属性に対応付けて抽出する抽出部とを備えたことを特徴とする文書属性取得装置が開示されている。
特許文献1に記載の技術を用いることで、文書画像内の表領域を推定し、表領域中の文字を認識し、表領域中の項目名と項目値を抽出し、データベース化することができる。
特開2006−92207号公報
特許文献1に記載の技術の処理対象は、2行n列またはn行2列の構造を持ち、全ての項目名が同一行または同一列に記載された表である。このため、より行数及び列数が多い表や、項目名が表内に点在する表等の複雑な表を認識できない課題がある。なお、項目名が表内に点在する表領域は、意味的に異なる複数の表を有する表領域が結合して構成される結合表領域と捉えられる。
本発明は上記の課題に鑑みてなされたもので、結合した異なる複数の表を意味的に分解し、認識することが可能な情報処理装置及び表解析方法を提供することにある。
上記課題を解決すべく、本発明の一つの観点に従う情報処理装置は、異なる表領域が結合してなる結合表領域を含む入力画像に対して表認識を行う情報処理装置であって、入力画像のうち少なくとも結合表領域に対して文字認識処理を行い、文字認識処理の結果得られた文字列から項目名を抽出し、結合表領域内において、一つの項目名を起点とした列または行内において一方向に進んだ位置に一つの項目名と異なる項目名を検出したら、異なる項目名以降を異なる表領域として認識する。
ことを特徴とする情報処理装置。
本発明によれば、結合した異なる複数の表を意味的に分解し、認識することが可能な情報処理装置及び表認識方法を実現することができる。
実施例に係る情報処理装置の概略構成を示す図である。 実施例に係る情報処理装置の動作の一例を示すフローチャートである。 実施例に係るレイアウトデータの一例を示す図である。 実施例に係る文字認識結果データの一例を示す図である。 入力画像である結合した表画像の一例を示す図である。 実施例に係る情報処理装置による表認識処理の結果を示す模式図である。 実施例に係る情報処理装置による表分離及び項目名項目値対応付処理の一例を説明するフローチャートである。 実施例に係る情報処理装置による項目名検出処理の一例を説明するフローチャートである。 実施例に係る項目辞書データの一例を示す図である。 実施例に係る情報処理装置による項目名項目値対応関係検出処理の一例を説明するフローチャートである。 実施例に係る情報処理装置による表認識結果修正処理の一例を説明するフローチャートである。 実施例に係る情報処理装置の出力装置に表示される画面の一例を示す図である。
以下、本発明の実施形態について、図面を参照して説明する。なお、以下に説明する実施形態は特許請求の範囲に係る発明を限定するものではなく、また実施形態の中で説明されている諸要素及びその組み合わせの全てが発明の解決手段に必須であるとは限らない。
本実施形態の情報処理装置及び表認識方法は、一例として次のような構成を有する。
本実施形態は、結合した異なる複数の表を意味的に分解し、分解した各表を認識することを目的とする。前記目的の実現のため、実施例では、表領域内の項目名に着目して、結合した複数の表の意味の境界を検出する。一般的に、項目名は表の最上行や最左列に記載される事が多い。しかし、複数の表が結合している表領域においては、表の内部に項目名が記載される事が多いため、表内部で検出された項目名を表の意味の変化と捉えて分離し、認識する。また、実施例では、前記認識結果の確認及び、項目名検出に用いられる項目名辞書の拡充のための、GUIを提示する。
なお、実施例を説明する図において、同一の機能を有する箇所には同一の符号を付し、その繰り返しの説明は省略する。
また、以下の説明では、情報の一例として「xxxデータ」といった表現を用いる場合があるが、情報のデータ構造はどのようなものでもよい。すなわち、情報がデータ構造に依存しないことを示すために、「xxxデータ」を「xxxテーブル」と言うことができる。また、以下の説明において、各情報の構成は一例であり、情報を分割して保持したり、結合して保持したりしても良い。
まず、図1を参照し、実施例1の情報処理装置のハードウェア構成及びソフトウェア構成を説明し、図2以降で前記情報処理装置が実行する表認識方法の処理の説明をする。
図1は、実施例に係る情報処理装置の概略構成を示す図である。
情報処理装置100は、各種情報処理が可能な装置、一例としてコンピュータ等の情報処理装置である。情報処理装置100は、画像中の結合した表領域の分離及び、表認識に関する処理を実行する。また、表認識結果の確認及び修正のためのGUIに関する処理も実行する。
情報処理装置100は、プロセッサ101、入力装置102、及び出力装置103、主記憶装置104、副記憶装置105、ネットワークインタフェース106を有する。各ハードウェアは内部バス等を介して互いに接続される。図1では、各ハードウェアの数は一つであるが、二つ以上でもよい。接続するネットワークの種類は限定されない。ネットワークや直接の接続を介して、他の計算機や記憶装置とデータの送受信や処理の分担をしてもよい。
プロセッサ101は、例えばCPU(Central Processing Unit)、FPGA(Field-Programmable Gate Array)等の演算素子を有し、主記憶装置104に格納されるプログラムを実行する。プロセッサ101がプログラムにしたがって処理を実行することによって、特定の機能を実現する。以降の説明においてプログラムを主語に処理を説明する場合、プロセッサ101がプログラムを実行していることを示す。
入力装置102は、情報処理装置100に対してデータを入力するための装置である。例えば、入力装置102は、キーボード、マウス、及びタッチパネル等の計算機操作のための機器を含む。また、入力装置102は、スキャナ、デジタルカメラ及びスマートフォン等の画像取得のための機器も含む。
出力装置103は、データの入力画面及び処理結果等を出力する装置である。出力装置103は、タッチパネル及びディスプレイ等を含む。
主記憶装置104は、プロセッサ101が実行するプログラム及びプログラムが使用する情報を格納する。また、主記憶装置104は、プログラムが一時的に使用するワークエリアを含む。主記憶装置104は、例えば、メモリ等が考えられる。
本実施例の主記憶装置104は、レイアウト解析プログラム111、文字認識プログラム112、表分離及び項目名項目値対応付プログラム113、表認識結果修正プログラム114を格納する。プログラム111から114は、図2のステップS201、S202、S203、S204の処理とそれぞれ対応している。
また、主記憶装置104は、レイアウトデータ121、文字認識結果データ122、項目名辞書データ123を格納する。レイアウトデータ121、文字認識結果データ122及び項目名辞書データ123の詳細については、図3、4、8にそれぞれに記載している。主記憶装置104が実行する各モジュールの処理の詳細、及び主記憶装置に格納される情報については、図2以降を参照する際に述べる。
主記憶装置104は、必要な一部のモジュールを実現できればよく、すべてのモジュールを実現するプログラム及び情報を格納している必要はない。
副記憶装置105は、データを永続的に格納する。副記憶装置105は、例えば、HDD(Hard Disk Drive)及びSSD(Solid State Drive)等が考えられる。なお、主記憶装置104に格納されるプログラム及び情報は、副記憶装置105に格納されてもよい。この場合、プロセッサ101が、副記憶装置105からプログラム及び情報を読み出し、主記憶装置104にロードする。
図2は、実施例に係る情報処理装置100の動作の一例を示すフローチャートであり、情報処理装置100による表認識処理の概要を示すフローチャートである。
まず、情報処理装置100のレイアウト解析プログラム111は、入力画像に対してレイアウト解析処理を実施する。レイアウト解析処理とは、文字認識の前処理として一般的に実施される処理のことであり、公知の手法を用いて実現可能である。例えば、入力画像を白黒の二値画像にし、連結する黒画素成分を抽出し、罫線、文字行、表領域等を画像から抽出することが考えられる。
レイアウト解析プログラム111は、ステップS201の処理結果としてレイアウトデータ121を取得する。レイアウトデータ121については、図3を用いて後述する。なお、ステップS201の入力画像は、入力装置102から取得したものの他、副記憶装置105や外部の記憶装置などに格納されたものでもよいしネットワークインタフェース106を介して取得したものでも良い。
本実施例の情報処理装置100及び表認識方法における入力画像は、プリントアウトされた(表領域を含む)文書をスキャナ、デジタルカメラ及びスマートフォン等の画像取得のための機器を用いて画像化したものである。入力画像のフォーマットに特段の限定はなく、ビットマップ画像、JPEG(Joint Photographic Experts Group)画像など、公知のフォーマットの画像が適用可能である。加えて、PDF(Portable Document Format)文書についても、項目名や項目値はテキストで容易に取り出すことができるが、表に関する情報は画像等で格納されており、従って、PDF文書についてもここにいう入力画像に含めることができる。
次に、情報処理装置100の文字認識プログラム112は文字認識処理を実施する(ステップS202)。文字認識処理とは、ステップS201で抽出した文字列に対して行う字種判別の処理のことであり、公知の手法を用いて実現可能である。例えば、文字列画像から方向特徴を抽出し、前記方向特徴を用いて文字認識辞書内の最近傍探索によって字種を判別することが考えられる。
文字認識プログラム112は、ステップS202の処理結果として文字認識結果データ122を取得する。文字認識結果データ122については、図4を参照して後述する。
さらに、情報処理装置100の表分離及び項目名項目値対応付プログラム113は、表分離及び項目名項目値対応処理を実施する(ステップS203)。表分離及び項目名項目値対応処理では、結合した複数の表の意味の境界を検出して表を意味的に分離し、分離した各表において、項目名と項目値の対応付をし、表認識結果を取得する。ステップS203の処理の詳細については、図6を用いて後述する。
そして、情報処理装置100の表認識結果修正プログラム114は、ステップS203で取得した表認識結果をGUIに提示し、確認及び修正情報を受信する(ステップS204)。ステップS204の処理の詳細については、図11を参照して後述する。また、GUIの詳細については図12を参照して後述する。
図3は、実施例に係るレイアウトデータ121の一例を示す図である。
レイアウトデータ121はステップS201のレイアウト解析処理で抽出したオブジェクトをエントリとする。レイアウトデータ121は、オブジェクト番号301、属性名302、記載座標303、及び構成表番号304を有する。
オブジェクト番号301はステップS201のレイアウト解析処理で抽出した各オブジェクトを一意に特定するための番号を格納する。
属性名302は、エントリの属性を示す情報を格納しており、縦罫線、横罫線、文字列等の属性が各エントリに付与される。
記載座標303は、エントリの画像中における始点及び終点の座標を格納する。
構成表番号304は、エントリが構成要素となっている表を一意に特定するための番号を格納する。
図4は、実施例に係る文字認識結果データ122の一例を示す図である。
文字認識結果データ122は、ステップS202の文字認識処理で取得した字種判別の結果を、文字列ごとに纏めたものをエントリとする。文字認識結果データ122は、オブジェクト番号401、文字列402、表最上フラグ403、表最左フラグ404を有する。
オブジェクト番号401は、各オブジェクトを一意に特定するための番号を格納しており、図3のオブジェクト番号301と対応している。
文字列402は、文字認識処理で取得した文字列を格納する。
表最上フラグ403は、エントリが表の最上段に記載される文字か否かのフラグである。
表最左フラグ404は、エントリが表の最左列に記載される文字か否かのフラグである。
図5は入力画像である結合した表画像の一例を示す図、図6は実施例に係る情報処理装置100による表認識処理の結果を示す模式図である。
図5に示す結合表501は、ある設計図面における寸法等を記載した表の一例であり、一つの表領域の中に、据付位置、据付レベル、垂直度(水平度)という3つの異なる表が含まれている。このとき、実施例の情報処理装置100は、図6に示すように、表認識処理結果として、据付位置テーブル502、据付レベルテーブル503、垂直度テーブル504という3つの分離したテーブルから構成されるデータベースを取得する。なお、各テーブルは、もともと結合していた表同士のリンクとして結合表キーを持ち、相互に参照可能である。
図7は、実施例に係る情報処理装置100による表分離及び項目名項目値対応付処理の一例を説明するフローチャートである。
まず、情報処理装置100の表分離及び項目名項目値対応付プログラム113は、文字認識結果データ122と項目名辞書データ123を照合することで、項目名を検出する(ステップS601)。項目名検出処理については、図8を参照して詳細を後述する。
次に、情報処理装置100の表分離及び項目名項目値対応付プログラム113は表分離罫線検出処理を実施する(ステップS602)。表分離罫線検出処理は、表を意味的に分離すると考えられる罫線を検出する。例えば、図3のレイアウトデータ121の記載座標303に基づいて罫線の太さを算出し、太さが閾値以上の場合に、表分離罫線と判断する処理が考えられる。また、色の変化でも表分離罫線を検出可能である。
次に、情報処理装置100の表分離及び項目名項目値対応付プログラム113は表分離フォント検出処理を実施する(ステップS603)。表分離フォント検出処理は表を意味的に分離すると考えられるフォントを検出する。例えば、文字列の太さ、色、字種の変化を検出することが考えられる。
さらに、情報処理装置100の表分離及び項目名項目値対応付プログラム113はステップS601からS603の処理結果に基づき、表分離処理をする(ステップS604)。
具体的には、情報処理装置100の表分離及び項目名項目値対応付プログラム113は、項目名、表分離罫線、表分離フォントが存在する位置の前後で表の意味が変化していると捉え、結合表を分離する。項目名または表分離フォントに基づく場合は、当該文字列より左及び上までを表1、当該文字列及び当該文字列の下及び当該文字列の右の領域を表2とする。表分離罫線に基づく場合は、表分離罫線の上または左を表1、下または右を表2とする。
なお、本処理における上下左右による処理の分岐は、一般的な表を想定したものであり、適用対象によっては分岐を入れ替えてよいし、判定の方向を変えてもよい。また、後で説明する他の処理でも同様に変えてよい。
そして、情報処理装置100の表分離及び項目名項目値対応付プログラム113は項目名項目値対応付処理を実施する(ステップS605)。項目名項目値対応付処理では、ステップS601からステップS604までで分離した各表において、項目名と項目値を対応付けする。処理の詳細については図10を用いて後述する。
図8は、実施例に係る情報処理装置100による項目名検出処理の一例を説明するフローチャートであり、図7のステップS601に対応する項目名検出処理を説明するフローチャートである。
まず、情報処理装置100の表分離及び項目名項目値対応付プログラム113は、項目名辞書データ123の有無によって処理を分岐する(ステップS701)。項目名辞書データが存在する場合、情報処理装置100の表分離及び項目名項目値対応付プログラム113はステップS702に進み、存在しない場合、情報処理装置100の表分離及び項目名項目値対応付プログラム113はステップS703に進む。なお、項目名辞書データとは、項目名となる文字列を定義したデータであり、図8を用いて後述する。
次に、情報処理装置100の表分離及び項目名項目値対応付プログラム113は文字認識結果データ122と項目名辞書データ123を照合する(ステップS702)。
次に、情報処理装置100の表分離及び項目名項目値対応付プログラム113は照合がマッチした文字列の領域を項目名領域として検出する(ステップS703)。
次に、情報処理装置100の表分離及び項目名項目値対応付プログラム113は表の最左または最上に存在する文字列領域を項目名領域として検出する(ステップS704)。
そして、情報処理装置100の表分離及び項目名項目値対応付プログラム113は項目名に挟まれた文字列領域を項目名領域として検出する(ステップS705)。
図9は、実施例に係る項目名辞書データ123の一例を示す図である。
項目名辞書データ123は、項目名文字列をエントリとする。文字認識結果データは、辞書番号801、項目名802を有する。
図10は、実施例に係る情報処理装置100による項目名項目値対応関係検出処理の一例を説明するフローチャートであり、図7のステップS605に対応する、項目名項目値対応関係検出処理を説明するフローチャートである。項目名項目値対応関係検出処理は、行または列ごとに実施する。
まず、情報処理装置100の表分離及び項目名項目値対応付プログラム113は、図8の項目名検出処理で検出した項目名領域の、右に伸びる行または下に伸びる列に存在する文字列において、異なる項目名を探索する(ステップS901)。
次に、情報処理装置100の表分離及び項目名項目値対応付プログラム113は、異なる項目名の検出の有無によって処理を分岐する(ステップS902)。存在する場合は、情報処理装置100の表分離及び項目名項目値対応付プログラム113はステップS903に、存在しない場合は、情報処理装置100の表分離及び項目名項目値対応付プログラム113はステップS904に進む。
次に、情報処理装置100の表分離及び項目名項目値対応付プログラム113は、検出した異なる項目名までの探索行または列を、探索の起点となった項目名と同一の表領域と判断し、再帰的にステップS901に進む(ステップS903)。
そして、情報処理装置100の表分離及び項目名項目値対応付プログラム113は、表の端まで探索した行または列を、探索の起点となった項目名と同一の表領域と判断する(ステップS904)。
図11は、実施例に係る情報処理装置100による表認識結果修正処理の一例を説明するフローチャートである。
まず、情報処理装置100の表認識結果修正プログラム114は入力画像と表認識結果を出力装置103に表示する(ステップS1001)。出力装置103に表示されるGUIについては図12を参照して後述する。
次に、情報処理装置100の表認識結果修正プログラム114は、入力装置102を介してGUIで入力された項目名項目値対応関係の修正情報を受信する(ステップS1002)。受信する場合、情報処理装置100の表認識結果修正プログラム114はステップS1003に進み。受信しない場合、情報処理装置100の表認識結果修正プログラム114は処理を終了する。
次に、情報処理装置100の表認識結果修正プログラム114は、受信した修正を表認識結果に反映する(ステップS1003)。
そして、次に、情報処理装置100の表認識結果修正プログラム114は、修正によって新たに項目名として指定された文字列を項目名辞書データ123に追加する(ステップS1004)。なお、即時追加せず、一定期間保留する処理や、人間に提示して辞書追加の判断をする処理を追加してもよい。
図12は、実施例に係る情報処理装置100の出力装置103に表示される画面の一例を示す図であり、図11の表認識結果修正処理で用いる、表認識結果の確認修正GUIの一例を示す図である。
1101は、入力画像に対する表認識結果である。まず、表認識結果の項目名及び項目値が表示される。ユーザは当該表認識結果を確認し、必要であれば、マウス、タッチペン及び指等を使って、修正する項目名及び項目地の領域を指定し、入力する。
1102は、確認及び修正の完了ボタンである。
この他、確認修正をする入力画像の一覧を表示するウィンドウや修正を元に戻す機能等を追加してよい。
このように構成される本実施例によれば、異なる表領域が結合してなる結合表領域を含む入力画像に対して表認識を行う情報処理装置100は、入力画像のうち少なくとも結合表領域に対して文字認識処理を行い、文字認識処理の結果得られた文字列から項目名を抽出し、結合表領域内において、一つの項目名を起点とした列または行内において一方向に進んだ位置に一つの項目名と異なる項目名を検出したら、異なる項目名以降を異なる表領域として認識している。
従って、本実施例によれば、結合した異なる複数の表を意味的に分解し、認識することが可能となる。
なお、上記した実施例は本発明を分かりやすく説明するために構成を詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、各実施例の構成の一部について、他の構成に追加、削除、置換することが可能である。
一例として、上記した実施例において、表分離及び項目名項目値対応付プログラム113により認識された表領域内について再度表分離及び項目名項目値対応付プログラム113により再帰的に認識を行ってもよい。
また、表認識結果修正プログラム114において項目名辞書データ123に追加される項目名は、既に項目名辞書データ123に登録されている項目名の異表記であってもよい。
また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、本発明は、実施例の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をコンピュータに提供し、そのコンピュータが備えるプロセッサが記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施例の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、CD−ROM、DVD−ROM、ハードディスク、SSD(Solid State Drive)、光ディスク、光磁気ディスク、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどが用いられる。
また、本実施例に記載の機能を実現するプログラムコードは、例えば、アセンブラ、C/C++、perl、Shell、PHP、Java(登録商標)等の広範囲のプログラム又はスクリプト言語で実装できる。
さらに、実施例の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することによって、それをコンピュータのハードディスクやメモリ等の記憶手段又はCD−RW、CD−R等の記憶媒体に格納し、コンピュータが備えるプロセッサが当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしてもよい。
上述の実施例において、制御線や情報線は、説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていてもよい。
100…情報処理装置 101…プロセッサ 102…入力装置 103…出力装置 104…主記憶装置 105…副記憶装置 106…ネットワークインタフェース 111…レイアウト解析プログラム 112…文字認識プログラム 113…項目名項目値対応付プログラム 114…表認識結果修正プログラム 121…レイアウトデータ 122…文字認識結果データ

Claims (14)

  1. 異なる表領域が結合してなる結合表領域を含む入力画像に対して表認識を行う情報処理装置であって、
    前記入力画像のうち少なくとも前記結合表領域に対して文字認識処理を行い、
    前記文字認識処理の結果得られた文字列から項目名を抽出し、
    前記結合表領域内において、一つの前記項目名を起点とした列または行内において一方向に進んだ位置に前記一つの項目名と異なる前記項目名を検出したら、前記異なる前記項目名以降を異なる前記表領域として認識する
    ことを特徴とする情報処理装置。
  2. 前記一方向は前記列については前記結合表領域の上から下であり、前記行については前記結合表領域の左から右であることを特徴とする請求項1に記載の情報処理装置。
  3. 前記情報処理装置は項目名辞書を有し、
    前記文字認識処理の結果得られた前記文字列と前記項目名辞書とを照合することで前記項目名を抽出することを特徴とする請求項1に記載の情報処理装置。
  4. 前記結合表領域の最も左で最も上の文字列を前記項目名として抽出することを特徴とする請求項1に記載の情報処理装置。
  5. 抽出した複数の前記項目名が前記結合表領域において前記行方向に一行置いてまたは前記列方向に一列置いて抽出されたら、これら項目名に挟まれる前記文字列を前記項目名として抽出することを特徴とする請求項1に記載の情報処理装置。
  6. 前記結合表領域内において、一つの前記項目名を起点とした列または行内において一方向に進んだ位置に前記一つの項目名と異なる前記項目名を検出しなかったら、前記列または行は同一の表領域であるとして認識することを特徴とする請求項1に記載の情報処理装置。
  7. 前記結合表領域内における罫線の太さの変化及び/または色の変化を検出し、変化のあった前記罫線を挟んで前記行方向または前記列方向を異なる前記表領域として認識することを特徴とする請求項1に記載の情報処理装置。
  8. 前記結合表領域内におけるフォントの字種の変化、前記フォントの太さの変化、または色の少なくとも一つの変化を検出し、変化のあった前記フォントを挟んで前記行方向または前記列方向を異なる前記表領域として認識することを特徴とする請求項1に記載の情報処理装置。
  9. 異なる前記表領域として認識した前記表領域に対して再帰的に前記異なる前記表領域の認識を行うことを特徴とする請求項1、7、8のいずれか一項に記載の情報処理装置。
  10. 前記異なる表領域として認識した結果を異なるテーブルとしてデータベースに記録し、前記異なるテーブル同士のリンクを前記異なるテーブル内にそれぞれ持つことを特徴とする請求項1に記載の情報処理装置。
  11. 前記表領域の認識結果を表示する表示装置と、
    前記表示装置に表示された前記認識結果に対して前記項目名と前記項目値との対応関係の修正入力を受け入れる入力装置と
    を有することを特徴とする請求項1に記載の情報処理装置。
  12. 前記情報処理装置は項目名辞書を有し、
    前記入力装置を介して新たに指定された前記項目名を前記項目名辞書に格納する
    ことを特徴とする請求項11に記載の情報処理装置。
  13. 前記新たに指定された前記項目名は、前記項目名辞書に既に含まれている前記項目名の異表記を含むことを特徴とする請求項12に記載の情報処理装置。
  14. 異なる表領域が結合してなる結合表領域を含む入力画像に対して表認識を行う情報処理装置により実施される表認識方法であって、
    前記入力画像のうち少なくとも前記結合表領域に対して文字認識処理を行い、
    前記文字認識処理の結果得られた文字列から項目名を抽出し、
    前記結合表領域内において、一つの前記項目名を起点とした列または行内において一方向に進んだ位置に前記一つの項目名と異なる前記項目名を検出したら、前記異なる前記項目名以降を異なる前記表領域として認識する
    ことを特徴とする表認識方法。

JP2019147653A 2019-08-09 2019-08-09 情報処理装置及び表認識方法 Pending JP2021028770A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2019147653A JP2021028770A (ja) 2019-08-09 2019-08-09 情報処理装置及び表認識方法
US16/819,257 US20210042555A1 (en) 2019-08-09 2020-03-16 Information Processing Apparatus and Table Recognition Method
CN202010471657.1A CN112347831A (zh) 2019-08-09 2020-05-29 信息处理装置以及表识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019147653A JP2021028770A (ja) 2019-08-09 2019-08-09 情報処理装置及び表認識方法

Publications (1)

Publication Number Publication Date
JP2021028770A true JP2021028770A (ja) 2021-02-25

Family

ID=74357440

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019147653A Pending JP2021028770A (ja) 2019-08-09 2019-08-09 情報処理装置及び表認識方法

Country Status (3)

Country Link
US (1) US20210042555A1 (ja)
JP (1) JP2021028770A (ja)
CN (1) CN112347831A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021114211A (ja) * 2020-01-21 2021-08-05 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3860341B2 (ja) * 1998-06-24 2006-12-20 株式会社東芝 文字認識装置
JP2008108114A (ja) * 2006-10-26 2008-05-08 Just Syst Corp 文書処理装置および文書処理方法
JP2009093305A (ja) * 2007-10-05 2009-04-30 Hitachi Computer Peripherals Co Ltd 帳票認識装置
JP4998220B2 (ja) * 2007-11-09 2012-08-15 富士通株式会社 帳票データ抽出プログラム、帳票データ抽出装置および帳票データ抽出方法
JP2012141670A (ja) * 2010-12-28 2012-07-26 Fujitsu Frontech Ltd 帳票認識装置、方法およびプログラム
JP2012194879A (ja) * 2011-03-17 2012-10-11 Pfu Ltd 情報処理装置、情報処理方法及びプログラム
CN102937948B (zh) * 2012-10-31 2016-02-03 广东欧珀移动通信有限公司 一种移动终端的图文数据编辑方法
GB2541153A (en) * 2015-04-24 2017-02-15 Univ Oxford Innovation Ltd Processing a series of images to identify at least a portion of an object
CN107066997B (zh) * 2016-12-16 2019-07-30 浙江工业大学 一种基于图像识别的电气元件报价方法
CN107491730A (zh) * 2017-07-14 2017-12-19 浙江大学 一种基于图像处理的化验单识别方法

Also Published As

Publication number Publication date
CN112347831A (zh) 2021-02-09
US20210042555A1 (en) 2021-02-11

Similar Documents

Publication Publication Date Title
JP5402099B2 (ja) 情報処理システム、情報処理装置、情報処理方法およびプログラム
JP4682284B2 (ja) 文書差分検出装置
US20080040655A1 (en) Table data processing method and apparatus
US11900644B2 (en) Document image analysis apparatus, document image analysis method and program thereof
JP4785655B2 (ja) 文書処理装置及び文書処理方法
US11783610B2 (en) Document structure identification using post-processing error correction
US20160140145A1 (en) Extracting information from PDF Documents using Black-Box Image Processing
CN105302626B (zh) Xps结构化数据的解析方法
US20160085727A1 (en) Reordering Text from Unstructured Sources to Intended Reading Flow
EP2884425B1 (en) Method and system of extracting structured data from a document
JP2021043478A (ja) 情報処理装置、その制御方法及びプログラム
JP2005216203A (ja) 表フォーマットデータ処理方法並びに表フォーマットデータ処理装置
JP2008129793A (ja) 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体
US20150261735A1 (en) Document processing system, document processing apparatus, and document processing method
JP2021028770A (ja) 情報処理装置及び表認識方法
CN113806472A (zh) 一种对文字图片和图像型扫描件实现全文检索的方法及设备
US10049107B2 (en) Non-transitory computer readable medium and information processing apparatus and method
US20180032244A1 (en) Input control device, input control method, character correction device, and character correction method
US10127478B2 (en) Electronic apparatus and method
JP2020087112A (ja) 帳票処理装置および帳票処理方法
JPH08320914A (ja) 表認識方法および装置
US9600480B2 (en) Systems and methods for indexing and linking electronic documents
JP7302175B2 (ja) 情報処理装置、及び情報処理プログラム
JP5752073B2 (ja) データ修正装置
JP2021196686A (ja) 情報処理装置、及び情報処理方法