JP6028905B2 - 帳票管理装置及び帳票管理方法並びに帳票管理プログラム - Google Patents
帳票管理装置及び帳票管理方法並びに帳票管理プログラム Download PDFInfo
- Publication number
- JP6028905B2 JP6028905B2 JP2012149125A JP2012149125A JP6028905B2 JP 6028905 B2 JP6028905 B2 JP 6028905B2 JP 2012149125 A JP2012149125 A JP 2012149125A JP 2012149125 A JP2012149125 A JP 2012149125A JP 6028905 B2 JP6028905 B2 JP 6028905B2
- Authority
- JP
- Japan
- Prior art keywords
- range
- line
- data
- character string
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Input (AREA)
Description
技術を用いて電子データ化する。この後、システム管理者が、領域情報と文字データを対比させた帳票イメージをコンピュータの画面上に表示させる。続いて、システム管理者は、帳票項目を特定すると共に、その帳票項目に対応するデータの領域をポインティングデバイスを使用することによって帳票イメージ内で指定する。指定した範囲をコンピュータに登録すると、指定された範囲のデータの書式情報がコンピュータによって自動的に抽出される。これによって、帳票項目と検索可能なデータの範囲が対応付けられたデータ構造が作成される。
1つの側面では、本発明は、電子帳票システムのデータ構造を効率良く設定できるようにすることを目的とする。
前述の一般的な説明及び以下の詳細な説明は、典型例及び説明のためのものであって、本発明を限定するためのものではない。
Unit)11と、メモリ12と、HDD(Hard disk drive)などの記録装置13と、表示制御部14及び表示装置15と、出力装置16と、入力装置17と、外部記憶装置18と、通信制御部19とがバス接続された構成を有する。
記録装置13は、帳票管理サーバ3のオペレーティング・システム(OS)やアプリケーション・プログラムが保存される。さらに、帳票を電子データ化した帳票データ26や、帳票の項目と検索可能なデータの範囲、データの書式などの情報から形成されるデータ構造27も記録装置13に格納される。ここで、アプリケーション・プログラムには、この実施の形態における帳票の管理処理を実行させる電子帳票の管理プログラムが含まれる。
3に登録される。帳票データ26の一例について図3を参照して説明する。図3では、帳票31が1〜n頁の複数枚ある場合を例示している。
2C)、右下Y座標(帳票項目範囲72D)を有する。帳票項目名73は、帳票項目の名前を特定する文字データが格納され、帳票項目の型74には、帳票項目のデータ欄に入力されるデータの型、例えば文字列であるか、数字であるか、日付であるかを特定する情報が格納される。
この実施の形態では、従来は手作業で作成されていたデータ構造をコンピュータ処理によって作成することを特徴とする。そこで、最初に、図5のフローチャートを主に参照して帳票項目のデータ構造27を生成する処理の概略について説明する。
する。図6に例示する帳票31は、例えば、売上日が、「2012年01月01日」で、伝票番号が「0001」、担当者が「101」として登録されている。例えば、行番号1の欄38Aには、商品コードが「0020」である「カラーテレビ」を「3台」売上として計上されたことが示され、これと共に、カラーテレビの単価が120000円であり、3台の合計金額が360000円であることが示される。以下、行番号2の欄38Bでは、「カラオケセット」の売上が、行番号3の欄38Cでは「電気掃除機」の売上が、行番号4の欄38Dでは「電気スタンド」の売上がそれぞれリストアップされている。そして、各列の欄38A〜38Dにおいて商品コード、数量、単価、金額の情報が入力されている。
まず、ステップS201で文字列判定部22が複数、例えば2つの帳票31の同一座標の文字列を抽出し、ステップS202で文字列同士を比較する。文字列が一致していれば(ステップS203でYes)、ステップS204で2つの文字列の文字属性同士を比較する。文字属性とは、例えば、文字列に使用されているフォントや、文字サイズ、文字飾りなどである。
の帳票31に対する比較が終了したか調べる。全ての帳票での比較が終了していない場合(ステップS208でNo)、ステップS201に戻って、次の帳票31の同一座標の文字列を抽出する。例えば、図3の帳票データ26の例では、1つの帳票データ26がnページから構成されているので、ステップS201からステップS208がn回繰り返される。また、異なる2つ以上の帳票データ26を用いて固定文字の判定処理を実施してしても良い。また、例えば、nページの帳票データ26が2つある場合には、ステップS201からステップS208が2×n回繰り返される。このように、帳票が1枚の場合には、別の帳票を選択し、複数枚の帳票では2ページ以降を選択することが好ましい。
最初に、ステップS301で、行範囲決定部23が、着目した行に含まれる文字列の種類を判定する。その行に属する文字列の全てが固定文字列であった場合(ステップS302でYes)、ステップS303に進み、その行を区切り行に設定する。この後、ステップS304に進む。これに対して、着目した行の中に、1つでも可変文字列が含まれていた場合(ステップS302でNo)、そのままステップS304に進む。
。ページ終端に到達していない場合(ステップS304でNo)、ステップS301に戻って前記の処理を繰り返し、別の行に対しても区切り行であるか否かを調べる。これに対して、ページ終端まで処理を終了したら(ステップS304でYes)、ステップS305に進む。ステップS305では、区切り行と次の区切り行の間を行範囲に設定する。又は、最後の区切り行とページ終端の間を行範囲に設定する。この後、ここでの処理を終了する。
例えば、売上日の項目35Aがある行81は、伝票番号のタイトル36Aと、担当者のタイトル37Aがあるだけであり、これらの文字列はハッチングによって示すように固定文字列のみで構成されている。従って、この行81は、行範囲決定部23によって区切り行と判定される。その下の行82は、「伝票番号」のデータ欄36Bが帳票31によって異なる可変文字列である。この行82において、データ欄36Bの両隣のデータ欄35B,37Bは固定文字列と判定されている。この場合には、可変文字列が一箇所含まれているので、区切り行とは判定されない。
最初に、ステップS401で、列範囲決定部24が、着目した行範囲内の1行目の文字列の左右端の座標を取得する。続いて、ステップS402で、最初に選択した文字列の右端の座標を列範囲の右端の初期値に設定する。さらに、最初に選択した文字列の左端の座標を列範囲の左端の初期値に設定する。
最初に、列の範囲を決定する行範囲、例えば行範囲H2を選択する。続いて、行範囲H2内の一番上の可変文字列を基準にして列範囲を決定する。図12の例では、一番上の可変文字列である「カラーテレビ」の左端の「カ」の文字のX座標がX3で、右端の「ビ」のX座標がX6であるので列の範囲の初期値は、左端がX3、右端がX6にそれぞれ設定される。
可変文字列が存在した場合でも固定文字列と判定する処理を追加することによって削除できる。閾値は、僅かに可変文字列が含まれているが、殆ど固定文字列と取り扱えるような値を統計的に算出したものを使用する。また、帳票項目範囲91〜97の中には、数種類の文字列のいずれかが入力される場合もあるので、固定文字列の判定において、2通り又は3通りの短い文字列であれば、固定文字列と判定する処理を追加しても良い。
図14にフローチャートを示すように、まず、ステップS501で、入力用端末2から帳票のデータを入力し、帳票データ26を作成する。続いて、ステップS502で、入力用端末2から送信された帳票データ26を帳票管理サーバ3が受信し、記録装置13に登録する。
さらに、予め記録装置13に登録してある帳票データ26であって、帳票のフォーマットが同一の帳票を選択してデータ構造27を形成しても良い。
部20と、文字抽出部21と、文字列判定部22と、行範囲決定部23と、列範囲決定部24と、検索制御部25として機能させる構成を有する。さらに、電子帳票の管理プログラムを実行可能に記録装置13に保存することや、コンピュータにインストール可能に保存した記録媒体や、ダウンロード可能な状態におくことも実施の形態に含まれるものとする。
(付記1) 帳票のデータを取り込む入力装置と、前記取り込まれた帳票のデータに含まれる文字列を抽出し、複数の前記帳票で共通して使用される文字の集合である固定文字列と、前記固定文字列以外の文字列を含む可変文字列とを区別する文字列判定部と、前記固定文字列のみを有する行を区切り行とし、前記区切り行同士の間、又は前記区切り行と帳票の終端までの間を、帳票の項目の検索可能な行範囲として設定する行範囲決定部と、を含むことを特徴とする電子帳票システム。
(付記2) 前記行範囲内に配置される複数の前記可変文字列の両端を比較し、前記行範囲内に配置される全ての前記可変文字列を包含する範囲を、前記取り込まれた帳票の項目の検索可能な列範囲として設定する列範囲決定部を含むことを特徴とする付記1に記載の電子帳票システム。
(付記3) 前記取り込まれた帳票のデータの1つの行において連続して配置されている文字のグループを1つの文字列として判定し、スペースで分けられた文字を異なる文字列と判定する文字抽出部を含むことを特徴とする付記1又は付記2に記載の電子帳票システム。
(付記4) 複数の帳票のデータに含まれる文字列を抽出し、複数の前記取り込まれた帳票で共通して使用される文字の集合である固定文字列と、前記取り込まれた帳票によって変化する文字列を含む可変文字列とを判別し、前記固定文字列のみを有する行を区切り行とし、前記区切り行同士の間、又は前記区切り行と前記取り込まれた帳票の終端までの間を帳票の項目の行範囲として抽出し、前記行範囲を検索可能な範囲として設定することを特徴とする電子帳票の管理方法。
(付記5) 前記行範囲内に配置される複数の前記可変文字列の両端を比較して前記行範囲内に配置される全ての前記可変文字列を包含する列範囲を抽出し、前記列範囲を検索可能な範囲として設定することを特徴とする付記4に記載の電子帳票の管理方法。
(付記6) 前記文字列を抽出するにあたり、前記帳票データの1つの行において連続して配置されている文字のグループを1つの文字列として判定し、スペースで分けられた文字を異なる文字列と判定することを特徴とする付記4又は付記5に記載の電子帳票の管理方法。
(付記7) 複数枚の帳票のデータに含まれる文字列を抽出し、複数の前記帳票で共通して使用される文字の集合である固定文字列と、前記帳票によって変化する文字列を含む可変文字列とを判別するステップと、前記固定文字列のみを有する行を区切り行とし、前記区切り行同士の間、又は前記区切り行と前記帳票の終端までの間を前記帳票の項目の行範囲として抽出するステップと、前記行範囲を検索可能な範囲として設定するステップと、をコンピュータに実行させることを特徴とする電子帳票の管理プログラム。
(付記8)
前記行範囲内に配置される複数の前記可変文字列の両端を比較して前記行範囲内に配置される全ての前記可変文字列を包含する列範囲を抽出するステップと、前記列範囲を検索
可能な範囲として設定するステップと、をコンピュータに実行させることを特徴とする付記7に記載の電子帳票の管理プログラム。
2 入力用端末
3 帳票管理サーバ
4 閲覧用端末
13 記録装置
16 通信制御部
21 文字抽出部
22 文字列判定部
23 行範囲決定部
24 列範囲決定部
26 帳票データ
31 帳票
35A 売上日の項目(帳票項目)
36A 伝票番号の項目(帳票項目)
27A 担当者の項目(帳票項目)
41 列番号の項目(帳票項目)
42 商品コードの項目(帳票項目)
43 商品名の項目(帳票項目)
44 数量の項目(帳票項目)
45 単価の項目(帳票項目)
46 金額の項目(帳票項目)
81 行(区切り行)
83 行(区切り行)
H1,H2 行範囲
W1 列範囲
Claims (11)
- 複数の帳票のデータを取り込む入力装置と、
取り込まれた前記帳票のデータに含まれる複数の文字列を抽出し、前記複数の文字列を、前記複数の帳票の同じ位置で共通して使用される固定文字列と、前記複数の帳票において同じ位置であるが帳票により内容が異なる可変文字列とに区別する文字列判定部と、
前記固定文字列のみを有する行を区切り行とし、前記区切り行同士の間、又は前記区切り行と帳票の終端までの間を、前記帳票の項目の行範囲として設定する行範囲決定部と、
を含むことを特徴とする帳票管理装置。 - 前記行範囲内に配置される複数の前記可変文字列の両端を比較し、前記行範囲内に配置される全ての前記可変文字列を包含する範囲を、取り込まれた前記帳票の項目の検索可能な列範囲として設定する列範囲決定部を含むことを特徴とする請求項1に記載の帳票管理装置。
- 前記位置は、前記複数の文字列それぞれの、前記文字列が表示された帳票における座標に対応することを特徴とする請求項1に記載の帳票管理装置。
- 前記行範囲を検索対象範囲として設定することを特徴とする請求項1に記載の帳票管理装置。
- 複数の帳票のデータに含まれる複数の文字列を抽出し、前記複数の文字列を、前記複数の帳票の同じ位置で共通して使用される固定文字列と、前記複数の帳票において同じ位置であるが帳票により内容が異なる可変文字列とに区別し、
前記固定文字列のみを有する行を区切り行とし、前記区切り行同士の間、又は前記区切り行と前記取り込まれた帳票の終端までの間を帳票の項目の行範囲として抽出することを特徴とする帳票管理方法。 - 前記行範囲内に配置される複数の前記可変文字列の両端を比較して前記行範囲内に配置される全ての前記可変文字列を包含する列範囲を抽出し、
前記列範囲を検索可能な範囲として設定することを特徴とする請求項5に記載の帳票管理方法。 - 前記位置は、前記複数の文字列それぞれの、前記文字列が表示された帳票における座標に対応することを特徴とする請求項5に記載の帳票管理方法。
- 前記行範囲を検索対象範囲として設定することを特徴とする請求項5に記載の帳票管理方法。
- 複数の帳票のデータに含まれる複数の文字列を抽出し、
前記複数の文字列を、前記複数の帳票の同じ位置で共通して使用される固定文字列、または、前記複数の帳票において同じ位置であるが帳票により内容が異なる可変文字列と判別し、
前記固定文字列のみを有する行を区切り行とし、前記区切り行同士の間、又は前記区切り行と前記帳票の終端までの間を前記帳票の項目の行範囲として抽出する、
処理をコンピュータに実行させることを特徴とする帳票管理プログラム。 - 前記位置は、前記複数の文字列それぞれの、前記文字列が表示された帳票における座標に対応することを特徴とする請求項9に記載の帳票管理プログラム。
- 前記行範囲を検索対象範囲として設定する、
処理をコンピュータに実行させることを特徴とする請求項9に記載の帳票管理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012149125A JP6028905B2 (ja) | 2012-07-03 | 2012-07-03 | 帳票管理装置及び帳票管理方法並びに帳票管理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012149125A JP6028905B2 (ja) | 2012-07-03 | 2012-07-03 | 帳票管理装置及び帳票管理方法並びに帳票管理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014010795A JP2014010795A (ja) | 2014-01-20 |
JP6028905B2 true JP6028905B2 (ja) | 2016-11-24 |
Family
ID=50107395
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012149125A Active JP6028905B2 (ja) | 2012-07-03 | 2012-07-03 | 帳票管理装置及び帳票管理方法並びに帳票管理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6028905B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6303445B2 (ja) * | 2013-11-28 | 2018-04-04 | キヤノンマーケティングジャパン株式会社 | 電子帳票システム、帳票検索装置、制御方法、およびプログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09231291A (ja) * | 1996-02-27 | 1997-09-05 | Mitsubishi Electric Corp | 帳票読取方法及びその装置 |
JP3663865B2 (ja) * | 1997-12-19 | 2005-06-22 | カシオ計算機株式会社 | 帳票処理装置及び記憶媒体 |
JP2001143018A (ja) * | 1999-11-12 | 2001-05-25 | Oki Electric Ind Co Ltd | 文字読取装置および文字読取方法 |
JP4078009B2 (ja) * | 2000-02-28 | 2008-04-23 | 東芝ソリューション株式会社 | 帳票における文字記録領域の検出装置、帳票における文字記録領域の検出方法、記憶媒体及び帳票フォーマット作成装置 |
JP2006178802A (ja) * | 2004-12-24 | 2006-07-06 | Hitachi Ltd | 帳票定義自動作成方法 |
JP4998237B2 (ja) * | 2007-12-06 | 2012-08-15 | 富士通株式会社 | 論理構造モデル作成支援プログラム、論理構造モデル作成支援装置および論理構造モデル作成支援方法 |
JP5318742B2 (ja) * | 2009-12-14 | 2013-10-16 | 富士通フロンテック株式会社 | 文字認識方法、文字認識装置および文字認識プログラム |
-
2012
- 2012-07-03 JP JP2012149125A patent/JP6028905B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014010795A (ja) | 2014-01-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8107727B2 (en) | Document processing apparatus, document processing method, and computer program product | |
US20070171473A1 (en) | Information processing apparatus, Information processing method, and computer program product | |
CN109074383B (zh) | 文档背景内可视化的文档搜索 | |
JP5665125B2 (ja) | 画像処理方法、及び、画像処理システム | |
US20090183115A1 (en) | Document searching apparatus, document searching method, and computer-readable recording medium | |
JP6826293B2 (ja) | 情報処理システムと、その処理方法及びプログラム | |
JP5424798B2 (ja) | メタデータ設定方法及びメタデータ設定システム、並びにプログラム | |
JP2006091994A (ja) | 文書情報処理装置および方法、文書情報処理プログラム | |
JP5702342B2 (ja) | レシート定義データ作成装置およびプログラム | |
JP2005216203A (ja) | 表フォーマットデータ処理方法並びに表フォーマットデータ処理装置 | |
JP5551986B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP6072560B2 (ja) | 電子雑誌生成システムおよび電子雑誌生成方法並びに電子雑誌生成プログラム | |
JP6028905B2 (ja) | 帳票管理装置及び帳票管理方法並びに帳票管理プログラム | |
JP2009093389A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP2010092383A (ja) | 電子文書ファイル検索装置、電子文書ファイル検索方法及びコンピュータプログラム | |
JP5298616B2 (ja) | 情報提示装置、情報提示方法および情報提示用プログラム | |
JP2014013470A (ja) | 電子帳票の管理方法及び電子帳票システム並びに電子帳票の管理プログラム | |
JP4828318B2 (ja) | 複数様式帳票統合印刷方法、システム及びプログラム | |
KR100955077B1 (ko) | 전자문서 변환 시스템 및 방법 | |
JP2020123233A (ja) | 情報処理装置及びプログラム | |
JP7377565B2 (ja) | 図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム | |
JP2009003496A (ja) | 帳票データ変換装置 | |
JP7504674B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP6897812B2 (ja) | 帳票閲覧装置 | |
US9201857B2 (en) | Finding multiple field groupings in semi-structured documents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150406 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160120 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160223 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160425 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160921 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161004 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6028905 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |