JP5216890B2 - レシートデータ認識装置およびそのプログラム - Google Patents
レシートデータ認識装置およびそのプログラム Download PDFInfo
- Publication number
- JP5216890B2 JP5216890B2 JP2011090594A JP2011090594A JP5216890B2 JP 5216890 B2 JP5216890 B2 JP 5216890B2 JP 2011090594 A JP2011090594 A JP 2011090594A JP 2011090594 A JP2011090594 A JP 2011090594A JP 5216890 B2 JP5216890 B2 JP 5216890B2
- Authority
- JP
- Japan
- Prior art keywords
- receipt
- item name
- data
- character
- item
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007726 management method Methods 0.000 claims description 129
- 238000013500 data storage Methods 0.000 claims description 55
- 238000013075 data extraction Methods 0.000 claims description 20
- 239000000284 extract Substances 0.000 claims description 14
- 238000000034 method Methods 0.000 description 46
- 230000008569 process Effects 0.000 description 38
- 238000001514 detection method Methods 0.000 description 34
- 238000012015 optical character recognition Methods 0.000 description 14
- 230000002776 aggregation Effects 0.000 description 6
- 238000004220 aggregation Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000015556 catabolic process Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 239000000853 adhesive Substances 0.000 description 2
- 230000001070 adhesive effect Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Character Input (AREA)
Description
(1)レシートから売上管理項目に必要なレシート項目を予め定義データに登録することにより,それらを用いて自動的に必要なレシートデータを抽出することができるため,売上情報の入力作業の省力化およびスピード化が達成できる。
(2)レシートから売上管理項目に必要なレシート項目について項目名称に同一の名称が複数存在する場合に,その中で売上管理項目に必要な金額に関する相対位置を,他のユニークな項目名称または複数のキーワードとなる項目名称の一群の位置情報に関連付けて定義データに登録できるため,レシートデータの抽出の誤認識を回避し,正しいレシートデータを抽出することができる。このため,チェック作業の省力化およびスピード化が達成できる。
(3)予め店舗ごとに登録,設定された定義データによって,どのような種類のレシートであるか,どのような項目名称を有し,金額に関する相対位置などの情報を画像の解析に利用することができ,文字認識などを含めて読み取りの精度を高めることができる。
(4)また,レシートの項目が異なる各店舗のレシートデータから,売上管理部門が必要とする基本的なデータを統一的に収集し,売上管理データベースなどに保存することができるようになる。
アンカー文字検出部142は,読み取ったレシート22に対応する定義データについて,読取り対象のレシート項目の項目名称が,定義データ中でレシート内に同一の項目名称を持つ他の文字列が存在すると定義され,かつアンカー文字が定義されている場合に,以下のように,アンカー文字の検出処理を実行する。
キーワード検出部143は,読み取ったレシート22に対応する定義データについて,読取り対象のレシート項目の項目名称が,定義データ中でレシート内に同一の項目名称を持つ他の文字列が存在すると定義され,かつ複数のキーワードが定義されている場合に,以下のように,複数のキーワード検出処理を実行する。
レシートデータ特定部144は,アンカー文字検出部142によりアンカー文字が検出された場合に,算出された距離と,定義データにおいて設定されている距離の情報とを比較し,検出されたアンカー文字の認識文字に最も近い距離の認識文字を,読取り対象のレシート項目の項目名称(レシート項目名称)として特定する。
レシートデータ特定部144は,キーワード検出部143により複数のキーワードが検出された場合に,複数のキーワードの中で一つのレシート項目名称の文字列に一致する認識文字を,読取り対象のレシート項目の項目名称として特定する。
一方,レシートデータ特定部144は,レシートデータ抽出部141により抽出された認識文字に該当するレシート項目名称が,定義データ中でレシート内に同一のレシート項目名称を持つ他の文字列が存在しないと定義されている場合に,抽出された認識文字を,読取り対象のレシート項目の項目名称として特定する。
レシートデータ特定部144は,(3)〜(5)のいずれかで特定した認識文字の位置データと,読取り対象のレシート項目の項目名称に対応する金額項目の相対位置データとから,その金額項目を表す認識文字を抽出する。
10 読取機
11 画像データ読込部
12 店舗特定部
13 定義データ読込部
14 レシートデータ処理部
15 売上管理データ生成部
20 レシート挟持用シート
22 レシート
101 画像データ記憶部
102 定義データ記憶部
103 売上管理データ記憶部
140 同一名称判定部
141 レシートデータ抽出部
142 アンカー文字検出部
143 キーワード検出部
144 レシートデータ特定部
Claims (6)
- レシート画像を文字認識することにより得られた認識文字とその位置データとを記憶する画像データ記憶部と,
レシートに印字される項目名称の文字列と,レシート内に同一の項目名称を持つ他の文字列が存在するか否かを示す情報と,レシート内に同一の項目名称を持つ他の文字列が存在する場合に,前記項目名称とレシート印字位置が関連付けられている他の項目名称の文字列であるアンカー文字と,前記項目名称の文字列と前記アンカー文字間の距離の情報とを,レシートにおける読取り対象となる各項目名称ごとに定義した定義データを記憶する定義データ記憶部と,
前記画像データ記憶部に記憶された認識文字から前記定義データに定義された項目名称の文字列に一致する認識文字を抽出するレシートデータ抽出部と,
抽出された認識文字に該当する項目名称が,前記定義データ中でレシート内に同一の項目名称を持つ他の文字列が存在すると定義されている場合に,対応する前記アンカー文字に一致する認識文字の位置を取得し,その位置と前記抽出された認識文字の位置との距離を算出する同一名称判定部と,
前記抽出された認識文字に該当する項目名称が,前記定義データ中でレシート内に同一の項目名称を持つ他の文字列が存在すると定義されている場合に,前記算出された距離と,前記定義データにおいて定義されている距離の情報とを比較し,最も近い距離の認識文字を,読取り対象の項目名称として特定し,前記抽出された認識文字に該当する項目名称が,前記定義データ中でレシート内に同一の項目名称を持つ他の文字列が存在しないと定義されている場合に,前記抽出された認識文字を,読取り対象の項目名称として特定するレシートデータ特定部と,
前記読取り対象の項目名称と,その項目名称に一致する認識文字に対応する金額項目を表す認識文字とから,認識結果のデータを生成し,認識結果のデータを出力または記憶するデータ生成部とを備える
ことを特徴するレシートデータ認識装置。 - レシート画像を文字認識することにより得られた認識文字とその位置データとを記憶する画像データ記憶部と,
レシートに印字される項目名称の文字列と,レシート内に同一の項目名称を持つ他の文字列が存在するか否かを示す情報と,レシート内に同一の項目名称を持つ他の文字列が存在する場合に,前記項目名称とレシート印字位置が関連付けられている他の項目名称の文字列である複数のキーワードの情報とを,レシートにおける読取り対象となる各項目名称ごとに定義した定義データを記憶する定義データ記憶部と,
前記画像データ記憶部に記憶された認識文字から前記定義データに定義された項目名称の文字列に一致する認識文字を抽出するレシートデータ抽出部と,
抽出された認識文字に該当する項目名称が,前記定義データ中でレシート内に同一の項目名称を持つ他の文字列が存在すると定義されている場合に,その項目名称に対して定義されている前記複数のキーワードに一致する複数の認識文字が存在するか否かを判定する同一名称判定部と,
前記複数のキーワードに一致する複数の認識文字が存在する場合に,前記複数のキーワードに一致する複数の認識文字の中の前記定義データに定義された項目名称の文字列に一致する認識文字を,読取り対象の項目名称として特定し,前記抽出された認識文字に該当する項目名称が,前記定義データ中でレシート内に同一の項目名称を持つ他の文字列が存在しないと定義されている場合に,前記抽出された認識文字を,読取り対象の項目名称として特定するレシートデータ特定部と,
前記読取り対象の項目名称と,その項目名称に一致する認識文字に対応する金額項目を表す認識文字とから,認識結果のデータを生成し,認識結果のデータを出力または記憶するデータ生成部とを備える
ことを特徴するレシートデータ認識装置。 - 請求項1または請求項2記載のレシートデータ認識装置において,
前記レシートは,店舗ごとに異なるフォーマットで印刷されたレシートであり,
前記定義データ記憶部には,店舗ごとに前記定義データが記憶され,
レシートを発行した店舗ごとに異なる定義データを用いて,前記レシートデータ抽出部と,前記同一名称判定部と,前記レシートデータ特定部と,前記データ生成部とによる処理を実行する
ことを特徴とするレシートデータ認識装置。 - 請求項3記載のレシートデータ認識装置において,
前記定義データ記憶部に記憶される定義データは,前記レシートに印字される項目名称の文字列に対応して,複数の店舗の売上管理に共通に用いられる管理項目名称のデータを含み,
前記データ生成部は,前記項目名称に一致する認識文字を,前記定義データに定義された対応する管理項目名称に変換した認識結果のデータを生成する
ことを特徴とするレシートデータ認識装置。 - コンピュータを,
レシート画像を文字認識することにより得られた認識文字とその位置データとを記憶する画像データ記憶手段と,
レシートに印字される項目名称の文字列と,レシート内に同一の項目名称を持つ他の文字列が存在するか否かを示す情報と,レシート内に同一の項目名称を持つ他の文字列が存在する場合に,前記項目名称とレシート印字位置が関連付けられている他の項目名称の文字列であるアンカー文字と,前記項目名称の文字列と前記アンカー文字間の距離の情報とを,レシートにおける読取り対象となる各項目名称ごとに定義した定義データを記憶する定義データ記憶手段と,
前記画像データ記憶手段に記憶された認識文字から前記定義データに定義された項目名称の文字列に一致する認識文字を抽出するレシートデータ抽出手段と,
抽出された認識文字に該当する項目名称が,前記定義データ中でレシート内に同一の項目名称を持つ他の文字列が存在すると定義されている場合に,対応する前記アンカー文字に一致する認識文字の位置を取得し,その位置と前記抽出された認識文字の位置との距離を算出する同一名称判定手段と,
前記抽出された認識文字に該当する項目名称が,前記定義データ中でレシート内に同一の項目名称を持つ他の文字列が存在すると定義されている場合に,前記算出された距離と,前記定義データにおいて定義されている距離の情報とを比較し,最も近い距離の認識文字を,読取り対象の項目名称として特定し,前記抽出された認識文字に該当する項目名称が,前記定義データ中でレシート内に同一の項目名称を持つ他の文字列が存在しないと定義されている場合に,前記抽出された認識文字を,読取り対象の項目名称として特定するレシートデータ特定手段と,
前記読取り対象の項目名称と,その項目名称に一致する認識文字に対応する金額項目を表す認識文字とから,認識結果のデータを生成し,認識結果のデータを出力または記憶するデータ生成手段として
機能させるためのレシートデータ認識プログラム。 - コンピュータを,
レシート画像を文字認識することにより得られた認識文字とその位置データとを記憶する画像データ記憶手段と,
レシートに印字される項目名称の文字列と,レシート内に同一の項目名称を持つ他の文字列が存在するか否かを示す情報と,レシート内に同一の項目名称を持つ他の文字列が存在する場合に,前記項目名称とレシート印字位置が関連付けられている他の項目名称の文字列である複数のキーワードの情報とを,レシートにおける読取り対象となる各項目名称ごとに定義した定義データを記憶する定義データ記憶手段と,
前記画像データ記憶手段に記憶された認識文字から前記定義データに定義された項目名称の文字列に一致する認識文字を抽出するレシートデータ抽出手段と,
抽出された認識文字に該当する項目名称が,前記定義データ中でレシート内に同一の項目名称を持つ他の文字列が存在すると定義されている場合に,その項目名称に対して定義されている前記複数のキーワードに一致する複数の認識文字が存在するか否かを判定する同一名称判定手段と,
前記複数のキーワードに一致する複数の認識文字が存在する場合に,前記複数のキーワードに一致する複数の認識文字の中の前記定義データに定義された項目名称の文字列に一致する認識文字を,読取り対象の項目名称として特定し,前記抽出された認識文字に該当する項目名称が,前記定義データ中でレシート内に同一の項目名称を持つ他の文字列が存在しないと定義されている場合に,前記抽出された認識文字を,読取り対象の項目名称として特定するレシートデータ特定手段と,
前記読取り対象の項目名称と,その項目名称に一致する認識文字に対応する金額項目を表す認識文字とから,認識結果のデータを生成し,認識結果のデータを出力または記憶するデータ生成手段として
機能させるためのレシートデータ認識プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011090594A JP5216890B2 (ja) | 2011-04-15 | 2011-04-15 | レシートデータ認識装置およびそのプログラム |
CN201110292415.7A CN102737224B (zh) | 2011-04-15 | 2011-09-29 | 收据数据识别装置及其方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011090594A JP5216890B2 (ja) | 2011-04-15 | 2011-04-15 | レシートデータ認識装置およびそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012226402A JP2012226402A (ja) | 2012-11-15 |
JP5216890B2 true JP5216890B2 (ja) | 2013-06-19 |
Family
ID=46992697
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011090594A Active JP5216890B2 (ja) | 2011-04-15 | 2011-04-15 | レシートデータ認識装置およびそのプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5216890B2 (ja) |
CN (1) | CN102737224B (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5991538B2 (ja) * | 2013-02-20 | 2016-09-14 | 富士ゼロックス株式会社 | データ処理装置、データ処理システム及びプログラム |
JP5959460B2 (ja) * | 2013-03-22 | 2016-08-02 | 株式会社エヌ・ティ・ティ・データ | データ処理装置、データ処理方法及びプログラム |
JP6136837B2 (ja) * | 2013-10-08 | 2017-05-31 | 富士通株式会社 | データ処理プログラム、およびデータ処理方法 |
JP2015162077A (ja) | 2014-02-27 | 2015-09-07 | ブラザー工業株式会社 | データ管理プログラム、データ管理システム、及びデータ管理サーバ |
JP6098628B2 (ja) * | 2014-12-26 | 2017-03-22 | ブラザー工業株式会社 | 画像処理プログラム、画像処理方法、及び画像処理装置 |
JP6756102B2 (ja) * | 2015-12-28 | 2020-09-16 | セイコーエプソン株式会社 | 情報処理装置、情報処理装置の情報処理方法、及び、情報処理システム |
JP6766503B2 (ja) * | 2016-07-29 | 2020-10-14 | セイコーエプソン株式会社 | 情報処理装置、情報処理装置の制御方法、及び、制御プログラム |
CN110956739A (zh) | 2019-05-09 | 2020-04-03 | 杭州睿琪软件有限公司 | 一种票据识别方法及装置 |
CN110991456B (zh) * | 2019-12-05 | 2023-07-07 | 北京百度网讯科技有限公司 | 票据识别方法及装置 |
JP7456580B2 (ja) * | 2020-03-10 | 2024-03-27 | グローリー株式会社 | 情報処理装置、情報処理システム及び情報処理方法 |
CN111428599B (zh) * | 2020-03-17 | 2023-10-20 | 北京子敬科技有限公司 | 票据识别方法、装置和设备 |
CN113269126A (zh) * | 2021-06-10 | 2021-08-17 | 上海云扩信息科技有限公司 | 一种基于坐标转换的关键信息提取方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4170441B2 (ja) * | 1997-11-28 | 2008-10-22 | 富士通株式会社 | 文書画像傾き検出装置および文書画像傾き検出プログラムの記憶媒体 |
JP2000251012A (ja) * | 1999-03-01 | 2000-09-14 | Hitachi Ltd | 帳票処理方法およびシステム |
JP4052095B2 (ja) * | 2002-11-12 | 2008-02-27 | セイコーエプソン株式会社 | レシート処理装置およびその方法、並びにコンピュータプログラム |
JP4396205B2 (ja) * | 2003-09-25 | 2010-01-13 | カシオ計算機株式会社 | 帳票データ入力装置およびプログラム |
JP4904684B2 (ja) * | 2004-11-18 | 2012-03-28 | 沖電気工業株式会社 | 金銭処理装置 |
JP4996940B2 (ja) * | 2007-02-21 | 2012-08-08 | 日立コンピュータ機器株式会社 | 帳票認識装置およびそのプログラム |
-
2011
- 2011-04-15 JP JP2011090594A patent/JP5216890B2/ja active Active
- 2011-09-29 CN CN201110292415.7A patent/CN102737224B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN102737224B (zh) | 2014-11-05 |
JP2012226402A (ja) | 2012-11-15 |
CN102737224A (zh) | 2012-10-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5216890B2 (ja) | レシートデータ認識装置およびそのプログラム | |
JP5202677B2 (ja) | レシートデータ認識装置およびそのプログラム | |
JP5204208B2 (ja) | レシートデータ照合支援装置およびレシートデータ照合支援プログラム | |
US8879846B2 (en) | Systems, methods and computer program products for processing financial documents | |
JP6100532B2 (ja) | レシート定義データ作成装置およびそのプログラム | |
US9027833B2 (en) | Commodity information display apparatus and method for displaying commodity information in different forms | |
JP6504514B1 (ja) | 書類分類システム及び方法並びに会計処理システム及び方法。 | |
JP5810568B2 (ja) | 情報処理装置、プログラム、およびデータの抽出方法 | |
JP5702342B2 (ja) | レシート定義データ作成装置およびプログラム | |
JP2013041388A (ja) | レシート定義データ作成装置およびそのプログラム | |
JP6108927B2 (ja) | 店舗別売上データ管理システム及び店舗別売上データ管理プログラム | |
JP5253462B2 (ja) | 店舗別レシートデータ収集装置およびそのプログラム | |
JP2013164740A (ja) | 会計情報読取りシステム、会計情報読取り方法、及びプログラム | |
US20190043033A1 (en) | Point-of-sale terminal | |
TW202018616A (zh) | 智能會計帳務系統與會計憑證的辨識入帳方法 | |
JP6507459B2 (ja) | 会計処理システム | |
JP6154209B2 (ja) | 顧客誘導システム及び顧客誘導方法 | |
CN111428725A (zh) | 数据结构化处理方法、装置和电子设备 | |
JP5664337B2 (ja) | Posシステム、pos装置、バーコードの誤読検出方法及びそのプログラム | |
CN101174349A (zh) | 一种网络税控器处理票据数据的方法 | |
TWM575887U (zh) | 智能會計帳務系統 | |
TWM626292U (zh) | 業務導向要項鍵值辨識系統 | |
TW202316312A (zh) | 識別帳務憑證影像以自動獲取帳務關聯資訊之帳務管理系統 | |
JP4516376B2 (ja) | 帳票処理システム | |
JP2001312694A (ja) | 多種類の帳票認識方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121227 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20121227 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20130205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130304 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5216890 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160308 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313115 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |