JP5239419B2 - 文字認識プログラム、文字認識電子部品、文字認識装置、文字認識方法、およびデータ構造 - Google Patents
文字認識プログラム、文字認識電子部品、文字認識装置、文字認識方法、およびデータ構造 Download PDFInfo
- Publication number
- JP5239419B2 JP5239419B2 JP2008066504A JP2008066504A JP5239419B2 JP 5239419 B2 JP5239419 B2 JP 5239419B2 JP 2008066504 A JP2008066504 A JP 2008066504A JP 2008066504 A JP2008066504 A JP 2008066504A JP 5239419 B2 JP5239419 B2 JP 5239419B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- registered
- data
- characters
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
- G06F3/023—Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/123—Storage facilities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
- G06F40/129—Handling non-Latin characters, e.g. kana-to-kanji conversion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Computer Interaction (AREA)
- Character Discrimination (AREA)
Description
例えば、言語毎に認識用辞書を持つ文字認識システムが提案されている(特許文献1参照)。この文字認識システムは、複数の言語向けの特徴量辞書と、複数の言語向けの特徴量抽出プログラムとを有しており、認識したい言語用の特徴量抽出プログラムおよび特徴量辞書をダウンロードして文字認識するものである。
前記出力手段は、画面表示を行う表示手段など、出力を行う適宜の手段で構成することができる。
これにより、登録文字データを共通して用いる複数の言語を分類区分により判別することが可能となる。
これにより、複数の分類区分や複数の文字種を1つのコードで表すことができる。
これにより、文字認識電子部品を携帯端末に搭載して文字認識機能を簡単に追加することが可能になる。
これにより、実際に動作する文字認識装置を提供することができる。
これにより、効率の良い文字認識方法を使用することができる。
これにより、効率よく文字認識することができる辞書データを提供することが可能になる。
これにより、ヘッダ部の先頭アドレスを参照して認識対象の文字種部分へ直接ジャンプして照合を行うことができる。従って、文字認識の処理時間を短縮できる効率良い辞書データを提供できる。
図1は、携帯端末1の斜視図を示し、図2は、携帯端末1の構成のブロック図を示す。
CPU17は、ROM18に記憶されたプログラムに従ってRAM19を一時記憶領域に使用して各種動作を行うプロセッサであり、各部を制御する制御機能21と、文字認識機能22を有している。
ROM18は、文字認識プログラム23、設定データ24、および辞書データ25を記憶している。
RAM19は、CPU17が各種制御や演算に使用するデータを一時記憶する。
また、日本語と中国語とで共通する漢字は、日中共通漢字として分類し、辞書データ25における日本語部分および中国語部分からこの日中共通漢字を除いておくことで、辞書データ25の容量を少なくして最適化している。
ヘッダ部25aには、各クラスの先頭アドレス29が順番に記憶されている。
設定データ24は、INDEX、項目、クラスコード26、および言語コード27で構成されている。
項目は、アプリケーションである単語リーダーと名刺リーダーとに分けて構成されている。単語リーダーには、各種言語の項目が設定されており、名刺リーダーには、読取対象(氏名や電話番号など)が設定されている。
この設定データ24により、利用者に用途を選択させて、辞書データ25のうちマッチングを行わなければならない対象文字を最小限に減らせるようにしている。
CPU17は、ROM18からアプリ機能を呼び出し、言語選択処理を実行する(ステップS1)。この言語選択処理では、図3(A)に示したアプリ選択画面30を操作画面表示部7に表示し、アプリ選択部31で「単語リーダー」と「名刺リーダー」のいずれか一方を選択させる。「単語リーダー」が選択された場合は、続いて言語選択画面40を表示し、言語選択部41で言語を選択させる。「名刺リーダー」が選択された場合は、続いて名刺カテゴリ選択画面50を表示し、カテゴリ選択部51で読取対象を選択させる。
また、このときCPU17は、選択された領域内の文字を切り出し、一文字ずつの文字画像に切り分けておくとよい。
認識処理を開始したCPU17は、まず変数iを初期化し(ステップS11)、クラスiが認識対象クラスか否か判定する(ステップS12)。ここで、クラスiとは、図6の辞書データ25に示す上からi番目のクラスをいう。このときCPU17は、ステップS1で取得したクラスコード26にクラスiが含まれていればクラスiが認識対象クラスであり、含まれていなければ認識対象クラスでないと判定する。
CPU17は、変数iが辞書データ25のクラス数より小さければステップS12に処理を戻して繰り返し(ステップS20:Yes)、同じかそれ以上であれば(ステップS20:No)、認識処理を終了する。
また、言語コード27により、照合に利用するマッチング情報28は、対象言語27aにさらに絞り込まれる。
従って、照合に利用するマッチング情報28は、辞書データ25に登録されている全てのマッチング情報28のうち、対象マッチング情報28aのみとなる。
この発明のコンピュータおよび文字認識装置は、実施形態の携帯端末1に対応し、
以下同様に、
文字画像取得手段は、画像入力部3に対応し、
文字認識電子部品は、チップ15に対応し、
演算手段は、CPU17に対応し、
指定手段は、ステップS1を実行するCPU17に対応し、
出力手段は、ステップS5を実行するCPU17に対応し、
記憶手段は、ROM18に対応し、
文字種は、クラスコード26に対応し、
分類区分は、言語コード27に対応し、
登録文字データは、マッチング情報28に対応し、
照合対象は、対象マッチング情報28aに対応し、
先頭アドレスデータは、先頭アドレス29に対応し、
認識目的の文字画像は、文字画像62に対応し、
分類区分指定ステップは、ステップS1に対応し、
文字画像取得ステップは、ステップS2に対応し、
文字出力ステップは、ステップS5に対応し、
照合対象減少ステップは、ステップS15に対応するも、
この発明は、上述の実施形態の構成のみに限定されるものではなく、多くの実施の形態を得ることができる。
Claims (7)
- 各登録文字データに対して文字を分類する分類区分を1または複数付与した辞書データを記憶手段に記憶させておき、
指定手段により前記分類区分を指定させる分類区分指定ステップと、
文字画像取得手段により認識目的の文字画像を取得する文字画像取得ステップと、
前記辞書データに登録されている登録文字データのうち前記指定ステップで指定された分類区分が付与されている登録文字データに照合対象を減少させる照合対象減少ステップと、
該文字画像内の文字を前記照合対象減少ステップで減少させた照合対象の各登録文字データと照合する照合ステップと、
照合結果から認識した文字を出力手段により出力する文字出力ステップとをコンピュータに実行させる文字認識プログラムにおいて、
前記分類区分は、当該登録文字データを共通して用いる複数の言語を区別し得る属性により構成され、
前記辞書データは、複数の言語で共通して用いる文字が登録された登録文字データと、共通して用いる文字を有する言語に対応して登録される複数の文字の中から前記共通して用いる文字を除した登録文字データを備えるとともに、これら登録文字データが文字種単位でまとめて登録されており、
各文字種の登録文字データが記憶されている領域の先頭アドレスを示す先頭アドレスデータを前記記憶手段に記憶させておき、
前記照合対象減少ステップは、
照合対象の文字種の先頭アドレスにジャンプして当該文字種内で前記分類区分が付与されている登録文字データによる照合を行い、
当該文字種内の照合が終了すれば次の照合対象の文字種の先頭アドレスにジャンプする処理を繰り返して照合対象を減少させる
文字認識プログラム。 - 前記分類区分と前記文字種の一方または両方を、ビット列コードにより構成した
請求項1記載の文字認識プログラム。 - 請求項1または2に記載の文字認識プログラムと前記辞書データとを記憶する前記記憶手段と、
前記各ステップを実行する演算手段とを備えた
文字認識電子部品。 - 請求項1または2に記載の文字認識プログラムと前記辞書データとを記憶する前記記憶手段と、
前記各ステップを実行する演算手段と、
前記指定手段、文字画像取得手段、および前記出力手段とを備えた
文字認識装置。 - 各登録文字データに対して文字を分類する分類区分を1または複数付与した辞書データを記憶手段に記憶させておき、
指定手段により前記分類区分を指定させる分類区分指定ステップと、
文字画像取得手段により認識目的の文字画像を取得する文字画像取得ステップと、
前記辞書データに登録されている登録文字データのうち前記指定ステップで指定された分類区分が付与されている登録文字データに照合対象を減少させる照合対象減少ステップと、
該文字画像内の文字を前記照合対象減少ステップで減少させた照合対象の各登録文字データと照合する照合ステップと、
照合結果から認識した文字を出力手段により出力する文字出力ステップとを実行する文字認識方法において、
前記分類区分は、当該登録文字データを共通して用いる複数の言語を区別し得る属性により構成され、
前記辞書データは、複数の言語で共通して用いる文字が登録された登録文字データと、共通して用いる文字を有する言語に対応して登録される複数の文字の中から前記共通して用いる文字を除した登録文字データを備えるとともに、これら登録文字データが文字種単位でまとめて登録されており、
各文字種の登録文字データが記憶されている領域の先頭アドレスを示す先頭アドレスデータを前記記憶手段に記憶させておき、
前記照合対象減少ステップは、
照合対象の文字種の先頭アドレスにジャンプして当該文字種内で前記分類区分が付与されている登録文字データによる照合を行い、
当該文字種内の照合が終了すれば次の照合対象の文字種の先頭アドレスにジャンプする処理を繰り返して照合対象を減少させる
文字認識方法。 - 文字認識に利用される辞書データのデータ構造であって、
各登録文字データに対して文字を分類する分類区分が1または複数付与され、
前記分類区分は、当該登録文字データを共通して用いる複数の言語を区別し得る属性により構成され、
前記辞書データは、複数の言語で共通して用いる文字が登録された登録文字データと、共通して用いる文字を有する言語に対応して登録される複数の文字の中から前記共通して用いる文字を除した登録文字データを備えるとともに、これら登録文字データが文字種単位でまとめて登録された
データ構造。 - 前記文字種単位の先頭アドレスを示す先頭アドレス情報がヘッダ部に登録された
請求項6記載のデータ構造。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008066504A JP5239419B2 (ja) | 2008-03-14 | 2008-03-14 | 文字認識プログラム、文字認識電子部品、文字認識装置、文字認識方法、およびデータ構造 |
EP09153842A EP2120185B1 (en) | 2008-03-14 | 2009-02-27 | Character recognition program, character recognition electronic component, character recognition device, character recognition method, and data structure |
CN200910004631XA CN101533476B (zh) | 2008-03-14 | 2009-03-02 | 字符识别电子元件、装置及其方法 |
KR1020090017879A KR101039447B1 (ko) | 2008-03-14 | 2009-03-03 | 문자인식 프로그램이 기록된 기록 매체, 문자인식 전자 부품, 문자인식 장치, 문자인식 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008066504A JP5239419B2 (ja) | 2008-03-14 | 2008-03-14 | 文字認識プログラム、文字認識電子部品、文字認識装置、文字認識方法、およびデータ構造 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009223556A JP2009223556A (ja) | 2009-10-01 |
JP5239419B2 true JP5239419B2 (ja) | 2013-07-17 |
Family
ID=40887899
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008066504A Active JP5239419B2 (ja) | 2008-03-14 | 2008-03-14 | 文字認識プログラム、文字認識電子部品、文字認識装置、文字認識方法、およびデータ構造 |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP2120185B1 (ja) |
JP (1) | JP5239419B2 (ja) |
KR (1) | KR101039447B1 (ja) |
CN (1) | CN101533476B (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5387378B2 (ja) * | 2009-12-15 | 2014-01-15 | 富士通株式会社 | 文字同定装置及び文字同定方法 |
CN103137102A (zh) * | 2011-11-23 | 2013-06-05 | 财团法人资讯工业策进会 | 多国语言字符显示方法及装置 |
JP6624120B2 (ja) * | 2017-02-27 | 2019-12-25 | 京セラドキュメントソリューションズ株式会社 | 文字認識装置、文字認識方法、文字認識プログラム、及び文字認識プログラムを記録したコンピューター読み取り可能な記録媒体 |
KR102175176B1 (ko) * | 2017-12-29 | 2020-11-06 | 한양대학교 산학협력단 | 문자 종류 개수에 기반한 데이터 구분 방법, 데이터 분류기 및 스토리지 시스템 |
WO2024085460A1 (ko) * | 2022-10-19 | 2024-04-25 | 삼성전자주식회사 | 이미지 내에 포함된 글자들을 식별하기 위한 전자 장치 및 그 방법 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5960691A (ja) * | 1982-09-30 | 1984-04-06 | Toshiba Corp | 光学文字読取装置 |
JPS6174083A (ja) * | 1984-09-18 | 1986-04-16 | Fujitsu Ltd | 文字認識装置 |
JPS61198380A (ja) * | 1985-02-28 | 1986-09-02 | インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション | 文字認識装置 |
JPH02212990A (ja) * | 1989-02-13 | 1990-08-24 | Toshiba Corp | 文字読取装置 |
JPH07200737A (ja) * | 1993-12-28 | 1995-08-04 | Hitachi Ltd | 文字認識方法およびシステム |
JPH1011542A (ja) * | 1996-06-20 | 1998-01-16 | Fujitsu Ltd | 文字認識装置 |
US7120302B1 (en) * | 2000-07-31 | 2006-10-10 | Raf Technology, Inc. | Method for improving the accuracy of character recognition processes |
JP4674778B2 (ja) * | 2000-08-31 | 2011-04-20 | ヒューレット・パッカード・カンパニー | 文字認識システム |
JP2004265136A (ja) | 2003-02-28 | 2004-09-24 | Toshiba Corp | 文字入力装置、文字入力方法、及び文字入力プログラム |
JP2005141604A (ja) | 2003-11-10 | 2005-06-02 | Hitachi Ltd | 携帯情報端末における文字認識方法および携帯情報端末 |
US20050105799A1 (en) * | 2003-11-17 | 2005-05-19 | Media Lab Europe | Dynamic typography system |
JP4597644B2 (ja) * | 2003-11-28 | 2010-12-15 | シャープ株式会社 | 文字認識装置、プログラムおよび記録媒体 |
JP2006065477A (ja) * | 2004-08-25 | 2006-03-09 | Fuji Xerox Co Ltd | 文字認識装置 |
JP4759963B2 (ja) | 2004-09-22 | 2011-08-31 | 沖電気工業株式会社 | 複数の認識辞書を利用した文字認識装置 |
US7428516B2 (en) * | 2005-06-23 | 2008-09-23 | Microsoft Corporation | Handwriting recognition using neural networks |
KR100700141B1 (ko) * | 2005-11-01 | 2007-03-28 | 엘지전자 주식회사 | 이동통신 단말기의 명함인식방법 |
-
2008
- 2008-03-14 JP JP2008066504A patent/JP5239419B2/ja active Active
-
2009
- 2009-02-27 EP EP09153842A patent/EP2120185B1/en active Active
- 2009-03-02 CN CN200910004631XA patent/CN101533476B/zh active Active
- 2009-03-03 KR KR1020090017879A patent/KR101039447B1/ko active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
CN101533476A (zh) | 2009-09-16 |
JP2009223556A (ja) | 2009-10-01 |
KR101039447B1 (ko) | 2011-06-07 |
KR20090098685A (ko) | 2009-09-17 |
CN101533476B (zh) | 2012-11-14 |
EP2120185B1 (en) | 2011-07-13 |
EP2120185A1 (en) | 2009-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7929770B2 (en) | Handwriting processing apparatus and method | |
EP2698692A1 (en) | System and method for implementing sliding input of text based upon on-screen soft keyboard on electronic equipment | |
WO2014008870A1 (zh) | 便携式终端设备滑行操作辅助输入控制的***及方法 | |
JP4780169B2 (ja) | データ生成装置、スキャナ、及びコンピュータプログラム | |
JP5239419B2 (ja) | 文字認識プログラム、文字認識電子部品、文字認識装置、文字認識方法、およびデータ構造 | |
US20090300003A1 (en) | Apparatus and method for supporting keyword input | |
JP6122800B2 (ja) | 電子機器、文字列表示方法、および文字列表示プログラム | |
EP2806336A1 (en) | Text prediction in a text input associated with an image | |
CN101833661A (zh) | 字符识别装置、字符识别程序及字符识别方法 | |
JP4991407B2 (ja) | 情報処理装置、その制御プログラムおよび該制御プログラムを記録したコンピュータ読み取り可能な記録媒体、ならびに制御方法 | |
CN101281449A (zh) | 手写字识别方法和*** | |
JP4597644B2 (ja) | 文字認識装置、プログラムおよび記録媒体 | |
US8386236B2 (en) | Method for prompting by suggesting stroke order of chinese character, electronic device, and computer program product | |
US20130090919A1 (en) | Electronic device and dictionary data display method | |
WO2000036530A1 (fr) | Methode de recherche et dispositif correspondant, support enregistre | |
CN112346578A (zh) | 输入方法及装置 | |
CN112789624A (zh) | 字符候选提议装置、手写字符辨别***、方法及程序 | |
US20040139056A1 (en) | Information display control apparatus and recording medium having recorded information display control program | |
CN111857362A (zh) | 文字输入方法及文字输入装置 | |
US20100083104A1 (en) | Electronic apparatus with dictionary function | |
JP4261831B2 (ja) | 文字認識処理方法、文字認識処理装置、文字認識プログラム | |
JP7268316B2 (ja) | 情報処理装置及びプログラム | |
KR102356788B1 (ko) | 키패드를 이용한 키워드 검색 방법 및 장치 | |
JP2007026263A (ja) | 文字認識装置及びコンピュータプログラム | |
JP3022790B2 (ja) | 手書き文字入力装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110107 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120830 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120911 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121030 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130305 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130318 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160412 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5239419 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |