JP6003492B2 - 文字認識装置及びプログラム - Google Patents
文字認識装置及びプログラム Download PDFInfo
- Publication number
- JP6003492B2 JP6003492B2 JP2012219462A JP2012219462A JP6003492B2 JP 6003492 B2 JP6003492 B2 JP 6003492B2 JP 2012219462 A JP2012219462 A JP 2012219462A JP 2012219462 A JP2012219462 A JP 2012219462A JP 6003492 B2 JP6003492 B2 JP 6003492B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- character recognition
- pattern
- character code
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/1916—Validation; Performance evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19147—Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Character Discrimination (AREA)
Description
図1には、本実施形態に係る文字認識装置1の機能ブロック図を示した。図1に示されるように、文字認識装置1は、学習データ取得部11、文字パターン入力部12、文字認識エンジン管理部13、特徴ベクトル生成部14、識別器学習部15、識別器データ保持部16、未知パターン取得部17、文字識別部18、識別結果出力部19を備える。
次に、図3〜5に示したフローチャートを参照しながら、文字認識装置1において行われる処理の詳細について説明する。
図3には、文字認識装置1において行われる学習処理のフローチャートを示した。学習処理は、学習データ(教師データ)に基づいて、識別器に文字コードの識別を学習させる処理である。
次に、文字コードの識別を学習した識別器により行われる未知の文字パターンの識別処理(文字認識処理)について説明する。
次に、学習処理の後に実行される、文字認識エンジンの設定処理について説明する。
Claims (3)
- それぞれ異なる複数の文字認識プログラムごとに、入力された文字パターンが該文字認識プログラムの認識対象とする複数の文字コードのそれぞれに該当する度合いを示す複数の評価値を出力する評価値出力手段と、
前記入力された文字パターンについて前記評価値出力手段により出力された複数の評価値を要素とする特徴情報を生成する生成手段と、
予め文字コードが指定された文字パターンについて前記生成手段により生成された特徴情報に基づいて、文字コードごとの特徴情報の分類を学習する学習手段と、
文字コードが未知の文字パターンについて前記生成手段により生成された特徴情報が前記学習された文字コードごとの特徴情報の分類のいずれに該当するかに基づいて、該未知の文字パターンの文字コードを決定する決定手段と、
予め文字コードが指定された複数の文字パターンのそれぞれについて前記決定手段により決定した文字コードと該文字パターンに指定された文字コードとの比較結果に基づいて、正解率が閾値以下である文字コードを特定する特定手段と、
前記特定手段により特定された文字コードを認識対象とする文字認識プログラムを前記評価値出力手段に追加する手段と、を含む
ことを特徴とする文字認識装置。 - 前記複数の文字認識プログラムは、第1の文字認識プログラムと、第2の文字認識プログラムを含み、
前記第1の文字認識プログラムが認識対象とする複数の文字コードの少なくとも一部と、前記第2の文字認識プログラムが認識対象とする複数の文字コードの少なくとも一部とが重複する
ことを特徴とする請求項1に記載の文字認識装置。 - それぞれ異なる複数の文字認識プログラムごとに、入力された文字パターンが該文字認識プログラムの認識対象とする複数の文字コードのそれぞれに該当する度合いを示す複数の評価値を出力する評価値出力手段、
前記入力された文字パターンについて前記評価値出力手段により出力された複数の評価値を要素とする特徴情報を生成する生成手段、
予め文字コードが指定された文字パターンについて前記生成手段により生成された特徴情報に基づいて、文字コードごとの特徴情報の分類を学習する学習手段と、
文字コードが未知の文字パターンについて前記生成手段により生成された特徴情報が前記学習された文字コードごとの特徴情報の分類のいずれに該当するかに基づいて、該未知の文字パターンの文字コードを決定する決定手段、
予め文字コードが指定された複数の文字パターンのそれぞれについて前記決定手段により決定した文字コードと該文字パターンに指定された文字コードとの比較結果に基づいて、正解率が閾値以下である文字コードを特定する特定手段、
前記特定手段により特定された文字コードを認識対象とする文字認識プログラムを前記評価値出力手段に追加する手段
としてコンピュータを機能させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012219462A JP6003492B2 (ja) | 2012-10-01 | 2012-10-01 | 文字認識装置及びプログラム |
US13/896,679 US9135525B2 (en) | 2012-10-01 | 2013-05-17 | Character recognition apparatus, character recognition method, and computer-readable medium |
CN201310286604.2A CN103714332B (zh) | 2012-10-01 | 2013-07-09 | 字符识别设备和字符识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012219462A JP6003492B2 (ja) | 2012-10-01 | 2012-10-01 | 文字認識装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014071813A JP2014071813A (ja) | 2014-04-21 |
JP6003492B2 true JP6003492B2 (ja) | 2016-10-05 |
Family
ID=50385273
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012219462A Active JP6003492B2 (ja) | 2012-10-01 | 2012-10-01 | 文字認識装置及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9135525B2 (ja) |
JP (1) | JP6003492B2 (ja) |
CN (1) | CN103714332B (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9898187B2 (en) | 2013-06-09 | 2018-02-20 | Apple Inc. | Managing real-time handwriting recognition |
US20140361983A1 (en) * | 2013-06-09 | 2014-12-11 | Apple Inc. | Real-time stroke-order and stroke-direction independent handwriting recognition |
US9495620B2 (en) | 2013-06-09 | 2016-11-15 | Apple Inc. | Multi-script handwriting recognition using a universal recognizer |
DK179329B1 (en) | 2016-06-12 | 2018-05-07 | Apple Inc | Handwriting keyboard for monitors |
JP6532619B2 (ja) * | 2017-01-18 | 2019-06-19 | 三菱電機株式会社 | 音声認識装置 |
US11194467B2 (en) | 2019-06-01 | 2021-12-07 | Apple Inc. | Keyboard management user interfaces |
CN112926334A (zh) * | 2019-12-06 | 2021-06-08 | 北京三星通信技术研究有限公司 | 确定词表示向量的方法、装置及电子设备 |
CN112270325B (zh) * | 2020-11-09 | 2024-05-24 | 携程旅游网络技术(上海)有限公司 | 字符验证码识别模型训练方法、识别方法、***、设备及介质 |
US11961317B2 (en) * | 2021-11-24 | 2024-04-16 | Oracle Financial Services Software Limited | Extracting textual information from image documents |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61272887A (ja) * | 1985-05-28 | 1986-12-03 | Toshiba Corp | 文字認識方式 |
JP3110552B2 (ja) * | 1992-05-07 | 2000-11-20 | 三菱電機株式会社 | 文字認識装置 |
JP3265701B2 (ja) * | 1993-04-20 | 2002-03-18 | 富士通株式会社 | 多判定器によるパターン認識装置 |
JP2673871B2 (ja) * | 1993-08-26 | 1997-11-05 | 日本アイ・ビー・エム株式会社 | ニューラル・ネットワークによるパターン認識方法及び装置 |
JPH0896083A (ja) * | 1994-09-28 | 1996-04-12 | Sumitomo Metal Ind Ltd | 文字認識装置 |
JPH0896082A (ja) | 1994-09-29 | 1996-04-12 | Toshiba Corp | 文字認識装置及び文字認識方法 |
JPH08272907A (ja) * | 1995-03-28 | 1996-10-18 | Toshiba Corp | 文字認識装置及び方法 |
US5835633A (en) * | 1995-11-20 | 1998-11-10 | International Business Machines Corporation | Concurrent two-stage multi-network optical character recognition system |
JPH09288717A (ja) | 1996-04-24 | 1997-11-04 | Brother Ind Ltd | 文字認識装置 |
JP3595900B2 (ja) | 1998-09-28 | 2004-12-02 | 富士通株式会社 | 手書き文字認識装置及び記録媒体 |
JP2001022883A (ja) | 1999-07-12 | 2001-01-26 | Ricoh Co Ltd | 文字認識方式及び該文字認識方式の機能を実現させるための記録媒体 |
US7254269B2 (en) * | 2000-08-31 | 2007-08-07 | Hewlett-Packard Development Company, L.P. | Character recognition system |
JP4674778B2 (ja) * | 2000-08-31 | 2011-04-20 | ヒューレット・パッカード・カンパニー | 文字認識システム |
US7031530B2 (en) * | 2001-11-27 | 2006-04-18 | Lockheed Martin Corporation | Compound classifier for pattern recognition applications |
US20040146200A1 (en) * | 2003-01-29 | 2004-07-29 | Lockheed Martin Corporation | Segmenting touching characters in an optical character recognition system to provide multiple segmentations |
US7369702B2 (en) * | 2003-11-07 | 2008-05-06 | Microsoft Corporation | Template-based cursive handwriting recognition |
US7302099B2 (en) * | 2003-11-10 | 2007-11-27 | Microsoft Corporation | Stroke segmentation for template-based cursive handwriting recognition |
US7848566B2 (en) * | 2004-10-22 | 2010-12-07 | Carnegie Mellon University | Object recognizer and detector for two-dimensional images using bayesian network based classifier |
US7865018B2 (en) * | 2005-06-02 | 2011-01-04 | Microsoft Corporation | Personalized implicit and explicit character shape adaptation and recognition |
US7496547B2 (en) * | 2005-06-02 | 2009-02-24 | Microsoft Corporation | Handwriting recognition using a comparative neural network |
US7817857B2 (en) * | 2006-05-31 | 2010-10-19 | Microsoft Corporation | Combiner for improving handwriting recognition |
JP2011257805A (ja) * | 2010-06-04 | 2011-12-22 | Sony Corp | 情報処理装置および方法、並びにプログラム |
US8548256B2 (en) * | 2010-07-01 | 2013-10-01 | Intellectual Ventures Fund 83 Llc | Method for fast scene matching |
JP2014092817A (ja) * | 2012-10-31 | 2014-05-19 | Fuji Xerox Co Ltd | 文字認識装置及びプログラム |
-
2012
- 2012-10-01 JP JP2012219462A patent/JP6003492B2/ja active Active
-
2013
- 2013-05-17 US US13/896,679 patent/US9135525B2/en not_active Expired - Fee Related
- 2013-07-09 CN CN201310286604.2A patent/CN103714332B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN103714332A (zh) | 2014-04-09 |
US20140093161A1 (en) | 2014-04-03 |
CN103714332B (zh) | 2018-09-07 |
JP2014071813A (ja) | 2014-04-21 |
US9135525B2 (en) | 2015-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6003492B2 (ja) | 文字認識装置及びプログラム | |
JP5588395B2 (ja) | 画像をオブジェクト及びそのパーツに関して効率的に解釈するためのシステムと方法 | |
US9600745B2 (en) | Image recognition system, image recognition method, and non-transitory computer readable medium storing image recognition program | |
CN107085585A (zh) | 用于图像搜索的准确的标签相关性预测 | |
CN103415825A (zh) | 用于手势识别的***和方法 | |
JP2008532176A (ja) | 認識グラフ | |
JP2008257469A (ja) | 画像処理装置及び画像検索方法 | |
CN111444346B (zh) | 一种用于文本分类的词向量对抗样本生成方法及装置 | |
CN109685104B (zh) | 一种识别模型的确定方法和装置 | |
US20220358658A1 (en) | Semi Supervised Training from Coarse Labels of Image Segmentation | |
CN113033271A (zh) | 利用人工智能模块学习脸部辨识的处理方法 | |
JP5667004B2 (ja) | データ分類装置及び方法及びプログラム | |
CN110991155B (zh) | 文本修正方法、设备及介质 | |
CN111126617A (zh) | 一种选择融合模型权重参数的方法、装置及设备 | |
CN115690514A (zh) | 图像识别方法及相关设备 | |
Ozasa et al. | Disambiguation in unknown object detection by integrating image and speech recognition confidences | |
US9042641B2 (en) | Character recognition apparatus, character recognition method, and computer-readable medium | |
CN115222047A (zh) | 一种模型训练方法、装置、设备及存储介质 | |
JP7061089B2 (ja) | 分類装置、分類方法及び分類プログラム | |
Sun et al. | A robot for classifying Chinese calligraphic types and styles | |
Aly et al. | Adaptive feature selection and data pruning for 3D facial expression recognition using the Kinect | |
Wang et al. | On-line signature verification using segment-to-segment graph matching | |
CN110765809A (zh) | 一种面部表情分类方法、装置和情感智能机器人 | |
Nasien et al. | New feature vector from freeman chain code for handwritten roman character recognition | |
Fischer et al. | Certainty-based prototype insertion/deletion for classification with metric adaptation. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150306 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160126 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160322 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160809 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160822 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6003492 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |