JP2939945B2 - ローマ字住所認識装置 - Google Patents

ローマ字住所認識装置

Info

Publication number
JP2939945B2
JP2939945B2 JP9174747A JP17474797A JP2939945B2 JP 2939945 B2 JP2939945 B2 JP 2939945B2 JP 9174747 A JP9174747 A JP 9174747A JP 17474797 A JP17474797 A JP 17474797A JP 2939945 B2 JP2939945 B2 JP 2939945B2
Authority
JP
Japan
Prior art keywords
character
roman
recognition
replacement
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP9174747A
Other languages
English (en)
Other versions
JPH1125229A (ja
Inventor
博之 永堀
武志 場生松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP9174747A priority Critical patent/JP2939945B2/ja
Publication of JPH1125229A publication Critical patent/JPH1125229A/ja
Application granted granted Critical
Publication of JP2939945B2 publication Critical patent/JP2939945B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ローマ字住所認識
装置に係り、特に、ローマ字で手書きされた住所情報を
対象に文字認識を行うローマ字住所認識装置に関する。
【0002】
【従来の技術】従来、文字認識装置の住所読取では、例
えば、特開昭62−247451号公報に開示される手
法のように、単語辞書や文字テーブルを使用して誤認識
を防ぐ事を目的とした文字認識方式が主であった。ま
た、英文の場合には、正しいスペルによる単語を複数記
憶しておき、当該正しいスペルの単語以外の記載を抽出
するスペルチェックが行われている。
【0003】
【発明が解決しようとする課題】上記従来例において
は、漢字や仮名が対象であり、ローマ字が対象である
と、認識性能は向上しない、という不都合があった。特
に、ローマ字の場合には、「H」と[N]や、「U」と
「J」などは形状が類似するため、認識率が向上しな
い、という不都合があった。
【0004】一方、住所の場合には、一般的な単語と異
なり、地名の数が多く、さらに、変更されることも多々
あるため、正しい単語を予め記憶しておくことが難し
く、さらに、複数の候補が生じたのでは、住所の自動認
識ができず、このため、ローマ字で記載される住所の認
識率を向上させることができなかった。
【0005】
【発明の目的】本発明は、係る従来例の有する不都合を
改善し、特に、認識率を向上させることができるローマ
字住所認識装置を提供することを、その目的とする。
【0006】
【課題を解決するための手段】そこで、本発明は、ロー
マ字で記載された住所の文字列を読み取る読み取り部
と、この読み取り部によって読み取られた文字列の画像
データの文字列を認識する認識処理手段とを備えてい
る。しかも、認識処理手段が、誤認識の確率の高い文字
について誤認識の結果と正しい文字との組み合わせを記
録した文字変換テーブルと、この文字変換テーブルを参
照して認識結果の文字列情報を変換する文字置換処理部
とを備えた、という構成を採っている。これにより前述
した目的を達成しようとするものである。
【0007】読み取り部は、ローマ字で記載された住所
の文字列を読み取る。すると、認識処理手段は、この文
字列の画像データを対象として認識処理を行い、ローマ
字の文字列を認識する。このとき、文字置換処理部は、
文字変換テーブルを参照して認識結果の文字列を変換す
る。文字変換テーブルには、誤認識の確率の高い文字に
ついて誤認識の結果と正しい文字との組み合わせが記録
されているため、この誤認識の確率の高い文字を検索
し、検索された場合には当該テーブルに従って変換す
る。すると、記載の手法によっては区別しづらいローマ
字について誤認識しても、これを訂正する。このとき、
3文字等の組み合わせで行うと、誤って変換することが
なくなる。
【0008】
【発明の実施の形態】次に、本発明の一実施形態につい
て図面を参照して説明する。図1に示すように、本実施
形態によるローマ字住所認識装置は、ローマ字で記載さ
れた住所の文字列を読み取る読み取り部20と、この読
み取り部20によって読み取られた文字列の画像データ
の文字列を認識する文字認識処理部12を有する認識処
理手段10とを備えている。この認識処理手段10は、
誤認識の確率の高い文字について誤認識の結果と正しい
文字との組み合わせを記録した文字変換テーブルと、こ
の文字変換テーブルを参照して認識結果の文字列情報を
変換する文字置換処理部14とを備える。ある実施形態
では、文字変換テーブルが、ローマ字の3文字を単位と
して誤認識の結果と正しい文字との組み合わせを有す
る。すると、誤った置換を行うことがなくなる。
【0009】また、認識処理手段10は、日本語のロー
マ字表記の規則に従って不完全な表記となる文字と当該
不完全な文字の置換候補とを記録したローマ字規則置換
テーブルと、このローマ字規則置換テーブルを参照して
認識結果の文字列情報を変換するローマ字規則置換処理
部16とを備えるとよい。これにより、文字認識処理部
12の認識結果のうち、ローマ字での記載の規則に合わ
ない部分については、予め定められた候補に置換る。こ
のローマ字規則置換テーブルは、例えば、文字列の語尾
が子音となる文字列の置換候補を有する。また、ある例
では、文字列中に子音が連続した文字列の置換候補を有
する。
【0010】さらに、これらのテーブルを入力するテー
ブル入力部と、このテーブル入力部に入力された情報を
各テーブルに登録するテーブル登録部とを備えると良
い。これによると、文字認識処理部12の特性に応じて
誤認識を減らすことができる。
【0011】次に、動作を説明する。
【0012】図2に示すように、まず、手書きローマ字
住所文字列の入力画像データ2Aを読み取り部20に入
力する。すると、例えば、読み取り部は候補文字列とし
て符号2Bで示す候補文字を出力する可能性がある。ア
ルファベットの文字の認識性能は漢字や仮名に比べ難し
く、特に手書きの「HとN」や「UとJ」等は記載方法
によっては区別がつかないことが多い。
【0013】そこで、OCR読み取り部から出力された
候補文字列を、そのまま認識結果として出力するのでは
なく、符号2Cで示す文字置換処理を行い読み取り部の
候補文字を置換修正する。文字置換処理部14では、あ
らかじめ文字認識処理部12で誤認識する確率の高い文
字を図3に示す文字置換テーブルに登録しておき、この
テーブルを参照し検索を行い、文字認識処理部12から
出力された候補文字列を置換する。
【0014】また、文字置換処理部14では、符号2B
で示す候補文字が文字置換処理部に入力され、文字変換
テーブルを参照し文字列の検索を行う。さらに、文字変
換テーブルを参照し、文字列の検索を行い、文字置換テ
ーブルに該当する文字列「CNI」、「SNI」を得
る。文字置換処理部14は、文字置換最終結果を参照し
「CNI→CHI」に「SNI→SHI」と文字置換を
行う。文字列置換部は処理結果として符号2Dで示す内
容を出力する。
【0015】さらに、文字置換処理部14で出力した文
字列をローマ字規則置換部16で処理する。ローマ字規
則置換部16は、文字置換処理部14で出力される符号
2Dで示す文字列を図4に示すローマ字規則変換テーブ
ルの規則に従い文字置換処理部で修正された文字列に置
換る。例えば、ローマ字規則置換部の入力が符号2Dで
示す内容である場合、図4のテーブルを参照し検索を行
い図4のテーブルに該当する「NIHOM」を得る。
【0016】ローマ字規則置換テーブルの文字置換条件
「単語の語尾がAIUEON以外の場合」の項目では、
「NIHOM」の「M」がローマ字規則置換部の文字置
換対象となり、ここでは、「M→N」に変換する。この
ように、文字置換処理部14とローマ字規則置換処理部
16を使用し変換出力された文字列をOCR装置の認識
結果として出力する。このように文字置換処理部14と
ローマ字規則置換処理部で二重の訂正処理を行なうと、
子音の処理と母音の処理とを行なうため、より認識精度
が高まる。
【0017】上述したように本実施形態によると、OC
R読取装置から出力された文字認識結果に対して、文字
置換処理とローマ字規則置換処理を追加する事により、
ローマ字住所認識の読み取り精度を向上させることがで
きる。
【0018】
【発明の効果】本発明は以上のように構成され機能する
ので、これによると、文字置換処理部が¥、文字変換テ
ーブルを参照して認識結果の文字列を変換し、この文字
変換テーブルには、誤認識の確率の高い文字について誤
認識の結果と正しい文字との組み合わせが記録されてい
るため、例えば、誤認識の確率の高い文字を検索し、検
索された場合には当該テーブルに従って変換すると、記
載の手法によっては区別しづらいローマ字について誤認
識しても、これを訂正することができ、これにより、手
書きされたローマ字の認識率を従来例と比較して向上さ
せることができる従来にない優れたローマ字住所認識装
置を提供することができる。また、ローマ字規則置換処
理部は、ローマ字規則置換テーブルを参照して認識結果
の文字列情報を変換し、このローマ字規則置換テーブル
には、日本語のローマ字表記の規則に従って不完全な表
記となる文字と当該不完全な文字の置換候補とが記録さ
れているため、認識結果のローマ字の文字列が日本語に
よるローマ字表記として不完全な場合には、これを置換
候補に置換ることができ、これによっても、手書きされ
たローマ字の認識率を従来例と比較して向上させること
ができる。
【図面の簡単な説明】
【図1】本発明による一実施形態の構成を示すブロック
図である。
【図2】図1に示す構成での動作例を示す説明図であ
る。
【図3】図2に示す処理での文字変換テーブルの一例を
示す説明図である。
【図4】図2に示す処理でのローマ字テーブルの一例を
示す説明図である。
【符号の説明】
10 認識処理手段 12 文字認識処理部 14 文字置換処理部 16 ローマ字規則置換処理部

Claims (7)

    (57)【特許請求の範囲】
  1. 【請求項1】 ローマ字で記載された住所の文字列を読
    み取る読み取り部と、この読み取り部によって読み取ら
    れた文字列の画像データの文字列を認識する認識処理手
    段とを備えたローマ字住所認識装置において、 前記認識処理手段が、誤認識の確率の高い文字について
    誤認識の結果と正しい文字との組み合わせを記録した文
    字変換テーブルと、この文字変換テーブルを参照して認
    識結果の文字列情報を変換する文字置換処理部とを備え
    たことを特徴とするローマ字住所認識装置。
  2. 【請求項2】 前記文字変換テーブルが、ローマ字の3
    文字を単位として前記誤認識の結果と正しい文字との組
    み合わせを有することを特徴とする請求項1記載のロー
    マ字住所認識装置。
  3. 【請求項3】 前記認識処理手段が、前記誤認識の結果
    と正しい文字との組み合わせが入力されるテーブル入力
    部と、このテーブル入力部に入力された誤認識の結果と
    正しい文字との組み合わせを前記文字変換テーブルに登
    録するテーブル登録部とを備えたことを特徴とする請求
    項1又は2記載のローマ字住所認識装置。
  4. 【請求項4】 ローマ字で記載された住所の文字列を読
    み取る読み取り部と、この読み取り部によって読み取ら
    れた文字列の画像データの文字列を認識する認識処理手
    段とを備えたローマ字住所認識装置において、 前記認識処理手段が、日本語のローマ字表記の規則に従
    って不完全な表記となる文字と当該不完全な文字の置換
    候補とを記録したローマ字規則置換テーブルと、このロ
    ーマ字規則置換テーブルを参照して認識結果の文字列情
    報を変換するローマ字規則置換処理部とを備えたことを
    特徴とするローマ字住所認識装置。
  5. 【請求項5】 前記ローマ字規則置換テーブルが、前記
    文字列の語尾が子音となる文字列の置換候補を有するこ
    とを特徴とする請求項4記載のローマ字住所認識装置。
  6. 【請求項6】 前記ローマ字規則置換テーブルが、前記
    文字列中に子音が連続した文字列の置換候補を有するこ
    とを特徴とする請求項4記載のローマ字住所認識装置。
  7. 【請求項7】 前記認識処理手段が、前記日本語のロー
    マ字表記の規則に従って不完全な表記となる文字と当該
    不完全な文字の置換候補とが入力されるテーブル入力部
    と、このテーブル入力部に入力された日本語のローマ字
    表記の規則に従って不完全な表記となる文字と当該不完
    全な文字の置換候補とを前記文字変換テーブルに登録す
    るテーブル登録部とを備えたことを特徴とする請求項
    4,5又は6記載のローマ字住所認識装置。
JP9174747A 1997-06-30 1997-06-30 ローマ字住所認識装置 Expired - Fee Related JP2939945B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9174747A JP2939945B2 (ja) 1997-06-30 1997-06-30 ローマ字住所認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9174747A JP2939945B2 (ja) 1997-06-30 1997-06-30 ローマ字住所認識装置

Publications (2)

Publication Number Publication Date
JPH1125229A JPH1125229A (ja) 1999-01-29
JP2939945B2 true JP2939945B2 (ja) 1999-08-25

Family

ID=15983983

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9174747A Expired - Fee Related JP2939945B2 (ja) 1997-06-30 1997-06-30 ローマ字住所認識装置

Country Status (1)

Country Link
JP (1) JP2939945B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111052221B (zh) * 2017-09-07 2023-06-23 雅马哈株式会社 和弦信息提取装置、和弦信息提取方法及存储器

Also Published As

Publication number Publication date
JPH1125229A (ja) 1999-01-29

Similar Documents

Publication Publication Date Title
EP0844583A2 (en) Method and apparatus for character recognition
US5161245A (en) Pattern recognition system having inter-pattern spacing correction
US20120109633A1 (en) Method and system for diacritizing arabic language text
Uthayamoorthy et al. Ddspell-a data driven spell checker and suggestion generator for the tamil language
JPH08263478A (ja) 中国語簡繁体字文書変換装置
JP3975825B2 (ja) 文字認識誤り訂正方法、装置及びプログラム
JP2939945B2 (ja) ローマ字住所認識装置
Nguyen et al. An in-depth analysis of OCR errors for unconstrained Vietnamese handwriting
JP3274014B2 (ja) 文字認識装置および文字認識方法
Rani et al. Post-processing methodology for word level Telugu character recognition systems using Unicode Approximation Models
JPS592191A (ja) 手書き日本語文の認識処理方式
JPH0634253B2 (ja) 誤読文字訂正処理装置
JP3455643B2 (ja) 文字認識装置における学習辞書の更新方法及び文字認識装置
JPH0528324A (ja) 英文字認識装置
JPH07110844A (ja) 日本語文書処理装置
JPH09185674A (ja) 誤認識文字検出装置、誤認識文字訂正装置、誤認識文字検出方法、および、誤認識文字訂正方法
JP2827066B2 (ja) 数字列混在文書の文字認識の後処理方法
CN115310458A (zh) 一种人名翻译方法、***、设备及计算机可读存储介质
JP3387421B2 (ja) 単語入力支援装置及び単語入力支援方法
JPH0362260A (ja) 片仮名単語誤り検出訂正装置
JPH1078953A (ja) 住所表記変換方法および住所表記チェック方法
JPH04123185A (ja) 文書認識方式
JPS62117060A (ja) 文字・音声入力変換方式
JPH0262659A (ja) 日本文訂正候補文字抽出装置
JPH0614375B2 (ja) 文字入力装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990519

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080618

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090618

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100618

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100618

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110618

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110618

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120618

Year of fee payment: 13

LAPS Cancellation because of no payment of annual fees