JPH02126367A - 文字認識機能付き電子辞書装置 - Google Patents

文字認識機能付き電子辞書装置

Info

Publication number
JPH02126367A
JPH02126367A JP63280727A JP28072788A JPH02126367A JP H02126367 A JPH02126367 A JP H02126367A JP 63280727 A JP63280727 A JP 63280727A JP 28072788 A JP28072788 A JP 28072788A JP H02126367 A JPH02126367 A JP H02126367A
Authority
JP
Japan
Prior art keywords
character
recognition
information
word
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63280727A
Other languages
English (en)
Inventor
Hiroshi Okamoto
博 岡本
Ryuichi Hamada
竜一 浜田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Home Electronics Ltd
NEC Corp
Original Assignee
NEC Home Electronics Ltd
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Home Electronics Ltd, Nippon Electric Co Ltd filed Critical NEC Home Electronics Ltd
Priority to JP63280727A priority Critical patent/JPH02126367A/ja
Publication of JPH02126367A publication Critical patent/JPH02126367A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Character Discrimination (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野コ 本発明は、文字認識機能を有する電子辞書装置に関する
[従来の技術] 一般の電子辞書装置はキーボードより文字のコードを入
力するものがほとんどであるが、最近は印刷文字や手書
き文字の字体を認識して入力するようなものも普及しつ
つある。
このような文字認識機能を有する従来の電子装置は、文
字認識部と電子辞書部とで構成される。
文字認識部は、例えばイメージ争スキャナより文字列を
表す文字情報を入力すると、先ず単語を切り出し、次に
その単語を構成する文字の各々を順次切り出し、各文字
を認識する。この文字認識は次のようにして行っている
。文字認識部は、可能な全ての文字(例えばアルファベ
ットであればA〜7.、  a−z)の標準体を表す情
報を格納する認識辞書を備え、切り出した文字を認識辞
書内の全文字と逐次比較して、一致ないし近似するもの
を決定する。文字認識部は、単語の全文字を決定すると
、その単語を表す情報または文字コードを電子辞書部に
与える。電子辞書部はその単語に対応する対訳の情報を
出力し、その対訳情報は表示部に送られ、画面上に対訳
が表示される。
[発明が解決しようとする課題] 上述のように、従来の文字認識機能付き電子辞書装置で
は、文字認識部と電子辞書部とが実質的に互いに独立し
、文字認識部は文字認識の最初から最後までを完全に独
力で行い、電子辞書部は文字認識部の認識処理が終了し
たのち対訳を出力するだけであった。
しかしながら、文字認識部による文字認識は、各文字に
ついて認識辞書の中の全部の文字と比較照合してその中
から一致ないし近似するものを決定する処理なので、認
識速度が遅(、また文字のパターンでしか判断しないた
め認識率もそれほど高くはなかった。
本発明は、かかる従来の問題点に鑑みてなされたもので
、文字認識の各段階で電子辞書を利用することにより認
識速度および認識率の向上を図る文字認識機能付き電子
辞書装置を提供することを目的とする。
[課題を解決するための手段] 上記の目的を達成するため、本発明の文字認識機能付き
電子辞書装置は、文字認識を必要とする文字情報を入力
する文字情報入力手段と;文字情報に対して単語および
文字の切り出しと文字認識を行い、文字認識の所定の段
階で当該単語に関する認識情報を生成し、その認識情報
に対応する単語候補情報に基づいて文字を決定する文字
認識手段と;文字認識手段からの認識情報に応答して電
子辞書の中の該当する単語を検索し、それらの単語に関
する単語候補情報を文字認識手段に与える単語候補検索
手段と:文字情報入力手段と文字認識手段と単語候補検
索手段との間の情報の受け渡しを制御する制御手段とを
具備する構成とした。
[作用] 文字情報入力手段から文字認識手段へ文字情匈が与えら
れると、先ず単語の切り出しが行われ、次にその単語を
構成する各文字の切り出しが行われる。そして、各文字
に相当する文字情報に対して順次文字認識が行われる。
文字認識手段は、最初は通常通り認識辞書等をサーチし
てパターンの一致ないし近似する文字を見付ける仕方で
文字を決定するが、所定の段階、例えば当該単語の第n
番目の文字以降について、あるいは不確定な文字があっ
たときに、その段階での当該単語に関する認識情報を生
成し、電子辞書の検索を要求する。認識情報には、例え
ばそれまでに決定された文字の情報や当該単語の文字数
の情報等が含まれる。
単語候補検索手段は、その認識情報を手掛かりに電子辞
書の中の該当する単語を検索し、それらの単語に関する
単語候補情報を生成する。単語候補情報には、例えば該
当する文字そのものを示す情報、あるいは該当する文字
の中の問題となっている文字を示す情報等が含まれる。
文字認識手段は、単語候補情報を受け取ると、その情報
を手掛かりに認識辞書の一部の文字だけをサーチして文
字を決定したり、場合によってはサーチを行うことなく
単語候補情報から直接文字を決定する。なお、単語候補
検索において該当する単語が検索されなかった場合は、
その語の処理を続けても無意味なので、その段階で文字
認識処理を中止してよい。
[実施例コ 第1図は、本発明の一実施例による文字認識機能付き電
子辞書装置のシステム構成を示す。
イメージ優スキャナ10は、原稿または帳票上を1ライ
ンずつ走査して文字列を光学的に読み取り、その結果得
られたアナログの画像信号をデジタルの画像信号に変換
して出力する。このデジタル画像信号は、いったん制御
部12に取り込まれてから、文字認識部18へ送られる
文字認識部18は、制御部12より受け取ったデジタル
画像信号(文字情報)を基に単語毎に順次切り出し、そ
の切り出した単語をさらに文字毎に順次切り出し、その
切り出した各文字に対して文字認識を行う。単語認識部
18Aは、認識辞書20をサーチして切出文字と一致な
いし近似する文字を捜し出す仕方で文字認識を行う。し
かし、このような単語認識部18Aの機能だけでは文字
認識に手間どる場合がある。例えば、当該単語の文字数
が多い場合、あるいははっきりしない文字がある場合で
ある。そのような場合、文字認識部18は単語認識部1
8Aの認識処理をいったん打ち切り、当該単語に関する
それまでの認識結果を示す情報(認識情報)を出力する
。そうすると、後述するように制御部12を介して辞書
検索部22より該当する1つまたは複数の単語に関する
認識情報が単語情報評価部18Bへ送られて(る。
単語認識部18Aは、その認識情報で示される文字につ
いてのみ認識辞書20をサーチして文字を決定する。文
字認識部工8は、1つの単語について文字認識を終了す
ると、その単語を表す文字コードを出力する。この文字
コードはいったん制御部12に取り込まれてから文字コ
ード記憶部26に格納される。
辞書検索部22は、単語候補検索部22Aと対訳検索部
22Bとからなる。単語候補検索部22Aは、上記のよ
うに制御部12を介して文字認識部18より認識情報を
受け取ると、電子辞書24をアクセスして該当する1つ
または複数の単語を検索し、それらの単語に関する単語
候補情報を出力する。その単語候補情報は制御部12を
介して文字認識W)18へ与えられる。対訳検索部22
Bは、文字コード記憶部26より制御部12を介して文
字コードを受け取ると、電子辞書24をアクセスしてそ
の文字コードに対応する対訳情報を読み出す。辞書検索
部22より出力された対訳情報はいったん制御部12に
取り込まれてから文字コードと一緒にデイスプレィ14
のテキストメモリに送られ、デイスプレィ14の画面上
に文字と対訳が表示される。
制御部12は、上述のようにシステム各部間の情報の受
け渡しに介在して情報転送の制御を行うとともに、文字
コード記憶部の続出/書込を制御したりデイスプレィ1
4の表示を制御する。キーボード16は、文字コードや
制御コードをシステムに直接入力するために使用される
。なお、本実施例のシステムにおいて、制御部129文
字認識部18および辞書検索部22は1つまたは複数の
マイクロコンピュータで構成される。
次に、第2図のフローチャートにつき本実施例の全体の
動作を説明する。
イメージ・スキャナ10より出力されたデジタル画像信
号(文字情報)は制御部12にいったん入力され(■)
、それから文字認識部18に送られる。−例として、r
nce  pipelineproJという帳票上の文
字列の一部を表す文字情報が入力されたとする。
文字認識部18は、この文字情報に対して文字の切り出
しを行う(■)。つまり、単語rpipeJineJを
切り出してから、先ず先頭の文字「p」を切り出す。こ
の実施例では、先頭の3文字までは認識辞書20だけで
文字認識を行い、当該単語の文字数が4つ以上のときは
電子辞書24を利用して文字認識を行うようにする。
したがって、rpJ、rib、rp」の3文字について
は単語候補検索を行うことなく、認識辞書20の全文字
をサーチして上記3文字の各々と一致ないし近似する文
字を見付ける方法で文字認識が行われる(■、■、■)
。そして、4番目のreJ以降については認識情報を出
力して単語候補検索を利用する(■)。認識情報には、
例えば当該単語の文字数および既に確定した先頭の3文
字rp i I)J等が含まれる。
辞書検索部22は、認識情報を受け取ると、電子辞書2
4をサーチして該当する単語を検索し、その単語に関す
る単語候補情報を出力する。この例の場合、先頭にrp
ip」を育しかつ8文字がらなる単語はrpipeli
neJとrpiperack]だけである。これらの単
語の4番目の文字はどちらも「e」なので、単語候補情
報にはreJを示す情報が含まれる(O)。
文字認識部18は、単語候補情報を受け取ると認識辞書
20の文字reJだけをサーチしてそれと文字情報のr
eJとを比較照合し、4番目の文字はreJであると決
定する(■)。次に、5番目の文字rlJについても同
様に単語候補検索を利用してrlJを決定する(■〜■
)。さらに、残りのriJr  rnJ、’eJについ
ても単語候補検索を利用して各々の文字を決定する。
この例の場合、いずれの単語候補情報も1つの文字しか
含まなかったが、複数の文字(例えば「eJ、rkJ!
  rsJ)を含む場合もある。その場合は、文字認識
部18においてそれらの文字についてのみ認識辞書20
をサーチして文字認識および決定を行う。
上述のようにして最後尾の文字(e)が決定すると、当
該単語rpipelineJが確定するので、文字認識
部18はこの単語の文字コードを出力する([相])。
この文字コードは制御部18および文字フード記憶部2
6を経由して辞書検索部22へ送られ、対訳検索w12
2Bはその文字コードに対応する対訳情報を電子辞書2
4から読み出す(■)。その読み出された対訳情報は文
字コードと一緒にデイスプレィ14に送られ、画面上に
単語rp ipe 11neJと対訳「パイプライン」
が−緒に表示される(@)。
以上のように、単語の文字数が4個以上のときは、4番
目以降の文字については各段階で電子辞書を検索し、単
語候補情報を基に認識辞書の中の一部の文字だけをサー
チして文字の決定を行うので、単語の全文字について認
識辞書の中の全部の文字と照合する従来方式の文字認識
と比較して、認識速度および認識率が大幅に向上する。
なお、単語候補検索において該当する候補がまったくな
い場合は、それ以降の文字認識処理および対訳検索処理
等を行っても無意味なので、その段階で早期に文字認識
を中止してよく、それによって認識効率を一層向上させ
ることができる。
第3図は、変形例のフローチャートである。この変形例
では、全部の文字情報に対して認識辞書20を利用して
文字認識を行ってから(■)、各文字について単語候補
検索を行うかどうかを決める。すなわち、そのような文
字認識で確定した文字については単語候補検索を行わず
に直ちに文字の決定を行い(■)、不確定な文字につい
ては単語候補検索を実行して決定を行う(■、■、■。
■)。例えば、上記の例のrpipelineJの第4
番目の文字が「e」なのがrcJなのがはっきりしない
ときは、文字認識部18より認識情報が出力され、それ
に応えて辞書検索部22より単語候補情報が返される。
その結果、「e」であることが確定するので、その文字
についての決定を行う。ほかにも、rUJとrVJ+ 
 rrnJと「m」等は相紛られしく、認識辞書2oに
よる文字認識では確定できないことがあるが、その場合
でもm語候補検索を利用することでどちらなのがかはっ
きりする。
なお、上述した実施例および変形例では、最後尾の文字
まで決定したのち当該単語を決定した。
しかし、単語候補情報から1つの単語に絞られる場合は
、その単語であると推定し、そこで文字認識を終了して
もよい。また、単語候補情報は、該当する単語の各々に
ついて全文字を表わすような情報であってもよい。
[発明の効果] 本発明は、上述したような構成を仔することにより、次
のような効果を奏する。
文字認識の所定の段階で逐次認識情報を生成してその情
報を手掛かりに電子辞書の中の該当する単語を検索し、
その結果得られた単語候補情報を手掛かりに効率よく文
字の決定を行うようにしたので、認識速度および認識率
を向上させることが可能である。
【図面の簡単な説明】
第1図は、本発明の一実施例による文字認識機能付き電
子辞書装置のシステム構成を示すプロ。 り図、 第2図は、実施例の全体動作を説明するためのブロック
図、および 第3図は、変形例の全体動作を説明するためのブロック
図である。 10・・・・イメージ・スキャナ、 12・・・・制御部、 18・・・・文字認識部、 20・・・・認識辞書、 22・・・・辞書検索部、 24・・・・電子辞書。

Claims (1)

  1. 【特許請求の範囲】 文字認識を必要とする文字情報を入力する文字情報入力
    手段と、 文字情報に対して単語および文字の切り出しと文字認識
    を行い、文字認識の所定の段階で当該単語に関する認識
    情報を生成し、その認識情報に対応した単語候補情報に
    基づいて文字情報に対応する文字を決定する文字認識手
    段と、 前記文字認識手段からの認識情報に応答して電子辞書の
    中の該当する単語を検索し、それらの単語に関する単語
    候補情報を前記文字認識手段に与える単語候補検索手段
    と、 前記文字情報入力手段と前記文字認識手段と前記単語候
    補検索手段との間の情報の受け渡しを制御する制御手段
    と、 を具備することを特徴とする文字認識機能付き電子辞書
    装置。
JP63280727A 1988-11-07 1988-11-07 文字認識機能付き電子辞書装置 Pending JPH02126367A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63280727A JPH02126367A (ja) 1988-11-07 1988-11-07 文字認識機能付き電子辞書装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63280727A JPH02126367A (ja) 1988-11-07 1988-11-07 文字認識機能付き電子辞書装置

Publications (1)

Publication Number Publication Date
JPH02126367A true JPH02126367A (ja) 1990-05-15

Family

ID=17629102

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63280727A Pending JPH02126367A (ja) 1988-11-07 1988-11-07 文字認識機能付き電子辞書装置

Country Status (1)

Country Link
JP (1) JPH02126367A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5144435A (ja) * 1974-09-25 1976-04-16 Nippon Electric Co

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5144435A (ja) * 1974-09-25 1976-04-16 Nippon Electric Co

Similar Documents

Publication Publication Date Title
CN86105459A (zh) 输入处理***
JPH02126367A (ja) 文字認識機能付き電子辞書装置
JPH09198404A (ja) 文書処理方法及び装置
JPS58123129A (ja) 仮名漢字変換装置
JPH08147289A (ja) かな漢字変換システム及びかな漢字変換方法
JPS59229683A (ja) 認識処理装置
JPH0475552B2 (ja)
JPH06274701A (ja) 単語照合装置
JPH0492973A (ja) イメージ情報登録検索装置
JPH1021233A (ja) 情報処理装置
JPS62117060A (ja) 文字・音声入力変換方式
JPH0731676B2 (ja) 文書作成装置
JPH1011433A (ja) 仮名漢字変換方式における同音異義語選択方法及びその装置
JPH02249087A (ja) 英単語検索装置
JPH06332949A (ja) 電子ファイリング装置
JPS63298517A (ja) 文字入力制御方式
JPS63138479A (ja) 文字認識装置
JPH06139277A (ja) 電子辞書装置
JPH09179858A (ja) 文書作成装置および表示方法
JPH08305697A (ja) 文書作成装置および文書作成方法
JPH07182317A (ja) 文書処理装置
JPS62190571A (ja) 文字選択方式
JP2003178263A (ja) 文字認識装置及び記録媒体
JPH07210550A (ja) かな漢字変換装置およびその方法
JPH06195372A (ja) 形態素解析装置