JPS5896376A - 日本語入力装置 - Google Patents

日本語入力装置

Info

Publication number
JPS5896376A
JPS5896376A JP56193976A JP19397681A JPS5896376A JP S5896376 A JPS5896376 A JP S5896376A JP 56193976 A JP56193976 A JP 56193976A JP 19397681 A JP19397681 A JP 19397681A JP S5896376 A JPS5896376 A JP S5896376A
Authority
JP
Japan
Prior art keywords
kanji
kana
characters
ocr
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP56193976A
Other languages
English (en)
Inventor
Masakazu Honda
本田 正教
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, Nippon Electric Co Ltd filed Critical NEC Corp
Priority to JP56193976A priority Critical patent/JPS5896376A/ja
Publication of JPS5896376A publication Critical patent/JPS5896376A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は日本語入力装置に関する。
コンピュータに通常の日本語で入力するのは容易でない
ので多くの場合日本語は入力、出力共カタカナが用いら
れている。カタカナは通常のキーボードやカナOCRで
入力できる。またデータプロセッサの業務においてはカ
タカナをデータとして扱うことがむしろ便利な曲もあっ
た。しかし近年オフィスオートメーションの必要性が増
大してくると、コンピュータはデータプロセッサとして
の役割に加えてワードプロセッサとして利用されること
が多くなって来た。
この場合に日本語は全てカタカナということば極めて不
自然であり、漢字を含んだ日本語で入力したいという強
い要請がある。
最も単純な漢字入力方−法は和文タイプと同様にタブレ
ット上の漢字を1個1個指示して入力する方法で、タブ
レット式またはべ/タッチ式として普及している。
また専門家用としては漢字をコード化する方法が開発さ
れている。すなわち漢字テレタイプ式、連想式、三角編
号式等がそれでおる。
さらに日本語ワードプロセッサ用として実現しているも
のにカナ漢字変換式がめる。この方式はカナをタイプラ
イタで入力すると、コンピュータが自動的にカナ漢字の
変換を行なうように構成したものである。このカナ漢字
変換式の装置は誰でもすぐに使えるという利点がある。
しかし、カナ文字をキーボードで入力することはある程
反練習しないとかなシの時間がかがる作業である。また
カナ漢字変換するためには漢字の部分を元々のカナの部
分と識別してコンピュータに指示するためにキーボード
操作が必要であり、相当わずられしい作業である。
さらにカナ漢字変換は同音意義の言葉が多くろるためい
ろいろの工夫をしても100%の精度はめシ得ず、いく
つかの候補がらの選択等の作業も必妥となる。
前述の問題点を解決する手段として漢字OCRが考えら
れる。すなわち、平葺きした、または印刷された通常の
日本文をOCRでそのま1読取る方法である。しめ>1
.ocaの技術は未だ平葺漢字を自由に読めるレベルに
はない。
また平葺漢字を自由に読めるようになるOCRが早急に
開発されるという見通しもない。
本発明の目的は前述した漢字入力に関する問題を解決す
るために生簀カナ文字と漢字に駁候すべき部分を示す簡
単な記号とを用いて容易に日本語の入力を可能にする日
本語人力装置を提供することにある。
前記目的を達成するために、本発明による日本語入力装
置は、カナ文字および漢字に変換すべ@部分を符号で記
入した帳票からそれ等の文字および符号を読みとるOC
R部と、前記OCR部出力出力字とすべ@部分音漢字に
変懐するカナ漢字変換部と、前記変換にニジえられたす
くなくとも第1 jlj1位の漢字を含むカナ1じり文
を表示するディスプレイ部と、前記ディスプレイ部に表
示された漢字部分を指定して他の順位の漢字に変換する
信号を前記漢字変換部に入力する修正用キーボードとか
ら構成されている。
前記構成によれば本発明の目的に完全に達成できる。
以下図面等を参照して本発明をさらに詳しく説明する。
第1図は本発明による日本語入力装置の実施例を示すブ
ロック図でおる。第2図はこの発明で用いる帳票の記入
例を示す図である。
通常のOCRと同様にカナ文字i6らかしめ印刷された
枠内に1個づつ記入する。そして漢字に変@を要する部
分は、漢字識別符号で前後を囲う。
ここでは、長い縦線”1”を符号として用いている。ま
た改行符号としてI″を用いる。
帳票1は第2図の光電変換部2で走査され、文字認識部
3で読みとられる。この光電変換部2と文字認識部がO
CR部を形成している。読取り結果はカナ漢字変換部5
および符号制a部4へ送られ漢字識別符号に挾1れたカ
ナ文字は漢字に変換され、それ以外は変換されない。結
果はディスプレイ6に表示され、候補選択または編集等
を、修正用キーボード部7で行った後結果をフロッピィ
ディスク8へ格納する。
修正前の結果と最終結果を第3図、第4因に示す。第3
図の漢字の次の数字にカナ漢字変換の優先順位を示す番
号であり、修正に正しい漢字に列配する番号をキーボー
ド7から入力する。
ここでは、1力/ジヨウ”をoct−trよ第l順位で
1カンビヨウ”と第2順位で1カンジヨウ”と読んだ例
を示しておる。
したがって対応する漢字の場所には2榎の結果が同時に
表示されるが、いずれにしても修正作業を要することな
ので、多少のOCRのdみ誤りニ入力作業を阻害するこ
とにならない。
以上述べたように本発明によれは、日本語はカナ文字で
記入され、漢字に相当するカナ文字には識別符号が与え
られる。
カナ文字は通常のOCR技術で読みとられ、識別符号の
あるカナ文字はカナ漢字変換部5で漢字に変換される。
漢字が1対1に特定できない時はいくつかの候補が優先
順位にしたがってディスプレイ6に表示される。オペレ
ータにディスプレイ6上の正しい漢字を選択して修正用
キーボード7で指示する。
正しい結果は行または頁単位でディスプレイ6上に表示
される。
OCRは周知の通り、対象文字を100%の精度でトむ
ことはできない。したがって修正手段がOCRには必ず
必要である。一方カナ漢字変換も100%の精度ででき
ないことは周知である。
したがってここKも従来の修正手段が必ず用意されてい
る。
またOCRの読取精度を上げる方法として、単語認識を
組合わせる手段が存在する。これに有り得ない文字の組
合わせと有り得る文字の組合わせを確率的に処理して最
終結果を得ようとすSものである。
仮に“トウキヨウ”という文字の組合わせが確率的に非
常に多いことが判っているならば、OCRは”トウホヨ
ウ”と読んだりまた9トウ?ヨウ”(?は不読)と読ん
でも結果ハ゛トウキヨウ”として出力する。このように
OCRとカナ漢字変換を組合わせるならば、単語認識の
手法を非常に有効に利用することができる。
すなわち、カナ漢字変換は文字の全ての組合わせについ
ては行なうはずがないから、OCRの読みとり結果の中
で漢字に変換すべき部分を指定するならば、結果は通常
数種類に限定される。
これはすなわち、意味のある単語の数は文字の全ての組
合わせに比して極めて少ない〃・うである。したがって
仮にOCRが全ての文字を正しく読みとれなくても、結
果を数種類の映ヤ10単語に特定することが容易にでき
る、。
例えばOCRが1トウキヨウ“を1トウホヨウ”と間違
えて読んでも、゛トウホヨウ”という文字の組合わせに
相当する漢字は無いから、゛東京″を候補とすることに
容易である。さらに0CRfl一般的に辞舊の構造上、
文字を確率的に識別しているから、”キ”の文字を第1
番の錐からしさで1ホ”と誤って読んでも、第2番の確
からしさでは”キ”と正しく読んでいる場合が多いこと
が知られている。したがってOCRの読みとり結果とし
て1トウホヨウ”と”トウキヨウ”の2つを候補とする
ことができ、この結果とカナ漢字変換を組合わせるなら
ば最終結果”東京”の信頼性に一段と高くなる。
現実の作業性から見ても、通常のOCRでは修正作業が
必要でめり、カナ漢字変換でも候補選択作業が必ずある
。したがってこの発明による候補選択作業は通常行なわ
れるものと変シはない。またカナ文字入力作業について
に、帳票にカナ文字全記入する作業は、キーボード7で
カナ文字を入力する作業に比して非常に容易なものであ
ることは明白である。
このようにして、本発明によれは、0CItの能力をカ
ナ漢字変換部でバックアップした、極めて容易に日本梧
入力が可能となる日本語入力装置が芙現できる。
【図面の簡単な説明】
第1図は本発明による日本語入力装置の実施例を示1ブ
ロック図、第2図Vi帳票の記入例を示すブロック図、
第3図は修正前のディスプレイ内容を示す図、44図は
修正済のディスプレイ内容を示す図である。 1・・・帳票  2・・・光電反換部 3・・・文字認識郡  4・・・符号制御部5・・・カ
ナ漢字変換部  6・・・ディスプレイ7・・・キーボ
ード  8・・・フロッピィディスク代理人 弁理士 
井 ノ ロ  護

Claims (1)

    【特許請求の範囲】
  1. カナ文字および漢字に変換すべき部分を符号で記入した
    帳票からそれ等の文字および符号を読みとる0(、R部
    と、前記OCR部出力出力字とすべき部分を漢字に変換
    するカナ漢字変換部と、前記変換によ)見られたすくな
    くとも第1順位の漢字を含むカナ1じシ文を表示するデ
    ィスプレイ部と、前記ディスプレイ部に表示された漢字
    部分を指定して他の順位の漢字に変換する信号をmJ記
    漢字変換部に入力する修正用キーボードとから構成した
    日本語入力装置。
JP56193976A 1981-12-01 1981-12-01 日本語入力装置 Pending JPS5896376A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56193976A JPS5896376A (ja) 1981-12-01 1981-12-01 日本語入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56193976A JPS5896376A (ja) 1981-12-01 1981-12-01 日本語入力装置

Publications (1)

Publication Number Publication Date
JPS5896376A true JPS5896376A (ja) 1983-06-08

Family

ID=16316900

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56193976A Pending JPS5896376A (ja) 1981-12-01 1981-12-01 日本語入力装置

Country Status (1)

Country Link
JP (1) JPS5896376A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6266363U (ja) * 1985-10-14 1987-04-24

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS537131A (en) * 1976-07-09 1978-01-23 Toshiba Corp Japanese sentence input unit
JPS5617469A (en) * 1979-07-24 1981-02-19 Fujitsu Ltd Character recognition system
JPS5644968A (en) * 1979-09-20 1981-04-24 Toshiba Corp Kana (japanese syllabary)-kanji (chinese character) conversion system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS537131A (en) * 1976-07-09 1978-01-23 Toshiba Corp Japanese sentence input unit
JPS5617469A (en) * 1979-07-24 1981-02-19 Fujitsu Ltd Character recognition system
JPS5644968A (en) * 1979-09-20 1981-04-24 Toshiba Corp Kana (japanese syllabary)-kanji (chinese character) conversion system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6266363U (ja) * 1985-10-14 1987-04-24

Similar Documents

Publication Publication Date Title
US7293229B2 (en) Ensuring proper rendering order of bidirectionally rendered text
US7257528B1 (en) Method and apparatus for Chinese character text input
JPH08314910A (ja) 異種コード文字列転記装置および電子辞書
US7359850B2 (en) Spelling and encoding method for ideographic symbols
JP2740335B2 (ja) 自動セル属性判定機能を有する表読取装置
JP2019057137A (ja) 情報処理装置及び情報処理プログラム
JPS5896376A (ja) 日本語入力装置
JPH09153034A (ja) 文書作成装置及び文書作成方法
JPH08115330A (ja) 類似文書検索方法および装置
JPH10320399A (ja) 言語識別装置,言語識別方法および言語識別のプログラムを記録した記録媒体
JP2570784B2 (ja) 文書リーダ後処理装置
JPH0365588B2 (ja)
JPS6211385B2 (ja)
JPH08297663A (ja) 入力ミス修正装置及び修正方法
JPS6120176A (ja) ロ−マ字−中国語変換装置
JP2002245470A (ja) 言語特定装置及び翻訳装置及び言語特定方法
JPS605318A (ja) 漢字仮名混り文入力装置
JPS60178575A (ja) 日本語処理装置
Murshed et al. Linguistically Sorting Bengali Texts: A Case Study of Multilingual Applications
JPH0682366B2 (ja) 文字列訂正方式
JPS60207948A (ja) カナ漢字変換処理装置
JP2000067037A (ja) 文書処理方法および装置
JPH03160580A (ja) 文字認識システムにおける文字修正方法
JPH0736884A (ja) 文字認識入力装置
JPH01152565A (ja) 利用者固有情報の処理方式