JPS5952338A - Kana (japanese syllabary)-kanji (chinese character) converter - Google Patents

Kana (japanese syllabary)-kanji (chinese character) converter

Info

Publication number
JPS5952338A
JPS5952338A JP57162187A JP16218782A JPS5952338A JP S5952338 A JPS5952338 A JP S5952338A JP 57162187 A JP57162187 A JP 57162187A JP 16218782 A JP16218782 A JP 16218782A JP S5952338 A JPS5952338 A JP S5952338A
Authority
JP
Japan
Prior art keywords
kanji
word
kana
dictionary
rinji
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57162187A
Other languages
Japanese (ja)
Inventor
Kimito Takeda
武田 公人
Tsutomu Kawada
河田 勉
Noriko Yamanaka
紀子 山中
Hiromi Saito
裕美 斎藤
Kazuo Yanai
矢内 一生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Tokyo Shibaura Electric Co Ltd filed Critical Toshiba Corp
Priority to JP57162187A priority Critical patent/JPS5952338A/en
Publication of JPS5952338A publication Critical patent/JPS5952338A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PURPOSE:To realize an effective input of a word which is not included in a word dictionary for a KANA-KANJI converter using a word dictionary, by extracting the KANJI forming a word which is not included in the disctionary after giving the limiting symbols to the words included in the dictionary for the word which is contained in the dictionary. CONSTITUTION:If it is impossible to find out a word ''RINCHO'' in a word dictionary 5, an operator thinks of a word including ''RIN'' such as ''RINJI'' for instance. Then the operator feeds ''RINJI'' to a storage device 2 with addition of a limiting symbol ''.'' which functions to extract ''RIN'' of ''RINJI''. A KANA-KANJI converting part 3 detects the presence or absence of the limiting symbol. Then a collating circuit 4 detects KANJI characters ''RINJI'' corresponding to KANA letters ''RINJI'', and a KANJI letter ''RIN'' is delivered as a candidate of conversion since this word exists before the limiting symbol. This ''RIN'' is displayed at a display device. In the same way, a limiting symbol is added to ''CHOSEI'' to feed ''CHOSEI'' for ''CHO'' of the ''RINCHO''. Then ''CHO'' is delivered.

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は文書作成装置において、入力された仮名文字列
を漢字変換する仮名漢字変換装置に関する。
DETAILED DESCRIPTION OF THE INVENTION [Technical Field of the Invention] The present invention relates to a kana-kanji conversion device for converting input kana character strings into kanji in a document creation device.

〔発明の技術的背景〕[Technical background of the invention]

近時、日本語ワードプロセッサ等の文書作成装置が広く
普及してきた。この文章作成装置は、例えばカナ・キー
ボードにより入力された仮名文字列、或いは音声入力さ
れた音声を認識して表意文字化された仮名文字列を漢字
変換しながら日本語文章を作成していくものである。こ
のような仮名漢字変換は、仮名文字列に対応して漢字混
りの文字列、つまり漢子・熟語を記憶登録してなる単語
辞書と漢字辞書を入力仮名文字列に従って検索しこれに
より該当する漢字文字を求めることにより行われる。
Recently, document creation devices such as Japanese word processors have become widespread. This text creation device creates Japanese sentences by converting kana character strings input using a kana keyboard or voice input into ideograms by converting them into kanji characters. It is. This type of kana-kanji conversion involves searching word dictionaries and kanji dictionaries in which kanji and idioms are memorized and registered corresponding to the kana character string, and then searching the corresponding kanji for the input kana character string. This is done by asking for the characters.

〔背景技術の問題点〕[Problems with background technology]

ところが、単語辞書に全てのことばが、記憶されている
ことは、不可能である。とのため、単語辞書に記憶され
ていないことばは、未変換となってしまう。このため、
単語辞書にないことばは、漢字辞書を検索して、漢字単
位で変換をする。しかしながら、漢字辞書は、同音異字
語が非常に多数あることが常である。例えば、観しょう
〃の読みに対しては、200以上の候補が該当する。
However, it is impossible for a word dictionary to memorize all words. Therefore, words that are not stored in the word dictionary remain unconverted. For this reason,
For words that are not in the word dictionary, search the kanji dictionary and convert each kanji. However, kanji dictionaries usually have a large number of homonyms. For example, there are more than 200 candidates for the pronunciation of Kansho.

上、小弁、少2升、召、生、正、匠、声、床。Upper, small bento, 2 sho, cho, raw, sho, takumi, voice, floor.

抄、承、青、姓、昇、尚、松、性、招、政、星。Shou, Jo, Ao, Surname, Noboru, Nao, Matsu, Sex, Invitation, Masa, Star.

昭、肖、省相、沼、笑、症、宵、将、称、従。Showa, Xiao, Minister, Numa, Sho, Sho, Yoi, Sho, Sho, Ju.

唱、商、紹、訟、祥2章、消、粧、証、詔、掌。Chanting, Shang, Shao, Sui, Sho 2 chapter, Elimination, Shou, Sei, Edict, Palm.

象、晶1勝、硝、渉、清、焼、焦、装、詳、傷奨・照、
精、彰、賞、衝、償、礁・障、鐘。
Elephant, Akira 1 win, Glass, Wataru, Kiyoshi, Yaki, Burnt, So, Detail, Kisho/Sho,
Sei, Akira, Award, Opposition, Atonement, Reef/impairment, Bell.

双り月、庄、肱9条、昌1歳、炒・・・・・・・・・上
記の中から該当する漢子を選択することとなる。
Futoritsuki, Sho, Kuji9jo, Sho1sai, Chi......You will select the appropriate Hanzi from the above.

このため、単語辞書に記憶されていないことばを入力す
るとき極めて効率が悪かった。
For this reason, it was extremely inefficient when inputting words that were not stored in the word dictionary.

〔発明の目的〕[Purpose of the invention]

本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、単語辞書に記憶されていない単
語を簡易に且つ効率良く入力することのできる実用性の
高いかな漢字変換装置を提供することにある。
The present invention was made in consideration of these circumstances, and its purpose is to provide a highly practical kana-kanji conversion device that can easily and efficiently input words that are not stored in a word dictionary. It is about providing.

〔発明の概要〕[Summary of the invention]

本発明は、単語辞書を用いたかな漢字変換装置において
、単語辞書に記憶されていない単語は、上記単語辞書に
記憶されている汎用単語を構成する要素を組み合わせて
変換できるようにしたものである。
The present invention is a kana-kanji conversion device using a word dictionary, in which words not stored in the word dictionary can be converted by combining elements constituting general-purpose words stored in the word dictionary.

このため本発明では、オペレータがかな文字を入力する
に際し、そのかな文字に対応する単語のうち特定の要素
のみを選択的に出力させるだめの限定情報を合わせて入
力可能とし、辞書検索)二際してはこの限定情報を除い
て対応する単語を検索するとともに、この単語を出力す
るに際しては上記限定情報に従ってその単語を構成する
特定の要素のみを出力するように構成されている。
Therefore, in the present invention, when an operator inputs a kana character, it is also possible to input limited information to selectively output only a specific element of the word corresponding to the kana character. Then, this limited information is excluded to search for the corresponding word, and when outputting this word, only specific elements constituting the word are output according to the limited information.

〔発明の効果〕〔Effect of the invention〕

従って、本発明によれば、単語辞書に記憶されていない
ことばを、漢字辞書を検索することなく、簡易にして、
効率よく、かな漢字変換することが可能となり、オペレ
ータの操作が容易化されるとともに辞書の構成も小規模
なものとすることができる。
Therefore, according to the present invention, words that are not stored in the word dictionary can be easily retrieved without searching the kanji dictionary.
Efficient kana-kanji conversion becomes possible, operator operations are facilitated, and the dictionary structure can be made smaller.

〔発明の実施例〕[Embodiments of the invention]

以下、図面を参照して本発明の一実施例(二ついて説明
する。第1図は実施例装置の要部を示す概略構成図であ
り、第2図はそのフローチャートである。かな漢字変換
に供される仮名文字列は、入力装置lを介して文字コー
ド化され、また、単語毎に区切られる等の前処理がなさ
れたのち一時記憶装置2へ供給される。この入力装置l
は、カナ・キーボード等の鍵盤装置にて構成されたり、
音声入力認識装置で構成されたりする。このようにして
入力された入力仮名文字列は、一時記憶装置2にて一旦
記憶されたのち、かな漢字変換制御部3において、変換
に限定をするかの指定があるか判別される。限定の指定
がないコード列は単語辞書照合回路4に与えられる。変
換−二限定をする指定があるときは、入力仮名文字列か
ら、限定情報を除いたコード列と変換限定情報が単語辞
書照合回路4へ与えられる。
An embodiment of the present invention (two embodiments will be described below with reference to the drawings. Fig. 1 is a schematic configuration diagram showing the main parts of the embodiment device, and Fig. 2 is a flowchart thereof. The kana character string to be input is converted into a character code via the input device 1, and is subjected to preprocessing such as segmentation into words, and then supplied to the temporary storage device 2.This input device 1
is composed of a keyboard device such as a kana keyboard,
It may consist of a voice input recognition device. After the input kana character string input in this manner is temporarily stored in the temporary storage device 2, the kana-kanji conversion control unit 3 determines whether there is a designation to limit the conversion. Code strings with no limitation specified are provided to the word dictionary matching circuit 4. When there is a designation for conversion-two restriction, a code string obtained by removing the restriction information from the input kana character string and the conversion restriction information are provided to the word dictionary matching circuit 4.

一方、単語辞書である辞書記憶装置5は、漢字を含む文
字列からなる単語と、その発音を示す仮名文字とを対応
させて複数単語に亘って記憶している。これらの単語情
報は、磁気ディスクやROMなどが、もちいられ、例え
ば(1あ”項から試ん”項に至るまで、順(=アドレス
割当てして記憶されている。このような単語辞書記憶装
置5に対して、前記単語辞書照合回路4は、先ず、与え
られた、コード列と辞書中の仮名文字列との照合を順次
行い、その一致検出を行っている。そして、一致検出さ
れた単語辞書中の漢字混りの文字列を選択的4二読み出
している。このとき、上記限定情報がないときには、上
記選択された、漢字混りの文字列は、そのままかな漢字
変換制御部へ出力されることとなる。一方、限定情報の
指定があるときは、上記選択された漢子混りの文字列か
ら、限定情報に従って漢子混りの文字列に限定を加え、
かな漢字変換制御部へ出力する。この変換候補となった
漢子混りの文字列は、変換候補表示装置6へ表示される
ようになっている。これにより、入力された仮名文字列
に限定情報を含む場合は、これに該当する漢字変換結果
が表示され、限定情報がない場合°と同様の操作で、該
当する漢字の選択ができる。
On the other hand, the dictionary storage device 5, which is a word dictionary, stores a plurality of words in correspondence with words consisting of character strings including kanji and kana characters indicating their pronunciations. This word information is stored in a magnetic disk, ROM, etc., and is stored in order (=address assignment), for example, from item 1A to item ``Try''. 5, the word dictionary matching circuit 4 first sequentially matches the given code string with the kana character strings in the dictionary and detects a match. A character string containing kanji in the dictionary is selectively read out.At this time, if the above-mentioned limiting information is not available, the selected character string containing kanji is output as is to the kana-kanji conversion control unit. On the other hand, when limited information is specified, from the selected character strings containing Chinese characters, add limitations to the character strings containing Chinese characters according to the limited information,
Output to the kana-kanji conversion control section. This conversion candidate character string containing Chinese characters is displayed on the conversion candidate display device 6. As a result, if the input kana character string includes limited information, the corresponding kanji conversion result will be displayed, and if there is no limited information, the corresponding kanji can be selected using the same operation as °.

このように構成された装置よれば、例えば、「臨調」な
る単語が単語辞書記憶装置5に記憶されてない場合に、
仮名人力したい場合は、まずオペレータは”臨”という
漢字を含む単語を発想し、例えば、曖臨時”という単語
が発想されたなら、この”臨時”という単語の前の漢字
であるという限定情報を附加して、仮名で萌りんじ”と
入力する。中点°1・”を1りんし”の前に附加したこ
とにより前の漢字に限定する。この場合、中点で限定す
るのでなく、′りんじ−りん”又は“りんじのりん”の
ごとく入力してもよい。まだ後の漢字に限定する場合に
は5りんじ・”と入力する。例えば′電・りんし”と入
力すると、その仮名文字列は一時記憶装置2に格納され
て、かな漢字変換制御部3にて、限定情報の有無が検出
される。本実施例では限定情報が文字列の先頭にあれば
限定フリップフレツブを1にセットし、文字列の終りに
出れば2にセットし、また限定情報がない場合は限定フ
リップフレツブを0にセットする。この場合、中点t′
−”の位置が、前にあることから”りんし”の読みに該
当する単語の前の漢字のみ変換候補とする指示(限定フ
リップフロップ=1)が単語辞書照合回路4へ与えられ
る。
According to the device configured in this way, for example, when the word "Rincho" is not stored in the word dictionary storage device 5,
If you want to perform kana human power, the operator first comes up with a word that includes the kanji ``rin'', and if the word ``baku tempura'' is thought of, then the operator must provide the limited information that it is the kanji before the word ``temporary''. Add "Moerinji" using a pseudonym. By adding the middle point °1・" before 1rinshi, it is limited to the previous kanji. In this case, instead of limiting to the middle point, you can enter ``Rinji-Rin'' or ``Rinji-no-Rin.'' If you want to limit to later kanji, enter ``5Rinji・''. . For example, when you input 'Den/Rinshi', the kana character string is stored in the temporary storage device 2, and the presence or absence of limited information is detected by the kana-kanji conversion control unit 3.In this embodiment, the limited information is written in characters. If it appears at the beginning of the string, set the qualifier flip-flop to 1, if it appears at the end of the string, set it to 2, and if there is no qualifier, set the qualifier flip-flop to 0. In this case, the midpoint t'
Since the position of "-" is in the front, an instruction (restriction flip-flop=1) is given to the word dictionary matching circuit 4 to select only the kanji before the word corresponding to the pronunciation of "Rinshi" as conversion candidates.

単語辞書照合回路4が”りんし”に該当する単語曖臨時
”を検出すると、変換限定情報が前の漢字なので、′臨
”を変換候補として出力する。これにより、変換候補表
示装置6へは、駿臨”のみが表示される。
When the word dictionary collation circuit 4 detects the word ``Fugu tempura'' that corresponds to ``Rinshi'', since the conversion restriction information is the previous kanji, it outputs ``Rin'' as a conversion candidate. As a result, only "Shunrin" is displayed on the conversion candidate display device 6.

同様にオペレータはひきつづき”調”という漢字を含む
単語覗ちょうさ”、′1ちょうせい”などを同様に限定
入力情報を付加してする。限定入力する単語に同音果義
語がある場合は該当する限定漢字を複数出力する。例え
ばU・かんじ”では、(′幹事”、吠漢子”、″監事”
、U完治”などの単語が該当するので、変換候補として
は II幹ρ。
Similarly, the operator continues to input words including the kanji ``tone'' such as ``peekchosa'', ``1chousei'', etc., by adding limited input information in the same way. If a word to be limitedly input has a homophone or meaning, multiple corresponding limited kanji are output. For example, in ``U. Kanji'', (``secretary'', ``kanji'', ``auditor'')
, U complete cure'', etc., so the conversion candidate is II trunk ρ.

1漢”、1監”、6完”が出力される。1 Kan”, 1 Kan”, and 6 Kan” are output.

以上説明したように本発明に孫子仮名漢字変換装置によ
れば、単語辞書にない単語であっても、漢字辞書を参照
することなく、簡単に入力することができる。これ故、
オペレータの入力操作の簡易化を図ることができ、効率
良く文章作成することが可能となる。また、音声入力に
より文章を作成する場合であっても、仮名文字を発生す
るだけで、十分対処することができ、その効果は絶大で
あり、実用上極めて多くの効果が奏せられる。
As described above, according to the Sun Tzu kana-to-kanji conversion device of the present invention, even words that are not in the word dictionary can be easily input without referring to the kanji dictionary. Therefore,
The operator's input operations can be simplified, and sentences can be created efficiently. Furthermore, even when a sentence is created by voice input, just generating kana characters is enough to cope with the problem, and the effect is tremendous, and in practical terms, an extremely large number of effects can be achieved.

尚、本発明は日本語のみ限定されるものではない。例え
ば、中国語の文章を入力する場合は、仮名文字の代わり
にローマ字入力が、もちいられるが、同様に入力できる
。要するに本発明はその要旨を逸脱しない範囲で種々変
形して実施することができる。
Note that the present invention is not limited to only Japanese. For example, when inputting Chinese text, Romaji input is used instead of Kana characters, but it can be input in the same way. In short, the present invention can be implemented with various modifications without departing from the gist thereof.

また、漢字を限定出力するのではなく、単語を漢字に分
解して、出力する方法も効果的である。
Furthermore, instead of outputting a limited number of kanji, it is also effective to break down words into kanji and output them.

例えば、鴫かんじ”を分解出力すると以下に示すような
順番に、1字づつ出力される。この場合、オペレータが
、漢字を選択する手段として、較当候補”と競前候補”
を表示要求する手段があると効率よく選択ができる。
For example, when ``Shizukanji'' is disassembled and output, it is output one character at a time in the order shown below.In this case, the operator selects kanji by using ``Bentai candidate'' and ``Competition candidate''.
If there is a means to request the display, selection can be made more efficiently.

−かんじ”・・・幹事、漢字、監事、完治表示順l 幹→漢−監−完一事一字一治 表示順2 幹→漢→監−完→治→字−事 表示順3 幹→事→漢→字−監→完→治-Kanji”...Secretary, Kanji, Auditor, Completely cured display order l Stem→Kan-Kan-Kan-ichiji-ichiji-ichiji Display order 2 Stem → Kan → Kan-Kan → Ji → Ji-ji Display order 3 Secretary→Ji→Kan→Character→Kan→Kan

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例を示す図、第2図は本発明の
一実施例のフローチャートである。 l・・・入力部     2・・・一時記憶装置3・・
・かな漢字変換制御部 4・・・単語辞書照合回路 5・・・単語辞書記憶装置 6・・・変換候補表示装置
FIG. 1 is a diagram showing one embodiment of the present invention, and FIG. 2 is a flowchart of one embodiment of the present invention. l...Input section 2...Temporary storage device 3...
・Kana-kanji conversion control unit 4...Word dictionary collation circuit 5...Word dictionary storage device 6...Conversion candidate display device

Claims (1)

【特許請求の範囲】[Claims] 複数の単語をその読みを表わす文字列に対応して記憶し
てなる単語辞書と、単語の読みを示す仮名文字列とこの
読みに該当する単語の漢字要素を限定する情報を入力す
る入力部と、上記入力仮名文字列から変換限定情報を除
いたコード列と変換限定情報とに分離する手段と、変換
限定情報が除かれたコード列と前記単語辞書を照合して
、漢字変換をする手段と、前記漢字変換された単語うち
前記限定情報により指定された漢字要素を限定して出力
する手段とを具備してなることを特徴とするかな漢字変
換装置。
a word dictionary in which a plurality of words are stored in correspondence with character strings representing their pronunciations; and an input section for inputting a kana character string representing the pronunciation of a word and information for limiting the kanji elements of the word corresponding to this reading. , means for separating the input kana character string into a code string from which conversion limited information has been removed and the conversion limited information; and means for performing kanji conversion by comparing the code string from which conversion limited information has been removed with the word dictionary. , means for limiting and outputting the Kanji elements designated by the limiting information among the Kanji-converted words.
JP57162187A 1982-09-20 1982-09-20 Kana (japanese syllabary)-kanji (chinese character) converter Pending JPS5952338A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57162187A JPS5952338A (en) 1982-09-20 1982-09-20 Kana (japanese syllabary)-kanji (chinese character) converter

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57162187A JPS5952338A (en) 1982-09-20 1982-09-20 Kana (japanese syllabary)-kanji (chinese character) converter

Publications (1)

Publication Number Publication Date
JPS5952338A true JPS5952338A (en) 1984-03-26

Family

ID=15749655

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57162187A Pending JPS5952338A (en) 1982-09-20 1982-09-20 Kana (japanese syllabary)-kanji (chinese character) converter

Country Status (1)

Country Link
JP (1) JPS5952338A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5391913A (en) * 1991-12-27 1995-02-21 Matsushita Electric Industrial Co., Ltd. Semiconductor device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5391913A (en) * 1991-12-27 1995-02-21 Matsushita Electric Industrial Co., Ltd. Semiconductor device

Similar Documents

Publication Publication Date Title
JP2515726B2 (en) Information retrieval method and device
JPS584424A (en) Japanese word input device
JPS5952338A (en) Kana (japanese syllabary)-kanji (chinese character) converter
JPS5998236A (en) Input device of japanese sentence
KR20030008254A (en) Alphabet input device and method in keypad
JPS6154559A (en) Japanese word processor
JPS59121425A (en) Chinese phonetic alphabet of kanji converter
JP2024021555A (en) KEARM priority conversion of Japanese input system
JPH0560139B2 (en)
JPH08272780A (en) Processor and method for chinese input processing, and processor and method for language processing
JPS63316162A (en) Document preparing device
JPS61233862A (en) Kana-kanji converter
JPH0441398Y2 (en)
JPH03225462A (en) Roman character/kanji converter
JPH0991278A (en) Document preparation device
JPS63174165A (en) Word processor
JPS58219632A (en) Data conversion processing system
JPS61128364A (en) Retrieving device of dictionary
JPH03160555A (en) Japanese word input device
JPH08335217A (en) Reading converting method and document preparation device
JPH03156664A (en) Kanji conversion system
JPS62187966A (en) Single chinese kanji conversion processing system
JPH04306766A (en) Machine translation device
JPS6249558A (en) Sentence producing device
JPH04295914A (en) I-language character input device