JPH0567074A - Kana/kanji converter - Google Patents

Kana/kanji converter

Info

Publication number
JPH0567074A
JPH0567074A JP3227653A JP22765391A JPH0567074A JP H0567074 A JPH0567074 A JP H0567074A JP 3227653 A JP3227653 A JP 3227653A JP 22765391 A JP22765391 A JP 22765391A JP H0567074 A JPH0567074 A JP H0567074A
Authority
JP
Japan
Prior art keywords
kana
kanji
word
dictionary
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3227653A
Other languages
Japanese (ja)
Inventor
Hisahiro Adachi
久博 安達
Tetsuro Chino
哲朗 知野
Kazuo Sumita
一男 住田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP3227653A priority Critical patent/JPH0567074A/en
Publication of JPH0567074A publication Critical patent/JPH0567074A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To provide a KANA (Japanese syllabary)/KANJI (Chinese character) conversion device capable of improving the accuracy of the conversion of a derivative in a dictionary with small capacity and efficiently obtaining the conversion result that a user intends. CONSTITUTION:An independent word dictionary 15 and an accessory dictionary 16 storing the KANJI/KANA inscription and grammar information corresponding to the readings for independent words, affixes and accessory words, a corresponding table 18 classifying the independent words from the viewpoint of the connection with the affixes and storing the classification items to which each independent word belongs and a connection table 19 storing the connection relation between the classification items and affixes are provided. This KANA/KANJI converter is a device retrieving a dictionary from inputted reading (a word retrieval part 9), detecting the classification item of the extracted independent word from the corresponding table, investigating the connection relation with the affix of the detected classification item from a connection table (an output decision part 11) and converting the inputted reading into a sentence mixed with KANA and KANJI.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、かな文字列を入力して
漢字かな混じり文字列に変換する日本語ワ―ドプロセッ
サにおけるかな漢字変換装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a kana-kanji conversion device in a Japanese word processor for inputting a kana character string and converting it into a kanji-kana mixed character string.

【0002】[0002]

【従来の技術】日本語における漢字かな混じり表記を行
う手段として、簡便な環境を提供するため、日本語ワ―
ドプロセッサが、広く普及している。これらのワ―ドプ
ロセッサにおいては、キ―ボ―ドよりかな入力もしくは
ロ―マ字入力によりかな文字を使用者が入力するととも
に、文節の切れ目もしくは文の切れ目などにおいて、こ
れらの切れ目を指示する特定のキ―を使用者が自ら打鍵
したタイミング、あるいは、かな入力中に句読点などが
入力されたり、入力された文字数があらかじめ定められ
た文字数を越えた場合などのタイミングで、入力された
かな入力に対応して漢字かな混じり表記に変換する処理
を行い、その変換した結果をCRTなどのディスプレイ
画面に表示する。この一連の手続きが繰り返されること
により使用者は自ら所望する文章についての漢字かな混
じり表記を作成していくことができる。
2. Description of the Related Art In order to provide a simple environment as a means of writing kanji and kana in Japanese, a Japanese language
Processors are widely used. In these word processors, the user inputs kana characters by kana or romaji input using the keyboard, and at the same time indicates these breaks at the breaks or breaks in sentences. Kana input entered at the timing when the user types a specific key, or when punctuation marks are entered during kana input, or when the number of input characters exceeds a predetermined number. In accordance with, the process of converting into a kanji-kana mixed notation is performed, and the conversion result is displayed on a display screen such as a CRT. By repeating this series of procedures, the user can create a kanji-kana mixed notation for a desired sentence.

【0003】このような日本語ワ―ドプロセッサでのか
な入力を漢字かな混じりの表記に変換する処理において
は、使用者が意図する漢字かな表記に正確に変換できる
ことが必要とされる。正確に変換することのできない場
合、変換を誤った部分についての修正を、使用者自らが
行わなければならず、その修正作業には多大な労力を必
要とする。ところが、日本語にあっては、英語などの言
語と異なり単語の分かち書きの習慣がないため、入力か
な文字列を漢字かな混じり表記に自動的に変換するため
には、まず各単語を単語ごとに分割する必要がある。日
本語は、次のような構造になっていることが知られてい
る。 (文) ::=(文節)+ (1) (文節) ::=(自立語)・(付属語)* (2) (自立語) ::=(自立語)+ (3) (自立語) ::=(接頭語)・(自立語) (4) (自立語) ::=(自立語)・(接尾語) (5)
In the process of converting a kana input in such a Japanese word processor into a kanji-kana mixed notation, it is necessary to be able to accurately convert it into the kanji kana notation intended by the user. If the conversion cannot be performed accurately, the user himself has to correct the incorrect conversion, which requires a great deal of effort. However, in Japanese, unlike English and other languages, there is no habit of separating words into words, so in order to automatically convert the input kana character string into kanji and kana mixed notation, first, each word Need to split. It is known that Japanese has the following structure. (Sentence) :: = (Sentence) + (1) (bunsetsu) :: = (independent word), (adjunct word) * (2) (Independent word) :: = (Independent word) + (3) (Independent word) ::: (Prefix) · (Independent word) (4) (Independent word) ::: (Independent word) · (Suffix) (5)

【0004】ここで、『*』は0個以上の単語が連鎖す
ることを示しており、『+』は1個以上の単語が連鎖す
ることを示している。また『・』は、前後の単語が連接
することを示している。
Here, "*" indicates that 0 or more words are chained, and "+" indicates that 1 or more words are chained. In addition, “·” indicates that the words before and after are connected.

【0005】例えば、(1)は、文が複数の文節から構
成されていることを表わしており、(2)は、文節が自
立語の後ろに複数個の付属語が連接して構成されること
を表わしている。(3)、複数の自立語が連接して複合
語が構成されることを表わしている(例えば、機械翻訳
システム::=機械翻訳・システム)。(4)、(5)
は、自立語に接頭語や接尾語が連接して派生語が構成さ
れ(例えば、重役室::=重役・室、新技術::=新・
技術)、文節を構成するにあたっては他の単純な自立語
と同様に付属語が連接してなることを表わしている。
尚、接頭語と接尾語を合わせて以後、接辞と呼ぶことに
する。
For example, (1) indicates that the sentence is composed of a plurality of clauses, and (2) the clause is composed of an independent word followed by a plurality of adjunct words. It means that. (3) represents that a plurality of independent words are concatenated to form a compound word (for example, machine translation system :: = machine translation system). (4), (5)
Is a derivative word that is formed by concatenating a prefix or suffix with an independent word (for example, executive room :: = executive room, new technology :: = new
Technology), it means that the adjunct words are concatenated in the construction of bunsetsu like other simple independent words.
The prefix and the suffix will be collectively referred to as a suffix hereinafter.

【0006】ところが、従来の技術においては、入力か
な文字列に派生語(接頭語+接尾語、自立語+接尾語)
を含む場合、接辞の読みと表記の対応表を用いて、自立
語と接辞の組み合わせて派生語を生成していたため、接
辞の読みが同じ場合、例えば、「りょう」という読みに
対して「寮」、「漁」、「量」、「料」などのように複
数の表記が対応し、「うんどうりょう」という読みに対
して、正しい変換結果である「運動量」以外に「運動
寮」、「運動漁」、「運動料」という無意味な造語を生
成し変換候補としてしまっていた。これは、変換処理に
おいて曖昧性を増加させ、変換精度を悪くする要因の一
つとなっている。
However, in the conventional technique, a derivative word (prefix + suffix, independent word + suffix) is added to the input kana character string.
If the affix reading is the same as the affix reading, the table of correspondence between the affix reading and the notation was used to generate derivative words by combining the independent word and the affix. ",""Fishing","amount","charge", etc., correspond to multiple notations, and for the reading "Undoryo", "exercise dormitory" in addition to the correct conversion result "exercise amount", The meaningless coined words "exercise fishing" and "exercise fee" were generated and used as conversion candidates. This is one of the factors that increase the ambiguity in the conversion process and deteriorate the conversion accuracy.

【0007】この曖昧性を解消するために、派生語(上
記の例では「運動量」)を一単語として辞書に登録する
ことは、日本語の造語能力の高さを考慮すれば膨大な辞
書の容量が必要とされるという問題がある。そこで、派
生語の変換の曖昧性を解消するために、『情報処理学会
論文誌昭和56年1月第22巻第1号』「べた書き文のかな
漢字変換システムとその同音語処理」においては、自立
語辞書の各自立語に連接可能な全ての接辞を漢字コ―ド
の形で格納しておき、変換時にその情報を参照する方式
が提案されている。しかしながら、各自立語に連接可能
な全ての接辞を漢字コ―ドで保持することは、自立語辞
書の容量を大きくするという問題があった。
In order to eliminate this ambiguity, registering a derivative word (“momentum” in the above example) as one word in the dictionary is an enormous dictionary, considering the high level of Japanese coinage ability. There is a problem that capacity is required. Therefore, in order to eliminate the ambiguity of the conversion of derivative words, in "Information Processing Society of Japan, Journal, Vol. 22, No. 1,""Kana-Kanji conversion system for solid writing and its homophone processing", A method has been proposed in which all affixes that can be concatenated with each independent word in an independent word dictionary are stored in the form of kanji code, and that information is referred to during conversion. However, holding all the affixes that can be connected to each independent word in the kanji code has a problem of increasing the capacity of the independent word dictionary.

【0008】ところで、日本語のかな漢字変換において
は、1つのかな入力に対して複数の同音異義語が存在す
ることが頻繁に起こる。この同音異義語の選択を誤った
部分については、使用者自らが次候補キ―等を用いて修
正しなければならない。
By the way, in Japanese kana-kanji conversion, it often happens that a plurality of homonyms exist for one kana input. The user must correct the mistaken selection of homonyms by using the next candidate key.

【0009】特に派生語を含む同音異義語の場合には、
接頭語+自立語と自立語+接尾語の構造の違いにより、
例えば図16に示すように、読み「しんぎじゅつ」の入力
に対して適切な単語候補は「新+技術」と「審議+術」
のように2つの構造を持つ。この場合「審議術」を得る
ためには、まず、接頭語+自立語の構造に対する候補群
を次候補キ―により、例えば「新+技術」、「真+技
術」、「親+技術」、
Particularly in the case of homonyms including derivative words,
Due to the difference in the structure of prefix + independent word and independent word + suffix,
For example, as shown in Fig. 16, the appropriate word candidates for the input of the reading "Shinjujutsu" are "new + technology" and "discussion + art".
It has two structures like. In this case, in order to obtain "deliberation technique", first, a candidate group for the structure of prefix + independent word is selected by the next candidate key, for example, "new + technology", "true + technology", "parent + technology",

【0010】「心+技術」を順に表示させ、その次に初
めて自立語+接尾語の構造に対する選択が行われ、「審
議+術」を得る。あるいは、使用者がカ―ソルの移動に
より文節の切り直し操作を行い「しんぎ」に対して「審
議」を確定させた語、「術」を選択する操作となる。こ
の逆の場合も同様である。また、これらの選択表示順序
は使用者には制御できないため、システムが提示した第
一候補の構造と異なる構造を持つ同音異義語を得るため
には、カ―ソル移動を伴い、その選択操作が多くなる場
合があり、文章を効率的に作成できないという問題があ
った。
"Mind + Technology" is displayed in order, and then the selection of the structure of the independent word + suffix is made for the first time to obtain "deliberation + skill". Alternatively, the user performs an operation of recutting the phrase by moving the cursor, and selects the word "jutsu", which is the word "deliberation" is fixed to "shingi". The same applies to the opposite case. Further, since the selection display order cannot be controlled by the user, in order to obtain a homonym having a structure different from the structure of the first candidate presented by the system, a cursor movement is involved and the selection operation is performed. There was a problem in that the text could not be created efficiently in some cases.

【0011】[0011]

【発明が解決しようとする課題】このように従来のかな
漢字変換装置においては、辞書中の自立語と接辞の接続
可能性を判定した接続情報を自立語各々に持たせていた
ために、自立語辞書の容量が大きくなるという問題があ
った。また、使用者の意図する変換結果とは異なる構造
を持つ派生語の同音異義語が提示された場合に、カ―ソ
ルの移動操作による文節の切り直しという作業が必要と
なり使用者に多大の労力を強いるという問題があった。
As described above, in the conventional kana-kanji conversion device, since each independent word has the connection information for determining the connection possibility of the independent word and the affix in the dictionary, the independent word dictionary is provided. There was a problem that the capacity of the was increased. Also, when a homonym of a derivative word having a structure different from the conversion result intended by the user is presented, it is necessary to re-adjust the phrase by moving the cursor, which requires a great deal of labor for the user. There was a problem of forcing.

【0012】本発明は以上の点を鑑みてなされたもの
で、その目的とするところは、容量の小さい辞書で派生
語の変換の精度を向上させ、また、異なる構造を持つ派
生語の同音異義語選択の操作性を向上させ、使用者の意
図する変換結果を効率よく得ることのできるかな漢字変
換装置を提供することにある。
The present invention has been made in view of the above points, and an object of the present invention is to improve the conversion accuracy of derivative words with a dictionary having a small capacity and to provide homonyms of derivative words having different structures. Another object of the present invention is to provide a kana-kanji conversion device that improves the operability of word selection and can efficiently obtain the conversion result intended by the user.

【0013】[0013]

【課題を解決するための手段】本発明の第1の発明に係
るかな漢字変換装置は、自立語、接辞、及び付属語につ
いて、読みに対応する漢字かな表記及び文法情報を記憶
する辞書と、各自立語が属する分類項目を記憶する対応
表と、分類項目と接辞との接続関係を記憶する接続表と
を備え、入力された読みから辞書を検索して抽出される
自立語の分類項目を前記対応表より検出し、検出された
分類項目の接辞との接続関係を前記接続表より調べて、
入力された読みを漢字かな混じりの文章に変換すること
を特徴とするものである。
A kana-kanji conversion device according to a first aspect of the present invention includes a dictionary for storing kanji kana notation and grammatical information corresponding to reading, for each of independent words, affixes and adjuncts, and It is provided with a correspondence table that stores the classification items to which the independent words belong, and a connection table that stores the connection relationship between the classification items and affixes, and the classification items of the independent words extracted by searching the dictionary from the input reading Detected from the correspondence table, check the connection relationship with the affix of the detected classification item from the connection table,
The feature is that the input reading is converted into a sentence containing kanji and kana.

【0014】本発明の第2の発明に係る漢字変換装置
は、文章の読みや制御信号を入力する入力部と、読みと
漢字かな表記とを対応づけて記憶する辞書と、この辞書
を参照して入力部より入力された読みを漢字かな混じり
の文章に変換するかな漢字変換部と、このかな漢字変換
部による変換結果を表示する表示部と、前記の変換結果
の同音異義語を保持する保持部とを備え、入力部より前
記の変換結果の構造の切り換えが指示された場合に、表
示された変換結果と異なる構造を持つ同音異義語を保持
部から取り出して表示することを特徴とするものであ
る。
A kanji conversion device according to a second aspect of the present invention refers to an input section for inputting a reading of a sentence or a control signal, a dictionary for storing the reading and the kanji kana notation in association with each other, and referring to this dictionary. And a kana-kanji conversion part for converting the reading input from the input part into a kanji-kana mixed sentence, a display part for displaying the conversion result by this kana-kanji conversion part, and a holding part for holding the homonyms of the conversion result. When the switching of the structure of the conversion result is instructed from the input unit, a homonym having a structure different from the displayed conversion result is taken out from the holding unit and displayed. ..

【0015】[0015]

【作用】本発明の第1の発明によれば、自立語を接辞と
の接続関係から幾つかの項目に分類し、その分類項目単
位で接辞との接続情報を記述するので、情報の記述量を
減らすことができ、かつ、自立語と接辞の無意味な組み
合わせを変換候補として生成することがないので、接辞
を含む入力に対して高い変換精度を得ることができる。
According to the first aspect of the present invention, since the independent word is classified into several items based on the connection relation with the affix, and the connection information with the affix is described for each classification item, the amount of information description Can be reduced, and since a meaningless combination of an independent word and an affix is not generated as a conversion candidate, a high conversion accuracy can be obtained for an input including an affix.

【0016】本発明の第2の発明によれば、使用者が本
装置が提示する変換候補について同音異義語選択を行う
ときに、構造の切り換えを指示することにより、所望の
構造と異なる構造を持つ変換候補の提示を行わないよう
にするので、所望の構造を持つ同音異義語の選択を容易
に行うことができる。つまり、第1、第2の発明とも、
無駄な変換候補の提示回数を減らすことで、使用者に円
滑な日本語文章作成環境を提供することを可能とする。
According to the second aspect of the present invention, when the user selects the homonyms for the conversion candidates presented by the present apparatus, by instructing the switching of the structure, a structure different from the desired structure can be obtained. Since the conversion candidate to be held is not presented, it is possible to easily select a homonym having a desired structure. That is, in both the first and second inventions,
By reducing the number of unnecessary conversion candidates presented, it is possible to provide the user with a smooth Japanese sentence creation environment.

【0017】[0017]

【実施例】【Example】

○実施例1 ○ Example 1

【0018】以下、図面を参照しながら第1の発明の一
実施例について説明する。尚、本発明にあっては、その
趣旨が無意味な組み合わせによる派生語の変換結果を第
一位の変換結果として出力しないような方法を提供する
ことにあるのであって、かな漢字変換処理におけるその
他の処理にあるわけではない。また、変換処理の起動は
先に述べたように、様々なタイミングで行われる可能性
があるが、派生語解析を行う処理は、共通の処理であ
る。したがって、ここでは、本発明の趣旨である派生語
解析処理について、文節の切れ目で変換処理が行われる
場合で説明する。文節の切れ目で変換処理が起動され
る、例えばべた入力の場合については、特開昭60− 720
14号公報で開示されている処理に本発明を適用すること
により、本発明に基づいた変換処理が容易に実現できる
ことはいうまでもない。
An embodiment of the first invention will be described below with reference to the drawings. It is to be noted that the present invention is to provide a method of not outputting a conversion result of a derivative word by a combination whose meaning is meaningless as a conversion result of the first place. Is not in the processing of. Further, as described above, the conversion process may be started at various timings, but the process of performing derivative word analysis is a common process. Therefore, here, the derivative word analysis process, which is the gist of the present invention, will be described in the case where the conversion process is performed at a break of a clause. Japanese Patent Laid-Open No. 60-720 discloses a case where conversion processing is started at a break of a phrase, for example, in case of solid input.
It goes without saying that the conversion processing based on the present invention can be easily realized by applying the present invention to the processing disclosed in Japanese Patent Publication No.

【0019】図1は、本発明の一実施例に係るかな漢字
変換装置の機能構成を示したブロック図である。本装置
は、文字入力部8、単語検索部9、接続判定部10、出力
決定部11、出力部12の処理ブロックならびに、入力バッ
ファ13、作業バッファ14、出力バッファ20、自立語辞書
15、付属語辞書16、付属語連接テ―ブル17、対応テ―ブ
ル18、接続テ―ブル19のデ―タから構成される。
FIG. 1 is a block diagram showing the functional arrangement of a kana-kanji conversion device according to an embodiment of the present invention. This device includes processing blocks of a character input unit 8, a word search unit 9, a connection determination unit 10, an output determination unit 11, an output unit 12, an input buffer 13, a work buffer 14, an output buffer 20, and an independent word dictionary.
It is composed of the data of 15, an annex word dictionary 16, an annex word concatenation table 17, a corresponding table 18, and a connection table 19.

【0020】図2は、自立語辞書15の内容の一部を示し
ている。自立語辞書には、自立語や接頭語、接尾語が記
憶されており、各単語について、読み、見出し、辞書番
号、使用頻度情報、文法情報がれぞれ格納されている。
図3は、各単語が属する分類項目を表わす対応テ―ブル
18の内容の一部を示している。対応テ―ブルでは、自立
語辞書の各単語の辞書番号と分類項目番号が対応付けら
れている。図4は、接続情報を格納した接続テ―ブル19
の一部を示している。接続テ―ブルは、分類項目番号と
接辞の辞書番号の接続行列の形で表わされており、1/
0のビット情報により接続の可否を表わしている。接続
テ―ブルにおける行方向の成分に分類項目番号が割り当
てられており、一方、行列方向の成分に接辞の接辞番号
が割り当てられている。
FIG. 2 shows a part of the contents of the independent word dictionary 15. The independent word dictionary stores independent words, prefixes, and suffixes, and for each word, reading, headline, dictionary number, usage frequency information, and grammatical information are stored.
FIG. 3 shows a correspondence table indicating the classification item to which each word belongs.
18 shows a part of the contents. In the correspondence table, the dictionary number of each word in the independent word dictionary and the classification item number are associated with each other. Figure 4 shows the connection table that stores the connection information.
Shows a part of. The connection table is expressed in the form of a connection matrix of classification item numbers and affix dictionary numbers.
The bit information of 0 indicates whether or not the connection is possible. The classification item number is assigned to the row direction component in the connection table, while the affix affix number is assigned to the matrix direction component.

【0021】図5は、本実施例装置に必要な機器の構成
を示した図である。かな漢字変換処理のためのプログラ
ムや自立語辞書、付属語辞書、対応テ―ブル、接続テ―
ブル、付属語連接テ―ブル等のデ―タは、ROM6内に
あらかじめ記憶されているものとする。ひらがな文字列
は、入力部1から入力され、入力制御部2を介してRA
M7内の入力バッファに格納される。変換キ―が打鍵さ
れると、変換処理を起動する。入力バッファに格納され
た文字列に対してかな漢字変換処理が施される。かな漢
字変換処理における、作業領域としてRAM7内の作業
バッファが使用される。処理結果は、RAM7内の出力
バッファに格納されるとともに、表示制御部4を介して
表示部5に表示される。
FIG. 5 is a diagram showing the configuration of equipment required for the apparatus of this embodiment. Kana-Kanji conversion processing program, independent word dictionary, auxiliary word dictionary, corresponding table, connection table
It is assumed that data such as a bull and an adjunct word connecting table are stored in the ROM 6 in advance. The hiragana character string is input from the input unit 1 and the RA is input via the input control unit 2.
It is stored in the input buffer in M7. When the conversion key is pressed, the conversion process is started. Kana-Kanji conversion processing is performed on the character string stored in the input buffer. A work buffer in the RAM 7 is used as a work area in the kana-kanji conversion processing. The processing result is stored in the output buffer in the RAM 7 and displayed on the display unit 5 via the display control unit 4.

【0022】次に、本実施例におけるかな漢字変換処理
について、図6に示すフロ―チャ―トに基づいて説明す
る。単語検索部9及び接続判定部10では、文字入力部8
で入力されたひらがな文字列に対して、自立語辞書15、
付属語辞書16、ならびに付属語連接テ―ブル17を参照し
ながら、文節の候補を構成する。まず最初に、自立語辞
書を参照して入力ひらがな文字列中の文字列を読みとす
る自立語を抽出する(S 602)(単語検索部9)。取り
出した自立語を核として、残りのひらがな文字列につい
て付属語解析を行う(S 605)(接続判定部10)。付属
語解析では、連接可能な付属語が検索される都度、その
付属語が文節の切れ目で使われるか否かを、付属語連接
テ―ブル上の終了可能性のビットにより判定している。
終了可能である場合、それまで解析された付属語系列を
付属語系列バッファに格納する。付属解析は、付属語系
列バッファに1個以上の付属語系列が格納された場合、
もしくは自立語単独で文節を終了することができる場合
(S606Yes)に、文節バッファと同音語バッファに対象
とする文節のデ―タを格納する(S 607)。付属語系列
バッファ、文節バッファ、同音語バッファは、作業バッ
ファ14内に設けられている。上記処理で、入力ひらがな
文字列から文節候補が全て解析されることになる。
Next, the kana-kanji conversion processing in this embodiment will be described based on the flowchart shown in FIG. In the word search unit 9 and the connection determination unit 10, the character input unit 8
Independent word dictionary 15, for the hiragana character string entered in
The bunsetsu candidates are constructed by referring to the adjunct word dictionary 16 and the adjunct word concatenation table 17. First, an independent word that reads a character string in the input hiragana character string is extracted by referring to the independent word dictionary (S602) (word search unit 9). Using the extracted independent word as a core, an auxiliary word analysis is performed on the remaining hiragana character strings (S605) (connection determining unit 10). In the adjunct word analysis, each time a concatenable adjunct word is searched, whether or not the adjunct word is used at a break of a bunsetsu is determined by a bit of termination possibility on the adjunct word concatenation table.
If it can be terminated, the adjunct word sequence that has been parsed up to that point is stored in the adjunct word sequence buffer. The adjunct analysis is performed when one or more adjunct word sequences are stored in the adjunct word sequence buffer.
Alternatively, when the independent phrase can be used to end the phrase (S606 Yes), the data of the target phrase is stored in the phrase buffer and the homophone word buffer (S607). The adjunct word series buffer, phrase buffer, and homophone word buffer are provided in the work buffer 14. In the above processing, all bunsetsu candidates are analyzed from the input hiragana character string.

【0023】図7に示すフロ―チャ―トに基づいて、本
実施例の特徴である派生語解析の処理(出力決定部11で
行われる)の方法について説明を行う。例えば、『うん
どうりょう』という図8に示すかな文字列が入力された
場合、図9に示す文節候補を得る(S 701)。この場
合、接尾語候補『りょう』に対して複数の候補『寮』、
『漁』、『量』、『料』が存在し、それぞれ、辞書にあ
らがじめ設定されている使用頻度順にソ―トされてい
る。図9より、かな入力に対しての第一候補列は、『運
動・寮・を』であり、品詞列としては『サ変名詞・接尾
語・格助詞』となり、接辞を含むので派生語解析が起動
される(S702Yes)。派生語解析では接尾語の場合、対
応テ―ブル18にて接尾語の直前の自立語の分類項目番号
を検索した後、検索した自立語の分類項目番号と接辞の
辞書番号とを持つビットの情報を接続テ―ブル19より検
出して、接尾語との接続の判定を行う(S 704)。接頭
語の場合も同様に、接頭語の直後の自立語との接続の判
定を行う(S 705)。上記の例では、対応テ―ブル18か
らサ変名詞『運動』の属する分類項目番号 004を検索
し、分類項目番号 004の自立語の、同音の接尾語『寮』
(辞書番号10050)、『漁』(辞書番号 10051)、
『量』(辞書番号 10052)、『料』(辞書番号 10053)
との接続の可否を、接続テ―ブル19を参照して判定を
し、接続可能である『量』が選択され、最終変換結果
『運動量』を得ることができる。
Based on the flow chart shown in FIG. 7, a method of the derivative word analysis processing (performed by the output determination unit 11) which is a feature of this embodiment will be described. For example, when the kana character string shown in FIG. 8 "UNDORYOU" is input, the phrase candidates shown in FIG. 9 are obtained (S701). In this case, for the suffix candidate “Ryo”, multiple candidates “dormitory”,
There are "fishing", "quantity", and "charge", and they are sorted according to the frequency of use as set in the dictionary. From FIG. 9, the first candidate sequence for kana input is "exercise / dormitory / wo", and the part-of-speech sequence is "sahen noun / suffix / case particle". It is activated (S702 Yes). In the case of a suffix in the derivative word analysis, after searching the classification item number of the independent word immediately before the suffix in the correspondence table 18, the bit number having the classification item number of the searched independent word and the dictionary number of the affix is searched. Information is detected from the connection table 19 and connection with the suffix is determined (S704). Similarly, in the case of the prefix, the connection with the independent word immediately after the prefix is determined (S705). In the example above, the correspondence table 18 is searched for the classification item number 004 to which the Sahen noun “exercise” belongs, and the independent word of the classification item number 004, the homophone suffix “dormitory”
(Dictionary number 10050), "Fishing" (Dictionary number 10051),
"Amount" (Dictionary number 10052), "Charge" (Dictionary number 10053)
Whether or not to connect with is determined by referring to the connection table 19, the "amount" that can be connected is selected, and the final conversion result "momentum" can be obtained.

【0024】尚、ここで説明した実施例にあっては、説
明を容易にするため変換候補列を全て構成した後、順
次、派生語解析を行ったがこれを候補列作成段階に行う
ことも可能である。また、上記の実施例では、自立語辞
書の外に図3の対応テ―ブルを設けたが、自立語辞書内
の各単語に付随させて分類項目番号を持たせるようにし
てもよい。
In the embodiment described here, after all the conversion candidate strings have been constructed in order to facilitate the explanation, the derivative words are sequentially analyzed, but this may be performed in the candidate string creating stage. It is possible. Further, in the above embodiment, the correspondence table of FIG. 3 is provided outside the independent word dictionary, but it is also possible to attach a classification item number to each word in the independent word dictionary.

【0025】本実施例では、接辞の接続関係が似ている
自立語を一つの項目にまとめ、その項目と接辞との接続
関係を定義した接続表を持たせる方式をとる。特開昭60
−191359号公報に、接辞の一覧表を自立語辞書の外に持
ち、辞書中の各自立語には連接可能な接辞を一覧表の位
置に対応するビットのベクトルの形で持たせる方式が開
示されているが、このように自立語それぞれに個別の接
続情報を持たせる場合に比べて、本実施例方式では辞書
容量が少なくて済む。なぜなら、通常の例では自立語は
数万語あり、接辞は千語弱であるため、接辞のデ―タ圧
縮を行う従来方式よりも、自立語のデ―タ圧縮を行う方
が情報圧縮の効果が大きいからである。この自立語のデ
―タ圧縮の方法について以下に説明する。簡単に述べる
と、例えば、 『量』に接続する名詞は、「運動」、「排気」、「降
水」 『料』に接続する名詞は、「慰謝」、「入場」、「斡
旋」 『寮』に接続する名詞は、「大学」、「男子」、「独
身」 のように名詞を接辞との接続性により幾つかの項目に分
類するのである。
In this embodiment, independent words having similar affix connection relationships are grouped into one item, and a connection table defining the connection relationship between the item and affix is provided. JP 60
-191359 discloses a method in which a list of affixes is provided outside an independent word dictionary, and each independent word in the dictionary is provided with an affix that can be concatenated in the form of a bit vector corresponding to the position of the list. However, as compared with the case where each independent word has individual connection information as described above, the dictionary capacity can be reduced in the method of this embodiment. This is because, in a typical example, there are tens of thousands of independent words and a little less than a thousand affixes.Therefore, the data compression of independent words is more effective than the conventional method of compressing affix data. This is because the effect is great. A method of compressing the independent word data will be described below. Briefly, for example, the nouns connected to "quantity" are "exercise", "exhaust", "precipitation" and "charges" are "comfort", "admission", "arrangement", and "dormitory". Nouns connected to are classified into several items, such as "university", "boy", and "single", according to the connectivity with affixes.

【0026】詳細に述べると、例えば、自立語を名詞と
した場合、名詞に接続する接辞のパタ―ンの類似性によ
って名詞のクラスタリングを行い、名詞・接辞の接続テ
―ブルをデ―タ圧縮する。クラスタリングの対象とする
全名詞と全接辞の接続性の可否を判定した接続テ―ブル
を用いて名詞のクラスタリングを行うが、その方法は、
図10に示すように、対象とする全ての名詞の1つずつを
1つのクラスタとする初期値(接続テ―ブルの情報をそ
のまま表現したテ―ブル)から接続する接辞のパタ―ン
が類似する複数のクラスタを1つのクラスタとしてマ―
ジしていくことを繰り返すことを基本にしている。すな
わち、各マ―ジの段階においてある評価尺度を最小にす
るクラスタのペアを求め、これらのクラスタをマ―ジす
る。この評価尺度としてここでは、名詞間の距離を定義
する。この距離は、接辞全体の集合をある手段によって
全順序に並べ、接辞全体集合の各要素がその名詞に接続
するか否かを1/0のビットベクトルで表現した場合の
ハミング距離に相当する。 接辞の集合={方,先,時,集,所,中,前} 対象とする名詞A1={武装} 対象とする名詞A2={反応} を例にとって説明すると、 A1のビットベクトルは (0,0,1,0,0,1,
1) A2のビットベクトルは (0,1,1,0,1,0,
1) となり、A1とA2のハミング距離は3となる。ハミン
グ距離とは、2つのベクトルの要素が互いに異なる要素
の総数である。これらをマ―ジする場合、ベクトル中異
なる要素を1と0のどちらかに統一するかについては、
例えば、マ―ジされる複数のクラスタで多数決をとる
(但し、同数の場合は1とする)等の方法がある。上記
の処理結果所望のクラスタ数になったとき、各名詞クラ
スタに分類項目番号を割りふって、図4の接続テ―ブル
が作成される。 ○実施例2 以下、図面を参照しながら第2の発明の一実施例につい
て説明する。
More specifically, for example, when an independent word is a noun, the nouns are clustered according to the similarity of the patterns of affixes connected to the nouns, and the connection table of the nouns and affixes is compressed. To do. Clustering of nouns is performed using the connection table that determines the connectivity of all nouns and all affixes targeted for clustering.
As shown in Fig. 10, the pattern of affixes that connect from the initial values (tables that represent the information of the connection table as they are) that make up each of the target nouns as one cluster is similar. Multiple clusters to be used as one cluster
The basic idea is to repeat the process. That is, a pair of clusters that minimizes a certain evaluation measure is obtained at each stage of merging, and these clusters are merged. Here, the distance between nouns is defined as this evaluation measure. This distance corresponds to the Hamming distance when the set of all affixes is arranged in a total order by some means and whether or not each element of the entire affix is connected to the noun is represented by a 1/0 bit vector. Set of affixes = {one, first, hour, collection, place, middle, front} Target noun A1 = {arming} Target noun A2 = {reaction} As an example, the bit vector of A1 is (0 , 0,1,0,0,1,
1) The bit vector of A2 is (0,1,1,0,1,0,
1) and the Hamming distance between A1 and A2 is 3. The Hamming distance is the total number of elements in which the elements of the two vectors are different from each other. When merging these, regarding whether to unify different elements in the vector to 1 or 0,
For example, there is a method of taking a majority vote for a plurality of clusters to be merged (however, if the number is the same, 1). When the desired number of clusters is obtained as a result of the above processing, the classification item number is assigned to each noun cluster, and the connection table of FIG. 4 is created. Example 2 An example of the second invention will be described below with reference to the drawings.

【0027】図11は、本発明の一実施例に係るかな漢字
変換装置の構成を示す図である。本装置は、入力部21、
編集制御部22、表示部23、かな漢字変換部24、かな漢字
変換辞書25、同音異義語選択部26、同音異義語構造解析
部27から構成される。
FIG. 11 is a diagram showing the structure of a kana-kanji conversion device according to an embodiment of the present invention. This device includes an input unit 21,
The editing control unit 22, the display unit 23, the kana-kanji conversion unit 24, the kana-Kanji conversion dictionary 25, the homonym synonym selection unit 26, and the homonym synonym structure analysis unit 27.

【0028】入力部21は、キ―ボ―ドなどの入力装置か
ら使用者の入力信号を受け取り、これを編集制御部22に
受け渡す。編集制御部22は、使用者の入力信号を解釈
し、それに応じてかな漢字変換部24もしくは同音異義語
選択部26を駆動し、それらの出力結果を受け取って、表
示部23に受け渡す。表示部23は編集制御部22から受け取
った結果をCRTディスプレイ装置、液晶ディスプレス
装置などの表示装置に表示させる。
The input section 21 receives a user's input signal from an input device such as a keyboard and transfers it to the edit control section 22. The edit control section 22 interprets the input signal of the user, drives the kana-kanji conversion section 24 or the homonym synonym selection section 26 accordingly, receives the output results thereof, and transfers them to the display section 23. The display unit 23 displays the result received from the editing control unit 22 on a display device such as a CRT display device or a liquid crystal display device.

【0029】かな漢字変換部24は、編集制御部22からひ
らがな文字列を受け取ると、かな漢字変換辞書25を参照
しながら、文法解析を行い、漢字かな混じり文の候補列
を生成して、編集制御部22に結果を転送する。編集制御
部22は、第一の候補列を表示部23に転送してその表示を
行うとともに、もし他に第2、第3の候補列、すなわ
ち、同音異義語がある場合には、これらの候補列とそれ
らが文章中で現れた位置情報を同音異義語選択部26に受
け渡し、同音異義語選択部26は、これらの情報を、同音
異義語の選択要求があるまで、同音異義語構造解析部27
に保持しておく。
When the kana-kanji conversion unit 24 receives a hiragana character string from the editing control unit 22, it performs grammatical analysis while referring to the Kana-Kanji conversion dictionary 25 to generate a candidate string of Kanji-Kana mixed sentences, and the editing control unit Transfer the result to 22. The edit control unit 22 transfers the first candidate string to the display unit 23 and displays it, and if there are other second and third candidate strings, that is, if there are homonyms, these The candidate strings and the position information in which they appear in the sentence are passed to the homonym synonym selection unit 26, and the homonym synonym selection unit 26 analyzes these information until the homonym synonym structure is requested. Part 27
Keep it in.

【0030】同音異義語選択部26は、利用者が入力部21
を介して同音異義語の選択要求を行うと、編集制御部22
によって駆動される。同音異義語選択部26は、使用者か
らの選択要求が接頭変換指示か接尾変換指示(両者を併
せて構造変換指示と呼ぶ)かを識別し、同音異義語構造
解析部27を起動し、同音異義語構造解析部27は指示され
た構造の同音語バッファを同音異義語選択部26に受け渡
し、同音異義語選択部26は使用者によって選択された候
補を編集制御部22に受け渡す。同音異義語選択部26は、
図13に示すフロ―チャ―トに従って動作する。
The homonym synonym selection unit 26 is input by the user to the input unit 21.
When a selection request for a homonym is made via the
Driven by. The homonym synonym selection unit 26 identifies whether the selection request from the user is a prefix conversion instruction or a suffix conversion instruction (these are collectively referred to as a structure conversion instruction), activates the homonym synonym structure analysis unit 27, and The synonym structure analysis unit 27 delivers the homonym buffer having the instructed structure to the homonym synonym selection unit 26, and the homonym synonym selection unit 26 delivers the candidate selected by the user to the edit control unit 22. The homonym synonym selection unit 26
It operates according to the flowchart shown in FIG.

【0031】以下、図13のフロ―チャ―トを参照しなが
ら、使用者が「こうきどでひょうじする」をかな漢字変
換しようとする場合を例に、同音異義語選択部26の動作
をより詳細に説明する。まず、このひらがな文字列はか
な漢字変換されて図15(a)に示すように「後期度で表
示する」と変換されて表示される。このとき、「こうき
ど」に対しては、同音異義語の候補が他にもあるため、
使用者にそれを知らせるべく「後期度」に下線が表示さ
れ、構造(自立語+接尾語)を明示するため「後期」が
高輝度表示されている。また、先に述べたように、編集
制御部22は、同音異義語選択部26に対して、同音異義語
の保持要求を出す(A2Yes )ので、同音異義語選択部
26は、同音異義語構造解析部27を起動し「後期度」の出
現位置及び同一の構造から成る他の候補(「こうき」に
対して、{後記、光輝、好機、好奇、工期、高貴}、
「ど」に対して{度、土、努、奴、怒、堵})と、別の
構造から成る候補(「こう」に対して、{高、後、好、
工}、「きど」に対して、{輝度、木戸、喜怒})の見
出し(漢字表記)、とその辞書番号(かな漢字変換辞書
5の各エントリに付加されている識別番号)を図14に示
すように同音異義語構造解析部27が内臓している同音語
バッファに構造単位で追加登録する(A3)。次に使用
者が入力部21の接頭変換指示手段により、同音異義語選
択要求を行う(具体的には、「シフト」キ―と変換キ―
を同時に押すことにより別の構造の同音異義語選択要求
を行う)(A1Yes )と、編集制御部22は、対象となる
「後期度」の位置情報と接頭変換指示情報を与えて、同
音異義語選択部26を駆動する。同音異義語選択部26は、
与えられた位置情報と接頭変換指示情報から同音異義語
構造解析部27を起動し、指示された構造の同音語バッフ
ァを検索し(A5)、「こう」の変換候補の辞書番号を
得る。同様に、「きど」の変換候補の辞書番号を得る
(A6)。これらの辞書番号から、同音異義語選択部26
は、「後期度」と異なる構造である「高輝度」を新たに
第一候補として、編集制御部22に送り、この結果、図15
(b)のように表示されていた「後期度で表示する」
が、「高輝度で表示する」の表示に変更される。この
際、「高」が高輝度表示され、構造が変更されたことを
使用者に知らせる(A7)。
In the following, referring to the flow chart of FIG. 13, the operation of the homonym synonym selecting section 26 will be described as an example of the case where the user wants to convert Kana-Kanji into "Koukidohyouji". The details will be described. First, this hiragana character string is converted into kana-kanji characters and converted into "display in late stage" and displayed as shown in FIG. 15 (a). At this time, because there are other candidates for homonyms for "Kokikido",
The "late" is underlined to inform the user of it, and the "late" is displayed with high brightness to clearly indicate the structure (independent word + suffix). Further, as described above, the edit control unit 22 issues a request to hold the homonyms and synonyms to the homonyms and synonyms selection unit 26 (A2Yes).
26 is a homonym synonym structure analysis unit 27 and activates the "late stage" appearance position and other candidates having the same structure (for "kouki", {postscript, shining, good opportunity, curiosity, construction period, noble} ,
For "do", {degree, soil, effort, guy, anger, sword}), and a candidate with a different structure (for "kou", {high, after, good,
Fig. 14 shows the heading (Kanji notation) and the dictionary number (identification number added to each entry in the Kana-Kanji conversion dictionary 5) of {luminance, Kido, anger} for "Kudo" and "Kido". As shown in the figure, the homonym synonym structure analysis unit 27 additionally registers in a homophone word buffer incorporated therein in units of structures (A3). Next, the user uses the prefix conversion instruction means of the input unit 21 to make a homonym selection request (specifically, "shift" key and conversion key).
By pressing at the same time, a homonym synonym selection request of another structure is made) (A1Yes), and the edit control unit 22 gives the target "late stage" position information and prefix conversion instruction information, The selection unit 26 is driven. The homonym synonym selection unit 26
The homophone synonym structure analysis unit 27 is activated from the given position information and prefix conversion instruction information, and the homophone word buffer having the instructed structure is searched (A5) to obtain the conversion candidate dictionary number of "Kou". Similarly, the dictionary number of the conversion candidate for "Kido" is obtained (A6). From these dictionary numbers, the homonym selection unit 26
15 sends “high brightness”, which is a structure different from the “late stage”, as a new first candidate to the editing control unit 22. As a result, as shown in FIG.
"Display in late stage" displayed as in (b)
Is changed to the display of "display with high brightness". At this time, "high" is displayed with high brightness to inform the user that the structure has been changed (A7).

【0032】尚、本実施例では、接尾変換指示要求の場
合については省略したが、接頭変換指示要求の場合と同
様に行うことができる。つまり「シフト」キ―が押され
ながら変換キ―が押されると現在表示されている構造と
異なる構造の候補が表示される。また、使用者が初期設
定であらかじめ選択できるようにすることも可能であ
り、随時、使用者の指示により、異なる構造を持つ同音
異義語の構造の選択順序をカ―ソルの移動操作無しにワ
ンタッチで変更することができる。例えば、通常「接頭
語+自立語」の構造を持つ語よりも、「自立語+接尾
語」の構造を持つ語の方が数が多いため、後者を初期設
定としておき、前者を得たいときのみ構造変換指示要求
を出すのである。また、同音異義語の構造選択順序の指
定手段をキ―ボ―トからとして説明を行ったが、マウス
クリックによる選択手段も容易に類推される。
In this embodiment, although the case of the suffix conversion instruction request is omitted, it can be performed in the same manner as the case of the prefix conversion instruction request. In other words, if the conversion key is pressed while the "shift" key is pressed, a structure candidate different from the structure currently displayed is displayed. It is also possible for the user to select in advance by default, and at any time the user can instruct the selection order of homonym structures with different structures with one touch without moving the cursor. Can be changed with. For example, when you want to get the former by setting the latter as the initial setting, there are usually more words with the structure of "independent word + suffix" than the word with the structure of "prefix + independent word". Only the structure conversion instruction request is issued. Further, although the means for designating the structure selection order of homonyms has been described from the keyboard, the selection means by mouse click can be easily inferred.

【0033】さらに、実施例1と実施例2を組み合わせ
たかな漢字変換装置の構成図を図12に示す。入力部21で
入力したかな文字列について、単語検索部9、接続判定
部10により文節候補を作成し、出力決定部11により無意
味な組み合わせによる派生語の変換結果を第1の変換結
果として出力しないための処理を行い、変換結果を表示
部23に出力するのは実施例1と同様である。これらの処
理で得られた変換結果が同音異義語を含む場合には、第
2、第3の候補列とそれらが文章中で現れた位置情報を
同音異義語構造解析部27に保持しておき、入力部21に構
造変換指示要求があった場合に、同音異義語選択部26を
駆動するのは実施例2と同様である。これにより、無意
味な造語を生成して変換候補とすることがなく、しか
も、使用者の意図する変換結果とは異なる構造を持つ派
生語の同音異義語が提示された場合には、ワンタッチで
派生語構造の異なる変換候補を提示させることができる
ので、使用者は非常に少ないキ―操作で意図する変換結
果を得ることができる。
Further, FIG. 12 shows a block diagram of a kana-kanji conversion device in which the first and second embodiments are combined. With respect to the kana character string input by the input unit 21, the word search unit 9 and the connection determination unit 10 create bunsetsu candidates, and the output determination unit 11 outputs the conversion result of the derivative word by the meaningless combination as the first conversion result. As in the first embodiment, the processing for not performing the conversion is performed and the conversion result is output to the display unit 23. If the conversion results obtained by these processes include homonyms, the second and third candidate strings and the position information where they appeared in the sentence are held in the homonym structure analysis unit 27. As in the second embodiment, the homonym synonym selection unit 26 is driven when the input unit 21 receives a structure conversion instruction request. As a result, if a meaningless coined word is not generated and used as a conversion candidate, and if a homonym of a derivative word having a structure different from the conversion result intended by the user is presented, it can be done with one touch. Since conversion candidates having different derivative structures can be presented, the user can obtain an intended conversion result with very few key operations.

【0034】[0034]

【発明の効果】以上説明したように本発明によれば、名
詞と接続可能な接辞の情報の記述量を抑えることがで
き、かつ、接辞を含むかな入力に対して高い変換精度を
得ることができ、また、異なる構造を持つ派生語の同音
異義語の選択を、使用者が容易に行うことができ、文書
作成作業の向上を図ることのできるかな漢字変換装置を
実現できる等実用上多大なる効果が奏せられる。
As described above, according to the present invention, it is possible to suppress the description amount of affix information that can be connected to a noun, and to obtain high conversion accuracy for kana input including an affix. It is also possible to realize a kana-kanji conversion device that allows users to easily select homonyms of derivative words having different structures and improve document creation work. Is played.

【図面の簡単な説明】[Brief description of drawings]

【図1】 第1の発明の一実施例に係るかな漢字変換装
置の機能構成を示したブロック図。
FIG. 1 is a block diagram showing a functional configuration of a kana-kanji conversion device according to an embodiment of the first invention.

【図2】 自立語、接辞などを記憶ておく自立語辞書15
の内容の一部を示した図。
[Fig. 2] Independent word dictionary 15 that stores independent words, affixes, etc.
The figure which showed a part of the content of.

【図3】 自立語の属する分類項目を表している対応テ
―ブル18の内容の一部を示した図。
FIG. 3 is a diagram showing a part of the contents of a correspondence table 18 representing a classification item to which an independent word belongs.

【図4】 分類項目と接辞の接続の可否を表している接
続テ―ブル19の内容の一部を示した図。
FIG. 4 is a diagram showing a part of the contents of a connection table 19 indicating whether or not a classification item and an affix can be connected.

【図5】 本実施例装置に必要な機器の構成を示す図。FIG. 5 is a diagram showing a configuration of equipment necessary for the apparatus of this embodiment.

【図6】 本実施例におけるかな漢字変換処理の候補列
作成処理の流れを示すフロ―チャ―ト。
FIG. 6 is a flow chart showing the flow of a candidate string creation process of the kana-kanji conversion process in this embodiment.

【図7】 本実施例における派生語解析の処理の流れを
示すフロ―チャ―ト。
FIG. 7 is a flowchart showing the flow of processing of derivative word analysis in the present embodiment.

【図8】 入力かな文字列の例を表す図。FIG. 8 is a diagram showing an example of an input kana character string.

【図9】 図8のかな文字列に対する変換候補を表す
図。
9 is a diagram showing conversion candidates for the kana character string in FIG.

【図10】 名詞のクラスタリングの例を示す図。FIG. 10 is a diagram showing an example of clustering of nouns.

【図11】 第2の発明の一実施例に係るかな漢字変換
装置の構成図。
FIG. 11 is a configuration diagram of a kana-kanji conversion device according to an embodiment of the second invention.

【図12】 第1の実施例と第2の実施例とを組み合わ
せたかな漢字変換装置の構成図。
FIG. 12 is a configuration diagram of a kana-kanji conversion device that is a combination of the first embodiment and the second embodiment.

【図13】 図11の同音異義語選択部26の動作を示すフ
ロ―チャ―ト。
FIG. 13 is a flowchart showing the operation of the homonym synonym selection unit 26 of FIG.

【図14】 図11の同音異義語解析部27の同音語バッフ
ァの内容の一例を示す図。
14 is a diagram showing an example of the contents of a homophone word buffer of the homonym synonym analysis unit 27 of FIG. 11. FIG.

【図15】 本実施例における画面表示例を示す図。FIG. 15 is a diagram showing a screen display example according to the present embodiment.

【図16】 「しんぎじゅつ」に対する同音異義語の候
補列を表す図。
FIG. 16 is a view showing a candidate string of homonyms for “Shinjujutsu”.

【符号の説明】[Explanation of symbols]

1 入力部 2 入力制御部 3 CPU 4 表示制御部 5 表示部 6 ROM 7 RAM 8 文字入力部 9 単語検索部 10 接続判定部 11 出力決定部 12 出力部 13 入力バッファ 14 作業バッファ 15 自立語辞書 16 付属語辞書 17 付属語連接テ―ブル 18 対応テ―ブル 19 接続テ―ブル 20 出力バッファ 21 入力部 22 編集制御部 23 表示部 24 かな漢字変換装置 25 かな漢字変換辞書 26 同音異義語選択部 27 同音異義語構造解析部 1 input unit 2 input control unit 3 CPU 4 display control unit 5 display unit 6 ROM 7 RAM 8 character input unit 9 word search unit 10 connection determination unit 11 output determination unit 12 output unit 13 input buffer 14 work buffer 15 independent word dictionary 16 Adjunct dictionary 17 Adjunct concatenation table 18 Correspondence table 19 Connection table 20 Output buffer 21 Input section 22 Edit control section 23 Display section 24 Kana-Kanji conversion device 25 Kana-Kanji conversion dictionary 26 Homophones Synonym selection unit 27 Homophones Word structure analysis section

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 文章の読みを入力する入力手段と、 自立語、接辞、及び付属語について、読みに対応する漢
字かな表記及び文法情報を記憶する辞書と、 各自立語が属する分類項目を記憶する第1の記憶手段
と、 前記分類項目と接辞との接続関係を記憶する第2の記憶
手段と、 前記入力手段により入力された読みから前記辞書を検索
して抽出される自立語の分類項目を前記第1の記憶手段
より検出し、検出された分類項目の接辞との接続関係を
前記第2の記憶手段より調べて、入力された読みを漢字
かな混じりの文章に変換する手段とを具備することを特
徴とするかな漢字変換装置。
1. An input means for inputting a reading of a sentence, a dictionary for storing kanji and kana notation and grammatical information corresponding to the reading of independent words, affixes and adjuncts, and a classification item to which each independent word belongs. First storage means, a second storage means for storing the connection relation between the classification item and an affix, and a classification item for an independent word extracted by searching the dictionary from the reading input by the input means. Is detected from the first storage means, the connection between the detected classification item and the affix is checked from the second storage means, and the input reading is converted into a sentence containing kanji and kana. A kana-kanji conversion device characterized by doing.
【請求項2】 文章の読みを入力する入力手段と、 読みと漢字かな表記とを対応づけて記憶する辞書と、 この辞書を参照して前記入力手段により入力された読み
を漢字かな混じりの文章に変換するかな漢字変換手段
と、 このかな漢字変換手段による変換結果を表示する表示手
段と、 前記変換結果の同音異義語を保持する保持手段と、 前記変換結果の構造の切り換えを指示する指示手段と、 この指示手段の指示により、前記表示手段に表示された
変換結果と異なる構造を持つ同音異義語を前記保持手段
から取り出して表示する手段を具備することを特徴とす
るかな漢字変換装置。
2. An input means for inputting a reading of a sentence, a dictionary for storing the reading and a kanji kana notation in association with each other, and a sentence containing kanji and kana for the reading input by the input means with reference to this dictionary. A kana-kanji conversion means for converting to kana-kanji conversion means, a display means for displaying the conversion result by the kana-kanji conversion means, a holding means for holding homonyms of the conversion result, and an instructing means for instructing switching of the structure of the conversion result, A kana-kanji conversion device comprising means for extracting a homonym having a structure different from the conversion result displayed on the display means from the holding means and displaying the same in response to an instruction from the instruction means.
JP3227653A 1991-09-09 1991-09-09 Kana/kanji converter Pending JPH0567074A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3227653A JPH0567074A (en) 1991-09-09 1991-09-09 Kana/kanji converter

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3227653A JPH0567074A (en) 1991-09-09 1991-09-09 Kana/kanji converter

Publications (1)

Publication Number Publication Date
JPH0567074A true JPH0567074A (en) 1993-03-19

Family

ID=16864237

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3227653A Pending JPH0567074A (en) 1991-09-09 1991-09-09 Kana/kanji converter

Country Status (1)

Country Link
JP (1) JPH0567074A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100715166B1 (en) * 2000-04-06 2007-05-11 쓰리엠 이노베이티브 프로퍼티즈 캄파니 Electrostatically assisted coating method and apparatus with focused web charge field

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100715166B1 (en) * 2000-04-06 2007-05-11 쓰리엠 이노베이티브 프로퍼티즈 캄파니 Electrostatically assisted coating method and apparatus with focused web charge field

Similar Documents

Publication Publication Date Title
KR20010024309A (en) Reduced keyboard disambiguating system
JPH11238051A (en) Chinese input conversion processor, chinese input conversion processing method and recording medium stored with chinese input conversion processing program
JPH07334499A (en) Input device for character string
JPH0567074A (en) Kana/kanji converter
JPS62197864A (en) Language information offering device
JP2537991B2 (en) Character input device and method
JPS628259A (en) Kana (japanese syllabary)-kanji (chinese character) converting system
JP2634596B2 (en) Kana-Kanji conversion device
JPH08335217A (en) Reading converting method and document preparation device
JPS58159133A (en) Kana (japanese syllabary)-to-kanji (chinese character) conversion processing system
JPH08272780A (en) Processor and method for chinese input processing, and processor and method for language processing
JP2542670B2 (en) Word processor
JPH05165805A (en) Japanese syllabary/chinese character converter
JPH0610804B2 (en) Kana-Kanji converter
JPH07287715A (en) Device for retrieving and specifying character string
JPH0468466A (en) Kana / kanji converting device
JPS619757A (en) Kana-to-kanji conversion processor
JPH08320867A (en) Single-chinese-character conversion device
JPS6072014A (en) "kana"-"kanji" converting device
JPH02115974A (en) Language retriever
JPH0798702A (en) Document preparing device
JPH08147282A (en) Device and method for kana/kanji conversion
JPH07160700A (en) Method and device for processing document
JPH0973460A (en) Document retrieval device
JPS6320570A (en) Machine translation system