JP2000010964A - Chinese input conversion processor, chinese input conversion processing method and recording medium recording chinese input conversion processing program - Google Patents

Chinese input conversion processor, chinese input conversion processing method and recording medium recording chinese input conversion processing program

Info

Publication number
JP2000010964A
JP2000010964A JP10169995A JP16999598A JP2000010964A JP 2000010964 A JP2000010964 A JP 2000010964A JP 10169995 A JP10169995 A JP 10169995A JP 16999598 A JP16999598 A JP 16999598A JP 2000010964 A JP2000010964 A JP 2000010964A
Authority
JP
Japan
Prior art keywords
tone
dictionary
input
conversion candidate
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10169995A
Other languages
Japanese (ja)
Inventor
Takao Azuma
隆夫 東
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP10169995A priority Critical patent/JP2000010964A/en
Publication of JP2000010964A publication Critical patent/JP2000010964A/en
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

PROBLEM TO BE SOLVED: To obtain a desired conversion candidate without the need of correction of input even if voice tone is erroneously inputted at a voice tone present mode. SOLUTION: A means 12a consulting a dictionary with voice tone and a means 12b consulting the dictionary without voice tone are provided. When a read character string is inputted from an input device 16 with pin-in with voice tone, a CPU 11 retrieves a conversion candidate from a Chinese dictionary 14 by using the means 12a consulting the dictionary with voice tone. Thus, the CPU outputs the conversion candidate by dictionary consultation by ignoring voice tone by using the means 12b consulting the dictionary without voice tone when the pertinent conversion candidate cannot be obtained. Thus, the desired conversion candidate can be obtained from a dictionary consultation result ignoring voice tone even if erroneous voice tone is inputted.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、中国語文書の作成
に用いられる中国語ワードプロセッサ等の中国語入力変
換処理装置に係り、特に声調付きピンインで読み文字列
を入力して変換候補を得る場合に用いて好適な中国語入
力変換処理装置と、同装置に用いられる中国語入力変換
処理方法、中国語入力変換処理プログラムを記録した記
録媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a Chinese input conversion device such as a Chinese word processor used for creating a Chinese document, and particularly to a case where a reading character string is input by using a pinyin with a tone to obtain a conversion candidate. The present invention relates to a Chinese input conversion processing device suitable for use in a personal computer, a Chinese input conversion processing method used in the device, and a recording medium recording a Chinese input conversion processing program.

【0002】[0002]

【従来の技術】従来、中国語ワードプロセッサ等の中国
語入力変換処理装置では、中国語の漢字とその読みを表
す表音記号(以下、ピンインと称す)とを対応付けた辞
書を用い、中国語の読みをピンインで入力し、これを漢
字に変換して出力する機能を備えている。これをピンイ
ン漢字変換機能(日本語ワードプロセッサのかな漢字変
換機能に相当)と呼ぶ。
2. Description of the Related Art Conventionally, a Chinese input conversion processing device such as a Chinese word processor uses a dictionary in which Chinese kanji and phonetic symbols (hereinafter referred to as pinyin) representing their readings are associated with each other. It is equipped with a function to input the Yomi reading in Pinyin, convert it into Kanji and output it. This is called the Pinyin Kanji conversion function (corresponding to the Kana-Kanji conversion function of a Japanese word processor).

【0003】ここで、中国語では、1つの漢字の発音は
必ず1音節になっている。1つの音節はさらに「声母」
と呼ばれる先頭子音(音節の先頭にくる子音)と、「韻
母」と呼ばれる「声母」を除いた部分(母音、二重母
音、鼻音化母音などがある)とで構成されている。
Here, in Chinese, the pronunciation of one kanji is always one syllable. One syllable is also "voice mother"
It is composed of the first consonant (consonant at the beginning of a syllable) and the part excluding the “vowel” called “final vowel” (including vowels, diphthongs, and nasal vowels).

【0004】ピンイン入力方式では、このような声母と
韻母をアルファベットで入力することになる。ところ
が、中国語では、同じピンインを持つ漢字が複数存在す
ることがあり、ピンインだけを入力して変換を行なって
も、ユーザが意図する漢字を第1の変換候補として必ず
しも得られないことがある。
In the Pinyin input method, such initials and finals are input in alphabets. However, in Chinese, there may be a plurality of kanjis having the same pinyin, and even if only pinyin is input and converted, the kanji intended by the user may not always be obtained as the first conversion candidate. .

【0005】そこで、このような問題を解決するため
に、ピンイン表記と合わせて、音節の抑揚を表わす「四
声」と呼ばれる声調記号を入力することにより、ユーザ
が意図する変換候補を提示する方法が一般的に採られて
いる。
[0005] In order to solve such a problem, a method of presenting a conversion candidate intended by a user by inputting a tone symbol called “four voices” representing inflection of syllables together with pinyin notation. Is generally adopted.

【0006】声調には、基本的なものが4つあり、これ
を四声(しせい)と呼ぶ。そのうち、音を同じ高さで伸
ばすものを第1声、上げるものを第2声、曲げるものを
第3声、下げるものを第4声という。同じ音節でも声調
が異なれば、漢字も意味も異なってくる。なお、この他
に、短く軽く発音する「軽声」と呼ばれる声調もある。
[0006] There are four basic tones, which are called four tones. Of these, the one that extends the sound at the same pitch is called the first voice, the one that raises the sound is the second voice, the one that bends it is the third voice, and the one that lowers it is the fourth voice. If the tone of the same syllable is different, the kanji and meaning will be different. In addition, there is also a tone called "light tone" which is pronounced short and light.

【0007】例えば音節[qi]は、以下のようにな
る。 第1声…[期] 第2声…[奇] 第3声…[起] 第4声…[器] このように、発音表記(ピンイン)から中国語の漢字に
変換する際の変換率を高めるため、ピンインの他に四声
を示す声調情報を併せて入力することが一般的に行われ
ている。
For example, the syllable [qi] is as follows. The first voice ... [period] The second voice ... [odd] The third voice ... [ki] The fourth voice ... [container] Thus, the conversion rate when converting from phonetic notation (pinyin) to Chinese kanji is In order to increase the tone, it is common to input tone information indicating four voices in addition to pinyin.

【0008】なお、中国語の発音と声調を入力する方式
として、上述したようにピンイン(中国語のラテンアル
ファベット表記)と声調を文字列で入力する方式(主に
大陸で用いられる)とは別に、キーボード上に刻印され
た注音記号と声調記号をキー入力する方式(主に台湾な
どで用いられる)があるが、ここでは、発音と声調を文
字列で入力するピンイン入力方式を前提として説明す
る。
As a method for inputting Chinese pronunciation and tone, apart from pinyin (Chinese Latin alphabet notation) and a method for inputting tone as a character string as described above (mainly used on continents), There is a method of key input of note marks and tone marks imprinted on a keyboard (mainly used in Taiwan, etc.), but here, a description will be made assuming a Pinyin input method of inputting pronunciation and tone as a character string. .

【0009】また、漢字変換の単位も様々であり、単漢
字を対象としたもの、単語単位(日本語で言う熟語単
位)の変換を行うもの、ある程度の文法解析を行い、文
節程度はまとまった入力のできるものなどが存在してい
る。
Also, the unit of kanji conversion is various, one for single kanji, one for conversion in word units (units of idioms in Japanese), some grammatical analysis is performed, and phrases are united. There are things that can be entered.

【0010】ピンインを漢字に変換する際に、上記いず
れの変換単位(単漢字、熟語、文節など)であっても、
ピンインと声調を与えて、これにより辞書を引くモード
(声調ありモード)と、ピンインのみを与えて、これに
より辞書を引くモード(声調なしモード)の2種類のモ
ードが存在している。
When converting Pinyin to Kanji, any of the above conversion units (single Kanji, idiom, phrase, etc.)
There are two types of modes: a mode in which a pinyin and tone are given and a dictionary is referred to thereby (tone mode), and a mode in which only Pinyin is given and the dictionary is referred to (toneless mode).

【0011】中国語の場合、漢字毎に読みと声調が原則
として一意に決まるため(意味が異なれば違う声調や読
みになったり、一部の単語中では声調が変化することは
ある)、声調入力を行った方が変換効率は良くなる。し
たがって、通常は、声調付きで入力するモードを備えて
いる。
In the case of Chinese, the pronunciation and tone are uniquely determined in principle for each kanji (different meanings may lead to different tones and readings, and in some words the tone may change). The conversion efficiency is better when the input is performed. Therefore, a mode for inputting with a tone is usually provided.

【0012】[0012]

【発明が解決しようとする課題】上記したように、従
来、変換効率を高めるため、読み文字列を声調付きのピ
ンインで入力することが行われている。しかしながら、
中国語に不慣れな外国人などは、ピンインの声調まで、
正確に標準語(大陸では「普通話」、台湾では「國
語」)のものを覚えているわけではない。このため、し
ばしば標準語の辞書にはない間違った声調を入力した
り、あるいは、声調が分からないためにピンインのみを
入力する、といったことが起こり得る。
As described above, conventionally, in order to increase the conversion efficiency, a character string to be read is input by pinyin with tone. However,
For foreigners unfamiliar with Chinese, such as Pinyin,
I don't exactly remember the standard language ("ordinary" on the continent, "national" on Taiwan). For this reason, it is often possible to input an incorrect tone that is not in the dictionary of standard words, or to input only Pinyin because the tone is not known.

【0013】この場合、ユーザが最初から声調なしモー
ドで指定し、ピンインのみを入力していれば問題ないが
(変換候補の数は増える)、例えば声調ありモードの状
態で、間違った声調を入力してしまうと、その声調を基
づいて辞書引きが行われるため、所望の変換候補が得ら
れなかったり、エラー(候補なし)になるかのどちらか
である。
In this case, there is no problem if the user designates in the toneless mode from the beginning and inputs only Pinyin (the number of conversion candidates increases). For example, in the state of the toneless mode, an incorrect tone is input. Then, since the dictionary is searched based on the tone, either a desired conversion candidate cannot be obtained or an error (no candidate) occurs.

【0014】また、声調ありモードにおいて、ユーザが
声調なしでピンインを入力し、その後に単語としての数
字を入力すると、システム側では、その数字を声調が入
力されたものと解釈し、間違った辞書引きをしてしまう
ことも考えられる。
In the tone mode, if the user inputs Pinyin without tone and then enters a number as a word, the system interprets the number as having tone input and outputs an incorrect dictionary. It is also possible to pull.

【0015】このように、従来は、声調ありで入力しよ
うとして、声調を間違えた場合には声調なしの入力モー
ドに切り替えて改めて入力し直すか、声調を訂正して再
入力しなければならなかった。
As described above, conventionally, when an attempt is made to input with a tone and the tone is mistaken, the user must switch to the input mode without tone and re-input, or correct the tone and re-input. Was.

【0016】また、声調記号を数字で入力するシステム
では、声調なしで数字を入力すると、声調との区別が付
かず、所望の変換候補を得ることができないなどの問題
があった。
Further, in a system for inputting a tone symbol by a number, there is a problem that if a number is input without a tone, the tone cannot be distinguished from the tone and a desired conversion candidate cannot be obtained.

【0017】本発明は上記のような点に鑑みなされたも
ので、声調ありモードで声調を間違って入力した場合で
も、入力の訂正操作を必要とせずに所望の変換候補を得
ることができ、また、声調ありモードで声調を入力せず
に数字を入力した場合でも、所望の変換候補を得ること
ができる中国語入力変換処理装置、中国語入力変換処理
方法、中国語入力変換処理プログラムを記録した記録媒
体を提供することを目的とする。
The present invention has been made in view of the above points, and even when a tone is erroneously input in the tone mode, a desired conversion candidate can be obtained without requiring an input correction operation. In addition, a Chinese input conversion processing device, a Chinese input conversion processing method, and a Chinese input conversion processing program capable of obtaining a desired conversion candidate even when a number is input without inputting a tone in the tone mode are recorded. It is an object of the present invention to provide a recording medium that has been used.

【0018】[0018]

【課題を解決するための手段】本発明の中国語入力変換
処理装置は、入力された声調付きのピンインに基づいて
中国語辞書から該当する見出しを変換候補として検索
し、この辞書引きによって変換候補が得られなかった場
合に、声調を無視してピンインのみに基づいて上記中国
語辞書から該当する見出しを変換候補として検索し、こ
の辞書引きによって得られた変換候補を出力するように
したものである(請求項1)。
SUMMARY OF THE INVENTION A Chinese input conversion processing device of the present invention searches a Chinese dictionary as a conversion candidate for a corresponding heading from a Chinese dictionary based on an input tone with a tone, and converts the dictionary to a conversion candidate. Is not obtained, the tone is disregarded, the corresponding headline is searched as a conversion candidate from the Chinese dictionary based on only Pinyin based on Pinyin, and the conversion candidate obtained by this dictionary lookup is output. (Claim 1).

【0019】このような構成によれば、声調付きピンイ
ンで読み文字列を入力する場合において、声調付きの辞
書引きにより変換候補が得られなかった際に、その声調
を無視した辞書引きが行われ、この辞書引きによって得
られた変換候補が出力される。したがって、間違った声
調を入力した場合でも、その声調を無視した辞書引き結
果から所望の変換候補を得ることができる。
According to such a configuration, in the case of inputting a character string to be read using a tone-added pinyin, when a conversion candidate cannot be obtained by a tone-added dictionary, a dictionary lookup ignoring the tone is performed. , The conversion candidates obtained by this dictionary lookup are output. Therefore, even when an incorrect tone is input, a desired conversion candidate can be obtained from the dictionary lookup result ignoring the tone.

【0020】また、本発明の中国語入力変換処理装置
は、声調を無視して得られた変換候補に基づいて、当該
声調を数字と見なした変換候補を作成することにより、
声調を無視して得られた変換候補と、当該声調を数字と
見なした変換候補とを出力するようにしたものである
(請求項2)。
Further, the Chinese input conversion processing device of the present invention creates a conversion candidate in which the tone is regarded as a numeral based on the conversion candidate obtained by ignoring the tone.
A conversion candidate obtained by ignoring a tone and a conversion candidate in which the tone is regarded as a numeral are output (claim 2).

【0021】このような構成によれば、声調付きピンイ
ンで読み文字列を入力する場合において、声調付きの辞
書引きにより変換候補が得られなかった際に、その声調
を無視した辞書引きが行われ、そのとき得られた変換候
補に基づいて当該声調を数字と見なした変換候補が作成
され、声調を無視した変換候補と共に出力される。した
がって、声調ではなく、数字を入力した場合でも、その
声調を無視した辞書引き結果から所望の変換候補を得る
ことができる。
According to such a configuration, in the case of inputting a reading character string with a tone-added pinyin, when a conversion candidate cannot be obtained by a tone-added dictionary, a dictionary lookup ignoring the tone is performed. Then, based on the conversion candidates obtained at that time, a conversion candidate in which the tone is regarded as a numeral is created and output together with the conversion candidate ignoring the tone. Therefore, even when a number is input instead of a tone, a desired conversion candidate can be obtained from a dictionary lookup result ignoring the tone.

【0022】また、本発明の中国語入力変換処理装置
は、入力された声調付きのピンインに基づいて中国語辞
書から該当する見出しを変換候補として検索すると共
に、声調を無視してピンインのみに基づいて上記中国語
辞書から該当する見出しを変換候補として検索し、これ
らの辞書引きによって得られた各変換候補を出力するよ
うにしたものである(請求項3)。
Further, the Chinese input conversion processing device of the present invention searches a corresponding dictionary as a conversion candidate from the Chinese dictionary on the basis of the input pinyin with tone, and ignores the tone and bases only on pinyin. Then, a corresponding headline is searched as a conversion candidate from the Chinese dictionary, and each conversion candidate obtained by these dictionary lookups is output (claim 3).

【0023】このような構成によれば、声調付きで読み
文字列を入力する場合において、声調を間違って入力し
た際に、声調付きの辞書引きにより、たまたま声調が一
致した別の変換候補が得られたとしても、その声調を無
視した辞書引きによって、正しい変換候補を得ることが
できる。
According to such a configuration, in the case of inputting a reading character string with a tone, when a tone is erroneously input, another conversion candidate whose tone coincides by chance is obtained by dictionary lookup with a tone. Even if it is, a correct conversion candidate can be obtained by dictionary lookup ignoring the tone.

【0024】さらに、上記各構成において、声調を無視
した辞書引きにより、複数の変換候補が得られた場合
に、それらの変換候補に付随された声調と指定された元
の声調との関係に基づいて各変換候補に順位付けを行う
ことで(請求項4)、最も確からしい変換候補を優先的
に出力することができる。
Further, in each of the above-described configurations, when a plurality of conversion candidates are obtained by dictionary lookup ignoring the tone, a plurality of conversion candidates are obtained based on the relationship between the tone attached to the conversion candidates and the specified original tone. By ranking the conversion candidates in this way (claim 4), the most probable conversion candidates can be output with priority.

【0025】また、声調を無視せずに得られた変換候補
と、声調を無視して得られた変換候補とを区別して出力
することで(請求項5)、どちらがユーザの入力した候
補であるのかを明示することができる。
Further, by converting and outputting conversion candidates obtained without ignoring the tone and conversion candidates obtained without ignoring the tone (claim 5), which is the candidate input by the user. Can be specified.

【0026】[0026]

【発明の実施の形態】以下、図面を参照して本発明の実
施形態を説明する。図1は本発明の中国語入力変換処理
装置のシステム構成を示すブロック図である。本装置
は、アルファベットのピンインを入力して中国語変換を
行うものである。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing the system configuration of the Chinese input conversion processing device of the present invention. This device is for inputting alphabetic pinyin and performing Chinese conversion.

【0027】なお、本実施形態における中国語入力変換
処理装置は、例えば磁気ディスク等の記録媒体に記録さ
れたプログラムを読み込み、このプログラムによって動
作が制御されるコンピュータによって実現される。
Note that the Chinese input conversion processing device according to the present embodiment is realized by a computer which reads a program recorded on a recording medium such as a magnetic disk and the operation of which is controlled by the program.

【0028】図1に示すように、本実施形態における中
国語入力変換処理装置は、CPU11、ROM12、R
AM13、中国語辞書14、学習テーブル15、入力装
置16、表示装置17、外部記憶装置18、印刷装置1
9、通信装置20によって構成される。
As shown in FIG. 1, a Chinese input conversion processing device according to this embodiment includes a CPU 11, a ROM 12,
AM 13, Chinese dictionary 14, learning table 15, input device 16, display device 17, external storage device 18, printing device 1
9. The communication device 20 is configured.

【0029】CPU11は、本装置の動作全体を制御す
るものであり、ROM12に格納されたプログラムの起
動で動作する。なお、ROM12に格納されたプログラ
ムに基づいて実現される機能としては、アプリケーショ
ンプログラムによるワードプロセッサ等がある。
The CPU 11 controls the entire operation of the present apparatus, and operates by starting a program stored in the ROM 12. Note that the functions realized based on the program stored in the ROM 12 include a word processor based on an application program.

【0030】ROM12は、本装置で使用される各種プ
ログラムやフォント(中国語フォントを含む)等のデー
タを格納している。このROM12には、声調ありで辞
書引きを行うためのプログラム1を格納したプログラム
領域12a、声調なしで辞書引きを行うためのプログラ
ム2を格納したプログラム領域12b、声調に関するル
ールを格納した声調ルール領域12cなどが設けられて
いる。なお、声調ルールについては、後に具体例を挙げ
て詳しく説明する。
The ROM 12 stores data such as various programs and fonts (including Chinese fonts) used in the apparatus. The ROM 12 has a program area 12a storing a program 1 for performing dictionary lookup with tone, a program area 12b storing a program 2 for performing dictionary lookup without tone, and a tone rule area storing rules relating to tone. 12c is provided. The tone rules will be described later in detail with specific examples.

【0031】RAM13は、本装置の処理動作に必要な
データを格納する。このRAM13には、文書作成のた
めに入力された中国語漢字の読みであるピンイン文字列
を格納するための入力バッファ13a、ピンイン漢字変
換によって得られた変換候補を格納するための候補バッ
ファ13b、ピンイン漢字変換によって得られた中国語
漢字からなる文書データを格納するための文書バッファ
13cなどが設けられている。
The RAM 13 stores data necessary for the processing operation of the apparatus. The RAM 13 has an input buffer 13a for storing a Pinyin character string that is a Chinese kanji reading input for document creation, a candidate buffer 13b for storing a conversion candidate obtained by the Pinyin kanji conversion, A document buffer 13c for storing document data composed of Chinese kanji obtained by the Pinyin kanji conversion is provided.

【0032】中国語辞書14は、ピンイン表記の読みと
声調、見出し、品詞など、ピンイン漢字変換処理に必要
な情報を記憶している(図2参照)。学習テーブル15
は、ユーザが入力した声調の誤りを統計的に学習するた
めのものである(図3参照)。この中国語辞書14と学
習テーブル15は、例えば外部記憶装置18あるいはR
AM13に設けられる。
The Chinese dictionary 14 stores information necessary for Pinyin kanji conversion processing, such as reading of Pinyin notation, tone, headline, part of speech, and the like (see FIG. 2). Learning table 15
Is for statistically learning the tone error input by the user (see FIG. 3). The Chinese dictionary 14 and the learning table 15 are stored in, for example, the external storage device 18 or R
It is provided in AM13.

【0033】入力装置16は、キーボードからなり、本
装置に対する指示やデータの入力を行うものであり、中
国語の読み表記であるピンイン文字列や声調の入力、そ
の入力された声調付きピンイン文字列に対するピンイン
漢字変換指示(「変換」キーの操作による指示)などを
行うためのものである。
The input device 16 is composed of a keyboard and is used to input instructions and data to the device. The input device 16 is used to input a Pinyin character string or tone which is a Chinese reading notation, and the inputted Pinyin character string with tone. To perform a Pinyin Kanji conversion instruction (an instruction by operating a “Conversion” key).

【0034】表示装置17は、例えばCRT (Cathode
Ray Tube) やLCD (Liquid Crystal Display) からな
り、入力装置13を通じて入力された声調付きピンイン
文字列やピンイン漢字変換結果などの表示を行う。
The display device 17 is, for example, a CRT (Cathode
It comprises a Ray Tube) and an LCD (Liquid Crystal Display), and displays a Pinyin character string with tone and a Pinyin Kanji conversion result input through the input device 13.

【0035】外部記憶装置18は、例えばHDD (Hard
Disk Drive)やCD−ROM (Compact Disc Read Only
Memory)からなり、各種プログラムや文書などのデータ
を保存する。この外部記憶装置18には、ワードプロセ
ッサを実現するためのアプリケーションプログラムの
他、ピンイン漢字変換処理で使用する辞書などのデータ
も含まれる。
The external storage device 18 is, for example, an HDD (Hard
Disk Drive) and CD-ROM (Compact Disc Read Only)
Memory), which stores data such as various programs and documents. The external storage device 18 includes data such as a dictionary used in Pinyin kanji conversion processing in addition to an application program for implementing a word processor.

【0036】印刷装置19は、文書の印刷等を行うため
に用いられる。この印刷装置16としては、本装置に内
蔵されたものでも、外付けにて接続されるものでも良
い。また、通信装置20は、例えば構内LAN (Local
Area Network) や通信ネットワーク等を介して外部装置
とのデータの送受信制御を行う。
The printing device 19 is used for printing a document and the like. The printing device 16 may be built in the printing apparatus or may be connected externally. The communication device 20 is, for example, a private LAN (Local
It controls the transmission and reception of data with external devices via an Area Network) or a communication network.

【0037】図2は中国語辞書14の構成を示す図であ
る。中国語辞書14は、ピンイン漢字変換処理に必要な
単語情報を記憶した辞書であって、ピンイン表記の読み
と声調、見出し、品詞の他、頻度情報や学習情報などの
属性情報からなる。
FIG. 2 is a diagram showing the structure of the Chinese dictionary 14. The Chinese dictionary 14 is a dictionary in which word information necessary for the Pinyin kanji conversion process is stored, and is composed of attribute information such as frequency information and learning information in addition to reading of Pinyin notation, tone, headline, part of speech, and the like.

【0038】なお、ここでは、第1声から第4声、およ
び、軽声(第5声)の声調情報を1〜5までの数字で表
すものとする。また、頻度情報は、単語の使用頻度を示
すものであり、数値が多いほど、その単語の使用頻度が
高いことを示している。学習情報は、単語の出力順位を
示すものであり、その単語が選択されたときに“1”に
なり、別の単語が選択されたら、それを“1”にして、
今まで“1”だったものは“2”といったように順位を
下げていく。
Here, it is assumed that the tone information of the first to fourth voices and the light voice (fifth voice) is represented by numerals 1 to 5. The frequency information indicates the frequency of use of a word, and indicates that the greater the numerical value, the higher the frequency of use of the word. The learning information indicates the output order of the word, and becomes "1" when the word is selected, and is set to "1" when another word is selected.
What was "1" until now will be reduced to "2".

【0039】図2の例では、声調付きのピンイン表記に
て読み「guan1/li3」(“/”は音節の切れ目
を示すものであり、実際には存在しない)と、見出し
「歓礼」などの情報が予め登録されている。
In the example of FIG. 2, reading “guan1 / li3” (“/” indicates a syllable break and does not actually exist) in the Pinyin notation with a tone and the heading “Journey” Is registered in advance.

【0040】同様に、読み「guan1/li4」と見
出し「官吏」等の情報、読み「guan3/li3」と
見出し「管理」等の情報、読み「guan4/li4」
と見出し「慣例」等の情報、読み「zheng1/fu
2」と見出し「征服」等の情報、読み「zheng4/
fu3」と「政府」等の情報、読み「zheng4/f
u4」と見出し「正負」等の情報が登録されている。
Similarly, information such as the reading "guan1 / li4" and the heading "official", information such as the reading "guan3 / li3" and the heading "Management", and the reading "guan4 / li4"
And information such as the heading "conventional" and reading "zheng1 / fu"
Information such as "2" and the heading "Conquest", and reading "zheng4 /
Information such as "fu3" and "government", read "zheng4 / f"
u4 "and information such as a heading" positive / negative "are registered.

【0041】図3は学習テーブル15の構成を示す図で
ある。学習テーブル15は、ユーザが入力した声調の誤
りを統計的に学習するためのものであり、辞書の正しい
声調とユーザが最初に入力した声調とを比較する構成に
なっている。
FIG. 3 is a diagram showing a configuration of the learning table 15. The learning table 15 is for statistically learning the tone error input by the user, and is configured to compare the correct tone in the dictionary with the tone input first by the user.

【0042】この場合、ユーザが学習テーブル15に登
録されている声調とは異なる入力をする毎に、該当欄の
数値を“1”ずつ増加していくものとする。これによ
り、ユーザが本システムを使い込んでくると、「ユーザ
が辞書上の正しい声調を別の声調に間違って入力した度
合い」に応じた数値が欄内に設定される。
In this case, each time the user makes an input different from the tone registered in the learning table 15, the numerical value in the corresponding column is increased by "1". Thus, when the user uses the present system, a numerical value corresponding to “the degree to which the user incorrectly inputs a correct tone on the dictionary to another tone” is set in the column.

【0043】なお、この学習テーブル15を用いた学習
方法については、後に具体例を挙げて詳しく説明する。
次に、同実施形態の動作を説明する。
The learning method using the learning table 15 will be described later in detail with a specific example.
Next, the operation of the embodiment will be described.

【0044】ここでは、発音はピンイン、声調は数字で
入力するピンイン−漢字変換システムを想定して説明す
る。図4は読み入力から変換結果を出力するまでの全体
の流れを示すフローチャートである。
Here, a description will be given assuming a Pinyin-Kanji conversion system in which the pronunciation is Pinyin and the tone is numerical input. FIG. 4 is a flowchart showing the entire flow from reading input to output of a conversion result.

【0045】ユーザが入力装置16を操作して、変換対
象となる読み文字列をピンイン入力し(ステップA1
1)、「変換」キーの押下により変換指示を行うと(ス
テップA12のYes)、CPU11はその入力された
読み文字列(ピンイン)に基づいてピンイン漢字変換処
理を実行する(ステップA13)。具体的には、中国語
辞書14を参照して、読みとして入力されたピンインに
対応する見出しを中国語辞書14から検索し、これを変
換候補として取得する処理を行う。
The user operates the input device 16 to pinyin input a reading character string to be converted (step A1).
1), when a conversion instruction is issued by pressing the "Conversion" key (Yes in step A12), the CPU 11 executes a Pinyin Kanji conversion process based on the input read character string (Pinyin) (step A13). Specifically, with reference to the Chinese dictionary 14, a process is performed to search the Chinese dictionary 14 for a heading corresponding to the pinyin input as a reading, and to acquire this as a conversion candidate.

【0046】ここで、声調ありモードであれば、読み文
字列としてピンインと共に入力された声調の情報も含め
て中国語辞書14を検索し、該当する単語の見出しを変
換候補として取得することになるが、声調が誤って入力
されている場合あるいは声調ではなく、数字として入力
されている場合には、正しい変換候補を得ることはでき
ない。本発明では、このような場合でも、ユーザが望む
変換候補を取得可能とするものであり、その処理動作を
後に図6を参照した説明する。
Here, in the tone mode, the Chinese dictionary 14 is searched including the tone information input together with the pinyin as a read character string, and the heading of the corresponding word is obtained as a conversion candidate. However, if the tone is erroneously input or if the tone is not a tone but is input as a number, a correct conversion candidate cannot be obtained. In the present invention, even in such a case, a conversion candidate desired by the user can be obtained, and the processing operation will be described later with reference to FIG.

【0047】ピンイン漢字変換処理によって複数の変換
候補が得られると(ステップA14のYes)、それら
の変換候補が表示され、その中からユーザが所望の変換
候補を選択することにより(ステップA15)、その選
択候補が当該読み文字列に対する変換結果として出力さ
れる(ステップA17)。
When a plurality of conversion candidates are obtained by the Pinyin kanji conversion process (Yes in step A14), the conversion candidates are displayed, and the user selects a desired conversion candidate from among them (step A15). The selection candidate is output as a conversion result for the read character string (step A17).

【0048】また、変換候補の中に所望の候補がなく、
ユーザが当該入力読み文字列を訂正する操作(再入力)
を行った際に(ステップA16のYes)、CPU11
はそのときの声調が誤りであったとして、その誤った声
調と中国語辞書14上の正しい声調とを比較分析して、
学習テーブル15を更新する処理(学習処理)を行う
(ステップA19)。なお、このときの学習処理につい
ては、後に具体例を挙げて説明する。
Also, there is no desired candidate among the conversion candidates,
Operation to correct the input character string by the user (re-input)
(Yes in step A16), the CPU 11
Considers that the tone at that time was wrong, compares and analyzes the erroneous tone with the correct tone on the Chinese dictionary 14,
A process of updating the learning table 15 (learning process) is performed (step A19). The learning process at this time will be described later with a specific example.

【0049】また、上記ステップA14において、変換
候補が得られた場合には、CPU11はエラーメッセー
ジを表示するなどして(ステップA18)、ここでの処
理を終える。
If a conversion candidate is obtained in step A14, the CPU 11 displays an error message (step A18) and terminates the processing.

【0050】次に、図5を参照して上記ステップA13
のピンイン漢字変換処理について詳しく説明する。図5
はピンイン漢字変換処理の動作を示すフローチャートで
ある。
Next, referring to FIG.
Will be described in detail. FIG.
9 is a flowchart showing the operation of the Pinyin Kanji conversion process.

【0051】まず、声調ありモードを前提として、CP
U11は辞書引きプログラム1を用いて、入力された読
みと声調が一致する単語の見出しを変換候補として中国
語辞書14から検索する(ステップB11)。
First, assuming the tone mode, the CP
U11 uses the dictionary look-up program 1 to search the Chinese dictionary 14 for a heading of a word whose tone matches the input pronunciation as a conversion candidate (step B11).

【0052】ここで、該当する変換候補が見つかれば
(ステップB12のYes)、CPU11はその変換候
補に適当な順位付けを行った後(ステップB18)、そ
の順位に従って出力する(ステップB19)。
Here, if a corresponding conversion candidate is found (Yes in step B12), the CPU 11 assigns an appropriate ranking to the conversion candidates (step B18), and then outputs according to the ranking (step B19).

【0053】具体的には、例えば図2に示すように、中
国語辞書14の中に単語の読みに対する見出し、品詞の
他に、使用頻度を示す頻度情報、ユーザがその単語を過
去に選択したことを示す学習情報を記憶するエリアを設
けておき、これらの情報を統合して変換候補の出力順位
を決定する処理を行うことである。
More specifically, as shown in FIG. 2, for example, in the Chinese dictionary 14, frequency information indicating the frequency of use in addition to the heading and part of speech for the reading of the word, and the user has selected the word in the past. That is, an area for storing learning information indicating that the information is stored is provided, and a process of determining the output order of the conversion candidates by integrating the information is performed.

【0054】一方、上記ステップB12で変換候補が見
つからなかった場合には、CPU11は入力された読み
文字列中に声調記号と見なせる「1」〜「5」のいずれ
かの数字が含まれているか否かを調べる(ステップB1
3)。その結果、入力読み文字列中に数字「1」〜
「5」のいずれもなければ(ステップB13のNo)、
入力されたピンイン自体が間違っているということであ
るから、変換候補なしで、ここでの処理を終える。
On the other hand, if no conversion candidate is found in step B12, the CPU 11 determines whether any of the numbers "1" to "5" that can be regarded as tone symbols is included in the input read character string. Check whether or not (step B1
3). As a result, the numbers "1" to "
If none of "5" is present (No in step B13),
Since the input pinyin itself is wrong, the processing here ends without any conversion candidate.

【0055】また、入力読み文字列中に数字「1」〜
「5」のいずれかの数字が含まれていれば(ステップB
13のYes)、入力された声調の誤り、あるいは、声
調ではなく数字として入力されている可能性がある。
In addition, in the input reading character string, the numbers “1” to
If any number of “5” is included (step B
13 Yes), there is a possibility that the input tone is incorrect, or that the input is not a tone but a number.

【0056】そこで、CPU11は辞書引きプログラム
2を用いて、入力読み文字列の声調部分を無視して、ピ
ンインのみ一致する単語の見出しを変換候補として中国
語辞書14から検索する(ステップB14)。この声調
を無視した辞書引きでも変換候補が得られなかった場合
には(ステップB15のNo)、これは声調の問題では
なく、ピンイン自体が間違っているということであるか
ら、変換候補なしで、ここでの処理を終える。
Then, using the dictionary lookup program 2, the CPU 11 ignores the tone part of the input read character string and searches the Chinese dictionary 14 for a heading of a word that matches only Pinyin as a conversion candidate (step B14). If no conversion candidate is obtained by dictionary lookup ignoring this tone (No in step B15), this is not a problem of tone but that Pinyin itself is wrong. The processing here ends.

【0057】また、声調部分を無視することで、変換候
補が得られた場合には(ステップB15のYes)、元
のピンイン文字列中にあった声調記号とは異なる声調記
号で中国語辞書14の中に所望の変換候補が存在してい
ることになるため、当該変換候補に元の声調記号(入力
された声調)と近いものから順に点数を付ける(ステッ
プB16)。
If a conversion candidate is obtained by ignoring the tone portion (Yes in step B15), the Chinese dictionary 14 uses tone symbols different from tone symbols in the original Pinyin character string. , There is a desired conversion candidate, so that the conversion candidate is given a score in order from the one closest to the original tone symbol (input tone) (step B16).

【0058】ここでの点数付けの方法としては、(1)
例えば「n音節からなる単語には、n個の声調記号が含
まれているので、そのうちのいくつの声調記号が元の声
調記号と一致している」といった声調記号の一致個数に
応じて点数を付ける方法、(2)例えば「第3声の後に
第3声がある場合、前の第3声は第2声として発音され
るため、このパターンで間違えている場合は、他のパタ
ーンよりも近いとして評価する」といったような声調ル
ールを用いて点数を付ける方法などがある。また、
(3)例えば「ユーザが第1声を第2声に間違える確率
が高いことが候補選択処理の結果判明した場合に、これ
を学習しておき(図4のステップA19の学習処理)、
この学習パターンは他のパターンよりも近いとして評価
する」といった学習ルールを組み込んでも良い。
The method of scoring here is (1)
For example, since a word consisting of n syllables contains n tone symbols, how many tone symbols match the original tone symbol? (2) For example, "If there is a third voice after the third voice, the previous third voice is pronounced as the second voice, so if this pattern is incorrect, it is closer than other patterns. Score using a tone rule such as "evaluate as". Also,
(3) For example, if it is determined that the probability that the user mistakes the first voice for the second voice is high as a result of the candidate selection process, this is learned (the learning process of step A19 in FIG. 4),
This learning pattern is evaluated as being closer than other patterns. "

【0059】このような方法により、変換候補に妥当な
点数付けがなされると、次にCPU11は、声調の一致
しない部分について、それを声調記号ではなく数字とし
て見なした変換候補と、誤った声調だとして無視した変
換候補の2種類に分ける(ステップB17)。なお、こ
こで分けられた各変換候補にさらに点数付けを行っても
良い。この場合、文書作成上、声調記号の誤りの方が可
能性が高いため、誤った声調だとして無視した変換候補
の方に高い点数を付けるのが好ましい。
When the conversion candidate is appropriately scored by such a method, the CPU 11 then erroneously determines that the part where the tones do not match is a conversion candidate that regards the part as a numeral instead of a tone symbol. It is divided into two types of conversion candidates which are ignored as tones (step B17). Note that each of the divided conversion candidates may be further scored. In this case, since a tone symbol error is more likely to occur in document creation, it is preferable to assign a higher score to a conversion candidate ignored as an incorrect tone.

【0060】さらに、各変換候補に学習情報などがある
場合には、CPU11はそれを考慮して統合的に点数を
付け、その点数に基づいて各変換候補の出力順位を決定
し(ステップB18)、その出力順位に従って各変換候
補を順に出力する(ステップB19)。
Further, if there is learning information or the like in each conversion candidate, the CPU 11 assigns a score in consideration of the information, and determines an output order of each conversion candidate based on the score (step B18). The conversion candidates are sequentially output in accordance with the output order (step B19).

【0061】この場合、変換候補の出力に際し、声調の
一致しない候補については、声調の一致する候補とは別
の表示色を用いたり、下線を付加するなど、異なる表示
形態を用いて区別表示する。これにより、声調誤入力の
自動補正がかかった候補であることをユーザにわかりや
すく認識させることができる。
In this case, when the conversion candidates are output, the candidates that do not match the tone are displayed in a different display form, such as using a different display color from the candidate having the matching tone or adding an underline. . This allows the user to easily recognize that the candidate has been automatically corrected for erroneous tone input.

【0062】次に、上述した変換処理について、具体例
を挙げて説明する。 (1)「統計的な学習」の方法 上記ステップB16での点数付けにおいて、学習ルール
を用いる方法について詳しく説明する。
Next, the above-described conversion processing will be described with a specific example. (1) Method of “Statistical Learning” A method of using a learning rule in the scoring in step B16 will be described in detail.

【0063】図3(a)に示すような学習テーブル15
を用意する。この学習テーブル15は、ユーザが入力し
た声調の誤りを統計的に学習するためのものであり、辞
書の正しい声調とユーザが最初に入力した声調とを比較
する構成になっている。
The learning table 15 as shown in FIG.
Prepare The learning table 15 is for statistically learning an error of the tone input by the user, and is configured to compare a correct tone in the dictionary with a tone originally input by the user.

【0064】まず、すべての欄の初期値は「0」として
おく。ここで、例えば中国語辞書14には第4声で載っ
ていた単語を、ユーザが誤って第2声で入力し、変換候
補(同音語)中より確定したとする。このような場合に
は、図3(a)に示す学習テーブル15中の“※1”の
欄に「1」を加える。同様に、中国語辞書14には第2
声で載っていた単語を、ユーザが第3声で入力し、確定
したときには、“※2”の欄の「1」を加える。
First, the initial values of all columns are set to “0”. Here, for example, it is assumed that the user mistakenly inputs a word that was listed in the fourth voice in the Chinese dictionary 14 with the second voice, and is determined from among conversion candidates (same words). In such a case, “1” is added to the column of “* 1” in the learning table 15 shown in FIG. Similarly, the Chinese dictionary 14 has the second
When the user inputs the word in the voice with the third voice and confirms it, "1" in the column of "* 2" is added.

【0065】このようにして、ユーザが中国語辞書14
に登録されている正しい声調用とは違った声調を入力す
る毎に、該当欄の数字を「1」ずつ増加していく。これ
により、ユーザが本システムを使い込んでくると、各欄
内の数字は、「ユーザが辞書上の正しい声調を別の声調
に間違って入力した度合い」を示すことになる。
In this way, when the user enters the Chinese dictionary 14
Each time a tone different from that for the correct tone registered in is entered, the number in the corresponding column is incremented by "1". Thus, when the user uses the present system, the number in each column indicates “the degree to which the user has incorrectly input a correct tone on the dictionary into another tone”.

【0066】今、学習テーブル15の内容が図3(b)
のようになったとする。このような状態になったとき、
ユーザが以下のような読み文字列を声調付きでピンイン
入力をしたとする。
Now, the contents of the learning table 15 are as shown in FIG.
Let's say When this happens,
It is assumed that the user has made a pinyin input of the following read character string with a tone.

【0067】入力:「zheng4 fu2」 このとき、中国語辞書14には、図2に示すように、 A:「zheng1 fu2」−「征服」 B:「zheng4 fu3」−「政府」 C:「zheng4 fu4」−「正負」 の3つ単語(読みと見出し)が登録されていたとする。Input: “zheng4 fu2” At this time, A: “zheng1 fu2” − “conquest” B: “zheng4 fu3” − “government” C: “zheng4 fu2”, as shown in FIG. It is assumed that three words (fu4)-"positive / negative" (reading and heading) have been registered.

【0068】この場合、入力読み文字列「zheng4
fu2」の音節数は「zheng4」と「fu2」の
2つであり、全音節の声調(第4声と第2声)が一致し
た辞書見出しはなく、上記3つの辞書単語AからCに対
しては、2音声中1音節のみ一致、残り1音節は不一致
である。したがって、「何音節声調が一致したか」で点
数付けを行った結果は一致している。
In this case, the input reading character string “zheng4
The number of syllables of “fu2” is two, “zheng4” and “fu2”, and there is no dictionary entry that matches the tone (the fourth and second voices) of all syllables. In other words, only one syllable in two voices matches, and the remaining one syllable does not match. Therefore, the results of scoring "how many syllable tones match" are in agreement.

【0069】そこで、上記学習テーブル15を用いて、
これらの出力順位を決定することになる。まず、辞書単
語Aの「zheng1 fu2」−「征服」について
は、2音節目の「fu2」の声調部分が入力読み文字列
「zheng4 fu2」と一致しているので、一致し
ない「zheng」の部分について学習テーブル15を
引く。その結果、ユーザ入力の声調は第4声、辞書の声
調は第1声であることから、図3(b)に示す学習テー
ブル15の“※A”の欄の情報により、点数は0 点とな
る。
Therefore, using the learning table 15,
These output orders will be determined. First, as for “zheng1 fu2” − “conquest” of the dictionary word A, since the tone part of “fu2” in the second syllable matches the input reading character string “zheng4 fu2”, the part of “zheng” that does not match About the learning table 15. As a result, since the tone of the user input is the fourth tone and the tone of the dictionary is the first tone, the score in the column of “* A” in the learning table 15 shown in FIG. Become.

【0070】A:「zheng1 fu2」−「征服」
…0 点 また、辞書単語Bの「zheng4 fu3」−「政
府」と、辞書単語Cの「zheng4 fu4」−「正
負」については、1音節目の「zheng4」の声調部
分が入力読み文字列「zheng4 fu2」と一致し
ているので、一致しない「fu」の部分について学習テ
ーブル15を引く。その結果、図3(b)に示す学習テ
ーブル15の“※B”と“※C”の欄の情報により、 B:「zheng4 fu3」−「政府」…4 点 C:「zheng4 fu4」−「正負」…2 点 となる。したがって、点数の高い順に並べ替えると、 B:「zheng4 fu3」−「政府」…4 点 C:「zheng4 fu4」−「正負」…2 点 A:「zheng1 fu2」−「征服」…0点 となり、この順序で当該入力読み文字列に対する変換候
補の出力が行われることになる。
A: "zheng1 fu2"-"conquest"
.. 0 point In addition, regarding the dictionary word B “zheng4 fu3” − “government” and the dictionary word C “zheng4 fu4” − “positive / negative”, the tone portion of “zheng4” in the first syllable is the input reading character string “ Therefore, the learning table 15 is drawn for the part of “fu” that does not match because it matches “zheng4 fu2”. As a result, B: “zheng4 fu3”-“government”... 4 points C: “zheng4 fu4”-“ Positive / negative ”… 2 points. Therefore, when sorted in descending order of score, B: "zheng4 fu3"-"government" ... 4 points C: "zheng4 fu4"-"positive / negative" ... 2 points A: "zheng1 fu2"-"conquest" ... 0 points In this order, conversion candidates for the input read character string are output.

【0071】(2)声調ルール 上記ステップB16での点数付けにおいて、声調ルール
を用いる方法について詳しく説明する。
(2) Tone Rule A method of using a tone rule in the scoring in step B16 will be described in detail.

【0072】声調ルールは、文章表記と日常の話し言葉
の相違などによる声調の変化(声調のゆれと呼ばれる)
を定義したものである。以下に、代表的な例を挙げる。 1.第3声の単語が2つの並ぶと、前の第3声は第2声
に変化する。すなわち、「**3**3」→「**2*
*3」(**はピンイン)となる。
The tone rule is a tone change due to a difference between sentence notation and everyday spoken language (called tone fluctuation).
Is defined. The following is a typical example. 1. When two words of the third voice are arranged, the previous third voice changes to the second voice. That is, "** 3 ** 3" → "** 2 *
* 3 "(** is Pinyin).

【0073】例えば、ユーザが以下のような読み文字列
を声調付きでピンイン入力をしたとする。 入力:「guan2 li3」 このとき、中国語辞書14には、図2に示すように、 D:「guan3 li3」−「管理」 E:「guan4 li4」−「慣例」 F:「guan1 li4」−「官吏」 G:「guan1 li3」−「歓礼」 といった4つの単語(読みと見出し)が登録されている
とする。
For example, suppose that the user has made a pinyin input of the following read character string with a tone. Input: "guan2 li3" At this time, in the Chinese dictionary 14, as shown in FIG. 2, D: "guan3 li3"-"management" E: "guan4 li4"-"conventional" F: "guan1 li4"- It is assumed that four words (reading and heading) such as “official” G: “guan1 li3” − “joy” are registered.

【0074】まず、声調の一致した音節の数で点数を付
けると、辞書単語DとGは第2音節目の「li3」が一
致しているので、 D:「guan3 li3」−「管理」…1点 E:「guan4 li4」−「慣例」…0点 F:「guan1 li4」−「官吏」…0点 G:「guan1 li3」−「歓礼」…1点 となる。
First, when a score is given based on the number of syllables whose tones match, the dictionary words D and G match “li3” in the second syllable, so that D: “guan3 li3” − “management” ... 1 point E: "guan4 li4"-"conventional" ... 0 points F: "guan1 li4"-"official" ... 0 points G: "guan1 li3"-"joy" ... 1 point.

【0075】ここで、辞書単語Dの「guan3 li
3」−「管理」と、辞書単語Gの「guan1 li
3」−「歓礼」の順序を付けるのに、この声調ルールを
利用する。
Here, the dictionary word D “guan3 li”
3 "-" management "and the dictionary word G" guan1 li "
This tone rule is used to assign the order of "3"-"joy".

【0076】すなわち、入力読み文字列「guan2
li3」は第2声と第3声からなり、上記辞書単語F、
G両方とも、第2音節目の「li3」の声調は「3」で
あるから、入力した「guan2」と辞書「guan
1」との距離よりは、声調ルールにより、辞書「gua
n3」との距離の方が近いと判断できる。よって、第1
位として「管理(guan3 li3)」、第2位とし
て「歓礼(guan1li3)」といった順で変換候補
を出力することになる。
That is, the input reading character string “guan2
li3 "is composed of the second and third voices, and the dictionary word F,
For both G, the tone of “li3” in the second syllable is “3”, so the input “guan2” and the dictionary “guan”
Rather than the distance to "1", the dictionary "gua"
It can be determined that the distance to “n3” is shorter. Therefore, the first
The conversion candidates are output in the order of “management (guan3li3)” as the order, and “joy” (guan1li3) as the second order.

【0077】また、辞書単語Eの「guan4 li
4」−「慣例」と辞書単語Fの「guan1 li4」
−「官吏」については、中国語辞書14に付属情報とし
て設定されている頻度情報と学習情報に基づいて出力す
る。この場合、図2の例では、「慣例」が学習済み順位
1位になっているので、これを先に出力する。
The dictionary word E “guan4li”
4 ”-“ conventional ”and dictionary word F“ guan1 li4 ”
-"Government" is output based on frequency information and learning information set in the Chinese dictionary 14 as attached information. In this case, in the example of FIG. 2, “conventional” is ranked first in the learned order, and is output first.

【0078】他の発音上のルールとしては、以下のよう
なものがある。 2.「単音節動詞または名詞の重ね型」→「後ろは軽声
に発音される」 この場合、辞書内も軽声で格納されている。
Other rules for pronunciation are as follows. 2. "Single syllable verb or noun overlap type" → "Back is pronounced lightly" In this case, the dictionary is also stored lightly.

【0079】3.ユーザが軽声以外で複数の音節を連続
して入力した場合に、これを救うためのルール この場合は、1つの(重ね型でない)動詞等を2回引く
ことになるため、何もせず救えてしまう。また、正しく
入力された場合も正しく引けてしまう。
3. Rule for rescuing multiple syllables consecutively input by the user other than a light voice. In this case, one (non-overlapping) verb or the like is to be drawn twice. Would. Also, if the input is correct, it will be closed correctly.

【0080】4.重ね型でないものは辞書にあって、重
ね型が辞書にない場合に、これを救うルール これは、例えば「kan4−看」は辞書にあるが、「k
an4 kan5−看看」といったような場合である。
このような場合には、別のアルゴリズム上の工夫で救う
ことになる。
4. A rule that saves a non-overlapping type in the dictionary if it is not in the dictionary is, for example, “kan4−” is in the dictionary, but “k
an4 kan5-signage ".
In such a case, it can be saved by a different algorithm.

【0081】すなわち、 1.声調のみ違う同じ音節が二つ続いている 2.後ろの音節が軽声である といった2つの条件を満たした場合に、前の音節を声調
込みで辞書引きして、動詞、名詞の単語が見つかった場
合に、後ろの音節はその重ね型である、とする文法解析
ルールである。
That is, 1. 1. Two identical syllables differing only in tone. If two conditions are met, such as that the back syllable is light voice, the previous syllable is lexicographically searched with a tone, and if a verb or noun word is found, the back syllable is the superposition type. Is a grammar analysis rule.

【0082】(3)次に、声調ありモードで、ユーザが
声調なしで数字を入力した場合の具体例について説明す
る。 例えば、「星期4」といった単語を変換候補として得る
ためには、本来、「xing1 qil4」といった読
み文字列を声調付きピンインで入力しなければならない
が、これを「xing qi4」と入力したとする。
(3) Next, a description will be given of a specific example in the case where the user inputs a number without a tone in the tone mode. For example, in order to obtain a word such as “star period 4” as a conversion candidate, a reading character string such as “xing1 qil4” must originally be input in a pinyin with a tone, but this is assumed to be input as “xing qi4”. .

【0083】ここで、「qi」の後ろに付加された
「4」を声調情報とし、「xing」の声調情報は無視
して中国語辞書14を検索した場合に、該当する単語は
見つからず、「qi」について声調情報「4」も無視し
て辞書引きを行った結果、「星期」といった単語が見つ
かったとする。
Here, when the tone information is set to “4” added after “qi” and the tone information of “xing” is ignored and the Chinese dictionary 14 is searched, no corresponding word is found. It is assumed that a word such as "star period" is found as a result of performing a dictionary lookup for "qi" ignoring tone information "4".

【0084】このような場合には、声調なしで得た「星
期」と、それに数字の「4」を加えた「星期4」という
2つの候補を作成し、両方出力する。このように、声調
なしで辞書引きした結果に基づいて、数字と見なした候
補と無視した候補を作成し、出力することで、ユーザが
声調なしで数字を入力した場合でも、所望の変換候補を
得ることができるようになる。
In such a case, two candidates, "star period" obtained without tone and "star period 4" obtained by adding the number "4" to the star are created and both are output. In this way, based on the result of the dictionary lookup without tone, the candidates regarded as numbers and the candidates ignored are created and output, so that even if the user inputs the numbers without tone, the desired conversion candidate is obtained. Can be obtained.

【0085】なお、上記実施形態では、ピンインと声調
により辞書引きした際に、該当する変換候補が得られた
場合に、その変換候補のみを変換結果として出力するよ
うにしたが(図5のステップB12のYes)、例えば
指定の声調以外の単語も辞書引きしておき、その優先順
位を下げて候補に入れるようにしても良い。
In the above embodiment, when a corresponding conversion candidate is obtained when a dictionary is searched based on pinyin and tone, only the conversion candidate is output as a conversion result (step in FIG. 5). (Yes in B12), for example, a word other than the designated tone may be looked up in a dictionary, and its priority may be lowered to be included as a candidate.

【0086】この場合の処理を図6に示す。図6は他の
実施形態としてのピンイン漢字変換処理の動作を示すフ
ローチャートである。なお、図6において、図5と異な
る点はステップB20の処理が追加されていることであ
り、その他の処理は図5と同様である。
FIG. 6 shows the processing in this case. FIG. 6 is a flowchart showing the operation of the Pinyin Kanji conversion process as another embodiment. 6 is different from FIG. 5 in that the process of step B20 is added, and the other processes are the same as those in FIG.

【0087】すなわち、まず、声調ありモードを前提と
して、CPU11は辞書引きプログラム1を用いて、入
力された読みと声調が一致する単語の見出しを変換候補
として中国語辞書14から検索する(ステップB1
1)。
First, assuming the tone mode, the CPU 11 uses the dictionary lookup program 1 to search the Chinese dictionary 14 for conversion of a heading of a word whose tone matches the input reading (step B1).
1).

【0088】ここで、該当する変換候補が見つかった場
合において(ステップB12のYes)、CPU11は
ユーザが指定した声調を無視することにより、読みの部
分のみ一致する単語の見出しを変換候補として中国語辞
書14から検索する(ステップB20)。
Here, when the corresponding conversion candidate is found (Yes in step B12), the CPU 11 ignores the tone specified by the user, and uses the heading of the word that matches only the reading part as a conversion candidate in Chinese. Search from the dictionary 14 (step B20).

【0089】このようにして、読みと声調が一致する変
換候補と、読みのみ一致する変換候補が得られると、C
PU11はこれらの変換候補に対して、上述したような
点数付けを行う(ステップB16)。この場合、読みと
声調が一致する変換候補の点数を高くし、読みのみ一致
する変換候補の点数を下げるようにする。
As described above, when a conversion candidate whose reading and tone match and a conversion candidate whose reading only matches are obtained, C
The PU 11 performs the above-described scoring on these conversion candidates (step B16). In this case, the score of the conversion candidate whose reading and tone match is increased, and the score of the conversion candidate whose reading only matches is lowered.

【0090】さらに、CPU11は声調を数字と見なし
た候補と無視した候補を作成した後(ステップB1
7)、これらの候補を含めて適当な順位付けを行って
(ステップB18)、その順位に従って各変換候補を出
力する(ステップB19)。この場合、上記ステップB
12で得られた読みと声調が一致する変換候補の点数が
最も高くなり、最優先で出力されることになる。
Further, the CPU 11 creates a candidate whose tone is regarded as a numeral and a candidate whose tone is ignored (step B1).
7) Perform appropriate ranking including these candidates (step B18), and output each conversion candidate according to the ranking (step B19). In this case, the above step B
The conversion candidate having the same tone as the reading obtained in step 12 has the highest score, and is output with the highest priority.

【0091】このように、指定の声調以外の単語も辞書
引きしておき、その優先順位を下げて候補に入れておく
ことで、声調が誤って入力された場合に、その声調でた
とえ辞書引きできたとしても、これを救うことができ
る。
In this way, words other than the designated tone are also extracted from the dictionary, and their priorities are reduced and included in the candidates, so that when a tone is erroneously input, even if the tone is input in the dictionary, Even if you can, you can save it.

【0092】なお、上述した各実施形態において記載し
た手法は、コンピュータに実行させることのできるプロ
グラムとして、例えば磁気ディスク(フロッピーディス
ク、ハードディスク等)、光ディスク(CD−ROM、
DVD等)、半導体メモリなどの記録媒体に書き込んで
各種装置に適用したり、通信媒体により伝送して各種装
置に適用することも可能である。本装置を実現するコン
ピュータは、記録媒体に記録されたプログラムを読み込
み、このプログラムによって動作が制御されることによ
り、上述した処理を実行する。
Note that the method described in each of the above-described embodiments can be executed by a computer as a program such as a magnetic disk (floppy disk, hard disk, etc.), an optical disk (CD-ROM,
It is also possible to write the data on a recording medium such as a DVD or a semiconductor memory and apply it to various devices, or to transmit it via a communication medium and apply it to various devices. A computer that realizes the present apparatus reads the program recorded on the recording medium, and executes the above-described processing by controlling the operation of the program.

【0093】[0093]

【発明の効果】以上のように本発明によれば、声調付き
で読み文字列を入力する場合において、声調付きで辞書
引きした結果、該当する変換候補が得られなかった際
に、その声調を無視した辞書引きを行って変換候補を出
力するようにしたため、間違った声調を入力した場合で
も、その声調を無視した辞書引き結果から所望の変換候
補を得ることができる。したがって、後に入力訂正を行
うなどの面倒な操作が不要となり、ユーザの負担が軽減
される。
As described above, according to the present invention, when a character string to be read with a tone is input, if the corresponding conversion candidate cannot be obtained as a result of dictionary lookup with a tone, the tone is changed. Since the conversion candidate is output by performing the ignored dictionary lookup, even if an incorrect tone is input, a desired conversion candidate can be obtained from the dictionary lookup result ignoring the tone. Therefore, troublesome operations such as performing input correction later become unnecessary, and the burden on the user is reduced.

【0094】また、声調なしで数字を入力した場合に、
その声調を無視した変換候補に基づいて当該声調を数字
と見なした変換候補を作成することで、所望の変換候補
を得ることができる。
When a number is input without tone,
A desired conversion candidate can be obtained by creating a conversion candidate in which the tone is regarded as a number based on the conversion candidate ignoring the tone.

【0095】また、声調付きの辞書引きと声調を無視し
た辞書引きの両方を行うことで、声調を間違って入力し
た際に、声調付きの辞書引きにより、たまたま声調が一
致した別の変換候補が得られたとしても、その声調を無
視した辞書引きによって、正しい変換候補を得ることが
できる。
Further, by performing both a dictionary lookup with a tone and a dictionary lookup ignoring the tone, when a tone is erroneously input, another conversion candidate whose tone coincides with the tone by the dictionary lookup with the tone happens. Even if obtained, correct conversion candidates can be obtained by dictionary lookup ignoring the tone.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施形態に係る中国語入力変換処理
装置のシステム構成を示すブロック図。
FIG. 1 is a block diagram showing a system configuration of a Chinese input conversion processing device according to an embodiment of the present invention.

【図2】同実施形態における中国語辞書の構成を示す
図。
FIG. 2 is an exemplary view showing a configuration of a Chinese dictionary in the embodiment.

【図3】同実施形態における学習テーブルの構成を示す
図。
FIG. 3 is a diagram showing a configuration of a learning table according to the embodiment.

【図4】同実施形態における読み入力から変換結果を出
力するまでの全体の流れを示すフローチャート。
FIG. 4 is an exemplary flowchart showing the entire flow from reading input to outputting a conversion result in the embodiment.

【図5】同実施形態におけるピンイン漢字変換処理の動
作を説明するためのフローチャート。
FIG. 5 is an exemplary flowchart for explaining the operation of the Pinyin Kanji conversion process according to the embodiment;

【図6】他の実施形態におけるピンイン漢字変換処理の
動作を説明するためのフローチャート。
FIG. 6 is a flowchart for explaining the operation of a Pinyin Kanji conversion process in another embodiment.

【符号の説明】[Explanation of symbols]

11…CPU 12…ROM 13…RAM 14…中国語辞書 15…学習テーブル 16…入力装置 17…表示装置 18…外部記憶装置 19…印刷装置 20…通信装置 Reference Signs List 11 CPU 12 ROM 13 RAM 14 Chinese dictionary 15 Learning table 16 Input device 17 Display device 18 External storage device 19 Printing device 20 Communication device

Claims (11)

【特許請求の範囲】[Claims] 【請求項1】 読み文字列を声調付きのピンインで入力
するための入力手段と、 読みと声調に対応する見出しを登録した中国語辞書と、 上記入力手段によって入力された声調付きのピンインに
基づいて上記中国語辞書から該当する見出しを変換候補
として検索する第1の辞書引き手段と、 この第1の辞書引き手段によって変換候補が得られなか
った場合に、声調を無視してピンインのみに基づいて上
記中国語辞書から該当する見出しを変換候補として検索
する第2の辞書引き手段と、 この第2の辞書引き手段によって得られた変換候補を出
力する出力手段とを具備したことを特徴とする中国語入
力変換処理装置。
1. An input means for inputting a reading character string with a tone with a tone, a Chinese dictionary in which headings corresponding to the reading and tone are registered, and a tone-based pinyin input by the input means. A first dictionary lookup unit for searching for a corresponding heading from the Chinese dictionary as a conversion candidate, and if no conversion candidate is obtained by the first dictionary lookup unit, the tone is ignored and only the pinyin is used. A second dictionary lookup unit for searching a corresponding headline from the Chinese dictionary as a conversion candidate, and an output unit for outputting a conversion candidate obtained by the second dictionary lookup unit. Chinese input conversion processor.
【請求項2】 読み文字列を声調付きのピンインで入力
するための入力手段と、 読みと声調に対応する見出しを登録した中国語辞書と、 上記入力手段によって入力された声調付きのピンインに
基づいて上記中国語辞書から該当する見出しを変換候補
として検索する第1の辞書引き手段と、 この第1の辞書引き手段によって変換候補が得られなか
った場合に、声調を無視してピンインのみに基づいて上
記中国語辞書から該当する見出しを変換候補として検索
する第2の辞書引き手段と、 この第2の辞書引き手段によって声調を無視して得られ
た変換候補に基づいて、当該声調を数字と見なした変換
候補を作成する候補作成手段と、 上記第2の辞書引き手段によって声調を無視して得られ
た変換候補および上記候補作成手段によって作成された
当該声調を数字と見なした変換候補を出力する出力手段
とを具備したことを特徴とする中国語入力変換処理装
置。
2. An input means for inputting a reading character string in a tone-added pinyin, a Chinese dictionary in which headings corresponding to the reading and the tone are registered, and a tone-input pinyin input by the input means. A first dictionary lookup unit for searching for a corresponding heading from the Chinese dictionary as a conversion candidate, and if no conversion candidate is obtained by the first dictionary lookup unit, the tone is ignored and only the pinyin is used. A second dictionary lookup unit that searches the Chinese dictionary for a corresponding heading as a conversion candidate, and based on the conversion candidate obtained by ignoring the tone by the second dictionary lookup unit, Candidate creating means for creating the conversion candidate considered, a conversion candidate obtained by ignoring the tone by the second dictionary lookup means, and a candidate created by the candidate creating means. Chinese input conversion processing apparatus characterized by comprising an output means for outputting the conversion candidates deemed numeric 該声 tone.
【請求項3】 読み文字列を声調付きのピンインで入力
するための入力手段と、 読みと声調に対応する見出しを登録した中国語辞書と、 上記入力手段によって入力された声調付きのピンインに
基づいて上記中国語辞書から該当する見出しを変換候補
として検索する第1の辞書引き手段と、 上記入力手段によって入力された声調を無視してピンイ
ンのみに基づいて上記中国語辞書から該当する見出しを
変換候補として検索する第2の辞書引き手段と、 上記第1および第2の辞書引き手段によって得られた各
変換候補を出力する出力手段とを具備したことを特徴と
する中国語入力変換処理装置。
3. An input means for inputting a reading character string with a tone with a tone, a Chinese dictionary in which headings corresponding to the reading and tone are registered, and a tone-based pinyin input by the input means. A first dictionary lookup unit for searching a corresponding heading from the Chinese dictionary as a conversion candidate, and converting the corresponding heading from the Chinese dictionary based on only Pinyin ignoring the tone input by the input unit. A Chinese input conversion processing device comprising: a second dictionary lookup unit for searching as a candidate; and an output unit for outputting each conversion candidate obtained by the first and second dictionary lookup units.
【請求項4】 上記第2の辞書引き手段によって複数の
変換候補が得られた場合に、それらの変換候補に付随さ
れた声調と上記入力手段によって指定された元の声調と
の関係に基づいて各変換候補に順位付けを行う順位付け
手段を具備し、 上記出力手段は、この順位付け手段によって付けた順位
に従って各変換候補を順に出力することを特徴とする請
求項1乃至請求項3のいずれかに記載の中国語入力変換
処理装置。
4. When a plurality of conversion candidates are obtained by the second dictionary lookup unit, a plurality of conversion candidates are obtained based on a relationship between a tone attached to the conversion candidates and an original tone specified by the input unit. 4. The apparatus according to claim 1, further comprising: ranking means for ranking each conversion candidate, wherein said output means sequentially outputs each conversion candidate in accordance with the ranking given by said ranking means. A Chinese input conversion processing device as described in Crab.
【請求項5】 上記出力手段は、上記第1の辞書引き手
段によって声調を無視せずに得られた変換候補と、上記
第2の辞書引き手段によって声調を無視して得られた変
換候補とを区別して出力することを特徴とする請求項1
乃至請求項3のいずれかに記載の中国語入力変換処理装
置。
5. The conversion means according to claim 1, wherein said conversion candidate obtained by said first dictionary lookup means without ignoring the tone and a conversion candidate obtained by ignoring the tone by said second dictionary lookup means. 2. The method according to claim 1, further comprising:
The Chinese input conversion processing device according to claim 3.
【請求項6】 読み文字列を声調付きのピンインで入力
し、読みと声調に対応する見出しを登録した中国語辞書
を参照して、当該読み文字列に対応する見出しを変換候
補として出力する中国語入力変換処理方法であって、 入力された声調付きのピンインに基づいて上記中国語辞
書から該当する見出しを変換候補として検索し、 この辞書引きによって変換候補が得られなかった場合
に、声調を無視してピンインのみに基づいて上記中国語
辞書から該当する見出しを変換候補として検索し、 この辞書引きによって得られた変換候補を出力すること
を特徴とする中国語入力変換処理方法。
6. A method of inputting a reading character string in a pinyin with a tone, referring to a Chinese dictionary in which headings corresponding to the reading and the tone are registered, and outputting a heading corresponding to the reading character string as a conversion candidate. In the word input conversion processing method, a corresponding headline is searched as a conversion candidate from the Chinese dictionary based on the input pinyin with a tone, and if the conversion candidate is not obtained by this dictionary lookup, the tone is changed. A Chinese input conversion processing method, characterized by retrieving a corresponding heading from the Chinese dictionary as a conversion candidate based on only Pinyin and ignoring it, and outputting a conversion candidate obtained by this dictionary lookup.
【請求項7】 読み文字列を声調付きのピンインで入力
し、読みと声調に対応する見出しを登録した中国語辞書
を参照して、当該読み文字列に対応する見出しを変換候
補として出力する中国語入力変換処理方法であって、 入力された声調付きのピンインに基づいて上記中国語辞
書から該当する見出しを変換候補として検索し、 この辞書引きによって変換候補が得られなかった場合
に、声調を無視してピンインのみに基づいて上記中国語
辞書から該当する見出しを変換候補として検索し、 この辞書引きによって声調を無視して得られた変換候補
に基づいて、当該声調を数字と見なした変換候補を作成
し、 声調を無視して得られた変換候補および当該声調を数字
と見なした変換候補を出力することを特徴とする中国語
入力変換処理方法。
7. A method of inputting a reading character string in a pinyin with a tone, referring to a Chinese dictionary in which headings corresponding to the reading and the tone are registered, and outputting a heading corresponding to the reading character string as a conversion candidate. In the word input conversion processing method, a corresponding headline is searched as a conversion candidate from the Chinese dictionary based on the input pinyin with a tone, and if the conversion candidate is not obtained by this dictionary lookup, the tone is changed. Ignore and search the corresponding headline as a conversion candidate from the Chinese dictionary based only on Pinyin. Based on the conversion candidate obtained by ignoring the tone by this dictionary lookup, the conversion in which the tone is regarded as a digit is performed. A Chinese input conversion processing method comprising: creating candidates; and outputting a conversion candidate obtained by ignoring a tone and a conversion candidate in which the tone is regarded as a numeral.
【請求項8】 読み文字列を声調付きのピンインで入力
し、読みと声調に対応する見出しを登録した中国語辞書
を参照して、当該読み文字列に対応する見出しを変換候
補として出力する中国語入力変換処理方法であって、 入力された声調付きのピンインに基づいて上記中国語辞
書から該当する見出しを変換候補として検索すると共
に、 入力された声調を無視してピンインのみに基づいて上記
中国語辞書から該当する見出しを変換候補として検索
し、 これらの辞書引きによって得られた各変換候補を出力す
ることを特徴とする中国語入力変換処理方法。
8. A method of inputting a reading character string with pinyin with tone, referring to a Chinese dictionary in which headings corresponding to reading and tone are registered, and outputting a heading corresponding to the reading character string as a conversion candidate. A word input conversion processing method, wherein a corresponding headline is searched as a conversion candidate from the Chinese dictionary based on the input tone-in Pinyin, and the input tone is ignored and the Chinese character is searched only based on Pinyin. A Chinese input conversion processing method characterized by searching a word dictionary for a corresponding heading as a conversion candidate and outputting each conversion candidate obtained by these dictionary lookups.
【請求項9】 読み文字列を声調付きのピンインで入力
し、読みと声調に対応する見出しを登録した中国語辞書
を参照して、当該読み文字列に対応する見出しを変換候
補として出力するための中国語入力変換処理プログラム
を記録した記録媒体であって、 入力された声調付きのピンインに基づいて上記中国語辞
書から該当する見出しを変換候補として検索する手順
と、 この辞書引きによって変換候補が得られなかった場合
に、声調を無視してピンインのみに基づいて上記中国語
辞書から該当する見出しを変換候補として検索する手順
と、 この辞書引きによって得られた変換候補を出力する手順
とをコンピュータに実行させるプログラムを記録したコ
ンピュータ読取り可能な記録媒体。
9. A method for inputting a reading character string in pinyin with tone, referring to a Chinese dictionary in which headings corresponding to reading and tone are registered, and outputting a heading corresponding to the reading character string as a conversion candidate. A conversion process for retrieving a corresponding headline from the Chinese dictionary as a conversion candidate based on the input pinyin with tone, and If it is not obtained, a procedure of searching for the corresponding heading from the Chinese dictionary as a conversion candidate based on only Pinyin, ignoring the tone, and a step of outputting the conversion candidate obtained by this dictionary lookup are performed by a computer. A computer-readable recording medium on which a program to be executed by a computer is recorded.
【請求項10】 読み文字列を声調付きのピンインで入
力し、読みと声調に対応する見出しを登録した中国語辞
書を参照して、当該読み文字列に対応する見出しを変換
候補として出力するための中国語入力変換処理プログラ
ムを記録した記録媒体であって、 入力された声調付きのピンインに基づいて上記中国語辞
書から該当する見出しを変換候補として検索する手順
と、 この辞書引きによって変換候補が得られなかった場合
に、声調を無視してピンインのみに基づいて上記中国語
辞書から該当する見出しを変換候補として検索する手順
と、 この辞書引きによって声調を無視して得られた変換候補
に基づいて、当該声調を数字と見なした変換候補を作成
する手順と、 声調を無視して得られた変換候補および当該声調を数字
と見なした変換候補を出力するする手順とをコンピュー
タに実行させるプログラムを記録したコンピュータ読取
り可能な記録媒体。
10. A method for inputting a reading character string in pinyin with tone, referring to a Chinese dictionary in which headings corresponding to reading and tone are registered, and outputting a heading corresponding to the reading character string as a conversion candidate. A conversion process for retrieving a corresponding headline from the Chinese dictionary as a conversion candidate based on the input pinyin with tone, and If not obtained, a procedure of searching for the corresponding heading from the Chinese dictionary as a conversion candidate based on only Pinyin ignoring the tone and ignoring the tone, based on the conversion candidate obtained ignoring the tone by this dictionary lookup A conversion candidate that regards the tone as a digit, and a conversion candidate obtained by ignoring the tone and a conversion candidate that considers the tone as a digit. Computer readable recording medium recording a program for executing the steps on a computer to output.
【請求項11】 読み文字列を声調付きのピンインで入
力し、読みと声調に対応する見出しを登録した中国語辞
書を参照して、当該読み文字列に対応する見出しを変換
候補として出力するための中国語入力変換処理プログラ
ムを記録した記録媒体であって、 入力された声調付きのピンインに基づいて上記中国語辞
書から該当する見出しを変換候補として検索する手順
と、 入力された声調を無視してピンインのみに基づいて上記
中国語辞書から該当する見出しを変換候補として検索す
る手順と、 これらの辞書引きによって得られた各変換候補を出力す
る手順とをコンピュータに実行させるプログラムを記録
したコンピュータ読取り可能な記録媒体。
11. A method for inputting a reading character string in a pinyin with a tone, referring to a Chinese dictionary in which headings corresponding to the reading and the tone are registered, and outputting a heading corresponding to the reading character string as a conversion candidate. A step of retrieving a corresponding entry from the Chinese dictionary as a conversion candidate based on the input tone with pinyin, and ignoring the input tone. A computer-readable program storing a program for causing a computer to execute a procedure of searching for a corresponding heading from the Chinese dictionary as a conversion candidate based on only Pinyin, and a procedure of outputting each conversion candidate obtained by referencing these dictionaries Possible recording medium.
JP10169995A 1998-06-17 1998-06-17 Chinese input conversion processor, chinese input conversion processing method and recording medium recording chinese input conversion processing program Pending JP2000010964A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10169995A JP2000010964A (en) 1998-06-17 1998-06-17 Chinese input conversion processor, chinese input conversion processing method and recording medium recording chinese input conversion processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10169995A JP2000010964A (en) 1998-06-17 1998-06-17 Chinese input conversion processor, chinese input conversion processing method and recording medium recording chinese input conversion processing program

Publications (1)

Publication Number Publication Date
JP2000010964A true JP2000010964A (en) 2000-01-14

Family

ID=15896649

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10169995A Pending JP2000010964A (en) 1998-06-17 1998-06-17 Chinese input conversion processor, chinese input conversion processing method and recording medium recording chinese input conversion processing program

Country Status (1)

Country Link
JP (1) JP2000010964A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112257420A (en) * 2020-10-21 2021-01-22 北京猿力未来科技有限公司 Text processing method and device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112257420A (en) * 2020-10-21 2021-01-22 北京猿力未来科技有限公司 Text processing method and device

Similar Documents

Publication Publication Date Title
KR100259407B1 (en) Keyboard for a system and method for processing chinese language text
US8365070B2 (en) Spelling correction system and method for misspelled input
JP4833476B2 (en) Language input architecture that converts one text format to the other text format with modeless input
US6848080B1 (en) Language input architecture for converting one text form to another text form with tolerance to spelling, typographical, and conversion errors
US20100180199A1 (en) Detecting name entities and new words
JP2013117978A (en) Generating method for typing candidate for improvement in typing efficiency
JPH113338A (en) Multi-language input system, its method and recording medium recording multi-language input program
US20070288240A1 (en) User interface for text-to-phone conversion and method for correcting the same
US7136803B2 (en) Japanese virtual dictionary
JPH11238051A (en) Chinese input conversion processor, chinese input conversion processing method and recording medium stored with chinese input conversion processing program
JP2000010964A (en) Chinese input conversion processor, chinese input conversion processing method and recording medium recording chinese input conversion processing program
JPS634206B2 (en)
Bagchi et al. Bangla spelling error detection and correction using n-gram model
Mon Spell checker for Myanmar language
KR100268297B1 (en) System and method for processing chinese language text
JPH08272780A (en) Processor and method for chinese input processing, and processor and method for language processing
JPS63316162A (en) Document preparing device
JP2004053871A (en) Speech recognition system
JPH0414168A (en) Word processor
JPH05108647A (en) Kanji converter
JP2002117025A (en) Device and method for japanese syllabary-to-chinese character conversion
JPH07121542A (en) Machine translation system
JPS6365566A (en) 'kana' to 'kanji' converter
JPH08241315A (en) Word registering mechanism for document processor
JP2000067046A (en) Word input supporting device and method therefor