JP2000235567A - 声調符号無入力式中国語文字変換装置 - Google Patents

声調符号無入力式中国語文字変換装置

Info

Publication number
JP2000235567A
JP2000235567A JP11038700A JP3870099A JP2000235567A JP 2000235567 A JP2000235567 A JP 2000235567A JP 11038700 A JP11038700 A JP 11038700A JP 3870099 A JP3870099 A JP 3870099A JP 2000235567 A JP2000235567 A JP 2000235567A
Authority
JP
Japan
Prior art keywords
syllable
input
conversion
phonetic
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11038700A
Other languages
English (en)
Inventor
Keiken Rin
啓軒 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP11038700A priority Critical patent/JP2000235567A/ja
Priority to US09/468,832 priority patent/US6327560B1/en
Priority to TW088123030A priority patent/TW460825B/zh
Priority to SG9906681A priority patent/SG82664A1/en
Priority to CN00100302A priority patent/CN1264072A/zh
Publication of JP2000235567A publication Critical patent/JP2000235567A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 キーボード上での入力効率を増加するため声
調符号の入力を省いた中国語文字変換装置。 【解決手段】 中国語文字変換装置は、一続きの入力表
音符号列を、声調符号の入力の有無に関わらず、表音組
み合わせ規則に整合する複数の音節に、自動的に切断す
る。各音節または、複数の音節から成る各音節ストリー
ムには、対応する同音文字またはフレーズのグループ
が、辞書の中に存在する。本発明では声調符号の入力を
省略できるので、ユーザによる入力のスピードを増加さ
せることができ、声調符号の誤りによる誤った入力も避
けることができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、計算機システムに
おいて、表音符号の入力列を中国語文字に変換するため
の中国語文字変換装置に関する。
【0002】
【従来の技術】計算機システムにおいて用いられるBI
G5コードによる伝統的中国語文字の総数は13051
である。中国語計算機システム普及の鍵は、如何に迅速
かつ正確に中国語文字を入力するかにかかっている。現
在、計算機システムにおける中国語入力は、スピーチ認
識や手書認識、キーボード操作によって達成できる。キ
ーボードを使って中国語文字を入力する方法は、最も信
頼できる方法であり、また最も普及している方法であ
る。中国語文字は、ユーザが発音に従って、或いは、中
国語の文字の形に従ってキーボードから入力できる。入
力すべき中国語文字の形に従ってキーボードから中国語
文字を入力する方法には、より早く入力できるという利
点があるが、一つ一つの中国語文字の入力に当たって各
文字を複数の部分に分解するに利用する数多くの規則
を、ユーザが覚えるのが困難である。そのため、台湾の
ように、所によっては、計算機の使用者の大部分は、中
国語文字を入力するため表音符号を入力する方を好んで
いるのが実状である。特に、これらの地域では、小学生
の頃から、中国語の音声学を学習しているからである。
【0003】台湾の小学校で使われている教材において
割り当てられている中国語表音符号を以下に示す。中国
語表音符号は、四つの主要グループにまとめられる。即
ち、母音(韻母)、遷移母音(介音)、子音(声母)、そして
声調である。本発明においては、符号「…」は、第一声
を表している。しかし実際には、第一声には、何も符号
が使われないことに注意すべきである。
【表1】
【0004】各音節即ち文字音は子音、遷移母音、母
音、または声調から構成される。声調に加えて、子音、
遷移母音、母音の一つ、二つ、または三つすべてが一音
節に同時に含まれることもあり、その一例を以下に挙げ
る。
【表2】
【0005】上記の例に示されているように、いわゆる
音節ストリームは、複数の音節によって構成され、中国
文字列に変換することができる。各音節には、少なくと
も一つの同音文字が対応する。現在、Mandarin Dairy N
ewspaper Dictionary(マンダリン毎日新聞辞典)によれ
ば、意味のある音節の総数は1364である。意味のあ
る音節は、子音、遷移母音、母音、または声調から成る
許容された配列であるとともに、少なくとも一つの対応
する同音文字を有していなければならない。例えば、
【外1】 は、遷移母音と母音の順序が入れ替わっているので、意
味のある音節ではない。また、
【外2】 も、表音符号の配列は正しいが、対応する同音文字がな
いので、意味のある音節ではない。
【0006】中国語には、多くの同音文字があるので、
各音節の表音符号を入力後、複数の同音文字から、正し
い中国語文字を選択する必要があり、そのために入力速
度が減少する。中国語の同音フレーズの総数は中国語の
同音文字の総数に比べて少なく、また中国語フレーズの
総数はテキスト中の中国語単語の総数より多いので、表
音符号の入力が中国語フレーズの形式であれば、複数の
同音文字から正しい中国語文字を選択する必要性は減少
する。近年、セマンティックおよびシンタクティックプ
ロセスと中国語フレーズ入力の組み合わせによって、表
音符号入力法で正しい中国語文字を得る割合は、95%
またはそれ以上に達する。即ち、複数の同音文字または
フレーズから正しい中国語文字またはフレーズを選択す
る必要性は5%以内である。
【0007】従来の中国語文字変換装置は中華民国特許
出願番号75105838に開示されている。図5は上
記中華民国特許出願に開示されている従来の中国語文字
変換装置のブロックダイアグラムを示す。100は表音
符号の列を入力するための入力部を表す。180は変換
に用いる複数の中国語文字を格納するするための辞書を
表す。140は表音符号の入力列の音節数を格納するた
めのNCHARレジスタを表す。120は表音符号の入
力列の変換開始位置を格納するためのPTRレジスタを
表す。130は表音符号の入力列の変換長を格納するた
めのNPレジスタを表す。150は、より長い長文字の
変換を優先させるという原理を維持するために、ある長
さの文字の変換終了後、NPレジスタの値を一つ減少さ
せるための比較器を表す。160は変換制御部である。
変換制御部160は順序よくPTRレジスタ120にお
ける設定位置を入力初期位置から移動させ、変換される
音節があるかどうかを決定する。もし変換される音節が
なくて、辞書180が対応する文字を含んでいるなら
ば、変換制御部160は、この音節を変換する。170
は、変換制御部160からの音節を探索キーとして、辞
書180を探索するための辞書探索部を表す。190
は、変換制御部160によって得られる中国語文字を出
力するための出力部を表す。
【0008】
【発明が解決しようとする課題】上記従来の中国語文字
変換装置において用いられる表音入力法は、伝統的表音
入力法と同じである。それは伝統的なユーザの習慣と一
致するが、次のような欠点がある。即ち、発音と表音符
号の間には矛盾する声調がある。例えば、「総統」の表
音符号は、
【外3】 である。ここでは、各中国語文字の表音符号は第三声の
声調符号を有している。しかし、話し言葉では、最初の
中国語文字「総」の第三声は、第二声に変化しなければ
ならない。即ち、話し言葉における「総統」の表音符号
は、
【外4】 である。このことは、誤った声調符号入力の原因となり
得る。さらに、ユーザが中国語文字の声調を正しく区別
することができないときには、正しい中国語文字が表音
符号入力法によって 入力され得ない。従って、もし声
調符号が、表音符号入力に際して省略され得るならば、
上記問題は避けることができる。
【0009】さらにまた、ユーザによるキー操作の総数
を減らすことができる。例えば、中国語文字「総統」の
入力表音符号が
【外5】 に減少しても、中国語文字「総統」は尚、変換されて得
られる。その理由は、
【外6】 が母音であり、
【外7】 が子音であることによって二つの音節
【外8】 は、子音、遷移母音、母音、声調の許容される配列に従
って、容易に分割されて得られるからである。しかし、
声調符号省略の状況において、ある種の音節は簡単には
分割され得ない。例えば、
【外9】 は一音節として認識され、中国語文字「天」に変換され
うる。しかし、この外字[外9]はまた、二つの連続した
音節
【外10】 として認識され、中国語フレーズ「提案」に変換されう
る。この場合、本発明では、一音節として判別し、中国
語文字「天」に変換する。もしユーザがそれが誤った結
果である、即ち、外字[外9]には引き続く二つの音節が
なければならないと認識すれば、特殊符号
【外11】 を二音節を表す表音符号の間に加えて、
【外12】 とすれば、中国語文字「提案」に正しく変換される。
【0010】本発明においては、同音文字の総数は増加
する。これは、同じ子音、遷移母音、母音を持ちなが
ら、異なった声調を持った多くの中国語文字は、声調符
号の省略によって、同音文字になるからである。例え
ば、表音符号
【外13】 が入力されると、「松」と「送」が互いの同音文字とな
る。表音符号
【外14】 が入力されると、「北京」と「背景」が互いの同音フレ
ーズとなる。声調なしの音節の総数は409である。ユ
ーザが、複数の同音文字またはフレーズから、正しい文
字またはフレーズを選択する操作は、中国語のシンタク
ティックおよびセマンティックプロセスの強化によっ
て、自動的に最優先の中国語文字またはフレーズを選択
することによって、減少させることができる。
【0011】本発明の目的は声調符号の入力を省略する
ことであるので、ユーザは、多くの同音文字またはフレ
ーズが存在する場合には、声調符号をを入力し、文字の
声調が曖昧であるか、キー操作の減少を望む場合には、
声調符号を入力しないという選択をすることができる。
次の表は、声調符号なしの入力表音符号の一例である。
【表3】
【0012】上の例から、一つの音節は他の音節から容
易に区別されることができることが分かる。他方、外字
[外13]は
【外15】 に分割されうるし、
【外16】
【外17】 に分割され、
【外18】
【外19】 に分割され、
【外20】
【外21】 に分割され、
【外22】
【外23】 に分割され、
【外24】
【外25】 に分割されうる。しかしながら、本発明に従えば、上記
の連続した二音節の各グループは、一音節として判別さ
れるように訂正されるようである。
【0013】
【課題を解決するための手段】上記の問題を克服するた
めに、本発明は声調符号入力なしの中国語文字変換装置
を提供することにあり、この声調符号入力なしの中国語
文字変換装置は次の部分から構成される。
【0014】子音、遷移母音、母音、声調のための複数
の符号を格納するための、表音符号メモリ部と、複数の
音節ストリームおよびそれらに対応する中国語文字とフ
レーズを格納するための辞書と、入力表音符号列から、
声調符号またはスペースキーに従って、表音符号達を切
断して音節を構成し、声調符号またはスペースキーが入
力されないときは、入力表音符号列から、上記表音符号
メモリ部における、子音、遷移母音、母音の配列順序規
則に従って、表音符号達を切断して音節を構成する音節
切断部と、上記音節切断部によって得られる音節、及び
上記音節切断部によって得られる音節とそれ以前に入力
された音節から構成される音節ストリームに従って、変
換開始位置および変換長を設定するための変換初期化部
と、変換開始位置と変換長によって構成される音節スト
リームを、上記設定された変換開始位置と変換長に従っ
て、繰り返し調整するための変換処理部と、上記変換処
理部からの音節ストリームを探索キーとして、中国語文
字を求めて、上記辞書を探索するための辞書探索部と、
誤った音節切断に基づいて辞書から検出された中国語文
字を修正するために、ユーザによって操作される音節編
集部と、同音語の誤った決定によって、上記辞書から検
出された中国語文字とは別の、正しい中国語文字を選択
するため、ユーザによって操作される同音文字・フレー
ズ選択部とで構成している。
【0015】本発明の上記構成によれば、音節切断部
は、声調符号またはスペースキーに従って、入力表音符
号列を少なくとも一音節に切断する。もし声調符号また
はスペースキーが入力されないときは、音節切断部は、
入力表音符号列を、子音、遷移母音、母音の許容された
配列に従って、音節達に切断する。そして、変換初期化
部は、音節切断部からの音節達と、音節切断部からの音
節達と以前に入力された音節から構成される音節ストリ
ームに従って、変換開始位置と変換長を設定する。その
後、変換処理部は、変換開始位置と変化長によって構成
される音節ストリームを、設定された変換開始位置と変
換長に従って、繰り返し調整する。
【0016】そして、辞書探索部は、上記変換処理部か
らの音節ストリームを探索キーとして、中国語文字また
はフレーズを求めて、上記辞書を探索する。それから、
音節編集部は、誤った音節切断部による誤りに基づいて
上記辞書から検出された中国語文字またはフレーズを修
正するために、ユーザによって操作されうる。最後に、
同音文字・フレーズ選択部は、同音文字またはフレーズ
の自動的決定によって上記辞書から誤って検出された中
国語文字とは別の、正しい中国語文字を選択するため、
ユーザによって操作されうる。
【0017】
【発明の実施の形態】図1は本発明に関わる中国語文字
変換装置の好ましい実施例のブロックダイアグラムであ
る。図1において、10は表音符号を入力するための入
力部を表す。11は、図6に示した子音、遷移母音、母
音、声調を示す、すべての表音符号を格納するための表
音符号メモリ部を表す。21は、図4に示した如くの複
数の音節ストリームとそれらに対応する中国語文字を格
納するための辞書を表す。13は音節切断部を表す。各
音節には、対応する中国語文字が存在する。音節切断部
13の詳細な動作フローチャートは、図2に示されてい
る。
【0018】14は、切断後の各音節を格納するため
の、JUINBUF音節レジスタを表す。15は、音節
ストリームの音節数を格納するための、NCHARレジ
スタを表す。16と17はそれぞれ、音節ストリームが
フレーズに変換されるときに使われるPTRレジスタと
NPレジスタを表す。PTRレジスタは、入力音節スト
リームが変換され始める位置を格納するために使われる
もので、単に「変換位置レジスタ」と称する。NPレジ
スタは、入力音節ストリームの変換されるべき音節の数
を格納するために使われるもので、単に「変換長レジス
タ」と称する。即ち、もしptrとnpがそれぞれPT
RレジスタとNPレジスタに格納されているならば、入
力音節ストリームのptr番目の音節からnp個の一続
きの音節が辞書探索キーである。これから以降、nch
ar、np、ptrは、それぞれNCHARレジスタ、
NPレジスタ、PTRレジスタに格納されている値を表
すものとする。
【0019】12はNCHARレジスタ15を初期化す
るためのシステム初期化部を表す。これは入力システム
の起動開始時点において、音節数ncharを0に設定
する。18は変換初期化部を表す。もし入力音節ストリ
ームの音節数が辞書21に格納されている最長のフレー
ズの文字数(max)より長ければ(本実施例において
はmaxは5と設定している、maxの値がNPレジス
タ17に設定され、変換位置ptrは、音節ストリーム
の音節数(nchar)からn番目の(n=max)位
置に設定される。そうでなければ、音節数(ncha
r)の値がnpとして設定され、ptrはこの音節スト
リームの第一番目の位置に設定される。19は入力音節
ストリームの音節数を制御するための変換処理部を表
す。
【0020】変換処理部19は、ptrによって指示さ
れる音節位置から始まる音節数(np)の音節を、変換
のための音節として設定し、文字・フレーズ探索のた
め、辞書探索部20に送る。もし対応する文字またはフ
レーズが検索されないならば、ptrは1だけ増やさ
れ、npは1だけ減らされ、さらに文字・フレーズ探索
が行われる。以上の動作は、一つのフレーズまたは文字
が検索されるまで続けられる。
【0021】20は辞書探索部を表す。これはNPレジ
スタ17からの音節を辞書探索キーとして、辞書21を
探索することによって、辞書21における同音文字また
はフレーズから、通常用いられる文字またはフレーズを
選択し、結果を変換処理部19に提供する。22は、変
換処理部19からの文字またはフレーズをユーザに提供
し、それによってユーザが音節切断に誤りがあるかどう
かを決定するための、音節編集部を表す。もし音節切断
に何らかの誤りがあれば、ユーザはその誤りを訂正する
ことができる。例えば、入力音節ストリームである外字
[外9]に対して、文字「天」が音節切断部13の結果に
基づいて得られたが、実際に求めるフレーズは「提案」
であるとすれば、ユーザはこの入力音節ストリームを音
節編集部22によって外字[外12]に修正することがで
きる。ここで
【外26】 は本発明における手動切断キーであるとしている。この
修正された音節ストリームは変換処理部19に改めて読
み込まれ、正しい変換結果が得られる。
【0022】23は、変換処理部19からの文字または
フレーズをユーザに提供し、ユーザが同音文字またはフ
レーズの選択に誤りがあるかどうかを判定するための同
音文字・フレーズ選択部を表す。もし同音文字・フレー
ズ選択に誤りがあれば、ユーザはその誤りを訂正するこ
とができる。例えば、入力音節ストリーム
【外27】 に対して、同音文字またはフレーズの最優先のものとし
て「悠閑」が得られる。しかし、求めるものは「有限」
であるとすれば、この同音文字またはフレーズの決定が
誤りであると判定した後、ユーザはこの誤りを訂正し、
第二番目の優先順位にあるフレーズ「有限」を得ること
によって、正しい結果を得ることができる。
【0023】子音、遷移母音、母音の許容された配列に
従って、音節を切断する方法を、図2に示したフローチ
ャートを参照して、以下説明する。先ず、ステップS1
において、表音符号が入力され、音節レジスタJUIN
BUFに格納される。ステップS2において、現在入力
された表音符号が声調符号またはスペースキーかどうか
が判定される。もし現在入力された表音符号が声調符号
またはスペースキーであれば、フローはステップS5に
進み、音節を設定しこの切断を終える。そして、変換初
期化部18は文字またはフレーズの変換を行う準備を
し、次の音節の表音符号入力数が0に設定される。もし
現在入力された表音符号が声調符号またはスペースキー
でなければ、フローはステップS3に進み、さらなる決
定を行う。
【0024】ステップS3において、現在入力された表
音符号がこの音節の第一番目の表音符号かどうかが判定
される。もし現在入力された表音符号がこの音節の第一
番目の表音符号ならば、フローはステップS1に戻り、
次の表音符号を読む。そうでなければ、フローはこの表
音符号の配列を判定するため、ステップS4に進む。
【0025】ステップS4において、この表音符号が子
音、遷移母音、母音の許容された配列に従っているかが
判定される。即ち、子音は遷移母音または母音によって
のみ従われなければならなく、遷移母音は母音によって
のみ従われなければならない。もしこの表音符号が、正
しく配列されているならば、フローは、ステップS1に
戻り、次の入力表音符号を読む。そうでなければ、フロ
ーは切断プロセスのため、ステップS6に進む。
【0026】ステップS5においては、この声調符号ま
たはスペースキーの前の符号達が一音節として切り取ら
れ、次の音節の表音符号数が0に設定される。フロー
は、文字またはフレーズ変換のため、ステップS7に進
む。ステップS6においては、この表音符号の前の表音
符号達が、一音節として切り取られ、この音節の切断を
完了する。その後、現在入力された表音符号は、次の音
節の第一番目の表音符号として設定され、次の音節の表
音符号数が1に設定される。それから、フローは文字・
フレーズ変換の準備のため、ステップS7に進む。
【0027】ステップS7においては、音節数レジスタ
のポインタ値が1だけ増やされ、変換初期化部18が文
字またはフレーズ変換の準備のため、完了された音節を
受け取る。
【0028】次に、変換処理部19の動作を、図3を参
照して説明する。ステップS30において、変換初期化
部18において設定されたptrの値によって特定され
た音節から始まる、np個の一続きの音節が切り取られ
る。ステップS31では、ステップS30において切り
取られた音節達に対応する文字またはフレーズを求めて
辞書が探索される。もし対応する文字またはフレーズが
存在するならば、フローはステップS32に進み、そう
でなければフローはステップS33に進む。
【0029】ステップS32においては、入力音節スト
リームにおける、ptrによって特定された音節から始
まるnp個の一続きの音節がステップS31で検出され
たフレーズに変換され、変換状態が正しい変換として設
定される。それから、フローは、フィードバック動作の
ためステップS35に進む。
【0030】ステップS33においては、ptrの値が
1だけ増やされ、次の音節位置を指示するようにされ
る。npの値は1だけ減らされる。フローは、現在のn
pが0かどうかを判定するためにステップS34に進
む。次のステップS34においては、npが0かどうか
が判定される。もしnpが0ならば、それは対応する文
字またはフレーズが検出されなかったことを表し、この
入力音節が正しくないと判定される。フローは、変換状
態を不正変換として設定するためにステップS35に進
む。もしnpが0でないならば、フローは、設定され直
されたnp個の音節を変換するため、ステップS30に
に進む。
【0031】ステップS35においては、変換状態が不
正変換として設定され、フローは、フィードバック動作
のため、ステップS36に進む。このステップS36で
は、変換処理部19による変換状態が音節切断部13に
フィードバックされる。
【0032】図4は本発明に関わる辞書の構造の一部を
例示する。辞書の内容は音節と対応する文字達および音
節ストリームと対応するフレーズ達を含む。
【0033】以後の説明においては、本発明による中国
語漢字変換装置の作用を説明する。この説明において
は、一例として「關於此提案的背景」に対応する下記外
字[外28]で表される表音符号の列が入力された場合
に、「關於此提案的背景」へと変換される場合を説明す
る。外字[外28]は、中国語表音符号では「guanv
ctiandebeijieng」と表される。
【外28】 但し、説明の便宜上、外字[外28]で表されるそれぞれ
の中国語表音符号に対しては、表4に示す対照表でのロ
ーマ字表音符号を割り当てて説明する。
【表4】
【0034】1.入力システムの起動。 音節数(nchar)がシステム初期化部12によって
0に設定される。これは音節レジスタJUINBUF1
4に音節が存在しないことを示す。本発明に関わる中国
語文字変換装置は、最初の表音符号が入力されるのを待
つ。
【0035】2.表音符号「g」の入力。 図2のフローチャートに従って、ステップS1において
この入力符号が音節レジスタJUINBUF14に格納
された後、ステップS2でこの入力音声符号が声調符号
かどうかが判定される。声調符号でないと判定される
と、ステップS3においてこの入力音声符号が現在の音
節の第一番目の音声符号かどうかを判定する。次いで、
フローはステップS1に戻り、次の音声符号を読む。
【0036】3.表音符号「u」の入力。 図2のフローチャートに従って、ステップS1で表音符
号が先行する表音符号「g」に続いて音節レジスタJU
INBUF14に格納された後、この表音符号はステッ
プS2において声調符号かどうかが判定されるが、この
場合では声調符号ではないと判定される。従って、フロ
ーはステップS3に進み、この符号は現在の音節の第一
番目の表音符号、そこでも表音符号ではないと判定され
る。その後ステップS4に進んで、この表音符号が許容
された子音、遷移母音、母音の配列に従っているかどう
かが判定される。「g」が子音で、「u」が遷移母音で
あり、この子音がその遷移母音によって従われているこ
とから、この判定結果に従って次の入力表音符号を読む
ため、ステップS1に戻る。
【0037】4.表音符号「an」の入力。 図2のフローチャートにおいてステップS1でこの表音
符号が先行する表音符号「u」に続いて音節レジスタJ
UINBUF14に格納された後、ステップS2にてこ
の表音符号が声調符号かどうかが判定されるが、この場
合では声調符号ではないと判定される。ステップS3に
おいてこの表音符号は現在の音節の第一番目の表音符号
ではないと判定された後、フローはステップS4に進
み、この表音符号が許容された子音、遷移母音、母音の
配列に従っているかどうかが判定される。「u」が遷移
母音で、「an」が母音であり、遷移母音が母音によっ
て従われていることから、この判定結果に従って次の入
力表音符号を読むためステップS1に戻る。
【0038】5.入力表音符号「v」の入力。 図2のフローチャートにおいて、ステップS1でこの表
音符号が先行する表音符号「an」に続いて音節レジス
タJUINBUF14に格納された後、ステップS2で
この表音符号は声調符号かどうかが判定される。この場
合でも依然と声調符号でないと判定されるから、ステッ
プS3においてこの表音符号は現在の音節の第一番目の
表音符号かどうかが判定され、第一番目の表音符号でな
いと判定されるとフローはステップS4進んで、この表
音符号が許容された子音、遷移母音、母音の配列に従っ
ているかどうかが判定される。「an」が母音で、
「v」が遷移母音であり、母音が遷移母音によって従わ
れていることから、この判定結果に従って音節切断を行
うためにステップS5に進む。
【0039】ステップS5において、表音符号「v」が
先行する「guan」から切り取られ、次の音節の第一
番目の表音符号として設定される。このとき、この先行
する表音符号達「guan」は一音節として設定され、
入力音節数(nchar)が1だけ増やされ、そのため
入力音節数は現在1に等しい。表音符号「guan」に
よって構成される音節は、文字・フレーズ変換の準備の
ために変換初期化部18に提供される。変換初期化部1
8においては、音節数(nchar)が辞書21の最長
文字数(5)より小さいので、ncharの値(1)が
変換長(np)として設定される。変換開始位置が先端
位置(1)に設定された後、変換処理部19が変換を行
う。
【0040】変換処理部19においては、ptrによっ
て指示された音節開始位置と変換長(np)を持った音
節ストリーム、即ち、「guan」を求めて、辞書探索
部20が探索される。辞書探索部20においては、「g
uan」はただ一つの音節から成るので、同音文字の部
分が探索される。表音符号「guan」に対応する同音
文字は次の通りである。
【外29】 最優先順位の文字、即ち「管」が選択され、この最初の
文字の変換の完了を決定するために変換処理部19にフ
ィードバックされる。それから、フローは入力部10に
戻って、次の表音符号の入力を待つ。
【0041】6.表音符号「c」の入力。 図2のフローチャートにおいて、ステップS1でこの表
音符号が先行する表音符号「v」に続いて音節レジスタ
JUINBUF14に格納された後、この表音符号は、
ステップS2において、声調符号かどうかが判定される
が、声調符号でないと判定される。次のステップS3で
は、現在の音節がすでに「v」を含んでいるので、この
表音符号は現在の音節の第一番目の表音符号ではないと
判定された後、ステップS4に進み、この表音符号が許
容された子音、遷移母音、母音の配列に従っているかど
うかが判定される。「v」が遷移母音で、「c」が子音
であり、遷移母音が子音によって従われていることか
ら、この判定結果に従ってフローは音節切断を行うため
にステップS5に進む。ステップS5において、表音符
号「c」が先行する「v」から切り取られ、次の音節の
第一番目の表音符号として設定される。
【0042】このとき、この先行する表音符号「v」は
一音節として設定され、入力音節数(nchar)が1
だけ増やされ、そのため入力音節数は現在2に等しい。
表音符号「v」によって構成される音節は、文字または
フレーズ変換の準備のために変換初期化部18に提供さ
れる。変換初期化部18においては、音節数(ncha
r)が辞書21の最長文字数(5)より小さいので、n
charの値(2)が変換長(np)として設定され
る。変換開始位置が先端位置(1)に設定されたされた
後、変換処理部19が変換を行う。変換処理部19にお
いては、ptrによって指示された音節開始位置と変換
長(np)を持った音節ストリーム、即ち「guan」
と「v」を求めて、辞書探索部20が探索する。
【0043】辞書探索部20においては、「guan」
・「v」は二音節から成るので、同音フレーズの部分が
探索される。表音符号「guan」・「v」に対応する
同音フレーズは次の通りである。
【外30】 本発明の辞書においては、すべての文字の表音符号が声
調符号とともに格納されているので、「guanv」と
「guanv′」のどちらが入力されても、「關於」が
検出されうる。今の場合、フレーズ「關於」だけが辞書
21に格納されているのでそれが選択される。この選択
されたフレーズは、二文字の変換を完了する決定のた
め、変換処理部19にフィードバックされる。同時に、
先に変換された文字「管」は、現在の変換結果に従って
「關」に修正され、プロセスは入力部10に帰って次の
表音文字の入力を待つ。
【0044】7.表音符号「t」の入力。 図2のフローチャートにおけるステップS1でこの表音
符号が先行する表音符号「c」に続いて音節レジスタJ
UINBUF14に格納された後、この表音符号は、ス
テップS2において、声調符号かどうかが判定される
が、声調符号ではないと判定される。するとステップS
3において、現在の音節がすでに「c」を含んでいるの
で、この表音符号は現在の音節の第一番目の表音符号で
はないと判定された後、ステップS4に進み、この表音
符号が許容された子音、遷移母音、母音の配列に従って
いるかどうかが判定される。「c」が子音で、「t」も
子音であり、子音が子音によって従われていることか
ら、この判定結果に従ってフローは音節切断を行うため
ステップS5に進む。
【0045】ステップS5で表音符号「t」が先行する
「c」から切り取られ、次の音節の第一番目の表音符号
として設定される。このとき、この先行する表音符号
「c」は一音節として設定され、入力音節数(ncha
r)が1だけ増やされ、そのため入力音節数は現在3に
等しい。表音符号「c」によって構成される音節は、文
字またはフレーズ変換に備えて変換初期化部18に提供
される。変換初期化部18においては、音節数(nch
ar)が辞書21の最長文字数(5)より小さいので、
ncharの値(3)が変換長(np)として設定され
る。変換開始位置が先端位置(1)に設定されたされた
後、変換処理部19が変換を行う。
【0046】変換処理部19においては、ptrによっ
て指示された音節開始位置と変換長(np)を持った音
節ストリーム、即ち「guan」・「v」・「c」を求
めて、辞書探索部20が探索する。辞書探索部20にお
いては、「guan」・「v」・「c」は三音節から成
るので、同音フレーズの部分が探索される。辞書21に
は、対応するフレーズが存在しないということが判明す
るので、変換処理部19は変換長(np)を1だけ減ら
し、ptrは1だけ増やされ、第二音節から変換を行う
よう、値2が得られる。辞書探索部20は、表音符号
「v」・「c」を求めて、辞書21を探索する。表音符
号「v」・「c」に対応する同音フレーズは次の通りで
ある。
【外31】
【0047】変換処理部19は「魚刺」の使用頻度と
「關於」の使用頻度を比較する。下記外字[外32] の
使用頻度は「關於」の使用頻度より低いことが判明する
ので、
【外32】 フレーズ「魚刺」は棄却され、変換長は再び1だけ減ら
され、値1が得られ、ptrの値は1だけ増やされ、値
3が得られる。変換は第三音節から開始され、辞書探索
部20が表音文字「c」を求めて、辞書21を探索す
る。辞書探索部20においては、「c」はただ一つの音
節から成るので、同音文字の部分が探索される。表音符
号「c」に対応する同音文字は次の通りである。
【外33】
【0048】最優先順位の文字、即ち「此」が選択さ
れ、この最初の文字の変換を完了する決定のため、変換
処理部19にフィードバックされる。それから、フロー
は入力部10に帰って、次の表音符号の入力を待つ。
【0049】8.表音符号「i」の入力。 図2のフローチャートおいて、ステップS1でこの表音
符号が、先行する表音符号「t」に続いて音節レジスタ
JUINBUF14に格納された後、この表音符号は、
ステップS2で声調符号かどうかが判定される。ステッ
プS3においてこの表音符号は現在の音節の第一番目の
表音符号ではないと判定された後、フローはステップS
4に進み、この表音符号が許容された子音、遷移母音、
母音の配列に従っているかどうかが判定される。「t」
が子音で、「i」が遷移母音であり、子音が遷移母音に
よって従われていることから、この判定結果に従ってフ
ローは、次の入力表音符号の読取りに備えてステップS
1に戻る。
【0050】9.表音符号「an」の入力。 図2のフローチャートにおいて、ステップS1でこの表
音符号が先行する表音符号「i」に続いて音節レジスタ
JUINBUF14に格納された後、この表音符号は、
ステップS2において、声調符号かどうかが判定され
る。ステップS3ではこの表音符号は現在の音節の第一
番目の表音符号ではないと判定するが、その後、フロー
はステップS4に進んで、この表音符号が許容された子
音、遷移母音、母音の配列に従っているかどうかが判定
される。「i」が遷移母音で、「an」が母音であり、
遷移母音が母音によって従われていることから、この判
定結果に従ってフローは、次の入力表音符号の読取りに
備えてステップS1に戻る。
【0051】10.表音符号「d」の入力。 図2のフローチャートにおいて、ステップS1でこの表
音符号が先行する表音符号「an」に続いて音節レジス
タJUINBUF14に格納された後、ステップS2で
この表音符号が声調符号かどうかが判定されるが、前述
と同様に声調符号でないと判定される。その後、ステッ
プS3において、現在の音節がすでに「an」を含んで
いるので、この表音符号は現在の音節の第一番目の表音
符号ではないと判定された後、フローはステップS4に
進んで、この表音符号が許容された子音、遷移母音、母
音の配列に従っているかどうかが判定される。「an」
が母音で、「d」が子音であり、母音が子音によって従
われていることから、この判定結果に従ってフローは音
節切断を行うためステップS5に進む。
【0052】ステップS5において、表音符号「d
「が、先行する「an「から切り取られ、次の音節の第
一番目の表音符号として設定される。このとき、この先
行する表音符号達「tian」は一音節として設定さ
れ、入力音節数(nchar)が1だけ増やされ、その
ため入力音節数は現在4に等しい。表音符号達「tia
n」によって構成される音節は、文字またはフレーズ変
換の準備のため、変換初期化部18に提供される。変換
初期化部18においては、音節数(nchar)が辞書
21の最長文字数(5)より小さいので、ncharの
値(4)が変換長(np)として設定される。変換開始
位置が先端位置(1)に設定されたされた後、変換処理
部19が変換を行う。
【0053】変換処理部19においては、ptrによっ
て指示された音節開始位置と変換長(np)を持った音
節ストリーム、即ち「guan」・「v」・「c」・
「tian」を求めて、辞書探索部20が探索する。辞
書探索部20においては、「guan」・「v」・
「c」・「tian」は四音節から成るので、同音フレ
ーズの部分が探索される。辞書21には、対応するフレ
ーズが存在しないということが判明するので、変換処理
部19は変換長(np)を1だけ減らし3を得、ptr
は1だけ増やされ、第二音節から変換を行うよう値2が
得られる。辞書探索部20は、表音符号「v」・「c」
・「tian」を求めて、辞書21を探索する。「v」
・「c」・「tian」は三音節なので、辞書21にお
いて、同音フレーズの部分が探索される。辞書21に
は、対応するフレーズが存在しないということが判明す
るので、変換処理部19は変換長(np)を1だけ減ら
し2を得、ptrは1だけ増やされ、第三音節から変換
を行うよう、値3が得られる。
【0054】辞書探索部20は、表音符号「c」・「t
ian」を求めて、辞書21を探索する。「c」・「t
ian」は二音節なので、辞書21において、同音フレ
ーズの部分が探索される。辞書21には、対応するフレ
ーズが存在しないということが判明するので、変換処理
部19は変換長(np)を1だけ減らし1を得、ptr
は1だけ増やされ、第四音節から変換を行うよう、値4
が得られる。辞書探索部20は、表音符号「tian」
を求めて、辞書21を探索する。「tian」は一音節
なので、辞書21において、同音文字の部分が探索され
る。「tian」に対応する同音文字は次の通りであ
る。
【外34】
【0055】最優先順位の文字即ち「天」が選択され、
第四音節の変換を完了する決定のため、変換処理部19
にフィードバックされる。それから、フローは入力部1
0に帰って、次の表音符号の入力を待つ。
【0056】11.表音符号「e」、「b」、「e
i」、「j」、「i」の入力。 これらの表音符号の入力、判定、及び変換は、前述した
同じ表音符号の場合と同じであるので、それらの説明は
ここでは省略する。
【0057】12.表音符号「eng」の入力。 図2のフローチャートにおいて、ステップS1でこの表
音符号が先行する表音符号「i」に続いて音節レジスタ
JUINBUF14に格納された後、ステップS2でこ
の表音符号は声調符号かどうかが判定される。ステップ
S3において、この表音符号は現在の音節の第一番目の
表音符号ではないと判定された後、フローはステップS
4に進み、この表音符号が許容された子音、遷移母音、
母音の配列に従っているかどうかが判定される。「i」
が遷移母音で、「eng」が母音であり、遷移母音が母
音によって従われていることから、この判定結果に従っ
てフローは次の入力表音符号を読むためステップS1に
戻る。
【0058】13.スペースキーの入力。 図2のフローチャートにおいて、ステップS1でこの表
音符号が先行する表音符号「eng」に続いて音節レジ
スタJUINBUF14に格納された後、ステップS2
でこの表音符号はスペースキーであるかどうかが判定さ
れ、スペースキーであると判定された後に表音符号達
「jieng」が一音節として設定される。入力音節数
(nchar)は1だけ増やされ、そのため入力音節数
は現在7に等しい。表音符号達「jieng」によって
構成される音節は、文字またはフレーズ変換に備えて変
換初期化部18に供給される。
【0059】変換初期化部18においては、音節数(n
char)が辞書21の最長文字数(5)より大きいの
で、ncharの値(5)が変換長(np)として設定
される。変換開始位置が現在の音節ストリームの最後の
音節から数えて5番目にさかのぼる位置、即ち第三番目
の音節に設定された後、変換処理部19が変換を行う。
変換処理部19においては、ptrによって指示された
音節開始位置と変換長(np)を持った音節ストリー
ム、即ち「c」・tian」・「de」・「bei」・
「jieng」を求めて、辞書探索部20が探索する。
辞書探索部20においては、「c」・「tian」・
「de」・「bei」・「jieng」は五音節から成
るので、同音フレーズの部分が探索される。
【0060】辞書21には対応するフレーズが存在しな
いということが判明するので、変換処理部19は上述の
動作を繰り返し、最後の2音節「bei」と「jien
g」が残る。「bei」・「jieng」は二音節なの
で、辞書21において、同音フレーズの部分が探索され
る。「bei」・「jieng」に対応する同音フレー
ズは次の通りである。
【外35】
【外36】 使用頻度に従って、フレーズ「北京」が選択され、第七
音節の変換を完了する決定のため、変換処理部19にフ
ィードバックされる。第六音節は自動的に「北」に修正
され、フローは入力部10に帰って、次の表音符号の入
力を待つ。
【0061】このとき、全音節ストリーム「guanv
ctiandebeijieng」の入力は完了してい
る。しかし、変換結果は「關於此天的北京」であり、こ
れはユーザが求める結果「關於此提案的背景」ではな
い。二つの誤りがユーザによって発見される。その一つ
は「天」で、他は「北京」である。このうち、「天」の
誤りは、入力表音符号達「tian」が二文字のフレー
ズ「ti」・「an」に変換されることが求められてい
るので、音節切断部13に原因がある。一方、「北京」
の誤りは使用頻度の比較結果による。
【0062】上記のように、音節切断によるすべての誤
りについては、音節編集部を動作させ、「天」に対する
「tian」を回復し、切断符号として外字[外11]を
加え、入力表音符号達を「ti’an」に修正すること
ができる。それから、変換処理部19と辞書探索部20
による、上述と同じ動作が実行されて、変換結果「關於
此提案的北京」が得られる。
【0063】「北京」の誤りは、同音文字・フレーズ選
択部23が、「北京」に対応するすべての同音フレーズ
を表示装置に表示し、求めるフレーズ「背景」をユーザ
が選択することによって修正することができる。ユーザ
による「背景」の選択後、間違った結果、即ち、「關於
此提案的北京」は、自動的に「關於此提案的背景」に修
正される。このように、ユーザが満足する求める結果
は、音節編集部と同音文字・フレーズ選択部の動作が実
行された後、変換結果として得られる。
【0064】本発明は、最も実際的で好ましい実施例と
考えられるものに関して説明したが、本発明は開示され
た実施例に限るものでなく、その意図するところは、最
も広く解釈される精神と範囲内に含まれる種々の取り合
わせを包含し、そのようなすべての修正と同等な取り合
わせに及ぶものである。例えば、スペースキーを、各音
節の入力後に入力して音節切断部による誤りを避けるこ
とができる。例えば、表音符号達「ti」に続いてスペ
ースキーを入力すれば、最優先順位の文字「替」が変換
結果として得られる。それから、表音符号「an」が入
力され、その後にスペース符号が入力されると、フレー
ズ「提案」が変換結果として得られる。更に、ある種の
音節の入力手続きにおいては、声調符号を加えることに
よって、音節切断を手動で動作させるとともに、これら
の音節の同音文字・フレーズを避けることができる。例
えば、もし入力表音符号達「「beijieng」は、
「北京」がこれらの表音符号の変換と矛盾するので、
「beijieng∨」に修正されると、フレーズ「背
景」のみが変換されて得られる。
【0065】
【発明の効果】以上に説明したように、本発明に関わる
中国語文字変換装置は、引き続いて入力される表音符号
達を、声調符号の入力の有無に関わらず、表音符号の組
み合わせ規則に従う複数の音節に、自動的に変換する。
各音節あるいは複数の音節から成る各音節ストリーム
は、辞書の中に、対応する同音文字またはフレーズのグ
ループを有している。本発明においては、声調符号の入
力を省略することができるので、ユーザの入力スピード
を増加することができる。さらに、間違った声調符号に
基づく入力の誤りも、これにより避けることができる。
【図面の簡単な説明】
【図1】 本発明に関わる中国語文字変換装置の好まし
い実施例のブロック図である。
【図2】 本発明に関わる好ましい実施例における音節
切断部の動作フローチャートである。
【図3】 本発明に関わる好ましい実施例における変換
処理部の動作フローチャートである。
【図4】 本発明に関わる好ましい実施例における辞書
の構成図である。
【図5】 従来の中国語文字変換装置のブロック図であ
る。
【図6】 本発明に関わる好ましい実施例における表音
符号記憶部の構成図である。
【符号の説明】
10 入力部 11 表音符号メモリ部 12 システム初期化部13 音節切断部 18 変換初期化部 19 変換処理部 20 辞書探索部 21 辞書 22 音節編集部 23 同音文字・フレーズ選択
部 24 出力部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 声調符号入力なしの中国語文字変換装置
    であって、 中国語の子音、遷移母音、母音、声調のための複数の符
    号を格納するための、表音符号メモリ部と、 複数の音節ストリームおよびそれらに対応する中国語文
    字とフレーズを格納するための辞書と、 入力表音符号列から、声調符号またはスペースキーに従
    って、入力表音符号列を少なくとも一音節に切断する
    が、声調符号またはスペースキーが入力されないとき
    は、上記入力表音符号列を、上記表音符号メモリ部にお
    ける子音、遷移母音、母音の配列順序規則に従って上記
    音節に切断する音節切断部と、 上記切断された音節とそれ以前に入力された音節に従っ
    て、求める音節ストリームを構成し、構成された音節ス
    トリームにおける変換開始位置および変換長を設定する
    ための変換初期化部と、 上記変換開始位置と上記変換長によって構成される音節
    ストリームを、上記設定された変換開始位置と変換長に
    従って繰り返し調整するための変換処理部と、 上記変換処理部からの上記音節ストリームを探索キーと
    して、中国語文字またはフレーズを求めて上記辞書を探
    索するための辞書探索部と、 上記音節切断部による誤った音節切断に基づいて辞書か
    ら探索された中国語文字を修正するために、ユーザによ
    って操作される音節編集部と、 同音語またはフレーズの誤った自動的決定によって、上
    記辞書から検出された中国語文字とは別の正しい中国語
    文字またはフレーズを選択するため、ユーザによって操
    作される同音文字・フレーズ選択部とからなる中国語文
    字変換装置。
JP11038700A 1999-02-17 1999-02-17 声調符号無入力式中国語文字変換装置 Pending JP2000235567A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP11038700A JP2000235567A (ja) 1999-02-17 1999-02-17 声調符号無入力式中国語文字変換装置
US09/468,832 US6327560B1 (en) 1999-02-17 1999-12-22 Chinese character conversion apparatus with no need to input tone symbols
TW088123030A TW460825B (en) 1999-02-17 1999-12-27 Chinese character conversion apparatus with no need to input tone symbols
SG9906681A SG82664A1 (en) 1999-02-17 1999-12-29 Chinese character conversion apparatus with no need to input tone symbols
CN00100302A CN1264072A (zh) 1999-02-17 2000-01-17 不需要输入音调符号的汉字转换装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11038700A JP2000235567A (ja) 1999-02-17 1999-02-17 声調符号無入力式中国語文字変換装置

Publications (1)

Publication Number Publication Date
JP2000235567A true JP2000235567A (ja) 2000-08-29

Family

ID=12532601

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11038700A Pending JP2000235567A (ja) 1999-02-17 1999-02-17 声調符号無入力式中国語文字変換装置

Country Status (5)

Country Link
US (1) US6327560B1 (ja)
JP (1) JP2000235567A (ja)
CN (1) CN1264072A (ja)
SG (1) SG82664A1 (ja)
TW (1) TW460825B (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000298667A (ja) * 1999-04-15 2000-10-24 Matsushita Electric Ind Co Ltd 構文情報による漢字変換装置
TWI247276B (en) * 2004-03-23 2006-01-11 Delta Electronics Inc Method and system for inputting Chinese character
US8032357B2 (en) * 2005-06-14 2011-10-04 Microsoft Corporation Phonetic input using a keypad

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5164900A (en) * 1983-11-14 1992-11-17 Colman Bernath Method and device for phonetically encoding Chinese textual data for data processing entry
US5175803A (en) * 1985-06-14 1992-12-29 Yeh Victor C Method and apparatus for data processing and word processing in Chinese using a phonetic Chinese language
US5109352A (en) * 1988-08-09 1992-04-28 Dell Robert B O System for encoding a collection of ideographic characters
US5047932A (en) * 1988-12-29 1991-09-10 Talent Laboratory, Inc. Method for coding the input of Chinese characters from a keyboard according to the first phonetic symbols and tones thereof
CN1023916C (zh) * 1989-06-19 1994-03-02 张道政 简繁五笔字根汉字输入***
TW268115B (ja) * 1991-10-14 1996-01-11 Omron Tateisi Electronics Co
US5331557A (en) * 1993-01-14 1994-07-19 Liu Zhong Yi Audio-video coding system for Chinese characters
US6014615A (en) * 1994-08-16 2000-01-11 International Business Machines Corporaiton System and method for processing morphological and syntactical analyses of inputted Chinese language phrases
SG42314A1 (en) * 1995-01-30 1997-08-15 Mitsubishi Electric Corp Language processing apparatus and method
US5893133A (en) * 1995-08-16 1999-04-06 International Business Machines Corporation Keyboard for a system and method for processing Chinese language text
US5832478A (en) * 1997-03-13 1998-11-03 The United States Of America As Represented By The National Security Agency Method of searching an on-line dictionary using syllables and syllable count

Also Published As

Publication number Publication date
SG82664A1 (en) 2001-08-21
TW460825B (en) 2001-10-21
US6327560B1 (en) 2001-12-04
CN1264072A (zh) 2000-08-23

Similar Documents

Publication Publication Date Title
JP4829901B2 (ja) マニュアルでエントリされた不確定なテキスト入力を音声入力を使用して確定する方法および装置
RU2379767C2 (ru) Коррекция ошибок для систем распознавания речи
TWI293455B (en) System and method for disambiguating phonetic input
US20070100619A1 (en) Key usage and text marking in the context of a combined predictive text and speech recognition system
JP2013117978A (ja) タイピング効率向上のためのタイピング候補の生成方法
JP2003514304A (ja) スペルミス、タイプミス、および変換誤りに耐性のある、あるテキスト形式から別のテキスト形式に変換する言語入力アーキテクチャ
JP2003527676A (ja) モードレス入力で一方のテキスト形式を他方のテキスト形式に変換する言語入力アーキテクチャ
US6587819B1 (en) Chinese character conversion apparatus using syntax information
WO2012144525A1 (ja) 音声認識装置、音声認識方法及び音声認識プログラム
JP2000235567A (ja) 声調符号無入力式中国語文字変換装置
US10614065B2 (en) Controlling search execution time for voice input facility searching
JP2595934B2 (ja) 仮名漢字変換処理装置
KR0157031B1 (ko) 자동 자판모드 변환장치 및 그 방법
JP2002207728A (ja) 表音文字生成装置及びそれを実現するためのプログラムを記録した記録媒体
JP3758241B2 (ja) 音声情報検索装置
JP3234338B2 (ja) 漢字変換装置
JP2002189490A (ja) ピンイン音声入力の方法
CN1357821A (zh) 拼音语音输入的方法
KR102278288B1 (ko) 음소 기반 텍스트 검색 장치 및 방법
JP6300596B2 (ja) 辞書装置、形態素解析装置、データ構造ならびに形態素解析の方法およびプログラム
TW200951743A (en) Method and system of using text characteristics to expand a query scope, data query method capable of searching word phrases having similar characteristics, and search engine server
JP3814000B2 (ja) 文字列変換装置および文字列変換方法
JPS62117060A (ja) 文字・音声入力変換方式
CN112988955A (zh) 多语语音识别及主题语意分析方法与装置
JPH08272780A (ja) 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法