JP2003108547A - 仮名漢字変換装置及び方法 - Google Patents

仮名漢字変換装置及び方法

Info

Publication number
JP2003108547A
JP2003108547A JP2001302643A JP2001302643A JP2003108547A JP 2003108547 A JP2003108547 A JP 2003108547A JP 2001302643 A JP2001302643 A JP 2001302643A JP 2001302643 A JP2001302643 A JP 2001302643A JP 2003108547 A JP2003108547 A JP 2003108547A
Authority
JP
Japan
Prior art keywords
expression
kana
frequency
kanji
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001302643A
Other languages
English (en)
Inventor
Takeyuki Aikawa
勇之 相川
泰博 ▲たか▼山
Yasuhiro Takayama
Katsushi Suzuki
克志 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2001302643A priority Critical patent/JP2003108547A/ja
Publication of JP2003108547A publication Critical patent/JP2003108547A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 ユーザが使用する多様な表現について、明示
的に表現の選択を行わずに適切な表現へ変換する仮名漢
字変換装置及び方法を提供する。 【解決手段】 入力された文字列を仮名漢字混じり文字
列に変換する仮名漢字変換部103と、変換させる表現
の頻度について学習する表現頻度学習部109と、表現
頻度学習部109が学習した表現の頻度に基づいて、表
現変換処理部106に仮名漢字混じり文字列の表現を変
換させる制御部101とを備えた。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、特に携帯電話な
どの携帯端末において、日本語を入力するための仮名漢
字変換に関するもので、特に電子メールや掲示板などで
用いられる口語体の多様な表現の入力に適した仮名漢字
変換装置及び方法に関するものである。
【0002】
【従来の技術】World Wide Web情報の閲
覧、電子メールの送受信、スケジュール管理などの高度
な機能を備えた携帯端末が急速に普及し、これらの携帯
端末を利用する際に、仮名漢字変換を使った日本語入力
を行う機会が非常に多くなってきた。
【0003】携帯端末はパソコン等と異なり、携帯性を
重視するため携帯端末の筐体は小さくまとめられ、入力
キーの数も少なく構成されている。電子メールや掲示板
への書き込みにおいて、感情を強調して表現するため
「やったぁぁぁ!」や「早くしろぉぉぉ!」などの表現
が使用されるが、携帯端末では入力キーが少ないため、
上記のような長い読みの表現を入力する場合に非常に手
間がかかる。従来、このような入力の手間を軽減するた
めの技術として、特開平7−191987号公報に開示
された文書処理方法及びその装置に関する発明などがな
されてきた。
【0004】従来の文書処理装置は、表現辞書及び表現
変換部を備え、入力された読み文字列の仮名漢字変換結
果をユーザが指定する表現種類に変換を行うものであ
る。図22は従来の文書処理装置の構成を示すブロック
図である。図において、2201は文字入力部、220
2はかな漢字変換部、2203はかな漢字変換候補保持
部、2204は表現辞書、2205は表現種類保持部、
2206は表現変換候補選択部、2207は表現種類選
択部、2208は表現変換候補保持部、2209は表現
変換部、2210は表示部、2211は前表現種類保持
部である。
【0005】次に動作について説明する。ユーザにより
文字入力部2201から入力された読み文字列を、かな
漢字変換部2202が仮名漢字混じり文字列に変換す
る。次に表現変換部2209は、かな漢字変換部220
2で変換された仮名漢字混じり文字列について表現辞書
2204を検索し、他の表現種類の候補を取得する。こ
れらの候補の中から、表現種類選択部2207を用いて
ユーザにより選択された表現種類を表現変換候補として
表現変換候補保持部2208に格納する。さらに表現変
換候補選択部2206を用いてユーザに表現変換候補を
選択させ、ユーザが所望する仮名漢字混じり文字列が取
得される。
【0006】従来の文書処理装置では、過去の助動詞
「た」に対する口語表現として「たぁぁぁ!」を表現辞
書2204に登録させておき、「やった」という読みが
入力されると表現種類選択において、口語表現変換を行
うことで「やったぁぁぁ!」という変換結果を得ること
ができる。また、表現種類選択部2207を用いてユー
ザによって選択された表現種類を、前表現種類保持部2
211に保持させ、後の入力について保持された表現種
類へ変換するようにし、表現の統一を図るようにしてい
る。
【0007】
【発明が解決しようとする課題】従来の文書処理装置は
以上のように構成されているので、表現変換処理を行う
際に、ユーザは表現種類を選択する必要があり、操作が
煩雑であった。また、表現を統一するために前表現種類
保持部2211に格納された表現種類を用いるようにし
ているが、電子メールや掲示板で使用される口語体の表
現種類は多様であり、例えば、「ぞ」という終助詞に対
する強調表現は「ぞぉぉぉ」、「ぞーーー」、「ぞ
〜」、「ぞおっ」など多くの種類があり、また、唯一ま
たは数種類の表現種類で統一できる使い方がなされてい
ないため、ユーザが満足する対応が困難であった。ま
た、前表現種類保持部2211に格納された表現種類を
用いることにより、直前に格納された「口語」、「敬
語」といった粗いレベルで表現を統一することはできる
が、詳細な表現種類を選択する場合には、ユーザがその
都度、非常に多くの表現種類から所望の表現種類を選択
しなくてはならず、入力操作の手間が大きくなってい
た。また、ユーザが選択操作を行った表現種類のみを記
憶するだけなので、電子メールの宛先によって表現が異
なる場合や、よく閲覧されるインターネット文書中に現
れる表現を、ユーザが使用する場合に使い勝手を良くす
ることができないという課題があった。
【0008】この発明は、上記のような課題を解決する
ためになされたもので、口語体を入力する際に、ユーザ
が使用する多様な表現種類の使用頻度を学習することに
より、明示的に表現種類を選択しなくとも適切な表現変
換を行える仮名漢字変換装置及び方法を得ることを目的
とする。
【0009】また、受信した電子メールにおいて使用さ
れる表現種類を検出し、その使用頻度を学習することに
より、ユーザが電子メールの本文を入力する際に、明示
的に表現種類を選択しなくとも適切な表現変換が可能な
仮名漢字変換装置及び方法を得ることを目的とする。
【0010】また、閲覧したインターネット文書におい
て使用されている表現種類を検出し、その使用頻度を学
習することにより、インターネット上の掲示板等に入力
する際に明示的に表現種類を選択しなくとも、適切な表
現変換が可能な仮名漢字変換装置及び方法を得ることを
目的とする。
【0011】
【課題を解決するための手段】この発明に係る仮名漢字
変換装置は、文字列を入力させる入力手段と、入力手段
から入力された文字列を仮名漢字混じり文字列に変換す
る仮名漢字変換手段と、仮名漢字変換手段によって変換
された仮名漢字混じり文字列の表現を変換する表現変換
手段と、表現変換手段に変換させる表現の頻度について
学習する表現頻度学習手段と、表現頻度学習手段が学習
した表現の頻度に基づいて表現変換手段に仮名漢字混じ
り文字列の表現を変換させる制御手段とを備えたもので
ある。
【0012】この発明に係る仮名漢字変換装置は、表現
変換手段が所定の表現変換規則に基づいて仮名漢字文字
列の表現を変換するものである。
【0013】この発明に係る仮名漢字変換装置は、表現
変換手段が変換した複数の表現から所望の表現を選択さ
せる表現選択手段を備え、表現頻度学習手段が表現選択
手段によって選択された表現の頻度を求め、後に行われ
る前記表現変換手段の変換において優先させる表現を頻
度から決定するものである。
【0014】この発明に係る仮名漢字変換装置は、表現
頻度学習手段が表現の頻度を表現変換手段の変換で用い
られる表現変換規則の使用頻度から求めるものである。
【0015】この発明に係る仮名漢字変換装置は、文字
列を入力させる入力手段と、入力手段から入力された文
字列を仮名漢字混じり文字列に変換する仮名漢字変換手
段と、受信した電子メールに使用されている表現を所定
の表現検索キーに基づいて検索し、検索された表現の頻
度を学習する電子メール表現頻度学習手段と、電子メー
ル表現頻度学習手段が学習した表現の頻度に基づいて仮
名漢字混じり文字列の表現を変換する電子メール表現変
換手段と、電子メール表現変換手段を制御し送信する電
子メールを作成する制御手段とを備えたものである。
【0016】この発明に係る仮名漢字変換装置は、作成
する電子メールの送信アドレスを検出する送信アドレス
検出手段を備え、電子メール表現頻度学習手段が受信し
た電子メールのアドレスと、この電子メールで使用され
た表現の頻度とを関連させて格納し、制御手段が送信ア
ドレス検出手段により検出されたアドレスと電子メール
表現頻度学習手段に格納されている電子メールのアドレ
スとを照合し、合致した電子メールのアドレスに関連す
る表現の頻度に基づいて表現変換手段に電子メールに適
した表現に変換させるものである。
【0017】この発明に係る仮名漢字変換装置は、文字
列を入力させる入力手段と、入力手段から入力された文
字列を仮名漢字混じり文字列に変換する仮名漢字変換手
段と、閲覧したインターネット文書に使用されている表
現を所定の表現検索キーに基づいて検索し、検索された
表現の頻度を学習する閲覧文書表現頻度学習手段と、閲
覧文書表現頻度学習手段が学習した表現の頻度に基づい
て仮名漢字混じり文字列の表現を変換する入力フォーム
表現変換手段と、入力フォーム表現変換手段を制御し入
力フォームへ変換された文字を入力する制御手段とを備
えたものである。
【0018】この発明に係る仮名漢字変換装置は、入力
操作を行う入力フォームのURLを検出する入力フォー
ムURL検出手段を備え、閲覧文書表現頻度学習手段が
閲覧した文書のURLと、この閲覧文書で使用された表
現の頻度とを関連させて格納し、制御手段が入力フォー
ムURL検出手段により検出されたURLと閲覧文書表
現頻度学習手段に格納されている閲覧文書のURLとを
照合し、合致した閲覧文書のURLに関連する表現の頻
度に基づいて表現変換手段に入力フォームに適した表現
に変換させるものである。
【0019】この発明に係る仮名漢字変換方法は、文字
列を入力させる過程と、入力された文字列を仮名漢字混
じり文字列に変換する過程と、変換された仮名漢字混じ
り文字列の表現を変換する過程と、変換させる表現の頻
度について学習を行う過程と、学習した表現の頻度に基
づいて仮名漢字混じり文字列の表現を変換させる過程と
を備えたものである。
【0020】
【発明の実施の形態】以下、この発明の実施の一形態を
説明する。 実施の形態1.図1は、この発明の実施の形態1による
仮名漢字変換装置1を示す構成図である。図において、
1は仮名漢字変換装置、101は仮名漢字変換装置1を
構成する各部位を制御する制御部(制御手段)、102
は読み文字列が入力される入力部(入力手段)、103
は入力部102から入力された読み文字列を仮名漢字混
じり文字列に変換する仮名漢字変換部(仮名漢字変換手
段)である。104は所定の記憶手段に格納され、仮名
漢字変換部103で行われる変換で用いられる仮名漢字
混じり文字列等のデータで構成される仮名漢字変換辞
書、105は仮名漢字変換部103の行った変換結果を
表示する表示部である。
【0021】106は後述する表現変換規則107に従
って仮名漢字変換部103が行った変換結果の表現を変
換する表現変換処理部(表現変換手段)である。107
は記憶手段111に格納されている表現変換規則、10
8は複数の候補から成る変換結果から所望の候補を選択
する候補選択部(候補選択手段)である。109は候補
選択部108で選択された候補から表現変換規則107
の使用頻度から表現の頻度を学習する表現頻度学習部
(表現頻度学習手段)、110は表現頻度学習部109
から得られる表現頻度学習結果を保持する表現頻度保持
部(表現頻度学習手段)である。なお、仮名漢字変換辞
書104を格納する記憶手段は記憶手段111と同一で
あっても別途備えるように構成してもよい。
【0022】次に動作について説明する。仮名漢字変換
装置1の詳細な処理動作を、図2のフローチャートを用
いて説明する。ステップST201で制御部101は、
仮名漢字変換処理を終了するか否かの判断を行う。仮名
漢字の変換処理を行う場合には、後述するステップST
202からステップST209までの処理を繰り返す。
また、変換処理を終了させる場合には終了処理を行う。
【0023】ステップST202で、入力部102へ読
み文字列の入力が行われ、例えば、ユーザによって「さ
いこうだ」という読み文字列が所定の操作で仮名漢字変
換装置1に入力された場合には、当該仮名漢字変換装置
1はステップST203からステップST209までの
処理を繰り返し行う。仮名漢字変換処理は、仮名漢字変
換部103が仮名漢字変換辞書104を参照しながら、
入力された読み文字列を仮名漢字混じり文字列へ変換す
るものである。仮名漢字変換に用いられる一般的なアル
ゴリズムとして、最長一致法、二文節最長一致法、コス
ト最小法などがある。この仮名漢字変換装置1は、これ
らの仮名漢字変換アルゴリズムに依存するものではな
く、どの仮名漢字変換アルゴリズムを採用しても実施可
能である。以下の説明では簡単のため、最長一致法を用
いた仮名漢字変換処理を例示して説明する。ここで、最
長一致法とは、読み文字列から仮名漢字混じり文字列に
変換する場合に、最も読み文字列と長く一致する候補を
優先し、これを変換結果として採用するアルゴリズムで
ある。
【0024】ステップST203では、制御部101が
入力された全ての読み文字列が処理されたか否かを判断
し、変換処理の繰り返しについて終了判断を行う。入力
された全ての読み文字列が処理済みであれば、ステップ
ST207へ進み、次なる処理を続行する。また、例え
ば読み文字列「さいこうだ」が入力され、一部あるいは
全ての読み文字列が未処理な場合はステップST204
へ進む。
【0025】ステップST204では、仮名漢字変換部
103は、入力された読み文字列に一致する辞書項目に
ついて仮名漢字変換辞書104の検索を行う。図3は仮
名漢字変換辞書104の辞書項目の構成例を示す説明図
である。図において、301は検索用の読みのフィール
ド、302は読みフィールド301に対応する仮名漢字
混じりの表記文字列のフィールド、303は文法的な性
質を表す品詞情報のフィールド、304は適用可能な表
現変換規則107を記述したフィールドである。辞書項
目は少なくともこれらのフィールドを備えるものであ
る。また、仮名漢字変換辞書104の検索は、入力され
た読み文字列の部分である文字列についても行われる。
例えば、「さいこうだ」という読み文字列は「さいこ
う」、「さい」、「さ」などの部分の読みについて、対
応する辞書項目の検索が行われる。
【0026】また、最長一致法では、一致する読み文字
数が最も大きい候補を優先して選択するので、「さいこ
う」という読みに対して、「最高」、及び「再考」が選
択され、これらの候補は、例えば図1に示す記憶手段1
11に備えられる変換用作業領域に格納される。図4は
変換用作業領域の構成の一例を示す説明図である。図に
おいて、401は何番目の文節かを示す文節番号を格納
する領域、402はある文節における何番目の候補かを
示す候補番号を格納する領域、403は当該候補の別な
表現の出力順位を制御するために用いられる表現頻度を
格納する領域、404は適用規則の番号を格納する領
域、405は当該候補の単語数を格納する領域、406
ないし410は当該候補を構成する各単語を格納する領
域である。この変換用作業領域は、変換処理中に動的に
確保してもよいが、予め最大文節数や最大候補数を定め
て静的に確保してもよい。なお、図4に図示したものは
単語の内容として表示情報のみを示したが、これは図示
を簡単にし、理解を容易にするためで、実際には辞書項
目の内容を全て取得できるように構成される。
【0027】ステップST205では、仮名漢字変換処
理部103が単語間の接続可否を記述した接続表(図示
省略)を参照して各単語の接続処理を行う。図4に示し
た領域402の候補番号が1で領域406の単語が「最
高」の候補と、候補番号が2で単語が「再考」の候補
は、いずれも単語がひとつなので接続処理はすべて成功
する。
【0028】ステップST206では、表現変換処理部
106が表現変換規則107を参照して、変換用作業領
域に格納された候補について表現変換処理を行う。この
表現変換処理は、図3に示した辞書項目において、フィ
ールド302の各表記文字列に対して、適用可能なフィ
ールド304に表現変換規則107が記載されている場
合に行われる。例えば、フィールド302の表記文字列
「最高」、及び「再考」は、ともにフィールド304に
表現変換規則107の記載がないので、ステップST2
06では何も処理を行わずにステップST203の処理
へ戻る。なお、表現変換処理については後述する。
【0029】再度行われるステップST203では、入
力読み文字列のうち「さいこう」はすでに処理されたの
で、残る「だ」について処理を行う判断が行われ、ステ
ップST204の処理へ進み、「だ」について仮名漢字
変換辞書104の検索が行われる。この後ステップST
205で単語の接続処理が行われる。図5は、このステ
ップST205の接続処理が行われる変換用作業領域の
一例を示す説明図である。この接続処理では「だ」に接
続可能な単語列のうち、最も読み文字数の長い候補が採
用される。形容動詞の「最高」には、図中、領域501
に格納される形容動詞活用語尾の「だ」が接続し、ま
た、サ変名詞の「再考」には領域502に格納される断
定助動詞の「だ」が接続する。
【0030】この後、ステップST206で、表現変換
処理部106が表現変換規則107を参照して表現変換
処理を行う。図3の辞書項目に示したように、形容動詞
活用語尾の「だ」には、適用可能な表現変換規則107
として規則R1、及び規則R2が記載されているので表
現変換処理が実施される。
【0031】以下、図6のフローチャートを用いて表現
変換処理部106の処理動作の詳細を説明する。ステッ
プST601は、表現変換処理の終了判断で、表現変換
処理を行う候補がなくなると処理を終了させる。表現変
換処理を行う候補が有る場合にはステップST602へ
進む。図5に例示したものは、領域501に格納される
形容動詞活用語尾の「だ」と、領域502に格納される
断定助動詞の「だ」の2つの単語について表現変換処理
が行われる。
【0032】ステップST602で、図3の辞書項目に
表現変換規則107の記載があるか否かが判断される。
また、表現変換規則107の記載がなければステップS
T601の処理へ戻り、次の候補の単語が処理される。
図3の例で、形容動詞活用語尾の「だ」は、表現変換規
則107として規則R1と規則R2が対応するように記
載されており、図5の領域501の「だ」を処理する場
合にはステップST603へ進む。また、一方、図5の
領域502の「だ」を処理する場合には、図3の断定助
動詞の「だ」に対応する表現変換規則107の記載がな
いので、図6のステップST603からステップST6
05の処理をスキップし、ステップST601の処理へ
戻る。
【0033】ステップST603では、表現変換規則1
07のうちから複数の規則を順次適用する場合に、未処
理の規則があるか否かを判断し、繰り返し行われる当該
処理の終了判断を行う。例えば、図5に示した領域50
1の形容動詞活用語尾の「だ」には、規則R1と規則R
2が適用された処理が行われ、どちらの規則も適用され
処理が済んでいれば表現変換処理が終了される。また、
規則R1、規則R2のいずれか、あるいは両方が未処理
であれば、次のステップST604へ進む。
【0034】図7は表現変換規則107の構成の一例を
示す説明図である。図において、701は規則を同定す
る規則番号が格納される欄、702は表現変換前の表現
パターンを示す変換前表現が格納される欄、703は表
現変換後の表現パターンを示す変換後表現が格納される
欄である。表現変換規則107は少なくとも規則番号欄
701、変換前表現欄702、及び変換後表現欄703
に格納される各情報から構成される。
【0035】図6のステップST604の別表現生成処
理は、図5の領域501の形容動詞活用語尾の「だ」に
ついて、図7に示した規則番号欄701の規則R1を適
用する。規則R1に対応する変換前表現欄702にある
「$A」は、処理対象単語のア段の末尾文字を表してい
る。形容動詞活用語尾の「だ」に対して規則R1を適用
すると変換後表現欄703にある「$A〜」に則して
「だ〜」が生成される。
【0036】ステップST605では候補の展開処理が
行われる。これは図7に例示した内容から分かるよう
に、複数の単語で同じ変換パターンを共有することがで
きるので、適用可能な所定の単語を同様の表現に変換す
るものである。このようにわずかな規則で多様な表現に
対応することができる。例えば、形容動詞活用語尾の
「だ」、過去の助動詞の「た」、及び終助詞の「な」と
で規則R1を共有することができ、これにより「最高だ
ぁぁぁ」と、「勝ったぁぁぁ」と、「言ったなぁぁぁ」
などの表現に変換することができる。また、複数の単語
に適用できる規則だけでなく、図7に示す規則番号欄7
01の規則R4のように、変換前表現欄702に示した
「ー」という表現を、変換後表現欄703に示した「〜
〜〜」へ変換する単純な単語の置き換えを行う規則を備
えてもよい。
【0037】候補展開を行う際に、表現頻度保持部11
0に格納された各規則の使用頻度を参照し、変換用作業
領域において新たに生成された候補の表現頻度に規則の
使用頻度を加算する。図8は表現頻度保持部110に格
納される情報の構成を示した説明図である。図におい
て、801は規則番号欄、802は規則の使用頻度を示
す欄である。表現頻度保持部110は、規則番号欄80
1に示す規則と欄802に示す使用頻度を格納する。ま
た、規則番号欄801に格納されている内容は、図7に
示した表現変換規則107の規則番号欄701の内容と
一対一に対応するものである。規則の使用頻度は、例え
ば、−255から+255までの整数値を使用して表
し、いずれの規則も適用していない候補を、使用頻度
「0」として、候補を規則に基づいて表現変換した場合
に使用頻度の値に「+1」を加算し、表現変換で使用さ
れなかった場合に使用頻度の値から「−1」されるよう
に減算したものである。この規則の使用頻度から表現の
頻度がわかり、この表現の頻度に基づいて表現変換処理
部106から変換結果として優先的に出力させる表現の
順位が制御される。なお、規則の使用頻度の算出は、後
述する表現頻度学習部109によって処理が行われ、規
則の使用頻度を表す数値、及び計算等は同様な作用効果
が得られるものであればよく、ここで説明したものに限
定されるものではない。
【0038】次に、図6のステップST603からステ
ップST605までの各処理過程を説明する。図9はス
テップST603の判断処理、ステップST604の別
表示生成処理、及びステップST605の候補展開処理
において、変換用作業領域の各状態を示す説明図であ
る。ステップST603の判断で、未処理の規則がある
と判断された後、ステップST604の別表現生成処理
では、図9(A)に示す候補901を複製し、これに規
則R1を適用して図9(B)に示す候補902を生成す
る。このとき、図8に示したように、表現頻度保持部1
10に格納されている規則R1の使用頻度「3」を、図
9(A)の欄901aに示した表現頻度「0」に加算し
て、図9(B)の欄902aに示すように、候補902
の変換用作業領域に格納する。これと合わせて、欄90
2bに適用規則として規則R1を格納する。図9に示し
た例は、候補902及び後述する候補903に適用され
る規則はそれぞれ1つであるが、変換用作業領域に格納
される単語数が多い場合には単語1から単語5までの内
で、複数の規則が適用される場合もあり、このときには
適用規則を記憶する欄に、例えば図9(B)の欄902
bや図9(C)の欄903bに複数の規則番号が格納さ
れる。また、適用された複数の規則に対する、それぞれ
の使用頻度の合計値が表現頻度として表現頻度保持部1
10に格納される。
【0039】次にステップST605の候補展開とし
て、図9(C)に示すように候補901を複製し、これ
に規則R2を適用して候補903を生成する。これは候
補901の「だ」が、図7に示す規則R2によって「だ
ぁぁぁ」に変換され、候補901、候補902の他に、
さらに候補903が展開される。
【0040】以下、図2のステップST207以降の処
理について説明する。ステップST207の候補表示で
は、制御部101の制御により、図9(C)に示した作
業領域に格納された候補を図1に示す表示部105へ表
示させる。候補の表示は文節ごとに、また候補番号順に
行う。同一の候補番号をもつ候補については表現頻度の
多い順に表示する。図10、図11及び図12は表示部
105の表示内容の一例を示す説明図である。図10に
示した表示例は候補が一覧表示されるものであるが、ユ
ーザによって所定の操作がなされることにより、同一行
に順次、次候補を表示するようにしてもよい。また、図
10に示した表示例は、各候補ごとにすべての表現を順
次表現するものであるが、候補の表示順序を変え、図1
1に示す例のように表現種類ごとに各候補を表示するよ
うにしてもよい。
【0041】ステップST208の候補選択では、表示
部105に表示された複数の候補の中から、ユーザに所
望の候補を選択させる。この選択は、図1に示す候補選
択部108に候補選択キーと表現選択キーの2種類の選
択キーを備えておき、図12に示すように候補選択と表
現選択とを独立させて操作するようにしてもよい。表現
選択キーが操作されると表示部105の表示は、図12
に示す表示1201から表示1202へ遷移し、さらに
表現選択キーが操作されると表示1203へ遷移する。
また、表示1201が表示された状態で候補選択キーが
操作されると表示1204へ遷移する。図12のように
表示させ、ユーザに操作させるようにすると、多様な表
現すべてを一覧表示しユーザに選択させる場合に比べ、
ユーザの操作負担が小さくなる。
【0042】ステップST209の表現頻度学習では、
ステップST208でユーザが選択した候補について、
図1に示す表現頻度学習部109が図9に示した変換用
作業領域に格納されている各情報を参照し、表現頻度学
習処理を行う。図13は表現頻度学習処理を示すフロー
チャートである。ステップST1301は、変換結果が
複数の文節からなる場合の、各文節に対する繰り返し処
理の終了判断である。図9に示した例では、変換結果が
1文節なので「さいこうだ」という文節について学習処
理が行われる。
【0043】ステップST1302では、選択された候
補に適用された表現変換規則107があるか否か、即ち
別表現があるか否かが判断される。例えば、図2のステ
ップST208において、図9(C)に示す候補903
の「最高だぁぁぁ」が選択されたとする。図9(C)の
変換用作業領域の内容を参照すると、同一の候補番号を
もつ、別の表現候補901,902が存在することが判
断でき、ステップST1303へ進む。また、同一の候
補番号をもつ、別の表現候補がない場合には、当該候補
について表現変換処理が行われないので、ステップST
1303からステップST1307の処理をスキップ
し、ステップST1301の処理へ戻り、次の文節につ
いて同様な処理を繰り返す。
【0044】ステップST1303では、選択された候
補が表現変換処理を受ける元の表現か否かが判断され
る。元の表現か否かは、変換用作業領域の適用規則欄が
空欄表示「−」か否かによって判断される。適用規則が
空欄「−」である場合にはステップST1304へ進
む。また、図9(C)の例では、選択された候補903
は欄903bに示されているように規則R2が適用され
ているのでステップST1306へ進む。
【0045】ステップST1306では、オーバーフロ
ー処理が行われる。このオーバーフロー処理は、次のス
テップST1307で頻度を加算し続けると、いずれは
所定の最大値に達することになり、これを防ぐために、
図2のステップST208において選択された候補90
3について適用された規則R2の使用頻度が、あと1つ
加算されると所定の最大値の255へ達する場合に、図
8に示した欄802の使用頻度の値を全て2で除した値
に置換する。図8に示した例では、規則R2の使用頻度
は3なので、前記説明の除算は行わずステップST13
07へ進む。続けてステップST1307では、規則R
2の使用頻度3に1を加算して4とする。この後、ステ
ップST1301の処理へ戻り、次の文節について同様
な処理を繰り返す。
【0046】以下、図2のステップST208で、図9
(C)の候補901の「最高だ」が選択された場合を例
示し、図13に示すステップST1304及びステップ
ST1305の処理を説明する。図9(C)に示す候補
901の適用規則欄は、空欄「−」となっているのでス
テップST1303の判断により、次のステップST1
304へ進む。
【0047】ステップST1304では、アンダーフロ
ー処理を行う。このアンダーフロー処理は、次のステッ
プST1305で各適用規則の使用頻度を減算し続けた
場合に、いずれは所定の最小値に達してしまうので、こ
れを防ぐためにステップST1304において、例えば
候補901の別表現である候補902,903に適用さ
れる規則R1,R2の使用頻度が、次に1減算されると
所定の最小値の−255に達する場合に、図8に示した
表現頻度保持部110に格納されている欄802の使用
頻度の値を全て2で除した値に置換する。図8に示した
例では、規則R2,R3の使用頻度は3なので前記説明
の除算は行わず、ステップST1305へ進む。続けて
ステップST1305では、規則R2,R3の使用頻度
3から1を減算して、それぞれ2とする。この後、ステ
ップST1301の処理へ戻り、次の文節について同様
な処理を繰り返す。
【0048】図2に示すステップST209の処理が済
むと、仮名漢字変換装置1は再びステップST201の
処理へ戻り、これまで説明した各処理を必要に応じて繰
り返し、順次入力される読み文字列を所望の仮名漢字混
じり文字列へ変換する。
【0049】以上のように、この実施の形態1によれ
ば、表現変換規則107の使用頻度を表現頻度学習部1
09が求め、これを表現頻度保持部110に格納し、入
力された読み文字列を、前記使用頻度に応じて優先順位
の高い候補へ変換するようにしたので、直前にユーザが
使用した表現を記憶して文体を統一させることができ、
多様な表現について、きめ細かく変換制御が可能にな
り、適切な表現候補に変換することができるという効果
がある。
【0050】また、表現頻度学習部109に、表現につ
いて頻度を学習させるようにしたので、例えば、「最高
だぁぁぁ」という規則R2によって生成された表現が、
ユーザによる候補選択部108の操作によって選択され
た場合、規則R2の使用頻度に1が加算され、次回以降
の入力部102からの読み文字列の入力について「最高
だ〜」ではなく、「最高だぁぁぁ」が優先して表示部1
05に表示され、ユーザによる表現選択の操作が不要に
することで、入力操作を容易にすることができる。ま
た、規則R2が適用された「勝ったぁぁぁ」や「言った
なぁぁぁ」などの類似した表現についても、優先させて
候補が表示されるので、ユーザによる候補選択部108
の表現選択操作が不要になり、入力操作を容易にするこ
とができるという効果がある。
【0051】また、表現頻度学習部109に、表現につ
いて頻度を学習させるようにしたので、例えば、「最高
だ」という候補が繰り返し選択され頻繁に使用されれ
ば、規則R1及び規則R2の使用頻度が低くなり、図8
に示す欄802の使用頻度の値が減算されていき、いず
れ負の値となる。すると「最高だ」が優先的に表示され
るようになり、ユーザによる選択操作部108の表現選
択操作の負荷を軽減することができるという効果があ
る。
【0052】また、表現頻度学習部109に、表現につ
いて頻度を学習させるようにしたので、例えば、「最高
だ〜」と「早くしろぉぉぉ」という2種類の表現が多用
されれば、これらの各表現に適用される図7に示す規則
R1と規則R3の使用頻度を示す値が大きくなり、これ
ら2種類の規則R1,R3を適用して得られる類似表現
の「勝った〜」や「眠いよぉぉぉ」などが優先的に表示
されるようになり、ユーザによる候補選択部108の表
現選択操作の負荷を軽減することができるという効果が
ある。
【0053】実施の形態2.図14は実施の形態2によ
る仮名漢字変換装置を示す構成図である。図1に示した
仮名漢字変換装置1と同様、または相当する部分には同
じ符号を用い、その説明を省略する。図において、14
01は受信した電子メールを分類してフォルダごとに格
納する電子メール格納部、1402は電子メール格納部
1401に格納されている電子メールで使用されている
表現を検出し使用頻度を学習する電子メール表現頻度学
習部(電子メール表現頻度学習手段)、1403は作成
中の電子メールの送信アドレスを検出する送信アドレス
検出部(送信アドレス検出手段)、1404は電子メー
ル表現頻度学習部1402が学習した表現の頻度を格納
保持する電子メール表現頻度保持部(電子メール表現頻
度学習手段)、1405は送信アドレス検出部1403
が検出した送信アドレスと電子メール表現頻度保持部1
404に保持されている表現の頻度を示す情報とを用い
て表現変換を行う電子メール表現変換処理部(電子メー
ル表現変換手段)である。
【0054】次に動作について説明する。図14に示し
た仮名漢字変換装置2の処理動作を図15のフローチャ
ートを用いて説明する。仮名漢字変換装置1と同様、ま
たは相当する処理動作には図2と同じステップ符号を付
し、その説明を省略する。ステップST1501の電子
メール表現頻度学習処理において、予め電子メール表現
頻度学習部1402は、電子メール格納部1401に格
納されている電子メールの内容を学習し、その学習内容
を電子メール表現頻度保持部1404に格納させる。こ
のステップST1501の処理は、例えば携帯端末の電
源投入時に毎回、未学習の全電子メールについて行うよ
うにしてもよいし、新たな電子メールが受信されたとき
に逐次行うようにしてもよい。
【0055】ここで電子メール表現頻度学習処理につい
て説明する。図16は、図7に示した表現変換規則10
7に表現検索キー1601を付加したもので、規則番号
欄701、変換前表現欄702、変換後表現欄703の
各欄に格納された情報と表現検索キー1601の各情報
の関連を示した説明図である。なお、図14に例示した
ものは、表現検索キー1601を表現変換規則107と
同様に記憶手段111に備えたもので、同様な作用効果
が得られるならば、ここに例示した構成に限定されるも
のではない。
【0056】図16に示す表現検索キー1601は、電
子メールの本文中に含まれる各種の表現と、表現変換に
用いられる規則とを関連付ける文字列である。電子メー
ル表現頻度学習部1402は、電子メール格納部140
1に格納されている電子メールから、所定の表現検索キ
ー1601を用い、この表現検索キー1601の内容に
適合する文字列を検索する。さらに適合した文字列と、
その前後の文字列を含めた文字列を電子メールの本文中
から抽出し、これら一連の文字列の表現が、検索に使用
した表現検索キー1601と関連する変換後表現欄70
3の内容に適合する場合、当該表現検索キー1601と
関連する規則番号欄701に格納された規則が使用され
たものと判断し、電子メール表現頻度保持部1404に
保持されている当該規則の使用頻度を1加算させる。
【0057】図17は、電子メール表現頻度保持部14
04に格納される情報の構成を示した説明図である。図
17の説明図は、図8の説明図に示した規則番号欄80
1、使用頻度欄802にそれぞれ格納されている情報と
フォルダ名欄1501に格納されている情報の関連につ
いて一例を示している。フォルダ名欄1501には、電
子メールが格納されているフォルダ名を示す情報が格納
されており、図17には、電子メール表現頻度学習部1
402が電子メールを検索した結果、使用されていると
判断された規則と、その規則が使用されている電子メー
ルが格納されているフォルダ名とが関連付けされて格納
されている様子が示されている。
【0058】電子メール表現頻度保持部1404に、電
子メール表現頻度学習部1402によって行われる、任
意の規則と、その規則が使用されている電子メールの格
納先のフォルダ名とを関連付けて格納することで、友人
との電子メールでよく使用される表現や、仕事に関する
電子メールでよく使用される表現などを、電子メールの
アドレス毎に、表現変換規則107の各規則について使
用頻度を取得することができる。
【0059】このようにステップST1501の処理が
行われた後、図2を用いて説明した内容と同様な処理
が、図15に示すステップST201からステップST
205まで行われ、その後、ステップST1502の電
子メール表現変換処理が行われる。
【0060】次に、ステップST1502の電子メール
表現変換処理について説明する。図18は電子メール表
現変換処理部1405が行う電子メール表現変換処理フ
ローチャートである。この電子メール表現変換処理は、
実施の形態1で説明した表現変換処理部106が行う表
現変換処理と同様なので、図18のフローチャートで
は、図6に示した表現変換処理のフローチャートと同
様、または相当する処理に同じ符号を用い、その詳細説
明を省略する。
【0061】ステップST601で電子メール表現変換
処理の終了判断を行い、表現変換を行う候補がなければ
当該変換処理を終了し、候補があればステップST60
2へ進み、辞書項目に表現変換規則107の記載がある
か否かが判断される。表現変換規則107の記載があれ
ばステップST603において未処理の規則の有無が判
断され、未処理の規則があると判断されるとステップS
T604の別表現生成が行われる。以上の動作処理は、
実施の形態1で説明した仮名漢字変換装置1の動作処理
と同様に、電子メール作成時の仮名漢字変換処理におい
て行われる。
【0062】図18に示すステップST1801の候補
展開は、図14に示す制御部101が、作成中の電子メ
ールに記載された送信アドレスを、送信アドレス検出部
1403に検出させ、さらに検出されたアドレスが多く
格納されているフォルダを特定し、電子メール格納部1
401からそのフォルダ名を取得する。制御部101
は、このフォルダ名を電子メール表現変換処理部140
5に通知し、図17に示すフォルダ名と各規則の使用頻
度との関連を用いた表現変換処理を行わせる。また、制
御部101は、送信アドレス検出部1403によって検
出されたアドレスが多く格納されているフォルダを特定
できなかった場合は、デフォルト値の使用頻度を用いて
電子メール表現変換処理部1405に表現変換処理を行
わせる。
【0063】ステップST1801の処理が済むと、ス
テップST603の処理へ戻り、所定の処理が繰り返さ
れ、実施の形態1で図6を用いて説明した場合と同様
に、一定の条件で電子メール表現変換処理が終了する。
【0064】また、図15に示すステップST1502
の処理が済むとステップST203の処理に戻り、実施
の形態1で図2を用いた説明と同様に、ステップST2
03からステップST205の処理が繰り返され、所定
の条件でステップST207からステップST209の
処理が行われ、仮名漢字変換装置2の変換処理が行われ
る。また、電子メールの本文作成について、入力部10
2から入力される読み文字列は仮名漢字変換部103に
よって、仮名漢字変換辞書104を参照しながら変換が
行われる。このように、入力部102から入力された文
字列に関する仮名漢字変換は、実施の形態1で説明した
仮名漢字変換装置1と同様に処理が行われ、ユーザが候
補選択部108を用いて選択した表現については、表現
頻度学習部109によって学習、即ち規則の使用頻度に
ついて加減算が行われ、この値を電子メール表示頻度保
持部1404に格納し、この規則の使用頻度を電子メー
ル表現変換処理部1405において行われる表現変換に
用い、電子メールの文書作成において仮名漢字変換を行
う。
【0065】以上のように、この実施の形態2によれ
ば、受信した電子メールにおいて使用されている表現を
検出し、その表現の使用頻度を電子メールが格納されて
いるフォルダごとにまとめて保持しておき、ユーザが電
子メールを作成する際に、表現の頻度に基づいて電子メ
ールの送り先に適した表現変換を行うことができるとい
う効果がある。
【0066】実施の形態3.図19は、この発明の実施
の形態3による仮名漢字変換装置3の構成図である。図
1に示した仮名漢字変換装置1、または図2に示した仮
名漢字変換装置2と同様、または相当する部分には同じ
符号を用い、その説明を省略する。図において、190
1は入力中の入力フォームが含まれるサイトのUnif
orm Resource Locator(以下、U
RLと記載する)を検出する入力フォームURL検出部
(入力フォームURL検出手段)、1902は閲覧した
インターネット文書のなかで使用されている表現を学習
する閲覧文書表現頻度学習部(閲覧文書表現頻度学習手
段)、1903は学習した閲覧文書の表現の頻度を保持
する閲覧文書表現頻度保持部(閲覧文書表現頻度学習手
段)、1904は閲覧文書表現頻度保持部1903に保
持された表現の頻度を用いて表現変換を行う入力フォー
ム表現変換処理部(入力フォーム表現変換手段)であ
る。
【0067】次に動作について説明する。仮名漢字変換
装置3の動作処理を図20に示すフローチャートを用い
て説明する。仮名漢字変換装置1と同様、または相当す
る動作処理について、図2と同じステップ符号を付し、
その説明を省略する。初めにステップST2001の閲
覧文書表現頻度学習処理で、予め閲覧文書表現頻度学習
部1902が、ユーザがインターネット上で閲覧してい
る文書に含まれる表現の頻度を学習し、閲覧文書表現頻
度保持部1903に格納させる。このステップST20
01の処理はユーザがインターネット上の文書を閲覧す
る際に、その都度行われる。
【0068】次に、閲覧文書学習処理について説明す
る。閲覧文書学習処理には、図19に示す表現検索キー
1601が用いられ、この表現検索キー1601は実施
の形態2で図16を用いて説明したものと同様なもの
で、ここでは詳細な説明を省略する。閲覧文書学習処理
で用いられる表現検索キー1601は、閲覧文書中に含
まれる各種の表現と規則番号欄701に示される各規則
とを関連付ける文字列である。閲覧文書表現頻度学習部
1902は、ユーザがインターネットで閲覧している文
書のなかから、表現検索キー1601の内容と適合する
所定の文字列を検索し、その前後の文字列を含めて一連
の文字列を抽出する。次に、図16の変換後表現欄70
3に格納された表現に、前記抽出した文字列の表現が該
当するか否かを判断する。適合する場合には、図16に
示す規則番号欄701の該当する規則が使用されている
として、閲覧文書表現頻度保持部1903に格納されて
いる当該規則の使用頻度の値に1を加算させる。
【0069】図21は閲覧文書表現頻度保持部1903
に格納される表現の頻度を示す情報の構成を示す説明図
である。図21に示す規則番号欄801、使用頻度欄8
02は図8に示したものと同様である。URL欄210
1に格納されているURLは、規則番号欄801にある
規則が検出された閲覧文書が属するサイトのURLであ
る。図21に例示したものはURL欄2101にあるU
RL毎に、表現検索キー1601を用いた検索結果から
抽出された規則とその使用頻度をまとめたものである。
また、使用頻度欄802には該当する規則の使用頻度が
閲覧文書表現頻度学習部1902によって加算され格納
される。このように閲覧文書や掲示板等への入力フォー
ムでよく使用される表現など、インターネット上の通信
で使用される表現について、表現変換規則107の各規
則との関連付けを行い、夫々の表現の使用頻度を学習さ
せる。
【0070】ステップST2001の処理が済むと、仮
名漢字変換装置3は、図20に示すステップST201
からステップST205の各処理を順次行う。各処理の
内容は図2に示した該当する処理と同様なので、ここで
は説明を省略する。
【0071】次に、図20に示すステップST2002
の入力フォーム表現変換処理について説明する。制御部
101は、ユーザの操作により入力中の入力フォームが
含まれるサイトのURLを、入力フォームURL検出部
1901に検出させ、検出されたURLを、図21に示
したURL欄2101に格納されているURLと照合す
る。この2つのURLが合致した場合は、当該URLで
検出された規則の使用頻度を用いて入力フォーム表現変
換処理部1904に表現変換処理を行わせる。この入力
フォーム表現変換処理部1904が行う表現変換処理
は、閲覧文書表現頻度保持部1903の動作を、相当す
る表現頻度保持部110の動作として説明すると、実施
の形態1で説明した図1に示す表現変換処理部106が
行う表現変換処理と同様になる。また、閲覧文書から得
られたURLがない場合には、使用頻度のデフォルト値
を表現変換処理に用いる。
【0072】ステップST2002の処理が済むと、ス
テップST203へ戻り、実施の形態1で図2を用いた
説明と同様に、ステップST203からステップST2
05の処理が繰り返され、所定の条件でステップST2
07からステップST209の処理が行われ、仮名漢字
変換装置3の仮名漢字変換処理が行われる。また、入力
フォームの文字入力について、入力部102から入力さ
れる読み文字列は仮名漢字変換部103によって、仮名
漢字変換辞書104を参照しながら変換が行われる。こ
のように、入力部102から入力された文字列に関する
仮名漢字変換は、実施の形態1で説明した仮名漢字変換
装置1と同様に処理が行われ、ユーザが候補選択部10
8を用いて選択した表現については、表現頻度学習部1
09によって学習、即ち規則の使用頻度が求められ、こ
の値を閲覧文書表示頻度保持部1903に格納し、格納
されている規則の使用頻度を表現の頻度とし、この表現
の頻度に基づいて入力フォーム表現変換処理部1904
が表現の変換を行い、サイトの入力フォームへの文字入
力時の仮名漢字変換を行う。
【0073】以上のように、この実施の形態3によれ
ば、閲覧したインターネット文書において使用されてい
る表現を検出し、その表現の頻度を学習してインターネ
ット上の掲示板等へ入力する際に、表現の頻度に基づい
て適切な表現へ変換できるという効果がある。
【0074】
【発明の効果】以上のように、この発明によれば、文字
列を入力させる入力手段と、入力手段から入力された文
字列を仮名漢字混じり文字列に変換する仮名漢字変換手
段と、仮名漢字変換手段によって変換された仮名漢字混
じり文字列の表現を変換する表現変換手段と、表現変換
手段に変換させる表現の頻度について学習する表現頻度
学習手段と、表現頻度学習手段が学習した表現の頻度に
基づいて表現変換手段に仮名漢字混じり文字列の表現を
変換させる制御手段とを備えたので、文書の表現を統一
でき、また、多様な表現に対応して適切な表現に変換す
ることができるという効果がある。
【0075】この発明によれば、表現変換手段が所定の
表現変換規則に基づいて仮名漢字文字列の表現を変換す
るようにしたので、文書の表現を統一でき、また、多様
な表現に対応して適切な表現に変換することができると
いう効果がある。
【0076】この発明によれば、表現変換手段が変換し
た複数の表現から所望の表現を選択させる表現選択手段
を備え、表現頻度学習手段が表現選択手段によって選択
された表現の頻度を求め、後に行われる前記表現変換手
段の変換において優先させる表現を頻度から決定するよ
うにしたので、文書の表現を統一でき、また、多様な表
現に対応して適切な表現に変換することができるという
効果がある。
【0077】この発明によれば、表現頻度学習手段が表
現の頻度を表現変換手段の変換で用いられる表現変換規
則の使用頻度から求めるようにしたので、文書の表現を
統一でき、また、多様な表現に対応して適切な表現に変
換することができるという効果がある。
【0078】この発明によれば、文字列を入力させる入
力手段と、入力手段から入力された文字列を仮名漢字混
じり文字列に変換する仮名漢字変換手段と、受信した電
子メールに使用されている表現を所定の表現検索キーに
基づいて検索し、検索された表現の頻度を学習する電子
メール表現頻度学習手段と、電子メール表現頻度学習手
段が学習した表現の頻度に基づいて仮名漢字混じり文字
列の表現を変換する電子メール表現変換手段と、電子メ
ール表現変換手段を制御し送信する電子メールを作成す
る制御手段とを備えたので、電子メールの本文入力の際
に、表現変換の操作をすることなく適切な表現の変換を
行うことができるという効果がある。
【0079】この発明によれば、作成する電子メールの
送信アドレスを検出する送信アドレス検出手段を備え、
電子メール表現頻度学習手段が受信した電子メールのア
ドレスと、この電子メールで使用された表現の頻度とを
関連させて格納し、制御手段が送信アドレス検出手段に
より検出されたアドレスと電子メール表現頻度学習手段
に格納されている電子メールのアドレスとを照合し、合
致した電子メールのアドレスに関連する表現の頻度に基
づいて表現変換手段に電子メールに適した表現に変換さ
せるようにしたので、電子メールの本文入力の際に、表
現変換の操作をすることなく適切な表現の変換を行うこ
とができるという効果がある。
【0080】この発明によれば、文字列を入力させる入
力手段と、入力手段から入力された文字列を仮名漢字混
じり文字列に変換する仮名漢字変換手段と、閲覧したイ
ンターネット文書に使用されている表現を所定の表現検
索キーに基づいて検索し、検索された表現の頻度を学習
する閲覧文書表現頻度学習手段と、閲覧文書表現頻度学
習手段が学習した表現の頻度に基づいて仮名漢字混じり
文字列の表現を変換する入力フォーム表現変換手段と、
入力フォーム表現変換手段を制御し入力フォームへ変換
された文字を入力する制御手段とを備えたので、入力フ
ォームへの入力の際に表現変換の操作をすることなく適
切な表現に変換を行うことができるという効果がある。
【0081】この発明によれば、入力操作を行う入力フ
ォームのURLを検出する入力フォームURL検出手段
を備え、閲覧文書表現頻度学習手段が閲覧した文書のU
RLと、この閲覧文書で使用された表現の頻度とを関連
させて格納し、制御手段が入力フォームURL検出手段
により検出されたURLと閲覧文書表現頻度学習手段に
格納されている閲覧文書のURLとを照合し、合致した
閲覧文書のURLに関連する表現の頻度に基づいて表現
変換手段に入力フォームに適した表現に変換させるよう
にしたので、入力フォームへの入力の際に表現変換の操
作をすることなく適切な表現に変換を行うことができる
という効果がある。
【0082】この発明によれば、文字列を入力させる過
程と、入力された文字列を仮名漢字混じり文字列に変換
する過程と、変換された仮名漢字混じり文字列の表現を
変換する過程と、変換させる表現の頻度について学習を
行う過程と、学習した表現の頻度に基づいて仮名漢字混
じり文字列の表現を変換させる過程とを備えたので、文
書の表現を統一でき、また、多様な表現に対応して適切
な表現に変換することができるという効果がある。
【図面の簡単な説明】
【図1】 この発明による実施の形態1の仮名漢字変換
装置の構成図である。
【図2】 仮名漢字変換装置の処理動作を示すフローチ
ャートである。
【図3】 仮名漢字変換辞書を構成する辞書項目を示す
説明図である。
【図4】 変換用作業領域の構成を示す説明図である。
【図5】 接続処理が行われる変換用作業領域を示す説
明図である。
【図6】 表現変換処理部の処理動作を示すフローチャ
ートである。
【図7】 表現変換処理規則を示す説明図である。
【図8】 表現頻度保持部に格納されている情報の構成
を示す説明図である。
【図9】 変換用作業領域の状態を示す説明図である。
【図10】 表示内容を示す説明図である。
【図11】 表示内容を示す説明図である。
【図12】 表示内容を示す説明図である。
【図13】 表現頻度学習処理を示すフローチャートで
ある。
【図14】 この発明の実施の形態2による仮名漢字変
換装置の構成図である。
【図15】 仮名漢字変換装置の処理動作を示すフロー
チャートである。
【図16】 表現変換規則と表現検索キーの関連を示す
説明図である。
【図17】 電子メール表現頻度保持部に格納されてい
る情報の構成を示す説明図である。
【図18】 電子メール表現変換処理部の処理動作を示
すフローチャートである。
【図19】 この発明による実施の形態3の仮名漢字変
換装置の構成図である。
【図20】 仮名漢字変換装置の処理動作を示すフロー
チャートである。
【図21】 閲覧文書表現頻度保持部に格納されている
情報の構成を示す説明図である。
【図22】 従来の文書処理装置の構成を示すブロック
図である。
【符号の説明】
1,2,3 仮名漢字変換装置、101 制御部(制御
手段)、102 入力部(入力手段)、103 仮名漢
字変換部(仮名漢字変換手段)、104 仮名漢字変換
辞書、105 表示部、106 表現変換処理部(表現
変換手段)、107 表現変換規則、108 候補選択
部(候補選択手段)、109 表現頻度学習部(表現頻
度学習手段)、110 表現頻度保持部(表現頻度学習
手段)、111記憶手段、1401 電子メール格納
部、1402 電子メール表現頻度学習部(電子メール
表現頻度学習手段)、1403 送信アドレス検出部
(送信アドレス検出手段)、1404 電子メール表現
頻度保持部(電子メール表現頻度学習手段)、1405
電子メール表現変換処理部(電子メール表現変換手
段)、1601 表現検索キー、1901 入力フォー
ムURL検出部(入力フォームURL検出手段)、19
02 閲覧文書表現頻度学習部(閲覧文書表現頻度学習
手段)、1903 閲覧文書表現頻度保持部(閲覧文書
表現頻度学習手段)、1904 入力フォーム表現変換
処理部(入力フォーム表現変換手段)。
フロントページの続き (72)発明者 鈴木 克志 東京都千代田区丸の内二丁目2番3号 三 菱電機株式会社内 Fターム(参考) 5B009 MA08 MA14 ME16 MG01 MG04

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 入力された文字列を仮名漢字混じり文字
    列に変換する仮名漢字変換装置であって文字列を入力さ
    せる入力手段と、 前記入力手段から入力された文字列を仮名漢字混じり文
    字列に変換する仮名漢字変換手段と、 前記仮名漢字変換手段によって変換された仮名漢字混じ
    り文字列の表現を変換する表現変換手段と、 前記表現変換手段に変換させる表現の頻度について学習
    する表現頻度学習手段と、 前記表現頻度学習手段が学習した表現の頻度に基づいて
    前記表現変換手段に仮名漢字混じり文字列の表現を変換
    させる制御手段とを備えた仮名漢字変換装置。
  2. 【請求項2】 表現変換手段は、所定の表現変換規則に
    基づいて仮名漢字文字列の表現を変換することを特徴と
    する請求項1記載の仮名漢字変換装置。
  3. 【請求項3】 表現変換手段が変換した複数の表現から
    所望の表現を選択させる表現選択手段を備え、 表現頻度学習手段は前記表現選択手段によって選択され
    た表現の頻度を求め、後に行われる前記表現変換手段の
    変換において優先させる表現を前記頻度から決定するこ
    とを特徴とする請求項1記載の仮名漢字変換装置。
  4. 【請求項4】 表現頻度学習手段は、表現の頻度を表現
    変換手段の変換で用いられる表現変換規則の使用頻度か
    ら求めることを特徴とする請求項3記載の仮名漢字変換
    装置。
  5. 【請求項5】 入力された文字列を仮名漢字混じり文字
    列に変換する仮名漢字変換装置であって文字列を入力さ
    せる入力手段と、 前記入力手段から入力された文字列を仮名漢字混じり文
    字列に変換する仮名漢字変換手段と、 受信した電子メールに使用されている表現を所定の表現
    検索キーに基づいて検索し、検索された表現の頻度を学
    習する電子メール表現頻度学習手段と、 前記電子メール表現頻度学習手段が学習した表現の頻度
    に基づいて前記仮名漢字混じり文字列の表現を変換する
    電子メール表現変換手段と、 前記電子メール表現変換手段を制御し送信する電子メー
    ルを作成する制御手段とを備えた仮名漢字変換装置。
  6. 【請求項6】 作成する電子メールの送信アドレスを検
    出する送信アドレス検出手段を備え、 電子メール表現頻度学習手段は、受信した電子メールの
    アドレスと、この電子メールで使用された表現の頻度と
    を関連させて格納し、 制御手段は、前記送信アドレス検出手段により検出され
    たアドレスと前記電子メール表現頻度学習手段に格納さ
    れている電子メールのアドレスとを照合し、合致した前
    記電子メールのアドレスに関連する表現の頻度に基づい
    て表現変換手段に前記電子メールに適した表現に変換さ
    せることを特徴とする請求項5記載の仮名漢字変換装
    置。
  7. 【請求項7】 入力された文字列を仮名漢字混じり文字
    列に変換する仮名漢字変換装置であって文字列を入力さ
    せる入力手段と、 前記入力手段から入力された文字列を仮名漢字混じり文
    字列に変換する仮名漢字変換手段と、 閲覧したインターネット文書に使用されている表現を所
    定の表現検索キーに基づいて検索し、検索された表現の
    頻度を学習する閲覧文書表現頻度学習手段と、前記閲覧
    文書表現頻度学習手段が学習した表現の頻度に基づいて
    前記仮名漢字混じり文字列の表現を変換する入力フォー
    ム表現変換手段と、 前記入力フォーム表現変換手段を制御し入力フォームへ
    前記入力フォーム表現変換手段で変換された文字を入力
    する制御手段とを備えた仮名漢字変換装置。
  8. 【請求項8】 入力操作を行う入力フォームのURLを
    検出する入力フォームURL検出手段を備え、 閲覧文書表現頻度学習手段は、閲覧した文書のURL
    と、この閲覧文書で使用された表現の頻度とを関連させ
    て格納し、 制御手段は、前記入力フォームURL検出手段により検
    出されたURLと前記閲覧文書表現頻度学習手段に格納
    されている閲覧文書のURLとを照合し、合致した前記
    閲覧文書のURLに関連する表現の頻度に基づいて表現
    変換手段に前記入力フォームに適した表現に変換させる
    ことを特徴とする請求項7記載の仮名漢字変換装置。
  9. 【請求項9】 文字列を入力させる過程と、 入力された文字列を仮名漢字混じり文字列に変換する過
    程と、 前記変換された仮名漢字混じり文字列の表現を変換する
    過程と、 変換させる表現の頻度について学習を行う過程と、 前記学習した表現の頻度に基づいて仮名漢字混じり文字
    列の表現を変換させる過程とを備えた仮名漢字変換方
    法。
JP2001302643A 2001-09-28 2001-09-28 仮名漢字変換装置及び方法 Pending JP2003108547A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001302643A JP2003108547A (ja) 2001-09-28 2001-09-28 仮名漢字変換装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001302643A JP2003108547A (ja) 2001-09-28 2001-09-28 仮名漢字変換装置及び方法

Publications (1)

Publication Number Publication Date
JP2003108547A true JP2003108547A (ja) 2003-04-11

Family

ID=19122849

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001302643A Pending JP2003108547A (ja) 2001-09-28 2001-09-28 仮名漢字変換装置及び方法

Country Status (1)

Country Link
JP (1) JP2003108547A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007164278A (ja) * 2005-12-09 2007-06-28 Nec Corp 日本語処理装置、日本語処理方法及び日本語処理用プログラム
JP2008310571A (ja) * 2007-06-14 2008-12-25 Oki Electric Ind Co Ltd 文字列入力装置、文字列入力方法およびプログラム
JP2010044592A (ja) * 2008-08-12 2010-02-25 Toshiba Corp 電子機器
JP2016115134A (ja) * 2014-12-15 2016-06-23 株式会社ドワンゴ 情報処理装置、制御方法、及びプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007164278A (ja) * 2005-12-09 2007-06-28 Nec Corp 日本語処理装置、日本語処理方法及び日本語処理用プログラム
JP2008310571A (ja) * 2007-06-14 2008-12-25 Oki Electric Ind Co Ltd 文字列入力装置、文字列入力方法およびプログラム
JP2010044592A (ja) * 2008-08-12 2010-02-25 Toshiba Corp 電子機器
JP2016115134A (ja) * 2014-12-15 2016-06-23 株式会社ドワンゴ 情報処理装置、制御方法、及びプログラム

Similar Documents

Publication Publication Date Title
US7277029B2 (en) Using language models to expand wildcards
RU2316040C2 (ru) Ввод текста в электронное устройство связи
US7769804B2 (en) Server side search with multi-word word wheeling and wildcard expansion
AU2004200638B2 (en) Methods and systems for language translation
RU2589873C2 (ru) Способ и устройство обработки ввода
US6003049A (en) Data handling and transmission systems employing binary bit-patterns based on a sequence of standard decomposed strokes of ideographic characters
JP4277903B2 (ja) 辞書機能を備えた電子機器及びプログラム
CA2542625A1 (en) Incremental search of keyword strings
US20070164782A1 (en) Multi-word word wheeling
WO2009098350A1 (en) Device and method for providing fast phrase input
JP2005078501A (ja) 携帯端末および携帯端末機能の呼出方法ならびにそのプログラム
JP4213570B2 (ja) 文字入力方法、文字入力装置およびプログラム
CA2665858A1 (en) Character input program, character input device, and character input method
JP2003108547A (ja) 仮名漢字変換装置及び方法
TWI273450B (en) Method and apparatus for searching data
JP4251000B2 (ja) かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラム
JP5442212B2 (ja) 電子機器
JP2002108768A (ja) 情報端末装置、それとサーバ装置とを接続した電子メールシステム、電子メール作成方法および電子メール作成プログラムを記録した記録媒体
JP2002251390A (ja) 単語列入力装置、単語列入力方法、ならびに、プログラム
JP4395620B2 (ja) 表示制御装置及びプログラム
JP4404436B2 (ja) 文字入力装置
JP2004213120A (ja) 言語入力方法及びシステム
JP5521299B2 (ja) 文字入力変換方法及び文字入力変換装置
JP2004178396A (ja) 日本語変換装置、方法、及びプログラム
JPH1011429A (ja) 文字処理装置

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20071105

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071105

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071105

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080807