JP2880601B2 - 言語処理装置 - Google Patents

言語処理装置

Info

Publication number
JP2880601B2
JP2880601B2 JP4009521A JP952192A JP2880601B2 JP 2880601 B2 JP2880601 B2 JP 2880601B2 JP 4009521 A JP4009521 A JP 4009521A JP 952192 A JP952192 A JP 952192A JP 2880601 B2 JP2880601 B2 JP 2880601B2
Authority
JP
Japan
Prior art keywords
input
word
buffer
dictionary
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP4009521A
Other languages
English (en)
Other versions
JPH05197747A (ja
Inventor
毅 九津見
徳行 平井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Consejo Superior de Investigaciones Cientificas CSIC
Original Assignee
Consejo Superior de Investigaciones Cientificas CSIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Consejo Superior de Investigaciones Cientificas CSIC filed Critical Consejo Superior de Investigaciones Cientificas CSIC
Priority to JP4009521A priority Critical patent/JP2880601B2/ja
Priority to US08/006,759 priority patent/US5442547A/en
Publication of JPH05197747A publication Critical patent/JPH05197747A/ja
Application granted granted Critical
Publication of JP2880601B2 publication Critical patent/JP2880601B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は辞書を装備する言語処理
装置に関し、特に、辞書の一部をその利用者に作成させ
る機能を有している言語処理装置において、その作成の
機能の改良に関する。
【0002】
【従来の技術】現在実用化されている言語処理装置に
は、人間の文書作成活動を支援するためのワードプロセ
ッサや、或る言語で書かれた文書を別の言語に翻訳する
ための機械翻訳装置などがある。これらの言語処理装置
には、それぞれの目的に応じた情報を納めた辞書が備え
られている。ここでいう辞書とは、言語処理装置で扱う
言語に関して、見出語とそれに付帯する各種の情報の組
とを1単位の項目としたものを多数統合し、見出語を用
いて所望の項目を容易に検索できるように系統立てて並
べたものである。辞書は、原則として機械可読な不揮発
性の媒体に機械可読な形式で記録される。
【0003】このような言語処理装置を用いて利用者が
処理あるいは作成しようとしている文書に、この装置に
備えられた辞書に見出語として記載されていない単語が
含まれている場合には、作業効率が著しく低下してしま
う。したがってそのような場合に備えて、この種の言語
処理装置は一般に「ユーザ辞書作成機能」を備えてい
る。ユーザ辞書とは、利用者が見出語およびそれに付帯
する情報を入力することにより言語処理装置に作成され
る辞書をいう。言語処理装置が言語処理を実行する際に
は、元々備えられている辞書と共に、ユーザ辞書も用い
る。
【0004】このとき、ユーザ辞書に登録しようとする
単語の活用方法が規則的である場合を考える。すなわ
ち、対象となる言語の文法理論によって規定されている
パターンに則って、登録しようとするすべての単語が活
用されている場合を考える。このような場合には、この
変型パターンは有限個ということになる。したがってユ
ーザ辞書に登録すべき内容は、登録対象の単語と、その
単語の品詞と、その単語の活用パターンが、その単語の
品詞に関して当該言語において存在する有限個の活用パ
ターンのうちのいずれであるかを指定する情報とであ
る。すなわち、このような場合には様々な文法条件の中
で実際にその単語が用いられる際にとる形を逐一辞書に
記載する必要はない。どのような形でも、その単語の原
形として定められる1つの形と、その品詞と、その活用
パターンとに基づき、言語処理装置の言語処理機能を用
いて生成することができる。
【0005】
【発明が解決しようとする課題】しかし、ユーザ辞書に
登録しようとする単語の活用方法が不規則的な場合に
は、上述のように単純な登録のみで十分というわけには
いかない。この場合には登録すべき内容は、単語の原形
と、その品詞と、様々な文法条件の中で実際にその単語
が用いられる際にとる形のすべてとである。そしてこれ
らはすべてユーザが入力しなければならない。
【0006】対象言語が英語の場合を考える。登録しよ
うとする単語の品詞が動詞であれば、入力すべき変化形
には、原形の他に三人称単数現在形(「三単現」)・過
去形・過去分詞形・現在分詞形がある。したがって動詞
の場合には1つの単語について5種類の形を入力しなけ
ればならない。
【0007】また、ユーザ辞書に登録しようとする単語
が複合語である場合を考える。複合語とは、複数の単語
とみなされる単語群が機能上は単一の単語として一まと
まりとして振るまう場合のその複数の単語をいう。複合
語をユーザ辞書に登録しようとする場合には、それらを
単一の単語とみなして登録するのが便利であり、また通
例でもある。この場合、言語によっては、複合語全体が
不規則変化する場合にも、変化する箇所はほぼ決まった
ものとなる。たとえば対象言語が英語である場合を考え
る。複合語の品詞が動詞である場合には、複合語を構成
する単語群のうち変化する部分は先頭の単語である可能
性が最も高い。一方、複合語の品詞が名詞である場合に
は、複合語を構成する単語群のうち末尾の単語が変化す
る可能性が最も高い。しかし、このような言語的特性が
存在するにもかかわらず、従来の言語処理装置のユーザ
辞書作成機能においては、通常の単語と同様に取扱われ
ており、英語の動詞であれば5種類の形を入力しなけれ
ばならない。
【0008】したがって従来の言語処理装置のユーザ辞
書作成機能においては、不規則変化をする単語や、複合
語を登録する際の利用者の負担を軽減することができな
いという問題点があった。
【0009】それゆえにこの発明の目的は、不規則変化
をする単語や複合語などを登録する場合の使用者の負担
を軽減することである。
【0010】
【課題を解決するための手段】本発明に係る言語処理装
置は、入力される文章に対して少なくとも形態素解析を
含む文法処理を行なうための文法処理手段と、形態素解
析の際に利用され得る、機械可読な媒体に機械可読な形
式で記録された、入力文章の言語の複数個の形態素を格
納するための辞書と、辞書の一部を利用者辞書として利
用者が作成するのを援助するための利用者辞書作成援助
手段とを含む。利用者辞書に記録される形態素は、文法
条件によって、所定の文法規則に従ってはその変型パタ
ーンを生成できないような変型パターンで形を変え得る
ものを含む。本発明に係る言語処理装置の利用者辞書作
成援助手段は、第1および第2のバッファと、利用者が
利用者辞書に記録させようとする、形を変え得る記録対
象形態素の第1の形を取得して第1のバッファに格納
るための手段と、所定の入力域上から利用者により入力
される記録対象形態素の第2の形を受けとり、第2のバ
ッファに格納するための手段と、第1のバッファに格納
された第1の形と第2のバッファ格納された第2の形と
を、記録対象形態素として互いに関連づけて利用者辞書
に記録するための手段とを含む。利用者辞書作成援助手
段はさらに、第2の形の入力に先立って、第1のバッフ
ァの内容を第2のバッファに複写し、さらに、第1の形
と第2の形とで形が異なっている可能性の最も高い箇所
に第2のバッファのポインタを位置づけるための手段
と、第2の形の入力に先立って、所定の入力域上に第2
のバッファの内容を表示するとともに、第2のバッファ
のポインタ位置に対応する箇所に入力位置を位置づける
ための手段とを含む。
【0011】
【作用】本発明に係る言語処理装置の利用者辞書作成援
助手段を利用して形態素を利用者辞書に記録する場合に
は、取得された第1の形が、第2の形の入力の際に所定
の入力域上に表示される。さらに、第1の形と第2の形
とで、その形が異なっている可能性が最も高い位置に入
力位置が位置づけられている。したがって第1の形を変
形して第2の形に変えて入力する際に入力位置を移す手
間も、修正量も少なくなる。
【0012】
【実施例】以下、本発明の言語処理装置の一実施例とし
て機械翻訳装置を例にとって説明する。しかし本発明は
機械翻訳装置には限定されず、ワードプロセッサなどに
対しても適用可能である。
【0013】実施例の説明の前に、機械翻訳の概念につ
いて簡単に説明する。第1図を参照して、機械翻訳にお
いて行なわれる解析処理には、様々な解析レベルがあ
る。機械翻訳は、図1の左上に示されるソース言語が入
力されると、各レベルの処理を順に行なって最終的に図
1の右側に示されるターゲット言語を得るための処理で
ある。たとえばソース言語が入力されると、まずレベル
L1の辞書引き処理、レベルL2の形態素解析処理、レ
ベルL3の構文解析処理、…と処理が進められ、最終的
にレベルL10の形態素生成処理が行なわれてターゲッ
ト言語が生成される。
【0014】機械翻訳は、どのレベルの解析処理まで行
なうかによって、大きく次の2つに分けられる。第1
は、レベルL6に示される中間言語まで解析し、そこか
らターゲット言語を生成していくピボット方式である。
第2は、上述のレベルL2〜レベルL5のいずれかまで
解析を行なってソース言語の内部構造を得、次に、得ら
れたソース言語の内部構造と同じレベルのターゲット言
語の内部構造に変換した後、ターゲット言語を生成する
トランスファ方式である。
【0015】ピボット方式において用いられる中間言語
とは、ソース言語およびターゲット言語のどちらにも依
存しない概念である。したがってソース言語の解析処理
を一度行なって中間言語を得れば、この中間言語から複
数の言語を生成することができるため、多言語間翻訳に
有利であるとされる。しかし、このようなピボット方式
では、その基本的概念である中間言語を本当に設定でき
るかどうかという点が未解決である。
【0016】トランスファ方式はピボット方式のこのよ
うな問題に対する妥協案であって、現在の多くのシステ
ムはこのトランスファ方式を採っている。以下の説明は
トランスファ方式についてのものであり、後述する実施
例の機械翻訳装置もトランスファ方式を用いたものであ
る。
【0017】以下、図1に示される各解析処理の内容に
ついて説明する。 (1) 辞書引き、形態素解析 この処理においては、入力された文章に対して、形態素
が格納された辞書を参照しながらたとえば最長一致法な
どを用いて形態素列(単語列)に分割する処理がまず行
なわれる。そして、得られた各単語に対する品詞などの
文法情報および訳語を得、さらに時制・人称・数などを
解析する処理が行なわれる。
【0018】(2) 構文解析 この処理においては、品詞・変化形などに基づき、単語
間のかかり受けなどの文章の構造(構造解析木)を組立
て、決定する処理が行なわれる。この処理においては、
得られた文章の構造が正しい意味を表わすかどうかにつ
いての判断は行なわれない。
【0019】(3) 意味解析 構文解析処理の結果得られた複数の構造解析木から、意
味的に正しいものとそうでないものとを判別し、正しい
もののみを採用する処理が行なわれる。
【0020】(4) 文脈解析 文脈解析処理では、入力された文章の話題を理解し、入
力文章中に含まれる省略部分や曖昧さなどを取去る処理
が行なわれる。
【0021】以下で説明する本発明の一実施例の機械翻
訳装置の翻訳モジュールにおいては、レベルL3までの
解析処理を行なうものとする。すなわち、本実施例の機
械翻訳装置の翻訳モジュールは、図2に示されるような
構造を有する。この翻訳モジュールは、図2を参照し
て、ソース言語に対して辞書引き・形態素解析処理を行
なうための辞書引き・形態素解析部11と、形態素解析
された入力文章に対して構文解析を行なうための構文解
析部12と、構文解析の結果を変換してターゲット言語
の構造解析木を生成するための変換部13と、変換部1
3によって生成されたターゲット言語の構造解析木に基
づき、ターゲット言語の翻訳文を生成するための翻訳文
生成部14とを含む。各部11〜14で行なわれる処理
については、実施例において詳しく説明する。
【0022】図3は、この発明の言語処理装置の一実施
例の機械翻訳装置のブロック図である。図3を参照し
て、この機械翻訳装置は、メインCPU(中央処理装
置)1と、メインCPU1が接続されたバス7と、バス
7に接続されたメインメモリ2と、バス7に接続された
CRT(陰極線管)やLCD(液晶表示装置)などから
なる表示装置3と、キーボード4と、バス7に接続され
た翻訳モジュール5と、翻訳モジュール5に接続された
翻訳用の辞書・文法規則および木変換構造規則などの知
識ベースを格納しているメモリ6とを含む。
【0023】翻訳モジュール5は、ソース言語の文章が
入力されると、それを所定の手順で翻訳してターゲット
言語を出力するためのものである。図4を参照して、翻
訳モジュール5は、バス7に接続され、バス7を介して
入力されるソース言語(本実施例の場合には英語)を、
所定の翻訳プログラムに従って翻訳してターゲット言語
(本実施例の場合には日本語)としてバス7に出力する
ための翻訳CPU15と、バス7に接続され、翻訳CP
U15で実行される翻訳プログラムを格納するための翻
訳プログラムメモリ16と、入力されたソース言語の原
文を各単語ごとに格納するためのバッファAと、バッフ
ァAに格納された各単語につき、メモリ6に含まれる辞
書を参照して得た各単語の品詞、訳語などの情報を格納
するためのバッファBと、ソース言語の構造解析木に関
する情報を格納するためのバッファCと、バッファCに
格納されたソース言語の構造解析木が変換されたターゲ
ット言語の構造解析木を格納するためのバッファDと、
バッファDに格納された日本語の構造解析木に適切な助
詞を助動詞などを補充して、日本語の形として整えられ
た文章を格納するためのバッファEと,使用者によるユ
ーザ辞書登録に用いられるバッファF,Gとを含む。
【0024】図5を参照して、メモリ6(図4参照)内
の辞書17は、各形態素をその文法情報と関連づけた項
目8を多数格納している。各項目8は、見出語のフィー
ルド18と、見出語18の品詞に関する情報を格納する
品詞フィールド19と、見出語18が名詞や動詞などの
ように変化する場合に、その変化のパターンが所定の規
則的なパターンのいずれかであるか、あるいは不規則な
ものであるかに関する情報を格納するための変化形フィ
ールド20と、見出語が不規則変化をする動詞や名詞で
ある場合に、その三単現または複数形を格納するための
三単現フィールド21と、見出語が不規則変化をする動
詞である場合にそれぞれその過去形、過去分詞形、現在
分詞形を格納するためのフィールド22、23、24
と、見出語18の日本語の訳語を格納するフィールド2
5とを含む。
【0025】図5に示される例において、単語“a”は
変化形を持たない語であるために、フィールド20〜2
4は空欄となっている。また単語“come”は、変化
形を有する動詞であって、しかも不規則変化をする動詞
であるためにフィールド21〜24に各変化形が格納さ
れている。また単語“pen”は名詞であって、変化形
として複数形を有するが、その変化のパターンとしては
語尾に“s”をつけるという規則的なものであるため
に、フィールド21〜24は空欄となっている。変化形
フィールド20が空欄の場合には変化しない語であるこ
とを示し、“0”はいずれの規則的変化パターンにも属
しない不規則な変化をするものであることを示し、それ
以外の値は特定の規則的な変化パターンに従って変化す
るものであることを示す。
【0026】以下、図3〜図10を参照して、本実施例
の機械翻訳装置による英日翻訳の動作を説明する。な
お、翻訳CPU15で実行される翻訳プログラムの詳細
については後に詳述する。
【0027】まず、読込まれた原文は形態素解析によっ
て形態素に分解され、図6に示されるようにバッファA
(図4参照)に格納される。
【0028】続いて翻訳プログラム16に基づく翻訳C
PU15の制御の下に、図2に示される辞書引き・形態
素解析部11によって、バッファAに格納された原文の
各単語につき、メモリ6に格納されている辞書17(図
5参照)を参照することにより各単語の訳語や品詞情報
などの情報が得られる。この情報は図4に示されるバッ
ファBに格納される。これらの情報の一部として、各単
語の品詞情報が含まれるが、これら品詞情報は図7に示
されるように格納される。すなわち“this”は多品
詞語であって代名詞、指示形容詞の2つの品詞を持つ。
また“is”の品詞は動詞である。同様に“a”、“p
en”についてもそれぞれの品詞がバッファBに格納さ
れる。“this”は多品詞語であるが、文中の品詞が
何であるかについては、図2に示される構文解析部12
に相当する処理によって一意に決定される。
【0029】翻訳プログラムのうち図2に示される構文
解析部12に相当する処理においては、メモリ6に格納
された辞書および文法規則に従って、各単語間のかかり
受け関係を示す構造解析木がたとえば図8に示されるよ
うに決定される。この構文解析結果は図4のバッファC
に格納される。
【0030】構造解析木の決定は次のようにして行なわ
れる。メモリ6に格納された文法規則のうち、英語に関
する文法規則は次のようなものから成り立っている。
【0031】 文→主部、述部 主部→名詞句 述部→動詞、名詞句 名詞句→代名詞 名詞句→冠詞、名詞 この規則のうちたとえば1つ目の規則は、「文は主部と
述部からできている。」ということを表わす。他の規則
についても同様である。これらの規則に従って構造解析
木が決定されるのである。なお、このような文法規則は
同じように日本語についても用意されており、英語の文
法規則と日本語の文法規則との間で対応づけがなされて
いる。
【0032】翻訳プログラムのうち、図2に示される変
換部13に相当する処理においては、入力された英文の
構造解析木(図8参照)の構造が、図9に示される日本
文に対する構文解析木の構造に変換される。この変換に
おいては、上述の構文解析部12が利用したのと同様
に、メモリ6に格納されている「木構造変換規則」が用
いられる。この変換は、図1でいえばレベルL3からタ
ーゲット言語のレベルL9への変換に相当する。得られ
た結果は図4に示されるバッファDに格納される。この
説明において用いられている例文“This is a
pen”は、この変換によって日本語文字列「これ
ペン である」に変換されたことになる。
【0033】翻訳プログラムのうち図2の翻訳文生成部
14に相当する処理を行なう部分は、得られた日本語文
字列「これ ペン である」に適切な助詞「は」や助動
詞をつけることにより、図10に示されるような文法的
な日本語の形にし、図4に示されるバッファEに格納す
る。この処理は、図1に示されるレベルL9からレベル
L10への変換に相当する。得られた日本文「これはペ
ンである。」は、図4に示される翻訳モジュール5から
出力され、メインメモリ2に格納されるとともに、表示
装置3に表示される。
【0034】ここで、入力された英文に、図5に示され
る辞書17に記憶されていない単語が含まれていると、
翻訳処理のうち、図1のレベルL2の段階で行なわれる
形態素解析が正常に実行され得ない。ユーザ辞書は、そ
のような単語を予め格納しておくことにより、形態素解
析を正常に実行させるためのものである。すなわち、良
好な翻訳結果を得るためには、翻訳しようとする文章に
は含まれているがメモリ6の辞書17に予め登録されて
いない単語を、予めユーザ辞書に登録しておく必要があ
るということである。
【0035】以下、図11〜図30を参照して、本発明
に係る言語処理装置の一例の機械翻訳装置において、不
規則変化形を含む語句をユーザ辞書に登録する際の、機
械翻訳装置の動作および使用者の操作を説明する。
【0036】図11には、このユーザ辞書登録処理のフ
ローチャートが示されている。図11においては、本発
明と直接関係のない部分については、複数の手順をまと
めて1つのブロックとして記載してある。本発明に関連
ある部分は他の図面でより詳細に説明する。なお、以下
の説明においては、図3および図4に示される装置を用
いて処理が行なわれるものとして説明する。
【0037】ユーザ辞書登録機能が開始されると、まず
ステップS(以下単に「S」と呼ぶ)100において、
登録したい単語の見出語を入力すべき旨のメッセージが
表示装置3に表示され、キーボード4が入力可能な状態
となる。続いてS200において、ユーザは登録したい
単語を入力する。入力された単語はバッファFに格納さ
れる。S300において、ユーザ辞書に登録可能な品詞
の一覧が表示装置3に表示され、どの品詞にするかの選
択を促すメッセージが表示装置3に表示される。キーボ
ード4は入力可能な状態となる。続いてS400で、使
用者はキーボード4を用いて、入力する単語の品詞を選
択する。
【0038】続いてS500において、選択された品詞
が動詞であるのか、名詞であるのか、その他の品詞であ
るのかによって処理がそれぞれS600、S700、S
800に分かれる。これら処理のうちS800の処理は
他のものと比べて簡易であるためここでは省略するもの
とし、S600の動詞登録処理、S700の名詞登録処
理について以下に詳しく説明する。
【0039】S400で選択された品詞が動詞である場
合には、動詞登録処理が開始される。以下においては、
ユーザが登録しようとする単語が「forget」であ
るものとし、これを登録する場合の機械翻訳装置の動作
およびユーザの操作を説明するものとする。図12を参
照して、まずステップS610で、動詞の活用形の一覧
が表示装置に表示される。この動詞の活用形の一覧につ
いての情報はたとえば図4の翻訳プログラム16の中に
テーブルとして予め準備されている。表示装置3に表示
される動詞の活用形の一覧の一例が図16に示されてい
る。
【0040】図16を参照して、動詞の活用形としては
規則的なパターンとして6つのものが予め用意されてい
る。たとえば図16に示される第1の変化パターンは最
も普通の変化パターンである。第2の変化パターンは、
過去形、過去分詞形、現在分詞形を作り出す際には、原
形の最後の文字“e”を取去った後にそれぞれed、e
d、ingをつけることによりこれら変化形が作り出さ
れるパターンである。第3の変化パターンは、過去形、
過去分詞形、現在分詞形を作る場合に、原形の最後の一
文字を重ねたうえでそれぞれed、ed、ingをつけ
るものである。第4の変化パターンは、第1の変化パタ
ーンに類似しているが、三単現の変化形を作る際に原形
の末尾にesをつけるところが第1の変化パターンと異
なる。第5の変化パターンは、原形の末尾がyで終了し
ている単語についてのものである。この変化パターンに
おいては、三単現、過去形、過去分詞形を作り出す場合
には原形の語尾のyを取除いた後、それぞれies、i
ed、iedをつける。また現在分詞形を作る場合には
そのままingを付加する変化パターンである。第6の
変化パターンは、上述の1〜5の変化パターンのいずれ
とも異なるものであって、三単現を作る場合には原形に
sをつけ、過去形の場合には原形と同形であり、過去分
詞形の場合には原形の末尾にenを付加し、現在分詞形
を作成する場合には原形の語尾にingを付加する変化
パターンである。そして、1〜6の変化パターンのいず
れにも属しない変化パターンの場合には図16に示され
る画面で0を選択するように予め定められている。
【0041】図16に示される画面において、画面上の
「選択して下さい。」という表示の末尾にカーソルが待
機しており、それぞれの選択肢に付された番号が入力可
能な状態となっている。
【0042】続いて処理はS620に進み、ユーザは該
当する変化パターンに対応する番号をキーボード4(図
3参照)を用いて入力する。登録しようとしている動詞
「forget」は、1〜6の変化パターンのいずれで
もないので、S620では“0”が入力されることにな
る。処理はS630に進む。
【0043】S630では、S620でユーザにより選
択された番号がいずれであるかに従って処理が分岐す
る。入力された選択肢が1〜6のいずれかである場合に
は、現在入力中の単語がその特定のパターンに従って変
化するということである。この特定の変化パターンに従
って、文章中で原形から変化形を生成することができる
ため、辞書17(図5参照)に格納する情報としては、
この単語が動詞であるという情報と、いずれの変化パタ
ーンに従って変化するかという情報のみでよい。したが
ってS680で、選択された規則変化形としてこの単語
が辞書に登録される。処理はこの後S690に進む。
【0044】S620で入力された変化パターンが
“0”である場合には、処理はS640に進む。現在の
説明の例の単語「forget」は、不規則変化をする
ので処理はS640以下に進むことになる。S640、
S650、S660、S670では、入力される単語の
三単現、過去形、過去分詞形、現在分詞形がそれぞれ入
力される。本発明においては、この入力の際のカーソル
制御に特徴がある。
【0045】S640以下では三単現の入力処理が行な
われる。図17を参照して、まず、三単現を入力すべき
旨のメッセージと共に、S200で入力された単語の原
形が表示される。この単語が表示される領域は、同時に
三単現の変化形を入力する入力域である。本発明に係る
機械翻訳装置においては、この際に、表示された原形の
綴りの末尾にカーソルが待機しているのが第1の特徴で
ある。これは、英語の場合には三単現の変化形を作成す
るためには、原形の語尾に“s”等を追加する可能性が
最も高いためである。このように表示された原形の綴り
の末尾にカーソルが待機しているために、ユーザは変化
形のすべての綴りを入力する必要なく、しかも表示され
ている原形の綴りと相違する部分を最小限の手間で修正
するだけで、この三単現の変化形を入力することができ
る。この例の単語の場合には、図18に示されるよう
に、表示されている「forget」の末尾、すなわち
現在のカーソル位置に「s」を付加するだけで三単現の
入力が完了する。
【0046】図12のS640の三単現入力は以下のよ
うにして行なわれる。図13を参照して、まずS641
で表示装置3の画面上の所定位置を消去する処理が行な
われる。この所定位置は入力域であるとともに、すでに
入力された単語の原形を表示する位置でもある。
【0047】続いてS642において、S641で消去
された画面上の所定位置に、バッファFに格納されてい
た、入力された単語または熟語が表示される。この時の
画面の状態は図17に示されるようになっているが、こ
の時点ではまだカーソルは表示されてはいない。カーソ
ルの位置決めは次のS643以下の処理で行なわれる。
【0048】S643においては、バッファFの格納内
容をバッファGにコピーする処理が行なわれる。バッフ
ァGは、単語の変化形を格納するためのバッファであ
る。このように前もってバッファGに入力単語の原形を
格納しておくことにより、画面上での修正と同様にバッ
ファGの内容を修正することができる。
【0049】続いてS644では、画面上に表示されて
いる単語の原形と、その変化形とで形が異なっている可
能性が最も高い位置がどこであるかが、すでに指定され
た品詞情報および、バッファGに格納されている字面上
の情報から、メモリ6に格納されている知識ベースの文
法規則に基づき推定される。その推定結果に基づき、バ
ッファGのポインタをどこに設定するかの位置が定めら
れる。本実施例の場合には対象言語が英語であり、この
部分の詳細については図14を参照して後述する。
【0050】続いてS645で、バッファGのポインタ
を、S644の処理で決定された位置に移動する処理が
行なわれる。
【0051】さらにS646で、バッファG内でポイン
タが指している位置に相当する、表示装置3の画面上の
位置にカーソルを表示する処理が行なわれる。これによ
り画面の表示結果は図17に表示されたものとなる。
【0052】続いてS647では、文字入力があったか
否かの判断が行なわれる。文字入力があれば続くS64
8に処理が進むが、文字入力がない場合にはS647の
処理が繰返し行なわれて、文字入力があるまでの待合わ
せ処理が行なわれる。
【0053】文字入力があった場合にはS648に処理
が進み、入力された文字が入力終了を示すコード(終了
コード)であるか否かの判断が行なわれる。終了コード
であれば変化形の入力が終了したということであるから
この処理はメインルーチンに復帰する。もしも終了コー
ドでない場合には変化形の形が修正されたということで
あるから、処理はS649に進む。
【0054】S649では、S647で入力された文字
を、バッファG内のポインタが指し示す位置に挿入する
処理が行なわれる。さらにバッファGのポインタが1進
められる。
【0055】続いてS64Aでは、入力された文字をS
646で表示されたカーソルの位置に表示する処理が行
なわれ、さらにカーソルをS646で表示された位置か
ら1進んだ位置に移す処理が行なわれる。S64Aのの
ち処理はS647に戻る。
【0056】S647〜S64Aの処理が繰返し行なわ
れることにより、必要な数の文字の修正が行なわれる。
【0057】図14を参照して、S644の処理内容
を、英語に対する処理に限定して詳述すると次のように
なる。なお、図14に示される処理ルーチンは、処理対
象が動詞である場合と名詞である場合の両方に対応する
ことが可能となるようにされている。したがってこのS
644は、図12のS640のみならず、S650,S
660,S670にも活用できる他、名詞登録の際の、
後述する図15のS750での処理にもこのまま使用す
ることが可能である。
【0058】まずS644Aにおいて、バッファG内に
格納されている単語数を計算する処理が行なわれる。そ
して、得られた単語数が1であるか、複数であるかの判
断が行なわれる。
【0059】続いてS644Bにおいて、バッファG内
に格納されている単語または熟語の品詞(図11のS4
00で選択されている)が動詞であるか、名詞であるか
についての判断が行なわれる。品詞が動詞であれば処理
はS644Cに進み、名詞であれば処理はS644Dに
進む。
【0060】品詞が動詞である場合には、S644Cに
おいて、S644Aで計数された単語数が1であるか複
数であるかについての判断が行なわれる。1である場合
には処理はS644Eに進みそれ以外の場合には処理は
S644Fに進む。
【0061】S644Eにおいては、英語の動詞(1単
語からなるもの)においては、変化形は原形の末尾に何
らかの接尾辞を付加する可能性が最も高いことから、バ
ッファGのポインタを単語の末尾に設定すべきことが決
定される。
【0062】また単語数が複数である場合にはS644
Fにおいて、ポインタを複数の単語の内の最初の単語の
末尾に設定することが決定される。これは、動詞の複合
語においては、その先頭の単語が動詞であってその形が
変化する確率が最も高く、しかもその末尾に接尾辞が付
加されることが最も可能性の高いためである。
【0063】一方、S644Bで品詞が名詞であると判
断された場合には処理はS644Dに進み、S644A
で計数された単語数が1であるか複数であるかについて
の判断が行なわれる。判断の結果単語数が1であれば処
理はS644Gに進み、それ以外の場合には処理はS6
44Hに進む。
【0064】単語数が1である場合には、S644Gに
おいては、バッファGのポインタを単語の末尾に設定す
べきことが決定される。なぜならば、英語の名詞の変化
形としては複数形があるが、一般的には1単語からなる
名詞の場合には複数形は名詞の原形の末尾に小文字sな
どの接尾辞をつけることが最も多いためである。
【0065】一方、単語数が複数である場合には処理は
S644Hに進み、バッファGのポインタを、バッファ
G内の名詞の複合語の最後の単語の末尾に設定すべきこ
とが決定される。なぜならば、動詞と異なり、英語の名
詞の複合語の場合にはその末尾に名詞がくることが多
く、しかも全体を複数形とする場合にはその末尾の単語
を複数形に変形させるべき時が多いためである。また、
そのような場合にはその最後の単語の末尾に接尾辞が付
加される場合が特に可能性が高い。したがってポインタ
を名詞の複合語の最後の単語の末尾に設定すべきことが
決定されるわけである。
【0066】S644E,S644F,S644Gおよ
びS644Hの後、処理は図13のS645に復帰する
ことになる。
【0067】続いてS650で、同様にして過去形の入
力処理が行なわれる。この場合にも図19に示されるよ
うに原形の表示がされ、しかもその末尾にカーソルが待
機している。これは、英語の場合には過去形を生成する
ためには動詞の原形の末尾にedをつける可能性が最も
高いためである。この例の単語の場合には図20に示さ
れるようにカーソルを2文字分戻して“e”を“o”と
直すだけで過去形の入力が完了する。他の動詞の場合に
は、動詞の原形の末尾にedをつけるのみでよいものも
多く、その場合にはこの単語の場合よりもより効率よく
過去形の入力が行なえる。
【0068】S660では、同様に過去分詞形の入力が
行なわれる。過去分詞形の入力の際にも図20に示され
るように動詞の原形が表示され、その末尾にカーソルが
待機している。これは、英語の場合には、過去形と同様
に過去分詞形を作り出す際にも、動詞の原形の末尾に何
らかの接続辞を付加するものが多いことによる。この例
の単語の場合には図21に示されるように“e”を
“o”に変更したうえ、語尾に“ten”を付加するこ
とによって過去分詞形の入力が完了する。
【0069】さらにS670では、現在分詞形の入力が
行なわれる。まず、図23に示されるように、現在分詞
形を入力すべき旨のメッセージの表示と共に、動詞の原
形が表示される。この場合にもカーソル位置は動詞の原
形の末尾となっている。これは、英語の場合には現在分
詞形は、動詞の原形にingなどの接続辞を付加するこ
とが多いためである。この例の単語の場合には図24に
示されるように、語尾の“t”を重ねたうえでingを
付加すればよい。このようにカーソルが原形の末尾に待
機していることにより、最小限の労力で現在分詞形の入
力が可能となる。
【0070】以上で動詞の変化形の入力がすべて完了し
たため、処理はS690に進む。S690では、不規則
変化の場合にも、規則変化の場合にも、訳語その他この
単語を辞書17(図5参照)に登録するのに必要な情報
をユーザは入力し、すべての必要な情報が入力されると
この単語が新たな項目として辞書17に登録され、ユー
ザ辞書登録機能は終了する。
【0071】(2) 名詞の単語を登録する場合 一方、図11のS700の名詞登録処理は次のようにし
て行なわれる。以下の説明では、単語「child」を
登録するものとする。
【0072】図15を参照して、まずS710におい
て、名詞の複数形の一覧が表示装置3(図3参照)上に
表示される。この名詞の複数形の一覧は、翻訳プログラ
ム16(図4参照)内に予めテーブルとして準備されて
いる。名詞の複数形の一覧の表示画面の一例を図25に
示す。図25を参照して、予め準備されている名詞の複
数形の規則的な変化パターンには5つある。第1の変化
パターンは、名詞の原形の末尾にsを付加するものであ
り、最も一般的なものである。第2のパターンは、名詞
の原形の語尾にesを付加するものである。これは、名
詞が特定の発音で終了する場合の複数形の生成のパター
ンである。第3のパターンは、名詞の原形の語尾がyで
終了するものに対する変化パターンである。このパター
ンにおいては、語尾のyが取除かれた後に語尾にies
が付加される。第4のパターンは単数形と複数形とが同
形というものである。第5のパターンは複数形のない名
詞である。これら1〜5の規則変化のいずれにも属さな
いものには“0”という番号が割当てられている。この
画面上には「選択して下さい。」というメッセージが表
示され、その末尾にカーソルが待機している。そして、
表示されたそれぞれの選択肢の番号が入力可能な状態に
なっている。今登録しようとしている名詞「chil
d」の複数形は不規則的であるので、図25に示される
画面では“0”が入力される。
【0073】再び図15を参照して、続いてS730で
は、S720で選択された選択肢に対応して、登録対象
となる名詞の複数形が不規則変化に従うものであるか、
規則変化するものであるかによって処理が分岐する。規
則変化である場合、すなわちS720で選択された選択
肢が1〜5である場合には処理はS770に進み、選択
された規則変化形として、品詞(「名詞」)とその変化
パターンに予め割当てられた番号とが登録されることに
なる。S770の後処理はS780に進む。
【0074】一方、登録対象となる単語が不規則変化を
するものである場合には処理はS740に進む。本説明
の単語の場合にはS740に処理が進むことになる。S
740では、図26に示されるように複数形を入力すべ
き旨のメッセージと、S200(図11参照)で入力さ
れた原形「child」とが、表示装置3(図3参照)
上に表示される。続いてS750では、カーソルを、表
示された単語のいずれの位置に設定するのがよいか、複
数形を生成する場合に、原形と形が異なっている可能性
の最も高い位置はどこかが推定され、そこにカーソルが
設定される。名詞の複数形の場合には、図25にも示さ
れるように、原形の末尾に複数形を表わす接尾辞が付加
されることが多い。したがってS750ではカーソルを
単語の末尾に位置づけるべきことが決定され、そのよう
に設定される。
【0075】続いてS760で、使用者によって複数形
の入力が行なわれる。この例の単語「child」の場
合には、複数形としては語尾に「ren」を付加するこ
とにより複数形が作られるため、カーソル位置を何ら変
更することなくそのまま“ren”を入力することによ
って複数形の入力が完了する。
【0076】このように、名詞の複数形が不規則なパタ
ーンによって作り出される単語の場合の複数形の入力に
おいても、すべての綴りを入力する必要がなく、僅かな
修正だけで複数形を入力することができる。S760の
処理が完了した後処理はS780に進む。S740〜S
760の処理は、動詞の場合の図13,14に示される
ルーチンをそのまま用いて実現できる。
【0077】S760、S770のいずれの処理が終了
しても処理はS780に進むが、S780では、登録す
る単語に割当てるべき訳語その他必要な情報をユーザは
入力する。すべての必要な情報が入力されるとこの単語
は新たな項目として辞書17(図5参照)に登録され、
ユーザ辞書登録機能は終了する。
【0078】S800(図11参照)で行なわれるその
他品詞の処理の場合には、動詞や名詞のような変化形が
含まれないことが多いため、より簡略な処理で辞書への
登録を行なうことができる。したがってここではそれら
の詳細についての詳しい説明は繰返されない。以下で
は、従来の技術の問題点として指摘した、複合語を登録
する際の、入力の負担の軽減について説明する。
【0079】(3) 動詞の複合語を登録する場合 以下では、「come about」という複合語を動
詞として登録する場合について説明する。ユーザ辞書登
録機能が開始されると、(1)の動詞の登録の場合と同
様の処理が図11のS400までに行なわれる。この場
合S200で入力される単語としては、単語ではなく上
述の複合語である。S500では、選択された品詞は動
詞であることから、処理はS600に進むことになる。
【0080】図12を参照して、S610で図16に示
されるものと同様の動詞の活用形の一覧が表示装置3
(図3参照)に表示される。S620では、活用形の選
択が行なわれる。この例の場合の複合語「comeab
out」を全体として1つの動詞としてみた場合、実際
に形が変化するのは「come」の部分である。そして
この「come」自体は不規則変化する。したがってS
620では、使用者はこの複合語全体を不規則変化する
ものとして図16で“0”を選択する。S630におい
ては、この場合不規則変化が選択されたものと判断さ
れ、S640に処理が進む。
【0081】S640では、図28に示されるように、
三単現の入力を促進するメッセージが表示されるととも
に、原形「come about」が表示される。図2
8においては、カーソル位置が複合語「come ab
out」全体の末尾ではなく、「come」の末尾に位
置するように制御される。これは次のような理由によ
る。英語においては、複合語が全体として動詞として扱
われる場合には、その複合語を構成する単語のうち型の
変化が起こるのは先頭の単語である場合が最も多い。と
いうのは、動詞が複合語の先頭にくることが最も多いた
めである。このような言語的な特性を考慮した結果、英
語処理の複合語登録においてはこのように第1の単語の
末尾にカーソルを位置させる。この点が本発明の第2の
特徴である。
【0082】この例の場合には図29に示されるよう
に、第1の単語の「come」の末尾にsを付加するこ
とにより、複合語の三単現を入力することができる。カ
ーソルが入力域の先頭に位置されている場合あるいは複
合語の末尾に位置されている場合と比較して、より少な
いカーソル移動とより少ない修正量で変化形を入力する
ことが可能となる。
【0083】S650では、最初に表示装置3に「co
me about」と表示され、「come」の末尾に
カーソルが位置する。ユーザが「come」を「cam
e」に修正し、過去形の入力が完了する。
【0084】S660では、まず表示装置に「come
about」が表示され、「come」の末尾にカー
ソルが位置する。この場合には「come」の過去分詞
形は原形と同型であるため、何も修正せずにそのまま入
力終了キーを押すだけで過去分詞形の入力が完了する。
【0085】S670では、最初に表示装置に「com
e about」と表示され、「come」の末尾にカ
ーソルが位置する。この場合には「come」が「co
ming」に修正され、現在分詞形の入力が完了する。
【0086】以上でこの複合語「come abou
t」の入力がすべて完了したため、S690に処理が進
み、訳語その他必要な情報が入力される。すべての必要
な情報が入力されると、この複合語は新たな項目として
辞書17(図5参照)に登録され、ユーザ辞書登録機能
は終了する。なお、S640〜S670の処理は、図1
3,14に示されるルーチンで実現できる。
【0087】(4) 名詞の複合語を登録する場合 ここでは、「street child」という複合語
を名詞として登録する場合について説明する。図11を
参照して、ユーザ辞書登録機能開始後S100〜S40
0までの処理は(2)で行なわれた処理と同様である。
ただ、この場合、S200で入力される単語が複合語
「street child」であることが(2)の場
合と異なる。S500の判断の結果処理がS700に進
むことも(2)の場合と同様である。
【0088】図15を参照して、S710で、名詞の複
数形の一覧が図25に示されるように表示装置に表示さ
れる。同時に各複数形の変化パターンに割当てられた番
号のいずれかを選択することが要求される。
【0089】S720では、ユーザはこの複合語「st
reet child」の複数形のパターンに対応する
番号を入力する。この複合語を全体として1つの名詞と
してみた場合、実際に形が変化するのは「child」
の部分である。この部分の複数形は不規則的な変化をす
るため、S720で選択される番号は“0”である。
【0090】その結果、S730における判断の結果S
740に処理が進むことになる。S740では、最初
に、図30に示されるように複数形を入力すべき旨のメ
ッセージが表示され、同時に入力域上に、S200(図
11参照)で入力された複合語の原形が表示される。そ
してこの場合カーソルは「street child」
という複合語の全体の末尾、すなわち「child」の
末尾に位置している。これは次のような理由による。英
語において、複合語が全体として名詞として扱われる場
合には、その複合語を構成する単語のうち複数形による
型の変化が起こるのは末尾の単語である場合が最も多
い。これは、複合語の最後に、その複合語全体の性格を
決定する名詞が位置されることが多いからである。この
ような言語的な特性が考慮された結果、名詞の複合語の
複数形の入力の場合には、複合語の末尾にカーソルが設
定されることになる。
【0091】ユーザは、この例の場合には図31に示さ
れるように、複合語の末尾、すなわち「child」の
末尾に“ren”を付加し、入力終了キーを押下するだ
けでS760における複数形「street chil
dren」の入力が完了する。
【0092】以上で複合語「street chil
d」の複数形の入力が完了したので、処理はS780に
進む。S780では、この複合語の訳語その他必要な情
報をユーザは入力する。すべての必要な情報が入力され
るとこの複合語は新たな項目として辞書17(図5参
照)に登録され、ユーザ辞書登録機能は終了する。な
お、この場合の入力処理も図13,14のルーチンを使
用して実現できる。
【0093】
【発明の効果】以上のように本発明によれば、不規則変
化をする単語や複合語の変化形を辞書に登録する際に、
入力域に予め登録しようとする単語や複合語の第1の形
の綴りが表示され、第1の形と第2の形とで形が異なっ
ている可能性が最も高い位置に入力位置が設定される。
したがって入力位置を変更する量も最小限ですみ、また
表示されている第1の形を僅かに変化させるだけで第2
の形を入力することができる。
【0094】その結果、辞書登録の際の使用者の負担を
軽減することができる言語処理装置を提供することがで
きる。
【図面の簡単な説明】
【図1】機械翻訳の概念を模式的に示す図である。
【図2】トランスファ方式による機械翻訳の構成を示す
模式図である。
【図3】本発明の言語処理装置の一例である機械翻訳装
置のブロック図である。
【図4】図3に示される翻訳モジュール5の詳細なブロ
ック図である。
【図5】辞書の内容を示す模式図である。
【図6】バッファAの格納内容を模式的に示す図であ
る。
【図7】バッファBの格納内容を模式的に示す図であ
る。
【図8】バッファCの格納内容を模式的に示す図であ
る。
【図9】バッファDの格納内容を模式的に示す図であ
る。
【図10】バッファEの格納内容を模式的に示す図であ
る。
【図11】翻訳モジュールで実行される翻訳プログラム
のメインルーチンのフローチャートである。
【図12】動詞登録処理のフローチャートである。
【図13】三単現入力処理のより詳細なフローチャート
である。
【図14】変化形位置推定・ポインタ位置決定処理のよ
り詳細なフローチャートである。
【図15】名詞登録処理のフローチャートである。
【図16】動詞の活用形選択の際の一覧表表示画面の一
例を模式的に示す図である。
【図17】三単現の入力画面の模式図である。
【図18】三単現の入力画面の模式図である。
【図19】動詞の過去形の入力の際の表示画面の模式図
である。
【図20】動詞の過去形の入力画面の模式図である。
【図21】動詞の過去分詞形の入力画面の模式図であ
る。
【図22】動詞の過去分詞形の入力画面を示す模式図で
ある。
【図23】動詞の現在分詞形の入力画面を示す模式図で
ある。
【図24】動詞の現在分詞形の入力画面の模式図であ
る。
【図25】名詞の複数形の変化形の一覧を示す画面の模
式図である。
【図26】名詞の複数形の入力画面の模式図である。
【図27】名詞の複数形の入力画面の模式図である。
【図28】動詞の複合語の三単現の入力画面の模式図で
ある。
【図29】動詞の複合語の三単現の入力画面の模式図で
ある。
【図30】名詞の複合語の複数形の入力画面の模式図で
ある。
【図31】名詞の複合語の複数形の入力画面の模式図で
ある。
【符号の説明】
1 メインCPU 2 メインメモリ 3 表示装置 4 キーボード 5 翻訳モジュール 6 メモリ 8 項目 11 辞書引き・形態素解析部 12 構文解析部 13 変換部 14 翻訳文生成部 15 翻訳CPU 16 翻訳プログラムメモリ 17 辞書

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力される文章に対して少なくとも形態
    素解析を含む文法処理を行なうための文法処理手段と、 形態素解析の際に利用され得る、機械可読な媒体に機械
    可読な形式で記録された、前記文章の言語の複数個の形
    態素を格納するための辞書と、 前記辞書の一部を利用者辞書として利用者が作成するの
    を援助するための利用者辞書作成援助手段とを含む言語
    処理装置であって、 前記利用者辞書に記録される形態素は、文法条件によっ
    て、所定の文法規則に従ってはその変型パターンを生成
    できないような変型パターンで形を変え得るものを含
    み、 前記利用者辞書作成援助手段は、第1および第2のバッファと、 利用者が前記利用者辞書に記録させようとする、形を変
    え得る記録対象形態素の第1の形を取得し前記第1のバ
    ッファに格納するための手段と、 所定の入力域上から利用者により入力される前記記録対
    象形態素の第2の形を受けとり、前記第2のバッファに
    格納するための手段と、前記第1のバッファに格納された 前記第1の形と、前記
    第2のバッファに格納された前記第2の形とを、前記記
    録対象形態素として、互いに関連づけて前記利用者辞書
    に記録するための手段とを含み、 前記利用者辞書作成援助手段はさらに、 前記第2の形の入力に先立って、前記第1のバッファの
    内容を前記第2のバッファに複写し、さらに、前記第1
    の形と前記第2の形とで形が異なっている可能性の最も
    高い箇所に前記第2のバッファのポインタを位置づける
    ための手段と、 前記第2の形の入力に先立って、前記所
    定の入力域上に前記第2のバッファの内容を表示すると
    ともに、前記第2のバッファのポインタ位置に対応する
    箇所に入力位置を位置づけるための手段とを含 む、言語
    処理装置。
JP4009521A 1992-01-22 1992-01-22 言語処理装置 Expired - Lifetime JP2880601B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP4009521A JP2880601B2 (ja) 1992-01-22 1992-01-22 言語処理装置
US08/006,759 US5442547A (en) 1992-01-22 1993-01-21 Apparatus for aiding a user in producing a dictionary storing morphemes with input cursor prepositioned at character location with the highest probability of change

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4009521A JP2880601B2 (ja) 1992-01-22 1992-01-22 言語処理装置

Publications (2)

Publication Number Publication Date
JPH05197747A JPH05197747A (ja) 1993-08-06
JP2880601B2 true JP2880601B2 (ja) 1999-04-12

Family

ID=11722575

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4009521A Expired - Lifetime JP2880601B2 (ja) 1992-01-22 1992-01-22 言語処理装置

Country Status (2)

Country Link
US (1) US5442547A (ja)
JP (1) JP2880601B2 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2006163A1 (en) * 1988-12-21 1990-06-21 Alfred B. Freeman Keyboard express typing system
US5617542A (en) * 1993-09-10 1997-04-01 British Telecommunications Public Limited Company Keyboard terminal with rapid keyed character local display that is altered if character transmitted to host is not timely acknowledged
JP3960562B2 (ja) * 1994-09-30 2007-08-15 株式会社東芝 機械翻訳の学習方法
JPH1011447A (ja) * 1996-06-21 1998-01-16 Ibm Japan Ltd パターンに基づく翻訳方法及び翻訳システム
US6002997A (en) * 1996-06-21 1999-12-14 Tou; Julius T. Method for translating cultural subtleties in machine translation
AU2953499A (en) * 1998-03-27 1999-10-18 Lernout & Hauspie Speech Products N.V. Speech recognition dictionary enlargement using derived words
JP2001051997A (ja) * 1999-08-11 2001-02-23 Sony Corp 文書データ作成装置、文書データ作成方法、及び記録媒体
US20020049795A1 (en) * 2000-05-15 2002-04-25 Freeman Alfred Boyd Computer assisted text input system
EP1655674A2 (en) * 2001-08-10 2006-05-10 National Institute of Information and Communications Technology, Independent Administrative Institution THIRD LANGUAGE TEXT GENERATING ALGORITHM BY MULTI−LINGUAL TEXT INPUTTING AND DEVICE AND PROGRAM THEREFOR
US20060136824A1 (en) * 2004-11-12 2006-06-22 Bo-In Lin Process official and business documents in several languages for different national institutions
US20060200337A1 (en) * 2005-03-04 2006-09-07 Microsoft Corporation System and method for template authoring and a template data structure
JP2008287406A (ja) * 2007-05-16 2008-11-27 Sony Corp 情報処理装置および情報処理方法、プログラム、並びに、記録媒体
CN102262450B (zh) * 2010-05-27 2015-12-09 北京搜狗科技发展有限公司 一种基于混输字符串进行字符转换的方法和装置
CN102566775A (zh) * 2010-12-31 2012-07-11 上海量明科技发展有限公司 产生字符间隔的输入方法及***
US10037139B2 (en) 2013-02-20 2018-07-31 Blackberry Limited Method and apparatus for word completion
US9261973B2 (en) 2013-06-07 2016-02-16 Blackberry Limited Method and system for previewing characters based on finger position on keyboard
KR102407630B1 (ko) * 2015-09-08 2022-06-10 삼성전자주식회사 서버, 사용자 단말 및 이들의 제어 방법.
CN111859972B (zh) * 2020-07-28 2024-03-15 平安科技(深圳)有限公司 实体识别方法、装置、计算机设备及计算机可读存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5775375A (en) * 1980-10-28 1982-05-11 Sharp Corp Electronic interpreter
US4724523A (en) * 1985-07-01 1988-02-09 Houghton Mifflin Company Method and apparatus for the electronic storage and retrieval of expressions and linguistic information
US5005127A (en) * 1987-10-26 1991-04-02 Sharp Kabushiki Kaisha System including means to translate only selected portions of an input sentence and means to translate selected portions according to distinct rules
JPH01129355A (ja) * 1987-11-13 1989-05-22 Sharp Corp 文書作成・校正支援装置

Also Published As

Publication number Publication date
US5442547A (en) 1995-08-15
JPH05197747A (ja) 1993-08-06

Similar Documents

Publication Publication Date Title
JP3220560B2 (ja) 機械翻訳装置
JP2880601B2 (ja) 言語処理装置
JP3377290B2 (ja) イディオム処理機能を持つ機械翻訳装置
US6393389B1 (en) Using ranked translation choices to obtain sequences indicating meaning of multi-token expressions
US4964044A (en) Machine translation system including semantic information indicative of plural and singular terms
JPH02140868A (ja) 機械翻訳システム
JPS62203273A (ja) 機械翻訳システム
JPH05314166A (ja) 電子化辞書および辞書検索装置
JP2815714B2 (ja) 翻訳装置
US4860206A (en) Translation system allowing user designation of postpositional words
JPH05120324A (ja) 言語処理方式
JPS58192173A (ja) 機械翻訳装置
JPS6310265A (ja) 翻訳装置
JP2938897B2 (ja) 文書作成処理装置
JP2719453B2 (ja) 機械翻訳装置
US20100106480A1 (en) Character data processing method, computer program, and character data processing system
JPS6320569A (ja) 機械翻訳装置
JP3233800B2 (ja) 機械翻訳装置
JP2839419B2 (ja) イディオム登録機能を持つ機械翻訳装置
JPS63136265A (ja) 機械翻訳装置
JP3253311B2 (ja) 言語処理装置および言語処理方法
JP2726416B2 (ja) 翻訳装置及び翻訳方法
JPH0668143A (ja) 対訳辞書作成支援システム
JPH04130577A (ja) 自然言語処理装置
JPH01142865A (ja) 機械翻訳方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990119