JP3669870B2 - 最適テンプレートパターン探索方法,探索装置および記録媒体 - Google Patents

最適テンプレートパターン探索方法,探索装置および記録媒体 Download PDF

Info

Publication number
JP3669870B2
JP3669870B2 JP18248099A JP18248099A JP3669870B2 JP 3669870 B2 JP3669870 B2 JP 3669870B2 JP 18248099 A JP18248099 A JP 18248099A JP 18248099 A JP18248099 A JP 18248099A JP 3669870 B2 JP3669870 B2 JP 3669870B2
Authority
JP
Japan
Prior art keywords
template
item
template pattern
value
input sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP18248099A
Other languages
English (en)
Other versions
JP2001013863A (ja
Inventor
尚之 徳田
紘幸 笹井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SunFlare Co Ltd
Original Assignee
SunFlare Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SunFlare Co Ltd filed Critical SunFlare Co Ltd
Priority to JP18248099A priority Critical patent/JP3669870B2/ja
Priority to US09/597,270 priority patent/US6804637B1/en
Publication of JP2001013863A publication Critical patent/JP2001013863A/ja
Application granted granted Critical
Publication of JP3669870B2 publication Critical patent/JP3669870B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、例えば翻訳文を添削したり評価する際に使用される最適テンプレートパターン探索方法,探索装置および記録媒体に係り、特にどのような入力文に対しても、これに最も適した最適テンプレートパターンを得ることができる最適テンプレートパターン探索方法,探索装置および記録媒体に関する。
【0002】
【従来の技術】
一般に、技術翻訳者養成講座においては、受講生が例題に対する解答文を本部に送付し、本部では送付されてきた解答文を添削して受講生に送り返し、受講生はその添削内容を見て自己のレベルを確認する方法が採られている。
【0003】
ところで従来、解答文の添削は、多数送られてくる解答文を複数の添削者に振分け、各添削者が人力により行う方法が採られているが、人力による添削には多大な時間を要するとともに、一定レベル以上の実力を有する添削者を確保することが必ずしも容易でなく、添削者によって添削内容にバラツキが生じるという問題がある。
【0004】
そこで本発明者等は先に、特開平9−325673号公報に示すように、専門家が人力で行なうのと同程度の結果が得られる翻訳文添削支援装置を提案した。
【0005】
【発明が解決しようとする課題】
本発明者等が先に提案した翻訳文添削支援装置は、模範解答に対応するテンプレートパターンを複数種類用意しておき、解答文がどのテンプレートパターンと一致するかを判断した後、解答文を当該テンプレートパターンと同様のテンプレートパターンに分解し、各テンプレート毎に解答文と模範解答との異同を判断して添削結果を得るものであり、技術翻訳者養成講座のように、解答文の翻訳レベルにバラツキが少ない場合には、極めて精度の高い添削結果を得ることができる。
【0006】
ところが、例えば一般の語学学校のように、解答文の翻訳レベルのバラツキが極めて大きい場合には、そのすべてのケースを想定して、模範解答に対応するテンプレートパターンを多数用意しておくことは不可能である。このため、解答文が予め用意された模範解答のテンプレートパターンと一致しない場合が多発することになり、最悪の場合には、解答文に対応する模範解答のテンプレートパターンを提示できないことがある。
【0007】
このような問題は、翻訳の場合に限らず、例えばインターネットを利用した情報検索システムにおいて、入力文に基づき所定の情報を検索する等の場合にも同様に生じる。
【0008】
ところで、前述のような問題は、入力文(解答文)に対する模範解答用のテンプレートパターンを予め用意しておき、その中で入力文に適したテンプレートパターンを探す方法を採っていたことに起因するものである。したがって、入力文に対して、その都度これに適した模範解答用のテンプレートパターンを作成するようにすれば、どのような入力文に対しても、これに最も適した模範解答用のテンプレートパターンを得ることができるものと予想される。
【0009】
本発明は、かかる知見に基づきなされたもので、どのような入力文に対しても、入力者が意図した入力文のテンプレートパターンと同一のテンプレートパターンを、模範解答用の最適テンプレートパターンとして得ることができる最適テンプレートパターン探索方法,探索装置および記録媒体を提供することを目的とする。
【0010】
【課題を解決するための手段】
前記目的を達成するため本発明は、任意数の文章要素を同列で包含する複数のテンプレートブロックを文法規則に基づき上位のものから順次配列して構成される模範解答用のテンプレート群を予め用意し、このテンプレート群から作成可能なすべてのテンプレートパターン候補の中から、入力文に最も適したテンプレートパターン候補を探索する最適テンプレートパターン探索方法であって、前記テンプレート群中のすべての単語に、その重要度に応じたポイント数のポイントを付与した後、前記すべてのテンプレートパターン候補について、各テンプレートパターン候補で用いられているすべての単語の合計ポイント数を分母,入力文と各テンプレートパターン候補との間での一致単語の合計ポイント数を分子とする最適度比較値を求め、分子が最大となる最適度比較値のうちで、最適度比較値が最も大きくなるテンプレートパターン候補を、最適テンプレートパターンと判定するようにしたことを特徴とする。
【0011】
すなわち、本発明においては、任意数の文章要素を同列で包含する複数のテンプレートブロックを文法規則に基づき上位のものから順次配列して構成される模範解答用のテンプレート群が予め用意されている。そして、このテンプレート群からは、上位のテンプレートブロック内の任意の文章要素と、その下位のテンプレートブロック内の任意の文章要素とを順次連結していくことにより、入力文に対応する多数のテンプレートパターン候補を作成することが可能である。一方、前記テンプレート群中のすべての単語には、その重要度に応じたポイント数のポイントが付与される。したがって、前記すべてのテンプレートパターン候補について、各テンプレートパターン候補で用いられているすべての単語の合計ポイント数を分母,入力文と各テンプレートパターン候補との間での一致単語の合計ポイント数を分子とする最適度比較値を求め、分子が最大となる最適度比較値のうちで、最適度比較値が最も大きくなるテンプレートパターン候補を、最適テンプレートパターンと判定することにより、どのような入力文であっても、入力者が意図した入力文のテンプレートパターンと同一のテンプレートパターンを、模範解答用の最適テンプレートパターンとして得ることが可能となる。
【0012】
本発明はまた、任意数の文章要素を同列で包含する複数のテンプレートブロックを文法規則に基づき上位のものから順次配列して構成される模範解答用のテンプレート群を記憶するテンプレート群記憶手段と;入力文を記憶する入力文記憶手段と;前記テンプレート群の各テンプレートブロックと入力文とを比較し、テンプレート群から作成可能なすべてのテンプレートパターン候補を探索するテンプレートパターン候補検索手段と;検索されたテンプレートパターン候補を記憶するテンプレートパターン候補記憶手段と;テンプレート群中のすべての単語にその重要度に応じたポイント数で付与されるポイントを、単語と関連付けて記憶する単語ポイント数記憶手段と;各テンプレートパターン候補において入力文と一致する単語を検索する一致単語検索手段と;各テンプレートパターン候補で用いられているすべての単語の合計ポイント数を演算する合計ポイント数演算手段と;入力文と各テンプレートパターン候補との間での一致単語の合計ポイント数を演算する一致単語ポイント数演算手段と;各テンプレートパターン候補における全単語の合計ポイント数を分母,各テンプレートパターン候補における入力文との一致単語の合計ポイント数を分子とする最適度比較値を演算する最適度比較値演算手段と;各テンプレートパターン候補の最適度比較値を比較し、分子が最大となる最適度比較値のうちで、最も大きな最適度比較値を有するテンプレートパターン候補を、最適テンプレートパターンと判定する最適テンプレートパターン判定手段と;を設けるようにしたことを特徴とする。そして、テンプレートパターン候補検索手段において、テンプレート群の各テンプレートブロックと入力文とを比較し、テンプレート群から作成可能なすべてのテンプレートパターン候補を探索するようにしているので、どのような入力文であっても、これに対応するテンプレートパターン候補を得ることが可能となる。また、複数のテンプレートパターン候補の中から最適テンプレートパターンを得る際には、各単語のポイント数が考慮されるので、入力文中にポイント数の高い重要単語が含まれている場合には、重要単語をより多く含むテンプレートパターン候補が最適テンプレートパターンとして選択されることになり、入力者が意図した入力文のテンプレートパターンと同一のテンプレートパターンを、最適テンプレートパターンと判定することが可能となる。
【0013】
本発明はさらに、任意数の文章要素を同列で包含する複数のテンプレートブロックを文法規則に基づき上位のものから順次配列して構成される模範解答用のテンプレ群を、メモリ領域に記憶させる処理;入力文をメモリ領域に記憶させる処理;前記テンプレート群中のすべての単語に対し、その重要度に応じたポイント数で付与されたポイントを、単語と関連付けてメモリ領域に記憶させる処理;前記テンプレート群から作成可能なすべてのテンプレートパターン候補について、各テンプレートパターン候補で用いられているすべての単語の合計ポイント数を分母,入力文と各テンプレートパターン候補との間での一致単語の合計ポイント数を分子とする最適度比較値を用い、分子が最大となる最適度比較値のうちで、最適度比較値が最も大きくなるテンプレートパターン候補を、最適テンプレートパターンと判定する処理;をコンピュータに実行させるようにしたことを特徴とする。そして前記各処理により、予め模範解答用のテンプレートパターンを容易しておかなくても、入力者が意図した入力文のテンプレートパターンと同一のテンプレートパターンを、模範解答用の最適テンプレートパターンとして得ることが可能となる。
【0014】
【発明の実施の形態】
以下、本発明を図面を参照して説明する。
図1は、本発明の実施の一形態に係る最適テンプレートパターン探索装置を示すもので、この装置は、図2に示す模範解答用のテンプレート群を記憶するテンプレート群記憶手段1、入力文を記憶する入力文記憶手段2およびテンプレートパターン候補検索作手段3を備えており、テンプレートパターン候補検索手段3は、後に詳述するテンプレート群の各テンプレートブロックと入力文とを比較し、テンプレート群から作成可能なすべてのテンプレートパターン候補を探索するようになっている。そして、探索された各テンプレートパターン候補は、テンプレートパターン候補記憶手段4に記憶されるようになっている。
【0015】
前記テンプレート群は、図2に示すように、単語・句からなる文章要素を任意数同列で包含する複数のテンプレートブロックを備えており、これら各テンプレートブロックは、文法規則に基づき上位のものから順次配列されている。そして、このテンプレート群からは、上位のテンプレートブロック内の任意の文章要素と、その下位のテンプレートブロック内の任意の文章要素とを順次連結していくことにより、入力文に対応する多数のテンプレートパターン候補を作成することができるようになっている。
【0016】
例えば、図2に示すテンプレート群の場合には、
『Japan has beautiful parksnationwide.』
『Japan is dotted with lovelypublic gardens all over thecountry.』
等のテンプレートパターン候補を作成することができるようになっている。
【0017】
このテンプレート群は、過去の添削例等を参考にして、添削作業等で翻訳文の核になる要素が何であるかを、専門家の知識を用いて吟味し、模範解答を単語・句からなる文章要素に分解するとともに、文法規則上同順位の文章要素を任意数同列でまとめてテンプレートブロックを作り、各テンプレートブロックを、文法規則に基づき上位のものから順次配列することにより構成されている。
【0018】
前記各テンプレートブロックは、正しく使われた単語・句だけでなく、統語的または意味上誤用された単語・句も含めて作成されており、これにより、通常考えられないような入力文に対しても、これに対応するテンプレートパターン候補を作成することができるようになっている。
【0019】
また、前記テンプレート群中のすべての単語には、図2に示すように、その重要度に応じたポイント数のポイントが付与されており、このポイントは、図1に示す単語ポイント数記憶手段5に、単語と関連付けて記憶されるようになっている。
【0020】
例えば、図2に示すテンプレート群の場合には、ほとんどの単語には、ポイント数「1」のポイントが付与されているが、『dotted』および『there』には、他の単語の2倍のポイント数「2」のポイントが付与されているとともに、『nationwide』には、他の単語の3倍のポイント数「3」のポイントが付与されている。すなわち、『dotted』,『there』および『nationwide』は、他の単語の2倍のあるいは3倍の重要度を有する重要単語として設定されている。
【0021】
ここで重要単語は、例えば教師が学生の翻訳文(入力文)を添削するような場合に、教師側が是非学生に覚えて貰いたいと考えている文型を強調する等の場合に設定されるのもので、この場合教師は、授業においてこの文型を用いて翻訳するよう、学生を指導するであろうし、学生もこの文型を用いて例題を翻訳するよう努力することが予想される。そして、学生がこの文型を用いて翻訳してきた場合には、その添削も、この文型に添ったテンプレートパターンを用いて評価してやることが、翻訳文(入力文)を教師に提出した学生の意図に添った評価となることは明らかである。
【0022】
そこで、本発明においては、後に詳述するように、学生がこの文型を用いて翻訳してきた場合には、この文型に添ったテンプレートパターンを、最適テンプレートパターンとして選択できるようにしている。
【0023】
なお、図2に示すテンプレート群では、『dotted』,『there』および『nationwide』が、重要単語として設定されているが、すべての単語のポイント数を「1」にしてもよい。
【0024】
前述のようにして作成された各テンプレートパターン候補は、図1に示すように、一致単語検索手段6において、入力文と一致する単語が検索されるようになっており、また合計ポイント数演算手段7においては、各テンプレートパターン候補で用いられているすべての単語の合計ポイント数が演算されるとともに、一致単語ポイント数演算手段8においては、入力文と各テンプレートパターン候補との間での一致単語の合計ポイント数が演算されるようになっている。そして、これら両合計ポイント数は、最適度比較値演算手段9において比較され、各テンプレートパターン候補の最適度比較値が演算されるようになっている。
【0025】
すなわち、最適度比較値演算手段9においては、各テンプレートパターン候補における全単語の合計ポイント数を分母とするとともに、各テンプレートパターン候補における入力文との一致単語の合計ポイント数を分子とすることにより、最適度比較値が演算されるようになっており、各テンプレートパターン候補の最適度比較値は、図1に示すように、最適テンプレートパターン判定手段10において相互に比較され、分子が最大となる最適度比較値のうちで、最も大きな最適度比較値を有するテンプレートパターン候補が、最適テンプレートパターンと判定されるようになっている。そして、一致単語の合計ポイント数のみならず、各テンプレートパターン候補における全単語の合計ポイント数をも考慮されるので、入力文により類似したテンプレートパターン候補が最適テンプレートとして決定されるようになっている。
【0026】
図3は、前記最適テンプレートパターン探索装置における最適テンプレートパターンの探索方法を示す流れ図であり、以下これについて説明する。
【0027】
まず、入力文に対応する模範解答用のテンプレート群が予め用意され、ステップS1においてこのテンプレート群を読込む。このテンプレート群は通常、FSA(有限状態オートマトン)を使用してコンピュータに組込み格納される。
【0028】
次いで、ステップS2において、テンプレート群中のすべての単語にその重要度に応じたポイント数で付与されているポイントを読込む。
【0029】
次いで、ステップS3において、入力文の読込みを行なうとともに、ステップS4において、入力文の解析を行なう。
【0030】
なお、この入力文の解析としては、例えば前記例のような和文英訳の場合であれば、前述の特開平9−325673号公報に示されているように、基本的用法が正しく履行されているか否かを調べるためのキーパターンによるキーパターンチェック、入力文のすべての単語に対し内蔵する辞書を用いて行なわれる品詞分類、および構文解析プログラムによる構文解析が順次行なわれることになる。
【0031】
次いで、ステップS5において、テンプレート群の各テンプレートブロックと入力文とを比較し、作成可能なすべてのテンプレートパターン候補を検索する。
【0032】
次いで、ステップS6において、入力文中の各単語が、各テンプレートパターン候補中のどの単語と一致するかを検索するとともに、ステップS7において、一致した単語の合計のポイント数を各テンプレートパターン候補毎に演算する。
【0033】
次いで、ステップS8において、各テンプレートパターン候補で用いられているすべての単語の合計ポイント数を各テンプレートパターン候補毎に演算するとともに、ステップS9において、各テンプレートパターン候補の最適度比較値をそれぞれ演算する。
【0034】
この最適度比較値は、具体的には、ステップS8で求められた合計ポイント数を分母,ステップS7で求められた一致単語ポイント数を分子とすることにより求められる。すなわち、一致単語ポイント数を合計ポイント数で除すことにより求められる。
【0035】
次いで、ステップS10において、各テンプレートパターン候補の最適度比較値を比較し、ステップS7で求められた一致単語ポイント数が最大となる最適度比較値のうちで、最適度比較値が最も大きくなるテンプレートパターンを、最適テンプレートパターンと判定する。
【0036】
例えば例題が、
『日本には、全国的に美しい庭が多い。』
であり、これに対し学生(入力者)の翻訳文(入力文)が、
『In Japan , are dotted with lovelypublic gardens nationwide.』
であったとすると、本発明においては、図2に示すテンプレート群から作成可能な多数のテンプレートパターン候補の中から、
『Japan is dotted with lovelypublic gardens nationwide.』
が最適テンプレートパターンとして決定される。
【0037】
次に、前記学生の翻訳文中の
『In Japan , are dotted with』
の部分に対して、図2に示すテンプレート群から作成可能な多数のテンプレート候補の中から、どのようにして最適テンプレートパターンが決定されるのかにつき具体的に説明する。
【0038】
いま、
『In Japan , are dotted with』
という入力文に対して、図2に示すテンプレート群から、
『Japan is dotted with』
と、
『In Japan , there are』
とがテンプレートパターン候補として作成されるものとすると、図4に示すような有向グラフが得られる。
【0039】
この有向グラフのノード(状態)が、N1,N2,N3,N4,N6,N7,N8,N9,N5とソート済みであることを前提とした上で、各ノードと入力文とのマッチングを行なう。
【0040】
図5は初期状態を示し、この状態から、矢印(N1,N2)すなわち『Japan』、矢印(N1,N6)すなわち『In』、矢印(N2,N3)すなわち『is』、矢印(N3,N4)すなわち『dotted』、矢印(N4,N5)すなわち『with』、矢印(N6,N7)すなわち『Japan』、矢印(N7,N8)すなわち『,』、矢印(N8,N9)すなわち『there』、および矢印(N9,N5)すなわち『are』と、入力文中の各単語とのマッチングが順次行なわれる。
【0041】
まず、矢印(N1,N2)と入力文とのマッチングについて、図6を参照して説明する。
(1) 矢印(N1,N2)と入力文の『In』とを照合すると、両者は等しくないので、項目(N2,“In”)の値および項目(N1,“In”)の値をチェックし、両者は共に0であることから、項目(N2,“In”)はそのままとし、バックリンクも同様にそのままとする(項目(N1,“In”)のバックリンクは当初設定されていないので、この時点で(N1,“In”)に設定する)。図6の表中における矢印がバックリンクである。
【0042】
ここで、バックリンクとは、以下のような理由で設定されるものである。すなわち、このマッチング方法では、図4に示す始端ノードN1から終端ノードN5までのすべてのマッチング作業を完了しなければ、最適テンプレートパターンがどの経路の文字列なのか判明しない。具体的には、図4の終端ノードN5まで作業を完了した時点で、矢印(N4,N5)側が最適テンプレートパターンであると判明した場合、ノードN4は、N4→N3→N2→N1の経路を辿って始端ノードN1に至る文字列であることが判る必要がある。この経路を示すものがバックリンクである。
【0043】
(2) 矢印(N1,N2)と入力文の『Japan』とを照合する。すると、両者は等しいので、項目(N2,“Japan”)の値(=0)、項目(N2,“In”)の値(=0)、項目(N1,“Japan”)の値(=0)、および(項目(N1,“In”)+1の値(=1、ここで+1は図4の“Japan”のポイント数を加えることを意味する。)をチェックし、そのうちの最大値を選択して項目(N2,“Japan”)の値とする。この数字は、前記最適度比較値を求める際の分子の数字として用いられるもので、これにより、項目(N2,“Japan”)=1となり、バックリンクは、最大値として選択した項目(N1,“In”)にリンクされる(ここで、N1は矢印(N1,N2)の始端ノードである)。
なお、図6に示す表において、N2の行の各升目の右下に記している数字「1」は、図4の始端ノードN1からノードN2までに含まれる単語の合計のポイント数を表わし、この数字は、前記最適度比較値を求める際の分母の数字として用いられる。
【0044】
(3) 次に、矢印(N1,N2)と入力文の『,』とを照合する。すると、両者は等しくないので、項目(N2,“,”)の値(=0)、項目(N2,“Japan”)の値(=1)、および(項目(N1,“,”)値(=0)をチェックし、そのうちの最大値を選択する。したがって、項目(N2,“,”)=1となり、バックリンクは、最大値として選択した項目(N2,“Japan”)にリンクされる。
【0045】
(4) 次に、矢印(N1,N2)と入力文の『are』とを照合する。すると、両者は等しくないので、項目(N2,“are”)の値(=0)、項目(N2,“,”)の値(=1)、および(項目(N1,“are”)値(=0)をチェックし、そのうちの最大値を選択する。したがって、項目(N2,“are”)=1となり、バックリンクは、最大値として選択した項目(N2,“,”)にリンクされる。
【0046】
(5) 次に、矢印(N1,N2)と入力文の『dotted』とを照合する。すると、両者は等しくないので、項目(N2,“dotted”)の値(=0)、項目(N2,“are”)の値(=1)、および(項目(N1,“dotted”)値(=0)をチェックし、そのうちの最大値を選択する。したがって、項目(N2,“dotted”)=1となり、バックリンクは、最大値として選択した項目(N2,“are”)にリンクされる。
【0047】
(6) 次に、矢印(N1,N2)と入力文の『with』とを照合する。すると、両者は等しくないので、項目(N2,“with”)の値(=0)、項目(N2,“dotted”)の値(=1)、および(項目(N1,“with”)値(=0)をチェックし、そのうちの最大値を選択する。したがって、項目(N2,“with”)=1となり、バックリンクは、最大値として選択した項目(N2,“dotted”)にリンクされる。
【0048】
次に、矢印(N1,N6)と入力文とのマッチングについて、図7を参照して説明する。
(1) まず、矢印(N1,N6)と入力文の『In』とを照合すると、両者は等しいので、項目(N6,“In”)の値(=0)、および項目(N1,“In”)+1の値(=1、ここで+1は図4の“In”のポイント数を加えることを意味する。)をチェックし、そのうちの最大値を選択して項目(N6,“In”)の値とする。これにより、項目(N6,“In”)=1となり、バックリンクは、最大値として選択した項目(N1,“In”)にリンクされる。
なお、図7に示す表において、N6の行の各升目の右下に記している数字「1」は、図4の始端ノードN1からノードN6までに含まれる単語の合計のポイント数,すなわち『In』のポイント数である。
【0049】
(2) 次に、矢印(N1,N6)と入力文の『Japan』とを照合する。すると、両者は等しくないので、項目(N6,“Japan”)の値(=0)、項目(N6,“In”)の値(=1)、および(項目(N1,“Japan”)値(=0)をチェックし、そのうちの最大値を選択する。したがって、項目(N6,“Japan”)=1となり、バックリンクは、最大値として選択した項目(N6,“In”)にリンクされる。
【0050】
(3) 次に、矢印(N1,N6)と入力文の『,』とを照合する。すると、両者は等しくないので、項目(N6,“,”)の値(=0)、項目(N6,“Japan”)の値(=1)、および(項目(N1,“,”)値(=0)をチェックし、そのうちの最大値を選択する。したがって、項目(N6,“,”)=1となり、バックリンクは、最大値として選択した項目(N6,“Japan”)にリンクされる。
【0051】
(4) 次に、矢印(N1,N6)と入力文の『are』とを照合する。すると、両者は等しくないので、項目(N6,“are”)の値(=0)、項目(N6,“,”)の値(=1)、および(項目(N1,“are”)値(=0)をチェックし、そのうちの最大値を選択する。したがって、項目(N6,“are”)=1となり、バックリンクは、最大値として選択した項目(N6,“,”)にリンクされる。
【0052】
(5) 次に、矢印(N1,N6)と入力文の『dotted』とを照合する。すると、両者は等しくないので、項目(N6,“dotted”)の値(=0)、項目(N6,“are”)の値(=1)、および項目(N1,“dotted”)値(=0)をチェックし、そのうちの最大値を選択する。したがって、項目(N6,“dotted”)=1となり、バックリンクは、最大値として選択した項目(N6,“are”)にリンクされる。
【0053】
(6) 次に、矢印(N1,N6)と入力文の『with』とを照合する。すると、両者は等しくないので、項目(N6,“with”)の値(=0)、項目(N6,“dotted”)の値(=1)、および項目(N1,“with”)値(=0)をチェックし、そのうちの最大値を選択する。したがって、項目(N6,“with”)=1となり、バックリンクは、最大値として選択した項目(N6,“dotted”)にリンクされる。
【0054】
次に、矢印(N2,N3)と入力文とのマッチングについて、図8を参照して説明する。
(1) まず、矢印(N2,N3)と入力文の『In』とを照合すると、両者は等しくないので、項目(N3,“In”)の値および項目(N2,“In”)をチェックし、両者は共に0であるので、項目(N3,“In”)はそのままとし、バックリンクもそのままとする。
なお、図8に示す表において、N3の行の各升目の右下に記している数字「2」は、図4の始端ノードN1からノードN3までに含まれる単語の合計のポイント数,すなわち『Japan』および『is』の合計のポイント数である。
【0055】
(2) 次に、矢印(N2,N3)と入力文の『Japan』とを照合する。すると、両者は等しくないので、項目(N3,“Japan”)の値(=0)、項目(N3,“In”)の値(=0)、および項目(N2,“Japan”)値(=1)をチェックし、そのうちの最大値を選択する。したがって、項目(N3,“Japan”)=1となり、バックリンクは、最大値として選択した項目(N2,“Japan”)にリンクされる。
【0056】
(3) 次に、矢印(N2,N3)と入力文の『,』とを照合する。すると、両者は等しくないので、項目(N3,“,”)の値(=0)、項目(N3,“Japan”)の値(=1)、および項目(N2,“,”)値(=1)をチェックし、そのうちの最大値を選択する。したがって、項目(N3,“,”)=1となり、バックリンクは、最大値として選択した項目(N3,“Japan”)にリンクされる。
【0057】
(4) 次に、矢印(N2,N3)と入力文の『are』とを照合する。すると、両者は等しくないので、項目(N3,“are”)の値(=0)、項目(N3,“,”)の値(=1)、および項目(N2,“are”)値(=1)をチェックし、そのうちの最大値を選択する。したがって、項目(N3,“are”)=1となり、バックリンクは、最大値として選択した項目(N3,“,”)にリンクされる。
【0058】
(5) 次に、矢印(N2,N3)と入力文の『dotted』とを照合する。すると、両者は等しくないので、項目(N3,“dotted”)の値(=0)、項目(N3,“are”)の値(=1)、および項目(N2,“dotted”)値(=1)をチェックし、そのうちの最大値を選択する。したがって、項目(N3,“dotted”)=1となり、バックリンクは、最大値として選択した項目(N3,“are”)にリンクされる。
【0059】
(6) 次に、矢印(N2,N3)と入力文の『with』とを照合する。すると、両者は等しくないので、項目(N3,“with”)の値(=0)、項目(N3,“dotted”)の値(=1)、および項目(N2,“with”)値(=1)をチェックし、そのうちの最大値を選択する。したがって、項目(N3,“with”)=1となり、バックリンクは、最大値として選択した項目(N3,“dotted”)にリンクされる。
【0060】
次に、矢印(N3,N4)と入力文とのマッチングについて、図9を参照して説明する。
(1) まず、矢印(N3,N4)と入力文の『In』とを照合すると、両者は等しくないので、項目(N4,“In”)の値および項目(N3,“In”)の値をチェックし、両者は共に0であるので、項目(N4,“In”)はそのままとし、バックリンクもそのままとする。
なお、図9に示す表において、N4の行の各升目の右下に記している数字「4」は、図4の始端ノードN1からノードN4までに含まれる単語,すなわち『Japan』,『is』および『dotted』の合計のポイント数である。
【0061】
(2) 次に、矢印(N3,N4)と入力文の『Japan』とを照合する。すると、両者は等しくないので、項目(N4,“Japan”)の値(=0)、項目(N4,“In”)の値(=0)、および項目(N3,“Japan”)値(=1)をチェックし、そのうちの最大値を選択する。したがって、項目(N4,“Japan”)=1となり、バックリンクは、最大値として選択した項目(N3,“Japan”)にリンクされる。
【0062】
(3) 次に、矢印(N3,N4)と入力文の『,』とを照合する。すると、両者は等しくないので、項目(N4,“,”)の値(=0)、項目(N4,“Japan”)の値(=1)、および項目(N3,“,”)値(=1)をチェックし、そのうちの最大値を選択する。したがって、項目(N4,“,”)=1となり、バックリンクは、最大値として選択した項目(N4,“Japan”)にリンクされる。
【0063】
(4) 次に、矢印(N3,N4)と入力文の『are』とを照合する。すると、両者は等しくないので、項目(N4,“are”)の値(=0)、項目(N4,“,”)の値(=1)、および項目(N3,“are”)値(=1)をチェックし、そのうちの最大値を選択する。したがって、項目(N4,“are”)=1となり、バックリンクは、最大値として選択した項目(N4,“,”)にリンクされる。
【0064】
(5) 次に、矢印(N3,N4)と入力文の『dotted』とを照合する。すると、両者は等しいので、項目(N4,“dotted”)の値(=0)、項目(N4,“are”)の値(=1)、項目(N3,“dotted”)値(=1)、および項目(N3,“are”)+2の値(=3、ここで+2は図4の“dotted”のポイント数を加えることを意味する。)をチェックし、その最大値を選択する。したがって、項目(N4,“dotted”)=3となり、バックリンクは、最大値として選択した項目(N3,“are”)にリンクされる。
【0065】
(6) 次に、矢印(N3,N4)と入力文の『with』とを照合する。すると、両者は等しくないので、項目(N4,“with”)の値(=0)、項目(N4,“dotted”)の値(=3)、および項目(N3,“with”)の値(=1)をチェックし、そのうちの最大値を選択する。したがって、項目(N4,“with”)=3となり、バックリンクは、最大値として選択した項目(N4,“dotted”)にリンクされる。
【0066】
次に、矢印(N4,N5)と入力文とのマッチングについて、図10を参照して説明する。
(1) まず、矢印(N4,N5)と入力文の『In』とを照合すると、両者は等しくないので、項目(N5,“In”)の値および項目(N4,“In”)の値をチェックし、両者は共に0であるので、項目(N5,“In”)はそのままとし、バックリンクもそのままとする。
なお、図10に示す表において、N5の行の各升目の右下に記している数字「5」は、図4の始端ノードN1からノードN5までの上側の文字列に含まれる単語,すなわち『Japan』,『is』,『dotted』および『with』の合計のポイント数である。
【0067】
(2) 次に、矢印(N4,N5)と入力文の『Japan』とを照合する。すると、両者は等しくないので、項目(N5,“Japan”)の値(=0)、項目(N5,“In”)の値(=0)、および項目(N4,“Japan”)値(=1)をチェックし、そのうちの最大値を選択する。したがって、項目(N5,“Japan”)=1となり、バックリンクは、最大値として選択した項目(N4,“Japan”)にリンクされる。
【0068】
(3) 次に、矢印(N4,N5)と入力文の『,』とを照合する。すると、両者は等しくないので、項目(N5,“,”)の値(=0)、項目(N5,“Japan”)の値(=1)、および項目(N4,“,”)値(=1)をチェックし、そのうちの最大値を選択する。したがって、項目(N5,“,”)=1となり、バックリンクは、最大値として選択した項目(N5,“Japan”)にリンクされる。
【0069】
(4) 次に、矢印(N4,N5)と入力文の『are』とを照合する。すると、両者は等しくないので、項目(N5,“are”)の値(=0)、項目(N5,“,”)の値(=1)、および項目(N4,“are”)値(=1)をチェックし、そのうちの最大値を選択する。したがって、項目(N5,“are”)=1となり、バックリンクは、最大値として選択した項目(N5,“,”)にリンクされる。
【0070】
(5) 次に、矢印(N4,N5)と入力文の『dotted』とを照合する。すると、両者は等しくないので、項目(N5,“dotted”)の値(=0)、項目(N5,“are”)の値(=1)、および項目(N4,“dotted”)値(=3)をチェックし、そのうちの最大値を選択する。したがって、項目(N5,“dotted”)=3となり、バックリンクは、最大値として選択した項目(N4,“dotted”)にリンクされる。
【0071】
(6) 次に、矢印(N4,N5)と入力文の『with』とを照合する。すると、両者は等しいので、項目(N5,“with”)の値(=0)、項目(N5,“dotted”)の値(=3)、項目(N4,“with”)の値(=3)、および項目(N4,“dotted”)+1の値(=4、ここで+1は図4の“with”のポイント数を加えることを意味する。)をチェックし、そのうちの最大値を選択する。したがって、項目(N5,“with”)=4となり、バックリンクは、最大値として選択した項目(N4,“dotted”)にリンクされる。
【0072】
次に、矢印(N6,N7)と入力文とのマッチングについて、図11を参照して説明する。
(1) まず、矢印(N6,N7)と入力文の『In』とを照合すると、両者は等しくないので、項目(N7,“In”)の値(=0)と項目(N6,“In”)の値(=1)とをチェックし、そのうちの大きい方の値を選択する。したがって、項目(N7,“In”)=1となり、バックリンクは、選択した項目(N6,“In”)にリンクされる。
なお、図11に示す表において、N7の行の各升目の右下に記している数字「2」は、図4の始端ノードN1からノードN7までに含まれる単語,すなわち『In』および『Japan』の合計のポイント数である。
【0073】
(2) 次に、矢印(N6,N7)と入力文の『Japan』とを照合する。すると、両者は等しいので、項目(N7,“Japan”)の値(=0)、項目(N7,“In”)の値(=0)、項目(N6,“Japan”)値(=1)、および項目(N6,“In”)+1の値(=2、ここで+1は図4の“Japan”のポイント数を加えることを意味する。)をチェックし、そのうちの最大値を選択する。したがって、項目(N7,“Japan”)=2となり、バックリンクは、最大値として選択した項目(N6,“In”)にリンクされる。
【0074】
(3) 次に、矢印(N6,N7)と入力文の『,』とを照合する。すると、両者は等しくないので、項目(N7,“,”)の値(=0)、項目(N7,“Japan”)の値(=2)、および項目(N6,“,”)値(=1)をチェックし、そのうちの最大値を選択する。したがって、項目(N7,“,”)=2となり、バックリンクは、最大値として選択した項目(N7,“Japan”)にリンクされる。
【0075】
(4) 次に、矢印(N6,N7)と入力文の『are』とを照合する。すると、両者は等しくないので、項目(N7,“are”)の値(=0)、項目(N7,“,”)の値(=2)、および項目(N6,“are”)値(=1)をチェックし、そのうちの最大値を選択する。したがって、項目(N7,“are”)=2となり、バックリンクは、最大値として選択した項目(N7,“,”)にリンクされる。
【0076】
(5) 次に、矢印(N6,N7)と入力文の『dotted』とを照合する。すると、両者は等しくないので、項目(N7,“dotted”)の値(=0)、項目(N7,“are”)の値(=2)、および項目(N6,“dotted”)値(=1)をチェックし、そのうちの最大値を選択する。したがって、項目(N7,“dotted”)=2となり、バックリンクは、最大値として選択した項目(N7,“are”)にリンクされる。
【0077】
(6) 次に、矢印(N6,N7)と入力文の『with』とを照合する。すると、両者は等しくないので、項目(N7,“with”)の値(=0)、項目(N7,“dotted”)の値(=2)、および項目(N6,“with”)値(=1)をチェックし、そのうちの最大値を選択する。したがって、項目(N7,“with”)=2となり、バックリンクは、最大値として選択した項目(N7,“dotted”)にリンクされる。
【0078】
次に、矢印(N7,N8)と入力文とのマッチングについて、図12を参照して説明する。
(1) まず、矢印(N7,N8)と入力文の『In』とを照合すると、両者は等しくないので、項目(N8,“In”)の値(=0)と項目(N7,“In”)の値(=1)とをチェックし、そのうちの大きい方の値を選択する。したがって、項目(N8,“In”)=1となり、バックリンクは、選択した項目(N7“In”)にリンクされる。
なお、図12に示す表において、N8の行の各升目の右下に記している数字「3」は、図4の始端ノードN1からノードN8までに含まれる単語,すなわち『In』,『Japan』および『,』の合計のポイント数である。
【0079】
(2) 次に、矢印(N7,N8)と入力文の『Japan』とを照合する。すると、両者は等しくないので、項目(N8,“Japan”)の値(=0)、項目(N8,“In”)の値(=1)、および項目(N7,“Japan”)値(=2)をチェックし、そのうちの最大値を選択する。したがって、項目(N8,“Japan”)=2となり、バックリンクは、最大値として選択した項目(N7,“Japan”)にリンクされる。
【0080】
(3) 次に、矢印(N7,N8)と入力文の『,』とを照合する。すると、両者は等しいので、項目(N8,“,”)の値(=0)、項目(N8,“Japan”)の値(=2)、項目(N7,“,”)の値(=2)、および項目(N7,“Japan”)+1の値(=3、ここで+1は図4の“,”のポイント数を加えることを意味する。)をチェックし、そのうちの最大値を選択する。したがって、項目(N8,“,”)=3となり、バックリンクは、最大値として選択した項目(N7,“Japan”)にリンクされる。
【0081】
(4) 次に、矢印(N7,N8)と入力文の『are』とを照合する。すると、両者は等しくないので、項目(N8,“are”)の値(=0)、項目(N8,“,”)の値(=3)、および項目(N7,“are”)値(=2)をチェックし、そのうちの最大値を選択する。したがって、項目(N8,“are”)=3となり、バックリンクは、最大値として選択した項目(N8,“,”)にリンクされる。
【0082】
(5) 次に、矢印(N7,N8)と入力文の『dotted』とを照合する。すると、両者は等しくないので、項目(N8,“dotted”)の値(=0)、項目(N8,“are”)の値(=3)、および項目(N7,“dotted”)値(=2)をチェックし、そのうちの最大値を選択する。したがって、項目(N8,“dotted”)=3となり、バックリンクは、最大値として選択した項目(N8,“are”)にリンクされる。
【0083】
(6) 次に、矢印(N7,N8)と入力文の『with』とを照合する。すると、両者は等しくないので、項目(N8,“with”)の値(=0)、項目(N8,“dotted”)の値(=3)、および項目(N7,“with”)値(=2)をチェックし、そのうちの最大値を選択する。したがって、項目(N8,“with”)=3となり、バックリンクは、最大値として選択した項目(N8,“dotted”)にリンクされる。
【0084】
次に、矢印(N8,N9)と入力文とのマッチングについて、図13を参照して説明する。
(1) まず、矢印(N8,N9)と入力文の『In』とを照合すると、両者は等しくないので、項目(N9,“In”)の値(=0)と項目(N8,“In”)の値(=1)とをチェックし、そのうちの大きい方の値を選択する。したがって、項目(N9,“In”)=1となり、バックリンクは、選択した項目(N8“In”)にリンクされる。
なお、図13に示す表において、N9の行の各升目の右下に記している数字「5」は、図4の始端ノードN1からノードN9までに含まれる単語,すなわち『In』,『Japan』『,』および『there』の合計ポイント数である。
【0085】
(2) 次に、矢印(N8,N9)と入力文の『Japan』とを照合する。すると、両者は等しくないので、項目(N9,“Japan”)の値(=0)、項目(N9,“In”)の値(=1)、および項目(N8,“Japan”)値(=2)をチェックし、そのうちの最大値を選択する。したがって、項目(N9,“Japan”)=2となり、バックリンクは、最大値として選択した項目(N8,“Japan”)にリンクされる。
【0086】
(3) 次に、矢印(N8,N9)と入力文の『,』とを照合する。すると、両者は等しくないので、項目(N9,“,”)の値(=0)、項目(N9,“Japan”)の値(=2)、および項目(N8,“,”)値(=3)をチェックし、そのうちの最大値を選択する。したがって、項目(N9,“,”)=3となり、バックリンクは、最大値として選択した項目(N8,“,”)にリンクされる。
【0087】
(4) 次に、矢印(N8,N9)と入力文の『are』とを照合する。すると、両者は等しくないので、項目(N9,“are”)の値(=0)、項目(N9,“,”)の値(=3)、および項目(N8,“are”)値(=3)をチェックし、そのうちの最大値を選択する。したがって、項目(N9,“are”)=3となり、バックリンクは、最大値として選択した項目(N9,“,”)にリンクされる。
【0088】
(5) 次に、矢印(N8,N9)と入力文の『dotted』とを照合する。すると、両者は等しくないので、項目(N9,“dotted”)の値(=0)、項目(N9,“are”)の値(=3)、および項目(N8,“dotted”)値(=3)をチェックし、そのうちの最大値を選択する。したがって、項目(N9,“dotted”)=3となり、バックリンクは、最大値として選択した項目(N9,“are”)にリンクされる。
【0089】
(6) 次に、矢印(N8,N9)と入力文の『with』とを照合する。すると、両者は等しくないので、項目(N9,“with”)の値(=0)、項目(N9,“dotted”)の値(=3)、および項目(N8,“with”)値(=3)をチェックし、そのうちの最大値を選択する。したがって、項目(N9,“with”)=3となり、バックリンクは、最大値として選択した項目(N9,“dotted”)にリンクされる。
【0090】
次に、矢印(N9,N5)と入力文とのマッチングについて、図14を参照して説明する。
(1) まず、矢印(N9,N5)と入力文の『In』とを照合すると、両者は等しくないので、項目(N9,“In”)の値(=0)と項目(N9,“In”)の値(=1)とをチェックし、そのうちの大きい方の値を選択する。したがって、項目(N5,“In”)=1となり、バックリンクは、選択した項目(N9“In”)にリンクされ、バックリンクが変更される。
なお、図14に示す表において、N5の行の第1列目から第5列目の各升目の右下に記している数字「6」は、図4の始端ノードN1からノードN5までの下側の文字列に含まれる単語,すなわち『In』,『Japan』『,』『there』および『are』の合計ポイント数である。
ここで、N5の行の第6列目の升目の右下に記している数字は、「6」ではなく「5」のままであるが、その理由については後に詳述する。
【0091】
(2) 次に、矢印(N9,N5)と入力文の『Japan』とを照合する。すると、両者は等しくないので、項目(N5,“Japan”)の値(=1)、項目(N5,“In”)の値(=1)、および項目(N9,“Japan”)値(=2)をチェックし、そのうちの最大値を選択する。したがって、項目(N5,“Japan”)=2となり、バックリンクは、最大値として選択した項目(N9,“Japan”)にリンクされ、バックリンクが変更される。
【0092】
(3) 次に、矢印(N9,N5)と入力文の『,』とを照合する。すると、両者は等しくないので、項目(N5,“In”)の値(=1)、項目(N5,“Japan”)の値(=2)、および項目(N9,“,”)値(=3)をチェックし、そのうちの最大値を選択する。したがって、項目(N5,“,”)=3となり、バックリンクは、最大値として選択した項目(N9,“,”)にリンクされ,バックリンクが変更される。
【0093】
(4) 次に、矢印(N9,N5)と入力文の『are』とを照合する。すると、両者は等しいので、項目(N5,“are”)の値(=1)、項目(N5,“,”)の値(=3)、項目(N9,“are”)値(=3)、および項目(N9,“,”)+1の値(=4、ここで+1は図4の“are”のポイント数を加えることを意味する。)をチェックし、そのうちの最大値を選択する。したがって、項目(N5,“are”)=4となり、バックリンクは、最大値として選択した項目(N9,“,”)にリンクされ、バックリンクが変更される。
【0094】
(5) 次に、矢印(N9,N5)と入力文の『dotted』とを照合する。すると、両者は等しくないので、項目(N5,“dotted”)の値(=3)、項目(N5,“are”)の値(=4)、および項目(N9,“dotted”)値(=3)をチェックし、そのうちの最大値を選択する。したがって、項目(N5,“dotted”)=4となり、バックリンクは、最大値として選択した項目(N5,“are”)にリンクされ、バックリンクが変更される。
【0095】
(6) 次に、矢印(N9,N5)と入力文の『with』とを照合する。すると、両者は等しくないので、項目(N5,“with”)の値(=4)、項目(N5,“dotted”)の値(=4)、および項目(N9,“with”)値(=3)をチェックする。
【0096】
ここで、項目(N5,“dotted”)の値(=4)が最大値である場合には、N5の行の第1列から第5列までの場合と同様、バックリンクが変更され、各升目の右下に記している数字も、変更された文字列の合計ポイント数である「6」に変更されることになる。
【0097】
ところが、項目(N5,“dotted”)の値(=4)と、元の項目(N5,“with”)の値(=4)とは同一値である。そしてこの場合には、バックリンクを変更することにより、N5の行の升目の右下に記している数字が小さくなる場合を除き、バックリンクの変更は行なわない。したがって、項目(N5,“with”)=4となり、バックリンクは、項目(N4,“dotted”)にリンクされたままの状態が保持され、升目の右下に記している数字も、図4の上側の文字列の合計ポイント数である「5」のままの状態が保持される。
【0098】
以上説明したマッチング作業により、図4に示す上側の文字列の最適度比較値が4/5で、下側の文字列の最適度比較値が4/6となり、上側の文字列が入力文に対する最適テンプレートパターンとして決定されることになる。
【0099】
このようにして、最適テンプレートパターンが決定されたならば、図3のステップS11において、入力文を最適テンプレートパターンと同様のテンプレートに分解するとともに、ステップS12において、入力文の添削を行なう。この添削方法は、前述の特開平9−325673号公報に示されている添削方法と同一である。
【0100】
しかして、模範解答用のテンプレートパターンを予め用意せず、入力文に合わせてその都度これに適したテンプレートパターンを作成するようにしているので、どのような入力文に対しても、これに最も適した模範解答用のテンプレートパターンを得ることができる。
【0101】
なお、前記実施の一形態においては、和文英訳の添削を例に採って説明したが、英文和訳の場合や、他の言語間の翻訳の場合にも同様に適用でき、また前述のように、インターネット等を利用した情報検索システムにおいて、入力文に基づき所定の情報を検索するような場合に、自然言語文章からなる複合情報を持つテンプレートパターンを検索キーとして使用することにより、同様に適用することができる。
【0102】
【発明の効果】
以上説明したように本発明は、任意数の文章要素を同列で包含する複数のテンプレートブロックを文法規則に基づき上位のものから順次配列して構成される模範解答用のテンプレート群を予め用意し、このテンプレート群から作成可能なすべてのテンプレートパターン候補の中から、入力文に最も適したテンプレートパターン候補を探索する最適テンプレートパターン探索方法であって、前記テンプレート群中のすべての単語に、その重要度に応じたポイント数のポイントを付与した後、前記すべてのテンプレートパターン候補について、各テンプレートパターン候補で用いられているすべての単語の合計ポイント数を分母,入力文と各テンプレートパターン候補との間での一致単語の合計ポイント数を分子とする最適度比較値を求め、分子が最大となる最適度比較値のうちで、最適度比較値が最も大きくなるテンプレートパターン候補を、最適テンプレートパターンと判定するようにしているので、どのような入力文であっても、入力者が意図した入力文のテンプレートパターンと同一のテンプレートパターンを、模範解答用の最適テンプレートパターンとして得ることができる。
【0103】
本発明はまた、任意数の文章要素を同列で包含する複数のテンプレートブロックを文法規則に基づき上位のものから順次配列して構成される模範解答用のテンプレート群を記憶するテンプレート群記憶手段と;入力文を記憶する入力文記憶手段と;前記テンプレート群の各テンプレートブロックと入力文とを比較し、テンプレート群から作成可能なすべてのテンプレートパターン候補を探索するテンプレートパターン候補検索手段と;検索されたテンプレートパターン候補を記憶するテンプレートパターン候補記憶手段と;テンプレート群中のすべての単語にその重要度に応じたポイント数で付与されるポイントを、単語と関連付けて記憶する単語ポイント数記憶手段と;各テンプレートパターン候補において入力文と一致する単語を検索する一致単語検索手段と;各テンプレートパターン候補で用いられているすべての単語の合計ポイント数を演算する合計ポイント数演算手段と;入力文と各テンプレートパターン候補との間での一致単語の合計ポイント数を演算する一致単語ポイント数演算手段と;各テンプレートパターン候補における全単語の合計ポイント数を分母,各テンプレートパターン候補における入力文との一致単語の合計ポイント数を分子とする最適度比較値を演算する最適度比較値演算手段と;各テンプレートパターン候補の最適度比較値を比較し、分子が最大となる最適度比較値のうちで、最も大きな最適度比較値を有するテンプレートパターン候補を最適テンプレートパターンと判定する最適テンプレートパターン判定手段と;を設けるようにしているので、どのような入力文であっても、これに対応するテンプレートパターン候補を得ることができる。また、複数のテンプレートパターン候補の中から最適テンプレートパターンを得る際には、最適度比較値を比較して判定するようにしているので、最適テンプレートパターンが複数出てくるといった不具合を、ほぼ完全に防止することができる。
【0104】
本発明はさらに、任意数の文章要素を同列で包含する複数のテンプレートブロックを文法規則に基づき上位のものから順次配列して構成される模範解答用のテンプレ群を、メモリ領域に記憶させる処理;入力文をメモリ領域に記憶させる処理;前記テンプレート群中のすべての単語に対し、その重要度に応じたポイント数で付与されたポイントを、単語と関連付けてメモリ領域に記憶させる処理;前記テンプレート群から作成可能なすべてのテンプレートパターン候補について、各テンプレートパターン候補で用いられているすべての単語の合計ポイント数を分母,入力文と各テンプレートパターン候補との間での一致単語の合計ポイント数を分子とする最適度比較値を用い、分子が最大となる最適度比較値のうちで、最適度比較値が最も大きくなるテンプレートパターン候補を、最適テンプレートパターンと判定する処理;をコンピュータに実行させるようにしているので、予め模範解答用のテンプレートパターンを用意しておかなくても、入力者が意図した入力文のテンプレートパターンと同一のテンプレートパターンを、模範解答用の最適テンプレートパターンとして得ることができる。
【図面の簡単な説明】
【図1】本発明の実施の一形態に係る最適テンプレートパターン探索装置を示す全体構成図である。
【図2】図1の装置で用いられるテンプレート群の一例を示す説明図である。
【図3】図1の装置による最適テンプレートパターン探索方法を示す流れ図である。
【図4】有向グラフの一例を示す説明図である。
【図5】図4の各ノードと入力文とのマッチングを行なう際の初期状態を示す表である。
【図6】矢印(N1,N2)と入力文とのマッチングを示す表である。
【図7】矢印(N1,N6)と入力文とのマッチングを示す表である。
【図8】矢印(N2,N3)と入力文とのマッチングを示す表である。
【図9】矢印(N3,N4)と入力文とのマッチングを示す表である。
【図10】矢印(N4,N5)と入力文とのマッチングを示す表である。
【図11】矢印(N6,N7)と入力文とのマッチングを示す表である。
【図12】矢印(N7,N8)と入力文とのマッチングを示す表である。
【図13】矢印(N8,N9)と入力文とのマッチングを示す表である。
【図14】矢印(N9,N5)と入力文とのマッチングを示す表である。
【符号の説明】
1 テンプレート群記憶手段
2 入力文記憶手段
3 テンプレートパターン候補検索手段
4 テンプレートパターン候補記憶手段
5 単語ポイント数記憶手段
6 一致単語検索手段
7 合計ポイント数演算手段
8 一致単語ポイント数演算手段
9 最適度比較値演算手段
10 最適テンプレートパターン判定手段

Claims (3)

  1. 正しく使われた単語・句だけでなく、統語的または意味上誤用された単語・句も含めた任意数の文章要素を同列で包含する複数のテンプレートブロックを、文法規則に基づき上位のものから順次配列して構成される模範解答用のテンプレート群を記憶するテンプレート群記憶手段と;入力文を記憶する入力文記憶手段と;テンプレート群中のすべての単語にその重要度に応じたポイント数で付与されるポイントを、単語と関連付けて記憶する単語ポイント数記憶手段と;を備え、前記テンプレート群から作成可能なすべてのテンプレートパターン候補の中から、入力文に最も適したテンプレートパターン候補を探索する最適テンプレートパターン探索方法であって、テンプレートパターン候補検索手段が、前記テンプレート群の各テンプレートブロックと入力文とを比較し、テンプレート群から作成可能なすべてのテンプレートパターン候補を探索するステップと;一致単語検索手段が、各テンプレートパターン候補において入力文と一致する単語を検索するステップと;合計ポイント数演算手段が、各テンプレートパターン候補で用いられているすべての単語の合計ポイント数を演算するステップと;一致単語ポイント数演算手段が、入力文と各テンプレートパターン候補との間での一致単語の合計ポイント数を演算するステップと;最適度比較値演算手段が、各テンプレートパターン候補における全単語の合計ポイント数を分母,各テンプレートパターン候補における入力文との一致単語の合計ポイント数を分子とする最適度比較値を演算するステップと;最適テンプレートパターン判定手段が、各テンプレートパターン候補の最適比較値を比較し、分子が最大となる最適度比較値のうちで、最も大きな最適度比較値を有するテンプレートパターン候補を最適テンプレートパターンと判定するステップと;を具備することを特徴とする最適テンプレートパターン探索方法。
  2. 正しく使われた単語・句だけでなく、統語的または意味上誤用された単語・句も含めた任意数の文章要素を同列で包含する複数のテンプレートブロックを文法規則に基づき上位のものから順次配列して構成される模範解答用のテンプレート群を記憶するテンプレート群記憶手段と;入力文を記憶する入力文記憶手段と;前記テンプレート群の各テンプレートブロックと入力文とを比較し、テンプレート群から作成可能なすべてのテンプレートパターン候補を探索するテンプレートパターン候補検索手段と;検索されたテンプレートパターン候補を記憶するテンプレートパターン候補記憶手段と;テンプレート群中のすべての単語にその重要度に応じたポイント数で付与されるポイントを、単語と関連付けて記憶する単語ポイント数記憶手段と;各テンプレートパターン候補において入力文と一致する単語を検索する一致単語検索手段と;各テンプレートパターン候補で用いられているすべての単語の合計ポイント数を演算する合計ポイント数演算手段と;入力文と各テンプレートパターン候補との間での一致単語の合計ポイント数を演算する一致単語ポイント数演算手段と;各テンプレートパターン候補における全単語の合計ポイント数を分母,各テンプレートパターン候補における入力文との一致単語の合計ポイント数を分子とする最適度比較値を演算する最適度比較値演算手段と;各テンプレートパターン候補の最適度比較値を比較し、分子が最大となる最適度比較値のうちで、最も大きな最適度比較値を有するテンプレートパターン候補を最適テンプレートパターンと判定する最適テンプレートパターン判定手段と;を具備することを特徴とする最適テンプレートパターン探索装置。
  3. 正しく使われた単語・句だけでなく、統語的または意味上誤用された単語・句も含めた任意数の文章要素を同列で包含する複数のテンプレートブロックを文法規則に基づき上位のものから順次配列して構成される模範解答用のテンプレート群を、メモリ領域に記憶させる処理;入力文をメモリ領域に記憶させる処理;前記テンプレート群中のすべての単語に対し、その重要度に応じたポイント数で付与されたポイントを、単語と関連付けてメモリ領域に記憶させる処理;前記テンプレート群から作成可能なすべてのテンプレートパターン候補について、各テンプレートパターン候補で用いられているすべての単語の合計ポイント数を分母,入力文と各テンプレートパターン候補との間での一致単語の合計ポイント数を分子とする最適度比較値を用い、分子が最大となる最適度比較値のうちで、最適度比較値が最も大きくなるテンプレートパターン候補を、最適テンプレートパターンと判定する処理;をコンピュータに実行させるためのプログラムを記録したコンピュータ読取り可能な記録媒体。
JP18248099A 1999-06-28 1999-06-28 最適テンプレートパターン探索方法,探索装置および記録媒体 Expired - Fee Related JP3669870B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP18248099A JP3669870B2 (ja) 1999-06-28 1999-06-28 最適テンプレートパターン探索方法,探索装置および記録媒体
US09/597,270 US6804637B1 (en) 1999-06-28 2000-06-20 Method, apparatus, and recording medium for retrieving optimum template pattern

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP18248099A JP3669870B2 (ja) 1999-06-28 1999-06-28 最適テンプレートパターン探索方法,探索装置および記録媒体
US09/597,270 US6804637B1 (en) 1999-06-28 2000-06-20 Method, apparatus, and recording medium for retrieving optimum template pattern

Publications (2)

Publication Number Publication Date
JP2001013863A JP2001013863A (ja) 2001-01-19
JP3669870B2 true JP3669870B2 (ja) 2005-07-13

Family

ID=33492323

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18248099A Expired - Fee Related JP3669870B2 (ja) 1999-06-28 1999-06-28 最適テンプレートパターン探索方法,探索装置および記録媒体

Country Status (2)

Country Link
US (1) US6804637B1 (ja)
JP (1) JP3669870B2 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4574047B2 (ja) * 2001-03-30 2010-11-04 富士通株式会社 訳例辞書を用いて翻訳を行う機械翻訳装置およびプログラム
US6988063B2 (en) * 2002-02-12 2006-01-17 Sunflare Co., Ltd. System and method for accurate grammar analysis using a part-of-speech tagged (POST) parser and learners' model
US7013262B2 (en) * 2002-02-12 2006-03-14 Sunflare Co., Ltd System and method for accurate grammar analysis using a learners' model and part-of-speech tagged (POST) parser
US7249012B2 (en) * 2002-11-20 2007-07-24 Microsoft Corporation Statistical method and apparatus for learning translation relationships among phrases
US7356457B2 (en) 2003-02-28 2008-04-08 Microsoft Corporation Machine translation using learned word associations without referring to a multi-lingual human authored dictionary of content words
US8666928B2 (en) * 2005-08-01 2014-03-04 Evi Technologies Limited Knowledge repository
US8340957B2 (en) * 2006-08-31 2012-12-25 Waggener Edstrom Worldwide, Inc. Media content assessment and control systems
US8271266B2 (en) * 2006-08-31 2012-09-18 Waggner Edstrom Worldwide, Inc. Media content assessment and control systems
US8838659B2 (en) 2007-10-04 2014-09-16 Amazon Technologies, Inc. Enhanced knowledge repository
JP5239307B2 (ja) * 2007-11-20 2013-07-17 富士ゼロックス株式会社 翻訳装置及び翻訳プログラム
CN101960451A (zh) * 2008-02-29 2011-01-26 夏普株式会社 信息处理装置、方法、以及程序
JP5298834B2 (ja) * 2008-12-23 2013-09-25 富士ゼロックス株式会社 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置
US9805089B2 (en) 2009-02-10 2017-10-31 Amazon Technologies, Inc. Local business and product search system and method
US9110882B2 (en) 2010-05-14 2015-08-18 Amazon Technologies, Inc. Extracting structured knowledge from unstructured text
US20150007181A1 (en) * 2013-06-27 2015-01-01 Xerox Corporation Method and system for selecting task templates

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4507750A (en) * 1982-05-13 1985-03-26 Texas Instruments Incorporated Electronic apparatus from a host language
US4802231A (en) * 1987-11-24 1989-01-31 Elliot Davis Pattern recognition error reduction system
US5758257A (en) * 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
JP2887660B2 (ja) 1996-06-05 1999-04-26 株式会社サン・フレア 翻訳文添削支援装置

Also Published As

Publication number Publication date
JP2001013863A (ja) 2001-01-19
US6804637B1 (en) 2004-10-12

Similar Documents

Publication Publication Date Title
Black et al. Statistically-driven computer grammars of English: The IBM/Lancaster approach
JP3669870B2 (ja) 最適テンプレートパターン探索方法,探索装置および記録媒体
US6112168A (en) Automatically recognizing the discourse structure of a body of text
JP3726742B2 (ja) 文書の一般テキストサマリを作成する方法およびシステム
CN108804428A (zh) 一种译文中术语错译的纠正方法、***及相关装置
EP1508861A1 (en) Method for synthesising a self-learning system for knowledge acquisition for text-retrieval systems
CN112925563B (zh) 一种面向代码重用的源代码推荐方法
CN112328800A (zh) 自动生成编程规范问题答案的***及方法
CN111061832A (zh) 基于开放域信息抽取的人物行为抽取方法
JP4502114B2 (ja) データベース検索装置
Wax Automated grammar engineering for verbal morphology
JP3794716B2 (ja) 単語を語形変化させる方法及びその方法を実行するデータ処理装置
US20030195740A1 (en) Translation evaluation using optimum template pattern determination method
US11494560B1 (en) System and methodology for computer-facilitated development of reading comprehension test items through passage mapping
CN117540063A (zh) 一种基于问题生成的教育领域知识库搜索优化方法和装置
JP3669869B2 (ja) 最適テンプレートパターンを用いた評価方法、評価装置および記録媒体
JP3932350B2 (ja) 言語変換処理統一システム
CN110750632A (zh) 一种改进的中文alice智能问答方法及***
JPH1078969A (ja) 情報検索装置
Lucassen Discovering phonemic base forms automatically: an information theoretic approach
CN115114417A (zh) 中文填空题自动评分方法及装置
KR20010092515A (ko) 언어를 학습하기 위한 방법 및 시스템
CN112732885A (zh) 用于问答***的答案扩展方法、装置及电子设备
Tamang et al. Adding smarter systems instead of human annotators: re-ranking for system combination
JPH07244665A (ja) 機械翻訳システム用辞書・ルール学習方法及び機械翻訳システム用辞書・ルール学習装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040323

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040521

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050405

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050412

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080422

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090422

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090422

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100422

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100422

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110422

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120422

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120422

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130422

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140422

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees