JP5696555B2 - Program and information processing apparatus - Google Patents

Program and information processing apparatus Download PDF

Info

Publication number
JP5696555B2
JP5696555B2 JP2011069497A JP2011069497A JP5696555B2 JP 5696555 B2 JP5696555 B2 JP 5696555B2 JP 2011069497 A JP2011069497 A JP 2011069497A JP 2011069497 A JP2011069497 A JP 2011069497A JP 5696555 B2 JP5696555 B2 JP 5696555B2
Authority
JP
Japan
Prior art keywords
word
sentence
information
predicate
role
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011069497A
Other languages
Japanese (ja)
Other versions
JP2012203779A (en
Inventor
宏 梅基
宏 梅基
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2011069497A priority Critical patent/JP5696555B2/en
Publication of JP2012203779A publication Critical patent/JP2012203779A/en
Application granted granted Critical
Publication of JP5696555B2 publication Critical patent/JP5696555B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、プログラム及び情報処理装置に関する。   The present invention relates to a program and an information processing apparatus.

2種以上の関係の少なくとも1種を除外し残りの関係に基づいてキーワードの予備関連語をファイルから抽出する。予備関連語によりデータベースを検索し予備情報を得る。キーワードの関連語をファイルから抽出するための制御情報を、前記除外した単語間の関係と前記予備情報とに基づいて生成する。この制御情報を用いキーワードの関連語をファイルから抽出する。この関連語によりデータベースを検索する、という技術が特許文献1に開示されている。   Exclude at least one of the two or more relationships, and extract keyword preliminary related words from the file based on the remaining relationships. Search the database by the preliminary related words to obtain preliminary information. Control information for extracting keyword-related words from the file is generated based on the relationship between the excluded words and the preliminary information. Using this control information, keywords related words are extracted from the file. A technique of searching a database using this related term is disclosed in Patent Document 1.

特開平09−153055号公報Japanese Patent Laid-Open No. 09-153055

ある単語の上位概念は必ずしも一つではなく、文中で当該単語が持つ役割に関係して異なることを考慮に入れた、同意関係ないし含意関係の判断を行う。   The superordinate concept of a word is not necessarily one, and a consensus relationship or an implication relationship is determined in consideration of differences in relation to the role of the word in the sentence.

請求項1記載の発明は、プログラムであって、コンピュータを、単語の表す概念、または単語そのものに対して、関連し得る述語と、当該述語との意味上の関係を表す意味関係情報と、当該単語が述語とともに現れるときに当該単語が文中で持つ役割を表す役割情報とを互いに関連づけて保持する保持手段と、処理対象となる一対の文について、一方の文に含まれる単語と、役割情報が共通する少なくとも一つの単語、または役割情報が共通する概念に対応する少なくとも一つの単語が、他方の文に含まれるか否かを解析する解析手段と、前記解析手段の解析の結果に基づき、前記一対の文が、互いに意味が同じ同意関係、または、一方の処理対象文の意味が、他方の処理対象文の意味を含む含意関係にあるか否かを判定する判定手段と、として機能させるものである。   The invention according to claim 1 is a program, which is a program that allows a computer to associate a predicate that can be related to a concept represented by a word or the word itself, semantic relationship information that represents a semantic relationship with the predicate, When a word appears together with a predicate, the holding means for holding the role information representing the role that the word has in the sentence in association with each other, the word included in one sentence, and the role information about a pair of sentences to be processed Analyzing means for analyzing whether at least one common word or at least one word corresponding to a concept with common role information is included in the other sentence, and based on the result of analysis by the analyzing means, A determination means for determining whether a pair of sentences have the same consent relationship, or whether the meaning of one processing target sentence is an implication relation including the meaning of the other processing target sentence; and It is intended to function Te.

請求項2記載の発明は、請求項1記載のプログラムであって、前記保持手段が、単語の表す概念と、単語そのものと、に対して、それぞれ関連し得る述語と、当該述語との意味上の関係を表す意味関係情報と、当該単語が述語とともに現れるときに当該単語が文中で持つ役割を表す役割情報とを互いに関連づけて保持し、前記解析手段は、処理対象となる一対の文について、一方の文に含まれる単語と役割情報が共通する少なくとも一つの単語が他方の文に含まれる場合と、一方の文に含まれる単語と役割情報が共通する概念に対応する少なくとも一つの単語が、他方の文に含まれる場合とで、異なる得点情報を出力することとしたものである。   The invention according to claim 2 is the program according to claim 1, wherein the holding means is a predicate that can relate to the concept represented by the word and the word itself, and the meaning of the predicate. Semantic relationship information that represents the relationship between and the role information that represents the role that the word has in the sentence when the word appears with the predicate, and the analysis means for the pair of sentences to be processed, When at least one word having the same role information as a word included in one sentence is included in the other sentence, and at least one word corresponding to a concept having the same role information as the word included in one sentence is Different score information is output when it is included in the other sentence.

請求項3記載の発明は、請求項2記載のプログラムであって、前記コンピュータを、複数の文を対象として、当該複数の文の各々と、指定された文とを処理対象となる一対の文として前記解析手段による解析を行わせ、前記解析手段により算出される得点情報を利用して、前記複数の文の各々を数値で評価し、当該評価の順に前記複数の文の各々を配列して提示する提示手段としてさらに機能させることとしたものである。 The invention according to claim 3 is the program according to claim 2, wherein the computer targets a plurality of sentences and each of the plurality of sentences and a specified sentence are processed. As an analysis by the analysis means, using the score information calculated by the analysis means, each of the plurality of sentences is evaluated numerically, and each of the plurality of sentences is arranged in the order of the evaluation It is intended to further function as a presenting means for presenting.

請求項4記載の発明は、情報処理装置であって、単語の表す概念、または単語そのものに対して、関連し得る述語と、当該述語との意味上の関係を表す意味関係情報と、当該単語が述語とともに現れるときに当該単語が文中で持つ役割を表す役割情報とを互いに関連づけて保持する保持手段と、処理対象となる一対の文について、一方の文に含まれる単語と、役割情報が共通する少なくとも一つの単語、または役割情報が共通する概念に対応する少なくとも一つの単語が、他方の文に含まれるか否かを解析する解析手段と、前記解析手段の解析の結果に基づき、前記一対の文が、互いに意味が同じ同意関係、または、一方の処理対象文の意味が、他方の処理対象文の意味を含む含意関係にあるか否かを判定する判定手段と、を含むこととしたものである。   The invention according to claim 4 is an information processing apparatus, which is related to a concept represented by a word or a word itself, semantic relation information representing a semantic relationship between the predicate, and the word When the word appears together with the predicate, the role information that represents the role of the word in the sentence is held in association with each other, and the pair of sentences to be processed has the same role information as the word contained in one sentence Analysis means for analyzing whether or not at least one word corresponding to a concept having a common role information is included in the other sentence, and based on the analysis result of the analysis means, the pair And determining means for determining whether the meaning of one processing target sentence is an implication relation including the meaning of the other processing target sentence. Than is.

請求項1,4記載の発明によると、文中の単語と当該単語に関連し得る述語との意味上の関係と、当該単語が文中で持つ役割を表す役割情報とに基づいて、二文が同意または含意の関係にあるかを判断できる。   According to the first and fourth aspects of the present invention, two sentences agree on the basis of the semantic relationship between a word in a sentence and a predicate that can be related to the word, and role information indicating the role of the word in the sentence. Or it can be judged whether there is an implication relationship.

請求項2記載の発明によると、得点情報を出力できる。   According to invention of Claim 2, score information can be output.

請求項3記載の発明によると、得点情報を利用した数値評価により、複数の文を順位付けして提示できる。   According to the invention described in claim 3, a plurality of sentences can be ranked and presented by numerical evaluation using the score information.

本発明の実施の形態に係る情報処理装置の例を表す構成ブロック図である。It is a block diagram showing an example of an information processing apparatus according to an embodiment of the present invention. 本発明の実施の形態に係る情報処理装置が利用する単語データベースの例を表す説明図である。It is explanatory drawing showing the example of the word database which the information processing apparatus which concerns on embodiment of this invention utilizes. 本発明の実施の形態に係る情報処理装置が利用する解析データベースの例を表す説明図である。It is explanatory drawing showing the example of the analysis database which the information processing apparatus which concerns on embodiment of this invention utilizes. 本発明の実施の形態に係る情報処理装置の例を表す機能ブロック図である。It is a functional block diagram showing the example of the information processing apparatus which concerns on embodiment of this invention. 本発明の実施の形態に係る情報処理装置による解析の結果例を表す説明図である。It is explanatory drawing showing the example of the result of the analysis by the information processing apparatus which concerns on embodiment of this invention. 本発明の実施の形態に係る情報処理装置の動作例を表すフローチャート図である。It is a flowchart figure showing the operation example of the information processing apparatus which concerns on embodiment of this invention. 本発明の実施の形態に係る情報処理装置の別の例を表す機能ブロック図である。It is a functional block diagram showing another example of the information processing apparatus which concerns on embodiment of this invention.

本発明の実施の形態について図面を参照しながら説明する。本発明の実施形態に係る情報処理装置1は、図1に示すように、制御部11、記憶部12、入力部13、出力部14を含んで構成される。   Embodiments of the present invention will be described with reference to the drawings. As shown in FIG. 1, the information processing apparatus 1 according to the embodiment of the present invention includes a control unit 11, a storage unit 12, an input unit 13, and an output unit 14.

制御部11は、CPU(Central Processing Unit)等のプログラム制御デバイスを含んで構成される。この制御部11は、処理対象となる一対の文について、一方の文に含まれる単語と、役割情報が共通する少なくとも一つの単語、または役割情報が共通する概念に対応する少なくとも一つの単語が、他方の文に含まれるか否かを解析し、当該解析の結果に基づき、処理対象となる一対の文が、互いに意味が同じである関係(同意関係)、または、一方の処理対象文の意味が、他方の処理対象文の意味を含む関係(含意関係)にあるか否かを判定する処理を実行する。これらの制御部11の処理の内容については、後に述べる。   The control unit 11 includes a program control device such as a CPU (Central Processing Unit). The control unit 11 includes, for a pair of sentences to be processed, at least one word having a common role information and at least one word having a common role information or a word included in one sentence, Analyzes whether or not it is included in the other sentence, and based on the result of the analysis, a pair of sentences to be processed has the same meaning (consent relation) with each other, or the meaning of one sentence to be processed However, the process which determines whether it exists in the relationship (implicit relationship) including the meaning of the other process target sentence is performed. The contents of the processing of these control units 11 will be described later.

記憶部12は、ディスクデバイスやメモリデバイスなどであり、制御部11によって実行されるプログラムを保持する。このプログラムは、コンピュータ可読な記録媒体に格納されて提供され、この記憶部12に複写されたものとしてもよい。また、この記憶部12は制御部11のワークメモリとしても動作する。   The storage unit 12 is a disk device, a memory device, or the like, and holds a program executed by the control unit 11. This program may be provided by being stored in a computer-readable recording medium and copied to the storage unit 12. The storage unit 12 also operates as a work memory for the control unit 11.

さらに本実施の形態では、この記憶部12は、単語の表す概念または単語そのものに対して、関連し得る述語と、当該述語との意味上の関係を表す意味関係情報と、当該単語が述語とともに現れるときに当該単語が文中で持つ役割を表す役割情報とを互いに関連づけて保持する。具体的にこの記憶部12は、図2に例示する単語データベースと、図3に例示する解析データベースとを保持する。具体的に、単語データベースは、単語そのもの(W)と、品詞を表す品詞情報(P)と、当該単語の概念を表す情報である概念情報を少なくとも一つ含む概念情報群(C)とを互いに関連づけて保持したものである。   Further, in the present embodiment, the storage unit 12 includes a predicate that can be related to the concept represented by the word or the word itself, semantic relationship information that represents a semantic relationship with the predicate, and the word together with the predicate. When the word appears, role information representing the role of the word in the sentence is held in association with each other. Specifically, the storage unit 12 holds a word database illustrated in FIG. 2 and an analysis database illustrated in FIG. Specifically, the word database includes a word itself (W), a part of speech information (P) representing a part of speech, and a concept information group (C) including at least one conceptual information which is information representing the concept of the word. It is held in association.

ここで概念情報は、例えば予め定められた類義語辞書(シソーラス)において、当該単語に係る類義語または上位概念語として規定された語とすればよい。一例として「猫」について「ペット」、「動物」などの概念情報が関連づけられる。   Here, the concept information may be a word defined as a synonym or a broader concept word related to the word in a predetermined synonym dictionary (thesaurus), for example. As an example, conceptual information such as “pet” and “animal” is associated with “cat”.

また、解析データベースは、各エントリーを識別する識別子(N:図3(a),(b)では行番号)と、単語または単語に係る概念情報(W/C)と、当該単語または概念情報に関連する単語とともに一つの文中にともに出現し得る述語(P)と、当該単語または概念情報に関連する単語と、当該述語との意味上の関係を表す意味関係情報(M)と、当該単語または概念情報に関連する単語が述語とともに現れるときに当該単語が文中で持つ役割を表す役割情報(R)とを互いに関連づけて保持したものである(図3(a))。   The analysis database includes an identifier (N: line number in FIGS. 3A and 3B) for identifying each entry, concept information (W / C) related to the word or word, and the word or concept information. A predicate (P) that can appear together in a sentence together with a related word, a word related to the word or conceptual information, semantic relationship information (M) representing a semantic relationship with the predicate, the word or When a word related to the concept information appears together with the predicate, role information (R) representing the role of the word in the sentence is held in association with each other (FIG. 3A).

例えば、単語そのものとして「動物」であれば、述語として「飼う」(なお、以下、動詞の単語については、各データベース内では、終止形で保持されているものとする)がともに一文中に現れることがあり、また、「動物」と「飼う」との意味上の関係は「対象」(「動物」は「飼」われる対象)と定められる。この意味上の関係を表す語は、予め複数の語からなる語群(意味関係情報語群)を定めておき、これらの語群のなかから選択するものとしておけばよい。   For example, if the word itself is “animal”, both “preserve” as a predicate (hereinafter, the verb word is assumed to be held in the final form in each database) will appear in one sentence. In addition, the semantic relationship between “animal” and “retain” is defined as “subject” (“animal” is “subject”). Words representing this semantic relationship may be determined in advance by defining a word group (semantic relationship information word group) consisting of a plurality of words and selecting from these word groups.

さらに「飼う」との関係において「動物」の文中での役割は、「ペット」であるとしておく。この役割を表す語(役割語)についても。予め複数の語からなる語群(役割情報語群)を定めておき、これらの語群のなかから選択するものとしておけばよい。また別のエントリーでは、同じ「動物」の概念に属する単語「牛」に対し、述語として「食べる」が関連づけられている場合、「食べる」との関係における「動物」の文中での役割は、「食べ物」であるなどとしておく。   Further, it is assumed that the role of “animal” in the context of “keep” is “pet”. Also about the word representing this role (role word). A word group consisting of a plurality of words (role information word group) may be determined in advance and selected from these word groups. In another entry, if the word “cow” belonging to the same “animal” concept is associated with “eat” as a predicate, the role of “animal” in the relationship with “eat” It is said that it is “food”.

このように、本実施の形態では、一つの単語について、述語ごとにその役割を表す役割語が異なる関係が定められ、当該関係が、解析データベースとして保持されている。   Thus, in the present embodiment, for one word, a relationship in which role words representing the role are different for each predicate is determined, and the relationship is held as an analysis database.

また、ここでは単語そのものとしたが、単語の表す概念である概念情報に対して、述語や、意味関係情報、並びに役割情報が関連づけて記録されていてもよい。また、単語そのもの(W)と述語等を関連づけたエントリと、単語の表す概念情報(C)に述語等を関連づけたエントリとの双方を含めて記録しておいてもよい(図3(b))。   Although the word itself is used here, predicate, semantic relationship information, and role information may be recorded in association with concept information that is a concept represented by the word. Further, both the entry associated with the word itself (W) and the predicate, and the entry associated with the predicate etc. in the conceptual information (C) represented by the word may be recorded (FIG. 3B). ).

なお、この解析データベースはあらかじめ構築しておく必要があるが、十分な単語を網羅した解析データベースのエントリーを人手で構築することはコストがかかるなど困難な場合がある。このコストを低減させるには、例えば、いわゆるブートストラップ手法等を用いて、種となる特定の役割語と述語のペアを元に、大規模コーパスから役割語と類似する実体の単語を収集すればよい。得られた単語の集合を既存の単語概念辞書と照合して概念としてまとめることで、個々の単語を包含する概念情報を得ることができる。さらに、役割語と実体の単語や概念情報を種に、関係を結ぶ頻度の高い述語を求めることもできる。また単語の語釈を記述した文を解析したり、特定の文型パターンなどを利用するなどして、種となる役割語を選抜すれば、さらに処理を効率化できる。ここで特定の文型パターンを利用するとは、例えば、連体節の関係を結ぶ述語の引数として高い頻度で現れる抽象的な一般名詞があれば、当該一般名詞を役割語として選抜することである。なお、得られた結果は人間が精査することで、一定の精度の大規模な関係データを構築することとしてもよい。このようなブートストラップ手法については、Patrick Pantel and Marco Pennacchiotti. 2006. Espresso: Leveraging Generic Patterns for Automatically Harvesting Semantic Relations. In Proceedings of Conference on Computational Linguistics / Association for Computational Linguistics (COLING/ACL-06). pp. 113-120などを参考にすることができる。   Although this analysis database needs to be constructed in advance, it may be difficult to manually construct an analysis database entry that covers a sufficient number of words because of the cost. In order to reduce this cost, for example, by using so-called bootstrap technique etc., collecting actual words similar to role words from a large corpus based on a specific role word and predicate pair as seeds Good. Concept information including individual words can be obtained by collating the set of obtained words with an existing word concept dictionary and collecting them as a concept. Furthermore, it is also possible to obtain a predicate with a high frequency of linking with a role word, an entity word, and conceptual information as seeds. Further, if a role word as a seed is selected by analyzing a sentence describing a word interpretation or using a specific sentence pattern or the like, the processing can be made more efficient. Here, using a specific sentence pattern means, for example, if there is an abstract general noun that appears frequently as an argument of a predicate that connects the relations of the linked clauses, the general noun is selected as a role word. In addition, it is good also as constructing | assembling the large-scale relationship data of a fixed precision by human being examining the obtained result. Patrick Pantel and Marco Pennacchiotti.2006.Espresso: Leveraging Generic Patterns for Automatically Harvesting Semantic Relations.In Proceedings of Conference on Computational Linguistics / Association for Computational Linguistics (COLING / ACL-06). You can refer to 113-120.

また、これら単語データベースや解析データベースは、ここでの説明では記憶部12に保持しておくこととするが、ネットワーク等の通信手段を介して情報処理装置1からアクセス可能なサーバ等、別体の装置に保持されていても構わない。この場合情報処理装置1は、必要に応じて当該サーバ等に格納されたデータベースを検索し、その検索結果を受け取る。   In addition, these word databases and analysis databases are stored in the storage unit 12 in the description here. However, a separate server such as a server that can be accessed from the information processing apparatus 1 via communication means such as a network. It may be held in the apparatus. In this case, the information processing apparatus 1 searches a database stored in the server or the like as necessary, and receives the search result.

入力部13は、キーボードやマウス等の入力デバイス、及び、ネットワークインタフェース等の文書情報を入力可能なデバイスを含む。出力部14は、ディスプレイ等であり、制御部11から入力される指示に従って情報を出力する。   The input unit 13 includes input devices such as a keyboard and a mouse, and devices capable of inputting document information such as a network interface. The output unit 14 is a display or the like, and outputs information according to an instruction input from the control unit 11.

次に、制御部11による処理の内容について述べる。本実施の形態の制御部11は、機能的には、図4に例示するように、処理対象文入力部21と、解析部22と、役割語関係判定部23と、文関係判定部24とを含んで構成される。また、以下の説明では、一対の文の間に、言い換え関係(互いに同じ意味となる同意関係)や、一方の文の意味が他方の文の意味を包含する包含関係があるか否かを判断するものとする。   Next, the contents of processing by the control unit 11 will be described. As illustrated in FIG. 4, the control unit 11 of the present embodiment functionally includes a processing target sentence input unit 21, an analysis unit 22, a role word relationship determination unit 23, and a sentence relationship determination unit 24. It is comprised including. Also, in the following explanation, it is determined whether there is a paraphrase relationship (consent relationship with the same meaning) or a inclusion relationship in which the meaning of one sentence includes the meaning of the other sentence between a pair of sentences. It shall be.

ここで処理対象文入力部21は、関係を判定する処理の対象となる、複数の処理対象文を受け入れる。以下の例では一対の文Aと文Bとが入力されたものとするが、3つ以上の文が入力された場合は、総当たりで2文の組み合わせを抽出し、組み合わせごとに、抽出した2文についての関係を以下に説明する処理により判定することとしてもよいし、いずれか一文をキーとして、このキーと、他の各文との組み合わせごとに、それらの関係を、以下に説明する処理により判定することとしてもよい。なお、以下の例では、文Aが「飼っていた亀が死んだ。」であり、文Bが「ペットが亡くなった。」であるものとする。   Here, the processing target sentence input unit 21 accepts a plurality of processing target sentences that are targets of processing for determining the relationship. In the following example, it is assumed that a pair of sentence A and sentence B are input. However, when three or more sentences are input, a combination of two sentences is extracted in total, and extracted for each combination. The relationship between the two sentences may be determined by the process described below, or any one sentence as a key, and the relationship between this key and each other sentence will be described below. It may be determined by processing. In the following example, it is assumed that sentence A is “A turtle that was kept dead” and sentence B is “A pet has died.”

解析部22は、処理対象文入力部21が受け入れた各文に対し、予め定められた解析処理を実行する。ここでは解析部22は、文中の単語を抽出し、単語間の関係を表す情報を生成する。具体的に、この解析部22は入力された文ごとに次の処理を行う。   The analysis unit 22 executes a predetermined analysis process for each sentence received by the processing target sentence input unit 21. Here, the analysis part 22 extracts the word in a sentence, and produces | generates the information showing the relationship between words. Specifically, the analysis unit 22 performs the following process for each input sentence.

すなわち解析部22は、広く知られた構文意味解析処理を行い、処理の対象とする文(注目文と呼ぶ)を単語に分割する。また記憶部12に格納されている単語データベースを参照し、各単語間の係り受けや意味的関係の解析処理を行う。この処理は例えば、梅基宏,杉原大悟,大熊智子,増市博,「LFG解析と語彙資源を利用した日本語含意関係判定」,情報処理学会研究報告 2008-NL-188,pp. 57-64,2008等に開示された処理を用いることができる。   That is, the analysis unit 22 performs a widely-known syntactic and semantic analysis process, and divides a sentence to be processed (referred to as an attention sentence) into words. In addition, referring to the word database stored in the storage unit 12, the dependency between each word and the analysis process of the semantic relationship are performed. This process is, for example, Hiroshi Umemoto, Daigo Sugihara, Tomoko Okuma, Hiroshi Masuichi, “Japanese Language Implication Relationship Determination Using LFG Analysis and Vocabulary Resources”, Information Processing Society of Japan 2008-NL-188, pp. 57-64 , 2008, etc., can be used.

この構文意味解析処理を、文A,Bのそれぞれに適用した結果の例を図5に示す。図5では、各単語を、表記、品詞、概念情報(単語データベース内のエントリー)を示した矩形で表し、単語間の関係を矢印で、矢印に付したラベルによりその意味的関係を表すものとする。   FIG. 5 shows an example of the result of applying this syntax and semantic analysis processing to each of the sentences A and B. In FIG. 5, each word is represented by a rectangle indicating notation, part of speech, and conceptual information (entry in the word database), the relationship between words is represented by an arrow, and the semantic relationship is represented by a label attached to the arrow. To do.

文Aについては、「飼う」、「亀」、「死ぬ」(動詞については既に述べたようにその終止形で表す)が単語として抽出される。そして「飼う」、「死ぬ」といった述語に対し、「亀」は、それぞれ「対象」(飼われる対象)、「主体」(死ぬに対する主格)という関係にあることが解析により得られる。図中の矢印は、述語に対して関係する単語を「引数」とし、引数となる単語に根を置き、関係する述語に対して矢印を引き出したものとなっている。   For sentence A, “Kai”, “Turtle”, and “Die” (the verb is expressed in its final form as described above) are extracted as words. Then, it is obtained by analysis that “turtle” has a relationship of “subject” (subject object) and “subject” (major for dying) to predicates such as “keep” and “die”. The arrows in the figure are words that are related to the predicate as “arguments”, rooted in the word that is the argument, and drawn with respect to the related predicates.

ここで文Aには「飼っていた亀」のような、述語が引数に係っている連体節が含まれる。この解析部22は、この連体節を、対応する平叙文である「亀を飼っていた」とみなして単語間の関係を抽出することとしている。すなわち、「亀」は「飼う」に係り、対象の意味的関係をもつと解析される。平叙文では助詞の「を」が存在することで、引数の「亀」が目的語であり対象の関係を持つと解析できるが、同じ内容を表す連体節にはそのような助詞が存在しない。そこで、「飼う」の動詞の格フレーム情報(動詞に関する格フレーム情報は、記憶部12に保持しておけばよい)と「亀」の単語の概念情報を利用して、両者が主体ではなく対象の関係にあると解析する。ここで格フレーム情報は、動詞ごとに、予め定められた表層格のそれぞれについてどのような単語あるいは単語に係る概念情報が係り合うかを関連づけたものである。具体的に、日本語の場合、表層格として「ガ格」、「ヲ格」、「ニ格」…などが定められ、動詞「飼う」に対しては、「ガ格」に「人」、「私」、「家」などの単語(人が飼う、私が飼う…というように表現され得る単語)や、これらの単語に関連する、「人間」といった概念情報が関連づけられる。また、「ヲ格」には、「チワワ」、「犬」、「猫」、「亀」などの単語(チワワを飼う…というように表現され得る単語)や、これらの単語に関連する、「動物」といった概念情報が関連づけられる。   Here, the sentence A includes a combined clause in which the predicate is related to the argument, such as “Kame to be kept”. The analysis unit 22 regards the union clause as a corresponding plain text “I had a turtle” and extracts the relationship between words. That is, “turtle” is related to “bring” and is analyzed to have a semantic relationship of the object. In the plain text, the particle “wa” is present, so that the argument “turtle” is an object and has a target relationship, but there is no such particle in the joint clause representing the same content. Therefore, the case frame information of the “Kai” verb (case frame information related to the verb may be stored in the storage unit 12) and the concept information of the word “turtle” are used instead of the subject. Analyzes that the relationship is Here, the case frame information relates, for each verb, what kind of word or conceptual information related to the word is related to each of the predetermined surface cases. Specifically, in the case of Japanese, “ga”, “wo”, “ni”, etc. are defined as the surface case, and for the verb “Kai”, “people” Words such as “I” and “house” (words that can be expressed as being kept by a person, kept by me, etc.) and conceptual information such as “human” related to these words are associated. In addition, “wo case” includes words such as “Chihuahua”, “Dog”, “Cat”, “Turtle”, etc. (words that can be expressed as keeping a Chihuahua ...), and “ Concept information such as “animal” is associated.

本実施の形態の解析部22は、「飼う」に対して「亀」という単語、あるいは「亀」という単語に関連する概念情報(単語データベースにおいて関連づけられた情報でよい)が関連づけられている「格」を格フレーム情報から検索し、検索により見出された「格」の情報を用いて、意味関係情報を得る。本実施の形態では、意味関係情報は、深層格を表す情報としておいてもよい。具体的にこの「亀」と「飼う」の例では表層格として日本語の「ヲ格」において現れるので、この表層格の情報や、その他の情報(受身形である等の情報)を用いて、深層格「対象」を定めることとしてもよい。   The analysis unit 22 of the present embodiment associates the word “turtle” or conceptual information related to the word “turtle” (may be information associated in the word database) with “Kai”. The “case” is searched from the case frame information, and the semantic relationship information is obtained using the information of “case” found by the search. In the present embodiment, the semantic relationship information may be information representing a deep case. Specifically, in this example of “turtle” and “bring”, it appears in the Japanese “wo case” as the surface case, so the information of this surface case and other information (information such as passive type) are used. The deep case “object” may be determined.

また、記憶部12には、この解析の結果として、引数と述語との組と、意味関係情報とが関連づけて記録される。具体的に上記文A,Bに対しては、
文Aについて:
(1)引数:「亀」、述語:「飼う」、意味関係情報:「対象」
(2)引数:「亀」、述語:「死ぬ」、意味関係情報:「主体」
文Bについて:
(1)引数:「ペット」、述語:「亡くなる」、意味関係情報:「主体」
といった情報が記録される。以下、この引数と述語との組との関係で列挙された各データ(上記(1)、(2)…)をそれぞれ、「解析結果」と呼ぶ。
In addition, as a result of this analysis, a pair of an argument and a predicate and semantic relationship information are recorded in the storage unit 12 in association with each other. Specifically, for the above sentences A and B,
About sentence A:
(1) Argument: “turtle”, predicate: “keep”, semantic relation information: “target”
(2) Argument: “Turtle”, predicate: “Die”, semantic relation information: “Subject”
About sentence B:
(1) Argument: “pet”, predicate: “died”, semantic information: “subject”
Such information is recorded. Hereinafter, each data (the above (1), (2)...) Enumerated by the relationship between the argument and the predicate pair is referred to as “analysis result”.

役割語関係判定部23は、文Aに含まれる役割語と、文Bに含まれる役割語との同意関係や含意関係を、解析部22での解析の結果と、解析データベースに格納されたデータとに基づいて判定する。   The role word relationship determination unit 23 analyzes the consent relationship and implication relationship between the role word included in the sentence A and the role word included in the sentence B, the result of analysis in the analysis unit 22, and data stored in the analysis database. Based on the above.

具体的に、この役割語関係判定部23は次の処理を実行する。すなわち役割語関係判定部23は、図6に例示するように、処理対象となっている文の一方(ここでは例えば文Bとする)について、当該文に含まれる単語のうち、役割情報語群に含まれる単語の集合RRを求める(S1)。   Specifically, the role word relationship determination unit 23 executes the following process. That is, as illustrated in FIG. 6, the role word relationship determination unit 23, for one of the sentences to be processed (here, sentence B, for example), among the words included in the sentence, the role information word group A set RR of words included in is obtained (S1).

役割語関係判定部23は、この集合の各要素R(いずれも役割語となる)について、次の処理を繰り返して行う(S2:LOOP)。まず役割語関係判定部23は、処理の対象となった要素Rに対応する語が概念情報として関連づけられている単語と、当該要素Rに対応する単語に関連づけられた概念情報とを、単語データベースから検索する(S3)。   The role word relationship determination unit 23 repeats the following processing for each element R (all become role words) of this set (S2: LOOP). First, the role word relationship determination unit 23 stores a word in which a word corresponding to the element R to be processed is associated as concept information and concept information associated with a word corresponding to the element R, in a word database. (S3).

役割語関係判定部23は、この処理S3における検索で見出した単語(複数ある場合はそのいずれか)、または処理S3で見出した概念情報に対応する単語が、処理対象となっている他方の文(処理S1を文Bについて行う場合、文Aとなる)文Aに含まれるか否かを判断する(S4)。この処理S4において、処理S3における検索で見出した単語または処理S3で見出した概念情報に対応する単語が、文Aに含まれる場合(処理S4でYesの場合)、役割語関係判定部23は、解析部22での文Aの解析結果を参照し、処理S3における検索で見出した単語を引数Eとする述語Pと、それらの間の意味関係情報とを取り出す(S5)。   The role word relationship determination unit 23 processes the other sentence in which the word found in the search in the process S3 (if any) or the word corresponding to the conceptual information found in the process S3 is the processing target. It is determined whether or not the sentence A is included in the sentence A (when the process S1 is performed on the sentence B, it becomes the sentence A) (S4). In the process S4, when the word found in the search in the process S3 or the word corresponding to the concept information found in the process S3 is included in the sentence A (Yes in the process S4), the role word relationship determination unit 23 By referring to the analysis result of the sentence A in the analysis unit 22, the predicate P having the argument E as the word found in the search in the process S3 and the semantic relationship information between them are extracted (S5).

そして役割語関係判定部23は、解析データベースを参照し、処理S3で見出した引数Eとしての単語と、処理S5で取り出した述語P及び意味関係情報とが互いに関連づけられたエントリであって、当該エントリに含まれる役割語が、要素Rに一致するものを検索する(S6)。なお、解析データベースにおいて単語の概念情報が述語に関連づけられている場合は、処理S3で見出した単語そのものではなく、当該単語の概念情報を単語データベースから取り出し、当該取り出した概念情報、処理S5で取り出した述語、及び意味関係情報、並びに役割語として要素Rと同じ単語が互いに関連づけられたエントリを検索することとすればよい。また、解析データベースにおいて単語そのものが述語に関連づけられている場合は、処理S3で見出した単語そのもの、処理S5で取り出した述語、及び意味関係情報、並びに役割語として要素Rと同じ単語が互いに関連づけられたエントリを検索することとすればよい。さらに、解析データベースにおいて単語そのものと単語の概念情報とがそれぞれ、述語に関連づけられている場合は、処理S3で見出した単語そのもの、または、単語データベースから取り出した当該単語の概念情報と、処理S5で取り出した述語、及び意味関係情報、並びに役割語として要素Rと同じ単語が互いに関連づけられたエントリを検索することとすればよい。   The role word relationship determination unit 23 refers to the analysis database, and is an entry in which the word as the argument E found in the process S3 is associated with the predicate P and the semantic relationship information extracted in the process S5. A search is performed for a role word included in the entry that matches the element R (S6). If the word concept information is associated with the predicate in the analysis database, the word concept information is extracted from the word database instead of the word found in process S3, and the extracted concept information is extracted in process S5. It is only necessary to search for entries in which the same words as the element R are associated with each other as predicates, semantic relation information, and role words. Further, when the word itself is associated with the predicate in the analysis database, the word itself found in the process S3, the predicate extracted in the process S5, the semantic relation information, and the same word as the element R as the role word are associated with each other. It is sufficient to search for the entry. Furthermore, when the word itself and the word concept information are associated with the predicate in the analysis database, the word itself found in the process S3 or the concept information of the word extracted from the word database and the process S5 What is necessary is just to search for the entry in which the same word as the element R is associated with each other as the extracted predicate, the semantic relationship information, and the role word.

役割語関係判定部23は、処理S6における検索によりエントリが見出されたならば、処理S3で見出した文A中の引数Eとしての単語と、処理S5で取り出した述語Pとの組(E,P)を表す情報を、対応する要素Rに関連づけて記憶部12に格納する(S7)。なお、役割語関係判定部23は、処理S3から処理S7までを要素Rごとに行うので、組(E,P)は複数得られる場合があるが、この場合は、複数の組(E,P)をそれぞれに対応する要素Rに関連づけて、集合EEとして記憶部12に格納しておく。ここで記憶部12に格納された組(E,P)は、対応する要素Rの言い換え(つまり同意)あるいは含意の関係にあるということになる。   If an entry is found by the search in process S6, the role word relationship determination unit 23 sets a combination of the word as the argument E in the sentence A found in process S3 and the predicate P extracted in process S5 (E , P) is stored in the storage unit 12 in association with the corresponding element R (S7). Since the role word relationship determination unit 23 performs the process S3 to the process S7 for each element R, a plurality of pairs (E, P) may be obtained. In this case, a plurality of pairs (E, P) are obtained. ) Are associated with the corresponding elements R and stored in the storage unit 12 as a set EE. Here, the pair (E, P) stored in the storage unit 12 is in a paraphrase (that is, agreement) or implication relationship of the corresponding element R.

なお、処理S4において、処理S3における検索で見出した単語または処理S3で見出した概念情報に対応する単語が、文Aに含まれなかったならば(処理S4でNoならば)、要素Rと同意あるいは含意の関係にある単語と述語との組はなかったと判断する。   In step S4, if the word found in the search in step S3 or the word corresponding to the conceptual information found in step S3 is not included in sentence A (if No in step S4), agree with element R. Alternatively, it is determined that there is no pair of a word and a predicate having an implication relationship.

役割語関係判定部23は、さらに、対象となる文A,Bを入れ替えて、上記処理S1ないしS7の処理を繰り返して行う。つまり役割語関係判定部23は、処理対象となっている文の一方(先の処理S1にて例えば文Bとしたならばここでは文A)について、当該文に含まれる単語のうち、役割情報語群に含まれる単語の集合RR′を求める(S1′)。なお、この処理は図6に示した処理と同様のものであるので、図示は省略する。   The role word relationship determination unit 23 further performs the processes of the above-described processes S1 to S7 by exchanging the target sentences A and B. In other words, the role word relationship determination unit 23, for one of the sentences to be processed (for example, sentence A if the sentence B is the previous process S1), the role information among the words included in the sentence. A set RR ′ of words included in the word group is obtained (S1 ′). Since this process is the same as the process shown in FIG.

役割語関係判定部23は、この集合の各要素R′(いずれも役割語となる)について、次の処理を繰り返して行う(S2′:LOOP)。まず役割語関係判定部23は、処理の対象となった要素Rに対応する語が概念情報として関連づけられている単語と、当該要素R′に対応する単語に関連づけられた概念情報とを、単語データベースから検索する(S3′)。   The role word relationship determination unit 23 repeats the following processing for each element R ′ (all become role words) of this set (S2 ′: LOOP). First, the role word relationship determination unit 23 determines a word associated with the word corresponding to the element R to be processed as concept information and the concept information associated with the word corresponding to the element R ′ as a word. Search from the database (S3 ').

役割語関係判定部23は、この処理S3′における検索で見出した単語(複数ある場合はそのいずれか)、または処理S3′で見出した概念情報に対応する単語が、他方の文である文Bに含まれるか否かを判断する(S4′)。この処理S4′において、処理S3′における検索で見出した単語または処理S3′で見出した概念情報に対応する単語が、文Bに含まれる場合(処理S4′でYesの場合)、役割語関係判定部23は、解析部22での文Bの解析結果を参照し、処理S3′における検索で見出した単語を引数E′とする述語P′と、それらの間の意味関係情報とを取り出す(S5′)。   The role word relationship determination unit 23 uses the sentence B in which the word found in the search in the process S3 ′ (or any of them) or the word corresponding to the conceptual information found in the process S3 ′ is the other sentence. (S4 ′). In this process S4 ′, if the word found in the search in process S3 ′ or the word corresponding to the conceptual information found in process S3 ′ is included in sentence B (Yes in process S4 ′), role word relationship determination The unit 23 refers to the analysis result of the sentence B in the analysis unit 22 and extracts the predicate P ′ having the word found by the search in the process S3 ′ as an argument E ′ and the semantic relationship information between them (S5). ′).

そして役割語関係判定部23は、解析データベースを参照し、処理S3′で見出した引数E′としての単語と、処理S5′で取り出した述語P′及び意味関係情報とが互いに関連づけられたエントリであって、当該エントリに含まれる役割語が、要素Rに一致するものを検索する(S6′)。なお、解析データベースにおいて単語の概念情報が述語に関連づけられている場合は、処理S3′で見出した単語そのものではなく、当該単語の概念情報を単語データベースから取り出し、当該取り出した概念情報、処理S5′で取り出した述語、及び意味関係情報、並びに役割語として要素Rと同じ単語が互いに関連づけられたエントリを検索することとすればよい。また、解析データベースにおいて単語そのものが述語に関連づけられている場合は、処理S3′で見出した単語そのもの、処理S5′で取り出した述語、及び意味関係情報、並びに役割語として要素Rと同じ単語が互いに関連づけられたエントリを検索することとすればよい。さらに、解析データベースにおいて単語そのものと単語の概念情報とがそれぞれ、述語に関連づけられている場合は、処理S3′で見出した単語そのもの、または、単語データベースから取り出した当該単語の概念情報と、処理S5′で取り出した述語、及び意味関係情報、並びに役割語として要素Rと同じ単語が互いに関連づけられたエントリを検索することとすればよい。   Then, the role word relationship determining unit 23 refers to the analysis database, and is an entry in which the word as the argument E ′ found in the process S3 ′, the predicate P ′ extracted in the process S5 ′, and the semantic relationship information are associated with each other. Therefore, a search is made for a role word included in the entry that matches the element R (S6 ′). If the word concept information is associated with the predicate in the analysis database, the word concept information is extracted from the word database instead of the word found in step S3 ′, and the extracted concept information, step S5 ′. It is only necessary to search for the entry in which the same word as the element R is associated with each other as the predicate and the semantic relationship information extracted in step 1 and the role word. Further, when the word itself is associated with the predicate in the analysis database, the word itself found in the process S3 ′, the predicate extracted in the process S5 ′, the semantic relation information, and the same word as the element R as the role word are mutually connected. What is necessary is just to search the associated entry. Further, when the word itself and the word concept information are associated with the predicate in the analysis database, the word itself found in the process S3 ′, or the concept information of the word extracted from the word database, and the process S5 What is necessary is just to search the entry in which the same word as the element R is linked | related as a predicate extracted by ', semantic relation information, and a role word.

役割語関係判定部23は、処理S6′における検索によりエントリが見出されたならば、処理S3′で見出した文B中の引数E′としての単語と、処理S5′で取り出した述語P′との組(E′,P′)を表す情報を、対応する要素R′に関連づけて記憶部12に格納する(S7′)。なお、役割語関係判定部23は、処理S3′から処理S7′までを要素R′ごとに行うので、組(E′,P′)は複数得られる場合があるが、この場合は、複数の組(E′,P′)を、それぞれに対応する要素R′に関連づけて、集合EE′として記憶部12に格納しておく。ここで記憶部12に格納された組(E′,P′)は、対応する要素R′の言い換え(つまり同意)あるいは含意の関係にあるということになる。   If an entry is found by the search in process S6 ′, the role word relationship determination unit 23 determines the word as the argument E ′ in the sentence B found in process S3 ′ and the predicate P ′ extracted in process S5 ′. The information representing the pair (E ′, P ′) is stored in the storage unit 12 in association with the corresponding element R ′ (S7 ′). Since the role word relationship determination unit 23 performs the process S3 ′ to the process S7 ′ for each element R ′, a plurality of sets (E ′, P ′) may be obtained. The set (E ′, P ′) is stored in the storage unit 12 as a set EE ′ in association with the corresponding element R ′. Here, the pair (E ′, P ′) stored in the storage unit 12 is in a paraphrase (that is, agreement) or implication relationship of the corresponding element R ′.

なお、処理S4′において、処理S3′における検索で見出した単語または処理S3′で見出した概念情報に対応する単語が、文Bに含まれなかったならば(処理S4′でNoならば)、要素R′と同意あるいは含意の関係にある単語と述語との組はなかったと判断する。   In process S4 ′, if the word found in the search in process S3 ′ or the word corresponding to the conceptual information found in process S3 ′ is not included in sentence B (if No in process S4 ′), It is determined that there is no combination of a word and a predicate that is in agreement or implication with the element R ′.

以上の処理を具体例に則して説明すると、次のようになる。すなわち、役割語関係判定部23は文B:「ペットが亡くなった。」に含まれる単語のうち、役割情報語群に含まれる単語の集合RRを求める。ここでは文Bから「ペット」、「が」、「亡くなる」の単語が抽出されており、役割情報語群には単語「ペット」が含まれるものとすると、集合RRには、要素Rとして、この単語「ペット」が含まれることとなる。   The above processing will be described in accordance with a specific example as follows. That is, the role word relationship determination unit 23 obtains a set RR of words included in the role information word group among the words included in the sentence B: “Pet died.” Here, if the words “pet”, “ga”, and “died” are extracted from the sentence B, and the word “pet” is included in the role information word group, the set RR includes an element R, This word “pet” is included.

役割語関係判定部23は、この集合の各要素Rについて、次の処理を繰り返して行う。ここでは要素Rは一つだけであるので、次の処理を一度だけ実行することになる。まず役割語関係判定部23は、要素Rである「ペット」が概念情報として関連づけられている単語を、単語データベースから検索する。ここではかかる単語として「チワワ」、「犬」、「動物」…が見出される。また、当該要素Rである「ペット」なる単語の概念情報を単語データベースから取得する。ここでは概念情報として「動物」が見出されたとする。   The role word relationship determination unit 23 repeats the following process for each element R in the set. Here, since there is only one element R, the next process is executed only once. First, the role word relationship determination unit 23 searches the word database for a word associated with the element R “pet” as concept information. Here, “chihuahua”, “dog”, “animal”, etc. are found as such words. Further, the concept information of the word “pet” as the element R is acquired from the word database. Here, it is assumed that “animal” is found as conceptual information.

役割語関係判定部23は、これら見出された単語(「チワワ」、「犬」、「動物」…)、または要素Rに対応する単語の概念情報「動物」に対応する単語のそれぞれについて、文Aに含まれているか否かを調べる。この処理は、判定が「真」(含まれている)となるか、見出された単語のすべてについて判定を完了するまで行う。   The role word relationship determination unit 23 determines the word corresponding to the found word (“Chihuahua”, “Dog”, “Animal”...) Or the conceptual information “Animal” of the word corresponding to the element R. It is checked whether or not it is included in sentence A. This process is performed until the determination becomes “true” (included) or until the determination is completed for all the found words.

ここでは、概念情報「動物」に対応する単語「亀」が文A:「飼っていた亀が死んだ。」に含まれるので、役割語関係判定部23はこの単語「亀」を引数Eとして、この引数Eに対応する述語Pと意味関係情報とを解析部22の解析結果を参照して取り出す。ここでは、引数E:「亀」、述語P:「飼う」、意味関係情報M:「対象」と、引数E:「亀」、述語P:「死ぬ」、意味関係情報M:「主体」とが得られる。   Here, since the word “turtle” corresponding to the concept information “animal” is included in the sentence A: “the turtle that had been kept dead”, the role word relationship determination unit 23 uses the word “turtle” as an argument E. The predicate P and semantic relationship information corresponding to the argument E are extracted with reference to the analysis result of the analysis unit 22. Here, argument E: “turtle”, predicate P: “keep”, semantic relationship information M: “object”, argument E: “turtle”, predicate P: “die”, semantic relationship information M: “subject” Is obtained.

そして役割語関係判定部23は、解析データベースを参照し、引数Eとしての単語「亀」またはその概念情報である「動物」と、述語P「飼う」及び意味関係情報M「対象」、並びに要素Rである「ペット」が役割語として互いに関連づけられたエントリを検索する。ここでは解析データベースに、概念情報である「動物」、述語「飼う」、意味関係情報「対象」、役割語「ペット」が互いに関連づけられたエントリがあるので、役割語関係判定部23は、文A中の引数Eとしての単語「亀」と、対応する述語P「飼う」との組(E:「亀」,P:「飼う」)を表す情報を、対応する要素R:「ペット」に関連づけて、記憶部12に格納する。この文A中の組が、対応する文Bから取り出された要素R:「ペット」と同意、または含意の関係にあるものと判断される。   Then, the role word relationship determination unit 23 refers to the analysis database, the word “turtle” as the argument E or “animal” as its concept information, the predicate P “Kai”, the semantic relationship information M “object”, and the elements An entry in which “pets” as R are associated with each other as role words is searched. Here, since there is an entry in the analysis database in which the concept information “animal”, predicate “keep”, semantic relationship information “target”, and role word “pet” are associated with each other, the role word relationship determination unit 23 Information representing a pair (E: “turtle”, P: “keep”) of the word “turtle” as the argument E in A and the corresponding predicate P “Kame” is set in the corresponding element R: “pet”. The data are stored in the storage unit 12 in association with each other. It is determined that the group in the sentence A is in agreement or an implication relationship with the element R: “pet” extracted from the corresponding sentence B.

また役割語関係判定部23は、文A,Bを入れ替えて同様の処理を行うが、文Aにおいては、当該文に含まれる単語のうち、役割情報語群に含まれる単語がないので、集合RRが空となり、要素Rごとの処理は行われず、従って、単語と述語の組は取り出されない。   The role word relationship determination unit 23 performs the same processing by exchanging the sentences A and B. However, in the sentence A, there is no word included in the role information word group among the words included in the sentence. RR becomes empty, and processing for each element R is not performed. Therefore, a combination of a word and a predicate is not extracted.

文関係判定部24は、解析部22及び役割語関係判定部23の処理により得られた結果に基づき、処理対象文入力部21で受け入れた文が同意(同じ意味、すなわち言い換え)関係にあるか、または含意の関係にあるかの判断を行う。   Based on the results obtained by the processing of the analysis unit 22 and the role word relationship determination unit 23, the sentence relationship determination unit 24 determines whether the sentences received by the processing target sentence input unit 21 have an agreement (same meaning, that is, paraphrase) relationship. Or whether there is an implication relationship.

具体的に、文関係判定部24は、処理対象となる一対の文(ここでは文A,文B)の解析結果のうち、役割語関係判定部23により、役割語の観点で同意、または含意の関係にあると判断された箇所を除いた部分を特定する。   Specifically, the sentence relationship determination unit 24 agrees or implications from the viewpoint of role words by the role word relationship determination unit 23 among the analysis results of the pair of sentences to be processed (here, sentence A and sentence B). The part except the part judged to be in the relationship is identified.

ここで用いている文A,Bの例では、
文Aについて:
(1)引数:「亀」、述語:「飼う」、意味関係情報:「対象」
(2)引数:「亀」、述語:「死ぬ」、意味関係情報:「主体」
文Bについて:
(1)引数:「ペット」、述語:「亡くなる」、意味関係情報:「主体」
が解析結果として記録されており、役割語関係判定部23により、(「亀」,「飼う」)と「ペット」とが役割語の観点から同意または含意の関係にあるとされている。そこで、文Aについての解析結果のうち、(1)引数:「亀」、述語:「飼う」、意味関係情報:「対象」の情報は、「ペット」と同意または含意の関係にあると判断されているとし、文Aについての解析結果のうち(2)と、文Bの解析結果の(1)とについて同意、または含意の関係にあるか否かを判断する。この判断は、例えば小谷 通隆, 柴田 知秀, 黒橋 禎夫、「言い換え表現の述語項構造への正規化とテキスト含意関係認識での利用」, 言語処理学会 第15回年次大会, pp.260-263 (2009)に示された方法で行うことができるので、詳しい説明を省略する。
In the example of sentences A and B used here,
About sentence A:
(1) Argument: “turtle”, predicate: “keep”, semantic relation information: “target”
(2) Argument: “Turtle”, predicate: “Die”, semantic relation information: “Subject”
About sentence B:
(1) Argument: “pet”, predicate: “died”, semantic information: “subject”
Is recorded as an analysis result, and the role word relationship determination unit 23 determines that ("turtle", "keep") and "pet" have an agreement or implication relationship from the viewpoint of role words. Therefore, among the analysis results of sentence A, (1) the argument: “turtle”, predicate: “keep”, semantic relationship information: “target” information is determined to have an agreement or implication relationship with “pet”. It is determined whether or not (2) of the analysis results for sentence A and (1) of the analysis result of sentence B are in agreement or implication. For example, Michitaka Kotani, Tomohide Shibata, Ikuo Kurohashi, “Normalization of paraphrased expressions to predicate term structure and use in recognition of textual implications”, Language Processing Society 15th Annual Conference, pp.260 Detailed explanation is omitted because it can be done by the method shown in -263 (2009).

文関係判定部24は、この判断と、役割語関係判定部23での判定とにより、処理対象の一方の文についての解析結果のうち、他方の文に現れる語や解析結果に同意あるいは含意の関係にあるものを特定する。ここでの例では、既に述べたように、役割語関係判定部23により、文Aの解析結果のうち(1)引数:「亀」、述語:「飼う」、意味関係情報:「対象」の情報は、「ペット」と同意または含意の関係にあると判断されているとし、文Aについての解析結果のうち(2)と、文Bの解析結果の(1)とが上記述語項構造への正規化などの方法で同意または含意の関係にあると判断されるので、文Aの解析結果のすべてが文Bに含まれる単語や解析結果のいずれかと同意または含意の関係にあると判断され、また逆に文Bの解析結果のすべてが文Aに含まれる単語や解析結果のいずれかと同意または含意の関係にあると判断される。そこで、文関係判定部24は、文Aと文Bとは同意または含意の関係にあると判断し、当該判断の結果を表す情報を出力する。   Based on this determination and the determination by the role word relationship determination unit 23, the sentence relationship determination unit 24 agrees with or implies the word or analysis result that appears in the other sentence among the analysis results of one sentence to be processed. Identify things that are related. In this example, as described above, the role word relationship determination unit 23 performs (1) argument: “turtle”, predicate: “keep”, semantic relationship information: “target” among the analysis results of the sentence A. Assume that the information is determined to have an agreement or implication relationship with “pet”, and (2) of the analysis results of sentence A and (1) of the analysis result of sentence B are in the upper descriptive term structure. Therefore, it is determined that all the analysis results of sentence A have an agreement or implication relationship with any of the words and analysis results included in sentence B. Conversely, it is determined that all of the analysis results of sentence B are in agreement or implications with either the words included in sentence A or the analysis results. Therefore, the sentence relationship determination unit 24 determines that the sentence A and the sentence B have an agreement or implication relationship, and outputs information representing the result of the determination.

なお、ここで示した例では、文Aの解析結果のすべてが文Bに含まれる単語や解析結果のいずれかと同意または含意の関係にあり、かつ、文Bの解析結果のすべてが文Aに含まれる単語や解析結果のいずれかと同意または含意の関係にと判断したことにより、文A,Bが互いに同意または含意の関係にあると判断することとしたが、本実施の形態はこれに限らず、例えば、文Aの解析結果のうち、文Bに含まれる単語や解析結果のいずれかと同意または含意の関係にあるものの個数ないし割合(全解析結果の数に対する個数)、かつ、文Bの解析結果のうち、文Aに含まれる単語や解析結果のいずれかと同意または含意の関係にあるものの個数ないし割合と、予め定めたしきい値との比較により、例えば同意または含意の関係にある解析結果の割合(文Aの解析結果、文Bの解析結果のいずれについても)が予め定めたしきい値を超える場合に、文A,Bが互いに同意または含意の関係にあると判断することとしてもよい。この際、当該割合や個数に基づいて、同意または含意関係にあると判断できる確からしさ(確信度)を得点として求めてもよい。一例としては、文関係判定部24が、文Aの解析結果のうち、文Bに含まれる単語や解析結果のいずれかと同意または含意の関係にあるものの割合と、文Bの解析結果のうち、文Aに含まれる単語や解析結果のいずれかと同意または含意の関係にあるものの割合とを乗じた値を得点として生成し、文A,Bが互いに同意または含意の関係にあるか否かを表す情報とともに出力してもよい。   In the example shown here, all of the analysis results of the sentence A are in agreement or implication with any of the words or analysis results included in the sentence B, and all of the analysis results of the sentence B are in the sentence A. Although it has been determined that sentences A and B have an agreement or implication relationship with each other by determining that they have an agreement or implication relationship with any of the included words or analysis results, this embodiment is not limited to this. First, for example, among the analysis results of sentence A, the number or ratio (number of all analysis results) of words B that are in agreement or implications with any of the words or analysis results included in sentence B, and Among the analysis results, by comparing the number or ratio of the words included in the sentence A or the analysis result with the agreement or implication relationship with a predetermined threshold value, for example, the analysis with the agreement or implication relationship result When the ratio (both of the analysis result of sentence A and the analysis result of sentence B) exceeds a predetermined threshold value, it may be determined that sentences A and B are mutually in agreement or implication. . At this time, the probability (certainty factor) that can be determined to be an agreement or an implication relationship may be obtained as a score based on the ratio or the number. As an example, the sentence relation determination unit 24 determines the ratio of the analysis result of the sentence A that is in agreement or implication with any of the words included in the sentence B or the analysis result, and the analysis result of the sentence B, A value obtained by multiplying either the word included in the sentence A or the analysis result and the ratio of those having an agreement or implication is generated as a score, and indicates whether the sentences A and B have an agreement or implication to each other You may output with information.

このように、本実施の形態の情報処理装置1では、文A:「飼っていた亀が死んだ。」、文B:「ペットが亡くなった。」が入力され、両者が同意(つまり言い換え)または含意の関係にあるか否かを判断するよう指示されると、   As described above, in the information processing apparatus 1 according to the present embodiment, the sentence A: “The turtle that was kept dead” and the sentence B: “The pet has died” are input, and both agree (that is, paraphrase). Or when instructed to determine if it is an implication,

文Aについて、「飼う」、「亀」、「死ぬ」の単語に分割し、「飼う」、「死ぬ」といった述語に対し、「亀」は、それぞれ「対象」、「主体」という関係にあることを解析により得る。また文Bについても、「ペット」、「亡くなる」の単語に分割し、「亡くなる」という述語に対し、「ペット」が「主体」の関係にあることを解析により得る。   For sentence A, it is divided into the words “Kame”, “Turtle”, and “Die”. For the predicates “Kame” and “Die”, “Turtle” has a relationship of “Subject” and “Subject”, respectively. This is obtained by analysis. The sentence B is also divided into the words “pet” and “died”, and it is obtained by analysis that the “pet” has a “subject” relationship with the predicate “died”.

これによりこの解析の結果として、
文Aについて:
(1)引数:「亀」、述語:「飼う」、意味関係情報:「対象」
(2)引数:「亀」、述語:「死ぬ」、意味関係情報:「主格」
文Bについて:
(1)引数:「ペット」、述語:「亡くなる」、意味関係情報:「主格」
といった解析結果が記録される。
As a result of this analysis,
About sentence A:
(1) Argument: “turtle”, predicate: “keep”, semantic relation information: “target”
(2) Argument: “Turtle”, Predicate: “Die”, Semantic information: “Master”
About sentence B:
(1) Argument: “Pet”, Predicate: “Death”, Semantic information: “Main character”
Such an analysis result is recorded.

情報処理装置1は、まず文Bに含まれる単語のうち、役割情報語群に含まれる単語の集合RRを求める。ここでは「ペット」が役割情報語群に含まれる単語となる。この集合RRに含まれる各単語について、当該単語が概念情報として関連づけられている単語「チワワ」、「犬」、「動物」…と、「ペット」に関連づけられている概念情報「愛玩動物」、「動物」、「生物」とを得る。   The information processing apparatus 1 first obtains a set RR of words included in the role information word group among the words included in the sentence B. Here, “pet” is a word included in the role information word group. For each word included in this set RR, the words “chihuahua”, “dog”, “animal”, etc., associated with the word as concept information, and the concept information “compete animal” associated with “pet”, Gain "animal" and "living creature".

情報処理装置1は文Aに含まれる単語のうち、ここで得た単語そのもの、または得られた概念情報に関連する単語があるか否かを調べる。ここでは文Aに含まれる単語「亀」の概念情報が「動物」であることから、情報処理装置1は、文Aには、得られた概念情報に関連する単語があると判断し、関連する単語「亀」を引数とする解析結果を取得する。   The information processing device 1 checks whether or not there is a word itself obtained here or a word related to the obtained concept information among the words included in the sentence A. Here, since the concept information of the word “turtle” included in the sentence A is “animal”, the information processing apparatus 1 determines that the sentence A has a word related to the obtained concept information, and the related information Get the analysis result with the word “turtle” to be used as an argument.

ここではかかる解析結果として、
(1)引数:「亀」、述語:「飼う」、意味関係情報:「対象」
(2)引数:「亀」、述語:「死ぬ」、意味関係情報:「主格」
が見出される。
Here, as the analysis result,
(1) Argument: “turtle”, predicate: “keep”, semantic relation information: “target”
(2) Argument: “Turtle”, Predicate: “Die”, Semantic information: “Master”
Is found.

情報処理装置1は、解析データベースを参照し、各解析結果に含まれる引数に想到する単語、述語、意味関係情報に関連するエントリを検索する。ここでは、(1)引数:「亀」、述語:「飼う」、意味関係情報:「対象」について、引数「亀」の概念情報である「動物」に対応し、
概念情報「動物」、述語「飼う」、意味関係情報「対象」、役割語「ペット」
というエントリが見出される。そしてこの役割語「ペット」が、文Bから取り出された役割語に一致するので、引数E:「亀」と、述語P:「飼う」との組を表す情報に、対応する集合RRの要素R(ここでは「ペット」)を関連づけて記憶する。
The information processing apparatus 1 refers to the analysis database and searches for an entry related to a word, a predicate, and semantic relation information that arrive at an argument included in each analysis result. Here, (1) argument: “turtle”, predicate: “keep”, semantic relation information: “object” corresponds to “animal” which is conceptual information of argument “turtle”,
Concept information "animal", predicate "keep", semantic relation information "object", role word "pet"
Will be found. Since this role word “pet” matches the role word extracted from the sentence B, the element representing the set of the argument E: “turtle” and the predicate P: “bring” is included in the corresponding element of the set RR. R (here, “pet”) is associated and stored.

情報処理装置1は、次に文Aから、役割情報語群に含まれる単語の抽出を試みるが、対応する単語がないので、集合RRが空となり、結局、単語と述語の組は取り出されない。   Next, the information processing apparatus 1 tries to extract a word included in the role information word group from the sentence A. However, since there is no corresponding word, the set RR is emptied, and the combination of the word and the predicate is not extracted after all. .

さらに情報処理装置1は、処理対象となる文A,文Bの解析結果のうち、役割語の観点で同意、または含意の関係にあると判断された箇所を除いた部分を特定する。   Further, the information processing apparatus 1 specifies a part of the analysis results of the sentence A and the sentence B to be processed, excluding a part that is determined to have an agreement or implication relationship from the viewpoint of role words.

ここでは、
文Aについて:
(2)引数:「亀」、述語:「死ぬ」、意味関係情報:「主格」
文Bについて:
(1)引数:「ペット」、述語:「亡くなる」、意味関係情報:「主格」
が特定される。そして、この特定した解析結果を参照して、同意または含意の関係にあるか否かを判断する。
here,
About sentence A:
(2) Argument: “Turtle”, Predicate: “Die”, Semantic information: “Master”
About sentence B:
(1) Argument: “Pet”, Predicate: “Death”, Semantic information: “Main character”
Is identified. Then, with reference to the identified analysis result, it is determined whether or not there is an agreement or implication relationship.

情報処理装置1は、これらが同意または含意の関係にあると判断できたならば、同意または含意の関係にあるか否かが不明である解析結果がなくなるので、文A,Bは互いに同意または含意の関係にあると判断して、その旨を表す情報を出力し、処理を終了する。   If the information processing apparatus 1 can determine that these are in an agreement or implication relationship, there is no analysis result in which it is unknown whether the agreement or implication relationship exists. It is determined that there is an implication relationship, information indicating that is output, and the process ends.

また本実施の形態では、同意または含意の判断の結果に得点を関連づけて出力する場合、分析データベースにおいて単語そのものが述語に関連づけられているエントリと、概念情報が述語に関連づけられているエントリとが含まれる場合、役割語関係判定部23の処理S4(またはS4′)にて、処理S3(またはS3′)で見出した単語そのものと、概念情報に対応する単語とのいずれが、処理対象となっている他方の文(処理S1を文Bについて行う場合、文Aとなる)に含まれるかにより、得点を異ならせてもよい。すなわち例えば、単語そのものが含まれる場合の得点が、概念に対応する単語が含まれている場合の得点に比べて高くなるように設定してもよい。   Further, in the present embodiment, when a score is output in association with the result of consent or implication determination, an entry in which the word itself is associated with the predicate and an entry in which the conceptual information is associated with the predicate are included in the analysis database. If it is included, in the process S4 (or S4 ′) of the role word relationship determination unit 23, either the word itself found in the process S3 (or S3 ′) and the word corresponding to the concept information are processed. The score may be different depending on whether it is included in the other sentence (if the process S1 is performed on the sentence B, it becomes the sentence A). That is, for example, the score when the word itself is included may be set to be higher than the score when the word corresponding to the concept is included.

さらに、本実施の形態の情報処理装置1は、文Aを検索のキーとして、複数の文B,C,D…のうちから同意または含意の関係にある文を抽出する処理を行ってもよい。この場合、情報処理装置1は、文Aと文B、文Aと文C…というように、検索の対象となる文B,C,D…の各々と、キーとなる文Aとの各対に対して上述の処理を行う。   Further, the information processing apparatus 1 according to the present embodiment may perform a process of extracting a sentence having an agreement or implication relationship from a plurality of sentences B, C, D... Using the sentence A as a search key. . In this case, the information processing apparatus 1 has a sentence A and a sentence B, a sentence A and a sentence C, and the like. The above-described processing is performed.

この場合の本実施の形態の情報処理装置1の制御部11は、機能的に、図7に例示するように、処理対象文入力部21と、解析部22と、役割語関係判定部23と、文関係判定部24とに加え、検索文入力部31と、検索部32と、順位付け部33とを含んで構成される。ここで既に説明した構成と同様の動作をする部分については同じ符号を付して、重複した説明を省略する。なお、この文関係判定部24は得点の情報を出力するものとする。   In this case, the control unit 11 of the information processing apparatus 1 according to the present embodiment functionally includes a processing target sentence input unit 21, an analysis unit 22, a role word relationship determination unit 23, as illustrated in FIG. In addition to the sentence relationship determination unit 24, a search sentence input unit 31, a search unit 32, and a ranking unit 33 are included. Parts that operate in the same manner as those already described here are given the same reference numerals, and redundant descriptions are omitted. The sentence relation determining unit 24 outputs score information.

検索文入力部31は、検索のキーとなる文の入力を受け入れる。この検索のキーとなる文と同意または含意の関係にある文が、処理対象文入力部21で受け入れた文のうちから検索部32において検索される。   The search sentence input unit 31 accepts an input of a sentence that is a search key. A sentence having an agreement or implication relationship with the search key sentence is searched by the search unit 32 from the sentences received by the processing target sentence input unit 21.

検索部32は、予め定められた、複数の文が格納されているデータベースから、検索文入力部31で入力されたキーとなる文との間に予め定めた条件を満足する文を検索して抽出する。この検索の処理は、例えば、徳永健伸著、辻井潤一編,「情報検索と言語処理 言語と計算」,東京大学出版会、1999年等に開示されている方法を採用できる。検索部32は、そして、抽出した文を処理対象文入力部21に出力する。これにより検索部32が抽出した各文と、検索文入力部31で入力されたキーとなる文とが同意または含意の関係にあるか否かが、解析部22、役割語関係判定部23、文関係判定部24の処理により判断され、処理対象文入力部21で入力された各文のうち、文関係判定部24が得点とともに出力する判定の結果により、同意または含意の関係にあると判定された文を特定する情報がそれぞれの得点とともに出力される。   The retrieval unit 32 retrieves a sentence satisfying a predetermined condition from a predetermined database in which a plurality of sentences are stored with a key sentence input by the retrieval sentence input unit 31. Extract. For this search processing, for example, the method disclosed in Takenobu Tokunaga, Junichi Sakurai, “Information Search and Language Processing Language and Calculation”, The University of Tokyo Press, 1999, etc. can be employed. Then, the search unit 32 outputs the extracted sentence to the processing target sentence input unit 21. Thus, whether each sentence extracted by the search unit 32 and the key sentence input by the search sentence input unit 31 have an agreement or implication relationship is determined by the analysis unit 22, the role word relationship determination unit 23, Of each sentence input by the sentence relation determination unit 24 and input by the processing target sentence input unit 21, the sentence relation determination unit 24 determines that there is an agreement or implication relationship based on the determination result output together with the score. Information identifying the sentence is output with each score.

さらに順位付け部33は、文関係判定部24が出力する得点の情報を参照して、処理対象文入力部21で入力された各文のうち、文関係判定部24が出力する判定の結果により、同意または含意の関係にあると判定された文を、対応する得点の順で並べ替えて出力する。   Further, the ranking unit 33 refers to the score information output by the sentence relationship determination unit 24 and, based on the determination result output by the sentence relationship determination unit 24 among the sentences input by the processing target sentence input unit 21. The sentences determined to have an agreement or implication are rearranged in the order of the corresponding scores and output.

具体的に、検索部32が、B:「ペットボトルを倒して人が死んだ」、C:「犬が病気で死ぬ」、D:「飼っていた亀が死んだ」の3つの文を検索により見出し(検索結果N=3件)、これらを処理対象文入力部21に入力したとする。これらについては、
文B:
(1)E:「ペットボトル」、P:「倒す」、M:「対象」
(2)E:「人」、P:「死ぬ」、M:「主体」
文C:
(1)E:「犬」、P:「死ぬ」、M:「主体」
(2)E:「病気」、P:「死ぬ」、M:「源泉」
文D:
(1)E:「亀」、P:「飼う」、M:「対象」
(2)E:「亀」、P:「死ぬ」、M:「主体」
の解析結果が得られる。ここでEは引数、Pは述語、Mは意味関係情報を表す。
Specifically, the search unit 32 searches for three sentences of B: “a person died after defeating a plastic bottle”, C: “a dog died of illness”, and D: “a turtle that had been kept dead”. The headlines (search results N = 3) are input to the processing target sentence input unit 21. About these
Sentence B:
(1) E: “Pet bottle”, P: “Defeat”, M: “Target”
(2) E: “People”, P: “Die”, M: “Subject”
Sentence C:
(1) E: “Dog”, P: “Die”, M: “Subject”
(2) E: “Illness”, P: “Die”, M: “Source”
Sentence D:
(1) E: “Turtle”, P: “Keep”, M: “Target”
(2) E: “Turtle”, P: “Die”, M: “Subject”
The analysis result is obtained. Here, E represents an argument, P represents a predicate, and M represents semantic relationship information.

さらに、検索のキーとなる文Aとして、「ペットが死んだ」が与えられたとすると、この文Aについては、
文A:
(1)E:「ペット」、P:「死ぬ」、M:「対象」
の解析結果が得られる。
Furthermore, if “pet is dead” is given as the sentence A which is the key of the search,
Sentence A:
(1) E: “Pet”, P: “Die”, M: “Target”
The analysis result is obtained.

また、文Aから得られる「ペット」の語が役割情報語群に含まれることから、「ペット」の役割語に対応する単語を文B,C,Dから検索する。すると、文B,Cにはこの役割語に対応する単語が見いだせず、文Dからは、既に説明したように、(E:「亀」、P:飼う)の関係が見いだされる。このとき、役割語関係判定部23が各文とキーとなる文との役割語の関係に基づいて、重みを得点として算出する。例えば役割語関係判定部23は、各文に表される意味関係情報の種類や実体の単語の具体性に応じて得点を算出することとしてもよい。つまり、対応する単語「亀」が、具体的な対象であるか「動物」のような抽象的な対象であるかにより、具体的なものであれば0.7点、抽象的なものであれば0.5点を加算することとし、意味関係情報が「対象」であれば1.0点、「時間」であれば0.5点を加算して、得点を演算することとすると、上記の結果から、文B,Cについて0点、文Dについては1.7点の得点が演算されることとなる。仮に、他に得点を演算しないこととしておくとすると、この得点が出力されることとなる。   Since the word “pet” obtained from the sentence A is included in the role information word group, the word corresponding to the role word “pet” is searched from the sentences B, C, and D. Then, the word corresponding to this role word is not found in the sentences B and C, and the relation of (E: “turtle”, P: keep) is found from the sentence D as already explained. At this time, the role word relationship determination unit 23 calculates a weight as a score based on the role word relationship between each sentence and a key sentence. For example, the role word relationship determination unit 23 may calculate the score according to the type of semantic relationship information represented in each sentence and the specificity of the actual word. In other words, depending on whether the corresponding word “turtle” is a concrete object or an abstract object such as “animal”, it is 0.7 points if it is concrete, If the semantic relationship information is “target”, 1.0 point is added, and if it is “time”, 0.5 point is added and the score is calculated. From the result, 0 points are calculated for sentences B and C, and 1.7 points are calculated for sentence D. If it is assumed that no other score is calculated, this score is output.

順位付け部33は、この得点を数値的評価として参照し、評価の数値が最も高い文Dを筆頭として、続いて文B,Cを任意の順序で出力する。この出力はランキングとして表示されてもよい。なお、上述の得点方式や、数値評価の方法は、予め管理者が設定しておく。このように、文中の単語の役割を考慮に入れた処理を行うことにより、単にキーとなる文Aとの文字列の一致度からすれば最も一致する文Bよりも、文字列上の一致度は最も低いが、意味的関係にはよく適合する文Dがより高い順位で出力される。   The ranking unit 33 refers to this score as a numerical evaluation, outputs the sentence D having the highest evaluation numerical value, and then outputs the sentences B and C in an arbitrary order. This output may be displayed as a ranking. Note that the above-described scoring method and numerical evaluation method are set in advance by an administrator. In this way, by performing processing that takes into account the role of words in the sentence, the degree of matching on the character string is higher than the sentence B that most closely matches the degree of matching of the character string with the sentence A that is just the key. Is the lowest, but the sentence D that fits well with the semantic relationship is output in a higher order.

1 情報処理装置、11 制御部、12 記憶部、13 入力部、14 出力部、21 処理対象文入力部、22 解析部、23 役割語関係判定部、24 文関係判定部、31 検索文入力部、32 検索部、33 順位付け部。   DESCRIPTION OF SYMBOLS 1 Information processing apparatus, 11 Control part, 12 Storage part, 13 Input part, 14 Output part, 21 Process target sentence input part, 22 Analysis part, 23 Role word relation determination part, 24 Sentence relation determination part, 31 Search sentence input part 32 Search part, 33 Ranking part.

Claims (4)

コンピュータを、
単語の表す概念、または単語そのものに対して、関連し得る述語と、当該述語との意味上の関係を表す意味関係情報と、当該単語が述語とともに現れるときに当該単語が文中で持つ役割を表す役割情報とを互いに関連づけて保持する保持手段と、
処理対象となる一対の文について、一方の文に含まれる単語と、役割情報が共通する少なくとも一つの単語、または役割情報が共通する概念に対応する少なくとも一つの単語が、他方の文に含まれるか否かを解析する解析手段と、
前記解析手段の解析の結果に基づき、前記一対の文が、互いに意味が同じ同意関係、または、一方の処理対象文の意味が、他方の処理対象文の意味を含む含意関係にあるか否かを判定する判定手段と、
として機能させるプログラム。
Computer
Represents a predicate that can be related to the concept represented by the word or the word itself, semantic relationship information that represents the semantic relationship with the predicate, and the role that the word has in the sentence when the word appears with the predicate. Holding means for holding the role information in association with each other;
For a pair of sentences to be processed, at least one word that has the same role information and at least one word that has the same role information, or at least one word that corresponds to a concept that has the same role information, is included in the other sentence An analysis means for analyzing whether or not,
Whether or not the pair of sentences has an agreement relationship with the same meaning, or the meaning of one processing target sentence has an implication relation including the meaning of the other processing target sentence, based on the analysis result of the analyzing means Determining means for determining
Program to function as.
前記保持手段が、単語の表す概念と、単語そのものと、に対して、それぞれ関連し得る述語と、当該述語との意味上の関係を表す意味関係情報と、当該単語が述語とともに現れるときに当該単語が文中で持つ役割を表す役割情報とを互いに関連づけて保持し、
前記解析手段は、処理対象となる一対の文について、一方の文に含まれる単語と役割情報が共通する少なくとも一つの単語が他方の文に含まれる場合と、一方の文に含まれる単語と役割情報が共通する概念に対応する少なくとも一つの単語が、他方の文に含まれる場合とで、異なる得点情報を出力する請求項1記載のプログラム。
The holding means includes a predicate that can be related to the concept represented by the word and the word itself, semantic relationship information that represents a semantic relationship with the predicate, and the word when the word appears together with the predicate. Holds the role information representing the role that the word has in the sentence in association with each other,
The analyzing means includes a case where at least one word having the same role information as a word included in one sentence is included in the other sentence, and a word and a role included in one sentence of the pair of sentences to be processed. The program according to claim 1, wherein score information that is different from a case where at least one word corresponding to a concept with common information is included in the other sentence is output.
前記コンピュータを、
複数の文を対象として、当該複数の文の各々と、指定された文とを処理対象となる一対の文として前記解析手段による解析を行わせ、
前記解析手段により算出される得点情報を利用して、前記複数の文の各々を数値で評価し、当該評価の順に前記複数の文の各々を配列して提示する提示手段としてさらに機能させる、請求項2記載のプログラム。
The computer,
For a plurality of sentences, each of the plurality of sentences and the specified sentence are analyzed by the analyzing means as a pair of sentences to be processed,
The score information calculated by the analyzing means is used to evaluate each of the plurality of sentences numerically, and further function as a presentation means for arranging and presenting each of the plurality of sentences in the order of the evaluation. Item 2. The program according to item 2.
単語の表す概念、または単語そのものに対して、関連し得る述語と、当該述語との意味上の関係を表す意味関係情報と、当該単語が述語とともに現れるときに当該単語が文中で持つ役割を表す役割情報とを互いに関連づけて保持する保持手段と、
処理対象となる一対の文について、一方の文に含まれる単語と、役割情報が共通する少なくとも一つの単語、または役割情報が共通する概念に対応する少なくとも一つの単語が、他方の文に含まれるか否かを解析する解析手段と、
前記解析手段の解析の結果に基づき、前記一対の文が、互いに意味が同じ同意関係、または、一方の処理対象文の意味が、他方の処理対象文の意味を含む含意関係にあるか否かを判定する判定手段と、
を含む情報処理装置。
Represents a predicate that can be related to the concept represented by the word or the word itself, semantic relationship information that represents the semantic relationship with the predicate, and the role that the word has in the sentence when the word appears with the predicate. Holding means for holding the role information in association with each other;
For a pair of sentences to be processed, at least one word that has the same role information and at least one word that has the same role information, or at least one word that corresponds to a concept that has the same role information, is included in the other sentence An analysis means for analyzing whether or not,
Whether or not the pair of sentences has an agreement relationship with the same meaning, or the meaning of one processing target sentence has an implication relation including the meaning of the other processing target sentence, based on the analysis result of the analyzing means Determining means for determining
An information processing apparatus including:
JP2011069497A 2011-03-28 2011-03-28 Program and information processing apparatus Expired - Fee Related JP5696555B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011069497A JP5696555B2 (en) 2011-03-28 2011-03-28 Program and information processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011069497A JP5696555B2 (en) 2011-03-28 2011-03-28 Program and information processing apparatus

Publications (2)

Publication Number Publication Date
JP2012203779A JP2012203779A (en) 2012-10-22
JP5696555B2 true JP5696555B2 (en) 2015-04-08

Family

ID=47184688

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011069497A Expired - Fee Related JP5696555B2 (en) 2011-03-28 2011-03-28 Program and information processing apparatus

Country Status (1)

Country Link
JP (1) JP5696555B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6049201B2 (en) * 2013-08-05 2016-12-21 Kddi株式会社 Program, method, apparatus and server for generating co-occurrence patterns for detecting synonyms

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6076051A (en) * 1997-03-07 2000-06-13 Microsoft Corporation Information retrieval utilizing semantic representation of text
JP4938298B2 (en) * 2004-11-30 2012-05-23 パロ・アルト・リサーチ・センター・インコーポレーテッド Method and program for outputting candidate sentences to be included in text summary
JP5046170B2 (en) * 2010-05-13 2012-10-10 インターナショナル・ビジネス・マシーンズ・コーポレーション SEARCH SYSTEM, SEARCH METHOD, REPORT SYSTEM, REPORT METHOD, AND PROGRAM

Also Published As

Publication number Publication date
JP2012203779A (en) 2012-10-22

Similar Documents

Publication Publication Date Title
Baik et al. Bridging the semantic gap with SQL query logs in natural language interfaces to databases
CN107257970B (en) Question answering from structured and unstructured data sources
US9715493B2 (en) Method and system for monitoring social media and analyzing text to automate classification of user posts using a facet based relevance assessment model
EP2707818B1 (en) Systems and methods for performing search and retrieval of electronic documents using a big index
US9280535B2 (en) Natural language querying with cascaded conditional random fields
US20170308607A1 (en) Method and System for a Semantic Search Engine
CN104331449B (en) Query statement and determination method, device, terminal and the server of webpage similarity
Zhang Towards efficient and effective semantic table interpretation
US10664530B2 (en) Control of automated tasks executed over search engine results
US20160180438A1 (en) Product recommendation with product review analysis
US20160180217A1 (en) Question answering with entailment analysis
KR20170046611A (en) Question sentence generation device and computer program
JP2015109068A (en) Mechanisms, methods, computer programs and devices for identifying and displaying relationships between candidate answers
JP2013543172A (en) Method, system, and computer program for automatically generating answers to questions
Tang et al. Overview of the NTCIR-9 Crosslink Task: Cross-lingual Link Discovery.
Abdulla et al. Improving biomedical information retrieval by linear combinations of different query expansion techniques
Kanagarajan et al. Intelligent sentence retrieval using semantic word based answer generation algorithm with cuckoo search optimization
Baazaoui Zghal et al. A system for information retrieval in a medical digital library based on modular ontologies and query reformulation
Sanz et al. Fragment-based approximate retrieval in highly heterogeneous XML collections
Zhang Start small, build complete: Effective and efficient semantic table interpretation using tableminer
Kiran et al. An approach towards establishing reference linking in desktop reference manager
JP5696555B2 (en) Program and information processing apparatus
Klang et al. Linking, searching, and visualizing entities in wikipedia
KR101881398B1 (en) Apparatus and method for processing biological system information
Tran et al. A comparative study of question answering over knowledge bases

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140723

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140812

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141003

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150113

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150126

R150 Certificate of patent or registration of utility model

Ref document number: 5696555

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees