JP5696555B2 - Program and information processing apparatus - Google Patents
Program and information processing apparatus Download PDFInfo
- Publication number
- JP5696555B2 JP5696555B2 JP2011069497A JP2011069497A JP5696555B2 JP 5696555 B2 JP5696555 B2 JP 5696555B2 JP 2011069497 A JP2011069497 A JP 2011069497A JP 2011069497 A JP2011069497 A JP 2011069497A JP 5696555 B2 JP5696555 B2 JP 5696555B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- sentence
- information
- predicate
- role
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、プログラム及び情報処理装置に関する。 The present invention relates to a program and an information processing apparatus.
2種以上の関係の少なくとも1種を除外し残りの関係に基づいてキーワードの予備関連語をファイルから抽出する。予備関連語によりデータベースを検索し予備情報を得る。キーワードの関連語をファイルから抽出するための制御情報を、前記除外した単語間の関係と前記予備情報とに基づいて生成する。この制御情報を用いキーワードの関連語をファイルから抽出する。この関連語によりデータベースを検索する、という技術が特許文献1に開示されている。
Exclude at least one of the two or more relationships, and extract keyword preliminary related words from the file based on the remaining relationships. Search the database by the preliminary related words to obtain preliminary information. Control information for extracting keyword-related words from the file is generated based on the relationship between the excluded words and the preliminary information. Using this control information, keywords related words are extracted from the file. A technique of searching a database using this related term is disclosed in
ある単語の上位概念は必ずしも一つではなく、文中で当該単語が持つ役割に関係して異なることを考慮に入れた、同意関係ないし含意関係の判断を行う。 The superordinate concept of a word is not necessarily one, and a consensus relationship or an implication relationship is determined in consideration of differences in relation to the role of the word in the sentence.
請求項1記載の発明は、プログラムであって、コンピュータを、単語の表す概念、または単語そのものに対して、関連し得る述語と、当該述語との意味上の関係を表す意味関係情報と、当該単語が述語とともに現れるときに当該単語が文中で持つ役割を表す役割情報とを互いに関連づけて保持する保持手段と、処理対象となる一対の文について、一方の文に含まれる単語と、役割情報が共通する少なくとも一つの単語、または役割情報が共通する概念に対応する少なくとも一つの単語が、他方の文に含まれるか否かを解析する解析手段と、前記解析手段の解析の結果に基づき、前記一対の文が、互いに意味が同じ同意関係、または、一方の処理対象文の意味が、他方の処理対象文の意味を含む含意関係にあるか否かを判定する判定手段と、として機能させるものである。
The invention according to
請求項2記載の発明は、請求項1記載のプログラムであって、前記保持手段が、単語の表す概念と、単語そのものと、に対して、それぞれ関連し得る述語と、当該述語との意味上の関係を表す意味関係情報と、当該単語が述語とともに現れるときに当該単語が文中で持つ役割を表す役割情報とを互いに関連づけて保持し、前記解析手段は、処理対象となる一対の文について、一方の文に含まれる単語と役割情報が共通する少なくとも一つの単語が他方の文に含まれる場合と、一方の文に含まれる単語と役割情報が共通する概念に対応する少なくとも一つの単語が、他方の文に含まれる場合とで、異なる得点情報を出力することとしたものである。
The invention according to
請求項3記載の発明は、請求項2記載のプログラムであって、前記コンピュータを、複数の文を対象として、当該複数の文の各々と、指定された文とを処理対象となる一対の文として前記解析手段による解析を行わせ、前記解析手段により算出される得点情報を利用して、前記複数の文の各々を数値で評価し、当該評価の順に前記複数の文の各々を配列して提示する提示手段としてさらに機能させることとしたものである。
The invention according to
請求項4記載の発明は、情報処理装置であって、単語の表す概念、または単語そのものに対して、関連し得る述語と、当該述語との意味上の関係を表す意味関係情報と、当該単語が述語とともに現れるときに当該単語が文中で持つ役割を表す役割情報とを互いに関連づけて保持する保持手段と、処理対象となる一対の文について、一方の文に含まれる単語と、役割情報が共通する少なくとも一つの単語、または役割情報が共通する概念に対応する少なくとも一つの単語が、他方の文に含まれるか否かを解析する解析手段と、前記解析手段の解析の結果に基づき、前記一対の文が、互いに意味が同じ同意関係、または、一方の処理対象文の意味が、他方の処理対象文の意味を含む含意関係にあるか否かを判定する判定手段と、を含むこととしたものである。 The invention according to claim 4 is an information processing apparatus, which is related to a concept represented by a word or a word itself, semantic relation information representing a semantic relationship between the predicate, and the word When the word appears together with the predicate, the role information that represents the role of the word in the sentence is held in association with each other, and the pair of sentences to be processed has the same role information as the word contained in one sentence Analysis means for analyzing whether or not at least one word corresponding to a concept having a common role information is included in the other sentence, and based on the analysis result of the analysis means, the pair And determining means for determining whether the meaning of one processing target sentence is an implication relation including the meaning of the other processing target sentence. Than is.
請求項1,4記載の発明によると、文中の単語と当該単語に関連し得る述語との意味上の関係と、当該単語が文中で持つ役割を表す役割情報とに基づいて、二文が同意または含意の関係にあるかを判断できる。 According to the first and fourth aspects of the present invention, two sentences agree on the basis of the semantic relationship between a word in a sentence and a predicate that can be related to the word, and role information indicating the role of the word in the sentence. Or it can be judged whether there is an implication relationship.
請求項2記載の発明によると、得点情報を出力できる。
According to invention of
請求項3記載の発明によると、得点情報を利用した数値評価により、複数の文を順位付けして提示できる。
According to the invention described in
本発明の実施の形態について図面を参照しながら説明する。本発明の実施形態に係る情報処理装置1は、図1に示すように、制御部11、記憶部12、入力部13、出力部14を含んで構成される。
Embodiments of the present invention will be described with reference to the drawings. As shown in FIG. 1, the
制御部11は、CPU(Central Processing Unit)等のプログラム制御デバイスを含んで構成される。この制御部11は、処理対象となる一対の文について、一方の文に含まれる単語と、役割情報が共通する少なくとも一つの単語、または役割情報が共通する概念に対応する少なくとも一つの単語が、他方の文に含まれるか否かを解析し、当該解析の結果に基づき、処理対象となる一対の文が、互いに意味が同じである関係(同意関係)、または、一方の処理対象文の意味が、他方の処理対象文の意味を含む関係(含意関係)にあるか否かを判定する処理を実行する。これらの制御部11の処理の内容については、後に述べる。
The
記憶部12は、ディスクデバイスやメモリデバイスなどであり、制御部11によって実行されるプログラムを保持する。このプログラムは、コンピュータ可読な記録媒体に格納されて提供され、この記憶部12に複写されたものとしてもよい。また、この記憶部12は制御部11のワークメモリとしても動作する。
The
さらに本実施の形態では、この記憶部12は、単語の表す概念または単語そのものに対して、関連し得る述語と、当該述語との意味上の関係を表す意味関係情報と、当該単語が述語とともに現れるときに当該単語が文中で持つ役割を表す役割情報とを互いに関連づけて保持する。具体的にこの記憶部12は、図2に例示する単語データベースと、図3に例示する解析データベースとを保持する。具体的に、単語データベースは、単語そのもの(W)と、品詞を表す品詞情報(P)と、当該単語の概念を表す情報である概念情報を少なくとも一つ含む概念情報群(C)とを互いに関連づけて保持したものである。
Further, in the present embodiment, the
ここで概念情報は、例えば予め定められた類義語辞書(シソーラス)において、当該単語に係る類義語または上位概念語として規定された語とすればよい。一例として「猫」について「ペット」、「動物」などの概念情報が関連づけられる。 Here, the concept information may be a word defined as a synonym or a broader concept word related to the word in a predetermined synonym dictionary (thesaurus), for example. As an example, conceptual information such as “pet” and “animal” is associated with “cat”.
また、解析データベースは、各エントリーを識別する識別子(N:図3(a),(b)では行番号)と、単語または単語に係る概念情報(W/C)と、当該単語または概念情報に関連する単語とともに一つの文中にともに出現し得る述語(P)と、当該単語または概念情報に関連する単語と、当該述語との意味上の関係を表す意味関係情報(M)と、当該単語または概念情報に関連する単語が述語とともに現れるときに当該単語が文中で持つ役割を表す役割情報(R)とを互いに関連づけて保持したものである(図3(a))。 The analysis database includes an identifier (N: line number in FIGS. 3A and 3B) for identifying each entry, concept information (W / C) related to the word or word, and the word or concept information. A predicate (P) that can appear together in a sentence together with a related word, a word related to the word or conceptual information, semantic relationship information (M) representing a semantic relationship with the predicate, the word or When a word related to the concept information appears together with the predicate, role information (R) representing the role of the word in the sentence is held in association with each other (FIG. 3A).
例えば、単語そのものとして「動物」であれば、述語として「飼う」(なお、以下、動詞の単語については、各データベース内では、終止形で保持されているものとする)がともに一文中に現れることがあり、また、「動物」と「飼う」との意味上の関係は「対象」(「動物」は「飼」われる対象)と定められる。この意味上の関係を表す語は、予め複数の語からなる語群(意味関係情報語群)を定めておき、これらの語群のなかから選択するものとしておけばよい。 For example, if the word itself is “animal”, both “preserve” as a predicate (hereinafter, the verb word is assumed to be held in the final form in each database) will appear in one sentence. In addition, the semantic relationship between “animal” and “retain” is defined as “subject” (“animal” is “subject”). Words representing this semantic relationship may be determined in advance by defining a word group (semantic relationship information word group) consisting of a plurality of words and selecting from these word groups.
さらに「飼う」との関係において「動物」の文中での役割は、「ペット」であるとしておく。この役割を表す語(役割語)についても。予め複数の語からなる語群(役割情報語群)を定めておき、これらの語群のなかから選択するものとしておけばよい。また別のエントリーでは、同じ「動物」の概念に属する単語「牛」に対し、述語として「食べる」が関連づけられている場合、「食べる」との関係における「動物」の文中での役割は、「食べ物」であるなどとしておく。 Further, it is assumed that the role of “animal” in the context of “keep” is “pet”. Also about the word representing this role (role word). A word group consisting of a plurality of words (role information word group) may be determined in advance and selected from these word groups. In another entry, if the word “cow” belonging to the same “animal” concept is associated with “eat” as a predicate, the role of “animal” in the relationship with “eat” It is said that it is “food”.
このように、本実施の形態では、一つの単語について、述語ごとにその役割を表す役割語が異なる関係が定められ、当該関係が、解析データベースとして保持されている。 Thus, in the present embodiment, for one word, a relationship in which role words representing the role are different for each predicate is determined, and the relationship is held as an analysis database.
また、ここでは単語そのものとしたが、単語の表す概念である概念情報に対して、述語や、意味関係情報、並びに役割情報が関連づけて記録されていてもよい。また、単語そのもの(W)と述語等を関連づけたエントリと、単語の表す概念情報(C)に述語等を関連づけたエントリとの双方を含めて記録しておいてもよい(図3(b))。 Although the word itself is used here, predicate, semantic relationship information, and role information may be recorded in association with concept information that is a concept represented by the word. Further, both the entry associated with the word itself (W) and the predicate, and the entry associated with the predicate etc. in the conceptual information (C) represented by the word may be recorded (FIG. 3B). ).
なお、この解析データベースはあらかじめ構築しておく必要があるが、十分な単語を網羅した解析データベースのエントリーを人手で構築することはコストがかかるなど困難な場合がある。このコストを低減させるには、例えば、いわゆるブートストラップ手法等を用いて、種となる特定の役割語と述語のペアを元に、大規模コーパスから役割語と類似する実体の単語を収集すればよい。得られた単語の集合を既存の単語概念辞書と照合して概念としてまとめることで、個々の単語を包含する概念情報を得ることができる。さらに、役割語と実体の単語や概念情報を種に、関係を結ぶ頻度の高い述語を求めることもできる。また単語の語釈を記述した文を解析したり、特定の文型パターンなどを利用するなどして、種となる役割語を選抜すれば、さらに処理を効率化できる。ここで特定の文型パターンを利用するとは、例えば、連体節の関係を結ぶ述語の引数として高い頻度で現れる抽象的な一般名詞があれば、当該一般名詞を役割語として選抜することである。なお、得られた結果は人間が精査することで、一定の精度の大規模な関係データを構築することとしてもよい。このようなブートストラップ手法については、Patrick Pantel and Marco Pennacchiotti. 2006. Espresso: Leveraging Generic Patterns for Automatically Harvesting Semantic Relations. In Proceedings of Conference on Computational Linguistics / Association for Computational Linguistics (COLING/ACL-06). pp. 113-120などを参考にすることができる。 Although this analysis database needs to be constructed in advance, it may be difficult to manually construct an analysis database entry that covers a sufficient number of words because of the cost. In order to reduce this cost, for example, by using so-called bootstrap technique etc., collecting actual words similar to role words from a large corpus based on a specific role word and predicate pair as seeds Good. Concept information including individual words can be obtained by collating the set of obtained words with an existing word concept dictionary and collecting them as a concept. Furthermore, it is also possible to obtain a predicate with a high frequency of linking with a role word, an entity word, and conceptual information as seeds. Further, if a role word as a seed is selected by analyzing a sentence describing a word interpretation or using a specific sentence pattern or the like, the processing can be made more efficient. Here, using a specific sentence pattern means, for example, if there is an abstract general noun that appears frequently as an argument of a predicate that connects the relations of the linked clauses, the general noun is selected as a role word. In addition, it is good also as constructing | assembling the large-scale relationship data of a fixed precision by human being examining the obtained result. Patrick Pantel and Marco Pennacchiotti.2006.Espresso: Leveraging Generic Patterns for Automatically Harvesting Semantic Relations.In Proceedings of Conference on Computational Linguistics / Association for Computational Linguistics (COLING / ACL-06). You can refer to 113-120.
また、これら単語データベースや解析データベースは、ここでの説明では記憶部12に保持しておくこととするが、ネットワーク等の通信手段を介して情報処理装置1からアクセス可能なサーバ等、別体の装置に保持されていても構わない。この場合情報処理装置1は、必要に応じて当該サーバ等に格納されたデータベースを検索し、その検索結果を受け取る。
In addition, these word databases and analysis databases are stored in the
入力部13は、キーボードやマウス等の入力デバイス、及び、ネットワークインタフェース等の文書情報を入力可能なデバイスを含む。出力部14は、ディスプレイ等であり、制御部11から入力される指示に従って情報を出力する。
The
次に、制御部11による処理の内容について述べる。本実施の形態の制御部11は、機能的には、図4に例示するように、処理対象文入力部21と、解析部22と、役割語関係判定部23と、文関係判定部24とを含んで構成される。また、以下の説明では、一対の文の間に、言い換え関係(互いに同じ意味となる同意関係)や、一方の文の意味が他方の文の意味を包含する包含関係があるか否かを判断するものとする。
Next, the contents of processing by the
ここで処理対象文入力部21は、関係を判定する処理の対象となる、複数の処理対象文を受け入れる。以下の例では一対の文Aと文Bとが入力されたものとするが、3つ以上の文が入力された場合は、総当たりで2文の組み合わせを抽出し、組み合わせごとに、抽出した2文についての関係を以下に説明する処理により判定することとしてもよいし、いずれか一文をキーとして、このキーと、他の各文との組み合わせごとに、それらの関係を、以下に説明する処理により判定することとしてもよい。なお、以下の例では、文Aが「飼っていた亀が死んだ。」であり、文Bが「ペットが亡くなった。」であるものとする。
Here, the processing target
解析部22は、処理対象文入力部21が受け入れた各文に対し、予め定められた解析処理を実行する。ここでは解析部22は、文中の単語を抽出し、単語間の関係を表す情報を生成する。具体的に、この解析部22は入力された文ごとに次の処理を行う。
The
すなわち解析部22は、広く知られた構文意味解析処理を行い、処理の対象とする文(注目文と呼ぶ)を単語に分割する。また記憶部12に格納されている単語データベースを参照し、各単語間の係り受けや意味的関係の解析処理を行う。この処理は例えば、梅基宏,杉原大悟,大熊智子,増市博,「LFG解析と語彙資源を利用した日本語含意関係判定」,情報処理学会研究報告 2008-NL-188,pp. 57-64,2008等に開示された処理を用いることができる。
That is, the
この構文意味解析処理を、文A,Bのそれぞれに適用した結果の例を図5に示す。図5では、各単語を、表記、品詞、概念情報(単語データベース内のエントリー)を示した矩形で表し、単語間の関係を矢印で、矢印に付したラベルによりその意味的関係を表すものとする。 FIG. 5 shows an example of the result of applying this syntax and semantic analysis processing to each of the sentences A and B. In FIG. 5, each word is represented by a rectangle indicating notation, part of speech, and conceptual information (entry in the word database), the relationship between words is represented by an arrow, and the semantic relationship is represented by a label attached to the arrow. To do.
文Aについては、「飼う」、「亀」、「死ぬ」(動詞については既に述べたようにその終止形で表す)が単語として抽出される。そして「飼う」、「死ぬ」といった述語に対し、「亀」は、それぞれ「対象」(飼われる対象)、「主体」(死ぬに対する主格)という関係にあることが解析により得られる。図中の矢印は、述語に対して関係する単語を「引数」とし、引数となる単語に根を置き、関係する述語に対して矢印を引き出したものとなっている。 For sentence A, “Kai”, “Turtle”, and “Die” (the verb is expressed in its final form as described above) are extracted as words. Then, it is obtained by analysis that “turtle” has a relationship of “subject” (subject object) and “subject” (major for dying) to predicates such as “keep” and “die”. The arrows in the figure are words that are related to the predicate as “arguments”, rooted in the word that is the argument, and drawn with respect to the related predicates.
ここで文Aには「飼っていた亀」のような、述語が引数に係っている連体節が含まれる。この解析部22は、この連体節を、対応する平叙文である「亀を飼っていた」とみなして単語間の関係を抽出することとしている。すなわち、「亀」は「飼う」に係り、対象の意味的関係をもつと解析される。平叙文では助詞の「を」が存在することで、引数の「亀」が目的語であり対象の関係を持つと解析できるが、同じ内容を表す連体節にはそのような助詞が存在しない。そこで、「飼う」の動詞の格フレーム情報(動詞に関する格フレーム情報は、記憶部12に保持しておけばよい)と「亀」の単語の概念情報を利用して、両者が主体ではなく対象の関係にあると解析する。ここで格フレーム情報は、動詞ごとに、予め定められた表層格のそれぞれについてどのような単語あるいは単語に係る概念情報が係り合うかを関連づけたものである。具体的に、日本語の場合、表層格として「ガ格」、「ヲ格」、「ニ格」…などが定められ、動詞「飼う」に対しては、「ガ格」に「人」、「私」、「家」などの単語(人が飼う、私が飼う…というように表現され得る単語)や、これらの単語に関連する、「人間」といった概念情報が関連づけられる。また、「ヲ格」には、「チワワ」、「犬」、「猫」、「亀」などの単語(チワワを飼う…というように表現され得る単語)や、これらの単語に関連する、「動物」といった概念情報が関連づけられる。
Here, the sentence A includes a combined clause in which the predicate is related to the argument, such as “Kame to be kept”. The
本実施の形態の解析部22は、「飼う」に対して「亀」という単語、あるいは「亀」という単語に関連する概念情報(単語データベースにおいて関連づけられた情報でよい)が関連づけられている「格」を格フレーム情報から検索し、検索により見出された「格」の情報を用いて、意味関係情報を得る。本実施の形態では、意味関係情報は、深層格を表す情報としておいてもよい。具体的にこの「亀」と「飼う」の例では表層格として日本語の「ヲ格」において現れるので、この表層格の情報や、その他の情報(受身形である等の情報)を用いて、深層格「対象」を定めることとしてもよい。
The
また、記憶部12には、この解析の結果として、引数と述語との組と、意味関係情報とが関連づけて記録される。具体的に上記文A,Bに対しては、
文Aについて:
(1)引数:「亀」、述語:「飼う」、意味関係情報:「対象」
(2)引数:「亀」、述語:「死ぬ」、意味関係情報:「主体」
文Bについて:
(1)引数:「ペット」、述語:「亡くなる」、意味関係情報:「主体」
といった情報が記録される。以下、この引数と述語との組との関係で列挙された各データ(上記(1)、(2)…)をそれぞれ、「解析結果」と呼ぶ。
In addition, as a result of this analysis, a pair of an argument and a predicate and semantic relationship information are recorded in the
About sentence A:
(1) Argument: “turtle”, predicate: “keep”, semantic relation information: “target”
(2) Argument: “Turtle”, predicate: “Die”, semantic relation information: “Subject”
About sentence B:
(1) Argument: “pet”, predicate: “died”, semantic information: “subject”
Such information is recorded. Hereinafter, each data (the above (1), (2)...) Enumerated by the relationship between the argument and the predicate pair is referred to as “analysis result”.
役割語関係判定部23は、文Aに含まれる役割語と、文Bに含まれる役割語との同意関係や含意関係を、解析部22での解析の結果と、解析データベースに格納されたデータとに基づいて判定する。
The role word
具体的に、この役割語関係判定部23は次の処理を実行する。すなわち役割語関係判定部23は、図6に例示するように、処理対象となっている文の一方(ここでは例えば文Bとする)について、当該文に含まれる単語のうち、役割情報語群に含まれる単語の集合RRを求める(S1)。
Specifically, the role word
役割語関係判定部23は、この集合の各要素R(いずれも役割語となる)について、次の処理を繰り返して行う(S2:LOOP)。まず役割語関係判定部23は、処理の対象となった要素Rに対応する語が概念情報として関連づけられている単語と、当該要素Rに対応する単語に関連づけられた概念情報とを、単語データベースから検索する(S3)。
The role word
役割語関係判定部23は、この処理S3における検索で見出した単語(複数ある場合はそのいずれか)、または処理S3で見出した概念情報に対応する単語が、処理対象となっている他方の文(処理S1を文Bについて行う場合、文Aとなる)文Aに含まれるか否かを判断する(S4)。この処理S4において、処理S3における検索で見出した単語または処理S3で見出した概念情報に対応する単語が、文Aに含まれる場合(処理S4でYesの場合)、役割語関係判定部23は、解析部22での文Aの解析結果を参照し、処理S3における検索で見出した単語を引数Eとする述語Pと、それらの間の意味関係情報とを取り出す(S5)。
The role word
そして役割語関係判定部23は、解析データベースを参照し、処理S3で見出した引数Eとしての単語と、処理S5で取り出した述語P及び意味関係情報とが互いに関連づけられたエントリであって、当該エントリに含まれる役割語が、要素Rに一致するものを検索する(S6)。なお、解析データベースにおいて単語の概念情報が述語に関連づけられている場合は、処理S3で見出した単語そのものではなく、当該単語の概念情報を単語データベースから取り出し、当該取り出した概念情報、処理S5で取り出した述語、及び意味関係情報、並びに役割語として要素Rと同じ単語が互いに関連づけられたエントリを検索することとすればよい。また、解析データベースにおいて単語そのものが述語に関連づけられている場合は、処理S3で見出した単語そのもの、処理S5で取り出した述語、及び意味関係情報、並びに役割語として要素Rと同じ単語が互いに関連づけられたエントリを検索することとすればよい。さらに、解析データベースにおいて単語そのものと単語の概念情報とがそれぞれ、述語に関連づけられている場合は、処理S3で見出した単語そのもの、または、単語データベースから取り出した当該単語の概念情報と、処理S5で取り出した述語、及び意味関係情報、並びに役割語として要素Rと同じ単語が互いに関連づけられたエントリを検索することとすればよい。
The role word
役割語関係判定部23は、処理S6における検索によりエントリが見出されたならば、処理S3で見出した文A中の引数Eとしての単語と、処理S5で取り出した述語Pとの組(E,P)を表す情報を、対応する要素Rに関連づけて記憶部12に格納する(S7)。なお、役割語関係判定部23は、処理S3から処理S7までを要素Rごとに行うので、組(E,P)は複数得られる場合があるが、この場合は、複数の組(E,P)をそれぞれに対応する要素Rに関連づけて、集合EEとして記憶部12に格納しておく。ここで記憶部12に格納された組(E,P)は、対応する要素Rの言い換え(つまり同意)あるいは含意の関係にあるということになる。
If an entry is found by the search in process S6, the role word
なお、処理S4において、処理S3における検索で見出した単語または処理S3で見出した概念情報に対応する単語が、文Aに含まれなかったならば(処理S4でNoならば)、要素Rと同意あるいは含意の関係にある単語と述語との組はなかったと判断する。 In step S4, if the word found in the search in step S3 or the word corresponding to the conceptual information found in step S3 is not included in sentence A (if No in step S4), agree with element R. Alternatively, it is determined that there is no pair of a word and a predicate having an implication relationship.
役割語関係判定部23は、さらに、対象となる文A,Bを入れ替えて、上記処理S1ないしS7の処理を繰り返して行う。つまり役割語関係判定部23は、処理対象となっている文の一方(先の処理S1にて例えば文Bとしたならばここでは文A)について、当該文に含まれる単語のうち、役割情報語群に含まれる単語の集合RR′を求める(S1′)。なお、この処理は図6に示した処理と同様のものであるので、図示は省略する。
The role word
役割語関係判定部23は、この集合の各要素R′(いずれも役割語となる)について、次の処理を繰り返して行う(S2′:LOOP)。まず役割語関係判定部23は、処理の対象となった要素Rに対応する語が概念情報として関連づけられている単語と、当該要素R′に対応する単語に関連づけられた概念情報とを、単語データベースから検索する(S3′)。
The role word
役割語関係判定部23は、この処理S3′における検索で見出した単語(複数ある場合はそのいずれか)、または処理S3′で見出した概念情報に対応する単語が、他方の文である文Bに含まれるか否かを判断する(S4′)。この処理S4′において、処理S3′における検索で見出した単語または処理S3′で見出した概念情報に対応する単語が、文Bに含まれる場合(処理S4′でYesの場合)、役割語関係判定部23は、解析部22での文Bの解析結果を参照し、処理S3′における検索で見出した単語を引数E′とする述語P′と、それらの間の意味関係情報とを取り出す(S5′)。
The role word
そして役割語関係判定部23は、解析データベースを参照し、処理S3′で見出した引数E′としての単語と、処理S5′で取り出した述語P′及び意味関係情報とが互いに関連づけられたエントリであって、当該エントリに含まれる役割語が、要素Rに一致するものを検索する(S6′)。なお、解析データベースにおいて単語の概念情報が述語に関連づけられている場合は、処理S3′で見出した単語そのものではなく、当該単語の概念情報を単語データベースから取り出し、当該取り出した概念情報、処理S5′で取り出した述語、及び意味関係情報、並びに役割語として要素Rと同じ単語が互いに関連づけられたエントリを検索することとすればよい。また、解析データベースにおいて単語そのものが述語に関連づけられている場合は、処理S3′で見出した単語そのもの、処理S5′で取り出した述語、及び意味関係情報、並びに役割語として要素Rと同じ単語が互いに関連づけられたエントリを検索することとすればよい。さらに、解析データベースにおいて単語そのものと単語の概念情報とがそれぞれ、述語に関連づけられている場合は、処理S3′で見出した単語そのもの、または、単語データベースから取り出した当該単語の概念情報と、処理S5′で取り出した述語、及び意味関係情報、並びに役割語として要素Rと同じ単語が互いに関連づけられたエントリを検索することとすればよい。
Then, the role word
役割語関係判定部23は、処理S6′における検索によりエントリが見出されたならば、処理S3′で見出した文B中の引数E′としての単語と、処理S5′で取り出した述語P′との組(E′,P′)を表す情報を、対応する要素R′に関連づけて記憶部12に格納する(S7′)。なお、役割語関係判定部23は、処理S3′から処理S7′までを要素R′ごとに行うので、組(E′,P′)は複数得られる場合があるが、この場合は、複数の組(E′,P′)を、それぞれに対応する要素R′に関連づけて、集合EE′として記憶部12に格納しておく。ここで記憶部12に格納された組(E′,P′)は、対応する要素R′の言い換え(つまり同意)あるいは含意の関係にあるということになる。
If an entry is found by the search in process S6 ′, the role word
なお、処理S4′において、処理S3′における検索で見出した単語または処理S3′で見出した概念情報に対応する単語が、文Bに含まれなかったならば(処理S4′でNoならば)、要素R′と同意あるいは含意の関係にある単語と述語との組はなかったと判断する。 In process S4 ′, if the word found in the search in process S3 ′ or the word corresponding to the conceptual information found in process S3 ′ is not included in sentence B (if No in process S4 ′), It is determined that there is no combination of a word and a predicate that is in agreement or implication with the element R ′.
以上の処理を具体例に則して説明すると、次のようになる。すなわち、役割語関係判定部23は文B:「ペットが亡くなった。」に含まれる単語のうち、役割情報語群に含まれる単語の集合RRを求める。ここでは文Bから「ペット」、「が」、「亡くなる」の単語が抽出されており、役割情報語群には単語「ペット」が含まれるものとすると、集合RRには、要素Rとして、この単語「ペット」が含まれることとなる。
The above processing will be described in accordance with a specific example as follows. That is, the role word
役割語関係判定部23は、この集合の各要素Rについて、次の処理を繰り返して行う。ここでは要素Rは一つだけであるので、次の処理を一度だけ実行することになる。まず役割語関係判定部23は、要素Rである「ペット」が概念情報として関連づけられている単語を、単語データベースから検索する。ここではかかる単語として「チワワ」、「犬」、「動物」…が見出される。また、当該要素Rである「ペット」なる単語の概念情報を単語データベースから取得する。ここでは概念情報として「動物」が見出されたとする。
The role word
役割語関係判定部23は、これら見出された単語(「チワワ」、「犬」、「動物」…)、または要素Rに対応する単語の概念情報「動物」に対応する単語のそれぞれについて、文Aに含まれているか否かを調べる。この処理は、判定が「真」(含まれている)となるか、見出された単語のすべてについて判定を完了するまで行う。
The role word
ここでは、概念情報「動物」に対応する単語「亀」が文A:「飼っていた亀が死んだ。」に含まれるので、役割語関係判定部23はこの単語「亀」を引数Eとして、この引数Eに対応する述語Pと意味関係情報とを解析部22の解析結果を参照して取り出す。ここでは、引数E:「亀」、述語P:「飼う」、意味関係情報M:「対象」と、引数E:「亀」、述語P:「死ぬ」、意味関係情報M:「主体」とが得られる。
Here, since the word “turtle” corresponding to the concept information “animal” is included in the sentence A: “the turtle that had been kept dead”, the role word
そして役割語関係判定部23は、解析データベースを参照し、引数Eとしての単語「亀」またはその概念情報である「動物」と、述語P「飼う」及び意味関係情報M「対象」、並びに要素Rである「ペット」が役割語として互いに関連づけられたエントリを検索する。ここでは解析データベースに、概念情報である「動物」、述語「飼う」、意味関係情報「対象」、役割語「ペット」が互いに関連づけられたエントリがあるので、役割語関係判定部23は、文A中の引数Eとしての単語「亀」と、対応する述語P「飼う」との組(E:「亀」,P:「飼う」)を表す情報を、対応する要素R:「ペット」に関連づけて、記憶部12に格納する。この文A中の組が、対応する文Bから取り出された要素R:「ペット」と同意、または含意の関係にあるものと判断される。
Then, the role word
また役割語関係判定部23は、文A,Bを入れ替えて同様の処理を行うが、文Aにおいては、当該文に含まれる単語のうち、役割情報語群に含まれる単語がないので、集合RRが空となり、要素Rごとの処理は行われず、従って、単語と述語の組は取り出されない。
The role word
文関係判定部24は、解析部22及び役割語関係判定部23の処理により得られた結果に基づき、処理対象文入力部21で受け入れた文が同意(同じ意味、すなわち言い換え)関係にあるか、または含意の関係にあるかの判断を行う。
Based on the results obtained by the processing of the
具体的に、文関係判定部24は、処理対象となる一対の文(ここでは文A,文B)の解析結果のうち、役割語関係判定部23により、役割語の観点で同意、または含意の関係にあると判断された箇所を除いた部分を特定する。
Specifically, the sentence
ここで用いている文A,Bの例では、
文Aについて:
(1)引数:「亀」、述語:「飼う」、意味関係情報:「対象」
(2)引数:「亀」、述語:「死ぬ」、意味関係情報:「主体」
文Bについて:
(1)引数:「ペット」、述語:「亡くなる」、意味関係情報:「主体」
が解析結果として記録されており、役割語関係判定部23により、(「亀」,「飼う」)と「ペット」とが役割語の観点から同意または含意の関係にあるとされている。そこで、文Aについての解析結果のうち、(1)引数:「亀」、述語:「飼う」、意味関係情報:「対象」の情報は、「ペット」と同意または含意の関係にあると判断されているとし、文Aについての解析結果のうち(2)と、文Bの解析結果の(1)とについて同意、または含意の関係にあるか否かを判断する。この判断は、例えば小谷 通隆, 柴田 知秀, 黒橋 禎夫、「言い換え表現の述語項構造への正規化とテキスト含意関係認識での利用」, 言語処理学会 第15回年次大会, pp.260-263 (2009)に示された方法で行うことができるので、詳しい説明を省略する。
In the example of sentences A and B used here,
About sentence A:
(1) Argument: “turtle”, predicate: “keep”, semantic relation information: “target”
(2) Argument: “Turtle”, predicate: “Die”, semantic relation information: “Subject”
About sentence B:
(1) Argument: “pet”, predicate: “died”, semantic information: “subject”
Is recorded as an analysis result, and the role word
文関係判定部24は、この判断と、役割語関係判定部23での判定とにより、処理対象の一方の文についての解析結果のうち、他方の文に現れる語や解析結果に同意あるいは含意の関係にあるものを特定する。ここでの例では、既に述べたように、役割語関係判定部23により、文Aの解析結果のうち(1)引数:「亀」、述語:「飼う」、意味関係情報:「対象」の情報は、「ペット」と同意または含意の関係にあると判断されているとし、文Aについての解析結果のうち(2)と、文Bの解析結果の(1)とが上記述語項構造への正規化などの方法で同意または含意の関係にあると判断されるので、文Aの解析結果のすべてが文Bに含まれる単語や解析結果のいずれかと同意または含意の関係にあると判断され、また逆に文Bの解析結果のすべてが文Aに含まれる単語や解析結果のいずれかと同意または含意の関係にあると判断される。そこで、文関係判定部24は、文Aと文Bとは同意または含意の関係にあると判断し、当該判断の結果を表す情報を出力する。
Based on this determination and the determination by the role word
なお、ここで示した例では、文Aの解析結果のすべてが文Bに含まれる単語や解析結果のいずれかと同意または含意の関係にあり、かつ、文Bの解析結果のすべてが文Aに含まれる単語や解析結果のいずれかと同意または含意の関係にと判断したことにより、文A,Bが互いに同意または含意の関係にあると判断することとしたが、本実施の形態はこれに限らず、例えば、文Aの解析結果のうち、文Bに含まれる単語や解析結果のいずれかと同意または含意の関係にあるものの個数ないし割合(全解析結果の数に対する個数)、かつ、文Bの解析結果のうち、文Aに含まれる単語や解析結果のいずれかと同意または含意の関係にあるものの個数ないし割合と、予め定めたしきい値との比較により、例えば同意または含意の関係にある解析結果の割合(文Aの解析結果、文Bの解析結果のいずれについても)が予め定めたしきい値を超える場合に、文A,Bが互いに同意または含意の関係にあると判断することとしてもよい。この際、当該割合や個数に基づいて、同意または含意関係にあると判断できる確からしさ(確信度)を得点として求めてもよい。一例としては、文関係判定部24が、文Aの解析結果のうち、文Bに含まれる単語や解析結果のいずれかと同意または含意の関係にあるものの割合と、文Bの解析結果のうち、文Aに含まれる単語や解析結果のいずれかと同意または含意の関係にあるものの割合とを乗じた値を得点として生成し、文A,Bが互いに同意または含意の関係にあるか否かを表す情報とともに出力してもよい。
In the example shown here, all of the analysis results of the sentence A are in agreement or implication with any of the words or analysis results included in the sentence B, and all of the analysis results of the sentence B are in the sentence A. Although it has been determined that sentences A and B have an agreement or implication relationship with each other by determining that they have an agreement or implication relationship with any of the included words or analysis results, this embodiment is not limited to this. First, for example, among the analysis results of sentence A, the number or ratio (number of all analysis results) of words B that are in agreement or implications with any of the words or analysis results included in sentence B, and Among the analysis results, by comparing the number or ratio of the words included in the sentence A or the analysis result with the agreement or implication relationship with a predetermined threshold value, for example, the analysis with the agreement or implication relationship result When the ratio (both of the analysis result of sentence A and the analysis result of sentence B) exceeds a predetermined threshold value, it may be determined that sentences A and B are mutually in agreement or implication. . At this time, the probability (certainty factor) that can be determined to be an agreement or an implication relationship may be obtained as a score based on the ratio or the number. As an example, the sentence
このように、本実施の形態の情報処理装置1では、文A:「飼っていた亀が死んだ。」、文B:「ペットが亡くなった。」が入力され、両者が同意(つまり言い換え)または含意の関係にあるか否かを判断するよう指示されると、
As described above, in the
文Aについて、「飼う」、「亀」、「死ぬ」の単語に分割し、「飼う」、「死ぬ」といった述語に対し、「亀」は、それぞれ「対象」、「主体」という関係にあることを解析により得る。また文Bについても、「ペット」、「亡くなる」の単語に分割し、「亡くなる」という述語に対し、「ペット」が「主体」の関係にあることを解析により得る。 For sentence A, it is divided into the words “Kame”, “Turtle”, and “Die”. For the predicates “Kame” and “Die”, “Turtle” has a relationship of “Subject” and “Subject”, respectively. This is obtained by analysis. The sentence B is also divided into the words “pet” and “died”, and it is obtained by analysis that the “pet” has a “subject” relationship with the predicate “died”.
これによりこの解析の結果として、
文Aについて:
(1)引数:「亀」、述語:「飼う」、意味関係情報:「対象」
(2)引数:「亀」、述語:「死ぬ」、意味関係情報:「主格」
文Bについて:
(1)引数:「ペット」、述語:「亡くなる」、意味関係情報:「主格」
といった解析結果が記録される。
As a result of this analysis,
About sentence A:
(1) Argument: “turtle”, predicate: “keep”, semantic relation information: “target”
(2) Argument: “Turtle”, Predicate: “Die”, Semantic information: “Master”
About sentence B:
(1) Argument: “Pet”, Predicate: “Death”, Semantic information: “Main character”
Such an analysis result is recorded.
情報処理装置1は、まず文Bに含まれる単語のうち、役割情報語群に含まれる単語の集合RRを求める。ここでは「ペット」が役割情報語群に含まれる単語となる。この集合RRに含まれる各単語について、当該単語が概念情報として関連づけられている単語「チワワ」、「犬」、「動物」…と、「ペット」に関連づけられている概念情報「愛玩動物」、「動物」、「生物」とを得る。
The
情報処理装置1は文Aに含まれる単語のうち、ここで得た単語そのもの、または得られた概念情報に関連する単語があるか否かを調べる。ここでは文Aに含まれる単語「亀」の概念情報が「動物」であることから、情報処理装置1は、文Aには、得られた概念情報に関連する単語があると判断し、関連する単語「亀」を引数とする解析結果を取得する。
The
ここではかかる解析結果として、
(1)引数:「亀」、述語:「飼う」、意味関係情報:「対象」
(2)引数:「亀」、述語:「死ぬ」、意味関係情報:「主格」
が見出される。
Here, as the analysis result,
(1) Argument: “turtle”, predicate: “keep”, semantic relation information: “target”
(2) Argument: “Turtle”, Predicate: “Die”, Semantic information: “Master”
Is found.
情報処理装置1は、解析データベースを参照し、各解析結果に含まれる引数に想到する単語、述語、意味関係情報に関連するエントリを検索する。ここでは、(1)引数:「亀」、述語:「飼う」、意味関係情報:「対象」について、引数「亀」の概念情報である「動物」に対応し、
概念情報「動物」、述語「飼う」、意味関係情報「対象」、役割語「ペット」
というエントリが見出される。そしてこの役割語「ペット」が、文Bから取り出された役割語に一致するので、引数E:「亀」と、述語P:「飼う」との組を表す情報に、対応する集合RRの要素R(ここでは「ペット」)を関連づけて記憶する。
The
Concept information "animal", predicate "keep", semantic relation information "object", role word "pet"
Will be found. Since this role word “pet” matches the role word extracted from the sentence B, the element representing the set of the argument E: “turtle” and the predicate P: “bring” is included in the corresponding element of the set RR. R (here, “pet”) is associated and stored.
情報処理装置1は、次に文Aから、役割情報語群に含まれる単語の抽出を試みるが、対応する単語がないので、集合RRが空となり、結局、単語と述語の組は取り出されない。
Next, the
さらに情報処理装置1は、処理対象となる文A,文Bの解析結果のうち、役割語の観点で同意、または含意の関係にあると判断された箇所を除いた部分を特定する。
Further, the
ここでは、
文Aについて:
(2)引数:「亀」、述語:「死ぬ」、意味関係情報:「主格」
文Bについて:
(1)引数:「ペット」、述語:「亡くなる」、意味関係情報:「主格」
が特定される。そして、この特定した解析結果を参照して、同意または含意の関係にあるか否かを判断する。
here,
About sentence A:
(2) Argument: “Turtle”, Predicate: “Die”, Semantic information: “Master”
About sentence B:
(1) Argument: “Pet”, Predicate: “Death”, Semantic information: “Main character”
Is identified. Then, with reference to the identified analysis result, it is determined whether or not there is an agreement or implication relationship.
情報処理装置1は、これらが同意または含意の関係にあると判断できたならば、同意または含意の関係にあるか否かが不明である解析結果がなくなるので、文A,Bは互いに同意または含意の関係にあると判断して、その旨を表す情報を出力し、処理を終了する。
If the
また本実施の形態では、同意または含意の判断の結果に得点を関連づけて出力する場合、分析データベースにおいて単語そのものが述語に関連づけられているエントリと、概念情報が述語に関連づけられているエントリとが含まれる場合、役割語関係判定部23の処理S4(またはS4′)にて、処理S3(またはS3′)で見出した単語そのものと、概念情報に対応する単語とのいずれが、処理対象となっている他方の文(処理S1を文Bについて行う場合、文Aとなる)に含まれるかにより、得点を異ならせてもよい。すなわち例えば、単語そのものが含まれる場合の得点が、概念に対応する単語が含まれている場合の得点に比べて高くなるように設定してもよい。
Further, in the present embodiment, when a score is output in association with the result of consent or implication determination, an entry in which the word itself is associated with the predicate and an entry in which the conceptual information is associated with the predicate are included in the analysis database. If it is included, in the process S4 (or S4 ′) of the role word
さらに、本実施の形態の情報処理装置1は、文Aを検索のキーとして、複数の文B,C,D…のうちから同意または含意の関係にある文を抽出する処理を行ってもよい。この場合、情報処理装置1は、文Aと文B、文Aと文C…というように、検索の対象となる文B,C,D…の各々と、キーとなる文Aとの各対に対して上述の処理を行う。
Further, the
この場合の本実施の形態の情報処理装置1の制御部11は、機能的に、図7に例示するように、処理対象文入力部21と、解析部22と、役割語関係判定部23と、文関係判定部24とに加え、検索文入力部31と、検索部32と、順位付け部33とを含んで構成される。ここで既に説明した構成と同様の動作をする部分については同じ符号を付して、重複した説明を省略する。なお、この文関係判定部24は得点の情報を出力するものとする。
In this case, the
検索文入力部31は、検索のキーとなる文の入力を受け入れる。この検索のキーとなる文と同意または含意の関係にある文が、処理対象文入力部21で受け入れた文のうちから検索部32において検索される。
The search
検索部32は、予め定められた、複数の文が格納されているデータベースから、検索文入力部31で入力されたキーとなる文との間に予め定めた条件を満足する文を検索して抽出する。この検索の処理は、例えば、徳永健伸著、辻井潤一編,「情報検索と言語処理 言語と計算」,東京大学出版会、1999年等に開示されている方法を採用できる。検索部32は、そして、抽出した文を処理対象文入力部21に出力する。これにより検索部32が抽出した各文と、検索文入力部31で入力されたキーとなる文とが同意または含意の関係にあるか否かが、解析部22、役割語関係判定部23、文関係判定部24の処理により判断され、処理対象文入力部21で入力された各文のうち、文関係判定部24が得点とともに出力する判定の結果により、同意または含意の関係にあると判定された文を特定する情報がそれぞれの得点とともに出力される。
The
さらに順位付け部33は、文関係判定部24が出力する得点の情報を参照して、処理対象文入力部21で入力された各文のうち、文関係判定部24が出力する判定の結果により、同意または含意の関係にあると判定された文を、対応する得点の順で並べ替えて出力する。
Further, the ranking
具体的に、検索部32が、B:「ペットボトルを倒して人が死んだ」、C:「犬が病気で死ぬ」、D:「飼っていた亀が死んだ」の3つの文を検索により見出し(検索結果N=3件)、これらを処理対象文入力部21に入力したとする。これらについては、
文B:
(1)E:「ペットボトル」、P:「倒す」、M:「対象」
(2)E:「人」、P:「死ぬ」、M:「主体」
文C:
(1)E:「犬」、P:「死ぬ」、M:「主体」
(2)E:「病気」、P:「死ぬ」、M:「源泉」
文D:
(1)E:「亀」、P:「飼う」、M:「対象」
(2)E:「亀」、P:「死ぬ」、M:「主体」
の解析結果が得られる。ここでEは引数、Pは述語、Mは意味関係情報を表す。
Specifically, the
Sentence B:
(1) E: “Pet bottle”, P: “Defeat”, M: “Target”
(2) E: “People”, P: “Die”, M: “Subject”
Sentence C:
(1) E: “Dog”, P: “Die”, M: “Subject”
(2) E: “Illness”, P: “Die”, M: “Source”
Sentence D:
(1) E: “Turtle”, P: “Keep”, M: “Target”
(2) E: “Turtle”, P: “Die”, M: “Subject”
The analysis result is obtained. Here, E represents an argument, P represents a predicate, and M represents semantic relationship information.
さらに、検索のキーとなる文Aとして、「ペットが死んだ」が与えられたとすると、この文Aについては、
文A:
(1)E:「ペット」、P:「死ぬ」、M:「対象」
の解析結果が得られる。
Furthermore, if “pet is dead” is given as the sentence A which is the key of the search,
Sentence A:
(1) E: “Pet”, P: “Die”, M: “Target”
The analysis result is obtained.
また、文Aから得られる「ペット」の語が役割情報語群に含まれることから、「ペット」の役割語に対応する単語を文B,C,Dから検索する。すると、文B,Cにはこの役割語に対応する単語が見いだせず、文Dからは、既に説明したように、(E:「亀」、P:飼う)の関係が見いだされる。このとき、役割語関係判定部23が各文とキーとなる文との役割語の関係に基づいて、重みを得点として算出する。例えば役割語関係判定部23は、各文に表される意味関係情報の種類や実体の単語の具体性に応じて得点を算出することとしてもよい。つまり、対応する単語「亀」が、具体的な対象であるか「動物」のような抽象的な対象であるかにより、具体的なものであれば0.7点、抽象的なものであれば0.5点を加算することとし、意味関係情報が「対象」であれば1.0点、「時間」であれば0.5点を加算して、得点を演算することとすると、上記の結果から、文B,Cについて0点、文Dについては1.7点の得点が演算されることとなる。仮に、他に得点を演算しないこととしておくとすると、この得点が出力されることとなる。
Since the word “pet” obtained from the sentence A is included in the role information word group, the word corresponding to the role word “pet” is searched from the sentences B, C, and D. Then, the word corresponding to this role word is not found in the sentences B and C, and the relation of (E: “turtle”, P: keep) is found from the sentence D as already explained. At this time, the role word
順位付け部33は、この得点を数値的評価として参照し、評価の数値が最も高い文Dを筆頭として、続いて文B,Cを任意の順序で出力する。この出力はランキングとして表示されてもよい。なお、上述の得点方式や、数値評価の方法は、予め管理者が設定しておく。このように、文中の単語の役割を考慮に入れた処理を行うことにより、単にキーとなる文Aとの文字列の一致度からすれば最も一致する文Bよりも、文字列上の一致度は最も低いが、意味的関係にはよく適合する文Dがより高い順位で出力される。
The ranking
1 情報処理装置、11 制御部、12 記憶部、13 入力部、14 出力部、21 処理対象文入力部、22 解析部、23 役割語関係判定部、24 文関係判定部、31 検索文入力部、32 検索部、33 順位付け部。
DESCRIPTION OF
Claims (4)
単語の表す概念、または単語そのものに対して、関連し得る述語と、当該述語との意味上の関係を表す意味関係情報と、当該単語が述語とともに現れるときに当該単語が文中で持つ役割を表す役割情報とを互いに関連づけて保持する保持手段と、
処理対象となる一対の文について、一方の文に含まれる単語と、役割情報が共通する少なくとも一つの単語、または役割情報が共通する概念に対応する少なくとも一つの単語が、他方の文に含まれるか否かを解析する解析手段と、
前記解析手段の解析の結果に基づき、前記一対の文が、互いに意味が同じ同意関係、または、一方の処理対象文の意味が、他方の処理対象文の意味を含む含意関係にあるか否かを判定する判定手段と、
として機能させるプログラム。 Computer
Represents a predicate that can be related to the concept represented by the word or the word itself, semantic relationship information that represents the semantic relationship with the predicate, and the role that the word has in the sentence when the word appears with the predicate. Holding means for holding the role information in association with each other;
For a pair of sentences to be processed, at least one word that has the same role information and at least one word that has the same role information, or at least one word that corresponds to a concept that has the same role information, is included in the other sentence An analysis means for analyzing whether or not,
Whether or not the pair of sentences has an agreement relationship with the same meaning, or the meaning of one processing target sentence has an implication relation including the meaning of the other processing target sentence, based on the analysis result of the analyzing means Determining means for determining
Program to function as.
前記解析手段は、処理対象となる一対の文について、一方の文に含まれる単語と役割情報が共通する少なくとも一つの単語が他方の文に含まれる場合と、一方の文に含まれる単語と役割情報が共通する概念に対応する少なくとも一つの単語が、他方の文に含まれる場合とで、異なる得点情報を出力する請求項1記載のプログラム。 The holding means includes a predicate that can be related to the concept represented by the word and the word itself, semantic relationship information that represents a semantic relationship with the predicate, and the word when the word appears together with the predicate. Holds the role information representing the role that the word has in the sentence in association with each other,
The analyzing means includes a case where at least one word having the same role information as a word included in one sentence is included in the other sentence, and a word and a role included in one sentence of the pair of sentences to be processed. The program according to claim 1, wherein score information that is different from a case where at least one word corresponding to a concept with common information is included in the other sentence is output.
複数の文を対象として、当該複数の文の各々と、指定された文とを処理対象となる一対の文として前記解析手段による解析を行わせ、
前記解析手段により算出される得点情報を利用して、前記複数の文の各々を数値で評価し、当該評価の順に前記複数の文の各々を配列して提示する提示手段としてさらに機能させる、請求項2記載のプログラム。 The computer,
For a plurality of sentences, each of the plurality of sentences and the specified sentence are analyzed by the analyzing means as a pair of sentences to be processed,
The score information calculated by the analyzing means is used to evaluate each of the plurality of sentences numerically, and further function as a presentation means for arranging and presenting each of the plurality of sentences in the order of the evaluation. Item 2. The program according to item 2.
処理対象となる一対の文について、一方の文に含まれる単語と、役割情報が共通する少なくとも一つの単語、または役割情報が共通する概念に対応する少なくとも一つの単語が、他方の文に含まれるか否かを解析する解析手段と、
前記解析手段の解析の結果に基づき、前記一対の文が、互いに意味が同じ同意関係、または、一方の処理対象文の意味が、他方の処理対象文の意味を含む含意関係にあるか否かを判定する判定手段と、
を含む情報処理装置。
Represents a predicate that can be related to the concept represented by the word or the word itself, semantic relationship information that represents the semantic relationship with the predicate, and the role that the word has in the sentence when the word appears with the predicate. Holding means for holding the role information in association with each other;
For a pair of sentences to be processed, at least one word that has the same role information and at least one word that has the same role information, or at least one word that corresponds to a concept that has the same role information, is included in the other sentence An analysis means for analyzing whether or not,
Whether or not the pair of sentences has an agreement relationship with the same meaning, or the meaning of one processing target sentence has an implication relation including the meaning of the other processing target sentence, based on the analysis result of the analyzing means Determining means for determining
An information processing apparatus including:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011069497A JP5696555B2 (en) | 2011-03-28 | 2011-03-28 | Program and information processing apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011069497A JP5696555B2 (en) | 2011-03-28 | 2011-03-28 | Program and information processing apparatus |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012203779A JP2012203779A (en) | 2012-10-22 |
JP5696555B2 true JP5696555B2 (en) | 2015-04-08 |
Family
ID=47184688
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011069497A Expired - Fee Related JP5696555B2 (en) | 2011-03-28 | 2011-03-28 | Program and information processing apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5696555B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6049201B2 (en) * | 2013-08-05 | 2016-12-21 | Kddi株式会社 | Program, method, apparatus and server for generating co-occurrence patterns for detecting synonyms |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6076051A (en) * | 1997-03-07 | 2000-06-13 | Microsoft Corporation | Information retrieval utilizing semantic representation of text |
JP4938298B2 (en) * | 2004-11-30 | 2012-05-23 | パロ・アルト・リサーチ・センター・インコーポレーテッド | Method and program for outputting candidate sentences to be included in text summary |
JP5046170B2 (en) * | 2010-05-13 | 2012-10-10 | インターナショナル・ビジネス・マシーンズ・コーポレーション | SEARCH SYSTEM, SEARCH METHOD, REPORT SYSTEM, REPORT METHOD, AND PROGRAM |
-
2011
- 2011-03-28 JP JP2011069497A patent/JP5696555B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012203779A (en) | 2012-10-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Baik et al. | Bridging the semantic gap with SQL query logs in natural language interfaces to databases | |
CN107257970B (en) | Question answering from structured and unstructured data sources | |
US9715493B2 (en) | Method and system for monitoring social media and analyzing text to automate classification of user posts using a facet based relevance assessment model | |
EP2707818B1 (en) | Systems and methods for performing search and retrieval of electronic documents using a big index | |
US9280535B2 (en) | Natural language querying with cascaded conditional random fields | |
US20170308607A1 (en) | Method and System for a Semantic Search Engine | |
CN104331449B (en) | Query statement and determination method, device, terminal and the server of webpage similarity | |
Zhang | Towards efficient and effective semantic table interpretation | |
US10664530B2 (en) | Control of automated tasks executed over search engine results | |
US20160180438A1 (en) | Product recommendation with product review analysis | |
US20160180217A1 (en) | Question answering with entailment analysis | |
KR20170046611A (en) | Question sentence generation device and computer program | |
JP2015109068A (en) | Mechanisms, methods, computer programs and devices for identifying and displaying relationships between candidate answers | |
JP2013543172A (en) | Method, system, and computer program for automatically generating answers to questions | |
Tang et al. | Overview of the NTCIR-9 Crosslink Task: Cross-lingual Link Discovery. | |
Abdulla et al. | Improving biomedical information retrieval by linear combinations of different query expansion techniques | |
Kanagarajan et al. | Intelligent sentence retrieval using semantic word based answer generation algorithm with cuckoo search optimization | |
Baazaoui Zghal et al. | A system for information retrieval in a medical digital library based on modular ontologies and query reformulation | |
Sanz et al. | Fragment-based approximate retrieval in highly heterogeneous XML collections | |
Zhang | Start small, build complete: Effective and efficient semantic table interpretation using tableminer | |
Kiran et al. | An approach towards establishing reference linking in desktop reference manager | |
JP5696555B2 (en) | Program and information processing apparatus | |
Klang et al. | Linking, searching, and visualizing entities in wikipedia | |
KR101881398B1 (en) | Apparatus and method for processing biological system information | |
Tran et al. | A comparative study of question answering over knowledge bases |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140218 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140723 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140812 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141003 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150113 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150126 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5696555 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |