JP2008140204A - Data retrieval system and program - Google Patents

Data retrieval system and program Download PDF

Info

Publication number
JP2008140204A
JP2008140204A JP2006326533A JP2006326533A JP2008140204A JP 2008140204 A JP2008140204 A JP 2008140204A JP 2006326533 A JP2006326533 A JP 2006326533A JP 2006326533 A JP2006326533 A JP 2006326533A JP 2008140204 A JP2008140204 A JP 2008140204A
Authority
JP
Japan
Prior art keywords
search
word
unit
character string
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006326533A
Other languages
Japanese (ja)
Other versions
JP4435144B2 (en
Inventor
Akira Sasaki
晶 佐々木
Etsuo Ito
悦雄 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2006326533A priority Critical patent/JP4435144B2/en
Publication of JP2008140204A publication Critical patent/JP2008140204A/en
Application granted granted Critical
Publication of JP4435144B2 publication Critical patent/JP4435144B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To efficiently retrieve a word whose language itself is not understandable from an example even when the syntax and role on semantic meaning in a sentence with respect to a specific keyword is recognized without making it necessary to perform any complicate operation. <P>SOLUTION: When accepting the designation of first and second retrieval object words in a character string being the object of retrieval from a user, a retrieval character string language analyzing part 25 analyzes the syntax and role information on semantic meaning of each of words constituting a character string. A retrieval formula generation part 26 generates a retrieval formula including the syntax and role information on semantic meaning corresponding to the first retrieval object word and the second retrieval object word. A database retrieval part 27 retrieves example data including the words constituting the sentence registered in an example database 28 and the syntax and role information on meaning of each word in the sentence by using the retrieval formula. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、自然言語による検索文字列に基づいて情報を検索するデータ検索システム及びプログラムに関する。   The present invention relates to a data search system and program for searching for information based on a search character string in a natural language.

情報検索サービスの分野においては、ユーザが効率良く検索処理を行うことができる情報検索システムの構築が要請されている。一般的な情報検索システムにおいては、ユーザから入力されたキーワードと、検索対象となるデータベース等に登録された文字情報とを照合することで、完全に一致する文字列を含むデータが検索結果として出力されるようになっている。   In the field of information retrieval services, there is a demand for the construction of an information retrieval system that allows users to perform retrieval processing efficiently. In a general information search system, data including a completely matching character string is output as a search result by matching a keyword input by a user with character information registered in a database to be searched. It has come to be.

このような情報検索システムにおいて、ユーザは、特定のキーワードにおける文脈に即した用例を検索する場合があるが、このような検索処理においては、ユーザが希望する検索結果を得るまでに非常に手間がかかる場合がある。すなわち、上述の情報検索システムにおいては、キーワードは、単なる記号列として取り扱われ、その文脈上の役割などが考慮されることはない。このため、膨大な検索結果が得られた場合には、その検索結果を1つずつユーザが検討する必要がある。   In such an information search system, the user may search for an example in accordance with the context of a specific keyword. However, in such a search process, it takes much time to obtain the search result desired by the user. It may take such a case. That is, in the above-described information retrieval system, the keyword is handled as a simple symbol string, and its contextual role is not considered. For this reason, when enormous search results are obtained, it is necessary for the user to examine the search results one by one.

例えば、医学文書において、”The agents seem to be effective in the treatment of the pathogen.”という英文が記載されていたとする。医学分野において、”treatment”は、「治療」と和訳される場合が多いが、ユーザにおいて、”pathogen(病原体)”に対して「治療」という言葉を使用することが適切であるか定かでないものとする。このような場合、ユーザは、医学的な用例を検索してこの表現が適切であるか判断する。   For example, it is assumed that an English sentence “The agents seem to be effective in the treatment of the pathogen” is described in a medical document. In the medical field, “treatment” is often translated as “treatment”, but it is unclear whether or not it is appropriate for users to use the term “treatment” for “pathogen”. And In such a case, the user searches medical examples to determine if this expression is appropriate.

この際、ユーザが「病原体」と「治療」をキーワードに指定して検索を実行した場合、医学的な用例がある程度検索できれば、「病原体を治療する」が医学分野で用いられている表現だと判断できる。しかし、このような用例が検索できなかった場合には、この表現は、医学分野では用いられていないという見当はついても、正しい表現を得ることはできない。一方、ユーザが「病原体」をキーワードに指定して検索を実行した場合には、得られる検索結果の用例を1つずつ検討しなければならず、非常に手間がかかる。   In this case, if the user specifies “pathogen” and “treatment” as keywords and executes a search, if the medical example can be searched to some extent, “treat pathogen” is an expression used in the medical field. I can judge. However, if such an example cannot be retrieved, the correct expression cannot be obtained even though it is assumed that this expression is not used in the medical field. On the other hand, when the user designates “pathogen” as a keyword and executes a search, examples of search results to be obtained must be examined one by one, which is very troublesome.

上述した「病原体」に対する「治療」のように、ある特定のキーワードに対する文中での構文上の役割が分かっているキーワードを検索したいという要望に対しては、以下のような2つの検索方法が提案されている。   The following two search methods are proposed in response to a request to search for a keyword whose syntactic role in a sentence for a specific keyword is known, such as “treatment” for “pathogen” described above. Has been.

第1の検索方法においては、例えば、あるキーワードと、そのキーワードに後続する言葉の品詞や意味を指定した定義付きキーワードを作成し、言葉の品詞や意味情報を予め付与した用例データベースを検索するものである(例えば、特許文献1参照)。かかる検索方法においては、例えば、キーワードとして、{{動物}が走る}などを指定することにより、「XXが走る」という検索文字列に対して「XX」を含む用例を検索することができる。なお、この検索方法においては、{{動物}が*走る}というように、任意の文字をあらわすワイルドカード*を用いることもできる。   In the first search method, for example, a keyword with a definition specifying a keyword and a part of speech or meaning of a word following the keyword is created, and an example database in which the part of speech or meaning information of the word is assigned in advance is searched. (For example, see Patent Document 1). In such a search method, for example, by specifying {{animal} runs} as a keyword, an example including “XX” can be searched for a search character string “XX runs”. In this search method, it is possible to use a wild card * representing an arbitrary character such as {{animal} * runs}.

第2の検索方法においては、キーワードである名詞に対して、共起する動詞及び動作の場所等を示す名詞を、それらの格関係を指定して関連付けた辞書を作成しておく。そして、検索文字列に対して、形態素解析及び係り受け解析を行って、名詞及び動詞とそれらの格関係とを取得し、上記辞書から、検索文字列中の「名詞−動詞」の格関係が関連付けられたキーワード及びその共起語を検出するものである。かかる検索方法においては、例えば、辞書の中の「ワイン」というキーワードに「造る」という動詞、「ワイナリー」という場所が登録されているとする。ユーザから「ワインを上手に造れる場所が知りたい」という検索文字列が指定されると、「ワイン−造る」という「名詞−動詞」の格関係が取得される。これを用いて辞書を検索すると、「ワイナリー」という場所を表す語を検出することができる。この方法によって、「ワインを上手に造れるXXが知りたい」という検索文字列に対して「XX」を検索することができる。
特開平2−190972号公報 特開2005−275524号公報
In the second search method, a dictionary is created in which nouns that indicate co-occurring verbs and action locations are associated with nouns that are keywords by designating their case relations. Then, morphological analysis and dependency analysis are performed on the search character string to obtain nouns and verbs and their case relations, and from the dictionary, the case relation of “noun-verb” in the search character string is obtained. The associated keywords and their co-occurrence words are detected. In such a search method, for example, it is assumed that a verb “build” and a place “winery” are registered in a keyword “wine” in a dictionary. When the search character string “I want to know where to make wine well” is specified by the user, the “noun-verb” case relationship “wine-make” is acquired. By using this to search the dictionary, it is possible to detect a word representing a place “Winery”. By this method, “XX” can be searched for a search character string “I want to know XX that can make wine well”.
Japanese Patent Laid-Open No. 2-190972 JP 2005-275524 A

しかしながら、上述した第1の検索方法においては、文字列の繋がり方による制約が多く、用例の網羅や絞込みが難しいという問題がある。例えば、{{動物}が走る}をキーワードとした場合、{{動物}が凄い速さで走る}というように間に副詞が入った用例を検索することができない。これに対して、{{動物}が*走る}というようにワイルドカードを使用した場合には、{{動物}が逃げる後を猟犬が走る}というような用例もヒットしてしまい、用例をうまく絞り込むことができない。また、キーワードに動詞が続く場合には、動詞の活用型(五段活用など)や活用形(連用形など)などの情報もユーザが逐一指定する必要があり、文法に精通していないユーザには敷居が高い。さらに、用例の動詞の活用形は様々であるために、活用形のバリエーションを網羅したキーワードを用意する必要があり手間がかかるという問題もある。   However, in the first search method described above, there are many restrictions due to how the character strings are connected, and there is a problem that it is difficult to cover and narrow down examples. For example, if {{animal} runs} is the keyword, {{animal} runs at a tremendous speed} cannot be searched for an example with an adverb in between. On the other hand, if you use a wildcard such as {{animal} * run}, then an example such as {a hound runs after the {animal} runs away} will hit and the example will work well. Cannot narrow down. In addition, if a keyword is followed by a verb, the user must also specify information such as the verb usage type (five-level usage, etc.) and the usage type (continuous usage type, etc.). The threshold is high. Furthermore, since there are various usage forms of the verbs in the example, it is necessary to prepare keywords that cover variations of the usage forms, which is troublesome.

一方、上述した第2の検索方法においては、キーワードに対して関連語と格関係とを関連付けた辞書を予め作成しておく必要があり、手間がかかるという問題がある。   On the other hand, in the second search method described above, there is a problem that it is necessary to create a dictionary in which related words and case relationships are associated with keywords in advance, which is troublesome.

本発明は、煩雑な作業を必要とすることなく、特定のキーワードに対する文中での構文・意味上の役割は分かっていても、言葉自体が分からない語を用例から効率良く検索することができるデータ検索システム及びプログラムを提供することを目的とする。   The present invention is a data that can efficiently search a word that does not understand the word itself from an example without knowing the complicated task and knowing the syntactic and semantic role in a sentence for a specific keyword. An object is to provide a search system and a program.

本発明のデータ検索システムは、文を構成する語と文中における各語の構文及び意味上の役割情報とを含む用例データが登録されたデータベースと、検索対象となる文字列の入力を受け付ける検索文字列入力部と、前記検索対象となる文字列中における第1及び第2の検索対象語の指定を受け付ける検索対象語指定部と、前記検索対象となる文字列を構成する各語の構文及び意味上の役割情報を解析する文字列用言語解析部と、前記第1の検索対象語と前記第2の検索対象語に対応する構文及び意味上の役割情報とを含む検索式を生成する検索式生成部と、前記検索式を用いて前記データベース内の用例データを検索するデータベース検索部と、前記用例データの検索結果を出力する出力部とを具備することを特徴とする。   The data search system of the present invention includes a database in which example data including words constituting a sentence and syntax and semantic role information of each word in the sentence is registered, and a search character that receives input of a character string to be searched A column input unit, a search target word designating unit for accepting designation of the first and second search target words in the character string to be searched, and the syntax and meaning of each word constituting the character string to be searched A character string language analysis unit for analyzing the above role information, and a search expression for generating a search expression including the first search target word and the syntax and semantic role information corresponding to the second search target word A generation unit, a database search unit that searches for example data in the database using the search formula, and an output unit that outputs a search result of the example data are provided.

なお、装置に係る本発明は、コンピュータに、当該発明に相当する機能を実現させるためのプログラムとしても成立する。   Note that the present invention relating to the apparatus is also realized as a program for causing a computer to realize a function corresponding to the present invention.

本発明によれば、煩雑な作業を必要とすることなく、特定のキーワードに対する文中での構文・意味上の役割は分かっていても、言葉自体が分からない語を用例から効率良く検索することが可能となる。   According to the present invention, it is possible to efficiently search a word whose word itself is not understood from an example without knowing complicated work, even if the role of syntax and meaning in a sentence for a specific keyword is known. It becomes possible.

(第1の実施の形態)
図1は、本発明の第1の実施の形態に係わるデータ検索システムのハードウエア構成を示すブロック構成図である。図1に示すデータ検索システム11において、演算制御装置12は、本データ検索システム11におけるデータ検索に関連する各種の演算処理を行う。演算制御装置12には、表示装置13、マウス14、キーボード15、ディスクドライブ16及び補助記憶装置17が接続されている。表示装置13は、演算制御装置12の演算結果等を表示する。マウス14やキーボード15は、表示装置13を介して演算制御装置12に対する各種指令の入力に用いられる。ディスクドライブ16は、検索対象の文字列、後述する用例データベースに登録する文書などのファイルを記憶媒体に入出力する。補助記憶装置17は、演算制御装置12の演算結果や、用例データベース等を記憶するものであり、例えば、複数個のハードディスクドライブ(HDD)で構成される。
(First embodiment)
FIG. 1 is a block diagram showing the hardware configuration of the data search system according to the first embodiment of the present invention. In the data search system 11 shown in FIG. 1, the calculation control device 12 performs various calculation processes related to data search in the data search system 11. A display device 13, a mouse 14, a keyboard 15, a disk drive 16 and an auxiliary storage device 17 are connected to the arithmetic control device 12. The display device 13 displays the calculation result of the calculation control device 12 and the like. The mouse 14 and the keyboard 15 are used for inputting various commands to the arithmetic control device 12 via the display device 13. The disk drive 16 inputs / outputs a character string to be searched and a file such as a document to be registered in a later-described example database to / from a storage medium. The auxiliary storage device 17 stores a calculation result of the calculation control device 12, an example database, and the like, and includes, for example, a plurality of hard disk drives (HDDs).

演算制御装置12は、プロセッサ18とメモリ19とを含んで構成されている。メモリ19には、データ検索に関連するプログラム20が記憶されると共に、プロセッサ18により演算処理が実行される際に使用される作業エリア21が設けられている。   The arithmetic and control unit 12 includes a processor 18 and a memory 19. The memory 19 stores a program 20 related to data retrieval and a work area 21 used when arithmetic processing is executed by the processor 18.

図2は、第1の実施の形態に係わるデータ検索システム11の機能ブロック図である。図2に示す演算制御装置12内の各機能ブロックは、上述のプログラム20を構成する各プログラムに対応する。すなわち、プロセッサ18がプログラム20を構成する各プログラムを実行することで、演算制御装置12は、各機能ブロックとして機能することとなる。   FIG. 2 is a functional block diagram of the data search system 11 according to the first embodiment. Each functional block in the arithmetic and control unit 12 shown in FIG. 2 corresponds to each program constituting the program 20 described above. That is, when the processor 18 executes each program constituting the program 20, the arithmetic control device 12 functions as each functional block.

図2において、検索文字列入力部22は、検索対象となる文字列(以下、「検索文字列」という)の入力を受け付けるものである。例えば、検索文字列は、ユーザ自身がキーボード15等から直接入力されたり、記憶媒体を介してディスクドライブ16から入力される。なお、検索文字列の入力方式については、これらに限定されるものではなく、任意の入力方式が選択可能である。   In FIG. 2, a search character string input unit 22 receives an input of a character string to be searched (hereinafter referred to as “search character string”). For example, the search character string is directly input by the user from the keyboard 15 or the like, or is input from the disk drive 16 via the storage medium. The search character string input method is not limited to these, and any input method can be selected.

検索対象語指定部23は、検索文字列において、検索対象となる語(以下、「検索対象語」という)の指定を受け付けるものである。例えば、検索対象語は、マウス14等によるドラッグ操作によって指定される。詳細について後述するように、検索対象語は、検索式を生成するために使用されるものであり、指定される内容に応じて2種類の検索対象語が存在する。1つは、検索対象語の文字列そのものを指定するための文字列指定用の検索対象語である。もう1つは、文中における検索対象語の構文・意味上の役割を指定するための役割情報指定用の検索対象語である。   The search target word designating unit 23 receives designation of a search target word (hereinafter referred to as “search target word”) in the search character string. For example, the search target word is specified by a drag operation using the mouse 14 or the like. As will be described in detail later, the search target word is used to generate a search expression, and there are two types of search target words depending on the specified contents. One is a search target word for designating a character string for designating the character string itself of the search target word. The other is a search target word for specifying role information for specifying a syntactic and semantic role of the search target word in a sentence.

検索制御部24は、後述する検索文字列用言語解析部25、検索式生成部26及びデータベース検索部27を制御するものである。これらを制御することで、入力された検索文字列の言語解析を行うと共に、指定された検索対象語を用いた検索式を生成し、当該検索式を用いて用例データベース28に登録された用例データの検索を行う。   The search control unit 24 controls a search character string language analysis unit 25, a search expression generation unit 26, and a database search unit 27, which will be described later. By controlling these, language analysis of the input search character string is performed, a search expression using the specified search target word is generated, and the example data registered in the example database 28 using the search expression Search for.

検索文字列用言語解析部25は、文字列用言語解析部として機能し、検索文字列の言語解析を行うことにより、検索文字列を構成する各語の構文・意味上の役割情報を取得するものである。具体的には、自然言語処理では一般的に用いられる解析手法である、形態素解析、構文解析、係り受け解析及び意味解析を行うことにより、検索文字列を構成する各語の構文・意味上の役割情報を取得する。   The search character string language analysis unit 25 functions as a character string language analysis unit, and performs language analysis of the search character string, thereby acquiring syntactic and semantic role information of each word constituting the search character string. Is. Specifically, by performing morphological analysis, syntactic analysis, dependency analysis, and semantic analysis, which are analysis methods commonly used in natural language processing, the syntactic and semantics of each word constituting the search string Get role information.

検索式生成部26は、検索文字列を構成する各語の構文・意味上の役割情報を用いて検索式を生成するものである。具体的には、検索文字列内における、文字列指定用の検索対象語と、役割情報指定用の検索対象語の構文・意味上の役割情報とから検索式を生成する。   The search formula generation unit 26 generates a search formula using role information on the syntax and meaning of each word constituting the search character string. Specifically, a search expression is generated from a search target word for specifying a character string in the search character string and role information on the syntax and meaning of the search target word for specifying role information.

データベース検索部27は、後述する用例データベース28に登録された用例データを検索するものである。具体的には、用例データベース28に登録された用例データと検索式との間で、検索対象語及び構文・意味上の役割情報の比較を行うことで検索を行う。   The database search unit 27 searches for example data registered in an example database 28 described later. Specifically, the search is performed by comparing the search target word and the role information on the syntax and meaning between the example data registered in the example database 28 and the search formula.

用例データベース28には、文を構成する語と、文脈中における各語の構文・意味上の役割情報とを含む用例データ(以下、適宜「文データ」という)が複数登録されている。例えば、用例データベース28への文データは、ディスクドライブ16に挿入された記憶媒体を介して登録される。なお、ここでは予め各文データにおいて、文を構成する各語に対して構文・意味上の役割情報が関連付けられているものとする。   In the example database 28, a plurality of example data (hereinafter referred to as “sentence data” as appropriate) including words constituting a sentence and syntax / semantic role information of each word in the context are registered. For example, sentence data for the example database 28 is registered via a storage medium inserted in the disk drive 16. Here, in each sentence data, it is assumed that role information on syntax and meaning is associated with each word constituting the sentence in advance.

出力部29は、用例データベース28に登録された文データの検索結果を出力するものである。例えば、表示装置13に表示することで検索結果を出力する。しかし、これに限定されるものではなく、表示装置13による出力に代え、あるいは、表示装置13による出力に加えて音声により検索結果を出力するようにしても良い。   The output unit 29 outputs a search result of sentence data registered in the example database 28. For example, the search result is output by displaying on the display device 13. However, the present invention is not limited to this, and the search result may be output by voice instead of the output by the display device 13 or in addition to the output by the display device 13.

次に、第1の実施の形態に係わるデータ検索システム11における検索処理について図3を用いて説明する。図3は、第1の実施の形態に係わるデータ検索システム11における検索処理について説明するためのフロー図である。   Next, search processing in the data search system 11 according to the first embodiment will be described with reference to FIG. FIG. 3 is a flowchart for explaining search processing in the data search system 11 according to the first embodiment.

第1の実施の形態に係わるデータ検索システム11を用いて検索処理を行う場合、まず、ユーザから検索文字列が入力されるので、検索文字列入力部22は、この検索文字列の入力を受け付ける(ステップS31)。検索文字列が入力された後、今度は、ユーザから検索文字列における検索対象語が指定されるので、検索対象語指定部23は、この検索対象語の指定を受け付ける(ステップS32)。このとき、ユーザからは、文字列指定用の検索対象語及び役割情報指定用の検索対象語が指定される。検索文字列においては、それぞれの検索対象語に識別子が付与される。   When a search process is performed using the data search system 11 according to the first embodiment, first, a search character string is input from the user, and the search character string input unit 22 receives an input of this search character string. (Step S31). After the search character string is input, the search target word in the search character string is specified from the user this time, and the search target word specifying unit 23 accepts the specification of the search target word (step S32). At this time, the user designates a search target word for designating a character string and a search target word for designating role information. In the search character string, an identifier is assigned to each search target word.

検索対象語が指定されると、検索文字列用言語解析部25は、検索文字列の言語解析を行う(ステップS33)。これにより、検索文字列を構成する各語の構文・意味上の役割情報が取得され、各語に対応する構文・意味上の役割情報が付与される。そして、検索式生成部26は、文字列指定用の検索対象語と、役割情報指定用の検索対象語に付与された構文・意味上の役割情報とから検索式を生成する(ステップS34)。   When the search target word is designated, the search character string language analysis unit 25 performs language analysis of the search character string (step S33). As a result, the syntactic and semantic role information of each word constituting the search character string is acquired, and the syntactic and semantic role information corresponding to each word is given. Then, the search expression generation unit 26 generates a search expression from the search target word for character string specification and the syntactic / semantic role information given to the search target word for role information specification (step S34).

検索式が生成されたならば、データベース検索部27は、当該検索式と、用例データベース28に登録されている各文データとの間で、検索対象語及び構文・意味上の役割情報を比較することで検索を行う(ステップS35)。そして、一定の判断基準により同一と判断される文データが存在する場合には、当該文データを用例データベース28から抽出して検索結果とする。一方、上記判断基準により同一と判断される文データが存在しない場合には、該当する文データが存在しない旨を検索結果とする。データベース検索部27による検索が完了すると、出力部29は、その検索結果を出力する(ステップS36)。このようにして第1の実施の形態における一連の検索処理が終了する。   If the search formula is generated, the database search unit 27 compares the search target word and the role information on the syntax and meaning between the search formula and each sentence data registered in the example database 28. Thus, a search is performed (step S35). If there is sentence data that is determined to be the same according to a certain criterion, the sentence data is extracted from the example database 28 and used as a search result. On the other hand, when there is no sentence data determined to be the same according to the above criteria, the search result indicates that the corresponding sentence data does not exist. When the search by the database search unit 27 is completed, the output unit 29 outputs the search result (step S36). In this way, a series of search processing in the first embodiment is completed.

以下、図3に示す検索処理について具体例を用いて説明する。ここでは、ユーザから、検索文字列として「その薬剤は、その病原体の治療に有効と思われる。」が入力され、また、文字列指定用の検索対象語として「病原体」が指定され、役割情報指定用の検索対象語として「治療」が指定されたものとする。   Hereinafter, the search process shown in FIG. 3 will be described using a specific example. Here, “the drug seems to be effective for the treatment of the pathogen” is input as a search character string from the user, “pathogen” is specified as a search target word for character string specification, and role information It is assumed that “treatment” is designated as a search target word for designation.

検索文字列入力部22及び検索対象語指定部23により、これらのような検索文字列の入力及び検索対象語の指定が受け付けられると(ステップS31、S32)、検索文字列用言語解析部25により、当該検索文字列の言語解析が行われる(ステップS33)。かかる言語解析の最終結果として、図4に示すツリー構造が得られ、文を構成する自立語(ノード)と、各自立語間の構文・意味上の関係(リンク)が明らかになる。この場合、図4に示すように、「病原体」は、「治療」の意味上の目的語になっており、「治療」の構文・意味上の役割情報として<「病原体」を意味上の目的語とする語>が取得される。   When the search character string input unit 22 and the search target word specifying unit 23 accept the input of the search character string and the specification of the search target word (steps S31 and S32), the search character string language analyzing unit 25 Then, language analysis of the search character string is performed (step S33). As a final result of such linguistic analysis, the tree structure shown in FIG. 4 is obtained, and the independent words (nodes) constituting the sentence and the syntactic and semantic relationships (links) between the independent words are clarified. In this case, as shown in FIG. 4, “pathogen” is a semantic object of “treatment”, and <pathogen ”is defined as a semantic object of the syntax and semantic role information of“ treatment ”. The word> is acquired.

ここで、検索文字列用言語解析部25における言語解析の内容について図5及び図6を用いて補足する。検索文字列用言語解析部25は、まず、検索文字列の形態素解析を行い、これに続いて構文解析または係り受け解析を行い、最後に意味解析を行う。   Here, the contents of the language analysis in the search character string language analysis unit 25 will be supplemented with reference to FIGS. The search character string language analysis unit 25 first performs morphological analysis of the search character string, subsequently performs syntax analysis or dependency analysis, and finally performs semantic analysis.

上述の検索文字列「その薬剤は、その病原体の治療に有効と思われる。」に対して、形態素解析を行うと、図5に示す解析結果が得られる。図5に示す解析結果においては、検索文字列を構成する各語に対して、品詞、活用形、可能性のある接続形態などが関連付けられている。そして、図5に示す形態素解析の解析結果に対して、構文解析または係り受け解析を行うと、図6に示すツリー構造が得られ、文を構成する自立語(ノード)と、各自立語間の格関係(リンク)が明らかになる。さらに、図6に示すツリー構造に対して意味解析を行うと、図4に示すように、リンクの内容が構文・意味上の役割情報に置き換わったツリー構造が得られる。   When the morphological analysis is performed on the search character string “the drug seems to be effective for the treatment of the pathogen”, the analysis result shown in FIG. 5 is obtained. In the analysis result shown in FIG. 5, the part of speech, the utilization form, the possible connection form, and the like are associated with each word constituting the search character string. Then, when syntactic analysis or dependency analysis is performed on the analysis result of the morphological analysis shown in FIG. 5, the tree structure shown in FIG. 6 is obtained, and the independent words (nodes) constituting the sentence and the distance between each independent word are obtained. The case relationship (link) becomes clear. Furthermore, when semantic analysis is performed on the tree structure shown in FIG. 6, a tree structure in which the contents of the link are replaced with syntactic and semantic role information is obtained as shown in FIG.

このような検索文字列の言語解析が完了すると、検索式生成部26により、ステップS32で指定された文字列指定用の検索対象語「病原体」と、ステップS33で取得された「治療」の構文・意味上の役割情報<「病原体」を意味上の目的語とする語>とから、検索式が生成される(ステップS34)。この場合、生成される検索式は、例えば、図7(a)に示すツリー構造、あるいは、図7(b)に示す文字列で表われる。   When the linguistic analysis of such a search character string is completed, the search expression generation unit 26 uses the search target word “pathogen” for specifying the character string specified in step S32 and the syntax of “treatment” acquired in step S33. A search expression is generated from the semantic role information <a word having “pathogen” as a semantic object> (step S34). In this case, the generated search expression is represented by, for example, a tree structure shown in FIG. 7A or a character string shown in FIG.

このような検索式が生成されると、データベース検索部27により、当該検索式を用いて用例データベース28に登録された文データの検索が行われる(ステップS35)。具体的には、ツリー構造のノード及びリンクのマッチングを行うことで、用例データベース28に登録された文データの検索を行う。なお、このようなマッチングの手法は、同出願人による特開2005−208825に開示される既存の手法であり、その説明を省略する。そして、データベース検索部27による検索が完了すると、出力部29は、その検索結果を出力する(ステップS36)。   When such a search expression is generated, the database search unit 27 searches the sentence data registered in the example database 28 using the search expression (step S35). Specifically, sentence data registered in the example database 28 is searched by matching nodes and links in a tree structure. Note that such a matching technique is an existing technique disclosed in Japanese Patent Laid-Open No. 2005-208825 by the same applicant, and the description thereof is omitted. When the search by the database search unit 27 is completed, the output unit 29 outputs the search result (step S36).

なお、実際の用例データベース28では、文字ベースでデータが登録されている。上述の検索文字列「その薬剤は、その病原体の治療に有効と思われる。」及び上述の検索式が用例データベース28に登録されているとすると、これらは、例えば、以下の形式で登録される。   In the actual example database 28, data is registered on a character basis. Assuming that the above search character string “the drug seems to be effective for the treatment of the pathogen” and the above search formula are registered in the example database 28, these are registered in the following format, for example. .

検索文字列 : 思う(innyo_有効(taisho_治療(imi_mokuteki_病原体(shiji_その))) syugo_薬剤(shiji_その))
検索式 : 治療(imi_mokuteki_病原体)
この例においては、カッコが単語同士の繋がりを表しており、ローマ字で記された文字列が構文・意味上の役割情報を表している。これらの用例と検索式は、「治療(imi_mokuteki_病原体」という部分が一致することで、マッチしたと判断されることとなる。
Search string : I think (innyo_effective (taisho_treatment (imi_mokuteki_pathogen (shiji_part))) syugo_drug (shiji_part))
Search formula: Treatment (imi_mokuteki_pathogen)
In this example, parentheses indicate a connection between words, and a character string written in Roman letters indicates syntax / semantic role information. These examples and search formulas are judged to have been matched by matching the part of “treatment (imi_mokuteki_pathogen)”.

例えば、用例データベース28に、以下のような文データが登録されているものとする。なお、各文データにおける先頭の番号は、説明の便宜上付与したものである。   For example, it is assumed that the following sentence data is registered in the example database 28. The head number in each sentence data is given for convenience of explanation.

1.YY病患者の治療には、WW病原体の除去が…
2.YY病の病原体はWWである。
1. To treat YY disease patients, removal of WW pathogens ...
2. The pathogen of YY disease is WW.

3.WW病原体の取り扱いは、厳重に管理する必要がある。 3. The handling of WW pathogens must be strictly controlled.

4.YY病の治療薬であるUUは、…
5.VV病原体を処理するには、…
6.VV病原体の消毒には、…
このような文データが登録された用例データベースに対して、
「病原体+<「病原体」を意味上の目的語とする語>」
という検索式で検索を行うと、以下に示すように、「病原体」を意味上の目的語とする語を含む用例(文データ)を検索することができる。ここで、キーワードに「病原体」または「治療」を指定しただけでは検索結果に含まれてしまう文データ2、4は、上記検索結果には含まれていない。このように文中における構文・意味上の役割情報を特定して検索を行うことで検索結果が絞り込まれていることが分かる。
4). UU, a therapeutic agent for YY disease ...
5. To treat VV pathogens ...
6). To disinfect VV pathogens ...
For an example database in which such sentence data is registered,
“Pathogen + <word with“ pathogen ”as a semantic object>”
When a search is performed using the search expression, it is possible to search for an example (sentence data) including a word having “pathogen” as a semantic object as shown below. Here, the sentence data 2 and 4 that are included in the search result only by specifying “pathogen” or “treatment” as a keyword are not included in the search result. In this way, it is understood that the search results are narrowed down by performing the search by specifying the syntactic and semantic role information in the sentence.

1.YY病患者の治療には、WW病原体の除去が…
3.WW病原体の取り扱いは、厳重に管理する必要がある。
1. To treat YY disease patients, removal of WW pathogens ...
3. The handling of WW pathogens must be strictly controlled.

5.VV病原体を処理する場合には、…
6.VV病原体の消毒には、…
なお、「病原体」を目的語とする動詞を検索する場合には、例えば、「病原体」ではなく、「病原体を」で検索するという方法も考えられる。しかしながら、この方法では、「病原体」を意味上の目的語としていながら、接続する助詞が「を」でない場合を検出することができず、検出できる用例(文データ)に限界がある。一方、他に接続する可能性のある助詞(「の」、「が」等)を網羅しようとすると、「病原体」を意味上の目的語としない用例も多数検出され、検索の精度が低下する。これに対し、本データ検索システム11においては、「病原体」を意味上の目的語とする語を直接検索の対象とすることができるため、より目的に即した検索を行うことが可能となる。
5. When treating VV pathogens ...
6). To disinfect VV pathogens ...
When searching for a verb having “pathogen” as an object, for example, a method of searching for “pathogen” instead of “pathogen” is conceivable. However, this method cannot detect a case where the particle to be connected is not “O” while using “pathogen” as a semantic object, and there is a limit to the example (sentence data) that can be detected. On the other hand, if we try to cover particles that may be connected to other words (such as “no”, “ga”, etc.), many examples that do not have “pathogen” as a semantic object are detected, and the accuracy of the search is reduced. . On the other hand, in this data search system 11, since a word having “pathogen” as a semantic object can be directly searched, it is possible to perform a search more suited to the purpose.

以上説明したように、第1の実施の形態に係わるデータ検索システム11においては、文字列指定用の検索対象語と、役割情報指定用の検索対象語に付与された構文・意味上の役割情報とを含む検索式を用いて、用例データベース28に登録された用例データを検索するようにしている。これにより、検索文字列中のある検索対象語に対して特定の構文・意味上の役割を有する語を、文字列を固定しないで、用例データベース28から検索することが可能となる。   As described above, in the data search system 11 according to the first embodiment, the search target word for character string designation and the syntactic / semantic role information given to the search target word for role information designation The example data registered in the example database 28 is searched using a search expression including As a result, a word having a specific syntactic / semantic role for a search target word in the search character string can be searched from the example database 28 without fixing the character string.

また、用例データベース28に登録される用例データは、例えば、ディスクドライブ16に挿入された記憶媒体を介して登録される。このため、従来の検索方法のように、あるキーワードに対して関連語と核関係とを関連付けた辞書を予め作成するような作業が不要となるため、煩雑な作業を必要とすることなく、特定のキーワードに対する文中での構文・意味上の役割は分かっていても、言葉自体が分からない語を用例から効率良く検索することが可能となる。   Further, the example data registered in the example database 28 is registered via, for example, a storage medium inserted in the disk drive 16. This eliminates the need to create a dictionary in which related words and nuclear relationships are associated with certain keywords in advance, unlike conventional search methods. Even if the syntactic and semantic roles of a keyword in the sentence are known, it is possible to efficiently search for a word that does not know the word itself from an example.

さらに、構文・意味上の役割情報は、検索文字列用言語解析部25による検索文字列の言語解析により取得され、この言語解析の解析結果に応じて検索式が生成されるので、ユーザに特別な処理を要求することなくユーザが希望する用例を検索することが可能となる。   Furthermore, the role information on the syntax and semantics is acquired by the language analysis of the search character string by the search character string language analysis unit 25, and a search expression is generated according to the analysis result of the language analysis. This makes it possible to search for an example desired by the user without requiring a special process.

(第2の実施の形態)
第1の実施の形態に係わるデータ検索システム11においては、検索式を用いた用例データベース28の検索処理により該当する文データが得られなかった場合にはその旨を検索結果として出力する。これに対し、第2の実施の形態に係わるデータ検索システム11においては、検索式を用いた用例データベース28の検索処理により該当する文データが得られなかった場合、用例データベース28への新たな文書の登録処理や、用例データベース28に未登録の文書の検索処理をユーザに選択させる点で第1の実施の形態に係わるデータ検索システム11と相違する。
(Second Embodiment)
In the data search system 11 according to the first embodiment, when the corresponding sentence data is not obtained by the search process of the example database 28 using the search expression, the fact is output as a search result. On the other hand, in the data search system 11 according to the second embodiment, if the corresponding sentence data is not obtained by the search processing of the example database 28 using the search formula, a new document to the example database 28 is obtained. This is different from the data search system 11 according to the first embodiment in that the user can select the registration process and search process for documents not registered in the example database 28.

図8は、本発明の第2の実施の形態に係わるデータ検索システム11の機能ブロック図である。なお、図8において、図2と同一要素には同一符号を付し、重複する説明は省略する。第2の実施の形態に係わるデータ検索システム11においては、図8に示すように、用例データベース28に新たな文書を登録するための要素、並びに、用例データベース28に未登録の文書を検索するための要素を備える点で第1の実施の形態に係わるデータ検索システム11と相違する。   FIG. 8 is a functional block diagram of the data search system 11 according to the second embodiment of the present invention. In FIG. 8, the same elements as those in FIG. In the data search system 11 according to the second embodiment, as shown in FIG. 8, an element for registering a new document in the example database 28 and a document not registered in the example database 28 are searched. The data retrieval system 11 according to the first embodiment is different from the data retrieval system 11 according to the first embodiment.

図8において、新規文書入力部30は、用例データベース28に新たに登録する文書(以下、「新規文書」という)の入力を受け付けるものである。例えば、新規文書は、記憶媒体を介してディスクドライブ16から入力される。なお、新規文書の入力方式については、これらに限定されるものではなく、任意の入力方式が選択可能である。   In FIG. 8, a new document input unit 30 receives an input of a document to be newly registered in the example database 28 (hereinafter referred to as “new document”). For example, a new document is input from the disk drive 16 via a storage medium. Note that the input method of the new document is not limited to these, and any input method can be selected.

データベース構築制御部31は、データベース登録部として機能し、後述する関連文書用言語解析部33を制御するものである。関連文書用言語解析部33を制御することで、例えば、用例データベース28に新たに登録される新規文書の言語解析を行う。   The database construction control unit 31 functions as a database registration unit and controls a related document language analysis unit 33 described later. By controlling the related document language analysis unit 33, for example, language analysis of a new document newly registered in the example database 28 is performed.

文分割部32は、入力された新規文書を1文単位に分割するものである。   The sentence division unit 32 divides the input new document into one sentence unit.

関連文書用言語解析部33は、新規文書用言語解析部として機能し、入力された新規文書の言語解析を行うことにより、新規文書に含まれる文を構成する各語の構文・意味上の役割情報を取得するものである。具体的には、新規文書に含まれる文の形態素解析、構文解析、係り受け解析及び意味解析を行うことにより、新規文書に含まれる文を構成する各語の構文・意味上の役割情報を取得する。また、関連文書用言語解析部33は、外部文書用言語解析部として機能し、後述する1次情報の言語解析を行うことにより、1次情報に含まれる文を構成する各語の構文・意味上の役割情報を取得するものである。   The related document language analysis unit 33 functions as a new document language analysis unit, and performs a language analysis of the input new document, thereby performing a syntactic and semantic role of each word constituting a sentence included in the new document. Information is acquired. Specifically, by performing morphological analysis, syntax analysis, dependency analysis, and semantic analysis of sentences included in a new document, the role information on the syntax and meaning of each word constituting the sentence included in the new document is obtained. To do. Further, the related document language analysis unit 33 functions as an external document language analysis unit, and performs the language analysis of the primary information described later to thereby construct the syntax and meaning of each word constituting the sentence included in the primary information. The above role information is acquired.

外部文書検索制御部34は、後述する外部文書検索部35及び関連文書用言語解析部33を制御するものである。これらを制御することにより、上述の検索式生成部26で生成された検索式に含まれる検索対象語に応じて検索を行うと共に、検索の結果得られた1次情報の言語解析を行う。   The external document search control unit 34 controls an external document search unit 35 and a related document language analysis unit 33 described later. By controlling these, a search is performed in accordance with a search target word included in the search expression generated by the search expression generation unit 26 described above, and language analysis of primary information obtained as a result of the search is performed.

外部文書検索部35は、Webあるいは既存の他のデータベースなどから、用例データベース28に登録されていない文書(以下、「外部文書」という)を検索するものである。具体的には、上述の検索式生成部26で生成された検索式に含まれる検索対象語に応じて、Webあるいは既存の他のデータベースなどを対象に外部文書を検索する。   The external document retrieval unit 35 retrieves a document (hereinafter referred to as “external document”) that is not registered in the example database 28 from the Web or another existing database. Specifically, an external document is searched for the Web or another existing database according to the search target word included in the search expression generated by the search expression generation unit 26 described above.

次に、第2の実施の形態に係わるデータ検索システム11における検索処理について図9を用いて説明する。図9は、第2の実施の形態に係わるデータ検索システム11における検索処理について説明するためのフロー図である。第2の実施の形態における検索処理は、用例データベース28の検索結果が得られたかを判定し、検索結果が得られない場合に後述する関連文書処理を行う点で、第1の実施の形態における検索処理と相違する。なお、図9において、図3と同一処理には同一符号を付し、重複する説明は省略する。   Next, search processing in the data search system 11 according to the second embodiment will be described with reference to FIG. FIG. 9 is a flowchart for explaining search processing in the data search system 11 according to the second embodiment. The search processing according to the second embodiment determines whether or not the search result of the example database 28 is obtained, and performs related document processing described later when the search result is not obtained. Differs from search processing. In FIG. 9, the same processes as those in FIG.

図9に示すように、第2の実施の形態に係わるデータ検索システム11においては、データベース検索部27が用例データベース28の検索を行った後、検索制御部24は、検索結果が得られたかを判定する(ステップS41)。ここで、検索結果が得られなかった場合には、新規文書の登録あるいは外部文書の検索を行う関連文書処理が行われる(ステップS42)。   As shown in FIG. 9, in the data search system 11 according to the second embodiment, after the database search unit 27 searches the example database 28, the search control unit 24 checks whether the search result is obtained. Determination is made (step S41). If no search result is obtained, a related document process for registering a new document or searching for an external document is performed (step S42).

図10は、第2の実施の形態に係わるデータ検索システム11の関連文書処理を説明するためのフロー図である。図10に示すように、関連文書処理においては、まず、ユーザに対して新規文書の登録を行うか否かが問われる(ステップS50)。ユーザから新規文書の登録指示を受け付けた場合には、登録指示に続いて新規文書が入力されるので、新規文書入力部30は、この新規文書の入力を受け付ける(ステップS51)。なお、ここでの新規文書には、検索文字列の分野で定評のある書籍、規格書及び社内文書等の用語の使われ方に十分信頼がおける文書など、まるごとデータベースに登録して問題ない文書が考えられる。   FIG. 10 is a flowchart for explaining related document processing of the data search system 11 according to the second embodiment. As shown in FIG. 10, in the related document processing, first, the user is asked whether or not to register a new document (step S50). When a new document registration instruction is received from the user, the new document is input following the registration instruction, and the new document input unit 30 receives the input of the new document (step S51). The new documents here include documents that have a reputation in the field of search character strings, documents that are sufficiently reliable in terms such as books and standards, and in-house documents. Can be considered.

新規文書を受け付けると、文分割部32は、この新規文書を1文単位に分割する(ステップS52)。そして、関連文書用言語解析部33は、1文単位に分割された新規文書に含まれる文の言語解析を行う(ステップS53)。これにより、各文を構成する各語の構文・意味上の役割情報が取得され、各語に構文・意味上の役割情報が付与される。構文・意味上の役割情報が付与されると、データベース構築制御部31は、この新規文書を用例データベース28に登録する(ステップS54)。これにより、新規文書に含まれる文が、各語に構文・意味上の役割情報が付与された状態で用例データベース28に登録されることとなる。   When the new document is received, the sentence dividing unit 32 divides the new document into one sentence unit (step S52). Then, the related document language analysis unit 33 performs language analysis of a sentence included in the new document divided into one sentence (step S53). As a result, the syntactic and semantic role information of each word constituting each sentence is acquired, and the syntactic and semantic role information is given to each word. When the syntactic / semantic role information is given, the database construction control unit 31 registers the new document in the example database 28 (step S54). As a result, the sentence included in the new document is registered in the example database 28 with syntax and semantic role information added to each word.

新規文書が登録されたならば、データベース検索部27は、図9に示すステップS34で生成された検索式と、用例データベース28に登録されている各文データ(新規文書の文データを含む)との間で、検索対象語及び構文・意味上の役割情報を比較することで検索を行う(ステップS55)。そして、検索制御部24は、検索結果が得られたかを判断する(ステップS56)。ここで、検索結果が得られた場合には、処理を図9に示すステップS36に移行し、出力部29は、検索結果を出力する。一方、検索結果が得られない場合には、処理がステップS50に戻し、再び、ステップS50以降の処理が行われる。   If the new document is registered, the database search unit 27 stores the search formula generated in step S34 shown in FIG. 9 and each sentence data (including sentence data of the new document) registered in the example database 28. The search is performed by comparing the search target word and the role information in the syntax and meaning (step S55). Then, the search control unit 24 determines whether a search result has been obtained (step S56). If a search result is obtained, the process proceeds to step S36 shown in FIG. 9, and the output unit 29 outputs the search result. On the other hand, when the search result cannot be obtained, the process returns to step S50, and the processes after step S50 are performed again.

一方、ステップS50において、例えば、一定時間、新規文書の登録指示を受け付けない場合には、ユーザに対して外部文書の検索を行うか否かが問われる(ステップS57)。なお、ここでの外部文書には、インターネットなどに存在する、用語の使われ方の信頼性が十分ではない文書などを含めても良い。ここで、ユーザから外部文書の検索指示を受け付けた場合には、外部文書検索部35は、外部文書の検索を行う(ステップS58)。この場合において、外部文書検索部35は、図9に示すステップS34で生成した検索式のうち、文字列指定用の検索対象語だけを用いた1次検索を行い、それらの検索対象語を含む文を収集する。   On the other hand, in step S50, for example, when a registration instruction for a new document is not accepted for a certain period of time, the user is asked whether or not to search for an external document (step S57). Note that the external document here may include a document that exists on the Internet or the like and that is not sufficiently reliable in terms. When an external document search instruction is received from the user, the external document search unit 35 searches for an external document (step S58). In this case, the external document search unit 35 performs a primary search using only the search target words for character string designation among the search expressions generated in step S34 shown in FIG. 9, and includes those search target words. Collect sentences.

1次検索結果(1次情報)が収集されると、関連文書用言語解析部33は、この1次情報の言語解析を行う(ステップS59)。これにより、収集された1次情報に含まれる各文を構成する各語の構文・意味上の役割情報が取得され、各語に構文・意味上の役割情報が付与される。構文・意味上の役割情報が付与されると、外部文書検索部35は、これらの1次情報に含まれる文を対象に、図9のステップS34で生成した検索式を用いた2次検索を行う(ステップS60)。2次検索を行ったならば、処理がステップ56に移行され、検索制御部24は、検索結果が得られたかを判断する。ここで、検索結果が得られた場合には、処理を図9に示すステップS36に移行し、出力部29は、2次検索結果を出力する。一方、検索結果が得られない場合には、処理がステップS50に戻し、再び、ステップS50以降の処理が行われる。このようにして第2の実施の形態における一連の検索処理が終了する。   When the primary search result (primary information) is collected, the related document language analysis unit 33 performs language analysis of the primary information (step S59). As a result, the syntactic and semantic role information of each word constituting each sentence included in the collected primary information is acquired, and the syntactic and semantic role information is assigned to each word. When the syntactic / semantic role information is given, the external document search unit 35 performs a secondary search using the search expression generated in step S34 of FIG. 9 for the sentence included in the primary information. It performs (step S60). If a secondary search is performed, the process proceeds to step 56, and the search control unit 24 determines whether a search result has been obtained. If a search result is obtained, the process proceeds to step S36 shown in FIG. 9, and the output unit 29 outputs the secondary search result. On the other hand, when the search result cannot be obtained, the process returns to step S50, and the processes after step S50 are performed again. In this way, a series of search processing in the second embodiment is completed.

なお、外部文書を検索して、望ましい検索結果が得られたときには、その検索結果をデータベース構築制御部31に送って用例データベース28に登録することも可能である。   When a desired search result is obtained by searching an external document, the search result can be sent to the database construction control unit 31 and registered in the example database 28.

以上説明したように、第2の実施の形態に係わるデータ検索システム11においては、用例データベース28に登録済みの用例データから所望の検索結果が得られない場合には、ユーザの選択に応じて新規文書を登録できるようにしたことから、構文・意味上の役割情報とを含む用例データベース28を、任意の新規文書から構築することが可能となる。   As described above, in the data search system 11 according to the second embodiment, when a desired search result cannot be obtained from the example data registered in the example database 28, a new one is selected according to the user's selection. Since the document can be registered, the example database 28 including syntax and semantic role information can be constructed from any new document.

また、用例データベース28に登録済みの用例データから所望の検索結果が得られない場合には、ユーザの選択に応じて任意の外部文書から検索対象語の一部を含むデータを1次検索し、その検索結果に対して構文・意味上の役割情報を付与して2次検索を行うことができるようにしたことから、用例データベース28に登録された用例データだけでなく、外部文書などを検索対象として、臨機応変に検索処理を行うことが可能となる。   If a desired search result cannot be obtained from the example data registered in the example database 28, data including a part of the search target word is arbitrarily searched from an arbitrary external document according to the user's selection. Since secondary search can be performed by assigning syntactic and semantic role information to the search results, not only the example data registered in the example database 28 but also external documents and the like can be searched. As a result, it is possible to perform search processing on an ad hoc basis.

なお、第2の実施の形態に係るデータ検索システム11においては、用例データベース28への新規文書の登録処理、並びに、外部文書の検索処理を組み合わせて実行する場合について示しているが、これらの処理は必ずしも組み合わせて実行すべきものではなく、一方の処理のみを実行するようにしても良い。   In the data search system 11 according to the second embodiment, a case where a new document registration process in the example database 28 and an external document search process are executed in combination is shown. Are not necessarily executed in combination, but only one of the processes may be executed.

(第3の実施の形態)
第1の実施の形態及び第2の実施の形態に係わるデータ検索システム11においては、ユーザから入力される検索文字列に応じて検索処理を行う。これに対し、第3の実施の形態に係わるデータ検索システム11においては、機械翻訳システムを備え、この機械翻訳システムにおける翻訳結果を検索文字列として取り扱い、当該翻訳過程で得た情報を検索処理に利用する点で、第1の実施の形態及び第2の実施の形態に係わるデータ検索システム11と相違する。
(Third embodiment)
In the data search system 11 according to the first embodiment and the second embodiment, search processing is performed in accordance with a search character string input from the user. On the other hand, the data search system 11 according to the third embodiment includes a machine translation system, handles the translation result in this machine translation system as a search character string, and uses the information obtained in the translation process for the search process. It differs from the data search system 11 according to the first embodiment and the second embodiment in that it is used.

図11は、本発明の第3の実施の形態に係わるデータ検索システム11の機能ブロック図である。なお、図11において、図8と同一要素には同一符号を付し、重複する説明は省略する。第3の実施の形態に係わるデータ検索システム11においては、図11に示すように、機械翻訳を行うための要素を備える点で第2の実施の形態に係わるデータ検索システム11と相違する。   FIG. 11 is a functional block diagram of the data search system 11 according to the third embodiment of the present invention. In FIG. 11, the same elements as those in FIG. As shown in FIG. 11, the data search system 11 according to the third embodiment is different from the data search system 11 according to the second embodiment in that it includes an element for performing machine translation.

図11において、第1言語文書入力部36は、原文文書入力部として機能し、翻訳対象の原文文書である、第1言語によって記述された文書(以下、「第1言語文書」という)の入力を受け付けるものである。例えば、第1言語文書は、記憶媒体を介してディスクドライブ16から入力される。   In FIG. 11, the first language document input unit 36 functions as an original document input unit, and inputs a document (hereinafter referred to as “first language document”) described in the first language, which is an original document to be translated. Is to accept. For example, the first language document is input from the disk drive 16 via a storage medium.

翻訳処理制御部37は、文分割部32と後述する機械翻訳処理部38を制御するものである。これらを制御することにより、第1言語文書を1文単位に分割し、第1言語文書の各文に対して言語解析を行うと共に、第2言語による訳文を生成する。   The translation processing control unit 37 controls the sentence division unit 32 and a machine translation processing unit 38 to be described later. By controlling these, the first language document is divided into sentence units, language analysis is performed on each sentence of the first language document, and translations in the second language are generated.

機械翻訳処理部38は、第1言語文書の言語解釈を行うと共に、機械翻訳用辞書39を参照して1文単位に分割された第1言語の文書から、第2言語の訳文を生成するものである。なお、生成された第2言語による訳文の各構成語には、対応する第1言語における文中の語及び他の訳語候補との対応関係が関連付けられている。機械翻訳用辞書39には、第1言語の語句と、第2言語の語句とが関連付けて登録されている。   The machine translation processing unit 38 interprets the language of the first language document and generates a translation of the second language from the document of the first language divided into one sentence with reference to the dictionary 39 for machine translation. It is. Each constituent word of the generated translation in the second language is associated with a correspondence relationship between the word in the corresponding sentence in the first language and another translation word candidate. In the machine translation dictionary 39, words in the first language and words in the second language are registered in association with each other.

次に、第3の実施の形態に係わるデータ検索システム11における検索処理について図12を用いて説明する。図12は、第3の実施の形態に係わるデータ検索システム11における検索処理について説明するためのフロー図である。第3の実施の形態における検索処理は、機械翻訳システムによる翻訳結果を検索文字列として入力を受け付ける点で、第2の実施の形態における検索処理と相違する。なお、図12において、図9と同一処理には同一符号を付し、重複する説明は省略する。   Next, search processing in the data search system 11 according to the third embodiment will be described with reference to FIG. FIG. 12 is a flowchart for explaining search processing in the data search system 11 according to the third embodiment. The search process according to the third embodiment is different from the search process according to the second embodiment in that an input is received as a search character string using a translation result obtained by the machine translation system. In FIG. 12, the same processes as those in FIG.

第3の実施の形態に係わるデータ検索システム11を用いて検索処理を行う場合、まず、ユーザから第1言語文書が入力されるので、第1言語文書入力部36は、この第1言語文書の入力を受け付ける(ステップS61)。第1言語文書が入力されると、文分割部32は、当該第1言語文書を1文単位に分割する(ステップS62)。   When a search process is performed using the data search system 11 according to the third embodiment, first, a first language document is input from the user. Therefore, the first language document input unit 36 stores the first language document. An input is accepted (step S61). When the first language document is input, the sentence dividing unit 32 divides the first language document into one sentence unit (step S62).

機械翻訳処理部38は、このように分割された第1言語文書の各文に対して言語解析を行う。これにより、各文を構成する各語の構文・意味上の役割情報が取得され、各語に構文・意味上の役割情報が付与される。そして、機械翻訳処理部38は、機械翻訳用辞書39を参照しつつ、第2言語による訳文を生成する(ステップS63)。このとき、第2言語による訳文の各構成語には、第1言語文書中の語との対応関係が関連付けられており、訳文の各構成語間の構文・意味上の関係も関連付けられている。   The machine translation processing unit 38 performs language analysis on each sentence of the first language document thus divided. As a result, the syntactic and semantic role information of each word constituting each sentence is acquired, and the syntactic and semantic role information is given to each word. Then, the machine translation processing unit 38 generates a translation in the second language while referring to the machine translation dictionary 39 (step S63). At this time, each constituent word of the translated sentence in the second language is associated with a correspondence relationship with the word in the first language document, and a syntactic and semantic relation between each constituent word of the translated sentence is also associated. .

機械翻訳処理部38により第2言語の訳文が生成されると、検索文字列入力部22は、これを検索文字列として受け付ける(ステップS64)。検索文字列を受け付けると、ユーザから検索文字列における検索対象語が指定されるので、検索対象語指定部23は、この検索対象語の指定を受け付ける(ステップS65)。文字列指定用の検索対象語及び役割情報指定用の検索対象語が指定されるのは、第1の実施の形態と同様である。   When the translation of the second language is generated by the machine translation processing unit 38, the search character string input unit 22 receives this as a search character string (step S64). When the search character string is received, the search target word in the search character string is specified by the user, and the search target word specifying unit 23 receives specification of the search target word (step S65). The search target word for specifying the character string and the search target word for specifying the role information are specified as in the first embodiment.

検索対象語が指定されると、検索式生成部26は、文字列指定用の検索対象語と、役割情報指定用の検索対象語に付与された構文・意味上の役割情報及び他の訳語候補とから検索式を生成する(ステップS66)。これらの他の訳語候補は、検索の際の絞り込み条件として考慮される。   When a search target word is specified, the search expression generation unit 26, the search target word for character string specification, the syntactic / semantic role information given to the search target word for role information specification, and other translation candidates A search expression is generated from (step S66). These other translated word candidates are considered as a narrowing-down condition in the search.

検索式が生成されたならば、データベース検索部27は、当該検索式と、用例データベース28に登録されている各文データとの間で、検索対象語、構文・意味上の役割情報及び他の訳語候補を比較することで検索を行う(ステップS67)。データベース検索部27による検索が完了したならば、検索制御部24は、検索結果が得られたかを判定する(ステップS41)。ここで、検索結果が得られなかった場合には、上述した関連文書処理を行う(ステップS42)。一方、検索結果が得られた場合には、出力部29は、その検索結果を出力する(ステップS68)。このようにして第3の実施の形態における一連の検索処理が終了する。   If the search expression is generated, the database search unit 27 determines the search target word, syntactic / semantic role information, and other information between the search expression and each sentence data registered in the example database 28. A search is performed by comparing translated word candidates (step S67). If the search by the database search unit 27 is completed, the search control unit 24 determines whether a search result has been obtained (step S41). If no search result is obtained, the related document processing described above is performed (step S42). On the other hand, when a search result is obtained, the output unit 29 outputs the search result (step S68). In this way, a series of search processing in the third embodiment is completed.

ここで、図12に示すデータ検索動作について具体例を用いて説明する。ここでは、ユーザから、第1言語文書として「The agents seem to be effective in the treatment of the pathogen.」が入力されたものとする。また、ユーザから、文字列指定用の検索対象語として「病原体」が指定され、役割情報指定用の検索対象語として「治療」が指定されたものとする。なお、ここでは、説明の便宜上、第1言語文書は、1文のみ入力された場合について説明する。このため、ステップS62における第1言語文書を分割する処理はスキップされる。   Here, the data search operation shown in FIG. 12 will be described using a specific example. Here, it is assumed that “The agents seem to be effective in the treatment of the pathogen” is input from the user as the first language document. In addition, it is assumed that “pathogen” is designated as a search target word for character string designation and “treatment” is designated as a search target word for role information designation by the user. Here, for convenience of explanation, a case where only one sentence is input as the first language document will be described. For this reason, the process which divides | segments the 1st language document in step S62 is skipped.

第1言語入力部36により、このような第1言語文書の入力が受け付けられると(ステップS61)、機械翻訳処理部38により、当該第1言語文書の言語解析が行われる。これにより、図13に示す第1言語のツリー構造が得られる。そして、第1言語のツリー構造を得た後、当該第1言語のツリー構造の内容が第2言語に言語変換され、第2言語のツリー構造が得られる。ここでは、図4に示すツリー構造と同一のツリー構造が得られる。なお、かかる言語変換の際には機械翻訳用辞書39が参照される。さらに、第2言語のツリー構造を得た後、第2言語により訳文が生成される(ステップS63)。ここでは、「その薬剤は、その病原体の治療に有効と思われる。」という訳文が生成される。   When the input of the first language document is accepted by the first language input unit 36 (step S61), the machine translation processing unit 38 performs language analysis of the first language document. Thereby, the tree structure of the first language shown in FIG. 13 is obtained. Then, after obtaining the tree structure of the first language, the contents of the tree structure of the first language are translated into the second language, and the tree structure of the second language is obtained. Here, the same tree structure as that shown in FIG. 4 is obtained. Note that the machine translation dictionary 39 is referred to during such language conversion. Further, after obtaining the second language tree structure, a translation is generated in the second language (step S63). Here, the translation “The drug seems to be effective for the treatment of the pathogen” is generated.

なお、訳文及び第2言語のツリー構造中の語には、対応する原文中の語に対する他の訳語候補が関連付けられている。例えば、「治療」には、対応する原文中の”treatment”に対する他の訳語候補が関連付けられている。ここでは、他の訳語候補として、「待遇、取り扱い、処理、もてなし、治療薬、処理…」が関連付けられているものとする。   It should be noted that the translation sentences and the words in the second language tree structure are associated with other translation word candidates for the corresponding words in the original sentence. For example, “treatment” is associated with other candidate words for “treatment” in the corresponding original text. Here, it is assumed that “other treatment, handling, processing, hospitality, therapeutic agent, processing,...” Is associated as another candidate translation.

第2言語の訳文が生成されると、検索文字列入力部22により、当該訳文を検索文字列として受け付けられる(ステップS64)。その後、検索対象語指定部23により、上述のように、ユーザから指定される検索対象語の指定が受け付けられる(ステップS65)。検索対象語の指定を受け付けると、検索式生成部26により、図4に示す第2言語のツリー構造から、検索式が生成される(ステップS66)。この場合、生成される検索式には、文字列指定用の検索対象語と、役割情報指定用の検索対象語の構文・意味上の役割情報及び他の訳語候補が含まれている。   When the translation in the second language is generated, the search character string input unit 22 accepts the translation as a search character string (step S64). Thereafter, the search target word designation unit 23 accepts the designation of the search target word designated by the user as described above (step S65). When the specification of the search target word is accepted, the search expression generation unit 26 generates a search expression from the second language tree structure shown in FIG. 4 (step S66). In this case, the generated search expression includes a search target word for designating a character string, role information on the syntax and meaning of the search target word for designating role information, and other translated word candidates.

このような検索式が生成されると、データベース検索部27により、当該検索式を用いて用例データベース28に登録された文データの検索が行われる(ステップS67)。なお、かかるデータベース検索部27による検索処理は、検索式に含まれる他の訳語候補により検索結果を絞り込む点で、第1の実施の形態における検索処理と相違する。   When such a search expression is generated, the database search unit 27 searches the sentence data registered in the example database 28 using the search expression (step S67). The search process by the database search unit 27 is different from the search process in the first embodiment in that the search result is narrowed down by other translation word candidates included in the search expression.

ここで、第1の実施の形態において利用した用例データベース28内の文データを、第3の実施の形態で生成される検索式を用いて検索した場合について示す。上述のように、第1の実施の形態で生成される検索式を用いて検索した場合においては、以下の検索結果が得られていた。   Here, a case where the sentence data in the example database 28 used in the first embodiment is searched using the search formula generated in the third embodiment will be described. As described above, when a search is performed using the search formula generated in the first embodiment, the following search results are obtained.

1.YY病患者の治療には、WW病原体の除去が…
3.WW病原体の取り扱いは、厳重に管理する必要がある。
1. To treat YY disease patients, removal of WW pathogens ...
3. The handling of WW pathogens must be strictly controlled.

5.VV病原体を処理する場合には、…
6.VV病原体の消毒には、…
これに対し、第3の実施の形態で生成される検索式を用いて検索した場合には、上述のように、他の訳語候補に「除去」、「消毒」は含まれていない。このため、文データ1、6は、検索結果から除外することができる。この結果、文データ3、5のみが検索結果として出力されることとなる。これにより、ユーザの意図に沿った、より精度の高い検索結果を得ることが可能となる。
5. When treating VV pathogens ...
6). To disinfect VV pathogens ...
On the other hand, when a search is performed using the search expression generated in the third embodiment, as described above, “removal” and “disinfection” are not included in the other translated word candidates. For this reason, the sentence data 1 and 6 can be excluded from the search results. As a result, only the sentence data 3 and 5 are output as search results. Thereby, it becomes possible to obtain a more accurate search result in line with the user's intention.

以上説明したように、第3の実施の形態に係わるデータ検索システム11においては、文字列指定用の検索対象語と、役割情報指定用の検索対象語に付与された構文・意味上の役割情報及び他の訳語候補とを含む検索式を用いて、データベース検索部27が用例データベース28に登録された用例データを検索すると共に、当該検索式に含まれる他の訳語候補を用いて当該検索結果を絞り込むようにしたことから、検索文字列中のある検索対象語に対して特定の構文・意味上の役割を有する語を、文字列を固定しないで、用例データベース28から検索することが可能となると共に、よりユーザ意図に沿って絞り込まれた検索結果を得ることが可能となる。この結果、例えば、機械翻訳システムから出力した訳文中の特定の語と他の語との共起関係が正しいかどうかが不明な場合に、絞り込まれた用例データからその適否を判断することが可能となる。   As described above, in the data search system 11 according to the third embodiment, the search target word for designating the character string and the role information in syntax and meaning given to the search target word for specifying the role information. And the database search unit 27 searches the example data registered in the example database 28 using a search expression including the other translation word candidates, and uses the other translation word candidates included in the search expression to obtain the search result. Since the search is narrowed down, a word having a specific syntactic / semantic role for a certain search target word in the search character string can be searched from the example database 28 without fixing the character string. At the same time, it is possible to obtain a search result narrowed down according to the user's intention. As a result, for example, when it is unclear whether the co-occurrence relationship between a specific word and other words in a translation output from a machine translation system is correct, it is possible to determine the suitability from the narrowed-down example data It becomes.

本発明の第1の実施の形態に係わるデータ検索システムのハードウエア構成を示すブロック構成図。The block block diagram which shows the hardware constitutions of the data search system concerning the 1st Embodiment of this invention. 本発明の第1の実施の形態に係わるデータ検索システムの機能ブロック図。1 is a functional block diagram of a data search system according to a first embodiment of the present invention. 本発明の第1の実施の形態に係わるデータ検索システムにおけるデータ検索動作について説明するためのフロー図。The flowchart for demonstrating the data search operation | movement in the data search system concerning the 1st Embodiment of this invention. 本発明の第1の実施の形態に係わるデータ検索システムにおける言語解析の結果として得られるツリー構造の内容を示す説明図。Explanatory drawing which shows the content of the tree structure obtained as a result of the linguistic analysis in the data search system concerning the 1st Embodiment of this invention. 本発明の第1の実施の形態に係わるデータ検索システムにおける形態素解析の結果についての説明図。Explanatory drawing about the result of the morphological analysis in the data search system concerning the 1st Embodiment of this invention. 本発明の第1の実施の形態に係わるデータ検索システムにおける構文解析または係り受け解析の結果として得られるツリー構造の内容を示す説明図。Explanatory drawing which shows the content of the tree structure obtained as a result of the syntax analysis or dependency analysis in the data search system concerning the 1st Embodiment of this invention. 本発明の第1の実施の形態に係わるデータ検索システムで生成される検索式の内容についての説明図。Explanatory drawing about the content of the search formula produced | generated by the data search system concerning the 1st Embodiment of this invention. 本発明の第2の実施の形態に係わるデータ検索システムの機能ブロック図。The functional block diagram of the data search system concerning the 2nd Embodiment of this invention. 本発明の第2の実施の形態に係わるデータ検索システムにおける検索処理について説明するためのフロー図。The flowchart for demonstrating the search process in the data search system concerning the 2nd Embodiment of this invention. 本発明の第2の実施の形態に係わるデータ検索システムの関連文書処理を説明するためのフロー図。The flowchart for demonstrating the related document process of the data search system concerning the 2nd Embodiment of this invention. 本発明の第3の実施の形態に係わるデータ検索システムの機能ブロック図。The functional block diagram of the data search system concerning the 3rd Embodiment of this invention. 本発明の第3の実施の形態に係わるデータ検索システムにおける検索処理について説明するためのフロー図。The flowchart for demonstrating the search process in the data search system concerning the 3rd Embodiment of this invention. 本発明の第3の実施の形態に係わるデータ検索システムにおける第1言語文書の言語解析の結果として得られるツリー構造の内容を示す説明図。Explanatory drawing which shows the content of the tree structure obtained as a result of the linguistic analysis of the 1st language document in the data search system concerning the 3rd Embodiment of this invention.

符号の説明Explanation of symbols

11…データ検索システム、12…演算制御装置、13…表示装置、14…マウス、15…キーボード、16…ディスクドライブ、17…補助記憶装置、18…プロセッサ、19…メモリ、20…プログラム、21…作業エリア、22…検索文字列入力部、23…検索対象語指定部、24…検索制御部、25…検索文字列用言語解析部、26…検索式生成部、27…データベース検索部、28…用例データベース、29…出力部、30…新規文書入力部、31…データベース構築制御部、32…文分割部、33…関連文書用言語解析部、34…外部文書検索制御部、35…外部文書検索部、36…第1言語文書入力部、37…翻訳処理制御部、38…機械翻訳処理部、39…機械翻訳用辞書。 DESCRIPTION OF SYMBOLS 11 ... Data search system, 12 ... Arithmetic control device, 13 ... Display device, 14 ... Mouse, 15 ... Keyboard, 16 ... Disk drive, 17 ... Auxiliary storage device, 18 ... Processor, 19 ... Memory, 20 ... Program, 21 ... Work area, 22 ... Search character string input section, 23 ... Search target word designation section, 24 ... Search control section, 25 ... Search string text language analysis section, 26 ... Search formula generation section, 27 ... Database search section, 28 ... Example database 29 ... Output unit 30 ... New document input unit 31 ... Database construction control unit 32 ... Sentence division unit 33 ... Related document language analysis unit 34 ... External document search control unit 35 ... External document search , 36... First language document input unit, 37... Translation processing control unit, 38... Machine translation processing unit, 39.

Claims (5)

文を構成する語と文中における各語の構文及び意味上の役割情報とを含む用例データが登録されたデータベースと、検索対象となる文字列の入力を受け付ける検索文字列入力部と、前記検索対象となる文字列中における第1及び第2の検索対象語の指定を受け付ける検索対象語指定部と、前記検索対象となる文字列を構成する各語の構文及び意味上の役割情報を解析する文字列用言語解析部と、前記第1の検索対象語と前記第2の検索対象語に対応する構文及び意味上の役割情報とを含む検索式を生成する検索式生成部と、前記検索式を用いて前記データベース内の用例データを検索するデータベース検索部と、前記用例データの検索結果を出力する出力部とを具備することを特徴とするデータ検索システム。   A database in which example data including words constituting a sentence and syntax and semantic role information of each word in the sentence are registered, a search character string input unit that receives input of a character string to be searched, and the search target A search target word designating unit that accepts designation of the first and second search target words in the character string, and a character that analyzes the syntax and semantic role information of each word constituting the search target character string A column language analysis unit, a search formula generation unit that generates a search formula including syntax and semantic role information corresponding to the first search target word and the second search target word, and the search formula A data search system comprising: a database search unit for searching for example data in the database by using; and an output unit for outputting a search result of the example data. 前記データベース内に新たに登録される新規文書の入力を受け付ける新規文書入力部と、前記新規文書に含まれる文を構成する各語の構文及び意味上の役割情報を解析する新規文書用言語解析部と、前記新規文書に含まれる文を構成する語と、文中における各語の構文及び意味上の役割情報とを含む用例データを前記データベースに登録するデータベース登録部とを具備することを特徴とする請求項1記載のデータ検索システム。   A new document input unit that receives input of a new document newly registered in the database, and a new document language analysis unit that analyzes syntax and semantic role information of each word constituting a sentence included in the new document And a database registration unit for registering example data including words constituting a sentence included in the new document and syntax and semantic role information of each word in the sentence in the database. The data search system according to claim 1. 前記データベースに登録されていない外部文書を検索する外部文書検索部と、前記外部文書検索部による前記第1の検索対象語を用いた1次検索結果に含まれる文を構成する各語の構文及び意味上の役割情報を解析する外部文書用言語解析部とを具備し、前記外部文書検索部は、構文及び意味上の役割情報が付与された1次検索結果に含まれる文を、前記検索式を用いて検索することを特徴とする請求項1または請求項2記載のデータ検索システム。   An external document search unit that searches for an external document that is not registered in the database, a syntax of each word constituting a sentence included in a primary search result using the first search target word by the external document search unit, and An external document language analysis unit for analyzing semantic role information, wherein the external document search unit uses the search expression to include a sentence included in a primary search result to which syntax and semantic role information are assigned. The data search system according to claim 1 or 2, wherein the search is performed by using a search. 前記用例データが記述される言語と異なる言語で記述された原文文書の入力を受け付ける原文文書入力部と、前記原文文書に含まれる文を、前記用例データが記述される言語に翻訳すると共に原文文書に含まれる文を構成する各語の構文及び意味上の役割情報を解析する翻訳処理部とを具備し、前記検索文字列入力部は、前記翻訳処理部による翻訳結果を前記検索対象となる文字列として受け付け、前記検索式生成部は、前記第1の検索対象語と前記第2の検索対象語に対応する構文及び意味上の役割情報と前記第2の検索対象語に対応する他の訳語候補とを含む検索式を生成し、前記データベース検索部は、前記検索式を用いて前記データベース内の用例データを検索すると共に前記検索式に含まれる他の訳語候補を用いて当該検索結果を絞り込むことを特徴とする請求項1ないし請求項3のいずれかに1項記載のデータ検索システム。   A source document input unit that accepts input of a source document written in a language different from the language in which the example data is described, and a sentence included in the source document document is translated into a language in which the example data is described and the source document A translation processing unit that analyzes the syntax and semantic role information of each word constituting the sentence included in the text, and the search character string input unit converts the translation result by the translation processing unit into the character to be searched Received as a sequence, the search expression generation unit includes syntax and semantic role information corresponding to the first search target word and the second search target word, and other translations corresponding to the second search target word The database search unit searches the example data in the database using the search formula and uses the other translation candidates included in the search formula to generate the search result. Data retrieval system according to 1, wherein in any one of claims 1 to 3, characterized in that Komu Ri. 文を構成する語と文中における各語の構文及び意味上の役割情報とを含む用例データが登録されたデータベースを検索するプログラムであって、コンピュータに、検索対象となる文字列の入力を受け付ける機能と、前記検索対象となる文字列中における第1及び第2の検索対象語の指定を受け付ける機能と、前記検索対象となる文字列を構成する各語の構文及び意味上の役割情報を解析する機能と、前記第1の検索対象語と前記第2の検索対象語に対応する構文及び意味上の役割情報を含む検索式を生成する機能と、前記検索式を用いて前記データベース内の用例データを検索する機能と、前記用例データの検索結果を出力する機能とを実現させるためのプログラム。   A program for searching a database in which example data including words constituting a sentence and syntax and semantic role information of each word in the sentence is registered, and accepting an input of a character string to be searched for in a computer And a function for accepting designation of first and second search target words in the character string to be searched, and a syntax and semantic role information of each word constituting the character string to be searched A function, a function for generating a search expression including syntax and semantic role information corresponding to the first search target word and the second search target word, and example data in the database using the search expression And a function for outputting a search result of the example data.
JP2006326533A 2006-12-04 2006-12-04 Data search system and program Expired - Fee Related JP4435144B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006326533A JP4435144B2 (en) 2006-12-04 2006-12-04 Data search system and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006326533A JP4435144B2 (en) 2006-12-04 2006-12-04 Data search system and program

Publications (2)

Publication Number Publication Date
JP2008140204A true JP2008140204A (en) 2008-06-19
JP4435144B2 JP4435144B2 (en) 2010-03-17

Family

ID=39601575

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006326533A Expired - Fee Related JP4435144B2 (en) 2006-12-04 2006-12-04 Data search system and program

Country Status (1)

Country Link
JP (1) JP4435144B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011048558A (en) * 2009-08-26 2011-03-10 Ntt Docomo Inc Device and method for generating task model
CN102779149A (en) * 2011-05-10 2012-11-14 索尼公司 Information processing apparatus, information processing method, program, and information processing system
JP2014056457A (en) * 2012-09-13 2014-03-27 Fujitsu Ltd Retrieval device, retrieval method, and program

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02190972A (en) * 1989-01-19 1990-07-26 Sharp Corp Example retrieving system
JPH0443464A (en) * 1990-06-08 1992-02-13 Fujitsu Ltd Dictionary retrieval processing system
JPH05165890A (en) * 1991-12-12 1993-07-02 Matsushita Electric Ind Co Ltd Electronic example dictionary
JPH06215035A (en) * 1993-01-18 1994-08-05 Sanyo Electric Co Ltd Text retrieving device
JPH0991314A (en) * 1995-07-14 1997-04-04 Fuji Xerox Co Ltd Information search device

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02190972A (en) * 1989-01-19 1990-07-26 Sharp Corp Example retrieving system
JPH0443464A (en) * 1990-06-08 1992-02-13 Fujitsu Ltd Dictionary retrieval processing system
JPH05165890A (en) * 1991-12-12 1993-07-02 Matsushita Electric Ind Co Ltd Electronic example dictionary
JPH06215035A (en) * 1993-01-18 1994-08-05 Sanyo Electric Co Ltd Text retrieving device
JPH0991314A (en) * 1995-07-14 1997-04-04 Fuji Xerox Co Ltd Information search device

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011048558A (en) * 2009-08-26 2011-03-10 Ntt Docomo Inc Device and method for generating task model
CN102779149A (en) * 2011-05-10 2012-11-14 索尼公司 Information processing apparatus, information processing method, program, and information processing system
JP2012238062A (en) * 2011-05-10 2012-12-06 Sony Corp Information processor, information processing method, program, and information processing system
CN102779149B (en) * 2011-05-10 2016-12-14 索尼公司 Information processor, information processing method and information processing system
JP2014056457A (en) * 2012-09-13 2014-03-27 Fujitsu Ltd Retrieval device, retrieval method, and program

Also Published As

Publication number Publication date
JP4435144B2 (en) 2010-03-17

Similar Documents

Publication Publication Date Title
Khan et al. A novel natural language processing (NLP)–based machine translation model for English to Pakistan sign language translation
JP6095621B2 (en) Mechanism, method, computer program, and apparatus for identifying and displaying relationships between answer candidates
Täckström et al. Efficient inference and structured learning for semantic role labeling
JP5243167B2 (en) Information retrieval system
JP4306894B2 (en) Natural language processing apparatus and method, and natural language recognition apparatus
US7296223B2 (en) System and method for structured document authoring
WO2017130434A1 (en) Computer system, method, and program for transferring named entity recognition model for multiple languages
JP2021507350A (en) Reinforcement evidence retrieval of complex answers
JP2005165958A (en) Information retrieval system, information retrieval support system and method therefor, and program
JP6077727B1 (en) Computer system, method, and program for transferring multilingual named entity recognition model
Chiarcos et al. Analyzing middle high German syntax with RDF and SPARQL
Vandeghinste et al. Improving the translation environment for professional translators
JP4435144B2 (en) Data search system and program
JP2007164635A (en) Method, device and program for acquiring synonymous vocabulary
WO2009113289A1 (en) New case generation device, new case generation method, and new case generation program
US20220004708A1 (en) Methods and apparatus to improve disambiguation and interpretation in automated text analysis using structured language space and transducers applied on automatons
JP7415495B2 (en) Document processing program, document processing device, and document processing method
JP5302784B2 (en) Machine translation method and system
JP5148583B2 (en) Machine translation apparatus, method and program
JP2007164462A (en) Question answering system, question answering method and question answering program
JP4812811B2 (en) Machine translation apparatus and machine translation program
JP4417967B2 (en) Example database and example search system
JP2012243130A (en) Information retrieval device, method and program
Hijazi et al. GRASS: A SYNTACTIC TEXT SIMPLIFICATION SYSTEM BASED ON SEMANTIC REPRESENTATIONS
JP4938298B2 (en) Method and program for outputting candidate sentences to be included in text summary

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090825

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090908

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091104

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091201

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091222

R150 Certificate of patent or registration of utility model

Ref document number: 4435144

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130108

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140108

Year of fee payment: 4

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees