JP3929418B2 - 情報探索プログラム及び情報探索プログラムを記録した媒体 - Google Patents

情報探索プログラム及び情報探索プログラムを記録した媒体 Download PDF

Info

Publication number
JP3929418B2
JP3929418B2 JP2003140555A JP2003140555A JP3929418B2 JP 3929418 B2 JP3929418 B2 JP 3929418B2 JP 2003140555 A JP2003140555 A JP 2003140555A JP 2003140555 A JP2003140555 A JP 2003140555A JP 3929418 B2 JP3929418 B2 JP 3929418B2
Authority
JP
Japan
Prior art keywords
search
information
keyword
data
target data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003140555A
Other languages
English (en)
Other versions
JP2004342016A (ja
Inventor
和信 五十嵐
Original Assignee
アルトリサーチ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アルトリサーチ株式会社 filed Critical アルトリサーチ株式会社
Priority to JP2003140555A priority Critical patent/JP3929418B2/ja
Publication of JP2004342016A publication Critical patent/JP2004342016A/ja
Application granted granted Critical
Publication of JP3929418B2 publication Critical patent/JP3929418B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、目的とする資料等を調査する為のシステムに係り、特に産業財産権等に関する異議申し立て資料の調査や、先願調査等のように、実際に文書等の内容の読み込みを調査者が行う必要のある調査を補助し、調査作業を容易にするシステムに関する。
【0002】
【従来の技術】
従来、特許情報等を機械検索によって検索できる特許情報データベース検索システムが開発使用されている。特許情報データベースを例にとれば、特許出願毎に発生する特許情報をデータベースとしてホストコンピュータの記憶手段に記憶させることによって構築されている。
【0003】
そして、このような特許情報データベースには、一般的な書誌的事項の他に、各種キーワード(例えばフリーキーワード、固定キーワード、Fターム等)がファイル毎に記憶され、これらを指定することにより、対応する特許情報が検索できるように構成されている。また、近年発行されているCD−ROM形式の特許公報等や、各メーカによって編集された特許情報に関するCD−ROM等(以下、これらを電子特許情報という)には、上記した書誌的事項の他に明細書、要約書及び図面も電子情報として記憶され、各種検索項目に基づいて対応する特許情報が検索できるように構成されている。
【0004】
ここで、前述の特許情報データベースや電子特許情報を用いて無効資料や異議申立資料を調査しようとする場合、調査者が検索式を作成し、その検索式にヒットした内容の抄録を見て更に必要により公報全文を読んで、無効資料あるいは異議申立資料として利用できるかを判断している。この検索の結果、ヒット件数が少ない場合は直接公報に目を通すことが行われる。該当する公報が見つからない場合は、再度検索式を作り直してヒットした公報を読むことが繰り返される。また、これから出願しようとする発明に対する先願調査等も、同様の手順によって行われる。
【0005】
ここで、少し詳しく特許等調査の過程について説明する。まず、調査者は本願の内容と特徴点を理解した後、前述の特許データベースや電子特許情報に記憶されている分類記号、キーワード等を組合わせて、目的とする技術が例えば数十件乃至百件程度の回答集合中に含まれるように検索式を作成する。勿論、検索の結果ヒットした件数が少なく、このヒットしたデータ集合中に所望の技術が網羅されていれば良いのであるが、僅かな件数に絞り込むと部分的に関連する類似技術の抽出や、他分野にある類似技術が抽出されないことも多い。このため、調査者は通常は数十件、多くても数百件の抽出を目安として、ヒットしたデータ集合中に、目的とする技術が含まれるように検索式を作成する。数百件を超える集合が作成された場合は、その後のスクリーニングに多大な時間を要するので、効率的な検索を行うことは難しい。しかし、必ずその中に目的とする類似技術が抽出されていると確信できる場合は、ヒットした全ての出願について抄録や、公報等を読んで、類似技術を探すこととなる。この作業は手作業で行われる。また、多くの公報等を読んだ後に類似技術が抽出できない場合は、再び検索式を作り変えて同様な操作を繰り返す。そして、いくら探しても類似技術が抽出できないことが確認できるまで、調査作業が続けられる。特に公知例、異議、無効資料調査にあっては、検索式を作成するために要する時間に加えて機械検索の結果を人が熟読して内容を更に吟味し、取捨する作業時間が加わることになる。そのため、調査が完了するまでに多くの時間を要し、調査コストも多大なものとなる。分類体系や調査の手法に習熟した調査の専門家であっても、機械検索の結果を吟味、処理するのに多大な時間を要しているのが調査作業の実情である。
【0006】
ところで、従来より広く使用されている一般的な検索処理方法として、パターンマッチングがある。これは、検索に使用するキーワードや検索式等(以下「検索用キーワード」と略す。)と、文書・文献等の検索単位毎に登録されているキーワード(以下、「登録キーワード」と略す。)とを比較し、一致するか(完全に、あるいは一部分)により、当該検索単位を検索結果として抽出するか否かを判断する手法である。その為、検索用キーワードと登録キーワードとが、不一致(完全に、あるいは一部分)ではあるが同義語等(類義語等を含む)の関係にある場合、検索することができないという問題点がある。即ち、技術思想の表現には非常に多くの用語があるので、パターンマッチングによる機械検索処理では、目的とする類似技術を抽出するのは非常に困難である。
【0007】
このパターンマッチングの例としては、「主キー」という文字列を検索用キーワードに指定した場合において、「主キー」、「キー」、「キー項目」等の登録キーワードが、「主キー」という文字列の少なくとも一部分を含むため、類似のキーワードとして判定されることになる。しかし、「メイン項目」や「検索項目」等の技術上の同義語等である登録キーワードについては、「主キー」という文字列を検索用キーワードに指定した場合、検索により抽出することができない。
【0008】
また、前述の登録キーワードは、検索行為に使用される為、事前に文書・文献等の検索単位毎に登録されている必要があり、その登録の手間を要する。(以下、この手間を「キーワード登録の手間」と称す。)
【0009】
そして、この登録キーワードの決定方法としては、文書・文献等の検索単位毎に特徴のあるキーワードを一部抽出したり、あるいは管理者が検索単位毎にキーワードをいくつか設定すること等が行われている。この為、一般的に登録キーワードは、文書・文献等の検索単位を構成する一部分、あるいは一側面しか表していないことが多い。(以下、この点を「登録キーワードの一部表現性」と称す。)この為、登録キーワード以外の検索単位を構成するキーワード等を、検索用キーワードに指定した場合に、前述の登録キーワードの一部表現性によって、当該検索単位は検索の結果抽出されないことになる。
【0010】
更に、先の「主キー」の例のように、技術上の同義語等である登録キーワードを統一して使用すべき必要が生じる。(以下、この点を「登録キーワードの統一必要性」と称す。)この登録キーワードの統一必要性の例としては、先の「主キー」という用語を登録キーワードに使用すると定めた場合、「メイン項目」や「検索項目」という登録キーワードを使用できなくなることが挙げられる。
【0011】
しかし、この登録キーワードの統一必要性が遵守されていない場合は、検索を行う調査者にとっては好ましいことではなく、特に産業財産権等の新規性や進歩性等を判断する際には、その問題点が一層顕在化することになる。
【0012】
ここで、新規性とは、ある特定の発明と、それに対する一以上の引用する発明とを認定し、両者を比較することにより相違点が生じるかにより、ある特定の発明が新しいものであるか否かを判断する特許要件である。この新規性の判断において、従来は調査者が目視で内容を確認することにより同一の発明であると認定される(新規性なしと判定される)発明同士であっても、特定の発明と引用する発明とが、同義の他の技術用語等を登録キーワードに使用していた場合は、精度の高い検索が行えないことがあった。本出願の出願時において普及している国内特許データベースには、Fターム、国際特許分類、FI記号その他、技術内容がシソーラス化された記号として付与されている。しかし、新しい発明は旧来の技術体系に必ずしも分類できるわけではないので、キーワードと分類記号を組み合わせても、完全に的を絞って該当特許等をヒットさせることは難しい。更に、分類記号の少ない、論文、一般技術文献を調査対象とする場合は、少ない件数に絞り込んだデータ集合中から、適切な文献を機械検索によりヒットさせることが難しい。そのため、ある程度の件数のデータ集合を作成し、その中で該当する文献等があるか否かを調査者が検討する必要がある。
【0013】
また、進歩性とは、ある特定の発明と、それに対する一以上の引用する発明とを認定し、両者を対比することによりそれぞれの発明を特定する為の事項の一致点及び相違点を明らかにし、その相違点が当業者容易であるか否かにより判定される特許要件である。この新規性の判断において、従来は調査者が目視で確認することにより相違点があまりないと認定される(進歩性なしと判定される)発明同士であっても、特定の発明と引用する発明とが、同義の他の技術用語等を登録キーワードに使用していた場合は、適切な検索抽出が行えないことがあった。
【0014】
一般的に産業財産権等の明細書等の書類は、作成者が多数存在することもあり、先の「主キー」の例のように同一、同種の意味である技術用語を多種多様な用語により表現している。このように、登録キーワードの統一必要性が考慮されていない事により、従来の検索方法では同一の発明や、類似の発明を検索することが非常に難しいという不都合があった。
【0015】
また、検索単位毎の登録キーワードが、検索単位を構成する一部分等である場合は、登録キーワードの一部表現性により、精度の高い調査を行うことが難しいという不都合があった。
【0016】
以上のような理由から、引例資料等の調査対象資料の抽出を迅速かつ正確に行えるシステムの出現が望まれている。また、特定の特許情報等に基づく新規性や進歩性分析を自動的に、または簡便化できる装置の出現が望まれている。
【0017】
これに関しては、【特許文献1】において、検索の対象となる複数の情報を、予め当該複数の情報に含まれるいくつかのキーワード群と対応付けて記憶しておき、当該検索対象情報のキーワードを集計して表示し、その中から調査者に選択されたキーワードに基づいて前記の検索の対象となる複数の情報から検索を行う方法が開示されている。
【0018】
しかし、この方法では、事前に検索の対象となる複数の情報毎にキーワード群の対応付けを登録しなければならないという手間を要し、キーワード登録の手間を解決できていない。更に、複数の情報に含まれる特定のキーワード群を検索に使用するため、登録キーワードの一部表現性や統一必要性を解決できていない。
【0019】
また、【特許文献2】においては、検索の対象となる文献単位毎に、所定のキーワード群への関連の有無を表現するパターンを作成し、調査者がパターンを指示することにより、当該指示されたパターンに類似のパターンを持つ文献単位を検索する方法が開示されている。
【0020】
しかし、事前に所定のキーワード群を決定しなければならないことや、その所定のキーワード群を途中で変更した場合等に、過去のパターンを再利用するのが難しいという不都合がある。また、【特許文献1】と同様に、事前に検索の対象となる複数の情報毎にパターンの対応付けを登録しなければならないという手間を要し、キーワード登録の手間を解決できてはいない。更に、所定のキーワード群への関連の有無を表現するパターンを検索に使用するため、登録キーワードの一部表現性や統一必要性も解決できていない。
【0021】
【特許文献1】
特開平9−73453号
【0022】
【特許文献2】
特開昭61−182131号
【0023】
【発明が解決しようとする課題】
このように、上記のような従来の検索方法にあっては、単に特定のキーワードや検索式を指定することにより、この検索式に該当するキーワード等を含む特許情報が抽出されるのみである。この為、新規性や進歩性等の判断は、抽出された特許情報の内容を調査者が実際に目視等で確認することによって行うのが一般的であり、抽出された特許情報(特許公報等)の件数が多い場合にその理解や把握に多大な手間を有する為、短時間かつ適切に新規性や進歩性等の判断を行うことが困難であるという不都合があった。
【0024】
また、調査対象のデータ集合に応じて適切なキーワードや検索式を決定する行為は、調査者が行わなければならず、調査者の負担が重いという不都合があった。
【0025】
更に、【特許文献1】及び【特許文献2】においても解決されていない課題として、以下の不都合が存在した。
【0026】
まず、キーワード登録の手間を解決できていない為、調査対象のデータが発生する度に、キーワード登録を行わなければならないという不都合があった。
【0027】
更に、登録キーワードの一部表現性を解決できていない為、調査漏れが発生しやすく、精度の高い調査を行い難いという不都合があった。
【0028】
これに加え、調査対象のデータ集合において、登録キーワードの統一必要性が考慮されていない場合、同義語等の関係にある技術用語が複数使用されている為に、精度の高い調査を行い難いという不都合があった。
【0029】
【発明の目的】
本発明は、かかる従来技術や【特許文献1】及び【特許文献2】の有する不都合を改善し、特に、キーワード登録の手間を解決し、登録キーワードを事前に登録する手間を要せずに、調査対象のデータ集合から検索を行うことのできる好適な手段の提供を目的とする。
【0030】
また、登録キーワードの一部表現性を解決し、精度の高い調査を行う為に、調査対象のデータ集合に応じた適切な検索キーワードを調査者が選択することができる好適な手段の提供を目的とする。
【0031】
更に、調査対象のデータ集合において、登録キーワードの統一必要性が考慮されていない場合においても、同義語等の関係にある技術用語等を、調査者が適切に検索キーワードとして選択することができる好適な手段を提供することを目的とする。
【0032】
【課題を解決するための手段】
上記目的を達成する為、本発明に係るシステムは、一以上のキーワードからなる情報ブロックを含む基準データと、一以上のキーワードからなる情報ブロックを複数含む検索対象データとを記憶する記憶手段を備えている。また、当該システムは、前記基準データを構成するキーワードと、前記検索対象データを構成するキーワードとの関連付けを入力する入力手段を備えている。更に、当該システムは、前記基準データの情報ブロックを基にして前記検索対象データから類似の情報ブロックを検索する処理を実行するコンピュータを備えている。これに加え、当該システムは、当該検索結果を表示する表示手段を備えている。以上のようなシステムにおいて、本発明に係る情報探索プログラムは、前記コンピュータに、前記記憶手段に格納された前記基準データから当該基準データの情報ブロックを構成するキーワードを抽出する第1抽出ステップを実行させる。また、当該プログラムは、前記コンピュータに、前記記憶手段に格納された前記検索対象データから当該検索対象データの複数の情報ブロックを構成するキーワードを抽出するステップを実行させる。更に、当該プログラムは、前記基準データから抽出された一以上のキーワードと、前記検索対象データから抽出された一以上のキーワードとを前記表示手段に表示して、当該表示された基準データのキーワード毎に、前記検索対象データから抽出されたキーワードとの関連付けを調査者に選択させるステップを実行させる。これに加え、当該プログラムは、前記コンピュータに、当該関連付けされた検索対象データから抽出されたキーワードに基づいて、当該キーワードを抽出した検索対象データより前記類似の情報ブロックを検索する検索ステップを実行させる。
【0033】
本発明によると、前記基準データのキーワード毎に関連付けされた、前記検索対象データのキーワードに基づいて、前記検索対象データより前記類似の情報ブロックを検索する為、従来とは異なり、調査者がより精度の高い検索を行うことが可能になる。また、従来とは異なり、前記検索対象データの情報ブロック毎にキーワードを登録しておかなくても、調査者が検索を行うことが可能になる。更に、従来とは異なり、前記検索対象データに応じた適切な検索キーワードを、調査者が選択することができる。これに加え、従来とは異なり、基準データのキーワード毎に同義語等の関係にある、前記検索対象データのキーワードを、調査者が検索キーワードとして適切に選択できる。
【0034】
また、他の発明に係る情報探索プログラムは、前記検索ステップが、前記基準データから抽出されたキーワードと、当該キーワード毎に関連付けされた検索対象データから抽出されたキーワードとに基づいて、前記検索対象データより前記類似の情報ブロックを検索することを特徴としている。
【0035】
本発明によると、前記基準データのキーワードと、当該キーワード毎に関連付けされた前記検索対象データのキーワードとに基づいて、前記検索対象データより前記類似の情報ブロックを検索する為、従来とは異なり、調査者がより精度の高い検索を行うことが可能になる。
【0036】
更に、他の発明に係る情報探索プログラムは、前記第1抽出ステップが、前記基準データから抽出されたキーワードを調査者が編集することを前記入力手段から受け付けるステップを含むことを特徴としている。
【0037】
本発明によると、前記基準データのキーワードを調査者が編集することにより、
従来とは異なり、調査者がより精度の高い検索を行うことが可能になる。
【0038】
また、他の発明に係る情報探索プログラムは、前記第1抽出ステップが、前記基準データから抽出されたキーワードを調査者が取捨することを前記入力手段から受け付けるステップを含むことを特徴としている。
【0039】
本発明によると、前記基準データのキーワードを調査者が取捨することにより、
従来とは異なり、調査者がより精度の高い検索を行うことが可能になる。
【0040】
更に、他の発明に係る情報探索プログラムは、前記コンピュータに、前記基準データから抽出されたキーワード毎に調査者から検索処理における重要度を表す重み付けとの関連付けを受け付けさせるステップを備えている。そして、前記検索ステップは、当該基準データのキーワード毎に関連付けされた、前記検索対象データから抽出されたキーワードと、前記重み付けとに基づいて、前記検索対象データより前記類似の情報ブロックを検索するステップを実行することを特徴としている。
【0041】
本発明によると、前記基準データのキーワード毎に関連付けされた、前記検索対象データのキーワードと、前記重み付けとに基づいて、前記検索対象データより前記類似の情報ブロックを検索する為、従来とは異なり、調査者がより精度の高い検索を行うことが可能になる。また、従来とは異なり、検索結果が重み付けにより補正される為、より細やかな検索を行うことが可能になる。
【0042】
また、他の発明に係る情報探索プログラムは、前記検索ステップが、前記検索対象データより類似の情報ブロックを検索した際に当該情報ブロック毎に類似度を示す情報を付与するステップを含んでいる。そして、当該プログラムが、前記コンピュータに、前記類似度順に前記検索結果を表示するステップを実行させることを特徴としている。
【0043】
本発明によると、前記類似度順に前記検索結果が表示される為、調査者が容易に検索結果を理解することが可能になる。また、従来とは異なり、当該検索結果の個々の内訳に、調査者が容易にアクセスすることが可能になる。
【0044】
更に、他の発明に係る情報探索プログラムは、前記基準データの情報ブロックが特定の特許等出願情報であり、前記検索対象データの複数の情報ブロックが複数の特許等出願情報または科学技術文献情報であることを特徴としている。
【0045】
本発明によると、前記基準データの情報ブロックである特定の特許等出願情報に対して、前記検索対象データの複数の情報ブロックである複数の特許出願情報または科学技術文献から、類似の特許出願情報または科学技術文献を検索することが可能になる。これにより、従来とは異なり、調査者が費やす調査時間を短縮し、負担を軽減することが可能になる。
【0046】
また、他の発明に係る情報探索プログラムは、前記基準データの情報ブロックが特定の特許出願の一以上の請求項であることを特徴としている。
【0047】
本発明によると、前記基準データの情報ブロックである特定の特許等出願の一以上の請求項に対して、前記検索対象データの複数の情報ブロックである複数の特許出願情報または科学技術文献から、類似の特許出願情報または科学技術文献を検索することが可能になる。これにより、従来とは異なり、請求項毎に類似の特許出願情報または科学技術文献を検索することが可能になる。
【0048】
更に、他の発明に係る情報探索プログラムは、特定の特許出願の一以上の請求項である前記基準データの情報ブロックが従属項である場合に、前記第1抽出ステップが、当該従属項が引用している独立項を前記基準データの情報ブロックに加えるステップを含むことを特徴としている。
【0049】
本発明によると、特定の特許出願の一以上の請求項である前記基準データの情報ブロックが従属項である場合に、当該従属項が引用している独立項を前記基準データの情報ブロックに加えることが可能になる。これにより、従来とは異なり、前記基準データの情報ブロックが従属項の場合であっても、請求項毎に類似の特許出願情報または科学技術文献を検索することが可能になる。
【0050】
これにより、前述の目的を達成しようとするものである。
【0051】
【発明の実施の形態】
以下、本発明の一実施形態を図1及至図19に基づいて説明する。
【0052】
図1は、本発明の一実施形態である情報探索システムの構成図である。この情報探索システム1は図1に示すように、記憶手段2と、入力手段3と、表示手段4と、これらを制御するコンピュータ5とから成り立っている。これら各手段及びコンピュータ5は相互に接続されており、データの授受を行いながら協働することにより情報探索機能15が実現される。また、記憶手段2は、検索処理の基準となる基準データ21と、基準データの検索対象となる検索対象データ22とを記憶している。
【0053】
次に、図1における記憶手段2、及びそこに記憶されている基準データ21と検索対象データ22とを詳細に図示したものが、図2の記憶手段2の詳細図である。ここで、基準データ21は、複数のキーワードからなる情報ブロック21aを含んでいる。また、検索対象データ22は、複数のキーワードからなる情報ブロック22aを、複数含んでいる。また、検索対象データ22はキーワード、分類記号等を検索式に使用することにより、調査者によって予め絞り込まれた検索データであるが、元々その件数が少ない場合は調査者による絞込みを行わないデータとする。
【0054】
ここで、基準データ21に含まれるキーワードと、検索対象データ22に含まれるキーワードとは、一以上の語句や記号や数値等、あるいはその組み合わせから構成されている。この例として、「キー項目」や、「システム」や、「検索結果」等が挙げられる。また図2において、基準データ21に含まれるキーワードaと、検索対象データ22に含まれるキーワードa´とは、同義語等(類義語等を含む)の関係にある。これと同様に、基準データ21に含まれるキーワードbと、検索対象データ22に含まれるキーワードb´とは、同義語等の関係にある。ここでいう同義語等の関係とは、前述の「主キー」と、「メイン項目」や「検索項目」等との関係のように、キーワード同士が同義語等の関係にあることをいう。
【0055】
更に、基準データの情報ブロック21aは、情報探索の基準となる情報単位を表している。また、基準データの情報ブロック21aの探索対象となる情報単位を表しているのが、検索対象データ22に複数含まれる情報ブロック22aである。ここで、前述した情報探索機能15は、コンピュータ5が、基準データ21のキーワード又は/及びこれと同義語等の関係にある検索対象データ22のキーワードを基にして、基準データの情報ブロック21aと類似の検索対象データの情報ブロック22aを判断する機能である。(後述)そして、この基準データの情報ブロック21aと、検索対象データの情報ブロック22aとは、文書や文献毎に区分されているのが望ましい。その場合、特定文献である基準データの情報ブロック21aに基づいて、特定文献の類似文献である、検索対象データの情報ブロック22aが、前述の情報探索機能15により判断されることになる。
【0056】
続いて、図1の情報探索システムを、パーソナルコンピュータに適用した場合におけるブロック図が図3である。ここで、図1における記憶手段2はメモリ6やハードディスク10に、入力手段3はキーボード等9に、表示手段4はディスプレイ7に、コンピュータ5はCPU8に夫々対応している。そして、各構成要素はバス13により接続されており、相互に通信を行えるように構成されている。また、図1における記憶手段2に記憶されていた基準データ21や検索対象データ22は、ファイルやデータベース等の形式により、基準データ11や検索対象データ12としてハードディスク10に記憶されている。同様に、情報探索機能15は、情報探索プログラム14としてハードディスク10に記憶されている。そして、図3におけるシステムは、CPU8が情報探索プログラム14を解釈することにより、計算処理を行い、各構成要素を制御する。また、CPU8が情報探索プログラム14を解釈・実行する際には、情報探索プログラム14やデータ等を、ハードディスク10からメモリ6に読み込む。
【0057】
ここで、キーボード等9はパーソナルコンピュータに一般的に使用されているマウス等を含む。また、ディスプレイ7は、CRTディスプレイや液晶ディスプレイ等である。さらに、図示した基準データのキーワード11aは、基準データ11に含まれるキーワードがCPU8により抽出され、メモリ6に読み込まれたことを概念的に表している。また、検索対象データのキーワード12aについても同様である。
【0058】
次に、本実施形態における各構成要素の動作を図4のフローチャートに従って説明する。
【0059】
図3の情報探索システムを使用して調査を行おうとする者(以下「調査者」と略す。)は、入力手段であるキーボード等9を使用し、調査開始のコマンドを入力すると、CPU8はそのコマンドを解釈し、情報探索プログラム14を起動する。
【0060】
ここでCPU8が、起動された情報探索プログラム14を解釈し、実行することにより、図4のフローチャートに図示された4つの処理が行われる。この4つの処理とはすなわち、基準データからキーワードを抽出する第1抽出ステップS1と、検索対象データからキーワードを抽出するステップS2と、基準データのキーワードと検索対象データのキーワードとの関連付けを選択させるステップS3と、関連付けられた検索対象データのキーワードに基づいて検索対象データの情報ブロックを検索するステップS4である。以上の4つの処理によって、情報探索機能15が実現する。また、基準データからキーワードを抽出する第1抽出ステップS1と、検索対象データからキーワードを抽出するステップS2とを、予め別ステップで処理しておき、情報探索プログラム14の実行開始によって、即座に基準データのキーワードと検索対象データのキーワードとの関連付けを選択させるステップS3から処理を進めることもできる。
【0061】
以下にS1及至S4の、夫々のステップの概略を先に説明する。
【0062】
まず、基準データからキーワードを抽出する第1抽出ステップS1とは、ハードディスク10に格納された基準データ11に含まれる情報ブロックを構成している、複数のキーワードを抽出するステップである。このステップにより抽出されたキーワードは、S3及びS4において使用される。以下、基準データからキーワードを抽出する第1抽出ステップS1を、「基準データからの第1抽出ステップ」と略す。
【0063】
次に、検索対象データからキーワードを抽出するステップS2とは、ハードディスク10に格納された、検索対象データ12に含まれる複数の情報ブロックを構成している、複数のキーワードを抽出するステップである。このステップにより抽出されたキーワードは、S3及びS4において使用される。以下、検索対象データからキーワードを抽出するステップS2を、「検索対象データからの抽出ステップ」と略す。
【0064】
続いて、基準データのキーワードと検索対象データのキーワードとの関連付けを選択させるステップS3とは、S1において基準データ11から抽出されたキーワードと、S2において検索対象データ12から抽出されたキーワードとの関連付けを、調査者に選択させるステップである。このステップにより選択された関連付けは、S4において使用される。以下、基準データのキーワードと検索対象データのキーワードとの関連付けを選択させるステップS3を、「関連付け選択ステップ」と略す。
【0065】
続いて、関連付けられた検索対象データのキーワードに基づいて検索対象データの情報ブロックを検索するステップS4とは、S3において関連付けられた検索対象データ12のキーワードに基づいて、基準データ11の情報ブロックと類似の、検索対象データ12の情報ブロックを検索するステップである。この検索ステップにより、検索対象データ12の情報ブロック毎に、基準データ11の情報ブロックに類似しているか否かが判定される。以下、関連付けられた検索対象データのキーワードに基づいて検索対象データの情報ブロックを検索するステップS4を、「検索ステップ」と略す。
【0066】
以上が、S1及至S4の各ステップの概略であり、以下に夫々のステップを詳細に説明する。
【0067】
まず、基準データからの第1抽出ステップS1においては、前述のCPU8が情報探索プログラム14を解釈し、実行することにより、図5のフローチャートに図示されたS11及至S15の処理を行う。以下、図5のフローチャートに基づいて、S11及至S15の夫々の処理について説明する。
【0068】
最初に、S11においてCPU8は、ディスプレイ7に図7の基準データ入力画面30を表示させ、調査者からの基準データ入力命令を待つ。ここで調査者は、キーボード等9を使用し、基準データ読込ボタン34を通じて基準データ読込を指示する。更に、調査者は、パスやファイル名等の基準データを特定する情報もあわせて指定する。そうすると、CPU8は調査者の基準データ読込の指示を受け、指定された基準データを、基準データ表示部33に表示する。また、CPU8は、当該基準データの分析を行い、「請求項」という文字や墨付括弧の記号により、基準データを請求項毎に分割し、請求項の一覧を請求項一覧表示部31に表示する。この、調査者が入力する基準データの例としては、特許等の明細書がある。また、このような基準データの受付処理の例としては、調査者が図8に図示したデータを基準データとして指定した場合、基準データ入力画面30は図9のような状態になる。
【0069】
次に、CPU8は、図9の入力画面を表示すると、請求項一覧表示部31に表示した基準データの請求項のうち、どれを使用するかの選択指示である、調査者の請求項選択命令を待つ。ここで調査者は、キーボード等9を使用し、請求項一覧表示部31の各請求項をダブルクリックすること等によって、一以上の請求項の選択を命令する。そうすると、CPU8は調査者の請求項選択の指示を受け、指定された請求項のデータを、基準データ表示部33から抽出して、選択請求項表示部32に表示する。
【0070】
この抽出・表示処理の際に、CPU8により、先の調査者による請求項選択の指示により選択された、一以上の請求項の中に、従属項を含んでいるか否かの分岐判定S12が行われる。ここで、従属項を含んでいるか否かは、基準データ表示部33から抽出した請求項データにおいて、「請求項」の文字や「請求項1及至3」の文字のような、他の請求項を引用しているか否かにより判定する。このS12において、従属項を含んでいるとCPU8が判定した場合、当該従属項が引用している請求項のデータも基準データ表示部33から抽出し、あわせて選択請求項表示部32に表示する(S13)。またこのS13において、従属項が引用している請求項が、更に他の請求項を引用している場合(他の請求項の従属項目である場合)、当該引用している請求項のデータも、あわせて選択請求項表示部32に表示する。このような処理を、引用している請求項が独立項になるまで繰り返す。以上のような従属項判定S12の例として、図9の状態の基準データ入力画面30において、調査者が請求項一覧表示部31から「請求項2」を指定した場合、基準データ入力画面30は図10の状態になり、請求項1と2のデータが反映される。このようにして、調査者の請求項選択の指示が選択請求項表示部32に反映されることになる。この選択請求項表示部32に表示されている請求項データは、前述の情報探索機能における情報探索の基準となる情報単位である、基準データの情報ブロックを表している。
【0071】
そして、この図10の基準データ入力画面30において、調査者がキーボード等9を使用し、選択請求項表示部32に表示された請求項データを編集することができる。すなわち、選択請求項表示部32に表示された請求項データに、文字や記号等を付け加えたり、又は削除したりすることができる。
【0072】
続いて、この図10の基準データ入力画面30において、調査者がキーボード等9を使用し、キーワード抽出ボタン35をクリックすること等によって、基準データの情報ブロックからのキーワード抽出を命令する。そうすると、CPU8は調査者のキーワード抽出の指示を受け、選択請求項表示部32に表示された請求項データを、キーワードに分割する(S14)。この分割の方法としては、CPU8が請求項データに含まれる助詞や空白文字等毎に、キーワードに分割する方法がある。このようなキーワード分割の例として、図10の入力画面における選択請求項表示部32に表示された請求項データは、図11に図示した分割キーワード一覧37のようにキーワード分割される。
【0073】
そして、請求項データをキーワードに分割すると、CPU8はディスプレイ7に図12の探索条件決定画面40を表示させ、請求項データを請求項データ表示部42に、分割キーワード一覧37をキーワード一覧表示部43に表示する(S15)。この図12の探索条件決定画面40において、調査者がキーボード等9を使用し、請求項データ表示部42に表示された請求項データを編集することができる。すなわち、請求項データ表示部42に表示された請求項データに、文字や記号等を付け加えたり、又は削除したりすることができる。ここで、請求項データ表示部42に表示された請求項データを編集した場合、調査者がキーボード等9を使用し、キーワード再抽出ボタン41をクリックすること等によって、請求項データ表示部42からのキーワード再抽出、及び抽出したキーワード一覧をキーワード一覧表示部43へ再表示できる。
【0074】
このようにして、CPU8はキーワード一覧表示部43にキーワードの一覧を表示すると、当該キーワードのうち、使用するキーワードの指示である、調査者のキーワード選択命令を待つ。ここで調査者は、キーボード等9を使用し、キーワード一覧表示部43の各キーワードをダブルクリックすること等により、一以上のキーワードの選択を命令する。そうすると、CPU8は調査者のキーワード選択の指示を受け、指定されたキーワードを、キーワード一覧表示部43から抽出して、検索条件表示部48の構成要素の列に表示する。このように、調査者がキーワード一覧表示部43から、例えば「キー項目」、「順序」、「検索結果」の各キーワードを順次クリックすることにより、図13のように検索条件表示部48の構成要素の列に選択したキーワードが表示される。この場合において調査者が選択するキーワードは、キーワード一覧表示部43に表示された全てのキーワードではなく、発明の特徴を表すようなものを選ぶのが適当である。このように、キーワードの取捨及び編集は専ら調査者が決定するものであり、情報探索プログラム14による自動的な決定がなされるのでは無い。
【0075】
以上が、基準データからの第1抽出ステップS1における各処理の説明である。ここで、図13において検索条件表示部48の構成要素の列に表示されている各キーワードが、基準データからの第1抽出ステップS1で抽出されたキーワードである。以下、検索対象データからの抽出ステップS2について説明する。
【0076】
この検索対象データからの抽出ステップS2においても、前述のCPU8が情報探索プログラム14を解釈し、実行することにより以下の処理が行われる。まずCPU8は、キーボード等9を通じて調査者から、S1によって受け付けた基準データに対しての、検索対象となる検索対象データの入力を受け付ける。この検索対象データの例としては、複数件数の特許公報等があげられ、その場合には出願毎の特許公報等が検索対象データにおける個々の情報ブロックとなる。また、前述のように、検索対象データにおける個々の情報ブロックは、基準データの情報ブロックとの類似度が判定される情報単位である。
【0077】
そして、CPU8は、調査者により入力された検索対象データを、前述の基準データからの第1抽出ステップS1におけるS14と同様に、キーワードに分割する。この分割の方法としては、CPU8が検索対象データに含まれる助詞や空白文字等毎に、キーワードに分割する方法がある。以上のようにして、検索対象データからの抽出ステップS2において分割された、検索対象データのキーワード一覧38を図14に図示する。ここで、図14において表示されているキーワードが、検索対象データからの抽出ステップS2で抽出されたキーワードとする。
【0078】
以上が、検索対象データからの抽出ステップS2における各処理の説明である。この検索対象データからの抽出ステップS2においては、調査者は検索対象データを指定するのみであり、他の処理は情報探索プログラム14に基づいて行われる。そのため、この検索対象データからの抽出ステップS2の後に、基準データからの第1抽出ステップS1を情報探索プログラム14が行っても不都合は無い。つまり、基準データからの第1抽出ステップS1と、検索対象データからの抽出ステップS2とは、順不同である。以下、関連付け選択ステップS3について説明する。
【0079】
この関連付け選択ステップS3においても、前述のCPU8が情報探索プログラム14を解釈し、実行することにより以下の処理が行われる。ここで、S1とS2を終えると、図13の探索条件決定画面40がディスプレイ7に表示されており、CPU8は調査者からの関連付け選択命令を待つ。ここで調査者は、キーボード等9を使用して、検索条件表示部48の構成要素の列に表示された各キーワードのうち、任意のキーワード(以下、「任意キーワード」と略す。)を選択し、同義語ボタン44をクリックすること等により、関連付け選択画面表示を指示する。これを検知すると、CPU8は、当該任意キーワードデータを検索条件表示部48から抽出し、情報探索プログラム14が予め保持している関連付け選択画面50をディスプレイ7に表示する。(後述)
【0080】
この関連付け選択画面50は、対象キーワード表示部51と、ヒットキーワード一覧表示部52と、ヒット外キーワード一覧表示部53と、関連付け実行ボタン54とを有している。ここで、対象キーワード表示部51とは、先に調査者によって検索条件表示部48の構成要素の列から選択された、任意キーワードを表示する部位である。図15の関連付け選択画面50においては、任意キーワードとして「キー項目」が選択されたことが分かる。また、ヒットキーワード一覧表示部52とは、任意キーワードを検索キーとして、S2で抽出されたキーワードに対して検索を行った結果、ヒットしたキーワードの一覧を表示する部位である。更に、ヒット外キーワード一覧表示部53とは、任意キーワードを検索キーとして、S2で抽出されたキーワードに対して検索を行った結果、ヒットしなかったキーワードの一覧を表示する部位である。このS2で抽出されたキーワードに対して行う検索方法は、前述の一般的なパターンマッチングが使用される。その結果、S2で抽出されたキーワードは各々、ヒットキーワード一覧表示部52とヒット外キーワード一覧表示部53との、どちらか一方に振り分けられ、表示される。また、この振り分け処理は、調査者が選択した類似度基準により判断される。図15のように、関連付け選択画面50は、調査者が類似度基準を選択できるように、ラジオボタンを複数備えている。図15の関連付け選択画面50においては、類似度が(弱)、(中)、(強)の3つのラジオボタンを備えており、調査者がどのラジオボタンを選ぶかにより類似度基準を選択できる。この類似度基準のキーワード振り分け例としては、「主キー」という任意キーに対して類似度基準を(強)に設定した場合、S2で抽出されたキーワードのうち、「主キー」という文字を完全に含むキーワードのみが、ヒットキーワード一覧表示部52に表示されることが挙げられる。また同様に、「主キー」という任意キーに対して類似度基準を(弱)に設定した場合、S2で抽出されたキーワードのうち、「主キー」という文字の一部分(例えば「主」や「キー」)を含むキーワードが、ヒットキーワード一覧表示部52に表示されることが挙げられる。
【0081】
先の関連付け選択画面50をディスプレイ7に表示すると、CPU8は、先の抽出した任意キーワードデータを対象キーワード表示部51に表示する。更にCPU8は、情報探索プログラム14により初期設定されている類似度基準と、S2で抽出されたキーワードとを読み込み、当該類似度基準に基づいて先のパターンマッチングにより、S2で抽出されたキーワードを、ヒットキーワード一覧表示部52とヒット外キーワード一覧表示部53とに振り分けて表示する。このような類似度基準を設ける理由は、構成要素として選択したキーワードに類似するキーワードが検索対象データ中に多く含まれる場合は、類似度の高いキーワードのみをヒットキーワード一覧表示部52に表示させて調査者が即座に必要とする検索用のキーワードを選択できるようにするためである。従って、構成要素として選択したキーワードに類似するキーワードが検索対象データ中に殆ど無い場合は、類似度の低いキーワードも含めてヒットキーワード一覧表示部52に表示させ、調査者が選択できるようにしている。更に、ヒットキーワード一覧表示部52に表示されるキーワードの件数が一定範囲内となるように、情報探索プログラム14によりラジオボタンの1つを選択させることもできる。
【0082】
また、調査者がキーボード等9を使用して、関連付け選択画面50上の類似度基準選択ラジオボタンの選択を行い、当該類似度基準を変更すると、CPU8は当該類似度基準に基づいて、再度先のS2で抽出されたキーワードを読み込み、先のパターンマッチングによりヒットキーワード一覧表示部52とヒット外キーワード一覧表示部53とに振り分けて表示する。このようにして、情報探索プログラム14により初期設定されている類似度基準を、調査者が変更することができる。
【0083】
続いて、調査者は、キーボード等9を使用して、ヒットキーワード一覧表示部52とヒット外キーワード一覧表示部53とに表示されたS2で抽出されたキーワードの一覧のうち、対象キーワード表示部51に表示された任意キーワードと同義語等の関係にあると考えるキーワードを選択する。この選択方法としては、ヒットキーワード一覧表示部52とヒット外キーワード一覧表示部53とに表示された、各キーワード毎に備えられたチェックボックスにチェックすることにより選択する方法がある。通常、ヒットキーワード一覧表示部52には調査者が構成要素として選択したキーワードは表示しない。調査者が構成要素として選択したキーワードは表示するまでもなく、調査者によって選択されたものとして処理が行われる。なお、調査者が構成要素として選択したキーワードも表示させると、検索対象データ中に選択した構成要素の有無を調査者が確認可能となる。このチェック付けを検知すると、CPU8は任意キーワードと当該チェックされたキーワードとの関連付けを記憶する。また、チェック付けが解除されると、CPU8は任意キーワードと当該チェックが解除されたキーワードとの関連付けを削除する。図15の関連付け選択画面50を例にとると、任意キーワードである「キー項目」に対して、「検索キー」と「検索項目」と「特徴部分」とがキーワード選択され、関連付けが記憶されている状態である。
【0084】
このように、調査者がキーボード等9を使用して、任意キーワードと、同義語等の関係にあると考えるキーワードを選択し、関連付け選択画面50上の関連付け実行ボタン54をクリックすること等により、任意キーワードに対する他のキーワードの関連付け保存が行われる。これを受けてCPU8は、当該関連付けを保存し、当該任意キーワードに関連付けられた他のキーワードを、探索条件決定画面40上の検索条件表示部48の、当該任意キーワードの行であり、同義語項目の列と交わる領域に各々表示する。この例として、図16の探索条件決定画面40上の検索条件表示部48においては、「キー項目」という任意キーワードに対して「検索キー」、「検索項目」、「特徴部分」という3つのキーワードが、「順序」という任意キーワードに対しては「手続」、「順番」という2つのキーワードが夫々関連付けられていることを示している。また同時に、図16の探索条件決定画面40上の検索条件表示部48においては、「検索結果」という任意キーワードに対して、全くキーワードが関連付けられていないことも示している。このように、任意キーワードに対して関連付けキーワードの無い場合は、構成要素として選択された語句、即ちこの場合は「検索結果」のキーワードのみを用いて検索用データベースの検索が行われる。(後述)
【0085】
以上が、関連付け選択ステップS3における各処理の説明である。ここで、図16において検索条件表示部48の構成要素の列に表示されている各任意キーワードに対し、当該任意キーワード毎の行の同義語項目に表示されているキーワードが、S3において当該任意キーワード毎に関連付けされた検索対象データのキーワードである。以下、検索ステップS4について説明する。
【0086】
この検索ステップS4においても、前述のCPU8が情報探索プログラム14を解釈し、実行することにより以下の処理が行われる。ここで、検索ステップS4は図6のフローチャートに図示されたS41及至S43の処理から成り立っている。以下、図6のフローチャートに基づいて、S41及至S43の夫々の処理について説明する。
【0087】
まず、図16の探索条件決定画面40において、CPU8は、検索条件表示部48の構成要素の列に表示されている各任意キーワード毎に重み付けを付与する指示である、調査者の重み付け付与命令を待つ。ここで調査者は、キーボード等9を使用し、検索条件表示部48の構成要素の列に表示されている各キーワードをクリックすること等により当該キーワードを選択した上で、重み付け付与メーター45を操作するか或いはキーボード等9から数値を入力することにより、重み付け付与の指示を行う。ここで重み付け付与メーター45は、図16のように、中央の重み付け指示棒を左右に操作することにより、特定範囲の数値の中から、重み付け指示棒が指し示す値を選択できるように構成されている。この調査者からの重み付け付与の指示を受けると、CPU8は、検索条件表示部48の該当キーワードの行における重みの列に、重み付け付与メーター45に示された値を表示する(S41)。この例として、図16の探索条件決定画面40において、「キー項目」という任意キーワードに対して「8」が、「順序」という任意キーワードに対して「6」が、「検索結果」という任意キーワードに対して「3」が夫々調査者によって重み付け付与された場合、探索条件決定画面40は図17のような状態になる。また、調査者が特に重み付け指定していない、検索条件表示部48の構成要素の列に表示されているキーワードについては、情報探索プログラム14により初期設定値が自動設定されると、調査者にとって簡便であり望ましい。
【0088】
ここで、調査者による重み付け付与ステップS41は、説明の便宜上からS4に含めたが、S1の最後や、S2、S3の他のステップに存在していても良い。また調査者は、探索条件決定画面40に表示されている時には適時、探索条件決定画面40に表示されている各種データを保存することや、以前保存された当該各種データを読み込むことができる。例えば、調査者が探索条件決定画面40上の設定保存ボタン46をキーボード等9を使用し、クリックすることを受けて、CPU8は、当該探索条件決定画面40に表示されている各種データをハードディスク10に保存する。また、調査者が探索条件決定画面40上の設定読込ボタン47をキーボード等9を使用してクリックし、設定ファイルを指定することを受けて、CPU8は、当該設定ファイルをハードディスク10からメモリ6に読み込み、探索条件決定画面40に当該設定ファイルの内容を表示する。
【0089】
次に、CPU8は、検索条件表示部48の条件に基づいて、検索対象データの情報ブロック毎に類似度判定を行う探索開始指示である、調査者の探索開始命令を待つ。ここで調査者は、キーボード等9を使用し、探索条件決定画面40上の探索開始ボタン49をクリックすること等によって、探索開始を指示する。そうすると、CPU8は調査者からの探索開始指示を受け、検索条件表示部48に表示されている検索条件データを抽出する。この例として、図17の探索条件決定画面40の状態において、調査者からの探索開始指示がなされると、図18のような検索条件データ60が抽出される。ここで、検索条件データ60には新たに管理番号の列が存在するが、これは検索条件データ60の各レコードをユニークにする為に管理番号を付したものである。
【0090】
続いて、CPU8は、検索条件データ60に基づいて、検索対象データの情報ブロック毎に類似度判定を行う(S42)。この類似度判定方法としては、検索条件データ60において、ある特定の構成要素に対する同義語の数がNで、検索対象データのある特定の情報ブロック(以下「特定情報ブロック」と称す。)に対して、N個のキーワードを使用した検索の結果M個ヒットした場合、その構成要素に対しての特定情報ブロックの得点は「(M/N)*重み」として、特定情報ブロック毎に記録される。同様に、他の構成要素である「順序」及び「検索結果」についても同様の検索と記録を行う。最後に、各構成要素毎の得点を、特定情報ブロック毎に集計して、その特定情報ブロックの類似度得点とする。
【0091】
例えば、第18図に示す検索条件データ60において、構成要素が「キー項目」の行では、同義語の数が3つ(「検索キー」、「検索項目」、「特徴部分」)であるのでNの数は構成要素として選択した「キー項目」を加えてN=4となる。これに対し、検索対象データのある特定の情報ブロックにおいて、「検索キー」と「検索項目」と「特徴部分」と「キー項目」とを検索キーワードとして、その情報ブロックを検索した場合「検索キー」と「検索項目」と「特徴部分」と「キー項目」の4つのキーワードが共に存在した場合は、M=4であることが分かり、第18図に示す検索条件データ60より、構成要素が「キー項目」の重みは8であることが分かる。よって、この特定情報ブロックにおける構成要素が「キー項目」の行の得点は、「(M/N)*重み」の式に代入すると「(4/4)*8」となり、当該式の解として「8」であることが分かる。同様にして、構成要素が「順序」の行と「検索結果」の行とにおいても、当該特定情報ブロックにおいて得点を算出する。そして、以上の3つの構成要素の行毎に算出された得点を合計することにより、当該特定情報ブロックの合計得点(類似度得点)が算出される。なお、ここでは3つの構成要素の行毎に算出された得点を単純に合計しているが、3つの構成要件の行毎に算出された得点の積を求めて、合計得点を補正することができる。然るに、同じ技術を広範な同義語で表現できる特許明細書や技術文献といった文章を対象に類似度を求めるので、得点の算定方法を厳密に定める意味は殆ど無いため、種種の計算方法を採用できる。
【0092】
また、先のS42において、検索条件データ60におけるある特定の構成要素に対する同義語の数であるNに、当該特定の構成要素を加えない数(N−1)をNとしても良い。例えば、第18図に示す検索条件データ60において、構成要素が「キー項目」の行では、同義語の数が3つ(「検索キー」、「検索項目」、「特徴部分」)であるのでN=3とし、調査者が選んだ3つのキーワードを検索キーワードとして、先のS42を行う。このように、当該構成要素自体をキーワードとして採用しないことにより、検索対照データ中のキーワードのみによる類似度判定を行うことができる。
【0093】
このようにして、CPU8は、検索条件データ60に基づいて、検索対象データの情報ブロック毎に類似度得点を算出すると、当該類似度得点の高い順に検索対象データの情報ブロックをソート処理し、ディスプレイ7に一覧表示する(S43)。この例としては、図19のような表示方式がある。この図19の検索情報データの情報ブロック類似度順一覧70においては、「文献番号」の項目の値がその情報ブロックの当初の表示順番を意味し、「得点順位」の項目の値がその情報ブロックの合計得点順番を意味している。例えば、「文献番号」が「373」の情報ブロックの行からは、当初は373番目の行に表示されていた情報ブロックであり、合計得点が他の情報ブロックに比べ一番高かったことが分かる。同様にして、「文献番号」が「373」の情報ブロックの行からは、「公開番号」が「H03−1234」であることや、「公開日」が「H03/10/10」であること、また「発明の名称」が「Aシステム」であることが読み取れる。更に、「リンク」の項目にはパスとファイル名等の、個別の情報ブロックデータの識別情報を保持している。これにより、調査者がキーボード等9を使用し、情報ブロック類似度順一覧70上の個別の情報ブロックを選択することで、即座にCPU8が、当該情報ブロックをディスプレイ7に表示することができる。
【0094】
以上のようなS43により、調査者は、基準データの情報ブロックに対して、類似度得点の高い検索対象データの情報ブロックを、類似度得点順に認知することができる。
【0095】
以上述べてきたように本実施形態によれば、基準データから抽出したキーワード毎に、検索対照データから抽出したキーワードを複数関係づけることができ、当該関係付けられた検索対照データからのキーワードに基づいて、検索対照データの情報ブロックを検索できるので、もれなく確実に目的とする情報ブロックを検索及び抽出できる効果がある。そのため、調査者は、検索対照データに含まれる内容を情報ブロック単位毎に、注意を要するもの順に見ることができ、読込み調査の時間が大幅に短縮できる。
【0096】
【発明の効果】
本発明は以上のように構成され機能するので、これによると、基準データから抽出されたキーワード毎に、検索対象データから抽出されたキーワードを関連付けることができ、当該関連付けられた検索対象データからのキーワードに基づいて、検索対象データの情報ブロック毎に類似度を判定することができる。
【0097】
また、検索対象データの情報ブロック毎に、事前に検索用キーワードを登録する必要が無く、検索対象データ全てをキーワード対象とすることができる。
【0098】
更に、検索対象データにおいて、登録キーワードの統一必要性が考慮されていない場合においても、同義語等の関係にある技術用語等を、調査者が適切に検索キーワードとして選択することができる。
【0099】
これに加え、基準データから抽出されたキーワード毎に、関連付けられた検索対象データから抽出されたキーワードに対し、調査者が重み付けを付与することによって、類似度判定を調整することができる。
【0100】
以上のような点により、従来よりも細やかな調査が行うことが可能になり、もれなく確実に検索対象データから目的とする情報ブロックを検索及び抽出できる効果があるという、従来にない優れた情報探索システムを提供することができる。
【図面の簡単な説明】
【図1】本発明の一実施形態である情報探索システムの構成図である。
【図2】図1における記憶手段2の詳細図である。
【図3】図1の情報探索システムを、パーソナルコンピュータに適用した場合におけるブロック図である。
【図4】情報探索システムの処理を図示したフローチャート図である。
【図5】図4におけるS1を詳細化したフローチャート図である。
【図6】図4におけるS4を詳細化したフローチャート図である。
【図7】基準データ入力画面30の画面図である。
【図8】基準データのデータ例である。
【図9】基準データ入力画面30の画面図である。
【図10】基準データ入力画面30の画面図である。
【図11】基準データをキーワードに分割したキーワード一覧図である。
【図12】探索条件決定画面40の画面図である。
【図13】探索条件決定画面40の画面図である。
【図14】検索対象データをキーワードに分割したキーワード一覧図である。
【図15】関連付け選択画面50の画面図である。
【図16】探索条件決定画面40の画面図である。
【図17】探索条件決定画面40の画面図である。
【図18】検索条件データ60のデータ例である。
【図19】検索情報データの情報ブロック類似度順一覧70の表示例である。
【符号の説明】
1 情報探索システム
2 記憶手段
3 入力手段
4 表示手段
5 コンピュータ
6 メモリ
7 ディスプレイ
8 CPU
9 キーボード等
10 ハードディスク
11 基準データ
11a 基準データのキーワード
12 検索対象データ
12a 検索対象データのキーワード
13 バス
14 情報探索プログラム
15 情報探索機能
21 基準データ
21a 基準データの情報ブロック
22 検索対象データ
22a 検索対象データの情報ブロック
30 基準データ入力画面
31 請求項一覧表示部
32 選択請求項表示部
33 基準データ表示部
34 基準データ読込ボタン
35 キーワード抽出ボタン
36 基準データ
37 分割キーワード一覧
38 検索対象データのキーワード一覧
40 探索条件決定画面
41 キーワード再抽出ボタン
42 請求項データ表示部
43 キーワード一覧表示部
44 同義語ボタン
45 重み付け付与メーター
46 設定保存ボタン
47 設定読込ボタン
48 検索条件表示部
49 探索開始ボタン
50 関連付け選択画面
51 対象キーワード一覧表示部
52 ヒットキーワード一覧表示部
53 ヒット外キーワード一覧表示部
54 関連付け実行ボタン
60 検索条件データ
70 検索情報データの情報ブロック類似度順一覧

Claims (10)

  1. 一以上のキーワードからなる情報ブロックを含む基準データと、一以上のキーワードからなる情報ブロックを複数含む検索対象データとを記憶する記憶手段と、
    前記基準データを構成するキーワードと、前記検索対象データを構成するキーワードとの関連付けを入力する入力手段と、
    前記基準データの情報ブロックを基にして前記検索対象データから類似の情報ブロックを検索する処理を実行するコンピュータと、
    当該検索結果を表示する表示手段とを備えたシステムにおいて、
    前記コンピュータに、
    前記記憶手段に格納された前記基準データから当該基準データの情報ブロックを構成するキーワードを抽出する第1抽出ステップと、
    前記記憶手段に格納された前記検索対象データから当該検索対象データの複数の情報ブロックを構成するキーワードを抽出するステップと、
    前記基準データから抽出された一以上のキーワードと、前記検索対象データから抽出された一以上のキーワードとを前記表示手段に表示して、当該表示された基準データのキーワード毎に、前記検索対象データから抽出されたキーワードとの関連付けを調査者に選択させるステップと、
    当該関連付けされた,検索対象データから抽出されたキーワードに基づいて当該キーワードを抽出した検索対象データより前記類似の情報ブロックを検索する検索ステップとを実行させることを特徴とした情報探索プログラム。
  2. 請求項1記載の情報探索プログラムにおいて、
    前記検索ステップは、
    前記基準データから抽出されたキーワードと、当該キーワード毎に関連付けされた検索対象データから抽出されたキーワードとに基づいて、前記検索対象データより前記類似の情報ブロックを検索することを特徴とした情報探索プログラム。
  3. 請求項2記載の情報探索プログラムにおいて、
    前記第1抽出ステップは、
    前記基準データから抽出されたキーワードを調査者が編集することを前記入力手段から受け付けるステップを含むことを特徴とした情報探索プログラム。
  4. 請求項2記載の情報探索プログラムにおいて、
    前記第1抽出ステップは、
    前記基準データから抽出されたキーワードを調査者が取捨することを前記入力手段から受け付けるステップを含むことを特徴とした情報探索プログラム。
  5. 請求項1記載の情報探索プログラムにおいて、
    前記コンピュータが、
    前記基準データから抽出されたキーワード毎に調査者から検索処理における重要度を表す重み付けとの関連付けを受け付けるステップを備え、
    前記検索ステップは、当該基準データのキーワード毎に関連付けされた、前記検索対象データから抽出されたキーワードと、前記重み付けとに基づいて、前記検索対象データより前記類似の情報ブロックを検索するステップを実行させることを特徴とした情報探索プログラム。
  6. 請求項1及至5記載の情報探索プログラムにおいて、
    前記検索ステップは、
    前記検索対象データより類似の情報ブロックを検索した際に当該情報ブロック毎に類似度を示す情報を付与するステップを含み、
    前記コンピュータに、
    前記類似度順に前記検索結果を表示するステップを実行させることを特徴とした情報探索プログラム。
  7. 請求項1及至6記載の情報探索プログラムにおいて、
    前記基準データの情報ブロックが特定の特許等出願情報であり、
    前記検索対象データの複数の情報ブロックが複数の特許等出願情報または科学技術文献情報であることを特徴とした情報探索プログラム。
  8. 請求項7記載の情報探索プログラムにおいて、
    前記基準データの情報ブロックが特定の特許出願の一以上の請求項であることを特徴とした情報探索プログラム。
  9. 請求項8記載の情報探索プログラムにおいて、
    特定の特許出願の一以上の請求項である前記基準データの情報ブロックが従属項である場合、
    前記第1抽出ステップは、
    当該従属項が引用している独立項を前記基準データの情報ブロックに加えるステップを含むことを特徴とした情報探索プログラム。
  10. 請求項1及至9記載の情報探索プログラムを記録した記録媒体。
JP2003140555A 2003-05-19 2003-05-19 情報探索プログラム及び情報探索プログラムを記録した媒体 Expired - Fee Related JP3929418B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003140555A JP3929418B2 (ja) 2003-05-19 2003-05-19 情報探索プログラム及び情報探索プログラムを記録した媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003140555A JP3929418B2 (ja) 2003-05-19 2003-05-19 情報探索プログラム及び情報探索プログラムを記録した媒体

Publications (2)

Publication Number Publication Date
JP2004342016A JP2004342016A (ja) 2004-12-02
JP3929418B2 true JP3929418B2 (ja) 2007-06-13

Family

ID=33529253

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003140555A Expired - Fee Related JP3929418B2 (ja) 2003-05-19 2003-05-19 情報探索プログラム及び情報探索プログラムを記録した媒体

Country Status (1)

Country Link
JP (1) JP3929418B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008538021A (ja) * 2005-03-04 2008-10-02 チョンヌン インコーポレイテッド 複数の情報ブロックに区分されたウェブページを用いた情報検索サービス提供サーバー、方法及びシステム
JP2006323517A (ja) * 2005-05-17 2006-11-30 Mitsubishi Electric Corp テキスト分類装置およびプログラム
JP5044707B1 (ja) * 2011-03-31 2012-10-10 株式会社東芝 情報処理システム、情報処理装置およびプログラム
JP5678256B2 (ja) * 2011-05-16 2015-02-25 アイビーリサーチ株式会社 知的財産管理装置
JP5862243B2 (ja) * 2011-11-30 2016-02-16 キヤノンマーケティングジャパン株式会社 情報処理装置、及びその制御方法、プログラム
JP2012216239A (ja) * 2012-07-12 2012-11-08 Toshiba Corp 情報処理装置、プログラムおよび情報検索方法
JP6188172B1 (ja) * 2016-03-15 2017-08-30 和之 白井 特許要件適否予測装置および特許要件適否予測プログラム

Also Published As

Publication number Publication date
JP2004342016A (ja) 2004-12-02

Similar Documents

Publication Publication Date Title
JP3282937B2 (ja) 情報検索方法及びシステム
US6029167A (en) Method and apparatus for retrieving text using document signatures
US7769771B2 (en) Searching a document using relevance feedback
US8803882B2 (en) Identifying on a graphical depiction candidate points and top-moving queries
US20090182733A1 (en) Apparatus, system, and method for information search
JPH09114860A (ja) データ検索方法及び装置
JPH10134075A (ja) 文書処理装置、単語抽出装置、単語抽出方法、及び単語抽出プログラムを記録した記録媒体
US20040249804A1 (en) Search supporting apparatus, search supporting method and searching program
EP1154355B1 (en) Document processing method, system and computer readable storage medium
JP3929418B2 (ja) 情報探索プログラム及び情報探索プログラムを記録した媒体
JP2006323517A (ja) テキスト分類装置およびプログラム
JP2003345829A (ja) 情報の検索方法およびその装置および情報検索のためのコンピュータプログラム
TWI396990B (zh) 引用文獻記錄擷取系統、方法及程式產品
CN109213830B (zh) 专业性技术文档的文档检索***
JP2005128872A (ja) 文書検索システム及び文書検索プログラム
KR20060114569A (ko) 특허정보시스템의 작동방법
JP7173314B2 (ja) マッピング支援装置、マッピング支援方法、及びプログラム
JPS6378228A (ja) 情報検索装置
JP4247026B2 (ja) キーワード頻度算出方法及びそれを実行するプログラム
US20080228725A1 (en) Problem/function-oriented searching method for a patent database system
JPH08314974A (ja) キーワード自動抽出装置および文書検索装置
WO2021192050A1 (ja) 分析支援プログラム、システム、及び方法
JPH09269952A (ja) 文書検索装置及びその方法
JP2009104548A (ja) 文書検索装置および文書検索支援方法
JP2005250682A (ja) 情報抽出システム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061010

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061207

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070306

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130316

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140316

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees