JP2005149346A - 文献情報分析システム及び文献情報分析プログラム - Google Patents

文献情報分析システム及び文献情報分析プログラム Download PDF

Info

Publication number
JP2005149346A
JP2005149346A JP2003388837A JP2003388837A JP2005149346A JP 2005149346 A JP2005149346 A JP 2005149346A JP 2003388837 A JP2003388837 A JP 2003388837A JP 2003388837 A JP2003388837 A JP 2003388837A JP 2005149346 A JP2005149346 A JP 2005149346A
Authority
JP
Japan
Prior art keywords
distribution density
keyword
region
display
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003388837A
Other languages
English (en)
Inventor
Masayuki Miyake
将之 三宅
Yuji So
裕二 宗
Takeshi Osuga
健 大須賀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nomura Research Institute Ltd
Original Assignee
Nomura Research Institute Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nomura Research Institute Ltd filed Critical Nomura Research Institute Ltd
Priority to JP2003388837A priority Critical patent/JP2005149346A/ja
Priority to PCT/JP2004/017632 priority patent/WO2005050480A2/ja
Publication of JP2005149346A publication Critical patent/JP2005149346A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 特許マップ作成の効率化及び品質の安定化を図れると共に、分析結果の一覧性を向上できる技術の提供。
【解決手段】 複数の文献情報中からキーワードを抽出する手段、各文献情報に含まれるキーワードの組合せ及び出現数に対して主成分分析を施し、各文献の座標を算出する手段、各文献の座標を一定の面積を備えた領域の分布密度に変換する手段、各領域に分布密度に対応した表示パターンを割り当てる手段、二次元平面上に各領域の表示パターンを反映させた図形を生成する手段、この図形をディスプレイ42上に表示させる手段、各キーワードを含む文献の総数及び各キーワードの出現総数に対して主成分分析を施し、各キーワードの座標を算出する手段、この座標に従い二次元平面上に当該キーワードを配置する手段、各キーワードをディスプレイ42上に表示させる手段を備えた文献情報分析システム10。
【選択図】 図1

Description

この発明は文献情報分析システム及び文献情報分析プログラムに係り、特に、特許文献や学術文献などの膨大な数の電子化された文書情報の中から重要なキーワードを抽出し、各キーワード間の関係及びキーワードを含む文献間の関係を統計的手法を用いて分析すると共に、その結果を視覚的に表現する技術に関する。
多数の特許文献(出願公開公報及び特許登録公報等)を精査することにより、特定の技術分野における企業別の出願状況や技術開発の方向性を把握することができ、未開拓の領域を認識することも可能となるため、多くの企業において特許文献の収集及び分析が行われている。
また、分析結果を平面上にマッピングすることにより、当該技術分野における全体的な傾向を視覚的に把握できるように工夫することも実践されている。
この所謂特許マップの作成手順や表現方法については様々なものが提案されているが、以下の工程を経る点では概ね共通している。
(1) 電子化された膨大な数の特許文献を、国際特許分類(IPC)やFターム、出願人名、公報発行年度、フリーワード等によって数十件〜数百件程度に絞り込む。
(2) 各特許文献のタイトルや要約書、代表図面をチェックし、不要な文献を排除する。
(3) 残った文献の内容を詳細に検討し、発明の内容(目的、構成、効果等)を短くまとめて書き出す。
(4) 各特許文献の番号、出願日、分類、出願人、内容等を1枚のカードに書き写し、縦軸に技術分類、横軸に年代等を設定した平面上に配置する。
(4) の代わりに、各特許文献から特徴的なキーワード(技術用語)を抽出し、これらを平面状に配置すると共に、関連する特許文献の番号や出願人名等を列記する場合もある。あるいは、各キーワードに関連する特許文献の数量を円の面積で表現することにより、キーワード間の関係(重要度)を一覧表示する手法もある。
何れにしても、特許マップの作成には膨大な時間が必要であり、人為的な作業が中心となるため、対象となる文献数を事前に厳しく絞り込んでおくことが不可欠となる。
このような特許マップの作成を支援するツールとして、下記の特許文献1においては、予め配置条件設定画面上において特許マップの外形寸法、表示項目、縦軸と横軸に用いる項目等を設定しておき、特許マップ化の対象となる二次元配列データ(出願日、分類、公開番号、コメント等のデータを含むCSVファイル)の座標をこれらの配置条件に従って算出する特許マップ作成システムが開示されている。
特開2001−222536号公報
上記特許文献1のシステムによれば、従来の(4)の作業を自動化することができ、特許マップの作成作業をある程度効率化することが可能となる。
しかしながら、特許マップ作成において最も時間を要する特許文献の内容分析や評価自体は人間が行うことが前提となっているため、その省力化効果は限定的なレベルにとどまる。
また、事前に分析対象となる特許文献数自体を厳しく絞り込むことが不可欠であり、その過程で重要な特許文献の取りこぼしが生じる危険性が高い。
さらに、このように特許文献の評価や内容分析を人為的に処理する限りは、作業者の主観や能力、経験によって成果物の品質が大きく左右され、安定性に欠けることとなる。
しかも、上記システムによって得られる特許マップは、平面上に一定の面積を有するカードを配置する形式であるため一覧性に欠け、当該技術分野における全体的な傾向や方向性を直感的に把握する用途には不向きである。
この発明は、従来の特許マップ作成システムが抱える上記の問題点を解決するためになされたものであり、各特許文献の評価や内容分析を自動化することにより、特許マップ作成の効率化及び品質の安定化を図れると共に、分析結果の表示方法を工夫することにより、一覧性の向上を実現可能な技術を提供することを目的としている。
上記の目的を達成するため、請求項1に記載した文献情報分析システムは、電子化された複数の文献情報の中から、所定の基準に従って複数のキーワードを抽出する手段と、各文献情報に含まれるキーワードの組合せ及び出現数に対して主成分分析を施すことにより、二次元平面上における各文献の座標を算出する手段と、各文献の座標を一定の面積を備えた領域毎に集計することにより、各領域の分布密度を算出する手段と、各領域に対し、その分布密度に対応した表示パターンを割り当てる手段と、二次元平面上に各領域の表示パターンを反映させることにより、文献の分布密度に対応した図形を生成する手段と、当該図形をディスプレイ上に表示させる手段と、上記キーワードを含む文献の総数及び各キーワードの出現総数に対して主成分分析を施すことにより、二次元平面上における各キーワードの座標を算出する手段と、各キーワードの座標に従い、上記二次元平面上に当該キーワードの存在を示すシンボルを配置する手段と、当該シンボルをディスプレイ上に表示させる手段とを備えたことを特徴としている。
上記「文献情報」には、特許公開公報や特許登録公報などの特許文献の他、論文などの学術文献、雑誌の記事などが含まれる(以下同様)。
上記「分布密度に対応した表示パターンを割り当てる」とは、例えば分布密度に応じて異なった色彩や模様、濃淡度を割り当てることが該当する(以下同様)。
上記「キーワードの存在を示すシンボル」としては、例えばキーワードを表す文字列(略語、イニシャルを含む)や、点などの図形とキーワードを表す文字列との組合せが該当する(以下同様)。
上記「主成分分析」とは、多くの変量の値をできるだけ情報の損失なしに、数個の総合的指標(主成分)で代表して表す統計的手法を意味する(以下同様)。
この文献情報分析システムを所謂クライアント−サーバ型のシステム構成によって実現する場合、上記「ディスプレイ上に表示させる手段」は、クライアント端末に表示用の情報を配信し、クライアント端末のディスプレイ上に必要情報(分布密度に対応した図形やキーワードの存在を示すシンボル等)を表示させるサーバ側の機能を指す(以下同様)。
請求項2に記載した文献情報分析システムは、請求項1のシステムを前提とし、さらに入力手段を介して特定のシンボルが選択された場合に、当該シンボルに関連付けられたキーワードを含む文献のリストを生成する手段と、当該文献のリストをディスプレイ上に表示させる手段とを備えたことを特徴としている。
請求項3に記載した文献情報分析システムは、請求項2のシステムを前提とし、さらに入力手段を介して上記リスト中の特定の文献が選択された場合に、当該文献情報の少なくとも一部をディスプレイ上に表示させる手段を備えたことを特徴としている。
請求項4に記載した文献情報分析システムは、請求項1〜3のシステムを前提とし、さらに、上記文献情報が少なくとも特許出願人や特許権者、発明者、著作者等の主体情報を含んでおり、入力手段を介して特定の主体が選択された場合に、他の主体に係る文献を除いて上記領域の分布密度を再計算する手段と、各領域に対し新たに算出された分布密度に対応した表示パターンを割り当てる手段と、二次元平面上に各領域の表示パターンを反映させることにより、文献の分布密度に対応した図形を生成する手段と、当該分布密度に対応した図形をディスプレイ上に再表示させる手段とを備えたことを特徴としている。
請求項5に記載した文献情報分析システムは、請求項1〜3のシステムを前提とし、さらに、上記文献情報が少なくとも特許出願人や特許権者、発明者、著作者等の主体情報を含んでおり、入力手段を介して一対の主体が選択された場合に、領域毎に選択された主体間の文献数を比較し、その差を文献数の多い方の主体の分布密度として各領域に関連付ける手段と、各領域に対し、主体及び分布密度に対応した表示パターンを割り当てる手段と、二次元平面上に各領域の表示パターンを反映させることにより、主体及び文献の分布密度に対応した図形を生成する手段と、当該図形をディスプレイ上に再表示させる手段とを備えたことを特徴としている。
請求項6に記載した文献情報分析システムは、請求項1〜5のシステムを前提とし、さらに、上記文献情報が少なくとも特許出願日や出願公開日、論文発表日、文献発行日等の日時情報を含んでおり、入力手段を介して特定の日時範囲が選択された場合に、範囲外の日時に係る文献を除いて上記領域の分布密度を再計算する手段と、各領域に対し新たに算出された分布密度に対応した表示パターンを割り当てる手段と、二次元平面上に各領域の表示パターンを反映させることにより、文献の分布密度に対応した図形を生成する手段と、当該分布密度に対応した図形をディスプレイ上に再表示させる手段とを備えたことを特徴としている。
請求項7に記載した文献情報分析システムは、請求項1〜6のシステムを前提とし、さらに、上記文献情報の中から所定の基準に従って複数のキーワード候補を抽出する手段と、キーワード候補のリストをディスプレイ上に表示させる手段と、入力手段を介して特定のキーワード候補が選択された場合に、これをキーワードとして抽出する手段とを備えたことを特徴としている。
請求項8に記載した文献情報分析システムは、請求項1〜7のシステムを前提とし、さらに、キーワードに適さない単語を要削除単語として登録しておく記憶手段と、キーワードまたはキーワード候補の抽出に際し、各文献情報に要削除単語が含まれている場合には当該単語を削除する手段とを備えたことを特徴としている。
請求項9に記載した文献情報分析システムは、請求項1〜8のシステムを前提とし、さらに、実質的に同一の意味を有する複数の類義語を、それぞれ特定の代表語に関連付けて登録しておく記憶手段と、キーワードまたはキーワード候補の抽出に際し、各文献情報に上記類義語が含まれている場合には該当の代表語に統一する手段とを備えたことを特徴としている。
請求項10に記載した文献情報分析プログラムは、コンピュータを、電子化された複数の文献情報の中から、所定の基準に従って複数のキーワードを抽出する手段、各文献情報に含まれるキーワードの組合せ及び出現数に対して主成分分析を施すことにより、二次元平面上における各文献の座標を算出する手段、各文献の座標を一定の面積を備えた領域毎に集計することにより、各領域の分布密度を算出する手段、各領域に対し、その分布密度に対応した表示パターンを割り当てる手段、二次元平面上に各領域の表示パターンを反映させることにより、文献の分布密度に対応した図形を生成する手段、当該図形をディスプレイ上に表示させる手段、上記キーワードを含む文献の総数及び各キーワードの出現総数に対して主成分分析を施すことにより、二次元平面上における各キーワードの座標を算出する手段、各キーワードの座標に従い、上記二次元平面上に当該キーワードの存在を示すシンボルを配置する手段、当該シンボルをディスプレイ上に表示させる手段として機能させることを特徴としている。
請求項11に記載した文献情報分析プログラムは、請求項10のプログラムを前提とし、さらにコンピュータを、入力手段を介して特定のシンボルが選択された場合に、当該シンボルに関連付けられたキーワードを含む文献のリストを生成する手段、当該文献のリストをディスプレイ上に表示させる手段として機能させることを特徴としている。
請求項12に記載した文献情報分析プログラムは、請求項11のプログラムを前提とし、さらにコンピュータを、入力手段を介して上記リスト中の特定の文献が選択された場合に、当該文献情報の少なくとも一部をディスプレイ上に表示する手段として機能させることを特徴としている。
請求項13に記載した文献情報分析プログラムは、請求項10〜12のプログラムを前提とし、さらにコンピュータを、上記文献情報が少なくとも特許出願人や特許権者、発明者、著作者等の主体情報を含んでいる場合において、入力手段を介して特定の主体が選択された際に、他の主体に係る文献を除いて上記領域の分布密度を再計算する手段、各領域に対し、新たに算出された分布密度に対応した表示パターンを割り当てる手段、二次元平面上に各領域の表示パターンを反映させることにより、文献の分布密度に対応した図形を生成する手段、当該分布密度に対応した図形をディスプレイ上に再表示させる手段として機能させることを特徴としている。
請求項14に記載した文献情報分析プログラムは、請求項10〜12のプログラムを前提とし、さらにコンピュータを、上記文献情報が少なくとも特許出願人や特許権者、発明者、著作者等の主体情報を含んでいる場合において、入力手段を介して一対の主体が選択された際に、領域毎に選択された主体間の文献数を比較し、その差を文献数の多い方の主体の分布密度として各領域に関連付ける手段、各領域に対し、主体及び分布密度に対応した表示パターンを割り当てる手段、二次元平面上に各領域の表示パターンを反映させることにより、主体及び文献の分布密度に対応した図形を生成する手段、当該図形をディスプレイ上に再表示させる手段として機能させることを特徴としている。
請求項15に記載した文献情報分析プログラムは、請求項10〜14のプログラムを前提とし、さらにコンピュータを、上記文献情報が少なくとも特許出願日や出願公開日、論文発表日、文献発行日等の日時情報を含んでいる場合において、入力手段を介して特定の日時範囲が選択された際に、範囲外の日時に係る文献を除いて上記領域の分布密度を再計算する手段、各領域に対し新たに算出された分布密度に対応した表示パターンを割り当てる手段、二次元平面上に各領域の表示パターンを反映させることにより、文献の分布密度に対応した図形を生成する手段、当該分布密度に対応した図形をディスプレイ上に再表示させる手段として機能させることを特徴としている。
請求項16に記載した文献情報分析プログラムは、請求項10〜15のプログラムを前提とし、さらにコンピュータを、上記文献情報の中から所定の基準に従って複数のキーワード候補を抽出する手段、キーワード候補のリストをディスプレイ上に表示させる手段、入力手段を介して特定のキーワード候補が選択された場合に、これをキーワードとして抽出する手段として機能させることを特徴としている。
請求項17に記載した文献情報分析プログラムは、請求項10〜16のプログラムを前提とし、さらにコンピュータを、キーワードに適さない単語を要削除単語として登録しておく記憶手段、キーワードまたはキーワード候補の抽出に際し、各文献情報に要削除単語が含まれている場合には当該単語を削除する手段として機能させることを特徴としている。
請求項18に記載した文献情報分析プログラムは、請求項10〜17のプログラムを前提とし、さらにコンピュータを、実質的に同一の意味を有する複数の類義語を、それぞれ特定の代表語に関連付けて登録しておく記憶手段、キーワードまたはキーワード候補の抽出に際し、各文献情報に上記類義語が含まれている場合には該当の代表語に統一する手段として機能させることを特徴としている。
この発明に係る文献情報分析システム及び分析プログラムにあっては、膨大な文献情報の中から自動的にキーワードあるいはキーワード候補を抽出し、これらを統計的手法を用いて分析することによって二次元平面上に各キーワードに対応したシンボルを配置させると共に、各文献の存在をも同じ二次元平面上に分布密度として表現することができる。
このため、文献情報として特許文献を用いることにより、多数の特許文献の全体的な広がりや集中具合、出願の方向性を一覧できる特許マップを自動生成することが可能となる。
また、各文献の評価や分析が基本的に自動化されるため、客観的な分析結果が得られるのみならず、従来のように対象文献数を無理に絞り込む必要がなくなり、比較的広い範囲における傾向を概観することが可能となる。
図1は、この発明に係る文献情報分析システム10の構成を示すブロック図であり、サーバ群12と、インターネット13やイントラネット等の通信ネットワークを介してサーバ群12と接続されたクライアント端末14とを備えている。
サーバ群12は、Webサーバ16と、AP(Application)サーバ18と、DB(Database)サーバ20とを備えており、APサーバ18には検索処理部22と、描画処理部24と、座標算出部26と、言語解析事前処理部28と、キーワード抽出部30と、表示データ蓄積部32と、要置換・削除単語データベース34と、類義語・必要語データベース36とが設けられている。
また、DBサーバ20は、文献データベース38を備えている。
サーバ群12は、それぞれWebサーバ16、APサーバ18、DBサーバ20として機能する独立したコンピュータをLAN接続することによって構成することもできるが、単一のコンピュータに各サーバ機能を実現するプログラムをセットアップすることによって構成することもできる。
APサーバ18の検索処理部22、描画処理部24、座標算出部26、言語解析事前処理部28、キーワード抽出部30は、APサーバ18のCPUがOS及び専用のアプリケーション・プログラムに従って必要な処理を実行することによって実現される。また、表示データ蓄積部32、要置換・削除単語データベース34、類義語・必要語データベース36は、APサーバ18のハードディスク内に格納されている。
クライアント端末14は、マウスやキーボード等の入力装置40と、ディスプレイ42とが接続されたPC等のコンピュータよりなり、分析要求部44と、表示処理部46とを備えている。
ここで、分析要求部44及び表示処理部46は、クライアント端末14のCPUが、OS及びWebブラウザプログラムに従って必要な処理を実行することによって実現される。
つぎに、図2及び図3のフローチャートに従い、この文献情報分析システム10における処理手順を説明する。
まずユーザは、クライアント端末14からインターネット13経由でWebサーバ16にアクセスする。そして、ID及びパスワードの入力を伴う認証ステップをクリアすると、Webサーバ16からクライアント端末14に検索条件入力用のフォームが送信され(S10)、ディスプレイ42に表示される(S12)。
これに対しユーザは、分析範囲を特定するための検索条件を入力装置40を介して入力し、分析要求部44を通じてWebサーバ16に送信する(S14)。
例えば、検索条件入力フォームにおいて、「文献種別(特開、特許登録、実開、実用登録等)」、「年度範囲(1992年〜2003年など)」、「国際特許分類(IPC)」、「Fターム」、「出願人/権利者」の中で必要な項目に検索条件を入力し、実行ボタンをクリックする。
これを受けたAPサーバ18の検索処理部22は、上記検索条件に合致する特許文献を文献データベース38から抽出し(S16)、ヒット件数が表記された検索結果ファイルがWebサーバ16からクライアント端末14に送信される(S18)。
ディスプレイ42に表示された検索結果に納得したユーザが、分析開始ボタンをクリックして分析リクエストを送信すると(S20)、検索処理部22は各特許文献の電子データ(文献情報)を文献データベース38から抽出する(S22)。
図4は抽出データの一例を示すものであり、「出願番号」、「出願日」、「出願人」、「発明者」、「発明の名称」、「抄録」の各データ項目を備えている。また、これらのデータは汎用的なCSV形式を備えている。
検索処理部22によって抽出されたデータは、表示データ蓄積部32に格納される。
つぎに言語解析事前処理部28が起動し、表示データ蓄積部32に格納された抽出データに対して整形処理を施す(S24)。
まず、言語解析事前処理部28は、テキストマイニングのアルゴリズムに従い抽出データを単語レベルに分解する。
つぎに言語解析事前処理部28は、要置換・削除単語データベース34を参照し、抽出データに含まれる不要な単語を削除すると共に、必要な置換処理を実行する。
ここで不要な単語とは、例えば抄録中に含まれる「課題」や「解決手段」、「効果」などの定型的な段落タイトル、あるいは「ところで」や「しかしながら」、「そこで」などの接続詞、「である。」、「この場合」など技術的な意味を有さない言葉が該当する。要置換・削除単語データベース34内には、予め分析対象外とすべき多数の要削除単語が登録されている。
また必要な置換処理としては、例えば出願番号中に含まれる「特願昭55-」の和暦表示を、「特願1980-」の西暦表示に変換することが該当する。このため、要置換・削除単語データベース34内には、予め和暦と西暦との対応データが格納されている。
言語解析事前処理部28によって整形された抽出データは、表示データ蓄積部32に格納される。
つぎにキーワード抽出部30が起動し、整形済みの抽出データからキーワード候補を抽出すると共に(S26)、各キーワード候補を出現文献数順に集計する。
まず、キーワード抽出部30は類義語・必要語データベース36を参照し、実質的に同義である複数の技術用語を一つの用語(代表語)に統一させる。例えば、ある特許文献中に「炭素繊維」とあり、他の特許文献中に「カーボンファイバ」の記載があった場合、キーワード抽出部はそれぞれについて「炭素繊維」の記載ありと認定し、それぞれを当該キーワード候補の出現文献としてカウントする。
ここで、無数の単語の中からどの程度の数のキーワード候補を抽出するかについては、予めシステム10において設定しておくこともできるが、分析要求時にユーザの側で設定することもできる。
例えば、抽出件数の上限を100件と設定されていた場合、キーワード抽出部30は出現文献数の上位100位内の単語をキーワード候補として選定する。
ただし、類義語・必要語データベース36内に特定の技術用語が必要語として設定されていた場合、キーワード抽出部30は当該必要語に該当する単語については例え出現文献数に基づく順位が100位以下であっても、キーワード候補として選定する。
この必要語の設定は、予めシステム運用者の側で準備して類義語・必要語データベース36に格納しておく他に、分析要求時にユーザが指定することもできる。
図5は、キーワード候補の抽出結果リスト50を例示するものであり、出現件数1位の「表面」というキーワード候補は、105件の特許文献中に合計で212回出現しており、全文献数に占める割合(出現頻度)が2.16%であることを示している。
このキーワード候補の抽出結果は、Webサーバ16からクライアント端末14に送信され(S28)、表示処理部46を通じてディスプレイ42に表示される(S30)。
これに対しユーザは、上記リストの中から必要なキーワード候補のチェックボックスにレ点を入力し、「選択」ボタン(図示省略)をクリックする(S32)。
これを受けたキーワード抽出部30は、ユーザが指定したキーワード候補を正式なキーワードとして抽出し(S34)、表示データ蓄積部32に格納する。
この際、各特許文献の出願番号と抽出したキーワード、及び各キーワードの出現数との対応関係も登録される。
つぎに座標算出部26が起動し、各特許文献の二次元平面上における位置座標を算出する(S36)。
すなわち、座標算出部26は、各特許文献に関連付けられたキーワードの組合せ及びそれぞれの出現数のデータを多変量解析の主成分分析用アルゴリズムに入力することにより、図6に示すように、各特許文献のX軸座標(第1主成分)及びY軸座標(第2主成分)が算出される。
この算出結果は、表示データ蓄積部32に格納される。
つぎに座標算出部26は、各特許文献の座標データを基に、二次元平面上における特許文献の分布密度を算出する(S38)。
すなわち、座標算出部26は、座標軸上の一定の面積に含まれる文献数を当該の領域の分布密度に変換する。
図7はその変換処理のイメージを示すものであり、二次元平面52上に各特許文献を座標通りにプロットした後(図中の黒点が各特許文献の位置を示している)、X軸及びY軸を所定の間隔で仕切ることによって複数の領域に区分し、各領域内に含まれる文献数を当該領域の分布密度として集計する。
例えば、αの領域には4件の特許文献が含まれているため、分布頻度は「4」とカウントされる。これに対し、βの領域には1件の特許文献も含まれていないため、分布頻度は「0」となる。
この分布密度データは、表示データ蓄積部32に格納される。
つぎに座標算出部26は、各キーワードを含む特許文献の件数、及び出現数のデータを主成分分析用アルゴリズムに入力することにより、図8に示すように、各キーワードのX軸座標(第1主成分)及びY軸座標(第2主成分)を算出する(S40)。
この算出結果は、表示データ蓄積部32に格納される。
つぎに描画処理部24が起動し、座標算出部26による算出結果に基づき、二次元平面上に分布密度データ及びキーワードの座標データを反映させた特許マップを生成する(S42)。
Webサーバ16は、この特許マップ表示用のWebファイルを生成し、クライアント端末14に送信することにより(S44)、クライアント端末14の表示処理部46を介してディスプレイ42に表示させる(S46)。
図9は特許マップ54の一例を示すものであり、各キーワードの存在を示す点が該当の座標上にプロットされると共に、各点の近傍には対応のキーワード(文字列)が表示されている。
また、特許マップ54上には、特許文献の分布密度に対応した図形(紋様)55が表示されている。
すなわち、上記のように特許マップ54を構成する細分化された領域には分布密度が予め関連付けられており、描画処理部24がその分布密度に応じて異なった色彩(表示パターン)を当該領域に割り当てることにより、特許マップ54上に分布密度を反映した図形(紋様)55が描画されることとなる。
各領域に対する色彩の割当て方に限定はないが、一例を挙げれば以下のようになる。
(1) 分布密度が50以上の領域 →赤色
(2) 分布密度が40〜49の領域→橙色
(3) 分布密度が30〜39の領域→黄色
(4) 分布密度が20〜29の領域→黄緑色
(5) 分布密度が10〜19の領域→水色
(6) 分布密度が1〜9の領域 →青色
(7) 分布密度が0の領域 →藍色
図9の特許マップ54は白黒で表現されているため分布密度を直感的に把握することは難しいが、実際には上記の色彩によって分布密度が鮮やかに描画されているため、ユーザはディスプレイ42上に表示された特許マップ54を一目見ただけで特許文献数の粗密具合を認識することができる。
分布密度の変化を色彩によって表現する代わりに、他の表示パターンによって表現することもできる。例えば、同一色彩における濃淡に差を付けることによって分布密度の変化を表現することが該当する。あるいは、各領域に分布密度に応じて異なった模様(斜線、網線等)を割り当てることにより、分布密度の変化を表現してもよい。
以下、図9の特許マップを観察することにより、ユーザはどのような情報を読み取ることができるのかについて説明する。
(1) まずユーザは、特定のキーワードの周辺に広がる分布密度を参照することにより、当該キーワード(技術テーマ)に関連する特許出願の多寡を認識することができる。例えば、「光励起」のキーワードの周辺が赤色で取り囲まれている場合、「光励起」に関連している特許出願件数が多いことを意味している。
(2) つぎにユーザは、各キーワードのマップ上における位置により、当該キーワードのユニーク度を確認することができる。すなわち、特許マップ54の中心に近い位置に配置されたキーワードは比較的オーソドックスであることを意味し、中心から外れるほどユニークな技術要素であることを読み取ることができる。
(3) またユーザは、複数のキーワード間の距離や組合せに基づき、各技術要素間の関係や位置付けを推察することもできる。
例えば、図10に示すように、「光励起」というキーワードの近傍に効果を表す「吸水性」、「防曇性」、「防露性」、「防汚性」のキーワードが配置されている場合、光励起作用を利用することによって吸水性、防曇性、防露性、防汚性といった効果を企図した出願傾向を読み取ることができる。
あるいは、「吸水性」、「防曇性」、「防露性」、「防汚性」の近傍で分布密度がゼロの領域には、光励起作用を利用して他の効果を実現する技術が配置されるべきことが予想できるため、つぎの技術開発の方向性を探る際の一助となる。
上記のキーワードのシンボル(点または文字列)は、特許マップ54上においてクリッカブルに表示されており、ユーザがマウスポインタを特定のキーワードに近づけてクリックすると、図11に示すように、描画処理部24によって別ウィンドウ56が開かれ、当該キーワードに関連付けられた特許文献の出願番号及び出願人名がリスト表示される。
さらに、このリストの中の特定文献をユーザがクリックすると、描画処理部24によって他のウィンドウ58が開かれ、表示データ蓄積部32内に格納された当該文献の抄録データが表示される。
またユーザは、特許マップ54の右横に設けられた年次指定欄58において特定の年次を指定し、「年次表示」ボタン60をクリックすることにより、当該年次における特許マップの表示を要求することができる。
すなわち、図9の特許マップ54は、最初の検索要求時にユーザが指定した年次範囲(例えば10年分)の特許出願に基づいて生成されたものであるが、この中からユーザが特定の年次を指定した場合、描画処理部24は各領域の分布密度から指定された年次以外の文献数を間引いて分布密度を再計算し、その結果を特許マップ54上に反映させる(図示省略)。
この際、キーワードのシンボル(点及び文字列)はそのままの位置で表示されるため、ユーザは分布密度を表す図形55を観察することにより、特定年次における出願傾向を読み取ることができる。
さらにユーザは、「アニメ表示」ボタン62をクリックすることにより、最初に指定した年次範囲内において、分布密度の変化を一定間隔をおいて年次単位で連続表示(アニメーション表示)させることもできる(図示省略)。
この場合も、キーワードのシンボル(点及び文字列)はそのままの位置で表示されるため、ユーザは分布密度を表す図形55の変化を観察することにより、出願傾向の推移を読み取ることができる。
ユーザは、出願人指定欄64において特定の出願人を指定することにより、当該出願人に係る特許マップの表示を要求することができる。
すなわち、最初の検索要求時にユーザが出願人を限定しなかった場合、図9の特許マップ54は当該技術分野における全特許出願に基づいて生成されたこととなり、出願人選択欄には各特許文献の出願人がリスト表示される。
この中からユーザが特定の出願人を指定した場合、座標算出部26は各領域の分布密度から指定された出願人以外の件数を間引いて分布密度を再計算し、描画処理部24はその結果を特許マップ54上に反映させる(図示省略)。
この場合も、キーワードのシンボル(点及び文字列)はそのままの位置で表示されるため、ユーザは分布密度を表す図形55を観察することにより、特定出願人による出願傾向を読み取ることができる。
この結果、例えばM&Aに際して合併候補となる複数企業の得意分野を順に俯瞰し、最も補完効果の高い企業を選択することが可能となる。
さらにユーザは、出願人表示欄64において複数の出願人を指定し、「和集合」ボタン66にチェックを入れて「選択」ボタン70をクリックすることにより、共同出願を含め各出願人に係る全ての特許文献に基づいた分布密度を特許マップ54上に表示させることができる。
これに対し、出願人表示欄64において複数の出願人を指定し、「差集合」ボタン68にチェックを入れて「選択」ボタン70をクリックすると、各出願人間の得意分野を明示する分布密度を特許マップ54上に表示させることができる。
例えば、ユーザが出願人選択欄64においてA社とB社を選択し、「差集合」ボタン68にチェックを入れて「選択」ボタン70をクリックすると、座標算出部26は各領域の分布密度から両社以外の出願人に係る文献数を除外すると共に、一方の出願人に係る文献数と他方の出願人に係る文献数とを比較し、その差を何れかの出願人に係る文献数として当該領域に関連付ける。
具体例を示すと、ある領域においてA社の文献数が8でB社の文献数が2の場合、当該領域にはA社の文献数として6が計上される。
また、他の領域においてA社の文献数が1でB社の文献数が5の場合、当該領域にはB社の文献数として4が計上される。
これに対し、A社の文献のみが存在している領域には、当該文献数がそのままA社の文献数として当該領域に計上され、B社の文献のみが存在している領域には、当該文献数がB社の文献数として当該領域に計上される。
なお、A社及びB社の共同出願に関しては、何れの文献数としても計上されない。
つぎに描画処理部24は、各領域に出願人及び分布密度に応じて異なった色彩を割り当てることにより、特許マップ54上に両社の差集合を反映した図形を描画する。
例えば、A社に係る領域には赤系の色彩を割当て、その濃度によって文献数の多寡を表現すると共に、B社に係る領域には青系の色彩を割当て、その濃度によって文献数の多寡を表現する。
この結果ユーザは、一目で両社の優位な領域を把握することが可能となる。
上記の文献情報分析システム10にあっては、クライアント端末14とサーバ群12とを備えたクライアント−サーバ型のシステム構成を備えていたが、この発明はこれに限定されるものではなく、パソコン等のコンピュータに専用のアプリケーションプログラムをセットアップすることにより、スタンドアロン型のシステム構成によって実現することも当然に可能である。
この場合、文献データベース38をパソコン等のハードディスクに格納しておくこともできるが、ネットワークを介して接続されたDBサーバ内に格納された文献データベースから必要な文献情報を抽出することもできる。
上記にあっては、キーワード抽出部30によって名詞のキーワード候補が抽出される例を示したが、この発明はこれに限定されるものではなく、名詞と名詞の組合せ、形容詞と名詞の組合せや、あるいは名詞と動詞の組合せをキーワード候補として抽出することもできる。
例えば、「水の汚れ(名詞+名詞)」、「高い親水性(形容詞+名詞)」、「紫外線を照射する(名詞+動詞)」などが該当する。
上記のように、キーワード抽出部30によってまずキーワード候補がリストアップされ、その中からユーザが選択したものをキーワードとして認定する代わりに、キーワード抽出部30によって自動的にキーワードが確定されるようにシステム10を運用することもできる。
また、上記にあっては、キーワード抽出部30によって特許文献の抄録(要約書の内容)からキーワード候補が抽出される例を示したが、特許明細書の全文からキーワードを抽出することも当然に可能である。
上記にあっては、日本語の特許文献から抽出した日本語のキーワードに基づき、文献情報の座標や分布密度、各キーワードの座標を算出し、これらの算出結果に基づいて日本語表記の特許マップを生成・表示する例を示したが、このシステム10は英語や中国語、ドイツ語、フランス語など日本語以外の言語で記述された文献情報にも対応可能である。
すなわち、文献データベース38には各言語による特許文献情報が蓄積されており、要置換・削除単語データベース34及び類義語・必要語データベース36にも言語毎に単語が登録されている。
また、検索処理部22による特許文献情報の検索・抽出処理、言語解析事前処理部28による整形処理、キーワード抽出部30によるキーワード候補の抽出処理、座標算出部26による各種算出処理、描画処理部24による特許マップの生成処理も、多言語対応となされている。
この発明は、特許マップ作成の効率化を実現することが出発点であったため、上記においては特許マップの生成に絞って説明を展開したが、他の分野に応用することも可能である。
例えば、特許文献の代わりに学術文献(学会誌や専門雑誌に掲載された研究論文など)の電子データを文献情報として文献データベースに格納しておけば、学界における研究動向を俯瞰するための研究マップを生成・表示することが可能となる。
特許文献の場合、出願後1年6ヶ月を経過しなければ情報が開示されないという制約があるが、研究論文はいち早く発表される傾向があるため、特許出願動向を先読みするためのツールとして活用することが期待できる。
この発明に係る文献情報分析システムの構成を示すブロック図である。 この文献情報分析システムにおける処理手順を示すフローチャートである。 この文献情報分析システムにおける処理手順を示すフローチャートである。 文献データベースから抽出したデータの一例を示す説明図である。 キーワード候補の抽出結果リストを例示する説明図である。 各特許文献のX軸座標及びY軸座標の算出結果を例示する説明図である。 特許文献の座標から分布密度を算出する際のイメージを示す説明図である。 各キーワードのX軸座標及びY軸座標の算出結果を例示する説明図である。 特許マップの一例を示すレイアウト図である。 特許マップの部分拡大図である。 特許マップ上に二つの別ウィンドウを表示させた状態を示すレイアウト図である。
符号の説明
10 文献情報分析システム
12 サーバ群
13 インターネット
14 クライアント端末
16 Webサーバ
18 APサーバ
20 DBサーバ
22 検索処理部
24 描画処理部
26 座標算出部
28 言語解析事前処理部
30 キーワード抽出部
32 表示データ蓄積部
34 要置換・削除単語データベース
36 類義語・必要語データベース
38 文献データベース
40 入力装置
42 ディスプレイ
44 分析要求部
46 表示処理部
50 キーワード候補の抽出結果リスト
52 二次元平面
54 特許マップ
55 特許文献の分布密度に対応した図形
56 別ウィンドウ
58 他のウィンドウ
60 「年次表示」ボタン
62 「アニメ表示」ボタン
64 出願人指定欄
66 「和集合」ボタン
68 「差集合」ボタン
70 「選択」ボタン

Claims (18)

  1. 電子化された複数の文献情報の中から、所定の基準に従って複数のキーワードを抽出する手段と、
    各文献情報に含まれるキーワードの組合せ及び出現数に対して主成分分析を施すことにより、二次元平面上における各文献の座標を算出する手段と、
    各文献の座標を一定の面積を備えた領域毎に集計することにより、各領域の分布密度を算出する手段と、
    各領域に対し、その分布密度に対応した表示パターンを割り当てる手段と、
    二次元平面上に各領域の表示パターンを反映させることにより、文献の分布密度に対応した図形を生成する手段と、
    当該図形をディスプレイ上に表示させる手段と、
    上記キーワードを含む文献の総数及び各キーワードの出現総数に対して主成分分析を施すことにより、二次元平面上における各キーワードの座標を算出する手段と、
    各キーワードの座標に従い、上記二次元平面上に当該キーワードの存在を示すシンボルを配置する手段と、
    当該シンボルをディスプレイ上に表示させる手段と、
    を備えたことを特徴とする文献情報分析システム。
  2. 入力手段を介して特定のシンボルが選択された場合に、当該シンボルに関連付けられたキーワードを含む文献のリストを生成する手段と、
    当該文献のリストをディスプレイ上に表示させる手段と、
    を備えたことを特徴とする請求項1に記載の文献情報分析システム。
  3. 入力手段を介して上記リスト中の特定の文献が選択された場合に、当該文献情報の少なくとも一部をディスプレイ上に表示させる手段を備えたことを特徴とする請求項2に記載の文献情報分析システム。
  4. 上記文献情報は、少なくとも特許出願人や特許権者、発明者、著作者等の主体情報を含んでおり、
    入力手段を介して特定の主体が選択された場合に、他の主体に係る文献を除いて上記領域の分布密度を再計算する手段と、
    各領域に対し、新たに算出された分布密度に対応した表示パターンを割り当てる手段と、
    二次元平面上に各領域の表示パターンを反映させることにより、文献の分布密度に対応した図形を生成する手段と、
    当該分布密度に対応した図形をディスプレイ上に再表示させる手段と、
    を備えたことを特徴とする請求項1〜3の何れかに記載の文献情報分析システム。
  5. 上記文献情報は、少なくとも特許出願人や特許権者、発明者、著作者等の主体情報を含んでおり、
    入力手段を介して一対の主体が選択された場合に、領域毎に選択された主体間の文献数を比較し、その差を文献数の多い方の主体の分布密度として各領域に関連付ける手段と、
    各領域に対し、主体及び分布密度に対応した表示パターンを割り当てる手段と、
    二次元平面上に各領域の表示パターンを反映させることにより、主体及び文献の分布密度に対応した図形を生成する手段と、
    当該図形をディスプレイ上に再表示させる手段と、
    を備えたことを特徴とする請求項1〜3の何れかに記載の文献情報分析システム。
  6. 上記文献情報は、少なくとも特許出願日や出願公開日、論文発表日、文献発行日等の日時情報を含んでおり、
    入力手段を介して特定の日時範囲が選択された場合に、範囲外の日時に係る文献を除いて上記領域の分布密度を再計算する手段と、
    各領域に対し、新たに算出された分布密度に対応した表示パターンを割り当てる手段と、
    二次元平面上に各領域の表示パターンを反映させることにより、文献の分布密度に対応した図形を生成する手段と、
    当該分布密度に対応した図形をディスプレイ上に再表示させる手段と、
    を備えたことを特徴とする請求項1〜5の何れかに記載の文献情報分析システム。
  7. 上記文献情報の中から、所定の基準に従って複数のキーワード候補を抽出する手段と、
    キーワード候補のリストをディスプレイ上に表示させる手段と、
    入力手段を介して特定のキーワード候補が選択された場合に、これをキーワードとして抽出する手段と、
    を備えたことを特徴とする請求項1〜6の何れかに記載の文献情報分析システム。
  8. キーワードに適さない単語を要削除単語として登録しておく記憶手段と、
    キーワードまたはキーワード候補の抽出に際し、各文献情報に要削除単語が含まれている場合には当該単語を削除する手段と、
    を備えたことを特徴とする請求項1〜7の何れかに記載の文献情報分析システム。
  9. 実質的に同一の意味を有する複数の類義語を、それぞれ特定の代表語に関連付けて登録しておく記憶手段と、
    キーワードまたはキーワード候補の抽出に際し、各文献情報に上記類義語が含まれている場合には該当の代表語に統一する手段と、
    を備えたことを特徴とする請求項1〜8の何れかに記載の文献情報分析システム。
  10. コンピュータを、
    電子化された複数の文献情報の中から、所定の基準に従って複数のキーワードを抽出する手段、
    各文献情報に含まれるキーワードの組合せ及び出現数に対して主成分分析を施すことにより、二次元平面上における各文献の座標を算出する手段、
    各文献の座標を一定の面積を備えた領域毎に集計することにより、各領域の分布密度を算出する手段、
    各領域に対し、その分布密度に対応した表示パターンを割り当てる手段、
    二次元平面上に各領域の表示パターンを反映させることにより、文献の分布密度に対応した図形を生成する手段、
    当該図形をディスプレイ上に表示させる手段、
    上記キーワードを含む文献の総数及び各キーワードの出現総数に対して主成分分析を施すことにより、二次元平面上における各キーワードの座標を算出する手段、
    各キーワードの座標に従い、上記二次元平面上に当該キーワードの存在を示すシンボルを配置する手段、
    当該シンボルをディスプレイ上に表示させる手段、
    として機能させることを特徴とする文献情報分析プログラム。
  11. コンピュータを、
    入力手段を介して特定のシンボルが選択された場合に、当該シンボルに関連付けられたキーワードを含む文献のリストを生成する手段、
    当該文献のリストをディスプレイ上に表示させる手段、
    として機能させることを特徴とする請求項10に記載の文献情報分析プログラム。
  12. コンピュータを、
    入力手段を介して上記リスト中の特定の文献が選択された場合に、当該文献情報の少なくとも一部をディスプレイ上に表示させる手段、
    として機能させることを特徴とする請求項11に記載の文献情報分析プログラム。
  13. コンピュータを、
    上記文献情報が少なくとも特許出願人や特許権者、発明者、著作者等の主体情報を含んでいる場合において、入力手段を介して特定の主体が選択された際に、他の主体に係る文献を除いて上記領域の分布密度を再計算する手段、
    各領域に対し、新たに算出された分布密度に対応した表示パターンを割り当てる手段、
    二次元平面上に各領域の表示パターンを反映させることにより、文献の分布密度に対応した図形を生成する手段、
    当該分布密度に対応した図形をディスプレイ上に再表示させる手段、
    として機能させることを特徴とする請求項10〜12の何れかに記載の文献情報分析プログラム。
  14. コンピュータを、
    上記文献情報が少なくとも特許出願人や特許権者、発明者、著作者等の主体情報を含んでいる場合において、入力手段を介して一対の主体が選択された際に、領域毎に選択された主体間の文献数を比較し、その差を文献数の多い方の主体の分布密度として各領域に関連付ける手段、
    各領域に対し、主体及び分布密度に対応した表示パターンを割り当てる手段、
    二次元平面上に各領域の表示パターンを反映させることにより、主体及び文献の分布密度に対応した図形を生成する手段、
    当該図形をディスプレイ上に再表示させる手段、
    として機能させることを特徴とする請求項10〜12の何れかに記載の文献情報分析プログラム。
  15. コンピュータを、
    上記文献情報が少なくとも特許出願日や出願公開日、論文発表日、文献発行日等の日時情報を含んでいる場合において、入力手段を介して特定の日時範囲が選択された際に、範囲外の日時に係る文献を除いて上記領域の分布密度を再計算する手段、
    各領域に対し新たに算出された分布密度に対応した表示パターンを割り当てる手段、
    二次元平面上に各領域の表示パターンを反映させることにより、文献の分布密度に対応した図形を生成する手段、
    当該分布密度に対応した図形をディスプレイ上に再表示させる手段、
    として機能させることを特徴とする請求項10〜14の何れかに記載の文献情報分析プログラム。
  16. コンピュータを、
    上記文献情報の中から所定の基準に従って複数のキーワード候補を抽出する手段、
    キーワード候補のリストをディスプレイ上に表示させる手段、
    入力手段を介して特定のキーワード候補が選択された場合に、これをキーワードとして抽出する手段、
    として機能させることを特徴とする請求項10〜15の何れかに記載の文献情報分析プログラム。
  17. コンピュータを、
    キーワードに適さない単語を要削除単語として登録しておく記憶手段、
    キーワードまたはキーワード候補の抽出に際し、各文献情報に要削除単語が含まれている場合には当該単語を削除する手段、
    として機能させることを特徴とする請求項10〜16の何れかに記載の文献情報分析プログラム。
  18. コンピュータを、
    実質的に同一の意味を有する複数の類義語を、それぞれ特定の代表語に関連付けて登録しておく記憶手段、
    キーワードまたはキーワード候補の抽出に際し、各文献情報に上記類義語が含まれている場合には該当の代表語に統一する手段、
    として機能させることを特徴とする請求項10〜17の何れかに記載の文献情報分析プログラム。
JP2003388837A 2003-11-19 2003-11-19 文献情報分析システム及び文献情報分析プログラム Pending JP2005149346A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2003388837A JP2005149346A (ja) 2003-11-19 2003-11-19 文献情報分析システム及び文献情報分析プログラム
PCT/JP2004/017632 WO2005050480A2 (ja) 2003-11-19 2004-11-19 文献情報分析システム及び文献情報分析プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003388837A JP2005149346A (ja) 2003-11-19 2003-11-19 文献情報分析システム及び文献情報分析プログラム

Publications (1)

Publication Number Publication Date
JP2005149346A true JP2005149346A (ja) 2005-06-09

Family

ID=34616233

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003388837A Pending JP2005149346A (ja) 2003-11-19 2003-11-19 文献情報分析システム及び文献情報分析プログラム

Country Status (2)

Country Link
JP (1) JP2005149346A (ja)
WO (1) WO2005050480A2 (ja)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007109183A (ja) * 2005-10-17 2007-04-26 Nomura Research Institute Ltd 文献情報分析装置及び文献情報分析方法
JP2007172429A (ja) * 2005-12-26 2007-07-05 Nomura Research Institute Ltd 文献情報分析装置及び文献情報分析方法
JP2007199906A (ja) * 2006-01-25 2007-08-09 Nomura Research Institute Ltd キーワード対応関係分析装置及び分析方法
JP2007265009A (ja) * 2006-03-28 2007-10-11 Nomura Research Institute Ltd 文献情報分析システム及び文献情報分析プログラム
WO2008108064A1 (ja) * 2007-03-07 2008-09-12 Panasonic Corporation 特許情報検索装置、特許情報検索方法、特許情報検索プログラム及び特許情報検索プログラムを記録した記録媒体
JP2008250625A (ja) * 2007-03-30 2008-10-16 Nomura Research Institute Ltd 検索システム
JP2008250623A (ja) * 2007-03-30 2008-10-16 Nomura Research Institute Ltd 検索システム
JP2009086772A (ja) * 2007-09-27 2009-04-23 Nomura Research Institute Ltd 検索サービス装置
JP2009271794A (ja) * 2008-05-08 2009-11-19 Nomura Research Institute Ltd 検索システム
JP2009271795A (ja) * 2008-05-08 2009-11-19 Nomura Research Institute Ltd 検索システム
JP2011107948A (ja) * 2009-11-17 2011-06-02 Itsuo Makino 情報収集方法
US8606494B2 (en) 2007-03-06 2013-12-10 Fuji Xerox Co., Ltd. Map generation apparatus, map generation method and computer readable medium
KR101352514B1 (ko) 2005-12-30 2014-01-17 (주)광개토연구소 이미지 특허맵 제공 시스템
US8645184B2 (en) 2007-05-10 2014-02-04 International Business Machines Corporation Future technology projection supporting apparatus, method, program and method for providing a future technology projection supporting service
JP2015207173A (ja) * 2014-04-21 2015-11-19 株式会社カネカ 特許情報分析装置及び特許情報分析方法

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007109183A (ja) * 2005-10-17 2007-04-26 Nomura Research Institute Ltd 文献情報分析装置及び文献情報分析方法
JP2007172429A (ja) * 2005-12-26 2007-07-05 Nomura Research Institute Ltd 文献情報分析装置及び文献情報分析方法
KR101352514B1 (ko) 2005-12-30 2014-01-17 (주)광개토연구소 이미지 특허맵 제공 시스템
JP4699909B2 (ja) * 2006-01-25 2011-06-15 株式会社野村総合研究所 キーワード対応関係分析装置及び分析方法
JP2007199906A (ja) * 2006-01-25 2007-08-09 Nomura Research Institute Ltd キーワード対応関係分析装置及び分析方法
JP2007265009A (ja) * 2006-03-28 2007-10-11 Nomura Research Institute Ltd 文献情報分析システム及び文献情報分析プログラム
US8606494B2 (en) 2007-03-06 2013-12-10 Fuji Xerox Co., Ltd. Map generation apparatus, map generation method and computer readable medium
WO2008108064A1 (ja) * 2007-03-07 2008-09-12 Panasonic Corporation 特許情報検索装置、特許情報検索方法、特許情報検索プログラム及び特許情報検索プログラムを記録した記録媒体
JP2008250623A (ja) * 2007-03-30 2008-10-16 Nomura Research Institute Ltd 検索システム
JP2008250625A (ja) * 2007-03-30 2008-10-16 Nomura Research Institute Ltd 検索システム
US8645184B2 (en) 2007-05-10 2014-02-04 International Business Machines Corporation Future technology projection supporting apparatus, method, program and method for providing a future technology projection supporting service
JP2009086772A (ja) * 2007-09-27 2009-04-23 Nomura Research Institute Ltd 検索サービス装置
JP2009271794A (ja) * 2008-05-08 2009-11-19 Nomura Research Institute Ltd 検索システム
JP2009271795A (ja) * 2008-05-08 2009-11-19 Nomura Research Institute Ltd 検索システム
JP2011107948A (ja) * 2009-11-17 2011-06-02 Itsuo Makino 情報収集方法
JP2015207173A (ja) * 2014-04-21 2015-11-19 株式会社カネカ 特許情報分析装置及び特許情報分析方法

Also Published As

Publication number Publication date
WO2005050480A2 (ja) 2005-06-02

Similar Documents

Publication Publication Date Title
JP2005149346A (ja) 文献情報分析システム及び文献情報分析プログラム
Neudecker et al. A survey of OCR evaluation tools and metrics
EP1564652A2 (en) Method and apparatus for visually emphasizing numerical data contained within an electronic document
JP2011501847A (ja) コンピュータで実現される方法
JP4997892B2 (ja) 検索システム、検索方法及び検索プログラム
Jänicke et al. Visualizations for text re-use
JP2008282222A (ja) 未来技術動向予測支援装置、方法、プログラム及び未来技術動向予測支援サービスを提供する方法
JP2011513810A (ja) 用語識別方法および装置
JP4829655B2 (ja) 文献情報分析システム及び文献情報分析プログラム
US20170132484A1 (en) Two Step Mathematical Expression Search
Jankowska et al. Relative N-gram signatures: Document visualization at the level of character N-grams
KR20200053334A (ko) 융합 연구 촉진을 위한 연구원 맵 구축 방법 및 시스템
JP4787955B2 (ja) 対象文書からキーワードを抽出する方法、システムおよびプログラム
JP4397264B2 (ja) 技術文献の市場性分析システム及び市場性分析プログラム
Pavel et al. Browsing and analyzing the command-level structure of large collections of image manipulation tutorials
US20150339786A1 (en) Forensic system, forensic method, and forensic program
JP2004110825A (ja) 自由形式注釈を強調するための方法及びシステム
JP4699909B2 (ja) キーワード対応関係分析装置及び分析方法
JP4005672B2 (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
JP4747828B2 (ja) 履歴管理装置
KR101078978B1 (ko) 문서 분류 시스템
JP2000194725A (ja) 類似グル―プ抽出装置、及び類似グル―プ抽出プログラムが記憶された記憶媒体
JP7053219B2 (ja) 文書検索装置および方法
KR101078966B1 (ko) 문서 분석 시스템
Alshehri et al. Multimodal Deep Learning for Scientific Imaging Interpretation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060331

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060530

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060731

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060829

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061030

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061205