JP7193890B2

JP7193890B2 - 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム

Info

Publication number: JP7193890B2
Application number: JP2021574396A
Authority: JP
Inventors: 一白坂; 崇志三上
Original assignee: AI Samurai Inc
Current assignee: AI Samurai Inc
Priority date: 2020-01-30
Filing date: 2020-01-30
Publication date: 2022-12-21
Anticipated expiration: 2040-01-30
Also published as: WO2021152809A1; JPWO2021152809A1

Description

本発明は、文書情報評価装置および文書情報評価方法並びに文書情報評価プログラムに関するものである。

近年、膨大な文書情報のなかから、条件に近い内容の文書情報を検索するシステムが提案されている（例えば、特許文献１参照。）。特許文献１には、文書情報の各部分を構成するセグメント（構成単位）ごとにキーワードの出現頻度から各文書情報の重みを計算し、その重みに基づいて所定の基準で類似度をスコア化することが記載されている。特許文献１のシステムによれば、文書情報のセグメントごとに類似度をスコア化しているため、文書情報の一部にしか条件に近い内容が記載されない場合であっても確実に検索することができる。

特開２０１５－２０３９６１号公報特開２０１０－２２４９８４号公報

しかし、特許文献１のシステムに基づくと、文書情報の一部にしか条件に近い内容が記載されておらず、文書情報の全体としては類似度が低い文献情報が検索される場合が生じ得る。利用者が意図しない文献情報が検索された場合、検索条件に用いるキーワード、文節、文章等の選定を最初からやり直す必要が生じる。そして、条件に近い内容の文書情報が検索されるまで、検索条件の選定を何回も繰り返すことになる。これには多大な時間を要し、利用者にとっての負担が非常に大きい。

また、近年、出願前の発明を評価する装置が開発されている。特許文献２には、知的財産に関する情報を記憶し、出願前の出願書類についての評価、及び、作成の支援を行う、特許明細書評価・作成作業支援装置が開示されている。特許文献１に記載の特許明細書評価・作成作業支援装置は、拒絶理由通知書を含む公開特許公報に関する情報を格納し、該格納情報に対して出願前の出願書類を類似検索することによって、予測される拒絶理由通知書の記載を推定することが記載されている。

そして、研究開発において発明を創作した技術者（発明者）は、自ら創作した発明が特許権等の知的財産に係る権利を取得できるか否かを確認するために、先行技術調査を行う場合がある。先行技術調査は、例えば、従来技術を検索可能なデータベースにおいて、自ら創作した発明の特徴を示すキーワードを入力して類似した従来技術の有無を検索する。技術者は、先行技術調査の結果から創作した発明について権利の取得の可能性を確認し、特許出願の可否について検討することができる。技術者は日々の研究開発において複数の発明を創作した場合、発明の創作の度に先行技術調査を行うことにより、それぞれの発明について権利の取得の可能性を確認することができる。

しかし、継続した研究開発等の事業においては関連した発明等の知的財産が創作され、新たな知的財産は、過去に創作した関連した知的財産に対する新たな創作部分を付加することにより創作される場合がある。知的財産における権利取得の可能性を調査する先行技術調査の結果、権利取得の可能性が低いと評価された場合、新たな創作部分を改めて検討する必要が生じ得る。すなわち、アイデアの内容が新規性または進歩性の要件を満たしていない場合、新たな創作部分の検討に手間が掛かり特許出願が遅れる可能性がある。

本発明の目的は、上記の課題に鑑み、創作された入力情報の権利取得の可能性を容易に評価できるとともに、新たな知的財産の創作を容易にすることができる、文書情報評価装置および文書情報評価方法並びに文書情報評価支援プログラムを提供することである。

本発明の一実施形態における文書情報評価装置は、利用者が操作可能な利用者端末から入力された入力情報および先行文書情報に含まれる文章を比較して前記入力情報と類似する先行文書情報を抽出し、前記入力情報と当該抽出された先行文書情報との類似度を評価する文書情報評価装置であって、
利用者が操作可能な利用者端末から入力された入力情報の入力を受け付ける文書情報入力部と、
複数の先行文書情報を記憶する記憶部と、
前記入力情報の第１技術分類を決定する決定部と、
前記入力情報および前記先行文書情報に含まれる文章を比較して前記入力情報との一致度をスコアとして算出する算出部と、
前記スコアに基づき、前記入力情報と前記文書情報との差異の程度を構成単位ごとに示した比較表を出力する出力部と、
前記スコアに基づき、権利取得の可能性を判定する判定部と、
前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、権利取得の可能性を向上させた追加情報を生成する生成部と、
を備え、
前記出力部は、前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、前記決定部にて決定した前記第１技術分類と異なる第２技術分類を用いて先行文書情報の出力を行い、
前記生成部は、当該先行文書情報および前記入力情報に含まれる文章の比較を行い、当該先行文書情報と前記入力情報との差分を構成する文書情報に基づき追加情報を生成する、ことを特徴とする。

本発明の一実施形態における文書情報評価装置において、前記第２技術分類を選択する選択部をさらに備え、
前記選択部は、
前記決定部にて決定した前記第１技術分類に関する前記先行文書情報に対応付けられた従来技術情報に付与されている技術分類を前記第２技術分類として選択する、ことを特徴としてもよい。

本発明の一実施形態における文書情報評価装置において、前記生成部は、前記第２技術分類を用いて出力した前記先行文書情報に存在し、前記入力情報に存在しない文章を前記追加情報として生成する、ことを特徴としてもよい。

本発明の一実施形態における文書情報評価装置において、前記出力部は、前記入力情報を構成単位ごとに分解して出力することが可能であり、
前記生成部は、前記構成単位を構成する複数の単語に存在しない単語を前記追加情報として生成する、ことを特徴としてもよい。

本発明の一実施形態における文書情報評価装置において、前記表示部は、評価された前記文書情報を、特許マップとして表示出力する表示部を、さらに備える、ことを特徴としてもよい。

本発明の一実施形態における文書情報評価方法は、利用者が操作可能な利用者端末から入力された入力情報および先行文書情報に含まれる文章を比較して前記入力情報と類似する先行文書情報を抽出し、前記入力情報と当該抽出された先行文書情報との類似度を評価する文書情報評価方法であって、
コンピュータが、
利用者が操作可能な利用者端末から入力された入力情報の入力を受け付ける文書情報入力ステップと、
複数の先行文書情報を記憶する記憶ステップと、
前記入力情報の第１技術分類を決定する決定ステップと、
前記入力情報および前記先行文書情報に含まれる文章を比較して前記入力情報との一致度をスコアとして算出する算出ステップと、
前記スコアに基づき、前記入力情報と前記文書情報との差異の程度を構成単位ごとに示した比較表を出力する出力ステップと、
前記スコアに基づき、権利取得の可能性を判定する判定ステップと、
前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、権利取得の可能性を向上させた追加情報を生成する生成ステップと、
を備え、
前記出力ステップは、前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、前記決定ステップにて決定した前記第１技術分類と異なる第２技術分類を用いて先行文書情報の出力を行い、
前記生成ステップは、当該先行文書情報および前記入力情報に含まれる文章の比較を行い、当該先行文書情報と前記入力情報との差分を構成する文書情報に基づき追加情報を生成する、ことを特徴とする。

本発明の一実施形態における文書情報評価プログラムは、利用者が操作可能な利用者端末から入力された入力情報および先行文書情報に含まれる文章を比較して前記入力情報と類似する先行文書情報を抽出し、前記入力情報と当該抽出された先行文書情報との類似度を評価する文書情報評価プログラムであって、
コンピュータに、
利用者が操作可能な利用者端末から入力された入力情報の入力を受け付ける文書情報入力機能と、
複数の先行文書情報を記憶する記憶機能と、
前記入力情報の第１技術分類を決定する決定機能と、
前記入力情報および前記先行文書情報に含まれる文章を比較して前記入力情報との一致度をスコアとして算出する算出機能と、
前記スコアに基づき、前記入力情報と前記文書情報との差異の程度を構成単位ごとに示した比較表を出力する出力機能と、
前記スコアに基づき、権利取得の可能性を判定する判定機能と、
前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、権利取得の可能性を向上させた追加情報を生成する生成機能と、
を実行させ、
前記出力機能は、前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、前記決定機能にて決定した前記第１技術分類と異なる第２技術分類を用いて先行文書情報の出力を行い、
前記生成機能は、当該先行文書情報および前記入力情報に含まれる文章の比較を行い、当該先行文書情報と前記入力情報との差分を構成する文書情報に基づき追加情報を生成する、ことを特徴とする。

本発明によれば、創作された入力情報の権利取得の可能性を容易に評価できるとともに、新たな知的財産の創作を容易にすることができる、文書情報評価装置および文書情報評価方法並びに知的財産文書情報評価支援プログラムを提供させることができる。

本発明の一実施形態に係る文書情報評価装置１のソフトウェア構成の一例を示すブロック図である。本発明の一実施形態における情報処理装置１のハードウェア構成の一例を示すブロック図である。本発明の一実施形態に係る出力画面の例を示す模式図である。本発明の一実施形態に係る文書情報評価装置１の動作例を示すフローチャートである。本発明の第１の実施形態における、文書情報評価装置１のスコア算出処理の一例を示すフローチャートである。本発明の一実施形態の第１変形例に係る文書情報評価装置１のソフトウェア構成の一例を示すブロック図である。本発明の一実施形態の第１変形例に係る検索の画面の例を示す模式図である。本発明の一実施形態の第１変形例に係る類義語辞書テーブルの一例を示す図である。本発明の一実施形態の第１変形例に係る文書情報評価装置１の動作例を示すフローチャートである。本発明の一実施形態の第２変形例に係る文書情報評価装置１のソフトウェア構成の一例を示すブロック図である。本発明の一実施形態の第２変形例に係る文書情報評価装置１の動作例を示すフローチャートである。本発明の実施形態に係る利用者端末へ出力される文書情報の評価結果の態様の例を示す地形マップである。本発明の実施形態に係る利用者端末へ出力される文書情報の評価結果の態様の例を示す俯瞰図である。本発明の実施形態に係る利用者端末へ出力される文書情報の評価結果の態様の例を示すチャートである。

以下、図面を参照して本発明の一実施形態における情報処理文書情報評価装置、文書情報評価方法及び文書情報評価プログラムについて詳細に説明する。

先ず、図１を用いて、文書情報評価装置１のソフトウェア構成を説明する。図１は、本発明の一実施形態における文書情報評価装置１のソフトウェア構成の一例を示すブロック図である。

文書情報評価装置１は、情報取得部１０１と、記憶部１０２と、算出部１０３と、出力部１０４と、入力部１０５の各機能部を有する。本実施形態における文書情報評価装置１の上記各機能部は、文書情報評価装置１を制御する情報処理プログラム（ソフトウェア）によって実現される機能モジュールであるものとして説明する。文書情報評価プログラムは、文書情報評価装置１で動作する。すなわち、文書情報評価装置１は、文書情報評価プログラムが動作する装置をいう。

出力部１０４は、利用者が検索または分析したい内容に関係する入力情報に対し、該入力情報と複数の文書情報との一致度をスコアとして算出した結果を比較表１００（図３参照）として出力する。その出力結果に基づき、利用者は、比較表１００に対して自己評価を入力することができる。これによって、文書情報評価装置１は、検索または分析の精度を向上させることが可能であって、利用者が希望する条件に近い内容の文書情報を検索または分析する場合に、検索または分析に要する時間を低減させることができ、検索の効率化を実現することができる。

文書情報評価装置１は、ネットワーク（ＮＷ）を介して利用者端末２と接続し、該利用者端末２に対して文書情報評価システムのサービスを提供するための装置である。文書情報評価装置１は、例えば、いわゆるサーバ装置やコンピュータ（例えば、デスクトップ、ラップトップ、タブレットなど）である。なお、本発明の一実施形態において、文書情報評価装置１は、これらに限定されない。

情報取得部１０１は、利用者端末２から入力されたこれら知的財産に関する情報を、利用者端末２から取得する。利用者端末２は、利用者が操作可能な端末装置であって、例えば、デスクトップＰＣ、ノートＰＣ、タブレットＰＣまたはスマートフォン等である。本実施形態では、一例として、入力情報および文書情報が知的財産に関する情報である場合について説明する。

ここで、知的財産とは、人間の知的活動によって生み出されたアイデアや創作物等である。知的財産は、例えば、発明、考案、意匠、商標、著作物、回路配置または植物の新品種である。また、知的財産は、例えば、知的財産の内容を説明するための文書、知的財産の内容を説明するための図、表、グラフ、スケッチもしくは写真（図等）、または図等を説明する文書等であってもよい。本実施形態における知的財産に関する情報とは、上述した利用者が検索または分析したい内容を抽出するための情報である。知的財産に関する情報は、権利取得された情報のみならず、権利取得前の公開情報、未公開情報、出願前の発明情報を含む。権利取得された情報とは、例えば、特許権、実用新案権、意匠権、商標権、著作権、回路配置利用権または育成者権等が成立している情報である。例えば、知的財産が発明である場合、入力情報および文書情報は、発明の内容を示す文章（特許請求の範囲の記載、発明の課題または発明の目的等）または図面等の情報である。また、知的財産が意匠である場合、入力情報および文書情報は、形状、模様若しくは色彩又はこれらの結合に係る図面等の情報である。また、知的財産が商標である場合、入力情報および文書情報は、商品またはサービスの識別標識である。

記憶部１０２は、文書情報を保持する。文書情報は、ＮＷを介して送受信される様々なデータを含み、例えば、文章データ、数値データを含む。文章データは、例えば、知的財産に関する情報、アイデアシート、アイデアメモ、訴訟に関連する情報、論文、書籍（雑誌、週刊誌を含む）、レポート及びホームページを含む。数値データは、例えば、実験データ、測定データ、統計データ、検査データが含まれる。その他、文章情報は、数式データ、図表データ、写真データ及び画像データ（静止画像、動画像を含む）を含む。

なお、知的財産に関する情報には、上述したように権利取得前の情報を含んでいてもよい。権利取得前の情報とは、例えば、発明や意匠を創作するまでの過程を記憶した情報、実験のために準備した材料もしくは装置、実験結果、研究開発の表題、研究開発の目的、技術者の氏名、技術者の所属名、プロジェクト番号等の付随的な情報である。付随的な情報には、取得された知的財産に関する情報に対するアクセス権限の情報を含んでいてもよい。アクセス権限とは、情報に対する閲覧、編集、削除、認証処理等の処理を実行できる権限であり、例えば、知的財産に関する情報を記憶した技術者に対しては、全ての処理を実行できるアクセス権限を付与し、知的財産の創作に共同した技術者には、閲覧の処理を実行できるアクセス権限を付与し、または、知的財産に関する情報を認証する認証者（後述）には認証処理を実行できるアクセス権限を付与する。情報取得部１０１は、知的財産に関する情報として、これらの付随的な情報を取得するようにしてもよい。利用者が入力したこれら知的財産に関する情報を、利用者端末２から取得する。

また、以下の説明においては、知的財産が発明である場合を例示するが、知的財産は発明に限定されるものではない。すなわち、知的財産の創作には、商標における識別標識の選択等を含んでいてもよい。

算出部１０３は、記憶部１０２において記憶された文書情報に基づき、利用者端末２から入力された入力情報に対する一致度を算出する。具体的には、入力情報を所定の構成単位に分解し、該分解された構成単位ごとに、記憶部１０２に記憶された複数の文書情報のうちの一の文書情報との一致度をスコアとして算出することができる。構成単位の分解は、例えば、「発明者、創作者、または出願人として関係する知的財産に関する情報」の構成要件を句読点ごとに分節をする。または、一定の文章の長さや、述語ごとに分節をしてもよい。算出部１０３は、構成要件を認定すると、出力部１０４により類似情報を取得し、構成要件と類似情報の近似の程度を算出する。構成要件のキーワードと同一または、そのキーワードよりも類似情報のキーワードが下位概念であれば一致度は高いと判断してもよい。算出部１０３は、記憶部１０２に、予め記憶された、単語のコーパス辞書により、その辞書により下位概念または上位概念の有無を算出できる。

算出部１０３は、構成要件と類似情報の一致度をスコア算出し、一致するか否かを閾値処理により判定し、構成要件の一致点および相違点を算出する。閾値は予め定められていてもよいし、機械学習により算出されたスコアをもちいてもよい。

また、算出部１０３は、具体的には、一致度をスコア算出するよう、記憶部１０２に記憶された知的財産に関する情報を用いて機械学習させたモデルを用いて、利用者端末２から受け付けた知的財産に関する情報に対する入力情報との内容の一致度をスコア算出することができる。これにより、文書情報評価装置１は、知的財産に関する情報（例えば、過去の特許情報）に基づいた一致度のスコア算出を、より素早く正確かつ容易に行うことができる。

機械学習において用いられる知的財産に関する情報は、該知的財産に関する情報について項目ごとに予め数値化された上で処理されており、利用者端末２から入力された知的財産に関する入力情報も、同様に数値化した上で一致度のスコア算出が行われる。

予め数値化される知的財産に関する情報に関する項目とは、例えば、知的財産に関する公開公報に紐づく各種情報であってもよい。知的財産に関する公開公報に紐づく各種情報は、例えば、公開公報の発行日、該公開公報に係る出願書類の提出日（すなわち出願日）、該公開公報に係る出願において受領した拒絶理由通知書の回数、該拒絶理由通知書における内容、該拒絶理由通知書に対する応答の内容、該公開公報に係る出願において行われた補正の回数、該補正の内容、独立請求項の文字数、請求項の数などであってもよい。

算出部１０３は、一致度のスコア算出のため、過去に文書情報評価装置１を使用して一致度をスコア算出した知的財産に関する情報の実際の結果をフィードバックとして記憶部１０２が格納することによって、機械学習に使用することができる。これにより、文書情報評価装置１は、より精度の高い類似する先行技術文献（先行文書情報）の抽出を行うことができる。

算出部１０３は、利用者が利用者端末２から入力した知的財産に関する入力情報に対して一致度のスコア算出を行った結果、相違点が高い（一致点が低い）場合、新たなキーワードを抽出し、構成要件ごとの一致度を改めてスコア算出してもよい。例えば、算出部１０３は、利用者端末２から入力された知的財産に関する情報において使用されるキーワードに代えて又は加えて抽出した新たなキーワードを使用した場合について一致度を改めて、スコア算出することができる。このとき、算出部１０３は、一致度のスコアが高くなるまで、キーワードの抽出を繰り返すことができる。一致度のスコアが高く算出された場合、このとき抽出したキーワードを出力部１０４より利用者端末２に出力することができる。キーワードの抽出は、記憶部１０２において記憶されている知的財産に関する文書情報からランダムに抽出してもよく、利用者端末２から入力された知的財産に関する入力情報から抽出するようにしてもよく、オズボーンのチェックリスト等を使用してキーワードの抽出の方法を予め定めておき、該方法に基づいて抽出してもよい。これにより、文書情報評価装置１は、利用者端末２から入力された知的財産に関する情報に対する一致度のスコア算出だけでなく、該知的財産に関する情報に関してどうすれば一致度が高くなるかの情報を利用者に提示することが可能となり、利用者が希望する内容を精度よく検索または分析することができる。

キーワードとは、文章、語句、熟語、単語、記号、アルファベット、化学式、又は数字などである。

また、算出部１０３は、利用者端末２から入力された知的財産に関する情報に対して一致度のスコア算出を行った結果、一致点が高い（相違点が低い）場合、記憶部１０２において記憶されている知的財産に関する文書情報からキーワードを抽出することができ、このとき、利用者端末２から入力された知的財産に関する入力情報において使用されるキーワードに代えて又は加えて抽出したキーワードを使用した場合の一致度のスコアが高くなる分布のうち端に位置するようなキーワードを抽出することとしてもよい。キーワードの抽出の際、利用者端末２から受け付けた知的財産に関する情報において使用されるキーワードに代えて又は加えて該抽出したキーワードを使用した場合の一致度のスコアが高くなる分布のうち、中央ではなく端に位置するようなキーワードを抽出することによって、文書情報評価装置１は、抽出するキーワードによる知的財産に関する情報についての限定に際し、より一致度のスコアを低くすることが可能なキーワードを提示することができる。例えば、知的財産に関する情報が特許出願予定の発明の場合、文書情報評価装置１は、該発明に対し、権利取得可能性を肯定的にしつつ、該発明の限定がより少ないものとなるようにすることが可能なキーワードを抽出することができる。

算出部１０３は、具体的には、学習データ及び権利取得可能性の情報に基づいて、知的財産に関する情報に付加すべき新たなキーワードを、知的財産に関する入力情報から算出し、出力部１０４は、新たなキーワードを出力することができる。これにより、文書情報評価装置１は、知的財産に関する情報を利用者によりわかりやすく表現することができ、知的財産法の知識に乏しい利用者であっても、わかりやすく知的財産に関する情報として、新たなキーワードを含めた発明の提案をすることができる。

また、算出部１０３は、相違性が認められた場合、その相違点の高い（一致点の低い）構成要件に対して、出力部１０４を介して、新たな類似特許を取得することとしてもよい。具体的には、算出部１０３は、一致点が低いと判断をし、出力部１０４に対して新たな類似情報を出力するように指令をし、出力部１０４は一致点の低い構成単位を埋めるための新たな類似情報を取得してもよい。算出部１０３による一致度の算出は、利用者が検索ボタン１０９（図３参照）を押すことによって、算出部１０３に検索信号が入力されることによって実行される。

出力部１０４は、文書情報の評価結果を利用者端末２に出力する。例えば、文書情報の評価結果は、構成単位ごとに、入力情報に類似する文書情報（以下、「類似情報」という）との差異の程度を対比（比較）した比較表である。ただし、文書情報の評価結果は、比較表に限定されない。例えば、模擬拒絶理由通知書（拒絶理由通知書に似せた、模擬的な通知書）であったり、発明者または出願人として関係する知的財産に関する情報等も含まれる。特許の場合、発明者または出願人として関係する知的財産に関する情報は、発明情報が記載されている発明メモや請求項情報である。類似情報は、例えば先行技術文献（先行文書情報）であって、比較表１００（図３参照）は、技術的な差異を示したいわゆるクレームチャートである。なお、入力情報に類似する文書情報との差異の程度は、構成単位ごとに対比（比較）する場合には限定されない。当該差異の程度は、文章、文節、複数の文節の組み合わせに基づいて、入力情報と先行文書情報との差異の程度（一致度）を構成単位（Ｅｌｅｍｅｎｔ）ごとに比較してもよいし、入力情報と先行文書情報との差異の程度（一致度）を文章全体として比較してもよい。

入力部１０５には、利用者の自己評価を示す自己評価モードが入力される。利用者は利用者の自己評価を示す自己評価モードの選択をすることができる。自己評価モードは、自己評価モード切り替えスイッチ１１５（図３参照）により選択できるように構成されている。出力部１０４は、比較表１００に対し、自己評価モード切り替えスイッチ１１５を表示出力する。詳細は、後述する。

以上説明した、文書情報評価装置１が有する、情報取得部１０１、記憶部１０２、算出部１０３、出力部１０４、入力部１０５の各機能部は、文書情報評価装置１の機能の一例を示したものであり、文書情報評価装置１が有する機能を限定したものではない。例えば、文書情報評価装置１は、上記全ての機能を有している必要はなく、一部の機能を有するものであってもよい。また、文書情報評価装置１は、上記以外の他の機能を有していてもよい。例えば、文書情報評価装置１は、機能の設定を行うための入力機能や、装置の稼働状態をＬＥＤランプ等により報知する出力機能を有していてもよい。

また、文書情報評価装置１が有する上記各機能部は、上述の通り、ソフトウェアによって実現されるものとして説明した。しかし、文書情報評価装置１が有する上記機能部の中で少なくとも１つ以上の機能部は、ハードウェアによって実現されるものであってもよい。

また、文書情報評価装置１が有する上記何れかの機能部は、１つの機能部を複数の機能部に分割して実施してもよい。また、文書情報評価装置１が有する上記何れか２つ以上の機能部を１つの機能に集約して実施してもよい。すなわち、図１は、文書情報評価装置１が有する機能を機能ブロックで表現したものであり、例えば、各機能部がそれぞれ別個のプログラムファイル等で構成されていることを示すものではない。

また、文書情報評価装置１は、１つの筐体によって実現される装置であっても、ネットワーク等を介して接続された複数の装置から実現されるシステムであってもよい。例えば、文書情報評価装置１は、その機能の一部または全部をクラウドコンピューティングシステムによって提供されるクラウドサービス等、仮想的な装置によって実現するものであってもよい。すなわち、文書情報評価装置１は、上記各機能部のうち、少なくとも１以上の機能部を他の装置において実現するようにしてもよい。また、文書情報評価装置１は、サーバ装置等の汎用的なコンピュータであってもよく、機能が限定された専用の装置であってもよい。

次に、図２を用いて、文書情報評価装置１のハードウェア構成を説明する。図２は、本発明の一実施形態における文書情報評価装置１のハードウェア構成の一例を示すブロック図である。

文書情報評価装置１は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）１１、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）１２、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）１３、タッチパネル１４および通信Ｉ／Ｆ（Ｉｎｔｅｒｆａｃｅ）１５を有する。文書情報評価装置１は、図１で説明した情報処理プログラムを実行する装置である。

ＣＰＵ１１は、ＲＡＭ１２またはＲＯＭ１３に記憶された情報処理プログラムを実行することにより、文書情報評価装置１の制御を行う。文書情報評価プログラムは、例えば、文書情報評価プログラムを記憶した記憶媒体、または、ネットワークを介したプログラム配信サーバ等から取得されて、ＲＯＭ１３にインストールされ、ＣＰＵ１１から読出されて実行される。

タッチパネル１４は、操作入力機能と表示機能（操作表示機能）を有する。タッチパネル１４は、文書情報評価装置１の利用者に対して指先又はタッチペン等を用いた操作入力を可能にする。本実施形態における文書情報評価装置１は操作表示機能を有するタッチパネル１４を用いる場合を説明するが、文書情報評価装置１は、表示機能を有する表示装置と操作入力機能を有する操作入力装置とを別個有するものであってもよい。その場合、タッチパネル１４の表示画面は表示装置の表示画面、タッチパネル１４の操作は操作入力装置の操作として実施することができる。なお、タッチパネル１４は、ヘッドマウント型、メガネ型、腕時計型のディスプレイ等の種々の形態によって実現されてもよい。

通信Ｉ／Ｆ１５は、通信用のＩ／Ｆである。通信Ｉ／Ｆ１５は、例えば、無線ＬＡＮ、有線ＬＡＮ、または赤外線等の近距離無線通信等を実行する。通信Ｉ／Ｆ１５は、例えば、ＮＷを介して利用者端末２との通信を実現する。通信Ｉ／Ｆ１５は、他の文書情報評価装置１との通信を実現するものであってもよい。なお、図２において通信用のＩ／Ｆは通信Ｉ／Ｆ１５のみを図示するが、文書情報評価装置１は複数の通信方式においてそれぞれの通信用のＩ／Ｆを有するものであってもよい。

次に、図３を用いて、文書情報評価装置１の出力画面の出力例を説明する。図３は、本発明の一実施形態に係る出力画面の例を示す模式図である。

入力部１０５には、利用者の自己評価を示す自己評価モードが入力される。比較表１００に対して、利用者が、類似情報としての文書情報の自己評価を示す自己評価モード切り替えスイッチ１１５を押すことにより、自己評価指令信号が入力部１０５に入力される。出力部１０４は、比較表１００に対し、利用者による文書情報の自己評価を示す自己評価モード切り替えスイッチ１１５を表示出力する。この自己評価モード切り替えスイッチ１１５に対してマウスによるクリックやキーボードの操作を行うことにより、自己評価指令信号が入力部１０５に入力される。自己評価モード切り替えスイッチ１１５をクリックすることにより利用者は自己評価を示す自己評価モードの選択ができる。また、利用者による選択に基づいて、出力部１０４は、比較表１００に対し自己評価を出力することができる。

より詳細には、出力部１０４は、自己評価モード切り替えスイッチ１１５を比較表１００に対して表示出力し、利用者がこの自己評価モード切り替えスイッチ１１５を選択する操作、すなわちマウスによるクリックやキーボードによる操作を行う。そして、出力部１０４は、自己評価モード切り替えスイッチ１１５の選択操作に基づき、例えば、模式的に図案化した図形（画像）を自己評価モードとして表示出力することができる。このように、利用者は、自己評価モード切り替えスイッチ１１５を操作し自己評価モードの選択を行うことにより、利用者からの自己評価の選択指示が行われ、自己評価指令信号を入力部１０５が受け付ける。

利用者は、マウスにより、自己評価モード切り替えスイッチ１１５をクリックすることによって、自己の評価を示す自己評価モードを選択することができる。そして、入力部１０５からの自己評価指令信号に基づき、出力部１０４は、自己評価の結果に応じて、文書情報が良好であることを示す高評価モードと良好でないことを示す低評価モードに切り替えて出力することができる。なお、切り替えて出力することができればよく、自己評価モード切り替えスイッチ１１５は、例えば、ボタン、アイコン等であってもよい。

図３に示すように、高評価モードとは、例えば、利用者の評価に対して「いいね！」といった評価が高いことを示す「いいね！」機能１１５ａと、「よくないね！」といった評価が低いことを示す「ダメだね！」機能１１５ｂとを切り替えて出力することができる。出力部１０４は、「いいね！」機能１１５ａと「ダメだね！」機能１１５ｂの表示態様を変更して出力することができる。視覚的に分かるように、例えば、「いいね！」機能１１５ａの表示態様は、肯定的な事象に対して表現する場合にとるポーズ、例えば、手を握った状態で親指を上方向に向ける態様の図形を出力することができる。また、表情が笑顔の図形や万歳をしている態様の図形を出力してもよい。その他、「いいね！」機能１１５ａの表示態様は、「○」の図形を出力するように構成してもよい。

また、図３に示すように、「ダメだね！」機能１１５ｂの表示態様は、否定的な事象に対して表現する場合にとるポーズ、例えば、手を握った状態で親指を下方向に向ける態様の図形を出力することができる。また、表情が悲観的な顔の図形や残念モードを表現する首を横に振っている態様の図形を出力してもよい。その他、「ダメだね！」機能１１５ｂの表示態様は、「×」の図形を出力するように構成してもよい。

「いいね！」機能１１５ａと「ダメだね！」機能１１５ｂの表示態様はスイッチの図形を変更して表示する場合に限定されない。例えば、出力部１０４は、「いいね！」機能１１５ａと「ダメだね！」機能１１５ｂとで、スイッチの色を変更して表示するように構成してもよい。また、上記の自己評価モード（「いいね！」機能１１５ａまたは「ダメだね！」機能１１５ｂ）の切り替えは、文書情報ごとに行うこともできるし、入力情報の構成単位（Ｅｌｅｍｅｎｔ）ごとに行うこともできる。このように自己評価モードを該構成単位ごとに切り替えることができるため、構成単位の高いスコアと、構成単位の低いスコアを視覚的に一目で把握することができる。

また、出力部１０４は、新たな類似情報に基づいて、第１キャラクター３の態様を選択してもよいとすることができる。具体的には、自己評価モード（「いいね！」機能１１５ａまたは「ダメだね！」機能１１５ｂ）の内容によって第１キャラクターのどの喜怒哀楽の出力態様にするかを選択するように構成してもよい。例えば、自己評価モードが「いいね！」機能１１５ａの場合は、例えば、「喜」または「楽」の出力態様で表示出力されるように構成してもよい。また、自己評価モードが「ダメだね！」機能１１５ｂの場合は、例えば、「怒」または「哀」の出力態様で表示出力されるように構成してもよい。この表示出力は、出力部１０４が実行する。

以上のように、出力部１０４は、算出部１０３により算出された一致度のスコア結果に基づいて、第１キャラクター３の態様を出力制御することができる。算出部１０３により算出された知的財産に関するデータに基づいて、第１キャラクター３の態様を出力制御することにより、文書情報評価装置１は、第１キャラクター３を使用した知的財産に関する情報の表現が可能となり、知的財産法の知識に乏しいユーザ利用者であっても、わかりやすく知的財産に関する情報を理解させることができる。

図３に示すように、出力部１０４は、比較表１００に出力される類似特許として複数の文書情報を出力することができる。そして、出力部１０４は、入力情報と複数の文書情報との差異の程度（一致度）を構成単位（Ｅｌｅｍｅｎｔ）ごとに比較表１００に出力する。図３では、５件の文書情報を出力する例が示されているが、文書情報の件数は限定されない。５件の文書情報の出力優先度は、構成単位ごとに算出される一致度を示すスコアが所定の基準を満たすか否かで決定する。所定の基準は、例えば、各構成単位のスコアを合算した値が高い順に上位５件の文献情報を左列から右列に向かって出力するように構成してもよい。また、所定の基準は、各構成単位のスコアの平均値が高い順に上位５件の文書情報を左列から右列に向かって出力するように構成してもよい。また、所定の基準は、複数に分割した全ての構成単位のうち、いくつかの任意の構成単位のスコアの平均値が所定値以上の、上位５件の文献情報を左列から右列に向かって、高い順に出力するように構成してもよい。任意の構成単位の特定は、利用者が利用者端末２から入力された任意の構成単位を取得するように構成してもよい。任意の構成単位の取得は、情報取得部１０１が実行する。また、任意の構成単位が、記憶部１０２に予め記憶されていてもよい。

また、左側から見て第２列目に出力される文書情報は、発明の各構成単位の一致度のスコアの平均値が一番高い文書情報を主引例として選定してもよい。発明と主引例との一致点と相違点の認定は、発明の各構成単位の一致度のスコアが、それぞれ所定値以上であるか否かで判断することとしてもよい。そして、主引例以外の文書情報は、主引例で一致度のスコアが低い構成単位について、一致度のスコアが高い類似先行技術文献（先行文書情報）を副引例として選定するように構成してもよい。比較表１００には、先行技術文献（先行文書情報）における主引例と副引例の表示、ならびに主引例に係る構成単位および副引例に係る構成単位の表示を含んでいてもよい。

このように、図３に示すように、比較表１００には、発明の構成単位ごとの一致度のスコアが表示画面２００に出力される。ここで、一致度とは、例えば、抽出された発明の特徴量が類似する先行技術文献（先行文書情報）にどれくらい含まれているかを示す数値（％）であり、数値が高いほど構成単位が先行技術文献（先行文書情報）に開示されていることを示している。構成単位ごとの一致度は、文書情報としての先行技術文献（先行文書情報）ごとに比較されて比較表１００に出力される。この出力は、出力部１０４が実行する。比較表１００の左側から見て第１列目には、分解された発明（入力情報）の構成単位が出力される。５件の文書情報を左側から見て第２列目～第６列目は、それぞれの先行技術文献（先行文書情報）に対する一致度のスコアが構成単位ごとに出力される。

そして、算出部１０３により算出された一致度のスコアに基づいて、出力部１０４は、入力情報と文書情報の一致度をスコアとして出力をすることができる。スコア結果は、例えば、比較表１００とともに出力部１０４によって表示画面２００に出力される。一致度のスコアは、例えば、～～％（例えば、８０％）といった形式で表現することができる。算出部１０３による一致度の算出は、利用者が検索ボタン１０９（図３参照）を押すことによって、算出部１０３に検索信号が入力されることによって実行される。

また、出力部１０４は、新たな類似情報に基づいて、第１キャラクター３の態様を選択することができ、具体的には、新たな類似情報と構成要件のスコアの高低によって第１キャラクターのどの喜怒哀楽の出力態様にするかを選択するように構成してもよい。

そして、出力部１０４は、新たに出力した類似情報に基づいて、第１キャラクター３の態様を選択することができる。新たな類似情報に基づいて、第１キャラクター３の態様を新たに選択可能とすることで、文書情報評価装置１は、知的財産に関する情報を利用者によりわかりやすく表現することができ、知的財産法の知識に乏しい利用者であっても、わかりやすく知的財産に関する情報を理解させることができる。

そして、出力部１０４は、具体的には、第１キャラクター３を介して、算出部１０３による一致度のスコア結果を示すことができる。第１キャラクター３を介して、算出部１０３によるスコア結果を示すことで、文書情報評価装置１は、スコア結果を利用者によりわかりやすく表現することができ、知的財産法の知識に乏しい利用者であっても、わかりやすく知的財産の登録の有無に関する情報を理解させることができる。

さらに、算出部１０３は、利用者により選択された自己評価モードの切り替えを反映し、入力された発明情報に対する類似先行技術文献（先行文書情報）の一致度を再算出することができる。具体的には、出力部１０４が出力した、入力情報に類似する先行技術文献（先行文書情報）との差異の程度を対比（比較）した比較表において、「いいね！」機能１１５ａと「ダメだね！」機能１１５ｂが出力表示された構成単位の重みづけを行い、一致度を再算出することができる。

次に、図４を用いて、文書情報評価装置１の動作処理の一例を説明する。図４は、本発明の一実施形態に係る文書情報評価装置１の動作例を示すフローチャートである。

＜文書情報評価装置１の動作処理の一例＞
図４において、文書情報評価装置１は、利用者端末２からの知的財産に関する情報を取得したか否かを判断する（Ｓ１１）。知的財産に関する情報を取得したか否かは、情報取得部１０１が利用者端末２から入力された知的財産に関する情報を取得したか否かで判断することができる。知的財産に関する情報を取得していないと判断した場合（ステップＳ１１：ＮＯ）、文書情報評価装置１は、Ｓ１１の処理を繰り返し、知的財産に関する情報の取得を待機する。

一方、知的財産に関する情報を取得したと判断した場合（Ｓ１１：ＹＥＳ）、算出部１０３は、記憶部１０２において記憶された文書情報に基づき、利用者端末２から入力された入力情報に対する一致度を算出する（Ｓ１２）。具体的には、入力情報を所定の構成単位に分解し、該分解された構成単位ごとに、記憶部１０２に記憶された複数の文書情報のうちの一の文書情報との一致度をスコアとして算出することができる。構成単位の分解は、例えば、「発明者、創作者、または出願人として関係する知的財産に関する情報」の構成要件を句読点ごとに分節をする。または、一定の文章の長さや、述語ごとに分節をしてもよい。

Ｓ１２の処理を実行した後、スコアの算出結果に基づき、出力部１０４は、入力情報と文書情報との差異の程度を構成単位ごとに示した比較表を出力する（Ｓ１３）。例えば、文書情報の評価結果は、構成単位ごとに、入力情報に類似する文書情報（以下、「類似情報」という）との差異の程度を対比（比較）した比較表である。ただし、文書情報の評価結果は、比較表１００に限定されない。例えば、模擬拒絶理由通知書（拒絶理由通知書に似せた、模擬的な通知書）であったり、発明者または出願人として関係する知的財産に関する情報等も含まれる。特許の場合、発明者または出願人として関係する知的財産に関する情報は、発明情報が記載されている発明メモや請求項情報である。類似情報は、例えば先行技術文献（先行文書情報）であって、比較表１００は、技術的な差異を示したいわゆるクレームチャートである。一致度のスコアは、例えば、「０％」～「１００％」の数値として算出することができる。

Ｓ１３の処理を実行した後、入力部１０５は、比較表に対して、利用者による文書情報の自己評価を入力する（Ｓ１４）。入力部１０５には、利用者の自己評価を示す自己評価モードが入力される。比較表１００に対して、利用者が、類似情報としての文書情報の自己評価を示す自己評価モード切り替えスイッチ１１５を押すことにより、自己評価指令信号が入力部１０５に入力される。出力部１０４は、比較表１００に対し、利用者による文書情報の自己評価を示す自己評価モード切り替えスイッチ１１５を表示出力する。この自己評価モード切り替えスイッチ１１５に対してマウスによるクリックやキーボードの操作を行うことにより、自己評価指令信号が入力部１０５に入力される。自己評価モード切り替えスイッチ１１５をクリックすることにより利用者は自己評価を示す自己評価モードの選択ができる。また、利用者による選択に基づいて、出力部１０４は、比較表１００に対し自己評価を出力することができる。より詳細には、出力部１０４は、自己評価モード切り替えスイッチ１１５を比較表１００に対して表示出力し、利用者がこの自己評価モード切り替えスイッチ１１５を選択する操作、すなわちマウスによるクリックやキーボードによる操作を行う。そして、出力部１０４は、自己評価モード切り替えスイッチ１１５の選択操作に基づき、例えば、模式的に図案化した図形（画像）を自己評価モードとして表示出力することができる。このように、利用者は、自己評価モード切り替えスイッチ１１５を操作し自己評価モードの選択を行うことにより、利用者からの自己評価の選択指示が行われ、自己評価指令信号を入力部１０５が受け付ける。自己評価の選択指示を受け付けは、出力部１０４が行う。

利用者は、マウスにより、自己評価モード切り替えスイッチ１１５をクリックすることによって、自己の評価を示す自己評価モードを選択することができる。そして、入力部１０５からの自己評価指令信号に基づき、出力部１０４は、自己評価の結果に応じて、文書情報が良好であることを示す高評価モードと良好でないことを示す低評価モードに切り替えて出力することができる。なお、切り替えて出力することができればよく、自己評価モード切り替えスイッチ１１５は、例えば、ボタン、アイコン等であってもよい。Ｓ１４の処理を実行した後、文書情報評価装置１は、図示する動作を終了する。

ここで、一致度のスコア算出は、例えば、以下の処理で行うことができる。

図５は、本発明の第１の実施形態における、文書情報評価装置１のスコア算出処理の一例を示すフローチャートである。

＜一致度のスコア算出処理＞
算出部１０３は、情報取得部１０１が評価対象を表す入力情報を取得すると、まずｋＮＮグラフを作成する（Ｓ１０１）。ｋＮＮグラフは、以下の手順で作成される。まず、情報取得部１０１が利用者端末２を介して取得した知的財産に関する技術情報に付随する技術情報、先行技術情報としての入力情報、記憶部１０２に記憶された入力情報に類似する類似技術情報に含まれる文章を全てベクトル化する。ベクトル化は、Ｗｏｒｄ２Ｖｅｃ、Ｄｏｃ２Ｖｅｃ(Ｐａｒａｇｒａｐｈ２ｖｅｃ)、ＬＤＡ（ＬａｔｅｎｔＤｉｒｉｃｈｌｅｔＡｌｌｏｃａｔｉｏｎ）またはＮＴＳＧ（ＮｅｕｒａｌｅｎｓｏｒＳｋｉｐＧｒａｍ）等の従来技術によって行われてよい。ベクトル化は算出部１０３が実行する。ベクトルから文章間の距離行列を作成する。各文章を頂点として、それぞれの文字データからそれと距離が短いものｋ個の文章へと辺を張る。以上の手順により、ｋＮＮグラフを作成する。上記にて文章として説明したが、複数の文節の組み合わせ、文節、または単語であってもよい。

続いて、算出部１０３は、情報取得部１０１から取得された技術情報としての入力情報に対する出力対象としての類似文書情報を、記憶部１０２に記憶された入力情報に類似する類似技術情報、および知的財産情報に含まれる文章全てに設定し（Ｓ１０２）、情報取得部１０１から取得した入力情報（技術情報）に含まれる技術文言をクエリと設定し、出力部１０４は、該クリエで該出力対象としての類似文書情報を出力する（Ｓ１０３）。ここで、出力はＥｌａｓｔｉｃＳｅａｒｃｈ（登録商標）等の従来技術によって行われてよい。

出力部１０４は、出力の結果、最もスコアが高い文章を始点として設定し（Ｓ１０４）、始点を最終出力結果へ追加し（Ｓ１０５）、最終出力結果がｎ件以上となるまで繰り返す（Ｓ１０６）。ｎ件に満たない場合Ｓ１０７に進み、ｎ件以上となった場合Ｓ１１０へ進む。

最終出力結果がｎ件に満たない場合、算出部１０３は、クエリ変換ルールの候補を抽出する（Ｓ１０７）。クエリ変換ルールの候補は、以下の手順で抽出される。まず、作成したｋＮＮグラフに基づき、始点として設定された文章と類似する文章を抽出する。続いて、始点として設定された文章と抽出された類似する文章とにおいて、重要度が高いと認定される単語を抽出する。重要度の認定は、ＴＦ－ＩＤＦ法等の従来技術によって行われてよい。抽出された単語に対し、始点として設定された文章、および、抽出された類似する文章において、隣接する単語を取得する。例えば、抽出された単語が「分散」であって、文章が「分散ファイルシステムにおける分散処理」であった場合の、「ファイル」および「処理」などである。

算出部１０３は、スコアが高い変換ルールをクエリに適用する（Ｓ１０８）。変換ルールは１つでも複数であってもよく、その数が算出部１０３によって制御されてもよい。また、変換ルールにより算出される新たなクリエの数は、情報取得部１０１によって取得した、評価対象を表す技術情報（入力情報）の評価の結果に対する利用者の評価情報に基づき、算出部１０３によって制御されてもよい。スコアは以下の式によって算出することができる。

式中、始点として設定された文章をＡ、始点として設定された文章において取得された隣接する単語をｗ１、抽出された類似する文章をＢ、抽出された類似する文章において取得された隣接する単語をｗ２とおき、Ｐ（ｗ，Ｘ）を文章Ｘ中での単語ｗの出現確率とおく。ｓｉｍｉｌａｒｉｔｙは、単語の意味的な近さの指標であって、この値が大きいほど２つの単語は意味的に似ていることを意味する。ｓｉｍｉｌａｒｉｔｙは、ＰｙｔｈｏｎのパッケージであるｎｌｔｋがＷｏｒｄＮｅｔのパス長に基づいて算出する値とすることができる。

算出部１０３は、始点と隣接する文章を次の出力対象に設定し（Ｓ１０９）、Ｓ１０８によって新たに算出されたクエリを用いて、再度出力を行う（Ｓ１０３に戻る）。

最終出力結果がｎ件以上となった場合、結果を出力する（Ｓ１１０）。このとき、出力部１０４は、最終出力結果とされる始点となる文章を含む文書情報または文書情報を出力してもよい。

次に、文書情報評価装置１の再算出処理の一例を説明する

＜再算出の算出処理＞
一致度のスコアの再算出は、例えば、以下の手順で行う。（１）まず、適合文書情報および非適合文書情報のベクトル化を行う（以下、それぞれ「適合文書ベクトル」および「非適合文書ベクトル」という）。算出部１０３は、適合文書ベクトルおよび非適合文書ベクトルを算出する。文書ベクトルの算出は、例えば、Ｗｏｒｄ２Ｖｅｓ、Ｄｏｃ２Ｖｅｃ(Ｐａｒａｇｒａｐｈ２ｖｅｃ)、ＬＤＡ、ＮＴＳＧ等で行ってもよい。ここで、適合文書ベクトルとは、「いいね！」機能１１５ａが出力された構成単位の文書情報をベクトル化したものをいう。また、非適合文書ベクトルとは、「ダメだね！」機能１１５ｂが出力された構成単位の文書情報をベクトル化したものをいう。

（２）次いで、算出部１０３は、利用者が操作可能な利用者端末２から入力された入力情報の文書ベクトル（以下、「入力文書ベクトル」という）を算出する。文書ベクトルの算出は、例えば、Ｗｏｒｄ２Ｖｅｓ、Ｄｏｃ２Ｖｅｃ(Ｐａｒａｇｒａｐｈ２ｖｅｃ)、ＬＤＡ、ＮＴＳＧ等で行ってもよい。

（３）次いで、算出部１０３は、入力文書ベクトル、適合文書ベクトルおよび非適合文書ベクトルの各重みを考慮した重心を算出する。本実施形態において、文書情報評価装置１は、一致度のスコアの再算出が可能に構成されている。ここで、該重心とは、検索を行う前の、入力文書ベクトル、適合文書ベクトルおよび非適合文書ベクトルの各重みのことをいう。具体的には、２回目の一致度のスコアの再算出を行う場合は、該２回目の一致度のスコア算出する前の，１回目の一致度のスコア算出の際に算出された重みを考慮して、重心を算出する。１回目の一致度のスコア算出の場合には、入力文書ベクトル、適合文書ベクトルおよび非適合文書ベクトルについて重みに差はないため、例えば、（入力文書ベクトルの重み、適合文書ベクトルの重み、非適合文書ベクトルの重み）＝（１、１、１）として、重心が算出される。

（４）重みおよび重心の算出は、算出部１０３が実行する。一致度のスコアの再算出を行う都度、入力文書ベクトル、合文書ベクトルおよび非適合文書ベクトルの各重みを再計算し直し、重心の再算出が実行され、これに伴い、入力文書ベクトル、適合文書ベクトルおよび非適合文書ベクトルの修正処理が行われる。この修正処理は、算出部１０３が実行する。具体的には、算出部１０３にて修正処理を実行した入力文書ベクトル、適合文書ベクトル、および（３）にて算出した重心の重心ベクトルの内積を算出する。

（５）算出部１０３は、（４）にて算出した内積に基づき、再度、入力文書ベクトル、適合文書ベクトルおよび非適合文書ベクトルの重みの修正処理（再算出）を実行する。文書ベクトルの修正処理に基づく重みの調整は、例えば、ＳＣＤＶ（ＳｐａｒｓｅＣｏｍｐｏｓｉｔｅＤｏｃｕｍｅｎｔＶｅｃｔｏｒｓｕｓｉｎｇＳｏｆｔｃｌｕｓｔｅｒｉｎｇｏｖｅｒｄｉｓｔｒｉｂｕｔｉｏｎａｌｒｅｐｒｅｎｓｅｎｔａｔｉｏｎｓ）で行うことができる。なお、文書ベクトルの算出は、Ｗｏｒｄ２Ｖｅｓ、Ｄｏｃ２Ｖｅｃ(Ｐａｒａｇｒａｐｈ２ｖｅｃ)、ＬＤＡ、ＮＴＳＧ等で行ってもよい。

（６）次いで、（４）、（５）にて新たに算出した入力文書ベクトル、適合文書ベクトルおよび非適合文書ベクトルの各重みに基づき、算出部１０３は、入力情報に対する文書情報の一致度のスコアの再算出を実行する。

（７）一致度ぐあいの再算出は、例えば、出力部１０４は、所望の文書情報を出力するまで、何回でも一致度のスコアの再算出処理を実行でき、都度、出力結果としての比較表１００を表示することができるユーザインタフェースを備える。

（８）利用者が入力情報を入力し、検索ボタン１０９を押すと、検索結果として比較表１００が出力される。比較表には、一致度のスコア結果が、構成単位ごとに出力される。一致度の再算出の出力は、再算出の都度、検索ボタン１０９を押すことにより実行される。ユーザインタフェースは、検索ボタン１０９が短時間に連続押しをすることができるように生成してもよい。

この再算出は、利用者が所望する文献情報が出力するまで、何回でも繰り返すことができる。一致度の再算出は、利用者が検索ボタン１０９（図３参照）を押すことによって、算出部１０３に検索信号が入力されることによって実行される。これにより、検索の精度を向上させることが可能であって、利用者は、条件に近い内容の文書情報（類似文書情報）を検索するために必要な時間を低減し、検索の効率化を実現させることができる。

＜重心の算出方法＞
続いて、重心の算出方法について詳細に説明する。重心は、適合文書情報から近く、非適合文書情報から離れた位置に設定する。（１）まず、適合文書ベクトルに重みを掛ける。適合文書ベクトルが複数ある場合は、それぞれの適合文書ベクトルに対し、該適合文書ベクトルに応じた各重みを掛けて重心を算出する。重心は、適合文書情報から近く、非適合文書情報から離れた位置に設定されるように重みの算出（調整）が行われ、該重みを考慮して重心の算出が行われる。この重みおよび重心の算出は、算出部１０３が実行する。

（２）重みの調整は、（１）にて算出した重心の重心ベクトル、および適合文書ベクトル、非適合文書ベクトルに基づいて決定されたパラメータにより算出することができる。パラメータは、下記の式に基づいて算出される。パラメータの算出は、算出部１０３が実行する。

パラメータ＝(非適合文書ベクトルと重心ベクトル間の距離)/(適合文書ベクトルと重心ベクトル間の距離)

（３）（２）にて算出したパラメータを用いて、入力文書ベクトル、適合文書ベクトルおよび非適合文書ベクトルの重みの調整を行い、調整した重みに基づいて、各々のベクトルについて、新たなベクトルを算出する。この新たなベクトルの算出は、算出部１０３が実行する。

ここで、重みの調整は、例えば、ＳＣＤＶ（ＳｐａｒｓｅＣｏｍｐｏｓｉｔｅＤｏｃｕｍｅｎｔＶｅｃｔｏｒｓｕｓｉｎｇＳｏｆｔｃｌｕｓｔｅｒｉｎｇｏｖｅｒｄｉｓｔｒｉｂｕｔｉｏｎａｌｒｅｐｒｅｎｓｅｎｔａｔｉｏｎｓ）で行うことができる。なお、文書ベクトルの算出は、Ｗｏｒｄ２Ｖｅｓ、Ｄｏｃ２Ｖｅｃ(Ｐａｒａｇｒａｐｈ２ｖｅｃ)、ＬＤＡ、ＮＴＳＧ等で行ってもよい。

次に、文書情報評価装置１の文書情報の再算出の方法の別の実施形態について説明する。

図４に示すように、比較表１００に出力された複数の文書情報のうち、利用者が入力情報に最も類似すると判断する所望の少なくとも一の文書情報をメイン文書情報として固定することができる。メイン文書情報の固定は、文書情報固定部（図示せず）が実行する。

より詳細には、出力部１０４は、メイン文書情報の固定を示すメイン文書情報固定スイッチ１０６の図形（画像）を比較表１００に対して出力し、利用者がこのスイッチを選択する操作、すなわちマウスによるクリックやキーボードによる操作を行う。そして、文書情報固定部（図示せず）に、メイン文書情報固定指令信号が入力される。利用者は、メイン文書情報固定スイッチ１０６を操作することによりメイン情報固定モードの選択を行い、メイン文書情報固定指令信号に基づき、利用者からの複数の文書情報の固定指示を受け付けるように構成する。

利用者は、マウスにより、メイン文書情報固定スイッチ１０６をクリックすることによって、メイン情報固定モードを選択することができる。なお、メイン情報固定モードを選択することができればよく、メイン文書情報固定スイッチ１０６は、例えば、ボタン、アイコン等であってもよい。

なお、メイン情報固定モードの選択は、利用者が自由に選択可能であり、出力部１０４が、比較表１００に出力した複数の類似文書情報のうち、何れの文書情報をメイン文書情報として選択してもよい。また、メイン文書情報の選択は１件に限らず２件以上の文書情報をメイン文書情報として選択してもよい。

さらに、利用者がメイン文書情報を指定することも可能である。図４に示すように入力ボックス１０７に利用者が文書情報を入力することにより、メイン文書情報を固定することもできる。この場合に入力できる文書情報も１件に限定されない。利用者は、２件以上の文書情報を入力することが可能である。そして、利用者がメイン文書情報を入力ボックス１０７に入力し特定スイッチ１０８を押すことにより、一致度の再算出を実行する。ここで、入力ボックス１０７に入力する文書情報は、例えば、拒絶理由通知書、模擬拒絶理由通知書（拒絶理由通知書に似せた、模擬的な通知書）であったり、発明者または出願人として関係する知的財産に関する情報等も含まれる。特許の場合、発明者または出願人として関係する知的財産に関する情報は、発明情報が記載されている発明メモや請求項情報である。類似情報は、例えば先行技術文献（先行文書情報）が含まれる。なお、入力ボックス１０７に入力する文書情報は、先行する特許文献番号に限定されない。入力ボックス１０７に入力する文書情報は、文章データ、数値データを含む。文章データは、例えば、知的財産に関する情報、アイデアシート、アイデアメモ、訴訟に関連する情報、論文、書籍（雑誌、週刊誌を含む）、レポート及びホームページを含む。数値データは、例えば、実験データ、測定データ、統計データ、検査データが含まれる。その他、入力ボックス１０７に入力する文書情報は、数式データ、図表データ、写真データ及び画像データ（静止画像、動画像を含む）を含む。その場合は、入力ボックス１０７に、例えば、ＰＤＦ電子データをドロップアンドドロップすることにより、該ＰＤＦ電子データを取り込むことができる。なお、先行する特許文献のＰＤＦ電子データをドロップアンドドロップすることにより取り込むことができる。

ここで、出力部１０４は、入力情報を分解した複数の構成単位のうち、少なくとも一以上の構成単位を指定して、この指定した構成単位が含まれる複数の文書情報を出力（抽出）することができる。構成単位の指定は、自己評価モード切り替えスイッチ１１５において、「いいね！」機能１１５ａに切り替えることによって行うことができる。そして、特定の構成単位が含まれる複数の類似する先行技術文献（先行文書情報）について一致度をスコア算出し、比較表１００に該文書情報を表示出力する。これにより、入力情報に、より類似する先行技術文献（先行文書情報）を出力することができる。特定の構成単位が含まれる複数の文書情報の算出は、上述した再算出の算出処理と同様の方法により行われる。そして、出力部１０４が出力した該文書情報のうち、特定の文書情報をメイン文書情報として、利用者がメイン文書情報固定スイッチ１０６を押すことにより固定することができる。

再算出は、メイン文書情報に基づき、入力文書情報の重みを調整することにより行う。再算出の方法は、上述した自己評価モードに基づく再算出の方法と同様の方法により行われる。

メイン文書情報としては、例えば、各国の特許庁において過去に審査された結果引用された引用情報、参考情報の他、利用者自身が過去に調査した特許文献、書籍、雑誌等の非特許文献であってもよい。

なお、本実施形態に係る文書情報評価装置１は、権利取得の可能性を判定する判定部４０２を備えていてもよい。判定部４０２は、認定した発明と類似する類似先行技術文献（先行文書情報）を検索し、類似した発明の有無によって、例えば、権利取得の可能性を判定する処理を実行できる。発明が類似するか否かの判断は、例えば、認定された発明の意味（含意）を認識し、含意が類似した引用発明が検索できたか否かで判断することができる。ここで、引用発明は、公開されている特許文献または非特許文献である。特許文献は、例えば、各国特許庁により公開されている特許公報等の文献を利用することができる。また、非特許文献は、学術雑誌、新聞、またはＷｅｂサイト等に掲載された文献を利用することができる。特許文献または非特許文献は、例えば、図示しない専用のデータベースに保存しておき、判定部４０２から検索可能にしていてもよいし、記憶部１０２に保存しておいてもよい。発明の意味の類似は、例えば、認定された発明に含まれる単語の中からキーワードを抽出し、同義語、類義語または派生語（同義語等）を記憶した図示しないデータベースからキーワードに対する同義語等を検索した上で、同義語等によって構成される文章の意味内容が類似しているか否かで判断することができる。判定部４０２は、文章の類似の度合いを類似度として算出してもよい。判定部４０２は、算出した文章の類似度が小さい場合、権利取得の可能性が高いと判定してもよい。一方、判定部４０２は、算出した文章の類似度が大きい場合、権利取得の可能性が低いと判定してもよい。判定部４０２は、権利取得の可能性の高低に応じて、例えば、「Ｓランク（可能性が極めて高い）」、「Ａランク（可能性が高い）」、「Ｂランク（可能性あり）」、および「Ｃランク（可能性が低い）」等、ランクによる判定をしてもよい。また、判定は、ＳランクからＣランクの表示に限定されない。判定は、例えば、可能性が高い順に◎から×の表示であってもよい。

判定部４０２は、各国の特許庁において過去に審査された権利取得の審査結果に基づき、権利取得の可能性を判定することができる。権利取得の審査結果とは、出願に係る発明、引用された引用文献、およびその両者の対比における審査結果（引用文献に基づき拒絶されたか否か）である。判定部４０２は、出願に係る発明と引用された引用文献の文章の類似度を算出し、算出した類似度と審査結果との対比を学習して、権利取得の可能を判定してもよい。判定部４０２は、算出した類似度と過去の審査結果との対比を学習することにより、過去の特許庁における判断を判定基準とすることができるので、権利取得の可能性についての判定精度を向上させることができる。記憶部１０２に、予め、審査結果が格納されるように構成してもよい。審査結果は、例えば、各国の特許庁が公開している審査情報から取得することができる。判定部４０２は、審査結果に基づき、権利取得の可能を判定してもよい。

出力部１０４は、算出部１０３により算出された知的財産に関するデータ、または、類似情報に基づいて、利用者端末２に出力される情報を制御する。具体的には、出力部１０４は、算出部１０３により算出された権利取得可能性の情報に基づいて、第１キャラクター３の態様を出力制御することができる。例えば、出力部１０４は、上述した権利取得可能性の情報が拒絶すべきと判定部４０２が判定した場合、記憶部１０２に記憶されたキャラクター情報のうち、哀のキャラクターを選択し、表示画面２００に表示するように出力部１０４に出力指示をだす。また、出力部１０４は、上述した権利取得可能性の情報が拒絶すべきと判定部４０２が判定した場合、上記スコアまたは権利取得可能性の情報に基づいて、記憶部１０２に記憶されたキャラクター情報のうち、哀のキャラクターを選択し、表示するように出力部１０４に出力指示をだしてもよい。

また、出力部１０４は、算出部１０３により算出されたキーワードを、第１キャラクター３を介して出力してもよい。算出部１０３が、記憶部１０２に記憶された知的財産に関する情報からキーワードを抽出する。具体的には、判定部４０２が、権利取得可能性の情報が拒絶すべきと判定した際、どのような新たなキーワードを付加すれば、権利取得可能性の情報が拒絶すべきではないと判定するかというロジックで、新たなキーワードを算出する。算出部１０３は、新たなキーワードを無数に列挙してもよいが、煩雑となるため、算出に際しては、同一または類似技術の公報のクレーム記載のキーワードを算出してもよい。

また、判定部４０２は、過去の審査結果を機械学習し、権利取得の可能性を判定してもよい。例えば、審査結果は情報取得部１０１が取得する。例えば、判定部４０２は、出願に係る発明と引用された引用文献を入力、審査結果を出力とした、入力と出力をデータセットとする機械学習（教師あり学習）を行い、学習したデータセットをモデリングすることにより、権利取得の可能性を判定することができる。データセットは、例えば、国、適用法（法改正を含む）、発明の分野等によってそれぞれ異なるモデルとしてモデリングすることができる。判定部４０２は、それぞれのモデリングにおいて学習された学習結果を用いることにより、権利取得の可能性についての判定精度を向上させることができる。また、判定部４０２は、情報取得部１０１において取得された新たな審査結果を機械学習していくことにより、特許庁における審査の傾向に変化があった場合においても、その傾向の変化に対応して権利取得の可能性についての判定することができる。なお、機械学習としては、教師ありの学習技法を用いても教師なしの学習技法を用いてもよい。機械学習の学習技法としては、例えば、ニューラルネットワーク（ディープラーニングを含む）、サポートベクターマシン、クラスタリング（例えば、課題、第１実施形態等）、またはベイジアンネットワーク等を用いてもよい。

続いて、図６～図９を参照して、本実施形態の第１変形例について説明する。図６は、本発明の一実施形態の第１変形例に係る文書情報評価装置１のソフトウェア構成の一例を示すブロック図である。また、図７は、本発明の一実施形態の第１変形例に係る検索の画面の例を示す模式図である。また、図８は、本発明の一実施形態の第１変形例に係る類義語辞書テーブルの一例を示す図である。なお、図１～図５を参照して説明した実施形態と同様の構成については、図の説明が冗長となることを避けるため、図の記載と説明とを省略する。

図６に示すように、文書情報評価装置１は、文書情報入力部３０１と、検索キーワード入力部３０２と、記憶部１０２と、算出部１０３と、類義語展開選択部３０３と、出力部１０４の各機能部を有する。本実施形態における文書情報評価装置１の上記各機能部は、文書情報評価装置１を制御する情報処理プログラム（ソフトウェア）によって実現される機能モジュールであるものとして説明する。文書情報評価プログラムは、文書情報評価装置１で動作する。すなわち、文書情報評価装置１は、文書情報評価プログラムが動作する装置をいう。第１変形例では、一例として、入力情報および文書情報が知的財産に関する情報である場合について説明する。

文書情報入力部３０１は、利用者端末２を介して入力ボックス３０１ａから入力された知的財産に関する情報（入力情報）を、利用者端末を介して受け付ける。文書情報入力部３０１には、例えば、利用者が創作した発明の内容が受け付けられる。文書情報評価装置１によって、入力ボックス３０１ａが生成される。

また、検索キーワード入力部３０２は、利用者端末２を介して入力ボックス３０２ａから入力されたこれら知的財産に関する情報を、利用者端末２から検索キーワードの入力を受け付ける。検索キーワードとは、利用者が入力する知的財産に関する情報と関連性のあるキーワードのことをいう。検索キーワードは、知的財産に関連する先行技術文献（類似する先行文書情報を含む）の抽出精度を向上させることを目的として、利用者が利用者端末２を介して入力する。検索キーワード入力部３０２には、例えば、入力ボックス３０２ａから入力された知的財産に関する情報の技術的特徴に関連するキーワードなどが受け付けられる。文書情報評価装置１によって、入力ボックス３０２ａが生成される。

利用者端末２は、利用者が操作可能な端末装置であって、例えば、デスクトップＰＣ、ノートＰＣ、タブレットＰＣまたはスマートフォン等である。

類義語展開選択部３０３は、検索キーワード入力部３０２に入力された検索キーワードの類義語展開の範囲を選択可能とする機能を有する。図７に示す通り、類義語展開選択部３０３は、「なし」、「標準」、「広い」の３段階の選択が可能である。「なし」とは、類義語の展開をしないで検索を行い一致度のスコアを算出する状態、「標準」とは、予め記憶部１０２に記憶されている第１類義語情報αのうち、例えば５０％の第１類義語情報αを展開して検索を行い一致度のスコアを算出する状態、「広い」とは、予め記憶部１０２に記憶されている第１類義語情報αのうち、例えば１００％の第１類義語情報αを展開して検索を行い一致度のスコアを算出する状態を、それぞれ示す。なお、「なし」「標準」、「広い」の３段階は例示であって、予め記憶部１０２に記憶されている第１類義語情報αのうちどの程度を展開し一致度のスコアを算出するかは適宜調整できるものとする。図７において、検索キーワード入力部３０２は、「あいまい」を選択した場合に検索キーワードの類義語展開を行い検索または分析の処理を実行する。また、検索キーワード入力部３０２は、「含む」を選択した場合に検索キーワードが含まれるように検索または分析の処理を実行する。そして、検索キーワード入力部３０２は、「含まない」を選択した場合に検索キーワードが含まれないように検索または分析の処理を実行する。

また、出力部１０４は、上記の通り、類義語展開選択部３０３に基づき「標準」または「広い」を選択した場合における、類義語展開された第１類義語情報αの内容を利用者端末２に表示出力する機能をさらに有する。表示出力は、検索キーワードごとに第１類義語情報αがテーブル形式で記憶される（図８参照）。

図７に示すように、文書情報評価装置１には、複数の類義語展開の選択を可能とする情報バー３０３ａ（第１情報バ―）が、出力部１０４によって、利用者端末２の検索を行う際の表示画面２０１に表示出力される。情報バー３０３ａには、「なし」、「標準」、「広い」の選択スイッチ３０３ｂが設けられており、選択スイッチ３０３ｂを操作し類義語展開の選択を行うことにより、利用者からの類義語展開の選択指示が行われ、類義語展開指令信号に基づく類義語展開の入力を類義語展開選択部３０３が受け付ける。類義語展開選択部３０３にて入力の受け付けが行われると、選択スイッチ３０３ｂの選択に応じた類義語が展開され、当該類義語展開の条件で検索を実行することが可能となる。

類義語展開選択部３０３に基づき類義語展開を例えば、「標準」と選択すると、検索キーワードの第１類義語情報αが利用者端末２の検索を行う際の表示画面２０１に表示出力される。そして、選択を「標準」から「広い」に変更した場合、「広い」に変更したことに伴い、「標準」から新たに追加される第１類義語情報αが利用者端末２の検索を行う際の表示画面２０１に表示出力される。このように、出力部１０４は、選択の変更に応じて、第１類義語情報αの遷移状態を確認できるように第１類義語情報αを出力してもよい（図８の矢印部参照）。本第１変形例では、「なし」「標準」、「広い」の３段階を例示して説明したが、これに限定されない。類義語展開の選択を４段階以上とすることも可能である。文書情報評価装置１によれば、選択位置に基づく第１類義語情報αの遷移状態を一目で確認することができる。

第１類義語情報αは、利用者が、適宜追加または削除することが可能である。記憶部１０２は、利用者が保持する独自の「複数の検索キーワードごとの複数の第２類義語情報βを記憶することができる。そして、図７に示すように、記憶部１０２には、検索キーワードごとに追加したい第２類義語情報βと、削除したい第２類義語情報βがテーブル形式で記憶されてもよい（図８参照）。追加したい第２類義語情報βとしての”add”情報（コマンド情報）と、削除したい第２類義語情報βとしての”del”情報（コマンド情報）を利用者が予め保持している。例えば、検索キーワードを「今日」とした場合、”add”情報を「一昨日」とし、”del”情報を「今日は」とする利用者独自の第２類義語辞書Ｙを保持していてもよい。また、記憶部１０２は、検索キーワードを「天気」とした場合、”add”情報を「雪」とし、”del”情報を「元気」とする利用者独自の第２類義語辞書Ｙを記憶していてもよい。

なお、利用者は利用者端末２を介して表示出力された第１類義語情報αから直接削除したい第１類義語情報αを選択して削除することができる。なお、利用者は利用者端末２を介して表示出力された第１類義語情報αに対して追加したい第１類義語情報αを直接入力することができる。利用者端末２を介して第１類義語情報αが表示出力された場合、テキストボックス（図示せず）が表示出力されており、当該テキストボックスに追加したい第１類義語情報αを直接入力してもよい。このように、第１類義語情報αから直接追加または削除を実行した場合、追加または削除した内容が、”add”情報または”del”情報として、第２類義語辞書Ｙに反映されてもよい。

第２類義語情報βを有する第２類義語辞書Ｙは、ＣＳＶ形式のファイルを、利用者端末２の検索を行う際の表示画面２０１に表示出力することにより実行してもよいし、ＣＳＶ形式のファイルを、クラウド上で保持し管理していてもよい。

具体的には、記憶部１０２は、利用者独自の複数の検索キーワードごとの複数の第２類義語情報βを有する第２類義語辞書Ｙを、前記複数の第１類義語情報αを有する第１類義語辞書Ｘの検索キーワードと対応付けて記憶している。第１類義語辞書Ｘには、例えばWordNetが用いられる。

出力部１０４にて表示出力された検索キーワードの第１類義語情報αからある検索キーワードを追加または削除したい場合、当該検索キーワードごとの第１類義語情報αと、検索キーワードごとの追加または削除したい第２類義語情報βはそれぞれ対応付けられている。

出力部１０４は、利用者独自の複数の検索キーワードごとの複数の第２類義語情報βを有する第２類義語辞書Ｙを、利用者端末２の検索を行う際の表示画面２０１に表示出力する機能を有する。出力部１０４は、さらに、検索キーワードごとに追加または削除したい第２類義語情報βがテーブル形式で表示出力することが可能であり（図８参照）、追加・削除ボタン（図示せず）を選択することにより、検索キーワードの第１類義語情報αから選択した第２類義語情報βを追加または削除できるように構成されていてもよい。また、”add”情報および”del”情報がコマンド情報として検索キーワードごとに対応付けられており、コマンド情報が”add”情報の場合は当該検索キーワードごとに対応する第２類義語情報βは自動で追加され、コマンド情報が”del”情報の場合は当該検索キーワードごとに対応する第２類義語情報βは自動で削除されるように構成してもよい。

このように、追加または削除された第１類義語情報αを利用者独自の類義語辞書として、記憶部１０２に記憶することができる。

本第１変形例によれば、検索または分析の精度を向上させることが可能であって、利用者の経験によらず一定水準の検索または分析をすることが可能となる。また、従来の文書情報評価装置では確認できなかった類義語情報を容易に確認することができ、検索または分析の範囲を明確にすることが可能にするため、文書情報評価装置の不透明性をなくし検索または分析の信頼性を向上させることができる。

また、本第１変形例によれば、文書情報評価装置１は、文書情報の評価を行うに際して、知的財産に関連する先行文書情報（類似する先行文書情報を含む）のどの部分に記載されている文章と、利用者が利用者端末２を介して入力する知的財産に関連する文書情報を比較するか否かを選択可能とする検索文章範囲選択部３０４を、さらに備えてもよい。

図７に示すように、文書情報評価装置１は、複数の検索文章範囲の選択を可能とする情報バー３０４ａ（第２情報バー）を生成し、出力部１０４によって、利用者端末２の検索を行う際の表示画面２０１に表示出力される。情報バー３０４ａには、「請求項」、「請求項・要約」、「全文」の選択スイッチ３０４ｂが設けられており、選択スイッチ３０４ｂを操作し検索文章範囲の選択を行うことにより、利用者からの検索文章範囲の選択指示が行われ、検索文章範囲選択指令信号に基づく検索文章範囲の選択を検索文章範囲選択部３０４が受け付ける。検索文章範囲選択部３０４にて入力の受け付けが行われると、選択スイッチ３０４ｂの選択に応じた検索文章範囲が選択され、当該検索文章範囲の選択の条件で検索を実行することが可能となる。

図７に示す通り、検索文章範囲選択部３０４は、「請求項」、「請求項・要約」、「全文」の３段階の入力の受け付けが可能である。「請求項・要約」とは、知的財産に関連する先行文書情報（類似する先行文書情報を含む）の請求項に記載されている箇所を検索または分析の範囲とする。「請求項」とは、知的財産に関連する先行文書情報の請求項に記載されている箇所を検索または分析の範囲とする。「請求項」は全請求項を対象としてもよいし、特定の一部の請求項のみを検索または分析の範囲の対象としてもよい。検索文章範囲選択部３０４は、検索または分析の範囲を、全請求項とするか特定の請求項にするか選択可能な構成としてもよい。「全文」とは、願書、明細書、請求項、要約書を含む。なお、「全文」には、図面を含めてもよい。「全文」は、図面に記載の用語を含む構成としてもよい。

このように評価内容（例えば、先行技術調査、無効資料調査、侵害性調査）の種類に応じて、検索または分析の範囲を適宜変更することができるため、文書情報評価装置１によれば評価精度を向上させることができる。

また、本第１変形例によれば、文書情報評価装置１は、利用者の知的財産に関連する文書情報（入力文書情報）の技術分野に関するキーワードの入力を受け付ける技術分野入力部３０５と、知的財産に関連する文書情報の技術的特徴に関するキーワードの入力を受け付ける技術的特徴入力部３０６と、をさらに備える構成としてもよい。なお、技術分野入力部３０５および技術的特徴入力部３０６による入力の受け付けは、キーワードに限定されない。当該入力の受け付けは、複数のキーワードを組み合わせた用語であってもよいし、文節、文章などの文書情報の入力を受け付けるように構成してもよい。技術分野入力部３０５には、利用者端末２を介して入力ボックス３０５ａから入力された知的財産に関する情報の技術分野が受け付けられる。また、技術的特徴入力部３０６には、利用者端末２を介して入力ボックス３０６ａから入力された知的財産に関する情報の技術的特徴が受け付けられる。文書情報評価装置１によって、入力ボックス３０５ａ、３０６ａが生成される。

また、文書情報評価装置１は、利用者の知的財産に関連する文書情報（入力文書情報）の補足情報に関する文書情報（例えば知的財産に関連する文書情報の具体的な実施形態、背景技術等）の入力を受け付ける補足情報入力部３０７を追加してもよい。なお、補足情報入力部３０７による入力の受付けは、文節、文章などの文書情報に限定されずキーワードであってもよい。補足情報入力部３０７には、利用者端末２を介して入力ボックス３０７ａから入力された知的財産に関する情報の補足情報が受け付けられる。文書情報評価装置１によって、入力ボックス３０７ａが生成される。

このように、検索キーワードに加え、技術分野関するキーワード、技術的特徴に関するキーワード、および補足情報に関する文書情報の、少なくとも一方のキーワードを入力することが可能になるため、文書情報評価装置１によれば、さらに評価精度を向上させることができる。

さらに、文書情報評価装置１は、上述のように選択した検索文章範囲および類義語展開範囲のフィードバックを行い、当該フィードバックの結果を記憶部１０２に記憶するように構成してもよい。文書情報評価装置１が、当該フィードバックの結果を学習することにより、例えば、前回実施した評価の対象となる文書情報と類似の技術分野や技術的特徴を有する前回とは異なる文書情報について評価を実施する場合、改めて選択しなくても、前回評価したときに選択した検索文章範囲および類義語展開範囲を自動で設定する項に構成してもよい。または、文書情報評価装置１は、類似の技術分野や技術的特徴について多用されている検索文章範囲および類義語展開範囲を、リコメンド（推奨）するように構成してもよい。リコメンド（推奨）は、文書情報評価装置１が備える推奨部（図示せず）が実行するように構成してもよい。

続いて、図９を用いて、一実施形態の第１変形例に係る文書情報評価装置１の動作例を説明する。図９は、一実施形態の第１変形例に係る文書情報評価装置１の動作例を示すフローチャートである。

＜第１変形例に係る文書情報評価装置１の動作処理の一例＞
図８において、文書情報評価装置１は、利用者端末２からの知的財産に関する入力情報の入力を受付ける（Ｓ２０１）。知的財産に関する入力情報の入力の受け付けは、文書情報入力部３０１が実行する。次いで、文書情報評価装置１は、利用者端末２から知的財産に関する文書情報に関連する検索キーワードの入力を受け付ける（Ｓ２０２）。検索キーワードの入力の受け付けは、検索キーワード入力部３０２が実行する。

次いで、類義語展開を選択する（Ｓ２０３）。類義語展開の入力の受け付けは、類義語展開選択部３０３が実行する。次いで、出力部１０４に基づき、Ｓ２０３にて選択した類義語展開の第１類義語情報αを表示出力する（Ｓ２０４）。次いで、表示出力された検索キーワードに関する第１類義語情報αが妥当か否かを判断する（Ｓ２０５）。Ｓ２０５にて、第１類義語情報αが妥当であると判断される場合（Ｓ２０５のＹＥＳ）、算出部１０３は、記憶部１０２において記憶された先行文書情報に基づき、利用者端末２から入力された入力情報としての文書情報に対する一致度を算出して（Ｓ２０６）本動作処理を終了する。

一方、Ｓ２０５にて、第１類義語情報αが妥当でないと判断される場合（Ｓ２０５のＮＯ）、利用者が保持する独自の複数の検索キーワードごとの複数の第２類義語情報βを文書情報評価装置１に取り込み利用者端末２に表示出力を行う。表示出力は、例えば、検索キーワードごとに追加したい第２類義語情報βと、削除したい第２類義語情報βがテーブル形式で作成したＣＳＶ形式のファイルを、利用者端末２に取り込み表示出力することにより実行してもよいし、ＣＳＶ形式のファイルを、クラウド上で保持し管理していてもよい。取り込まれた第２類義語情報βを有する第２類義語辞書Ｙは、例えば記憶部１０２に記憶される。そして、当該表示出力された、当該第２類義語情報βから追加または削除したい第２類義語情報βを選択する（Ｓ２０７）。例えば、追加・削除ボタン（図示せず）を選択することにより、検索キーワードの第１類義語情報αから選択した第２類義語情報βを追加または削除できるように構成されていてもよい。その後、Ｓ２０６に移行し本動作処理を終了する。

なお、上記の第１変形例に係る文書情報評価装置１の動作処理の一例では、検索キーワードの類義語展開のバリエーションについて説明したが、これに限定されない。文書情報評価装置１は、利用者端末２を介して入力ボックス３０１ａから入力された知的財産に関する情報（入力情報）の類義語展開についても適用可能である。また、文書情報評価装置１は、入力情報に含まれるキーワードおよび検索キーワードの両方について、類義語展開を実行することもできる。すなわち、文書情報評価装置１は、入力情報に含まれるキーワードおよび検索キーワードのうち少なくとも一方のキーワードの類義語展開について適用可能である。

さらに、文書情報評価装置１は、入力情報に含まれる複数のキーワードおよび複数の検索キーワードの両方について、キーワードごとに、第１類義語情報の類義語展開の選択を複数設定できるように構成してもよい。この場合、出力部１０４は、第１類義語情報を、キーワードごとにテーブル形式で出力するように構成してもよい。

続いて、図１０～図１１を参照して、本実施形態の第２変形例について説明する。図１０は、本発明の一実施形態の第２変形例に係る文書情報評価装置１のソフトウェア構成の一例を示すブロック図である。また、図１１は、本発明の一実施形態の第２変形例に係る検索の画面の例を示す模式図である。なお、図１～図５を参照して説明した実施形態、および図６～図９を参照して説明した第１変形例と同様の構成については、図の説明が冗長となることを避けるため、図の記載と説明とを省略する。

図１０に示すように、文書情報評価装置１は、文書情報入力部３０１と、記憶部１０２と、決定部４０１と、算出部１０３と、判定部４０２、出力部１０４、生成部４０３の各機能部を有する。本第２変形例における文書情報評価装置１の上記各機能部は、文書情報評価装置１を制御する情報処理プログラム（ソフトウェア）によって実現される機能モジュールであるものとして説明する。文書情報評価プログラムは、文書情報評価装置１で動作する。すなわち、文書情報評価装置１は、文書情報評価プログラムが動作する装置をいう。第２変形例では、一例として、入力情報および文書情報が知的財産に関する情報である場合について説明する。

決定部４０１は、利用者端末２を介して入力ボックス３０１ａから入力された知的財産に関する情報（入力情報）の第１技術分類を決定する。例えば、決定部４０１は、入力情報としての知的財産に関する情報に含まれる複数の単語の中から出現頻度の高い単語を用いて第１技術分類を決定してもよく、入力情報に含まれる複数の単語が多く含まれる先行文書情報を記憶部１０２から検索して、抽出された先行文書情報に対応付けられている技術分類を入力情報の第１技術分類としてもよく、単語の係り受け関係から重要な用語を用いて第１技術分類を決定してもよい。すなわち、第１技術分類は、利用者が入力した入力情報（発明内容）が属する技術分類を特定するために決定される。なお、第１技術分類は、通常１つに決定されるが、第１技術分類を１つに絞込み辛い場合などは、複数の第１技術分類を入力情報に対して決定してもよい。入力ボックス３０１ａに入力された入力情報から第１技術分類を決定する技術は、一般的な技術を用いればよく、上記手法には限定されない。例えば、決定部４０１は、文章、文節、複数の文節の組み合わせに基づいて、第１技術分類を決定してもよい。

第１技術分類は、特許庁によって特許文献に付与される技術分類であり、ＩＰＣやＦＩを想定する。しかしながら、ここではＵＰＣ、ＣＰＣ、Ｆタームなどの特許分類を用いることもできる。更に、特許文献が異なる技術分野に分類されるための分類分けであれば、特許庁が用意するもの以外でもよく、例えば、図書館の書籍分類などであってもよい。

本第２変形例に係る発明において、文書情報評価装置１が備える決定部４０１が、第１技術分類を決定する構成について説明したが、本発明はこれに限定されず、利用者が第１技術分類を決定してもよい。この場合、利用者が決定した第１技術分類は、利用者端末２を介して技術分類入力ボックス（図示せず）から入力される。

生成部４０３は、利用者の前記入力情報に係る権利取得の可能性に応じて、権利取得の可能性を向上させた追加情報を生成する。生成部４０３は、判定部４０２において判定された権利取得の可能性に基づき、文書情報入力部３０１において入力を受け付けられた知的財産に関する情報（入力情報）の権利取得の可能性を向上させるための追加情報を生成する。なお、追加情報の生成はＡＩ（ＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ）によって行うことができる。

生成部４０３は、例えば、入力情報に対して構成要件の付加または削除等をした追加情報を生成する。一般的に、入力情報の構成要件を付加する補充訂正は、権利範囲を限定することになるが、権利取得の可能性を高くすることができる。すなわち、生成部４０３は、入力情報の構成要件を付加することにより、権利の取得の可能性を高める追加情報を生成することができる。例えば、判定部４０２において権利取得の可能性が低いと判定された場合、生成部４０３は、入力情報の補充訂正によって権利の取得可能性が高くなる追加情報を生成する。生成部４０３は、例えば、機械学習において学習した、過去の審査において権利の取得の可能性を向上させた構成要件（文言または文章）を発明の構成要件に付加することにより過去の審査を踏まえて権利取得の可能性を向上させた追加情報を生成することができる。

一方、判定部４０２において権利取得の可能性が高いと判定された場合、生成部４０３は、入力情報の補充訂正において、権利の取得可能性が低くなる情報の生成を行ってもよい。生成部４０３は、入力情報の補充訂正において、権利の取得可能性が低くなる情報の生成を検討してもよい。例えば、入力情報の補充訂正は、入力情報のある構成要件を削除する情報の生成を検討することができる。発明内容（入力情報）の構成要件を削除する補正は、権利取得の可能性を低くすることになるが、発明の権利範囲を広げることができる。生成部４０３は、発明の構成要件を削除することにより、権利範囲を広げる情報を生成することができる。生成部４０３は、権利の取得の可能性に影響の少ない構成要件を削除する情報を生成することにより、権利の取得の可能性を維持しつつ発明の権利範囲を広げることが可能となる。

生成部４０３は、情報記録部（図示せず）に記録された情報に基づき、追加情報を生成してもよい。生成部４０３は、情報記録部（図示せず）に記録された技術者が過去に創作した知的財産を参照することにより技術者の知識を利用することができる。これにより、生成部４０３は、技術者が自ら作成する情報と類似した追加情報を技術者に代わって生成してもよい。生成部４０３は、他の技術者（例えば、同じ会社の技術者）によって情報記録部（図示せず）に記録された知的財産に関する情報に基づき、追加情報を生成してもよい。なお、第２変形例では、権利取得の可能性が高いと判定された場合、構成要件を削除する情報を追加情報として生成する場合について説明したが、これに限定されない。生成部４０３は、構成要件に含まれる単語、文節、文章などの一部を削除するように構成してもよい。この場合においても、生成部４０３は、上記と同様に権利の取得の可能性に影響の少ない単語、文節、文章などを削除する情報を生成することにより、権利の取得の可能性を維持しつつ発明の権利範囲を広げることが可能となる。

また、生成部４０３は、創作された発明に対してシミュレーション技術を適用することにより、発明の不具合を検出して創作対象から排除するようにしてもよい。シミュレーション技術には、例えば、ＣＡＤ等によりモデリングされたモデルに対する流体解析の技術、薬剤の生成をシミュレートする技術、実施に掛かるコストもしくは時間を算出する技術、または科学的な矛盾を検出する技術等を用いることができる。

生成部４０３は、例えば、判定部４０２において機械学習された、利用者が創作した発明と同じ技術分野において特許査定を得やすい構成要件を付加する追加情報を生成する。また、生成部４０３は、利用者が創作した発明と同じ技術分野において利用者が過去に創作した発明の構成要件を付加する追加情報を生成してもよい。すなわち、生成部４０３は、利用者に代わって新たな発明を創作することもできる。判定部４０２は、生成部４０３において生成された追加情報に基づき、知的財産に係る権利取得の可能性を再判定してもよい。知的財産に係る権利取得の可能性を再判定することにより、権利取得の可能性を向上させた追加情報を生成部４０３において生成させることができる。

さらに、生成部４０３は、複数の追加情報を生成することができる。そして、判定部４０２は、生成部４０３において生成された複数の追加情報に基づき、それぞれの権利取得の可能性を再判定してもよい。生成された複数の知的財産に係る権利取得の可能性を再判定することにより、生成された複数の追加情報の中から権利取得の可能性の高いものを選択することが可能になる。例えば、生成部４０１は、複数の追加情報の中から再判定の結果において権利取得の可能性が高い順に追加情報をソートして利用者に提言できるようにしてもよい。

生成部４０３によって生成された追加情報は、表示部（図示せず）によって利用者端末２の画面上に表示出力することができる。例えば、利用者端末２に出力結果として比較表１００が表示出力されたとき、一致度のスコアが低く権利取得可能性が否定的であると評価される場合（例えば、Ｃランク）、生成部４０３に評価結果に基づく評価信号が入力され、追加情報を生成するように構成してもよい。そして、表示部（図示せず）は、利用者端末２に出力された比較表１００上に、追加情報を表示出力してもよい。また、表示部（図示せず）は、追加情報に対応する単語、文節、文章などを当該第１キャラクター３の近くに吹き出しとして表示出力してもよい。また、生成部４０３によって追加情報が生成された場合、制御部（図示せず）に基づき、例えば、第１キャラクター３が追加情報を発声（提言）するように構成してもよい。なお、判定部４０２において権利取得の可能性が高いと判定された場合、生成部４０３は、入力情報の補充訂正において、権利の取得可能性が低くなる情報の生成を行ってもよい。また、生成部４０３は、判定部４０２において権利の取得の可能性に影響の少ない単語、文節、文章などを削除する情報を生成してもよい。

＜入力情報の補充訂正＞
入力情報の補充訂正は以下の手順にて行う。まず、出力部１０４は、判定部４０２が判定した、利用者の入力情報に係る権利取得の可能性に応じて、決定部４０１にて決定した第１技術分類と異なる第２技術分類を用いて先行文書情報の出力（抽出）を行う。次いで、生成部４０３が、当該先行文書情報および入力情報に含まれる文章の比較を行い、当該先行文書情報と入力情報との差分を構成する文書情報に基づき追加情報を生成することにより実行する。

第２技術分類が含まれる先行文書情報のうち、入力情報に類似する先行文書情報の出力（抽出）は、一般的な手法を用いることができる。例えば、出力部１０４は、当該先行文書情報を構成単位ごとに分割する。具体的には、小用語解析を用いることができる。すなわち、先行文書情報を複数の単語単位に分割して、どの単語がどの単語を修飾しているかの係り受け関係を抽出する。発明文章が英文などの場合には、ピリオド、コロン、セミコロン、カンマ、や関係代名詞の優先順位で分割をするデリミタ処理を行ってもよい。そして、出力部１０４は、先行文書情報中に含まれる複数の単語の中から重要な用語を出力（抽出）してもよい。例えば、出力部１０４は、出現頻度の高い単語を出力（抽出）してもよく、単語の係り受け関係から重要な用語を出力（抽出）してもよい。なお、重要な用語は、通常１つの単語であるが、重要な用語を１つに絞込み辛い場合などは、複数の単語としてもよい。

このように、出力部１０４による第２技術分類が含まれる先行文書情報の出力（抽出）は、記憶部１０２に含まれる先行文書情報を単にキーワード検索によって検索してもよい。

出力部１０４は、出力（抽出）される文献の精度を高めるために、キーワードが含まれる先行文書情報の中から当該キーワードの重要度を考慮して先行文書情報の精度を上げてもよい。例えば、出力部１０４は、ＴＦ－ＩＤＦ法などを用いて、キーワードが先行文書情報に含まれる文章においてどの程度の重要度があるかを評価してもよい。ここでは、キーワードが１つの特許文献全体において出現する特許文献は、重要度が低いと仮定し、１つの特許文献において特定の文章にしか出現しない場合は、重要度が高いと仮定してもよい。なお、ＴＦＩＤＦ法などを用いた、キーワードに対する特許文献の抽出は、利用者が利用端末２に入力情報を入力し、キーワードが得られた際に行なわれてもよく、代表的なキーワードに対する特許文献を予め記憶部１０２内に記憶しておいてもよい。

なお、先行技術情報の検索は、キーワード検索に限定されない。先行技術情報の検索は、文章、文節、複数の文節の組み合わせに基づいて、入力情報と先行文書情報との差異の程度（一致度）を構成単位（Ｅｌｅｍｅｎｔ）ごとに比較してもよいし、入力情報と先行文書情報との差異の程度（一致度）を文章全体として比較してもよい。

生成部４０３は、上記のように第２技術分類を用いて出力（抽出）した先行文書情報と入力情報を、当該先行文書情報および当該入力情報に含まれる文章の構成単位ごとに比較を行い、先行文書情報と入力情報との差分を構成する文書情報を生成する。差分を構成する文書情報は、構成単位ごとの文章であってもよいし、文節、または単語であってもよい。差分を構成する文章、文節、単語が複数ある場合、出力部１０４は、全ての文章、文節、単語を追加情報として出力することができる。なお、出力部１０４は、複数ある文章、文節、単語のいくつかを選定して出力するように構成してもよい。また、出力部１０４は、文章、文節、単語の出現頻度が高い順に、上位２位を選定してもよいし、上位１位と３位を選定して出力するように構成してもよい。このように、出力部１０４は、差分を構成する文章、文節、単語（追加情報）を適宜選択して出力することができる。これにより、生成部４０３は、第２技術分類を用いて出力した先行文書情報に存在し、入力情報に存在しない文章などを追加情報として生成することができる。第２変形例に係る発明によれば、権利取得の可能性が低い発明（入力情報）に対して何らかの構成を外的に付加した追加情報を提示することが可能になり、利用者に対し、権利取得の可能性を向上させた発明を提言することができる。

また、出力部１０４は、入力情報に含まれるキーワードの第１類義語情報を出力することにより、当該キーワード以外の類義語、例えば、キーワードの中位概念、下位概念に属するキーワードを出力するように構成してもよい。そして、生成部４０３は、入力情報の構成単位を構成する複数の単語（キーワード、熟語など）以外の関連する単語（キーワードなど）を追加情報として生成してもよい。第２変形例に係る発明によれば、入力情報の構成単位に含まれるキーワードを異なるキーワードに訂正することにより、権利取得の可能性を向上させることができる。

なお、出力部１０４に基づき、どのキーワードがどのキーワードを修飾しているかの係り受け関係を出力（抽出）した結果、どのキーワードにも修飾されていないキーワードがある場合、当該キーワードが用いられている先行文書情報を出力（抽出）してもよい。具体的には、出力部１０４は、先行文書情報において、当該キーワードがどのキーワードを修飾しているかの係り受け関係を出力（抽出）する。その結果、先行文書情報に用いられているキーワードを修飾しているキーワードが存在する場合には、出力部１０４は、当該キーワードを追加情報として、出力（抽出）してもよい。なお、修飾する情報は、キーワードに限定されず、文章、文節であってもよい。第２変形例に係る発明によれば、権利取得の可能性が低い発明（入力情報）に対して何らかの構成を内的に付加した追加情報を提示することが可能になり、利用者に対し、権利取得の可能性を向上させた発明を提言することができる。

なお、生成部４０３は、例えば、判定部４０２において機械学習された、利用者が創作した発明と同じ技術分野において特許査定を得やすい構成要件を付加する追加情報を生成するように構成してもよい。生成部４０３は、利用者が創作した発明と同じ技術分野において利用者が過去に創作した発明の構成要件を付加する追加情報を生成してもよい。すなわち、生成部４０３は、利用者に代わって新たな発明を創作することもできる。判定部４０２は、生成部４０３において生成された追加情報に基づき、知的財産に係る権利取得の可能性を再判定することにより、生成部４０３において生成された追加情報を利用した権利取得の可能性を向上させることができる。

文書情報評価装置１は、さらに第２技術分類を選択する選択部（図示せず）を備える。選択部（図示せず）は、決定部４０１が決定した第１技術分類と異なる第２技術分類を選択する。選択部（図示せず）は、決定部４０１にて決定した第１技術分類に関する先行文書情報に対応付けられた従来技術情報（従来特許文献）に付与されている技術分類を第２技術分類として選択してもよい。この場合、第２技術分類は、第１技術分類と重複しないように決められる。更に、第２技術分類は、第１技術分類に類似しない技術分類が選択されるとよい。例えば、選択部（図示せず）は、技術分類（ＩＰＣ、ＦＩ等の特許分類）の先頭から所定桁数一致しているものを除外することで、類似しない技術分類を選択できるようになる。すなわち、選択部（図示せず）は、第２技術分類を特許分類上で第１技術分類から所定距離離れたところで指定することができれば、選択方法は上記に限定されることはない。更に、所定距離は、技術分類によって異なる値が定められるとよい。例えば、ＩＴソフトウェアの技術分野は、技術分類をまたいでも基本的に組み合わせが容易であると判断されることが多いため、所定距離を大きく設定することが必要である。すなわち、所定距離は、第１技術分類の先頭からの第１所定桁数（例えば４桁）、および先頭からの第２所定桁数（例えば３桁）と設定することができる。ここで、第２所定桁数は、第１所定桁数よりも少ない必要がある。この構成によって、第２技術分類が第１技術分類に限りなく近い特許分類になることを除外し、適度に近い第２技術分類に含まれる先行文書情報を出力（抽出）することができる。

第２技術分類は、第１技術分類との距離が適切な距離を有していればよい。距離が近すぎる場合は、特許性が否定される原因となり、距離が遠すぎると技術分野としては、異分野過ぎて無意味となってしまう可能性がある。第２技術分類を選択する手法は、上述の通り、さまざまな手法が採用できる。例えば、選択部（図示せず）は、決定部４０１にて決定された第１技術分類の先頭からの第１所定桁数（例えば４桁）一致しておらず、先頭からの第２所定桁数（例えば３桁）一致している特許分類を第２技術分類として選択してもよい。

第２技術分類は、特許庁によって特許文献に付与される技術分類であり、ＦＩやＩＰＣを想定する。しかしながら、ここではＣＰＣ、ＵＰＣ、Ｆタームなどの特許分類を用いることもできる。更に、特許文献が異なる技術分野に分類されるための分類分けであれば、特許庁が用意するもの以外でもよく、例えば、図書館の書籍分類などであってもよい。ただし、第２特許分類は、第１特許分類と同種類の特許分類を用いることが好ましい。

続いて、図１１を用いて、一実施形態の第２変形例に係る文書情報評価装置１の動作例を説明する。図１１は、一実施形態の第２変形例に係る文書情報評価装置１の動作例を示すフローチャートである。

＜第２変形例に係る文書情報評価装置１の動作処理の一例＞
図１１において、文書情報評価装置１は、利用者端末２からの知的財産に関する入力情報の入力を受付ける（Ｓ３０１）。知的財産に関する入力情報の入力の受け付けは、文書情報入力部３０１が実行する。次いで、文書情報評価装置１は、第１技術分類を決定する（Ｓ３０２）。決定部４０１は、利用者端末２を介して入力ボックス３０１ａから入力された知的財産に関する情報（入力情報）の第１技術分類を決定する。第１技術分類の決定は、決定部４０１が実行する。

次いで、算出部１０３は、記憶部１０２において記憶された先行文書情報に基づき、利用者端末２から入力された入力情報に対する一致度を算出する（Ｓ３０３）。具体的には、入力情報を所定の構成単位に分解し、該分解された構成単位ごとに、記憶部１０２に記憶された複数の文書情報のうちの一の文書情報との一致度をスコアとして算出することができる。構成単位の分解は、例えば、「発明者、創作者、または出願人として関係する知的財産に関する情報」の構成要件を句読点ごとに分節をする。または、構成単位の分解は、一定の文章の長さや、述語ごとに分節をしてもよい。

Ｓ３０３の処理を実行した後、スコアの算出結果に基づき、出力部１０４は、入力情報と文書情報との差異の程度を構成単位ごとに示した比較表を出力する（Ｓ３０４）。例えば、文書情報の評価結果は、構成単位ごとに、入力情報に類似する文書情報（以下、「類似情報」という）との差異の程度を対比（比較）した比較表である。ただし、文書情報の評価結果は、比較表１００に限定されない。例えば、模擬拒絶理由通知書（拒絶理由通知書に似せた、模擬的な通知書）であったり、発明者または出願人として関係する知的財産に関する情報等も含まれる。特許の場合、発明者または出願人として関係する知的財産に関する情報は、発明情報が記載されている発明メモや請求項情報である。類似情報は、例えば先行技術文献（先行文書情報）であって、比較表１００は、技術的な差異を示したいわゆるクレームチャートである。一致度のスコアは、例えば、「０％」～「１００％」の数値として算出することができる。

次いで、文書情報評価装置１は、認定した発明（入力情報）と類似する類似先行技術文献（先行文書情報）を検索し、類似した発明の有無によって、例えば、権利取得の可能性を判定する（Ｓ３０５）。判定は、判定部４０２が実行する。発明が類似するか否かの判断は、例えば、認定された発明の意味（含意）を認識し、含意が類似した引用発明が検索できたか否かで判断することができる。ここで、引用発明は、公開されている特許文献または非特許文献である。特許文献は、例えば、各国特許庁により公開されている特許公報等の文献を利用することができる。また、非特許文献は、学術雑誌、新聞、またはＷｅｂサイト等に掲載された文献を利用することができる。特許文献または非特許文献は、例えば、図示しない専用のデータベースに保存しておき、判定部４０２から検索可能にしていてもよいし、記憶部１０２に保存しておいてもよい。

次いで、文書情報評価装置１は、判定部４０２が権利取得の可能性を判定した結果、権利取得の可能性が高いと判定した場合は（Ｓ３０６のＹＥＳ）、本動作処理を終了する。なお、判定部４０２が権利取得の可能性が高いと判定した場合、生成部４０３は、入力情報の補充訂正において、権利の取得可能性が低くなる情報の生成を検討してもよい。例えば、入力情報の補充訂正は、入力情報のある構成要件を削除する情報の生成を検討することができる。発明内容（入力情報）の構成要件を削除する訂正は、権利取得の可能性を低くすることになるが、発明の権利範囲を広げることができる。生成部４０３は、発明の構成要件を削除することにより、権利範囲を広げる情報を生成することができる。生成部４０３は、権利の取得の可能性に影響の少ない構成要件を削除する情報を生成することにより、権利の取得の可能性を維持しつつ発明の権利範囲を広げることが可能となる。

一方、文書情報評価装置１は、判定部４０２が権利取得の可能性を判定した結果、権利取得の可能性が低いと判定した場合は（Ｓ３０６のＮＯ）、決定部４０１にて決定した第１技術分類と異なる第２技術分類の選択を行う（Ｓ３０７）。選択は選択部（図示せず）が実行する。第２技術分類は、第１技術分類に類似しない技術分類が選択されるとよい。例えば、技術分類（ＩＰＣ、ＦＩ等の特許分類）の先頭から所定桁数一致している特許分類に設定することで、類似しない技術分類を選択できる。

次いで、出力部１０４は、Ｓ３０７にて決定した第１技術分類と異なる第２技術分類を用いて先行文書情報の出力（抽出）を行う（Ｓ３０８）。出力は出力部１０４が実行する。出力部１０４による第２技術分類が含まれる先行文書情報の出力（抽出）は、記憶部１０２に含まれる先行文書情報を単にキーワード検索によって検索してもよい。

次いで、生成部４０３が、当該先行文書情報および入力情報に含まれる文章の比較を行い、当該先行文書情報と前記入力情報との差分を構成する文書情報に基づき追加情報を生成する（Ｓ３０９）。出力部１０４は、差分を構成する文章、文節、単語（追加情報）を適宜選択して出力することができる。これにより、権利取得の可能性が低い発明（入力情報）に対して何らかの構成を外的に付加した追加情報を提示することが可能になり、利用者に対し、権利取得の可能性を向上させた発明を提案することができる。

また、出力部１０４に基づき、構成単位ごとに分割された入力情報を複数の単語（キーワードなど）単位に分割して、どのキーワードがどのキーワードを修飾しているかの係り受け関係を出力（抽出）してもよい。これにより、権利取得の可能性が低い発明（入力情報）に対して何らかの構成を内的に付加した追加情報を提示することが可能になり、利用者に対し、権利取得の可能性を向上させた発明を提案することができる。

なお、判定部４０２は、生成部４０３において生成された複数の追加情報に基づき、それぞれの権利取得の可能性を再判定してもよい。生成された複数の知的財産に係る権利取得の可能性を再判定することにより、生成された複数の追加情報の中から権利取得の可能性の高いものを選択することが可能になる。例えば、生成部４０３は、複数の追加情報の中から再判定の結果において権利取得の可能性が高い順に追加情報をソートして利用者に提言できるように構成してもよい。

さらに、判定部４０２において権利取得の可能性が高いと判定された場合、生成部４０３は、入力情報の補充訂正において、権利の取得可能性が低くなる情報の生成を行ってもよい。生成部４０３は、入力情報の補充訂正において、権利の取得可能性が低くなる情報の生成を検討してもよい。例えば、入力情報の補充訂正は、入力情報のある構成要件を削除する情報の生成を検討することができる。発明内容（入力情報）の構成要件を削除する補正は、権利取得の可能性を低くすることになるが、発明の権利範囲を広げることができる。生成部４０３は、発明の構成要件を削除することにより、権利範囲を広げる情報を生成することができる。生成部４０３は、権利の取得の可能性に影響の少ない構成要件を削除する情報を生成することにより、権利の取得の可能性を維持しつつ発明の権利範囲を広げることが可能となる。

Ｓ３０９にて追加情報が生成されると、本動作処理を終了する。

また、文書情報評価装置１は、明細書に記載された文章の全文（特許請求の範囲の記載、発明の課題または発明の目的、発明の詳細な説明等）から、出現頻度の高い単語、文章、文節、図面、複数の文節の組み合わせ等に基づいて、先行文書情報を出力（抽出）してもよい。また、先行文書情報の出力（抽出）は、明細書に記載された文章の全文のうち、一部の文章、例えば、発明の課題が共通する先行文書情報を出力（抽出）してもよい。あるいは、先行文書情報の出力（抽出）は、発明の効果が共通する先行文書情報を出力（抽出）してもよい。このように、文書情報評価装置１は、先行文書情報を検索するに際して、どの部分に記載されている文章を基に、入力情報に記載されているキーワード（単語）などの出現頻度の高い先行文書情報を検索するかを、適宜選択することが可能である。この選択は、利用者が、利用者端末２を介して入力ボックス（図示せず）から先行文書情報の出力（抽出）条件を入力することによって実行されてよい。入力ボックス（図示せず）には、例えば、「発明の課題が共通」または「発明の効果が共通」と入力する。入力は、図示しない条件入力部によって受け付けられる。入力部によって先行文書情報の出力（抽出）条件を受け付けると、当該条件に従って、出力部１０４が先行文書情報の出力（抽出）を実行するように構成してもよい。

さらに、文書情報評価装置１によって評価された文書情報を、特許マップとして表示出力するように構成してもよい。特許マップの表示出力は、例えば、図示しない表示部が行ってもよい。特許マップは、例えば、複数の文書情報をＩＰＣやＦＩなどの技術分類、または単語（キーワード、熟語など）ごとに分類して特許マップとして表示出力するように構成してもよい。特許マップは、図１２Ａ～Ｃに示すように、文書情報を第２キャラクター（例えば、戦士）として配置した地形マップ（例えば、戦場の地形を模したマップ、以下「戦場マップ」という）２２０と、俯瞰図２３０と、チャート２４０であってもよい。そして、文書情報評価装置１は、戦場マップ２２０と、俯瞰図２３０と、チャート２４０と、を任意に切り替え利用者端末２上に表示出力することができるように構成してもよい。切り替えは、例えば、文書情報評価装置１が備える切替部（図示せず）により行う。

また、上述した本実施形態および変形例においては、知的財産が発明である場合について主に説明したが、例えば、一致度のスコアおよび類似度において、意匠登録または商標登録について判定するものであってもよい。

なお、本実施形態および変形例で説明した装置を構成する機能を実現するためのプログラムを、コンピュータ読み取り可能な記憶媒体に記憶して、当該記憶媒体に記憶されたプログラムをコンピュータシステムに読み込ませ、実行することにより、本実施形態の上述した種々の処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、ＯＳや周辺機器等のハードウェアを含むものであってもよい。また、「コンピュータシステム」は、ＷＷＷシステムを利用している場合であれば、ホームページ提供環境（あるいは表示環境）も含むものとする。また、「コンピュータ読み取り可能な記憶媒体」とは、フレキシブルディスク、光磁気ディスク、ＲＯＭ、フラッシュメモリ等の書き込み可能な不揮発性メモリ、ＣＤ－ＲＯＭ等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。

さらに「コンピュータ読み取り可能な記憶媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ（例えばＤＲＡＭ（ＤｙｎａｍｉｃＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ））のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク（通信網）や電話回線等の通信回線（通信線）のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記憶されているプログラムとの組合せで実現するもの、いわゆる差分ファイル（差分プログラム）であっても良い。

以上、本発明者によってなされた発明の実施形態および変形例について、図面を参照して説明してきたが、本発明は上述の実施の形態および変形例に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることは言うまでもない。

実施形態に記載された内容の一部を以下に記載する。
[付記１]
利用者が操作可能な利用者端末から入力された入力情報を前記利用者端末から取得する情報取得部と、
複数の文書情報を記憶する記憶部と、
前記入力情報を所定の構成単位に分解し、該分解された構成単位ごとに前記記憶部に記憶された複数の文書情報のうちの一の文書情報との一致度ぐあいをスコアとして算出する算出部と、
前記スコアに基づき、前記入力情報と前記文書情報との差異の程度を前記構成単位ごとに示した比較表を出力する出力部と、
前記比較表に対して、前記利用者による前記文書情報の自己評価を入力する入力部とを備える、
文書情報評価装置。
[付記２]
前記出力部は、
前記入力部により入力された自己評価の結果に応じて、前記文書情報が良好であることを示す高評価モードと良好でないことを示す低評価モードに切り替えて出力する、
ことを特徴とする[付記１]に記載の文書情報評価装置。
[付記３]
前記出力部は、
各文書情報を前記構成単位ごとに、前記高評価モードおよび前記低評価モードに切り替えて出力する、
ことを特徴とする[付記２]に記載の文書情報評価装置。
[付記４]
前記出力部は、
前記入力情報の構成単位ごとに、該入力情報と複数の前記文書情報との差異の程度を前記比較表に出力することが可能であって、
複数の前記文書情報の出力優先度は、前記構成単位ごとに算出される前記スコアが所定の基準を満たすか否かで決定する、
ことを特徴とする[付記１]乃至[付記３]のいずれか一項に記載の文書情報評価装置。
[付記５]
前記入力情報および複数の前記文書情報は知的財産に関する情報を含む、
ことを特徴とする[付記１]乃至[付記４]のいずれか一項に記載の文書情報評価装置。
[付記６]
前記算出部は、
前記自己評価を示す自己評価モードの切り替えを反映し、前記入力情報に対する前記文書情報の一致度ぐあいを再算出する、
ことを特徴とする[付記５]に記載の文書情報評価装置。
[付記７]
前記比較表に出力された前記複数の文書情報のうち、前記利用者が希望する所望の少なくとも一の文書情報をメイン文書情報として固定する文書情報固定部を、さらに備え、
前記算出部は、
前記文書情報固定部にて固定した前記メイン文書情報に基づき、前記入力情報に対する前記文書情報の一致度ぐあいを再算出する、
ことを特徴とする[付記５]または[付記６]に記載の文書情報評価装置。
[付記８]
コンピュータが、
利用者が操作可能な利用者端末から入力された入力情報を前記利用者端末から取得する情報取得ステップと、
複数の文書情報を記憶する記憶ステップと、
前記入力情報を所定の構成単位に分解し、該分解された構成単位ごとに前記記憶ステップに記憶された複数の文書情報のうちの一の文書情報との一致度ぐあいをスコアとして算出する算出ステップと、
前記スコアに基づき、前記入力情報と前記文書情報との差異の程度を前記構成単位ごとに示した比較表を出力する出力ステップと、
前記比較表に対して、前記利用者による前記文書情報の自己評価を入力する入力ステップとを備える、
文書情報評価方法。
[付記９]
コンピュータに、
利用者が操作可能な利用者端末から入力された入力情報を前記利用者端末から取得する情報取得機能と、
複数の文書情報を記憶する記憶機能と、
前記入力情報を所定の構成単位に分解し、該分解された構成単位ごとに前記記憶機能に記憶された複数の文書情報のうちの一の文書情報との一致度ぐあいをスコアとして算出する算出機能と、
前記スコアに基づき、前記入力情報と前記文書情報との差異の程度を前記構成単位ごとに示した比較表を出力する出力機能と、
前記比較表に対して、前記利用者による前記文書情報の自己評価を入力する入力機能とを実行させる、
文書情報評価プログラム。

また、第１変形例に記載された内容の一部を以下に記載する。
[付記１]
利用者が操作可能な利用者端末から入力された入力情報および複数の文書情報に含まれる文章を比較して前記入力情報と類似する先行文書情報を抽出し、前記入力情報と当該抽出された先行文書情報との類似度を評価する文書情報評価装置であって、
利用者が操作可能な利用者端末から入力された入力情報の入力を受け付ける文書情報入力部と、
前記利用者が操作可能な前記利用者端末から入力された前記入力情報に関する検索キーワードの入力を受け付ける検索キーワード入力部と、
複数の文書情報を記憶する記憶部と、
前記入力情報に含まれるキーワードおよび前記検索キーワードのうち少なくとも一方のキーワードの第１類義語情報を展開する入力を受け付ける類義語展開選択部と、
前記利用者の操作に応じて前記類義語展開選択部にて類義語展開を選択する場合、前記第１類義語情報を出力する出力部と、
前記入力情報および前記先行文書情報に含まれる文章を比較して前記入力情報との一致度をスコアとして算出する算出部と、
を備え、
前記出力部は、前記入力情報に含まれるキーワードおよび前記検索キーワードのうち少なくとも一方のキーワードの前記第1類義語情報の類義語展開の選択を複数設定できる第１情報バーを表示出力することが可能であり、
前記記憶部は、利用者独自の複数のキーワードごとの複数の第２類義語情報を有する第２類義語辞書を、前記複数の第１類義語情報を有する第１類義語辞書のキーワードと対応付けて記憶することが可能であり、
前記出力されたキーワードに対応する前記第１類義語情報から、当該キーワードに対応する少なくとも１つの第２類義語情報を削除し、または任意の第2類義語情報を追加することができる、
文書情報評価装置。
[付記２]
入力情報の評価を行うに際して、前記先行文書情報のどの部分に記載されている文章と前記入力情報を比較するか否かを選択可能とする入力を受け付ける検索文章範囲選択部と、をさらに備え、
前記出力部は、前記検索文章範囲の選択を複数設定できる第２情報バーを表示出力することを特徴とする、
[付記１]に記載の文書情報評価装置。
[付記３]
前記入力情報の技術分野に関するキーワードの入力を受け付ける技術分野入力部と、
前記入力情報の技術的特徴に関するキーワードの入力を受け付ける技術的特徴入力部と、をさらに備えることを特徴とする、
[付記１]または[付記２]に記載の文書情報評価装置。
[付記４]
コンピュータが、
利用者が操作可能な利用者端末から入力された入力情報および複数の文書情報に含まれる文章を比較して前記入力情報と類似する先行文書情報を抽出し、前記入力情報と当該抽出された先行文書情報との類似度を評価する文書情報評価方法であって、
利用者が操作可能な利用者端末から入力された入力情報を前記利用者端末から取得する情報取得ステップと、
前記利用者が操作可能な前記利用者端末から入力された前記入力情報に関する検索キーワードの入力を受け付ける検索キーワード入力ステップと、
複数の文書情報を記憶する記憶ステップと、
前記入力情報に含まれるキーワードおよび前記検索キーワードのうち少なくとも一方のキーワードの第１類義語情報を展開する入力を受け付ける類義語展開選択ステップと、
前記利用者の操作に応じて前記類義語展開選択部にて類義語展開を選択する場合、前記第１類義語情報を出力する出力ステップと、
前記入力情報および前記先行文書情報に含まれる文章を比較して前記入力情報との一致度をスコアとして算出する算出ステップと、
を備え、
前記出力ステップは、前記入力情報に含まれるキーワードおよび前記検索キーワードのうち少なくとも一方のキーワードの前記第1類義語情報の類義語展開の選択を複数設定できる第１情報バーを表示出力することが可能であり、
前記記憶ステップは、利用者独自の複数のキーワードごとの複数の第２類義語情報を有する第２類義語辞書を、前記複数の第１類義語情報を有する第１類義語辞書のキーワードと対応付けて記憶することが可能であり、
前記出力されたキーワードに対応する前記第１類義語情報から、当該キーワードに対応する少なくとも１つの第２類義語情報を削除し、または任意の第2類義語情報を追加することができる、
文書情報評価方法。
[付記５]
コンピュータに、
利用者が操作可能な利用者端末から入力された入力情報および複数の文書情報に含まれる文章を比較して前記入力情報と類似する先行文書情報を抽出し、前記入力情報と当該抽出された先行文書情報との類似度を評価する文書情報評価プログラムであって、
利用者が操作可能な利用者端末から入力された入力情報を前記利用者端末から取得する情報取得機能と、
前記利用者が操作可能な前記利用者端末から入力された前記入力情報に関する検索キーワードの入力を受け付ける検索キーワード入力機能と、
複数の文書情報を記憶する記憶機能と、
前記入力情報に含まれるキーワードおよび前記検索キーワードのうち少なくとも一方のキーワードの第１類義語情報を展開する入力を受け付ける類義語展開選択機能と、
前記利用者の操作に応じて前記類義語展開選択部にて類義語展開を選択する場合、前記第１類義語情報を出力する出力機能と、
前記入力情報および前記先行文書情報に含まれる文章を比較して前記入力情報との一致度をスコアとして算出する算出機能と、
を実行させ、
前記出力機能は、前記入力情報に含まれるキーワードおよび前記検索キーワードのうち少なくとも一方のキーワードの前記第1類義語情報の類義語展開の選択を複数設定できる第１情報バーを表示出力することが可能であり、
前記記憶機能は、利用者独自の複数のキーワードごとの複数の第２類義語情報を有する第２類義語辞書を、前記複数の第１類義語情報を有する第１類義語辞書のキーワードと対応付けて記憶することが可能であり、
前記出力されたキーワードに対応する前記第１類義語情報から、当該キーワードに対応する少なくとも１つの第２類義語情報を削除し、または任意の第2類義語情報を追加することができる、
文書情報評価プログラム。

また、第２変形例に記載された内容の一部を以下に記載する。
[付記１]
利用者が操作可能な利用者端末から入力された入力情報および先行文書情報に含まれる文章を比較して前記入力情報と類似する先行文書情報を抽出し、前記入力情報と当該抽出された先行文書情報との類似度を評価する文書情報評価装置であって、
利用者が操作可能な利用者端末から入力された入力情報の入力を受け付ける文書情報入力部と、
複数の先行文書情報を記憶する記憶部と、
前記入力情報の第１技術分類を決定する決定部と、
前記入力情報および前記先行文書情報に含まれる文章を比較して前記入力情報との一致度をスコアとして算出する算出部と、
前記スコアに基づき、前記入力情報と前記文書情報との差異の程度を構成単位ごとに示した比較表を出力する出力部と、
前記スコアに基づき、権利取得の可能性を判定する判定部と、
前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、権利取得の可能性を向上させた追加情報を生成する生成部と、
を備え、
前記出力部は、前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、前記決定部にて決定した前記第１技術分類と異なる第２技術分類を用いて先行文書情報の出力を行い、
前記生成部は、当該先行文書情報および前記入力情報に含まれる文章の比較を行い、当該先行文書情報と前記入力情報との差分を構成する文書情報に基づき追加情報を生成する、
文書情報評価装置。
[付記２]
前記第２技術分類を選択する選択部をさらに備え、
前記選択部は、
前記決定部にて決定した前記第１技術分類に関する前記先行文書情報に対応付けられた従来技術情報に付与されている技術分類を前記第２技術分類として選択する、
ことを特徴とする[付記２]に記載の文書情報評価装置。
[付記３]
前記生成部は、前記第２技術分類を用いて出力した前記先行文書情報に存在し、前記入力情報に存在しない文章を前記追加情報として生成する
ことを特徴とする[付記１]または[付記２]に記載の文書情報評価装置。
[付記４]
前記出力部は、前記入力情報を構成単位ごとに分解して出力することが可能であり、
前記生成部は、前記構成単位を構成する複数の単語に存在しない単語を前記追加情報として生成する、
ことを特徴とする[付記１]～[付記３]のいずれか一項に記載の文書情報評価装置。
[付記５]
前記表示部は、評価された前記文書情報を、特許マップとして表示出力する表示部を、さらに備える、
ことを特徴とする[付記１]～[付記４]のいずれか一項に記載の文書情報評価装置。
[付記６]
利用者が操作可能な利用者端末から入力された入力情報および先行文書情報に含まれる文章を比較して前記入力情報と類似する先行文書情報を抽出し、前記入力情報と当該抽出された先行文書情報との類似度を評価する文書情報評価方法であって、
コンピュータが、
利用者が操作可能な利用者端末から入力された入力情報の入力を受け付ける文書情報入力ステップと、
複数の先行文書情報を記憶する記憶ステップと、
前記入力情報の第１技術分類を決定する決定ステップと、
前記入力情報および前記先行文書情報に含まれる文章を比較して前記入力情報との一致度をスコアとして算出する算出ステップと、
前記スコアに基づき、前記入力情報と前記文書情報との差異の程度を構成単位ごとに示した比較表を出力する出力ステップと、
前記スコアに基づき、権利取得の可能性を判定する判定ステップと、
前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、権利取得の可能性を向上させた追加情報を生成する生成ステップと、
を備え、
前記出力ステップは、前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、前記決定ステップにて決定した前記第１技術分類と異なる第２技術分類を用いて先行文書情報の出力を行い、
前記生成ステップは、当該先行文書情報および前記入力情報に含まれる文章の比較を行い、当該先行文書情報と前記入力情報との差分を構成する文書情報に基づき追加情報を生成する、
文書情報評価方法。
[付記６]
利用者が操作可能な利用者端末から入力された入力情報および先行文書情報に含まれる文章を比較して前記入力情報と類似する先行文書情報を抽出し、前記入力情報と当該抽出された先行文書情報との類似度を評価する文書情報評価プログラムであって、
コンピュータに、
利用者が操作可能な利用者端末から入力された入力情報の入力を受け付ける文書情報入力機能と、
複数の先行文書情報を記憶する記憶機能と、
前記入力情報の第１技術分類を決定する決定機能と、
前記入力情報および前記先行文書情報に含まれる文章を比較して前記入力情報との一致度をスコアとして算出する算出機能と、
前記スコアに基づき、前記入力情報と前記文書情報との差異の程度を構成単位ごとに示した比較表を出力する出力機能と、
前記スコアに基づき、権利取得の可能性を判定する判定機能と、
前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、権利取得の可能性を向上させた追加情報を生成する生成機能と、
を実行させ、
前記出力機能は、前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、前記決定機能にて決定した前記第１技術分類と異なる第２技術分類を用いて先行文書情報の出力を行い、
前記生成機能は、当該先行文書情報および前記入力情報に含まれる文章の比較を行い、当該先行文書情報と前記入力情報との差分を構成する文書情報に基づき追加情報を生成する、
文書情報評価プログラム。

１文書情報評価装置
２利用者端末
１０１情報取得部
１０２記憶部
１０３算出部
１０４出力部
１０５入力部
１１５自己評価モード切り替えスイッチ
１１５ａ「いいね！」機能
１１５ｂ「ダメだね！」機能
１０６固定スイッチ
１０７入力ボックス
１０８特定スイッチ
１０９検索イッチ
１００比較表
２００表示画面
ＮＷネットワーク
１１ＣＰＵ
１２ＲＡＭ
１３ＲＯＭ
１４タッチパネル
１５通信Ｉ／Ｆ
３０１文章情報入力部
４０１決定部
４０２判定部
４０３生成部

Claims

利用者が操作可能な利用者端末から入力された入力情報および先行文書情報に含まれる文章を比較して前記入力情報と類似する先行文書情報を抽出し、前記入力情報と当該抽出された先行文書情報との類似度を評価する文書情報評価装置であって、
利用者が操作可能な利用者端末から入力された入力情報の入力を受け付ける文書情報入力部と、
複数の先行文書情報を記憶する記憶部と、
前記入力情報の第１技術分類を決定する決定部と、
前記決定部にて決定した前記第１技術分類と異なる第２技術分類を選択する選択部と、
前記入力情報および前記先行文書情報に含まれる文章を比較して前記入力情報との一致度をスコアとして算出する算出部と、
前記スコアに基づき、前記入力情報と前記文書情報との差異の程度を構成単位ごとに示した比較表を出力する出力部と、
前記スコアに基づき、権利取得の可能性を判定する判定部と、
前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、権利取得の可能性を向上させた追加情報を生成する生成部と、
を備え、
前記選択部は、前記決定部にて決定した前記第１技術分類に関する前記先行文書情報に対応付けられた従来技術情報に付与されている技術分類を前記第２技術分類として選択し、
前記出力部は、前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、前記第２技術分類が含まれる先行文書情報の出力を行い、
前記生成部は、出力した前記第２技術分類が含まれる先行文書情報に存在し、前記入力情報に存在しない文書情報を前記追加情報として生成する、
文書情報評価装置。
前記出力部は、前記入力情報を構成単位ごとに分解して出力することが可能であり、
前記生成部は、前記構成単位を構成する複数の単語に存在しない単語を前記追加情報として生成する、
ことを特徴とする請求項１に記載の文書情報評価装置。
評価された前記文書情報を、ＩＰＣ、ＦＩを含む技術分類、またはキーワード、熟語を含む単語ごとに分類し、分類した結果を特許マップとして表示出力する表示部を、さらに備える、
ことを特徴とする請求項１または２に記載の文書情報評価装置。
利用者が操作可能な利用者端末から入力された入力情報および先行文書情報に含まれる文章を比較して前記入力情報と類似する先行文書情報を抽出し、前記入力情報と当該抽出された先行文書情報との類似度を評価する文書情報評価方法であって、
コンピュータが、
利用者が操作可能な利用者端末から入力された入力情報の入力を受け付ける文書情報入力ステップと、
複数の先行文書情報を記憶する記憶ステップと、
前記入力情報の第１技術分類を決定する決定ステップと、
前記決定ステップにて決定した前記第１技術分類と異なる第２技術分類を選択する選択ステップと、
前記入力情報および前記先行文書情報に含まれる文章を比較して前記入力情報との一致度をスコアとして算出する算出ステップと、
前記スコアに基づき、前記入力情報と前記文書情報との差異の程度を構成単位ごとに示した比較表を出力する出力ステップと、
前記スコアに基づき、権利取得の可能性を判定する判定ステップと、
前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、権利取得の可能性を向上させた追加情報を生成する生成ステップと、
を実行し、
前記選択ステップでは、前記決定ステップにて決定した前記第１技術分類に関する前記先行文書情報に対応付けられた従来技術情報に付与されている技術分類を前記第２技術分類として選択し、
前記出力ステップでは、前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、前記決定ステップにて決定した前記第１技術分類と異なる第２技術分類が含まれる先行文書情報の出力を行い、
前記生成ステップでは、出力した前記第２技術分類が含まれる先行文書情報に存在し、前記入力情報に存在しない文書情報を前記追加情報として生成する、
文書情報評価方法。
利用者が操作可能な利用者端末から入力された入力情報および先行文書情報に含まれる文章を比較して前記入力情報と類似する先行文書情報を抽出し、前記入力情報と当該抽出された先行文書情報との類似度を評価する文書情報評価プログラムであって、
コンピュータに、
利用者が操作可能な利用者端末から入力された入力情報の入力を受け付ける文書情報入力機能と、
複数の先行文書情報を記憶する記憶機能と、
前記入力情報の第１技術分類を決定する決定機能と、
前記決定機能にて決定した前記第１技術分類と異なる第２技術分類を選択する選択機能と、
前記入力情報および前記先行文書情報に含まれる文章を比較して前記入力情報との一致度をスコアとして算出する算出機能と、
前記スコアに基づき、前記入力情報と前記文書情報との差異の程度を構成単位ごとに示した比較表を出力する出力機能と、
前記スコアに基づき、権利取得の可能性を判定する判定機能と、
前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、権利取得の可能性を向上させた追加情報を生成する生成機能と、
を実現させ、
前記出力機能は、前記利用者の前記入力情報に係る権利取得の前記可能性に応じて、前記決定機能にて決定した前記第１技術分類と異なる第２技術分類が含まれる先行文書情報の出力を行い、
前記生成機能は、出力した前記第２技術分類が含まれる先行文書情報に存在し、前記入力情報に存在しない文書情報を前記追加情報として生成する、
文書情報評価プログラム。