JP2021504818A

JP2021504818A - 基礎ナレッジ・グラフへの重ね合わせによるインコヒーレント・ノードの構造化

Info

Publication number: JP2021504818A
Application number: JP2020528387A
Authority: JP
Inventors: ウーヴェシャイデラー、ティム; ラヴィッツァ、ステファン; ジョバンニーニ、アンドレア; ハッシャジ、アヴディル; ストレイト、シモン; グラフ、フロリアン
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2017-11-27
Filing date: 2018-11-23
Publication date: 2021-02-15
Also published as: US20190163835A1; US10740398B2; GB202009501D0; DE112018005244T5; CN111386520A; GB2581761A; WO2019102411A1

Abstract

ナレッジ・グラフを作成するためのコンピュータ・プログラム製品、システムおよび方法が、複数の新規ノードを受け取ることと、既存エッジによって選択的に接続された既存ノードを有する基礎ナレッジ・グラフを受け取ることと、上記基礎ナレッジ・グラフの上記既存ノードのうちの選択されたノードに上記新規ノードを重ね合わせることとを含み得る。この方法は、下にある上記基礎ナレッジ・グラフ内の対応する既存ノードがゼロまたは所定最大数の既存エッジを介した接続を有する場合に上記新規ノードのうちの少なくとも２つのノード間に、新規の重みを有する新規エッジを作成することによって上記新規ノードを接続することであって、上記新規の重みが対応する上記既存ノード間の接続の上記既存エッジの既存の重みに基づいて決定される、上記接続することと、上記基礎ナレッジ・グラフから上記新規ノードを上記新規エッジとともに切り離すこととをさらに含み得る。

Description

本発明は、一般には、ナレッジ・グラフを作成するためのシステム、コンピュータ・プログラム製品および方法に関し、より詳細には、非構造化情報エンティティからのナレッジ・グラフの自動作成に関する。

情報の管理は、知識社会／知識産業における重要な活動である。情報は、構造化情報またはいわゆる非構造化情報である場合があり、それぞれのトランザクションまたはコラボレーション・システムがアクセス可能な電子ストレージ・システム内で管理されることができ、または情報は、非電子的形態、例えば手書きまたは音声で新たに生成され得る。

情報の非構造化エンティティは、異なる様々な状況、例えば、参加者が、ある構想を念頭に置いたブレインストーミングと、あらゆる異なる側面に関する付箋の書き込みとを使用するワークショップ、特にデザイン思考ワークショップにおいて生成されることがある。非構造化エンティティの別の発生源としては、特に、スプリントと呼ばれる４週間のサイクルと、１５分間のスタンドアップ・ミーティングと、参加者全員が「うまくいったこと」、「改善の余地があること」およびその他の行動項目について参加者のアイデアを付箋に書くことができるスプリント・レトロスペクティブ・ミーティングとを使用する、ＳＣＲＵＭ法を使用したソフトウェア・プロジェクトにおけるプロジェクト管理のためのアジャイル手法がある。非構造化エンティティのその他の発生源としては、ソーシャル・メディア・ツール、ブログ、電話会議の覚え書き、および関連メッセージ交換などがある。

しかしながら、組織的枠組みがなければ、上記のような付箋およびその他の手書きメッセージは、単独の相関関係のない情報エンティティであり、これは入力の前処理（すなわち、上記の例のうちの最初の例の場合の付箋、スキャン、および文字認識、後の例の場合の文字認識）の後は変化しない。しかし、ユーザには、それぞれが内容（例えば、参加者のテキスト投稿）とメタデータ（例えば参加者、タイムスタンプ）とを含む相関性のない１組の情報が残される。

共通する課題は、要約を自動的に生成することができ、または結論を引き出すことができ、あるいはその両方ができるような方式で、情報のエンティティを編成し、提示することであり、これは、チームにとって、チーム全体がトピックをよりよく理解することができて、具体的な結果に焦点を合わせられ、きわめて有用であろう。

現在、手作業による手法がとられており、これには必然的な欠点がある。第１に、情報のすべてのエンティティをグループ化するのは面倒で時間がかかり、特にコストがかかる。第２に、グループ化するためのカテゴリの選択が人の個人的見解によって決まる可能性があり、したがってある程度、恣意的である。エンティティのサブセットのためにカテゴリが選択された後は、別のサブセットのエンティティについてそれらのカテゴリが適合しない場合、最初からやり直すのは気が進まない場合がある。

現在の手法は、程度の差こそあれ「スタンドアロン」であり、すなわち、情報の一貫性のないエンティティを相関させるために一般的知識を使うことができない場合がある。したがって、この限界を克服する方法およびシステム、具体的には、相関性のない情報、すなわち「付箋」を、より把握が容易な方式で互いに関係付ける方法およびシステムが必要である。

したがって、当技術分野では上記の問題に対処する必要がある。

第１の観点から見ると、本発明は、ナレッジ・グラフを作成するためのコンピュータ実装方法であって、コンピュータ・システムのプロセッサによって、複数の新規ノードを受け取る第１の受け取ることと、上記プロセッサによって、既存の重みを各エッジが有する既存エッジによって選択的に接続された既存ノードを含む基礎ナレッジ・グラフを受け取る第２の受け取ることと、上記プロセッサによって、上記基礎ナレッジ・グラフの上記既存ノードのうちの選択されたノードに上記複数の新規ノードを重ね合わせ、新規ノードと対応する既存ノードとの対を形成することと、上記プロセッサによって、下にある上記基礎ナレッジ・グラフ内の対応する既存ノードがゼロまたは所定最大数の既存エッジを介した接続を有する場合に、上記複数の新規ノードのうちの少なくとも２つのノード間に新規の重みを有する新規エッジを形成することによって上記複数の新規ノードを接続することであって、上記新規の重みが上記対応する既存ノード間の接続の上記既存エッジの上記既存の重みに基づいて決定される、上記接続することと、上記プロセッサによって、上記基礎ナレッジ・グラフから上記複数の新規ノードを上記新規エッジとともに結果のナレッジ・グラフとして切り離すこととを含む方法を提供する。

他の観点から見ると、本発明は、プロセッサと、上記プロセッサに結合されたメモリ・デバイスと、上記プロセッサに結合され、ナレッジ・グラフを作成する方法を実装するために上記メモリ・デバイスを介して上記プロセッサによって実行可能なプログラム・コードを含むコンピュータ可読記憶装置とを含むシステムであって、上記方法は、コンピュータ・システムのプロセッサによって、複数の新規ノードを受け取る第１の受け取ることと、上記プロセッサによって、既存の重みを各エッジが有する既存エッジによって選択的に接続された既存ノードを含む基礎ナレッジ・グラフを受け取る第２の受け取ることと、上記プロセッサによって、上記基礎ナレッジ・グラフの上記既存ノードのうちの選択されたノードに上記複数の新規ノードを重ね合わせ、新規ノードと対応する既存ノードとの対を形成することと、上記プロセッサによって、下にある上記基礎ナレッジ・グラフ内の対応する既存ノードがゼロまたは所定最大数の既存エッジを介した接続を有する場合に、上記複数の新規ノードのうちの少なくとも２つのノード間に新規の重みを有する新規エッジを形成することによって上記複数の新規ノードを接続することであって、上記新規の重みが上記対応する既存ノード間の接続の上記既存エッジの上記既存の重みに基づいて決定される、上記接続することと、上記プロセッサによって、上記基礎ナレッジ・グラフから上記複数の新規ノードを上記新規エッジとともに結果のナレッジ・グラフとして切り離すこととを含む、システムを提供する。

他の観点から見ると、本発明は、ナレッジ・グラフを作成するためのコンピュータ・プログラム製品であって、処理回路によって読み取り可能であり、本発明のステップを実行するために上記処理回路による実行のための命令を記憶する、コンピュータ可読記憶媒体を含む、コンピュータ・プログラム製品を提供する。

他の観点から見ると、本発明は、コンピュータ可読媒体に記憶され、デジタル・コンピュータの内部メモリにロード可能なコンピュータ・プログラムであって、コンピュータ上で実行されると本発明のステップを実行するためのソフトウェア・コード部分を含む、コンピュータ・プログラムを提供する。

ナレッジ・グラフを作成するための方法、システム、コンピュータ・プログラム製品およびコンピュータ・プログラムが提供される。コンピューティング・システムのプロセッサが、複数の新規ノードと、既存のエッジの各エッジが既存の重みを有する既存エッジによって選択的に接続された既存ノードを含む基礎ナレッジ・グラフとを受け取る。複数の新規ノードは、基礎ナレッジ・グラフの既存のノードのうちの選択されたノードに重ね合わされて、新規ノードと対応する既存ノードとの対を形成する。下にある基礎ナレッジ・グラフ内の対応する既存ノードがゼロまたは所定最大数の既存エッジを介した接続を有する場合、複数の新規ノードは、複数の新規ノードのうちの少なくとも２つのノードの間に新規の重みを有する新規エッジを作成することによって接続され、新規の重みは、対応する既存ノード間の接続の既存エッジの既存の重みに基づいて決定される。複数の新規ノードは、結果のナレッジ・グラフとして、基礎ナレッジ・グラフから新規エッジとともに切り離される。

以下、本発明の実施形態について、例示のみを目的として添付図面を参照しながら説明する。

図１は、本発明の実施形態による、ナレッジ・グラフを作成する方法のフローチャートを示す図である。図２は、本発明の実施形態による、図１の方法の代替方法のフローチャートを示す図である。図３は、本発明の実施形態による、基礎ナレッジ・グラフおよび関連インコヒーレント・ノードのグラフ表現を示す図である。図４は、本発明の実施形態による、結果のナレッジ・グラフのリンク／エッジが追加された関連インコヒーレント・ノードを有する基礎ナレッジ・グラフのグラフ表現を示す図である。図５は、本発明の実施形態による、基礎ナレッジ・グラフと結果のナレッジ・グラフとのグラフ表現であって、エッジの重みも示すグラフ表現を示す図である。図６は、本発明の実施形態による、結果のナレッジ・グラフの他のグラフ表現を示す図である。図７は、本発明の実施形態による、ノードのスコアを有する結果のナレッジ・グラフのグラフ表現を示す図である。図８は、本発明の実施形態による、クラスタの中心の可能な候補の第１のグラフ表現を示す図である。図９は、本発明の実施形態による、クラスタの中心の可能な候補の第２のグラフ表現を示す図である。図１０は、本発明の実施形態による、結果のナレッジ・グラフを作成するためのシステムのコンポーネント・モデルのブロック図を示す図である。図１１は、本発明の実施形態による、コンピューティング・システムのブロック図を示す図である。

本発明の一態様によると、ナレッジ・グラフを作成する方法を提供することができる。この方法は、複数の新規ノードを受け取ることと、各エッジが既存の重みを有する既存エッジによって選択的に接続された既存ノードを含む基礎ナレッジ・グラフを受け取ることと、基礎ナレッジ・グラフの既存ノードのうちの選択された既存ノードに新規ノードを重ね合わせて、新規ノードと対応する既存ノードとの対を形成することとを含む。

この方法は、下にある基礎ナレッジ・グラフ内の対応する既存ノードがゼロまたは所定最大数の既存エッジを介した接続を有する場合に、新規ノードのうちの少なくとも２つの新規ノード間に新規の重みを有する新規エッジを作成することによって新規ノードを接続することであって、新規の重みが、対応する既存ノード間の接続の既存エッジの既存の重みに基づいて決定される、新規ノードを接続することと、新規ノードを新規エッジとともに結果のナレッジ・グラフとして基礎ナレッジ・グラフから切り離すこととをさらに含む。

本発明の別の態様によると、ナレッジ・グラフを作成するためのシステムを提供することができる。このシステムは、複数の新規ノードを受け取るようになされた第１の受信ユニットと、既存エッジのそれぞれが既存の重みを有する既存のエッジによって選択的に接続された既存ノードを含む基礎ナレッジ・ブラフを受け取るようになされた第２の受信ユニットと、基礎ナレッジ・グラフの既存のノードのうちの選択されたノードに上記新規ノードを重ね合わせて新規ノードと対応する既存ノードとの対を形成するようになされた重ね合わせモジュールとを含み得る。

さらに、このシステムは、下にある基礎ナレッジ・グラフ内の対応する既存ノードがゼロまたは所定最大数の既存エッジを介した接続を有する場合、新規ノードのうちの２つの新規ノード間に新規の重みを有する新規エッジを作成することによって新規ノードを接続するようになされたリンク・エンジンであって、新規の重みが対応する既存ノード間の接続の既存エッジの既存の重みに基づいて決定される、上記リンク・エンジンと、結果のナレッジ・グラフとして、基礎ナレッジ・グラフから新規ノードを新規エッジとともに切り離すようになされた切り離しユニットとを含むことができる。

ナレッジ・グラフを作成するための提案の方法は、複数の利点と技術的効果を提供し得る。

本発明の例示の実施形態は、既存のナレッジ・グラフの構造を利用して情報の新規エンティティを構造化することができる。新規エンティティは、ナレッジ・グラフ内の位置にまだ割り当てられていない可能性があるノードであるということができる。これらのいわゆるインコヒーレント・ノードは、それらの元々はインコヒーレントであったノードをエッジ（すなわち相互関係またはリンク）によって関係付けるために、内容マッチング法を使用して既存ナレッジ・グラフのノードに関係付けることができる。

ただし、インコヒーレント・ノードを組み込まずに、既存ナレッジ・グラフにおける知識に基づいて、インコヒーレント・ノードを重ね合わせ、次いでインコヒーレント・ノード間にエッジを付加することによって、既存ナレッジ・グラフは変化しないままで（すなわち、インコヒーレント・ノードは既存ナレッジ・グラフに組み込まれない）、既存ナレッジ・グラフの構造に沿って新規のナレッジ・グラフを作成することができる。したがって、新規ナレッジ・グラフのソート、構造化および編成は、既存ナレッジ・グラフとの強い相関を有し得るが、最終的には、既存ナレッジ・グラフとは完全に独立した新規ナレッジ・グラフの存在内にあり得る。しかしながら、既存ナレッジ・グラフ内に抽出されていた知識と経験とは、新たに作成されたナレッジ・グラフにも反映され得る。

したがって、様々な発生源、具体的には、ブレインストーミング会議、開発会議、プロジェクト会議、個人の覚え書き、ブログおよびソーシャル・メディア・ツールへの投稿などからの情報の新規エンティティを、既存ナレッジ・グラフによって表された固有の知識を使用するが、既存ナレッジ・グラフには依存せずに、編成することができる。新規ナレッジ・グラフは、情報エンティティ、具体的には元々はインコヒーレントであったノードおよび関係（すなわちそれらのノード間にエッジが作成されている）のみを反映することができる。結果の新規ナレッジ・グラフは、主観的偏向もなくすることができる。

以下では、本発明の他の実施形態について説明する。

方法の例示の一実施形態によると、ノードの重ね合わせは、新規ノードの内容を基礎ナレッジ・グラフの既存ノードの内容にマッピングするために認知コンピューティング法を使用することができる。したがって、既存ノードに最適な方式で内容的にまたは意図の点で関連する新規ノードを、対を形成するために使用することができる。このようにして、２つの異なる新規ノードが同じ既存ノードにマップされることができないように保証することもできる。また、新規ノードを既存ノードと突き合わせる最も単純な方式は、キーワードに基づく方式とすることができることもわかるであろう。

方法の例示の一実施形態によると、情報エンティティの一部を認知エンジンによる処理のために利用可能な新規ノードの作成源とするために、複数の新規ノードの各ノードが、タイプされた記録または手書きの記録のスキャン、手書き文字認識および変換、スピーチ・ツー・テキスト変換、または同様の技術によって得られる、少なくとも部分的にテキストの形態の内容を含むことができる。

方法の例示の一実施形態によると、新規ノードのうちの２つの新規ノード間の新規エッジの重みが、既存ナレッジ・グラフの２つの対応するノード間の最短接続を形成するエッジの数によって決定され得る。したがって、作成されるナレッジ・グラフの新たに作成されたエッジも重みを有し得る。新たに作成されたエッジに重み付けするための異なる選択肢もあり得、基礎ナレッジ・グラフの編成も反映することができる。

したがって、方法の別の例示の一実施形態によると、新規ノードのうちの２つの新規ノード間の新規エッジの重みが、既存ナレッジ・グラフの２つの対応するノード間の最短の接続を形成するエッジの数の逆数値によって決定され得る。

また、方法のさらに他の例示の実施形態によると、新規ノードのうちの２つの新規ノード間の新規エッジの重みが、既存ナレッジ・グラフの２つの対応するノード間の最短の接続を形成するエッジの重みの和の逆数値によって決定され得る。当業者は、重み因子を作成するための他の技法（例えば、新規エッジの新規の重み因子を導出するために既存ノードの既存の重みに、選択された数学関数を適用することによって、上記の重み付け技法の組合せを使用するなど）も定義することができるであろう。

さらに他の例示の実施形態によると、方法は、新規ノードにスコア、具体的にはスコア値を割り当てることも含み得る。このようにして、重要度の異なる値を結果のナレッジ・グラフの新規ノードに割り当てることができる。スコア値は、新規ノードのクラスタ化のために使用することができる。

値、具体的には重み、スコアなどを割り当てるが、説明を簡単にするために「重み付けする」という表現は、重み因子の意味を有する数値をエッジなどに割り当てることができることを示し得ることはわかるであろう。同じことは、スコアおよび関連するスコア数値にも当てはまる。

方法の例示の一実施形態によると、スコア、具体的にはスコア値は、新規ノードに接続するエッジの重みの和として決定され得る。したがって、新規ノードが有するエッジが多いほど、その新規ノードのスコア値が高くなり得る。方法の別の例示の実施形態によると、スコアは、新規ノードに接続するエッジの数として決定され得る。したがって、新規ノードのスコア値を作成するいくつかの異なる方式が存在し得る。

追加の例示の一実施形態によると、方法は、結果のナレッジ・グラフにおいて、クラスタ、具体的には少なくとも１つのクラスタを作成することも含むことができる。このようにして、より容易かつ迅速に利用することができるように、同じ主題の異なる側面の集合をグループ化することができる。クラスタの中心を見つける異なる選択肢も利用可能である。

方法の他の例示の実施形態によると、クラスタの中心は、他の新規ノードへの直接エッジの数が最も多い新規ノードとすることができるか、または方法の別の例示の実施形態によると、クラスタの中心は、所定の閾値を上回るノード・スコアを有する新規ノードとすることができる。所定の閾値は、クリップ・レベルの同義語として使用されることがある。また、新規ノードをクラスタ中心と定義するために他の技法も使用可能であることはわかるであろう。

したがって、方法の別の例示の実施形態によると、クラスタの名前はクラスタの中心の名前と同じであってもよく、これはクラスタの名前を定義する簡単な手法となり得る。より包括的な手法も使用可能である。

また、実施形態は、コンピュータまたは任意の命令実行システムによって、またはそれらとともに使用するためのプログラム・コードを提供するコンピュータ使用可能媒体またはコンピュータ可読媒体からアクセス可能な、関連コンピュータ・プログラム製品の形態をとってもよい。説明のために、コンピュータ使用可能媒体またはコンピュータ可読媒体とは、命令実行システム、装置またはデバイスによって、またはそれらとともに使用するためのプログラムを記憶、伝達、伝播または伝送する手段を含み得る、任意の装置とすることができる。

本明細書の文脈では、以下の表記、用語または表現あるいはその組合せを使用することがある。「ナレッジ・グラフ」という用語は、情報エンティティのグループ内の構造を意味し得る。ナレッジ・グラフの中核ビルディング・ブロックは、情報を含むノードと、選択された異なるノード間にリンクを形成するエッジとすることができる。エッジは、２つのノード間の関係の強度値を定義する重みまたは重み因子を有することができる。さらに、ノードは、ノードの内容の何らかの重要性を表すスコアまたはスコア値も有することができる。

「新規ノード」という用語は、本明細書の文脈では、新規ナレッジ・グラフのビルディング・ブロックの１つとみなされるエンティティとして示される、１つの情報を意味し得る。新規ノードは、少なくとも部分的に、何らかの文字での情報を含み得る。最初は、新規ノードは、エッジを介して連結されなくてもよい。新規エッジは、この方法のプロセスの一部として作成することができる。新規ノードは、本明細書の文脈ではインコヒーレント・ノードとも称することがある。

「基礎ナレッジ・グラフ」という用語は、既存ノードと、既存エッジとを含み、既存エッジが、割り当てられた既存の重みを有する、既存ナレッジ・グラフを意味し得る。基礎ナレッジ・グラフは、大きさ、具体的には既存ノードおよび既存エッジの数が、新たに作成されるナレッジ・グラフよりもはるかに大きい場合がある。例えば、１００倍、１０，０００倍、またはさらに１，０００，０００以上となることがある。

「エッジ」という用語は、ナレッジ・グラフのノード間の接続またはリンクを意味し得る。ノードが典型的には、内容が内部に含まれる四角、円、または楕円あるいはこれらの組合せとして提示される場合、エッジは典型的にはそれらのノード間の線として提示される。エッジには、関連ノードの内容間の相互関係の強度を表す重み因子を割り当てることができる。

「重み」または重み因子という用語は、例えば、ナレッジ・グラフの２つのノード間の関係、リンク、またはエッジの相対強度を表す数値を意味し得る。

「重ね合わせ」という用語は、既存ナレッジ・グラフの既存ノードの上に新規ノードを論理的に配置することを意味し得る。したがって、新規ノードと既存ノードとの複数の対を作成することができる。重ね合わせは、ノードの情報の意味に基づき得る（すなわち内容、意図または題目に基づく）。題目または見出し語、キーワード、または場合によっては、キャッチワードは、１組の関連する辞書または事典のエントリがその下に記載され得る単語とすることができる。

「クラスタ」という用語は、相互に関連する項目、この場合は新規ノードのグループを意味し得る。新規ノードをある特定のクラスタに関係付けるために、新規ノード間の関連エッジの特定の強度または重みをとることができる。クラスタは中心を有し得る。クラスタの中心を定義するための異なる方法が存在し得る。

図１に、本発明の実施形態による、ナレッジ・グラフを作成する方法１００のフローチャートを示す。この方法は、複数の新規ノードを受け取るステップ１０２を含み得る。ステップ１０４で、エッジのうちのそれぞれ１つのエッジが既存の重みと重ね合わせとを有する、既存エッジによって選択的に接続された既存ノードを含む基礎ナレッジ・グラフを受け取る。ステップ１０６で、基礎ナレッジ・グラフの既存ノードのうちの選択されたノードの上に新規ノードを重ね合わせて、新規ノードと対応する既存ノードとの対を作成する。

さらに、方法１００は、下にある基礎ナレッジ・グラフ内の対応する既存ノードがゼロまたは所定最大数の既存エッジを介した接続を有する場合、新規ノードのうちの少なくとも２つの新規ノードの間に新規の重み、具体的には新規重み値を有する新規エッジを作成することによって新規ノードを接続するステップ１０８を含むことができ、新規の重みは対応する既存ノード間の接続の既存エッジの既存の重みに基づいて決定される。ステップ１１０で、基礎ナレッジ・グラフから新規ノードを新規エッジとともに結果のナレッジ・グラフとして切り離す。

図２に、本発明の実施形態による、図１の方法の代替方法２００のフローチャートを示す。まず、ステップ２０２で、インコヒーレント・ノードを比較可能な形式で作成するために、エンティティの、スキャンまたは文字認識あるいはその両方などの前処理を行う。これらの方法は、ワークショップの手書き出力に対して行ってもよい。また、ディスカッションを処理し、情報エンティティを作成するために、スピーチ・ツー・テキスト変換および音声認識を使用してもよい。次に、ステップ２０４で、インコヒーレント・ノードのそれぞれの内容または意図を判断することができる。このために、１つまたは複数の既存ナレッジ・グラフ、タクソノミーまたは辞書あるいはその組合せとともに、内容解釈のための認知コンピューティング・アルゴリズムを使用してもよく、これは知られている技法によって行うことができる。

このために、方法は、２つの選択可能な手法を使用してもよい。まず、ステップ２０６で、基礎ナレッジ・グラフのノードの全部またはサブセットの内容／意図を判断し、ステップ２０８で、各インコヒーレント・ノードの意図の、基礎ナレッジ・グラフのノードの判断された意図とのベスト・マッチ（ファジー・マッチ）を判断する。インコヒーレント・ノードのセットと比較して基礎ナレッジ・グラフ内のノードがはるかに多いため、この処理は、この方法の他のステップと比べた場合、比較的多くの演算時間および演算能力を必要とする。

別の方法として、ステップ２１０で、基礎ナレッジ・グラフのノードの名前、具体的には既存の名前を使用して、各インコヒーレント・ノードの内容／意図のベスト・マッチ（例えばファジー・マッチ）を判断する。

ステップ２１２で、選択されたベスト・マッチに従って基礎ナレッジ・グラフにインコヒーレント・ノードを重ね合わせる。次に、ステップ２１４で、インコヒーレント・ノードのメタデータ（例えば作成者名、時刻）も使用して基礎ナレッジ・グラフの既存の連結を使用することによって、インコヒーレント・ノード間にエッジを作成する。また、ステップ２１６で、新規に作成されたナレッジ・グラフのクラスタ、具体的には少なくとも１つのクラスタと、クラスタの命名とを特定する。ステップ２１８で、結果のナレッジ・グラフをユーザに提示するための形態に変換する（例えば、グラフィックで表示可能な形態への変換）。

図３は、本発明の実施形態による、基礎ナレッジ・グラフと関連インコヒーレント・ノード３０４、３０６、３０８のグラフ表現３００である。図中の円と、円の間の線とは、基礎ナレッジ・グラフ３０２のノードとエッジとを表す。基礎ナレッジ・グラフのノードより大きい円は、インコヒーレント・ノードまたは新規ノード３０４、３０６、３０８および３１０を表し得る。既存の基礎ナレッジ・グラフ３０２の円の上に六角形をグラフィックでオーバーレイすることによって、基礎ナレッジ・グラフ３０２の既存ノードとの、それまでリンクされていなかったインコヒーレント・ノード３０４、３０６、３０８および３１０の重ね合わせを表すことができる。

図４は、本発明の実施形態による、結果のナレッジ・グラフの追加されたリンク／エッジを有する関連コヒーレント・ノードを備えた基礎ナレッジ・グラフ３０２のグラフ表現４００である。各インコヒーレント・ノード（すなわち、図４でＡ、Ｂ、Ｃ、Ｄとして示されている）について、下にある基礎ナレッジ・グラフ３０２のエッジを隣接するインコヒーレント・ノードに達するまでたどる。別のインコヒーレント・ノードを通る経路によって接続された２つのインコヒーレント・ノードはリンクされなくてもよい。また、所定のクリップ・レベル（すなわち閾値）も適用することができ、例えば、経路の特定の長さ（例えばエッジ数）または特定の累積逆重み（例えば、経路のリンクの逆重みの和）に達した後、リンクの検索を記憶することができる。重なり合わせた六角形のインコヒーレント・ノードの間のエッジは太い点線で示されている。クリップ・レベルを基礎ナレッジ・グラフの４つのエッジに設定することができる。

さらに、結果のナレッジ・グラフのエッジの重みが、基礎ナレッジ・グラフ内にある経路強度の逆数として示され、または、この例では、逆重みの和の逆数によって同様に与えられる。

図４に示すように、経路長が５であるため、ＡはＤにリンクされていない。ＢとＤとの間には別のインコヒーレント・ノードと交差しない経路がないため、経路長クリップ・レベルに関係なくＢはＤにリンクされない。

インコヒーレント・ノードに複数の経路が接続する場合、最短経路または最大の結果重みを有する経路がとられる。別の例示の実施形態では、重みの和をとることができ、その後、すべての重みが任意により「１」に正規化される。別の例示の実施形態では、最大の重みを有する経路を強調するために重みの二乗の和の乗根がとられ、その後、場合によってすべての重みが「１」に正規化される。

別の例示の実施形態では、結果のナレッジ・グラフのエッジの重みはインコヒーレント・ノードのメタデータに影響される。例えば、２つのノードが同じ作者によるものであるか、またはワークショップ中に同時に作成されている場合、その２つのノード間のリンクの重みが増加される。

別の例示の実施形態では、同じ作者を示すために、所定の重みを有する追加のエッジが追加され得る。

方法の次のステップで、インコヒーレント・ノードのクラスタが特定されて、インコヒーレント・ノードがカテゴリに分類され、各カテゴリのトピックまたはテーマに命名することができる。このために、すべてのノードにスコアとしてエッジの重みの和が与えられる。別の例示の実施形態では、ノードにはエッジの数がスコアとして与えられる。

例示の一実施形態では、クラスタの数を例えばｎ個に制限することができる（すなわち、それ以降、上位ｎのスコアを有するｎ個のノードのみが考慮される）。別の例示の実施形態では、所定の最低スコアを下回るすべてのノードが無視される。さらに別の例示の実施形態では、クラスタ・コア間の最小距離が必要とされてもよい（すなわち、特定の半径内の隣接ノードよりもスコアの低いすべてのノードが無視される）。別の例示の実施形態では、上記の基準の組合せを使用することができる。別の例示の実施形態では、上記の手法を数サイクル適用することができる。

上記の手法をさらに詳しく見るために、次の図について考えてみることができる。

図５は、本発明の実施形態による、基礎ナレッジ・グラフと結果のナレッジ・グラフのグラフィカル表現５００であり、エッジの重みも示している。簡単にするために、基礎ナレッジ・グラフは、規則的な格子として示し、すべてのリンクが重み「１」を有する。いずれにしても、経路の重みを重みの積として表すことができるように、重みは「０」と「１」の間の範囲に正規化する必要がある（すなわちより長い経路がより短い経路よりも低い重みを有する）。

既存ナレッジ・グラフのノードよりも大きい円として示されている９個のインコヒーレント・ノードが重ね合わされている。

結果のナレッジ・グラフのエッジ重みとして、基礎ナレッジ・グラフの経路のエッジがとられる。重みの数値が各エッジのすぐ横に示されている。結果のナレッジ・グラフのノード間のエッジは、太い点線で示されている。

図６に、本発明の実施形態による、結果のナレッジ・グラフの他のグラフ表現６００を示す。図６は、リンクの重みが同じである、図５の結果のナレッジ・グラフから抽出した部分に過ぎない。

図７に、本発明の実施形態による、ノードのスコアを有する結果のナレッジ・グラフのグラフ表現７００を示す。第１の反復回で、各ノードがスコアとしてそのノードのエッジの和を受け取る。この例では、ノードのリンクの重みが２．５に設定され、それによって３つの可能な候補とそれらの間の２つの接続ができる。１つは直接リンク（すなわち、エッジ重み１）であり、１つは合計重み０．２５＝０．５×０．５を有する、２つのエッジを含む経路であり、これを検証することができる。一例は、最上位ノードが３つのリンクを有し、それぞれの重みが０．５、１、０．３３３３３３３．．．であり、結果ナレッジ・グラフの残りのノードについても計算することができる。

この手法により、３つの可能な候補とそれらの間の２つのエッジとが残る。次の図に記載のように、１つは直接エッジ（すなわち重み１）であり、１つは、合計重み０．２５＝０．５×０．５を有する、２つのリンクを含む経路である。

図８に、本発明の実施形態による、クラスタの中心の可能な候補の第１のグラフ表現８００を示す。図９に、本発明の実施形態による、クラスタの中心の可能な候補の第２のグラフ表現８００を示す。図８および図９は、クラスタの中心の可能な候補の実施形態８００を示し、なぜなら、この候補が、結果のナレッジ・グラフにおけるすべてのノードのうちで最高のスコアを有するためである。

第２の反復回では、残りのノードを接続するエッジの重みが第１の反復回のノードのスコアに加えられる。この例では、第２の期間の必要最小スコアが４に設定されており、１つのノード（すなわち、スコア４．２５を有するノード）だけがクラスタ・コアとして残される。あるいは、クラスタ・コア間の最小距離を２に設定することもできるが、他のいずれの数値も選択可能であり、その結果として２つのクラスタ・コア、すなわちスコア４．２５と２．７５を有するノードが残ることになる。

クラスタ・コアのカテゴリ名または意図あるいはその両方を選択することができる。

例示の一実施形態では、最も近いクラスタ・コアにノードを割り当てることによってクラスタが形成される。別の例示の実施形態では、クラスタ・コアのスコアは関数としてとられ、例えば重力モデルでは、スコアを距離（例えばノード間のエッジ数またはホップ数で測った距離）の二乗で割った値となる。

非反復的手法として、別の例示の実施形態では、各ノードの周りに所定の半径の円が配置される（すなわち、そのノードから開始する経路を所定のクリップ・レベルである、逆重みの和の所定の閾値に達するまでたどる）。クラスタ・コアは、その与えられた円内に位置する最大数のノードを有するノードとすることができる。

方法の次のステップで、結果のナレッジ・グラフは次にグラフィックで表示可能な形態に変換され、ユーザに提示されることができる。前のインコヒーレント・ノードは、名前付きクラスタに配置され、グループ化される。よりわかりやすくするために、色分けを使用することができる。

クラスタの決定のためのパワー・メータ（例えばクラスタ数、クラスタ・コアに必要な最小スコア、クラスタ間の最小距離、反復回数）を変えることによって、ユーザは異なるカテゴリ化を生成することができる。次に、関連する表現の目的のために特定のカテゴリ化を選択する。

図１０に、本発明の実施形態による、結果のナレッジ・グラフを作成するためのシステムのコンポーネント・モデル９００のブロック図を示す。情報のエンティティ９０２が、上述のように標準化形式でインコヒーレント・ノード９０６を生成するデータ・プリプロセッサ９０４に渡される。このために、エンティティの形式に応じて、プリプロセッサ９０４は、スキャン、光学式文字認識、スピーチ・ツー・テキスト、または同様の技法を使用することができる。インテント・マッパ（intent mapper）９０８と呼ぶコンポーネントが、各インコヒーレント・ノードの意図を捕捉する。例示の一実施形態では、インテント・マッパ９０８は、マッチング・エンジン９１４がインコヒーレント・ノード９０６の意図を基礎ナレッジ・グラフ９１０のノードの意図と突き合わせるように、基礎ナレッジ・グラフ９１０のノードの全部またはサブセットの意図も捕捉する。別の実施形態では、マッチング・エンジン９１４は、関連方法の文脈で前述したように、インコヒーレント・ノード９０６の意図を基礎ナレッジ・グラフ９１０のノードの名前または記述または内容あるいはこれらの組合せと突き合わせる。

リンク・エンジン９１６が、１つの重ね合わされたインコヒーレント・ノードから別の重ね合わされたインコヒーレント・ノードまで基礎ナレッジ・グラフ９１０のリンクをたどる。リンク・エンジン９１６は、結果のナレッジ・グラフ９１２を、基礎ナレッジ・グラフ９１０とは別個に記憶する。このようにして、結果のナレッジ・グラフ９１２は、基礎ナレッジ・グラフ９１０から独立した構造となる。

クラスタ化エンジン９１８が、クラスタのスコアを識別し、ノード名から名前文字列を選択し、クラスタの周辺のノードをクラスタに割り当てる。

次に、提示モジュール９２０が、結果のナレッジ・グラフ９１２のクラスタとノードとリンクとを図示する１つまたは複数のグラフィクスを描画する。ユーザ・インターフェース９２２が、結果のナレッジ・グラフ９１２の異なる表示を生成するためにクラスタ化アルゴリズムのパワー・メータをユーザが変更することができるようにする。ユーザは、結果のグラフを変更するために、または、結果のグラフ９１２の表示を変更するために、ユーザ・コンピューティング・デバイスを使用して結果のナレッジ・グラフ９１２と対話することができる。

本発明の実施形態は、プラットフォームに関係なく、プログラム・コードを記憶または実行あるいはその両方に適する実質的に任意の種類のコンピュータとともに実装することができる。図１１に、本発明の実施形態による、コンピュータ・システムのブロック図を示す。例えば、図１１は、提案の方法に関連するプログラム・コードを実行するのに適するか、または図１０によるコンポーネント・モデルのコンポーネントのうちの１つまたは複数のコンポーネントとして動作する、コンピュータ・システム１０００を示す。

コンピュータ・システム１０００は、適合するコンピュータ・システムの一例に過ぎず、本明細書に記載の本発明の実施形態の使用または機能の範囲に関するいかなる限定も示唆することを意図していない。実施形態にかかわらず、コンピュータ・システム１０００は、上記の機能セットのいずれも実装または実行可能である。コンピュータ・システム１０００内には、多くの他の汎用または特殊目的コンピュータ・システム環境または構成とともに動作可能なコンポーネントがある。コンピュータ・システム／サーバ１０００とともに使用するのに適合し得る周知のコンピューティング・システム、環境または構成あるいはその組合せの例としては、パーソナル・コンピュータ・システム、サーバ・コンピュータ・システム、シン・クライアント、シック・クライアント、ハンドヘルド型またはラップトップ・デバイス、マルチプロセッサ・システム、マイクロプロセッサ・ベースのシステム、セット・トップ・ボックス、プログラマブル消費者電子機器、ネットワークＰＣ、ミニコンピュータ・システム、メインフレーム・コンピュータ・システム、および上記のシステムまたはデバイスのいずれかを含む分散クラウド・コンピューティング環境などがあるがこれらには限定されない。コンピュータ・システム／サーバ１０００は、コンピュータ・システム１０００によって実行されるプログラム・モジュールなどのコンピュータ・システム実行可能命令の一般的な文脈で説明することができる。一般に、プログラム・モジュールは、特定のタスクを実行するかまたは特定の抽象データ・タイプを実装する、ルーチン、プログラム、オブジェクト、コンポーネント、ロジック、データ構造などを含み得る。コンピュータ・システム／サーバ１０００は、タスクが通信ネットワークを介してリンクされたリモート処理デバイスによって実行される分散クラウド・コンピューティング環境で実施することもできる。分散クラウド・コンピューティング環境では、プログラム・モジュールを、メモリ・ストレージ・デバイスを含む、ローカル・コンピュータ・システム記憶媒体とリモート・コンピュータ・システム記憶媒体の両方に配置することができる。

図に示すように、コンピュータ・システム／サーバ１０００は、汎用コンピューティング・デバイスの形態で示されている。コンピュータ・システム／サーバ１０００の構成要素は、１つまたは複数のプロセッサまたは処理ユニット１００２と、システム・メモリ１００４と、システム・メモリ１００４を含む様々なシステム構成要素をプロセッサ１００２に接続するバス１００６とを含み得るがこれらには限定されない。バス１００６は、様々なバス・アーキテクチャのうちのいずれかのアーキテクチャを使用する、メモリ・バスまたはメモリ・コントローラ、ペリフェラル・バス、アクセラレーテッド・グラフィクス・ポート、およびプロセッサ・バスまたはローカル・バスを含む、数種類のバス構造のうちのいずれかの１つまたは複数に相当する。例として、そのようなアーキテクチャとしては、業界標準アーキテクチャ（Industry Standard Architecture：ＩＳＡ）バス、マイクロ・チャネル・アーキテクチャ（Micro Channel Architecture：ＭＣＡ）バス、拡張（Enhanced）ＩＳＡ（ＥＩＳＡ）バス、ビデオ・エレクトロニクス・スタンダーズ・アソシエーション（Video Electronics Standards Association：ＶＥＳＡ）ローカル・バス、およびペリフェラル・コンポーネント・インターコネクト（Peripheral Component Interconnect：ＰＣＩ）バスがあるが、これらには限定されない。コンピュータ・システム／サーバ１０００は、典型的には様々なコンピュータ／システム可読媒体を含む。そのような媒体は、コンピュータ・システム／サーバ１０００がアクセス可能な任意の利用可能な媒体とすることができ、これには揮発性媒体と不揮発性媒体、取り外し可能媒体と取り外し不能媒体の両方が含まれる。

システム・メモリ１００４は、ランダム・アクセス・メモリ（ＲＡＭ）１００８またはキャッシュ・メモリ１０１０あるいはその両方などの、揮発性メモリの形態のコンピュータ・システム可読記憶媒体を含み得る。コンピュータ・システム／サーバ１０００は、他の取り外し可能／取り外し不能、揮発性／不揮発性のコンピュータ・システム記憶媒体をさらに含み得る。一例に過ぎないが、ストレージ・システム１０１２を、取り外し不能な不揮発性磁気媒体（図示されておらず、一般に「ハード・ドライブ」と呼ばれる）の読み書きのために設けることができる。図示されていないが、取り外し可能な不揮発性磁気ディスク（例えば「フロッピィ・ディスク」）の読み書きのための磁気ディスク・ドライブと、ＣＤ−ＲＯＭ、ＤＶＤ−ＲＯＭまたはその他の光学媒体などの、取り外し可能な不揮発性光ディスクの読み書きのための光ディスク・ドライブとを備えることができる。そのような場合、それぞれを１つまたは複数のデータ・メディア・インターフェースによってバス１００６に接続することができる。以下でさらに図示し、説明するように、メモリ１００４は、本発明の実施形態の機能を実施するように構成された１組の（例えば少なくとも１つの）プログラム・モジュールを有する少なくとも１つのプログラム製品を含み得る。

一例として、１組の（例えば少なくとも１つの）プログラム・モジュール１０１６を有するプログラム／ユーティリティと、オペレーティング・システムと、１つまたは複数のアプリケーション・プログラムと、その他のプログラム・モジュールと、プログラム・データとをメモリ１００４に記憶することができるが、これには限定されない。オペレーティング・システム、１つまたは複数のアプリケーション・プログラム、その他のプログラム・モジュール、およびプログラム・データ、またはその何らかの組合せのそれぞれが、ネットワーキング環境の実装形態を含み得る。プログラム・モジュール１０１６は、一般に、本明細書に記載の本発明の実施形態の機能または方法あるいはその両方を実施する。

コンピュータ・システム／サーバ１０００は、キーボード、ポインティング・デバイス、ディスプレイ１０２０など、または、ユーザがコンピュータ・システム／サーバ１０００とやり取りすることができるようにする１つまたは複数のデバイス、または、コンピュータ・システム／サーバ１０００が１つまたは複数の他のコンピューティング・デバイスと通信することができるようにする任意のデバイス（例えばネットワーク・カード、モデムなど）、あるいはその組合せなどの、１つまたは複数の外部デバイス１０１８とも通信することができる。このような通信は、入出力（Ｉ／Ｏ）インターフェース１０１４を介して行うことができる。さらに、コンピュータ・システム／サーバ１０００は、ローカル・エリア・ネットワーク（ＬＡＮ）、または汎用ワイド・エリア・ネットワーク（ＷＡＮ）、またはパブリック・ネットワーク（例えばインターネット）、あるいはその組合せなどの１つまたは複数のネットワークと、ネットワーク・アダプタ１０２２を介して通信することができる。図のように、ネットワーク・アダプタ１０２２は、バス１００６を介してコンピュータ・システム／サーバ１０００の他の構成要素と通信することができる。なお、図示されていないが、他のハードウェア・コンポーネントまたはソフトウェア・コンポーネントあるいはその両方もコンピュータ・システム／サーバ１０００とともに使用することができることを理解されたい。例としては、マイクロコード、デバイス・ドライバ、冗長処理ユニット、外部ディスク・ドライブ・アレイ、ＲＡＩＤシステム、テープ・ドライブ、およびデータ・アーカイブ・ストレージ・システムなどが含まれるが、これらには限定されない。

本発明の様々な実施形態の説明を例示のために示したが、これらは網羅的であること、または開示されている実施形態に限定することを意図したものではない。記載されている実施形態の範囲から逸脱することなく、多くの変更および変形が当業者には明らかであろう。本明細書で使用されている用語は、実施形態の原理、実際の適用、または市場に見られる技術に優る技術的改良を最もよく説明するために、または当業者が本明細書で開示されている実施形態を理解することができるように選定された。

本発明は、システム、方法またはコンピュータ・プログラム製品あるいはその組合せとして実現することができる。コンピュータ・プログラム製品は、プロセッサに本発明の態様を実施させるためのコンピュータ可読プログラム命令が記憶されたコンピュータ可読記憶媒体（または複数の媒体）を含み得る。

媒体は、伝播媒体の場合は、電子、磁気、光、電磁気、赤外線または半導体システムであってもよい。コンピュー可読媒体の例には、半導体メモリまたはソリッド・ステート・メモリ、磁気テープ、取り外し可能コンピュータ・ディスケット、ランダム・アクセス・メモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、剛性磁気ディスク、および光ディスクが含まれ得る。光ディスクの現在の例としては、コンパクト・ディスク読み取り専用メモリ（ＣＤ−ＲＯＭ）、コンパクト・ディスク読み取り／書き込み（ＣＤ−Ｒ／Ｗ）、ＤＶＤ、およびＢｌｕ−Ｒａｙ−Ｄｉｓｃ（登録商標）が含まれる。

コンピュータ可読記憶媒体は、命令実行デバイスによって使用される命令を保持し、記憶することができる有形デバイスとすることができる。コンピュータ可読記憶媒体は、例えば、電子ストレージ・デバイス、磁気ストレージ・デバイス、光学式ストレージ・デバイス、電磁気ストレージ・デバイス、半導体ストレージ・デバイス、またはこれらの任意の適合する組合せであってよいが、これらには限定されない。コンピュータ可読記憶媒体のより具体的な例の非網羅的なリストには以下のものが含まれる。すなわち、可搬コンピュータ・ディスケット、ハードディスク、ランダム・アクセス・メモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、消去可能プログラマブル読み取り専用メモリ（ＥＰＲＯＭまたはフラッシュ・メモリ）、スタティック・ランダム・アクセス・メモリ（ＳＲＡＭ）、可搬コンパクト・ディスク読み取り専用メモリ（ＣＤ−ＲＯＭ）、デジタル・バーサタイル・ディスク（ＤＶＤ）、メモリ・スティック、フロッピィ・ディスク、パンチカードまたは命令が記録された溝内の***構造などの機械的に符号化されたデバイス、およびこれらの任意の適合する組合せが含まれる。本明細書で使用されるコンピュータ可読記憶媒体とは、電波またはその他の自由に伝播する電磁波、導波路またはその他の伝送媒体を伝播する電磁波（例えば光ファイバ・ケーブルを通る光パルス）、または電線を介して伝送される電気信号などの、一過性の信号自体であると解釈すべきではない。

本明細書に記載のコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体からそれぞれのコンピューティング／処理デバイスに、または、ネットワーク、例えばインターネット、ローカル・エリア・ネットワーク、ワイド・エリア・ネットワーク、または無線ネットワークあるいはこれらの組合せを介して外部コンピュータまたは外部記憶装置にダウンロードすることができる。ネットワークは、銅伝送ケーブル、光伝送ファイバ、無線伝送、ルータ、ファイアウォール、交換機、ゲートウェイ・コンピュータ、またはエッジ・サーバあるいはこれらの組合せを含み得る。各コンピューティング／処理デバイスにおけるネットワーク・アダプタ・カードまたはネットワーク・インターフェースが、ネットワークからコンピュータ可読プログラム命令を受信し、それらのコンピュータ可読プログラム命令を、それぞれのコンピューティング／処理デバイス内のコンピュータ可読記憶媒体への記憶のために転送する。

本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、インストラクション・セット・アーキテクチャ（ＩＳＡ）命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、または、Ｓｍａｌｌｔａｌｋ（Ｒ）、Ｃ＋＋などのオブジェクト指向プログラミング言語、および「Ｃ」プログラミング言語、または同様のプログラム言語などの従来型の手続き型プログラミング言語を含む、１つまたは複数のプログラミング言語の任意の組合せで書かれたソース・コードまたはオブジェクト・コードとすることができる。コンピュータ可読プログラム命令は、スタンドアロン・ソフトウェア・パッケージとして全体がユーザのコンピュータ上でまたは一部がユーザのコンピュータ上で、または一部がユーザのコンピュータ上で一部がリモート・コンピュータ上で、または全体がリモート・コンピュータまたはサーバ上で実行されてもよい。後者の場合、リモート・コンピュータは、ローカル・エリア・ネットワーク（ＬＡＮ）またはワイド・エリア・ネットワーク（ＷＡＮ）を含む、任意の種類のネットワークを介してユーザのコンピュータに接続することができ、または接続は（例えば、インターネット・サービス・プロバイダを使用してインターネットを介して）外部コンピュータに対して行ってもよい。実施形態によっては、本発明の態様を実行するために、例えばプログラマブル・ロジック回路、フィールド・プログラマブル・ゲート・アレイ（ＦＰＧＡ）、またはプログラマブル・ロジック・アレイ（ＰＬＡ）を含む電子回路が、コンピュータ可読プログラム命令の状態情報を使用して電子回路をパーソナライズすることにより、コンピュータ可読プログラム命令を実行することができる。

本発明の態様について、本発明の実施形態による方法、装置（システム）、およびコンピュータ・プログラム製品を示すフローチャート図またはブロック図あるいはその両方の図を参照しながら説明している。フローチャート図またはブロック図あるいはその両方の図の各ブロックおよび、フローチャート図またはブロック図あるいはその両方の図のブロックの組合せは、コンピュータ可読プログラム命令によって実装可能であることはわかるであろう。

これらのコンピュータ可読プログラム命令は、コンピュータまたはその他のプログラマブル・データ処理装置のプロセッサにより実行される命令が、フローチャートまたはブロック図あるいはその両方のブロックで規定されている機能／動作を実装する手段を形成するようなマシンを実現するように、汎用コンピュータ、特殊目的コンピュータ、またはその他のプログラマブル・データ処理装置のプロセッサに供給することができる。これらのコンピュータ可読プログラム命令は、命令が記憶されたコンピュータ可読記憶媒体が、フローチャートまたはブロック図あるいはその両方のブロックで規定されている機能／動作の態様を実装する命令を含む製造品を含むように、コンピュータ、プログラマブル・データ処理装置、またはその他の装置あるいはこれらの組合せに対して特定の方式で機能するように指示することができるコンピュータ可読記憶媒体に記憶することもできる。

コンピュータ可読プログラム命令は、コンピュータ、その他のプログラマブル装置またはその他のデバイス上で実行される命令がフローチャートまたはブロック図あるいはその両方のブロックで規定されている機能／動作を実装するように、コンピュータ、その他のプログラマブル装置、またはその他のデバイス上で一連の動作ステップが実行されるようにするために、コンピュータ、その他のプログラマブル・データ処理装置、またはその他のデバイスにロードされてもよい。

図面中のフローチャートまたはブロック図あるいはその両方は、本発明の様々な実施形態によるシステム、方法およびコンピュータ・プログラム製品の可能な実装形態のアーキテクチャ、機能および動作を示す。なお、フローチャートまたはブロック図の各ブロックは、規定されている論理機能を実装するための１つまたは複数の実行可能命令を含む、命令のモジュール、セグメント、または部分を表すことがある。別の実装形態では、ブロックに記載されている機能は、図に記載されている順序とは異なる順序で行われてもよい。例えば、連続して示されている２つのブロックは、関与する機能に応じて、実際には実質的に並行して実行されてもよく、またはそれらのブロックは場合によっては逆の順序で実行されてもよい。また、ブロック図またはフローチャート図あるいはその両方の図の各ブロック、およびブロック図またはフローチャート図あるいはその両方の図のブロックの組合せは、規定されている機能または動作を実行する特殊目的ハードウェア・ベースのシステムによって実装可能であるか、または特殊目的ハードウェアとコンピュータ命令との組合せを実施することができることもわかるであろう。

一実施形態では、本発明のシステムは、コンピュータ、携帯型デバイスなどのハードウェア・デバイスとすることができるか、またはそれを含み得る。一実施形態では、ハードウェア・デバイスは、（独立して、または組み合わさって）本発明の方法のみを実行するように特殊化された、特殊非汎用ハードウェアおよび回路（すなわち、特殊ディスクリート非汎用アナログ、デジタル、およびロジック・ベースの回路）を含む特殊目的デバイス（例えば、コンピュータ、マシン、携帯型デバイス）であるか、または含む。特殊ディスクリート非汎用アナログ、デジタル、およびロジック・ベースの回路は、特別に設計されたプロプライエタリ・コンポーネント（例えば、本発明の方法のみを実装するように設計された特定用途向け集積回路（ＡＳＩＣ）などの特殊集積回路）を含み得る。

別の実施形態では、提案の発明は、結果のグラフが検索エンジン技術を向上させることができ、それによって、ユーザが追加のウェブサイトまでナビゲートしたり追加の情報検索を行ったりすることを回避することができるようにする場所において関連情報を提供することによって、コンピュータ資源を節減するため、コンピュータ技術に必然的に根ざす技術的問題を解決する。

本発明のコンピュータ・プログラム製品は、コンピュータ可読プログラム・コードが記憶された１つまたは複数のコンピュータ可読ハードウェア記憶装置を含むことができ、上記プログラム・コードは、本発明の方法を実装するためにコンピューティング・システム（またはコンピュータ・システム）の１つまたは複数のプロセッサによって実行可能な命令を含む。

本発明のコンピュータ・システムは、１つまたは複数のプロセッサと、１つまたは複数のメモリと、１つまたは複数のコンピュータ可読ハードウェア記憶装置とを含むことができ、上記１つまたは複数のハードウェア記憶装置は、本発明の方法を実装するために１つまたは複数のメモリを介して１つまたは複数のプロセッサによって実行可能なプログラム・コードを含む。

本発明の様々な実施形態の説明を例示のために示したが、網羅的であること、または開示されている実施形態に限定することを意図したものではない。記載されている実施形態の範囲から逸脱することなく、多くの変更および変形が当業者には明らかであろう。本明細書で使用されている用語は、実施形態の原理、実際の適用、または市場に見られる技術に優る技術的改良を最もよく説明するために、または当業者が本明細書で開示されている実施形態を理解することができるように選定された。

Claims

ナレッジ・グラフを作成するためのコンピュータ実装方法であって、
コンピュータ・システムのプロセッサによって、複数の新規ノードを受け取る第１の受け取ることと、
前記プロセッサによって、既存の重みを各エッジが有する既存エッジによって選択的に接続された既存ノードを含む基礎ナレッジ・グラフを受け取る第２の受け取ることと、
前記プロセッサによって、前記基礎ナレッジ・グラフの前記既存ノードのうちの選択されたノードに前記複数の新規ノードを重ね合わせ、新規ノードと対応する既存ノードとの対を形成することと、
前記プロセッサによって、下にある前記基礎ナレッジ・グラフ内の対応する既存ノードがゼロまたは所定最大数の既存エッジを介した接続を有する場合に、前記複数の新規ノードのうちの少なくとも２つのノード間に新規の重みを有する新規エッジを形成することによって前記複数の新規ノードを接続することであって、前記新規の重みが前記対応する既存ノード間の接続の前記既存エッジの前記既存の重みに基づいて決定される、前記接続することと、
前記プロセッサによって、前記基礎ナレッジ・グラフから前記複数の新規ノードを前記新規エッジとともに結果のナレッジ・グラフとして切り離すことと
を含む、方法。
重ね合わせることは、前記基礎ナレッジ・グラフの既存ノードの内容に新規ノードの内容をマッピングするために認知コンピューティング方法を使用する、請求項１に記載の方法。
前記複数の新規ノードの各ノードが少なくとも部分的にテキスト形態の内容を含む、請求項１または２に記載の方法。
前記複数の新規ノードのうちの２つのノード間の前記新規エッジの重みが、前記既存ナレッジ・グラフの前記２つの対応するノード間に最短の接続を形成するエッジの数によって決定される、請求項１ないし３のいずれかに記載の方法。
前記複数の新規ノードのうちの２つのノード間の前記新規エッジの重みが、前記既存ナレッジ・グラフの前記２つの対応するノード間に最短の接続を形成するエッジの数の逆数値によって決定される、請求項１ないし３のいずれかに記載の方法。
前記複数の新規ノードのうちの２つのノード間の前記新規エッジの重みが、前記既存ナレッジ・グラフの前記２つの対応するノード間に最短の接続を形成するエッジの重みの和の逆数値によって決定される、請求項１ないし３のいずれかに記載の方法。
前記新規ノードにスコアを割り当てることをさらに含む、請求項１ないし６のいずれかに記載の方法。
前記スコアは、前記新規ノードに接続する前記エッジの前記重みの和として決定される、請求項７に記載の方法。
前記スコアは、前記新規ノードに接続する前記エッジの数として決定される、請求項７に記載の方法。
前記結果のナレッジ・グラフにおいてクラスタを形成することをさらに含む、請求項１ないし９のいずれかに記載の方法。
前記クラスタの中心が、他の新規ノードへの最大数の直接エッジを有する前記新規ノードである、請求項１０に記載の方法。
前記クラスタの中心が、所定の閾値を上回るノード・スコアを有する前記新規ノードである、請求項１０に記載の方法。
前記クラスタの名前が前記クラスタの中心の名前と同じである、請求項１０ないし１２のいずれかに記載の方法。
システムであって、
プロセッサと、
前記プロセッサに結合されたメモリ・デバイスと、
前記プロセッサに結合され、ナレッジ・グラフを作成する方法を実装するように前記メモリ・デバイスを介して前記プロセッサによって実行可能なプログラム・コードを含むコンピュータ可読記憶装置と
を含み、前記方法は、
コンピュータ・システムのプロセッサによって、複数の新規ノードを受け取る第１の受け取ることと、
前記プロセッサによって、既存の重みを各エッジが有する既存エッジによって選択的に接続された既存ノードを含む基礎ナレッジ・グラフを受け取る第２の受け取ることと、
前記プロセッサによって、前記基礎ナレッジ・グラフの前記既存ノードのうちの選択されたノードに前記複数の新規ノードを重ね合わせ、新規ノードと対応する既存ノードとの対を形成することと、
前記プロセッサによって、下にある前記基礎ナレッジ・グラフ内の対応する既存ノードがゼロまたは所定最大数の既存エッジを介した接続を有する場合に、前記複数の新規ノードのうちの少なくとも２つのノード間に新規の重みを有する新規エッジを形成することによって前記複数の新規ノードを接続することであって、前記新規の重みが前記対応する既存ノード間の接続の前記既存エッジの前記既存の重みに基づいて決定される、前記接続することと、
前記プロセッサによって、前記基礎ナレッジ・グラフから前記複数の新規ノードを前記新規エッジとともに結果のナレッジ・グラフとして切り離すことと
を含む、システム。
前記重ね合わせることは、前記基礎ナレッジ・グラフの前記ノードの内容への前記複数の新規ノードの内容のマッピングのために認知コンピューティング・システムを使用する、請求項１４に記載のシステム。
前記複数の新規ノードの各ノードが少なくとも部分的にテキスト形態の内容を含む、請求項１４または１５に記載のシステム。
前記複数の新規ノードのうちの２つのノード間の新規エッジの重みが、前記既存ナレッジ・グラフの前記２つの対応するノード間の最短の接続を形成するエッジの数によって決定されるか、または、前記複数の新規ノードのうちの２つのノード間の前記新規エッジの重みが、前記既存ナレッジ・グラフの前記２つの対応するノード間に最短の接続を形成するエッジの数の逆数値によって決定されるか、または前記複数の新規ノードのうちの２つのノード間の前記新規エッジの重みが、前記既存ナレッジ・グラフの前記２つの対応するノード間に最短の接続を形成するエッジの重み付きの数の和の逆数値によって決定される、請求項１４ないし１６のいずれかに記載のシステム。
前記新規ノードにスコアを割り当てることをさらに含む、請求項１４ないし１７のいずれかに記載のシステム。
前記スコアは、前記新規ノードに接続する前記エッジの前記重みの和として決定される、請求項１８に記載のシステム。
前記スコアは前記新規ノードに接続する前記エッジの和として決定される、請求項１８に記載のシステム。
前記結果のナレッジ・グラフにおいてクラスタを形成することをさらに含む、請求項１４ないし２０のいずれかに記載のシステム。
前記クラスタの中心が他の新規ノードへの最大数の直接エッジを有する前記新規ノードである、請求項２１に記載のシステム。
前記クラスタの中心が、所定の閾値を上回るノード・スコアを有する前記新規ノードである、請求項２１に記載のシステム。
前記クラスタの名前が前記クラスタの中心の名前と同じである、請求項２１ないし２３のいずれかに記載のシステム。
ナレッジ・グラフを作成するためのコンピュータ・プログラム製品であって、
処理回路によって読み取り可能であり、請求項１ないし１３のいずれかに記載の方法を実行するように前記処理回路による実行のための命令を記憶する、コンピュータ可読記憶媒体を含む、コンピュータ・プログラム製品。
コンピュータ可読媒体に記憶され、デジタル・コンピュータの内部メモリにロード可能なコンピュータ・プログラムであって、コンピュータ上で実行されると請求項１ないし１３のいずれかに記載の方法を実行するソフトウェア・コード部分を含む、コンピュータ・プログラム。