JP2021504818A - 基礎ナレッジ・グラフへの重ね合わせによるインコヒーレント・ノードの構造化 - Google Patents

基礎ナレッジ・グラフへの重ね合わせによるインコヒーレント・ノードの構造化 Download PDF

Info

Publication number
JP2021504818A
JP2021504818A JP2020528387A JP2020528387A JP2021504818A JP 2021504818 A JP2021504818 A JP 2021504818A JP 2020528387 A JP2020528387 A JP 2020528387A JP 2020528387 A JP2020528387 A JP 2020528387A JP 2021504818 A JP2021504818 A JP 2021504818A
Authority
JP
Japan
Prior art keywords
new
nodes
knowledge graph
existing
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020528387A
Other languages
English (en)
Inventor
ウーヴェ シャイデラー、ティム
ウーヴェ シャイデラー、ティム
ラヴィッツァ、ステファン
ジョバンニーニ、アンドレア
ハッシャジ、アヴディル
ストレイト、シモン
グラフ、フロリアン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2021504818A publication Critical patent/JP2021504818A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

ナレッジ・グラフを作成するためのコンピュータ・プログラム製品、システムおよび方法が、複数の新規ノードを受け取ることと、既存エッジによって選択的に接続された既存ノードを有する基礎ナレッジ・グラフを受け取ることと、上記基礎ナレッジ・グラフの上記既存ノードのうちの選択されたノードに上記新規ノードを重ね合わせることとを含み得る。この方法は、下にある上記基礎ナレッジ・グラフ内の対応する既存ノードがゼロまたは所定最大数の既存エッジを介した接続を有する場合に上記新規ノードのうちの少なくとも2つのノード間に、新規の重みを有する新規エッジを作成することによって上記新規ノードを接続することであって、上記新規の重みが対応する上記既存ノード間の接続の上記既存エッジの既存の重みに基づいて決定される、上記接続することと、上記基礎ナレッジ・グラフから上記新規ノードを上記新規エッジとともに切り離すこととをさらに含み得る。

Description

本発明は、一般には、ナレッジ・グラフを作成するためのシステム、コンピュータ・プログラム製品および方法に関し、より詳細には、非構造化情報エンティティからのナレッジ・グラフの自動作成に関する。
情報の管理は、知識社会/知識産業における重要な活動である。情報は、構造化情報またはいわゆる非構造化情報である場合があり、それぞれのトランザクションまたはコラボレーション・システムがアクセス可能な電子ストレージ・システム内で管理されることができ、または情報は、非電子的形態、例えば手書きまたは音声で新たに生成され得る。
情報の非構造化エンティティは、異なる様々な状況、例えば、参加者が、ある構想を念頭に置いたブレインストーミングと、あらゆる異なる側面に関する付箋の書き込みとを使用するワークショップ、特にデザイン思考ワークショップにおいて生成されることがある。非構造化エンティティの別の発生源としては、特に、スプリントと呼ばれる4週間のサイクルと、15分間のスタンドアップ・ミーティングと、参加者全員が「うまくいったこと」、「改善の余地があること」およびその他の行動項目について参加者のアイデアを付箋に書くことができるスプリント・レトロスペクティブ・ミーティングとを使用する、SCRUM法を使用したソフトウェア・プロジェクトにおけるプロジェクト管理のためのアジャイル手法がある。非構造化エンティティのその他の発生源としては、ソーシャル・メディア・ツール、ブログ、電話会議の覚え書き、および関連メッセージ交換などがある。
しかしながら、組織的枠組みがなければ、上記のような付箋およびその他の手書きメッセージは、単独の相関関係のない情報エンティティであり、これは入力の前処理(すなわち、上記の例のうちの最初の例の場合の付箋、スキャン、および文字認識、後の例の場合の文字認識)の後は変化しない。しかし、ユーザには、それぞれが内容(例えば、参加者のテキスト投稿)とメタデータ(例えば参加者、タイムスタンプ)とを含む相関性のない1組の情報が残される。
共通する課題は、要約を自動的に生成することができ、または結論を引き出すことができ、あるいはその両方ができるような方式で、情報のエンティティを編成し、提示することであり、これは、チームにとって、チーム全体がトピックをよりよく理解することができて、具体的な結果に焦点を合わせられ、きわめて有用であろう。
現在、手作業による手法がとられており、これには必然的な欠点がある。第1に、情報のすべてのエンティティをグループ化するのは面倒で時間がかかり、特にコストがかかる。第2に、グループ化するためのカテゴリの選択が人の個人的見解によって決まる可能性があり、したがってある程度、恣意的である。エンティティのサブセットのためにカテゴリが選択された後は、別のサブセットのエンティティについてそれらのカテゴリが適合しない場合、最初からやり直すのは気が進まない場合がある。
現在の手法は、程度の差こそあれ「スタンドアロン」であり、すなわち、情報の一貫性のないエンティティを相関させるために一般的知識を使うことができない場合がある。したがって、この限界を克服する方法およびシステム、具体的には、相関性のない情報、すなわち「付箋」を、より把握が容易な方式で互いに関係付ける方法およびシステムが必要である。
したがって、当技術分野では上記の問題に対処する必要がある。
第1の観点から見ると、本発明は、ナレッジ・グラフを作成するためのコンピュータ実装方法であって、コンピュータ・システムのプロセッサによって、複数の新規ノードを受け取る第1の受け取ることと、上記プロセッサによって、既存の重みを各エッジが有する既存エッジによって選択的に接続された既存ノードを含む基礎ナレッジ・グラフを受け取る第2の受け取ることと、上記プロセッサによって、上記基礎ナレッジ・グラフの上記既存ノードのうちの選択されたノードに上記複数の新規ノードを重ね合わせ、新規ノードと対応する既存ノードとの対を形成することと、上記プロセッサによって、下にある上記基礎ナレッジ・グラフ内の対応する既存ノードがゼロまたは所定最大数の既存エッジを介した接続を有する場合に、上記複数の新規ノードのうちの少なくとも2つのノード間に新規の重みを有する新規エッジを形成することによって上記複数の新規ノードを接続することであって、上記新規の重みが上記対応する既存ノード間の接続の上記既存エッジの上記既存の重みに基づいて決定される、上記接続することと、上記プロセッサによって、上記基礎ナレッジ・グラフから上記複数の新規ノードを上記新規エッジとともに結果のナレッジ・グラフとして切り離すこととを含む方法を提供する。
他の観点から見ると、本発明は、プロセッサと、上記プロセッサに結合されたメモリ・デバイスと、上記プロセッサに結合され、ナレッジ・グラフを作成する方法を実装するために上記メモリ・デバイスを介して上記プロセッサによって実行可能なプログラム・コードを含むコンピュータ可読記憶装置とを含むシステムであって、上記方法は、コンピュータ・システムのプロセッサによって、複数の新規ノードを受け取る第1の受け取ることと、上記プロセッサによって、既存の重みを各エッジが有する既存エッジによって選択的に接続された既存ノードを含む基礎ナレッジ・グラフを受け取る第2の受け取ることと、上記プロセッサによって、上記基礎ナレッジ・グラフの上記既存ノードのうちの選択されたノードに上記複数の新規ノードを重ね合わせ、新規ノードと対応する既存ノードとの対を形成することと、上記プロセッサによって、下にある上記基礎ナレッジ・グラフ内の対応する既存ノードがゼロまたは所定最大数の既存エッジを介した接続を有する場合に、上記複数の新規ノードのうちの少なくとも2つのノード間に新規の重みを有する新規エッジを形成することによって上記複数の新規ノードを接続することであって、上記新規の重みが上記対応する既存ノード間の接続の上記既存エッジの上記既存の重みに基づいて決定される、上記接続することと、上記プロセッサによって、上記基礎ナレッジ・グラフから上記複数の新規ノードを上記新規エッジとともに結果のナレッジ・グラフとして切り離すこととを含む、システムを提供する。
他の観点から見ると、本発明は、ナレッジ・グラフを作成するためのコンピュータ・プログラム製品であって、処理回路によって読み取り可能であり、本発明のステップを実行するために上記処理回路による実行のための命令を記憶する、コンピュータ可読記憶媒体を含む、コンピュータ・プログラム製品を提供する。
他の観点から見ると、本発明は、コンピュータ可読媒体に記憶され、デジタル・コンピュータの内部メモリにロード可能なコンピュータ・プログラムであって、コンピュータ上で実行されると本発明のステップを実行するためのソフトウェア・コード部分を含む、コンピュータ・プログラムを提供する。
ナレッジ・グラフを作成するための方法、システム、コンピュータ・プログラム製品およびコンピュータ・プログラムが提供される。コンピューティング・システムのプロセッサが、複数の新規ノードと、既存のエッジの各エッジが既存の重みを有する既存エッジによって選択的に接続された既存ノードを含む基礎ナレッジ・グラフとを受け取る。複数の新規ノードは、基礎ナレッジ・グラフの既存のノードのうちの選択されたノードに重ね合わされて、新規ノードと対応する既存ノードとの対を形成する。下にある基礎ナレッジ・グラフ内の対応する既存ノードがゼロまたは所定最大数の既存エッジを介した接続を有する場合、複数の新規ノードは、複数の新規ノードのうちの少なくとも2つのノードの間に新規の重みを有する新規エッジを作成することによって接続され、新規の重みは、対応する既存ノード間の接続の既存エッジの既存の重みに基づいて決定される。複数の新規ノードは、結果のナレッジ・グラフとして、基礎ナレッジ・グラフから新規エッジとともに切り離される。
以下、本発明の実施形態について、例示のみを目的として添付図面を参照しながら説明する。
図1は、本発明の実施形態による、ナレッジ・グラフを作成する方法のフローチャートを示す図である。 図2は、本発明の実施形態による、図1の方法の代替方法のフローチャートを示す図である。 図3は、本発明の実施形態による、基礎ナレッジ・グラフおよび関連インコヒーレント・ノードのグラフ表現を示す図である。 図4は、本発明の実施形態による、結果のナレッジ・グラフのリンク/エッジが追加された関連インコヒーレント・ノードを有する基礎ナレッジ・グラフのグラフ表現を示す図である。 図5は、本発明の実施形態による、基礎ナレッジ・グラフと結果のナレッジ・グラフとのグラフ表現であって、エッジの重みも示すグラフ表現を示す図である。 図6は、本発明の実施形態による、結果のナレッジ・グラフの他のグラフ表現を示す図である。 図7は、本発明の実施形態による、ノードのスコアを有する結果のナレッジ・グラフのグラフ表現を示す図である。 図8は、本発明の実施形態による、クラスタの中心の可能な候補の第1のグラフ表現を示す図である。 図9は、本発明の実施形態による、クラスタの中心の可能な候補の第2のグラフ表現を示す図である。 図10は、本発明の実施形態による、結果のナレッジ・グラフを作成するためのシステムのコンポーネント・モデルのブロック図を示す図である。 図11は、本発明の実施形態による、コンピューティング・システムのブロック図を示す図である。
本発明の一態様によると、ナレッジ・グラフを作成する方法を提供することができる。この方法は、複数の新規ノードを受け取ることと、各エッジが既存の重みを有する既存エッジによって選択的に接続された既存ノードを含む基礎ナレッジ・グラフを受け取ることと、基礎ナレッジ・グラフの既存ノードのうちの選択された既存ノードに新規ノードを重ね合わせて、新規ノードと対応する既存ノードとの対を形成することとを含む。
この方法は、下にある基礎ナレッジ・グラフ内の対応する既存ノードがゼロまたは所定最大数の既存エッジを介した接続を有する場合に、新規ノードのうちの少なくとも2つの新規ノード間に新規の重みを有する新規エッジを作成することによって新規ノードを接続することであって、新規の重みが、対応する既存ノード間の接続の既存エッジの既存の重みに基づいて決定される、新規ノードを接続することと、新規ノードを新規エッジとともに結果のナレッジ・グラフとして基礎ナレッジ・グラフから切り離すこととをさらに含む。
本発明の別の態様によると、ナレッジ・グラフを作成するためのシステムを提供することができる。このシステムは、複数の新規ノードを受け取るようになされた第1の受信ユニットと、既存エッジのそれぞれが既存の重みを有する既存のエッジによって選択的に接続された既存ノードを含む基礎ナレッジ・ブラフを受け取るようになされた第2の受信ユニットと、基礎ナレッジ・グラフの既存のノードのうちの選択されたノードに上記新規ノードを重ね合わせて新規ノードと対応する既存ノードとの対を形成するようになされた重ね合わせモジュールとを含み得る。
さらに、このシステムは、下にある基礎ナレッジ・グラフ内の対応する既存ノードがゼロまたは所定最大数の既存エッジを介した接続を有する場合、新規ノードのうちの2つの新規ノード間に新規の重みを有する新規エッジを作成することによって新規ノードを接続するようになされたリンク・エンジンであって、新規の重みが対応する既存ノード間の接続の既存エッジの既存の重みに基づいて決定される、上記リンク・エンジンと、結果のナレッジ・グラフとして、基礎ナレッジ・グラフから新規ノードを新規エッジとともに切り離すようになされた切り離しユニットとを含むことができる。
ナレッジ・グラフを作成するための提案の方法は、複数の利点と技術的効果を提供し得る。
本発明の例示の実施形態は、既存のナレッジ・グラフの構造を利用して情報の新規エンティティを構造化することができる。新規エンティティは、ナレッジ・グラフ内の位置にまだ割り当てられていない可能性があるノードであるということができる。これらのいわゆるインコヒーレント・ノードは、それらの元々はインコヒーレントであったノードをエッジ(すなわち相互関係またはリンク)によって関係付けるために、内容マッチング法を使用して既存ナレッジ・グラフのノードに関係付けることができる。
ただし、インコヒーレント・ノードを組み込まずに、既存ナレッジ・グラフにおける知識に基づいて、インコヒーレント・ノードを重ね合わせ、次いでインコヒーレント・ノード間にエッジを付加することによって、既存ナレッジ・グラフは変化しないままで(すなわち、インコヒーレント・ノードは既存ナレッジ・グラフに組み込まれない)、既存ナレッジ・グラフの構造に沿って新規のナレッジ・グラフを作成することができる。したがって、新規ナレッジ・グラフのソート、構造化および編成は、既存ナレッジ・グラフとの強い相関を有し得るが、最終的には、既存ナレッジ・グラフとは完全に独立した新規ナレッジ・グラフの存在内にあり得る。しかしながら、既存ナレッジ・グラフ内に抽出されていた知識と経験とは、新たに作成されたナレッジ・グラフにも反映され得る。
したがって、様々な発生源、具体的には、ブレインストーミング会議、開発会議、プロジェクト会議、個人の覚え書き、ブログおよびソーシャル・メディア・ツールへの投稿などからの情報の新規エンティティを、既存ナレッジ・グラフによって表された固有の知識を使用するが、既存ナレッジ・グラフには依存せずに、編成することができる。新規ナレッジ・グラフは、情報エンティティ、具体的には元々はインコヒーレントであったノードおよび関係(すなわちそれらのノード間にエッジが作成されている)のみを反映することができる。結果の新規ナレッジ・グラフは、主観的偏向もなくすることができる。
以下では、本発明の他の実施形態について説明する。
方法の例示の一実施形態によると、ノードの重ね合わせは、新規ノードの内容を基礎ナレッジ・グラフの既存ノードの内容にマッピングするために認知コンピューティング法を使用することができる。したがって、既存ノードに最適な方式で内容的にまたは意図の点で関連する新規ノードを、対を形成するために使用することができる。このようにして、2つの異なる新規ノードが同じ既存ノードにマップされることができないように保証することもできる。また、新規ノードを既存ノードと突き合わせる最も単純な方式は、キーワードに基づく方式とすることができることもわかるであろう。
方法の例示の一実施形態によると、情報エンティティの一部を認知エンジンによる処理のために利用可能な新規ノードの作成源とするために、複数の新規ノードの各ノードが、タイプされた記録または手書きの記録のスキャン、手書き文字認識および変換、スピーチ・ツー・テキスト変換、または同様の技術によって得られる、少なくとも部分的にテキストの形態の内容を含むことができる。
方法の例示の一実施形態によると、新規ノードのうちの2つの新規ノード間の新規エッジの重みが、既存ナレッジ・グラフの2つの対応するノード間の最短接続を形成するエッジの数によって決定され得る。したがって、作成されるナレッジ・グラフの新たに作成されたエッジも重みを有し得る。新たに作成されたエッジに重み付けするための異なる選択肢もあり得、基礎ナレッジ・グラフの編成も反映することができる。
したがって、方法の別の例示の一実施形態によると、新規ノードのうちの2つの新規ノード間の新規エッジの重みが、既存ナレッジ・グラフの2つの対応するノード間の最短の接続を形成するエッジの数の逆数値によって決定され得る。
また、方法のさらに他の例示の実施形態によると、新規ノードのうちの2つの新規ノード間の新規エッジの重みが、既存ナレッジ・グラフの2つの対応するノード間の最短の接続を形成するエッジの重みの和の逆数値によって決定され得る。当業者は、重み因子を作成するための他の技法(例えば、新規エッジの新規の重み因子を導出するために既存ノードの既存の重みに、選択された数学関数を適用することによって、上記の重み付け技法の組合せを使用するなど)も定義することができるであろう。
さらに他の例示の実施形態によると、方法は、新規ノードにスコア、具体的にはスコア値を割り当てることも含み得る。このようにして、重要度の異なる値を結果のナレッジ・グラフの新規ノードに割り当てることができる。スコア値は、新規ノードのクラスタ化のために使用することができる。
値、具体的には重み、スコアなどを割り当てるが、説明を簡単にするために「重み付けする」という表現は、重み因子の意味を有する数値をエッジなどに割り当てることができることを示し得ることはわかるであろう。同じことは、スコアおよび関連するスコア数値にも当てはまる。
方法の例示の一実施形態によると、スコア、具体的にはスコア値は、新規ノードに接続するエッジの重みの和として決定され得る。したがって、新規ノードが有するエッジが多いほど、その新規ノードのスコア値が高くなり得る。方法の別の例示の実施形態によると、スコアは、新規ノードに接続するエッジの数として決定され得る。したがって、新規ノードのスコア値を作成するいくつかの異なる方式が存在し得る。
追加の例示の一実施形態によると、方法は、結果のナレッジ・グラフにおいて、クラスタ、具体的には少なくとも1つのクラスタを作成することも含むことができる。このようにして、より容易かつ迅速に利用することができるように、同じ主題の異なる側面の集合をグループ化することができる。クラスタの中心を見つける異なる選択肢も利用可能である。
方法の他の例示の実施形態によると、クラスタの中心は、他の新規ノードへの直接エッジの数が最も多い新規ノードとすることができるか、または方法の別の例示の実施形態によると、クラスタの中心は、所定の閾値を上回るノード・スコアを有する新規ノードとすることができる。所定の閾値は、クリップ・レベルの同義語として使用されることがある。また、新規ノードをクラスタ中心と定義するために他の技法も使用可能であることはわかるであろう。
したがって、方法の別の例示の実施形態によると、クラスタの名前はクラスタの中心の名前と同じであってもよく、これはクラスタの名前を定義する簡単な手法となり得る。より包括的な手法も使用可能である。
また、実施形態は、コンピュータまたは任意の命令実行システムによって、またはそれらとともに使用するためのプログラム・コードを提供するコンピュータ使用可能媒体またはコンピュータ可読媒体からアクセス可能な、関連コンピュータ・プログラム製品の形態をとってもよい。説明のために、コンピュータ使用可能媒体またはコンピュータ可読媒体とは、命令実行システム、装置またはデバイスによって、またはそれらとともに使用するためのプログラムを記憶、伝達、伝播または伝送する手段を含み得る、任意の装置とすることができる。
本明細書の文脈では、以下の表記、用語または表現あるいはその組合せを使用することがある。「ナレッジ・グラフ」という用語は、情報エンティティのグループ内の構造を意味し得る。ナレッジ・グラフの中核ビルディング・ブロックは、情報を含むノードと、選択された異なるノード間にリンクを形成するエッジとすることができる。エッジは、2つのノード間の関係の強度値を定義する重みまたは重み因子を有することができる。さらに、ノードは、ノードの内容の何らかの重要性を表すスコアまたはスコア値も有することができる。
「新規ノード」という用語は、本明細書の文脈では、新規ナレッジ・グラフのビルディング・ブロックの1つとみなされるエンティティとして示される、1つの情報を意味し得る。新規ノードは、少なくとも部分的に、何らかの文字での情報を含み得る。最初は、新規ノードは、エッジを介して連結されなくてもよい。新規エッジは、この方法のプロセスの一部として作成することができる。新規ノードは、本明細書の文脈ではインコヒーレント・ノードとも称することがある。
「基礎ナレッジ・グラフ」という用語は、既存ノードと、既存エッジとを含み、既存エッジが、割り当てられた既存の重みを有する、既存ナレッジ・グラフを意味し得る。基礎ナレッジ・グラフは、大きさ、具体的には既存ノードおよび既存エッジの数が、新たに作成されるナレッジ・グラフよりもはるかに大きい場合がある。例えば、100倍、10,000倍、またはさらに1,000,000以上となることがある。
「エッジ」という用語は、ナレッジ・グラフのノード間の接続またはリンクを意味し得る。ノードが典型的には、内容が内部に含まれる四角、円、または楕円あるいはこれらの組合せとして提示される場合、エッジは典型的にはそれらのノード間の線として提示される。エッジには、関連ノードの内容間の相互関係の強度を表す重み因子を割り当てることができる。
「重み」または重み因子という用語は、例えば、ナレッジ・グラフの2つのノード間の関係、リンク、またはエッジの相対強度を表す数値を意味し得る。
「重ね合わせ」という用語は、既存ナレッジ・グラフの既存ノードの上に新規ノードを論理的に配置することを意味し得る。したがって、新規ノードと既存ノードとの複数の対を作成することができる。重ね合わせは、ノードの情報の意味に基づき得る(すなわち内容、意図または題目に基づく)。題目または見出し語、キーワード、または場合によっては、キャッチワードは、1組の関連する辞書または事典のエントリがその下に記載され得る単語とすることができる。
「クラスタ」という用語は、相互に関連する項目、この場合は新規ノードのグループを意味し得る。新規ノードをある特定のクラスタに関係付けるために、新規ノード間の関連エッジの特定の強度または重みをとることができる。クラスタは中心を有し得る。クラスタの中心を定義するための異なる方法が存在し得る。
図1に、本発明の実施形態による、ナレッジ・グラフを作成する方法100のフローチャートを示す。この方法は、複数の新規ノードを受け取るステップ102を含み得る。ステップ104で、エッジのうちのそれぞれ1つのエッジが既存の重みと重ね合わせとを有する、既存エッジによって選択的に接続された既存ノードを含む基礎ナレッジ・グラフを受け取る。ステップ106で、基礎ナレッジ・グラフの既存ノードのうちの選択されたノードの上に新規ノードを重ね合わせて、新規ノードと対応する既存ノードとの対を作成する。
さらに、方法100は、下にある基礎ナレッジ・グラフ内の対応する既存ノードがゼロまたは所定最大数の既存エッジを介した接続を有する場合、新規ノードのうちの少なくとも2つの新規ノードの間に新規の重み、具体的には新規重み値を有する新規エッジを作成することによって新規ノードを接続するステップ108を含むことができ、新規の重みは対応する既存ノード間の接続の既存エッジの既存の重みに基づいて決定される。ステップ110で、基礎ナレッジ・グラフから新規ノードを新規エッジとともに結果のナレッジ・グラフとして切り離す。
図2に、本発明の実施形態による、図1の方法の代替方法200のフローチャートを示す。まず、ステップ202で、インコヒーレント・ノードを比較可能な形式で作成するために、エンティティの、スキャンまたは文字認識あるいはその両方などの前処理を行う。これらの方法は、ワークショップの手書き出力に対して行ってもよい。また、ディスカッションを処理し、情報エンティティを作成するために、スピーチ・ツー・テキスト変換および音声認識を使用してもよい。次に、ステップ204で、インコヒーレント・ノードのそれぞれの内容または意図を判断することができる。このために、1つまたは複数の既存ナレッジ・グラフ、タクソノミーまたは辞書あるいはその組合せとともに、内容解釈のための認知コンピューティング・アルゴリズムを使用してもよく、これは知られている技法によって行うことができる。
このために、方法は、2つの選択可能な手法を使用してもよい。まず、ステップ206で、基礎ナレッジ・グラフのノードの全部またはサブセットの内容/意図を判断し、ステップ208で、各インコヒーレント・ノードの意図の、基礎ナレッジ・グラフのノードの判断された意図とのベスト・マッチ(ファジー・マッチ)を判断する。インコヒーレント・ノードのセットと比較して基礎ナレッジ・グラフ内のノードがはるかに多いため、この処理は、この方法の他のステップと比べた場合、比較的多くの演算時間および演算能力を必要とする。
別の方法として、ステップ210で、基礎ナレッジ・グラフのノードの名前、具体的には既存の名前を使用して、各インコヒーレント・ノードの内容/意図のベスト・マッチ(例えばファジー・マッチ)を判断する。
ステップ212で、選択されたベスト・マッチに従って基礎ナレッジ・グラフにインコヒーレント・ノードを重ね合わせる。次に、ステップ214で、インコヒーレント・ノードのメタデータ(例えば作成者名、時刻)も使用して基礎ナレッジ・グラフの既存の連結を使用することによって、インコヒーレント・ノード間にエッジを作成する。また、ステップ216で、新規に作成されたナレッジ・グラフのクラスタ、具体的には少なくとも1つのクラスタと、クラスタの命名とを特定する。ステップ218で、結果のナレッジ・グラフをユーザに提示するための形態に変換する(例えば、グラフィックで表示可能な形態への変換)。
図3は、本発明の実施形態による、基礎ナレッジ・グラフと関連インコヒーレント・ノード304、306、308のグラフ表現300である。図中の円と、円の間の線とは、基礎ナレッジ・グラフ302のノードとエッジとを表す。基礎ナレッジ・グラフのノードより大きい円は、インコヒーレント・ノードまたは新規ノード304、306、308および310を表し得る。既存の基礎ナレッジ・グラフ302の円の上に六角形をグラフィックでオーバーレイすることによって、基礎ナレッジ・グラフ302の既存ノードとの、それまでリンクされていなかったインコヒーレント・ノード304、306、308および310の重ね合わせを表すことができる。
図4は、本発明の実施形態による、結果のナレッジ・グラフの追加されたリンク/エッジを有する関連コヒーレント・ノードを備えた基礎ナレッジ・グラフ302のグラフ表現400である。各インコヒーレント・ノード(すなわち、図4でA、B、C、Dとして示されている)について、下にある基礎ナレッジ・グラフ302のエッジを隣接するインコヒーレント・ノードに達するまでたどる。別のインコヒーレント・ノードを通る経路によって接続された2つのインコヒーレント・ノードはリンクされなくてもよい。また、所定のクリップ・レベル(すなわち閾値)も適用することができ、例えば、経路の特定の長さ(例えばエッジ数)または特定の累積逆重み(例えば、経路のリンクの逆重みの和)に達した後、リンクの検索を記憶することができる。重なり合わせた六角形のインコヒーレント・ノードの間のエッジは太い点線で示されている。クリップ・レベルを基礎ナレッジ・グラフの4つのエッジに設定することができる。
さらに、結果のナレッジ・グラフのエッジの重みが、基礎ナレッジ・グラフ内にある経路強度の逆数として示され、または、この例では、逆重みの和の逆数によって同様に与えられる。
図4に示すように、経路長が5であるため、AはDにリンクされていない。BとDとの間には別のインコヒーレント・ノードと交差しない経路がないため、経路長クリップ・レベルに関係なくBはDにリンクされない。
インコヒーレント・ノードに複数の経路が接続する場合、最短経路または最大の結果重みを有する経路がとられる。別の例示の実施形態では、重みの和をとることができ、その後、すべての重みが任意により「1」に正規化される。別の例示の実施形態では、最大の重みを有する経路を強調するために重みの二乗の和の乗根がとられ、その後、場合によってすべての重みが「1」に正規化される。
別の例示の実施形態では、結果のナレッジ・グラフのエッジの重みはインコヒーレント・ノードのメタデータに影響される。例えば、2つのノードが同じ作者によるものであるか、またはワークショップ中に同時に作成されている場合、その2つのノード間のリンクの重みが増加される。
別の例示の実施形態では、同じ作者を示すために、所定の重みを有する追加のエッジが追加され得る。
方法の次のステップで、インコヒーレント・ノードのクラスタが特定されて、インコヒーレント・ノードがカテゴリに分類され、各カテゴリのトピックまたはテーマに命名することができる。このために、すべてのノードにスコアとしてエッジの重みの和が与えられる。別の例示の実施形態では、ノードにはエッジの数がスコアとして与えられる。
例示の一実施形態では、クラスタの数を例えばn個に制限することができる(すなわち、それ以降、上位nのスコアを有するn個のノードのみが考慮される)。別の例示の実施形態では、所定の最低スコアを下回るすべてのノードが無視される。さらに別の例示の実施形態では、クラスタ・コア間の最小距離が必要とされてもよい(すなわち、特定の半径内の隣接ノードよりもスコアの低いすべてのノードが無視される)。別の例示の実施形態では、上記の基準の組合せを使用することができる。別の例示の実施形態では、上記の手法を数サイクル適用することができる。
上記の手法をさらに詳しく見るために、次の図について考えてみることができる。
図5は、本発明の実施形態による、基礎ナレッジ・グラフと結果のナレッジ・グラフのグラフィカル表現500であり、エッジの重みも示している。簡単にするために、基礎ナレッジ・グラフは、規則的な格子として示し、すべてのリンクが重み「1」を有する。いずれにしても、経路の重みを重みの積として表すことができるように、重みは「0」と「1」の間の範囲に正規化する必要がある(すなわちより長い経路がより短い経路よりも低い重みを有する)。
既存ナレッジ・グラフのノードよりも大きい円として示されている9個のインコヒーレント・ノードが重ね合わされている。
結果のナレッジ・グラフのエッジ重みとして、基礎ナレッジ・グラフの経路のエッジがとられる。重みの数値が各エッジのすぐ横に示されている。結果のナレッジ・グラフのノード間のエッジは、太い点線で示されている。
図6に、本発明の実施形態による、結果のナレッジ・グラフの他のグラフ表現600を示す。図6は、リンクの重みが同じである、図5の結果のナレッジ・グラフから抽出した部分に過ぎない。
図7に、本発明の実施形態による、ノードのスコアを有する結果のナレッジ・グラフのグラフ表現700を示す。第1の反復回で、各ノードがスコアとしてそのノードのエッジの和を受け取る。この例では、ノードのリンクの重みが2.5に設定され、それによって3つの可能な候補とそれらの間の2つの接続ができる。1つは直接リンク(すなわち、エッジ重み1)であり、1つは合計重み0.25=0.5×0.5を有する、2つのエッジを含む経路であり、これを検証することができる。一例は、最上位ノードが3つのリンクを有し、それぞれの重みが0.5、1、0.3333333...であり、結果ナレッジ・グラフの残りのノードについても計算することができる。
この手法により、3つの可能な候補とそれらの間の2つのエッジとが残る。次の図に記載のように、1つは直接エッジ(すなわち重み1)であり、1つは、合計重み0.25=0.5×0.5を有する、2つのリンクを含む経路である。
図8に、本発明の実施形態による、クラスタの中心の可能な候補の第1のグラフ表現800を示す。図9に、本発明の実施形態による、クラスタの中心の可能な候補の第2のグラフ表現800を示す。図8および図9は、クラスタの中心の可能な候補の実施形態800を示し、なぜなら、この候補が、結果のナレッジ・グラフにおけるすべてのノードのうちで最高のスコアを有するためである。
第2の反復回では、残りのノードを接続するエッジの重みが第1の反復回のノードのスコアに加えられる。この例では、第2の期間の必要最小スコアが4に設定されており、1つのノード(すなわち、スコア4.25を有するノード)だけがクラスタ・コアとして残される。あるいは、クラスタ・コア間の最小距離を2に設定することもできるが、他のいずれの数値も選択可能であり、その結果として2つのクラスタ・コア、すなわちスコア4.25と2.75を有するノードが残ることになる。
クラスタ・コアのカテゴリ名または意図あるいはその両方を選択することができる。
例示の一実施形態では、最も近いクラスタ・コアにノードを割り当てることによってクラスタが形成される。別の例示の実施形態では、クラスタ・コアのスコアは関数としてとられ、例えば重力モデルでは、スコアを距離(例えばノード間のエッジ数またはホップ数で測った距離)の二乗で割った値となる。
非反復的手法として、別の例示の実施形態では、各ノードの周りに所定の半径の円が配置される(すなわち、そのノードから開始する経路を所定のクリップ・レベルである、逆重みの和の所定の閾値に達するまでたどる)。クラスタ・コアは、その与えられた円内に位置する最大数のノードを有するノードとすることができる。
方法の次のステップで、結果のナレッジ・グラフは次にグラフィックで表示可能な形態に変換され、ユーザに提示されることができる。前のインコヒーレント・ノードは、名前付きクラスタに配置され、グループ化される。よりわかりやすくするために、色分けを使用することができる。
クラスタの決定のためのパワー・メータ(例えばクラスタ数、クラスタ・コアに必要な最小スコア、クラスタ間の最小距離、反復回数)を変えることによって、ユーザは異なるカテゴリ化を生成することができる。次に、関連する表現の目的のために特定のカテゴリ化を選択する。
図10に、本発明の実施形態による、結果のナレッジ・グラフを作成するためのシステムのコンポーネント・モデル900のブロック図を示す。情報のエンティティ902が、上述のように標準化形式でインコヒーレント・ノード906を生成するデータ・プリプロセッサ904に渡される。このために、エンティティの形式に応じて、プリプロセッサ904は、スキャン、光学式文字認識、スピーチ・ツー・テキスト、または同様の技法を使用することができる。インテント・マッパ(intent mapper)908と呼ぶコンポーネントが、各インコヒーレント・ノードの意図を捕捉する。例示の一実施形態では、インテント・マッパ908は、マッチング・エンジン914がインコヒーレント・ノード906の意図を基礎ナレッジ・グラフ910のノードの意図と突き合わせるように、基礎ナレッジ・グラフ910のノードの全部またはサブセットの意図も捕捉する。別の実施形態では、マッチング・エンジン914は、関連方法の文脈で前述したように、インコヒーレント・ノード906の意図を基礎ナレッジ・グラフ910のノードの名前または記述または内容あるいはこれらの組合せと突き合わせる。
リンク・エンジン916が、1つの重ね合わされたインコヒーレント・ノードから別の重ね合わされたインコヒーレント・ノードまで基礎ナレッジ・グラフ910のリンクをたどる。リンク・エンジン916は、結果のナレッジ・グラフ912を、基礎ナレッジ・グラフ910とは別個に記憶する。このようにして、結果のナレッジ・グラフ912は、基礎ナレッジ・グラフ910から独立した構造となる。
クラスタ化エンジン918が、クラスタのスコアを識別し、ノード名から名前文字列を選択し、クラスタの周辺のノードをクラスタに割り当てる。
次に、提示モジュール920が、結果のナレッジ・グラフ912のクラスタとノードとリンクとを図示する1つまたは複数のグラフィクスを描画する。ユーザ・インターフェース922が、結果のナレッジ・グラフ912の異なる表示を生成するためにクラスタ化アルゴリズムのパワー・メータをユーザが変更することができるようにする。ユーザは、結果のグラフを変更するために、または、結果のグラフ912の表示を変更するために、ユーザ・コンピューティング・デバイスを使用して結果のナレッジ・グラフ912と対話することができる。
本発明の実施形態は、プラットフォームに関係なく、プログラム・コードを記憶または実行あるいはその両方に適する実質的に任意の種類のコンピュータとともに実装することができる。図11に、本発明の実施形態による、コンピュータ・システムのブロック図を示す。例えば、図11は、提案の方法に関連するプログラム・コードを実行するのに適するか、または図10によるコンポーネント・モデルのコンポーネントのうちの1つまたは複数のコンポーネントとして動作する、コンピュータ・システム1000を示す。
コンピュータ・システム1000は、適合するコンピュータ・システムの一例に過ぎず、本明細書に記載の本発明の実施形態の使用または機能の範囲に関するいかなる限定も示唆することを意図していない。実施形態にかかわらず、コンピュータ・システム1000は、上記の機能セットのいずれも実装または実行可能である。コンピュータ・システム1000内には、多くの他の汎用または特殊目的コンピュータ・システム環境または構成とともに動作可能なコンポーネントがある。コンピュータ・システム/サーバ1000とともに使用するのに適合し得る周知のコンピューティング・システム、環境または構成あるいはその組合せの例としては、パーソナル・コンピュータ・システム、サーバ・コンピュータ・システム、シン・クライアント、シック・クライアント、ハンドヘルド型またはラップトップ・デバイス、マルチプロセッサ・システム、マイクロプロセッサ・ベースのシステム、セット・トップ・ボックス、プログラマブル消費者電子機器、ネットワークPC、ミニコンピュータ・システム、メインフレーム・コンピュータ・システム、および上記のシステムまたはデバイスのいずれかを含む分散クラウド・コンピューティング環境などがあるがこれらには限定されない。コンピュータ・システム/サーバ1000は、コンピュータ・システム1000によって実行されるプログラム・モジュールなどのコンピュータ・システム実行可能命令の一般的な文脈で説明することができる。一般に、プログラム・モジュールは、特定のタスクを実行するかまたは特定の抽象データ・タイプを実装する、ルーチン、プログラム、オブジェクト、コンポーネント、ロジック、データ構造などを含み得る。コンピュータ・システム/サーバ1000は、タスクが通信ネットワークを介してリンクされたリモート処理デバイスによって実行される分散クラウド・コンピューティング環境で実施することもできる。分散クラウド・コンピューティング環境では、プログラム・モジュールを、メモリ・ストレージ・デバイスを含む、ローカル・コンピュータ・システム記憶媒体とリモート・コンピュータ・システム記憶媒体の両方に配置することができる。
図に示すように、コンピュータ・システム/サーバ1000は、汎用コンピューティング・デバイスの形態で示されている。コンピュータ・システム/サーバ1000の構成要素は、1つまたは複数のプロセッサまたは処理ユニット1002と、システム・メモリ1004と、システム・メモリ1004を含む様々なシステム構成要素をプロセッサ1002に接続するバス1006とを含み得るがこれらには限定されない。バス1006は、様々なバス・アーキテクチャのうちのいずれかのアーキテクチャを使用する、メモリ・バスまたはメモリ・コントローラ、ペリフェラル・バス、アクセラレーテッド・グラフィクス・ポート、およびプロセッサ・バスまたはローカル・バスを含む、数種類のバス構造のうちのいずれかの1つまたは複数に相当する。例として、そのようなアーキテクチャとしては、業界標準アーキテクチャ(Industry Standard Architecture:ISA)バス、マイクロ・チャネル・アーキテクチャ(Micro Channel Architecture:MCA)バス、拡張(Enhanced)ISA(EISA)バス、ビデオ・エレクトロニクス・スタンダーズ・アソシエーション(Video Electronics Standards Association:VESA)ローカル・バス、およびペリフェラル・コンポーネント・インターコネクト(Peripheral Component Interconnect:PCI)バスがあるが、これらには限定されない。コンピュータ・システム/サーバ1000は、典型的には様々なコンピュータ/システム可読媒体を含む。そのような媒体は、コンピュータ・システム/サーバ1000がアクセス可能な任意の利用可能な媒体とすることができ、これには揮発性媒体と不揮発性媒体、取り外し可能媒体と取り外し不能媒体の両方が含まれる。
システム・メモリ1004は、ランダム・アクセス・メモリ(RAM)1008またはキャッシュ・メモリ1010あるいはその両方などの、揮発性メモリの形態のコンピュータ・システム可読記憶媒体を含み得る。コンピュータ・システム/サーバ1000は、他の取り外し可能/取り外し不能、揮発性/不揮発性のコンピュータ・システム記憶媒体をさらに含み得る。一例に過ぎないが、ストレージ・システム1012を、取り外し不能な不揮発性磁気媒体(図示されておらず、一般に「ハード・ドライブ」と呼ばれる)の読み書きのために設けることができる。図示されていないが、取り外し可能な不揮発性磁気ディスク(例えば「フロッピィ・ディスク」)の読み書きのための磁気ディスク・ドライブと、CD−ROM、DVD−ROMまたはその他の光学媒体などの、取り外し可能な不揮発性光ディスクの読み書きのための光ディスク・ドライブとを備えることができる。そのような場合、それぞれを1つまたは複数のデータ・メディア・インターフェースによってバス1006に接続することができる。以下でさらに図示し、説明するように、メモリ1004は、本発明の実施形態の機能を実施するように構成された1組の(例えば少なくとも1つの)プログラム・モジュールを有する少なくとも1つのプログラム製品を含み得る。
一例として、1組の(例えば少なくとも1つの)プログラム・モジュール1016を有するプログラム/ユーティリティと、オペレーティング・システムと、1つまたは複数のアプリケーション・プログラムと、その他のプログラム・モジュールと、プログラム・データとをメモリ1004に記憶することができるが、これには限定されない。オペレーティング・システム、1つまたは複数のアプリケーション・プログラム、その他のプログラム・モジュール、およびプログラム・データ、またはその何らかの組合せのそれぞれが、ネットワーキング環境の実装形態を含み得る。プログラム・モジュール1016は、一般に、本明細書に記載の本発明の実施形態の機能または方法あるいはその両方を実施する。
コンピュータ・システム/サーバ1000は、キーボード、ポインティング・デバイス、ディスプレイ1020など、または、ユーザがコンピュータ・システム/サーバ1000とやり取りすることができるようにする1つまたは複数のデバイス、または、コンピュータ・システム/サーバ1000が1つまたは複数の他のコンピューティング・デバイスと通信することができるようにする任意のデバイス(例えばネットワーク・カード、モデムなど)、あるいはその組合せなどの、1つまたは複数の外部デバイス1018とも通信することができる。このような通信は、入出力(I/O)インターフェース1014を介して行うことができる。さらに、コンピュータ・システム/サーバ1000は、ローカル・エリア・ネットワーク(LAN)、または汎用ワイド・エリア・ネットワーク(WAN)、またはパブリック・ネットワーク(例えばインターネット)、あるいはその組合せなどの1つまたは複数のネットワークと、ネットワーク・アダプタ1022を介して通信することができる。図のように、ネットワーク・アダプタ1022は、バス1006を介してコンピュータ・システム/サーバ1000の他の構成要素と通信することができる。なお、図示されていないが、他のハードウェア・コンポーネントまたはソフトウェア・コンポーネントあるいはその両方もコンピュータ・システム/サーバ1000とともに使用することができることを理解されたい。例としては、マイクロコード、デバイス・ドライバ、冗長処理ユニット、外部ディスク・ドライブ・アレイ、RAIDシステム、テープ・ドライブ、およびデータ・アーカイブ・ストレージ・システムなどが含まれるが、これらには限定されない。
本発明の様々な実施形態の説明を例示のために示したが、これらは網羅的であること、または開示されている実施形態に限定することを意図したものではない。記載されている実施形態の範囲から逸脱することなく、多くの変更および変形が当業者には明らかであろう。本明細書で使用されている用語は、実施形態の原理、実際の適用、または市場に見られる技術に優る技術的改良を最もよく説明するために、または当業者が本明細書で開示されている実施形態を理解することができるように選定された。
本発明は、システム、方法またはコンピュータ・プログラム製品あるいはその組合せとして実現することができる。コンピュータ・プログラム製品は、プロセッサに本発明の態様を実施させるためのコンピュータ可読プログラム命令が記憶されたコンピュータ可読記憶媒体(または複数の媒体)を含み得る。
媒体は、伝播媒体の場合は、電子、磁気、光、電磁気、赤外線または半導体システムであってもよい。コンピュー可読媒体の例には、半導体メモリまたはソリッド・ステート・メモリ、磁気テープ、取り外し可能コンピュータ・ディスケット、ランダム・アクセス・メモリ(RAM)、読み取り専用メモリ(ROM)、剛性磁気ディスク、および光ディスクが含まれ得る。光ディスクの現在の例としては、コンパクト・ディスク読み取り専用メモリ(CD−ROM)、コンパクト・ディスク読み取り/書き込み(CD−R/W)、DVD、およびBlu−Ray−Disc(登録商標)が含まれる。
コンピュータ可読記憶媒体は、命令実行デバイスによって使用される命令を保持し、記憶することができる有形デバイスとすることができる。コンピュータ可読記憶媒体は、例えば、電子ストレージ・デバイス、磁気ストレージ・デバイス、光学式ストレージ・デバイス、電磁気ストレージ・デバイス、半導体ストレージ・デバイス、またはこれらの任意の適合する組合せであってよいが、これらには限定されない。コンピュータ可読記憶媒体のより具体的な例の非網羅的なリストには以下のものが含まれる。すなわち、可搬コンピュータ・ディスケット、ハードディスク、ランダム・アクセス・メモリ(RAM)、読み取り専用メモリ(ROM)、消去可能プログラマブル読み取り専用メモリ(EPROMまたはフラッシュ・メモリ)、スタティック・ランダム・アクセス・メモリ(SRAM)、可搬コンパクト・ディスク読み取り専用メモリ(CD−ROM)、デジタル・バーサタイル・ディスク(DVD)、メモリ・スティック、フロッピィ・ディスク、パンチカードまたは命令が記録された溝内の***構造などの機械的に符号化されたデバイス、およびこれらの任意の適合する組合せが含まれる。本明細書で使用されるコンピュータ可読記憶媒体とは、電波またはその他の自由に伝播する電磁波、導波路またはその他の伝送媒体を伝播する電磁波(例えば光ファイバ・ケーブルを通る光パルス)、または電線を介して伝送される電気信号などの、一過性の信号自体であると解釈すべきではない。
本明細書に記載のコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体からそれぞれのコンピューティング/処理デバイスに、または、ネットワーク、例えばインターネット、ローカル・エリア・ネットワーク、ワイド・エリア・ネットワーク、または無線ネットワークあるいはこれらの組合せを介して外部コンピュータまたは外部記憶装置にダウンロードすることができる。ネットワークは、銅伝送ケーブル、光伝送ファイバ、無線伝送、ルータ、ファイアウォール、交換機、ゲートウェイ・コンピュータ、またはエッジ・サーバあるいはこれらの組合せを含み得る。各コンピューティング/処理デバイスにおけるネットワーク・アダプタ・カードまたはネットワーク・インターフェースが、ネットワークからコンピュータ可読プログラム命令を受信し、それらのコンピュータ可読プログラム命令を、それぞれのコンピューティング/処理デバイス内のコンピュータ可読記憶媒体への記憶のために転送する。
本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、インストラクション・セット・アーキテクチャ(ISA)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、または、Smalltalk(R)、C++などのオブジェクト指向プログラミング言語、および「C」プログラミング言語、または同様のプログラム言語などの従来型の手続き型プログラミング言語を含む、1つまたは複数のプログラミング言語の任意の組合せで書かれたソース・コードまたはオブジェクト・コードとすることができる。コンピュータ可読プログラム命令は、スタンドアロン・ソフトウェア・パッケージとして全体がユーザのコンピュータ上でまたは一部がユーザのコンピュータ上で、または一部がユーザのコンピュータ上で一部がリモート・コンピュータ上で、または全体がリモート・コンピュータまたはサーバ上で実行されてもよい。後者の場合、リモート・コンピュータは、ローカル・エリア・ネットワーク(LAN)またはワイド・エリア・ネットワーク(WAN)を含む、任意の種類のネットワークを介してユーザのコンピュータに接続することができ、または接続は(例えば、インターネット・サービス・プロバイダを使用してインターネットを介して)外部コンピュータに対して行ってもよい。実施形態によっては、本発明の態様を実行するために、例えばプログラマブル・ロジック回路、フィールド・プログラマブル・ゲート・アレイ(FPGA)、またはプログラマブル・ロジック・アレイ(PLA)を含む電子回路が、コンピュータ可読プログラム命令の状態情報を使用して電子回路をパーソナライズすることにより、コンピュータ可読プログラム命令を実行することができる。
本発明の態様について、本発明の実施形態による方法、装置(システム)、およびコンピュータ・プログラム製品を示すフローチャート図またはブロック図あるいはその両方の図を参照しながら説明している。フローチャート図またはブロック図あるいはその両方の図の各ブロックおよび、フローチャート図またはブロック図あるいはその両方の図のブロックの組合せは、コンピュータ可読プログラム命令によって実装可能であることはわかるであろう。
これらのコンピュータ可読プログラム命令は、コンピュータまたはその他のプログラマブル・データ処理装置のプロセッサにより実行される命令が、フローチャートまたはブロック図あるいはその両方のブロックで規定されている機能/動作を実装する手段を形成するようなマシンを実現するように、汎用コンピュータ、特殊目的コンピュータ、またはその他のプログラマブル・データ処理装置のプロセッサに供給することができる。これらのコンピュータ可読プログラム命令は、命令が記憶されたコンピュータ可読記憶媒体が、フローチャートまたはブロック図あるいはその両方のブロックで規定されている機能/動作の態様を実装する命令を含む製造品を含むように、コンピュータ、プログラマブル・データ処理装置、またはその他の装置あるいはこれらの組合せに対して特定の方式で機能するように指示することができるコンピュータ可読記憶媒体に記憶することもできる。
コンピュータ可読プログラム命令は、コンピュータ、その他のプログラマブル装置またはその他のデバイス上で実行される命令がフローチャートまたはブロック図あるいはその両方のブロックで規定されている機能/動作を実装するように、コンピュータ、その他のプログラマブル装置、またはその他のデバイス上で一連の動作ステップが実行されるようにするために、コンピュータ、その他のプログラマブル・データ処理装置、またはその他のデバイスにロードされてもよい。
図面中のフローチャートまたはブロック図あるいはその両方は、本発明の様々な実施形態によるシステム、方法およびコンピュータ・プログラム製品の可能な実装形態のアーキテクチャ、機能および動作を示す。なお、フローチャートまたはブロック図の各ブロックは、規定されている論理機能を実装するための1つまたは複数の実行可能命令を含む、命令のモジュール、セグメント、または部分を表すことがある。別の実装形態では、ブロックに記載されている機能は、図に記載されている順序とは異なる順序で行われてもよい。例えば、連続して示されている2つのブロックは、関与する機能に応じて、実際には実質的に並行して実行されてもよく、またはそれらのブロックは場合によっては逆の順序で実行されてもよい。また、ブロック図またはフローチャート図あるいはその両方の図の各ブロック、およびブロック図またはフローチャート図あるいはその両方の図のブロックの組合せは、規定されている機能または動作を実行する特殊目的ハードウェア・ベースのシステムによって実装可能であるか、または特殊目的ハードウェアとコンピュータ命令との組合せを実施することができることもわかるであろう。
一実施形態では、本発明のシステムは、コンピュータ、携帯型デバイスなどのハードウェア・デバイスとすることができるか、またはそれを含み得る。一実施形態では、ハードウェア・デバイスは、(独立して、または組み合わさって)本発明の方法のみを実行するように特殊化された、特殊非汎用ハードウェアおよび回路(すなわち、特殊ディスクリート非汎用アナログ、デジタル、およびロジック・ベースの回路)を含む特殊目的デバイス(例えば、コンピュータ、マシン、携帯型デバイス)であるか、または含む。特殊ディスクリート非汎用アナログ、デジタル、およびロジック・ベースの回路は、特別に設計されたプロプライエタリ・コンポーネント(例えば、本発明の方法のみを実装するように設計された特定用途向け集積回路(ASIC)などの特殊集積回路)を含み得る。
別の実施形態では、提案の発明は、結果のグラフが検索エンジン技術を向上させることができ、それによって、ユーザが追加のウェブサイトまでナビゲートしたり追加の情報検索を行ったりすることを回避することができるようにする場所において関連情報を提供することによって、コンピュータ資源を節減するため、コンピュータ技術に必然的に根ざす技術的問題を解決する。
本発明のコンピュータ・プログラム製品は、コンピュータ可読プログラム・コードが記憶された1つまたは複数のコンピュータ可読ハードウェア記憶装置を含むことができ、上記プログラム・コードは、本発明の方法を実装するためにコンピューティング・システム(またはコンピュータ・システム)の1つまたは複数のプロセッサによって実行可能な命令を含む。
本発明のコンピュータ・システムは、1つまたは複数のプロセッサと、1つまたは複数のメモリと、1つまたは複数のコンピュータ可読ハードウェア記憶装置とを含むことができ、上記1つまたは複数のハードウェア記憶装置は、本発明の方法を実装するために1つまたは複数のメモリを介して1つまたは複数のプロセッサによって実行可能なプログラム・コードを含む。
本発明の様々な実施形態の説明を例示のために示したが、網羅的であること、または開示されている実施形態に限定することを意図したものではない。記載されている実施形態の範囲から逸脱することなく、多くの変更および変形が当業者には明らかであろう。本明細書で使用されている用語は、実施形態の原理、実際の適用、または市場に見られる技術に優る技術的改良を最もよく説明するために、または当業者が本明細書で開示されている実施形態を理解することができるように選定された。

Claims (26)

  1. ナレッジ・グラフを作成するためのコンピュータ実装方法であって、
    コンピュータ・システムのプロセッサによって、複数の新規ノードを受け取る第1の受け取ることと、
    前記プロセッサによって、既存の重みを各エッジが有する既存エッジによって選択的に接続された既存ノードを含む基礎ナレッジ・グラフを受け取る第2の受け取ることと、
    前記プロセッサによって、前記基礎ナレッジ・グラフの前記既存ノードのうちの選択されたノードに前記複数の新規ノードを重ね合わせ、新規ノードと対応する既存ノードとの対を形成することと、
    前記プロセッサによって、下にある前記基礎ナレッジ・グラフ内の対応する既存ノードがゼロまたは所定最大数の既存エッジを介した接続を有する場合に、前記複数の新規ノードのうちの少なくとも2つのノード間に新規の重みを有する新規エッジを形成することによって前記複数の新規ノードを接続することであって、前記新規の重みが前記対応する既存ノード間の接続の前記既存エッジの前記既存の重みに基づいて決定される、前記接続することと、
    前記プロセッサによって、前記基礎ナレッジ・グラフから前記複数の新規ノードを前記新規エッジとともに結果のナレッジ・グラフとして切り離すことと
    を含む、方法。
  2. 重ね合わせることは、前記基礎ナレッジ・グラフの既存ノードの内容に新規ノードの内容をマッピングするために認知コンピューティング方法を使用する、請求項1に記載の方法。
  3. 前記複数の新規ノードの各ノードが少なくとも部分的にテキスト形態の内容を含む、請求項1または2に記載の方法。
  4. 前記複数の新規ノードのうちの2つのノード間の前記新規エッジの重みが、前記既存ナレッジ・グラフの前記2つの対応するノード間に最短の接続を形成するエッジの数によって決定される、請求項1ないし3のいずれかに記載の方法。
  5. 前記複数の新規ノードのうちの2つのノード間の前記新規エッジの重みが、前記既存ナレッジ・グラフの前記2つの対応するノード間に最短の接続を形成するエッジの数の逆数値によって決定される、請求項1ないし3のいずれかに記載の方法。
  6. 前記複数の新規ノードのうちの2つのノード間の前記新規エッジの重みが、前記既存ナレッジ・グラフの前記2つの対応するノード間に最短の接続を形成するエッジの重みの和の逆数値によって決定される、請求項1ないし3のいずれかに記載の方法。
  7. 前記新規ノードにスコアを割り当てることをさらに含む、請求項1ないし6のいずれかに記載の方法。
  8. 前記スコアは、前記新規ノードに接続する前記エッジの前記重みの和として決定される、請求項7に記載の方法。
  9. 前記スコアは、前記新規ノードに接続する前記エッジの数として決定される、請求項7に記載の方法。
  10. 前記結果のナレッジ・グラフにおいてクラスタを形成することをさらに含む、請求項1ないし9のいずれかに記載の方法。
  11. 前記クラスタの中心が、他の新規ノードへの最大数の直接エッジを有する前記新規ノードである、請求項10に記載の方法。
  12. 前記クラスタの中心が、所定の閾値を上回るノード・スコアを有する前記新規ノードである、請求項10に記載の方法。
  13. 前記クラスタの名前が前記クラスタの中心の名前と同じである、請求項10ないし12のいずれかに記載の方法。
  14. システムであって、
    プロセッサと、
    前記プロセッサに結合されたメモリ・デバイスと、
    前記プロセッサに結合され、ナレッジ・グラフを作成する方法を実装するように前記メモリ・デバイスを介して前記プロセッサによって実行可能なプログラム・コードを含むコンピュータ可読記憶装置と
    を含み、前記方法は、
    コンピュータ・システムのプロセッサによって、複数の新規ノードを受け取る第1の受け取ることと、
    前記プロセッサによって、既存の重みを各エッジが有する既存エッジによって選択的に接続された既存ノードを含む基礎ナレッジ・グラフを受け取る第2の受け取ることと、
    前記プロセッサによって、前記基礎ナレッジ・グラフの前記既存ノードのうちの選択されたノードに前記複数の新規ノードを重ね合わせ、新規ノードと対応する既存ノードとの対を形成することと、
    前記プロセッサによって、下にある前記基礎ナレッジ・グラフ内の対応する既存ノードがゼロまたは所定最大数の既存エッジを介した接続を有する場合に、前記複数の新規ノードのうちの少なくとも2つのノード間に新規の重みを有する新規エッジを形成することによって前記複数の新規ノードを接続することであって、前記新規の重みが前記対応する既存ノード間の接続の前記既存エッジの前記既存の重みに基づいて決定される、前記接続することと、
    前記プロセッサによって、前記基礎ナレッジ・グラフから前記複数の新規ノードを前記新規エッジとともに結果のナレッジ・グラフとして切り離すことと
    を含む、システム。
  15. 前記重ね合わせることは、前記基礎ナレッジ・グラフの前記ノードの内容への前記複数の新規ノードの内容のマッピングのために認知コンピューティング・システムを使用する、請求項14に記載のシステム。
  16. 前記複数の新規ノードの各ノードが少なくとも部分的にテキスト形態の内容を含む、請求項14または15に記載のシステム。
  17. 前記複数の新規ノードのうちの2つのノード間の新規エッジの重みが、前記既存ナレッジ・グラフの前記2つの対応するノード間の最短の接続を形成するエッジの数によって決定されるか、または、前記複数の新規ノードのうちの2つのノード間の前記新規エッジの重みが、前記既存ナレッジ・グラフの前記2つの対応するノード間に最短の接続を形成するエッジの数の逆数値によって決定されるか、または前記複数の新規ノードのうちの2つのノード間の前記新規エッジの重みが、前記既存ナレッジ・グラフの前記2つの対応するノード間に最短の接続を形成するエッジの重み付きの数の和の逆数値によって決定される、請求項14ないし16のいずれかに記載のシステム。
  18. 前記新規ノードにスコアを割り当てることをさらに含む、請求項14ないし17のいずれかに記載のシステム。
  19. 前記スコアは、前記新規ノードに接続する前記エッジの前記重みの和として決定される、請求項18に記載のシステム。
  20. 前記スコアは前記新規ノードに接続する前記エッジの和として決定される、請求項18に記載のシステム。
  21. 前記結果のナレッジ・グラフにおいてクラスタを形成することをさらに含む、請求項14ないし20のいずれかに記載のシステム。
  22. 前記クラスタの中心が他の新規ノードへの最大数の直接エッジを有する前記新規ノードである、請求項21に記載のシステム。
  23. 前記クラスタの中心が、所定の閾値を上回るノード・スコアを有する前記新規ノードである、請求項21に記載のシステム。
  24. 前記クラスタの名前が前記クラスタの中心の名前と同じである、請求項21ないし23のいずれかに記載のシステム。
  25. ナレッジ・グラフを作成するためのコンピュータ・プログラム製品であって、
    処理回路によって読み取り可能であり、請求項1ないし13のいずれかに記載の方法を実行するように前記処理回路による実行のための命令を記憶する、コンピュータ可読記憶媒体を含む、コンピュータ・プログラム製品。
  26. コンピュータ可読媒体に記憶され、デジタル・コンピュータの内部メモリにロード可能なコンピュータ・プログラムであって、コンピュータ上で実行されると請求項1ないし13のいずれかに記載の方法を実行するソフトウェア・コード部分を含む、コンピュータ・プログラム。
JP2020528387A 2017-11-27 2018-11-23 基礎ナレッジ・グラフへの重ね合わせによるインコヒーレント・ノードの構造化 Pending JP2021504818A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/822,653 US10740398B2 (en) 2017-11-27 2017-11-27 Structuring incoherent nodes by superimposing on a base knowledge graph
US15/822,653 2017-11-27
PCT/IB2018/059257 WO2019102411A1 (en) 2017-11-27 2018-11-23 Structuring incoherent nodes by superimposing on a base knowledge graph

Publications (1)

Publication Number Publication Date
JP2021504818A true JP2021504818A (ja) 2021-02-15

Family

ID=66631426

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020528387A Pending JP2021504818A (ja) 2017-11-27 2018-11-23 基礎ナレッジ・グラフへの重ね合わせによるインコヒーレント・ノードの構造化

Country Status (6)

Country Link
US (1) US10740398B2 (ja)
JP (1) JP2021504818A (ja)
CN (1) CN111386520A (ja)
DE (1) DE112018005244T5 (ja)
GB (1) GB2581761A (ja)
WO (1) WO2019102411A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10936657B2 (en) * 2018-08-31 2021-03-02 Netiq Corporation Affinity determination using graphs
US10916237B2 (en) * 2019-03-29 2021-02-09 Microsoft Technology Licensing, Llc Training utterance generation
US10867132B2 (en) 2019-03-29 2020-12-15 Microsoft Technology Licensing, Llc Ontology entity type detection from tokenized utterance
US10970278B2 (en) 2019-03-29 2021-04-06 Microsoft Technology Licensing, Llc Querying knowledge graph with natural language input
CN110491106B (zh) * 2019-07-22 2022-03-18 深圳壹账通智能科技有限公司 基于知识图谱的数据预警方法、装置和计算机设备
US11176137B2 (en) 2020-02-19 2021-11-16 Bank Of America Corporation Query processing platform for performing dynamic cluster compaction and expansion
US11714928B2 (en) * 2020-02-27 2023-08-01 Maxon Computer Gmbh Systems and methods for a self-adjusting node workspace
US11640540B2 (en) 2020-03-10 2023-05-02 International Business Machines Corporation Interpretable knowledge contextualization by re-weighting knowledge graphs
CN111984796B (zh) * 2020-07-31 2022-11-04 西安理工大学 一种基于规范知识图谱ifc模型的自动合规性检查方法
CN111966821B (zh) * 2020-08-26 2024-06-04 南京柯基数据科技有限公司 一种基于力学原理的知识图谱可视化方法
US12019681B2 (en) * 2021-05-11 2024-06-25 Start.io Inc. Identifying objects based on free-form text description
US20230342629A1 (en) * 2022-04-26 2023-10-26 Microsoft Technology Licensing, Llc Exploring entities of interest over multiple data sources using knowledge graphs
CN114817575B (zh) * 2022-06-24 2022-09-02 国网浙江省电力有限公司信息通信分公司 基于扩展模型的大规模电力事理图谱处理方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105706083A (zh) * 2013-11-05 2016-06-22 谷歌公司 用于支持查询和预测的结构化用户图
US20170076206A1 (en) * 2015-09-16 2017-03-16 International Business Machines Corporation Cognitive Operations Based on Empirically Constructed Knowledge Graphs

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6778995B1 (en) 2001-08-31 2004-08-17 Attenex Corporation System and method for efficiently generating cluster groupings in a multi-dimensional concept space
US9020947B2 (en) 2011-11-30 2015-04-28 Microsoft Technology Licensing, Llc Web knowledge extraction for search task simplification
JP2015133047A (ja) 2014-01-15 2015-07-23 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
US9607098B2 (en) 2014-06-02 2017-03-28 Wal-Mart Stores, Inc. Determination of product attributes and values using a product entity graph
US10586156B2 (en) * 2015-06-25 2020-03-10 International Business Machines Corporation Knowledge canvassing using a knowledge graph and a question and answer system
JP6578897B2 (ja) 2015-11-10 2019-09-25 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
US10013450B2 (en) * 2015-12-03 2018-07-03 International Business Machines Corporation Using knowledge graphs to identify potential inconsistencies in works of authorship
US10013404B2 (en) 2015-12-03 2018-07-03 International Business Machines Corporation Targeted story summarization using natural language processing
US20170293698A1 (en) * 2016-04-12 2017-10-12 International Business Machines Corporation Exploring a topic for discussion through controlled navigation of a knowledge graph
US9721008B1 (en) * 2016-06-09 2017-08-01 International Business Machines Corporation Recipe generation utilizing natural language processing
US11176325B2 (en) * 2017-06-26 2021-11-16 International Business Machines Corporation Adaptive evaluation of meta-relationships in semantic graphs

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105706083A (zh) * 2013-11-05 2016-06-22 谷歌公司 用于支持查询和预测的结构化用户图
US20170076206A1 (en) * 2015-09-16 2017-03-16 International Business Machines Corporation Cognitive Operations Based on Empirically Constructed Knowledge Graphs

Also Published As

Publication number Publication date
US20190163835A1 (en) 2019-05-30
US10740398B2 (en) 2020-08-11
GB202009501D0 (en) 2020-08-05
DE112018005244T5 (de) 2020-07-02
CN111386520A (zh) 2020-07-07
GB2581761A (en) 2020-08-26
WO2019102411A1 (en) 2019-05-31

Similar Documents

Publication Publication Date Title
JP2021504818A (ja) 基礎ナレッジ・グラフへの重ね合わせによるインコヒーレント・ノードの構造化
JP7127106B2 (ja) 質問応答処理、言語モデルの訓練方法、装置、機器および記憶媒体
US11394667B2 (en) Chatbot skills systems and methods
US20190103111A1 (en) Natural Language Processing Systems and Methods
Bennett et al. Organization in the crowd: Peer production in large-scale networked protests
Stephens Exploring Web 2.0 and libraries
US10152549B1 (en) Providing suggestions to a user based on social activity patterns
CN104933081A (zh) 一种搜索建议提供方法及装置
Conner et al. A picture for the words! textual visualization in big data analytics
US11188193B2 (en) Method and system for generating a prioritized list
US20150248424A1 (en) Sorting and displaying documents according to sentiment level in an online community
Micallef et al. True or false: Studying the work practices of professional fact-checkers
US20170046411A1 (en) Generating structured meeting reports through semantic correlation of unstructured voice and text data
JP7488871B2 (ja) 対話推薦方法、装置、電子機器、記憶媒体ならびにコンピュータプログラム
Scharl et al. Semantic systems and visual tools to support environmental communication
Ahmed et al. Sentiment analysis for smart cities: state of the art and opportunities
Dang et al. What is in a rumour: Combined visual analysis of rumour flow and user activity
Iaconesi et al. Urban acupuncture in the era on ubiquitous media
McGuirk Performing social media analytics with Brandwatch for Classrooms: A platform review
Ye et al. Tooleyes: Fine-grained evaluation for tool learning capabilities of large language models in real-world scenarios
Bratawisnu et al. Association perception customer feedback with text network analysis in social media (case study on internet banking BRI, BCA, Mandiri in Indonesia)
JP6511192B2 (ja) 議論支援システム、議論支援方法、及び議論支援プログラム
Praharaj et al. Measuring collaboration quality through audio data and learning analytics
Haines et al. Mobilising the Energy in Store: stored collections, enthusiast experts and the ecology of heritage
Gunnarsson et al. Automation of audio descriptions of large bar charts for persons with visual impairment: Prototyping and proof of concept

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200603

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20200930

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210423

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20211228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220406

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220705

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230214