JP2021128779A - データ拡張の方法及び装置、機器、記憶媒体 - Google Patents

データ拡張の方法及び装置、機器、記憶媒体 Download PDF

Info

Publication number
JP2021128779A
JP2021128779A JP2021049353A JP2021049353A JP2021128779A JP 2021128779 A JP2021128779 A JP 2021128779A JP 2021049353 A JP2021049353 A JP 2021049353A JP 2021049353 A JP2021049353 A JP 2021049353A JP 2021128779 A JP2021128779 A JP 2021128779A
Authority
JP
Japan
Prior art keywords
triple
subject
prediction
expansion
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021049353A
Other languages
English (en)
Other versions
JP7229291B2 (ja
Inventor
ホアン、ピンピン
Pingping Huang
ワン、チュアン
Quan Wang
チアン、ウェンピン
Wenbin Jiang
ユアン、ポンチョン
Pengcheng Yuan
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2021128779A publication Critical patent/JP2021128779A/ja
Application granted granted Critical
Publication of JP7229291B2 publication Critical patent/JP7229291B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/29Graphical models, e.g. Bayesian networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/042Knowledge-based neural networks; Logical representations of neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Fuzzy Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】本発明の実施例は、データ拡張の方法及び装置、機器、記憶媒体を開示し、ナレッジグラフ技術の分野に関する。
【解決手段】当該方法の一具体的な実施形態は、ナレッジグラフからトリプルを取得することと、前記ナレッジグラフから前記トリプルにおける関係と等価な関係パスをマイニングし、ここで、前記関係パスは、前記トリプルのうちのサブジェクトおよびオブジェクトをそれぞれ始点及び終点とすることと、前記関係パスに基づいて前記トリプルを展開することにより、展開トリプルを生成することと、を含む。当該実施形態は、ナレッジグラフにおけるトリプルに対する拡張を実現し、トリプルのうちのサブジェクトおよびオブジェクトのより大きな文脈における関連付けを強化し、トリプルのうちのサブジェクトとオブジェクトとの間の関連付けをより大域的になるようにする。
【選択図】図2

Description

本発明の実施例は、コンピュータ技術の分野に関し、具体的にはナレッジグラフ技術の分野に関する。
ナレッジグラフは、ナレッジドメイン可視化またはナレッジ領域マッピングマップとも呼ばれ、ナレッジ発展プロセスと構造関係を示す一連の様々な異なるグラフであり、可視化技術でナレッジリソースおよびそのキャリアを説明し、ナレッジおよびそれらの間の相互関係をマイニング、分析、構築、描画、表示する。
ナレッジグラフは、世界の現実的なナレッジを説明する有向グラフ構造のナレッジベースであり、その基本的な構成は、トリプル(S、P、O)である。ここで、S(subject)およびO(object)は、ナレッジグラフにおけるノードであり、エンティティを表す。Sは、具体的にサブジェクトを表し、Oは、具体的にオブジェクトを表す。P(predication)は、ナレッジグラフにおける2つのエンティティ(SとO)を結ぶエッジであり、2つのエンティティ間の関係を表す。従来のナレッジグラフでは、2つのエンティティ間の関連付けは、この2つのエンティティを直接に結ぶエッジPによって表され、表される関連付けは、比較的局所的である。
本発明の実施例では、データ拡張の方法及び装置、機器、記憶媒体を提案する。
第1の態様において、本発明の実施例は、ナレッジグラフからトリプルを取得することと、ナレッジグラフからトリプルにおける関係と等価な関係パスをマイニングし、ここで、関係パスは、トリプルのうちのサブジェクトおよびオブジェクトをそれぞれ始点及び終点とすることと、関係パスに基づいてトリプルを展開することにより、展開トリプルを生成することと、を含むデータ拡張の方法に関する。
第2の態様において、本発明の実施例は、ナレッジグラフからトリプルを取得するように構成される第1の取得モジュールと、ナレッジグラフからトリプルにおける関係と等価な関係パスをマイニングするように構成され、ここで、関係パスは、トリプルのうちのサブジェクトおよびオブジェクトをそれぞれ始点及び終点とするマイニングモジュールと、関係パスに基づいてトリプルを展開することにより、展開トリプルを生成するように構成される展開モジュールと、を含むデータ拡張の装置に関する。
第3の態様において、本発明の実施例は、少なくとも1つのプロセッサと、少なくとも1つのプロセッサに通信接続されたメモリと、を含み、ここで、メモリには、少なくとも1つのプロセッサによって実行可能な指令が記憶され、指令が少なくとも1つのプロセッサによって実行されることにより、第1の態様のいずれかの実施形態で説明された方法を少なくとも1つのプロセッサに実行させる電子機器に関する。
第4の態様において、本発明の実施例は、コンピュータ指令が記憶された非一時的コンピュータ可読記憶媒体であって、コンピュータ指令は、第1の態様のいずれかの実施形態で説明された方法をコンピュータに実行させるために使用される非一時的コンピュータ可読記憶媒体に関する。
第5の態様において、本発明の実施例は、コンピュータプログラムであって、プロセッサにより実行されると、第1の態様のいずれかの実施形態で説明された方法をコンピュータに実行させるコンピュータプログラムに関する。
本発明の実施例によるデータ拡張の方法及び装置、機器、記憶媒体は、まず、ナレッジグラフからトリプルを取得し、次に、ナレッジグラフからトリプルにおける関係と等価な関係パスをマイニングし、最後に、関係パスに基づいてトリプルを展開することにより、展開トリプルを生成する。ナレッジグラフにおけるトリプルに対する拡張を実現し、トリプルのうちのサブジェクトおよびオブジェクトのより大きな文脈における関連付けを強化し、トリプルのうちのサブジェクトとオブジェクトとの間の関連付けをより大域的になるようにする。
本明細書で記載された内容は、本開示の実施例のキーまたは重要な特徴を特定することを意図したものではなく、本開示の範囲を制限するものでもないことを理解すべきである。本開示の他の特徴は、以下の説明によって容易に理解される。
本発明のその他の特徴、目的および利点をより明確にするために、以下の図面を参照してなされた非限定的な実施例の詳細な説明を参照する。図面は、本技術案をよりよく理解するために使用され、本発明に対する限定を構成しない。
本発明が適用可能な例示的なシステムアーキテクチャ図である。 本発明によるデータ拡張の方法の一実施例のフローチャートである。 本発明の実施例のデータ拡張の方法を実現することができるシーン図である。 本発明によるデータ拡張の方法の別の実施例のフローチャートである。 本発明によるデータ拡張の装置の一実施例の概略構成図である。 本発明の実施例のデータ拡張の方法を実現するための電子機器のブロック図である。
以下、図面に関連して本発明の例示的な実施例を説明し、理解を容易にするための本発明の実施例の様々な詳細を含み、それらは単なる例示的なものと見なされるべきである。したがって、当業者は、本発明の範囲および精神から逸脱することなく、本明細書に記載された実施例に対して様々な変更および修正を行うことができることを認識すべきである。同様に、明確かつ簡明にするために、以下の説明では、公知の機能および構造に対する説明が省略される。
なお、矛盾しない場合には、本発明の実施例及び実施例における特徴が互いに組み合わせることができる。以下、図面を参照して、実施例に合わせて本発明を詳細に説明する。
図1には、本発明が適用され得る、データ拡張の方法又はデータ拡張の装置の実施例の例示的なシステムアーキテクチャ100が示されている。
図1に示すように、システムアーキテクチャ100は、データベースサーバー101、ネットワーク102およびサーバー103を含むことができる。ネットワーク102は、データベースサーバー101とサーバー103との間に通信リンクの媒体を提供するために使用される。ネットワーク102は、例えば有線、無線通信リンク、または光ファイバケーブルなどの様々な接続タイプを含むことができる。
データベースサーバー101は、ナレッジグラフを記憶し、ネットワーク102を介してナレッジグラフをサーバー103に提供することができる。
サーバー103は、様々なサービスを提供するものであってもよい。例えば、サーバー103は、データベースサーバー101から取得されたナレッジグラフなどのデータに対し分析などの処理を行い、処理結果(例えば展開トリプル)を生成することができる。
なお、サーバー103は、ハードウェアでもソフトウェアでもよい。サーバー103がハードウェアである場合、複数のサーバーからなる分散型サーバークラスターとして実現されてもよく、単一のサーバーとして実現されてもよい。サーバー103がソフトウェアである場合、複数のソフトウェアまたはソフトウェアモジュール(例えば分散型サービスを提供する)として実現されてもよく、単一のソフトウェアまたはソフトウェアモジュールとして実現されてもよい。ここで、具体的に限定しない。
なお、本発明の実施例によるデータ拡張の方法は、一般的にサーバー103によって実行され、これに対応して、データ拡張の装置は、一般的にサーバー103に配置されている。
図1のデータベースサーバー、ネットワーク、およびサーバーの数は単なる例示であることを理解すべきである。必要に応じて、任意の数のデータベースサーバー、ネットワーク、およびサーバーを備えることができる。サーバー103にナレッジグラフが記憶された場合、システムアーキテクチャ100には、データベースサーバー101およびネットワーク102を設けなくてもよい。
続けて図2を参照すると、本発明によるデータ拡張の方法の一実施例のフロー200が示されている。当該データ拡張の方法は、以下のステップを含む。
ステップ201において、ナレッジグラフからトリプルを取得する。
本実施例において、データ拡張の方法の実行主体(例えば図1に示されたサーバー103)は、ナレッジグラフからトリプルを取得することができる。ここで取得されたトリプルは、ナレッジグラフにおける任意のトリプルであることができる。
通常、ナレッジグラフは、世界の現実的なナレッジを説明する有向グラフ構造のナレッジベースであり、その基本的な構成は、トリプル(S、P、O)である。ここで、SおよびOは、ナレッジグラフにおけるノードであり、エンティティを表す。Sは、具体的にサブジェクトを表し、Oは、具体的にオブジェクトを表す。Pは、ナレッジグラフにおける2つのエンティティ(SとO)を結ぶエッジであり、2つのエンティティ間の関係を表す。例えば、トリプル(A、娘、B)に対して、Aはサブジェクトであり、Bはオブジェクトであり、娘はAとBとの間の関係であり、BがAの娘であることを表す。
ステップ202において、ナレッジグラフからトリプルにおける関係と等価な関係パスをマイニングする。
本実施例において、上記実行主体は、ナレッジグラフからトリプルにおける関係と等価な関係パスをマイニングすることができる。ここで、関係パスは、ナレッジグラフにおける少なくとも1つのエッジで接続されたパスであってもよく、且つ関係パスは、トリプルのうちのサブジェクトおよびオブジェクトをそれぞれ始点及び終点とする。
通常、関係パスは、様々なマイニングツールによってマイニングされることができる。例えば、統計共起に基づくルールマイニングツールamiePlusが挙げられる。そのマイニングプロセスは、以下の通りである。まず、ナレッジグラフからトリプル(S、P、O)におけるサブジェクトおよびオブジェクトと統計共起する他のトリプルシーケンスをマイニングし、次に、他のトリプルシーケンスにおける関係を順序的に組み合わせることにより、関係パスpathを生成する。ここで、他のトリプルシーケンスにおける関係に対応するエッジは、端と端とがつながり、且つ他のトリプルシーケンスにおける最初の他のトリプルのうちのエンティティは、トリプル(S、P、O)のうちのサブジェクトSを含み、最後の他のトリプルのうちのエンティティは、トリプル(S、P、O)のうちのオブジェクトOを含む。例えば、ナレッジグラフには、(A、娘、B)、(B、母、C)、(C、夫、A)の複数のトリプルがある。ここで、(A、娘、B)は、BがAの娘であることを表し、(B、母、C)は、CがBの母であることを表し、(C、夫、A)は、AがCの夫であることを表す。トリプル(A、娘、B)に対して、AおよびBと統計共起するトリプルシーケンスは、(C、夫、A)→(B、母、C)であり、関係「娘」と関係パスは、「夫-1→母-1」と等価である。ここで、上付き文字「-1」が付いている関係の方向は、上付き文字「-1」が付いていない関係の方向と反対である。
ステップ203において、関係パスに基づいてトリプルを展開することにより、展開トリプルを生成する。
本実施例において、上記実行主体は、関係パスに基づいてトリプルを展開することにより、展開トリプルを生成することができる。通常、展開トリプルは、トリプルのうちの少なくとも1つのエンティティと同じである。例えば、展開トリプルは、トリプルのうちのサブジェクトと同じである。
本実施例のいくつかの選択可能な実施形態において、上記実行主体は、関係パスpathを利用してトリプル(S、P、O)における関係Pを置き換えることにより、展開トリプル(S、path、O)を生成することができる。例えば、関係パス「夫-1→母-1」を利用してトリプル(A、娘、B)における関係「娘」を置き換えることにより、展開トリプル(A、夫-1→母-1、B)を生成する。
本実施例のいくつかの選択可能な実施形態において、上記実行主体は、まず、トリプル(S、P、O)のうちのサブジェクトSを起点として関係パスpathを巡回することにより、トリプル(S、P、O)のうちのオブジェクトOと異なる他のオブジェクトO’を得て、次に、関係パスpathを利用してトリプル(S、P、O)における関係Pを置き換え、且つ他のオブジェクトO’を利用してトリプル(S、P、O)のうちのオブジェクトOを置き換えることにより、展開トリプル(S、path、O’)を生成する。例えば、ナレッジグラフにはトリプル(A、娘、E)、(E、母、C)も存在する。トリプル(A、娘、B)のうちのサブジェクトAを起点として関係パス「夫-1→母-1」を巡回する場合、トリプル(A、娘、B)のうちのオブジェクトBと異なる他のオブジェクトEを得ることもできる。関係パス「夫-1→母-1」を利用してトリプル(A、娘、B)における関係「娘」を置き換えると同時に、オブジェクトを利用してトリプル(A、娘、B)のうちのオブジェクトBを置き換えることにより、展開トリプル(A、夫-1→母-1、E)を生成する。
本発明の実施例によるデータ拡張の方法及び装置、機器、記憶媒体は、まず、ナレッジグラフからトリプルを取得し、次に、ナレッジグラフからトリプルにおける関係と等価な関係パスをマイニングし、最後に、関係パスに基づいてトリプルを展開することにより、展開トリプルを生成する。ナレッジグラフにおけるトリプルに対する拡張を実現し、トリプルのうちのサブジェクトおよびオブジェクトのより大きな文脈における関連付けを強化し、トリプルのうちのサブジェクトとオブジェクトとの間の関連付けをより大域的になるようにする。
理解を容易にするために、以下、本発明の実施例のデータ拡張の方法を実現することができるシーンを提供する。図3に示すように、ナレッジグラフには、(A、娘、B)、(B、母、C)、(C、夫、A)、(D、国王、A)、(D、皇后、C)の複数のトリプルがある。ここで、(A、娘、B)は、BがAの娘であることを表し、(B、母、C)は、CがBの母であることを表し、(C、夫、A)は、AがCの夫であることを表し、(D、国王、A)は、AがDの国王であることを表し、(D、皇后、C)は、CがDの皇后であることを表す。トリプル(C、夫、A)に対して、関係「夫」と関係パスは、「母-1→娘-1」と等価であり、トリプル(C、夫、A)に対応する展開トリプルは、(C、母-1→娘-1、A)である。トリプル(D、皇后、C)に対して、関係「皇后」と関係パスは、「国王→夫-1」と等価であり、トリプル(D、皇后、C)に対応する展開トリプルは、(D、国王→夫-1、C)である。トリプル(B、母、C)に対して、関係「母」と関係パスは、「娘-1」と等価であり、トリプル(B、母、C)に対応する展開トリプルは、(B、娘-1、C)である。ここで、上付き文字「-1」が付いている関係の方向は、上付き文字「-1」が付いていない関係の方向と反対である。
さらに図4を参照すると、本発明によるデータ拡張の方法の別の実施例のフロー400が示されている。当該データ拡張の方法は、以下のステップを含む。
ステップ401において、ナレッジグラフからトリプルを取得する。
ステップ402において、ナレッジグラフからトリプルにおける関係と等価な関係パスをマイニングする。
ステップ403において、関係パスに基づいてトリプルを展開することにより、展開トリプルを生成する。
本実施例において、ステップ401〜403の具体的な動作は、図2に示された実施例のステップ201〜203において詳細に説明され、ここで説明を省略する。
ステップ404において、トリプルと展開トリプルをそれぞれ訓練サンプルとして、訓練サンプルセットに追加する。
本実施例において、データ拡張の方法の実行主体(例えば図1に示されたサーバー103)は、ナレッジグラフにおける大部分のトリプルと対応する展開トリプルをそれぞれ訓練サンプルとして、訓練サンプルセットに追加することができる。ここで、トリプルは訓練サンプルであり、拡張トリプルも訓練サンプルである。従来技術ではナレッジグラフにおけるトリプルのみを訓練サンプルとするのに対し、訓練サンプルセットの内容を豊かにする。ちなみに、拡張トリプルも訓練サンプルとすることにより、訓練サンプルセットにおける関係パスと関係との対応関係が強化され、訓練サンプルにおけるサブジェクトとオブジェクトとの間の関連付けをより大域的になるようにする。
ステップ405において、訓練サンプルセットにおける訓練サンプルについて、サブジェクトまたはオブジェクトが欠落している当該訓練サンプルを入力として、欠落しているサブジェクトまたはオブジェクトを出力として、訓練を監督することにより、予測モデルを得る。
本実施例において、上記実行主体は、トリプルと拡張トリプルの両方を含む訓練サンプルセットを利用して訓練待ちのモデルに対して訓練を監督することにより、予測モデルを得る。具体的に、訓練サンプルセットにおける訓練サンプルについて、上記実行主体は、訓練サンプルセットにおける訓練サンプルについて、サブジェクトまたはオブジェクトが欠落している当該訓練サンプルを入力として、欠落しているサブジェクトまたはオブジェクトを出力として、訓練待ちのモデルに対して訓練を監督することにより、予測モデルを得る。例えば、訓練サンプルセットにおける(S、P、O)と拡張トリプル(S、path、O)、(S、path、O’) について、(S、P、?)を入力とし、Oを出力とし、(S、path、?)を入力とし、OまたはO’を出力とし、(?、P、O)、(?、path、O)および(?、path、O’)を入力とし、Sを出力とし、訓練待ちのモデルに対して訓練を監督することにより、予測モデルを得る。ここで、訓練待ちのモデルは、例えばpathRNNモデル、CompTansEモデルなどの様々な関係をサポートするシーケンスデータの任意のモデルであってもよい。
トリプルと拡張トリプルを利用して予測モデルを訓練することにより、予測モデルが表現学習を行う際に学習した関係と関係パスとの間の対応関係、及びより大きなコンテキストにおける遠いサブジェクトSとオブジェクトO’との間の関連関係が強化される。
ステップ406において、予測トリプルを取得する。
本実施例において、上記実行主体は、予測トリプルを取得することができる。ここで、予測トリプルは、サブジェクトまたはオブジェクトが欠落し、例えば(S、P、?)または(?、P、O)が挙げられている。予測トリプルは、ナレッジグラフにおけるごく一部のトリプルであってもよい。通常、予測トリプルは、訓練サンプルセットにおけるトリプルと異なる。
ステップ407において、ナレッジグラフに基づいて、予測トリプルに対応する予測展開トリプルを確定する。
本実施例において、上記実行主体は、ナレッジグラフに基づいて、予測トリプルに対応する予測展開トリプルを確定することができる。通常、予測展開トリプルは、データ拡張の方法により予測トリプルを展開することで取得されることもできる。例えば、予測トリプル(S、P、?)または(?、P、O)について、その対応する予測展開トリプルは、(S、path、?)または(?、path、O)であってもよい。
ステップ408において、予測トリプルと予測展開トリプルをそれぞれ予測モデルに入力することにより、予測トリプルと予測展開トリプルに対応する予測サブジェクトまたはオブジェクトの信頼度を得る。
本実施例において、上記実行主体は、予測トリプルと予測展開トリプルをそれぞれ予測モデルに入力することにより、予測トリプルと予測展開トリプルに対応する予測サブジェクトまたはオブジェクトの信頼度を得ることができる。通常、予測トリプルを予測モデルに入力することにより、予測トリプルに対応する予測サブジェクトまたはオブジェクトの信頼度を出力することができる。即ち、予測トリプルに欠落したサブジェクトまたはオブジェクトが各エンティティに属する信頼度である。同様に、予測展開トリプルを予測モデルに入力することにより、予測展開トリプルに対応する予測サブジェクトまたはオブジェクトの信頼度を出力することができる。即ち、予測展開トリプルに欠落したサブジェクトまたはオブジェクトが各エンティティに属する信頼度である。
ステップ409において、予測トリプルと予測展開トリプルに対応する予測サブジェクトまたはオブジェクトの信頼度の平均値を計算し、予測トリプルの欠落しているサブジェクトまたはオブジェクトを確定する。
本実施例において、上記実行主体は、予測トリプルと予測展開トリプルに対応する予測サブジェクトまたはオブジェクトの信頼度の平均値を計算し、予測トリプルの欠落しているサブジェクトまたはオブジェクトを確定することができる。通常、上記実行主体は、予測トリプルと予測展開トリプルに欠落したサブジェクトまたはオブジェクトが各エンティティに属する平均信頼度を計算することにより、欠落したサブジェクトまたはオブジェクトを確定することができる。
予測モデルの訓練と予測の両方にナレッジグラフによって拡張されたデータセットを使用する。従来の技術では、単一のトリプル(S、P、O)粒度のモデルに基づいて訓練し、判別関数f(S、P、O)を最適化することだけを目標として、(S、P、O)が成立している事実(f(S、P、O)=1)であるか、成立していない事実(f(S、P、O)=0)であるかをモデルに判断させることができることに比べて、予測モデルの分類結果をより解釈可能にすることで、関係パスを介してトリプルが成立するかどうかをテストする推論の中間論理の解釈を容易にすることができる。例えば、拡張された訓練サンプルセットを利用して訓練された予測モデルは、トリプル(S、P、O)が成立しているかどうかを判断するだけでなく、トリプル(S、P、O)における関係Pに対応する関係パスpathに基づいて、トリプル(S、P、O)を解釈することができる。
予測モデルの訓練と予測の際に、離散記号で表されたトリプルまたは展開トリプルを入力するとき、予測モデルは、入力されたエンティティと関係を連続ベクトルに変換して、ナレッジグラフ表現を得ることができる。予測モデルは、まず、エンティティに対応する連続ベクトルと関係に対応する連続ベクトルに基づいて、欠落したエンティティの連続ベクトルを予測し、次に、予測された欠落したエンティティの連続ベクトルに基づいて、欠落したエンティティを確定する。ここで、ナレッジグラフ表現は、ナレッジグラフにおける離散記号のエンティティと関係を連続ベクトルの形で表現するものである。連続ベクトルは、ナレッジグラフにおけるエンティティの構造上のキー情報を保持することができる一方、下流のアプリケーションタスクによる知識の利用に便利であることを示している。現在、情報抽出、問答、読解などの任務において、ナレッジグラフは、ベクトルの形で適用され、役割を果たしている。展開トリプルを用いて訓練サンプルセットを拡張することで、ナレッジグラフ表現学習の効果を向上させ、予測モデルによるナレッジグラフの利用に有利である。
図4から分かるように、図2に対応する実施例と比較して、本実施例におけるデータ拡張の方法のフロー400には、モデルを訓練するステップ及びモデルを予測するステップを追加する。したがって、本実施例で説明された技術案では、第1の態様において、展開トリプルを用いて訓練サンプルセットを拡張することで、訓練サンプルセットにおける内容を豊かにする。ちなみに、拡張トリプルも訓練サンプルとすることにより、訓練サンプルセットにおける関係パスと関係との対応関係が強化され、訓練サンプルにおけるサブジェクトとオブジェクトとの間の関連付けをより大域的になるようにする。第2の態様において、拡張された訓練サンプルセットを用いて予測モデルを訓練することで、予測モデルが表現学習を行う際に学習した関係と関係パスとの間の対応関係が強化され、複数の関係間の相関が強くなり、この結果、予測モデルの効果を向上させる。第3の態様において、モデルテストの際に、トリプルをテストすることに対し対応する関係パスを展開し、分類結果の計算に一緒に参加して、予測モデルの分類結果をより解釈可能にすることで、関係パスを介してトリプルが成立するかどうかをテストする推論の中間論理の解釈を容易にする。
さらに図5を参照して、上記の各図に示された方法の実現として、本開示はデータ拡張の装置の一実施例を提供し、当該装置の実施例は、図2に示す方法実施例に対応し、当該装置は、具体的に様々な電子機器に適用できる。
図5に示すように、本実施例に係るデータ拡張の装置500は、第1の取得モジュール501と、マイニングモジュール502と、展開モジュール503とを含む。ここで、第1の取得モジュール501は、ナレッジグラフからトリプルを取得するように構成される。マイニングモジュール502は、ナレッジグラフからトリプルにおける関係と等価な関係パスをマイニングするように構成され、ここで、関係パスは、トリプルのうちのサブジェクトおよびオブジェクトをそれぞれ始点及び終点とする。展開モジュール503は、関係パスに基づいてトリプルを展開することにより、展開トリプルを生成するように構成される。
本実施例において、データ拡張の装置500において、第1の取得モジュール501、マイニングモジュール502、及び展開モジュール503の具体的な処理およびそれによる技術的効果について、図2の対応する実施例におけるステップ201〜203の関連説明をそれぞれ参照することができ、ここでは説明を省略する。
本実施例のいくつかの選択可能な実施形態において、マイニングモジュール502は、さらに、ナレッジグラフから、トリプルのうちのサブジェクトおよびオブジェクトと統計共起する他のトリプルシーケンスをマイニングし、他のトリプルシーケンスにおける関係を順序的に組み合わせることにより、関係パスを生成するように構成される。
本実施例のいくつかの選択可能な実施形態において、展開モジュール503は、さらに、関係パスを利用してトリプルにおける関係を置き換えることにより、展開トリプルを生成するように構成される。
本実施例のいくつかの選択可能な実施形態において、展開モジュール503は、さらに、トリプルのうちのサブジェクトを起点として関係パスを巡回することにより、トリプルのうちのオブジェクトと異なる他のオブジェクトを得て、関係パスを利用してトリプルにおける関係を置き換え、且つ他のオブジェクトを利用してトリプルのうちのオブジェクトを置き換えることにより、展開トリプルを生成するように構成される。
本実施例のいくつかの選択可能な実施形態において、データ拡張の装置500は、トリプルと展開トリプルをそれぞれ訓練サンプルとして、訓練サンプルセットに追加するように構成される追加モジュール(図示せず)と、訓練サンプルセットにおける訓練サンプルについて、サブジェクトまたはオブジェクトが欠落している当該訓練サンプルを入力として、欠落しているサブジェクトまたはオブジェクトを出力として、訓練を監督することにより、予測モデルを得るように構成される訓練モジュール(図示せず)と、をさらに含む。
本実施例のいくつかの選択可能な実施形態において、データ拡張の装置500は、予測トリプルを取得するように構成され、ここで、予測トリプルは、サブジェクトまたはオブジェクトが欠落している第2の取得モジュール(図示せず)と、ナレッジグラフに基づいて、予測トリプルに対応する予測展開トリプルを確定するように構成される確定モジュール(図示せず)と、予測トリプルと予測展開トリプルをそれぞれ予測モデルに入力することにより、予測トリプルと予測展開トリプルに対応する予測サブジェクトまたはオブジェクトの信頼度を得るように構成される予測モジュール(図示せず)と、予測トリプルと予測展開トリプルに対応する予測サブジェクトまたはオブジェクトの信頼度の平均値を計算し、予測トリプルの欠落しているサブジェクトまたはオブジェクトを確定するように構成される計算モジュール(図示せず)と、をさらに含む。
本発明の実施例によると、本発明は、電子機器及び可読記憶媒体をさらに提供する。
図6に示すように、本発明の実施例のデータ拡張の方法による電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、作業台、パーソナルデジタルアシスタント、サーバー、ブレードサーバ、大型コンピュータ、および他の適切なコンピュータのような様々な形態のデジタルコンピュータを表すことを意図している。電子機器は、パーソナルデジタル処理、携帯電話、スマートフォン、ウェアラブルデバイス、および他の類似のコンピューティングデバイスのような様々な形態のモバイルデバイスを表すこともできる。本明細書に示された部品、それらの接続および関係、およびそれらの機能は、単なる例にすぎ、本明細書で説明されおよび/または要求されている本発明の実現を制限することを意図しない。
図6に示すように、当該電子機器は、少なくとも1つのプロセッサ601と、メモリ602と、高速インターフェースと低速インターフェースを含む各部品を接続するためのインターフェースとを含む。各部品は、異なるバスを利用して互いに接続され、共通マザーボードに取り付けられてもよいし、必要に応じて他の方法で取り付けられてもよい。プロセッサは、GUIのグラフィカル情報を外部入力/出力装置(例えば、インタフェースにカップリングされた表示装置)に表示するためのメモリ内またはメモリ上に記憶された命令を含む、電子機器内で実行された指令を処理することができる。他の実施形態では、必要に応じて、複数のプロセッサおよび/または複数のバスを複数のメモリおよび複数のメモリとともに使用することができる。同様に、複数の電子機器を接続してもよく、各機器は、部分的に必要な動作(例えば、サーバアレイ、1組のブレードサーバ、またはマルチプロセッサシステムとして)を提供する。図6では、1つのプロセッサ601を例にとる。
メモリ602は、本発明による非一時的コンピュータ可読記憶媒体である。ここで、前記メモリは、少なくとも1つのプロセッサによって実行され得る指令を記憶することにより、本発明によるデータ拡張の方法を前記少なくとも1つのプロセッサに実行させる。本発明の非一時的コンピュータ可読記憶媒体は、コンピュータ指令を記憶し、当該コンピュータ指令は、本発明によるデータ拡張の方法をコンピュータに実行させるために使用される。
メモリ602は、非一時的コンピュータ可読記憶媒体として、本発明の実施例におけるデータ拡張の方法に対応するプログラム指令/モジュール(例えば、図5に示された第1の取得モジュール501、マイニングモジュール502、及び展開モジュール503)のような、非一時的ソフトウェアプログラム、非一時的コンピュータ実行可能プログラム、およびモジュールを記憶するために使用されることができる。プロセッサ601は、メモリ602に記憶された非一時的ソフトウェアプログラム、指令およびモジュールを実行することにより、サーバーの様々な機能アプリケーションおよびデータ処理を実行し、すなわち、上述した方法の実施例におけるデータ拡張の方法が実現される。
メモリ602は、プログラム記憶領域およびデータ記憶領域を含むことができ、ここで、プログラム記憶領域は、オペレーティングシステム、少なくとも1つの機能に必要なアプリケーションプログラムを記憶することができ、データ記憶領域は、データ拡張の方法による電子機器の使用によって作成されたデータなどを記憶することができる。また、メモリ602は、高速ランダムアクセスメモリを含むことができ、例えば少なくとも1つの磁気ディスク記憶装置、フラッシュメモリ装置、または他の非一時的固体記憶装置などの非一時的メモリを含むこともできる。いくつかの実施例では、選択肢の一つとして、メモリ602は、プロセッサ601に対して遠隔的に配置されたメモリを含むことができ、これらの遠隔メモリは、ネットワークを介してデータ拡張の方法の電子機器に接続されることができる。上記のネットワークの例は、インターネット、企業内ネットワーク、ローカルエリアネットワーク、モバイル通信ネットワークおよびその組み合わせを含むが、これらに限定されない。
データ拡張の方法の電子機器は、入力装置603および出力装置604をさらに含むことができる。プロセッサ601、メモリ602、入力装置603および出力装置604は、バスまたは他の方法で接続されることができ、図6では、バスで接続されることを例にとる。
入力装置603は、入力された数字または文字メッセージを受信し、データ拡張の方法の電子機器のユーザ設定および機能制御に関するキー信号入力を生成することができ、例えばタッチスクリーン、キーパッド、マウス、トラックボード、タッチパッド、指示棒、1つ以上のマウスボタン、トラックボール、ジョイスティックなどの入力装置が挙げられる。出力装置604は、表示装置、補助照明装置(例えば、LED)、および触覚フィードバック装置(例えば、振動モータ)などを含むことができる。当該表示装置は、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ、およびプラズマディスプレイを含むことができるが、これらに限定されない。いくつかの実施例では、表示装置は、タッチスクリーンであってもよい。
ここで説明されたシステムおよび技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、専用ASIC(専用集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、および/またはこれらの組み合わせにおいて実現されることができる。これらの様々な実施形態は、以下の内容を含むことができ、即ち、1つ以上のコンピュータプログラムに実施され、当該1つ以上のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステム上で実行および/または解釈されることができ、当該プログラマブルプロセッサは、専用または汎用プログラマブルプロセッサであってもよく、記憶システム、少なくとも1つの入力装置、および少なくとも1つの出力装置からデータおよび指令を受信し、且つデータおよび指令を当該記憶システム、当該少なくとも1つの入力装置、および当該少なくとも1つの出力装置に送信することができる。
これらの計算プログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、またはコードとも呼ばれ)は、プログラマブルプロセッサのマシン指令を含み、高度なプロセスおよび/またはオブジェクトに向けたプログラミング言語、および/またはアセンブリ/マシン言語を利用してこれらの計算プログラムを実行することができる。本明細書で使用されたような用語「機械可読媒体」および「コンピュータ可読媒体」とは、機械指令および/またはデータをプログラマブルプロセッサに提供するための任意のコンピュータプログラム製品、デバイス、および/または装置(例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス(PLD))を指し、機械可読信号である機械指令を受信する機械可読媒体を含む。用語「機械可読信号」とは、機械指令および/またはデータをプログラマブルプロセッサに提供するための任意の信号を指す。
ユーザとのインタラクティブを提供するために、ここで説明されたシステムおよび技術をコンピュータ上で実施することができ、当該コンピュータは、ユーザに情報を表示するための表示装置(例えば、CRT(陰極線管)またはLCD(液晶ディスプレイ)モニタ)、キーボードおよびポインティングデバイス(例えば、マウスまたはトラックボール)を備え、ユーザーは、当該キーボードおよび当該ポインティングデバイスを介して入力をコンピュータに提供することができる。他の種類の装置は、ユーザとのインタラクティブを提供するために使用されることもできる。例えば、ユーザに提供されたフィードバックは、任意の形態のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバック)であってもよく、任意の形態(声入力、音声入力、または触覚入力を含む)でユーザからの入力を受信してもよい。
ここで説明されたシステムおよび技術を、バックグラウンド部品を含む計算システム(例えば、データサーバー)、またはミドルウエア部品を含む計算システム(例えば、アプリケーションサーバー)、またはフロントエンド部品を含む計算システム(例えば、グラフィカルユーザインタフェースまたはネットワークブラウザを有するユーザコンピュータが挙げられ、ユーザーは、当該グラフィカルユーザインタフェースまたは当該ネットワークブラウザを介してここで説明されたシステムおよび技術の実施形態とインタラクティブすることができ)、またはこのようなバックグラウンド部品、ミドルウエア部品、またはフロントエンド部品の任意の組合せを含む計算システム上で実施することができる。システムの部品は、任意の形態またはメディアのデジタルデータ通信(例えば、通信ネットワーク)によって相互に接続されてもよい。通信ネットワークの例は、ローカルエリアネットワーク(LAN)、広域ネットワーク(WAN)、およびインターネットを含む。
コンピュータシステムは、クライアントとサーバーとを含むことができる。クライアントとサーバーは、一般に互いに離れ、通常は通信ネットワークを介してインタラクティブする。クライアントとサーバーとの関係は、対応するコンピュータ上で実行され、且つ互いにクライアントーサーバー関係を有するコンピュータプログラムによって生成される。
本発明の技術案によると、まず、ナレッジグラフからトリプルを取得し、次に、ナレッジグラフからトリプルにおける関係と等価な関係パスをマイニングし、最後に、関係パスに基づいてトリプルを展開することにより、展開トリプルを生成する。ナレッジグラフにおけるトリプルに対する拡張を実現し、トリプルのうちのサブジェクトおよびオブジェクトのより大きな文脈における関連付けを強化し、トリプルのうちのサブジェクトとオブジェクトとの間の関連付けをより大域的になるようにする。
以上で示された様々な形態のフローを用いて、ステップを並べ替え、追加、または削除できることを理解すべきである。例えば、本発明に記載された各ステップは、並列的に実行されてもよいし、順次に実行されてもよいし、異なる順序で実行されてもよく、本発明に開示された技術案の所望の結果が達成される限り、本明細書では制限しない。
上記具体的な実施形態は、本発明の保護範囲に対する制限を構成するものではない。当業者は、設計要件とその他の要因に応じて、様々な修正、組み合わせ、サブ組み合わせ、および代替を行うことが可能であることを理解すべきである。本発明の精神及び原則内でなされたいかなる修正、均等置換及び改善等は、いずれも本発明の保護範囲に含まれるべきである。

Claims (15)

  1. ナレッジグラフからトリプルを取得することと、
    前記ナレッジグラフから前記トリプルにおける関係と等価な関係パスをマイニングし、ここで、前記関係パスは、前記トリプルのうちのサブジェクトおよびオブジェクトをそれぞれ始点及び終点とすることと、
    前記関係パスに基づいて前記トリプルを展開することにより、展開トリプルを生成することと、
    を含む、
    データ拡張の方法。
  2. 前記前記ナレッジグラフから前記トリプルにおける関係と等価な関係パスをマイニングすることは、
    前記ナレッジグラフから、前記トリプルのうちのサブジェクトおよびオブジェクトと統計共起する他のトリプルシーケンスをマイニングすることと、
    前記他のトリプルシーケンスにおける関係を順序的に組み合わせることにより、前記関係パスを生成することと、
    を含む、
    請求項1に記載の方法。
  3. 前記前記関係パスに基づいて前記トリプルを展開することにより、展開トリプルを生成することは、
    前記関係パスを利用して前記トリプルにおける関係を置き換えることにより、前記展開トリプルを生成することを含む、
    請求項1に記載の方法。
  4. 前記前記関係パスに基づいて前記トリプルを展開することにより、展開トリプルを生成することは、
    前記トリプルのうちのサブジェクトを起点として前記関係パスを巡回することにより、前記トリプルのうちのオブジェクトと異なる他のオブジェクトを得ることと、
    前記関係パスを利用して前記トリプルにおける関係を置き換え、且つ前記他のオブジェクトを利用して前記トリプルのうちのオブジェクトを置き換えることにより、前記展開トリプルを生成することと、
    を含む、
    請求項1に記載の方法。
  5. 前記トリプルと前記展開トリプルをそれぞれ訓練サンプルとして、訓練サンプルセットに追加することと、
    前記訓練サンプルセットにおける訓練サンプルについて、サブジェクトまたはオブジェクトが欠落している当該訓練サンプルを入力として、欠落しているサブジェクトまたはオブジェクトを出力として、訓練を監督することにより、予測モデルを得ることと、
    をさらに含む、
    請求項1から4のいずれか1項に記載の方法。
  6. 予測トリプルを取得し、ここで、前記予測トリプルは、サブジェクトまたはオブジェクトが欠落していることと、
    前記ナレッジグラフに基づいて、前記予測トリプルに対応する予測展開トリプルを確定することと、
    前記予測トリプルと前記予測展開トリプルをそれぞれ前記予測モデルに入力することにより、前記予測トリプルと前記予測展開トリプルに対応する予測サブジェクトまたはオブジェクトの信頼度を得ることと、
    前記予測トリプルと前記予測展開トリプルに対応する予測サブジェクトまたはオブジェクトの信頼度の平均値を計算し、前記予測トリプルの欠落しているサブジェクトまたはオブジェクトを確定することと、
    をさらに含む、
    請求項5に記載の方法。
  7. ナレッジグラフからトリプルを取得するように構成される第1の取得モジュールと、
    前記ナレッジグラフから前記トリプルにおける関係と等価な関係パスをマイニングするように構成され、ここで、前記関係パスは、前記トリプルのうちのサブジェクトおよびオブジェクトをそれぞれ始点及び終点とするマイニングモジュールと、
    前記関係パスに基づいて前記トリプルを展開することにより、展開トリプルを生成するように構成される展開モジュールと、
    を含む、
    データ拡張の装置。
  8. 前記マイニングモジュールは、さらに、
    前記ナレッジグラフから、前記トリプルのうちのサブジェクトおよびオブジェクトと統計共起する他のトリプルシーケンスをマイニングし、
    前記他のトリプルシーケンスにおける関係を順序的に組み合わせることにより、前記関係パスを生成するように構成される、
    請求項7に記載の装置。
  9. 前記展開モジュールは、さらに、
    前記関係パスを利用して前記トリプルにおける関係を置き換えることにより、前記展開トリプルを生成するように構成される、
    請求項7に記載の装置。
  10. 前記展開モジュールは、さらに、
    前記トリプルのうちのサブジェクトを起点として前記関係パスを巡回することにより、前記トリプルのうちのオブジェクトと異なる他のオブジェクトを得て、
    前記関係パスを利用して前記トリプルにおける関係を置き換え、且つ前記他のオブジェクトを利用して前記トリプルのうちのオブジェクトを置き換えることにより、前記展開トリプルを生成するように構成される、
    請求項7に記載の装置。
  11. 前記トリプルと前記展開トリプルをそれぞれ訓練サンプルとして、訓練サンプルセットに追加するように構成される追加モジュールと、
    前記訓練サンプルセットにおける訓練サンプルについて、サブジェクトまたはオブジェクトが欠落している当該訓練サンプルを入力として、欠落しているサブジェクトまたはオブジェクトを出力として、訓練を監督することにより、予測モデルを得るように構成される訓練モジュールと、
    をさらに含む、
    請求項7から10のいずれか1項に記載の装置。
  12. 予測トリプルを取得するように構成され、ここで、前記予測トリプルは、サブジェクトまたはオブジェクトが欠落している第2の取得モジュールと、
    前記ナレッジグラフに基づいて、前記予測トリプルに対応する予測展開トリプルを確定するように構成される確定モジュールと、
    前記予測トリプルと前記予測展開トリプルをそれぞれ前記予測モデルに入力することにより、前記予測トリプルと前記予測展開トリプルに対応する予測サブジェクトまたはオブジェクトの信頼度を得るように構成される予測モジュールと、
    前記予測トリプルと前記予測展開トリプルに対応する予測サブジェクトまたはオブジェクトの信頼度の平均値を計算し、前記予測トリプルの欠落しているサブジェクトまたはオブジェクトを確定するように構成される計算モジュールと、
    をさらに含む、
    請求項11に記載の装置。
  13. 少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサに通信接続されたメモリと、
    を含み、
    前記メモリには、前記少なくとも1つのプロセッサによって実行可能な指令が記憶され、前記指令が前記少なくとも1つのプロセッサによって実行されることにより、請求項1から6のいずれか1項に記載の方法を前記少なくとも1つのプロセッサに実行させる、
    電子機器。
  14. コンピュータ指令が記憶された非一時的コンピュータ可読記憶媒体であって、
    前記コンピュータ指令は、請求項1から6のいずれか1項に記載の方法を前記コンピュータに実行させるために使用される、
    非一時的コンピュータ可読記憶媒体。
  15. コンピュータプログラムであって、
    プロセッサにより実行されると、請求項1から6のいずれか1項に記載の方法を前記コンピュータに実行させる、コンピュータプログラム。
JP2021049353A 2020-04-08 2021-03-24 データ拡張の方法及び装置、機器、記憶媒体 Active JP7229291B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010268590.1 2020-04-08
CN202010268590.1A CN111506623B (zh) 2020-04-08 2020-04-08 数据扩充方法、装置、设备以及存储介质

Publications (2)

Publication Number Publication Date
JP2021128779A true JP2021128779A (ja) 2021-09-02
JP7229291B2 JP7229291B2 (ja) 2023-02-27

Family

ID=71877523

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021049353A Active JP7229291B2 (ja) 2020-04-08 2021-03-24 データ拡張の方法及び装置、機器、記憶媒体

Country Status (5)

Country Link
US (1) US20210216885A1 (ja)
EP (1) EP3846050A3 (ja)
JP (1) JP7229291B2 (ja)
KR (1) KR20210040886A (ja)
CN (1) CN111506623B (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113204650B (zh) * 2021-05-14 2022-03-11 深圳市曙光信息技术有限公司 基于领域知识图谱的评价方法及***
CN113779274B (zh) * 2021-09-18 2024-04-05 深圳平安医疗健康科技服务有限公司 指标模拟仿真方法、装置、计算机设备及存储介质
CN114925167A (zh) * 2022-05-20 2022-08-19 武汉众智数字技术有限公司 一种基于知识图谱的案件处理方法和***

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011142134A1 (ja) * 2010-05-14 2011-11-17 日本電気株式会社 情報検索装置、情報検索方法、コンピュータ・プログラムおよびデータ構造
JP2019074843A (ja) * 2017-10-13 2019-05-16 ヤフー株式会社 情報提供装置、情報提供方法、およびプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160132501A1 (en) * 2014-11-07 2016-05-12 Google Inc. Determining answers to interrogative queries using web resources
WO2018057945A1 (en) * 2016-09-22 2018-03-29 nference, inc. Systems, methods, and computer readable media for visualization of semantic information and inference of temporal signals indicating salient associations between life science entities
CN106874380B (zh) * 2017-01-06 2020-01-14 北京航空航天大学 知识库三元组检验的方法与装置
US20180232443A1 (en) * 2017-02-16 2018-08-16 Globality, Inc. Intelligent matching system with ontology-aided relation extraction
US20190246122A1 (en) * 2018-02-08 2019-08-08 Qualcomm Incorporated Palette coding for video coding
US11080300B2 (en) * 2018-08-21 2021-08-03 International Business Machines Corporation Using relation suggestions to build a relational database
US20200074301A1 (en) * 2018-09-04 2020-03-05 Beijing Jingdong Shangke Information Technology Co., Ltd. End-to-end structure-aware convolutional networks for knowledge base completion
CN109960722B (zh) * 2019-03-31 2021-10-22 联想(北京)有限公司 一种信息处理方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011142134A1 (ja) * 2010-05-14 2011-11-17 日本電気株式会社 情報検索装置、情報検索方法、コンピュータ・プログラムおよびデータ構造
JP2019074843A (ja) * 2017-10-13 2019-05-16 ヤフー株式会社 情報提供装置、情報提供方法、およびプログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
GUANGLIN NIU、外6名: "Rule-Guided Compositional Representation Learning on Knowledge Graphs", PROCEEDINGS OF THE THIRTY-FOURTH AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE, JPN7022003363, February 2020 (2020-02-01), pages 2950 - 2958, ISSN: 0004826651 *
YANKAI LIN、外4名: "Modeling Relation Paths for Representation Learning of Knowledge Bases", PROCEEDINGS OF THE 2015 CONFERENCE ON EMPIRICAL METHODS IN NATURAL LANGUAGE PROCESSING, JPN7022003366, September 2015 (2015-09-01), pages 705 - 714, XP055841112, ISSN: 0004826650, DOI: 10.18653/v1/D15-1082 *

Also Published As

Publication number Publication date
JP7229291B2 (ja) 2023-02-27
KR20210040886A (ko) 2021-04-14
CN111506623A (zh) 2020-08-07
EP3846050A2 (en) 2021-07-07
CN111506623B (zh) 2024-03-22
US20210216885A1 (en) 2021-07-15
EP3846050A3 (en) 2021-10-27

Similar Documents

Publication Publication Date Title
JP7166322B2 (ja) モデルを訓練するための方法、装置、電子機器、記憶媒体およびコンピュータプログラム
JP7317791B2 (ja) エンティティ・リンキング方法、装置、機器、及び記憶媒体
KR102484617B1 (ko) 이종 그래프 노드를 표현하는 모델 생성 방법, 장치, 전자 기기, 저장 매체 및 프로그램
JP7170082B2 (ja) 情報を生成するための方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム
JP7058304B2 (ja) 異種グラフにおけるノード表現の生成方法、装置及び電子機器
JP7269913B2 (ja) ナレッジグラフ構築方法、装置、電子機器、記憶媒体およびコンピュータプログラム
JP2021128779A (ja) データ拡張の方法及び装置、機器、記憶媒体
CN111539514A (zh) 用于生成神经网络的结构的方法和装置
JP7264866B2 (ja) イベント関係の生成方法、装置、電子機器及び記憶媒体
JP2022018095A (ja) マルチモーダル事前訓練モデル取得方法、装置、電子デバイス及び記憶媒体
KR102521765B1 (ko) 인과 관계의 판별 방법, 장치, 전자 기기 및 저장 매체
JP2022505015A (ja) 知識グラフのベクトル表現生成方法、装置及び電子機器
CN111539479A (zh) 生成样本数据的方法和装置
JP7044839B2 (ja) エンドツーエンドモデルのトレーニング方法および装置
JP7133002B2 (ja) 句読点予測方法および装置
JP7194215B2 (ja) キーポイントの特定方法及び装置、機器、記憶媒体
CN112270399A (zh) 基于深度学习的算子注册处理方法、装置及电子设备
JP2021192286A (ja) モデル訓練、画像処理方法及びデバイス、記憶媒体、プログラム製品
CN111090991A (zh) 场景纠错方法、装置、电子设备和存储介质
US20240104403A1 (en) Method for training click rate prediction model
CN112508163B (zh) 神经网络模型中子图的展示方法、装置和存储介质
CN112270412B (zh) 网络算子处理方法、装置、电子设备及存储介质
CN111324747B (zh) 三元组的生成方法、装置及电子设备
CN115186738A (zh) 模型训练方法、装置和存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210611

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220624

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220715

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221013

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230209

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230214

R150 Certificate of patent or registration of utility model

Ref document number: 7229291

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150