JP2021128779A - データ拡張の方法及び装置、機器、記憶媒体 - Google Patents
データ拡張の方法及び装置、機器、記憶媒体 Download PDFInfo
- Publication number
- JP2021128779A JP2021128779A JP2021049353A JP2021049353A JP2021128779A JP 2021128779 A JP2021128779 A JP 2021128779A JP 2021049353 A JP2021049353 A JP 2021049353A JP 2021049353 A JP2021049353 A JP 2021049353A JP 2021128779 A JP2021128779 A JP 2021128779A
- Authority
- JP
- Japan
- Prior art keywords
- triple
- subject
- prediction
- expansion
- relationship
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/288—Entity relationship models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Animal Behavior & Ethology (AREA)
- Probability & Statistics with Applications (AREA)
- Fuzzy Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【解決手段】当該方法の一具体的な実施形態は、ナレッジグラフからトリプルを取得することと、前記ナレッジグラフから前記トリプルにおける関係と等価な関係パスをマイニングし、ここで、前記関係パスは、前記トリプルのうちのサブジェクトおよびオブジェクトをそれぞれ始点及び終点とすることと、前記関係パスに基づいて前記トリプルを展開することにより、展開トリプルを生成することと、を含む。当該実施形態は、ナレッジグラフにおけるトリプルに対する拡張を実現し、トリプルのうちのサブジェクトおよびオブジェクトのより大きな文脈における関連付けを強化し、トリプルのうちのサブジェクトとオブジェクトとの間の関連付けをより大域的になるようにする。
【選択図】図2
Description
Claims (15)
- ナレッジグラフからトリプルを取得することと、
前記ナレッジグラフから前記トリプルにおける関係と等価な関係パスをマイニングし、ここで、前記関係パスは、前記トリプルのうちのサブジェクトおよびオブジェクトをそれぞれ始点及び終点とすることと、
前記関係パスに基づいて前記トリプルを展開することにより、展開トリプルを生成することと、
を含む、
データ拡張の方法。 - 前記前記ナレッジグラフから前記トリプルにおける関係と等価な関係パスをマイニングすることは、
前記ナレッジグラフから、前記トリプルのうちのサブジェクトおよびオブジェクトと統計共起する他のトリプルシーケンスをマイニングすることと、
前記他のトリプルシーケンスにおける関係を順序的に組み合わせることにより、前記関係パスを生成することと、
を含む、
請求項1に記載の方法。 - 前記前記関係パスに基づいて前記トリプルを展開することにより、展開トリプルを生成することは、
前記関係パスを利用して前記トリプルにおける関係を置き換えることにより、前記展開トリプルを生成することを含む、
請求項1に記載の方法。 - 前記前記関係パスに基づいて前記トリプルを展開することにより、展開トリプルを生成することは、
前記トリプルのうちのサブジェクトを起点として前記関係パスを巡回することにより、前記トリプルのうちのオブジェクトと異なる他のオブジェクトを得ることと、
前記関係パスを利用して前記トリプルにおける関係を置き換え、且つ前記他のオブジェクトを利用して前記トリプルのうちのオブジェクトを置き換えることにより、前記展開トリプルを生成することと、
を含む、
請求項1に記載の方法。 - 前記トリプルと前記展開トリプルをそれぞれ訓練サンプルとして、訓練サンプルセットに追加することと、
前記訓練サンプルセットにおける訓練サンプルについて、サブジェクトまたはオブジェクトが欠落している当該訓練サンプルを入力として、欠落しているサブジェクトまたはオブジェクトを出力として、訓練を監督することにより、予測モデルを得ることと、
をさらに含む、
請求項1から4のいずれか1項に記載の方法。 - 予測トリプルを取得し、ここで、前記予測トリプルは、サブジェクトまたはオブジェクトが欠落していることと、
前記ナレッジグラフに基づいて、前記予測トリプルに対応する予測展開トリプルを確定することと、
前記予測トリプルと前記予測展開トリプルをそれぞれ前記予測モデルに入力することにより、前記予測トリプルと前記予測展開トリプルに対応する予測サブジェクトまたはオブジェクトの信頼度を得ることと、
前記予測トリプルと前記予測展開トリプルに対応する予測サブジェクトまたはオブジェクトの信頼度の平均値を計算し、前記予測トリプルの欠落しているサブジェクトまたはオブジェクトを確定することと、
をさらに含む、
請求項5に記載の方法。 - ナレッジグラフからトリプルを取得するように構成される第1の取得モジュールと、
前記ナレッジグラフから前記トリプルにおける関係と等価な関係パスをマイニングするように構成され、ここで、前記関係パスは、前記トリプルのうちのサブジェクトおよびオブジェクトをそれぞれ始点及び終点とするマイニングモジュールと、
前記関係パスに基づいて前記トリプルを展開することにより、展開トリプルを生成するように構成される展開モジュールと、
を含む、
データ拡張の装置。 - 前記マイニングモジュールは、さらに、
前記ナレッジグラフから、前記トリプルのうちのサブジェクトおよびオブジェクトと統計共起する他のトリプルシーケンスをマイニングし、
前記他のトリプルシーケンスにおける関係を順序的に組み合わせることにより、前記関係パスを生成するように構成される、
請求項7に記載の装置。 - 前記展開モジュールは、さらに、
前記関係パスを利用して前記トリプルにおける関係を置き換えることにより、前記展開トリプルを生成するように構成される、
請求項7に記載の装置。 - 前記展開モジュールは、さらに、
前記トリプルのうちのサブジェクトを起点として前記関係パスを巡回することにより、前記トリプルのうちのオブジェクトと異なる他のオブジェクトを得て、
前記関係パスを利用して前記トリプルにおける関係を置き換え、且つ前記他のオブジェクトを利用して前記トリプルのうちのオブジェクトを置き換えることにより、前記展開トリプルを生成するように構成される、
請求項7に記載の装置。 - 前記トリプルと前記展開トリプルをそれぞれ訓練サンプルとして、訓練サンプルセットに追加するように構成される追加モジュールと、
前記訓練サンプルセットにおける訓練サンプルについて、サブジェクトまたはオブジェクトが欠落している当該訓練サンプルを入力として、欠落しているサブジェクトまたはオブジェクトを出力として、訓練を監督することにより、予測モデルを得るように構成される訓練モジュールと、
をさらに含む、
請求項7から10のいずれか1項に記載の装置。 - 予測トリプルを取得するように構成され、ここで、前記予測トリプルは、サブジェクトまたはオブジェクトが欠落している第2の取得モジュールと、
前記ナレッジグラフに基づいて、前記予測トリプルに対応する予測展開トリプルを確定するように構成される確定モジュールと、
前記予測トリプルと前記予測展開トリプルをそれぞれ前記予測モデルに入力することにより、前記予測トリプルと前記予測展開トリプルに対応する予測サブジェクトまたはオブジェクトの信頼度を得るように構成される予測モジュールと、
前記予測トリプルと前記予測展開トリプルに対応する予測サブジェクトまたはオブジェクトの信頼度の平均値を計算し、前記予測トリプルの欠落しているサブジェクトまたはオブジェクトを確定するように構成される計算モジュールと、
をさらに含む、
請求項11に記載の装置。 - 少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに通信接続されたメモリと、
を含み、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な指令が記憶され、前記指令が前記少なくとも1つのプロセッサによって実行されることにより、請求項1から6のいずれか1項に記載の方法を前記少なくとも1つのプロセッサに実行させる、
電子機器。 - コンピュータ指令が記憶された非一時的コンピュータ可読記憶媒体であって、
前記コンピュータ指令は、請求項1から6のいずれか1項に記載の方法を前記コンピュータに実行させるために使用される、
非一時的コンピュータ可読記憶媒体。 - コンピュータプログラムであって、
プロセッサにより実行されると、請求項1から6のいずれか1項に記載の方法を前記コンピュータに実行させる、コンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010268590.1 | 2020-04-08 | ||
CN202010268590.1A CN111506623B (zh) | 2020-04-08 | 2020-04-08 | 数据扩充方法、装置、设备以及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021128779A true JP2021128779A (ja) | 2021-09-02 |
JP7229291B2 JP7229291B2 (ja) | 2023-02-27 |
Family
ID=71877523
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021049353A Active JP7229291B2 (ja) | 2020-04-08 | 2021-03-24 | データ拡張の方法及び装置、機器、記憶媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20210216885A1 (ja) |
EP (1) | EP3846050A3 (ja) |
JP (1) | JP7229291B2 (ja) |
KR (1) | KR20210040886A (ja) |
CN (1) | CN111506623B (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113204650B (zh) * | 2021-05-14 | 2022-03-11 | 深圳市曙光信息技术有限公司 | 基于领域知识图谱的评价方法及*** |
CN113779274B (zh) * | 2021-09-18 | 2024-04-05 | 深圳平安医疗健康科技服务有限公司 | 指标模拟仿真方法、装置、计算机设备及存储介质 |
CN114925167A (zh) * | 2022-05-20 | 2022-08-19 | 武汉众智数字技术有限公司 | 一种基于知识图谱的案件处理方法和*** |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011142134A1 (ja) * | 2010-05-14 | 2011-11-17 | 日本電気株式会社 | 情報検索装置、情報検索方法、コンピュータ・プログラムおよびデータ構造 |
JP2019074843A (ja) * | 2017-10-13 | 2019-05-16 | ヤフー株式会社 | 情報提供装置、情報提供方法、およびプログラム |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160132501A1 (en) * | 2014-11-07 | 2016-05-12 | Google Inc. | Determining answers to interrogative queries using web resources |
WO2018057945A1 (en) * | 2016-09-22 | 2018-03-29 | nference, inc. | Systems, methods, and computer readable media for visualization of semantic information and inference of temporal signals indicating salient associations between life science entities |
CN106874380B (zh) * | 2017-01-06 | 2020-01-14 | 北京航空航天大学 | 知识库三元组检验的方法与装置 |
US20180232443A1 (en) * | 2017-02-16 | 2018-08-16 | Globality, Inc. | Intelligent matching system with ontology-aided relation extraction |
US20190246122A1 (en) * | 2018-02-08 | 2019-08-08 | Qualcomm Incorporated | Palette coding for video coding |
US11080300B2 (en) * | 2018-08-21 | 2021-08-03 | International Business Machines Corporation | Using relation suggestions to build a relational database |
US20200074301A1 (en) * | 2018-09-04 | 2020-03-05 | Beijing Jingdong Shangke Information Technology Co., Ltd. | End-to-end structure-aware convolutional networks for knowledge base completion |
CN109960722B (zh) * | 2019-03-31 | 2021-10-22 | 联想(北京)有限公司 | 一种信息处理方法及装置 |
-
2020
- 2020-04-08 CN CN202010268590.1A patent/CN111506623B/zh active Active
-
2021
- 2021-03-24 JP JP2021049353A patent/JP7229291B2/ja active Active
- 2021-03-25 KR KR1020210038964A patent/KR20210040886A/ko not_active Application Discontinuation
- 2021-03-26 US US17/213,952 patent/US20210216885A1/en active Pending
- 2021-03-29 EP EP21165621.0A patent/EP3846050A3/en not_active Ceased
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011142134A1 (ja) * | 2010-05-14 | 2011-11-17 | 日本電気株式会社 | 情報検索装置、情報検索方法、コンピュータ・プログラムおよびデータ構造 |
JP2019074843A (ja) * | 2017-10-13 | 2019-05-16 | ヤフー株式会社 | 情報提供装置、情報提供方法、およびプログラム |
Non-Patent Citations (2)
Title |
---|
GUANGLIN NIU、外6名: "Rule-Guided Compositional Representation Learning on Knowledge Graphs", PROCEEDINGS OF THE THIRTY-FOURTH AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE, JPN7022003363, February 2020 (2020-02-01), pages 2950 - 2958, ISSN: 0004826651 * |
YANKAI LIN、外4名: "Modeling Relation Paths for Representation Learning of Knowledge Bases", PROCEEDINGS OF THE 2015 CONFERENCE ON EMPIRICAL METHODS IN NATURAL LANGUAGE PROCESSING, JPN7022003366, September 2015 (2015-09-01), pages 705 - 714, XP055841112, ISSN: 0004826650, DOI: 10.18653/v1/D15-1082 * |
Also Published As
Publication number | Publication date |
---|---|
JP7229291B2 (ja) | 2023-02-27 |
KR20210040886A (ko) | 2021-04-14 |
CN111506623A (zh) | 2020-08-07 |
EP3846050A2 (en) | 2021-07-07 |
CN111506623B (zh) | 2024-03-22 |
US20210216885A1 (en) | 2021-07-15 |
EP3846050A3 (en) | 2021-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7166322B2 (ja) | モデルを訓練するための方法、装置、電子機器、記憶媒体およびコンピュータプログラム | |
JP7317791B2 (ja) | エンティティ・リンキング方法、装置、機器、及び記憶媒体 | |
KR102484617B1 (ko) | 이종 그래프 노드를 표현하는 모델 생성 방법, 장치, 전자 기기, 저장 매체 및 프로그램 | |
JP7170082B2 (ja) | 情報を生成するための方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム | |
JP7058304B2 (ja) | 異種グラフにおけるノード表現の生成方法、装置及び電子機器 | |
JP7269913B2 (ja) | ナレッジグラフ構築方法、装置、電子機器、記憶媒体およびコンピュータプログラム | |
JP2021128779A (ja) | データ拡張の方法及び装置、機器、記憶媒体 | |
CN111539514A (zh) | 用于生成神经网络的结构的方法和装置 | |
JP7264866B2 (ja) | イベント関係の生成方法、装置、電子機器及び記憶媒体 | |
JP2022018095A (ja) | マルチモーダル事前訓練モデル取得方法、装置、電子デバイス及び記憶媒体 | |
KR102521765B1 (ko) | 인과 관계의 판별 방법, 장치, 전자 기기 및 저장 매체 | |
JP2022505015A (ja) | 知識グラフのベクトル表現生成方法、装置及び電子機器 | |
CN111539479A (zh) | 生成样本数据的方法和装置 | |
JP7044839B2 (ja) | エンドツーエンドモデルのトレーニング方法および装置 | |
JP7133002B2 (ja) | 句読点予測方法および装置 | |
JP7194215B2 (ja) | キーポイントの特定方法及び装置、機器、記憶媒体 | |
CN112270399A (zh) | 基于深度学习的算子注册处理方法、装置及电子设备 | |
JP2021192286A (ja) | モデル訓練、画像処理方法及びデバイス、記憶媒体、プログラム製品 | |
CN111090991A (zh) | 场景纠错方法、装置、电子设备和存储介质 | |
US20240104403A1 (en) | Method for training click rate prediction model | |
CN112508163B (zh) | 神经网络模型中子图的展示方法、装置和存储介质 | |
CN112270412B (zh) | 网络算子处理方法、装置、电子设备及存储介质 | |
CN111324747B (zh) | 三元组的生成方法、装置及电子设备 | |
CN115186738A (zh) | 模型训练方法、装置和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210611 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220624 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220715 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221013 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230209 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230214 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7229291 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |