JP2022031804A - イベント抽出方法、装置、電子機器及び記憶媒体 - Google Patents
イベント抽出方法、装置、電子機器及び記憶媒体 Download PDFInfo
- Publication number
- JP2022031804A JP2022031804A JP2021191869A JP2021191869A JP2022031804A JP 2022031804 A JP2022031804 A JP 2022031804A JP 2021191869 A JP2021191869 A JP 2021191869A JP 2021191869 A JP2021191869 A JP 2021191869A JP 2022031804 A JP2022031804 A JP 2022031804A
- Authority
- JP
- Japan
- Prior art keywords
- event
- question
- argument
- text
- description text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
Description
第6態様によれば、コンピュータプログラムを提供し、前記コンピュータプログラムがプロセッサによって実行される場合、本願の実施例によって開示されるイベント抽出方法が実現される。
本願の実施例によれば、本願は、コンピュータプログラムを提供し、コンピュータプログラムがプロセッサによって実行される場合、本願によって提供されるイベント抽出方法が実現される。
Claims (18)
- イベント記述テキストを取得するステップと、
前記イベント記述テキストに基づいて、少なくとも1つの候補イベントタイプを決定するステップであって、前記候補イベントタイプが1組の質問文に対応するステップと、
前記質問文に基づいて、前記イベント記述テキストから対応するイベント要素を抽出するステップと、
を含むイベント抽出方法。 - 前記質問文に基づいて、前記イベント記述テキストから対応するイベント要素を抽出するステップが、
前記質問文に基づいて、前記イベント記述テキストからイベントトリガワード、イベントタイプ、イベント引数、及び引数役割を抽出するステップと、
前記イベントトリガワード、前記イベントタイプ、前記イベント引数、及び前記引数役割を前記対応するイベント要素とするステップと、
を含む請求項1に記載の方法。 - 前記質問文が、少なくとも1つの第1質問文を含み、前記第1質問文が1つの前記イベントタイプに対応し、前記イベントタイプが少なくとも1つの第2質問文に対応し、前記第2質問文が1つの引数役割に対応し、前記第1質問文が、前記イベント記述テキスト内の前記イベントトリガワード及び前記イベントタイプを抽出するために用いられ、前記第2質問文が、前記イベント引数及び前記引数役割を抽出するために用いられる請求項2に記載の方法。
- 前記質問文に基づいて、前記イベント記述テキストからイベントトリガワード及びイベントタイプを抽出するステップが、
前記イベント記述テキストから前記第1質問文にマッチングするトリガワードを認識し、前記マッチングするトリガワードを前記イベントトリガワードとするステップと、
前記第1質問文に対応する前記イベントタイプを、抽出されたイベントタイプとするステップと、
を含む請求項3に記載の方法。 - 前記質問文に基づいて、前記イベント記述テキストから前記イベント引数及び前記引数役割を抽出するステップが、
前記抽出されたイベントタイプに対応する少なくとも1つの第2質問文を決定するステップと、
前記イベント記述テキストから前記第2質問文にマッチングするイベント引数を認識し、前記マッチングするイベント引数を、抽出されたイベント引数とするステップと、
前記第2質問文に対応する前記引数役割を、抽出された引数役割とするステップと、
を含む請求項4に記載の方法。 - 前記イベント記述テキストから前記第1質問文にマッチングするトリガワードを認識するステップが、
前記イベント記述テキスト及び前記第1質問文を事前に訓練されたイベントトリガワード抽出モデルに入力して、前記イベントトリガワード抽出モデルによって出力された前記マッチングするトリガワードを取得するステップを含む請求項4に記載の方法。 - 前記イベント記述テキストから前記第2質問文にマッチングするイベント引数を認識するステップが、
前記イベント記述テキスト及び前記第2質問文を事前に訓練されたイベント引数抽出モデルに入力して、前記イベント引数抽出モデルによって出力された前記マッチングするイベント引数を取得するステップを含む請求項5に記載の方法。 - イベント記述テキストを取得するための取得モジュールと、
前記イベント記述テキストに基づいて、少なくとも1つの候補イベントタイプを決定するための決定モジュールであって、前記候補イベントタイプが1組の質問文に対応する決定モジュールと、
前記質問文に基づいて、前記イベント記述テキストから対応するイベント要素を抽出するための抽出モジュールと、
を備えるイベント抽出装置。 - 前記抽出モジュールが、
前記質問文に基づいて、前記イベント記述テキストからイベントトリガワード、イベントタイプ、イベント引数、及び引数役割を抽出するための抽出サブモジュールと、
前記イベントトリガワード、前記イベントタイプ、前記イベント引数、及び前記引数役割を前記対応するイベント要素とするための取得サブモジュールと、
を備える請求項8に記載の装置。 - 前記質問文が、少なくとも1つの第1質問文を含み、前記第1質問文が1つの前記イベントタイプに対応し、前記イベントタイプが少なくとも1つの第2質問文に対応し、前記第2質問文が1つの引数役割に対応し、前記第1質問文が、前記イベント記述テキスト内の前記イベントトリガワード及び前記イベントタイプを抽出するために用いられ、前記第2質問文が、前記イベント引数及び前記引数役割を抽出するために用いられる請求項9に記載の装置。
- 前記抽出サブモジュールが、
前記イベント記述テキストから前記第1質問文にマッチングするトリガワードを認識し、前記マッチングするトリガワードを前記イベントトリガワードとし、
前記第1質問文に対応する前記イベントタイプを、抽出されたイベントタイプとする請求項10に記載の装置。 - 前記抽出サブモジュールが、
前記抽出されたイベントタイプに対応する少なくとも1つの第2質問文を決定し、
前記イベント記述テキストから前記第2質問文にマッチングするイベント引数を認識し、前記マッチングするイベント引数を、抽出されたイベント引数とし、
前記第2質問文に対応する前記引数役割を、抽出された引数役割とする請求項11に記載の装置。 - 前記抽出サブモジュールが、
前記イベント記述テキスト及び前記第1質問文を事前に訓練されたイベントトリガワード抽出モデルに入力して、前記イベントトリガワード抽出モデルによって出力された前記マッチングするトリガワードを取得する請求項11に記載の装置。 - 前記抽出サブモジュールが、
前記イベント記述テキスト及び前記第2質問文を事前に訓練されたイベント引数抽出モデルに入力して、前記イベント引数抽出モデルによって出力された前記マッチングするイベント引数を取得する請求項12に記載の装置。 - 少なくとも1つのプロセッサと、
該少なくとも1つのプロセッサに通信可能に接続されるメモリと、
を備え、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、前記命令が、前記少なくとも1つのプロセッサが請求項1から7のいずれか一項に記載の方法を実行できるように、前記少なくとも1つのプロセッサによって実行される電子機器。 - コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令が、コンピュータに請求項1から7のいずれか一項に記載の方法を実行させる非一時的なコンピュータ読み取り可能な記憶媒体。 - コンピュータプログラムを含むコンピュータプログラム製品であって、
前記コンピュータプログラムがプロセッサによって実行される場合、請求項1から7のいずれか一項に記載の方法が実現されるコンピュータプログラム製品。 - プロセッサによって実行される場合、請求項1から7のいずれか一項に記載の方法が実現されるコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011356616.4 | 2020-11-26 | ||
CN202011356616.4A CN112507700A (zh) | 2020-11-26 | 2020-11-26 | 事件抽取方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022031804A true JP2022031804A (ja) | 2022-02-22 |
JP7228662B2 JP7228662B2 (ja) | 2023-02-24 |
Family
ID=74966798
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021191869A Active JP7228662B2 (ja) | 2020-11-26 | 2021-11-26 | イベント抽出方法、装置、電子機器及び記憶媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220004714A1 (ja) |
EP (1) | EP3910492A3 (ja) |
JP (1) | JP7228662B2 (ja) |
KR (1) | KR20210124938A (ja) |
CN (1) | CN112507700A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114676271A (zh) * | 2022-03-07 | 2022-06-28 | 上海安硕企业征信服务有限公司 | 事件抽取方法、装置、电子设备及存储介质 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112905868A (zh) * | 2021-03-22 | 2021-06-04 | 京东方科技集团股份有限公司 | 事件抽取方法、装置、设备及存储介质 |
US11893345B2 (en) | 2021-04-06 | 2024-02-06 | Adobe, Inc. | Inducing rich interaction structures between words for document-level event argument extraction |
CN113392213B (zh) * | 2021-04-19 | 2024-05-31 | 合肥讯飞数码科技有限公司 | 事件抽取方法以及电子设备、存储装置 |
CN113241138B (zh) * | 2021-06-21 | 2022-06-17 | 中国平安人寿保险股份有限公司 | 医疗事件信息的抽取方法、装置、计算机设备及存储介质 |
US12019982B2 (en) * | 2021-10-25 | 2024-06-25 | Adobe Inc. | Event understanding with deep learning |
CN114118049B (zh) * | 2021-10-28 | 2023-09-22 | 北京百度网讯科技有限公司 | 信息获取方法、装置、电子设备及存储介质 |
CN114741516A (zh) * | 2021-12-08 | 2022-07-12 | 商汤国际私人有限公司 | 一种事件抽取方法和装置、电子设备及存储介质 |
CN114492377B (zh) * | 2021-12-30 | 2024-04-16 | 永中软件股份有限公司 | 一种事件角色的标注方法和计算机设备、计算机可读存储介质 |
CN115062137B (zh) * | 2022-08-15 | 2022-11-04 | 中科雨辰科技有限公司 | 一种基于主动学习确定异常文本的数据处理*** |
CN115238685B (zh) * | 2022-09-23 | 2023-03-21 | 华南理工大学 | 一种基于位置感知的建筑工程变更事件联合抽取方法 |
CN115827848B (zh) * | 2023-02-10 | 2023-06-23 | 天翼云科技有限公司 | 一种知识图谱事件抽取方法、装置、设备和存储介质 |
CN116451787B (zh) * | 2023-02-16 | 2023-12-26 | 阿里巴巴(中国)有限公司 | 内容风险识别方法、装置、***及设备 |
CN116628210B (zh) * | 2023-07-24 | 2024-03-19 | 广东美的暖通设备有限公司 | 基于对比学习对智慧楼宇故障事件抽取的故障确定方法 |
CN116701576B (zh) * | 2023-08-04 | 2023-10-10 | 华东交通大学 | 无触发词的事件检测方法和*** |
CN117454987B (zh) * | 2023-12-25 | 2024-03-19 | 临沂大学 | 基于事件自动抽取的矿山事件知识图谱构建方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0573611A (ja) * | 1991-09-13 | 1993-03-26 | Nippon Telegr & Teleph Corp <Ntt> | 事象解析器 |
US20150154263A1 (en) * | 2013-12-02 | 2015-06-04 | Qbase, LLC | Event detection through text analysis using trained event template models |
CN111401033A (zh) * | 2020-03-19 | 2020-07-10 | 北京百度网讯科技有限公司 | 事件抽取方法、事件抽取装置和电子设备 |
CN111414482A (zh) * | 2020-03-20 | 2020-07-14 | 北京百度网讯科技有限公司 | 一种事件论元抽取方法、装置以及电子设备 |
CN111967268A (zh) * | 2020-06-30 | 2020-11-20 | 北京百度网讯科技有限公司 | 文本中的事件抽取方法、装置、电子设备和存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104156352B (zh) * | 2014-08-15 | 2017-04-19 | 苏州大学 | 一种中文事件的处理方法及*** |
CN111325020B (zh) * | 2020-03-20 | 2023-03-31 | 北京百度网讯科技有限公司 | 一种事件论元抽取方法、装置以及电子设备 |
US11687385B2 (en) * | 2020-05-21 | 2023-06-27 | International Business Machines Corporation | Unsupervised event extraction |
CN111651581A (zh) * | 2020-06-05 | 2020-09-11 | 腾讯科技(深圳)有限公司 | 文本处理方法、装置、计算机设备及计算机可读存储介质 |
CN111753522A (zh) * | 2020-06-29 | 2020-10-09 | 深圳壹账通智能科技有限公司 | 事件抽取方法、装置、设备以及计算机可读存储介质 |
-
2020
- 2020-11-26 CN CN202011356616.4A patent/CN112507700A/zh active Pending
-
2021
- 2021-09-20 US US17/479,636 patent/US20220004714A1/en active Pending
- 2021-09-23 EP EP21198437.2A patent/EP3910492A3/en not_active Withdrawn
- 2021-09-27 KR KR1020210127359A patent/KR20210124938A/ko not_active Application Discontinuation
- 2021-11-26 JP JP2021191869A patent/JP7228662B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0573611A (ja) * | 1991-09-13 | 1993-03-26 | Nippon Telegr & Teleph Corp <Ntt> | 事象解析器 |
US20150154263A1 (en) * | 2013-12-02 | 2015-06-04 | Qbase, LLC | Event detection through text analysis using trained event template models |
CN111401033A (zh) * | 2020-03-19 | 2020-07-10 | 北京百度网讯科技有限公司 | 事件抽取方法、事件抽取装置和电子设备 |
CN111414482A (zh) * | 2020-03-20 | 2020-07-14 | 北京百度网讯科技有限公司 | 一种事件论元抽取方法、装置以及电子设备 |
CN111967268A (zh) * | 2020-06-30 | 2020-11-20 | 北京百度网讯科技有限公司 | 文本中的事件抽取方法、装置、电子设备和存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114676271A (zh) * | 2022-03-07 | 2022-06-28 | 上海安硕企业征信服务有限公司 | 事件抽取方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US20220004714A1 (en) | 2022-01-06 |
EP3910492A3 (en) | 2022-03-16 |
KR20210124938A (ko) | 2021-10-15 |
EP3910492A2 (en) | 2021-11-17 |
CN112507700A (zh) | 2021-03-16 |
JP7228662B2 (ja) | 2023-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2022031804A (ja) | イベント抽出方法、装置、電子機器及び記憶媒体 | |
JP7223785B2 (ja) | 時系列ナレッジグラフ生成方法、装置、デバイス及び媒体 | |
EP3933660A1 (en) | Method and apparatus for extracting event from text, electronic device, and storage medium | |
JP7283009B2 (ja) | 対話理解モデルの訓練方法、装置、デバイス及び記憶媒体 | |
JP7264866B2 (ja) | イベント関係の生成方法、装置、電子機器及び記憶媒体 | |
JP2021182430A (ja) | 意味解析モデルのトレーニング方法及び装置、電子機器並びに記憶媒体 | |
JP2021184237A (ja) | データセット処理方法、装置、電子機器及び記憶媒体 | |
CN113220836B (zh) | 序列标注模型的训练方法、装置、电子设备和存储介质 | |
CN111325020A (zh) | 一种事件论元抽取方法、装置以及电子设备 | |
JP2022018095A (ja) | マルチモーダル事前訓練モデル取得方法、装置、電子デバイス及び記憶媒体 | |
JP2021184255A (ja) | 語義表現モデルの生成方法、語義表現モデルの生成装置、電子機器、記憶媒体及びコンピュータプログラム | |
JP2021099890A (ja) | 因果関係の判別方法、装置、電子機器及び記憶媒体 | |
JP2021197133A (ja) | 意味マッチング方法、装置、電子機器、記憶媒体及びコンピュータプログラム | |
US20220092252A1 (en) | Method for generating summary, electronic device and storage medium thereof | |
JP2021193617A (ja) | 医療データ検証方法、装置及び電子機器 | |
EP4113357A1 (en) | Method and apparatus for recognizing entity, electronic device and storage medium | |
JP2021131858A (ja) | エンティティワードの認識方法と装置 | |
JP2021111334A (ja) | 検索データに基づくヒューマンコンピュータ対話型インタラクションの方法、装置及び電子機器 | |
JP2022040026A (ja) | エンティティリンキング方法、装置、電子デバイス及び記憶媒体 | |
JP7308910B2 (ja) | 単語スロットの認識方法、装置及び電子機器 | |
US20220237376A1 (en) | Method, apparatus, electronic device and storage medium for text classification | |
JP2022008207A (ja) | トリプルサンプルの生成方法、装置、電子デバイス及び記憶媒体 | |
JP7369228B2 (ja) | ユーザ興味画像の生成方法、装置、電子機器及び記憶媒体 | |
EP3958163A2 (en) | Method and apparatus for generating dialogue, electronic device, and storage medium | |
CN112269884B (zh) | 信息抽取方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211126 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220810 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220816 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221111 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230207 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230213 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7228662 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |