JP6988924B2 - 質問群抽出方法、質問群抽出装置および質問群抽出プログラム - Google Patents
質問群抽出方法、質問群抽出装置および質問群抽出プログラム Download PDFInfo
- Publication number
- JP6988924B2 JP6988924B2 JP2019568547A JP2019568547A JP6988924B2 JP 6988924 B2 JP6988924 B2 JP 6988924B2 JP 2019568547 A JP2019568547 A JP 2019568547A JP 2019568547 A JP2019568547 A JP 2019568547A JP 6988924 B2 JP6988924 B2 JP 6988924B2
- Authority
- JP
- Japan
- Prior art keywords
- question
- state
- sentence
- task
- indicating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/226—Validation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Algebra (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
そこで、本発明は、上述した課題を解決する、会話履歴から任意のトピックに関連する質問群を容易に抽出できる質問群抽出方法、質問群抽出装置および質問群抽出プログラムを提供することを目的とする。
[構成の説明]
以下、本発明の実施形態を、図面を参照して説明する。図1は、本発明による質問群抽出装置の第1の実施形態の構成例を示すブロック図である。
2.オペレータが顧客の状況を明確にするための質問をする
3.顧客が質問に答える
4.オペレータが顧客の課題に関して原因(Cause) を述べる
5.オペレータが顧客の課題に対する対処(Action)を行う
( 状態S →形態素a の対応頻度)/( 状態S →全形態素の対応頻度) ・・・式(1)
−c * ( 前状態に適合した発話からの距離の総和) ・・・式(2)
以下、本実施形態の質問群抽出装置100が状態遷移モデルの出力確率を学習する動作を図9を参照して説明する。図9は、第1の実施形態の質問群抽出装置100による出力確率学習処理の動作を示すフローチャートである。なお、本例において質問群抽出装置100には、状態遷移モデルとラベル付与パタンとが事前に設定されている。
本実施形態の質問群抽出装置100は、会話履歴データから質問群を抽出する装置である。質問群抽出装置100の学習ラベル付与部112は、会話履歴データ中の各発話に対して正規表現等を用いて状態ラベルを付与する。
11 付与部
12 抽出部
101 CPU
102 主記憶部
103 通信部
104 補助記憶部
105 入力部
106 出力部
107 システムバス
111 学習受付部
112 学習ラベル付与部
113 アラインメント生成部
114 出力確率算出部
121 抽出受付部
122 抽出ラベル付与部
123 状態遷移モデル参照部
124 生成確率算出部
125 出力部
Claims (10)
- 質問群抽出装置で実行される質問群抽出方法であって、
前記質問群抽出装置が、
1つの課題を示す文である課題文と、前記1つの課題に対する質問を示す文である質問文と、前記質問に対する回答を示す文である回答文とで構成されている文の集合が1つ以上含まれている会話履歴を示すデータ内の前記課題文に課題状態を示すラベル、前記データ内の前記質問文に質問状態を示すラベル、および前記データ内の前記回答文に回答状態を示すラベルをそれぞれ付与し、
1つの課題状態と質問状態と回答状態とで構成され状態の遷移を表すモデルである状態遷移モデルに従ってラベルが示す状態が対応付けられている前記文の集合を、前記データから抽出する
ことを特徴とする質問群抽出方法。 - 質問群抽出装置が、
会話履歴に含まれている文の集合の数だけ前記会話履歴を示すデータから前記文の集合を抽出する
請求項1記載の質問群抽出方法。 - 質問群抽出装置が、
会話履歴を示すデータ内の文に付与されたラベルを状態遷移モデルを用いて修正し、
ラベルが修正された前記データから文の集合を抽出する
請求項1または請求項2記載の質問群抽出方法。 - 質問群抽出装置が、
状態遷移モデル中の任意の状態から文を構成する形態素が生成される確率である生成確率を基にラベルを修正する
請求項3記載の質問群抽出方法。 - 質問群抽出装置が、
状態遷移モデル中の任意の状態に文を構成する形態素が対応している度合いを学習し、
学習された度合いを用いて生成確率を算出する
請求項4記載の質問群抽出方法。 - 質問群抽出装置が、
生成確率が算出される形態素が含まれる文と、前記文に付与されたラベルが示す状態への状態遷移モデルにおける遷移前の状態を示すラベルが付与された文との会話履歴中の距離を用いて前記生成確率を算出する
請求項4または請求項5記載の質問群抽出方法。 - 質問群抽出装置が、
含まれている課題文が同一の課題を示す複数の文の集合をグループ化して出力する
請求項1から請求項6のうちのいずれか1項に記載の質問群抽出方法。 - 状態遷移モデルには、結論状態が含まれ、
質問群抽出装置が、
会話履歴を示すデータ内の課題文が示す1つの課題に対する結論を示す文である結論文に結論状態を示すラベルを付与し、
結論文が含まれる文の集合を抽出する
請求項1から請求項7のうちのいずれか1項に記載の質問群抽出方法。 - 1つの課題を示す文である課題文と、前記1つの課題に対する質問を示す文である質問文と、前記質問に対する回答を示す文である回答文とで構成されている文の集合が1つ以上含まれている会話履歴を示すデータ内の前記課題文に課題状態を示すラベル、前記データ内の前記質問文に質問状態を示すラベル、および前記データ内の前記回答文に回答状態を示すラベルをそれぞれ付与する付与部と、
1つの課題状態と質問状態と回答状態とで構成され状態の遷移を表すモデルである状態遷移モデルに従ってラベルが示す状態が対応付けられている前記文の集合を、前記データから抽出する抽出部とを備える
ことを特徴とする質問群抽出装置。 - コンピュータに、
1つの課題を示す文である課題文と、前記1つの課題に対する質問を示す文である質問文と、前記質問に対する回答を示す文である回答文とで構成されている文の集合が1つ以上含まれている会話履歴を示すデータ内の前記課題文に課題状態を示すラベル、前記データ内の前記質問文に質問状態を示すラベル、および前記データ内の前記回答文に回答状態を示すラベルをそれぞれ付与する付与処理、および
1つの課題状態と質問状態と回答状態とで構成され状態の遷移を表すモデルである状態遷移モデルに従ってラベルが示す状態が対応付けられている前記文の集合を、前記データから抽出する抽出処理
を実行させるための質問群抽出プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2018/003843 WO2019150583A1 (ja) | 2018-02-05 | 2018-02-05 | 質問群抽出方法、質問群抽出装置および記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019150583A1 JPWO2019150583A1 (ja) | 2021-01-14 |
JP6988924B2 true JP6988924B2 (ja) | 2022-01-05 |
Family
ID=67479599
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019568547A Active JP6988924B2 (ja) | 2018-02-05 | 2018-02-05 | 質問群抽出方法、質問群抽出装置および質問群抽出プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11416678B2 (ja) |
JP (1) | JP6988924B2 (ja) |
WO (1) | WO2019150583A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11783005B2 (en) * | 2019-04-26 | 2023-10-10 | Bank Of America Corporation | Classifying and mapping sentences using machine learning |
CN111159344A (zh) * | 2019-12-27 | 2020-05-15 | 京东数字科技控股有限公司 | 机器人应答方法、装置、设备及存储介质 |
US11238076B2 (en) * | 2020-04-19 | 2022-02-01 | International Business Machines Corporation | Document enrichment with conversation texts, for enhanced information retrieval |
CN112966076A (zh) * | 2021-02-25 | 2021-06-15 | 中国平安人寿保险股份有限公司 | 智能问答问题的生成方法、装置、计算机设备及存储介质 |
CN113705248B (zh) * | 2021-07-21 | 2022-09-30 | 上海原圈网络科技有限公司 | 一种基于结果评价的话术训练数据处理方法和装置 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW473675B (en) | 2000-09-29 | 2002-01-21 | C A I Co Ltd | Topics dialog procedures and system |
JP4085015B2 (ja) * | 2003-02-28 | 2008-04-30 | 株式会社東芝 | ストリームデータ生成装置、ストリームデータ生成システム、ストリームデータ生成方法及びプログラム |
JP4246548B2 (ja) | 2003-05-30 | 2009-04-02 | 日本電信電話株式会社 | 統計情報を用いた対話方法及びその装置と、対話プログラム及びそのプログラムを記録した記録媒体 |
JP4680691B2 (ja) * | 2005-06-15 | 2011-05-11 | 富士通株式会社 | 対話システム |
JP4755478B2 (ja) | 2005-10-07 | 2011-08-24 | 日本電信電話株式会社 | 応答文生成装置、応答文生成方法、そのプログラムおよび記憶媒体 |
US8315964B2 (en) * | 2008-10-27 | 2012-11-20 | Microsoft Corporation | Comprehensive human computation framework |
US9378273B2 (en) * | 2014-03-13 | 2016-06-28 | International Business Machines Corporation | System and method for question answering by reformulating word problems |
US10572806B2 (en) * | 2015-02-17 | 2020-02-25 | International Business Machines Corporation | Question answering with time-based weighting |
US10120864B2 (en) * | 2016-03-29 | 2018-11-06 | Conduent Business Services Llc | Method and system for identifying user issues in forum posts based on discourse analysis |
US10460398B1 (en) * | 2016-07-27 | 2019-10-29 | Intuit Inc. | Method and system for crowdsourcing the detection of usability issues in a tax return preparation system |
JP6819988B2 (ja) * | 2016-07-28 | 2021-01-27 | 国立研究開発法人情報通信研究機構 | 音声対話装置、サーバ装置、音声対話方法、音声処理方法およびプログラム |
CN110019644B (zh) * | 2017-09-06 | 2022-10-14 | 腾讯科技(深圳)有限公司 | 对话实现中的搜索方法、装置和计算机可读存储介质 |
-
2018
- 2018-02-05 WO PCT/JP2018/003843 patent/WO2019150583A1/ja active Application Filing
- 2018-02-05 US US16/967,321 patent/US11416678B2/en active Active
- 2018-02-05 JP JP2019568547A patent/JP6988924B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
US11416678B2 (en) | 2022-08-16 |
US20210034815A1 (en) | 2021-02-04 |
WO2019150583A1 (ja) | 2019-08-08 |
JPWO2019150583A1 (ja) | 2021-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6988924B2 (ja) | 質問群抽出方法、質問群抽出装置および質問群抽出プログラム | |
CN106649742B (zh) | 数据库维护方法和装置 | |
JP5831951B2 (ja) | 対話システム、冗長メッセージ排除方法および冗長メッセージ排除プログラム | |
CN112417102B (zh) | 一种语音查询方法、装置、服务器和可读存储介质 | |
US20060129396A1 (en) | Method and apparatus for automatic grammar generation from data entries | |
KR102100951B1 (ko) | 기계 독해를 위한 질의응답 데이터 생성 시스템 | |
KR101677859B1 (ko) | 지식 베이스를 이용하는 시스템 응답 생성 방법 및 이를 수행하는 장치 | |
CN111613214A (zh) | 一种用于提升语音识别能力的语言模型纠错方法 | |
CN107657949A (zh) | 游戏数据的获取方法及装置 | |
JP6757840B2 (ja) | 文抽出システム、文抽出方法、及びプログラム | |
US11669691B2 (en) | Information processing apparatus, information processing method, and computer readable recording medium | |
CN114020888A (zh) | 文本生成的方法、装置、设备以及存储介质 | |
CN111814433B (zh) | 一种维吾尔语实体识别的方法、装置和电子设备 | |
CN114625889A (zh) | 一种语义消歧方法、装置、电子设备及存储介质 | |
JP2016048463A (ja) | 次発話候補ランキング装置、方法、及びプログラム | |
JP2019125154A (ja) | 情報処理装置、会話データ処理方法及び情報処理システム | |
US20210319481A1 (en) | System and method for summerization of customer interaction | |
CN114141235A (zh) | 语音语料库生成方法、装置、计算机设备和存储介质 | |
JP7013329B2 (ja) | 学習装置、学習方法および学習プログラム | |
JP7044642B2 (ja) | 評価装置、評価方法および評価プログラム | |
CN112685434A (zh) | 一种基于知识图谱的运维问答方法 | |
JP2021108033A (ja) | 質問回答表示サーバ、質問回答表示方法及び質問回答表示プログラム | |
Boonpa et al. | Relationship extraction from Thai children's tales for generating illustration | |
JP7216863B1 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
CN113743126B (zh) | 一种基于用户情绪的智能交互方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200731 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200731 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210824 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211020 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211102 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211115 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6988924 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |