JP5653709B2 - 質問応答システム - Google Patents
質問応答システム Download PDFInfo
- Publication number
- JP5653709B2 JP5653709B2 JP2010234383A JP2010234383A JP5653709B2 JP 5653709 B2 JP5653709 B2 JP 5653709B2 JP 2010234383 A JP2010234383 A JP 2010234383A JP 2010234383 A JP2010234383 A JP 2010234383A JP 5653709 B2 JP5653709 B2 JP 5653709B2
- Authority
- JP
- Japan
- Prior art keywords
- question
- sentence
- focus
- input
- analyzed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
Description
例えば、音声認識技術を用いたシステムとして、電話を使った航空券やホテルの予約などの自動応答システムがある。この自動応答システムは、利用者がシステムに対して要求を伝え、システムは利用者に要求内容の確認を行った後に予約などの処理を行う。また他の例として、利用者がwebでの検索を行う際に、クエリや質問を音声によってシステムに入力し、クエリや質問に応じた結果を返す質問応答システムも実用化されつつある。
例えば、利用者が質問応答システムに「風邪にはリンゴがいいの?」と尋ねた場合、質問応答システムはNoと回答するだけでは不十分であり、利用者は実際には「風邪にいいのは何か」を知りたがっている。したがって質問応答システムは、このYes/No質問を「何を」を尋ねるWhat質問であると判断し、「風邪にはミカンがいいそうです」と答える必要がある。すなわち質問応答システムは、利用者の知りたい箇所を特定し適切な内容を回答するために、表層ではYes/No質問にみえる質問が、深層ではWH質問(5W1H)としての役割を果たしているものとみなす必要がある。
以下、図面を参照して本発明の実施の形態について説明する。
図1は音声認識を用いた質問応答システムのブロック図である。質問応答システム10は、音声入力部11と、音声認識部12と、音響モデル13と、言語モデル14と、質問タイプ同定部15と、焦点解析部16と、回答文生成部17と、文例データベース18と、知識データベース19と、音声合成部20を備える。
図2に、質問タイプ同定部15による質問タイプの分類例を示す。質問タイプ同定部15はこの分類例に基づき、音声認識部12においてテキスト化された質問中に、「何」という言葉が使用されていれば質問タイプはWhatであると分類し、「どうして」という言葉が使用されていれば質問タイプはWhyであると分類し、「どうやって」という言葉が使用されていれば質問タイプはHowであると分類し、「いくら」という言葉が使用されていれば質問タイプはHowmuchであると分類し、「いつ」という言葉が使用されていれば質問タイプはWhenであると分類し、いずれのキーワードも使用されていなければ質問タイプはYes/No質問であると分類する。
なお、質問タイプの分類例は文例データベース18に記憶されている。
例えば焦点解析部16に入力された「風邪にはりんごがいいの?」が解析され、「りんごが」が焦点として抽出される。焦点解析部16による焦点解析の方法については、後に詳述する。
また回答文生成部17は、入力された質問がYes/No質問でなく、5W1Hを問う質問であれば、入力された質問を知識データベース19に記憶されている複数の文と比較し、最も類似している平叙文を抽出する。回答文生成部17による回答文の生成方法については、後に詳述する。
なお、文例データベース18で記憶するものは、上記のものに限られない。
図4に、質問文の最終文節の役割と文末例の対応表を示す。最終文節は、動詞、存在、可能、名詞+助動詞、形容詞、その他の6種類に分類されており、それぞれの分類には複数の文末例が登録されている。なお、判定不能の文末の場合はその他に分類される。
典型的には、最終文節の役割と文末例の対応表は、あらかじめ文例データベース18に記憶されている。
図5は、機能語のパターンを利用した焦点解析方法を示す図である。「インドネシアの考古学では遺跡を発見した方にクレジットや評価がいくんですか。」という質問が入力されると、焦点解析部16は「いくんですか」の役割を決定する。
例えば図5に示すように、焦点解析部16は、解析済み文の「それじゃ掘った人にクレジットや評価がいくのでしょうか。」の「いくのでしょうか」が、前述の「いくんですか」の役割と一致するか否かを判定する。ここで、「いくのでしょうか」と「いくんですか」の役割は一致したものとする。
分析対象質問文の最終文節と、解析済み文の最終文節の役割が一致していない場合には、ステップS12に進む(ステップS8でNo)。
入力文書の最終文節に直接係る文節とは、図5における、「考古学では」「方に」「評価が」が相当する。機能語とは助詞と助動詞であるので、「では」「に」「が」が相当する。ここで機能語の比較は、構文木の根から上に向かって行うため、「が」、「に」、「では」の順番になる。
図5において焦点解析部16は、分析対象質問文の「評価が」の「が」と、解析済み文の「評価が」の「が」を比較する。比較の結果、パターンが一致しているので、焦点解析部16は、一致した文節数のカウントをインクリメントする。その後、焦点解析部16はステップS9〜ステップS11のループにより、分析対象質問文の「方に」の「に」と解析済み文の「人に」の「に」の比較を行う。さらに焦点解析部16は、分析対象質問文の「考古学では」の「では」と、解析済み文の「それじゃ」の「じゃ」の比較を行う。したがって焦点解析部16では、一致した文節数の2がカウントされ、その後「では」と「じゃ」の機能語パターンの比較結果が不一致となる。
機能語パターンが不一致となった場合には(ステップS10でNo)、ステップS12に進む。
解析済み文が他に無ければ(ステップS12でNo)、ステップS13に進む。このとき典型的には、1つの分析対象質問文に対し、複数の解析済み文が比較された状態である。したがって、焦点解析部16にはそれぞれの解析済み文について、ステップS11で行われた文節数のカウントが記録されている。機能語のパターンの一致率をNf(st,sa(i))とする。
焦点解析部16は、複数の解析済み文の焦点の位置の多数決により、分析対象質問文の焦点の位置を推定する(ステップS14)。例えば、解析済み文「それじゃ掘った人にクレジットや評価がいくのでしょうか。」が、焦点の位置の推定に用いられる場合であって、あらかじめ焦点の位置が「人に」であると設定されている場合には、分析対象質問文の「方に」の箇所に焦点があるものとして投票される。
回答文生成部17は、入力された分析対象質問文をYes/No質問の形式から、深層質問タイプに応じたWH質問に変換する(ステップS21)。次に、回答文生成部17は、WH質問に変換された分析対象質問文を、自立語(疑問詞、名詞、形容詞、形容動詞、動詞)の列に変換する(ステップS22)。
この比較により一致する自立語の数を、文の自立語の数で除算することで正規化したものを類似度とする。回答文生成部17は、分析対象質問文を複数の文と比較し、もっとも類似度が高い文を選択する(ステップS23)。
質問応答システム10は、人間同士の会話から質問文を抽出し、Yes/No質問を収集する(ステップS31)。次に質問応答システム10は、収集した質問文から、順番に一つの質問文を選択する(ステップS32)。
質問応答システム10が自動で形態素解析と係り受け解析を実施した後、解析誤りがあれば、手動で修正を行う。
文例データベース18は、決定された焦点の箇所と深層質問タイプを登録する。
また質問応答システム10は、文例データベース18に解析済み文の学習データを蓄積することができ、これにより質問応答の精度を高めることができる。
実施の形態1では、分析対象質問文と解析済み文を比較する際に、最終文節と、最終文節にかかる文節の機能語の一致率について注目した。実施の形態2では、各文節の内容的な類似度に注目する。
以下に、焦点解析部16における焦点解析の具体的な手法を述べる。図8は、実施の形態2にかかる焦点解析のフローチャートである。なお、図3の焦点解析のフローチャートと同様の処理を行う箇所については、同一のステップ番号を付し、説明を省略する。
分析対象質問をst、解析済み文の集合を{sa(i)}とする。焦点解析部16はstの最終文節と、これに直接係る最終文節から文節番号を付与する。ここで、文節番号jの文節をpt(j)とする。sa(i)の最終文節と、これに直接係る最終文節から文節番号を付与し、文節番号jの文節をpa(i,j)とする。
次にpt(j)の形態素数をNuni-gram(pt(j))とする。また、pt(j)とpa(i,j)の形態素一致数をNuni-gram(pt(j),pa(i,j))とする。
pt(j)とpa(i,j)の形態素一致率Sim(pt(j),pa(i,j))は以下の式で求められる。
これを文節間類似度とする。
ここで入力文書の最終文節に直接係る文節とは、図9において、「考古学では」「方に」「評価が」が相当する。比較は構文木の根から上に向かう順序で行い、「が」、「に」、「では」の順序となる。ここでは、入力文の「評価が」と解析済み文の「評価が」が比較される。
図9において、入力文の「いくんですか」と解析済み文の「いくのでしょうか」は類似度が0でなく文節が終了していないので、焦点解析部16ではカウントをインクリメントし、ステップS49に戻る。その後ステップS49〜ステップS51のループにより、焦点解析部16において、入力文の「評価が」と解析済み文の「評価が」および、入力文の「方に」と解析済み文の「人に」の類似度の計算と、カウントのインクリメントが行われる。さらに焦点解析部16では、入力文の「考古学界では」と解析済み文の「それじゃ」の類似度を計算する。ここで、類似度はそれぞれ1、0.5、0であるものとする。
焦点解析部16は、stとsa(i)の最終文節とこれに直接係る文節の文節間について、それぞれ最終文節から順に形態素一致率Sim(pt(j),pa(i,j))を計算し、0でなかった文節数Nb(st,sa(i))と、そこまでの形態素一致率の積Sim(st,sa(i))を求める。
すなわち
である。これを文間類似度とする。
次にステップS53に進む。
その後、焦点解析部16は、焦点位置の投票結果に基づいて焦点位置を決定して出力する(ステップS56)。
実施の形態3では、実施の形態1で述べた最終文末および最終文末に係る文節の機能語の一致率に注目した焦点解析の方法と、実施の形態2で述べた各文節の内容的な類似度に注目した焦点解析の方法を、組み合わせた方法によって焦点解析を行う方法について述べる。
焦点解析部16は、stの最終文節と、これに直接かかる文節に最終文節から文節番号を付与し、文節番号jの文節をpt(j)とする。また、sa(i)の最終文節と、最終文節に直接係る文節に、最終文節から文節番号を付与し、文節番号jの文節をpa(i,j)とする。
pt(j)とpa(i,j)の形態素一致率Sim(pt(j),pa(i,j))は、以下の式で求められる。
これを機能語に着目した文節間類似度と定義する。
焦点解析部16は、stとsa(i)の最終文節と、最終文節に直接係る文節の文節間について、それぞれ最終文節から順に機能語に着目した形態素一致率Sim(pt(j),pa(i,j))を計算し、0でなかった文節数Nb(st,sa(i))とそこまでの機能語に着目した形態素一致率の積Sim(st,sa(i))を求める。すなわち、
である。ただし最終文節に関しては、役割が異なるか、形態素一致率が0ならば、文節間類似度を0とする。
したがって質問応答システム10は、機能語と類似度の両方を利用した焦点解析によって決定された焦点に基づいて、利用者の質問に回答することができる。
11 音声入力部
12 音声認識部
13 音響モデル
14 言語モデル
15 質問タイプ同定部
16 焦点解析部
17 回答文生成部
18 文例データベース
19 知識データベース
20 音声合成部
Claims (1)
- 利用者が質問を入力する質問入力手段と、
前記質問入力手段に入力された質問の構文を解析する構文解析手段と、
前記構文解析手段による解析結果に基づき、前記入力された質問の種類を判定する質問判定手段と、
前記質問判定手段により前記入力された質問の種類がYes又はNoで回答できる種類であると判定された場合に、前記入力された質問の焦点を決定する焦点決定手段と、
前記焦点決定手段により決定された焦点に応じて、適切な回答文を生成する回答文生成手段と、
あらかじめ前記焦点となる文節の位置が設定された解析済み文を記憶する文例データベースと、を備え、
前記焦点決定手段は、前記入力された質問文と前記解析済み文との、それぞれの最終文節の働きの比較と、当該最終文節に係る文節の機能語の比較と、当該機能語の出現順とに基づいて、最も類似した解析文を抽出し、その解析された焦点位置に基づいて、前記入力された質問の焦点を決定する、
質問応答システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010234383A JP5653709B2 (ja) | 2010-10-19 | 2010-10-19 | 質問応答システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010234383A JP5653709B2 (ja) | 2010-10-19 | 2010-10-19 | 質問応答システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012088893A JP2012088893A (ja) | 2012-05-10 |
JP5653709B2 true JP5653709B2 (ja) | 2015-01-14 |
Family
ID=46260459
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010234383A Active JP5653709B2 (ja) | 2010-10-19 | 2010-10-19 | 質問応答システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5653709B2 (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5860861B2 (ja) * | 2013-10-11 | 2016-02-16 | 日本電信電話株式会社 | 焦点推定装置、モデル学習装置、方法、及びプログラム |
JP6492698B2 (ja) * | 2015-01-28 | 2019-04-03 | 日本電気株式会社 | 情報処理システム、情報処理方法、及び、プログラム |
US20170206328A1 (en) * | 2015-07-31 | 2017-07-20 | Finc Co. Ltd. | Healthcare server, healthcare server control method, and non-transitory computer readable medium |
JP6362651B2 (ja) * | 2016-09-09 | 2018-07-25 | 株式会社FiNC | 健康管理サーバおよび健康管理サーバ制御方法並びに健康管理プログラム |
JP6429840B2 (ja) * | 2016-09-14 | 2018-11-28 | 株式会社FiNC | 健康管理サーバおよび健康管理サーバ制御方法並びに健康管理プログラム |
JP6360547B2 (ja) * | 2016-12-15 | 2018-07-18 | 株式会社FiNC | 健康管理サーバおよび健康管理サーバ制御方法並びに健康管理プログラム |
JP7081671B2 (ja) * | 2018-08-06 | 2022-06-07 | 富士通株式会社 | 評価プログラム、評価方法および情報処理装置 |
JP2019003680A (ja) * | 2018-09-03 | 2019-01-10 | 株式会社FiNC | 健康管理サーバおよび健康管理サーバ制御方法並びに健康管理プログラム |
JP6471344B1 (ja) * | 2018-10-05 | 2019-02-20 | 株式会社FiNC Technologies | 健康管理サーバおよび健康管理サーバ制御方法並びに健康管理プログラム |
JP6630962B2 (ja) * | 2018-10-05 | 2020-01-15 | 株式会社FiNC Technologies | 健康管理サーバおよび健康管理サーバ制御方法並びに健康管理プログラム |
JP6630961B2 (ja) * | 2018-10-05 | 2020-01-15 | 株式会社FiNC Technologies | 健康管理サーバおよび健康管理サーバ制御方法並びに健康管理プログラム |
JP6630960B2 (ja) * | 2018-10-05 | 2020-01-15 | 株式会社FiNC Technologies | 健康管理サーバおよび健康管理サーバ制御方法並びに健康管理プログラム |
JP6630963B2 (ja) * | 2018-10-05 | 2020-01-15 | 株式会社FiNC Technologies | 健康管理サーバおよび健康管理サーバ制御方法並びに健康管理プログラム |
JP6634617B2 (ja) * | 2018-10-05 | 2020-01-22 | 株式会社FiNC Technologies | 健康管理サーバおよび健康管理サーバ制御方法並びに健康管理プログラム |
JP2019036328A (ja) * | 2018-10-05 | 2019-03-07 | 株式会社FiNC Technologies | 健康管理サーバおよび健康管理サーバ制御方法並びに健康管理プログラム |
JP6630964B2 (ja) * | 2018-10-05 | 2020-01-15 | 株式会社FiNC Technologies | 健康管理サーバおよび健康管理サーバ制御方法並びに健康管理プログラム |
JP6471343B2 (ja) * | 2018-10-05 | 2019-02-20 | 株式会社FiNC Technologies | 健康管理サーバおよび健康管理サーバ制御方法並びに健康管理プログラム |
JP6630965B2 (ja) * | 2018-10-05 | 2020-01-15 | 株式会社FiNC Technologies | 健康管理サーバおよび健康管理サーバ制御方法並びに健康管理プログラム |
CN110347792B (zh) * | 2019-06-25 | 2022-12-20 | 腾讯科技(深圳)有限公司 | 对话生成方法及装置、存储介质、电子设备 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0793351A (ja) * | 1993-09-22 | 1995-04-07 | Matsushita Electric Ind Co Ltd | 自然言語質問応答生成装置 |
WO2007099812A1 (ja) * | 2006-03-01 | 2007-09-07 | Nec Corporation | 質問回答装置、質問回答方法および質問回答用プログラム |
-
2010
- 2010-10-19 JP JP2010234383A patent/JP5653709B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012088893A (ja) | 2012-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5653709B2 (ja) | 質問応答システム | |
CA2508946C (en) | Method and apparatus for natural language call routing using confidence scores | |
JP4195428B2 (ja) | 多数の音声特徴を利用する音声認識 | |
US8165877B2 (en) | Confidence measure generation for speech related searching | |
CN109151218A (zh) | 通话语音质检方法、装置、计算机设备及存储介质 | |
US20060074898A1 (en) | System and method for improving the accuracy of audio searching | |
Griol et al. | Combining speech-based and linguistic classifiers to recognize emotion in user spoken utterances | |
Lakomkin et al. | KT-speech-crawler: Automatic dataset construction for speech recognition from YouTube videos | |
JP5073024B2 (ja) | 音声対話装置 | |
Granell et al. | A multimodal crowdsourcing framework for transcribing historical handwritten documents | |
US8423354B2 (en) | Speech recognition dictionary creating support device, computer readable medium storing processing program, and processing method | |
KR101483947B1 (ko) | 핵심어에서의 음소 오류 결과를 고려한 음향 모델 변별 학습을 위한 장치 및 이를 위한 방법이 기록된 컴퓨터 판독 가능한 기록매체 | |
Stemmer et al. | Acoustic modeling of foreign words in a German speech recognition system | |
JP5360414B2 (ja) | キーワード抽出モデル学習システム、方法およびプログラム | |
Mukherjee et al. | REARC-a Bangla Phoneme recognizer | |
Llitjós et al. | Improving pronunciation accuracy of proper names with language origin classes | |
JP2010277036A (ja) | 音声データ検索装置 | |
JP2011248107A (ja) | 音声認識結果検索方法とその装置とプログラム | |
Suhasini et al. | ASR_SSN_CSE@ LTEDI-2023: Pretrained Transformer based Automatic Speech Recognition system for Elderly People | |
Wang | Mandarin spoken document retrieval based on syllable lattice matching | |
Pramod Reddy | Recognition of human emotion with spectral features using multi layer-perceptron | |
WO2022084851A1 (en) | Embedded dictation detection | |
Chandramouli et al. | Unsupervised paradigm for information extraction from transcripts using BERT | |
Suhasini et al. | ASR TAMIL SSN@ LT-EDI-2024: Automatic Speech Recognition system for Elderly People | |
Wang et al. | Confidence measures for voice search applications. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130703 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7426 Effective date: 20130703 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20130703 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140224 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140401 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140529 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141028 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141119 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5653709 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |