JP6726638B2 - 含意認識装置、方法、及びプログラム - Google Patents
含意認識装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP6726638B2 JP6726638B2 JP2017094854A JP2017094854A JP6726638B2 JP 6726638 B2 JP6726638 B2 JP 6726638B2 JP 2017094854 A JP2017094854 A JP 2017094854A JP 2017094854 A JP2017094854 A JP 2017094854A JP 6726638 B2 JP6726638 B2 JP 6726638B2
- Authority
- JP
- Japan
- Prior art keywords
- similarity
- alignment
- pair
- self
- independent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
b)要素ju,jvが、t2において同一部分文にあり、t1において同一部分文にない。
c)要素ju,jvが、t2において同一部分文になく、t1において同一部分文にある。
d)要素ju,jvが、t2において同一部分文になく、t1において同一部分文にない。
図1は、本発明の請求項1の一例を示す含意認識装置の構成例である。図1に示すように、本発明の第1の実施の形態に係る含意認識装置100は、CPUと、RAMと、後述する各処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この含意認識装置100は、機能的には図1に示すように入力手段10と、演算手段20と、出力手段40とを備えている。
図10は、本発明の請求項2の一例を示す含意認識装置の構成例である。図10に示すように、本発明の第2の実施の形態に係る含意認識装置200は、CPUと、RAMと、後述する各処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この含意認識装置200は、機能的には図10に示すように入力手段210と、演算手段220と、出力手段240とを備えている。
20,220 演算手段
22 部分文抽出手段
24 類義自立部抽出手段
25 自立部データベース
26 アライメント選択手段
28 アライメント類似度算出手段
29 自立部重みデータベース
30 アライメント類似度補正手段
31 類似度補正率データベース
32 テキスト間類似度算出手段
40,240 出力手段
100,200 含意認識装置
224 テキストt1,t2の組選択手段
228 正解アライメント類似度算出手段
232 正解アライメント類似度補正手段
236 重回帰分析手段
Claims (5)
- 2つのテキストt1,t2の間の含意関係を認識する含意認識装置であって、
t1,t2それぞれに対し、係り受け解析し、用言文節を起点として、該用言文節と、該用言文節に係るまたは該用言文節が係る非用言文節と、非用言文節に係る非用言文節とを連結して得られる部分文を抽出し、前記部分文を除いた文節群の中の非用言文節と該非用言文節に係る非用言文節とを連結して得られる部分文を抽出することにより、部分文のリストを抽出する部分文抽出手段と、
t2中の各自立部に対し、該自立部と同義または類義のt1中の類義自立部のリストを抽出する類義自立部抽出手段と、
t2中の各自立部に対し、対応する類義自立部リストから一つの類義自立部を選択することにより、自立部間のアライメントを選択するアライメント選択手段と、
選択したアライメントにおいて、t2中の各自立部と該自立部に対応する類義自立部との類似度の、該自立部の重みを付けた平均をとることにより、該アライメントの類似度を算出するアライメント類似度算出手段と、
選択したアライメントにおいて、t2中の自立部の各ペアに対し、該ペアが同一の部分文にあるか否かと、該ペアの各自立部に対応する類義自立部が同一の部分文にあるか否かによって定まる類似度の補正率を、類似度補正率データベースより取得し、各ペアの類似度補正率の、該ペアの各自立部の重みから定まる該ペアの重みをつけた平均をとることにより、該アライメントの類似度の補正率を算出し、該アライメントの類似度に、該補正率を乗じることにより、該アライメントの補正類似度を算出するアライメント類似度補正手段と、
各アライメントの補正類似度の最大値を、テキストt1,t2間の類似度として算出するテキスト間類似度算出手段とを含むことを特徴とする含意認識装置。 - テキストt1,t2の組のリストであって、各組に対し、t1,t2それぞれの正解部分文のリストと、t2中の各自立部と該自立部に対応するt1中の正解の1類義自立部との対のリストである正解アライメントと、t1,t2が含意関係にあるか否かの正解ラベルが付与されているt1,t2の組のリストを入力とし、
処理対象とするテキストt1,t2の組を選択するテキストt1,t2の組選択手段と、
選択したt1,t2の組の正解アライメントにおいて、t2中の各自立部と該自立部に対応する類義自立部との類似度の、該自立部の重みを付けた平均をとることにより、該正解アライメントの類似度を算出する正解アライメント類似度算出手段と、
該正解アライメントにおいて、t2中の自立部の各ペアに対し、該ペアが同一の正解部分文にあるか否かと、該ペアの各自立部に対応する類義自立部が同一の正解部分文にあるか否かによって定まる類似度の補正率を未知数とし、各ペアの類似度補正率の、該ペアの各自立部の重みから定まる該ペアの重みをつけた平均をとることにより、該正解アライメントの類似度の補正率の式を導出し、該正解アライメントの類似度に、該補正率の式を乗じることにより、該正解アライメントの補正類似度の式を導出する正解アライメント類似度補正手段と、
各t1,t2の組の正解アライメントの補正類似度の式と、該組の正解ラベルとの対のリストに対し、重回帰分析を適用することにより、未知数である各類似度補正率の最適値を導出する重回帰分析手段とを含むことを特徴とする含意認識装置。 - 部分文抽出手段と、類義自立部抽出手段と、アライメント選択手段と、アライメント類似度算出手段と、アライメント類似度補正手段と、テキスト間類似度算出手段とを含み、2つのテキストt1,t2の間の含意関係を認識する含意認識装置における含意認識方法であって、
前記部分文抽出手段が、t1,t2それぞれに対し、係り受け解析し、用言文節を起点として、該用言文節と、該用言文節に係るまたは該用言文節が係る非用言文節と、非用言文節に係る非用言文節とを連結して得られる部分文を抽出し、前記部分文を除いた文節群の中の非用言文節と該非用言文節に係る非用言文節とを連結して得られる部分文を抽出することにより、部分文のリストを抽出するステップと、
前記類義自立部抽出手段が、t2中の各自立部に対し、該自立部と同義または類義のt1中の類義自立部のリストを抽出するステップと、
前記アライメント選択手段が、t2中の各自立部に対し、対応する類義自立部リストから一つの類義自立部を選択することにより、自立部間のアライメントを選択するステップと、
前記アライメント類似度算出手段が、選択したアライメントにおいて、t2中の各自立部と該自立部に対応する類義自立部との類似度の、該自立部の重みを付けた平均をとることにより、該アライメントの類似度を算出するステップと、
前記アライメント類似度補正手段が、選択したアライメントにおいて、t2中の自立部の各ペアに対し、該ペアが同一の部分文にあるか否かと、該ペアの各自立部に対応する類義自立部が同一の部分文にあるか否かによって定まる類似度の補正率を、類似度補正率データベースより取得し、各ペアの類似度補正率の、該ペアの各自立部の重みから定まる該ペアの重みをつけた平均をとることにより、該アライメントの類似度の補正率を算出し、該アライメントの類似度に、該補正率を乗じることにより、該アライメントの補正類似度を算出するステップと、
前記テキスト間類似度算出手段が、各アライメントの補正類似度の最大値を、テキストt1,t2間の類似度として算出するステップとを含むことを特徴とする含意認識方法。 - テキストt1,t2の組選択手段と、正解アライメント類似度算出手段と、正解アライメント類似度補正手段と、重回帰分析手段とを含む含意認識装置における含意認識方法であって、
テキストt1,t2の組のリストであって、各組に対し、t1,t2それぞれの正解部分文のリストと、t2中の各自立部と該自立部に対応するt1中の正解の1類義自立部との対のリストである正解アライメントと、t1,t2が含意関係にあるか否かの正解ラベルが付与されているt1,t2の組のリストを入力とし、
前記テキストt1,t2の組選択手段が、処理対象とするテキストt1,t2の組を選択するステップと、
前記正解アライメント類似度算出手段が、選択したt1,t2の組の正解アライメントにおいて、t2中の各自立部と該自立部に対応する類義自立部との類似度の、該自立部の重みを付けた平均をとることにより、該正解アライメントの類似度を算出するステップと、
前記正解アライメント類似度補正手段が、該正解アライメントにおいて、t2中の自立部の各ペアに対し、該ペアが同一の正解部分文にあるか否かと、該ペアの各自立部に対応する類義自立部が同一の正解部分文にあるか否かによって定まる類似度の補正率を未知数とし、各ペアの類似度補正率の、該ペアの各自立部の重みから定まる該ペアの重みをつけた平均をとることにより、該正解アライメントの類似度の補正率の式を導出し、該正解アライメントの類似度に、該補正率の式を乗じることにより、該正解アライメントの補正類似度の式を導出するステップと、
前記重回帰分析手段が、各t1,t2の組の正解アライメントの補正類似度の式と、該組の正解ラベルとの対のリストに対し、重回帰分析を適用することにより、未知数である各類似度補正率の最適値を導出するステップとを含むことを特徴とする含意認識方法。 - コンピュータを、請求項1又は請求項2記載の含意認識装置の各手段として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017094854A JP6726638B2 (ja) | 2017-05-11 | 2017-05-11 | 含意認識装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017094854A JP6726638B2 (ja) | 2017-05-11 | 2017-05-11 | 含意認識装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018190339A JP2018190339A (ja) | 2018-11-29 |
JP6726638B2 true JP6726638B2 (ja) | 2020-07-22 |
Family
ID=64480401
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017094854A Active JP6726638B2 (ja) | 2017-05-11 | 2017-05-11 | 含意認識装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6726638B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111753147A (zh) * | 2020-06-27 | 2020-10-09 | 百度在线网络技术(北京)有限公司 | 相似度处理方法、装置、服务器及存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG188994A1 (en) * | 2011-10-20 | 2013-05-31 | Nec Corp | Textual entailment recognition apparatus, textual entailment recognition method, and computer-readable recording medium |
JP6327799B2 (ja) * | 2013-05-22 | 2018-05-23 | 大学共同利用機関法人情報・システム研究機構 | 自然言語推論システム、自然言語推論方法及びプログラム |
JP2015225412A (ja) * | 2014-05-26 | 2015-12-14 | 日本電信電話株式会社 | 文書要約装置、方法、及びプログラム |
JP6551968B2 (ja) * | 2015-03-06 | 2019-07-31 | 国立研究開発法人情報通信研究機構 | 含意ペア拡張装置、そのためのコンピュータプログラム、及び質問応答システム |
-
2017
- 2017-05-11 JP JP2017094854A patent/JP6726638B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018190339A (ja) | 2018-11-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6846469B2 (ja) | インターネットテキストマイニングに基づく関心地点の有効性の判断方法および装置 | |
CN104615767B (zh) | 搜索排序模型的训练方法、搜索处理方法及装置 | |
US8255412B2 (en) | Boosting algorithm for ranking model adaptation | |
US8401847B2 (en) | Speech recognition system and program therefor | |
KR101923650B1 (ko) | 문장 임베딩 및 유사 질문 검색을 위한 장치 및 방법 | |
JP5537649B2 (ja) | データ検索およびインデクシングの方法および装置 | |
US20100205198A1 (en) | Search query disambiguation | |
WO2021212801A1 (zh) | 面向电商产品的评价对象识别方法、装置及存储介质 | |
CN107391614A (zh) | 一种基于wmd的中文问答匹配方法 | |
CN105808530B (zh) | 一种统计机器翻译中的翻译方法和装置 | |
US20120143790A1 (en) | Relevance of search results determined from user clicks and post-click user behavior obtained from click logs | |
US20080208836A1 (en) | Regression framework for learning ranking functions using relative preferences | |
JP2015062117A (ja) | 実体のリンク付け方法及び実体のリンク付け装置 | |
US8438080B1 (en) | Learning characteristics for extraction of information from web pages | |
CN111368094A (zh) | 实体知识图谱建立、属性信息获取、门诊分诊方法及装置 | |
CN110472062B (zh) | 识别命名实体的方法及装置 | |
CN114329225B (zh) | 基于搜索语句的搜索方法、装置、设备及存储介质 | |
JP2018147392A (ja) | モデル学習装置、スコア計算装置、方法、データ構造、及びプログラム | |
KR101089163B1 (ko) | 학습 콘텐츠 제공 장치 및 그 방법 | |
CN105243053B (zh) | 提取文档关键句的方法及装置 | |
JP6726638B2 (ja) | 含意認識装置、方法、及びプログラム | |
CN114022687B (zh) | 一种基于增强学习的图像描述对抗生成方法 | |
CN114385930A (zh) | 一种兴趣点推荐方法及*** | |
CN112559691A (zh) | 语义相似度的确定方法及确定装置、电子设备 | |
WO2021160822A1 (en) | A method for linking a cve with at least one synthetic cpe |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190626 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200605 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200623 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200629 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6726638 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |