JP2020071678A - 情報処理装置、制御方法、プログラム - Google Patents
情報処理装置、制御方法、プログラム Download PDFInfo
- Publication number
- JP2020071678A JP2020071678A JP2018205385A JP2018205385A JP2020071678A JP 2020071678 A JP2020071678 A JP 2020071678A JP 2018205385 A JP2018205385 A JP 2018205385A JP 2018205385 A JP2018205385 A JP 2018205385A JP 2020071678 A JP2020071678 A JP 2020071678A
- Authority
- JP
- Japan
- Prior art keywords
- learning
- search
- target document
- search target
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明の目的は、情報検索における順位学習において、学習データを効果的に使うことで精度向上の効果を高め、また学習時間が短縮を可能とする技術を提供することである。
図5は、本発明の実施形態に係る生成された素性ベクトルの一例である。本発明における類似検索は、“学習時”および実際にユーザなどがFAQを閲覧する“問合せ時”がある。何れの場合も素性ベクトルを生成する。
まず各FAQを正解とする学習データの数により適切な学習データを選択する方法を提示する。設定パラメータ1100(図11)にある学習実行件数に10とある記載に基づき、1つのFAQに対応する学習データが10件以上ある場合だけ、それらの学習データを適切な学習データとして、順位学習に利用する方法を提示する。
その他の方法を記載する。学習データに含まれるクエリが適切なものであれば、学習をしていない状態であっても(すなわち情報検索部131による検索であっても)、正解となるFAQは比較的上位に来る。そのため、例えば50位を閾値として、学習データのクエリで検索した結果、対応づけられる正解のFAQが50位以内に入っている場合は、その学習データはよい学習データである、と見なす。
実施形態2と類似の方法として、閾値として順位ではなく、クエリとFAQの検索結果の類似度(検索スコア)を用いる。すなわち、類似度が一定の値以上であれば、よい学習データであると見なす。
実施形態4として、実施形態3,4を合わせて順位と類似度の両方を閾値とする方法もある。その他、学習データと検索結果の中の正解に対し、類似度と関連する数値的な情報、内部に含まれる単語など言語的な情報、また単一の学習データではなく他の学習データと正解FAQから得られる統計値などを用いて分類できるのであれば、如何なる方法であってもよいことはいうまでもない。
101 学習データ前処理部
102 学習時検索部
103 情報検索部
104 学習用素性ベクトル生成部
105 学習用素性ベクトルマッピング部
106 学習モデル生成部
111 ユーザ条件受付部
112 ユーザ条件検索部
113 再ランク付け用素性ベクトル生成部
114 再ランク付け用素性ベクトルマッピング部
115 再ランク付け部
121 学習データ記憶部
122 設定記憶部
123 学習言語情報記憶部
124 検索対象文書記憶部
125 学習モデル記憶部
Claims (9)
- 検索クエリテキストにより検索対象文書を検索する検索手段と、前記検索対象文書と当該検索対象文書に対応付けられた学習用検索クエリテキストとを記憶する記憶手段とを備える情報処理装置であって、
前記検索対象文書に対応付けられた学習用検索クエリテキストを用いて、前記検索対象文書に対する付加テキスト情報を作成する作成手段と、
前記学習用検索クエリテキストと、前記検索対象文書に対する付加テキスト情報を含む文書データとの組を用いて順位学習を行う学習手段と
を備えることを特徴とする情報処理装置。 - 前記学習手段は、前記学習用検索クエリテキストと、前記検索対象文書に対する付加テキスト情報のみから成る文書データとの組を用いて順位学習を行うことを特徴とする請求項1に記載の情報処理装置。
- 前記学習手段は、前記学習用検索クエリテキストと、前記文書データとから算出される素性データを用いて順位学習を行うことを特徴とする請求項1または2に記載の情報処理装置。
- 前記素性データには、前記学習用検索クエリテキストにより、前記文書データに対応する前記検索対象文書が検索された場合の検索スコアを含むことを特徴とする請求項3に記載の情報処理装置。
- 前記付加テキスト情報は、前記学習用検索クエリテキストから抽出された特徴語を含むことを特徴とする請求項1〜4のいずれか1項に記載の情報処理装置。
- 前記付加テキスト情報に含まれる特徴語の数が所定の値に従って制限されることを特徴とする請求項5に記載の情報処理装置。
- 前記学習手段は、前記検索対象文書それぞれに対応付けられた学習用検索クエリテキストの数が所定の値を超える場合に、前記文書データに前記検索対象文書に対する付加テキスト情報を含めることを特徴とする請求項1〜6のいずれか1項に記載の情報処理装置。
- 検索クエリテキストにより検索対象文書を検索する検索手段と、前記検索対象文書と当該検索対象文書に対応付けられた学習用検索クエリテキストとを記憶する記憶手段とを備える情報処理装置の制御方法であって、
作成手段が、前記検索対象文書に対応付けられた学習用検索クエリテキストを用いて、前記検索対象文書に対する付加テキスト情報を作成する作成ステップと、
学習手段が、前記学習用検索クエリテキストと、前記検索対象文書に対する付加テキスト情報を含む文書データとの組を用いて順位学習を行う学習ステップと
を備える情報処理装置の制御方法。 - 検索クエリテキストにより検索対象文書を検索する検索手段と、前記検索対象文書と当該検索対象文書に対応付けられた学習用検索クエリテキストとを記憶する記憶手段とを備える情報処理装置において実行可能なプログラムであって、
前記情報処理装置を、
前記検索対象文書に対応付けられた学習用検索クエリテキストを用いて、前記検索対象文書に対する付加テキスト情報を作成する作成手段と、
前記学習用検索クエリテキストと、前記検索対象文書に対する付加テキスト情報を含む文書データとの組を用いて順位学習を行う学習手段
として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018205385A JP7256357B2 (ja) | 2018-10-31 | 2018-10-31 | 情報処理装置、制御方法、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018205385A JP7256357B2 (ja) | 2018-10-31 | 2018-10-31 | 情報処理装置、制御方法、プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2020071678A true JP2020071678A (ja) | 2020-05-07 |
JP2020071678A5 JP2020071678A5 (ja) | 2022-08-30 |
JP7256357B2 JP7256357B2 (ja) | 2023-04-12 |
Family
ID=70549581
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018205385A Active JP7256357B2 (ja) | 2018-10-31 | 2018-10-31 | 情報処理装置、制御方法、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7256357B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021230190A1 (ja) * | 2020-05-11 | 2021-11-18 | Jeインターナショナル株式会社 | オペレーション支援装置、オペレーション支援方法、およびプログラム |
JP7030296B1 (ja) * | 2021-05-26 | 2022-03-07 | 株式会社エス・ケイ通信 | プログラム、方法、情報処理装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006338457A (ja) * | 2005-06-03 | 2006-12-14 | Fuji Xerox Co Ltd | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム |
JP2011141838A (ja) * | 2010-01-08 | 2011-07-21 | Fujitsu Ltd | 情報処理装置、情報処理プログラム、及び、情報処理方法 |
JP2013061718A (ja) * | 2011-09-12 | 2013-04-04 | Nippon Telegr & Teleph Corp <Ntt> | サポートベクタ選択装置、方法、及びプログラム |
JP2013161330A (ja) * | 2012-02-07 | 2013-08-19 | Nippon Telegr & Teleph Corp <Ntt> | 学習データ生成装置、検索装置、学習データ生成方法、検索方法及びそのプログラム |
JP2013254420A (ja) * | 2012-06-08 | 2013-12-19 | Nippon Telegr & Teleph Corp <Ntt> | 質問応答装置、モデル学習装置、方法、及びプログラム |
-
2018
- 2018-10-31 JP JP2018205385A patent/JP7256357B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006338457A (ja) * | 2005-06-03 | 2006-12-14 | Fuji Xerox Co Ltd | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム |
JP2011141838A (ja) * | 2010-01-08 | 2011-07-21 | Fujitsu Ltd | 情報処理装置、情報処理プログラム、及び、情報処理方法 |
JP2013061718A (ja) * | 2011-09-12 | 2013-04-04 | Nippon Telegr & Teleph Corp <Ntt> | サポートベクタ選択装置、方法、及びプログラム |
JP2013161330A (ja) * | 2012-02-07 | 2013-08-19 | Nippon Telegr & Teleph Corp <Ntt> | 学習データ生成装置、検索装置、学習データ生成方法、検索方法及びそのプログラム |
JP2013254420A (ja) * | 2012-06-08 | 2013-12-19 | Nippon Telegr & Teleph Corp <Ntt> | 質問応答装置、モデル学習装置、方法、及びプログラム |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021230190A1 (ja) * | 2020-05-11 | 2021-11-18 | Jeインターナショナル株式会社 | オペレーション支援装置、オペレーション支援方法、およびプログラム |
JP2021179655A (ja) * | 2020-05-11 | 2021-11-18 | Jeインターナショナル株式会社 | オペレーション支援装置、オペレーション支援方法、およびプログラム |
JP7030296B1 (ja) * | 2021-05-26 | 2022-03-07 | 株式会社エス・ケイ通信 | プログラム、方法、情報処理装置 |
JP2022181236A (ja) * | 2021-05-26 | 2022-12-08 | 株式会社エス・ケイ通信 | プログラム、方法、情報処理装置 |
Also Published As
Publication number | Publication date |
---|---|
JP7256357B2 (ja) | 2023-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10896214B2 (en) | Artificial intelligence based-document processing | |
US7769771B2 (en) | Searching a document using relevance feedback | |
US9767144B2 (en) | Search system with query refinement | |
US8335787B2 (en) | Topic word generation method and system | |
US20040249808A1 (en) | Query expansion using query logs | |
US20120150861A1 (en) | Highlighting known answers in search results | |
WO2019169858A1 (zh) | 一种基于搜索引擎技术的数据分析方法及*** | |
JP7451747B2 (ja) | コンテンツを検索する方法、装置、機器及びコンピュータ読み取り可能な記憶媒体 | |
US20090307217A1 (en) | Method, Device and System for Processing, Browsing and Searching an Electronic Documents | |
US20210240775A1 (en) | System and method for providing automated and unsupervised inline question answering | |
CN110046298A (zh) | 一种查询词推荐方法、装置、终端设备及计算机可读介质 | |
US20120095997A1 (en) | Providing contextual hints associated with a user session | |
US20050138079A1 (en) | Processing, browsing and classifying an electronic document | |
JP2019164409A (ja) | 文書検索装置、文書検索方法、及び文書検索プログラム | |
JP7256357B2 (ja) | 情報処理装置、制御方法、プログラム | |
JP2013174988A (ja) | 類似文書検索支援装置及び類似文書検索支援プログラム | |
JP2010123036A (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
JP2020161012A (ja) | 情報処理装置、制御方法、プログラム | |
CN110688559A (zh) | 一种检索方法及装置 | |
JP7427510B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP2008282111A (ja) | 類似文書検索方法、プログラムおよび装置 | |
CN112905752A (zh) | 一种智能交互方法、装置、设备以及存储介质 | |
JP6181890B2 (ja) | 文献解析装置、文献解析方法およびプログラム | |
CN111259126A (zh) | 基于词语特征的相似度计算方法、装置、设备及存储介质 | |
JP2010238041A (ja) | 分類体系改正支援プログラム、分類体系改正支援装置、および分類体系改正支援方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190115 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211029 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220817 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220822 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220920 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221114 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230228 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230313 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7256357 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |