JP2012133785A - 減少クエリを推薦する検索システムおよび検索方法 - Google Patents
減少クエリを推薦する検索システムおよび検索方法 Download PDFInfo
- Publication number
- JP2012133785A JP2012133785A JP2011279933A JP2011279933A JP2012133785A JP 2012133785 A JP2012133785 A JP 2012133785A JP 2011279933 A JP2011279933 A JP 2011279933A JP 2011279933 A JP2011279933 A JP 2011279933A JP 2012133785 A JP2012133785 A JP 2012133785A
- Authority
- JP
- Japan
- Prior art keywords
- query
- terms
- weight value
- term
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2452—Query translation
- G06F16/24528—Standardisation; Simplification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
- G06F16/24534—Query rewriting; Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Software Systems (AREA)
- Computational Mathematics (AREA)
- Algebra (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】検索システムは、入力されたクエリから2以上の用語を抽出する用語抽出部と、抽出された用語それぞれの加重値を算出する加重値算出部と、算出された加重値を基準にして抽出された用語のうち少なくとも1つの用語を除去し、残りの用語を用いて少なくとも1つの減少クエリを提供する減少クエリ推薦部と、を備え、クエリは、クエリを介した検索結果が予め選定された数以下であるクエリを含むことを特徴とする。
【選択図】図5
Description
510 用語抽出部
520 加重値算出部
530 減少クエリ推薦部
540 検索結果提供部
Claims (17)
- 入力されたクエリから2以上の用語を抽出する用語抽出部と、
前記抽出された用語それぞれの加重値を算出する加重値算出部と、
前記算出された加重値を基準にして前記抽出された用語のうち少なくとも1つの用語を除去し、残りの用語を用いて少なくとも1つの減少クエリを提供する減少クエリ推薦部と、
を備えることを特徴とする検索システム。 - 前記クエリは、前記クエリを介した検索結果が予め選定された数以下であるクエリを含むことを特徴とする請求項1に記載の検索システム。
- 前記用語抽出部は、
前記クエリを形態素分析して複数の用語を抽出する形態素分析部と、
クエリログを用いて前記複数の用語のうち前記クエリ内で互いに隣接した用語間の相互の情報量を算出し、前記相互の情報量が閾値以上である互いに隣接した用語を1つの用語として結合するウィークコンセプト抽出部と、
を備えることを特徴とする請求項1または2に記載の検索システム。 - 前記相互の情報量は、
前記クエリログで前記互いに隣接した用語がそれぞれ用いられた回数および前記互いに隣接した用語が共に用いられた回数を用いて算出されることを特徴とする請求項3に記載の検索システム。 - 前記加重値算出部は、
前記抽出された用語それぞれに対して、全体文書の数および該当用語が含まれた文書の数に基づいて算出される第1加重値、クエリログに含まれたクエリの数、および該当用語と前記クエリログに含まれたクエリが正確にマッチングされる数に基づいて算出される第2加重値、前記クエリログに含まれたクエリの数と該当用語と前記クエリログに含まれたクエリが部分的にマッチングされる数に基づいて算出される第3加重値、および前記第2加重値の前記第3加重値に対する比率に基づいて算出される第4加重値のうち少なくとも1つの加重値を用いて前記抽出された用語それぞれの加重値を算出することを特徴とする請求項1〜4のいずれか1項に記載の検索システム。 - 前記減少クエリ推薦部は、
前記抽出された用語から前記加重値を基準にして予め選定された順位以下の用語を除去する用語除去部と、
前記除去された用語を除いた残りの用語を用いて前記少なくとも1つの減少クエリを生成する減少クエリ生成部と、
を備えることを特徴とする請求項1〜5のいずれか1項に記載の検索システム。 - 前記減少クエリ生成部は、
前記加重値が最も高い用語をキー用語として選定し、キー用語と前記残りの用語のうち他の用語の組合に基づいて前記少なくとも1つの減少クエリを生成することを特徴とする請求項6に記載の検索システム。 - 前記少なくとも1つの減少クエリを用いて前記クエリを入力したユーザに検索結果を提供する検索結果提供部をさらに備えることを特徴とする請求項1〜7のいずれか1項に記載の検索システム。
- 前記検索結果提供部は、
前記少なくとも1つの減少クエリによる検索結果を前記ユーザに提供することを特徴とする請求項8に記載の検索システム。 - 前記クエリは商品検索のためにユーザから入力されたクエリとして、前記クエリによって検索された商品が予め選定された数以下であるクエリを含むことを特徴とする請求項1〜9のいずれか1項に記載の検索システム。
- 入力されたクエリから2以上の用語を抽出し、
前記抽出された用語それぞれの加重値を算出し、
前記算出された加重値を基準にして前記抽出された用語のうち少なくとも1つの用語を除去し、残りの用語を用いて少なくとも1つの減少クエリを提供することを特徴とする検索方法。 - 前記クエリは、前記クエリを介した検索結果が予め選定された数以下であるクエリを含むことを特徴とする請求項11に記載の検索方法。
- 前記入力されたクエリから2以上の用語を抽出することは、
前記クエリを形態素分析して複数の用語を抽出し、
クエリログを用いて前記複数の用語のうち前記クエリ内で互いに隣接した用語間の相互の情報量を算出し、前記相互の情報量が閾値以上である互いに隣接した用語を1つの用語として結合することを特徴とする請求項11または12に記載の検索方法。 - 前記抽出された用語それぞれの加重値を算出することは、
前記抽出された用語それぞれに対して、全体文書の数および該当用語が含まれた文書の数に基づいて算出される第1加重値、クエリログに含まれたクエリの数および該当用語と前記クエリログに含まれたクエリが正確にマッチングされる数に基づいて算出される第2加重値、前記クエリログに含まれたクエリの数と該当用語と前記クエリログに含まれたクエリが部分的にマッチングされる数に基づいて算出される第3加重値、および前記第2加重値の前記第3加重値に対する比率に基づいて算出される第4加重値のうち少なくとも1つの加重値を用いて前記抽出された用語それぞれの加重値を算出することを特徴とする請求項11〜13のいずれか1項に記載の検索方法。 - 前記少なくとも1つの減少クエリを提供することは、
前記抽出された用語から前記加重値を基準にして予め選定された順位以下の用語を除去し、
前記除去された用語を除いた残りの用語を用いて前記少なくとも1つの減少クエリを生成することを特徴とする請求項11〜14のいずれか1項に記載の検索方法。 - 前記少なくとも1つの減少クエリを用いて前記クエリを入力したユーザに検索結果を提供することを特徴とする請求項11〜15のいずれか1項に記載の検索方法。
- 請求項11〜16のいずれか1項の方法を行うプログラムを記録したコンピュータで読み出し可能な記録媒体。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20100133136 | 2010-12-23 | ||
KR10-2010-0133136 | 2010-12-23 | ||
KR1020110121487A KR101850886B1 (ko) | 2010-12-23 | 2011-11-21 | 감소 질의를 추천하는 검색 시스템 및 방법 |
KR10-2011-0121487 | 2011-11-21 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012133785A true JP2012133785A (ja) | 2012-07-12 |
JP5838086B2 JP5838086B2 (ja) | 2015-12-24 |
Family
ID=46318299
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011279933A Active JP5838086B2 (ja) | 2010-12-23 | 2011-12-21 | 減少クエリを推薦する検索システムおよび検索方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9128982B2 (ja) |
JP (1) | JP5838086B2 (ja) |
KR (1) | KR101850886B1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8515973B1 (en) | 2011-02-08 | 2013-08-20 | Google Inc. | Identifying geographic features from query prefixes |
US9477748B2 (en) * | 2013-12-20 | 2016-10-25 | Adobe Systems Incorporated | Filter selection in search environments |
KR102052604B1 (ko) * | 2014-02-28 | 2019-12-05 | 현대엠엔소프트 주식회사 | 내비게이션의 검색 방법 및 그 장치 |
US9753967B2 (en) * | 2014-03-31 | 2017-09-05 | Samsung Electronics Co., Ltd. | Computing system with error detection mechanism and method of operation thereof |
US10417687B1 (en) * | 2014-12-12 | 2019-09-17 | Amazon Technologies, Inc. | Generating modified query to identify similar items in a data store |
US10083238B2 (en) * | 2015-09-28 | 2018-09-25 | Oath Inc. | Multi-touch gesture search |
CN106445921B (zh) * | 2016-09-29 | 2019-05-07 | 北京理工大学 | 利用二次互信息的中文文本术语抽取方法 |
CN106503258B (zh) * | 2016-11-18 | 2020-05-12 | 深圳市世强元件网络有限公司 | 一种网站站内精确搜索方法 |
CN106873801A (zh) * | 2017-02-28 | 2017-06-20 | 百度在线网络技术(北京)有限公司 | 用于生成输入法词库中的词条组合的方法和装置 |
US10860809B2 (en) * | 2019-04-09 | 2020-12-08 | Sas Institute Inc. | Word embeddings and virtual terms |
US11556550B2 (en) * | 2021-04-15 | 2023-01-17 | RELX Inc. | Methods and systems for no fail searching |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH064584A (ja) * | 1992-06-24 | 1994-01-14 | Sharp Corp | 文章検索装置 |
JPH09153068A (ja) * | 1995-11-29 | 1997-06-10 | Oki Electric Ind Co Ltd | 類似検索方法および装置 |
JP2000029890A (ja) * | 1998-07-10 | 2000-01-28 | Nippon Telegr & Teleph Corp <Ntt> | データベース検索方法及び装置及びデータベース検索プログラムを格納した記憶媒体 |
JP2002230037A (ja) * | 2001-01-31 | 2002-08-16 | Kddi Corp | 検索システム、方法及びプログラム |
JP2006163623A (ja) * | 2004-12-03 | 2006-06-22 | Nippon Hoso Kyokai <Nhk> | 質問応答装置及び質問応答プログラム、並びに、テレビ受像機 |
JP2008003721A (ja) * | 2006-06-20 | 2008-01-10 | Canon Software Inc | 情報検索システムおよび情報検索方法およびプログラムおよび記録媒体 |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6073130A (en) * | 1997-09-23 | 2000-06-06 | At&T Corp. | Method for improving the results of a search in a structured database |
US6144958A (en) * | 1998-07-15 | 2000-11-07 | Amazon.Com, Inc. | System and method for correcting spelling errors in search queries |
US6397211B1 (en) * | 2000-01-03 | 2002-05-28 | International Business Machines Corporation | System and method for identifying useless documents |
JP2002049638A (ja) | 2000-05-26 | 2002-02-15 | Fujitsu Ltd | 文書情報検索装置、方法、文書情報検索プログラム及び文書情報検索プログラムを格納したコンピュータ可読の記録媒体 |
US6883001B2 (en) * | 2000-05-26 | 2005-04-19 | Fujitsu Limited | Document information search apparatus and method and recording medium storing document information search program therein |
US7885963B2 (en) * | 2003-03-24 | 2011-02-08 | Microsoft Corporation | Free text and attribute searching of electronic program guide (EPG) data |
KR100515641B1 (ko) * | 2003-04-24 | 2005-09-22 | 우순조 | 모빌적 형상 개념을 기초로 한 구문 분석방법 및 이를이용한 자연어 검색 방법 |
US20040220907A1 (en) * | 2003-04-30 | 2004-11-04 | Camarillo David W. | Technique for searching for contact information concerning desired parties |
JP4574186B2 (ja) | 2004-02-17 | 2010-11-04 | 株式会社リコー | 重要言語識別方法、重要言語識別プログラム、重要言語識別装置、文書検索装置およびキーワード抽出装置 |
US7406465B2 (en) | 2004-12-14 | 2008-07-29 | Yahoo! Inc. | System and methods for ranking the relative value of terms in a multi-term search query using deletion prediction |
US8429184B2 (en) * | 2005-12-05 | 2013-04-23 | Collarity Inc. | Generation of refinement terms for search queries |
US7627559B2 (en) * | 2005-12-15 | 2009-12-01 | Microsoft Corporation | Context-based key phrase discovery and similarity measurement utilizing search engine query logs |
KR100816912B1 (ko) | 2006-04-13 | 2008-03-26 | 엘지전자 주식회사 | 문서검색 시스템 및 그 방법 |
US8001114B2 (en) * | 2006-07-18 | 2011-08-16 | Wilson Chu | Methods and apparatuses for dynamically searching for electronic mail messages |
US7505973B2 (en) * | 2007-01-16 | 2009-03-17 | Microsoft Corporation | Efficient paging of search query results |
US7925644B2 (en) * | 2007-03-01 | 2011-04-12 | Microsoft Corporation | Efficient retrieval algorithm by query term discrimination |
JP5332128B2 (ja) | 2007-03-30 | 2013-11-06 | 富士通株式会社 | 情報検索装置、情報検索方法およびそのプログラム |
JP2008287406A (ja) * | 2007-05-16 | 2008-11-27 | Sony Corp | 情報処理装置および情報処理方法、プログラム、並びに、記録媒体 |
US8051056B2 (en) * | 2007-05-29 | 2011-11-01 | Microsoft Corporation | Acquiring ontological knowledge from query logs |
US8032527B2 (en) * | 2007-08-29 | 2011-10-04 | Google Inc. | Search filtering |
US8046355B2 (en) * | 2007-09-04 | 2011-10-25 | Google Inc. | Word decompounder |
US8583670B2 (en) * | 2007-10-04 | 2013-11-12 | Microsoft Corporation | Query suggestions for no result web searches |
US8019748B1 (en) * | 2007-11-14 | 2011-09-13 | Google Inc. | Web search refinement |
US8280886B2 (en) * | 2008-02-13 | 2012-10-02 | Fujitsu Limited | Determining candidate terms related to terms of a query |
KR100931025B1 (ko) * | 2008-03-18 | 2009-12-10 | 한국과학기술원 | 재현율의 저하 없이 정확도를 향상시키기 위한 추가 용어를이용한 질의 확장 방법 |
US20100153366A1 (en) * | 2008-12-15 | 2010-06-17 | Motorola, Inc. | Assigning an indexing weight to a search term |
US8108391B1 (en) * | 2009-03-12 | 2012-01-31 | Google Inc. | Identifying non-compositional compounds |
US8423350B1 (en) * | 2009-05-21 | 2013-04-16 | Google Inc. | Segmenting text for searching |
US8392441B1 (en) * | 2009-08-15 | 2013-03-05 | Google Inc. | Synonym generation using online decompounding and transitivity |
US20120047025A1 (en) * | 2010-08-19 | 2012-02-23 | Google Inc. | Query stem advertising |
-
2011
- 2011-11-21 KR KR1020110121487A patent/KR101850886B1/ko active IP Right Grant
- 2011-12-21 JP JP2011279933A patent/JP5838086B2/ja active Active
- 2011-12-21 US US13/333,667 patent/US9128982B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH064584A (ja) * | 1992-06-24 | 1994-01-14 | Sharp Corp | 文章検索装置 |
JPH09153068A (ja) * | 1995-11-29 | 1997-06-10 | Oki Electric Ind Co Ltd | 類似検索方法および装置 |
JP2000029890A (ja) * | 1998-07-10 | 2000-01-28 | Nippon Telegr & Teleph Corp <Ntt> | データベース検索方法及び装置及びデータベース検索プログラムを格納した記憶媒体 |
JP2002230037A (ja) * | 2001-01-31 | 2002-08-16 | Kddi Corp | 検索システム、方法及びプログラム |
JP2006163623A (ja) * | 2004-12-03 | 2006-06-22 | Nippon Hoso Kyokai <Nhk> | 質問応答装置及び質問応答プログラム、並びに、テレビ受像機 |
JP2008003721A (ja) * | 2006-06-20 | 2008-01-10 | Canon Software Inc | 情報検索システムおよび情報検索方法およびプログラムおよび記録媒体 |
Non-Patent Citations (1)
Title |
---|
野寄 竜也 TATSUYA NOYORI: "単語クラスタリングと連接関係による複合語キーワードの抽出", 第69回(平成19年)全国大会講演論文集(2) 人工知能と認知科学, JPN6015016485, 6 March 2007 (2007-03-06), JP, ISSN: 0003060831 * |
Also Published As
Publication number | Publication date |
---|---|
US20120166450A1 (en) | 2012-06-28 |
US9128982B2 (en) | 2015-09-08 |
JP5838086B2 (ja) | 2015-12-24 |
KR20120132610A (ko) | 2012-12-06 |
KR101850886B1 (ko) | 2018-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5838086B2 (ja) | 減少クエリを推薦する検索システムおよび検索方法 | |
Ak et al. | Learning attribute representations with localization for flexible fashion search | |
Jaradat | Deep cross-domain fashion recommendation | |
CN103258025B (zh) | 生成共现关键词的方法、提供关联搜索词的方法以及*** | |
Yang et al. | Learning tuple compatibility for conditional outfit recommendation | |
CN106372122B (zh) | 一种基于维基语义匹配的文档分类方法及*** | |
CN104123285B (zh) | 搜索结果的导航方法及装置 | |
Blesneag et al. | Holomorphic Yukawa couplings in heterotic string theory | |
Shafqat et al. | A hybrid GAN-based approach to solve imbalanced data problem in recommendation systems | |
Chen et al. | Collaborative filtering based on demographic attribute vector | |
CN107832444A (zh) | 基于搜索日志的事件发现方法及装置 | |
Ginting et al. | Comparison of Priori and FP-Growth algorithms in determining association rules | |
WO2006123918A1 (en) | Query matching system and method, and computer readable recording medium recording program for implementing the method | |
Jiang et al. | DeepProduct: Mobile product search with portable deep features | |
Gu et al. | Fashion coordinates recommendation based on user behavior and visual clothing style | |
Zhou et al. | Attention calibration for transformer-based sequential recommendation | |
CN103942693B (zh) | 识别杂货铺的方法、装置及搜索店铺的方法、*** | |
CN105183892A (zh) | 广告信息搜索方法及装置 | |
Pei-Xia et al. | Learning discriminative CNN features and similarity metrics for image retrieval | |
JP2012221431A (ja) | 関連語抽出装置、関連語抽出方法、及び関連語抽出プログラム | |
Dodds et al. | Learning embeddings for product visual search with triplet loss and online sampling | |
Gupta et al. | Feature based opinion mining for mobile reviews | |
Schaak | The impact of free trade agreements on international agricultural trade: A gravity application on the dairy product trade and the ASEAN-China-FTA | |
JP5634859B2 (ja) | サイトクラスタシステムおよびサイトクラスタ方法 | |
CN106547919A (zh) | 一种海量数字信息的分布式推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140623 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150424 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150428 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20150724 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20150826 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150928 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151027 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151109 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5838086 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |