RU2018122689A - Способ и система выбора для ранжирования поисковых результатов с помощью алгоритма машинного обучения - Google Patents
Способ и система выбора для ранжирования поисковых результатов с помощью алгоритма машинного обучения Download PDFInfo
- Publication number
- RU2018122689A RU2018122689A RU2018122689A RU2018122689A RU2018122689A RU 2018122689 A RU2018122689 A RU 2018122689A RU 2018122689 A RU2018122689 A RU 2018122689A RU 2018122689 A RU2018122689 A RU 2018122689A RU 2018122689 A RU2018122689 A RU 2018122689A
- Authority
- RU
- Russia
- Prior art keywords
- query
- search
- machine learning
- learning algorithm
- queries
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Claims (69)
1. Исполняемый на компьютере способ ранжирования поисковых результатов с помощью первого алгоритма машинного обучения, причем способ выполняется сервером, на котором расположен второй алгоритм машинного обучения, который был обучен определять сходство запросов на основе их текстового содержимого, причем способ включает в себя:
получение вторым алгоритмом машинного обучения нового запроса;
извлечение вторым алгоритмом машинного обучения из базы данных поискового журнала, документа, который был введен на сервер поисковой системы;
вычисление вторым алгоритмом машинного обучения соответствующего параметра сходства между новым запросом и каждым запросом из множества поисковых запросов;
выбор вторым алгоритмом машинного обучения из множества поисковых запросов, данного прошлого запроса, связанного с наиболее высоким соответствующим параметром сходства;
извлечение вторым алгоритмом машинного обучения набора поисковых результатов, связанных с данным прошлым запросом, причем каждый поисковый результат из набора поисковых результатов связан с соответствующей аннотацией, включая:
по меньшей мере один соответствующий поисковый запрос, который был использован для получения доступа к соответствующему поисковому результату на сервере поисковой системы;
вычисление вторым алгоритмом машинного обучения для каждого из по меньшей мере одного соответствующего поискового запроса, который был использован для получения доступа к соответствующему поисковому результату, соответствующего второго параметра сходства; и
использование соответствующего второго параметра сходства в качестве фактора ранжирования первым алгоритмом машинного обучения для ранжирования связанных поисковых результатов в качестве поисковых результатов для нового запроса.
2. Способ по п. 1, дополнительно включающий в себя:
во время фазы обучения:
извлечение из базы данных поискового журнала множества поисковых запросов, которое было введено на сервер поисковой системы, причем множество поисковых запросов связано с соответствующим набором поисковых результатов, и каждый соответствующий поисковый результат соответствующего набора поисковых результатов связан по меньшей мере с одним соответствующим параметром пользовательского взаимодействия;
вычисление, для каждого запроса из множества поисковых запросов, соответствующего вектора запроса на основе по меньшей мере одного параметра пользовательского взаимодействия, связанного с каждым поисковым результатом из соответствующего набора поисковых результатов;
вычисление, для каждой возможной пары запросов из множества поисковых запросов, на основе соответствующих векторов запроса каждого запроса из пары запросов, соответствующего параметра сходства, причем соответствующий параметр сходства указывает на степень сходства между запросами в паре запросов;
создание набора обучающих объектов, причем каждый обучающий объект из набора обучающих объектов включает в себя указание на соответствующий запрос из каждой из возможных пар запросов и соответствующий параметр сходства;
обучение второго алгоритма машинного обучения на наборе обучающих объектов для определения параметра сходства новой пары запросов, причем по меньшей мере один запрос из новой пары запросов не включен в набор обучающих объектов.
3. Способ по п. 2, в котором соответствующая аннотация дополнительно включает в себя:
по меньшей мере один соответствующий параметр пользовательского взаимодействия, причем по меньшей мере один соответствующий параметр пользовательского взаимодействия указывает на пользовательское поведение с соответствующим поисковым результатом по меньшей одного пользователя после ввода по меньшей мере одного соответствующего запроса в сервер поисковой системы.
4. Способ по п. 2, в котором во время фазы обучения, соответствующий параметр сходства вычисляется путем использования одного из: скалярного произведения или коэффициента Отиаи (косинусного коэффициента).
5. Способ по п. 3, в котором соответствующий второй параметр сходства вычисляется вторым алгоритмом машинного обучения на основе:
соответствующего параметра сходства между новым запросом и по меньшей мере одним соответствующим поисковым запросом, включенным в соответствующую аннотацию; и
по меньшей мере одного соответствующего параметра пользовательского взаимодействия, включенного в соответствующую аннотацию.
6. Способ по п. 5, в котором вычисление вторым алгоритмом машинного обучения для каждого из по меньшей мере одного соответствующего поискового запроса, который был использован для получения доступа к соответствующему поисковому результату, соответствующего второго параметра сходства включает в себя:
перемножение соответствующего параметра сходства и по меньшей мере одного соответствующего параметра пользовательского взаимодействия.
7. Способ по п. 4, в котором обучение второго алгоритма машинного обучения на наборе обучающих объектов для определения параметра сходства новой пары запросов основано по меньшей мере на соответствующем текстовом свойстве каждого запроса из новой пары запросов.
8. Способ по п. 7, в котором второй алгоритм машинного обучения представляет собой нейронную сеть.
9. Способ по п. 8, в котором первый алгоритмом машинного обучения является алгоритмом на основе дерева решений.
10. Способ по п. 9, в котором первый алгоритмом машинного обучения использует множество дополнительных факторов для ранжирования, и причем соответствующий второй параметр сходства добавляется ко множеству дополнительных факторов для ранжирования.
11. Способ по п. 1, в котором параметр пользовательского взаимодействия является по меньшей мере одним из: кликабельность или время простоя.
12. Способ по п. 3, в котором способ дополнительно включает в себя, до этапа получения нового запроса:
создание множества аннотаций, включающих в себя соответствующие аннотации; и
сохранение множества аннотаций в хранилище сервера.
13. Способ по п. 8, в котором создание множества аннотаций выполняется третьим алгоритмом машинного обучения.
14. Система ранжирования поисковых результатов с помощью первого алгоритма машинного обучения, причем система выполняется вторым алгоритмом машинного обучения на системе, и второй алгоритм машинного обучения был обучен определять сходство запросов на основе их текстового содержимого, причем система включает в себя:
процессор;
постоянный машиночитаемый носитель компьютерной информации, содержащий инструкции, процессор;
при выполнении инструкций, выполнен с возможностью осуществлять:
получение вторым алгоритмом машинного обучения нового запроса;
извлечение вторым алгоритмом машинного обучения из базы данных поискового журнала, документа, который был введен на сервер поисковой системы;
вычисление вторым алгоритмом машинного обучения соответствующего параметра сходства между новым запросом и каждым запросом из множества поисковых запросов;
выбор вторым алгоритмом машинного обучения из множества поисковых запросов, данного прошлого запроса, связанного с наиболее высоким соответствующим параметром сходства;
извлечение вторым алгоритмом машинного обучения набора поисковых результатов, связанных с данным прошлым запросом, причем каждый поисковый результат из набора поисковых результатов связан с соответствующей аннотацией, включая:
по меньшей мере один соответствующий поисковый запрос, который был использован для получения доступа к соответствующему поисковому результату на сервере поисковой системы;
вычисление вторым алгоритмом машинного обучения для каждого из по меньшей мере одного соответствующего поискового запроса, который был использован для получения доступа к соответствующему поисковому результату, соответствующего второго параметра сходства; и
использование соответствующего второго параметра сходства в качестве фактора ранжирования первым алгоритмом машинного обучения для ранжирования соответствующих поисковых результатов в качестве поисковых результатов для нового запроса.
15. Система по п. 14, в которой процессор выполнен с дополнительной возможностью осуществлять:
во время фазы обучения:
извлечение из базы данных поискового журнала множества поисковых запросов, которое было введено на сервер поисковой системы, причем множество поисковых запросов связано с соответствующим набором поисковых результатов, и каждый соответствующий поисковый результат соответствующего набора поисковых результатов связан по меньшей мере с одним соответствующим параметром пользовательского взаимодействия;
вычисление, для каждого запроса из множества поисковых запросов, соответствующего вектора запроса на основе по меньшей мере одного параметра пользовательского взаимодействия, связанного с каждым поисковым результатом из соответствующего набора поисковых результатов;
вычисление, для каждой возможной пары запросов из множества поисковых запросов, на основе соответствующих векторов запроса каждого запроса из пары запросов, соответствующего параметра сходства, причем соответствующий параметр сходства указывает на степень сходства между запросами в паре запросов;
создание набора обучающих объектов, причем каждый обучающий объект из набора обучающих объектов включает в себя указание на соответствующий запрос из каждой из возможных пар запросов и соответствующий параметр сходства;
обучение второго алгоритма машинного обучения на наборе обучающих объектов для определения параметра сходства новой пары запросов, причем по меньшей мере один запрос из новой пары запросов не включен в набор обучающих объектов.
16. Система по п. 14, в которой соответствующая аннотация дополнительно включает в себя:
по меньшей мере один соответствующий параметр пользовательского взаимодействия, причем по меньшей мере один соответствующий параметр пользовательского взаимодействия указывает на пользовательское поведение с соответствующим поисковым результатом по меньшей одного пользователя после ввода по меньшей мере одного соответствующего запроса в сервер поисковой системы.
17. Система по п. 15, в которой во время фазы обучения, соответствующий параметр сходства вычисляется путем использования одного из: скалярного произведения или коэффициента Отиаи (косинусного коэффициента).
18. Система по п. 16, в которой соответствующий второй параметр сходства вычисляется вторым алгоритмом машинного обучения на основе:
соответствующего параметра сходства между новым запросом и по меньшей мере одним соответствующим поисковым запросом, включенным в соответствующую аннотацию; и
по меньшей мере одного соответствующего параметра пользовательского взаимодействия, включенного в соответствующую аннотацию.
19. Система по п. 18, в которой для вычисления вторым алгоритмом машинного обучения для каждого из по меньшей мере одного соответствующего поискового запроса, который был использован для получения доступа к соответствующему поисковому результату, соответствующего второго параметра сходства, процессор выполнен с возможностью осуществлять:
перемножение соответствующего параметра сходства и по меньшей мере одного соответствующего параметра пользовательского взаимодействия.
20. Система по п. 17, в которой обучение второго алгоритма машинного обучения на наборе обучающих объектов для определения параметра сходства новой пары запросов основано по меньшей мере на соответствующем текстовом свойстве каждого запроса из новой пары запросов.
21. Система по п. 20, в которой облачный сервис является сервисом облачного хранения.
22. Система по п. 21, в которой классификатор реализуется как алгоритм машинного обучения на основе дерева решений.
23. Система по п. 22, в которой первый алгоритм машинного обучения использует множество дополнительных факторов для ранжирования, и причем соответствующий второй параметр сходства добавляется ко множеству дополнительных факторов для ранжирования.
24. Система по п. 14, в которой параметр пользовательского взаимодействия является по меньшей мере одним из: кликабельность или время простоя.
25. Система по п. 16, в которой процессор далее выполнен с возможностью, до этапа получения нового запроса, осуществлять:
создание множества аннотаций, включающих в себя соответствующие аннотации; и
сохранение множества аннотаций в хранилище системы.
26. Система по п. 21, в которой создание множества векторов аннотации производится с помощью третьего алгоритма машинного обучения.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2018122689A RU2731658C2 (ru) | 2018-06-21 | 2018-06-21 | Способ и система выбора для ранжирования поисковых результатов с помощью алгоритма машинного обучения |
US16/277,088 US11681713B2 (en) | 2018-06-21 | 2019-02-15 | Method of and system for ranking search results using machine learning algorithm |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2018122689A RU2731658C2 (ru) | 2018-06-21 | 2018-06-21 | Способ и система выбора для ранжирования поисковых результатов с помощью алгоритма машинного обучения |
Publications (3)
Publication Number | Publication Date |
---|---|
RU2018122689A true RU2018122689A (ru) | 2019-12-24 |
RU2018122689A3 RU2018122689A3 (ru) | 2020-01-28 |
RU2731658C2 RU2731658C2 (ru) | 2020-09-07 |
Family
ID=68981763
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2018122689A RU2731658C2 (ru) | 2018-06-21 | 2018-06-21 | Способ и система выбора для ранжирования поисковых результатов с помощью алгоритма машинного обучения |
Country Status (2)
Country | Link |
---|---|
US (1) | US11681713B2 (ru) |
RU (1) | RU2731658C2 (ru) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11775573B2 (en) | 2019-04-15 | 2023-10-03 | Yandex Europe Ag | Method of and server for retraining machine learning algorithm |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11042538B2 (en) * | 2018-08-24 | 2021-06-22 | Mastercard International Incorporated | Predicting queries using neural networks |
US11526565B2 (en) * | 2019-04-05 | 2022-12-13 | Ovh | Method of and system for clustering search queries |
JP7321977B2 (ja) * | 2020-06-10 | 2023-08-07 | ヤフー株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
WO2023142042A1 (zh) * | 2022-01-29 | 2023-08-03 | 华为技术有限公司 | 排序模型训练方法、装置及存储介质 |
CN117540828B (zh) * | 2024-01-10 | 2024-06-04 | 中国电子科技集团公司第十五研究所 | 作训科目推荐模型训练方法、装置、电子设备和存储介质 |
Family Cites Families (139)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6269368B1 (en) | 1997-10-17 | 2001-07-31 | Textwise Llc | Information retrieval using dynamic evidence combination |
US6185558B1 (en) | 1998-03-03 | 2001-02-06 | Amazon.Com, Inc. | Identifying the items most relevant to a current query based on items selected in connection with similar queries |
US7124129B2 (en) | 1998-03-03 | 2006-10-17 | A9.Com, Inc. | Identifying the items most relevant to a current query based on items selected in connection with similar queries |
US6006225A (en) | 1998-06-15 | 1999-12-21 | Amazon.Com | Refining search queries by the suggestion of correlated terms from prior searches |
US6189002B1 (en) | 1998-12-14 | 2001-02-13 | Dolphin Search | Process and system for retrieval of documents using context-relevant semantic profiles |
US8775396B2 (en) | 1999-04-15 | 2014-07-08 | Intellectual Ventures I Llc | Method and system for searching a wide area network |
US7567958B1 (en) | 2000-04-04 | 2009-07-28 | Aol, Llc | Filtering system for providing personalized information in the absence of negative data |
US6701311B2 (en) | 2001-02-07 | 2004-03-02 | International Business Machines Corporation | Customer self service system for resource search and selection |
US6738764B2 (en) | 2001-05-08 | 2004-05-18 | Verity, Inc. | Apparatus and method for adaptively ranking search results |
US7149732B2 (en) | 2001-10-12 | 2006-12-12 | Microsoft Corporation | Clustering web queries |
US7296016B1 (en) | 2002-03-13 | 2007-11-13 | Google Inc. | Systems and methods for performing point-of-view searching |
US20040249808A1 (en) | 2003-06-06 | 2004-12-09 | Microsoft Corporation | Query expansion using query logs |
US8086619B2 (en) | 2003-09-05 | 2011-12-27 | Google Inc. | System and method for providing search query refinements |
US7505964B2 (en) | 2003-09-12 | 2009-03-17 | Google Inc. | Methods and systems for improving a search ranking using related queries |
US7689585B2 (en) | 2004-04-15 | 2010-03-30 | Microsoft Corporation | Reinforced clustering of multi-type data objects for search term suggestion |
US8135698B2 (en) | 2004-06-25 | 2012-03-13 | International Business Machines Corporation | Techniques for representing relationships between queries |
US7958115B2 (en) | 2004-07-29 | 2011-06-07 | Yahoo! Inc. | Search systems and methods using in-line contextual queries |
US7716198B2 (en) | 2004-12-21 | 2010-05-11 | Microsoft Corporation | Ranking search results using feature extraction |
US7698270B2 (en) | 2004-12-29 | 2010-04-13 | Baynote, Inc. | Method and apparatus for identifying, extracting, capturing, and leveraging expertise and knowledge |
US20060149710A1 (en) | 2004-12-30 | 2006-07-06 | Ross Koningstein | Associating features with entities, such as categories of web page documents, and/or weighting such features |
US7574426B1 (en) | 2005-03-31 | 2009-08-11 | A9.Com, Inc. | Efficiently identifying the items most relevant to a current query based on items selected in connection with similar queries |
WO2006110684A2 (en) | 2005-04-11 | 2006-10-19 | Textdigger, Inc. | System and method for searching for a query |
US20060294071A1 (en) | 2005-06-28 | 2006-12-28 | Microsoft Corporation | Facet extraction and user feedback for ranking improvement and personalization |
US20070005587A1 (en) | 2005-06-30 | 2007-01-04 | Microsoft Corporation | Relative search results based off of user interaction |
US8832100B2 (en) | 2005-09-14 | 2014-09-09 | Millennial Media, Inc. | User transaction history influenced search results |
US20090234711A1 (en) | 2005-09-14 | 2009-09-17 | Jorey Ramer | Aggregation of behavioral profile data using a monetization platform |
US7620607B1 (en) | 2005-09-26 | 2009-11-17 | Quintura Inc. | System and method for using a bidirectional neural network to identify sentences for use as document annotations |
US7577643B2 (en) | 2006-09-29 | 2009-08-18 | Microsoft Corporation | Key phrase extraction from query logs |
WO2008057268A2 (en) | 2006-10-26 | 2008-05-15 | Mobile Content Networks, Inc. | Techniques for determining relevant advertisements in response to queries |
US20080114750A1 (en) | 2006-11-14 | 2008-05-15 | Microsoft Corporation | Retrieval and ranking of items utilizing similarity |
JP2008181186A (ja) | 2007-01-23 | 2008-08-07 | Yahoo Japan Corp | クエリーログを利用したキーワードとサイトの関連度を求める方法 |
US7603348B2 (en) | 2007-01-26 | 2009-10-13 | Yahoo! Inc. | System for classifying a search query |
US8321448B2 (en) | 2007-02-22 | 2012-11-27 | Microsoft Corporation | Click-through log mining |
US7792813B2 (en) | 2007-08-31 | 2010-09-07 | Microsoft Corporation | Presenting result items based upon user behavior |
US8645390B1 (en) | 2007-08-31 | 2014-02-04 | Google Inc. | Reordering search query results in accordance with search context specific predicted performance functions |
US8086620B2 (en) | 2007-09-12 | 2011-12-27 | Ebay Inc. | Inference of query relationships |
US7877385B2 (en) | 2007-09-21 | 2011-01-25 | Microsoft Corporation | Information retrieval using query-document pair information |
US7895235B2 (en) | 2007-12-19 | 2011-02-22 | Yahoo! Inc. | Extracting semantic relations from query logs |
US8392436B2 (en) | 2008-02-07 | 2013-03-05 | Nec Laboratories America, Inc. | Semantic search via role labeling |
US7877404B2 (en) | 2008-03-05 | 2011-01-25 | Microsoft Corporation | Query classification based on query click logs |
US8694526B2 (en) | 2008-03-18 | 2014-04-08 | Google Inc. | Apparatus and method for displaying search results using tabs |
US20090248661A1 (en) | 2008-03-28 | 2009-10-01 | Microsoft Corporation | Identifying relevant information sources from user activity |
US20090254512A1 (en) | 2008-04-03 | 2009-10-08 | Yahoo! Inc. | Ad matching by augmenting a search query with knowledge obtained through search engine results |
US8965786B1 (en) | 2008-04-18 | 2015-02-24 | Google Inc. | User-based ad ranking |
US9128945B1 (en) * | 2008-05-16 | 2015-09-08 | Google Inc. | Query augmentation |
US20090313286A1 (en) | 2008-06-17 | 2009-12-17 | Microsoft Corporation | Generating training data from click logs |
US7958158B2 (en) | 2008-06-19 | 2011-06-07 | International Business Machines Corporation | Aggregating database queries |
US8239370B2 (en) | 2008-06-27 | 2012-08-07 | Microsoft Corporation | Basing search results on metadata of prior results |
US9183323B1 (en) | 2008-06-27 | 2015-11-10 | Google Inc. | Suggesting alternative query phrases in query results |
US20100010895A1 (en) | 2008-07-08 | 2010-01-14 | Yahoo! Inc. | Prediction of a degree of relevance between query rewrites and a search query |
US8515950B2 (en) | 2008-10-01 | 2013-08-20 | Microsoft Corporation | Combining log-based rankers and document-based rankers for searching |
KR20100069118A (ko) | 2008-12-16 | 2010-06-24 | 한국전자통신연구원 | 질의어 색인 데이터베이스 구축 방법과 그 질의어 색인 데이터베이스를 이용한 질의어 추천 방법 |
US8239334B2 (en) | 2008-12-24 | 2012-08-07 | Microsoft Corporation | Learning latent semantic space for ranking |
US8341095B2 (en) | 2009-01-12 | 2012-12-25 | Nec Laboratories America, Inc. | Supervised semantic indexing and its extensions |
US8156129B2 (en) | 2009-01-15 | 2012-04-10 | Microsoft Corporation | Substantially similar queries |
US20100198816A1 (en) | 2009-01-30 | 2010-08-05 | Yahoo! Inc. | System and method for presenting content representative of document search |
US9009146B1 (en) * | 2009-04-08 | 2015-04-14 | Google Inc. | Ranking search results based on similar queries |
US8145623B1 (en) | 2009-05-01 | 2012-03-27 | Google Inc. | Query ranking based on query clustering and categorization |
US20110004588A1 (en) | 2009-05-11 | 2011-01-06 | iMedix Inc. | Method for enhancing the performance of a medical search engine based on semantic analysis and user feedback |
CA2764496C (en) | 2009-06-05 | 2018-02-27 | Wenhui Liao | Feature engineering and user behavior analysis |
US8606786B2 (en) * | 2009-06-22 | 2013-12-10 | Microsoft Corporation | Determining a similarity measure between queries |
US20100332493A1 (en) | 2009-06-25 | 2010-12-30 | Yahoo! Inc. | Semantic search extensions for web search engines |
US8214363B2 (en) | 2009-07-06 | 2012-07-03 | Abhilasha Chaudhary | Recognizing domain specific entities in search queries |
US8543668B1 (en) | 2009-11-24 | 2013-09-24 | Google Inc. | Click tracking using link styles |
US9317613B2 (en) | 2010-04-21 | 2016-04-19 | Yahoo! Inc. | Large scale entity-specific resource classification |
US8478699B1 (en) * | 2010-04-30 | 2013-07-02 | Google Inc. | Multiple correlation measures for measuring query similarity |
US20120143790A1 (en) | 2010-12-01 | 2012-06-07 | Microsoft Corporation | Relevance of search results determined from user clicks and post-click user behavior obtained from click logs |
US20120158685A1 (en) | 2010-12-16 | 2012-06-21 | Microsoft Corporation | Modeling Intent and Ranking Search Results Using Activity-based Context |
US9064007B1 (en) | 2011-01-05 | 2015-06-23 | Google Inc. | Co-click based similarity score of queries and keywords |
EP2479686B1 (en) | 2011-01-24 | 2014-09-17 | AOL Inc. | Systems and methods for analyzing and clustering search queries |
US8612367B2 (en) | 2011-02-04 | 2013-12-17 | Microsoft Corporation | Learning similarity function for rare queries |
US8719257B2 (en) | 2011-02-16 | 2014-05-06 | Symantec Corporation | Methods and systems for automatically generating semantic/concept searches |
US8898156B2 (en) * | 2011-03-03 | 2014-11-25 | Microsoft Corporation | Query expansion for web search |
US20120253792A1 (en) | 2011-03-30 | 2012-10-04 | Nec Laboratories America, Inc. | Sentiment Classification Based on Supervised Latent N-Gram Analysis |
US9507861B2 (en) | 2011-04-01 | 2016-11-29 | Microsoft Technolgy Licensing, LLC | Enhanced query rewriting through click log analysis |
US8423547B2 (en) | 2011-04-08 | 2013-04-16 | Microsoft Corporation | Efficient query clustering using multi-partite graphs |
US8762365B1 (en) | 2011-08-05 | 2014-06-24 | Amazon Technologies, Inc. | Classifying network sites using search queries |
US8788477B1 (en) | 2011-09-19 | 2014-07-22 | Google Inc. | Identifying addresses and titles of authoritative web pages by analyzing search queries in query logs |
US20130110824A1 (en) | 2011-11-01 | 2013-05-02 | Microsoft Corporation | Configuring a custom search ranking model |
US9009148B2 (en) | 2011-12-19 | 2015-04-14 | Microsoft Technology Licensing, Llc | Clickthrough-based latent semantic model |
US8463595B1 (en) | 2012-03-06 | 2013-06-11 | Reputation.Com, Inc. | Detailed sentiment analysis |
US9064016B2 (en) | 2012-03-14 | 2015-06-23 | Microsoft Corporation | Ranking search results using result repetition |
US9767144B2 (en) | 2012-04-20 | 2017-09-19 | Microsoft Technology Licensing, Llc | Search system with query refinement |
US8775442B2 (en) | 2012-05-15 | 2014-07-08 | Apple Inc. | Semantic search using a single-source semantic model |
WO2014050002A1 (ja) | 2012-09-28 | 2014-04-03 | 日本電気株式会社 | クエリ類似度評価システム、評価方法、及びプログラム |
US9104733B2 (en) | 2012-11-29 | 2015-08-11 | Microsoft Technology Licensing, Llc | Web search ranking |
US9251292B2 (en) | 2013-03-11 | 2016-02-02 | Wal-Mart Stores, Inc. | Search result ranking using query clustering |
US9519859B2 (en) | 2013-09-06 | 2016-12-13 | Microsoft Technology Licensing, Llc | Deep structured semantic model produced using click-through data |
US9715660B2 (en) | 2013-11-04 | 2017-07-25 | Google Inc. | Transfer learning for deep neural network based hotword detection |
US9633017B2 (en) | 2013-11-07 | 2017-04-25 | Yahoo! Inc. | Dwell-time based generation of a user interest profile |
US9898554B2 (en) | 2013-11-18 | 2018-02-20 | Google Inc. | Implicit question query identification |
US9589277B2 (en) | 2013-12-31 | 2017-03-07 | Microsoft Technology Licensing, Llc | Search service advertisement selection |
RU2556425C1 (ru) | 2014-02-14 | 2015-07-10 | Закрытое акционерное общество "Эвентос" (ЗАО "Эвентос") | Способ автоматической итеративной кластеризации электронных документов по семантической близости, способ поиска в совокупности кластеризованных по семантической близости документов и машиночитаемые носители |
US9818065B2 (en) | 2014-03-12 | 2017-11-14 | Microsoft Technology Licensing, Llc | Attribution of activity in multi-user settings |
US11170425B2 (en) | 2014-03-27 | 2021-11-09 | Bce Inc. | Methods of augmenting search engines for eCommerce information retrieval |
US9477654B2 (en) | 2014-04-01 | 2016-10-25 | Microsoft Corporation | Convolutional latent semantic models and their applications |
US9535960B2 (en) | 2014-04-14 | 2017-01-03 | Microsoft Corporation | Context-sensitive search using a deep learning model |
US10642845B2 (en) | 2014-05-30 | 2020-05-05 | Apple Inc. | Multi-domain search on a computing device |
US20150356199A1 (en) | 2014-06-06 | 2015-12-10 | Microsoft Corporation | Click-through-based cross-view learning for internet searches |
US9846836B2 (en) | 2014-06-13 | 2017-12-19 | Microsoft Technology Licensing, Llc | Modeling interestingness with deep neural networks |
US10089580B2 (en) | 2014-08-11 | 2018-10-02 | Microsoft Technology Licensing, Llc | Generating and using a knowledge-enhanced model |
RU2580516C2 (ru) | 2014-08-19 | 2016-04-10 | Общество С Ограниченной Ответственностью "Яндекс" | Способ формирования персонализированной модели ранжирования, способ формирования модели ранжирования, электронное устройство и сервер |
JP5957048B2 (ja) | 2014-08-19 | 2016-07-27 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 曖昧性を解消する教師データの生成方法、生成システム、及び生成プログラム |
RU2609079C2 (ru) | 2015-02-27 | 2017-01-30 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и сервер обработки поискового предложения |
US9946799B2 (en) | 2015-04-30 | 2018-04-17 | Microsoft Technology Licensing, Llc | Federated search page construction based on machine learning |
US10997184B2 (en) | 2015-05-22 | 2021-05-04 | Coveo Solutions, Inc. | System and method for ranking search results |
US10606946B2 (en) | 2015-07-06 | 2020-03-31 | Microsoft Technology Licensing, Llc | Learning word embedding using morphological knowledge |
US10387464B2 (en) | 2015-08-25 | 2019-08-20 | Facebook, Inc. | Predicting labels using a deep-learning model |
US10133729B2 (en) | 2015-08-28 | 2018-11-20 | Microsoft Technology Licensing, Llc | Semantically-relevant discovery of solutions |
WO2017040663A1 (en) | 2015-09-01 | 2017-03-09 | Skytree, Inc. | Creating a training data set based on unlabeled textual data |
US20170083523A1 (en) | 2015-09-18 | 2017-03-23 | Facebook, Inc. | Granular Forward Indexes on Online Social Networks |
US10354182B2 (en) | 2015-10-29 | 2019-07-16 | Microsoft Technology Licensing, Llc | Identifying relevant content items using a deep-structured neural network |
US9659248B1 (en) | 2016-01-19 | 2017-05-23 | International Business Machines Corporation | Machine learning and training a computer-implemented neural network to retrieve semantically equivalent questions using hybrid in-memory representations |
US10489712B2 (en) * | 2016-02-26 | 2019-11-26 | Oath Inc. | Quality-based scoring and inhibiting of user-generated content |
US10621507B2 (en) | 2016-03-12 | 2020-04-14 | Wipro Limited | System and method for generating an optimized result set using vector based relative importance measure |
US10740678B2 (en) | 2016-03-31 | 2020-08-11 | International Business Machines Corporation | Concept hierarchies |
RU2632143C1 (ru) * | 2016-04-11 | 2017-10-02 | Общество С Ограниченной Ответственностью "Яндекс" | Способ обучения модуля ранжирования с использованием обучающей выборки с зашумленными ярлыками |
US10789545B2 (en) | 2016-04-14 | 2020-09-29 | Oath Inc. | Method and system for distributed machine learning |
US10606847B2 (en) | 2016-05-31 | 2020-03-31 | Microsoft Technology Licensing, Llc | Generation of training data for ideal candidate search ranking model |
CN106095983B (zh) | 2016-06-20 | 2019-11-26 | 北京百度网讯科技有限公司 | 一种基于个性化深度神经网络的相似度确定方法及装置 |
US10762439B2 (en) | 2016-07-26 | 2020-09-01 | International Business Machines Corporation | Event clustering and classification with document embedding |
US20180052853A1 (en) | 2016-08-22 | 2018-02-22 | Salesforce.Com, Inc. | Adjusting feature weights for ranking entity based search results |
RU2637998C1 (ru) | 2016-09-12 | 2017-12-08 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и система создания краткого изложения цифрового контента |
US9767182B1 (en) | 2016-10-28 | 2017-09-19 | Searchmetrics Gmbh | Classification of search queries |
US20180121550A1 (en) | 2016-10-28 | 2018-05-03 | Facebook, Inc. | Ranking Search Results Based on Lookalike Users on Online Social Networks |
RU2643466C1 (ru) * | 2017-04-14 | 2018-02-01 | Алексей Валентинович Воронин | Способ и система формирования результатов поисковой выдачи |
WO2018192831A1 (en) | 2017-04-20 | 2018-10-25 | Koninklijke Philips N.V. | Learning and applying contextual similarities between entities |
US10915524B1 (en) | 2017-06-27 | 2021-02-09 | Amazon Technologies, Inc. | Scalable distributed data processing and indexing |
US10733507B2 (en) | 2017-07-25 | 2020-08-04 | Microsoft Technology Licensing, Llc | Semantic clustering based retrieval for candidate set expansion |
CN110019658B (zh) | 2017-07-31 | 2023-01-20 | 腾讯科技(深圳)有限公司 | 检索项的生成方法及相关装置 |
US10803055B2 (en) | 2017-12-15 | 2020-10-13 | Accenture Global Solutions Limited | Cognitive searches based on deep-learning neural networks |
US20190205472A1 (en) | 2017-12-28 | 2019-07-04 | Salesforce.Com, Inc. | Ranking Entity Based Search Results Based on Implicit User Interactions |
CN111971679A (zh) | 2018-01-26 | 2020-11-20 | 威盖特技术美国有限合伙人公司 | 基于行业语言模型生成自然语言推荐 |
US10628432B2 (en) | 2018-02-19 | 2020-04-21 | Microsoft Technology Licensing, Llc | Personalized deep models for smart suggestions ranking |
US10909196B1 (en) | 2018-02-26 | 2021-02-02 | A9.Com, Inc. | Indexing and presentation of new digital content |
US10915538B2 (en) | 2018-03-23 | 2021-02-09 | Home Depot Product Authority, Llc | Ranking and presenting search engine results based on category-specific ranking models |
US11126630B2 (en) | 2018-05-07 | 2021-09-21 | Salesforce.Com, Inc. | Ranking partial search query results based on implicit user interactions |
US20200004886A1 (en) | 2018-06-28 | 2020-01-02 | Microsoft Technology Licensing, Llc | Generating supervised embedding representations for search |
WO2020051704A1 (en) | 2018-09-12 | 2020-03-19 | Avigilon Corporation | System and method for improving speed of similarity based searches |
-
2018
- 2018-06-21 RU RU2018122689A patent/RU2731658C2/ru active
-
2019
- 2019-02-15 US US16/277,088 patent/US11681713B2/en active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11775573B2 (en) | 2019-04-15 | 2023-10-03 | Yandex Europe Ag | Method of and server for retraining machine learning algorithm |
Also Published As
Publication number | Publication date |
---|---|
US11681713B2 (en) | 2023-06-20 |
US20190391982A1 (en) | 2019-12-26 |
RU2018122689A3 (ru) | 2020-01-28 |
RU2731658C2 (ru) | 2020-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2018122689A (ru) | Способ и система выбора для ранжирования поисковых результатов с помощью алгоритма машинного обучения | |
JP6526329B2 (ja) | ウェブページトレーニング方法及び装置、検索意図識別方法及び装置 | |
US20220292333A1 (en) | Prediction-model-based mapping and/or search using a multi-data-type vector space | |
US10997256B2 (en) | Webpage classification method and apparatus, calculation device and machine readable storage medium | |
CN108280114B (zh) | 一种基于深度学习的用户文献阅读兴趣分析方法 | |
US10565253B2 (en) | Model generation method, word weighting method, device, apparatus, and computer storage medium | |
WO2021082123A1 (zh) | 信息推荐方法及装置、电子设备 | |
RU2018132848A (ru) | Способ и система для расширения поисковых запросов с целью ранжирования результатов поиска | |
CN110309251B (zh) | 文本数据的处理方法、装置和计算机可读存储介质 | |
CN110134777B (zh) | 问题去重方法、装置、电子设备和计算机可读存储介质 | |
CN108572971B (zh) | 一种用于挖掘与检索词相关的关键词的方法和装置 | |
GB2583679A (en) | Searching multilingual documents based on document structure extraction | |
US20160078087A1 (en) | Query features and questions | |
CN106649423A (zh) | 一种基于内容相关度的检索模型计算方法 | |
RU2018144177A (ru) | Способ и система генерирования признака для ранжирования документа | |
CN112100470B (zh) | 基于论文数据分析的专家推荐方法、装置、设备及存储介质 | |
CN112084307A (zh) | 一种数据处理方法、装置、服务器及计算机可读存储介质 | |
CN112612875A (zh) | 一种查询词自动扩展方法、装置、设备及存储介质 | |
CN103744970B (zh) | 一种确定图片的主题词的方法及装置 | |
Mazloom et al. | Few-example video event retrieval using tag propagation | |
Zhang et al. | USTB at INEX2014: Social Book Search Track. | |
CN111339778B (zh) | 文本处理方法、装置、存储介质和处理器 | |
Moroo et al. | Reranking-based Crash Report Deduplication. | |
CN116610810A (zh) | 基于调控云知识图谱血缘关系的智能搜索方法及*** | |
Rinjeni et al. | Matching Scientific Article Titles using Cosine Similarity and Jaccard Similarity Algorithm |