RU2018122689A - Способ и система выбора для ранжирования поисковых результатов с помощью алгоритма машинного обучения - Google Patents

Способ и система выбора для ранжирования поисковых результатов с помощью алгоритма машинного обучения Download PDF

Info

Publication number
RU2018122689A
RU2018122689A RU2018122689A RU2018122689A RU2018122689A RU 2018122689 A RU2018122689 A RU 2018122689A RU 2018122689 A RU2018122689 A RU 2018122689A RU 2018122689 A RU2018122689 A RU 2018122689A RU 2018122689 A RU2018122689 A RU 2018122689A
Authority
RU
Russia
Prior art keywords
query
search
machine learning
learning algorithm
queries
Prior art date
Application number
RU2018122689A
Other languages
English (en)
Other versions
RU2018122689A3 (ru
RU2731658C2 (ru
Inventor
Валерий Иванович Дужик
Андрей Дмитриевич Дроздовский
Олег Павлович Найдин
Original Assignee
Общество С Ограниченной Ответственностью "Яндекс"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Общество С Ограниченной Ответственностью "Яндекс" filed Critical Общество С Ограниченной Ответственностью "Яндекс"
Priority to RU2018122689A priority Critical patent/RU2731658C2/ru
Priority to US16/277,088 priority patent/US11681713B2/en
Publication of RU2018122689A publication Critical patent/RU2018122689A/ru
Publication of RU2018122689A3 publication Critical patent/RU2018122689A3/ru
Application granted granted Critical
Publication of RU2731658C2 publication Critical patent/RU2731658C2/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Claims (69)

1. Исполняемый на компьютере способ ранжирования поисковых результатов с помощью первого алгоритма машинного обучения, причем способ выполняется сервером, на котором расположен второй алгоритм машинного обучения, который был обучен определять сходство запросов на основе их текстового содержимого, причем способ включает в себя:
получение вторым алгоритмом машинного обучения нового запроса;
извлечение вторым алгоритмом машинного обучения из базы данных поискового журнала, документа, который был введен на сервер поисковой системы;
вычисление вторым алгоритмом машинного обучения соответствующего параметра сходства между новым запросом и каждым запросом из множества поисковых запросов;
выбор вторым алгоритмом машинного обучения из множества поисковых запросов, данного прошлого запроса, связанного с наиболее высоким соответствующим параметром сходства;
извлечение вторым алгоритмом машинного обучения набора поисковых результатов, связанных с данным прошлым запросом, причем каждый поисковый результат из набора поисковых результатов связан с соответствующей аннотацией, включая:
по меньшей мере один соответствующий поисковый запрос, который был использован для получения доступа к соответствующему поисковому результату на сервере поисковой системы;
вычисление вторым алгоритмом машинного обучения для каждого из по меньшей мере одного соответствующего поискового запроса, который был использован для получения доступа к соответствующему поисковому результату, соответствующего второго параметра сходства; и
использование соответствующего второго параметра сходства в качестве фактора ранжирования первым алгоритмом машинного обучения для ранжирования связанных поисковых результатов в качестве поисковых результатов для нового запроса.
2. Способ по п. 1, дополнительно включающий в себя:
во время фазы обучения:
извлечение из базы данных поискового журнала множества поисковых запросов, которое было введено на сервер поисковой системы, причем множество поисковых запросов связано с соответствующим набором поисковых результатов, и каждый соответствующий поисковый результат соответствующего набора поисковых результатов связан по меньшей мере с одним соответствующим параметром пользовательского взаимодействия;
вычисление, для каждого запроса из множества поисковых запросов, соответствующего вектора запроса на основе по меньшей мере одного параметра пользовательского взаимодействия, связанного с каждым поисковым результатом из соответствующего набора поисковых результатов;
вычисление, для каждой возможной пары запросов из множества поисковых запросов, на основе соответствующих векторов запроса каждого запроса из пары запросов, соответствующего параметра сходства, причем соответствующий параметр сходства указывает на степень сходства между запросами в паре запросов;
создание набора обучающих объектов, причем каждый обучающий объект из набора обучающих объектов включает в себя указание на соответствующий запрос из каждой из возможных пар запросов и соответствующий параметр сходства;
обучение второго алгоритма машинного обучения на наборе обучающих объектов для определения параметра сходства новой пары запросов, причем по меньшей мере один запрос из новой пары запросов не включен в набор обучающих объектов.
3. Способ по п. 2, в котором соответствующая аннотация дополнительно включает в себя:
по меньшей мере один соответствующий параметр пользовательского взаимодействия, причем по меньшей мере один соответствующий параметр пользовательского взаимодействия указывает на пользовательское поведение с соответствующим поисковым результатом по меньшей одного пользователя после ввода по меньшей мере одного соответствующего запроса в сервер поисковой системы.
4. Способ по п. 2, в котором во время фазы обучения, соответствующий параметр сходства вычисляется путем использования одного из: скалярного произведения или коэффициента Отиаи (косинусного коэффициента).
5. Способ по п. 3, в котором соответствующий второй параметр сходства вычисляется вторым алгоритмом машинного обучения на основе:
соответствующего параметра сходства между новым запросом и по меньшей мере одним соответствующим поисковым запросом, включенным в соответствующую аннотацию; и
по меньшей мере одного соответствующего параметра пользовательского взаимодействия, включенного в соответствующую аннотацию.
6. Способ по п. 5, в котором вычисление вторым алгоритмом машинного обучения для каждого из по меньшей мере одного соответствующего поискового запроса, который был использован для получения доступа к соответствующему поисковому результату, соответствующего второго параметра сходства включает в себя:
перемножение соответствующего параметра сходства и по меньшей мере одного соответствующего параметра пользовательского взаимодействия.
7. Способ по п. 4, в котором обучение второго алгоритма машинного обучения на наборе обучающих объектов для определения параметра сходства новой пары запросов основано по меньшей мере на соответствующем текстовом свойстве каждого запроса из новой пары запросов.
8. Способ по п. 7, в котором второй алгоритм машинного обучения представляет собой нейронную сеть.
9. Способ по п. 8, в котором первый алгоритмом машинного обучения является алгоритмом на основе дерева решений.
10. Способ по п. 9, в котором первый алгоритмом машинного обучения использует множество дополнительных факторов для ранжирования, и причем соответствующий второй параметр сходства добавляется ко множеству дополнительных факторов для ранжирования.
11. Способ по п. 1, в котором параметр пользовательского взаимодействия является по меньшей мере одним из: кликабельность или время простоя.
12. Способ по п. 3, в котором способ дополнительно включает в себя, до этапа получения нового запроса:
создание множества аннотаций, включающих в себя соответствующие аннотации; и
сохранение множества аннотаций в хранилище сервера.
13. Способ по п. 8, в котором создание множества аннотаций выполняется третьим алгоритмом машинного обучения.
14. Система ранжирования поисковых результатов с помощью первого алгоритма машинного обучения, причем система выполняется вторым алгоритмом машинного обучения на системе, и второй алгоритм машинного обучения был обучен определять сходство запросов на основе их текстового содержимого, причем система включает в себя:
процессор;
постоянный машиночитаемый носитель компьютерной информации, содержащий инструкции, процессор;
при выполнении инструкций, выполнен с возможностью осуществлять:
получение вторым алгоритмом машинного обучения нового запроса;
извлечение вторым алгоритмом машинного обучения из базы данных поискового журнала, документа, который был введен на сервер поисковой системы;
вычисление вторым алгоритмом машинного обучения соответствующего параметра сходства между новым запросом и каждым запросом из множества поисковых запросов;
выбор вторым алгоритмом машинного обучения из множества поисковых запросов, данного прошлого запроса, связанного с наиболее высоким соответствующим параметром сходства;
извлечение вторым алгоритмом машинного обучения набора поисковых результатов, связанных с данным прошлым запросом, причем каждый поисковый результат из набора поисковых результатов связан с соответствующей аннотацией, включая:
по меньшей мере один соответствующий поисковый запрос, который был использован для получения доступа к соответствующему поисковому результату на сервере поисковой системы;
вычисление вторым алгоритмом машинного обучения для каждого из по меньшей мере одного соответствующего поискового запроса, который был использован для получения доступа к соответствующему поисковому результату, соответствующего второго параметра сходства; и
использование соответствующего второго параметра сходства в качестве фактора ранжирования первым алгоритмом машинного обучения для ранжирования соответствующих поисковых результатов в качестве поисковых результатов для нового запроса.
15. Система по п. 14, в которой процессор выполнен с дополнительной возможностью осуществлять:
во время фазы обучения:
извлечение из базы данных поискового журнала множества поисковых запросов, которое было введено на сервер поисковой системы, причем множество поисковых запросов связано с соответствующим набором поисковых результатов, и каждый соответствующий поисковый результат соответствующего набора поисковых результатов связан по меньшей мере с одним соответствующим параметром пользовательского взаимодействия;
вычисление, для каждого запроса из множества поисковых запросов, соответствующего вектора запроса на основе по меньшей мере одного параметра пользовательского взаимодействия, связанного с каждым поисковым результатом из соответствующего набора поисковых результатов;
вычисление, для каждой возможной пары запросов из множества поисковых запросов, на основе соответствующих векторов запроса каждого запроса из пары запросов, соответствующего параметра сходства, причем соответствующий параметр сходства указывает на степень сходства между запросами в паре запросов;
создание набора обучающих объектов, причем каждый обучающий объект из набора обучающих объектов включает в себя указание на соответствующий запрос из каждой из возможных пар запросов и соответствующий параметр сходства;
обучение второго алгоритма машинного обучения на наборе обучающих объектов для определения параметра сходства новой пары запросов, причем по меньшей мере один запрос из новой пары запросов не включен в набор обучающих объектов.
16. Система по п. 14, в которой соответствующая аннотация дополнительно включает в себя:
по меньшей мере один соответствующий параметр пользовательского взаимодействия, причем по меньшей мере один соответствующий параметр пользовательского взаимодействия указывает на пользовательское поведение с соответствующим поисковым результатом по меньшей одного пользователя после ввода по меньшей мере одного соответствующего запроса в сервер поисковой системы.
17. Система по п. 15, в которой во время фазы обучения, соответствующий параметр сходства вычисляется путем использования одного из: скалярного произведения или коэффициента Отиаи (косинусного коэффициента).
18. Система по п. 16, в которой соответствующий второй параметр сходства вычисляется вторым алгоритмом машинного обучения на основе:
соответствующего параметра сходства между новым запросом и по меньшей мере одним соответствующим поисковым запросом, включенным в соответствующую аннотацию; и
по меньшей мере одного соответствующего параметра пользовательского взаимодействия, включенного в соответствующую аннотацию.
19. Система по п. 18, в которой для вычисления вторым алгоритмом машинного обучения для каждого из по меньшей мере одного соответствующего поискового запроса, который был использован для получения доступа к соответствующему поисковому результату, соответствующего второго параметра сходства, процессор выполнен с возможностью осуществлять:
перемножение соответствующего параметра сходства и по меньшей мере одного соответствующего параметра пользовательского взаимодействия.
20. Система по п. 17, в которой обучение второго алгоритма машинного обучения на наборе обучающих объектов для определения параметра сходства новой пары запросов основано по меньшей мере на соответствующем текстовом свойстве каждого запроса из новой пары запросов.
21. Система по п. 20, в которой облачный сервис является сервисом облачного хранения.
22. Система по п. 21, в которой классификатор реализуется как алгоритм машинного обучения на основе дерева решений.
23. Система по п. 22, в которой первый алгоритм машинного обучения использует множество дополнительных факторов для ранжирования, и причем соответствующий второй параметр сходства добавляется ко множеству дополнительных факторов для ранжирования.
24. Система по п. 14, в которой параметр пользовательского взаимодействия является по меньшей мере одним из: кликабельность или время простоя.
25. Система по п. 16, в которой процессор далее выполнен с возможностью, до этапа получения нового запроса, осуществлять:
создание множества аннотаций, включающих в себя соответствующие аннотации; и
сохранение множества аннотаций в хранилище системы.
26. Система по п. 21, в которой создание множества векторов аннотации производится с помощью третьего алгоритма машинного обучения.
RU2018122689A 2018-06-21 2018-06-21 Способ и система выбора для ранжирования поисковых результатов с помощью алгоритма машинного обучения RU2731658C2 (ru)

Priority Applications (2)

Application Number Priority Date Filing Date Title
RU2018122689A RU2731658C2 (ru) 2018-06-21 2018-06-21 Способ и система выбора для ранжирования поисковых результатов с помощью алгоритма машинного обучения
US16/277,088 US11681713B2 (en) 2018-06-21 2019-02-15 Method of and system for ranking search results using machine learning algorithm

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2018122689A RU2731658C2 (ru) 2018-06-21 2018-06-21 Способ и система выбора для ранжирования поисковых результатов с помощью алгоритма машинного обучения

Publications (3)

Publication Number Publication Date
RU2018122689A true RU2018122689A (ru) 2019-12-24
RU2018122689A3 RU2018122689A3 (ru) 2020-01-28
RU2731658C2 RU2731658C2 (ru) 2020-09-07

Family

ID=68981763

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2018122689A RU2731658C2 (ru) 2018-06-21 2018-06-21 Способ и система выбора для ранжирования поисковых результатов с помощью алгоритма машинного обучения

Country Status (2)

Country Link
US (1) US11681713B2 (ru)
RU (1) RU2731658C2 (ru)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11775573B2 (en) 2019-04-15 2023-10-03 Yandex Europe Ag Method of and server for retraining machine learning algorithm

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11042538B2 (en) * 2018-08-24 2021-06-22 Mastercard International Incorporated Predicting queries using neural networks
US11526565B2 (en) * 2019-04-05 2022-12-13 Ovh Method of and system for clustering search queries
JP7321977B2 (ja) * 2020-06-10 2023-08-07 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム
WO2023142042A1 (zh) * 2022-01-29 2023-08-03 华为技术有限公司 排序模型训练方法、装置及存储介质
CN117540828B (zh) * 2024-01-10 2024-06-04 中国电子科技集团公司第十五研究所 作训科目推荐模型训练方法、装置、电子设备和存储介质

Family Cites Families (139)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6269368B1 (en) 1997-10-17 2001-07-31 Textwise Llc Information retrieval using dynamic evidence combination
US6185558B1 (en) 1998-03-03 2001-02-06 Amazon.Com, Inc. Identifying the items most relevant to a current query based on items selected in connection with similar queries
US7124129B2 (en) 1998-03-03 2006-10-17 A9.Com, Inc. Identifying the items most relevant to a current query based on items selected in connection with similar queries
US6006225A (en) 1998-06-15 1999-12-21 Amazon.Com Refining search queries by the suggestion of correlated terms from prior searches
US6189002B1 (en) 1998-12-14 2001-02-13 Dolphin Search Process and system for retrieval of documents using context-relevant semantic profiles
US8775396B2 (en) 1999-04-15 2014-07-08 Intellectual Ventures I Llc Method and system for searching a wide area network
US7567958B1 (en) 2000-04-04 2009-07-28 Aol, Llc Filtering system for providing personalized information in the absence of negative data
US6701311B2 (en) 2001-02-07 2004-03-02 International Business Machines Corporation Customer self service system for resource search and selection
US6738764B2 (en) 2001-05-08 2004-05-18 Verity, Inc. Apparatus and method for adaptively ranking search results
US7149732B2 (en) 2001-10-12 2006-12-12 Microsoft Corporation Clustering web queries
US7296016B1 (en) 2002-03-13 2007-11-13 Google Inc. Systems and methods for performing point-of-view searching
US20040249808A1 (en) 2003-06-06 2004-12-09 Microsoft Corporation Query expansion using query logs
US8086619B2 (en) 2003-09-05 2011-12-27 Google Inc. System and method for providing search query refinements
US7505964B2 (en) 2003-09-12 2009-03-17 Google Inc. Methods and systems for improving a search ranking using related queries
US7689585B2 (en) 2004-04-15 2010-03-30 Microsoft Corporation Reinforced clustering of multi-type data objects for search term suggestion
US8135698B2 (en) 2004-06-25 2012-03-13 International Business Machines Corporation Techniques for representing relationships between queries
US7958115B2 (en) 2004-07-29 2011-06-07 Yahoo! Inc. Search systems and methods using in-line contextual queries
US7716198B2 (en) 2004-12-21 2010-05-11 Microsoft Corporation Ranking search results using feature extraction
US7698270B2 (en) 2004-12-29 2010-04-13 Baynote, Inc. Method and apparatus for identifying, extracting, capturing, and leveraging expertise and knowledge
US20060149710A1 (en) 2004-12-30 2006-07-06 Ross Koningstein Associating features with entities, such as categories of web page documents, and/or weighting such features
US7574426B1 (en) 2005-03-31 2009-08-11 A9.Com, Inc. Efficiently identifying the items most relevant to a current query based on items selected in connection with similar queries
WO2006110684A2 (en) 2005-04-11 2006-10-19 Textdigger, Inc. System and method for searching for a query
US20060294071A1 (en) 2005-06-28 2006-12-28 Microsoft Corporation Facet extraction and user feedback for ranking improvement and personalization
US20070005587A1 (en) 2005-06-30 2007-01-04 Microsoft Corporation Relative search results based off of user interaction
US8832100B2 (en) 2005-09-14 2014-09-09 Millennial Media, Inc. User transaction history influenced search results
US20090234711A1 (en) 2005-09-14 2009-09-17 Jorey Ramer Aggregation of behavioral profile data using a monetization platform
US7620607B1 (en) 2005-09-26 2009-11-17 Quintura Inc. System and method for using a bidirectional neural network to identify sentences for use as document annotations
US7577643B2 (en) 2006-09-29 2009-08-18 Microsoft Corporation Key phrase extraction from query logs
WO2008057268A2 (en) 2006-10-26 2008-05-15 Mobile Content Networks, Inc. Techniques for determining relevant advertisements in response to queries
US20080114750A1 (en) 2006-11-14 2008-05-15 Microsoft Corporation Retrieval and ranking of items utilizing similarity
JP2008181186A (ja) 2007-01-23 2008-08-07 Yahoo Japan Corp クエリーログを利用したキーワードとサイトの関連度を求める方法
US7603348B2 (en) 2007-01-26 2009-10-13 Yahoo! Inc. System for classifying a search query
US8321448B2 (en) 2007-02-22 2012-11-27 Microsoft Corporation Click-through log mining
US7792813B2 (en) 2007-08-31 2010-09-07 Microsoft Corporation Presenting result items based upon user behavior
US8645390B1 (en) 2007-08-31 2014-02-04 Google Inc. Reordering search query results in accordance with search context specific predicted performance functions
US8086620B2 (en) 2007-09-12 2011-12-27 Ebay Inc. Inference of query relationships
US7877385B2 (en) 2007-09-21 2011-01-25 Microsoft Corporation Information retrieval using query-document pair information
US7895235B2 (en) 2007-12-19 2011-02-22 Yahoo! Inc. Extracting semantic relations from query logs
US8392436B2 (en) 2008-02-07 2013-03-05 Nec Laboratories America, Inc. Semantic search via role labeling
US7877404B2 (en) 2008-03-05 2011-01-25 Microsoft Corporation Query classification based on query click logs
US8694526B2 (en) 2008-03-18 2014-04-08 Google Inc. Apparatus and method for displaying search results using tabs
US20090248661A1 (en) 2008-03-28 2009-10-01 Microsoft Corporation Identifying relevant information sources from user activity
US20090254512A1 (en) 2008-04-03 2009-10-08 Yahoo! Inc. Ad matching by augmenting a search query with knowledge obtained through search engine results
US8965786B1 (en) 2008-04-18 2015-02-24 Google Inc. User-based ad ranking
US9128945B1 (en) * 2008-05-16 2015-09-08 Google Inc. Query augmentation
US20090313286A1 (en) 2008-06-17 2009-12-17 Microsoft Corporation Generating training data from click logs
US7958158B2 (en) 2008-06-19 2011-06-07 International Business Machines Corporation Aggregating database queries
US8239370B2 (en) 2008-06-27 2012-08-07 Microsoft Corporation Basing search results on metadata of prior results
US9183323B1 (en) 2008-06-27 2015-11-10 Google Inc. Suggesting alternative query phrases in query results
US20100010895A1 (en) 2008-07-08 2010-01-14 Yahoo! Inc. Prediction of a degree of relevance between query rewrites and a search query
US8515950B2 (en) 2008-10-01 2013-08-20 Microsoft Corporation Combining log-based rankers and document-based rankers for searching
KR20100069118A (ko) 2008-12-16 2010-06-24 한국전자통신연구원 질의어 색인 데이터베이스 구축 방법과 그 질의어 색인 데이터베이스를 이용한 질의어 추천 방법
US8239334B2 (en) 2008-12-24 2012-08-07 Microsoft Corporation Learning latent semantic space for ranking
US8341095B2 (en) 2009-01-12 2012-12-25 Nec Laboratories America, Inc. Supervised semantic indexing and its extensions
US8156129B2 (en) 2009-01-15 2012-04-10 Microsoft Corporation Substantially similar queries
US20100198816A1 (en) 2009-01-30 2010-08-05 Yahoo! Inc. System and method for presenting content representative of document search
US9009146B1 (en) * 2009-04-08 2015-04-14 Google Inc. Ranking search results based on similar queries
US8145623B1 (en) 2009-05-01 2012-03-27 Google Inc. Query ranking based on query clustering and categorization
US20110004588A1 (en) 2009-05-11 2011-01-06 iMedix Inc. Method for enhancing the performance of a medical search engine based on semantic analysis and user feedback
CA2764496C (en) 2009-06-05 2018-02-27 Wenhui Liao Feature engineering and user behavior analysis
US8606786B2 (en) * 2009-06-22 2013-12-10 Microsoft Corporation Determining a similarity measure between queries
US20100332493A1 (en) 2009-06-25 2010-12-30 Yahoo! Inc. Semantic search extensions for web search engines
US8214363B2 (en) 2009-07-06 2012-07-03 Abhilasha Chaudhary Recognizing domain specific entities in search queries
US8543668B1 (en) 2009-11-24 2013-09-24 Google Inc. Click tracking using link styles
US9317613B2 (en) 2010-04-21 2016-04-19 Yahoo! Inc. Large scale entity-specific resource classification
US8478699B1 (en) * 2010-04-30 2013-07-02 Google Inc. Multiple correlation measures for measuring query similarity
US20120143790A1 (en) 2010-12-01 2012-06-07 Microsoft Corporation Relevance of search results determined from user clicks and post-click user behavior obtained from click logs
US20120158685A1 (en) 2010-12-16 2012-06-21 Microsoft Corporation Modeling Intent and Ranking Search Results Using Activity-based Context
US9064007B1 (en) 2011-01-05 2015-06-23 Google Inc. Co-click based similarity score of queries and keywords
EP2479686B1 (en) 2011-01-24 2014-09-17 AOL Inc. Systems and methods for analyzing and clustering search queries
US8612367B2 (en) 2011-02-04 2013-12-17 Microsoft Corporation Learning similarity function for rare queries
US8719257B2 (en) 2011-02-16 2014-05-06 Symantec Corporation Methods and systems for automatically generating semantic/concept searches
US8898156B2 (en) * 2011-03-03 2014-11-25 Microsoft Corporation Query expansion for web search
US20120253792A1 (en) 2011-03-30 2012-10-04 Nec Laboratories America, Inc. Sentiment Classification Based on Supervised Latent N-Gram Analysis
US9507861B2 (en) 2011-04-01 2016-11-29 Microsoft Technolgy Licensing, LLC Enhanced query rewriting through click log analysis
US8423547B2 (en) 2011-04-08 2013-04-16 Microsoft Corporation Efficient query clustering using multi-partite graphs
US8762365B1 (en) 2011-08-05 2014-06-24 Amazon Technologies, Inc. Classifying network sites using search queries
US8788477B1 (en) 2011-09-19 2014-07-22 Google Inc. Identifying addresses and titles of authoritative web pages by analyzing search queries in query logs
US20130110824A1 (en) 2011-11-01 2013-05-02 Microsoft Corporation Configuring a custom search ranking model
US9009148B2 (en) 2011-12-19 2015-04-14 Microsoft Technology Licensing, Llc Clickthrough-based latent semantic model
US8463595B1 (en) 2012-03-06 2013-06-11 Reputation.Com, Inc. Detailed sentiment analysis
US9064016B2 (en) 2012-03-14 2015-06-23 Microsoft Corporation Ranking search results using result repetition
US9767144B2 (en) 2012-04-20 2017-09-19 Microsoft Technology Licensing, Llc Search system with query refinement
US8775442B2 (en) 2012-05-15 2014-07-08 Apple Inc. Semantic search using a single-source semantic model
WO2014050002A1 (ja) 2012-09-28 2014-04-03 日本電気株式会社 クエリ類似度評価システム、評価方法、及びプログラム
US9104733B2 (en) 2012-11-29 2015-08-11 Microsoft Technology Licensing, Llc Web search ranking
US9251292B2 (en) 2013-03-11 2016-02-02 Wal-Mart Stores, Inc. Search result ranking using query clustering
US9519859B2 (en) 2013-09-06 2016-12-13 Microsoft Technology Licensing, Llc Deep structured semantic model produced using click-through data
US9715660B2 (en) 2013-11-04 2017-07-25 Google Inc. Transfer learning for deep neural network based hotword detection
US9633017B2 (en) 2013-11-07 2017-04-25 Yahoo! Inc. Dwell-time based generation of a user interest profile
US9898554B2 (en) 2013-11-18 2018-02-20 Google Inc. Implicit question query identification
US9589277B2 (en) 2013-12-31 2017-03-07 Microsoft Technology Licensing, Llc Search service advertisement selection
RU2556425C1 (ru) 2014-02-14 2015-07-10 Закрытое акционерное общество "Эвентос" (ЗАО "Эвентос") Способ автоматической итеративной кластеризации электронных документов по семантической близости, способ поиска в совокупности кластеризованных по семантической близости документов и машиночитаемые носители
US9818065B2 (en) 2014-03-12 2017-11-14 Microsoft Technology Licensing, Llc Attribution of activity in multi-user settings
US11170425B2 (en) 2014-03-27 2021-11-09 Bce Inc. Methods of augmenting search engines for eCommerce information retrieval
US9477654B2 (en) 2014-04-01 2016-10-25 Microsoft Corporation Convolutional latent semantic models and their applications
US9535960B2 (en) 2014-04-14 2017-01-03 Microsoft Corporation Context-sensitive search using a deep learning model
US10642845B2 (en) 2014-05-30 2020-05-05 Apple Inc. Multi-domain search on a computing device
US20150356199A1 (en) 2014-06-06 2015-12-10 Microsoft Corporation Click-through-based cross-view learning for internet searches
US9846836B2 (en) 2014-06-13 2017-12-19 Microsoft Technology Licensing, Llc Modeling interestingness with deep neural networks
US10089580B2 (en) 2014-08-11 2018-10-02 Microsoft Technology Licensing, Llc Generating and using a knowledge-enhanced model
RU2580516C2 (ru) 2014-08-19 2016-04-10 Общество С Ограниченной Ответственностью "Яндекс" Способ формирования персонализированной модели ранжирования, способ формирования модели ранжирования, электронное устройство и сервер
JP5957048B2 (ja) 2014-08-19 2016-07-27 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 曖昧性を解消する教師データの生成方法、生成システム、及び生成プログラム
RU2609079C2 (ru) 2015-02-27 2017-01-30 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер обработки поискового предложения
US9946799B2 (en) 2015-04-30 2018-04-17 Microsoft Technology Licensing, Llc Federated search page construction based on machine learning
US10997184B2 (en) 2015-05-22 2021-05-04 Coveo Solutions, Inc. System and method for ranking search results
US10606946B2 (en) 2015-07-06 2020-03-31 Microsoft Technology Licensing, Llc Learning word embedding using morphological knowledge
US10387464B2 (en) 2015-08-25 2019-08-20 Facebook, Inc. Predicting labels using a deep-learning model
US10133729B2 (en) 2015-08-28 2018-11-20 Microsoft Technology Licensing, Llc Semantically-relevant discovery of solutions
WO2017040663A1 (en) 2015-09-01 2017-03-09 Skytree, Inc. Creating a training data set based on unlabeled textual data
US20170083523A1 (en) 2015-09-18 2017-03-23 Facebook, Inc. Granular Forward Indexes on Online Social Networks
US10354182B2 (en) 2015-10-29 2019-07-16 Microsoft Technology Licensing, Llc Identifying relevant content items using a deep-structured neural network
US9659248B1 (en) 2016-01-19 2017-05-23 International Business Machines Corporation Machine learning and training a computer-implemented neural network to retrieve semantically equivalent questions using hybrid in-memory representations
US10489712B2 (en) * 2016-02-26 2019-11-26 Oath Inc. Quality-based scoring and inhibiting of user-generated content
US10621507B2 (en) 2016-03-12 2020-04-14 Wipro Limited System and method for generating an optimized result set using vector based relative importance measure
US10740678B2 (en) 2016-03-31 2020-08-11 International Business Machines Corporation Concept hierarchies
RU2632143C1 (ru) * 2016-04-11 2017-10-02 Общество С Ограниченной Ответственностью "Яндекс" Способ обучения модуля ранжирования с использованием обучающей выборки с зашумленными ярлыками
US10789545B2 (en) 2016-04-14 2020-09-29 Oath Inc. Method and system for distributed machine learning
US10606847B2 (en) 2016-05-31 2020-03-31 Microsoft Technology Licensing, Llc Generation of training data for ideal candidate search ranking model
CN106095983B (zh) 2016-06-20 2019-11-26 北京百度网讯科技有限公司 一种基于个性化深度神经网络的相似度确定方法及装置
US10762439B2 (en) 2016-07-26 2020-09-01 International Business Machines Corporation Event clustering and classification with document embedding
US20180052853A1 (en) 2016-08-22 2018-02-22 Salesforce.Com, Inc. Adjusting feature weights for ranking entity based search results
RU2637998C1 (ru) 2016-09-12 2017-12-08 Общество С Ограниченной Ответственностью "Яндекс" Способ и система создания краткого изложения цифрового контента
US9767182B1 (en) 2016-10-28 2017-09-19 Searchmetrics Gmbh Classification of search queries
US20180121550A1 (en) 2016-10-28 2018-05-03 Facebook, Inc. Ranking Search Results Based on Lookalike Users on Online Social Networks
RU2643466C1 (ru) * 2017-04-14 2018-02-01 Алексей Валентинович Воронин Способ и система формирования результатов поисковой выдачи
WO2018192831A1 (en) 2017-04-20 2018-10-25 Koninklijke Philips N.V. Learning and applying contextual similarities between entities
US10915524B1 (en) 2017-06-27 2021-02-09 Amazon Technologies, Inc. Scalable distributed data processing and indexing
US10733507B2 (en) 2017-07-25 2020-08-04 Microsoft Technology Licensing, Llc Semantic clustering based retrieval for candidate set expansion
CN110019658B (zh) 2017-07-31 2023-01-20 腾讯科技(深圳)有限公司 检索项的生成方法及相关装置
US10803055B2 (en) 2017-12-15 2020-10-13 Accenture Global Solutions Limited Cognitive searches based on deep-learning neural networks
US20190205472A1 (en) 2017-12-28 2019-07-04 Salesforce.Com, Inc. Ranking Entity Based Search Results Based on Implicit User Interactions
CN111971679A (zh) 2018-01-26 2020-11-20 威盖特技术美国有限合伙人公司 基于行业语言模型生成自然语言推荐
US10628432B2 (en) 2018-02-19 2020-04-21 Microsoft Technology Licensing, Llc Personalized deep models for smart suggestions ranking
US10909196B1 (en) 2018-02-26 2021-02-02 A9.Com, Inc. Indexing and presentation of new digital content
US10915538B2 (en) 2018-03-23 2021-02-09 Home Depot Product Authority, Llc Ranking and presenting search engine results based on category-specific ranking models
US11126630B2 (en) 2018-05-07 2021-09-21 Salesforce.Com, Inc. Ranking partial search query results based on implicit user interactions
US20200004886A1 (en) 2018-06-28 2020-01-02 Microsoft Technology Licensing, Llc Generating supervised embedding representations for search
WO2020051704A1 (en) 2018-09-12 2020-03-19 Avigilon Corporation System and method for improving speed of similarity based searches

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11775573B2 (en) 2019-04-15 2023-10-03 Yandex Europe Ag Method of and server for retraining machine learning algorithm

Also Published As

Publication number Publication date
US11681713B2 (en) 2023-06-20
US20190391982A1 (en) 2019-12-26
RU2018122689A3 (ru) 2020-01-28
RU2731658C2 (ru) 2020-09-07

Similar Documents

Publication Publication Date Title
RU2018122689A (ru) Способ и система выбора для ранжирования поисковых результатов с помощью алгоритма машинного обучения
JP6526329B2 (ja) ウェブページトレーニング方法及び装置、検索意図識別方法及び装置
US20220292333A1 (en) Prediction-model-based mapping and/or search using a multi-data-type vector space
US10997256B2 (en) Webpage classification method and apparatus, calculation device and machine readable storage medium
CN108280114B (zh) 一种基于深度学习的用户文献阅读兴趣分析方法
US10565253B2 (en) Model generation method, word weighting method, device, apparatus, and computer storage medium
WO2021082123A1 (zh) 信息推荐方法及装置、电子设备
RU2018132848A (ru) Способ и система для расширения поисковых запросов с целью ранжирования результатов поиска
CN110309251B (zh) 文本数据的处理方法、装置和计算机可读存储介质
CN110134777B (zh) 问题去重方法、装置、电子设备和计算机可读存储介质
CN108572971B (zh) 一种用于挖掘与检索词相关的关键词的方法和装置
GB2583679A (en) Searching multilingual documents based on document structure extraction
US20160078087A1 (en) Query features and questions
CN106649423A (zh) 一种基于内容相关度的检索模型计算方法
RU2018144177A (ru) Способ и система генерирования признака для ранжирования документа
CN112100470B (zh) 基于论文数据分析的专家推荐方法、装置、设备及存储介质
CN112084307A (zh) 一种数据处理方法、装置、服务器及计算机可读存储介质
CN112612875A (zh) 一种查询词自动扩展方法、装置、设备及存储介质
CN103744970B (zh) 一种确定图片的主题词的方法及装置
Mazloom et al. Few-example video event retrieval using tag propagation
Zhang et al. USTB at INEX2014: Social Book Search Track.
CN111339778B (zh) 文本处理方法、装置、存储介质和处理器
Moroo et al. Reranking-based Crash Report Deduplication.
CN116610810A (zh) 基于调控云知识图谱血缘关系的智能搜索方法及***
Rinjeni et al. Matching Scientific Article Titles using Cosine Similarity and Jaccard Similarity Algorithm