CN101937433A - 一种产品实时搜索方法 - Google Patents

一种产品实时搜索方法 Download PDF

Info

Publication number
CN101937433A
CN101937433A CN200910069476XA CN200910069476A CN101937433A CN 101937433 A CN101937433 A CN 101937433A CN 200910069476X A CN200910069476X A CN 200910069476XA CN 200910069476 A CN200910069476 A CN 200910069476A CN 101937433 A CN101937433 A CN 101937433A
Authority
CN
China
Prior art keywords
product
searching
search
index
real
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200910069476XA
Other languages
English (en)
Inventor
刘霞
徐纯芳
赵鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TIANJIN YIDU SEARCH NETWORK TECHNOLOGY Co Ltd
Original Assignee
TIANJIN YIDU SEARCH NETWORK TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TIANJIN YIDU SEARCH NETWORK TECHNOLOGY Co Ltd filed Critical TIANJIN YIDU SEARCH NETWORK TECHNOLOGY Co Ltd
Priority to CN200910069476XA priority Critical patent/CN101937433A/zh
Publication of CN101937433A publication Critical patent/CN101937433A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种产品实时搜索方法,包括以下步骤:(1)产品索引搜索:采用统一的索引结构,将索引数据分为字段和属性两部分,字段部分包括需要提供全文检索文本内容的产品名称和产品关键字数据;属性部分包括需要提供筛选内容的产品价格、归属地和分类数据;(2)数据查询搜索:首先采用变元分词方法对用户关键字进行分词,然后启用语法分析引擎对分词结果进行分析理解和过滤,最后提交到搜索查询器,由搜索查询器检索分析后的关键字,返回搜索结果。本发明能够对索引数据进行实时更新,并提供基于关键字的全文检索和基于属性的筛选,实现对产品的精确搜索功能,可广泛用于电子商务搜索等对搜索精度高的搜索领域。

Description

一种产品实时搜索方法
技术领域
本发明涉及一种数据搜索技术,尤其是一种产品实时搜索方法。
背景技术
目前,搜索引擎已经和人们的生活息息相关,为我们的生活提供了极大的便利。传统的搜索引擎均采用基于文本的搜索方法,这些搜索引擎能够根据文本关键字让用户准确地找到所需信息,但是它无法告知用户诸如“最便宜的水族箱”这类问题。在产品搜索这一特定领域,用户需要对产品的价格、归属地、属性特征等进行精确查找,进而找到自己想要的产品;同时,产品的价格等属性可能是实时变化的,传统搜索引擎建立快照的方式势必会导致价格等属性的不准确性,因此传统的基于文本的搜索方法已经满足不了产品的搜索需求。
发明内容
本发明的目的在于克服现有技术的不足,提供了一种产品实时搜索方法,该搜索方法能够对产品的价格、归属地、各种属性特征进行精确搜索,并能实时更新产品的信息,满足搜索用户快速、准确地找到自己想要产品的需要。
本发明解决其技术问题是采取以下技术方案实现的:
一种产品实时搜索方法,其特征在于:包括产品索引和产品搜索方法,其采用的方法步骤如下:
(1)产品索引搜索:采用统一的索引结构,将索引数据分为字段和属性两部分,字段部分包括需要提供全文检索文本内容的产品名称和产品关键字数据;属性部分包括需要提供筛选内容的产品价格、归属地和分类数据;
(2)数据查询搜索:首先采用变元分词方法对用户关键字进行分词,然后启用语法分析引擎对分词结果进行分析理解和过滤,最后提交到搜索查询器,由搜索查询器检索分析后的关键字,返回搜索结果。
而且,所述的统一的索引结构采用如下两种形式之一:(1)使用统一的数据库结构,将对产品的索引转换成了对数据库的数据索引;(2)使用XML标准来索引,
而且,所述产品索引搜索还包括产品索引的更新,其更新方法为:当产品更新时,产品发布者通过数据库或者XML的方式实时反馈到搜索数据中心,更新产品索引数据。
而且,所述的变元分词方法为:对用户输入的词语按照其长度计算该词语的变元长度;设置切分步进值;按照变元长度及切分步进值对输入的词语进行切分。
而且,所述的变元长度的计算方法为:将词语的长度开平方,然后取整数便得到变元长度。
而且,所述的切分步进值为1~5。
本发明的优点和积极效果是:
本搜索方法采用两种形式的索引形式并能够对索引数据进行实时更新,还提供基于关键字的全文检索和基于属性的筛选,能让用户更方便地找到自己需要的信息,同时采用变元分词技术,实现对产品的精确搜索功能,使得用户在搜索一个产品的时候,并不是简单的找到符合我搜索关键字的结果,而是需要对产品价格、归属地、分类属性等进行精确地筛选。解决了产品的搜索问题,可广泛用于电子商务搜索等对搜索精度高的搜索领域。
具体实施方式
以下对本发明实施例做进一步详述。
一种产品实时搜索方法,包括产品索引和产品搜索方法,其采用的方法步骤如下:
(1)产品索引搜索:采用统一的索引结构,将索引数据分为字段和属性两部分,字段部分包括需要提供全文检索文本内容的产品名称和产品关键字数据;属性部分包括需要提供筛选内容的产品价格、归属地、分类数据;通过这种索引方式,使搜索“最便宜的水族箱”成为可能。
该统一的索引结构包括以下两种形式:(1)统一的数据库结构,将产品的索引转换成了对数据库的数据索引,这种形式是属于会员站的形式,即所有产品的发布站点都是搜索引擎***的会员;(2)XML标准来索引。
产品索引搜索还包括产品索引的更新,其更新方法为:当产品更新时,产品发布者通过数据库或者XML的方式实时反馈到搜索数据中心,更新搜索数据,这种方式用来索引非会员站的数据。
(2)数据查询搜索:首先采用变元分词方法对用户关键字进行分词,然后启用语法分析引擎对分词结果进行分析理解,过滤掉无用信息后提交到搜索查询器,搜索查询器检索分析后的关键字,返回搜索结果。用户根据结果进一步进行分类筛选,价格排序等操作,从而找到自己最感兴趣的产品。
上述变元分词方法是使用如下方法实现的:对用户输入的词语按照其长度计算该词语的变元长度,其计算方法为:将词语的长度开平方,然后取整数便得到变元长度;设置切分步进值,该切分步进值为1~5;按照变元长度及切分步进值对输入的词语进行切分。例如用户输入词语的长度为10,然后按照规则来计算可变元长度,将词语的长度10开方后取整,则得到变元长度3;将切分步进值设置为1,最后,根据变元长度及切分步进值来切分用户输入的词语。
需要强调的是,本发明所述的实施例是说明性的,而不是限定性的,因此本发明并不限于具体实施方式中所述的实施例,凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式,同样属于本发明保护的范围。

Claims (6)

1.一种产品实时搜索方法,其特征在于:包括产品索引和产品搜索方法,其采用的方法步骤如下:
(1)产品索引搜索:采用统一的索引结构,将索引数据分为字段和属性两部分,字段部分包括需要提供全文检索文本内容的产品名称和产品关键字数据;属性部分包括需要提供筛选内容的产品价格、归属地和分类数据;
(2)数据查询搜索:首先采用变元分词方法对用户关键字进行分词,然后启用语法分析引擎对分词结果进行分析理解和过滤,最后提交到搜索查询器,由搜索查询器检索分析后的关键字,返回搜索结果。
2.根据权利要求1所述的一种产品实时搜索方法,其特征在于:所述的统一的索引结构采用如下两种形式之一:(1)使用统一的数据库结构,将对产品的索引转换成了对数据库的数据索引;(2)使用XML标准来索引,
3.根据权利要求1所述的一种产品实时搜索方法,其特征在于:所述产品索引搜索还包括产品索引的更新,其更新方法为:当产品更新时,产品发布者通过数据库或者XML的方式实时反馈到搜索数据中心,更新产品索引数据。
4.根据权利要求1所述的一种产品实时搜索方法,其特征在于:所述的变元分词方法为:对用户输入的词语按照其长度计算该词语的变元长度;设置切分步进值;按照变元长度及切分步进值对输入的词语进行切分。
5.根据权利要求4所述的一种产品实时搜索方法,其特征在于:所述的变元长度的计算方法为:将词语的长度开平方,然后取整数便得到变元长度。
6.根据权利要求4所述的一种产品实时搜索方法,其特征在于:所述的切分步进值为1~5。
CN200910069476XA 2009-06-29 2009-06-29 一种产品实时搜索方法 Pending CN101937433A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910069476XA CN101937433A (zh) 2009-06-29 2009-06-29 一种产品实时搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910069476XA CN101937433A (zh) 2009-06-29 2009-06-29 一种产品实时搜索方法

Publications (1)

Publication Number Publication Date
CN101937433A true CN101937433A (zh) 2011-01-05

Family

ID=43390767

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910069476XA Pending CN101937433A (zh) 2009-06-29 2009-06-29 一种产品实时搜索方法

Country Status (1)

Country Link
CN (1) CN101937433A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102737039A (zh) * 2011-04-07 2012-10-17 北京百度网讯科技有限公司 索引建立方法、搜索方法和搜索结果排序方法及对应装置
CN102902695A (zh) * 2011-07-29 2013-01-30 上海博泰悦臻电子设备制造有限公司 导航***及兴趣点搜索方法和装置
CN103064990A (zh) * 2013-02-04 2013-04-24 广州太平洋电脑信息咨询有限公司 一种利用索引数据文件查询方法
CN103186633A (zh) * 2011-12-31 2013-07-03 北京百度网讯科技有限公司 一种结构化信息抽取方法、搜索方法和装置
CN103186556A (zh) * 2011-12-28 2013-07-03 北京百度网讯科技有限公司 得到和搜索结构化语义知识的方法及对应装置
CN103593343A (zh) * 2012-08-13 2014-02-19 腾讯科技(深圳)有限公司 一种电子商务平台中的信息检索方法和装置
CN107145509A (zh) * 2017-03-28 2017-09-08 深圳市元征科技股份有限公司 一种信息搜索方法及其设备
CN109993592A (zh) * 2017-12-29 2019-07-09 北京京东尚科信息技术有限公司 信息推送方法和装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102737039A (zh) * 2011-04-07 2012-10-17 北京百度网讯科技有限公司 索引建立方法、搜索方法和搜索结果排序方法及对应装置
CN102737039B (zh) * 2011-04-07 2014-11-12 北京百度网讯科技有限公司 索引建立方法、搜索方法和搜索结果排序方法及对应装置
CN102902695A (zh) * 2011-07-29 2013-01-30 上海博泰悦臻电子设备制造有限公司 导航***及兴趣点搜索方法和装置
CN103186556A (zh) * 2011-12-28 2013-07-03 北京百度网讯科技有限公司 得到和搜索结构化语义知识的方法及对应装置
CN103186633B (zh) * 2011-12-31 2016-08-17 北京百度网讯科技有限公司 一种结构化信息抽取方法、搜索方法和装置
CN103186633A (zh) * 2011-12-31 2013-07-03 北京百度网讯科技有限公司 一种结构化信息抽取方法、搜索方法和装置
CN103593343A (zh) * 2012-08-13 2014-02-19 腾讯科技(深圳)有限公司 一种电子商务平台中的信息检索方法和装置
WO2014026569A1 (en) * 2012-08-13 2014-02-20 Tencent Technology (Shenzhen) Company Limited Method and apparatus for searching information in electronic commerce platform
CN103064990B (zh) * 2013-02-04 2014-03-26 广州太平洋电脑信息咨询有限公司 一种利用索引数据文件查询方法
CN103064990A (zh) * 2013-02-04 2013-04-24 广州太平洋电脑信息咨询有限公司 一种利用索引数据文件查询方法
CN107145509A (zh) * 2017-03-28 2017-09-08 深圳市元征科技股份有限公司 一种信息搜索方法及其设备
CN107145509B (zh) * 2017-03-28 2020-11-13 深圳市元征科技股份有限公司 一种信息搜索方法及其设备
CN109993592A (zh) * 2017-12-29 2019-07-09 北京京东尚科信息技术有限公司 信息推送方法和装置

Similar Documents

Publication Publication Date Title
CN101937433A (zh) 一种产品实时搜索方法
US7702685B2 (en) Querying social networks
US20180060410A1 (en) System and method of applying globally unique identifiers to relate distributed data sources
JP5721818B2 (ja) 検索におけるモデル情報群の使用
CN102012900B (zh) 信息检索方法和***
US8086592B2 (en) Apparatus and method for associating unstructured text with structured data
CN103106220B (zh) 一种搜索方法、搜索装置及一种搜索引擎***
Chen et al. Senbazuru: A prototype spreadsheet database management system
CN104899268A (zh) 一种分布式企业信息垂直搜索方法
CN101464897A (zh) 一种词匹配及信息查询方法及装置
CN104063523A (zh) 一种电子商务搜索评分与排名的方法及***
CN103823893A (zh) 一种基于用户评论的产品检索方法及产品检索***
CN101853308A (zh) 一种个性化元搜索的方法及其应用终端
CA2545237A1 (en) Method and system for managing exemplar terms database for business-oriented metadata content
CN102360367A (zh) 一种xbrl数据搜索方法及搜索引擎
Liu et al. Return specification inference and result clustering for keyword search on xml
DE102012221251A1 (de) Semantisches und kontextbezogenes Durchsuchen von Wissensspeichern
CN102789487A (zh) 数据查询检索处理装置和数据查询检索处理方法
CN103020074A (zh) 基于本体的对象级搜索技术
TAO et al. An ontology-based information retrieval model for vegetables e-commerce
CN103365868A (zh) 一种数据处理方法和数据处理***
CN102622413A (zh) 一种回答自然语言问题的方法与装置
CN107291951B (zh) 数据处理方法、装置、存储介质和处理器
CN105183774A (zh) 一种智能查询方法及***
CN103177122A (zh) 一种基于同义词的个人文件搜索方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110105