CN106326259A - 搜索引擎中商品标签的构建方法、***及搜索方法和*** - Google Patents

搜索引擎中商品标签的构建方法、***及搜索方法和*** Download PDF

Info

Publication number
CN106326259A
CN106326259A CN201510362833.7A CN201510362833A CN106326259A CN 106326259 A CN106326259 A CN 106326259A CN 201510362833 A CN201510362833 A CN 201510362833A CN 106326259 A CN106326259 A CN 106326259A
Authority
CN
China
Prior art keywords
commodity
subclass
label
entry
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510362833.7A
Other languages
English (en)
Inventor
马沈
郭成华
程进兴
王静玺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suning Commerce Group Co Ltd
Original Assignee
Suning Commerce Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suning Commerce Group Co Ltd filed Critical Suning Commerce Group Co Ltd
Priority to CN201510362833.7A priority Critical patent/CN106326259A/zh
Publication of CN106326259A publication Critical patent/CN106326259A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种搜索引擎中商品标签的构建方法,该方法包括:S11:对商品进行分类,建立商品子类列表;S12:确定商品子类的多维度标签;S13:将S12确定的多维度标签加入商品子类列表中,构建商品标签。同时还提供搜索引擎中商品标签的构建***、搜索方法和搜索***。本实施例从多维度构建商品标签,提高搜索返回率,进而改善用户体验。

Description

搜索引擎中商品标签的构建方法、***及搜索方法和***
技术领域
本发明涉及电子商务领域,具体来说,涉及搜索引擎中商品标签的构建方法、***及搜索方法和***。
背景技术
当前电子商务网站的搜索技术是基于关键词完全匹配技术。如果商品目录的数据库不能完全匹配用户输入的所有关键词时,那么即使目标商品存在,搜索结果仍然为零或者返回率低。搜索结果为零和返回率低的情况,例如:当输入关键词“亚洲地图图书”搜索时,没有相关的结果显示。这是因为没有一件商品能够同时匹配这三个关键词。
对于部分商品一物多名而出现的无搜索结果,现有技术采用在数据库里提供商品名称的同义词或近义词,并将此类词汇与商品名称联系起来。然而在现实搜索中,除去商品名称不同,用户对商品的需求可能停留在对某类商品的特性上。
基于此,现有的商品标签的构建方法难以适应用户的需求。
发明内容
本发明实施例提供搜索引擎中商品标签的构建方法、构建***及搜索方法和搜索***,从多维度构建商品标签,提高搜索返回率,进而改善用户体验。
为解决上述技术问题,第一方面,本发明实施例提供一种搜索引擎中商品标签的构建方法,该方法包括:
S11:对商品进行分类,建立商品子类列表;
S12:确定商品子类的多维度标签;
S13:将S12确定的多维度标签加入商品子类列表中,构建商品标签。
结合第一方面,作为第一种可能实现的方式,所述的S11中,商品子类列表包括大类、小类和商品子类。
结合第一方面,作为第二种可能实现的方式,所述的S12中,利用实体识别方法和句子剖析方法自动提取商品的多维度标签;多维度标签包括商品子类对应的同义词、近义词、广义词、商品功能词和特征词。
结合第一方面第二种可能实现的方式,作为第三种可能实现的方式,所述的S12具体包括:
S21用模版化的智能网页爬虫获取外部公共资源;
S22利用定制化的网络机器人从外部公共资源抓取与该商品子类相关联的词条,从而生成商品子类相关词条集合;
S23从商品子类相关词条集合中提取备选标签;
S24审阅备选标签,形成最终的标签。
结合第一方面的第三种可能实现的方式,作为第四种可能实现的方式,所述的步骤S22中,从外部公共资源抓取与该商品子类相关联的词条的过程为:根据该词条在商品子类商品数据中的出现频率和评价数据中的出现频率,当该两种出现频率均大于或等于事先设定的阈值时,则将该词条视为与商品子类相关联的词条。
第二方面,本发明实施例提供一种搜索引擎中商品标签的构建***,该***包括:
分类模块:用于对商品进行分类,建立商品子类列表;
确定模块:用于确定商品子类的多维度标签;
构建模块:用于将确定的多维度标签,加入商品子类列表中,构建商品标签。
结合第二方面,作为第一种可能实现的方式,所述的确定模块具体包括:
获取子模块:用于用模版化的智能网页爬虫获取外部公共资源;
生成子模块:用于利用定制化的网络机器人从外部公共资源抓取与该商品子类相关联的词条,从而生成商品子类相关词条集合;
提取子模块:用于从商品子类相关词条集合中提取备选标签;
审阅子模块:用于审阅备选标签,形成最终的标签。
结合第二方面第一种可能实现的方式,作为第二种可能实现的方式,所述的生成子模块具体包括:
统计单元:用于统计词条在商品子类商品数据中的出现频率和评价数据中的出现频率;
判断单元:用于判断两种出现频率是否均大于或等于事先设定的阈值,如果是,则该词条为与商品子类相关联的词条。
第三方面,本发明实施例提供一种商品搜索方法,该方法包括:
S61:建立商品子类列表,所述的商品子类列表包括大类、小类、商品子类和多维度标签,多维度标签包括商品子类对应的同义词、近义词、广义词、商品功能词以及特征词;
S62:在商品子类列表中搜索用户在搜索引擎中输入的检索词,以及该检索词对应的同义词、近义词、广义词、商品功能词和特征词,并显示搜索结果。
第四方面,本发明实施例提供一种商品搜索***,该***包括:
建立模块:用于建立商品子类列表,所述的商品子类列表包括大类、小类、商品子类和多维度标签,多维度标签包括商品子类对应的同义词、近义词、广义词、商品功能词以及特征词;
输入模块:用于在搜索引擎中输入检索词;
搜索模块:用于在商品子类列表中搜索检索词,以及该检索词对应的同义词、近义词、广义词、商品功能词和特征词,并显示搜索结果。
本发明实施例搜索引擎中商品标签的构建方法、***及搜索方法和***,通过在商品子类列表中构建商品的多维度标签,提高了搜索结果召回率。多维度标签包括同义词、近义词、广义词、商品功能词以及特征词。设置多维度标签,使得用户在搜索时,***根据检索词,在多维度标签中搜索该检索词,以及该检索词的同义词、近义词、广义词、商品功能词以及特征词,从而提高了搜索结果召回率。
附图说明
图1是本发明实施例中商品标签的构建方法的流程图;
图2是本发明实施例中确定商品子类的同义词、近义词、广义词、商品功能词以及特征词的流程图;
图3是本发明实施例中构建***的结构框图;
图4是本发明实施例确定模块的结构框图;
图5是本发明实施例生成子模块的结构框图;
图6是本发明实施例查找商品的方法的流程图;
图7是本发明实施例查找商品的***的结构框图。
具体实施方式
如图1所示,本实施例提供一种电子商务搜索引擎中商品标签的构建方法:
S11:对商品进行分类,建立商品子类列表。
整个商品子类列表包括大类、小类和商品子类。商品子类、小类和大类是依据电子商务平台的商品分类信息而定。如表1所示,按照商品的用途,对商品进行分类。商品子类对应待搜索的商品。小类是商品子类的上一层次的分类,大类是小类的上一层次的分类。在表1中,***为商品子类,***属于的小类为厨卫电器,***属于的大类为厨卫电器/生活电器。商品子类包含不同或相同企业生产销售的相同商品。
表1
S12:确定商品子类的多维度标签。
多维度标签包括商品子类对应的同义词、近义词、广义词、商品功能词和特征词。
利用实体识别方法和句子剖析方法自动提取商品的同义词、近义词、广义词、商品功能词以及特征词。S12进一步包括:
S21用模版化的智能网页爬虫获取外部公共资源。
外部公共资源如电子商务网站、社交网站、百度百科、互联百科等网站。这些网站中包含了商品的各类信息,例如商品属性、商品同义词、近义词、使用评价数据等。
S22利用定制化的网络机器人从外部公共资源抓取与该商品子类相关联的词条,从而生成商品子类相关词条集合。
根据每个网站的数据结构等不同,网络机器人有所改进,形成定制化的网络机器人,以抓取最有效数据。在确定与该商品子类相关联的词条时,可以根据该词条在商品子类商品数据中的出现频率和评价数据中的出现频率而定。当两种出现频率均大于或等于事先设定的阈值时,则该词条为与商品子类相关联的词条;否则,则该词条为与商品子类不相关联的词条。
S23从商品子类相关词条集合中提取备选标签。
作为一种优选例,通过实体识别方法和句子剖析方法,对商品子类相关词条集合中的词条,进行聚类分析,词性过滤之后,生成备选标签。实体识别方法包括构建字典和词典、分析比较不同搜索词的用户点击方式、分析用户搜索期间搜索词的改写三种方法。通过分析商品数据,以及百度百科等互联网资源来建立各种词典,比如商品类别词典、品牌词典、型号词典等。
通过实体识别方法查询待搜索商品的同义词、近义词、广义词、商品功能词以及特征词。例如,搜索***,在商品类别词典中出现的净水机、过滤器为***的同义词/近义词。
商品功能词以及特征词可以通过分析商品的描述等数据来获得。
句子剖析方法采用自然语言处理技术来实现。句子剖析方法的具体过程是通过开源自然语言处理包来进行分词,并进行词性标注。比如采用斯坦福大学的开源自然语言处理包进行句子剖析方法。例如,百度词条中出现的句子“***也叫净水机、过滤器”,通过开源自然语言处理包进行处理后,识别为“***也叫净水机/过滤器”。
S24审阅备选标签,形成最后的标签。
备选标签中可能包含质量不高的词条。质量不高的词条是指:通过机器学习不可避免地出现一些备选商品类不相关的词,或者与电子商务不相关的词,又或者备选标签里重复出现的同义词。通过人工审阅,删除质量不高的词条。这有利于进一步提高备选标签的相关度和质量。
同义词是指:用同一种语言表达的意义相同的词或者短语。近义词是指:用同一种语言表达的意义相近的词或者短语。同义词和近义词利用实体识别方法获取。实体识别技术如前所述,主要包括1)词典和字典的使用;2)用户点击方式;3)搜索词的改写。
广义词:在电子商务情境下,由商品子类本义而推广出更一般化的词条。广义词的确定主要依靠广泛被认可的外部公共数据资源来确定,如百科、维基网站中对关键词的定义。广义词的确定采用实体识别和句子剖析方法。
商品功能是指商品子类中的商品能发挥的有利作用或效能。商品特征是指商品子类下商品异于其它商品的特有属性和特点。商品功能以及商品特征主要依据商品目录提供的描述以及消费者的使用反馈和评价数据产生候选词条,人工完善最终入选词条,以确保描述的准确性。例如,在表1中,商品子类体温计的功能之一是“量体温”。
又例如,对商品子类“足沐器”来说,其同义词/近义词是洗脚盆、足浴盆;广义词是个护健康和生活电器;商品功能为足部按摩、足浴和足疗。
又例如,对商品子类“调奶器”来说,商品特征是母婴和亲子。
S13:将S12确定的多维度标签加入商品子类列表中,构建商品标签。将多维度标签存储在商品子类列表中,作为商品子类的多维度标签,并与各商品子类相对应。多维度标签包括同义词、近义词、广义词、商品功能词以及特征词。
本实施例中,商品标签采用多维度,即包括了商品子类的名称,还包括同义词、近义词、广义词、商品功能词以及特征词。
在深度了解用户需求的基础上,形成多维度的词条,提供更加准确的商品描述和搜索推荐。
多维度标签中包含商品属性词、特征词和功能词。商品属性、特征和功能可以根据商品目录以及消费者评价数据来获得。商品目录是指存储商品信息的数据库。商品目录包含商品颜色、尺寸、功能以及其它相关用于描述商品的属性。消费者评价数据可以网站获取,包括电子商务网站以及社交网络。
以电子商务为平台,深入了解商品为前提,建立全方位的多维度商品标签模型。以这种多层次、多维度的词汇标签在索引中扩充该商品子类,完成对商品子类的立体化,生动化的描述。
商品标签的多层次体现在从商品本身出发,既有横向的标签,如商品的同义词、近义词;也有纵向的标签,如广义词、功能词和特征词。本实施例的商品标签是在横向和纵向发散性的综合。这对商品的描述更全面,更形象化。
本实施例利用外部公共平台的数据创建商品标签,突出电子商务词汇的广度和深度。根据商品的特征和功能描述,创建商品功能词以及特征词标签,为搜索者找到商品提供了可能性。与传统的单一维度的商品描述相比,本实施例采用多维度的商品标签,提高了搜索结果召回率,从而改善用户体验,提升商品从搜索到购买的转化率。
如图3所示,本实施例提供一种搜索引擎中商品标签的构建***,该***包括:
分类模块:用于对商品进行分类,建立商品子类列表;
确定模块:用于确定商品子类的多维度标签;
构建模块:用于将确定的多维度标签,加入商品子类列表中,构建商品标签。
该***中,构建模块将多维度标签都加入商品子类列表中,构建商品标签。这样,商品标签构成多维度标签。多维度标签包括同义词、近义词、广义词、商品功能词以及特征词。多维度标签中包含商品属性词、特征词和功能词。商品属性、特征和功能可以根据商品目录以及消费者评价数据来获得。商品目录是指存储商品信息的数据库。商品目录包含商品颜色、尺寸、功能以及其它相关用于描述商品的属性。消费者评价数据可以网站获取,包括电子商务网站以及社交网络。商品标签从商品本身出发,既有横向的标签,如商品的同义词、近义词;也有纵向的标签,如广义词、功能词和特征词。本实施例的商品标签是在横向和纵向发散性的综合。
上述***中,确定模块用于确定商品子类的同义词、近义词、广义词、商品功能词以及特征词。如图4所示,确定模块具体包括:
获取子模块:用于用模版化的智能网页爬虫方法获取外部公共资源;
生成子模块:用于利用定制化的网络机器人,从外部公共资源抓取与该商品子类相关联的词条,从而生成商品子类相关词条集合;
提取子模块:用于从商品子类相关词条集合中提取备选标签;
审阅子模块:用于人工审阅备选标签,形成最终的标签。
确定模块利用网络技术自动确定备选标签。由于本***为提高搜索返回率,商品标签为包含有广义词、功能词和特征词的多维度标签。同义词、近义词、广义词、功能词和特征词往往需要通过外部公共资源获取。因此,利用获取子模块来获取外部公共资源。生成子模块利用现有技术的定制化的网络机器人,从外部公共资源抓取与该商品子类相关联的词条,从而生成商品子类相关词条集合。如图5所示,生成子模块具体包括:统计单元:用于统计词条在商品子类商品数据中的出现频率和评价数据中的出现频率;判断单元:用于判断两种出现频率是否大于或等于事先设定的阈值时,如果是,则该词条为与商品子类相关联的词条;否则,则该词条为与商品子类不相关联的词条。通过判断单元来判断词条是否为与商品子类相关联的词条。提取子模块通过实体识别方法和句子剖析方法,对商品子类相关词条集合中的词条,进行聚类分析,词性过滤之后,提取备选标签。备选标签中可能包含质量不高的词条。质量不高的词条是指:通过机器学习不可避免地出现一些备选商品类不相关的词,或者与电子商务不相关的词,又或者备选标签里重复出现的同义词。通过人工审阅,删除质量不高的词条。这有利于进一步提高备选标签的相关度和质量。
本实施例利用外部公共平台的数据创建商品标签,突出电子商务词汇的广度和深度。根据商品的特征和功能描述,创建商品功能词以及特征词标签,为搜索者找到商品提供了可能性。本实施例采用多维度的商品标签,提高了搜索结果召回率。
如图6所示,一种利用电子商务搜索引擎查找商品的方法,包括
S61:建立商品子类列表,所述的商品子类列表包括大类、小类、商品子类和多维度标签,多维度标签包括商品子类对应的同义词、近义词、广义词、商品功能词以及特征词;
商品子类、小类和大类是依据电子商务平台的商品分类信息而定。按照商品的用途,对商品进行分类。商品子类对应待搜索的商品。小类是商品子类的上一层次的分类,大类是小类的上一层次的分类。多维度标签包括商品子类对应的同义词、近义词、广义词、商品功能词以及特征词。利用实体识别方法和句子剖析方法自动提取商品的同义词、近义词、广义词、商品功能词以及特征词。
S62:在商品子类列表中搜索用户在搜索引擎中输入的检索词,以及该检索词对应的同义词、近义词、广义词、商品功能词和特征词,并显示搜索结果。
检索词可以为商品子类的名称、同义词、近义词、广义词、商品功能词、特征词中的一种或任意组合。例如按照表1构建的商品子类列表中,在搜索引擎中输入反渗透设备。反渗透设备是***的近义词,反渗透是***的功能词。
同义词和商品子类之间建立双向索引关系,如商品子类为“血糖仪”,它的同义词是“血糖计”,那么在用户搜索“血糖仪”时,“血糖仪”和“血糖计”都会被返回在搜索结果里。反之亦然。
同样,对于商品子类的近义词来说,近义词和商品子类之间建立双向索引关系。如商品子类为“健康秤”,它的近义词“机械秤”,在用户搜索“健康秤”时,“健康秤”和“机械秤”都会被返回在搜索结果里。反之亦然。对于商品子类的近义词和同义词,如果说同义词和搜索词的关系是1:1,那么近义词和搜索词的关系小于1:1。如商品子类为“健康秤”时,作为同义词的“体重秤”可以完全替换“健康秤”,但是作为近义词的“机械秤”属于相关但是不能完全替代,“机械秤”应该排在健康秤/体重秤靠后的位置。
广义词的使用是将该广义词和对应商品子类建立单向索引关系,如商品子类是“电脑”,它的广义词是“电子商品”,那么在用户搜索“电子商品”时,“电脑”会被返回在搜索结果里,反之则不成立。
商品功能词、特征词分别和对应商品子类之间建立单向索引关系。商品功能词和特征词在搜索商品时担任过滤和帮助用户选择商品的作用。如商品子类“眉笔”的功能之一是“描眉”,那么在用户搜索“描眉”时,“眉笔”会在搜索结果中返回。描眉作为商品多维度标签会被加在商品子类列表中。
本实施例有助于创建基于对用户深度需求理解的智能化搜索,帮助用户实现从内在需求的简单搜索到发现满意商品而购买的过程。
本实施例以大数据及机器学***的商品子类名称进行多维度的生动化的描述。
本实施例用一系列相关词汇(组)来扩充当前单个商品子类,从而全面,准确,立体地呈现该商品子类。该发明将解决因需要关键词完美匹配而导致的搜索结果为零或召回率低的情况,进而改善用户体验,和提升网站商品从搜索到购买的转化率。对关键词的多维度标签分析和整理提供深度了解用户的途径,为定制个性化搜索打下基础。
如图7所示,本发明实施例提供一种商品搜索***,该***包括:
建立模块:用于建立商品子类列表,所述的商品子类列表包括大类、小类、商品子类和多维度标签,多维度标签包括商品子类对应的同义词、近义词、广义词、商品功能词以及特征词;
输入模块:用于在搜索引擎中输入检索词;
搜索模块:用于在商品子类列表中搜索检索词,以及该检索词对应的同义词、近义词、广义词、商品功能词和特征词,并显示搜索结果。
建立模块建立的商品子类列表,包括大类、小类、商品子类和多维度标签。多维度标签包括对应商品子类的名称,以及同义词、近义词、广义词、商品功能词以及特征词。商品子类、小类和大类是依据电子商务平台的商品分类信息而定。例如按照商品的用途,对商品进行分类。商品子类对应待搜索的商品。小类是商品子类的上一层次的分类,大类是小类的上一层次的分类。输入模块用于在搜索引擎中输入检索词。搜索模块根据检索词,在商品子类列表中,尤其是多维度标签中,搜索检索词,以及检索词对应的同义词、近义词、广义词、商品功能词和特征词,并显示搜索结果。
上述的商品搜索***中,商品子类列表中建立了多层次、多维度的标签。这样在索引中扩充该商品子类,完成对商品子类的立体化描述。商品标签的多层次体现在从商品本身出发,既有横向的标签,如商品的同义词、近义词;也有纵向的标签,如广义词、功能词和特征词。本实施例的商品标签是在横向和纵向发散性的综合。
本实施例***突出电子商务词汇的广度和深度。根据商品的特征和功能描述,创建商品功能词以及特征词标签,为搜索者找到商品提供了可能性。通过在商品子类列表中建立多维度标签,提高了搜索结果召回率,从而改善用户体验,提升商品从搜索到购买的转化率。
本领域技术人员应该知晓,实现上述实施例的方法或者***,可以通过计算机程序指令来实现。该计算机程序指令装载到可编程数据处理设备上,例如计算机,从而在可编程数据处理设备上执行相应的指令,用于实现上述实施例的方法或者***实现的功能。
本领域技术人员依据上述实施例,可以对本申请进行非创造性的技术改进,而不脱离本发明的精神实质。这些改进仍应视为在本申请权利要求的保护范围之内。

Claims (10)

1.一种搜索引擎中商品标签的构建方法,其特征在于,该方法包括:
S11:对商品进行分类,建立商品子类列表;
S12:确定商品子类的多维度标签;
S13:将S12确定的多维度标签加入商品子类列表中,构建商品标签。
2.按照权利要求1所述的构建方法,其特征在于,所述的S11中,商品子类列表包括大类、小类和商品子类。
3.按照权利要求1所述的构建方法,其特征在于,所述的S12中,利用实体识别方法和句子剖析方法自动提取商品的多维度标签;多维度标签包括商品子类对应的同义词、近义词、广义词、商品功能词和特征词。
4.按照权利要求3所述的构建方法,其特征在于,所述的S12具体包括:
S21用模版化的智能网页爬虫获取外部公共资源;
S22利用定制化的网络机器人从外部公共资源抓取与该商品子类相关联的词条,从而生成商品子类相关词条集合;
S23从商品子类相关词条集合中提取备选标签;
S24审阅备选标签,形成最终的标签。
5.按照权利要求4所述的构建方法,其特征在于,所述的步骤S22中,从外部公共资源抓取与该商品子类相关联的词条的过程为:根据该词条在商品子类商品数据中的出现频率和评价数据中的出现频率,当该两种出现频率均大于或等于事先设定的阈值时,则将该词条视为与商品子类相关联的词条。
6.一种搜索引擎中商品标签的构建***,其特征在于,该***包括:
分类模块:用于对商品进行分类,建立商品子类列表;
确定模块:用于确定商品子类的多维度标签;
构建模块:用于将确定的多维度标签,加入商品子类列表中,构建商品标签。
7.按照权利要求6所述的构建***,其特征在于,所述的确定模块具体包括:
获取子模块:用于用模版化的智能网页爬虫获取外部公共资源;
生成子模块:用于利用定制化的网络机器人从外部公共资源抓取与该商品子类相关联的词条,从而生成商品子类相关词条集合;
提取子模块:用于从商品子类相关词条集合中提取备选标签;
审阅子模块:用于审阅备选标签,形成最终的标签。
8.按照权利要求7所述的搜索引擎中商品标签的构建方法,其特征在于,所述的生成子模块具体包括:
统计单元:用于统计词条在商品子类商品数据中的出现频率和评价数据中的出现频率;
判断单元:用于判断两种出现频率是否均大于或等于事先设定的阈值,如果是,则该词条为与商品子类相关联的词条。
9.一种商品搜索方法,其特征在于,该方法包括:
S61:建立商品子类列表,所述的商品子类列表包括大类、小类、商品子类和多维度标签,多维度标签包括商品子类对应的同义词、近义词、广义词、商品功能词以及特征词;
S62:在商品子类列表中搜索用户在搜索引擎中输入的检索词,以及该检索词对应的同义词、近义词、广义词、商品功能词和特征词,并显示搜索结果。
10.一种商品搜索***,其特征在于,该***包括:
建立模块:用于建立商品子类列表,所述的商品子类列表包括大类、小类、商品子类和多维度标签,多维度标签包括商品子类对应的同义词、近义词、广义词、商品功能词以及特征词;
输入模块:用于在搜索引擎中输入检索词;
搜索模块:用于在商品子类列表中搜索检索词,以及该检索词对应的同义词、近义词、广义词、商品功能词和特征词,并显示搜索结果。
CN201510362833.7A 2015-06-26 2015-06-26 搜索引擎中商品标签的构建方法、***及搜索方法和*** Pending CN106326259A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510362833.7A CN106326259A (zh) 2015-06-26 2015-06-26 搜索引擎中商品标签的构建方法、***及搜索方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510362833.7A CN106326259A (zh) 2015-06-26 2015-06-26 搜索引擎中商品标签的构建方法、***及搜索方法和***

Publications (1)

Publication Number Publication Date
CN106326259A true CN106326259A (zh) 2017-01-11

Family

ID=57723163

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510362833.7A Pending CN106326259A (zh) 2015-06-26 2015-06-26 搜索引擎中商品标签的构建方法、***及搜索方法和***

Country Status (1)

Country Link
CN (1) CN106326259A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107291835A (zh) * 2017-05-31 2017-10-24 北京京东尚科信息技术有限公司 一种搜索词的推荐方法和装置
CN108109009A (zh) * 2017-12-22 2018-06-01 罗华文 一种基于大数据分析的商品商场陈列方法
CN108717637A (zh) * 2018-03-22 2018-10-30 浙江大学 一种电商安全相关实体的自动挖掘方法及***
CN109410004A (zh) * 2018-10-29 2019-03-01 维沃移动通信有限公司 一种推荐方法、装置及移动终端
WO2020000201A1 (zh) * 2018-06-26 2020-01-02 深圳齐心集团股份有限公司 基于电商平台的商品搜索***
CN110807083A (zh) * 2018-08-02 2020-02-18 北京京东尚科信息技术有限公司 关键词评估方法和装置
WO2020073528A1 (zh) * 2018-10-12 2020-04-16 平安科技(深圳)有限公司 基于会话的信息推送方法、装置、计算机设备及存储介质
CN111400577A (zh) * 2018-12-14 2020-07-10 阿里巴巴集团控股有限公司 一种搜索召回方法及装置
WO2020147332A1 (zh) * 2019-01-16 2020-07-23 苏宁云计算有限公司 一种扩大商品搜索召回的方法及装置
CN111563382A (zh) * 2020-03-18 2020-08-21 大箴(杭州)科技有限公司 文本信息的获取方法、装置、存储介质及计算机设备
CN113674054A (zh) * 2021-08-13 2021-11-19 青岛海信智慧生活科技股份有限公司 商品类别的配置方法、装置及***
CN113806519A (zh) * 2021-09-24 2021-12-17 金蝶软件(中国)有限公司 一种搜索召回方法、装置及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751420A (zh) * 2008-12-10 2010-06-23 华中科技大学 语义脉络文档查询方法
CN102609424A (zh) * 2011-01-21 2012-07-25 日电(中国)有限公司 评价信息抽取方法和设备
CN102646103A (zh) * 2011-02-18 2012-08-22 腾讯科技(深圳)有限公司 检索词的聚类方法和装置
CN103123649A (zh) * 2013-01-29 2013-05-29 广州一找网络科技有限公司 一种基于微博平台的消息搜索方法及***
CN103577432A (zh) * 2012-07-26 2014-02-12 阿里巴巴集团控股有限公司 一种商品信息搜索方法和***
CN103577423A (zh) * 2012-07-23 2014-02-12 阿里巴巴集团控股有限公司 关键词分类方法及***

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751420A (zh) * 2008-12-10 2010-06-23 华中科技大学 语义脉络文档查询方法
CN102609424A (zh) * 2011-01-21 2012-07-25 日电(中国)有限公司 评价信息抽取方法和设备
CN102646103A (zh) * 2011-02-18 2012-08-22 腾讯科技(深圳)有限公司 检索词的聚类方法和装置
CN103577423A (zh) * 2012-07-23 2014-02-12 阿里巴巴集团控股有限公司 关键词分类方法及***
CN103577432A (zh) * 2012-07-26 2014-02-12 阿里巴巴集团控股有限公司 一种商品信息搜索方法和***
CN103123649A (zh) * 2013-01-29 2013-05-29 广州一找网络科技有限公司 一种基于微博平台的消息搜索方法及***

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
张予焓: "产品评价对象的提取和分析", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
瞿国忠: "查询扩展技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
陆国浩: "企业网络营销关键词扩展方法的研究", 《沙洲职业工学院学报》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107291835B (zh) * 2017-05-31 2020-12-22 北京京东尚科信息技术有限公司 一种搜索词的推荐方法和装置
CN107291835A (zh) * 2017-05-31 2017-10-24 北京京东尚科信息技术有限公司 一种搜索词的推荐方法和装置
CN108109009A (zh) * 2017-12-22 2018-06-01 罗华文 一种基于大数据分析的商品商场陈列方法
CN108717637A (zh) * 2018-03-22 2018-10-30 浙江大学 一种电商安全相关实体的自动挖掘方法及***
CN108717637B (zh) * 2018-03-22 2020-11-17 浙江大学 一种电商安全相关实体的自动挖掘方法及***
WO2020000201A1 (zh) * 2018-06-26 2020-01-02 深圳齐心集团股份有限公司 基于电商平台的商品搜索***
CN110807083A (zh) * 2018-08-02 2020-02-18 北京京东尚科信息技术有限公司 关键词评估方法和装置
WO2020073528A1 (zh) * 2018-10-12 2020-04-16 平安科技(深圳)有限公司 基于会话的信息推送方法、装置、计算机设备及存储介质
CN109410004A (zh) * 2018-10-29 2019-03-01 维沃移动通信有限公司 一种推荐方法、装置及移动终端
CN111400577A (zh) * 2018-12-14 2020-07-10 阿里巴巴集团控股有限公司 一种搜索召回方法及装置
CN111400577B (zh) * 2018-12-14 2023-06-30 阿里巴巴集团控股有限公司 一种搜索召回方法及装置
WO2020147332A1 (zh) * 2019-01-16 2020-07-23 苏宁云计算有限公司 一种扩大商品搜索召回的方法及装置
CN111563382A (zh) * 2020-03-18 2020-08-21 大箴(杭州)科技有限公司 文本信息的获取方法、装置、存储介质及计算机设备
CN113674054A (zh) * 2021-08-13 2021-11-19 青岛海信智慧生活科技股份有限公司 商品类别的配置方法、装置及***
CN113674054B (zh) * 2021-08-13 2023-12-05 青岛海信智慧生活科技股份有限公司 商品类别的配置方法、装置及***
CN113806519A (zh) * 2021-09-24 2021-12-17 金蝶软件(中国)有限公司 一种搜索召回方法、装置及介质

Similar Documents

Publication Publication Date Title
CN106326259A (zh) 搜索引擎中商品标签的构建方法、***及搜索方法和***
CN106776711B (zh) 一种基于深度学习的中文医学知识图谱构建方法
CN103593792B (zh) 一种基于中文知识图谱的个性化推荐方法与***
CN105653706B (zh) 一种基于文献内容知识图谱的多层引文推荐方法
CN108280114B (zh) 一种基于深度学习的用户文献阅读兴趣分析方法
CN103870973B (zh) 基于电子信息的关键词提取的信息推送、搜索方法及装置
WO2020253591A1 (zh) 运用标签知识网络的搜索方法及装置
CN104636371B (zh) 信息推荐方法及设备
CN112667794A (zh) 一种基于孪生网络bert模型的智能问答匹配方法及***
CN106339502A (zh) 一种基于用户行为数据分片聚类的建模推荐方法
EP1995669A1 (en) Ontology-content-based filtering method for personalized newspapers
JP6381775B2 (ja) 情報処理システム及び情報処理方法
Ramey et al. The systematic literature review as a research genre
CN105528437B (zh) 一种基于结构化文本知识提取的问答***构建方法
CN107257970A (zh) 从结构化和非结构化数据源进行的问题回答
CN110168535A (zh) 一种信息处理方法及终端、计算机存储介质
CN103838833A (zh) 基于相关词语语义分析的全文检索***
CN102236646A (zh) 对象级垂直搜索引擎个性化排序算法iRank
CN102968417A (zh) 一种应用于计算机网络中的搜索方法和***
CN103399862B (zh) 确定目标查询序列所对应的搜索引导信息的方法与设备
Das et al. A CV parser model using entity extraction process and big data tools
CN106708886A (zh) 站内搜索词的显示方法及装置
Shi et al. The exploration of artificial intelligence application in fashion trend forecasting
Rintyarna et al. Adapted weighted graph for Word Sense Disambiguation
Zhou et al. Survey of knowledge graph approaches and applications

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170111

RJ01 Rejection of invention patent application after publication