CN103902545A - 一种类目路径识别方法及*** - Google Patents

一种类目路径识别方法及*** Download PDF

Info

Publication number
CN103902545A
CN103902545A CN201210572005.2A CN201210572005A CN103902545A CN 103902545 A CN103902545 A CN 103902545A CN 201210572005 A CN201210572005 A CN 201210572005A CN 103902545 A CN103902545 A CN 103902545A
Authority
CN
China
Prior art keywords
keyword
count value
classification path
classification
path
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210572005.2A
Other languages
English (en)
Other versions
CN103902545B (zh
Inventor
胡德凤
朱正平
马超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Shangke Information Technology Co Ltd
Priority to CN201210572005.2A priority Critical patent/CN103902545B/zh
Priority to RU2015125959A priority patent/RU2617921C2/ru
Priority to PCT/CN2013/088002 priority patent/WO2014101616A1/en
Publication of CN103902545A publication Critical patent/CN103902545A/zh
Priority to US14/748,618 priority patent/US20150294388A1/en
Application granted granted Critical
Publication of CN103902545B publication Critical patent/CN103902545B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/954Navigation, e.g. using categorised browsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种类目路径识别方法及***,本发明实施例中的方法包括:根据用户输入的商品标题确定所述商品标题的类目路径,而不需要用户逐级确定该商品标题的类目路径。本发明实施例方法包括:获取用户输入的商品标题;对该商品标题进行分词处理,得到商品标题中的关键词集合;根据关键词集合及预置的商品类目识别模型确定商品标题的类目路径,能够有效的实现商品标题的类目路径的识别,且避免因用户操作失误导致的类目出错的情况,提高了类目识别的操作效率及准确率。

Description

一种类目路径识别方法及***
技术领域
本发明涉及数据处理领域,尤其涉及一种类目识别方法及装置。
背景技术
随着电子商务的发展,开网店和网购在网民中越来越普遍,网上交易***提供一个网上交易平台,站点中的所有商品都会归属到一个分类路径之下,这样能方便用户找到想要的商品,这个分类可称为类目,例如:“美特斯邦威运动长裤”这样的商品所属的类目路径即为“运动服饰/包/配件>运动服饰>运动长裤”,这里“运动服饰/包/配件”是一级类目,“运动服饰”是二级类目,“运动长裤”是三级类目。网上交易平台可按照类目对网店的商品进行管理。
在消费者与消费者(英文全称:Consumer to Consumer,缩写:C2C)网站或商家对顾客(英文全称:Business-to-Customer,缩写:B2C)网站中,卖家或运营人员发布商品时,除了填写商品名称外,还需要手工去选择商品的一级类目,二级类目,直到最低级类目,每一级类目又有若干种选择需要卖家仔细查看;甚至有多个类目都比较适合,但又都不是特别适合的状况发生,这会让用户非常踌躇,且容易出现类目错误的情况。
发明内容
本发明实施例提供了一种类目路径识别方法及***,用于根据用户输入的商品标题确定所述商品标题的类目路径,而不需要用户逐级确定该商品标题的类目路径,能够有效的实现商品标题的类目路径的识别,且避免因用户操作失误导致的类目出错的情况,提高了类目识别的操作效率及准确性。
本发明一方面提供了一种类目路径识别方法,可包括:
获取用户输入的商品标题;
对所述商品标题进行分词处理,得到所述商品标题中的关键词集合;
根据所述关键词集合及预置的商品类目识别模型确定所述商品标题的类目路径。
在第一方面第一种可能的实现方式中,所述根据所述关键词集合及预置的商品类目识别模型确定所述商品标题的类目路径包括:
利用所述关键词集合查找所述商品类目识别模型中的关键词与类目路径计数表确定包含所述关键词集合的类目路径的集合,所述关键词与类目路径计数表中包含类目路径与关键词之间的对应关系,及所述关键词在对应的类目路径下的出现次数的计数值;
分别计算所述类目路径的集合中每一个类目路径的综合计数值;
选取所述类目路径的集合中综合计数值最大的类目路径作为所述商品标题的类目路径。
结合第一方面或者第一方面第一种可能的实现方式,在第二中可能的实现方式中,所述分别计算所述类目路径的集合中的每一个类目路径的综合计数值包括:
分别对所述类目路径的集合中的每一个类目路径执行以下步骤:
分别计算所述关键词集合中的每一个关键词在所述类目路径下的关键词计数值;
计算得到的所述关键词集合中的关键词的关键词计数值的乘积,将所述乘积作为所述类目路径的综合计数值。
结合第一方面第二种可能的实现方式,在第三种可能的实现方式中,所述分别计算所述关键词集合中的每一个关键词在所述类目路径下的关键词计数值包括:
分别对所述关键词集合中的每一个关键词执行以下步骤:
查找所述关键词与类目路径计数表确定所述关键词在所述类目路径下的出现次数的第一计数值,在所述商品类目识别模型中的关键词计数表中查找所述关键词的出现次数的第二计数值,及在所述商品类目识别模型中的类目路径计数表中查找所述类目路径下的商品标题的总数的第三计数值,所述关键词计数表中包含每个关键词的总的出现次数的计数值,所述类目路径计数表中包含每个类目路径下的总的商品标题的计数值;
利用所述第一计数值、所述第二计数值及所述第三计数值计算所述关键词在所述类目路径下的关键词计数值。
结合第一方面第三种可能的实现方式,在第四中可能的实现方式中,所述利用所述第一计数值、所述第二计数值及所述第三计数值计算所述关键词在所述类目路径下的关键词计数值包括:
将所述第二计数值与预置的第一参数的乘积与所述第三计数值与预置的第二参数的乘积的和作为第四计数值;
将所述第一计数值除以所述第四计数值得到的商作为所述关键词在所述类目路径下的关键词计数值。
本发明第二方面提供了一种类目路径识别***,可包括:
获取单元,用于获取用户输入的商品标题;
处理单元,用于在所述获取单元获取所述商品标题之后,对所述商品标题进行分词处理,得到所述商品标题中的关键词集合;
确定单元,用于在所述处理单元得到所述关键词集合之后,根据所述关键词集合及预置的商品类目识别模型确定所述商品标题的类目路径。
在第二方面可能的实现方式中,所述确定单元包括:
第一查找单元,用于在所述处理单元得到所述关键词集合之后,利用所述关键词集合查找所述商品类目识别模型中的关键词与类目路径计数表确定包含所述关键词集合的类目路径的集合,所述关键词与类目路径计数表中包含类目路径与关键词之间的对应关系,及所述关键词在对应的类目路径下的出现次数的计数值;
第一计算单元,用于在所述第一查找单元得到所述类目路径的集合之后,分别计算所述类目路径的集合中每一个类目路径的综合计数值;
选取单元,用于在所述第一计算单元得到所述类目路径的集中和每一个类目路径的综合计数值之后,选取所述类目路径的集合中综合计数值最大的类目路径作为所述商品标题的类目路径。
结合第二方面或者第二方面第一种可能的实现方式,在第二种可能的实现方式中,所述第一计算单元包括:第二计算单元及第三计算单元,且所述第二计算单元及第三计算单元将分别计算类目路径的集合中的每一个类目路径的综合计数值;
所述第二计算单元,用于分别计算所述关键词集合中的每一个关键词在所述类目路径下的关键词计数值;
所述第三计算单元,用于在第二计算单元得到所述关键词计数值之后,计算得到的所述关键词集合中的关键词的关键词计数值的乘积,将所述乘积作为所述类目路径的综合计数值。
结合第二方面第二种可能的实现方式,在第三种可能的实现方式中,所述第二计算单元包括:第二查找单元和第四计算单元,所述第二查找单元及所述第四计算单元用于计算所述关键词集合中的每一个关键词的关键词计数值;
所述第二查找单元,用于查找所述关键词与类目路径计数表确定所述关键词在所述类目路径下的出现次数的第一计数值,在所述商品类目识别模型中的关键词计数表中查找所述关键词的出现次数的第二计数值,及在所述商品类目识别模型中的类目路径计数表中查找所述类目路径下的商品标题的总数的第三计数值,所述关键词计数表中包含每个关键词的总的出现次数的计数值,所述类目路径计数表中包含每个类目路径下的总的商品标题的计数值;
所述第四计算单元,用于利用所述第一计数值、所述第二计数值及所述第三计数值计算所述关键词在所述类目路径下的关键词计数值。
结合第二方面第三种可能的实现方式,在第四种可能的实现方式中,所述第四计算单元包括:
第五计算单元,用于将所述第二计数值与预置的第一参数的乘积与所述第三计数值与预置的第二参数的乘积的和作为第四计数值;
第六计算单元,用于将所述第一计数值除以所述第四计数值得到的商作为所述关键词在所述类目路径下的关键词计数值。
从以上技术方案可以看出,本发明实施例具有以下优点:
类目路径识别***获取到用户输入的商品标题之后,将对该商品标题进行分词处理,得到该商品标题中的关键词集合,并利用该关键词集合及与预置的商品类目识别模型确定该商品标题的类目路径,能够有效的实现商品标题的类目路径的识别,不需要用户逐级确定该商品标题的类目路径,且可避免因用户操作失误导致的类目出错的情况,提高了类目识别的操作效率及准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中类目路径识别方法的一个示意图;
图2为本发明实施例中类目路径识别方法的另一示意图;
图3为本发明实施例中类目路径识别***的结构的一个示意图;
图4为本发明实施例中类目路径识别***的结构的一个示意图;
图5为本发明实施例中第二计算单元的结构的一个示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种类目路径识别方法及***,在用户发布商品信息时,用于根据用户输入的商品标题自动识别所述商品标题的类目路径,而不需要用户逐级确定该商品标题的类目路径,能够有效的实现商品标题的类目路径的识别,且避免因用户操作失误导致的类目出错的情况,提高了类目识别的操作效率及准确性。
在本发明实施例中,类目路径识别***将使用预置的商品类目识别模型确定用户输入的商品标题的类目路径,为了更好的理解本发明实施例中的计数方案,下面将详细的介绍本发明实施例中的商品类目识别模型的建立方法。
在本发明实施例中,模型建立***将从C2C网站或者B2C网站的数据库中获取已保存的所有的商品标题与类目路径之间的一一对应的对应关系的数据,且模型建立***将该数据随机的分为第一数据和第二数据,或者模型建立***将该数据按照预置的比例分为第一数据和第二数据,例如:该预置的比例可以为:5:5,或者7:3等等。
在本发明实施例中,模型建立***将***中保存的商品标题与类目路径之间的一一对应的对应关系的数据分为第一数据和第二数据之后,将利用第一数据构建商品类目识别模型,并利用第二数据对构建的商品类目识别模型进行优化和验证,使得利用得到商品类目识别模型确定商品标题的类目路径的准确性更高。
其中,利用第一数据构建商品类目识别模型具体包括:
1)对第一数据中的商品标题与类目路径之间的一一对应的对应关系进行统计,确定属于一个相同的类目路径下的商品标题的出现次数,并生成一个类目路径计数表,在该类目路径计数表中包含第一数据中每一个类目路径下的总的商品标题的计数值。
例如:“女装/女士精品>裤子>女士牛仔裤”的类目路径下总共有57个商品标题,“运动服饰/包/配件>运动服饰>运动长裤”的类目路径下总共有107个商品标题。
2)对第一数据中的所有商品标题进行分词处理,得到所有的关键词,并统计计算每一个关键词的出现次数,并将该出现次数作为该关键词的计数值,生成关键词计数表,使得该关键词计数表中包含第一数据中每一个关键词的总的出现次数的计数值。
例如:若第一商品标题为“韩都衣舍韩版时尚女装修身磨破直筒牛仔裤”,第二商品标题为“美特斯邦威时尚女装修身直筒牛仔裤”,则对第一商品标题进行分词处理,得到的关键词包括“韩都衣舍”、“韩版”、“时尚”“女装”、“修身”、“磨破”、“直筒”、“牛仔裤”,对第二商品标题进行分词处理得到的关键词包括:“美特斯邦威”、“时尚”、“女装”、“修身”、“直筒”、“牛仔裤”,对第一商品标题及第二商品标题中的关键词进行统计,可得到每个关键词总的出现次数的计数值,即“韩都衣舍”的计数值为1,“韩版”的计数值为1、“时尚”的计数值为2、“女装”的计数值为2、“修身”的计数值为2、“磨破”的计数值为1、“直筒”的计数值为2、“牛仔裤”的计数值为2、“美特斯邦威”的计数值为1。
3)对第一数据中的商品标题与类目路径之间的一一对应的对应关系进行处理,建立类目路径与商品标题之间的一对多的对应关系。
例如:第一数据中的商品标题与类目路径之间的一一对应的关系的表可以如下表所示:
商品标题 类目路径
美特斯邦威时尚女装修身直筒牛仔裤 女装/女士精品>裤子>女士牛仔裤
法律之门 图书>法律>法律普及读物
周杰伦杰伦十代(10CD) 音乐>华语流行>男歌手
韩都衣舍女装修身磨破直筒牛仔裤 女装/女士精品>裤子>女士牛仔裤
不可不知的1000个法律常识 图书>法律>法律普及读物
张学友完全学友(4CD) 音乐>华语流行>男歌手
欧时丽女装修身窄脚牛仔裤 女装/女士精品>裤子>女士牛仔裤
超越法律 图书>法律>法律普及读物
周杰伦七里香(CD) 音乐>华语流行>男歌手
表1
对上述表1中的的数据进行处理,可得到类目路径与商品标题之间的一对多的对应关系,具体可参看下表:
表2
在本发明实施例中,模型建立***在得到第一数据中的类目路径与商品标题之间的一对多的对应关系之后,将对每一个类目路径下的商品标题进行统计处理,具体包括:对类目路径下的所有商品标题进行分词处理,得到该类目路径下的所有的关键词,并对得到的所有关键词进行统计,确定每一个关键词在该类目路径下出现的次数,生成关键词与类目路径计数表,该关键词与类目路径计数表中包含在每个类目路径与其商品标题的一对多的对应关系中类目路径与关键词之间的对应关系,及关键词在该对应的类目路径下的出现次数的计数值。
在本发明实施了中,模型建立***利用第一数据得到类目路径计数表、关键词计数表、关键词与类目路径计数表,并将该类目路径计数表、关键词计数表、关键词与类目路径计数表、及初始的商品标题的类目路径的综合计数值的计算公式作为初始商品类目识别模型,其中,初始的商品标题的类目路径的综合计数值的计算公式包括:
S(P,Ki)=T/(A*Ki+B*P)                        公式(1)
S(P,K)=S(P,K1)*S(P,K2)*……*S(P,Kn)  公式(2)
其中,P表示在类目路径计数表中与商品标题X对应的类目路径Y的总的商品标题的计数值,Ki为商品标题X的关键词集合K中的第i个关键词,T表示在关键词与类目路径计数表中关键词Ki在类目路径Y下出现次数的计数值,S(P,Ki)表示关键词Ki在类目路径P下的关键词计数值,S(P,K)表示商品标题X的关键词集合K在类目路径Y下综合计数值,,n表示商品标题X的关键词集合中有n个关键词,A和B为预先设置的常数值。
需要说明的是,在本发明实施例中,由于参数A和参数B为模型建立***给定的具有具体数值的参数,并不能使得初始商品类目识别模型在识别商品标题的类目路径时有较高的准确率,因此,为了提高初始商品类目识别模型的准确率,可以利用第二数据对该初始商品类目识别模型的准确率进行计算,并根据计算得到的准确率调整参数A和参数B的大小,并将调整后的参数A和参数B带入公式(1)中,得到修正后的公式(1),即得到修正后的初始商品类目识别模型,并继续利用第二数据对修正后的初始商品类目模型的准确率进行计算,如此循环往复,可对初始商品类目识别模型进行多次修正,直至修正后的初始商品类目识别模型的准确率满足模型建立***预先设置的数值,并将最后的修正后的初始商品类目模型作为最终的商品类目识别模型使用。
在本发明实施例中,利用第二数据对初始商品类目模型识别的准确率进行计算的方法包括:
对第二数据中的每一条商品标题与类目路径之间的一一对应关系进行如下处理:
为了便于理解,以第二数据中的商品标题X及与其对应的类目路径Z为例进行说明,包括:
对商品标题X进行分词处理,得到商品标题X的关键词集合K,查找关键词与类目路径计数表,确定包含关键词集合K的所有的类目路径的集合,接着,分别计算商品标题X在该类目路径的集合中的每一个类目路径下的综合计数值。为了便于理解,以商品标题X在类目路径的集合中的类目路径Y下的综合计数值的计算为例进行说明,包括:按照公式(1)分别计算商品标题X的关键词集合K中的每一个关键词的关键词计数值;按照公式(2)计算商品标题X在类目路径Y下的综合计数值。
在本发明实施了中,在利用公式(1)和公式(2)计算得到商品标题X的类目路径的集合中的每一个类目路径的综合计数值之后,将选取其中综合计数值最大的类目路径与第二数据中与商品标题X对应的类目路径Z进行比较,若综合计数值最大的类目路径与类目路径Z完全相同,则说明该商品标题X的类目路径的识别是正确的,若综合计数值最大的类目路径与类目路径Z不完全相同,则说明该商品X的类目路径的识别是错误的。
在本发明实施例中,对第二数据中的每一条商品标题与类目路径之间的一一对应关系进行上述处理之后,模型建立***将统计计算对第二数据中的商品标题的类目路径识别正确的次数及类目路径识别错误的次数,并计算得到类目识别的准确率,该准确率即为初始商品类目模型的准确率。且模型建立***在得到初始商品类目模型的准确率之后,将进一步判断该准确率与预置的数值之间的关系,若该准确率大于或等于预置的数值,则不对参数A和参数B进行调整,若该准确率小于预置的数值,则调整参数A和参数B的大小,实现对参数A和参数B的修正,即实现对初始商品类目识别模型的修正,且在调整参数A和参数B的大小之后,将继续按照上述的利用第二数据对初始商品类目模型识别的准确率进行计算的方法计数修正后的初始商品类目识别模型的准确率,并利用该准确率确定是否调整参数A和参数B,直至得到的第二数据中的商品标题的类目路径识别的准确率大于或等于预置的数值时,将最后的并将最后的修正后的初始商品类目模型作为最终的商品类目识别模型使用。
需要说明的是,在本发明实施例中,可以接收用户的输入确定调整后的参数A和参数B的大小,也可以由模型建立***按照预置的调整方式调整参数A和参数B的大小,在实际应用中,可根据具体的情况设置参数A和参数B的调整方式,此处不做限定。
在本发明实施例中,模型建立***建立商品类目识别模型之后,可以将该商品类目识别模型设置在类目路径识别***中,由类目路径识别***利用该商品类目识别模型确定用户输入的商品标题的类目路径,请参阅图1,为本发明实施例中的类目路径识别方法的实施例,包括:
101、获取用户输入的商品标题;
在本发明实施例中,用户可利用类目路径识别***实现商品标题的类目路径的自动识别,用于可将待确定类目路径的商品标题输入类目路径识别***中,使得类目路径识别***可获得用户输入的商品标题。
102、对商品标题进行分词处理,得到商品标题中的关键词集合;
在本发明实施例中,类目路径识别***将对商品标题进行分词处理,得到商品标题中的关键词集合。例如:若商品标题为“韩都衣舍韩版时尚女装修身磨破直筒牛仔裤”,则对该商品标题进行分词处理,得到的关键词集合包括“韩都衣舍”、“韩版”、“时尚”“女装”、“修身”、“磨破”、“直筒”、“牛仔裤”,又例如:若商品标题为“美特斯邦威时尚女装修身直筒牛仔裤”,则对该商品标题进行分词处理得到的关键词集合包括:“美特斯邦威”、“时尚”、“女装”、“修身”、“直筒”、“牛仔裤”。
103、根据关键词集合及预置的商品类目识别模型确定商品标题的类目路径。
在本发明实施例中,类目路径识别***将根据得到的商品标题中的关键词集合及预置的商品类目识别模型确定商品标题的类目路径。
在本发明实施例中,类目路径识别***获取到用户输入的商品标题之后,将对该商品标题进行分词处理,得到该商品标题中的关键词集合,并利用该关键词集合及与预置的商品类目识别模型确定该商品标题的类目路径,能够有效的实现商品标题的类目路径的识别,不需要用户逐级确定该商品标题的类目路径,且可避免因用户操作失误导致的类目出错的情况,提高了类目识别的操作效率及准确率。
为了更好的理解本发明实施例中的类目路径识别方法,请参阅图2,为本发明实施例中类目路径识别方法的实施例,包括:
201、获取用户输入的商品标题;
202、对商品标题进行分词处理,得到商品标题中的关键词集合;
在本发明实施例中,步骤201及步骤202分别与图1所示实施例中的步骤101及步骤102描述的内容相似,此处不再赘述。
203、利用关键词集合查找商品类目识别模型中的关键词与类目路径计数表确定包含关键词集合的类目路径的集合,关键词与类目路径计数表中包含类目路径与关键词之间的对应关系,及关键词在对应的类目路径下的出现次数的计数值;
在本发明实施例中,类目路径识别***中包含商品类目识别模型,该商品类目识别模型中包含关键词与类目路径计数表,关键词计数表及类目路径计数表,其中,关键词与类目路径计数表中包含类目路径与关键词之间的对应关系,及关键词在对应的类目路径下的出现次数的计数值;关键词计数表中包含每个关键词的总的出现次数的计数值,类目路径计数表中包含每个类目路径下的总的商品标题的计数值。
在本发明实施例中,类目路径识别***在获取到商品标题的关键词集合之后,将利用关键词集合查找商品类目识别模型中的关键词与类目路径计数表确定包含关键词集合的类目路径的集合。
204、分别计算类目路径的集合中每一个类目路径的综合计数值;
在本发明实施例中,类目路径识别***在得到商品标题的关键词集合对应的类目路径的集合之后,将分别计算该类目路径的集合中每一个类目路径的综合计数值。
在本发明实施中,为了得到商品标题的关键词集合对应的类目路径的集合中的每一个类目路径的综合计数值,类目路径识别***将分别对类目路径集合中的每一个类目路径执行以下步骤:
步骤A、分别计算关键词集合中的每一个关键词在类目路径下的关键词计数值;
在本发明实施例中,类目路径识别***将分别计算商品标题的关键词集合中的每一个关键词在类目路径下的关键词计数值,具体的,类目路径识别***将分别对关键词集合中的每一个关键词执行以下步骤:
步骤A1、查找关键词与类目路径计数表确定关键词在类目路径下的出现次数的第一计数值,在商品类目识别模型中的关键词计数表中查找关键词的出现次数的第二计数值,及在商品类目识别模型中的类目路径计数表中查找类目路径下的商品标题的总数的第三计数值;
步骤A2、利用第一计数值、第二计数值及第三计数值计算关键词在类目路径下的关键词计数值。
在步骤A2中,类目识别***是使用商品类目识别模型中的公式(1)确定关键词在类目路径下的关键词计数值,包括:将第二计数值与预置的第一参数的乘积与第三计数值与预置的第二参数的乘积的和作为第四计数值;将第一计数值除以第四计数值得到的商作为关键词在类目路径下的关键词计数值,且公式(1)为:
S(P,Ki)=T/(A*Ki+B*P)
其中,第三计数值为P,P表示在类目路径计数表中与商品标题X对应的类目路径Y的总的商品标题的计数值,第二计数值为Ki,Ki为商品标题X的关键词集合K中的第i个关键词,第一计数值为T,T表示在关键词与类目路径计数表中关键词Ki在类目路径Y下出现次数的计数值,且A*Ki+B*P的和为第四计数值,S(P,Ki)表示关键词Ki在类目路径P下的关键词计数值,A表示参数A,且第一参数为参数A,B表示参数B,且第二参数为参数B,且其中的参数A和参数B为调整之后的且能够使得商品类目识别模型的准确率大于或等于预置的数值的参数。
B、计算得到的关键词集合中的关键词的关键词计数值的乘积,将乘积作为类目路径的综合计数值。
在本发明实施例中,类目识别***将计算得到商品标题的关键词集合中的关键词的关键词计数值的乘积作为该商品标题在对应的类目路径下的综合计数值,且综合计数值的计算公式为:
S(P,K)=S(P,K1)*S(P,K2)*……*S(P,Kn)  公式(2)
其中,S(P,Ki)表示关键词Ki在类目路径P下的关键词计数值,S(P,K)表示商品标题X的关键词集合K在类目路径Y下综合计数值。
205、选取类目路径的集合中综合计数值最大的类目路径作为商品标题的类目路径。
在本发明实施例中,类目路径识别***在得到用户输入的商品标题的关键词集合对应的类目路径的集合中的每一个类目路径的综合计数值之后,将选取该类目路径集合中综合计数值最大的类目路径作为用户输入的商品标题的类目路径,使得类目路径识别***可将用户输入的商品标题放入该选取的类目路径下,实现商品标题的类目路径的自动识别。
在本发明实施例中,类目路径识别***在获取到用户输入的商品标题之后,将对该商品标题进行分词处理,得到该商品标题的关键词集合,并利用该关键词集合查找商品类目识别模型中的关键词与类目路径计数表确定包含该关键词集合的类目路径的集合,且还将进一步类目路径的集合中每一个类目路径的综合计数值,从中选取综合计数值最大的类目路径为用户输入的商品标题的类目路径,能够有效的实现商品标题的类目路径的识别,且不需要用户逐级设置商品标题的类目路径,节约用户的工作量及时间,且能够避免因用户错误操作导致的类目错误,有效的提高用户的体验。
为了更好的理解本发明实施例中的类目路径识别方法,下面将介绍一个具体的应用场景。
若用户输入的商品标题为“美特斯邦威时尚女装修身直筒牛仔裤”,则类目路径识别***将获取该商品标题“美特斯邦威时尚女装修身直筒牛仔裤”,并对该商品标题进行分词处理,得到该商品标题的关键词集合,具体包括“美特斯邦威”、“时尚”、“女装”、“修身”、“直筒”、“牛仔裤”。接着,类目路径识别***利用预置的商品类目识别模型中的关键词与类目路径计数表获取包含该关键词集合{“美特斯邦威”、“时尚”、“女装”、“修身”、“直筒”、“牛仔裤”}的类目路径的集合,且获得的类目路径的集合包括:“女装/女士精品>裤子>女士牛仔裤”,“图书>服装>女式服装搭配>牛仔裤搭配”。
类目路径识别***将分别对获得的类目路径的集合中的两条类目路径进行处理,具体包括:类目路径识别***将查找商品类目识别模型中的关键词与类目路径计算表,确定在类目路径“女装/女士精品>裤子>女士牛仔裤”下的商品标题的关键词集合{“美特斯邦威”、“时尚”、“女装”、“修身”、“直筒”、“牛仔裤”}中的每一个关键词的出现次数的第一计数值,若第一计数值分别为100、200、50、80、300,400,继续在商品类目识别模型中的关键词计数表中查找关键词集合{“美特斯邦威”、“时尚”、“女装”、“修身”、“直筒”、“牛仔裤”}中的每一个关键词的出现次数的第二数值,分别为300、500、1000、400、200、700,且继续在商品类目识别模型中的类目路径计数表中查找类目路径“女装/女士精品>裤子>女士牛仔裤”下的商品标题的总数,该总是为1000,接着,利用得到的计数值,按照公式(1)分别计算关键词集合{“美特斯邦威”、“时尚”、“女装”、“修身”、“直筒”、“牛仔裤”}中的每一个关键词的关键词计数值(假设公式(1)中的参数A和参数B均为0.01),分别为7.69、13.33、2.5、5.71、25、23.5,类目路径识别***将关键词集合中的关键词的关键词计数值相乘,得到商品标题“美特斯邦威时尚女装修身直筒牛仔裤”在类目路径“女装/女士精品>裤子>女士牛仔裤”下时类目路径的综合计数值,且该综合计数值为344305.27,且按照上述相似的计算方式,可得到商品标题“美特斯邦威时尚女装修身直筒牛仔裤”在类目路径“图书>服装>女式服装搭配>牛仔裤搭配”下时类目路径的综合计数值为756,则选取综合计数值最大的类目路径“女装/女士精品>裤子>女士牛仔裤”为商品标题“美特斯邦威时尚女装修身直筒牛仔裤”的类目路径,实现了商品标题的类目路径的自动识别,不需要用户逐级设置商品标题的类目,能够有效的减少用户的工作量且避免因用户操作失误带来的类目错误的问题,提高了类目识别的操作效率及准确率。
请参阅图3,为本发明实施例中类目路径识别***的结构的实施例,包括:
获取单元301,用于获取用户输入的商品标题;
处理单元302,用于在获取单元301获取商品标题之后,对商品标题进行分词处理,得到商品标题中的关键词集合;
确定单元303,用于在处理单元302得到关键词集合之后,根据关键词集合及预置的商品类目识别模型确定商品标题的类目路径。
在本发明实施例中,类目路径识别***中的获取单元301获取用户输入的商品标题,接着由处理单元302对商品标题进行分词处理,得到商品标题中的关键词集合,最后确定单元303根据关键词集合及预置的商品类目识别模型确定商品标题的类目路径。
在本发明实施例中,类目路径识别***获取到用户输入的商品标题之后,将对该商品标题进行分词处理,得到该商品标题中的关键词集合,并利用该关键词集合及与预置的商品类目识别模型确定该商品标题的类目路径,能够有效的实现商品标题的类目路径的识别,不需要用户逐级确定该商品标题的类目路径,且可避免因用户操作失误导致的类目出错的情况,提高了类目识别的操作效率及准确率。
为了更好的理解本发明实施例中的类目路径识别***,请参阅图4,为本发明实施例中类目路径识别***的实施例,包括:
如图3所示实施例中描述的获取单元301、处理单元302及确定单元303,且与图3所示实施例中描述的内容相似,此处不再赘述。
在本发明实施例中,确定单元303包括:
第一查找单元401,用于在处理单元得到关键词集合之后,利用关键词集合查找商品类目识别模型中的关键词与类目路径计数表确定包含关键词集合的类目路径的集合,关键词与类目路径计数表中包含类目路径与关键词之间的对应关系,及关键词在对应的类目路径下的出现次数的计数值;
第一计算单元402,用于在第一查找单元401得到类目路径的集合之后,分别计算类目路径的集合中每一个类目路径的综合计数值;
选取单元403,用于在第一计算单元402得到类目路径的集中和每一个类目路径的综合计数值之后,选取类目路径的集合中综合计数值最大的类目路径作为商品标题的类目路径。
且其中,第一计算单元402包含第二计算单元404及第三计算单元405,且第二计算单元404及第三计算单元405将分别计算类目路径的集合中的每一个类目路径的综合计数值;
其中,第二计算单元404,用于分别计算关键词集合中的每一个关键词在类目路径下的关键词计数值;
第三计算单元405,用于在第二计算单元得到关键词计数值之后,计算得到的关键词集合中的关键词的关键词计数值的乘积,将乘积作为类目路径的综合计数值。
在本发明实施例中,类目路径识别***中的获取单元301获取用户输入的商品标题,接着由处理单元302对商品标题进行分词处理,得到商品标题中的关键词集合,接着,确定单元303中的第一查找单元401利用关键词集合查找商品类目识别模型中的关键词与类目路径计数表确定包含关键词集合的类目路径的集合,接着,确定单元303中的第一计算单元402分别计算类目路径的集合中每一个类目路径的综合计数值;最后,确定单元303中的选取单元403选取类目路径的集合中综合计数值最大的类目路径作为商品标题的类目路径。
在本发明实施例中,第一计算单元402包含第二计算单元404及第三计算单元405,且第二计算单元404及第三计算单元405将分别计算类目路径的集合中的每一个类目路径的综合计数值;具体的包括:第二计算单元404分别计算关键词集合中的每一个关键词在类目路径下的关键词计数值;接着第三计算单元405计算得到的关键词集合中的关键词的关键词计数值的乘积,将乘积作为类目路径的综合计数值。
在本发明实施例中,类目路径识别***在获取到用户输入的商品标题之后,将对该商品标题进行分词处理,得到该商品标题的关键词集合,并利用该关键词集合查找商品类目识别模型中的关键词与类目路径计数表确定包含该关键词集合的类目路径的集合,且还将进一步类目路径的集合中每一个类目路径的综合计数值,从中选取综合计数值最大的类目路径为用户输入的商品标题的类目路径,能够有效的实现商品标题的类目路径的识别,且不需要用户逐级设置商品标题的类目路径,节约用户的工作量及时间,且能够避免因用户错误操作导致的类目错误,有效的提高用户的体验。
为了更好的理解本发明实施例中的类目路径识别***,下面将详细介绍本发明实施例中类目路径识别***中的第一计算单元402中的第二计算单元404的结构,请参阅图5,为本发明实施例中第二计算单元的结构的实施例,包括:
第二计算单元404中包含第二查找单元501和第四计算单元502,第二查找单元501及第四计算单元502用于计算关键词集合中的每一个关键词的关键词计数值;
第二查找单元501,用于查找关键词与类目路径计数表确定关键词在类目路径下的出现次数的第一计数值,在商品类目识别模型中的关键词计数表中查找关键词的出现次数的第二计数值,及在商品类目识别模型中的类目路径计数表中查找类目路径下的商品标题的总数的第三计数值,关键词计数表中包含每个关键词的总的出现次数的计数值,类目路径计数表中包含每个类目路径下的总的商品标题的计数值;
第四计算单元502,用于利用第一计数值、第二计数值及第三计数值计算关键词在类目路径下的关键词计数值。
在本发明实施例中,第四计算单元502包含:
第五计算单元503,用于将第二计数值与预置的第一参数的乘积与第三计数值与预置的第二参数的乘积的和作为第四计数值;
第六计算单元504,用于将第一计数值除以第四计数值得到的商作为关键词在类目路径下的关键词计数值。
在本发明实施例中,第一查找单元401确定包含用户输入的商品标题的关键词集合的类目路径的集合之后,第二计算单元404中的第二查找单元501查找关键词与类目路径计数表确定关键词在类目路径下的出现次数的第一计数值,在商品类目识别模型中的关键词计数表中查找关键词的出现次数的第二计数值,及在商品类目识别模型中的类目路径计数表中查找类目路径下的商品标题的总数的第三计数值,并有第四计算单元502利用第一计数值、第二计数值及第三计数值计算关键词在类目路径下的关键词计数值,其中,第四计算单元502计算关键词集合中的关键词在类目路径下的关键词计数值具体包括:第五计算单元503将第二计数值与预置的第一参数的乘积与第三计数值与预置的第二参数的乘积的和作为第四计数值;接着,第六计算单元504将第一计数值除以第四计数值得到的商作为关键词在类目路径下的关键词计数值。
在本发明实施例中,类目路径识别***在获取到用户输入的商品标题之后,能够利用商品类目识别模型确定用户输入的商品标题的类目路径,能够有效的实现商品标题的类目路径的识别,且不需要用户逐级设置商品标题的类目路径,节约用户的工作量及时间,且能够避免因用户错误操作导致的类目错误,有效的提高用户的体验。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上对本发明所提供的一种类目路径识别方法及***进行了详细介绍,对于本领域的一般技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种类目路径识别方法,其特征在于,包括:
获取用户输入的商品标题;
对所述商品标题进行分词处理,得到所述商品标题中的关键词集合;
根据所述关键词集合及预置的商品类目识别模型确定所述商品标题的类目路径。
2.根据权利要求1所述的类目路径识别方法,其特征在于,所述根据所述关键词集合及预置的商品类目识别模型确定所述商品标题的类目路径包括:
利用所述关键词集合查找所述商品类目识别模型中的关键词与类目路径计数表确定包含所述关键词集合的类目路径的集合,所述关键词与类目路径计数表中包含类目路径与关键词之间的对应关系,及所述关键词在对应的类目路径下的出现次数的计数值;
分别计算所述类目路径的集合中每一个类目路径的综合计数值;
选取所述类目路径的集合中综合计数值最大的类目路径作为所述商品标题的类目路径。
3.根据权利要求2所述的类目路径识别方法,其特征在于,所述分别计算所述类目路径的集合中的每一个类目路径的综合计数值包括:
分别对所述类目路径的集合中的每一个类目路径执行以下步骤:
分别计算所述关键词集合中的每一个关键词在所述类目路径下的关键词计数值;
计算得到的所述关键词集合中的关键词的关键词计数值的乘积,将所述乘积作为所述类目路径的综合计数值。
4.根据权利要求3所述的类目路径识别方法,其特征在于,所述分别计算所述关键词集合中的每一个关键词在所述类目路径下的关键词计数值包括:
分别对所述关键词集合中的每一个关键词执行以下步骤:
查找所述关键词与类目路径计数表确定所述关键词在所述类目路径下的出现次数的第一计数值,在所述商品类目识别模型中的关键词计数表中查找所述关键词的出现次数的第二计数值,及在所述商品类目识别模型中的类目路径计数表中查找所述类目路径下的商品标题的总数的第三计数值,所述关键词计数表中包含每个关键词的总的出现次数的计数值,所述类目路径计数表中包含每个类目路径下的总的商品标题的计数值;
利用所述第一计数值、所述第二计数值及所述第三计数值计算所述关键词在所述类目路径下的关键词计数值。
5.根据权利要求3所述的类目路径识别方法,其特征在于,所述利用所述第一计数值、所述第二计数值及所述第三计数值计算所述关键词在所述类目路径下的关键词计数值包括:
将所述第二计数值与预置的第一参数的乘积与所述第三计数值与预置的第二参数的乘积的和作为第四计数值;
将所述第一计数值除以所述第四计数值得到的商作为所述关键词在所述类目路径下的关键词计数值。
6.一种类目路径识别***,其特征在于,包括:
获取单元,用于获取用户输入的商品标题;
处理单元,用于在所述获取单元获取所述商品标题之后,对所述商品标题进行分词处理,得到所述商品标题中的关键词集合;
确定单元,用于在所述处理单元得到所述关键词集合之后,根据所述关键词集合及预置的商品类目识别模型确定所述商品标题的类目路径。
7.根据权利要求6所述的类目路径识别***,其特征在于,所述确定单元包括:
第一查找单元,用于在所述处理单元得到所述关键词集合之后,利用所述关键词集合查找所述商品类目识别模型中的关键词与类目路径计数表确定包含所述关键词集合的类目路径的集合,所述关键词与类目路径计数表中包含类目路径与关键词之间的对应关系,及所述关键词在对应的类目路径下的出现次数的计数值;
第一计算单元,用于在所述第一查找单元得到所述类目路径的集合之后,分别计算所述类目路径的集合中每一个类目路径的综合计数值;
选取单元,用于在所述第一计算单元得到所述类目路径的集中和每一个类目路径的综合计数值之后,选取所述类目路径的集合中综合计数值最大的类目路径作为所述商品标题的类目路径。
8.根据权利要求7所述的类目路径识别***,其特征在于,所述第一计算单元包括:第二计算单元及第三计算单元,且所述第二计算单元及第三计算单元将分别计算类目路径的集合中的每一个类目路径的综合计数值;
所述第二计算单元,用于分别计算所述关键词集合中的每一个关键词在所述类目路径下的关键词计数值;
所述第三计算单元,用于在第二计算单元得到所述关键词计数值之后,计算得到的所述关键词集合中的关键词的关键词计数值的乘积,将所述乘积作为所述类目路径的综合计数值。
9.根据权利要求8所述的类目路径识别***,其特征在于,所述第二计算单元包括:第二查找单元和第四计算单元,所述第二查找单元及所述第四计算单元用于计算所述关键词集合中的每一个关键词的关键词计数值;
所述第二查找单元,用于查找所述关键词与类目路径计数表确定所述关键词在所述类目路径下的出现次数的第一计数值,在所述商品类目识别模型中的关键词计数表中查找所述关键词的出现次数的第二计数值,及在所述商品类目识别模型中的类目路径计数表中查找所述类目路径下的商品标题的总数的第三计数值,所述关键词计数表中包含每个关键词的总的出现次数的计数值,所述类目路径计数表中包含每个类目路径下的总的商品标题的计数值;
所述第四计算单元,用于利用所述第一计数值、所述第二计数值及所述第三计数值计算所述关键词在所述类目路径下的关键词计数值。
10.根据权利要求9所述的类目路径识别***,其特征在于,所述第四计算单元包括:
第五计算单元,用于将所述第二计数值与预置的第一参数的乘积与所述第三计数值与预置的第二参数的乘积的和作为第四计数值;
第六计算单元,用于将所述第一计数值除以所述第四计数值得到的商作为所述关键词在所述类目路径下的关键词计数值。
CN201210572005.2A 2012-12-25 2012-12-25 一种类目路径识别方法及*** Active CN103902545B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201210572005.2A CN103902545B (zh) 2012-12-25 2012-12-25 一种类目路径识别方法及***
RU2015125959A RU2617921C2 (ru) 2012-12-25 2013-11-28 Способ и система распознания пути категории
PCT/CN2013/088002 WO2014101616A1 (en) 2012-12-25 2013-11-28 Method and system of category path recognition
US14/748,618 US20150294388A1 (en) 2012-12-25 2015-06-24 Method and system of category path recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210572005.2A CN103902545B (zh) 2012-12-25 2012-12-25 一种类目路径识别方法及***

Publications (2)

Publication Number Publication Date
CN103902545A true CN103902545A (zh) 2014-07-02
CN103902545B CN103902545B (zh) 2018-10-16

Family

ID=50993875

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210572005.2A Active CN103902545B (zh) 2012-12-25 2012-12-25 一种类目路径识别方法及***

Country Status (4)

Country Link
US (1) US20150294388A1 (zh)
CN (1) CN103902545B (zh)
RU (1) RU2617921C2 (zh)
WO (1) WO2014101616A1 (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105488136A (zh) * 2015-11-25 2016-04-13 北京京东尚科信息技术有限公司 选购热点标签的挖掘方法
CN106204053A (zh) * 2015-05-06 2016-12-07 阿里巴巴集团控股有限公司 信息类目错放识别方法和装置
CN107092600A (zh) * 2016-02-17 2017-08-25 阿里巴巴集团控股有限公司 一种信息识别方法及装置
CN107909424A (zh) * 2017-10-19 2018-04-13 北京京东尚科信息技术有限公司 一种实时干预搜索结果的方法和装置
CN108984554A (zh) * 2017-06-01 2018-12-11 北京京东尚科信息技术有限公司 用于确定关键词的方法和装置
CN109559191A (zh) * 2018-10-25 2019-04-02 平安科技(深圳)有限公司 网购类商品的销售控制方法、装置、电子设备及存储介质
CN109635198A (zh) * 2018-12-17 2019-04-16 杭州柚子街信息科技有限公司 在商品展示平台上呈现用户搜索结果的方法、装置、介质及电子设备
CN109978675A (zh) * 2017-12-22 2019-07-05 航天信息股份有限公司 一种税务监控方法和装置
CN110019798A (zh) * 2017-11-20 2019-07-16 航天信息股份有限公司 一种用于对进销项商品种类差异进行度量的方法及***
CN111178056A (zh) * 2020-01-02 2020-05-19 苏宁云计算有限公司 基于深度学习的文案生成方法、装置及电子设备
CN111353838A (zh) * 2018-12-21 2020-06-30 北京京东尚科信息技术有限公司 自动化校验商品类目的方法和装置
CN113779243A (zh) * 2021-08-16 2021-12-10 深圳市世强元件网络有限公司 一种商品自动分类方法、装置及计算机设备

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017092728A (ja) * 2015-11-11 2017-05-25 富士通株式会社 通信システム、基地局、制御局、制御局の制御方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050222987A1 (en) * 2004-04-02 2005-10-06 Vadon Eric R Automated detection of associations between search criteria and item categories based on collective analysis of user activity data
US20090125505A1 (en) * 2007-11-13 2009-05-14 Kosmix Corporation Information retrieval using category as a consideration
US20120109946A1 (en) * 2010-11-02 2012-05-03 Alibaba Group Holding Limited Determination of category information using multiple
CN102737057A (zh) * 2011-04-14 2012-10-17 阿里巴巴集团控股有限公司 一种商品类目信息的确定方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000003388A (ja) * 1998-06-16 2000-01-07 Hitachi Ltd 需要予測単位設定方法
RU2225031C2 (ru) * 2001-05-21 2004-02-27 Киракозов Сергей Николаевич Способ идентификации товаров на принадлежность к объектам экспортного контроля
US6826568B2 (en) * 2001-12-20 2004-11-30 Microsoft Corporation Methods and system for model matching
US20040260677A1 (en) * 2003-06-17 2004-12-23 Radhika Malpani Search query categorization for business listings search
US20100257171A1 (en) * 2009-04-03 2010-10-07 Yahoo! Inc. Techniques for categorizing search queries

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050222987A1 (en) * 2004-04-02 2005-10-06 Vadon Eric R Automated detection of associations between search criteria and item categories based on collective analysis of user activity data
US20090125505A1 (en) * 2007-11-13 2009-05-14 Kosmix Corporation Information retrieval using category as a consideration
US20120109946A1 (en) * 2010-11-02 2012-05-03 Alibaba Group Holding Limited Determination of category information using multiple
CN102456058A (zh) * 2010-11-02 2012-05-16 阿里巴巴集团控股有限公司 类目信息提供方法及装置
CN102737057A (zh) * 2011-04-14 2012-10-17 阿里巴巴集团控股有限公司 一种商品类目信息的确定方法及装置

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106204053A (zh) * 2015-05-06 2016-12-07 阿里巴巴集团控股有限公司 信息类目错放识别方法和装置
CN105488136B (zh) * 2015-11-25 2019-03-26 北京京东尚科信息技术有限公司 选购热点标签的挖掘方法
CN105488136A (zh) * 2015-11-25 2016-04-13 北京京东尚科信息技术有限公司 选购热点标签的挖掘方法
CN107092600A (zh) * 2016-02-17 2017-08-25 阿里巴巴集团控股有限公司 一种信息识别方法及装置
CN108984554A (zh) * 2017-06-01 2018-12-11 北京京东尚科信息技术有限公司 用于确定关键词的方法和装置
CN108984554B (zh) * 2017-06-01 2021-06-29 北京京东尚科信息技术有限公司 用于确定关键词的方法和装置
CN107909424A (zh) * 2017-10-19 2018-04-13 北京京东尚科信息技术有限公司 一种实时干预搜索结果的方法和装置
CN107909424B (zh) * 2017-10-19 2021-03-30 北京京东尚科信息技术有限公司 一种实时干预搜索结果的方法和装置
CN110019798B (zh) * 2017-11-20 2021-02-05 航天信息股份有限公司 一种用于对进销项商品种类差异进行度量的方法及***
CN110019798A (zh) * 2017-11-20 2019-07-16 航天信息股份有限公司 一种用于对进销项商品种类差异进行度量的方法及***
CN109978675A (zh) * 2017-12-22 2019-07-05 航天信息股份有限公司 一种税务监控方法和装置
CN109978675B (zh) * 2017-12-22 2022-06-07 航天信息股份有限公司 一种税务监控方法和装置
CN109559191A (zh) * 2018-10-25 2019-04-02 平安科技(深圳)有限公司 网购类商品的销售控制方法、装置、电子设备及存储介质
CN109635198B (zh) * 2018-12-17 2020-09-29 杭州柚子街信息科技有限公司 在商品展示平台上呈现用户搜索结果的方法、装置、介质及电子设备
CN109635198A (zh) * 2018-12-17 2019-04-16 杭州柚子街信息科技有限公司 在商品展示平台上呈现用户搜索结果的方法、装置、介质及电子设备
CN111353838A (zh) * 2018-12-21 2020-06-30 北京京东尚科信息技术有限公司 自动化校验商品类目的方法和装置
CN111178056A (zh) * 2020-01-02 2020-05-19 苏宁云计算有限公司 基于深度学习的文案生成方法、装置及电子设备
WO2021135319A1 (zh) * 2020-01-02 2021-07-08 苏宁云计算有限公司 基于深度学习的文案生成方法、装置及电子设备
CN113779243A (zh) * 2021-08-16 2021-12-10 深圳市世强元件网络有限公司 一种商品自动分类方法、装置及计算机设备

Also Published As

Publication number Publication date
RU2015125959A (ru) 2017-01-30
CN103902545B (zh) 2018-10-16
RU2617921C2 (ru) 2017-04-28
WO2014101616A1 (en) 2014-07-03
US20150294388A1 (en) 2015-10-15

Similar Documents

Publication Publication Date Title
CN103902545A (zh) 一种类目路径识别方法及***
CN108960719B (zh) 选品方法和装置以及计算机可读存储介质
CN106651542B (zh) 一种物品推荐的方法及装置
US11315164B2 (en) Complementary product recommendation systems
WO2019210695A1 (zh) 模型训练和业务推荐
US9418147B2 (en) Method and apparatus of determining product category information
CN101661487B (zh) 对信息项进行搜索的方法和***
CN110879864B (zh) 一种基于图神经网络和注意力机制的上下文推荐方法
WO2014015079A2 (en) Method and apparatus of recommending clothing products
CN110020128B (zh) 一种搜索结果排序方法及装置
CN102609422A (zh) 类目错放识别方法和装置
CN105095311B (zh) 推广信息的处理方法、装置及***
CN103116588A (zh) 一种个性化推荐方法及***
CN105893476A (zh) 智能问答方法、知识库优化方法及装置、智能知识库
CN113191838B (zh) 一种基于异质图神经网络的购物推荐方法及***
CN103778553A (zh) 一种商品属性推荐方法及***
CN103514255A (zh) 一种基于项目层次类别的协同过滤推荐方法
CN107133282B (zh) 一种改进的基于双向传播的评价对象识别方法
CN105138508A (zh) 一种基于偏好扩散的上下文推荐***
CN107679856A (zh) 基于交易的业务控制方法和装置
CN111680165B (zh) 信息匹配方法、装置、可读存储介质和电子设备
CN108920665A (zh) 基于网络结构和评论文本的推荐评分方法及装置
US20190205769A1 (en) Data Processing Method, Apparatus, Device and Computer Readable Storage Media
CN104951435A (zh) 聊天过程中智能显示关键词的方法及装置
CN107016589A (zh) 推荐产品的确定方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant