CN103377190B - 一种基于交易平台的供应商信息搜索方法和装置 - Google Patents

一种基于交易平台的供应商信息搜索方法和装置 Download PDF

Info

Publication number
CN103377190B
CN103377190B CN201210105607.7A CN201210105607A CN103377190B CN 103377190 B CN103377190 B CN 103377190B CN 201210105607 A CN201210105607 A CN 201210105607A CN 103377190 B CN103377190 B CN 103377190B
Authority
CN
China
Prior art keywords
supplier
information
product
keyword
grouping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210105607.7A
Other languages
English (en)
Other versions
CN103377190A (zh
Inventor
陈智强
陈旭
顾海杰
何亮
王德胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Singapore Holdings Pte Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201210105607.7A priority Critical patent/CN103377190B/zh
Priority to TW101129964A priority patent/TW201342290A/zh
Priority to PCT/US2013/035910 priority patent/WO2013155144A1/en
Priority to JP2015505865A priority patent/JP2015513165A/ja
Priority to EP13718953.6A priority patent/EP2836978A1/en
Priority to US13/859,919 priority patent/US20130275269A1/en
Publication of CN103377190A publication Critical patent/CN103377190A/zh
Application granted granted Critical
Publication of CN103377190B publication Critical patent/CN103377190B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0639Item locations

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种基于交易平台的供应商信息搜索方法和装置,其中,所述供应商具有一个或多个产品分组信息,各产品分组信息分别具有对应的特征权参数,所述的方法包括:接收用户提交的供应商搜索请求,所述搜索请求中包括搜索关键词;在预置的供应商信息库中根据所述搜索关键词查找匹配的供应商产品分组信息;在所述匹配的供应商产品分组信息中,按照各自对应的特征权参数进行加权;对加权后的供应商产品分组信息进行排序,并提取相应的供应商信息返回给用户。本申请可以提供买家个性化搜索的功能,使买家能快速、简单地搜索到其所需的最佳供应商。

Description

一种基于交易平台的供应商信息搜索方法和装置
技术领域
本申请涉及交易平台数据处理的技术领域,特别是涉及一种基于交易平台的供应商信息搜索方法,以及,一种基于交易平台的供应商信息搜索装置。
背景技术
在因特网开放的网络环境下,基于网络通讯技术,买卖双方可不谋面地通过交易平台进行各种商贸活动,实现消费者的网上购物、商户之间的网上交易和在线电子支付,以及各种商务活动、交易活动、金融活动和相关的综合服务活动。目前,交易平台一般可分为企业对企业(Business-to-Business,B2B)、企业对消费者(Business-to-Customer,B2C)、消费者对消费者(Customer-to-Customer,C2C)等模式。近几年来,国内交易平台迅速发展,各种B2B、C2C、B2C模式的交易平台(俗称购物网站),如淘宝网、当当网、卓越亚马逊、拍拍网、京东商城等,已被用户认可和接受。
在电子交易平台中,卖家可以通过自己的主页发布所供应的产品信息,类目信息等,如果供应的产品种类和数目较多,卖家还可以对产品按照一定的规则进行分组。为了给买家更直观更形象的认识,方便供买家浏览,卖家可以在自己主页设置橱窗信息用来直接显示产品图片、名称等信息。
买家在采购产品时,可以在交易平台搜索和筛选满意的供应商以进行交易。采用现有技术,买家可以在预先知道供应商ID的情况下,在搜索栏内基于供应商ID进行搜索,获得对应供应商所经营产品的相关信息。然而在大多数情况下,买家只能使用自定义的查询词在交易平台搜索自己关心或欲购买的产品,再通过产品信息找到对应供应商的信息,获得该供应商所经营产品的相关信息。并且,采用此种方式获得的供应商往往不是最佳的供应商,还需要买家进一步进行人工筛选。
因此,目前需要本领域技术人员迫切解决的一个技术问题就是:提出一种全新的基于交易平台的供应商信息搜索机制,用以提供买家个性化搜索的功能,使买家能快速、简单地搜索到其所需的最佳供应商。
发明内容
本申请的目的是提供一种基于交易平台的供应商信息搜索方法和装置,用以提供买家个性化搜索的功能,使买家能快速、简单地搜索到其所需的最佳供应商。
为了解决上述问题,本申请公开了一种基于交易平台的供应商信息搜索方法,所述供应商具有一个或多个产品分组信息,各产品分组信息分别具有对应的特征权参数,所述的方法包括:
接收用户提交的供应商搜索请求,所述搜索请求中包括搜索关键词;
在预置的供应商信息库中根据所述搜索关键词查找匹配的供应商产品分组信息;
在所述匹配的供应商产品分组信息中,按照各自对应的特征权参数进行加权;
对加权后的供应商产品分组信息进行排序,并提取相应的供应商信息返回给用户。
优选的,所述特征权参数包括主营系数,所述各供应商的各产品分组信息的特征权参数通过以下步骤获得:
统计第一占比及第二占比,所述第一占比为供应商某产品分组中的产品数量占该供应商所有产品数量的百分比,所述第二占比为供应商某产品分组中带特征标识的产品数量占该供应商所有带该特征标识的产品数量的百分比;
采用第一权重对所述第一占比进行加权,采用第二权重对所述第二占比进行加权,其中,所述第二权重大于第一权重;
将所述加权后的第一占比及第二占比进行合计,获得当前供应商当前产品分组的主营系数。
优选的,所述特征标识为橱窗推荐标识。
优选的,所述预置的供应商信息库中包括供应商各产品分组信息对应的供应商信息关键词和供应商信息短语列表,其中,所述供应商信息关键词包括标题关键词,所述标题关键词通过获取各供应商各产品分组的产品标题信息,对所述产品标题信息进行分词获得;所述供应商信息短语列表通过获取各供应商各产品分组的产品标题信息,对所述产品标题信息进行分短语获得。
优选的,所述供应商信息关键词还包括分组名关键词,所述分组名关键词通过获取各供应商各产品分组的名称,对所述名称进行分词获得;
所述供应商信息关键词还包括类目关键词,所述类目关键词通过获取各供应商各产品的类目信息,并从所述类目信息中提取获得;其中,所述各供应商各产品的类目信息包括根目录描述信息以及叶子目录描述信息;
所述供应商信息关键词还包括属性关键词,所述属性关键词通过获取各供应商各产品的属性信息,并从所述属性信息中提取获得。
优选的,所述搜索关键词包括短语字段和单词字段,所述在预置的供应商信息库中根据搜索关键词查找匹配的供应商产品分组信息的步骤包括:
采用所述短语字段查询供应商信息短语列表,提取匹配的最相似的K个供应商产品分组信息为匹配的供应商产品分组信息;其中,所述K为预设的数量阈值;
若采用所述短语字段查询到的供应商产品分组信息为L个,且所述L<K,则进一步采用单词字段查询供应商信息关键词,提取匹配的最相似的K-L个供应商产品分组信息,所述L个供应商产品分组信息以及K-L个供应商产品分组信息组成匹配的供应商产品分组信息。
优选的,所述搜索关键词包括短语字段和单词字段,所述在预置的供应商信息库中根据搜索关键词查找匹配的供应商产品分组信息的步骤包括:
采用所述短语字段查询供应商信息短语列表,提取匹配的最相似的K个供应商产品分组信息为候选的供应商产品分组信息;其中,所述K为预设的数量阈值;
若采用所述短语字段查询到的供应商产品分组信息为L个,且所述L<K,则进一步采用单词字段查询供应商信息关键词,提取匹配的最相似的K-L个供应商产品分组信息,所述L个供应商产品分组信息以及K-L个供应商产品分组信息组成候选的供应商产品分组信息;
计算第一文本相似度,所述第一文本相似度为所述单词字段与候选供应商的产品分组信息的供应商信息关键词的文本相似度;
计算第二文本相似度,所述第二文本相似度为所述短语字段与相应候选供应商的产品分组信息的供应商信息短语列表的文本相似度;
根据所述第一文本相似度和第二文本相似度,从高到低选取预设数量的候选供应商产品分组信息为匹配的供应商产品分组信息。
本申请实施例还公开了一种基于交易平台的供应商信息搜索装置,所述供应商具有一个或多个产品分组信息,各产品分组信息分别具有对应的特征权参数,所述的装置包括:
请求接收模块,用于接收用户提交的供应商搜索请求,所述搜索请求中包括搜索关键词;
搜索模块,用于在预置的供应商信息库中根据所述搜索关键词查找匹配的供应商产品分组信息;
加权模块,用于在所述匹配的供应商产品分组信息中,按照各自对应的特征权参数进行加权;
反馈模块,用于对加权后的供应商产品分组信息进行排序,并提取相应的供应商信息返回给用户。
优选的,所述特征权参数包括主营系数,所述主营系数通过如下方式获得:
统计第一占比及第二占比,所述第一占比为供应商某产品分组中的产品数量占该供应商所有产品数量的百分比,所述第二占比为供应商某产品分组中带特征标识的产品数量占该供应商所有带该特征标识的产品数量的百分比;
采用第一权重对所述第一占比进行加权,采用第二权重对所述第二占比进行加权,其中,所述第二权重大于第一权重;
将所述加权后的第一占比及第二占比进行合计,获得当前供应商当前产品分组的主营系数。
优选的,所述预置的供应商信息库中包括供应商各产品分组信息对应的供应商信息关键词和供应商信息短语列表,其中,所述供应商信息关键词包括标题关键词,所述标题关键词通过获取各供应商各产品分组的产品标题信息,对所述产品标题信息进行分词获得;所述供应商信息短语列表通过获取各供应商各产品分组的产品标题信息,对所述产品标题信息进行分短语获得。
优选的,所述供应商信息关键词还包括分组名关键词,所述分组名关键词通过获取各供应商各产品分组的名称,对所述名称进行分词获得;
所述供应商信息关键词还包括类目关键词,所述类目关键词通过获取各供应商各产品的类目信息,并从所述类目信息中提取获得;其中,所述各供应商各产品的类目信息包括根目录描述信息以及叶子目录描述信息;
所述供应商信息关键词还包括属性关键词,所述属性关键词通过获取各供应商各产品的属性信息,并从所述属性信息中提取获得。
优选的,所述搜索关键词包括短语字段和单词字段,所述搜索模块包括:
第一提取子模块,用于采用所述短语字段查询供应商信息短语列表,提取匹配的最相似的K个供应商产品分组信息为匹配的供应商产品分组信息;其中,所述K为预设的数量阈值;
第二提取子模块,用于在采用所述短语字段查询到的供应商产品分组信息为L个,且所述L<K,则进一步采用单词字段查询供应商信息关键词时,提取匹配的最相似的K-L个供应商产品分组信息,所述L个供应商产品分组信息以及K-L个供应商产品分组信息组成匹配的供应商产品分组信息。
优选的,所述搜索关键词包括短语字段和单词字段,所述搜索模块包括:
第一候选信息提取子模块,用于采用所述短语字段查询供应商信息短语列表,提取匹配的最相似的K个供应商产品分组信息为候选的供应商产品分组信息;其中,所述K为预设的数量阈值;
第二候选信息提取子模块,用于在采用所述短语字段查询到的供应商产品分组信息为L个,且所述L<K,则进一步采用单词字段查询供应商信息关键词时,提取匹配的最相似的K-L个供应商产品分组信息,所述L个供应商产品分组信息以及K-L个供应商产品分组信息组成候选的供应商产品分组信息;
第一文本相似度计算子模块,用于计算第一文本相似度,所述第一文本相似度为所述单词字段与候选供应商的产品分组信息的供应商信息关键词的文本相似度;
第二文本相似度计算子模块,用于计算第二文本相似度,所述第二文本相似度为所述短语字段与相应候选供应商的产品分组信息的供应商信息短语列表的文本相似度;
匹配信息选取子模块,用于根据所述第一文本相似度和第二文本相似度,从高到低选取预设数量的候选供应商产品分组信息为匹配的供应商产品分组信息。
与现有技术相比,本申请包括以下优点:
本申请实施例可以只利用特征权参数进行搜索结果的排序,而无需采用如现有技术采用繁琐的搜索关键词与供应商产品信息的文本匹配算法,特征权参数的计算方法比较简单,并且可以提前计算好,因此,本申请可以非常有效地节省搜索时计算搜索结果的时间,从而提高搜索效率。
本申请综合供应商的相关信息计算出供应商主要经营哪些产品和供应商分组相应的主营系数,并用一组关键词来标识供应商的相应分组,这样在向买家提供供应商时,只要考虑到卖家的主营系数指标就可以了解供应商业务针对性的好坏,可为在向买家提供最佳供应商的过程中做预处理的功能,并根据主营系数在后台为买家计算出一批满足买家需求的最佳供应商,从而实现了买家个性化搜索的功能,使买家能快速、简单地搜索到其所需的最佳供应商。
附图说明
图1是本申请的一种基于交易平台的供应商信息搜索方法实施例的步骤流程图;
图2是本申请的一种示例中数据输入输出整体流向的示意图;
图3是本申请的一种示例中类目信息处理过程的示意图;
图4是本申请的一种示例中标题关键词处理过程的示意图;
图5是本申请的一种示例中属性关键词处理过程的示意图;
图6是本申请的一种示例中主营系数计算过程的示意图;
图7是本申请的一种示例中信息综合处理过程的示意图;
图8是本申请的一种基于交易平台的供应商信息搜索装置实施例的结构框图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
在交易平台中,供应商可以通过自己的主页发布所供应的产品信息,类目信息等,如果供应的产品种类和数目较多,供应商还可以对产品按照一定的规则进行分组。为了给买家更直观更形象的认识,方便供买家浏览,供应商还可以在自己主页设置橱窗信息用来直接显示产品图片、名称等信息。
现有技术在向买家提供优质供应商过程中,往往没有对供应商所卖产品的针对性进行考虑,即供应商主要经营哪些产品,所以提供给买家的供应商可能不是最佳的供应商,因为在交易平台中,有些供应商在供应或出售一些主要产品的同时,可能还提供一些额外的服务,但这些额外的服务往往并不是他们主营业务。所以针对那些购买额外服务产品的买家,如果向他们提供业务针对性差的卖家,可能会使买家的体验效果大打折扣。
为了解决这个问题,本专利发明人创造性提出本申请实施例的核心构思之一在于,综合供应商的相关信息计算出供应商主要经营哪些产品和供应商的各产品分组相应的主营系数,并用一组关键词来标识供应商的相应分组,这样在向买家提供供应商时,只要考虑到卖家的主营系数指标就可以了解供应商业务针对性的好坏,可为在向买家提供最佳供应商的过程中做预处理的功能,最终提升买家的体验效果。
参照图1,示出了本申请的一种基于交易平台的供应商信息搜索方法实施例的步骤流程图,具体可以包括如下步骤:
步骤101、接收用户提交的供应商搜索请求,所述搜索请求中包括搜索关键词;
步骤102、在预置的供应商信息库中根据所述搜索关键词查找匹配的供应商产品分组信息;
步骤103、在所述匹配的供应商产品分组信息中,按照各自对应的特征权参数进行加权;
步骤104、对加权后的供应商产品分组信息进行排序,并提取相应的供应商信息返回给用户。
在具体实现中,供应商在交易平台发布所供应的产品信息,形成产品信息集合,如果发布的产品信息较多,供应商可以进一步按照一定的规则对产品信息进行分组,即形成供应商的产品分组信息,一般而言,一个供应商有多个产品分组信息。这种供应商的产品分组信息是一种结构化信息,不同于通用检索的数据源(如***、***等搜索引擎采用的通用数据源)。供应商的产品分组信息是对供应商及其要卖的产品的描述,通常主要需要用到:供应商分组的主要关键词、供应商类型、供应商规模、供应商提供产品的类目、供应商提供的产品关键词等多个域的信息。
本申请实施例中,需要预先针对各供应商的各产品分组信息计算特征权参数,在本申请的一种优选实施例中,所述特征权参数包括主营系数,具体可以通过如下子步骤计算特征权参数:
子步骤S11、统计第一占比及第二占比,所述第一占比为供应商某产品分组中的产品数量占该供应商所有产品数量的百分比,所述第二占比为供应商某产品分组中带特征标识的产品数量占该供应商所有带该特征标识的产品数量的百分比;
作为本申请实施例具体应用的一种示例,所述特征标识可以为橱窗推荐标识。
子步骤S12、采用第一权重对所述第一占比进行加权,采用第二权重对所述第二占比进行加权,其中,所述第二权重大于第一权重;
子步骤S13、将所述加权后的第一占比及第二占比进行合计,获得当前供应商当前产品分组的主营系数。
所述预置的供应商信息库中包括供应商各产品分组信息对应的供应商信息关键词和供应商信息短语列表,其中,所述供应商信息关键词可以包括标题关键词,所述标题关键词可以通过获取各供应商各产品分组的产品标题信息,对所述产品标题信息进行分词获得;所述供应商信息短语列表可以通过获取各供应商各产品分组的产品标题信息,对所述产品标题信息进行分短语获得。
更为优选的是,为提供多样化的检索方式,如按分组名检索,所述供应商信息关键词还可以包括分组名关键词,所述分组名关键词可以通过获取各供应商各产品分组的名称,对所述名称进行分词获得;
进一步地,为提供多样化的检索方式,如按类目检索,所述供应商信息关键词还可以包括类目关键词,所述类目关键词可以通过获取各供应商各产品的类目信息,并从所述类目信息中提取获得;其中,所述各供应商各产品的类目信息包括根目录描述信息以及叶子目录描述信息;
更进一步地,为提供多样化的检索方式,如按属性检索,所述供应商信息关键词还可以包括属性关键词,所述属性关键词通过获取各供应商各产品的属性信息,并从所述属性信息中提取获得。
为使本领域技术人员更好地理解本申请,以下通过一个本申请实施例具体应用的示例进一步说明所述供应商各产品分组信息对应的供应商信息关键词和供应商信息短语列表的提取过程,以及,特征权参数的计算过程。
1、输入输出数据:
从供应商数据库获得输入数据一共有5张表格,分别表示类目信息、产品信息、属性信息、橱窗信息和分组信息。为了方便描述,假设表名和各个字段说明如以下表1所示:
表1:
输入数据字段说明:
(1)COMPANY_ID:供应商ID
(2)GROUP_ID:分组ID
(3)PRODUCT_ID:产品ID
(4)SUBJECT:产品名称
(5)CATEGORY_ROOT_ID:根类目ID
(6)CATEGORY_ROOT_DESC:根类目描述
(7)CATEGORY_LEAF_ID:叶子类目ID
(8)CATEGORY_LEAF_DESC:叶子类目描述
(9)ATTR_ID:属性ID
(10)ATTR_VALUE:属性值
(11)NAME:分组名称
应用本申请实施例进行供应商信息关键词和供应商信息短语列表提取以及主营系数计算后,生成输出数据表的各个字段如以下表2所示:
表2:
输出数据字段说明:
1)COMPANY_ID:供应商ID
2)GROUP_ID:分组ID
3)NAME_KEYWORDs:分组名关键词
4)CATEGORY_ROOT_IDs:根类目ID列表
5)CATEGORY_LEAF_IDs:叶子类目ID列表
6)CATEGORY_KEYWORDs:类目关键词列表
7)SUBJECT_KEYWORDs:标题关键词列表
8)ATTR_KEYWORDs:属性关键词列表
9)GROUP_SIZE:分组大小即该分组含有的产品数
10)SHOWCASE_SIZE:橱窗大小即该分组中在橱窗里的产品数
11)SCORE:主营系数
12)PHRASEs:供应商信息短语列表
2、数据处理流程
参考图2所示的数据输入输出整体流向的示意图,输入数据(5张表)经过类目信息处理、标题关键词处理、属性关键词处理、主营系数计算处理四个步骤后得到表CGC、表CGS、表CGA、表CGN,最后综合这四个表的信息得到主营建模最终结果,mixed_info为最终输出数据表,
(1)类目信息处理
参考图3所示的类目信息处理过程示意图,该过程利用叶子类目信息“CATEGORY_LEAF_ID”将“类目信息表”和“产品信息表”进行关联,从而获得各个产品的根类目信息和叶子类目信息,然后从根类目描述CATEGORY_ROOT_DESC和叶子类目描述ATEGORY_LEAF_DESC中提取类目关键词,具体可以为对CATEGORY_ROOT_DESC和ATEGORY_LEAF_DESC进行分词处理,获得类目关键词CATEGORY_KEYWORDs。
此过程可以获得包括如下字段内容的表CGC:供应商ID(COMPANY_ID);分组ID(GROUP_ID);根类目ID列表(CATEGORY_ROOT_IDs);叶子类目ID列表(CATEGORY_LEAF_IDs);类目关键词列表(CATEGORY_KEYWORDs)。
(2)标题关键词处理
参考图4所示的标题关键词处理过程示意图,该过程收集每个产品分组group下所有产品product的标题subject字段,并对subject字段进行分词和分短语,分词结果包含了关键词和该关键词出现频率的信息,分短语结果包含短语和短语出现频率信息。
此过程可以获得包括如下字段内容的表CGS:供应商ID(COMPANY_ID);分组ID(GROUP_ID);标题关键词列表(SUBJECT_KEYWORDs);根类目ID列表(CATEGORY_ROOT_IDs);供应商信息短语列表(PHRASEs)。
(3)属性关键词处理
参考图5所示的属性关键词处理过程示意图,该过程利用“产品ID”关联“产品信息表”及“属性信息表”,并对关联后的表进行分词处理和词频统计,最终得到供应商分组的“属性关键词”列表(含词频信息)。
此过程可以获得包括如下字段内容的表CGA:供应商ID(COMPANY_ID);分组ID(GROUP_ID);属性关键词列表(ATTR_KEYWORDs)。
(4)主营系数计算
参考图6所示的主营系数计算过程示意图,该过程利用“供应商ID”和“分组ID”关联“产品信息表”、“橱窗信息表”、“分组信息表”,计算每一个“供应商产品分组”的得分,并对分组的name字段进行分词。分词结果只包含关键词,不包含词频信息。
主营系数可以采用如下公式进行计算:
W1*P1+W2*P2
其中,P1表示该产品分组中产品数占该供应商产品总数的百分比;P2表示该分组包含橱窗产品数占该供应商所有橱窗产品总数的百分比。W1、W2分别表示P1和P2权重,其中,W2>W1,W2的优选取值为0.75,W1的优选取值为0.25。
此过程可以获得包括如下字段内容的表CGN:供应商ID(COMPANY_ID);分组ID(GROUP_ID);分组名关键词(NAME_KEYWORDs)分组大小(GROUP_SIZE),即该分组含有的产品数;橱窗大小(SHOWCASE_SIZE),即该分组中在橱窗里的产品数;主营系数(SCORE)。
(5)信息综合
参考图7所示的信息综合处理过程示意图,此前处理得到的SUBJECT_KEYWORDS、ATTR_KEYWORDS及PHRASEs中只包含了关键词和词组出现的频率,这里根据该频率除以对应的group_size获得百分比信息,利用“供应商ID”和“分组ID”关联以上计算所有信息即CGC、CGS、CGA、CGN4张表,最终得到主营建模的最终输出结果(表2)。
在步骤101中,所述用户提交的供应商搜索请求中的搜索关键词可以包括:用户提交的产品信息关键词;或者,用户提交的产品信息关键词和后台生成的产品信息关键词。
作为本申请实施例在交易平台的一种具体应用的示例,所述搜索请求中可以包括如下表所示的RFQ(Request For Quotation,买家在电子商务网站上填写的有关买家欲购买的产品信息,包括产品信息关键字、个性化指标等)字段的内容:
在本申请实施例中,用户可以仅提交基本的产品信息关键词作为搜索需求信息,根据用户提交的产品信息关键词,后台可以按一些规则处理为更为标准的产品信息关键词,之后再将这两类产品信息关键词一并处理。用户还可以如上例中提交更多的个性化指标作为搜索需求信息,在后续的搜索处理中,会将这些个性化指标作为供应商进一步筛选的条件。
在本申请实施例中,可以根据前台输入的RFQ信息中的关键词段进行分词获得搜索关键词。如果RFQ中指明的类目信息含有化学类目或医疗类目,则在分词处理中进行特殊处理,与其他行业分开进行分词处理,主要是利用化学词典进行分词;如果RFQ中类目信息为空,默认买家对类目没有任何要求。分词的结果有一系列的单词和一系列的词组,即所述分词后获得的搜索关键词可以包括:短语字段和单词字段。当然,在实际中,所述分词后获得的搜索关键词也可以仅包括单词字段。
所述预置的供应商信息库中可以包括供应商各产品分组信息对应的供应商信息关键词和供应商信息短语列表,在本申请的一种优选实施例中,在所述搜索关键词包括短语字段和单词字段时,所述步骤102具体可以包括如下子步骤:
子步骤S21、采用所述短语字段查询供应商信息短语列表,提取匹配的最相似的K个供应商产品分组信息为匹配的供应商产品分组信息;其中,所述K为预设的数量阈值;
子步骤S22、若采用所述短语字段查询到的供应商产品分组信息为L个,且所述L<K,则进一步采用单词字段查询供应商信息关键词,提取最相似的K-L个供应商产品分组信息,所述L个供应商产品分组信息以及K-L个供应商产品分组信息组成匹配的供应商产品分组信息。
作为本申请的另一种优选实施例,若所述搜索关键词字段仅包括单词字段,则所述步骤102可以包括如下子步骤:
子步骤S23、采用所述单词字段查询供应商信息关键词,提取匹配的最相似的K个供应商产品分组信息为匹配的供应商产品分组信息;其中,所述K为预设的数量阈值。
在本申请的另一种优选实施例中,在所述搜索关键词包括短语字段和单词字段时,所述步骤102具体可以包括如下子步骤:
子步骤S31、采用所述短语字段查询供应商信息短语列表,提取匹配的最相似的K个供应商产品分组信息为候选的供应商产品分组信息;其中,所述K为预设的数量阈值;
子步骤S32、若采用所述短语字段查询到的供应商产品分组信息为L个,且所述L<K,则进一步采用单词字段查询供应商信息关键词,提取匹配的最相似的K-L个供应商产品分组信息,所述L个供应商产品分组信息以及K-L个供应商产品分组信息组成候选的供应商产品分组信息;
子步骤S33、计算第一文本相似度,所述第一文本相似度为所述单词字段与候选供应商的产品分组信息的供应商信息关键词的文本相似度;
子步骤S34、计算第二文本相似度,所述第二文本相似度为所述短语字段与相应候选供应商的产品分组信息的供应商信息短语列表的文本相似度;
子步骤S35、根据所述第一文本相似度和第二文本相似度,从高到低选取预设数量的候选供应商产品分组信息为匹配的供应商产品分组信息。
作为本申请实施例一种具体应用的示例,可以采用如下计算方法进行文本相似度的计算:
RFQ中含有的RFQ_Name和RFQ_Comment是先经过分词以及复数变单数变换处理的,可以得到一系列的单词字段和短语字段,那么文本相似度分为两部分,分别为单词字段相似度和短语字段相似度。下面分别介绍这两部分的相似度计算方法。
(一)单词字段相似度:
供应商信息关键词和RFQ的相似度(第一文本相似度):
计算公式如下:
S i m i l a r i t y = &Sigma; i w e i g h t ( W i ) * p e r c e n t ( W i ) * N a m e O r C o m m e n t ( W i )
其中,weight(Wi)表示单词字段的属性所对应的权重;percent(Wi)表示单词字段在供应商的产品分组信息中所占的百分比;NameOrComment(Wi)表示与供应商信息关键词匹配的单词字段属于产品信息关键词的权重,取值为与供应商信息关键词匹配的单词字段属于用户提交的产品信息关键词的权重Name(Wi),或者,与供应商信息关键词匹配的单词字段属于后台生成的产品信息关键词的权重Comment(Wi);Name表示RFQ的标题subject的权重,comment表示是运营人员手工添加的字段的权重,这里可以根据这两种不同情况配置不同的权重。
(二)短语字段相似度
供应商信息短语列表和RFQ的相似度(第二文本相似度):
计算公式如下:
S i m i a l r i t y = &Sigma; i w e i g h t ( PH i ) * p e r c e n t ( PH i ) * N a m e O r C o m m e n t ( PH i )
其中,weight(PHi)表示短语字段的属性所对应的权重;percent(PHi)表示短语字段所占供应商的产品分组信息的百分比;NameOrComment(PHi)表示与供应商主要关键词匹配的短语字段属于产品信息关键词的权重,取值为与供应商主要关键词匹配的短语字段属于用户提交的产品信息关键词的权重Name(PHi),或者,与供应商主要关键词匹配的短语字段属于后台生成的产品信息关键词的权重Comment(PHi),Name表示RFQ的标题subject的权重,comment表示是运营人员手工添加的字段的权重,这里可以根据这两种不同情况配置不同的权重。
本申请实施例的相似度算法主要包括两个维度:文本相似度与主营系数,相似度分数是两者综合考察结果;其中,前面所述的文本相似度是从匹配的关键词类型的维度来划分的,可以包括单词字段的文本相似度与短语字段的文本相似度;本步骤中的主营系数是分组产品占比与分组在橱窗中的占比的一个综合指标,其在搜索时可以用来对产品分组进行加权。
当然,上述预置的供应商信息库的存储结构,以及,相应的查找与搜索关键词匹配的供应商产品分组信息的方式均仅仅用作示例,本领域技术人员根据实际情况任意选用即可,本申请对此无需加以限制。
在步骤103中,可以直接根据匹配的供应商产品分组信息对应的主营系数,对所述供应商分组信息进行排序;也可以根据所述第一文本相似度,第二文本相似度和主营系数计算所述匹配的供应商产品分组信息的分值,然后按该分值对所述供应商分组信息进行排序;作为本申请实施例具体应用的一种示例,可以采用如下公式计算匹配的供应商产品分组信息的分值:
Similarity=TextSimilarity*(1-Wm)+主管系数*Wm
其中,Wm是配置的主营系数的权重,TextSimilarity是文本相似度的得分。
在本申请的一种优选实施例中,所述特征属性参数还可以包括所述匹配的供应商产品分组信息的公共指标得分和个性化指标得分。
例如,所述公共指标得分可以采用如下公式进行计算:
Scorepublic=∑1P1*W1
其中,P1为供应商的活跃度,P2为供应商的报价响应度,W1、W2为各自所占的权重。
所述个性化指标得分可以通过如下公式进行计算:
Scorepersonalized=∑iScorei
当然,上述特征权参数的选用,以及,采用特征权参数作用于供应商产品分组信息搜索排序结果的方式仅仅用作示例,本申请对此无需加以限制。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
参照图8,示出了本申请的一种基于交易平台的供应商信息搜索装置实施例的结构框图,所述供应商具有一个或多个产品分组信息,各产品分组信息分别具有对应的特征权参数,本实施例具体可以包括如下模块:
请求接收模块801,用于接收用户提交的供应商搜索请求,所述搜索请求中包括搜索关键词;
搜索模块802,用于在预置的供应商信息库中根据所述搜索关键词查找匹配的供应商产品分组信息;
加权模块803,用于在所述匹配的供应商产品分组信息中,按照各自对应的特征权参数进行加权;
反馈模块804,用于对加权后的供应商产品分组信息进行排序,并提取相应的供应商信息返回给用户。
在本申请的一种优选实施例中,所述特征权参数包括主营系数,所述主营系数通过如下方式获得:
统计第一占比及第二占比,所述第一占比为供应商某产品分组中的产品数量占该供应商所有产品数量的百分比,所述第二占比为供应商某产品分组中带特征标识的产品数量占该供应商所有带该特征标识的产品数量的百分比;
其中,所述特征标识可以为橱窗推荐标识。
采用第一权重对所述第一占比进行加权,采用第二权重对所述第二占比进行加权,其中,所述第二权重大于第一权重;
将所述加权后的第一占比及第二占比进行合计,获得当前供应商当前产品分组的主营系数。
在本申请的一种优选实施例中,所述预置的供应商信息库中可以包括供应商各产品分组信息对应的供应商信息关键词和供应商信息短语列表,其中,所述供应商信息关键词可以包括标题关键词,所述标题关键词可以通过获取各供应商各产品分组的产品标题信息,对所述产品标题信息进行分词获得;所述供应商信息短语列表可以通过获取各供应商各产品分组的产品标题信息,对所述产品标题信息进行分短语获得。
为满足实际中更多的用户搜索需求,所述供应商信息关键词还可以包括分组名关键词,所述分组名关键词可以通过获取各供应商各产品分组的名称,对所述名称进行分词获得;
所述供应商信息关键词还可以包括类目关键词,所述类目关键词可以通过获取各供应商各产品的类目信息,并从所述类目信息中提取获得;其中,所述各供应商各产品的类目信息包括根目录描述信息以及叶子目录描述信息;
所述供应商信息关键词还可以包括属性关键词,所述属性关键词可以通过获取各供应商各产品的属性信息,并从所述属性信息中提取获得。
在本申请的一种优选实施例中,所述搜索关键词可以包括短语字段和单词字段,所述搜索模块802可以包括如下子模块:
第一提取子模块,用于采用所述短语字段查询供应商信息短语列表,提取匹配的最相似的K个供应商产品分组信息为匹配的供应商产品分组信息;其中,所述K为预设的数量阈值;
第二提取子模块,用于在采用所述短语字段查询到的供应商产品分组信息为L个,且所述L<K,则进一步采用单词字段查询供应商信息关键词时,提取匹配的最相似的K-L个供应商产品分组信息,所述L个供应商产品分组信息以及K-L个供应商产品分组信息组成匹配的供应商产品分组信息。
在本申请的另一种优选实施例中,所述搜索关键词可以包括短语字段和单词字段,所述搜索模块802可以包括如下子模块:
第一候选信息提取子模块,用于采用所述短语字段查询供应商信息短语列表,提取匹配的最相似的K个供应商产品分组信息为候选的供应商产品分组信息;其中,所述K为预设的数量阈值;
第二候选信息提取子模块,用于在采用所述短语字段查询到的供应商产品分组信息为L个,且所述L<K,则进一步采用单词字段查询供应商信息关键词时,提取匹配的最相似的K-L个供应商产品分组信息,所述L个供应商产品分组信息以及K-L个供应商产品分组信息组成候选的供应商产品分组信息;
第一文本相似度计算子模块,用于计算第一文本相似度,所述第一文本相似度为所述单词字段与候选供应商的产品分组信息的供应商信息关键词的文本相似度;
第二文本相似度计算子模块,用于计算第二文本相似度,所述第二文本相似度为所述短语字段与相应候选供应商的产品分组信息的供应商信息短语列表的文本相似度;
匹配信息选取子模块,用于根据所述第一文本相似度和第二文本相似度,从高到低选取预设数量的候选供应商产品分组信息为匹配的供应商产品分组信息。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本申请所提供的一种基于交易平台的供应商信息搜索方法和一种基于交易平台的供应商信息搜索装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (13)

1.一种基于交易平台的供应商信息搜索方法,其特征在于,所述供应商具有一个或多个产品分组信息,所述产品分组信息为针对供应商在交易平台发布所供应的产品信息形成产品信息集合,按照一定的规则对产品信息进行分组,形成的供应商的产品分组信息;各产品分组信息分别具有对应的特征权参数,所述的方法包括:
接收用户提交的供应商搜索请求,所述搜索请求中包括搜索关键词;
在预置的供应商信息库中根据所述搜索关键词查找匹配的供应商产品分组信息;
在所述匹配的供应商产品分组信息中,按照各自对应的特征权参数进行加权;
对加权后的供应商产品分组信息进行排序,并提取相应的供应商信息返回给用户。
2.根据权利要求1所述的基于交易平台的供应商信息搜索方法,其特征在于,所述特征权参数包括主营系数,所述各供应商的各产品分组信息的特征权参数通过以下步骤获得:
统计第一占比及第二占比,所述第一占比为供应商某产品分组中的产品数量占该供应商所有产品数量的百分比,所述第二占比为供应商某产品分组中带特征标识的产品数量占该供应商所有带该特征标识的产品数量的百分比;
采用第一权重对所述第一占比进行加权,采用第二权重对所述第二占比进行加权,其中,所述第二权重大于第一权重;
将所述加权后的第一占比及第二占比进行合计,获得当前供应商当前产品分组的主营系数。
3.根据权利要求2所述的基于交易平台的供应商信息搜索方法,其特征在于,所述特征标识为橱窗推荐标识。
4.根据权利要求1所述的基于交易平台的供应商信息搜索方法,其特征在于,所述预置的供应商信息库中包括供应商各产品分组信息对应的供应商信息关键词和供应商信息短语列表,其中,所述供应商信息关键词包括标题关键词,所述标题关键词通过获取各供应商各产品分组的产品标题信息,对所述产品标题信息进行分词获得;所述供应商信息短语列表通过获取各供应商各产品分组的产品标题信息,对所述产品标题信息进行分短语获得。
5.根据权利要求4所述的基于交易平台的供应商信息搜索方法,其特征在于,所述供应商信息关键词还包括分组名关键词,所述分组名关键词通过获取各供应商各产品分组的名称,对所述名称进行分词获得;
所述供应商信息关键词还包括类目关键词,所述类目关键词通过获取各供应商各产品的类目信息,并从所述类目信息中提取获得;其中,所述各供应商各产品的类目信息包括根目录描述信息以及叶子目录描述信息;
所述供应商信息关键词还包括属性关键词,所述属性关键词通过获取各供应商各产品的属性信息,并从所述属性信息中提取获得。
6.根据权利要求1、2、3、4或5所述的基于交易平台的供应商信息搜索方法,其特征在于,所述搜索关键词包括短语字段和单词字段,所述在预置的供应商信息库中根据搜索关键词查找匹配的供应商产品分组信息的步骤包括:
采用所述短语字段查询供应商信息短语列表,提取匹配的最相似的K个供应商产品分组信息为匹配的供应商产品分组信息;其中,所述K为预设的数量阈值;
若采用所述短语字段查询到的供应商产品分组信息为L个,且所述L<K,则进一步采用单词字段查询供应商信息关键词,提取匹配的最相似的K-L个供应商产品分组信息,所述L个供应商产品分组信息以及K-L个供应商产品分组信息组成匹配的供应商产品分组信息。
7.根据权利要求1、2、3、4或5所述的基于交易平台的供应商信息搜索方法,其特征在于,所述搜索关键词包括短语字段和单词字段,所述在预置的供应商信息库中根据搜索关键词查找匹配的供应商产品分组信息的步骤包括:
采用所述短语字段查询供应商信息短语列表,提取匹配的最相似的K个供应商产品分组信息为候选的供应商产品分组信息;其中,所述K为预设的数量阈值;
若采用所述短语字段查询到的供应商产品分组信息为L个,且所述L<K,则进一步采用单词字段查询供应商信息关键词,提取匹配的最相似的K-L个供应商产品分组信息,所述L个供应商产品分组信息以及K-L个供应商产品分组信息组成候选的供应商产品分组信息;
计算第一文本相似度,所述第一文本相似度为所述单词字段与候选供应商的产品分组信息的供应商信息关键词的文本相似度;
计算第二文本相似度,所述第二文本相似度为所述短语字段与相应候选供应商的产品分组信息的供应商信息短语列表的文本相似度;
根据所述第一文本相似度和第二文本相似度,从高到低选取预设数量的候选供应商产品分组信息为匹配的供应商产品分组信息。
8.一种基于交易平台的供应商信息搜索装置,其特征在于,所述供应商具有一个或多个产品分组信息,所述产品分组信息为针对供应商在交易平台发布所供应的产品信息形成产品信息集合,按照一定的规则对产品信息进行分组,形成的供应商的产品分组信息;各产品分组信息分别具有对应的特征权参数,所述的装置包括:
请求接收模块,用于接收用户提交的供应商搜索请求,所述搜索请求中包括搜索关键词;
搜索模块,用于在预置的供应商信息库中根据所述搜索关键词查找匹配的供应商产品分组信息;
加权模块,用于在所述匹配的供应商产品分组信息中,按照各自对应的特征权参数进行加权;
反馈模块,用于对加权后的供应商产品分组信息进行排序,并提取相应的供应商信息返回给用户。
9.根据权利要求8所述的基于交易平台的供应商信息搜索装置,其特征在于,所述特征权参数包括主营系数,所述主营系数通过如下方式获得:
统计第一占比及第二占比,所述第一占比为供应商某产品分组中的产品数量占该供应商所有产品数量的百分比,所述第二占比为供应商某产品分组中带特征标识的产品数量占该供应商所有带该特征标识的产品数量的百分比;
采用第一权重对所述第一占比进行加权,采用第二权重对所述第二占比进行加权,其中,所述第二权重大于第一权重;
将所述加权后的第一占比及第二占比进行合计,获得当前供应商当前产品分组的主营系数。
10.根据权利要求8所述的基于交易平台的供应商信息搜索装置,其特征在于,所述预置的供应商信息库中包括供应商各产品分组信息对应的供应商信息关键词和供应商信息短语列表,其中,所述供应商信息关键词包括标题关键词,所述标题关键词通过获取各供应商各产品分组的产品标题信息,对所述产品标题信息进行分词获得;所述供应商信息短语列表通过获取各供应商各产品分组的产品标题信息,对所述产品标题信息进行分短语获得。
11.根据权利要求10所述的基于交易平台的供应商信息搜索装置,其特征在于,所述供应商信息关键词还包括分组名关键词,所述分组名关键词通过获取各供应商各产品分组的名称,对所述名称进行分词获得;
所述供应商信息关键词还包括类目关键词,所述类目关键词通过获取各供应商各产品的类目信息,并从所述类目信息中提取获得;其中,所述各供应商各产品的类目信息包括根目录描述信息以及叶子目录描述信息;
所述供应商信息关键词还包括属性关键词,所述属性关键词通过获取各供应商各产品的属性信息,并从所述属性信息中提取获得。
12.根据权利要求8、9、10或11所述的基于交易平台的供应商信息搜索装置,其特征在于,所述搜索关键词包括短语字段和单词字段,所述搜索模块包括:
第一提取子模块,用于采用所述短语字段查询供应商信息短语列表,提取匹配的最相似的K个供应商产品分组信息为匹配的供应商产品分组信息;其中,所述K为预设的数量阈值;
第二提取子模块,用于在采用所述短语字段查询到的供应商产品分组信息为L个,且所述L<K,则进一步采用单词字段查询供应商信息关键词时,提取匹配的最相似的K-L个供应商产品分组信息,所述L个供应商产品分组信息以及K-L个供应商产品分组信息组成匹配的供应商产品分组信息。
13.根据权利要求8、9、10或11所述的基于交易平台的供应商信息搜索装置,其特征在于,所述搜索关键词包括短语字段和单词字段,所述搜索模块包括:
第一候选信息提取子模块,用于采用所述短语字段查询供应商信息短语列表,提取匹配的最相似的K个供应商产品分组信息为候选的供应商产品分组信息;其中,所述K为预设的数量阈值;
第二候选信息提取子模块,用于在采用所述短语字段查询到的供应商产品分组信息为L个,且所述L<K,则进一步采用单词字段查询供应商信息关键词时,提取匹配的最相似的K-L个供应商产品分组信息,所述L个供应商产品分组信息以及K-L个供应商产品分组信息组成候选的供应商产品分组信息;
第一文本相似度计算子模块,用于计算第一文本相似度,所述第一文本相似度为所述单词字段与候选供应商的产品分组信息的供应商信息关键词的文本相似度;
第二文本相似度计算子模块,用于计算第二文本相似度,所述第二文本相似度为所述短语字段与相应候选供应商的产品分组信息的供应商信息短语列表的文本相似度;
匹配信息选取子模块,用于根据所述第一文本相似度和第二文本相似度,从高到低选取预设数量的候选供应商产品分组信息为匹配的供应商产品分组信息。
CN201210105607.7A 2012-04-11 2012-04-11 一种基于交易平台的供应商信息搜索方法和装置 Active CN103377190B (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN201210105607.7A CN103377190B (zh) 2012-04-11 2012-04-11 一种基于交易平台的供应商信息搜索方法和装置
TW101129964A TW201342290A (zh) 2012-04-11 2012-08-17 基於交易平台的供應商資訊搜索方法和裝置
PCT/US2013/035910 WO2013155144A1 (en) 2012-04-11 2013-04-10 Searching supplier information based on transaction platform
JP2015505865A JP2015513165A (ja) 2012-04-11 2013-04-10 取引プラットフォームに基づく供給業者情報の検索
EP13718953.6A EP2836978A1 (en) 2012-04-11 2013-04-10 Searching supplier information based on transaction platform
US13/859,919 US20130275269A1 (en) 2012-04-11 2013-04-10 Searching supplier information based on transaction platform

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210105607.7A CN103377190B (zh) 2012-04-11 2012-04-11 一种基于交易平台的供应商信息搜索方法和装置

Publications (2)

Publication Number Publication Date
CN103377190A CN103377190A (zh) 2013-10-30
CN103377190B true CN103377190B (zh) 2017-01-18

Family

ID=48190607

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210105607.7A Active CN103377190B (zh) 2012-04-11 2012-04-11 一种基于交易平台的供应商信息搜索方法和装置

Country Status (6)

Country Link
US (1) US20130275269A1 (zh)
EP (1) EP2836978A1 (zh)
JP (1) JP2015513165A (zh)
CN (1) CN103377190B (zh)
TW (1) TW201342290A (zh)
WO (1) WO2013155144A1 (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8818978B2 (en) * 2008-08-15 2014-08-26 Ebay Inc. Sharing item images using a similarity score
CN103530299B (zh) * 2012-07-05 2017-04-12 阿里巴巴集团控股有限公司 一种搜索结果的生成方法及装置
JP2016038658A (ja) * 2014-08-06 2016-03-22 株式会社日立製作所 サプライヤ探索装置および探索方法
CN104299139A (zh) * 2014-08-27 2015-01-21 宁波搜布信息科技有限公司 一种面料交易***及方法
CN104299157A (zh) * 2014-08-27 2015-01-21 宁波搜布信息科技有限公司 一种面料交易***及方法
CN104299150A (zh) * 2014-08-27 2015-01-21 宁波搜布信息科技有限公司 一种基于移动客户端的面料交易***及方法
CN104331818A (zh) * 2014-10-30 2015-02-04 中英融贯资讯(武汉)有限公司 可控制差异化推送商户服务信息的方法及***
CN104408173B (zh) * 2014-12-11 2016-12-07 焦点科技股份有限公司 一种基于b2b平台的核心关键词自动提取方法
CN104636429B (zh) * 2014-12-24 2018-01-23 四川超凡知识产权服务股份有限公司 商标类别检索方法和装置
CN104765797A (zh) * 2015-03-26 2015-07-08 无线生活(杭州)信息科技有限公司 一种信息检索方法及装置
CN105808685B (zh) * 2016-03-02 2021-09-28 腾讯科技(深圳)有限公司 推广信息的推送方法及装置
CN105956896A (zh) * 2016-04-15 2016-09-21 郑州悉知信息科技股份有限公司 一种采购方法、服务器及终端设备
CN108241652A (zh) * 2016-12-23 2018-07-03 北京国双科技有限公司 关键词聚类方法及装置
CN108171586A (zh) * 2018-01-23 2018-06-15 北京值得买科技股份有限公司 一种商品聚类方法及装置
JP6968032B2 (ja) * 2018-06-05 2021-11-17 株式会社日立製作所 取引管理システム及び取引管理方法
CN109308662A (zh) * 2018-09-27 2019-02-05 北京亚联之星信息技术有限公司 一种数据匹配、数据处理方法及设备
US11328005B2 (en) 2018-10-05 2022-05-10 Accenture Global Solutions Limited Machine learning (ML) based expansion of a data set
CN110033350B (zh) * 2019-04-11 2022-03-22 苏州市黄道婆网络科技有限公司 一种纺织面料移动互联网交易平台
CN110119472A (zh) * 2019-05-22 2019-08-13 欧冶云商股份有限公司 应用于网络平台的钢产品检索方法及***
US20210233130A1 (en) * 2020-01-29 2021-07-29 Walmart Apollo, Llc Automatically determining the quality of attribute values for items in an item catalog
CN111400345A (zh) * 2020-02-21 2020-07-10 北京九州云动科技有限公司 支持多平台的商品搜索方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101819578A (zh) * 2010-01-25 2010-09-01 青岛普加智能信息有限公司 检索方法、索引建立方法和装置及检索***
CN102084363A (zh) * 2008-07-03 2011-06-01 加利福尼亚大学董事会 一种用于在结构化数据上高效地支持交互式模糊搜索的方法

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001350768A (ja) * 2000-06-08 2001-12-21 Dainippon Printing Co Ltd データベースシステム、販売店紹介システムおよび販売店紹介方法
JP2002189732A (ja) * 2000-12-21 2002-07-05 Sanyo Electric Co Ltd ユーザ支援装置およびシステム
US7263515B1 (en) * 2001-06-18 2007-08-28 I2 Technologies Us, Inc. Content enhancement in an electronic marketplace
JP2003228659A (ja) * 2002-02-05 2003-08-15 Dainippon Printing Co Ltd 商取引の支援方法/支援システム/支援装置
US20040015416A1 (en) * 2002-07-22 2004-01-22 Benjamin David Foster Seller configurable merchandising in an electronic marketplace
US20040015777A1 (en) * 2002-07-22 2004-01-22 International Business Machines Corporation System and method for sorting embedded content in Web pages
JP4296961B2 (ja) * 2003-09-09 2009-07-15 株式会社日立製作所 受注販売紹介方法、紹介情報サーバおよび記憶媒体
US20050119948A1 (en) * 2003-09-30 2005-06-02 Musgrove Timothy A. System and method for presenting a synthesized interface to a product catalog
US7814112B2 (en) * 2006-06-09 2010-10-12 Ebay Inc. Determining relevancy and desirability of terms
WO2008055204A2 (en) * 2006-10-31 2008-05-08 Dotted Pair, Inc. System and method for interacting with item catalogs
CN100498790C (zh) * 2007-02-06 2009-06-10 腾讯科技(深圳)有限公司 一种搜索方法和***
JP4858328B2 (ja) * 2007-06-19 2012-01-18 日本電気株式会社 電子商取引における購買支援システム、購買支援方法および購買支援用プログラム
US20090063304A1 (en) * 2007-08-29 2009-03-05 Anthony Meggs System and method for searching, identifying, and ranking merchants based upon preselected criteria such as social values
US20090132366A1 (en) * 2007-11-15 2009-05-21 Microsoft Corporation Recognizing and crediting offline realization of online behavior
US20090164265A1 (en) * 2007-12-20 2009-06-25 Ebay Inc. Auction profit optimization
US8131586B2 (en) * 2008-01-16 2012-03-06 Alvin Cordeiro Method and apparatus for personalized consumer to business matchmaking
US8762382B2 (en) * 2008-08-11 2014-06-24 Collective, Inc. Method and system for classifying text
US20100312648A1 (en) * 2009-01-10 2010-12-09 Ryan Gerome System and method for profile based search and correlation of customers, vendors, distributors, consultants and products
US8615707B2 (en) * 2009-01-16 2013-12-24 Google Inc. Adding new attributes to a structured presentation
US8239280B1 (en) * 2009-09-21 2012-08-07 Igor Feinberg Method, medium, and system for adjusting purchasing power values
US8219552B2 (en) * 2009-10-07 2012-07-10 International Business Machines Corporation Information theory based result merging for searching hierarchical entities across heterogeneous data sources
JP4958968B2 (ja) * 2009-12-22 2012-06-20 ヤフー株式会社 商品検索支援装置、方法及びプログラム
JP5050046B2 (ja) * 2009-12-28 2012-10-17 ヤフー株式会社 検索スコア演算装置及び方法
JP2011244318A (ja) * 2010-05-20 2011-12-01 Sharp Corp 使用メガネ識別装置、映像観賞システム、映像観賞用メガネ、使用メガネ識別プログラム、コンピュータ読み取り可能な記録媒体、及び表示装置
US9223476B2 (en) * 2010-07-02 2015-12-29 Ebay Inc. User-widget-based transaction system
US20120095993A1 (en) * 2010-10-18 2012-04-19 Jeng-Jye Shau Ranking by similarity level in meaning for written documents

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102084363A (zh) * 2008-07-03 2011-06-01 加利福尼亚大学董事会 一种用于在结构化数据上高效地支持交互式模糊搜索的方法
CN101819578A (zh) * 2010-01-25 2010-09-01 青岛普加智能信息有限公司 检索方法、索引建立方法和装置及检索***

Also Published As

Publication number Publication date
CN103377190A (zh) 2013-10-30
JP2015513165A (ja) 2015-04-30
TW201342290A (zh) 2013-10-16
WO2013155144A1 (en) 2013-10-17
US20130275269A1 (en) 2013-10-17
EP2836978A1 (en) 2015-02-18

Similar Documents

Publication Publication Date Title
CN103377190B (zh) 一种基于交易平台的供应商信息搜索方法和装置
Han et al. Artificial intelligence in business-to-business marketing: a bibliometric analysis of current research status, development and future directions
CN103309886B (zh) 一种基于交易平台的结构化信息搜索方法和装置
Riaz et al. Opinion mining on large scale data using sentiment analysis and k-means clustering
US10062098B2 (en) Recommendation engine
US8122061B1 (en) Systems and methods for information management using socially constructed graphs
CN103729359B (zh) 一种推荐搜索词的方法及***
US20160132800A1 (en) Business Relationship Accessing
JP6022056B2 (ja) 検索結果の生成
JP2016503914A (ja) 商品評価の分析
CN103577988A (zh) 一种识别特定用户的方法和装置
CN103309894B (zh) 基于用户属性的搜索实现方法及***
CN106326318B (zh) 搜索方法及装置
Chen et al. Evaluating the enhancement of corporate social responsibility websites quality based on a new hybrid MADM model
Salamzadeh et al. Media business models: A holistic approach
Zhao et al. Anatomy of a web-scale resale market: a data mining approach
CN106295972A (zh) 云智造定制品智能服务***及实现方法
Nastisin et al. Sustainable performance of players in the global aviation industry in the light of multi-factor analysis of online reputation
Wu et al. The Influence of E‐Marketing on Performance of Real Estate Enterprises: Based on Super‐Efficiency DEA and Grey Entropy Methods
CN117332247A (zh) 以大语言模型为媒介的大数据交易和质量评估方法及***
Alamsyah et al. A core of E-commerce customer experience based on conversational data using network text methodology
Shamim et al. Critical product features’ identification using an opinion analyzer
Tang et al. Service recommendation based on dynamic user portrait: an integrated approach
Iwashita A Framework of Matching Algorithm for Influencer Marketing
Wei et al. The Analysis of “Online Silk Road” from the Perspective of Big Data

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1186798

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1186798

Country of ref document: HK

TR01 Transfer of patent right

Effective date of registration: 20240228

Address after: # 01-21, Lai Zan Da Building 1, 51 Belarusian Road, Singapore

Patentee after: Alibaba Singapore Holdings Ltd.

Country or region after: Singapore

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Patentee before: ALIBABA GROUP HOLDING Ltd.

Country or region before: Cayman Islands

TR01 Transfer of patent right