CN110309253A - 选品方法、装置和计算机可读存储介质 - Google Patents

选品方法、装置和计算机可读存储介质 Download PDF

Info

Publication number
CN110309253A
CN110309253A CN201810170587.9A CN201810170587A CN110309253A CN 110309253 A CN110309253 A CN 110309253A CN 201810170587 A CN201810170587 A CN 201810170587A CN 110309253 A CN110309253 A CN 110309253A
Authority
CN
China
Prior art keywords
article
temperature
data
target data
emotion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810170587.9A
Other languages
English (en)
Inventor
安旭
董浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201810170587.9A priority Critical patent/CN110309253A/zh
Publication of CN110309253A publication Critical patent/CN110309253A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0203Market surveys; Market polls

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Databases & Information Systems (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开提出一种选品方法、装置和计算机可读存储介质,涉及大数据技术领域。本公开的一种选品方法包括:从垂直数据源获取目标数据,垂直数据源包括垂直网站、论坛或贴吧中的一种或多种;确定与目标数据相关联的物品的热度;根据用户中符合垂直数据源的访问者画像的用户的比例确定物品的综合热度;根据物品的综合热度选品。通过这样的方法,能够从垂直数据源中获取数据进行分析,得到有针对访问者的物品热度,结合相同类型的访问者在***中的比例确定物品的综合热度,从而使得对物品的热度分析更有用户针对性,提高选品分析的可靠性。

Description

选品方法、装置和计算机可读存储介质
技术领域
本公开涉及大数据技术领域,特别是一种选品方法、装置和计算机可读存储介质。
背景技术
商品选品是商品销售领域不可忽视的重要内容。往往爆款商品能为商家带来不菲的利润,但是,如果某种或某类产品发生了滞销,则会为商家带来不小的损失,也不利于销售平台的持续发展。
相关技术中商家可能会倾向于根据网络热销情况选品,或根据之前的销售情况选品,但由于不同人群的消费情况不同,喜好也有差异,销售预期往往与实际情况有较大差异。
发明内容
本公开的一个目的在于提高选品分析的可靠性。
根据本公开的一个方面,提出一种选品方法,包括:从垂直数据源获取目标数据,垂直数据源包括垂直网站、论坛或贴吧中的一种或多种;确定与目标数据相关联的物品的热度;根据用户中符合垂直数据源的访问者画像的用户的比例确定物品的综合热度;根据物品的综合热度选品。
可选地,目标数据为将物品作为关键词从垂直数据源得到的数据;确定与目标数据中相关联的物品的热度包括:对目标数据进行情感分析,统计物品的情感得分;根据情感得分和数据的数据量确定物品的热度。
可选地,根据情感得分与数据量的关系确定物品的热度包括:统计目标数据中物品的情感得分,并与预定情感阈值比较;若情感得分大于预定情感阈值,则确定目标数据对物品为正面情感;根据具有正面情感的目标数据的数量和目标数据的总数据量确定物品的热度。
可选地,根据正面情感的文章数量和数据的数据量确定物品的热度包括:通过公式:
H=(PN/N)*logMN
确定物品的热度,其中,H为物品的热度,N为目标数据的总数据量,PN为目标数据中对物品为正面情感的数量,M为大于1的正数。
可选地,确定物品的综合热度包括:将热度与用户中符合访问者画像的用户所占比例的乘积作为物品的综合热度。
可选地,根据物品的综合热度选品包括以下一种或多种操作:选择综合热度高于预定综合热度下限的物品;按照综合热度从高到低的顺序选择物品;根据综合热度确定物品的选品量。
可选地,访问者画像包括访问者的年龄段;用户中符合访问者画像的用户包括用户中符合访问者的年龄段的用户。
通过这样的方法,能够从垂直数据源中获取数据进行分析,得到针对访问者的物品热度,结合相同类型的访问者在***中的比例确定物品的综合热度,从而使得对物品的热度分析更有用户针对性,提高选品分析的可靠性。
根据本公开的另一个方面,提出一种选品装置,包括:数据获取单元,被配置为从垂直数据源获取目标数据,垂直数据源包括垂直网站、论坛或贴吧中的一种或多种;热度确定单元,被配置为确定与目标数据相关联的物品的热度;综合热度确定单元,被配置为根据用户中符合垂直数据源的访问者画像的用户的比例确定物品的综合热度;选品单元,被配置为根据物品的综合热度选品。
可选地,数据获取单元被配置为将物品作为关键词从垂直数据源中获取目标数据;热度确定单元被配置为:对目标数据进行情感分析,统计物品的情感得分;统计目标数据中物品的情感得分,并与预定情感阈值比较;若情感得分大于预定情感阈值,则确定目标数据对物品为正面情感;根据具有正面情感的目标数据的数量和目标数据的总数据量确定物品的热度。
可选地,根据正面情感的文章数量和数据的数据量确定物品的热度包括:通过公式:
H=(PN/N)*logMN
确定物品的热度,其中,H为物品的热度,N为目标数据的总数据量,PN为目标数据中对物品为正面情感的数量,M为大于1的正数。
可选地,综合热度确定单元被配置为将热度与用户中符合访问者画像的用户所占比例的乘积作为物品的综合热度。
可选地,选品单元被配置为执行以下一种或多种操作:选择综合热度高于预定综合热度下限的物品;按照综合热度从高到低的顺序选择物品;根据综合热度确定物品的选品量。
根据本公开的又一个方面,提出一种选品装置,包括:存储器;以及耦接至存储器的处理器,处理器被配置为基于存储在存储器的指令执行上文中任意一种选品方法。
这样的装置能够从垂直数据源中获取数据进行分析,得到针对访问者的物品热度,结合相同类型的访问者在***中的比例确定物品的综合热度,从而使得对物品的热度分析更有用户针对性,提高选品分析的可靠性。
根据本公开的再一个方面,提出一种计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现上文中任意一种选品方法的步骤。
这样的计算机可读存储介质通过执行其上的指令,能够从垂直数据源中获取数据进行分析,得到针对访问者的物品热度,结合相同类型的访问者在***中的比例确定物品的综合热度,从而使得对物品的热度分析更有用户针对性,提高选品分析的可靠性。
附图说明
此处所说明的附图用来提供对本公开的进一步理解,构成本公开的一部分,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。在附图中:
图1为本公开的选品方法的一个实施例的流程图。
图2为本公开的选品方法中确定物品的热度的一个实施例的流程图。
图3为本公开的选品方法的另一个实施例的流程图。
图4为本公开的选品装置的一个实施例的示意图。
图5为本公开的选品装置的另一个实施例的示意图。
图6为本公开的选品装置的又一个实施例的示意图。
具体实施方式
下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
本公开的选品方法的一个实施例的流程图如图1所示。
在步骤101中,从垂直数据源获取目标数据,垂直数据源包括垂直网站、论坛或贴吧中的一种或多种。由于垂直数据源往往会具有一个或一类主题,其用户群体具有一定的特色,如具有一定的年龄特征、喜好特征或身份特征等。在一个实施例中,可以有针对性的为每个或几个垂直数据源生成访问者画像。在一个实施例中,目标数据为将物品作为关键词从垂直数据源得到的数据。
在步骤102中,确定与目标数据相关联的物品的热度。在一个实施例中,可以根据垂直数据源中与需要的物品相关的目标数据的数据量确定物品的热度。
在步骤103中,根据热度和用户中符合垂直数据源的访问者画像的用户的数量确定物品的综合热度。由于不同的人群其购物渠道、平台也会不同,因此在得到物品在垂直数据源中的热度后,还需要确定垂直数据源的访问者从本平台或商家购物的可能性。在一个实施例中,在热度相同的情况下,如果用户中符合垂直数据源的访问者画像的用户的数量越多,则综合热度越高;如果用户中符合垂直数据源的访问者画像的用户的数量越少,则综合热度越低。
在步骤104中,根据物品的综合热度选品。在一个实施例中,可以按照热度值从高到低的顺序选品,优先选择热度值高的物品进货和销售。在另一个实施例中,可以设定预定热度值下限,只选择热度值高于预定热度值下限的物品;在又一个实施例中,还可以根据热度值确定选品量,如热度值高的增加进货量,热度值低的减少进货量或者不进货。
通过这样的方法,能够从垂直数据源中获取数据进行分析,得到有针对访问者的物品热度,结合相同类型的访问者在***中的比例确定物品的综合热度,从而使得对物品的热度分析更有用户针对性,提高选品分析的可靠性。
本公开的选品方法中确定物品的热度的一个实施例的流程图如图2所示。
在步骤201中,对目标数据进行情感分析,统计物品的情感得分。在一个实施例中,可以通过语义分析得到用户对于物品的态度,如设置正面或反面情感的关键词及其情感程度(如质量好、可以、还行)、设置反向词(如不、非、但是),以及程度词(如非常、很、尤其)等,通过分析匹配得到物品的情感得分。
在一个实施例中,可以采用如SVM(Support Vector Machine,支持向量机)的方案对目标数据做情感正负面分类。准备一个情感词典以及标记好情感的训练语料,为训练语料做词性标注,定义情感词语组(比如程度副词+情感词,否定词+情感词等),进而在目标数据中匹配每个句子中所有情感词语组。计算句子中所有情感词语组的情感正负得分。并计算整个句子的情感正负得分,可以参考公式:
NegNum_Neg*ScoreA_D*ScoreE
确定情感得分,其中Neg为否定词,Num_Neg为否定词出现的次数,ScoreA_D为程度副词在情感词典中的分数,ScoreE为情感词在情感词典中的分数。句子的情感正负得分是所有情感词语组的情感得分之和。
在步骤202中,将物品的情感得分与预定情感阈值比较。若物品的情感得分低于预定情感阈值,则认为目标数据对于该物品为负面情感,并不受到访问者的欢迎,可以不做考虑,或者避免考虑该物品;若物品的情感得分高于预定情感阈值,则执行步骤204。
在步骤203中,认为目标数据对于该物品为正面情感,该物品是可以作为备选的物品,执行步骤205。
在步骤204中,根据正面情感的文章数量和所述数据的数据量确定物品的热度。
在一个实施例中,可以通过公式:
H=(PN/N)*logMN
确定物品的热度,其中,H为物品的热度,N为目标数据的总数据量,如跟帖数、文章数或评论条数,PN为目标数据中对物品为正面情感的数量,M为大于1的正数(如10,或自然常数e)。这样计算的热度一方面能够反应物品的受欢迎程度,另一方面也能够将目标数据的本身数据量纳入考虑范围内,提高物品热度对物品受欢迎程度的反映的准确性。
通过这样的方法,不仅能够考虑到关于物品的讨论量,还能够针对目标数据进行情感分析,得到垂直数据源的访问用户对于物品的情感态度,进而通过量化的运算得到物品的热度,计算结果直观、准确,从而提高热度计算的可靠性。
在一个实施例中,在认为具有负面情感的访问者对具有正面情感的访问者不会产生影响的情况下(即已经购买者不会因为他人说不好而改变看法),可以忽略情感得分低于预定情感阈值的数据,通过上文图2所示实施例中的方法计算热度,提高运算的效率。
在另一个实施例中,在认为具有负面情感的访问者对具有正面情感的访问者会产生影响的情况下(即持正面态度的用户可能会因为他人说不好而改变看法),则可以综合考虑所有目标数据的情感得分,得到平均结果,再基于目标数据的总量得到物品的热度,从而能够考虑到不同的访问者之间所产生的影响,进一步提高热度计算的可靠度。
在一个实施例中,可以设定第一预定情感阈值和第二预定情感阈值,若情感得分大于第一预定情感阈值,则认为情感为正面情感;若情感得分小于第二预定情感阈值,则认为情感为负面情感,若情感得分在第一预定情感阈值和第二预定情感阈值之间,则认为情感为中性情感。在一个实施例中,第一、第二预定情感阈值可以根据训练语料使用交叉验证的方法取最优值。通过这样的方法,能够实现对物品情感的更细的划分,有利于提高热度计算的准确性和全面性。
本公开的选品方法的另一个实施例的流程图如图3所示。
在步骤301中,确定物品名称。在一个实施例中,可以先确定选品范围,在选品范围内挑选物品进行检索。
在步骤302中,将物品作为关键词从垂直数据源得到目标数据。在一个实施例中,可以将物品作为关键词在垂直数据源中进行检索,或爬取,得到目标数据。目标数据可以包括文章、评论、帖子等。
在一个实施例中,垂直数据源可以按照物品的使用范围进行选择,例如物品为运动装备,则可以选择运动论坛、贴吧等作为垂直数据源获取目标数据。
在一个实施例中,垂直数据源可以是具有时代特色的垂直网站、贴吧、论坛等,其用户具有范围较小的年龄区间,可以将其年龄范围,比如70后一代、80后一代、90后一代,作为用户画像。
在步骤303中,根据目标数据确定物品的热度。在一个实施例中,可以先在每篇文章、每个帖子、每条评论中对物品进行情感分析,得到情感得分,进而采用如上文中任意实施例中的方式确定物品的热度。
在步骤304中,统计用户中符合画像的用户所占比例。在一个实施例中,可以对用户画像进行分析,如利用历史销售数据或平台注册信息分析用户特点,将用户画像与垂直数据源的访问者画像进行匹配,得到相匹配的用户在全部用户中所占的比例,或在全部用户中的消费所占比例。
在步骤305中,将用户所占比例与热度的乘积作为物品的综合热度。如物品的热度为H,在用户中符合访问者画像的用户所占比例、或消费金额所占比例为α,则综合热度为α*H。这样的处理方式在考虑到物品本身热度的同时,也考虑到其用户的消费能力、消费意愿和购买的可能性,从而使综合热度能够更好的反映物品被购买的可能性。
在步骤306中,根据物品的综合热度选品。
通过这样的方法,能够根据需要确定物品,并获得对应的目标数据,进一步得到商品的热度,并结合用户分布得到综合热度,从而能够从物品热度和用户分布两个角度估计物品的销售情况,提高选品分析的可靠性。另外,由于不同年龄段的用户购买的物品和习惯相差较大,因此选择具有时代特色的垂直数据源进行物品热度计算,以及结合对应年龄段的用户所占比例确定综合热度,能够给出具有时代特色的选品方案,进一步提高选品的可靠性。
本公开的选品装置的一个实施例的示意图如图4所示。数据获取单元401能够从垂直数据源获取目标数据,垂直数据源包括垂直网站、论坛或贴吧中的一种或多种。热度确定单元403能够确定与目标数据相关联的物品的热度。在一个实施例中,可以根据垂直数据源中与需要的物品相关的目标数据的数据量确定物品的热度。综合热度确定单元404能够根据热度和用户中符合垂直数据源的访问者画像的用户的数量确定物品的综合热度。由于不同的人群其购物渠道、平台也会不同,因此在得到物品在垂直数据源中的热度后,还需要确定垂直数据源的访问者从本平台或商家购物的可能性。选品单元405能够根据物品的综合热度选品。在一个实施例中,可以按照热度值从高到低的顺序选品,优先选择热度值高的物品进货和销售。在另一个实施例中,可以设定预定热度值下限,只选择热度值高于预定热度值下限的物品;在又一个实施例中,还可以根据热度值确定选品量,如热度值高的增加进货量,热度值低的减少进货量或者不进货。
这样的装置能够从垂直数据源中获取数据进行分析,得到针对访问者的物品热度,结合相同类型的访问者在***中的比例确定物品的综合热度,从而使得对物品的热度分析更有用户针对性,提高选品分析的可靠性。
在一个实施例中,如图4所示,选品装置还可以包括画像确定单元402,能够确定垂直数据源的访问者画像,访问者画像可以包括访问者的身份特征、年龄段、爱好等信息。画像确定单元402可以将访问者画像提供给综合热度确定单元404确定用户中符合垂直数据源的访问者画像的用户的数量或所占比例,从而能够从物品热度和用户分布两个角度估计物品的销售情况,提高选品分析的可靠性。
在一个实施例中,数据获取单元401能够将物品作为关键词从垂直数据源得到目标数据。在一个实施例中,可以将物品作为关键词在垂直数据源中进行检索,或爬取,得到目标数据。目标数据可以包括文章、评论、帖子等。热度确定单元402能够采用上文中任意一种方式确定物品的热度,从而不仅能够考虑到关于物品的讨论量,还能够针对目标数据进行情感分析,得到处置数据源的访问用户对于物品的情感态度,进而通过量化的运算得到物品的热度,计算结果直观、准确,从而提高热度计算的可靠性。
在一个实施例中,综合热度确定单元404能够统计,将用户中符合垂直数据源的访问者画像的用户所占比例与热度确定单元402确定的热度的乘积作为物品的综合热度。如物品的热度为H,在购买用户中符合访问者画像的用户所占比例、或消费金额所占比例为α,则综合热度为α*H。这样的处理方式在考虑到物品本身热度的同时,也考虑到其用户的消费能力、消费意愿和购买的可能性,从而使综合热度能够更好的反映物品被购买的可能性。
本公开选品装置的一个实施例的结构示意图如图5所示。选品装置包括存储器501和处理器502。其中:存储器501可以是磁盘、闪存或其它任何非易失性存储介质。存储器用于存储上文中选品方法的对应实施例中的指令。处理器502耦接至存储器501,可以作为一个或多个集成电路来实施,例如微处理器或微控制器。该处理器502用于执行存储器中存储的指令,能够使得对物品的热度分析更有用户针对性,提高选品分析的可靠性。
在一个实施例中,还可以如图6所示,选品装置600包括存储器601和处理器602。处理器602通过BUS总线603耦合至存储器601。该选品装置600还可以通过存储接口604连接至外部存储装置605以便调用外部数据,还可以通过网络接口606连接至网络或者另外一台计算机***(未标出)。此处不再进行详细介绍。
在该实施例中,通过存储器存储数据指令,再通过处理器处理上述指令,能够使得对物品的热度分析更有用户针对性,提高选品分析的可靠性。
在另一个实施例中,一种计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现选品方法对应实施例中的方法的步骤。本领域内的技术人员应明白,本公开的实施例可提供为方法、装置、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开实施例的方法、设备(***)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
至此,已经详细描述了本公开。为了避免遮蔽本公开的构思,没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述,完全可以明白如何实施这里公开的技术方案。
可能以许多方式来实现本公开的方法以及装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法以及装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
最后应当说明的是:以上实施例仅用以说明本公开的技术方案而非对其限制;尽管参照较佳实施例对本公开进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本公开的具体实施方式进行修改或者对部分技术特征进行等同替换;而不脱离本公开技术方案的精神,其均应涵盖在本公开请求保护的技术方案范围当中。

Claims (14)

1.一种选品方法,包括:
从垂直数据源获取目标数据,所述垂直数据源包括垂直网站、论坛或贴吧中的一种或多种;
确定与所述目标数据相关联的物品的热度;
根据用户中符合所述垂直数据源的访问者画像的用户的比例确定物品的综合热度;
根据物品的所述综合热度选品。
2.根据权利要求1所述的方法,其中,所述目标数据为将物品作为关键词从所述垂直数据源得到的数据;
所述确定与所述目标数据中相关联的物品的热度包括:
对所述目标数据进行情感分析,统计所述物品的情感得分;
根据所述情感得分和所述数据的数据量确定物品的热度。
3.根据权利要求2所述的方法,其中,所述根据所述情感得分与数据量的关系确定物品的热度包括:
统计所述目标数据中物品的情感得分,并与预定情感阈值比较;
若所述情感得分大于所述预定情感阈值,则确定所述目标数据对所述物品为正面情感;
根据具有正面情感的目标数据的数量和目标数据的总数据量确定物品的热度。
4.根据权利要求3所述的方法,其中,所述根据正面情感的文章数量和所述数据的数据量确定物品的热度包括:
通过公式:
H=(PN/N)*logMN
确定物品的热度,其中,H为物品的热度,N为目标数据的总数据量,PN为所述目标数据中对所述物品为正面情感的数量,M为大于1的正数。
5.根据权利要求4所述的方法,其中,所述确定物品的综合热度包括:
将用户中符合所述访问者画像的用户所占比例与所述热度的乘积作为所述物品的综合热度。
6.根据权利要求1所述的方法,其中,所述根据物品的所述综合热度选品包括以下一种或多种操作:
选择所述综合热度高于预定综合热度下限的物品;
按照所述综合热度从高到低的顺序选品物品;
根据所述综合热度确定物品的选品量。
7.根据权利要求1所述的方法,其中,
所述访问者画像包括所述访问者的年龄段;
所述用户中符合所述访问者画像的用户包括用户中符合所述访问者的年龄段的用户。
8.一种选品装置,包括:
数据获取单元,被配置为从垂直数据源获取目标数据,所述垂直数据源包括垂直网站、论坛或贴吧中的一种或多种;
热度确定单元,被配置为确定与所述目标数据相关联的物品的热度;
综合热度确定单元,被配置为根据用户中符合所述垂直数据源的访问者画像的用户的比例确定物品的综合热度;
选品单元,被配置为根据物品的所述综合热度选品。
9.根据权利要求8所述的装置,其中,
所述数据获取单元被配置为将物品作为关键词从所述垂直数据源中获取目标数据;
所述热度确定单元被配置为:
对所述目标数据进行情感分析,统计所述物品的情感得分;
统计所述目标数据中物品的情感得分,并与预定情感阈值比较;
若所述情感得分大于所述预定情感阈值,则确定所述目标数据对所述物品为正面情感;
根据具有正面情感的目标数据的数量和目标数据的总数据量确定物品的热度。
10.根据权利要求9所述的装置,其中,所述根据正面情感的文章数量和所述数据的数据量确定物品的热度包括:
通过公式:
H=(PN/N)*logMN
确定物品的热度,其中,H为物品的热度,N为目标数据的总数据量,PN为所述目标数据中对所述物品为正面情感的数量,M为大于1的正数。
11.根据权利要求10所述的装置,其中,所述综合热度确定单元被配置为将用户中符合所述访问者画像的用户所占比例与所述热度的乘积作为所述物品的综合热度。
12.根据权利要求8所述的装置,其中,所述选品单元被配置为执行以下一种或多种操作:
选择所述综合热度高于预定综合热度下限的物品;
按照所述综合热度从高到低的顺序选择物品;
根据所述综合热度确定物品的选品量。
13.一种选品装置,包括:
存储器;以及
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器的指令执行如权利要求1至7任一项所述的方法。
14.一种计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现权利要求1至7任意一项所述的方法的步骤。
CN201810170587.9A 2018-03-01 2018-03-01 选品方法、装置和计算机可读存储介质 Pending CN110309253A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810170587.9A CN110309253A (zh) 2018-03-01 2018-03-01 选品方法、装置和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810170587.9A CN110309253A (zh) 2018-03-01 2018-03-01 选品方法、装置和计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN110309253A true CN110309253A (zh) 2019-10-08

Family

ID=68073276

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810170587.9A Pending CN110309253A (zh) 2018-03-01 2018-03-01 选品方法、装置和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110309253A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113763111A (zh) * 2021-02-10 2021-12-07 北京沃东天骏信息技术有限公司 物品搭配方法、装置及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102799587A (zh) * 2011-05-25 2012-11-28 腾讯科技(深圳)有限公司 一种论坛搜索方法和装置
CN103425767A (zh) * 2013-08-07 2013-12-04 北京搜狗信息服务有限公司 一种提示数据的确定方法和***
CN104572889A (zh) * 2014-12-24 2015-04-29 深圳市腾讯计算机***有限公司 一种搜索词推荐方法、装置和***
US20150135057A1 (en) * 2013-11-08 2015-05-14 Yahoo! Inc. Media Forums for Presenting and Managing User Generated Content Regarding Articles Presented on Websites
CN105096152A (zh) * 2014-05-20 2015-11-25 阿里巴巴集团控股有限公司 一种基于商品热度的操作执行方法及装置
CN105740353A (zh) * 2016-01-26 2016-07-06 中国人民解放军国防科学技术大学 个股和文章关联度的计算方法及其***
CN107153697A (zh) * 2017-05-08 2017-09-12 浙江敢尚网络科技有限公司 一种商品交易网站中的商品搜索方法和装置
CN107341176A (zh) * 2017-05-23 2017-11-10 北京三快在线科技有限公司 一种样本权重设置方法及装置,电子设备
CN107632989A (zh) * 2016-07-19 2018-01-26 阿里巴巴集团控股有限公司 一种商品对象选取、模型确定及使用热度确定方法与装置
CN107679904A (zh) * 2017-09-28 2018-02-09 山东浪潮云服务信息科技有限公司 一种推荐商品的方法及装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102799587A (zh) * 2011-05-25 2012-11-28 腾讯科技(深圳)有限公司 一种论坛搜索方法和装置
CN103425767A (zh) * 2013-08-07 2013-12-04 北京搜狗信息服务有限公司 一种提示数据的确定方法和***
US20150135057A1 (en) * 2013-11-08 2015-05-14 Yahoo! Inc. Media Forums for Presenting and Managing User Generated Content Regarding Articles Presented on Websites
CN105096152A (zh) * 2014-05-20 2015-11-25 阿里巴巴集团控股有限公司 一种基于商品热度的操作执行方法及装置
CN104572889A (zh) * 2014-12-24 2015-04-29 深圳市腾讯计算机***有限公司 一种搜索词推荐方法、装置和***
CN105740353A (zh) * 2016-01-26 2016-07-06 中国人民解放军国防科学技术大学 个股和文章关联度的计算方法及其***
CN107632989A (zh) * 2016-07-19 2018-01-26 阿里巴巴集团控股有限公司 一种商品对象选取、模型确定及使用热度确定方法与装置
CN107153697A (zh) * 2017-05-08 2017-09-12 浙江敢尚网络科技有限公司 一种商品交易网站中的商品搜索方法和装置
CN107341176A (zh) * 2017-05-23 2017-11-10 北京三快在线科技有限公司 一种样本权重设置方法及装置,电子设备
CN107679904A (zh) * 2017-09-28 2018-02-09 山东浪潮云服务信息科技有限公司 一种推荐商品的方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113763111A (zh) * 2021-02-10 2021-12-07 北京沃东天骏信息技术有限公司 物品搭配方法、装置及存储介质

Similar Documents

Publication Publication Date Title
US10726208B2 (en) Consumer insights analysis using word embeddings
CN111177569B (zh) 基于人工智能的推荐处理方法、装置及设备
Bell What is machine learning?
Wang et al. Effect of online review sentiment on product sales: The moderating role of review credibility perception
CN103377262B (zh) 对用户进行分组的方法和装置
US11315164B2 (en) Complementary product recommendation systems
US11182806B1 (en) Consumer insights analysis by identifying a similarity in public sentiments for a pair of entities
CN110532479A (zh) 一种信息推荐方法、装置及设备
US10685183B1 (en) Consumer insights analysis using word embeddings
CN103140868B (zh) 基于历史数据确定适用性的可能性
CN110428298A (zh) 一种店铺推荐方法、装置及设备
US10558759B1 (en) Consumer insights analysis using word embeddings
CN108537587A (zh) 流失用户预警方法、装置、计算机可读存储介质和服务器
US10509863B1 (en) Consumer insights analysis using word embeddings
US10803248B1 (en) Consumer insights analysis using word embeddings
KR102635928B1 (ko) 인터넷 밈 경제
CN110322300B (zh) 数据处理方法及装置、电子设备、存储介质
CN110413870A (zh) 商品推荐方法、装置及服务器
US20150026105A1 (en) Systems and method for determining influence of entities with respect to contexts
US11030539B1 (en) Consumer insights analysis using word embeddings
KR102266517B1 (ko) 사용자의 실행 패턴을 이용한 상품 추천 시스템, 사용자의 실행 패턴을 이용한 상품 추천 방법 및 이를 위한 장치
KR102464783B1 (ko) 소비자의 비정형 평가 정보를 이용한 소비자 니즈 분석 방법 및 장치
KR102097045B1 (ko) 사용자의 특성을 반영하여 상품을 추천하는 방법 및 장치
CN108153792A (zh) 一种数据处理方法和相关装置
CN107622413A (zh) 一种价格敏感度计算方法、装置及其设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination