CN105095396A - 模型创建方法、质量评估方法及装置 - Google Patents

模型创建方法、质量评估方法及装置 Download PDF

Info

Publication number
CN105095396A
CN105095396A CN201510387836.6A CN201510387836A CN105095396A CN 105095396 A CN105095396 A CN 105095396A CN 201510387836 A CN201510387836 A CN 201510387836A CN 105095396 A CN105095396 A CN 105095396A
Authority
CN
China
Prior art keywords
text
data
weight
model
calculated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510387836.6A
Other languages
English (en)
Inventor
谭龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201510387836.6A priority Critical patent/CN105095396A/zh
Publication of CN105095396A publication Critical patent/CN105095396A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

公开了一种创建用于评估商品质量的模型的方法以及装置。该方法包括计算样本集的每条样本数据中的各个候选关键词与商品质量的相关度,并且根据计算的相关度确定关键词库;结合确定的关键词库计算每个样本数据中的词在该样本中的权重;以及对计算的权重进行归一化,得到训练数据,并且利用训练数据进行训练以输出模型文件,所述模型文件用来描述通过训练得到的模型。利用上述方案,能够提高商品质量评估的准确率。

Description

模型创建方法、质量评估方法及装置
技术领域
本申请涉及数据挖掘技术,具体涉及一种基于文本的商品质量分析方法和装置以及相关的模型创建方法和装置。
背景技术
随着电子商务的兴起,网上购物已经越来越普及。这样,在服务提供商侧就累积了大量的数据需要进行处理。例如,对海量商品的评价、投诉、工单、退换货等文本数据收集、特征词计算,文本训练及质量分析,实现对商品质量的量化、以及假货的预测/识别,能高准确度的判定商品的质量,是整个运营中不可或缺乃至非常重要的一环。
在现有的技术中,使用人工建模,并根据分析结果不断完善模型的方式进行商品质量分析。例如,收集文本(商品评价、投诉、工单、退换货等)数据,然后对文本数据进行分词,去停用词、反义词。进而根据历史数据制定商品质量量化模型。在质量评估阶段,用指定的关键字与文本匹配,并根据模型依次计算指标数据,并且根据分析结果以及关键词命中情况优化关键词及量化模型。
但是,上述的方案中根据经验设置的文本匹配关键词,与商品质量的相关度相对较低。此外,通过历史数据制定的量化模型识别准确率低、变更频繁造成成本上升。并且,模型在高维情况下,文本向高维控件做映射,计算复杂性增加。在现有技术中用同步分析或多线程分析方式性能低,分析海量商品时不能满足业务要求。
发明内容
针对现有技术中的一个或多个问题,提出了一种创建用于评估商品质量的模型的方法、利用该模型评估商品质量的方法及装置。
在本发明的一个方面,提供了一种创建用于评估商品质量的模型的方法,包括步骤:计算样本集的每条样本数据中的各个候选关键词与商品质量的相关度,并且根据计算的相关度确定关键词库;结合确定的关键词库计算每个样本数据中的词在该样本中的权重;以及对计算的权重进行归一化,得到训练数据,并且利用训练数据进行训练以输出模型文件,所述模型文件用来描述通过训练得到的模型。
在本发明的另一方面,提供了一种创建用于评估商品质量的模型的装置,包括:计算样本集的每条样本数据中的各个候选关键词与商品质量的相关度,并且根据计算的相关度确定关键词库的装置;结合确定的关键词库计算每个样本数据中的词在该样本中的权重的装置;以及对计算的权重进行归一化,得到训练数据,并且利用训练数据进行训练以输出模型文件,所述模型文件用来描述通过训练得到的模型的装置。
在本发明的再一方面,提供了一种评估商品质量的方法,包括步骤:结合关键词库计算待评估商品的每条文本数据中的词在该文本中的权重;对计算的权重进行归一化,得到训练数据;基于得到的训练数据,利用创建的模型计算该商品对应的质量类别及概率。
在本发明的又一方面,提供了一种评估商品质量的装置,包括:结合关键词库计算待评估商品的每条文本数据中的词在该文本中的权重的装置;对计算的权重进行归一化,得到训练数据的装置;基于得到的训练数据,利用创建的模型计算该商品对应的质量类别及概率的装置。
根据上述方案,能够提供基于文本的商品质量分析的准确度和性能。此外,采用卡方统计动态计算用于匹配文本的关键词,大大提高关键词与商品质量的相关度。在其他例子中,对关键词进行反义词过滤,提高量化数据的准确性,对关键词库进行尺度转换,利于训练更好的模型。
另外,一些方案中使用SVM支持向量机,在高维特征空间采用线性算法对文本的非线性特征进行线性分析,应用核函数展开定理,降低计算复杂度。此外,可以运用分布式任务进行关键词计算、量化及质量分析能够快速、近实时分析海量商品的质量。
附图说明
为了更好地理解本发明,将根据以下附图对本发明进行详细描述:
图1示出了根据本发明实施例的网络结构的示意图;
图2示出了根据本发明实施例的服务器侧的结构示意图;
图3示出了根据本发明实施例的创建评估商品质量的模型的方法的流程图;以及
图4示出了根据本发明实施例的评估商品质量的方法的流程图。
具体实施方式
下面将详细描述本发明的具体实施例,应当注意,这里描述的实施例只用于举例说明,并不用于限制本发明。在以下描述中,为了提供对本发明的透彻理解,阐述了大量特定细节。然而,对于本领域普通技术人员显而易见的是:不必采用这些特定细节来实行本发明。在其他实例中,为了避免混淆本发明,未具体描述公知的结构、材料或方法。
在整个说明书中,对“一个实施例”、“实施例”、“一个示例”或“示例”的提及意味着:结合该实施例或示例描述的特定特征、结构或特性被包含在本发明至少一个实施例中。因此,在整个说明书的各个地方出现的短语“在一个实施例中”、“在实施例中”、“一个示例”或“示例”不一定都指同一实施例或示例。此外,可以以任何适当的组合和/或子组合将特定的特征、结构或特性组合在一个或多个实施例或示例中。此外,本领域普通技术人员应当理解,这里使用的术语“和/或”包括一个或多个相关列出的项目的任何和所有组合。
图1示出了根据本发明实施例的网络结构的示意图。如图1所示,用户通过手机之类的移动终端140和150上网,例如移动终端140和150通过基站160连接到电信网络170,进而通过网络170连接到服务提供商的服务器110。类似地,用户也可以通过台式机之类的计算机120上网。例如,台式机120通过路由器130之类的网元连接到电信网络170,进而连接到服务提供商的服务器110。这样,用户可以操作120/140或者150进行网络冲浪,在服务提供商的网站上进行网上购物等等。而在服务提供商侧,通过网络将商品展示在网络上,方便用户浏览和购买。当千千万万的用户进行网上购物时,就需要服务提供商对网上售出的商品的质量进行评估和监控。这涉及到海量数据的处理,需要以较高的准确率和较高的性能来进行这些数据的处理。
图2示出了根据本发明实施例的服务器侧的结构示意图。如图2所示,在图示的实施例中,实现对商品关联的文本进行分词,关键词计算、量化、尺度转换,模型训练及质量分析。下面在SKU维度的基础上进行描述,但是本领域的技术人员应该能够想到在其他的维度上实施本发明。
如图2所示,管理端UI201是方便服务提供商的管理人员操作的用户界面,例如进行数据的采集,发出进行质量分析的指示等等。此外,管理端UI还可以用来对关键词库进行调整或者设定过滤器,例如设置需要过滤掉的反义词等等。
定时器或用户(运营专员)202触发进行商品质量分析。协同工作单元204生成任务协调并分配给关键词计算单元205、词量化单元207、训练单元208以及质量分析单元214依次运行,每个单元均可分布式并行分析。每个单元都可找到对应的1个Master和多个Follow,如某一Master停止服务,且其他Follow会根据实例的闲忙情况选择一个Follow接替Master的任务,并获取最新的任务状态,保证装置可靠性及数据的一致性。
关键词计算单元205计算样本集的每条样本数据中的各个候选关键词与商品质量的相关度,并且根据计算的相关度确定关键词库。例如,关键词计算单元205利用卡方统计计算所有关键词(来源例如是:对所有样本数据的文本分词,去停用词、反义词)和商品质量的相关度,并从高到低排序、编号,并取前N个作为关键词库,使关键词库和商品质量高度相关。卡方统计是一种假设检验方法,利用独立性检验来考察两个变量是否有关系,并且量化这种判断的可靠程度。卡方统计公式如下:
K 2 = N * ( A D - B C ) 2 ( A + B ) * ( C + D ) * ( A + C ) * ( B + D )
SKU表示保存库存控制的最小可用单位,便于识别商品,如一款商品多色,则对应多个SKU。以SKU维度分析为例:
A为关键词在假货类别中,所有文本出现的次数;
B为关键词不在假货类别中,所有文本出现的次数
C为关键词在假货类别中,没有出现过的文本个数;
D为关键词不在假货类别中,没有出现过的文本个数;
N为样本数据的文本总数;
特征词计算、排序后数据格式如下表:
编号 特征词 卡方值
1 假货 57.18
2 次品 52.39
3 仿货 38.87
4 严重 32.66
5 有问题 16.30
词量化单元207结合确定的关键词库计算每个样本数据中的词在该样本中的权重。例如词量化单元207对每条样本数据(包含商品对应的质量类别:好、中、差)进行分词,去停用词、反义词,然后结合关键词库计算每个词在样本中的权重,计算公式:
Y i , j = ΣX i , j / N Σ k = 1 n X k , j ,
上式中,N为SKU对应的文本总数,分子为关键词在样本SKU中出现的频率(一个文本出现多次算一次),分母为关键词在其他类别中出现次数总和。
对样本数据量化数据格式如下表:
SKU 分类标记 特征编号 权重值 特征编号 权重值 特征编号 权重值
10001 A 2 0.81 6 0.61 10 0.01
10002 B 3 0.73 35 0.83 21 2.15
10003 A 5 1.11 78 1.23 156 0.28
10004
训练单元208对计算的权重进行归一化,得到训练数据,并且利用训练数据进行训练以输出模型文件,所述模型文件用来描述通过训练得到的模型。例如训练单元208先将词量化单元207生成的词量化数据进行尺度转换,统一量化值的范围(利于训练更好的模型),然后生成训练集209,得到模型文件210,所述模型文件用来描述通过训练得到的模型。在训练集209中,一条样本数据生成一条训练数据。
进行尺度转换后数据格式如下表:
SKU 分类标记 特征编号 权重值 特征编号 权重值 特征编号 权重值
10001 A 2 0.81 6 0.61 10 0.01
10002 B 3 0.73 35 0.83 21 0.85
10003 A 5 0.96 78 0.93 156 0.28
10004
例如,训练单元208使用SVM将训练集209训练成模型文件210并输出。SVM表示支持向量机,是一种可训练的机器学习方法。
在得到模型文件后,质量分析单元214读取商品文本数据,并使用和词量化单元、训练单元同样的方法生成文本训练数据,并根据训练出的模型通过SVM计算某个商品质量对应的类别及概率;
产出结果数据如下表:
SKU 结果类别
20001 A
20002 B
20003 A
20004
用户通过管理端UI201维护样本数据、关键词或反义词库、设置商品质量分析参数、以及检索质量结果数据。
在上述的实施例中将模型的创建过程与商品质量的评估合并在一起描述,但是本领域的技术人员也可以将上述的实施例分成模型的创建阶段和商品质量的评估阶段。例如,在训练单元208对训练集209进行训练得到模型文件210后,可以保存在存储器中待后续使用。图3示出了根据本发明实施例的创建评估商品质量的模型的方法的流程图。
在步骤S310,计算样本集的每条样本数据中的各个候选关键词与商品质量的相关度,并且根据计算的相关度确定关键词库。
例如,利用卡方统计计算所有关键词(来源例如是:对所有样本数据的文本分词,去停用词、反义词)和商品质量的相关度,并从高到低排序、编号,并取前N个作为关键词库,使关键词库和商品质量高度相关。
在步骤S320,结合确定的关键词库计算每个样本数据中的词在该样本中的权重。
例如,对每条样本数据(包含商品对应的质量类别:好、中、差)进行分词,去停用词、反义词,然后结合关键词库计算每个词在样本中的权重。
在步骤S330,对计算的权重进行归一化,得到训练数据,并且利用训练数据进行训练以输出模型文件,所述模型文件用来描述通过训练得到的模型。
例如,先将生成的词量化数据进行尺度转换,统一量化值的范围(利于训练更好的模型),然后生成训练集,得到模型文件,该模型文件用来描述通过训练得到的模型。在训练集中,一条样本数据生成一条训练数据。
另外,在商品质量评估阶段,可以保存的模型文件来进行质量评估。例如,在质量评估阶段对要评估的商品的文本数据在词量化单元212和训练单元213进行处理,然后进行质量分析。这里的词量化单元212和训练单元213与词量化单元207和训练单元208的功能相同,只是处理的数据不同而已。这样,质量分析单元214进行后续的质量分析,得到该商品的质量分析结果215。
图4示出了根据本发明实施例的评估商品质量的方法的流程图。如图4所示,在步骤S410,结合关键词库计算待评估商品的每条文本数据中的词在该文本中的权重。例如结合关键词库待评估商品的文本数据211中的词在文本中的权重。
在步骤S420,对计算的权重进行归一化,得到训练数据。在步骤S430,基于得到的训练数据,利用创建的模型计算该商品对应的质量类别及概率。
上述实施例的本发明提供的方法,采用诸如卡方统计之类的方法动态计算用于匹配文本的关键词,大大提高关键词与商品质量的相关度,且无需人工维护。此外,上述实施例中的单一关键词与SKU相关度的计算模型中,该相关度与关键词在SKU中出现的概率成正比,与其他类别中关键词出现次数总和成反比,完美的表现了关键词与SKU的相关性
此外,词量化过程对关键词进行反义词过滤,提高量化数据的准确性,对关键词库进行尺度转换,利于训练更好的模型,提高准确性。
在一些实施例中,使用SVM支持向量机,在高维特征空间采用线性算法对文本的非线性特征进行线性分析,应用核函数展开定理,相对传统数据挖掘方法,降低计算复杂度。且随着样本数据的改变,模型定时重新生成,降低人为干预的繁琐度。
在一些实施例中,运用分布式任务进行关键词计算、量化及质量分析能够快速、近实时分析海量商品的质量,总之,本发明相对于现有技术能大大提高商品质量量化数据的准确性及一致性,分析速度快,可靠性高。
如本领域的技术人员理解的那样,在上述实施例中,协同工作单元可省略,对分析性能有一定影响,但不影响本方法或装置的最终结果。此外关键词及反义词库可以是手工维护,线下建立完善的模型对其进行优化。此外,上述的方法和装置可针对商品的不同维度进行质量分析(SPU、SKU、店铺、运营商等)。SPU是一组可复用、易检索的标准化信息的集合,该集合描述了一个产品的特性,是商品信息聚合的最小单位。
另外,词量化单元中,相关度计算模型也可根据文本的类型(评价、投诉、工单、退换货)加以区分。
根据一些实施例,上述的商品质量类别可以自行定义,不影响本方法和装置对商品质量的判断。
以上的详细描述通过使用示意图、流程图和/或示例,已经阐述了一种基于文本的商品质量分析方法和装置的众多实施例。在这种示意图、流程图和/或示例包含一个或多个功能和/或操作的情况下,本领域技术人员应理解,这种示意图、流程图或示例中的每一功能和/或操作可以通过各种结构、硬件、软件、固件或实质上它们的任意组合来单独和/或共同实现。在一个实施例中,本发明的实施例所述主题的若干部分可以通过专用集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP)、或其他集成格式来实现。然而,本领域技术人员应认识到,这里所公开的实施例的一些方面在整体上或部分地可以等同地实现在集成电路中,实现为在一台或多台计算机上运行的一个或多个计算机程序(例如,实现为在一台或多台计算机***上运行的一个或多个程序),实现为在一个或多个处理器上运行的一个或多个程序(例如,实现为在一个或多个微处理器上运行的一个或多个程序),实现为固件,或者实质上实现为上述方式的任意组合,并且本领域技术人员根据本公开,将具备设计电路和/或写入软件和/或固件代码的能力。此外,本领域技术人员将认识到,本公开所述主题的机制能够作为多种形式的程序产品进行分发,并且无论实际用来执行分发的信号承载介质的具体类型如何,本公开所述主题的示例性实施例均适用。信号承载介质的示例包括但不限于:可记录型介质,如软盘、硬盘驱动器、紧致盘(CD)、数字通用盘(DVD)、数字磁带、计算机存储器等;以及传输型介质,如数字和/或模拟通信介质(例如,光纤光缆、波导、有线通信链路、无线通信链路等)。
虽然已参照几个典型实施例描述了本发明,但应当理解,所用的术语是说明和示例性、而非限制性的术语。由于本发明能够以多种形式具体实施而不脱离发明的精神或实质,所以应当理解,上述实施例不限于任何前述的细节,而应在随附权利要求所限定的精神和范围内广泛地解释,因此落入权利要求或其等效范围内的全部变化和改型都应为随附权利要求所涵盖。

Claims (12)

1.一种创建用于评估商品质量的模型的方法,包括步骤:
计算样本集的每条样本数据中的各个候选关键词与商品质量的相关度,并且根据计算的相关度确定关键词库;
结合确定的关键词库计算每个样本数据中的词在该样本中的权重;以及
对计算的权重进行归一化,得到训练数据,并且利用训练数据进行训练以输出模型文件,所述模型文件用来描述通过训练得到的模型。
2.如权利要求1所述的方法,其中利用卡方统计计算所有候选关键词与商品质量的相关度,并且提取前N个作为关键词库:
K 2 = N * ( A D - B C ) 2 ( A + B ) * ( C + D ) * ( A + C ) * ( B + D )
A为关键词在假货类别中,所有文本出现的次数;
B为关键词不在假货类别中,所有文本出现的次数
C为关键词在假货类别中,没有出现过的文本个数;
D为关键词不在假货类别中,没有出现过的文本个数;
N为样本数据的文本总数。
3.如权利要求1所述的方法,还包括在计算权重之前对每条样本数据进行分词,并且去除停用词和反义词。
4.如权利要求1所述的方法,其中按照下式计算每个词在样本中的权重:
Y i , j = ΣX i , j / N Σ k = 1 n X k , j ,
上式中分子为关键词在样本集中出现的频率,分母为关键词在其他类别中出现次数总和,N为文本总数。
5.如权利要求1所述的方法,其中利用支持向量机算法基于训练数据来得到模型文件。
6.一种创建用于评估商品质量的模型的装置,包括:
计算样本集的每条样本数据中的各个候选关键词与商品质量的相关度,并且根据计算的相关度确定关键词库的装置;
结合确定的关键词库计算每个样本数据中的词在该样本中的权重的装置;以及
对计算的权重进行归一化,得到训练数据,并且利用训练数据进行训练以输出模型文件,所述模型文件用来描述通过训练得到的模型的装置。
7.一种评估商品质量的方法,包括步骤:
结合关键词库计算待评估商品的每条文本数据中的词在该文本中的权重;
对计算的权重进行归一化,得到训练数据;
基于得到的训练数据,利用创建的模型计算该商品对应的质量类别及概率。
8.如权利要求7所述的方法,其中所述关键词库是通过计算样本集的每条样本数据中的各个候选关键词与商品质量的相关度,并且根据计算的相关度来确定的。
9.如权利要求7所述的方法,其中按照下式计算每个词在文本中的权重:
Y i , j = ΣX i , j / N Σ k = 1 n X k , j ,
上式中分子为关键词在文本中出现的频率,分母为关键词在其他类别中出现次数总和,N为文本总数。
10.如权利要求7所述的方法,还包括在计算权重之前对每条文本数据进行分词,并且去除停用词和反义词。
11.一种评估商品质量的装置,包括:
结合关键词库计算待评估商品的每条文本数据中的词在该文本中的权重的装置;
对计算的权重进行归一化,得到训练数据的装置;
基于得到的训练数据,利用创建的模型计算该商品对应的质量类别及概率的装置。
12.如权利要求11所述的装置,其中以分布式任务的方式来评估商品的质量。
CN201510387836.6A 2015-07-03 2015-07-03 模型创建方法、质量评估方法及装置 Pending CN105095396A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510387836.6A CN105095396A (zh) 2015-07-03 2015-07-03 模型创建方法、质量评估方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510387836.6A CN105095396A (zh) 2015-07-03 2015-07-03 模型创建方法、质量评估方法及装置

Publications (1)

Publication Number Publication Date
CN105095396A true CN105095396A (zh) 2015-11-25

Family

ID=54575833

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510387836.6A Pending CN105095396A (zh) 2015-07-03 2015-07-03 模型创建方法、质量评估方法及装置

Country Status (1)

Country Link
CN (1) CN105095396A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105790866A (zh) * 2016-03-31 2016-07-20 中国联合网络通信集团有限公司 基站分级方法及装置
CN106919545A (zh) * 2015-12-25 2017-07-04 皇家飞利浦有限公司 用于处理文档的方法与设备
CN107274043A (zh) * 2016-04-07 2017-10-20 阿里巴巴集团控股有限公司 预测模型的质量评价方法、装置及电子设备
CN107908783A (zh) * 2017-12-07 2018-04-13 百度在线网络技术(北京)有限公司 检索文本相关性的评估方法、装置、服务器和存储介质
CN107944761A (zh) * 2017-12-18 2018-04-20 广东广业开元科技有限公司 基于人工智能消费维权指数企业投诉预警监测分析方法
CN108304868A (zh) * 2018-01-25 2018-07-20 阿里巴巴集团控股有限公司 模型训练方法、数据类型识别方法和计算机设备
CN108399545A (zh) * 2017-02-06 2018-08-14 北京京东尚科信息技术有限公司 电子商务平台质量检测方法和装置
CN108429776A (zh) * 2017-02-13 2018-08-21 阿里巴巴集团控股有限公司 网络对象的推送方法、装置、客户端、交互设备以及***
CN109473149A (zh) * 2018-11-09 2019-03-15 天津开心生活科技有限公司 数据质量评估方法、装置、电子设备及计算机可读介质
CN110363251A (zh) * 2019-07-23 2019-10-22 杭州嘉云数据科技有限公司 一种sku图像分类方法、装置、电子设备及存储介质
CN111310431A (zh) * 2018-11-27 2020-06-19 浙江智美知识产权服务有限公司 一种量化式智能处理方法
CN111598585A (zh) * 2020-04-30 2020-08-28 山东贵合信息科技有限公司 一种农产品质量追溯方法、设备及介质
CN111600993A (zh) * 2020-05-13 2020-08-28 北京华峰创业科技有限公司 一种根据短信进行行程提醒的方法和装置
WO2021179138A1 (zh) * 2020-03-09 2021-09-16 图灵通诺(北京)科技有限公司 商超货架上商品的分析方法和***

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663025A (zh) * 2012-03-22 2012-09-12 浙江盘石信息技术有限公司 一种违规在线商品检测方法
CN103699523A (zh) * 2013-12-16 2014-04-02 深圳先进技术研究院 产品分类方法和装置
CN103778548A (zh) * 2012-10-19 2014-05-07 阿里巴巴集团控股有限公司 商品信息与关键词匹配方法、商品信息投放方法及装置
CN103778205A (zh) * 2014-01-13 2014-05-07 北京奇虎科技有限公司 一种基于互信息的商品分类方法和***
CN103823893A (zh) * 2014-03-11 2014-05-28 北京大学 一种基于用户评论的产品检索方法及产品检索***
CN103853824A (zh) * 2014-03-03 2014-06-11 沈之锐 一种基于深度语义挖掘的内文广告发布方法与***

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663025A (zh) * 2012-03-22 2012-09-12 浙江盘石信息技术有限公司 一种违规在线商品检测方法
CN103778548A (zh) * 2012-10-19 2014-05-07 阿里巴巴集团控股有限公司 商品信息与关键词匹配方法、商品信息投放方法及装置
CN103699523A (zh) * 2013-12-16 2014-04-02 深圳先进技术研究院 产品分类方法和装置
CN103778205A (zh) * 2014-01-13 2014-05-07 北京奇虎科技有限公司 一种基于互信息的商品分类方法和***
CN103853824A (zh) * 2014-03-03 2014-06-11 沈之锐 一种基于深度语义挖掘的内文广告发布方法与***
CN103823893A (zh) * 2014-03-11 2014-05-28 北京大学 一种基于用户评论的产品检索方法及产品检索***

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106919545A (zh) * 2015-12-25 2017-07-04 皇家飞利浦有限公司 用于处理文档的方法与设备
CN105790866A (zh) * 2016-03-31 2016-07-20 中国联合网络通信集团有限公司 基站分级方法及装置
CN105790866B (zh) * 2016-03-31 2018-07-24 中国联合网络通信集团有限公司 基站分级方法及装置
CN107274043B (zh) * 2016-04-07 2021-05-07 阿里巴巴集团控股有限公司 预测模型的质量评价方法、装置及电子设备
CN107274043A (zh) * 2016-04-07 2017-10-20 阿里巴巴集团控股有限公司 预测模型的质量评价方法、装置及电子设备
CN108399545A (zh) * 2017-02-06 2018-08-14 北京京东尚科信息技术有限公司 电子商务平台质量检测方法和装置
CN108429776B (zh) * 2017-02-13 2021-09-14 阿里巴巴集团控股有限公司 网络对象的推送方法、装置、客户端、交互设备以及***
CN108429776A (zh) * 2017-02-13 2018-08-21 阿里巴巴集团控股有限公司 网络对象的推送方法、装置、客户端、交互设备以及***
CN107908783A (zh) * 2017-12-07 2018-04-13 百度在线网络技术(北京)有限公司 检索文本相关性的评估方法、装置、服务器和存储介质
CN107944761A (zh) * 2017-12-18 2018-04-20 广东广业开元科技有限公司 基于人工智能消费维权指数企业投诉预警监测分析方法
CN108304868A (zh) * 2018-01-25 2018-07-20 阿里巴巴集团控股有限公司 模型训练方法、数据类型识别方法和计算机设备
CN109473149B (zh) * 2018-11-09 2021-01-15 天津开心生活科技有限公司 数据质量评估方法、装置、电子设备及计算机可读介质
CN109473149A (zh) * 2018-11-09 2019-03-15 天津开心生活科技有限公司 数据质量评估方法、装置、电子设备及计算机可读介质
CN111310431A (zh) * 2018-11-27 2020-06-19 浙江智美知识产权服务有限公司 一种量化式智能处理方法
CN110363251A (zh) * 2019-07-23 2019-10-22 杭州嘉云数据科技有限公司 一种sku图像分类方法、装置、电子设备及存储介质
WO2021179138A1 (zh) * 2020-03-09 2021-09-16 图灵通诺(北京)科技有限公司 商超货架上商品的分析方法和***
US11748787B2 (en) 2020-03-09 2023-09-05 Yi Tunnel (Beijing) Technology Co., Ltd. Analysis method and system for the item on the supermarket shelf
CN111598585A (zh) * 2020-04-30 2020-08-28 山东贵合信息科技有限公司 一种农产品质量追溯方法、设备及介质
CN111600993A (zh) * 2020-05-13 2020-08-28 北京华峰创业科技有限公司 一种根据短信进行行程提醒的方法和装置

Similar Documents

Publication Publication Date Title
CN105095396A (zh) 模型创建方法、质量评估方法及装置
CN110222272B (zh) 一种潜在客户挖掘与推荐方法
Cai et al. Multimodal Data Guided Spatial Feature Fusion and Grouping Strategy for E‐Commerce Commodity Demand Forecasting
CN108985830B (zh) 基于异质信息网络的推荐评分方法、装置
CN102890803B (zh) 电子商品异常交易过程的确定方法及其装置
CN108960719B (zh) 选品方法和装置以及计算机可读存储介质
CN104463637A (zh) 一种基于电商平台的商品推荐方法、装置及服务器
Hadden et al. Churn prediction using complaints data
CN112200601B (zh) 物品推荐方法、装置及可读存储介质
Kabir et al. Analysis of different predicting model for online shoppers’ purchase intention from empirical data
CN105335518A (zh) 生成用户偏好信息的方法及装置
CN104834651A (zh) 一种提供高频问题回答的方法和装置
CN104850617A (zh) 短文本处理方法及装置
CN111966886A (zh) 对象推荐方法、对象推荐装置、电子设备及存储介质
CN106327230B (zh) 一种异常用户检测方法及设备
CN110647995A (zh) 规则训练方法、装置、设备及存储介质
CN111738805A (zh) 基于行为日志的搜索推荐模型生成方法、设备和存储介质
CN102985939A (zh) 艺术品评估引擎和用于自动形成艺术品指数的方法
Desai et al. Business intelligence visualization using deep learning based sentiment analysis on amazon review data
CN104572623B (zh) 一种在线lda模型的高效数据总结分析方法
Bahtiar et al. Comparison of Naïve Bayes and Logistic Regression in Sentiment Analysis on Marketplace Reviews Using Rating-Based Labeling
JP5835802B2 (ja) 購買予測装置、方法、及びプログラム
CN107944946A (zh) 商品标签生成方法及装置
CN116844724A (zh) 一种基于因子分析技术的app健康程度评估方法
Silva et al. A categorical clustering of publishers for mobile performance marketing

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20151125

RJ01 Rejection of invention patent application after publication