CN104718547A - 顾客数据解析*** - Google Patents

顾客数据解析*** Download PDF

Info

Publication number
CN104718547A
CN104718547A CN201380013637.8A CN201380013637A CN104718547A CN 104718547 A CN104718547 A CN 104718547A CN 201380013637 A CN201380013637 A CN 201380013637A CN 104718547 A CN104718547 A CN 104718547A
Authority
CN
China
Prior art keywords
data
client
detailed data
prediction processing
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201380013637.8A
Other languages
English (en)
Inventor
毛谷村刚太郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Culture Convenience Club Co Ltd
Original Assignee
Culture Convenience Club Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Culture Convenience Club Co Ltd filed Critical Culture Convenience Club Co Ltd
Publication of CN104718547A publication Critical patent/CN104718547A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0281Customer communication at a business location, e.g. providing product or service information, consulting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

其目的为提供一种解析***,以高精度在短时间内进行被运用公司***收集/存储的顾客数据的解析。顾客数据解析***(1)用来解析被运用公司***(2)收集/储存的详细数据,其特征为,具有预测处理单元,以任意的详细数据的多个项目为说明变量,以其他的多个项目为目标变量,从项目间的相关度,通过概率推论计算多个项目的概率值。

Description

顾客数据解析***
发明领域
本发明涉及一种收集与顾客有关的数据,并对其进行解析的***。
背景技术
通过积分卡、***的加入者、营销网络加入者及顾客名簿登录者等,每日收集与会员顾客有关的各种各样的数据,存储在数据库中的这种数据例如为了投递与顾客的意向相符的商品广告而被使用的技术,已为众所周知(引用文献1~5)。另外,从顾客收集的数据能够作为下述数据加以利用,该数据成为以上述那种用于对顾客的广告等推荐的最佳顾客的提取所需的分析、用于商品/服务开发的调研或商品/服务销售趋势的调研等的市场调查所需的分析为代表的各种各样分析的基础。以往作为生成这种成为分析基础的数据所用的解析方法,采用了下述方法,即为了获知对于与1个项目建立关联后的数据,与另1个项目建立关联后的数据带来什么程度影响,要按每1个目标变量制作模型,按多个目标变量的每个进行评分的方法。但是,在解析从多位顾客提供的巨大数据量的被称为大数据的原始数据的场合,就上述解析方法而言,因为在对多个目标变量评分时,运算需要较长时间,给运算装置增加很大的负荷,所以人们要求这一点的改进。
专利文献1:日本特开2010-211687号公报
专利文献2:日本特开2009-163533号公报
专利文献3:日本特开2012-247926号公报
专利文献4:日本特开2004-70504号公报
专利文献5:日本特开2012-190061号公报
发明内容
因此,本发明的目的为,提供一种可以有效解析被收集的数据,在短时间内生成能在广告、市场调查等各种各样的分析方面利用的作为分析基础的数据的***。
本发明的顾客解析***用来解析被运用公司***收集/存储的详细数据,其特征为,具有以任意的详细数据的多个项目为说明变量,以其他的多个项目为目标变量,通过概率推论计算多个项目的概率值的预测处理单元。
根据本发明的另一方式,其特征为,具有以任意的详细数据的多个项目为说明变量,以其他的多个项目为目标变量,且将所述目标变量作为下世代目标变量所用的说明变量,通过概率推论计算其他的多个项目的概率值的预测处理单元。
其特征为,具有数据集市生成处理单元,对详细数据进行汇总,生成由适于解析的详细数据构成的数据集市。
其特征为,具有采样处理单元,对任意数量的顾客的详细数据进行采样。
其特征为,具有验证单元,判定对于详细数据的项目进行预测处理而得到的概率值和从所收集的实例值的详细数据得到的先验概率值之间的差分。
其特征为,具有校正单元,在由验证单元判定出概率值和先验概率值的差分小于等于任意的值之前,校正预测处理的预测试验模型。
其特征为,具有评分单元,将由验证单元判定为小于等于任意值的差分的预测试验模型作为预测处理的预测模型,利用所述预测模型,对全部顾客的详细数据进行预测处理来计算概率值。
其特征为,对计算出的概率值进行阈值判定,计算映射估计值。
发明效果
根据本发明,即便目标变量是数个,也可以一次执行预测模型制作过程、评分过程。
附图说明
图1是本发明的顾客数据解析***的框图。
图2是本发明的顾客数据解析***的流程图。
图3是表示本发明的详细数据解析阶段的流程图。
图4是以往的预测处理的模式图。
图5是本发明的顾客数据解析***的预测处理的模式图。
图6是本发明的顾客数据解析***的预测处理的模式图。
图7是本发明的顾客数据解析***的预测处理的模式图。
图8是本发明的顾客数据解析***的预测处理的模式图。
图9是本发明的顾客数据解析***的预测处理的模式图。
图10是本发明的顾客数据解析***的预测处理的模式图。
图11是本发明的顾客数据解析***的预测处理的模式图。
图12是本发明的顾客数据解析***的数据表的例子。
图13是本发明的顾客数据解析***的数据表的例子。
图14是本发明的顾客数据解析***的数据表的例子。
图15是本发明的顾客数据解析***的作为解析结果利用例的波形生成处理及近似率计算处理的流程图。
图16是波形生成处理后的图表。
图17是波形生成处理后的图表。
图18是波形生成处理后的图表。
图19是近似率计算处理的计算例。
图20是近似率计算处理的计算例。
符号说明
1  顾客数据解析***
2  运用公司***
3  网上加盟***
4  实际加盟***
5  问卷调查单元
具体实施方式
(***的结构)
下面,参照附图,对于本发明的顾客数据解析***1进行说明。
如图1所示,顾客数据解析***1(下面有时只称为***1。)具有:运用公司***2,由处于运用公司的管辖下的运算装置、数据库群等构成;EC站点等的网上加盟***3,和运用公司***2可传递信息地连接而成,由运算装置、输入输出终端等构成;实际加盟***4,和运用公司***2可传递信息地连接而成,由运算装置、输入输出终端等构成,设置于实际店铺内;问卷调查单元5。
参照图1,对于***1的概略进行说明。***1用来存储通过网上加盟***3、实际加盟***4及问卷调查单元5等从利用***1的顾客收集的各种数据,进行解析。在从顾客存储于运用公司***2中的数据里,第1,有对于各个顾客在***的利用登录时赋予的顾客ID、在***1的利用登录时由顾客提供的性别、年龄等顾客的基本属性等的属性数据。第2,有详细数据,该详细数据包括每次顾客在加盟企业购入商品/服务(下面称为商品等。),都被收集、传递的商品等的品种或商品名、来店时间段、利用店铺等的履历类数据和通过任意的问卷调查从顾客收集、传递的已婚/未婚之别、有无子女、居住条件、年收入、有无驾驶证及顾客的意愿性等调研类的数据。属性数据存储于会员主数据库中,在顾客的属性数据中有变更时进行更新。另外,详细数据随时提供给运用公司***2,存储于解析数据库中。
这样收集的各数据按照顾客ID进行管理。如果举出顾客ID的一例,则按每名顾客不同的任意位数的数字及字符串是一例,在顾客拥有积分卡时,该顾客ID能够采用磁、电等各种各样的方式记录于该卡中,由实际加盟***4的POS终端等的输入装置读取顾客ID,以顾客ID和顾客数据建立了关联的状态传递给运用公司***2。另外,在通过网上加盟***3进行传递时,能够通过顾客拥有的移动终端或计算机等的顾客终端的输入装置,输入顾客ID,以顾客ID和顾客数据建立了关联的状态传递给运用公司***2。
还有,在***1中作为附带功能的服务积分加法/减法处理在运用公司***2的积分类***中进行,当顾客在加盟企业购入了商品等时,或每次借其他各种各样的机会利用服务积分,积攒服务积分,也就是每次传递服务积分的加法/减法数据,都要进行其与顾客的顾客ID对应的帐户的服务积分的加法/减法处理
(详细数据的收集/存储和其解析处理)
如图2的流程图所示,本发明的***1作为基础的是,详细数据的收集/存储和其解析处理。***1一般的流程由下述详细数据收集存储阶段和详细数据解析阶段构成,该详细数据收集存储阶段由2个步骤组成,即对每次顾客在加盟企业购入商品等都传递给运用公司***2的详细数据进行收集处理(S1),实施存储所取得的详细数据的详细数据存储处理(S2)的步骤,该详细数据解析阶段由数据集市的生成处理(S3)、采样处理(S4)、制作模型处理(S5)、验证处理(S6)、评分处理(S7)以及解析结果计算处理(S8)的步骤组成。
(详细数据收集/存储处理阶段)
详细数据的收集处理(S1)在实际加盟***4中,当顾客购入商品等时,从POS终端通过履历类输入装置,输入详细数据,以顾客ID与详细数据建立关联后的状态,通过因特网线路或者专用线路等的通信线路传递给运用公司***2。另外,在网上加盟***3中,当购入了商品等时,从顾客终端以详细数据和顾客ID建立关联后的状态通过因特网线路等的通信线路传递给动作公司***2。
接着,从详细数据存储处理(S2),通过实际加盟***4、网上加盟***3传递到运用公司***2的详细数据被存储于解析数据数据库。这样,详细数据的收集/存储每次传递详细数据都要进行。
(详细数据解析阶段)
对于详细数据解析阶段的作为起始步骤的数据汇总处理(S3),进行说明。数据汇总处理用来根据需要对属性数据及/或详细数据进行离散化处理,进而通过将该属性数据及/或详细数据,整理为类别数据、上位层或者大分类/中分类的项目群,来生成数据集市。通过生成数据集市,就可以将属性数据及/或详细数据整理为易于解析的数据项目。参照图12,来说明数据集市生成处理的一例。例如,对于象属性数据的“性别”那样非连续量的项目,进行整理为类别数据的处理。另外,对于与详细数据的履历类数据有关的商品等的品种,进行将“油炸鸡、油炸薯、炸小牛排”总括为中分类的“副食”,将“鲑鱼饭团、梅子饭团、金枪鱼饭团”总括为中分类的“饭团”的处理。如此,进行以与项目的特性相应的方法将属性数据和详细数据整理为易于解析的项目数的数据集市生成处理。该项目数依照运算处理装置的处理能力、加盟企业要求提供的数据项目,来确定。例如,虽然目前汇总为约3000项目左右适于分析,但是项目数是任意的。
下面,说明下述作为制作预测模型的过程、评分的过程之基本的本发明的预测处理。以往的预测处理如图4所示,一直进行下述处理,即对于1个目标变量,赋予1个或多个说明变量,针对1个项目计算对“已婚、未婚”的说明变量的影响程度的处理。也就是说,如果准备针对1个目标变量项目计算(已婚、未婚)的概率值,则需要对于1个目标变量,只按目标变量的数量进行预测处理。
另一方面,图3、图5~图11所示的本发明新的预测处理用来利用例如以贝叶斯网络为代表的概率推论,以任意的详细数据的多个项目为目标变量,以其他的多个项目为说明变量,从项目间的相关度,通过概率推论计算多个项目的概率值。
下面,参照图5~图11所示的预测处理的模式图,说明本发明的预测处理。图5~图7所示的案例1是预测处理为1层模型的场合。如图5所示,若对于任意顾客A的预测处理,将已婚/未婚之别的概率设为目标变量,则在与顾客A有关的信息任何都未提供给运用公司***2的状态,也就是在顾客A的说明变量中没有任何详细数据的状态下,已婚/未婚之别的概率值其从提供了调研类数据的顾客们的数据得到的先验概率值(已婚0.5478,未婚0.4252)在已婚/未婚之别的项目中被放弃。同样,在对于其他的说明变量(购入调料、购入副食及深夜时间利用比例)也没有任何详细数据的状态下,从提供了履历类数据的顾客们的数据得到的购入调料的先验概率值(多0.2,少0.8)、购入副食的先验概率值(有购入0.35,无购入0.65)、深夜时间段的利用比例的先验概率值(多0.1,普通0.3,少0.6)被放弃。
参照图6,若接下来对于顾客A的说明变量之中的购入副食,提供了“有购入”的详细数据,则有副食购入的项目的概率值加入,若进行了预测处理,则作为目标变量的未婚的概率值从0.4252(约43%)上升为约0.63(63%)。
参照图7,若再对于顾客A的说明变量之中深夜时间段的利用,提供了“多”的详细数据,则深夜时间段比例的项目的概率值(1.0)加入,作为目标变量的未婚的概率值进行从0.63(63%)进一步上升为0.9(90%)这样的预测处理。
下面,参照图8~图11所示的预测处理的模式图,来说明2层模型时的预测处理。如图8所示,若对于任意的顾客A的预测处理,将手工制作意愿的概率设为第2目标变量,则在没有顾客A的详细数据的状态下,手工制作意愿的概率值其从提供了调研类数据的顾客们的数据得到的先验概率值(高0.4809,低0.5191)被放弃,第1目标变量的已婚/未婚之别的概率值其从提供了调研类数据的顾客们的数据得到的先验概率值(已婚0.5748,未婚0.4252)被放弃。
参照图9,若接下来对于顾客A的说明变量之中的购入调料,得到了“购入较多”的详细数据,则和所述1层模型的结构相同,购入调料多的概率值(1.0)加入,通过预测处理,手工制作意愿的概率值从0.4809(约48%)上升为0.715(约71%)。
再者,若对于顾客A的说明变量之中的购入副食,得到了“无购入”的详细数据,则无副食购入的概率值(1.0)加入,第1目标变量即已婚/未婚之别的已婚的概率值从0.5748(约57%)上升为0.685(约68%)。进而,第1目标变量即已婚/未婚之别因为也是对第2目标变量即手工制作意愿的说明变量,所以根据无副食购入的概率值(1.0)的变动,第1目标变量已婚/未婚之别的概率值发生变动,该第1目标变量的变动传播为第2目标变量的变动,第2目标变量即手工制作意愿的概率值再从0.715(约71%)上升为0.737(约74%)。
如图11所示,预测处理是说明变量(父)的概率值的变动使第1目标变量(子)的概率值产生变动的处理,是在第1目标变量(子)还是说明变量(父)时,使第2目标变量(子(相对于起始的说明变量为孙))的概率值产生变动的处理。也就是说,1个目标变量相对于下世代以下的目标变量也成为说明变量,可以根据需要设定到当前连接的全部目标变量(第n世代的目标变量)中。也就是说,本发明的预测处理因任意的说明变量的详细数据加入,而进行计算与之连接的各项目的概率值的预测处理,给当前连接的全部目标变量的概率值带来影响。另外,在2层以上的预测处理中,因上世代的说明变量的实例值加入,而给当前连接的(子、孙、第n世代的目标变量)变动传播影响,进行计算各项目的概率值的预测处理。虽然这是在预测模型的制作过程和评分的过程中计算概率值的预测处理,但是在此,以父、子、孙的关系表示出预测处理的传播模型,而预测处理的连接并不限于这种单向的连接。
下面,说明制作在评分处理中使用的预测模型的过程。首先,采样处理(S4)是作为为了全部顾客部分的详细数据的预测处理而制作精度高的预测模型,也就是概率推论之运算体系的前阶段,为了制作预测试验模型,而提取任意顾客的动作。采样处理单元进行下述处理,即提取任意数量的顾客(例如100万人量)的汇总后的数据集市(例如3000项目的数据集市)的处理。虽然在采样处理中为了预测试验模型的制作,作为提取对象的顾客也可以随机提取,但是为了能在下述的验证处理中进行确切的验证,从具有对概率值的答案的顾客,也就是预定项目以上的实例值的详细数据已被存储的顾客之中,提取任意数量的顾客较为合适。
接着,制作模型处理(S5)、验证处理(S6)用来对由所述采样单元采样后的详细数据,使用预测试验模型,进行预测处理也就是概率推论,计算概率值,验证计算出的概率值和从实际所收集并存储的详细数据得到的答案,也就是先验概率值,制作评分用的预测模型。
制作模型处理单元对于所采样的顾客的详细数据使用预测试验模型,进行预测处理。接下来,验证处理单元进行下述验证处理,即在全部的项目或者任意的项目中计算通过利用预测试验模型的预测处理所得到的概率值和对于事先作为实例值所收集的各目标变量已经得到的先验概率值之间的差分。校正处理单元进行目标变量或说明变量的项目更换,或者变更对项目的离散化的方法等预测试验模型的校正处理,以便验证处理的结果计算出的概率值和先验概率值之间的差分小于等于任意的值。重复该验证处理和校正处理,由预测试验模型得到的概率值和先验概率值之间的差分小于等于任意的值的状态的预测试验模型被确定为预测模型。还有,这里所确定的预测模型因为详细数据有每次收集并存储都变得过时的可能性,所以作为暂用模型来使用,定期或者每次存储一定量的详细数据,都经过所述的过程,制作预测处理所用的预测模型。
下面,对于评分的过程进行说明。评分处理用来使用在所述制作模型处理制作出的预测模型,对全部顾客的数据集市的详细数据展开预测处理。因此,要对于全部顾客的数据集市的全部项目,计算概率值。
参照图12,在不进行评分的状态下如实例表所示,是只在实际所收集的属性数据、详细数据的项目中实例值被放弃的状态。对此,若利用所述预测模型进行了预测处理,则成为对于图13所示的被称为顾客DNA(顾客评价)表的全部项目放弃了概率推论后的概率值的状态。再者,如图14所示,如果根据实例表的趋势,添加了表示用阈值判定所输入的概率值后的结果之处理,则还能够获得映射估计值。
以往,虽然产生了只按目标变量的数量制作预测模型的过程、进行评分的过程,但是在本发明中,即便目标变量是数个,仍可以一次实施预测模型制作过程、评分过程。也就是说,因为通过这种预测处理来解析详细数据,所以能够对于全部顾客的全部详细数据的项目,在短时间内进行解析。另外,因为在对全部顾客的详细数据的项目展开利用预测处理的评分之前,通过采样处理、制作模型处理及验证处理,制作预测试验模型,并重复该预测试验模型的验证和校正来制作精度高的预测模型,所以能够以概率值这样的形式预测与顾客的现实活动相符的值,可以针对全部顾客的全部详细数据的项目在短时间内获得精度高的概率值。另外,因为将预测模型作为暂用版本,经常更换,所以可以针对每日更新的详细数据,进行接近现实的预测处理。还有,在展开评分的解析对象的顾客数绝对少的情况下,也可以省去采样处理、制作模型处理和验证处理,对全部顾客量的详细数据直接实施预测处理。
(概率值的利用例)
下面,说明由所述顾客数据解析***得到的概率值的利用方法例。在接于顾客数据解析***之后的***之一中,有波形生成和近似度计算的过程。如图15所示,运用公司***2使波形生成单元动作后,波形生成单元进行绘制处理(S1),该绘制处理绘制与在纵轴上所取的类别对应的各项目的概率值,并进行折线图化的波形生成处理(S2)。例如,在生成顾客A的波形的情况下,如图16所示,将横轴作为项目,将纵轴作为顾客数据(%),绘制针对顾客A的各项目(例如年收入水平、吸烟率、汽车持有率)的概率值,并将其波形化。由此,通过波形表示顾客A的性质。也能够同样地表示顾客B的波形。
另外,如图17所示,其他形态的波形生成单元,将横轴作为项目,将纵轴作为概率值(%),计算各项目的概率值的平均值,进行绘制平均值化的概率值的绘制处理,并进行折线图化的波形生成处理。例如图12所示,在生成商品G的波形的情况下,将横轴作为项目,将纵轴作为概率值(%),计算具有购入了商品G的履历类数据的顾客们的各项目的概率值的平均值,绘制针对商品G的各项目(例如年收入水平、吸烟率、汽车持有率)的、平均值化后的概率值,并将其波形化。进而,如图18所示,还可以生成店A的波形和店B的波形。
(近似度计算处理)
参照图19、20,对于作为计算近似度的单元的近似度计算处理,进行说明。波形生成处理是指,计算由波形生成单元所生成的至少2个以上波形的近似度(也被称为同步率。)的处理。该近似度如下求出,即计算由波形生成单元所生成的至少2个以上的波形的点之间的差分,计算由所述波形生成单元所生成的至少2个以上的波形的线段角度的差分,判定所述点之间的差分是否为阈值以内,判定所述线段角度的差分是否为阈值以内,计算所述点之间的差分为阈值以内的比例,计算所述线段角度的差分为阈值以内的比例,根据所述点之间的差分为阈值以内的比例和所述线段角度的差分为阈值以内的比例求出上述近似度。
如图19、20所示,在此,所谓概率差分指的是,用在纵轴上所取的概率值的差表示出对应的绘制后的点之间的距离的值,参照图16,例如发送源数据A的项目的项目X1(例如年收入水平)的概率绘制在X1A%(例如75%)、发送目标数据B的项目的项目X1(年收入水平)的概率绘制在X1B%(例如73%)的位置上的情况下,进行X1A%(75%)-X1B%(73%)=概率差分Y1%(2%)的运算,对于与X1~Xn的全部项目对应的点重复进行该运算,计算概率差分Y1~Yn。接下来,在该概率差分的值为阈值(例如±5%)以内的情况下,判定为点一致,为阈值以外的情况下,判定为点不一致。进而,计算针对全部计算结果的点的一致率。
另外,所谓线段角度的差分指的是折线图的线的角度的差分,参照图19、20,进行线段角度的差分θ=θ1-θ2=tan-1D/C-tan-1D'/C的运算,对于与X1~Xn间的全部项目对应的线重复进行该运算。接下来,在该线段角度的差分的值为阈值(例如±3°)以内的情况下判定为波形一致,为阈值以外的情况下判定为波形不一致。进而,计算针对全部计算结果的波形的一致率。
然后,根据通过上述运算得到的点的一致率、波形的一致率,通过近似度=(点的一致率+波形的一致率)/2的运算来计算波形的近似度即近似度。还有,上述阈值的值能够设为可变条件。
这样,通过波形生成单元、近似度计算单元,求出顾客对顾客、企业对企业、店铺对店铺等那样的同类别之间的近似度,或者求出顾客对企业、顾客对店铺、顾客对商品、顾客对区域、企业对商品、店铺对商品、店铺对区域等那样的不同类别之间的近似度也就是近似度,并将该近似度视觉化,由此,当然可以将本***在向顾客的建议操作中发挥作用,并且能够在本***中例如进行企业或店铺的货品的分析、开店地域的分析等用于各种目的的调查分析。
另外,作为其他的利用例,因为也可以对于没有详细数据的顾客求出概率值,所以实际上还可以使用于挑选虽未购入商品A但购入的概率高的顾客等的市场调查中。进而,还可以使用于分析某类别的顾客群购入的可能性高的商品等的市场调查中。
产业上的可利用性
根据本发明,即便目标变量是数个,仍可以一次进行预测模型制作过程、评分过程。

Claims (8)

1.一种顾客数据解析***,解析运用公司***所收集/存储的详细数据,其特征为,
具有以任意的详细数据的多个项目为说明变量,以其他的多个项目为目标变量,通过概率推论计算多个项目的概率值的预测处理单元。
2.如权利要求1所述的顾客数据解析***,其特征为,
具有以任意的详细数据的多个项目为说明变量,以其他的多个项目为目标变量,且将所述目标变量作为下世代目标变量所用的说明变量,通过概率推论计算多个项目的概率值的预测处理单元。
3.如权利要求1或2所述的顾客数据解析***,其特征为,
具有数据集市生成处理单元,对详细数据进行汇总,生成由适于解析的详细数据构成的数据集市。
4.如权利要求1至3任一项所述的顾客数据解析***,其特征为,
具有采样处理单元,对任意数量的顾客的详细数据进行采样。
5.如权利要求1至4任一项所述的顾客数据解析***,其特征为,
具有验证单元,判定对于详细数据的项目进行预测处理而得到的概率值和从所收集的实例值的详细数据得到的先验概率值之间的差分。
6.如权利要求5所述的顾客数据解析***,其特征为,
具有校正单元,在由验证单元判定出概率值和先验概率值的差分为任意的值以下为止,校正预测处理的预测试验模型。
7.如权利要求6所述的顾客数据解析***,其特征为,
具有评分单元,将由验证单元判定为任意值以下的差分的预测试验模型作为预测处理的预测模型,利用所述预测模型,对全部顾客的详细数据进行预测处理,来计算概率值。
8.如权利要求1至7任一项所述的顾客数据解析***,其特征为,
对计算出的概率值进行阈值判定,计算映射估计值。
CN201380013637.8A 2013-10-11 2013-11-20 顾客数据解析*** Pending CN104718547A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2013-214213 2013-10-11
JP2013214213A JP6059122B2 (ja) 2013-10-11 2013-10-11 顧客データ解析システム
PCT/JP2013/081284 WO2015052851A1 (ja) 2013-10-11 2013-11-20 顧客データ解析システム

Publications (1)

Publication Number Publication Date
CN104718547A true CN104718547A (zh) 2015-06-17

Family

ID=52812694

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380013637.8A Pending CN104718547A (zh) 2013-10-11 2013-11-20 顾客数据解析***

Country Status (6)

Country Link
JP (1) JP6059122B2 (zh)
KR (1) KR20150053256A (zh)
CN (1) CN104718547A (zh)
HK (1) HK1209867A1 (zh)
TW (1) TWI597679B (zh)
WO (1) WO2015052851A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105701498A (zh) * 2015-12-31 2016-06-22 腾讯科技(深圳)有限公司 一种用户分类方法及服务器
CN106327002A (zh) * 2015-06-30 2017-01-11 松下电器(美国)知识产权公司 需求预测方法和需求预测装置
CN106651409A (zh) * 2015-10-29 2017-05-10 北京京东尚科信息技术有限公司 预测用户婚姻状态的方法和装置
CN112154488A (zh) * 2018-05-21 2020-12-29 Nec平台株式会社 信息处理装置、控制方法和程序
CN113177643A (zh) * 2021-05-24 2021-07-27 北京融七牛信息技术有限公司 一种基于大数据的自动建模***
CN113177642A (zh) * 2021-05-24 2021-07-27 北京融七牛信息技术有限公司 一种针对数据不平衡的自动建模***

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6603600B2 (ja) * 2015-06-30 2019-11-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 需要予測方法、需要予測装置及び需要予測プログラムを記録したコンピュータ読み取り可能な記録媒体
US20170004411A1 (en) * 2015-07-04 2017-01-05 Tata Consultancy Services Limited Method and system for fusing business data for distributional queries
JP6320353B2 (ja) * 2015-08-27 2018-05-09 株式会社アクシバル デジタルマーケティングシステム
JP6058104B1 (ja) * 2015-11-06 2017-01-11 株式会社南山デイリーサービス 顧客情報更新装置及びコンピュータプログラム
JP6784000B2 (ja) * 2015-12-25 2020-11-11 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報処理装置、情報処理方法、及び、プログラム
CN111902836A (zh) 2018-03-27 2020-11-06 文化便利俱乐部株式会社 基于顾客属性信息进行建议的装置、方法、及程序
JP7197391B2 (ja) * 2019-02-01 2022-12-27 株式会社オービック データ分析装置、データ分析方法およびデータ分析プログラム
WO2021250902A1 (ja) * 2020-06-12 2021-12-16 株式会社アシックス データ推定装置、方法及びプログラム

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1647067A (zh) * 2002-04-04 2005-07-27 石原产业株式会社 数据解析装置及方法
CN101354757A (zh) * 2008-09-08 2009-01-28 中国科学院地理科学与资源研究所 一种精细尺度下的动态风险及易损性预测方法
JP2010044518A (ja) * 2008-08-11 2010-02-25 Kddi Corp 嗜好推定装置、嗜好推定方法及びコンピュータプログラム
CN102360386A (zh) * 2011-10-12 2012-02-22 朱一超 电子商务网站智能导购***和方法
CN102662832A (zh) * 2012-03-20 2012-09-12 浙江大学 一种生产过程数据校正软件的评测方法
CN102682153A (zh) * 2011-03-08 2012-09-19 索尼公司 信息处理和呈现装置、终端装置、评估得分计算法和程序
CN103235981A (zh) * 2013-04-10 2013-08-07 东南大学 一种风电电能质量趋势预测方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001229150A (ja) * 2000-02-14 2001-08-24 Hitachi Ltd データ分析方法
JP2002366401A (ja) * 2001-06-06 2002-12-20 Nippon Yunishisu Kk 統合的データマート構築及び運用支援システム
US20040064357A1 (en) * 2002-09-26 2004-04-01 Hunter Jeffrey D. System and method for increasing the accuracy of forecasted consumer interest in products and services
JP4847916B2 (ja) * 2007-05-18 2011-12-28 日本電信電話株式会社 購買順序を考慮したリコメンド装置、リコメンド方法、リコメンドプログラムおよびそのプログラムを記録した記録媒体
US20100203876A1 (en) * 2009-02-11 2010-08-12 Qualcomm Incorporated Inferring user profile properties based upon mobile device usage
JP5544314B2 (ja) * 2011-01-25 2014-07-09 株式会社日立製作所 用役設備の最適運転システム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1647067A (zh) * 2002-04-04 2005-07-27 石原产业株式会社 数据解析装置及方法
JP2010044518A (ja) * 2008-08-11 2010-02-25 Kddi Corp 嗜好推定装置、嗜好推定方法及びコンピュータプログラム
CN101354757A (zh) * 2008-09-08 2009-01-28 中国科学院地理科学与资源研究所 一种精细尺度下的动态风险及易损性预测方法
CN102682153A (zh) * 2011-03-08 2012-09-19 索尼公司 信息处理和呈现装置、终端装置、评估得分计算法和程序
CN102360386A (zh) * 2011-10-12 2012-02-22 朱一超 电子商务网站智能导购***和方法
CN102662832A (zh) * 2012-03-20 2012-09-12 浙江大学 一种生产过程数据校正软件的评测方法
CN103235981A (zh) * 2013-04-10 2013-08-07 东南大学 一种风电电能质量趋势预测方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106327002A (zh) * 2015-06-30 2017-01-11 松下电器(美国)知识产权公司 需求预测方法和需求预测装置
CN106651409A (zh) * 2015-10-29 2017-05-10 北京京东尚科信息技术有限公司 预测用户婚姻状态的方法和装置
CN105701498A (zh) * 2015-12-31 2016-06-22 腾讯科技(深圳)有限公司 一种用户分类方法及服务器
CN105701498B (zh) * 2015-12-31 2021-09-07 腾讯科技(深圳)有限公司 一种用户分类方法及服务器
CN112154488A (zh) * 2018-05-21 2020-12-29 Nec平台株式会社 信息处理装置、控制方法和程序
CN113177643A (zh) * 2021-05-24 2021-07-27 北京融七牛信息技术有限公司 一种基于大数据的自动建模***
CN113177642A (zh) * 2021-05-24 2021-07-27 北京融七牛信息技术有限公司 一种针对数据不平衡的自动建模***

Also Published As

Publication number Publication date
WO2015052851A1 (ja) 2015-04-16
HK1209867A1 (zh) 2016-04-08
TW201514889A (zh) 2015-04-16
KR20150053256A (ko) 2015-05-15
JP2015076076A (ja) 2015-04-20
JP6059122B2 (ja) 2017-01-11
TWI597679B (zh) 2017-09-01

Similar Documents

Publication Publication Date Title
CN104718547A (zh) 顾客数据解析***
CN108205766A (zh) 信息推送方法、装置及***
CN108805598B (zh) 相似度信息确定方法、服务器及计算机可读存储介质
CN110008973B (zh) 一种模型训练方法、基于模型确定目标用户的方法及装置
CN104813315A (zh) 顾客数据分析/验证***
CN111125535A (zh) 理财产品推荐方法及装置
CN110555578A (zh) 一种销量预测方法和装置
CN104285233A (zh) 市场调查/分析***
CN111767458A (zh) 信息推送方法、装置、***及存储介质
CN104598449A (zh) 基于偏好的聚类
CN104239335A (zh) 特定用户信息获取方法及装置
CN111680213B (zh) 信息推荐方法、数据处理方法及装置
CN112395499B (zh) 信息推荐方法及装置、电子设备、存储介质
CN113886697A (zh) 基于聚类算法的活动推荐方法、装置、设备及存储介质
CN117291651A (zh) 美妆行业的自然复购预测模型的创建方法及其应用
CN111325255A (zh) 特定人群圈定方法、装置、电子设备及存储介质
CN107622409A (zh) 购车能力的预测方法和预测装置
EP3493082A1 (en) A method of exploring databases of time-stamped data in order to discover dependencies between the data and predict future trends
CN110766431A (zh) 判断用户对优惠券是否敏感的方法和装置
CN114119078A (zh) 目标资源确定方法、装置、电子设备及介质
JP6287280B2 (ja) 情報処理方法、プログラム、及び情報処理装置
CN107066602A (zh) 一种新闻信息推送方法及***
CN110727797A (zh) 标签生成方法、装置、电子设备和计算机可读介质
JP2017045337A (ja) デジタルマーケティングシステム
CN113781076B (zh) 提示方法、装置、设备及可读存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1209867

Country of ref document: HK

C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150617

REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1209867

Country of ref document: HK