CN112765467A - 一种服务推荐方法、装置、电子设备以及存储介质 - Google Patents
一种服务推荐方法、装置、电子设备以及存储介质 Download PDFInfo
- Publication number
- CN112765467A CN112765467A CN202110069949.7A CN202110069949A CN112765467A CN 112765467 A CN112765467 A CN 112765467A CN 202110069949 A CN202110069949 A CN 202110069949A CN 112765467 A CN112765467 A CN 112765467A
- Authority
- CN
- China
- Prior art keywords
- classification
- mode
- target
- users
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 112
- 230000006870 function Effects 0.000 claims description 50
- 238000005315 distribution function Methods 0.000 claims description 28
- 238000004590 computer program Methods 0.000 claims description 15
- 238000013459 approach Methods 0.000 claims description 3
- 230000000875 corresponding effect Effects 0.000 description 117
- 238000003066 decision tree Methods 0.000 description 39
- 230000008569 process Effects 0.000 description 15
- 230000000694 effects Effects 0.000 description 12
- 238000012545 processing Methods 0.000 description 12
- 230000004044 response Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 230000035945 sensitivity Effects 0.000 description 7
- 230000002159 abnormal effect Effects 0.000 description 5
- 230000002596 correlated effect Effects 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 102100023927 Asparagine synthetase [glutamine-hydrolyzing] Human genes 0.000 description 4
- 101100380329 Homo sapiens ASNS gene Proteins 0.000 description 4
- 230000001276 controlling effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 101100048480 Vaccinia virus (strain Western Reserve) UNG gene Proteins 0.000 description 3
- 230000001364 causal effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000000540 analysis of variance Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 238000010998 test method Methods 0.000 description 2
- 208000005156 Dehydration Diseases 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种服务推荐方法、装置、电子设备以及存储介质,该方法包括:获取多个用户的分类信息;针对每种分类方式,按照该种分类方式,根据多个用户的分类信息,将多个用户划分为多个用户群组;针对每种分类方式,根据按照该种分类方式分类所得到的多个用户群组之间使用目标出行服务的使用率的差异程度,确定该种分类方式的分类差异度;基于不同分类方式的分类差异度,从全部的分类方式中确定目标分类方式;确定目标分类方式所对应的多个用户群组中的目标用户群组,向目标用户群组中的用户推荐目标出行服务。通过本申请的上述分类方式能够确定出不同用户群组针对目标出行服务的反馈差异,以针对差异化场景进行精准服务推荐。
Description
技术领域
本申请涉及计算机技术领域,具体而言,涉及一种服务推荐方法、装置、电子设备以及存储介质。
背景技术
网约车平台为沟通服务请求端(乘客)和服务提供端(司机)的平台,服务请求端通过在网约车平台上发送打车请求,进而网约车平台根据打车请求生成订单,以发送至服务提供端,实现司机接收乘客发送的订单。
为了更好的服务乘客和司机,网约车平台一般会针对乘客和司机提供多种出行服务,以对打车过程进行干预从而促进完单。目前,用于分析一个干预(treatment)对一个结果(outcome)的影响的方式为A/B Test,但是上述方法考虑的是实验中所有样本的平均实验效果,这种均值分析的准确性较低。
除上述方式之外,还可以利用ANOVA回归模型来评估干预对结果的影响,在该方法中通过加入交互项,可以评估少量子人群的不同实验效果,即CATE(Conditional AverageTreatment Effect,条件平均因果效应)。
发明内容
有鉴于此,本申请的目的在于提供一种服务推荐方法、装置、电子设备以及存储介质,能够确定出不同用户群组针对目标出行服务的反馈差异,以针对差异化场景进行精准服务推荐。
根据本申请的一个方面,提供一种服务推荐方法,包括:获取多个用户的分类信息,所述分类信息包括用户的属性信息和用户使用目标出行服务的订单信息;针对每种分类方式,按照该种分类方式,根据所述多个用户的分类信息,将所述多个用户划分为多个用户群组;针对每种分类方式,根据按照该种分类方式分类所得到的多个用户群组之间使用所述目标出行服务的使用率的差异程度,确定该种分类方式的分类差异度;基于不同分类方式的分类差异度,从全部的分类方式中确定目标分类方式;向所述目标分类方式所对应的目标用户群组中的用户推荐所述目标出行服务,所述目标用户群组是从所述目标分类方式所对应的多个用户群组中确定的。
根据本申请的另一方面,提供一种服务推荐装置,包括:信息获取模块,获取多个用户的分类信息,所述分类信息包括用户的属性信息和用户使用目标出行服务的订单信息;分类模块,针对每种分类方式,按照该种分类方式,根据所述多个用户的分类信息,将所述多个用户划分为多个用户群组;差异度确定模块,针对每种分类方式,根据按照该种分类方式分类所得到的多个用户群组之间使用所述目标出行服务的使用率的差异程度,确定该种分类方式的分类差异度;目标分类确定模块,基于不同分类方式的分类差异度,从全部的分类方式中确定目标分类方式;服务推荐模块,向所述目标分类方式所对应的目标用户群组中的用户推荐目标出行服务,所述目标用户群组是从所述目标分类方式所对应的多个用户群组中确定的。
本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的服务推荐方法的步骤。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述的服务推荐方法的步骤。
本申请实施例还提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现如上述的服务推荐方法的步骤。
本申请实施例提供的服务推荐方法:获取多个用户的分类信息,所述分类信息包括用户的属性信息和用户使用目标出行服务的订单信息;针对每种分类方式,按照该种分类方式,根据所述多个用户的分类信息,将所述多个用户划分为多个用户群组;针对每种分类方式,根据按照该种分类方式分类所得到的多个用户群组之间使用所述目标出行服务的使用率的差异程度,确定该种分类方式的分类差异度;基于不同分类方式的分类差异度,从全部的分类方式中确定目标分类方式;向所述目标分类方式所对应的目标用户群组中的用户推荐所述目标出行服务,所述目标用户群组是从所述目标分类方式所对应的多个用户群组中确定的。
与现有技术相比,通过本申请的上述分类方式,能够确定出不同用户群组针对目标出行服务的反馈差异,有助于找到针对目标出行服务反馈较为明显的人群,以针对差异化场景进行服务推荐,从而提高服务推荐的准确性。
进一步的,通过引入数值分布函数来确保分类的稳定性,通过引入正则化函数来约束分类的过拟合,以保证分类结果的稳定性和精确性。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种服务推荐***的结构示意图;
图2示出了本申请实施例所提供的一种服务推荐方法的流程图;
图3示出了本申请实施例所提供的另一种服务推荐方法的流程图;
图4示出了本申请实施例所提供的决策树模型的示意图;
图5示出了本申请实施例所提供的一种服务推荐装置的结构示意图;
图6示出了本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例,都属于本申请保护的范围。
为了使得本领域技术人员能够使用本申请内容,结合特定应用场景“网约车(如快车、拼车或顺风车)”,给出以下实施方式。对于本领域技术人员来说,在不脱离本申请的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用场景。虽然本申请主要围绕网约车进行描述,但是应该理解,这仅是一个示例性实施例。
需要说明的是,本申请实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。
本申请中的术语“乘客”、“请求方”、“服务请求方”和“客户”可互换使用,以指代可以请求或订购服务的个人、实体或工具。本申请中的术语“司机”、“提供方”、“服务提供方”和“供应商”可互换使用,以指代可以提供服务的个人、实体或工具。本申请中的术语“用户”可以指代请求服务、订购服务、提供服务或促成服务的提供的个人、实体或工具。例如,用户可以是乘客、驾驶员、操作员等,或其任意组合。在本申请中,“乘客”和“乘客终端”可以互换使用,“驾驶员”和“驾驶员终端”可以互换使用。
本申请中的术语“服务请求”和“订单”可互换使用,以指代由乘客、服务请求方、司机、服务提供方、或供应商等、或其任意组合发起的请求。接受该“服务请求”或“订单”的可以是乘客、服务请求方、司机、服务提供方、或供应商等、或其任意组合。服务请求可以是收费的或免费的。
本申请中的术语“目标出行服务”,可以指由司机、服务提供方、或供应商等、或其任意组合提供的服务。接受或使用该“目标出行服务”的可以是乘客、服务请求方、司机、服务提供方、或供应商等、或其任意组合。目标出行服务可以是收费的或免费的。
本申请中使用的定位技术可以基于全球定位***(Global Positioning System,GPS)、全球导航卫星***(Global Navigation Satellite System,GLONASS),罗盘导航***(COMPASS)、伽利略定位***、准天顶卫星***(Quasi-Zenith Satellite System,QZSS)、无线保真(Wireless Fidelity,WiFi)定位技术等,或其任意组合。一个或多个上述定位***可以在本申请中互换使用。
本申请的一个方面涉及一种服务推荐***。该***可以实现服务器、服务请求端、服务提供端之间的交互,并能够基于目标群体中的多个用户的分类信息来对多个用户进行分类,以确定出分类所得到的不同用户群组针对目标出行服务的反馈差异,从而针对具有不同反馈差异的各用户群组进行个性化服务推荐。
本申请中的“目标出行服务”可指用于引导用户使用相应的目标出行方式的服务,示例性地,目标出行服务可包括但不限于以下的任意一种或多种:引导用户使用快车的服务、引导用户使用拼车的服务、引导用户使用顺风车的服务。
在本申请的实施例中,服务提供方可以在预定时间段内向目标群体中的多个用户推送目标出行服务,其相当于对用户的出行过程施加了干预,通过本申请的服务推荐方法可以确定出基于目标分类方式分类所得到的多个用户群组针对目标出行服务的反馈差异,即,确定出了不同用户群组针对所施加的干预的反馈效果。本申请的目的在于找到使得各用户群组对干预反馈差异最为明显的分类方式,以对不同用户群组进行针对性的服务推荐。
值得注意的是,在本申请提出申请之前,现有技术中通常是利用A/B Test方法来评估干预对结果的影响,但是A/B Test方法考虑的是实验中所有样本的平均实验效果,这种均值分析的准确性较低。
除此之外,现有技术中还可以通过个体因果效应(ITE,Individual TreatmentEffect)、平均因果效应(ATE,Average Treatment Effect)和条件平均因果效应(CATE,Conditional Average Treatment Effect)来评估干预对结果的影响。
目前,可以利用ANOVA回归模型来对CATE进行预估,其通过加入交互项,可以评估少量子人群的不同实验效果,即CATE。但其实验指标的选择需要依靠具有资深经验的工程师进行筛选,并且该方法不适合过多的实验指标做交叉,过多的交叉会使得回归方程的变量选择和结果解读变得异常繁琐。
然而,本申请提供的服务推荐***可以根据不同分类方式分类所得到的多个用户群组之间使用目标出行服务的使用率的差异程度来寻找到能够使得分类结果之间差异度最显著的目标分类方式,以针对基于目标分类方式分类所获得的各用户群组进行个性化服务推荐。
图1是本申请实施例提供的一种服务推荐***100的结构示意图。例如,服务推荐***100可以是用于诸如出租车、代驾服务、快车、拼车、公共汽车服务、驾驶员租赁、或班车服务之类的运输服务、或其任意组合的在线运输服务平台。服务推荐***100可以包括服务器110、网络120、服务请求端130、服务提供端140、和数据库150中的一种或多种。
在一些实施例中,服务器110可以包括处理器。处理器可以处理与服务请求有关的信息和/或数据,以执行本申请中描述的一个或多个功能。例如,处理器可以基于从服务请求端130获得的服务请求来确定目标车辆。在一些实施例中,处理器可以包括一个或多个处理核(例如,单核处理器(S)或多核处理器(S))。仅作为举例,处理器可以包括中央处理单元(Central Processing Unit,CPU)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、专用指令集处理器(Application Specific Instruction-setProcessor,ASIP)、图形处理单元(Graphics Processing Unit,GPU)、物理处理单元(Physics Processing Unit,PPU)、数字信号处理器(Digital Signal Processor,DSP)、现场可编程门阵列(Field Programmable Gate Array,FPGA)、可编程逻辑器件(Programmable Logic Device,PLD)、控制器、微控制器单元、简化指令集计算机(ReducedInstruction Set Computing,RISC)、或微处理器等,或其任意组合。
在一些实施例中,服务请求端130和服务提供端140对应的设备类型可以是移动设备,比如可以包括智能家居设备、可穿戴设备、智能移动设备、虚拟现实设备、或增强现实设备等,也可以是平板计算机、膝上型计算机、或机动车辆中的内置设备等。
在一些实施例中,数据库150可以连接到网络120以与服务推荐***100中的一个或多个组件(例如,服务器110,服务请求端130,服务提供端140等)通信。服务推荐***100中的一个或多个组件可以经由网络120访问存储在数据库150中的数据或指令。在一些实施例中,数据库150可以直接连接到服务推荐***100中的一个或多个组件,或者,数据库150也可以是服务器110的一部分。
下面结合上述图1示出的服务推荐***100中描述的内容,对本申请实施例提供的服务推荐方法进行详细说明。
参照图2所示,为本申请实施例提供的一种服务推荐方法的流程示意图,该方法可以由服务推荐***100中的服务器110来执行,具体执行过程为:
S101、获取多个用户的分类信息。这里,分类信息包括但不限于用户的属性信息和用户使用目标出行服务的订单信息。
例如,服务提供方可以在预定时间段内向多个用户推送目标出行服务,并获取每个用户的属性信息和每个用户在上述预定时间段内使用目标出行服务的订单信息。
作为示例,用户的属性信息可包括但不限于以下至少一项:性别、年龄、驾龄、学历、所在城市、国籍、职业。例如,可以基于定位技术确定用户所在的位置,基于用户所在的位置来确定该用户所在城市。
作为示例,用户使用目标出行服务的订单信息可包括但不限于以下至少一项:应答率、应答等待时长、接驾距离、用户的在线时长、订单总资源(如订单总成交额)、历史完单波动指数、完单数量、针对目标出行服务的敏感指数、用户所处的服务阶段、用户的分组标识。用户的分组标识可用于指示用户是属于实验组还是对照组。
这里,用户的历史完单波动指数可用于表征用户在单位时间内完单数量的变化,针对目标出行服务的敏感指数可用于表征用户针对目标出行服务的使用频次,该敏感指数可与用户针对目标出行服务的使用频次呈正相关性,如,用户针对目标出行服务的使用频次越高,则敏感指数越高,用户针对目标出行服务的使用频次越低,则敏感指数越低。
此外,在本申请中,还可以预先划分多个服务阶段,作为示例,多个服务阶段可包括但不限于:新生期、活跃期、流失期、激活期。
在此情况下,根据用户的订单信息来确定用户当前处于多个服务阶段中的哪一服务阶段。例如,以订单信息为完单数量为例,可以基于用户的完单数量与不同服务阶段对应的匹配条件的匹配结果,确定用户当前所处的服务阶段。
S102、针对每种分类方式,按照该种分类方式,根据多个用户的分类信息,将多个用户划分为多个用户群组。
在该步骤中,可以根据所获取的多个用户的分类信息确定多个用户特征,通过遍历每个用户特征来对多个用户进行划分。
在本申请中,每种分类方式的分类维度(即,特征维度)均是相同的,不同分类方式所对应的相同分类维度的分类阈值是不同的。
这里,多个分类维度可指多个用户特征,每个用户特征对应多个分类阈值,基于此,所有的分类方式可包括针对多个用户特征的遍历顺序不同以及不同用户特征对应的多个分类阈值所组合形成的多种分类方式。
在一可选实施例中,可以将多个用户的分类信息,输入到决策树模型中,以获得多个用户群组。此时,该决策树模型为一个多层的树结构的模型,每层的***节点对应一个用户特征,基于多个用户特征来进行逐层分类,以获得多个用户群组。
作为示例,多个用户特征可包括以下至少一项:性别、年龄、驾龄、学历、所在城市、国籍、职业、应答率、应答等待时长、接驾距离、用户的在线时长、订单总资源、历史完单波动指数、完单数量、针对目标出行服务的敏感指数、用户所处的服务阶段。
S103、针对每种分类方式,根据按照该种分类方式分类所得到的多个用户群组之间使用目标出行服务的使用率的差异程度,确定该种分类方式的分类差异度。
在该步骤中,针对每种分类方式,按照该种分类方式分类可得到多个用户群组,确定多个用户群组之间使用目标出行服务的使用率的差异程度,从而确定出该种分类方式的分类差异度。这里,分类差异度可用于表征按照该种分类方式所得到的分类结果对目标出行服务的使用率的差异程度。
例如,每种分类方式的分类差异度可以根据该种分类方式下每个分类维度的分类阈值的分类差异度计算出来。作为示例,可针对每个分类维度,确定该分类维度下的每个分类阈值的分类差异度,从该分类维度下的全部分类阈值中选择出目标分类阈值,将所选择的目标分类阈值的分类差异度确定为该分类维度的分类差异度。这里,可将全部分类阈值的分类差异度中最大分类差异度对应的分类阈值确定为目标分类阈值。
S104、基于不同分类方式的分类差异度,从全部的分类方式中确定目标分类方式。
在该步骤中,可将分类差异度最大的分类方式确定为目标分类方式。
例如,可基于不同分类方式的分类差异度的排名,来从全部的分类方式中确定目标分类方式。针对不同分类方式,可以按照分类差异度由高到低的顺序进行排名,此时,可将排在首位的分类差异度所对应的分类方式确定为目标分类方式,或者,也可以按照分类差异度由低到高的顺序进行排名,此时,可将排在最后一位的分类差异度所对应的分类方式确定为目标分类方式。
S105、向目标分类方式所对应的目标用户群组中的用户推荐目标出行服务。
在本申请的一示例中,上述步骤S101中的多个用户可为目标群体中的部分用户,此时可以基于部分用户的分类信息来确定出目标分类方式,然后基于所确定的目标分类方式对目标群体中的全部用户进行分类,以获得按照目标分类方式分类所得到的多个用户群组,从该多个用户群组中确定目标用户群组。但本申请不限于此,上述步骤S101中的多个用户也可为目标群体中的全部用户,此时利用目标群体中的全部用户的分类信息来确定出目标分类方式。
在该步骤中,可从目标分类方式所对应的多个用户群组中确定出目标用户群组,以向目标用户群组中的用户推荐目标出行服务。
在一示例中,可以通过以下方式来确定目标用户群组:根据目标分类方式所对应的不同用户群组的服务推荐优先级,从多个用户群组中选择出目标用户群组。
这里,目标用户群组的服务推荐优先级高于其他用户群组的服务推荐优先级。应理解,目标用户群组的服务推荐优先级高于其他用户群组的服务推荐优先级可指目标用户群组的服务推荐优先级大于设定值,或者目标用户群组的服务推荐优先级大于全部用户群组的服务推荐优先级的中间值等,本申请并不限于目标用户群组的推荐优先级是全部用户群组的服务推荐优先级中的最大值这一种情况。
也就是说,目标用户群组可以是目标分类方式所对应的不同用户群组中的一个用户群组,也可以是不同用户群组中的部分用户群组(多个用户群组的情况)。
在一实施例中,每个用户群组的服务推荐优先级可以根据该用户群组中的用户使用目标出行服务的完单数量来确定,服务推荐优先级与完单数量呈正相关性。
例如,用户群组中的用户使用目标出行服务的完单数量越多,则该用户群组的服务推荐优先级越高,用户群组中的用户使用目标出行服务的完单数量越少,则该用户群组的服务推荐优先级越低。也就是说,上述所确定出的服务推荐优先级越高,表明该高服务推荐优先级对应的用户群组中的用户使用目标出行服务的可能性更高,后续针对高服务推荐优先级的用户群组中的用户推荐目标出行服务,有助于提升这类用户群组中的用户对目标出行服务的使用率。
参照图3所示,为本申请实施例提供的另一种服务推荐方法的流程示意图,该方法可以由服务推荐***100中的服务器来执行,具体执行过程为:
S201、获取多个用户的分类信息。这里,分类信息包括但不限于用户的属性信息和用户使用目标出行服务的订单信息。
例如,服务提供方可以在预定时间段内向多个用户推送目标出行服务,并获取每个用户的属性信息和每个用户在上述预定时间段内使用目标出行服务的订单信息。
其中,S201的描述可以参照上述图2所示的S101的描述,并且能达到相同的技术效果,对此不做赘述。
S202、对所获取的分类信息进行预处理。
这里,分类信息可包括数值类型的分类信息和非数值类型的分类信息。其中,数值类型的分类信息可指该分类信息能够用具体数值来进行表示。例如,数值类型的分类信息可包括年龄、驾龄、应答率、用户的在线时长、历史完单波动指数、完单数量等。
非数值类型的分类信息可指该分类信息无法使用具体数值来进行表示。例如,非数值类型的分类信息可包括学历、性别、职业、用户所处的服务阶段等。
在该步骤中,可以针对数值类型的分类信息进行预处理。作为示例,该预处理可包括但不限于以下至少一项:缺失值补充、异常值剔除、异常值修正。例如,可以查看数值类型的分类信息的五分位数的分布,对缺失值采用众数进行补齐,对于异常值数据进行删除或修正操作。
S203、对所获取的分类信息进行特征工程处理。
在该步骤中,可以针对非数值类型的分类信息可进行特征工程处理。作为示例,该特征工程处理可包括:对分类信息采用One Hot编码完成“二进制化”操作,以形成针对该分类信息的字符串编码。
S204、确定多个用户特征。
在该步骤中,可以基于所获取的多个用户的分类信息确定多个用户特征。例如,利用预处理后的数值类型的分类信息和特征工程处理后的非数值类型的分类信息,确定多个用户特征。
作为示例,多个用户特征可包括以下至少一项:性别、年龄、驾龄、学历、所在城市、国籍、职业、应答率、应答等待时长、接驾距离、用户的在线时长、订单总资源、历史完单波动指数、完单数量、针对目标出行服务的敏感指数、用户所处的服务阶段。
S205、确定每个用户特征的多个分类阈值。
在本实施例中,每种分类方式的分类维度(即,特征维度)均是相同的,不同分类方式所对应的相同分类维度的分类阈值是不同的。
这里,多个分类维度可指多个用户特征,每个用户特征(即,每个分类维度)对应多个分类阈值。也就是说,每个用户特征对应多个分类阈值,从多个分类阈值中选取该用户特征的目标分类阈值。
根据数值类型的分类信息确定的用户特征属于数值类型的用户特征,以用户特征为历史完单波动指数为例,针对数值类型的用户特征,可以遍历目标群体中所有用户的历史完单波动指数,按照从小到大或者从大到小的顺序进行排序,选取相邻历史完单波动指数的中间值作为一个分类阈值,从而形成该用户特征的多个分类阈值。
针对非数值类型的用户特征,可以通过穷举的方式选取出该用户特征的全部分类阈值,以形成该用户特征的多个分类阈值。
S206、确定每个用户特征的每个分类阈值的分类差异度。
在本申请实施例中,针对每种分类方式,根据按照该种分类方式分类所得到的多个用户群组中的用户对目标出行服务的使用率,利用数值分布函数确定该种分类方式的数值分布指数,针对每种分类方式,根据按照该种分类方式分类所得到的多个用户群组中的用户对目标出行服务的使用率,利用正则化函数确定该种分类方式的正则化指数,针对每种分类方式,根据所确定的数值分布指数和正则化指数确定该种分类方式的分类差异度。作为示例,数值分布函数用于表征不同分类方式所对应的使用率的差异程度,正则化函数用于控制分类过拟合。
例如,可通过以下方式确定每种分类方式的分类差异度:基于多个用户生成多个候选用户群体;针对每种分类方式,根据每个候选用户群体按照该种分类方式分类所得到的每个用户群组使用目标出行服务的使用率,确定在该种分类方式下每个候选用户群体对应的分布差异指标;针对每种分类方式,根据在该种分类方式下每个候选用户群体对应的分布差异指标,利用数值分布函数确定该种分类方式的数值分布指数;针对每种分类方式,根据在该种分类方式下每个候选用户群体对应的使用率,利用正则化函数确定该种分类方式的正则化指数;针对每种分类方式,根据该种分类方式的数值分布指数和正则化指数确定该种分类方式的分类差异度。
上述每个候选用户群体中均包括多个用户中的部分用户,也就是说,每个候选用户群体之间包括的用户可以重复。
在本申请的服务推荐方法中,还可以先对各分类方式的分类结果是否具备显著差异进行判断,然后针对具备显著差异的分类方式,确定其分类差异度。
例如,确定每种分类方式的分类差异度可包括:针对每种分类方式,确定在该种分类方式下所述多个候选用户群体中符合要求的候选用户群体的数量,符合要求的候选用户群体的分布差异指标落入预定置信区间内;针对每种分类方式,根据符合要求的候选用户群体的数量,确定按照该种分类方式分类所获得的分类结果是否具备显著差异;确定具备显著差异的分类方式的分类差异度。这里,针对不具备显著差异的分类方式可进行舍弃,无需计算其分类差异度。
在本申请的一优选实施例中,每种分类方式的分类差异度是根据该种分类方式下每个分类维度的分类阈值的分类差异度计算出来的,下面介绍确定每个分类维度的分类阈值的分类差异度的过程。
例如,可预先构建一***目标函数,针对每个用户特征(即,每个分类维度),计算该用户特征的每个分类阈值的***目标函数值,将计算得到的***目标函数值确定为对应的分类阈值的分类差异度。
在一示例中,***目标函数可包括但不限于数值分布函数和正则化函数。其中,针对每个用户特征的每个分类阈值,数值分布函数可用于表征按照该分类阈值分类所得到的用户群组对目标出行服务的使用率的差异程度,正则化函数可用于控制分类过拟合。
例如,针对每个用户特征,根据按照该用户特征的每个分类阈值分类所得到的多个用户群组中的用户对目标出行服务的使用率,分别利用数值分布函数和正则化函数来确定数值分布指数以及正则化指数,并根据所确定的数值分布指数和正则化指数确定该用户特征的每个分类阈值的分类差异度。
这里,***目标函数中的数值分布函数表征的是分类结果中不同用户群组对目标出行服务的使用率分布情况,基于此,在本申请中可以基于随机抽样的原理,针对每个分类阈值,从该分类阈值对应的多个用户中进行多次抽取获得多个候选用户群体,例如,可采用Bootstrap随机抽样方式,即,有放回的重复抽样方法,获得多个候选用户群体。
针对每个分类阈值,根据每个候选用户群体按照该分类阈值分类所得到的第一候选用户群组和第二候选用户群组对目标出行服务的使用率,分别确定该分类阈值的数值分布指数和正则化指数,并根据所确定的数值分布指数和正则化指数,确定该分类阈值的分类差异度。也就是说,针对每个分类阈值进行多次抽样,可以获得该分类阈值下的使用率分布情况。
在一可选的实施例中,在确定每个用户特征的每个分类阈值的分类差异度之前,本申请的服务推荐方法可还包括:
针对指定用户特征的每个分类阈值,确定在该分类阈值下从多个候选用户群体中所选择的符合要求的候选用户群体的数量,符合要求的候选用户群体的分布差异指标落入预定置信区间内。该分布差异指标用于表征按照该分类阈值分类所得到的第一候选用户群组和第二候选用户群组对目标出行服务的使用率的差异程度;针对每个分类阈值,根据符合要求的候选用户群体的数量确定该分类阈值下所获得的分类结果是否具备显著差异。
如果符合要求的候选用户群体的数量不小于(大于或者等于)设定阈值,则确定该分类阈值下所获得的分类结果具备显著差异,继续确定具备显著差异的分类阈值的分类差异度。如果符合要求的候选用户群体的数量小于设定阈值,则确定该分类阈值下所获得的分类结果不具备显著差异,此时可将该分类阈值舍弃,无需继续确定该分类阈值的分类差异度。作为示例,上述预定置信区间可为能够确定各分类结果之间的显著差异的置信区间,例如,该预定置信区间可包括5%和95%的置信区间,但本申请不限于此,本领域技术人员也可以根据需要来调整预定置信区间的取值范围。
通过上述方式可以在确定分类差异度之前,预先剔除统计不显著的切分方式,以提高处理效率。
下面介绍确定每个用户特征的每个分类阈值的分类差异度的具体过程。
在本申请的实施例中,每个分类阈值的分类结果具有两个分支,例如,以用户特征为年龄为例,假设年龄对应的多个分类阈值可包括30岁、40岁、50岁,即,以30岁作为分类阈值进行分类、以40岁作为分类阈值进行分类、以50岁作为分类阈值进行分类等。对于以30岁作为分类阈值进行分类,其分类结果的两个分支为小于或等于30岁的一支和大于30岁的一支,以此类推,本申请不再一一举例。
例如,针对指定分类维度的每个分类阈值,根据该分类阈值,将每个候选用户群体划分为第一候选用户群组和第二候选用户群组,此时,第一候选用户群组可指根据该分类阈值进行分类的分类结果中的一支,第二候选用户群组可指根据该分类阈值进行分类的分类结果中的另一支。
针对指定分类维度的每个分类阈值,根据该分类阈值划分出的第一候选用户群组的第一***指数和第二候选用户群组的第二***指数,分别确定该分类阈值下每个候选用户群体对应的分布差异指标。
这里,第一***指数可用于表征第一候选用户群组中的用户对目标出行服务的使用率,第二***指数可用于表征第二候选用户群组中的用户对目标出行服务的使用率。
具体地,针对指定分类维度的每个分类阈值,根据该分类阈值下所有候选用户群体对应的分布差异指标的平均值和分布差异指标的方差,确定该分类阈值的数值分布指数。
针对指定分类维度的每个分类阈值,根据该分类阈值下每个候选用户群体对应的分布差异指标,利用数值分布函数确定该分类阈值的数值分布指数。
具体地,针对指定分类维度的每个分类阈值,基于该分类阈值下所有候选用户群体对应的第一候选用户群组的第一***指数,计算该分类阈值的第一***指数的方差;针对指定分类维度的每个分类阈值,基于该分类阈值下所有候选用户群体对应的第二候选用户群组的第二***指数,计算该分类阈值的第二***指数的方差;针对指定分类维度的每个分类阈值,基于约束参数、第一***指数的方差、第二***指数的方差,确定该分类阈值的正则化指数。
作为示例,约束参数的大小与正则化函数对分类过拟合的影响程度呈正相关性。也就是说,约束参数越大,则正则化函数对分类过拟合的约束程度越大,约束参数越小,则正则化函数对分类过拟合的约束程度越小。
有时模型识别出异常、不稳定的场景是由于模型错误的识别个体随机特征、泛化能力变弱的表现,针对这一问题,在***目标函数中引入正则化函数,利用正则化函数来控制模型的过拟合,即分类之后两个分支的标准差不能过大,通过引入约束参数λ控制正则化函数对过拟合控制的强弱。
针对指定分类维度的每个分类阈值,基于该分类阈值的数值分布指数和正则化指数,确定该分类阈值的分类差异度。例如,针对每个分类阈值,可将数值分布指数与正则化指数的差值,确定为该种选取方式的分类差异度。
这里,指定分类维度可指多个分类维度中的任一分类维度,也就是说,针对每个分类维度,通过重复上述方式步骤,来确定出每个分类维度的每个分类阈值的分类差异度。
S207、基于分类差异度,确定目标分类方式。
例如,在通过上述方式确定出指定分类维度的每个分类阈值的分类差异度之后,可从全部分类阈值中选择出目标分类阈值,将所选择的目标分类阈值的分类差异度确定为指定分类维度的分类差异度。
在本申请的实施例中,可基于多个用户特征来进行逐层分类,以获得多个用户群组。每层的***节点对应一用户特征,针对每层的***节点,在通过上述过程确定出各用户特征的目标分类阈值之后,将各用户特征的目标分类阈值的分类差异度进行比较,将其中最大分类差异度对应的用户特征确定为该层的***节点,基于最大分类差异度对应的用户特征的目标分类阈值确定该层的***节点的分类方式。
利用上述方式确定出的每层的***节点对应的用户特征以及每层的***节点对应的分类方式,形成了针对多个用户的目标分类方式。
S208、向目标分类方式所对应的目标用户群组中的用户推荐目标出行服务。
在该步骤中,可从目标分类方式所对应的多个用户群组中确定出目标用户群组,以向目标用户群组中的用户推荐目标出行服务。这里,目标出行服务为用于引导目标用户群组中的用户使用目标出行方式的服务以促进完单,例如,针对实验组用户发放补贴(如派发优惠券)的形式来促进完单。
其中,S208的描述可以参照上述图2所示的S105的描述,并且能达到相同的技术效果,对此不做赘述。
除此之外,本申请的服务推荐方法可还包括:对目标出行服务进行调整,向其他用户群组推荐调整后的目标出行服务。
这里,对目标出行服务的调整可指各种能够有助于提升目标出行服务的使用率的手段,作为示例,对目标推送服务进行调整的方式可包括但不限于:对实验对象、实验变量等多方面的调整,用以提高目标出行服务被推荐给其他用户群组中的用户后的使用率。
在本申请的一优选实施例中,可以利用决策树模型来实现上述针对目标群体中的多个用户的分类过程。下面参照图4来介绍基于决策树模型对目标群体中的多个用户的分类过程。
图4示出了本申请实施例所提供的决策树模型的示意图。
决策树模型为由多个***节点和多个叶子节点构成的多层树形结构,多个***节点中的每个***节点对应一用户特征,多个叶子节点中的每个叶子节点对应一用户群组以及该用户群组的服务推荐指标,该服务推荐指标用于表征用户群组中的用户使用目标出行服务的完单数量。
也就是说,决策树模型为基于用户特征与用户群组之间的关联关系构建得到的树形结构,在本示例中,该决策树模型为二叉树,即,每个***节点具有两个分支。
下面介绍构建决策树模型的过程。
在本示例中,可以采用随机森林思想Bootstrap,从目标群体的全部用户中抽取N份训练集合,基于该N份训练集合来对决策树模型进行训练,并从目标群体的全部用户中抽取M份测试集合,基于M份测试集合来验证决策树模型的分类精度。
如果决策树模型的分类精度达到预设分类精度要求,则将目标群体中的全部用户的分类信息输入到决策树模型中,以对目标群体中的全部用户进行分类。如果决策树模型的分类精度没有达到预设分类精度要求,则可继续对该决策树模型进行训练。
也就是说,可以利用目标群体中的一部分用户的分类信息来训练决策树模型,再利用目标群体中的另一部分用户的分类信息来验证决策树模型的分类精度,利用达到预设分类精度要求的决策树模型来对目标群体中的全部用户进行分类。
具体训练过程如下:获取目标群体中的多个用户的分类信息,并基于所获取的分类信息确定多个用户特征,可记为:x1,…,xn,其中n表示用户特征的数量,并确定每个用户的分组状态(实验组或对照组)。
针对决策树的第一层,该第一层对应的可选用户特征为全部用户特征,每个用户特征对应多个分类阈值。
在本示例中,假设存在三个用户特征(n=3),如用户特征A、用户特征B、用户特征C,用户特征A对应3个分类阈值(相当于对应3种候选分类方式),用户特征B对应2个分类阈值,用户特征C对应4个分类阈值。
在此情况下,可以先针对用户特征A,分别按照用户特征A所对应的3个分类阈值对多个用户进行分类,分别确定用户特征A对应的3个分类阈值的分类差异度。
例如,针对用户特征A的第一个分类阈值,通过有放回随机抽样的方式,从该分类阈值对应的多个待选用户(第一层对应的是目标群体中的全部用户)中进行多次抽取获得多个候选用户群体,针对每个候选用户群体,确定该候选用户群体按照第一个分类阈值分类划分得到的第一候选用户群组(即,第一分支)的第一***指数和第二候选用户群组(即,第二分支)的第二***指数。
在本示例中,以投资回报率(ROI,Return on Investment)作为***指数来表征每个候选用户群组中的用户对目标出行服务的使用率。在此情况下,第一***指数可指目标出行服务被推荐给第一候选用户群组中的各用户后所带来的投资回报率,第二***指数可指目标出行服务被推荐给第二候选用户群组中的各用户后所带来的投资回报率。
目前直接对ROI进行建模的挑战是非常大的,首先ROI这个指标本身无法求和或者计算平均值,所以传统CART树模型所采用的Gini系数和Impurity等***标准不能直接使用。并且ROI指标存在不稳定的特点,这也为建模带来一定的难度。
针对上述问题,在本申请中是基于用户特征来构建决策树模型,将ROI作为评估决策树模型中的各***节点的分类方式差异程度的一个评价指标。在本示例中,基于ROI来构建决策树模型的***目标函数,将使得***目标函数值最大的分类方式,确定为***节点的最终分类方式。也就是说,决策树模型中的每个***节点均以***目标函数最大化为目标(也可以说是以投资回报率最大化为目标)来进行***,从而挖掘出具有显著差异的ROI场景。
在本示例中,假设关注的是在预定时间段内针对目标群体中的各用户推荐目标出行服务所带来的完单资源(如,完单成交总额,也可以称为完单GMV)的变化,以目标出行服务为针对目标出行方式进行补贴(如派发优惠券)为例,此时,可利用如下公式来计算每一分支的***指数:
公式(1)中,ROI表示按照一个分类阈值分类所得到的一个分支的***指数,GMVtreatment表示该分支对应的候选用户群组中属于实验组用户的完单成交总额,GMVcontrol表示该分支对应的候选用户群组中属于对照组用户的完单成交总额,Subsidytreatment表示针对该分支对应的候选用户群组中属于实验组用户的补贴费用,Subsidycontrol表示针对该分支对应的候选用户群组中属于对照组用户的补贴费用。
通过上述公式(1),可以通过计算得到的ROI来衡量补贴带来的完单成交总额增量,即考虑到了补贴费用,基于此可以获知在总体预算约束情况下的最大化增量GMV,避免了现有算法仅考虑GMV提升,但未考虑到补贴的实际费用的问题,即现有算法存在高补贴带来高收益的情况。
应理解,上述示例中是以完单资源为例进行介绍的,但本申请不限于此,还可以运用于对不同的关注点进行场景挖掘,只需要修改建模时的y值即可,y值可为连续变量也可以是离散变量。上述应用场景为预定时间段内补贴带来的完单成交总额增量,如将y修改为司机在预定时间段内的出车率,即可挖掘出补贴带来的出车率差异化场景。
继续上述示例,针对用户特征A的第一个分类阈值,在通过上述公式(1)计算出该分类阈值下第一候选用户群组的第一***指数和第二候选用户群组的第二***指数之后,分别计算该分类阈值下每个候选用户群体对应的分布差异指标。
例如,针对每个候选用户群体,可将该分类阈值下第一候选用户群组的第一***指数与第二候选用户群组的第二***指数的差值,确定为该候选用户群体对应的分布差异指标。
作为示例,可利用如下公式来计算每个候选用户群体对应的分布差异指标:
ROIgap=ROIleft-ROIright (2)
公式(2)中,ROIgap表示候选用户群体的分布差异指标,ROIleft表示该候选用户群体划分出的第一候选用户群组的第一***指数,即,二叉树分类结构中的左节点的***指数,ROIright表示该候选用户群体划分出的第二候选用户群组的第二***指数,即,二叉树分类结构中的右节点的***指数。
在此情况下,***目标函数可利用如下公式来表示:
公式(3)中,MAX表示***目标函数值,即,分类阈值的分类差异度,等式右侧的被减数为数值分布函数,减数为正则化函数,表示多个候选用户群体对应的分布差异指标的平均值,σgap表示多个候选用户群体对应的分布差异指标的方差,σROIleft表示多个候选用户群体对应的第一***指数的方差,σROIright表示多个候选用户群体对应的第二***指数的方差,λ表示约束参数。
基于上述方式可以寻找到实验效果显著不同的子场景分类方式,同时加入正则化项保证子场景切分的稳定性,提高其泛化能力。
同理,针对用户特征B,分别按照用户特征B所对应的2个分类阈值对多个用户进行分类,通过上述步骤获得针对用户特征B的2个分类阈值的分类差异度。针对用户特征C,分别按照用户特征C所对应的4个分类阈值对多个用户进行分类,通过上述步骤获得针对用户特征C的4个分类阈值的分类差异度。
将所有用户特征的所有分类阈值的分类差异度进行比较,将最大分类差异度对应的用户特征确定为该层的***节点,将最大分类差异度对应的用户特征的目标分类阈值确定为该层的***节点的分类方式。例如,假设最大分类差异度对应是用户特征A的第二个分类阈值,则可将决策树模型的第一层的***节点确定为用户特征A,将用户特征A的第二个分类阈值确定为第一层的***节点的分类方式。
在本申请中,对所有用户特征的每个分类阈值计算两个分支的分布差异指标,采用随机森林的思想刻画分布差异指标分布,同时加入拟合项保证***稳定性,最终有效挖掘出ROI差异最显著的分类方式。
针对决策树模型的第二层,该第二层包括两个***节点,每个***节点对应的可选用户特征为N-1个用户特征,即,全部用户特征中除已确定的第一层***节点对应的用户特征之外的其他用户特征,每个用户特征对应多个分类阈值。
以上述示例为例,决策树模型的第一层的***节点为用户特征A,该决策树模型的第二层的一个***节点对应的是按照用户特征A的第二个分类阈值分类所得到的第一候选用户群组,决策树模型的第二层的另一个***节点对应的是按照用户特征A的第二个分类阈值分类所得到的第二候选用户群组。
针对上述决策树模型的第二层的一个***节点,可参照上述过程来分别确定用户特征B和用户特征C各自对应的不同分类阈值的分类差异度,以基于分类差异度确定出该一个***节点对应的用户特征以及该一个分类节点对应的分类方式。同理,确定上述决策树模型的第二层的另一个***节点对应的用户特征以及该另一个分类节点对应的分类方式。
在本示例中,针对决策树模型的第二层的一个***节点,假设根据按照用户特征A的第二个分类阈值分类所得到的第一候选用户群组,将该一个***节点确定为用户特征B,将用户特征B的第一个分类阈值确定为第二层的一个***节点的分类方式。针对决策树模型的第二层的另一个***节点,假设根据按照用户特征A的第二个分类阈值分类所得到的第二候选用户群组,将另一个***节点确定为用户特征C,将用户特征C的第二个分类阈值确定为第二层的另一个***节点的分类方式。则后续在决策树模型的第三层,可以针对按照用户特征B的第一个分类阈值分类所得到的第一候选用户群组和第二候选用户群组、按照用户特征C的第二个分类阈值分类所得到的第一候选用户群组和第二候选用户群组继续进行分类,以此类推,当遍历完所有用户特征之后,完成对目标群体中的多个用户的分类。
这里,在决策树模型中,任意一条从根节点到叶子节点的路径中的***节点对应的用户特征不重复,也就是说,第一层对应的可选用户特征为全部用户特征,第二层对应的可选用户特征为除已确定的第一层对应的用户特征之外的其他用户特征,以此类推。这样,在对所有用户特征遍历结束后,获得最终的决策树模型。
可将上述最终获得的决策树模型所对应的分类方式确定为目标分类方式,决策树模型的每个叶子节点对应的用户群组即为按照目标分类方式分类所得到的多个用户群组,计算每个用户群组的服务推荐指标,基于服务推荐指标来确定目标用户群组。在本示例中,可将投资回报率作为服务推荐指标来表征每个用户群组中的用户使用目标出行服务的完单数量。
例如,可将不小于预设阈值的服务推荐指标对应的用户群组确定为目标用户群组,将小于预设阈值的服务推荐指标对应的用户群组确定为其他用户群组,向目标分类方式所对应的目标用户群组中的用户推荐目标出行服务。
也就是说,最终确定出的目标用户群组为针对目标出行服务的反馈较为明显的人群,如果目标出行服务指针对快车出行服务派发优惠券,则目标用户群组可指针对派发的优惠券所带来的投资回报率较高的人群。
根据本申请的服务推荐方法,将投资回报率作为确定每个用户特征的分类方式的分类标准,能够有效的识别出具有ROI差异的多个用户群组,并且分类得到的不同分支需要在统计上具有显著差异并给出预设置信区间。另外,基于不同分支的方差来构建正则化函数,以剔除掉异常、不稳定场景,防止模型过拟合。
基于同一发明构思,本申请实施例中还提供了与服务推荐方法对应的服务推荐装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述服务推荐方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
参照图5所示,为本申请实施例所提供的一种服务推荐装置的结构示意图,该服务推荐装置300包括:信息获取模块301、分类模块302、差异度确定模块303、目标分类确定模块304、服务推荐模块305;其中,
信息获取模块301,用于获取多个用户的分类信息。这里,分类信息包括用户的属性信息和用户使用目标出行服务的订单信息。
分类模块302,用于针对每种分类方式,按照该种分类方式,根据所述多个用户的分类信息,将所述多个用户划分为多个用户群组。
分类模块302可以根据所获取的多个用户的分类信息确定多个用户特征,通过遍历每个用户特征来对多个用户进行划分。
在本申请中,每种分类方式的分类维度(即,特征维度)均是相同的,不同分类方式所对应的相同分类维度的分类阈值是不同的。
这里,多个分类维度可指多个用户特征,每个用户特征对应多个分类阈值,基于此,所有的分类方式可包括针对多个用户特征的遍历顺序不同以及不同用户特征对应的多个分类阈值所组合形成的多种分类方式。
在一可选实施例中,分类模块302可以将多个用户的分类信息,输入到决策树模型中,以获得多个用户群组。此时,该决策树模型为一个多层的树结构的模型,每层的***节点对应一个用户特征,基于多个用户特征来进行逐层分类,以获得多个用户群组。
差异度确定模块303,用于针对每种分类方式,根据按照该种分类方式分类所得到的多个用户群组之间使用目标出行服务的使用率的差异程度,确定该种分类方式的分类差异度。
例如,每种分类方式的分类差异度可以根据该种分类方式下每个分类维度的分类阈值的分类差异度计算出来。作为示例,差异度确定模块303可针对每个分类维度,确定该分类维度下的每个分类阈值的分类差异度,从该分类维度下的全部分类阈值中选择出目标分类阈值,将所选择的目标分类阈值的分类差异度确定为该分类维度的分类差异度。这里,可将全部分类阈值的分类差异度中最大分类差异度对应的分类阈值确定为目标分类阈值。
目标分类确定模块304,用于基于不同分类方式的分类差异度,从全部的分类方式中确定目标分类方式。
例如,目标分类确定模块304可将分类差异度最大的分类方式确定为目标分类方式。
在一示例中,目标分类确定模块304可基于不同分类方式的分类差异度的排名,来从全部的分类方式中确定目标分类方式。针对不同分类方式,可以按照分类差异度由高到低的顺序进行排名,此时,可将排在首位的分类差异度所对应的分类方式确定为目标分类方式,或者,也可以按照分类差异度由低到高的顺序进行排名,此时,可将排在最后一位的分类差异度所对应的分类方式确定为目标分类方式。
服务推荐模块305,向目标分类方式所对应的目标用户群组中的用户推荐目标出行服务。
例如,服务推荐模块305可从目标分类方式所对应的多个用户群组中确定出目标用户群组,以向目标用户群组中的用户推荐目标出行服务。
在一示例中,服务推荐模块305可以通过以下方式来确定目标用户群组:根据目标分类方式所对应的不同用户群组的服务推荐优先级,从多个用户群组中选择出目标用户群组。
这里,目标用户群组的服务推荐优先级高于其他用户群组的服务推荐优先级。目标用户群组可以是目标分类方式所对应的不同用户群组中的一个用户群组,也可以是不同用户群组中的部分用户群组(多个用户群组的情况)。
在一实施例中,每个用户群组的服务推荐优先级可以根据该用户群组中的用户使用目标出行服务的完单数量来确定,服务推荐优先级与完单数量呈正相关性。
一种可能的实施方式中,信息获取模块301,可还用于:对所获取的分类信息进行预处理以及特征工程处理。这里,分类信息可包括数值类型的分类信息和非数值类型的分类信息。信息获取模块301可以针对数值类型的分类信息进行预处理,可以针对非数值类型的分类信息可进行特征工程处理。
一种可能的实施方式中,分类模块302,具体用于:可以基于所获取的多个用户的分类信息确定多个用户特征,并确定确定每个用户特征对应的多个分类阈值。
根据数值类型的分类信息确定的用户特征属于数值类型的用户特征,以用户特征为历史完单波动指数为例,针对数值类型的用户特征,分类模块302可以遍历目标群体中所有用户的历史完单波动指数,按照从小到大或者从大到小的顺序进行排序,选取相邻历史完单波动指数的中间值作为一个分类阈值,从而形成该用户特征的多个分类阈值。
针对非数值类型的用户特征,分类模块302可以通过穷举的方式选取出该用户特征的全部分类阈值,以形成该用户特征的多个分类阈值。
一种可能的实施方式中,差异度确定模块303,可还用于:确定每个用户特征的每个分类阈值的分类差异度。
在本申请的一优选实施例中,差异度确定模块303可预先构建一***目标函数,针对每个用户特征(即,每个分类维度),计算该用户特征的每个分类阈值的***目标函数值,将计算得到的***目标函数值确定为对应的分类阈值的分类差异度。
在一示例中,***目标函数可包括但不限于数值分布函数和正则化函数。其中,针对每个用户特征的每个分类阈值,数值分布函数可用于表征按照该分类阈值分类所得到的用户群组对目标出行服务的使用率的差异程度,正则化函数可用于控制分类过拟合。
例如,差异度确定模块303针对每个用户特征,根据按照该用户特征的每个分类阈值分类所得到的多个用户群组中的用户对目标出行服务的使用率,分别利用数值分布函数和正则化函数来确定数值分布指数以及正则化指数,并根据所确定的数值分布指数和正则化指数确定该用户特征的每个分类阈值的分类差异度。
关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
本申请实施例公开了TS1、一种服务推荐方法,包括:
获取多个用户的分类信息,所述分类信息包括用户的属性信息和用户使用目标出行服务的订单信息;
针对每种分类方式,按照该种分类方式,根据所述多个用户的分类信息,将所述多个用户划分为多个用户群组;
针对每种分类方式,根据按照该种分类方式分类所得到的多个用户群组之间使用所述目标出行服务的使用率的差异程度,确定该种分类方式的分类差异度;
基于不同分类方式的分类差异度,从全部的分类方式中确定目标分类方式;
向所述目标分类方式所对应的目标用户群组中的用户推荐所述目标出行服务,所述目标用户群组是从所述目标分类方式所对应的多个用户群组中确定的。
TS2、根据TS1所述的方法,其中,向所述目标分类方式所对应的目标用户群组中的用户推荐所述目标出行服务,包括:
根据所述目标分类方式所对应的每个用户群组的服务推荐优先级,从所述目标分类方式所对应的多个用户群组中选择出所述目标用户群组;所述目标用户群组的服务推荐优先级是根据该用户群组中的用户使用所述目标出行服务的完单数量确定的,所述服务推荐优先级与完单数量呈正相关性;
向所述目标分类方式所对应的目标用户群组中的用户推荐所述目标出行服务。
TS3、根据TS1所述的方法,其中,针对每种分类方式,根据按照该种分类方式分类所得到的多个用户群组之间使用所述目标出行服务的使用率的差异程度,确定该种分类方式的分类差异度,包括:
针对每种分类方式,根据按照该种分类方式分类所得到的多个用户群组中的用户对所述目标出行服务的使用率,利用数值分布函数确定该种分类方式的数值分布指数;
针对每种分类方式,根据按照该种分类方式分类所得到的多个用户群组中的用户对所述目标出行服务的使用率,利用正则化函数确定该种分类方式的正则化指数;
针对每种分类方式,根据所确定的数值分布指数和正则化指数确定该种分类方式的分类差异度;所述数值分布函数用于表征不同分类方式所对应的使用率的差异程度,所述正则化函数用于控制分类过拟合。
TS4、根据TS3所述的方法,其中,通过以下方式确定每种分类方式的分类差异度:
基于所述多个用户生成多个候选用户群体;每个所述候选用户群体中均包括所述多个用户中的部分用户;
针对每种分类方式,根据每个候选用户群体按照该种分类方式分类所得到的每个用户群组使用所述目标出行服务的使用率,确定在该种分类方式下每个候选用户群体对应的分布差异指标;
针对每种分类方式,根据在该种分类方式下每个候选用户群体对应的分布差异指标,利用数值分布函数确定该种分类方式的数值分布指数;
针对每种分类方式,根据在该种分类方式下每个候选用户群体对应的使用率,利用正则化函数确定该种分类方式的正则化指数;
针对每种分类方式,根据该种分类方式的数值分布指数和正则化指数确定该种分类方式的分类差异度。
TS5、根据TS4所述的方法,其中,确定每种分类方式的分类差异度,包括:
针对每种分类方式,确定在该种分类方式下所述多个候选用户群体中符合要求的候选用户群体的数量,符合要求的候选用户群体的分布差异指标落入预定置信区间内;
针对每种分类方式,根据符合要求的候选用户群体的数量,确定按照该种分类方式分类所获得的分类结果是否具备显著差异;
确定具备显著差异的分类方式的分类差异度。
TS6、根据TS4所述的方法,其中,每种分类方式的分类维度均是相同的;不同分类方式所对应的相同分类维度的分类阈值是不同的,
每种分类方式的分类差异度是根据该种分类方式下每个分类维度的分类阈值的分类差异度计算出来的;
指定分类维度的分类阈值的分类差异度是按照如下的方式计算得到的:
针对指定分类维度的每个分类阈值,利用数值分布函数确定该分类阈值的数值分布指数,并利用正则化函数确定该种分类方式的正则化指数;
针对指定分类维度的每个分类阈值,基于该分类阈值的数值分布指数和正则化指数,确定该分类阈值的分类差异度;
根据指定分类维度的每个分类阈值的分类差异度,从全部分类阈值中选择出目标分类阈值,将所选择的目标分类阈值的分类差异度确定为指定分类维度的分类差异度。
TS7、根据TS6所述的方法,其中,指定分类维度的每个分类阈值的数值分布指数是按照如下的方式计算得到的:
针对指定分类维度的每个分类阈值,根据该分类阈值,将每个候选用户群体划分为第一候选用户群组和第二候选用户群组;
针对指定分类维度的每个分类阈值,根据该分类阈值划分出的第一候选用户群组的第一***指数和第二候选用户群组的第二***指数,分别确定该分类阈值下每个候选用户群体对应的分布差异指标;所述第一***指数用于表征第一候选用户群组中的用户对所述目标出行服务的使用率,所述第二***指数用于表征第二候选用户群组中的用户对所述目标出行服务的使用率;
针对指定分类维度的每个分类阈值,根据该分类阈值下每个候选用户群体对应的分布差异指标,利用数值分布函数确定该分类阈值的数值分布指数;
指定分类维度的每个分类阈值的正则化指数是按照如下的方式计算得到的:
针对指定分类维度的每个分类阈值,根据该分类阈值划分出的第一候选用户群组的第一***指数和第二候选用户群组的第二***指数,利用正则化函数确定该分类阈值的正则化指数。
TS8、根据TS7所述的方法,其中,通过以下方式确定指定分类维度的每个分类阈值的数值分布指数:
针对指定分类维度的每个分类阈值,根据该分类阈值下所有候选用户群体对应的分布差异指标的平均值和分布差异指标的方差,确定该分类阈值的数值分布指数。
TS9、根据TS7所述的方法,其中,通过以下方式确定指定分类维度的每个分类阈值的正则化指数:
针对指定分类维度的每个分类阈值,基于该分类阈值下所有候选用户群体对应的第一候选用户群组的第一***指数,计算该分类阈值的第一***指数的方差;
针对指定分类维度的每个分类阈值,基于该分类阈值下所有候选用户群体对应的第二候选用户群组的第二***指数,计算该分类阈值的第二***指数的方差;
针对指定分类维度的每个分类阈值,基于约束参数、第一***指数的方差、第二***指数的方差,确定该分类阈值的正则化指数,所述约束参数的大小与对分类过拟合的影响程度呈正相关性。
TS10、根据TS1所述的方法,其中,所述属性信息包括以下至少一项:性别、年龄、驾龄、学历、所在城市、国籍、职业;
所述订单信息包括以下至少一项:应答率、应答等待时长、接驾距离、用户的在线时长、订单总资源、历史完单波动指数、完单数量、针对目标出行服务的敏感指数、用户所处的服务阶段、用户的分组标识。
本申请实施例公开了TS11、一种服务推荐装置,该服务推荐装置包括:
信息获取模块,用于获取多个用户的分类信息,所述分类信息包括用户的属性信息和用户使用目标出行服务的订单信息;
分类模块,用于针对每种分类方式,按照该种分类方式,根据所述多个用户的分类信息,将所述多个用户划分为多个用户群组;
差异度确定模块,用于针对每种分类方式,根据按照该种分类方式分类所得到的多个用户群组之间使用目标出行服务的使用率的差异程度,确定该种分类方式的分类差异度;
目标分类确定模块,用于基于不同分类方式的分类差异度,从全部的分类方式中确定目标分类方式;
服务推荐模块,向目标分类方式所对应的目标用户群组中的用户推荐目标出行服务,目标用户群组是从所述目标分类方式所对应的多个用户群组中确定的。
TS12、根据TS11所述的装置,其中,服务推荐模块根据所述目标分类方式所对应的每个用户群组的服务推荐优先级,从所述目标分类方式所对应的多个用户群组中选择出所述目标用户群组;所述目标用户群组的服务推荐优先级是根据该用户群组中的用户使用所述目标出行服务的完单数量确定的,所述服务推荐优先级与完单数量呈正相关性;
向所述目标分类方式所对应的目标用户群组中的用户推荐所述目标出行服务。
TS13、根据TS11所述的装置,其中,差异度确定模块针对每种分类方式,根据按照该种分类方式分类所得到的多个用户群组中的用户之间使用所述目标出行服务的使用率,确定该种分类方式的分布差异指标;
针对每种分类方式,根据按照该种分类方式分类所得到的多个用户群组中的用户对所述目标出行服务的使用率,利用数值分布函数确定该种分类方式的数值分布指数;
针对每种分类方式,根据按照该种分类方式分类所得到的多个用户群组中的用户对所述目标出行服务的使用率,利用正则化函数确定该种分类方式的正则化指数;
针对每种分类方式,根据所确定的数值分布指数和正则化指数确定该种分类方式的分类差异度;所述数值分布函数用于表征不同分类方式所对应的使用率的差异程度,所述正则化函数用于控制分类过拟合。
TS14、根据TS13所述的装置,其中,差异度确定模块通过以下方式确定每种分类方式的分类差异度:
基于所述多个用户生成多个候选用户群体;每个所述候选用户群体中均包括所述多个用户中的部分用户;
针对每种分类方式,根据每个候选用户群体按照该种分类方式分类所得到的每个用户群组使用所述目标出行服务的使用率,确定在该种分类方式下每个候选用户群体对应的分布差异指标;
针对每种分类方式,根据在该种分类方式下每个候选用户群体对应的分布差异指标,利用数值分布函数确定该种分类方式的数值分布指数;
针对每种分类方式,根据在该种分类方式下每个候选用户群体对应的使用率,利用正则化函数确定该种分类方式的正则化指数;
针对每种分类方式,根据该种分类方式的数值分布指数和正则化指数确定该种分类方式的分类差异度。
TS15、根据TS14所述的装置,其中,差异度确定模块针对每种分类方式,确定在该种分类方式下所述多个候选用户群体中符合要求的候选用户群体的数量,符合要求的候选用户群体的分布差异指标落入预定置信区间内,所述预定置信区间的分布差异指标的真实值的概率大于设定阈值;
针对每种分类方式,根据符合要求的候选用户群体的数量,确定按照该种分类方式分类所获得的分类结果是否具备显著差异;
确定具备显著差异的分类方式的分类差异度。
TS16、根据TS14所述的装置,其中,每种分类方式的分类维度均是相同的;不同分类方式所对应的相同分类维度的分类阈值是不同的,
每种分类方式的分类差异度是根据该种分类方式下每个分类维度的分类阈值的分类差异度计算出来的;
指定分类维度的分类阈值的分类差异度是按照如下的方式计算得到的:
针对指定分类维度的每个分类阈值,利用数值分布函数确定该分类阈值的数值分布指数,并利用正则化函数确定该种分类方式的正则化指数;
针对指定分类维度的每个分类阈值,基于该分类阈值的数值分布指数和正则化指数,确定该分类阈值的分类差异度;
根据指定分类维度的每个分类阈值的分类差异度,从全部分类阈值中选择出目标分类阈值,将所选择的目标分类阈值的分类差异度确定为指定分类维度的分类差异度。
TS17、根据TS16所述的装置,其中,指定分类维度的每个分类阈值的数值分布指数是按照如下的方式计算得到的:
针对指定分类维度的每个分类阈值,根据该分类阈值,将每个候选用户群体划分为第一候选用户群组和第二候选用户群组;
针对指定分类维度的每个分类阈值,根据该分类阈值划分出的第一候选用户群组的第一***指数和第二候选用户群组的第二***指数,分别确定该分类阈值下每个候选用户群体对应的分布差异指标;所述第一***指数用于表征第一候选用户群组中的用户对所述目标出行服务的使用率,所述第二***指数用于表征第二候选用户群组中的用户对所述目标出行服务的使用率;
针对指定分类维度的每个分类阈值,根据该分类阈值下每个候选用户群体对应的分布差异指标,利用数值分布函数确定该分类阈值的数值分布指数;
指定分类维度的每个分类阈值的正则化指数是按照如下的方式计算得到的:
针对指定分类维度的每个分类阈值,根据该分类阈值划分出的第一候选用户群组的第一***指数和第二候选用户群组的第二***指数,利用正则化函数确定该分类阈值的正则化指数。
TS18、根据TS17所述的装置,其中,差异度确定模块通过以下方式确定指定分类维度的每个分类阈值的数值分布指数:
针对指定分类维度的每个分类阈值,根据该分类阈值下所有候选用户群体对应的分布差异指标的平均值和分布差异指标的方差,确定该分类阈值的数值分布指数。
TS19、根据TS17所述的装置,其中,差异度确定模块通过以下方式确定指定分类维度的每个分类阈值的正则化指数:
针对指定分类维度的每个分类阈值,基于该分类阈值下所有候选用户群体对应的第一候选用户群组的第一***指数,计算该分类阈值的第一***指数的方差;
针对指定分类维度的每个分类阈值,基于该分类阈值下所有候选用户群体对应的第二候选用户群组的第二***指数,计算该分类阈值的第二***指数的方差;
针对指定分类维度的每个分类阈值,基于约束参数、第一***指数的方差、第二***指数的方差,确定该分类阈值的正则化指数,所述约束参数的大小与对分类过拟合的影响程度呈正相关性。
TS20、根据TS11所述的装置,其中,所述属性信息包括以下至少一项:性别、年龄、驾龄、学历、所在城市、国籍、职业;
所述订单信息包括以下至少一项:应答率、应答等待时长、接驾距离、用户的在线时长、订单总资源、历史完单波动指数、完单数量、针对目标出行服务的敏感指数、用户所处的服务阶段、用户的分组标识。
请参阅图6,图6为本申请实施例所提供的一种电子设备的结构示意图。如图6中所示,所述电子设备400包括处理器410、存储器420和总线430。
所述存储器420存储有所述处理器410可执行的机器可读指令,当电子设备400运行时,所述处理器410与所述存储器420之间通过总线430通信,所述机器可读指令被所述处理器410执行时,可以执行如上述图2以及图3所示方法实施例中的服务推荐方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时可以执行如上述图2以及图3所示方法实施例中的服务推荐方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述服务推荐方法。
本申请实施例还提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现上述图2以及图3所示方法实施例中的服务推荐方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的***、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种服务推荐方法,其特征在于,包括:
获取多个用户的分类信息,所述分类信息包括用户的属性信息和用户使用目标出行服务的订单信息;
针对每种分类方式,按照该种分类方式,根据所述多个用户的分类信息,将所述多个用户划分为多个用户群组;
针对每种分类方式,根据按照该种分类方式分类所得到的多个用户群组之间使用所述目标出行服务的使用率的差异程度,确定该种分类方式的分类差异度;
基于不同分类方式的分类差异度,从全部的分类方式中确定目标分类方式;
向所述目标分类方式所对应的目标用户群组中的用户推荐所述目标出行服务,所述目标用户群组是从所述目标分类方式所对应的多个用户群组中确定的。
2.根据权利要求1所述的方法,其特征在于,针对每种分类方式,根据按照该种分类方式分类所得到的多个用户群组之间使用所述目标出行服务的使用率的差异程度,确定该种分类方式的分类差异度,包括:
针对每种分类方式,根据按照该种分类方式分类所得到的多个用户群组中的用户对所述目标出行服务的使用率,利用数值分布函数确定该种分类方式的数值分布指数;
针对每种分类方式,根据按照该种分类方式分类所得到的多个用户群组中的用户对所述目标出行服务的使用率,利用正则化函数确定该种分类方式的正则化指数;
针对每种分类方式,根据所确定的数值分布指数和正则化指数确定该种分类方式的分类差异度;所述数值分布函数用于表征不同分类方式所对应的使用率的差异程度,所述正则化函数用于控制分类过拟合。
3.根据权利要求2所述的方法,其特征在于,通过以下方式确定每种分类方式的分类差异度:
基于所述多个用户生成多个候选用户群体;每个所述候选用户群体中均包括所述多个用户中的部分用户;
针对每种分类方式,根据每个候选用户群体按照该种分类方式分类所得到的每个用户群组使用所述目标出行服务的使用率,确定在该种分类方式下每个候选用户群体对应的分布差异指标;
针对每种分类方式,根据在该种分类方式下每个候选用户群体对应的分布差异指标,利用数值分布函数确定该种分类方式的数值分布指数;
针对每种分类方式,根据在该种分类方式下每个候选用户群体对应的使用率,利用正则化函数确定该种分类方式的正则化指数;
针对每种分类方式,根据该种分类方式的数值分布指数和正则化指数确定该种分类方式的分类差异度。
4.根据权利要求3所述的方法,其特征在于,确定每种分类方式的分类差异度,包括:
针对每种分类方式,确定在该种分类方式下所述多个候选用户群体中符合要求的候选用户群体的数量,符合要求的候选用户群体的分布差异指标落入预定置信区间内;
针对每种分类方式,根据符合要求的候选用户群体的数量,确定按照该种分类方式分类所获得的分类结果是否具备显著差异;
确定具备显著差异的分类方式的分类差异度。
5.根据权利要求3所述的方法,其特征在于,每种分类方式的分类维度均是相同的;不同分类方式所对应的相同分类维度的分类阈值是不同的,
每种分类方式的分类差异度是根据该种分类方式下每个分类维度的分类阈值的分类差异度计算出来的;
指定分类维度的分类阈值的分类差异度是按照如下的方式计算得到的:
针对指定分类维度的每个分类阈值,利用数值分布函数确定该分类阈值的数值分布指数,并利用正则化函数确定该种分类方式的正则化指数;
针对指定分类维度的每个分类阈值,基于该分类阈值的数值分布指数和正则化指数,确定该分类阈值的分类差异度;
根据指定分类维度的每个分类阈值的分类差异度,从全部分类阈值中选择出目标分类阈值,将所选择的目标分类阈值的分类差异度确定为指定分类维度的分类差异度。
6.根据权利要求5所述的方法,其特征在于,指定分类维度的每个分类阈值的数值分布指数是按照如下的方式计算得到的:
针对指定分类维度的每个分类阈值,根据该分类阈值,将每个候选用户群体划分为第一候选用户群组和第二候选用户群组;
针对指定分类维度的每个分类阈值,根据该分类阈值划分出的第一候选用户群组的第一***指数和第二候选用户群组的第二***指数,分别确定该分类阈值下每个候选用户群体对应的分布差异指标;所述第一***指数用于表征第一候选用户群组中的用户对所述目标出行服务的使用率,所述第二***指数用于表征第二候选用户群组中的用户对所述目标出行服务的使用率;
针对指定分类维度的每个分类阈值,根据该分类阈值下每个候选用户群体对应的分布差异指标,利用数值分布函数确定该分类阈值的数值分布指数;
指定分类维度的每个分类阈值的正则化指数是按照如下的方式计算得到的:
针对指定分类维度的每个分类阈值,根据该分类阈值划分出的第一候选用户群组的第一***指数和第二候选用户群组的第二***指数,利用正则化函数确定该分类阈值的正则化指数。
7.一种服务推荐装置,其特征在于,包括:
信息获取模块,获取多个用户的分类信息,所述分类信息包括用户的属性信息和用户使用目标出行服务的订单信息;
分类模块,针对每种分类方式,按照该种分类方式,根据所述多个用户的分类信息,将所述多个用户划分为多个用户群组;
差异度确定模块,针对每种分类方式,根据按照该种分类方式分类所得到的多个用户群组之间使用所述目标出行服务的使用率的差异程度,确定该种分类方式的分类差异度;
目标分类确定模块,基于不同分类方式的分类差异度,从全部的分类方式中确定目标分类方式;
服务推荐模块,向所述目标分类方式所对应的目标用户群组中的用户推荐目标出行服务,所述目标用户群组是从所述目标分类方式所对应的多个用户群组中确定的。
8.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1至6任一所述方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至6任一所述方法的步骤。
10.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现如权利要求1至6任一所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110069949.7A CN112765467A (zh) | 2021-01-19 | 2021-01-19 | 一种服务推荐方法、装置、电子设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110069949.7A CN112765467A (zh) | 2021-01-19 | 2021-01-19 | 一种服务推荐方法、装置、电子设备以及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112765467A true CN112765467A (zh) | 2021-05-07 |
Family
ID=75703184
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110069949.7A Pending CN112765467A (zh) | 2021-01-19 | 2021-01-19 | 一种服务推荐方法、装置、电子设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112765467A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130086082A1 (en) * | 2011-09-29 | 2013-04-04 | Postech Academy-Industry Foundation | Method and system for providing personalization service based on personal tendency |
CN103823908A (zh) * | 2014-03-21 | 2014-05-28 | 北京飞流九天科技有限公司 | 基于用户偏好的内容推荐方法和服务器 |
US20200134747A1 (en) * | 2018-02-06 | 2020-04-30 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for recommending transportation services |
CN111291795A (zh) * | 2020-01-21 | 2020-06-16 | 腾讯科技(深圳)有限公司 | 人群特征分析方法、装置、存储介质和计算机设备 |
CN111353093A (zh) * | 2018-12-24 | 2020-06-30 | 北京嘀嘀无限科技发展有限公司 | 问题推荐方法、装置、服务器及可读存储介质 |
WO2020143305A1 (zh) * | 2019-01-07 | 2020-07-16 | 平安科技(深圳)有限公司 | 群体信息分类方法、装置、计算机设备和存储介质 |
CN111442778A (zh) * | 2019-01-16 | 2020-07-24 | 百度在线网络技术(北京)有限公司 | 出行方案推荐方法、装置、设备及计算机可读存储介质 |
CN111612493A (zh) * | 2019-02-26 | 2020-09-01 | 北京嘀嘀无限科技发展有限公司 | 一种用户分群方法及装置 |
-
2021
- 2021-01-19 CN CN202110069949.7A patent/CN112765467A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130086082A1 (en) * | 2011-09-29 | 2013-04-04 | Postech Academy-Industry Foundation | Method and system for providing personalization service based on personal tendency |
CN103823908A (zh) * | 2014-03-21 | 2014-05-28 | 北京飞流九天科技有限公司 | 基于用户偏好的内容推荐方法和服务器 |
US20200134747A1 (en) * | 2018-02-06 | 2020-04-30 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for recommending transportation services |
CN111353093A (zh) * | 2018-12-24 | 2020-06-30 | 北京嘀嘀无限科技发展有限公司 | 问题推荐方法、装置、服务器及可读存储介质 |
WO2020143305A1 (zh) * | 2019-01-07 | 2020-07-16 | 平安科技(深圳)有限公司 | 群体信息分类方法、装置、计算机设备和存储介质 |
CN111442778A (zh) * | 2019-01-16 | 2020-07-24 | 百度在线网络技术(北京)有限公司 | 出行方案推荐方法、装置、设备及计算机可读存储介质 |
CN111612493A (zh) * | 2019-02-26 | 2020-09-01 | 北京嘀嘀无限科技发展有限公司 | 一种用户分群方法及装置 |
CN111291795A (zh) * | 2020-01-21 | 2020-06-16 | 腾讯科技(深圳)有限公司 | 人群特征分析方法、装置、存储介质和计算机设备 |
Non-Patent Citations (2)
Title |
---|
王海艳;董茂伟;: "基于动态卷积概率矩阵分解的潜在群组推荐", 计算机研究与发展, no. 08 * |
肖海涛;何鹏;曾诚;: "基于排序学习的Top-k软件服务推荐方法", 计算机应用, no. 1 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106651213B (zh) | 服务订单的处理方法及装置 | |
US20190197057A1 (en) | A classification method and a classification device for service data | |
US20120310939A1 (en) | Systems And Methods For Clustering Time Series Data Based On Forecast Distributions | |
CN108615129B (zh) | 一种运力监测方法、装置及电子设备 | |
CN111311338A (zh) | 用户价值的预测方法以及用户价值预测模型的训练方法 | |
CN107203912A (zh) | 动态定价方法和装置 | |
CN109345166B (zh) | 用于生成信息的方法和装置 | |
CN111523678A (zh) | 业务的处理方法、装置、设备及存储介质 | |
CN111967971A (zh) | 银行客户数据处理方法及装置 | |
CN112232944B (zh) | 一种评分卡创建方法、装置和电子设备 | |
CN111062774B (zh) | 活动投放方法、装置、电子设备和计算机可读介质 | |
CN108428138A (zh) | 一种基于客户分群的客户生存率分析装置及分析方法 | |
CN106708875A (zh) | 一种特征筛选方法及*** | |
CN113159213A (zh) | 一种业务分配方法、装置及设备 | |
CN112765467A (zh) | 一种服务推荐方法、装置、电子设备以及存储介质 | |
CN108830480B (zh) | 一种erp采购计算方法及其*** | |
CN111984637B (zh) | 数据建模中的缺失值处理方法和装置、设备及存储介质 | |
CN111353797A (zh) | 资源分配方法、装置以及电子设备 | |
CN114862188A (zh) | 一种农产品电商数据的分析*** | |
CN111339468B (zh) | 信息推送方法、装置、电子设备和存储介质 | |
CN107391728A (zh) | 数据挖掘方法以及数据挖掘装置 | |
CN109934604B (zh) | 销量数据的处理方法、***、存储介质及电子设备 | |
CN113034264A (zh) | 客户流失预警模型的建立方法、装置、终端设备及介质 | |
CN110610200B (zh) | 车商分类方法、装置、计算机设备及存储介质 | |
CN114418063B (zh) | 神经网络模型中网络层的分配方法与装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |