CN108446944B

CN108446944B - 一种常驻城市的确定方法、装置及电子设备

Info

Publication number: CN108446944B
Application number: CN201810112757.8A
Authority: CN
Inventors: 吕兵; 付晴川; 朱日兵; 左元; 吴金蔚; 文诗琪; 霍盼; 姚杏
Original assignee: Beijing Sankuai Online Technology Co Ltd
Current assignee: Beijing Sankuai Online Technology Co Ltd
Priority date: 2018-02-05
Filing date: 2018-02-05
Publication date: 2020-03-17
Anticipated expiration: 2038-02-05
Also published as: CN108446944A

Abstract

本发明提供了一种常驻城市的确定方法、装置及电子设备，所述方法包括：根据用户的特征信息、各候选城市的特征信息、以及用户在所述各候选城市的行为信息，通过城市概率模型预测得到所述用户和各候选城市的拟合概率；根据所述用户和各候选城市的拟合概率，确定第一概率阈值；根据所述第一概率阈值从所述各候选城市中确定所述用户的常驻城市。解决了现有技术中按照城市分类统计，耗费时间较长，对于在多个城市之间活跃的用户确定一个常驻城市准确性差的问题，能够通过用户、城市的特征信息、以及用户在城市的行为信息，确定用户的常驻城市，简化了计算过程、提高了准确性。

Description

一种常驻城市的确定方法、装置及电子设备

技术领域

本发明实施例涉及计算机技术领域，尤其涉及一种常驻城市的确定方法、装置及电子设备。

背景技术

常驻城市为用户常年居住或工作的城市，根据常驻城市向用户推荐信息、产品，可以有效提高推荐成功率。例如，对于常年居住或工作在城市A的用户，向用户推荐城市A的新闻信息、以及车票等信息，却不用向用户推荐城市A的特产以及旅游景点等信息。

现有技术中，确定用户的常驻城市算法步骤包括：首先，基于城市分别统计在指定历史周期内，用户在该城市的停留时间；其中，停留时间可以用天数表示；然后，将一用户在各城市的停留时间排序；最后，将用户停留天数最多的城市作为用户的常驻城市。

可以看出，上述过程需要按照城市进行分类，当城市数量较大时，耗费时间较长；且对于经常在多个城市之间活跃的用户，确定一个常驻城市准确性较差。

发明内容

本发明提供一种常驻城市的确定方法、装置、电子设备，以解决现有技术中常驻城市确定的上述问题。

根据用户的特征信息、各候选城市的特征信息、以及用户在所述各候选城市的行为信息，通过城市概率模型预测得到所述用户和各候选城市的拟合概率；

根据所述用户和各候选城市的拟合概率，确定第一概率阈值；

根据所述第一概率阈值从所述各候选城市中确定所述用户的常驻城市。

根据本发明的第二方面，提供了一种常驻城市的确定装置，所述装置包括：

概率预测模块，用于根据用户的特征信息、各候选城市的特征信息、以及用户在所述各候选城市的行为信息，通过城市概率模型预测得到所述用户和各候选城市的拟合概率；

第一概率阈值确定模块，用于根据所述用户和各候选城市的拟合概率，确定第一概率阈值；

常驻城市确定模块，用于根据所述第一概率阈值从所述各候选城市中确定所述用户的常驻城市。

根据本发明的第三方面，提供了一种电子设备，包括：

处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现前述常驻城市的确定方法。

根据本发明的第四方面，提供了一种可读存储介质，其特征在于，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行前述常驻城市的确定方法。

本发明实施例提供了一种常驻城市的确定方法、装置、电子设备，所述方法包括：根据用户的特征信息、各候选城市的特征信息、以及用户在所述各候选城市的行为信息，通过城市概率模型预测得到所述用户和各候选城市的拟合概率；根据所述用户和各候选城市的拟合概率，确定第一概率阈值；根据所述第一概率阈值从所述各候选城市中确定所述用户的常驻城市。解决了现有技术中按照城市分类统计，计算过程复杂，对于在多个城市之间活跃的用户确定一个常驻城市准确性差的问题，能够通过用户、城市的特征信息、以及用户在城市的行为信息，确定用户的常驻城市，简化了计算过程、提高了准确性。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的***架构下的一种常驻城市的确定方法具体步骤流程图；

图2是本发明实施例提供的***架构下的另一种常驻城市的确定方法具体步骤流程图；

图3是本发明实施例提供的一种常驻城市的确定装置的结构图；

图4是本发明实施例提供的另一种常驻城市的确定装置的结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例一

参照图1，其示出了一种常驻城市的确定方法的步骤流程图，包括：

步骤101，根据用户的特征信息、各候选城市的特征信息、以及用户在所述各候选城市的行为信息，通过城市概率模型预测得到所述用户和各候选城市的拟合概率。

其中，用户的特征信息包括但不限于：性别、年龄、职业、消费水平、收入水平、是否旅游达人。

候选城市的特征信息包括但不限于：城市等级、是否旅游城市、城市的本地用户数和异地用户数、酒店旅行交通等业务的日均订单数。

用户在各候选城市的行为信息包括但不限于：用户在指定历史时间周期内浏览和定位该候选城市的次数及占比、用户在该候选城市出现的最大时间窗口、该候选城市是否用户的家乡城市。可以理解，指定历史时间周期可以为过去半年、一个月或一周等，本发明实施例对历史时间周期不加以限制。

可以看出，上述信息中包括连续和离散两种信息，其中，连续信息包括：年龄、城市的本地用户数和异地用户数、酒店旅行交通等业务的日均订单数、用户在指定历史时间周期内浏览和定位该候选城市的次数及占比、用户在该候选城市出现的最大时间窗口，离散信息包括：性别、职业、消费水平、收入水平、是否旅游达人、城市等级、是否旅游城市、该候选城市是否用户的家乡城市。

在实际应用中，上述信息中的离散特征可以用离散数值表示。例如，对于用户的性别信息：男用1表示、女用2表示，用户的收入水平：低等收入用1表示、中等收入用2表示、高等收入用3标识等。

可以理解，对于一个用户、一个候选城市，该用户的各特征信息、该候选城市的各特征信息、以及该用户在该候选城市的各行为信息，均分别对应一个变量输入至城市概率模型，得到该用户和该候选城市的拟合概率，从而对于多个用户、多个候选城市，得到各用户与各候选城市的拟合概率。

步骤102，根据所述用户和各候选城市的拟合概率，确定第一概率阈值。

本发明实施例将概率值差距最大的两个相邻概率值，作为确定第一概率阈值的参考值。

具体地，可以将两个相邻概率值的平均值作为第一概率阈值，也可以将两个相邻概率阈值的其他加权平均值作为第一概率阈值。

步骤103，根据所述第一概率阈值从所述各候选城市中确定所述用户的常驻城市。

具体地，将概率大于第一概率阈值的候选城市作为常驻城市，概率小于第一概率阈值的候选城市作为非常驻城市。从而常驻城市可能存在多个。

本发明实施例确定多个常驻城市更加符合实际应用，在实际应用中，少部分用户会活跃在多个城市之间。例如，一个用户长期在北京上海广州等大城市频繁往返出差，或一个用户家住在河北廊坊市的燕郊镇，但是在北京城区上班。

在确定用户在常驻城市之后，可以进行个性化推荐，以提高推荐成功率。例如，某用户在常驻城市访问美团平台时，可以推荐当地用户购买的热销商品，而当地热门景点、特产等不进行推荐；当某用户在非常驻城市访问美团平台时，可以推荐异地用户购买的热销商品、异地旅游产品、常驻城市到异地之间的火车票机票等。

综上所述，本发明实施例提供了一种常驻城市的确定方法，所述方法包括：根据用户的特征信息、各候选城市的特征信息、以及用户在所述各候选城市的行为信息，通过城市概率模型预测得到所述用户和各候选城市的拟合概率；根据所述用户和各候选城市的拟合概率，确定第一概率阈值；根据所述第一概率阈值从所述各候选城市中确定所述用户的常驻城市。解决了现有技术中按照城市分类统计，耗费时间较长，对于在多个城市之间活跃的用户确定一个常驻城市准确性差的问题，能够通过用户、城市的特征信息、以及用户在城市的行为信息，确定用户的常驻城市，简化了计算过程、提高了准确性。

实施例二

本申请实施例从***架构的层级对可选地常驻城市的确定方法进行了描述。

参照图2，其示出了另一种常驻城市的确定方法的具体步骤流程图。

步骤201，基于标注数据样本集训练得到城市概率模型，所述标注数据样本集中的各标注数据样本至少包括：用户的特征信息、候选城市的特征信息、以及用户在候选城市的行为信息。

其中，标注数据样本集的每条数据样本均已被标注对应城市是否为对应用户的常驻城市。在实际应用中，可以增加一个字段以表示数据样本为常驻城市样本还是非常驻城市样本。例如，可以通过字段ResidentCity标注样本，当ResidentCity＝1表示样本为常驻城市样本；当ResidentCity＝0表示样本为非常驻城市样本。

标注数据样本集可以通过客服人员对酒店入住客户、美团平台等类似平台用户的电话回访、调查问卷获取得到。

用户的特征信息可以通过用户对应用的使用日志中解析得到。例如，用户在美团平台注册账号时，输入的个人信息包括：性别、年龄、职业、消费水平、收入水平，可以作为用户的特征信息，此外，还可以从用户的使用日志中分析得到用户是否为旅游达人。当用户关注的信息多为旅游景点、酒店等信息时，可以确定用户为旅游达人；否则，用户不为旅游达人。可以理解，在实际应用中，还可以在注册时提供是否喜欢旅游选项供用户选择；从而选择喜欢旅游的用户为旅游达人；否则不喜欢旅游的用户不为旅游达人。

候选城市的特征信息可以从数据库中获取。例如，美团平台会对城市做一个基础数据。

用户在候选城市的行为信息可以通过用户对应用的访问日志中解析得到，例如，可以通过日志确定用户在指定历史时间周期内浏览和定位该候选城市的次数及占比、用户在该候选城市出现的最大时间窗口、以及该候选城市是否用户的家乡城市。

在本发明实施例中，可以采用逻辑回归模型，或者决策树模型进行训练，从而使得模型中的参数组为最优参数组。

可选地，在本发明的另一种实施例中，步骤201包括子步骤2011至2014：

子步骤2011，初始化城市概率模型的参数组。

在选取概率模型之后，初始化概率模型的参数组。例如，对于逻辑回归模型，模型公式如下：

其中，u为用户，c为候选城市；

N为非常数参数的数目，根据用户的特征信息、候选城市的特征信息、以及用户在候选城市的行为信息的数目决定。例如，若用户的特征信息包括性别、年龄、职业、消费水平、收入水平、是否旅游达人等六种，城市的特征信息包括城市等级、是否旅游城市、城市的本地用户数和异地用户数、酒店旅行交通等业务的日均订单数等五种，用户在候选城市的行为信息包括用户在指定历史时间周期内浏览和定位该候选城市的次数及占比、用户在该候选城市出现的最大时间窗口、以及该候选城市是否用户的家乡城市等三种，从而参数组的大小为14。

x_i为用户u的特征信息、候选城市c的特征信息、以及用户u在候选城市c的行为信息组成的特征信息中的第i个特征信息的取值；

w_i为x_i的参数，b为常数参数。

可以理解，训练就是确定w_i和b的值。

具体地，可以根据经验值初始化参数组，也可以通过分析初始化为其他值。可以理解，当初始化参数组的值不恰当时，将会增大训练时间；当初始化参数组的值接近于最优参数组时，将会减少训练时间。

子步骤2012，对于所述标注数据样本集中的各标注数据样本，将用户的特征信息、候选城市的特征信息、以及用户在候选城市的行为信息输入至预设城市概率模型，得到用户与对应候选城市的拟合概率。

具体地，对于用户u与候选城市c，将用户u的特征信息、候选城市c的特征信息、用户u在候选城市c的行为信息，按照指定顺序输入至概率模型中，计算得到用户u和候选城市c的拟合概率。

可以理解，用户u的特征信息、候选城市c的特征信息、用户u在候选城市c的行为信息的顺序可以根据实际应用场景设定，本发明实施例对其不加以限制。

在实际应用中，标注数据样本集包括大量用户与其对应的多个候选城市，对于每个标注数据样本，对应一个用户以及该用户对应的其中一个候选城市。从而可以根据标注数据样本集得到大量用户分别与多个候选城市的拟合概率。

子步骤2013，通过所述各标注数据样本确定的用户与对应候选城市的拟合概率确定损失值。

本发明实施例的损失函数通过最大化常驻城市与非常驻城市的概率间隔，与传统模型中的损失函数，如逻辑回归模型的交叉熵损失函数相比，不仅可以对用户和城市的拟合概率进行排序，还可以使得用户与常驻城市比与非常驻城市的拟合概率差距明显。

可选地，在本发明的另一种实施例中，步骤2013包括子步骤20131至20132：

子步骤20131，对于标注数据样本集中的各用户，分别将用户和各非常驻城市的拟合概率减去用户与各常驻城市的拟合概率，再加上预设保护值，得到所述用户的各第一差值。

在本发明实施例中，对于标注数据样本集中的所有用户，基于每个用户的所有标注数据样本，根据该用户与各非常驻城市的拟合概率、与各常驻城市的拟合概率，计算该用户的各第一差值。

具体地，对于用户u，常驻城市c’，非常驻城市c，第一差值的计算公式如下：

M₁＝f(φ(u,c))-f(φ(u,c'))+ε (2)

其中，f(φ(u,c))为用户u和非常驻城市c的拟合概率，f(φ(u,c'))为用户u和常驻城市c’的拟合概率。在实际应用中，可以采用如公式(1)所示的逻辑回归模型公式，也可以采用其他模型公式。

ε为预设保护值，会影响训练结果，可以根据在训练过程中根据预测结果进行调整，本发明实施例对其不加以限制。

子步骤20132，对于所述各用户，取所述用户的各第一差值与零的最大值得到第二差值，并统计各第二差值的总和，得到所述用户的第三差值。

具体地，对于用户u，常驻城市c’，非常驻城市c，第二差值的计算公式如下：

M₂＝max(0,M₁)＝max(0,f(φ(u,c))-f(φ(u,c'))+ε) (3)

则，第三差值的计算公式如下：

其中，_Cu为用户u的候选城市集合，分为常驻城市和非常驻城市。可以理解，这里常驻城市和非常驻城市均可以为多个。

子步骤20133，统计各用户的第三差值的总和，得到损失值。

具体地，损失值的计算公式如下：

其中，U为所有用户集合。

子步骤2014，若所述损失值不满足预设条件，则调整所述参数组，直至所述损失值满足预设条件。

具体地，当损失值小于等于预设值时，损失值满足预设条件，训练结束，此时对应的参数组为目标参数组；当损失值大于预设值时，损失值不满足预设条件，调整参数组，以继续进行训练，直至损失值满足预设条件。

可以理解，预设值可以根据实际应用场景设定，本发明实施例对其不加以限制。预设值越小，训练结果越准确，训练时间越长；预设值越大，训练结果越粗糙，训练时间越短。

步骤202，根据用户的特征信息、各候选城市的特征信息、以及用户在所述各候选城市的行为信息，通过城市概率模型预测得到所述用户和各候选城市的拟合概率。

该步骤可以参照步骤101的详细说明，在此不再赘述。

步骤203，将所述用户和各候选城市的拟合概率排序。

具体地，可以降序排列也可以升序排列。

步骤204，分别计算两个相邻概率之间的差值。

具体地，对于降序排列，用前一个概率减去后一个概率；对于升序排列，用后一个概率减去前一个概率。

以升序排列为例，对于第i个概率和第i+1个概率，差值M_i可以按照如下公式计算：

M_i＝P_i-P_i+1 (6)

其中，P_i为第i个概率，第P_i+1为第i+1个概率。

可以理解，在实际应用中，还可以将差值取绝对值，以保证得到的差值为正值。

步骤205，计算差值最大的两个相邻概率的加权平均值，得到第一概率阈值。

基于公式(6)，判断得到差值最大的两个相邻概率P_I和P_I+1，则第一概率阈值P_s可以按照如下公式计算：

P_s＝C₁·P_I+C₂·P_I+1 (7)

其中，C₁为概率P_I的加权参数，C₂为概率P_I+1的加权参数，C₁+C₂＝1,C₁≠0,C₂≠0。特别地，当C₁＝C₂＝0.5时，第一概率阈值为P_I和P_I+1的平均值。

步骤206，对于各候选城市，若用户和所述候选城市的拟合概率大于等于所述第一概率阈值，则所述候选城市为用户的常驻城市。

可以理解，对于公式(7)计算得到的第一概率阈值，概率P_I及排在P_I前面的概率对应的候选城市为用户的常驻城市；概率P_I+1及排在P_I+1后面的概率对应的候选城市为用户的非常驻城市。

实施例三

参照图3，其示出了一种常驻城市的确定装置的结构图，具体如下。

概率预测模块301，用于根据用户的特征信息、各候选城市的特征信息、以及用户在所述各候选城市的行为信息，通过城市概率模型预测得到所述用户和各候选城市的拟合概率。

第一概率阈值确定模块302，用于根据所述用户和各候选城市的拟合概率，确定第一概率阈值。

常驻城市确定模块303，用于根据所述第一概率阈值从所述各候选城市中确定所述用户的常驻城市。

综上所述，本发明实施例提供了一种常驻城市的确定装置，所述装置包括：概率预测模块，用于根据用户的特征信息、各候选城市的特征信息、以及用户在所述各候选城市的行为信息，通过城市概率模型预测得到所述用户和各候选城市的拟合概率；第一概率阈值确定模块，用于根据所述用户和各候选城市的拟合概率，确定第一概率阈值；常驻城市确定模块，用于根据所述第一概率阈值从所述各候选城市中确定所述用户的常驻城市。解决了现有技术中按照城市分类统计，耗费时间较长，对于在多个城市之间活跃的用户确定一个常驻城市准确性差的问题，能够通过用户、城市的特征信息、以及用户在城市的行为信息，确定用户的常驻城市，简化了计算过程、提高了准确性。

实施例四

参照图4，其示出了另一种常驻城市的确定装置的结构图，具体如下。

概率模型训练模块401，用于基于标注数据样本集训练得到城市概率模型，所述标注数据样本集中的各标注数据样本至少包括：用户的特征信息、候选城市的特征信息、以及用户在候选城市的行为信息。

概率预测模块402，用于根据用户的特征信息、各候选城市的特征信息、以及用户在所述各候选城市的行为信息，通过城市概率模型预测得到所述用户和各候选城市的拟合概率。

第一概率阈值确定模块403，用于根据所述用户和各候选城市的拟合概率，确定第一概率阈值。可选地，在本发明的另一种实施例中，上述第一概率阈值确定模块403，包括：

排序子模块4031，用于将所述用户和各候选城市的拟合概率排序。

概率差值计算子模块4032，用于分别计算两个相邻概率之间的差值。

第一概率阈值确定子模块4033，用于计算差值最大的两个相邻概率的加权平均值，得到第一概率阈值。

常驻城市确定模块404，用于根据所述第一概率阈值从所述各候选城市中确定所述用户的常驻城市。可选地，在本发明的另一种实施例中，上述常驻城市确定模块，包括：

常驻城市确定子模块4041，用于对于各候选城市，若用户和所述候选城市的拟合概率大于等于所述第一概率阈值，则所述候选城市为用户的常驻城市。

可选地，在本发明的另一种实施例中，上述概率模型训练模块401，包括：

参数组初始化子模块，用于初始化城市概率模型的参数组。

概率计算子模块，用于对于所述标注数据样本集中的各标注数据样本，将用户的特征信息、候选城市的特征信息、以及用户在候选城市的行为信息输入至预设城市概率模型，得到用户与对应候选城市的拟合概率。

损失值确定子模块，用于通过所述各标注数据样本确定的用户与对应候选城市的拟合概率确定损失值。

继续训练子模块，用于若所述损失值不满足预设条件，则调整所述参数组，直至所述损失值满足预设条件。

可选地，在本发明的另一种实施例中，上述损失值确定子模块，包括：

第一差值计算单元，用于对于标注数据样本集中的各用户，分别将用户和各非常驻城市的拟合概率减去用户与各常驻城市的拟合概率，再加上预设保护值，得到所述用户的各第一差值。

第二差值计算单元，用于对于各用户，取所述用户的各第一差值与零的最大值得到第二差值，并统计各第二差值的总和，得到所述用户的第三差值。

损失值确定单元，用于统计各用户的第三差值的总和，得到损失值。

本发明实施例还提供了一种电子设备，包括：处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现前述实施例的常驻城市的确定方法。

本发明实施例还提供了一种可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行前述实施例的常驻城市的确定方法。

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

在此提供的算法和显示不与任何特定计算机、虚拟***或者其它设备固有相关。各种通用***也可以与基于在此的示教一起使用。根据上面的描述，构造这类***所要求的结构是显而易见的。此外，本发明也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的常驻城市的确定设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的***、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种常驻城市的确定方法，其特征在于，应用于电子设备，所述方法包括：

根据目标用户的特征信息、各候选城市的特征信息、以及所述目标用户在所述各候选城市的行为信息，通过城市概率模型预测得到所述目标用户和各候选城市的拟合概率；

根据所述目标用户和各候选城市的拟合概率，确定第一概率阈值；

根据所述第一概率阈值从所述各候选城市中确定所述目标用户的常驻城市。

2.根据权利要求1所述的方法，其特征在于，所述根据所述第一概率阈值从所述各候选城市中确定所述目标用户的常驻城市的步骤，包括：

对于各候选城市，若所述目标用户和所述候选城市的拟合概率大于等于所述第一概率阈值，则所述候选城市为所述目标用户的常驻城市。

3.根据权利要求1所述的方法，其特征在于，所述根据所述目标用户和各候选城市的拟合概率，确定第一概率阈值的步骤，包括：

将所述目标用户和各候选城市的拟合概率排序；

分别计算两个相邻概率之间的差值；

计算差值最大的两个相邻概率的加权平均值，得到第一概率阈值。

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

基于标注数据样本集训练得到城市概率模型，所述标注数据样本集中的各标注数据样本至少包括：用户的特征信息、候选城市的特征信息、以及用户在候选城市的行为信息。

5.根据权利要求4所述的方法，其特征在于，所述基于标注数据样本集训练得到城市概率模型的步骤，包括：

初始化城市概率模型的参数组；

对于所述标注数据样本集中的各标注数据样本，将用户的特征信息、候选城市的特征信息、以及用户在候选城市的行为信息输入至预设城市概率模型，得到用户与对应候选城市的拟合概率；

通过所述各标注数据样本确定的用户与对应候选城市的拟合概率确定损失值；

若所述损失值不满足预设条件，则调整所述参数组，直至所述损失值满足预设条件。

6.根据权利要求5所述的方法，其特征在于，所述通过所述各标注数据样本确定的用户与对应候选城市的拟合概率确定损失值的步骤，包括：

对于标注数据样本集中的各用户，分别将用户和各非常驻城市的拟合概率减去用户与各常驻城市的拟合概率，再加上预设保护值，得到所述用户的各第一差值；

对于各用户，取所述用户的各第一差值与零的最大值得到第二差值，并统计各第二差值的总和，得到所述用户的第三差值；

统计各用户的第三差值的总和，得到损失值。

7.一种常驻城市的确定装置，其特征在于，应用于电子设备，所述装置包括：

8.根据权利要求7所述的装置，其特征在于，所述常驻城市确定模块，包括：

常驻城市确定子模块，用于对于各候选城市，若用户和所述候选城市的拟合概率大于等于所述第一概率阈值，则所述候选城市为用户的常驻城市。

9.一种电子设备，其特征在于，包括：

处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1-6中任一所述的常驻城市的确定方法。

10.一种可读存储介质，其特征在于，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如方法权利要求1-6中任一所述的常驻城市的确定方法。