CN110472995A

CN110472995A - 到店预测方法、装置、可读存储介质及电子设备

Info

Publication number: CN110472995A
Application number: CN201910610494.8A
Authority: CN
Inventors: 张凯; 王丛超; 杨一帆; 张弓
Original assignee: Hanhai Information Technology Shanghai Co Ltd
Current assignee: Hanhai Information Technology Shanghai Co Ltd
Priority date: 2019-07-08
Filing date: 2019-07-08
Publication date: 2019-11-19

Abstract

本申请实施例提供了一种到店预测方法、装置、可读存储介质及电子设备，该方法包括：获得用户终端发起的搜索请求；对所述搜索请求进行特征提取，确定所述用户终端的用户的特征、所述搜索请求对应的店铺列表中各个店铺的特征以及用户‑店铺交叉特征；将所述用户的特征、所述各个店铺的特征以及所述用户‑店铺交叉特征输入预先训练的到店概率预测模型，确定所述用户到达所述各个店铺的概率；根据所述用户到达所述各个店铺的概率，确定所述用户是否到达目标店铺。本申请通过到店概率预测模型输出的各个店铺的概率确定出用户到达的目标店铺，实现了对用户的当前位置的准确定位，提高了用户终端向用户推荐的当前位置附近的店铺的可靠性。

Description

到店预测方法、装置、可读存储介质及电子设备

技术领域

本申请涉及信息处理技术领域，尤其涉及一种到店预测方法、装置、可读存储介质及电子设备。

背景技术

随着移动互联网的发展，人们可以很方便地通过移动设备访问网络以获取服务，由此兴起了一批O2O(Online-to-Offline)本地生活化服务(例如：O2O附近搜索)，极大的方便了人们的生活。以O2O附近搜索为例，用户通过该搜索功能可以查看前位置附近的美食、娱乐等生活资讯，该搜索功能的具体实现过程为：预先搜集各个商户的经纬度标注，实时获取用户的定位，计算用户的定位与已标注经纬度的各个商户的距离，将距离满足用户的筛选范围的商户按照一定的算法进行排序后得到筛选结果，并将筛选结果返回到用户使用的移动设备进行显示。

然而，上述搜索功能的具体实现过程存在一个问题：筛选结果过度依赖于用户的定位，当用户的定位未达到一定的准确度时，计算得到的用户的位置与各个商户的距离存在偏差，导致一部分商户无法被作为筛选结果并返回给用户，严重影响了用户的决策与使用体验。

因而，为使得计算得到的用户的定位与已标注经纬度的各个商户的距离满足一定的准确度，需保证用户的定位满足较高的精度要求。在实际情况中，用户的实时定位受网络状况影响较大，当用户在一些大型建筑物内(例如：在商场内)发起O2O附近搜索时，由于普通的定位技术无法定位大型建筑物的楼层信息，并且移动设备在室内无法接收到GPS信号，只能依赖网络运营商的基站实现用户的实时定位，而依赖网络运营商的基站获得的用户的实时定位存在漂移现象，无法保证用户在室内的实时定位满足较高的精度要求。

因此，如何更精确地对用户的当前位置进行定位是本领域急需解决的问题。

发明内容

本申请实施例提供一种到店预测方法、装置、可读存储介质及电子设备，能实时地预测用户是否到达店铺，实现了对用户的当前位置的精准定位。

本申请实施例第一方面提供了一种到店预测方法，所述方法包括：

获得用户终端发起的搜索请求；

对所述搜索请求进行特征提取，确定所述用户终端的用户的特征、所述搜索请求对应的店铺列表中各个店铺的特征以及用户-店铺交叉特征，所述用户-店铺交叉特征是对所述用户的特征与所述各个店铺的特征进行特征交叉得到的；

将所述用户的特征、所述各个店铺的特征以及所述用户-店铺交叉特征输入预先训练的到店概率预测模型，确定所述用户到达所述各个店铺的概率；

根据所述用户到达所述各个店铺的概率，确定所述用户是否到达目标店铺，所述目标店铺为所述各个店铺中的一个。

可选地，所述根据所述用户到达所述各个店铺的概率，确定所述用户是否到达目标店铺的步骤，包括：

在所述用户到达所述目标店铺的概率大于预设的概率阈值的情况下，确定所述用户到达所述目标店铺；或

在所述用户到达所述目标店铺的概率大于预设的概率阈值，且所述搜索请求对应的参数值在预设的生效参数值范围内的情况下，确定所述用户到达所述目标店铺。

可选地，所述方法还包括：

确定与用户到店相关联的用户行为类型；

从所述用户终端的搜索日志中提取第一类搜索记录和第二类搜索记录，所述第一类搜索记录为符合所述用户行为类型的搜索记录，所述第二类搜索记录为对应的搜索时刻与所述第一类搜索记录的搜索时刻的时间差在预设时长内的搜索记录；

将所述第一类搜索记录和所述第二类搜索记录中符合所述用户行为类型的搜索记录标记为正样本，以及，将所述第二类搜索记录中不符合所述用户行为类型的搜索记录标记为负样本；

根据所述正样本和所述负样本，对预设模型进行训练，得到所述到店概率预测模型。

可选地，所述根据所述正样本和所述负样本，对预设模型进行训练，得到所述到店概率预测模型的步骤，包括：

对所述正样本和所述负样本分别进行特征提取，确定所述正样本和所述负样本各自对应的样本用户的特征、所述正样本和所述负样本各自对应的店铺列表中各个样本店铺的特征以及样本用户-样本店铺交叉特征，所述样本用户-样本店铺交叉特征是对所述样本用户的特征与所述各个样本店铺的特征进行特征交叉得到的；

以所述样本用户的特征、所述各个样本店铺的特征以及所述样本用户-样本店铺交叉特征为训练样本，对所述预设模型进行训练，得到所述到店概率预测模型。

可选地，在所述确定所述用户到达所述目标店铺的步骤之后，所述方法还包括：

从所述用户终端的搜索日志中提取对应的搜索时刻在确定所述用户到达所述目标店铺之后的搜索记录；

在提取的搜索记录是针对所述目标店铺的搜索记录的情况下，将所述提取的搜索记录标记为正样本，并增加所述正样本的权重；

若所述提取的搜索记录不是针对所述目标店铺的搜索请求，将所述提取的搜索记录标记为负样本，并减少所述负样本的权重；以及

根据增加权重后的正样本和减少权重后的负样本，对所述到店概率预测模型进行更新。

可选地，所述用户的特征包括以下至少一者：所述用户终端扫描或连接到的WIFI名称及相应的信号强度、所述用户终端的设备类型、所述用户终端的经纬度、所述用户终端的IP地址、所述用户的用户画像、以及所述用户的消费偏好。

可选地，所述各个店铺的特征包括以下至少一者：所述各个店铺的标识、所述各个店铺的WIFI名称、所述各个店铺的WIFI平均连接或扫描强度、所述各个店铺的经纬度、所述各个店铺所属的类目、所述各个店铺售卖的商品的价格区间、所述各个店铺的点击率以及所述各个店铺的访购率。

可选地，所述用户-店铺交叉特征是通过以下至少一种方式得到的：

根据所述用户终端的经纬度和所述各个店铺的经纬度，确定所述用户终端与所述各个店铺的直线距离；

对所述用户终端扫描或连接到的店铺的WIFI的信号强度，与所述用户终端扫描或连接到的店铺的WIFI平均连接或扫描强度进行特征交叉；

对所述用户终端扫描或连接到的店铺的WIFI的信号强度，与所述用户终端与所述用户终端扫描或连接到的店铺的直线距离进行特征交叉；和/或

对所述用户终端的用户点击或消费价格与所述各个店铺的人均价格进行特征交叉。

本申请实施例第二方面提供一种到店预测装置，所述装置包括：

获得模块，用于获得用户终端发起的搜索请求；

特征提取模块，用于对所述搜索请求进行特征提取，确定所述用户终端的用户的特征、所述搜索请求对应的店铺列表中各个店铺的特征以及用户-店铺交叉特征，所述用户-店铺交叉特征是对所述用户的特征与所述各个店铺的特征进行特征交叉得到的；

概率预测模块，用于将所述用户的特征、所述各个店铺的特征以及所述用户-店铺交叉特征输入预先训练的到店概率预测模型，确定所述用户到达所述各个店铺的概率；以及

确定模块，用于根据所述用户到达所述各个店铺的概率，确定所述用户是否到达目标店铺，所述目标店铺为所述各个店铺中的一个。

可选地，所述确定模块包括：

第一确定模块，用于在所述用户到达所述目标店铺的概率大于预设的概率阈值的情况下，确定所述用户到达所述目标店铺；或

第二确定模块，用于在所述用户到达所述目标店铺的概率大于预设的概率阈值，且所述搜索请求对应的参数值在预设的生效参数值范围内的情况下，确定所述用户到达所述目标店铺。

可选地，所述装置还包括：

第三确定模块，用于确定与用户到店相关联的用户行为类型；

第一提取模块，用于从所述用户终端的搜索日志中提取第一类搜索记录和第二类搜索记录，所述第一类搜索记录为符合所述用户行为类型的搜索记录，所述第二类搜索记录为对应的搜索时刻与所述第一类搜索记录的搜索时刻的时间差在预设时长内的搜索记录；

标记模块，用于将所述第一类搜索记录和所述第二类搜索记录中符合所述用户行为类型的搜索记录标记为正样本，以及，将所述第二类搜索记录中不符合所述用户行为类型的搜索记录标记为负样本；

训练模块，用于根据所述正样本和所述负样本，对预设模型进行训练，得到所述到店概率预测模型。

可选地，所述训练模块包括：

特征提取子模块，用于对所述正样本和所述负样本分别进行特征提取，确定所述正样本和所述负样本各自对应的样本用户的特征、所述正样本和所述负样本各自对应的店铺列表中各个样本店铺的特征以及样本用户-样本店铺交叉特征，所述样本用户-样本店铺交叉特征是对所述样本用户的特征与所述各个样本店铺的特征进行特征交叉得到的；

训练子模块，用于以所述样本用户的特征、所述各个样本店铺的特征以及所述样本用户-样本店铺交叉特征为训练样本，对所述预设模型进行训练，得到所述到店概率预测模型。

可选地，所述装置还包括：

第二提取模块，用于从所述用户终端的搜索日志中提取对应的搜索时刻在确定所述用户到达所述目标店铺之后的搜索记录；

第一权重调整模块，用于在提取的搜索记录是针对所述目标店铺的搜索记录的情况下，将所述提取的搜索记录标记为正样本，并增加所述正样本的权重；

第二权重调整模块，用于在所述提取的搜索记录不是针对所述目标店铺的搜索记录的情况下，将所述提取的搜索记录标记为负样本，并减少所述负样本的权重；以及

更新模块，用于根据增加权重后的正样本和减少权重后的负样本，对所述到店概率预测模型进行更新。

本申请实施例第三方面提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本申请第一方面所述的方法中的步骤。

本申请实施例第四方面提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行时实现本申请第一方面所述的方法的步骤。

采用本申请实施例提供的一种到店预测方法，首先获取用户发起的搜索请求，然后对搜索请求进行特征提取，并将提取出的特征(包括：用户终端的用户的特征、搜索请求对应的店铺列表中各个店铺的特征以及用户-店铺交叉特征)输入到店概率预测模型以得到用户到达店铺列表中各个店铺的概率，最后再根据这些概率预测得到用户到达的目标店铺。本申请从用户维度、店铺维度以及用户-店铺交叉维度三个维度对用户终端发起的搜索请求进行特征提取，提高了到店概率预测模型输出的结果的准确度以及最终预测得到的目标店铺的准确度，此外，通过到店概率预测模型输出的各个店铺的概率确定出用户到达的目标店铺，实现了对用户的当前位置的准确定位，提高了用户终端向用户推荐的当前位置附近的店铺的可靠性，增强了用户的使用体验。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请各个实施例提供的用户终端与后台服务器进行交互的示意图；

图2是本申请一实施例示出的一种到店预测方法的流程图；

图3是本申请一实施例示出的获得用户-店铺交叉特征的流程图；

图4是本申请一实施例示出的一种到店概率预测模型的训练方法的流程图；

图5是本申请一实施例示出的另一种到店概率预测模型的训练方法的流程图；

图6是本申请一实施例示出的一种更新到店概率预测模型的方法的流程图；

图7是本申请一实施例示出的一种到店预测装置的示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在对本申请各个实施例进行说明之前，首先对相关技术进行说明。为获得用户的较为精准的定位，在相关技术中，采用对获得的用户的定位进行修正的方式，例如其中的一种修正方式为：在用户的当前位置的一定范围内寻找参考源，例如：若用户当前的网络状态是已连接WIFI，则可将该WIFI的坐标作为一个参考源，再对用户的定位进行修正；又例如：当用户处于大型建筑物内部(例如：大型商场内部)时，由于GPS信号被阻挡，则可以根据用户历史定位的周边的地磁信息对用户的定位进行修正。

然而，上述两种对获得的用户的定位进行修正的方式需要获取对应的数据信息，代价高昂，例如：当采用WIFI的坐标作为参考源时，需要额外获得用户所处的区域中的各个WIFI的坐标信息，当利用地磁信息对用户的定位进行修正时，需额外获得用户所处的区域中的地磁信息。

在相关技术中，另一种获得用户的定位的方式是：搜集用户连接到的店铺的WIFI、用户在该店铺内的停留时间以及用户在该店铺的购买信息，然后结合业务制定相应的规则，再根据规则判断用户是否在该店铺内。但是该方式仅仅考虑用户连接的店铺的WIFI、用户在该店铺内的停留时间以及用户在该店铺的购买信息，即只从用户一侧来判断用户是否在该店铺内，此外，该方案过度依赖于店铺是否有WIFI、用户是否有购买行为，也不具备较强的普适性，因此这种定位方式对用户定位所得到的定位结果的准确度依然不高。

为了提高用户的定位的准确度，本申请实施例利用O2O(Online-to-Offline)本地生活化服务中许多业务只能在商家店内完成的特性，实时获取用户的搜索请求并标记出用户针对店铺做出了典型行为(例如：参与店内的团购验券活动、购买闪惠、签到、上传UGC等)的消费数据，再针对这些消费数据从用户、店铺、用户和店铺的交叉等多个维度进行特征提取，然后将提取出的特征输入预先训练好的到店概率预测模型，得到用户到达各个店铺的概率，最后再根据这些概率得到用户实际到达的目标店铺。

下面将对本申请实施例提供的一种到店预测方法进行详细说明。

图1是本申请各个实施例提供的用户终端与后台服务器进行交互的示意图。参照图1，后台服务器通过网络与一个或多个用户终端(例如：图1中的用户终端1至用户终端n)进行通信连接，以实现通信交互。后台服务器可以是网络服务器、数据库服务器等。用户终端可以是个人电脑(personal computer，PC)、平板电脑、智能手机等。

图2是本申请一实施例示出的一种到店预测方法的流程图，该方法应用于图1中的后台服务器。参照图2，本申请一实施例提供的到店预测方法包括以下步骤：

步骤S11：获得用户终端发起的搜索请求。

在本实施例中，用户可在用户终端输入搜索请求，后台服务器用于接收用户终端发送的搜索请求。其中，用户终端安装有可支持附近搜索功能的终端应用软件，例如：搜索类应用软件、购物类应用软件或者可为用户提供其他服务的应用软件。通过这类应用软件，用户可以搜索当前位置的周边范围内的任何目标。用户终端接收到用户输入的搜索请求后，将搜索请求发送给后台服务器，然后接收后台服务器针对该次搜索请求返回的搜索结果并在页面上以店铺列表的形式将搜索结果展示给用户。

用户终端接收到用户的搜索请求后，主动将针对此次搜索请求的用户数据发送给后台服务器，或者，用户终端接收到用户的搜索请求后，在下一次后台服务器向用户终端请求用户数据时，再将针对此次搜索请求的用户数据发送给后台服务器，当然，也可以采用其它的方式将针对搜索请求的用户数据发送给后台服务器，本申请各个实施例对此不作具体限制。

其中，用户数据包括用户行为数据、用户信息以及用户终端的设备状态信息。用户行为数据是指：用户对店铺列表中的任意店铺做出用户行为时动态生成的数据，用户行为可以是一般用户行为，例如点击、收藏、分享等行为；也可以是与到店相关的行为(即：只有到达店铺后才能完成的行为)，例如：闪惠买单、团购验券、自助点餐、取号排队、上传UGC、用户签到等，当然，也可以为其它类型的用户行为，本申请包括但不限于上述列举出的多种用户行为。用户信息是指：用户画像(例如：用户的年龄、职业、性别等)、用户的消费偏好(例如：经常购买的商品的类目、价格消费区间)以及其它表征用户的个人特征的信息。用户终端的设备状态信息是指：用户终端扫描或连接到的WIFI名称及相应的信号强度、用户终端的设备类型、用户终端的经纬度、用户终端的IP地址等。

示例地，后台服务器是某生活消费类APP的后台服务器，相应地，用户终端上安装的可支持附近搜索功能的终端应用软件为与后台服务器进行通信交互的生活消费类APP。用户在生活消费类APP的搜索栏中输入“火锅”，则生活消费类APP上会弹出展示有多个与“火锅”相关的店铺的页面，用户可任意点击一个店铺，查询该店铺的相关信息、参与该店铺内的闪惠买单、团购验券、用户签到等活动。生活消费类APP实时记录用户针对该次搜索请求产生的用户行为数据，同时通过用户的个人账户获取用户信息，以及通过用户终端内的应用程序获取用户终端的设备状态信息，利用用户行为数据、用户信息以及用户终端的设备状态信息生成针对此次搜索请求的用户数据并发送给后台服务器。

步骤S12：对所述搜索请求进行特征提取，确定所述用户终端的用户的特征、所述搜索请求对应的店铺列表中各个店铺的特征以及用户-店铺交叉特征，所述用户-店铺交叉特征是对所述用户的特征与所述各个店铺的特征进行特征交叉得到的。

在本申请各个实施例中，从三个维度对搜索请求进行特征提取，三个维度分别为：用户维度、店铺维度以及用户和店铺的交叉维度。对所述搜索请求进行特征提取，具体为：对与搜索请求对应的用户数据进行特征提取。

具体地，确定用户终端的用户的特征是指：从用户数据中提取出符合用户维度的数据，作为用户终端的用户的特征，例如用户终端的用户的特征可以是：用户终端扫描或连接到的WIFI名称及相应的信号强度、用户终端的设备类型、用户终端的经纬度、用户终端的IP地址、用户的用户画像、以及用户的消费偏好。当然，用户的特征还可以包括其它可以表征用户的个性的特征，本申请包括但不限于上述列举的用户的特征。

后台服务器预先存储有所有已在终端应用软件上注册的店铺的信息，例如：终端应用软件是生活消费类APP时，后台服务器预先存储有所有已在该生活消费类APP上注册的店铺的信息。由于用户终端发起搜索请求后，后台服务器会向用户终端返回符合搜索条件的店铺列表，因此，确定搜索请求对应的店铺列表中各个店铺的特征是指：从预先存储的所有已注册的店铺的信息中提取店铺列表中各个店铺的特征，其中，店铺列表中各个店铺的特征可以是：各个店铺的标识、各个店铺的WIFI名称、各个店铺的WIFI平均连接或扫描强度、各个店铺的经纬度、各个店铺所属的类目、各个店铺售卖的商品的价格区间、各个店铺的点击率以及各个店铺的访购率。具体地，各个店铺所属的类目表征各个店铺所售卖的商品的类型，例如：某个店铺售卖的商品是服饰，那么该店铺所属的类目是服饰类，又例如：某个店铺售卖的商品是小吃或饮料，那么该店铺所属的类目是餐饮类。各个店铺的访购率是指：在一定时间内，访问该店铺的所有顾客中，产生了购买行为的顾客所占的百分比。

用户-店铺交叉特征是用户与各个店铺的关联特征。图3是本申请一实施例示出的获得用户-店铺交叉特征的流程图。参照图3，用户-店铺交叉特征具体可以通过以下步骤获得：

步骤S121：根据所述用户终端的经纬度和所述各个店铺的经纬度，确定所述用户终端与所述各个店铺的直线距离。

步骤S122：对所述用户终端扫描或连接到的店铺的WIFI的信号强度，与所述用户终端扫描或连接到的店铺的WIFI平均连接或扫描强度进行特征交叉。

将特征A与特征B进行特征交叉是指：采用预设的计算方法对特征A和特征B进行计算以得到特征A与特征B的关联特征C，例如：特征A为用户终端扫描或连接到的店铺的WIFI的信号强度，特征B为与用户终端扫描或连接到的店铺的WIFI平均连接或扫描强度，预设的计算方法为特征A和特征B的比值，则关联特征C为特征A除以特征B所得到的值。

步骤S123：对所述用户终端扫描或连接到的店铺的WIFI的信号强度，与所述用户终端与所述用户终端扫描或连接到的店铺的直线距离进行特征交叉；和/或对所述用户终端的用户点击或消费价格与所述各个店铺的人均价格进行特征交叉。

各个店铺的人均价格即各个店铺的人均消费价格，用户点击价格即用户点击过的商品的价格，用户消费价格即为用户购买过的商品的价格。本实施例为了保证最终预测得到的目标店铺的准确度，在将用户终端扫描或连接到的店铺的WIFI的信号强度，与用户终端扫描或连接到的店铺的WIFI平均连接或扫描强度进行特征交叉之后，还可以通过以下三种方式中的任一种方式进行特征交叉：

1)用户终端扫描或连接到的店铺的WIFI的信号强度，与用户终端与用户终端扫描或连接到的店铺的直线距离进行特征交叉。

2)将用户终端的用户点击价格(或用户消费价格)与各个店铺的人均价格进行特征交叉。

3)将用户终端扫描或连接到的店铺的WIFI的信号强度，与用户终端与用户终端扫描或连接到的店铺的直线距离进行特征交叉，且将用户终端的用户点击价格(或用户消费价格)与各个店铺的人均价格进行特征交叉。

步骤S13：将所述用户的特征、所述各个店铺的特征以及所述用户-店铺交叉特征输入预先训练的到店概率预测模型，确定所述用户到达所述各个店铺的概率。

其中，到店概率预测模型是利用用户终端的搜索日志对预设模型进行训练得到的。具体的训练过程将在下文中进行详细的描述。

将用户的特征、各个店铺的特征以及用户-店铺交叉特征作为输入值输入到店概率预测模型后，到店概率预测模型会输出用户到达店铺列表中的各个店铺的概率值。用户到达各个店铺的概率值与用户到达该店铺的可能性成正比，概率值越高，用户到达该店铺的可能性越大，概率值越低，用户到达该店铺的可能性越小。

步骤S14：根据所述用户到达所述各个店铺的概率，确定所述用户是否到达目标店铺，所述目标店铺为所述各个店铺中的一个。

目标店铺为用户当前所在的店铺，确定出目标店铺，也即确定出用户当前的精准位置。确定用户是否到达目标店铺的具体步骤将在下文进行说明。

在一种实施方式中，后台服务器是某生活消费类APP的后台服务器，用户终端上安装的可支持附近搜索功能的软件为与后台服务器进行通信交互的生活消费类APP，当用户处于大型商场内部且通过该生活消费类APP搜索附近的店铺时，后台服务器根据用户的搜索请求返回多个满足搜索条件(搜索条件可以从多个方面设置，例如：距离用户当前位置的距离、店铺的价格区间、用户的好评度排名)的店铺，以供用户查看。例如用户可以在搜索栏输入“火锅”，并设置搜索条件为距离当前位置一千米的范围内，生活消费类APP将所有符合搜索条件的与“火锅”相关的店铺展示到页面中，用户可以对感兴趣的店铺进行查看或者做出与某个店铺相关的用户行为(如前文所述，用户行为可以包括：一般用户行为和与到店相关的行为)，生活消费类APP实时记录用户产生的用户行为数据，并将用户行为数据、用户信息、用户终端的设备状态信息作为针对用户当前的搜索请求(搜索名称为“火锅”的搜索请求)的用户数据发送给后台服务器。后台服务器对用户数据进行特征提取，并将提取的特征输入至到店概率预测模型，以得到用户到达搜索结果中的与“火锅”相关的各个店铺的概率，然后再根据各个概率预测得到用户当前时刻所在的店铺。在本申请各个实施例中，当前时刻为包含用户发起搜索请求的时刻的一段较短的时长。

在本申请实施例中，首先获取用户发起的搜索请求，然后对搜索请求进行特征提取，并将提取出的特征(包括：用户终端的用户的特征、搜索请求对应的店铺列表中各个店铺的特征以及用户-店铺交叉特征)输入到店概率预测模型以得到用户到达店铺列表中各个店铺的概率，最后再根据这些概率预测得到用户到达的目标店铺。本申请从用户维度、店铺维度以及用户-店铺交叉维度三个维度对用户终端发起的搜索请求进行特征提取，提高了到店概率预测模型输出的结果的准确度以及最终预测得到的目标店铺的准确度，此外，通过到店概率预测模型输出的各个店铺的概率确定出用户到达的目标店铺，实现了对用户的当前位置的定位，提高了用户终端向用户推荐的当前位置附近的店铺的可靠性，增强了用户的使用体验。

具体地，步骤S14可以包括：

步骤S141：在所述用户到达所述目标店铺的概率大于预设的概率阈值的情况下，确定所述用户到达所述目标店铺；或

步骤S142：在所述用户到达所述目标店铺的概率大于预设的概率阈值，且所述搜索请求对应的参数值在预设的生效参数值范围内的情况下，确定所述用户到达所述目标店铺。

在本实施例中，判断用户是否到达目标店铺有两种方式，第一种判定方式是：将到店概率预测模型输出的概率与预设的概率阈值进行比较，将概率大于预设的概率阈值的店铺作为用户到达的目标店铺；第二种判定方式是：将概率大于预设的概率阈值的店铺中，搜索请求对应的参数值在预设的生效参数值范围内的店铺作为用户到达的目标店铺，搜索请求对应的参数值与预设的生效参数值范围的关系用于辅助确定用户是否到达目标店铺。

示例地，如果预设的概率阈值为0.8，到店概率预测模型输出的所有概率中只有一个店铺M的概率为0.9，那么根据第一种判定方式，店铺M为用户到达的目标店铺；根据第二种判定方式，如果店铺M是一个餐饮类店铺，则可将搜索请求对应的参数值设置为用户终端当前的时刻，将预设的生效参数值范围设置为午餐时间(例如：11：00-13：00)，若用户终端当前的时刻刚好落在预设的生效参数值范围内，可确定用户到达店铺M。当然，搜索请求对应的参数值和预设的生效参数值范围可根据本申请实际应用过程中的需求确定。

在实际情况中，如果后台服务器获取用户终端发起的搜索请求的周期较长，则可能存在到店概率预测模型输出的多个店铺的概率值大于预设阈值的现象。如果后台服务器获取用户终端发起的搜索请求的周期较短，则满足概率值大于预设阈值的店铺的数量通常较少，甚至为零，在此种情况下，如果只存在一个概率值大于预设阈值的店铺，则将该店铺作为用户当前所在的目标店铺，如果存在多个概率值大于预设阈值的店铺，则将多个店铺中概率值最高的店铺作为用户当前所在的店铺。预设阈值是通过计算到店概率预测模型的准确率和召回率，得到的用户到店判定是否生效的一个经验阈值，即：预设阈值是将利用到店概率预测模型预测出的目标店铺，与用户的实际到达的店铺进行对比分析后，结合具体的业务所得到的最佳概率值，只有在该最佳概率值下，预测得到的用户到达的目标店铺的准确度最高。

在本申请实施例中，设置了两种可判定用户是否到达目标店铺的方法，增强了本申请的到店预测方法在实际应用过程中的灵活性，此外，第二种判定方式中增设了搜索请求对应的参数值是否在预设的生效参数值范围内这一辅助判定条件，提高了判定结果的准确度。

下面将对到店概率预测模型的训练过程进行说明。

图4是本申请一实施例示出的一种到店概率预测模型的训练方法的流程图。参照图4，该训练方法包括：

步骤S21：确定与用户到店相关联的用户行为类型。

与用户到店相关联的用户行为是指：用户必须到达店铺后才能完成的用户行为，例如：闪惠买单、团购验券、自助点餐、取号排队、上传UGC、用户签到、连接WIFI等。对于一个店铺，如果用户产生了与到店相关的用户行为，那么用户实际到达该店铺的可能性较大。

步骤S22：从所述用户终端的搜索日志中提取第一类搜索记录和第二类搜索记录，所述第一类搜索记录为符合所述用户行为类型的搜索记录，所述第二类搜索记录为对应的搜索时刻与所述第一类搜索记录的搜索时刻的时间差在预设时长内的搜索记录。

用户终端的搜索日志中包含所有的搜索记录，用户发起的一次搜索请求可以对应多条搜索记录，每次发起搜索请求时生成的多条搜索记录组成了该次搜索请求的用户行为数据。举例来讲，用户在搜索栏中输入“服饰”，那么以该次搜索名称为“服饰”的搜索请求为搜索请求X，点击搜索后，用户终端会展示多个符合“中餐”这一搜索名称的店铺，如果用户1查看了店铺A并在店铺A中完成签到，那么用户1-搜索请求X-店铺A-签到为一条搜索记录，如果用户1查看了店铺A并在店铺A中参与了团购验券活动，那么用户1-搜索请求X-店铺A-团购验券为另一条搜索记录，类似地，用户1还可以基于其它店铺中生成多条搜索记录。

其中，第一类搜索记录为符合用户行为类型的搜索记录，只要搜索记录中携带的用户行为是用户必须到达相应的店铺后才能产生的用户行为，该条搜索记录即可被作为第一类搜索记录。例如：一条搜索记录为用户1-搜索请求X-店铺A-团购验券，由于团购验券是要求用户到达相应的店铺后才能完成的，因此该条搜索记录可作为一条第一类搜索记录，又例如：一条搜索记录为用户1-搜索请求X-店铺A-分享，由于分享不要求用户到达相应的店铺，因此该条搜索记录不能作为一条第一类搜索记录。

可选地，在选出多条第一类搜索记录后，还可以进一步设置筛选条件，例如筛选条件可以是时间范围条件，将所有搜索记录中对应的搜索时刻位于某一段时间内的第一类搜索记录筛选出来，作为新的第一类搜索记录。

在本实施例中，第一类搜索记录只是搜索日志中的符合用户行为类型的搜索记录中的一部分搜索记录，为使得采集的搜索记录分布合理，还需采集第二类搜索记录。第二类搜索记录为对应的搜索时刻与第一类搜索记录的搜索时刻的时间差在预设时长内的搜索记录。举例来讲，一条第一类搜索记录的搜索时刻为10：00，若预设时长为1分钟时，则由该第一类搜索记录得到的第二类搜索记录可以为用户在9：59-10：01之间产生的搜索记录。

本实施例中采用的提取第一类搜索记录和第二类搜索记录的方式保证了提取出的搜索记录具有较好的分布性(例如：预先提取出时间分布较为合理的第一类搜索记录，再基于这些第一类搜索记录提取出第二类搜索记录)，避免了无法提取到一定数量的符合用户行为类型的搜索记录的现象，或者提取出的搜索记录的时间分布不合理(例如：搜索记录过度集中于某一个时间段)的现象。

步骤S23：将所述第一类搜索记录和所述第二类搜索记录中符合所述用户行为类型的搜索记录标记为正样本，以及，将所述第二类搜索记录中不符合所述用户行为类型的搜索记录标记为负样本。

正样本表示用户理论上到达了店铺，负样本表示用户理论上没有到达店铺。由于所有的第一类搜索记录中的用户行为均为与用户到店相关联的用户行为，因而，所有的第一类搜索记录均为正样本。由于第一类搜索记录只是搜索日志中的符合用户行为类型的搜索记录中的一部分搜索记录，因而，第二类搜索记录中还可能存在有多条符合用户行为类型的搜索记录，因此在划分正负样本时还需将第二类搜索记录中的符合用户行为类型的搜索记录标记为正样本，将不符合用户行为类型的搜索记录标记为负样本。

步骤S24：根据所述正样本和所述负样本，对预设模型进行训练，得到所述到店概率预测模型。

本实施例中将划分得到的正样本和负样本作为输入值，采用机器学习算法(例如：逻辑回归算法)对预设模型进行训练得到一个二分类预测模型(即：到店概率预测模型)，其作用是：当输入从搜索请求中提取的特征时，可以输出用户到达店铺列表中的各个店铺的概率，店铺列表为搜索请求对应的搜索结果。

图5是本申请一实施例示出的另一种到店概率预测模型的训练方法的流程图。参照图5，步骤S24包括：

步骤S241：对所述正样本和所述负样本分别进行特征提取，确定所述正样本和所述负样本各自对应的样本用户的特征、所述正样本和所述负样本各自对应的店铺列表中各个样本店铺的特征以及样本用户-样本店铺交叉特征，所述样本用户-样本店铺交叉特征是对所述样本用户的特征与所述各个样本店铺的特征进行特征交叉得到的。

步骤S242：以所述样本用户的特征、所述各个样本店铺的特征以及所述样本用户-样本店铺交叉特征为训练样本，对所述预设模型进行训练，得到所述到店概率预测模型。

在本实施例中，每条搜索记录还携带有用户信息和用户终端的设备状态信息，在得到正样本和负样本后，可以从每一条样本中提取出对应的样本用户的特征、对应的样本店铺的特征以及样本用户-样本店铺交叉特征，然后再将这部分特征输入预设模型并对预设模型进行训练，得到到店概率预测模型。

图6是本申请一实施例示出的一种更新到店概率预测模型的方法的流程图。参照6，该方法包括：

步骤S31：从所述用户终端的搜索日志中提取对应的搜索时刻在确定所述用户到达所述目标店铺之后的搜索记录。

在根据到店概率预测模型预测得到用户到达的目标店铺之后，从用户终端的搜索日志中提取对应的搜索时刻在确定用户到达目标店铺之后的搜索记录，将这部分搜索记录作为反馈记录，利用反馈记录可以实现对样本权重的调整，便于对到店概率预测模型进行更新。例如：用户实际上只到达了店铺A，但是可能对其它的店铺做出了与用户到店相关联的用户行为，此时可以将与店铺A相关的样本标记为正样本并调整权重值，将其它店铺的样本标记为正负并调整权重值，以保证每一条样本使用时的可靠性。

步骤S32：在提取的搜索记录是针对所述目标店铺的搜索记录的情况下，将所述提取的搜索记录标记为正样本，并增加所述正样本的权重。

举例来讲，某次预测得到用户到达的目标店铺为店铺A，那么在反馈记录中，可以将与店铺A相关的搜索记录作为权重值较大的正样本，例如：当与店铺A相关的搜索记录中的用户行为是团购验券行为(也可以为其它用户行为，例如：上传UGC、连接WIFI)时，可以将该搜索记录标记为权重值较大的正样本。

可选地，根据反馈记录中的用户行为的不同，本实施例对不同的正样本(反馈记录中与目标店铺相关的搜索记录)设置大小不同的权重值，例如：正样本中，用户行为是团购验券行为的样本所对应的权重值大于用户行为是点击行为的样本所对应的权重值。

步骤S33：在所述提取的搜索记录不是针对所述目标店铺的搜索记录的情况下，将所述提取的搜索记录标记为负样本，并减少所述负样本的权重。

在本实施例中，还可以调整与店铺A无关的搜索记录的权重，具体地，将与店铺A无关的搜索记录标记为负样本，并减少该负样本的权重。例如：当所提取的搜索记录中的用户行为是不是团购验券行为(或者其它用户行为，例如：上传UGC、连接WIFI)时，可以将该搜索记录标记为权重值较小的负样本。

可选地，不同的负样本的权重值的大小也是可以调整的，根据反馈记录中的用户行为的不同，本实施例对不同的负样本(反馈记录中与目标店铺无关的搜索记录)设置大小不同的权重值。例如：负样本中，用户行为是团购验券的样本所对应的权重值大于用户行为是点击行为的样本所对应的权重值。

步骤S34：根据增加权重后的正样本和减少权重后的负样本，对所述到店概率预测模型进行更新。

在本实施例中，将所有的反馈记录作为之后对到店概率预测模型进行更新时的样本，实现了从搜索日志中挖掘反馈记录并反作用于模型的预测过程，根据确定出的用户到达的目标店铺与确定出目标店铺之后用户产生的反馈行为，对反馈记录中的正样本和负样本进行权重值的调整，保证了更新到店概率预测模型时采用的样本的可靠性，在可靠的样本的数量较多的情况下，实现了对到店概率预测模型的不断迭代优化，有效地提高了到店概率预测模型的预测结果的准确度，以及根据到店概率预测模型的预测结果预测得到的目标店铺的准确度。

本申请实施例中的到店预测方法可更为准确地对用户进行定位，提高了O2O附近搜索中距离计算的准确度，适用于多种需计算店铺到用户的距离的场景，例如各类服务型软件的周边搜索服务(包括：附近美食、果蔬生鲜、鲜花配送等)，能为用户提供更优质的搜索体验。此外，本申请提出的到店预测方法不仅简单易行、成本低，而且还能利用反馈记录对到店预测模型不断地迭代更新，使得到店预测模型的输出结果的准确度可以随着搜索业务规模的发展以及搜索数据量(例如：搜索记录)的累积而越来越高，从而实现对用户更为精准地定位。

基于同一发明构思，本申请一实施例提供一种到店预测装置。图7是本申请一实施例示出的一种到店预测装置的示意图。参照图7，该装置700包括：

获得模块701，用于获得用户终端发起的搜索请求；

特征提取模块702，用于对所述搜索请求进行特征提取，确定所述用户终端的用户的特征、所述搜索请求对应的店铺列表中各个店铺的特征以及用户-店铺交叉特征，所述用户-店铺交叉特征是对所述用户的特征与所述各个店铺的特征进行特征交叉得到的；

概率预测模块703，用于将所述用户的特征、所述各个店铺的特征以及所述用户-店铺交叉特征输入预先训练的到店概率预测模型，确定所述用户到达所述各个店铺的概率；

确定模块704，用于根据所述用户到达所述各个店铺的概率，确定所述用户是否到达目标店铺，所述目标店铺为所述各个店铺中的一个。

可选地，所述确定模块包括：

可选地，所述装置还包括：

可选地，所述训练模块包括：

可选地，所述装置还包括：

基于同一发明构思，本申请另一实施例提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本申请上述任一实施例所述的方法中的步骤。

基于同一发明构思，本申请另一实施例提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行时实现本申请上述任一实施例所述的方法中的步骤。

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白，本申请实施例的实施例可提供为方法、装置、或计算机程序产品。因此，本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请实施例是参照根据本申请实施例的方法、终端设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请实施例的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本申请所提供的一种到店预测方法、装置、可读存储介质及电子设备，进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种到店预测方法，其特征在于，所述方法包括：

获得用户终端发起的搜索请求；

2.根据权利要求1所述的方法，其特征在于，所述根据所述用户到达所述各个店铺的概率，确定所述用户是否到达目标店铺的步骤，包括：

3.根据权利要求1所述的方法，其特征在于，所述方法还包括：

确定与用户到店相关联的用户行为类型；

4.根据权利要求3所述的方法，其特征在于，所述根据所述正样本和所述负样本，对预设模型进行训练，得到所述到店概率预测模型的步骤，包括：

5.根据权利要求2所述的方法，其特征在于，在所述确定所述用户到达所述目标店铺的步骤之后，所述方法还包括：

在所述提取的搜索记录不是针对所述目标店铺的搜索记录的情况下，将所述提取的搜索记录标记为负样本，并减少所述负样本的权重；以及

6.根据权利要求1所述的方法，其特征在于，所述用户的特征包括以下至少一者：所述用户终端扫描或连接到的WIFI名称及相应的信号强度、所述用户终端的设备类型、所述用户终端的经纬度、所述用户终端的IP地址、所述用户的用户画像、以及所述用户的消费偏好。

7.根据权利要求1所述的方法，其特征在于，所述各个店铺的特征包括以下至少一者：所述各个店铺的标识、所述各个店铺的WIFI名称、所述各个店铺的WIFI平均连接或扫描强度、所述各个店铺的经纬度、所述各个店铺所属的类目、所述各个店铺售卖的商品的价格区间、所述各个店铺的点击率以及所述各个店铺的访购率。

8.根据权利要求7所述的方法，其特征在于，所述用户-店铺交叉特征是通过以下至少一种方式得到的：

9.一种到店预测装置，其特征在于，所述装置包括：

获得模块，用于获得用户终端发起的搜索请求；

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-8任一所述的方法中的步骤。

11.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行时实现如权利要求1-8任一所述的方法的步骤。