CN112291374B

CN112291374B - 一种物联网设备特征获取方法及装置

Info

Publication number: CN112291374B
Application number: CN202011597672.7A
Authority: CN
Inventors: 严坦; 吴睿泽; 支良标
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2020-12-29
Filing date: 2020-12-29
Publication date: 2021-03-23
Anticipated expiration: 2040-12-29
Also published as: CN112291374A

Abstract

本说明书公开一种物联网设备特征获取方法及装置，包括获取多台物联网设备的位置信息以及用户行为信息；根据获取的信息构建以设备为节点、以设备间关联关系为边的设备关联图；基于所构建的设备关联图，得到路径集；所述路径集中任一路径为所述关联图中的任一无环路径；利用所述路径集中任一路径生成若干条训练样本，以根据所述路径集得到训练样本集；其中，任一训练样本以任一路径中的节点为特征值，以该路径中该节点的相邻节点为标签值；基于所述训练样本集训练深度学习模型；利用训练后的深度学习模型的隐藏层信息获取物联网设备特征。

Description

一种物联网设备特征获取方法及装置

技术领域

本说明书涉及机器学习技术领域，尤其涉及一种物联网设备特征获取方法及装置。

背景技术

目前，物联网设备功能十分强大，除了具有常规的基本功能之外，通常还具有其他功能，例如展示推送信息的功能。以物联网自动售货机为例，其除了具有售卖商品的功能以外，还具有通过屏幕展示推送信息的功能，其会在屏幕上展示推送信息以供用户查看，例如展示商品广告信息、展示商品优惠券等信息。

物联网设备展示的推送信息如果不能满足用户的使用需求，对于设备本身来说，无疑是一种网络资源的浪费。

为了解决上述问题，目前业界常采用机器学习的方式，即以用户信息与推送信息为特征，以用户对于推送信息的点击情况为标签进行训练，进而利用训练后的模型确定向用户展示的推送信息。但是通常情况下，用户并非在所有设备上的行为都相同，因此，以上述方式训练出的模型效果欠佳。

基于上述理由，如果将设备特征也作为模型的训练特征，训练出的模型效果也会更佳，另外，如果将设备的某项数据作为该设备的特征，特征信息量较少，对于模型的训练效果提升较小，从这个角度而言，如果设备特征能够体现的含义越丰富，则利用该设备特征训练出的模型效果也就更佳。

因此，亟需获取一种含义丰富的物联网设备特征，用于模型训练。

发明内容

针对上述技术问题，本说明书提供一种物联网设备特征获取方法及装置，技术方案如下：

根据本说明书的第一方面，提供一种物联网设备特征获取方法，包括：

获取多台物联网设备的位置信息以及用户行为信息；

根据获取的信息构建以设备为节点、以设备间关联关系为边的设备关联图；

基于所构建的设备关联图，得到路径集；所述路径集中任一路径为所述设备关联图中的任一无环路径；

利用所述路径集中任一路径生成若干条训练样本，以根据所述路径集得到训练样本集；其中，任一训练样本以任一路径中的节点为特征值，以该路径中该节点的相邻节点为标签值；基于所述训练样本集训练深度学习模型；

利用训练后的深度学习模型的隐藏层信息获取物联网设备特征。

根据本说明书的第二方面，提供一种物联网设备特征获取装置，包括：

信息获取模块，用于获取多台物联网设备的位置信息以及用户行为信息；

关联图生成模块，用于根据获取的信息构建以设备为节点、以设备间关联关系为边的设备关联图；

路径生成模块，用于基于所构建的设备关联图，得到路径集；所述路径集中任一路径为所述设备关联图中的任一无环路径；

模型训练模块，用于利用所述路径集中任一路径生成若干条训练样本，以根据所述路径集得到训练样本集；其中，任一训练样本以任一路径中的节点为特征值，以该路径中该节点的相邻节点为标签值；基于所述训练样本集训练深度学习模型；

设备特征获取模块，用于利用训练后的深度学习模型的隐藏层信息获取物联网设备特征。

本说明书通过获取物联网设备的位置信息，以及用户基于设备的行为信息，并通过获取的信息生成以设备为节点，以设备之间关联关系为边的设备关联图，根据该图上的路径，生成模型训练样本集，任一训练样本以任一路径中的节点为特征值，以该路径中该节点的相邻节点为标签值；利用所述训练样本集训练深度学习模型，利用训练后的深度学习模型的隐藏层信息获取物联网设备特征。

因此，确定出的物联网设备的特征，可以包含设备与设备之间的关联关系，又由于该设备与设备之间的关联关系是通过用户行为、以及地理位置信息建立的，因此该设备特征包含了用户行为以及地理位置信息两个维度的信息。

进而，该物联网设备特征在特征空间可以从多个维度体现出设备之间的相似性，其中包括在地理位置维度上的相似性，以及在用户行为维度上的相似性，故使用该特征进行模型训练得到模型后，该模型的输出可以将设备考虑在内，即能够实现在相似的设备上为同一个用户展示相同或相近的推送信息，进而使推送信息更能满足用户的使用需求。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本说明书。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书实施例中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1是本说明书实施例的一种物联网设备特征获取方法的流程示意图；

图2是本说明书实施例的一种物联网设备关联图的示意图；

图3是本说明书实施例的一种路径的示意图；

图4a是本说明书实施例的一种Skip-gram算法模型的输入输出关系的示意图；

图4b是本说明书实施例的一种CBOW算法模型的输入输出关系的示意图；

图5是本说明书实施例的一种对位置关联图以及用户信息关联图进行融合的示意图；

图6是本说明书实施例的一种标记有权重值的物联网设备关联图的示意图；

图7是本说明书实施例的一种基于物联网设备关联图的路径获取方法的流程示意图；

图8是本说明书实施例的一种物联网设备特征的获取装置结构示意图；

图9是用于配置本说明书实施例装置的一种设备的结构示意图。

具体实施方式

为了使本领域技术人员更好地理解本说明书实施例中的技术方案，下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行详细地描述，显然，所描述的实施例仅仅是本说明书的一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员所获得的所有其他实施例，都应当属于保护的范围。

在本说明书使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本说明书。在本说明书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本说明书可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本说明书范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

为了解决上述问题，目前业界常采用机器学习的方式，即以用户信息与推送信息为特征，以用户对于推送信息的点击情况为标签进行训练，进而利用训练后的模型确定向用户展示的推送信息。但是通常情况下，用户并非在所有设备上的行为都相同，例如，用户通常在家门口的自动售货机上购买日用品，用户对于日用品的优惠券需求更高，在商场的自动售货机上购买饮料，对于饮料优惠券需求更高。因此，以上述方式训练出的模型效果欠佳。

基于上述理由，如果将设备特征也作为模型的训练特征，训练出的模型效果也会更佳。另外，如果将设备的某项数据作为该设备的特征，例如，用户在设备上的点击次数，则该特征信息含义较少，对于模型的训练效果提升较小，从这个角度而言，如果设备特征的含义越丰富，则利用该设备特征训练出的模型效果也就更佳。

因此，需要获取一种含义丰富的物联网设备特征，用于后续的模型训练，以使该模型的效果更佳。

针对上述技术问题，本说明书提供的方案如下所示。

本说明书通过获取物联网设备的位置信息，以及用户基于设备的行为信息，并通过获取的信息生成以设备为节点，以设备之间关系为边的设备关联图，根据该图上的路径，生成模型训练特征，任一训练样本以任一路径中的节点为特征值，以该路径中该节点的相邻节点为标签值，利用训练样本集训练深度学习模型，进而利用深度学习模型的隐藏层信息获取设备关联图中每个节点对应的物联网设备的特征。

进而，该物联网设备特征可以从多个维度体现出设备之间的相似性，其中包括在地理位置上的相似性，以及在用户行为上的相似性，故使用该特征进行模型训练得到模型后，该模型的输出可以将设备的相似性考虑在内，即能够实现在相似设备上为同一个用户展示相同或相近的推送信息，进而使推送信息更能满足用户的使用需求。

基于以上说明，如图1所示，为一种物联网设备特征获取方法的流程示意图，该方法可以至少包括以下步骤。

S101，获取多台物联网设备的位置信息以及用户行为信息。

在针对多台物联网设备获取信息时，可以根据存储的形式进行获取，例如，在存储形式为针对每台设备分别存储的位置信息以及用户行为信息，则可以直接进行获取。

另外，如果存储形式为将全部物联网设备中的用户行为信息存储在一起，则可以是依据每条信息中的设备标识字段，将同一设备的用户行为信息汇总在一起。

汇总完成后会得到每台设备的全部行为信息以及位置信息，可以理解的是，每台设备会存在多条用户行为信息，而物联网设备通常情况下均是固定部署在某地，因此一台设备通常对应一条位置信息。

其中，位置信息可以是每台物联网设备部署所在地的省份、城市、经纬度等信息，本说明书对位置信息的具体形式不做限定。

行为信息可以是一种或多种行为信息，以物联网设备为物联网自动售货机或刷脸支付设备为例，用户行为信息可以是用户的交易行为信息、用户对于推送信息的点击行为信息。其中，行为信息中通常记录有用户标识、行为发生时间、设备标识、行为种类标识等信息。

S102，根据获取的信息构建以设备为节点、以设备间关联关系为边的设备关联图。

本步骤中，在获取了多台物联网设备的位置信息以及用户行为信息后，即可以以每台物联网设备为一个节点，针对多个节点中任意两个节点，根据S101中获取的信息确定该两个节点之间是否具有关联关系，在具有关联关系的情况下，对该两个节点构建边。

其中，获取的信息为位置信息和用户行为信息，在确定任意两个节点是否具有关联关系时，可以采用以下方式实现。

根据获取的位置信息，确定该两个节点对应的设备之间的距离，确定该距离是否小于预设长度；例如是否小于1KM。

针对这两个节点，根据获取的行为信息，确定所述两个节点对应的设备之间是否具有相同用户。

其中，由于物联网设备的功能十分多样，因此，用户行为信息可以是一种也可以是多种。以行为信息为交易行为为例，根据两个节点对应的设备的交易行为信息中的用户标识，确定是否有至少一个相同用户分别在两台设备上分别进行过交易行为；在存在的情况下，则确定两台设备之间具有相同用户。

在行为信息为多种行为信息时，可以是不分行为信息种类确定两台设备之间是否具有相同用户，例如用户A在设备1上进行过交易行为，在设备2上进行过点击行为，则可以确定设备1和设备2存在相同用户。

当然，为了更为细化的确定设备之间，基于某种用户行为的相似性，还可以是分别针对每种行为信息，确定两个节点对应的设备之间是否有相同用户，例如，针对交易行为确定两台设备之间是否具有相同用户，针对推送信息点击行为确定两台设备之间是否具有相同用户。其中，如果用户A仅在设备1上进行过交易行为，仅在设备2上进行过点击行为，则认为用户A不为设备1和设备2之间的相同用户。

在两个节点对应的设备之间的距离小于预设长度、和/或所述两个设备之间具有相同用户，则确定所述两个节点之间具有关联关系。

即上述两个条件满足其一则可以确定这两个设备之间存在关联关系，前者说明这两个节点在地理位置上存在关联关系、后者说明这两个节点在用户行为上存在关联关系。

在确定了这两个节点存在关联关系后，可以构建这两个节点之间的边。在确定两个节点不存在关联关系的情况下，不构建两个节点之间的边。

在针对多个节点之中的全部节点之间都进行判断，生成全部边之后，即生成了设备关联图。如图2所示，为一种物联网设备关联图的示意图，其中每个节点代表一台设备，节点之间连接有边则代表这两个节点对应的设备之间存在关联关系。可以理解的是，在实际应用中，节点数量通常多达上万个、甚至几十万个。

S103，基于所构建的设备关联图，得到路径集；

路径集中任一路径为所述关联图中的任一无环路径，其中无环路径是指路径中不存在相同节点，如图3所示，为一种路径的示意图。

在生成了图后，可以进一步基于该设备关联图生成多条路径；

一种方式可以是以该设备关联图为基础，将该图中全部无环路径，作为路径集中的路径。

另一种方式可以是以该设备关联图为基础，将该图中的部分无环路径，作为路径集中的路径，其中，可以是随机选取部分路径，还可以是基于某些筛选方式确定出部分路径，组成路径集，具体筛选的方式可以参照下文，这里先不进行详述。

S104，生成训练样本集、基于该训练样本集训练深度学习模型；

在S103中得到路径集后，利用所述路径集中任一路径生成若干条训练样本，以根据所述路径集得到训练样本集；

上述训练样本集中，任一训练样本的形式可以是以任一路径中的节点为特征值，以该路径中该节点的相邻节点为标签值。

对于深度学习模型来说其输入需要以向量的形式进行输入，因此需要将路径集中的每个节点转化为向量的形式。

其中，可以将每个节点转化为one-hot形式的向量，one-hot形式可以将各个节点以离散向量的形式进行表示，例如节点1的one-hot向量为（1,0,0,0,0,0，…0）、节点2的one-hot向量为（0,1,0,0,0,0，…0）等，即若存在n个节点，则每一个节点的向量均为n维的one-hot形式，即可以用one-hot形式的向量将不同的节点进行区分，但是其缺点也很明显，在节点数量过多时，one-hot形式的向量维数过于巨大，且过于稀疏，向量之间完全独立，并不能表示出不同节点之间的关系。

例如，如果路径集共存在7个节点，即每条路径均是由这7个节点组成的，则可以对每个节点以one-hot形式进行编码。即节点1为（1,0,0,0,0,0,0），节点2为（0,1,0,0,0,0,0），依此类推，得到7个节点的one-hot形式的向量。

上述所述的相邻节点即可以包括与目标节点直接以边相连的节点，也可以包括在路径中与目标节点相近的节点，例如相邻节点可以为与目标节点之间的节点数量小于预设数量的节点。

在一个实施例中，可以是以任一路径中的任一节点作为特征值，以该路径中该节点的一个相邻节点作为标签值。

以图3所示的路径为例，可以是以节点4为特征值，以节点3或5作为标签值。

在一个实施例中，可以是以任一路径中任一节点作为特征值，以该路径中该节点的一个或多个节点相邻的节点为标签值。

以图3为例，可以是以节点4为特征值，以节点3和5作为标签值，还可以是以节点4为特征值，以节点2、3、5、6作为标签值。

在一个实施例中，还可以是以任一路径中的多个节点作为特征值，以该路径中该多个节点的共同的相邻节点作为标签值。

仍以图3为例，可以是以节点3和5为特征值，以节点4作为标签值，还可以是以节点2、3、5、6为特征值，以节点4作为标签值。

本申请对于训练样本的具体形式并不进行限定，特征和标签只要可以体现路径中相邻节点之间的关系即可。

综上，训练样本可以分为两种形式：

1、以中间节点作为特征值，前后预设数量的节点作为标签值；

2、以前后预设数量的节点作为特征值，中间节点作为标签值。

上述两类训练样本可以总结为：特征是路径中的节点、标签是该节点在该路径中的相邻节点。

其中，路径集中存在若干条路径，可以根据每条路径可以生成一个或多个训练样本，从而可以根据路径集得到包含大量训练样本的训练样本集。

在得到了训练样本集后，即可使用训练样本集训练深度学习模型，深度学习模型可以为至少包括一层隐藏层的深度学习模型。

在一个具体实施例中，深度学习模型可以具体为Skip-gram算法模型、或CBOW算法模型。

其中，Skip-gram算法模型和CBOW算法模型，为实现word2vec算法的模型，word2vec算法主要用于将文本映射为包含语义信息的向量的算法，相关技术中，可以通过Skip-gram模型或CBOW模型，将语句中的每个词的one-hot形式的向量，映射为包含语义信息、即能够体现词与词之间关系的低维向量。

本说明书中，可以采用Skip-gram算法模型或CBOW算法模型作为深度学习模型。

根据上述内容可知，得到的训练样本，可以用于这两种模型的训练。

在训练样本的形式为：中间节点作为特征值，前后预设数量的节点作为标签值时，可以采用Skip-gram算法模型，作为深度学习模型。

可以参照图4a所示，为一种Skip-gram算法模型的输入输出关系的示意图。

在训练样本的形式为：中间节点作为标签值，前后预设数量的节点作为特征值时，可以采用CBOW算法模型，作为深度学习模型。

可以参照图4b所示，为一种CBOW算法模型的输入输出关系的示意图。

在选取一种算法实现深度学习模型后，即可以根据路径集得到相应的训练样本集。

S105，利用训练后的深度学习模型的隐藏层信息获取物联网设备特征。

由于，训练样本中特征是路径中的节点、标签是该节点在该路径中的相邻节点，因此，训练完成后，训练后的深度学习模型的输入输出可以体现出节点之间的关联关系，而隐藏层可以将输入数据的特征向量，抽象到另一个维度空间，来展现其更抽象化的特征，即可以将输入数据的one-hot形式转化为低维度的向量空间中，在该空间中，可以体现出输入数据之间的差异性。

因此，在训练完成后，可以针对所述设备关联图中任一节点，将该节点的向量作为输入，利用深度学习模型的隐藏层输出作为该节点对应的设备的特征。

即将任一节点的one-hot形式的向量输入到训练后的深度学习模型中，得到隐藏层的输出即为该节点的特征，即可以作为该节点对应的设备的特征。

在深度学习模型为单层隐藏层时，可以获取该单层隐藏层的输出作为设备的特征。在深度学习模型为多层隐藏层时，可以获取最后一层隐藏层的输出作为设备的特征。

另外，Skip-gram算法模型和CBOW算法模型均为包括一层隐藏层的深度学习模型，即均为包括输入层、一层隐藏层和输出层的深度学习模型，且隐藏层不存在激活函数，因此可以理解为简单的深度学习模型。

即Skip-gram模型和CBOW模型，均可以通过隐藏层将one-hot形式的节点向量，映射到预设维度的特征向量，通常将该预设维度设置的比one-hot形式的向量的维度低，这样就可以将one-hot形式的节点向量映射到低纬度的向量，而这个预设维度的特征向量即为输入节点对应的设备的特征，这个特征可以体现出节点与节点之间的关联关系、即设备与设备之间的关联关系，而设备之间的关联关系是通过位置信息与行为信息建立的，所以该特征可以包含位置、用户行为多个维度的信息。

以Skip-gram模型为例，该模型主要分为三层，输入层、隐藏层以及输出层，该模型的输入为任一节点的向量，即one-hot形式的向量，隐藏层的输出将该one-hot形式的向量降维为预设维度的向量，而这个向量即为该输入节点所对应设备的特征。CBOW模型同理，将任一节点的one-hot形式的向量输入该模型，该模型隐藏层的输出即为该节点对应设备的特征，即将任一节点的较为离散的one-hot形式的向量降维至维度较低、且能表示出节点之间关系的特征，又因为节点之间的关联关系，是通过位置信息以及用户行为信息建立的，所以该特征可以体现出设备与设备之间位置、用户行为多个维度的信息。

通过上述方式得到的设备特征，将设备映射到了一个可以体现出设备间差异的特征空间中，在该特征空间中，可以直接体现设备与设备之间的相似度，而该相似度为用户行为相似度和地理位置相似度的综合表现。

本说明书通过获取物联网设备的位置信息，以及用户基于设备的行为信息，并通过获取的信息生成以设备为节点，以设备之间关系为边的图，根据该图上的路径，生成模型训练样本集，利用所述训练样本集训练深度学习模型，将任一节点的向量输入到该训练后的深度学习模型中，利用该模型的隐藏层输出作为该节点对应的设备的特征。

进而，该物联网设备特征在特征空间可以从多个维度体现出设备之间的相似性，其中包括在地理位置上的相似性，以及在用户行为上的相似性，故使用该特征进行模型训练得到模型后，该模型的输出可以将设备的相似性考虑在内，即能够实现在相似设备上为同一个用户展示相同或相近的推送信息，进而使推送信息更能满足用户的使用需求。

以用户在某个物联网自动售货机上进行操作为例，在用户交易完成时，自动售货机会得到用户的标识，进而可以根据用户的标识获取该用户的用户特征，进而将用户特征、该自动售货机的设备特征、以及一条推送信息的特征作为输入，输出用户在该设备上对于该推送信息的点击概率。在对每条推送信息的点击概率进行预测后，即可以将概率最高的一条或多条推送信息推展示在物联网设备上，以便该用户查看和点击。可见，采用本方式，将物联网设备的特征也考虑在内，在向用户推送信息时，可以在相似的设备上为同一用户推送相同或相似的信息，因此推送信息更能满足用户的需求。

在上述S102中，在生成设备关联图时，还可以根据获取的位置信息以及用户行为信息，确定所述设备关联图中任一条边的权重值，所述权重值用于表征所述边两端节点之间的关联程度。

权重值，可以是在确定两个节点之间存在关联关系时即进行确定。也可以是在生成完整的设备关联图后，进一步为图中每条边进行赋值。

其中，在根据位置信息确定两个节点之间边的距离权重值时，可以是根据所述两个节点对应的设备之间的距离，确定所述边的距离权重值；所述距离权重值与所述距离成负相关关系。

可以采用多种方式根据两个节点对应的设备之间的距离，确定所述边的距离权重值，一种具体的方式可以为采用下述方式确定任意两个节点i以及j之间的距离权重值：

（1）

其中,

为节点i以及j之间的距离权重值，

为i以及j之间的距离，单位可以为KM。

当然，上述仅为实例性的说明，只要能够通过节点之间的距离确定节点之间距离权重值，且权重值与距离成负相关关系均可。

根据用户行为信息确定两个节点之间边的行为权重值，可以是根据所述两个节点对应的设备之间的相同用户的行为信息，确定所述边的行为权重值；行为权重值，与所述相同用户的行为信息数量成正相关关系；且行为发生时间越早，则权重值越小。

可以采用多种方式根据两个节点的相同用户的行为信息，确定所述边的行为权重值，一种具体的方式可以为采用下述方式确定任意两个节点i以及j之间的行为权重值：

（2）

其中，

为第k条行为信息中记录的行为时间距今的天数；K为获取的节点

和节点

的行为信息中，具有相同用户标识的行为信息总条数。可见，通过该方式，在任意两个节点对应的设备之间的相同用户行为信息数量越多的情况下，该行为权重值越大，且每条行为信息的发生时间越早则每条行为信息的权重贡献越小，即用户行为发生时间越早，则对当前两个节点之间的权重影响越小，用户行为发生时间越晚，则对当前两个节点之间的权重影响越大，因此，更能反映用户当前行为的信息，即越晚发生的行为对两个节点之间的权重影响越大。综上，采用上述方式，可以将相同用户的行为信息数量、以及行为信息发生时间的早晚映射到该权重值中。

在确定了距离权重值以及所述行为权重值后，可以综合距离权重值以及所述行为权重值，确定所述两个节点之间边的权重值。

一种具体的方式可以是通过采用下述方式确定综合距离权重值以及所述行为权重值，确定两个节点之间边的权重值：

（3）

其中，

为两个节点之间边的权重值。

在确定设备关联图中的全部边的权重值后，可以得到包括以设备为节点，以设备之间关联关系为边、以关联程度为边的权重值的设备关联图。

另外，在获取的行为信息为多种行为信息，例如Y种行为信息时，可以是不分行为种类，采用上述公式（1）-（3），确定两个节点之间的行为权重值。

还可以是根据获取的Y种行为信息中的每一种行为信息，分别确定所述两个节点对应的设备之间是否具有相同用户；例如，Y为2，行为信息包括支付行为信息以及点击行为信息；可以，针对支付行为信息判断两个设备是否具有相同用户，即是否有同一个用户在两台设备分别进行过支付行为，然后再针对点击行为信息判断两个设备是否具有相同用户。

针对两个节点之间X种具有相同用户的行为信息，其中X≤Y，分别确定所述边的单种行为权重值；并综合所述X个单种行为权重值，确定为所述边的行为权重值。

例如可以是以下方式，确定行为信息：

（4）

为根据第X种行为信息确定的两个节点之间边的权重值。

即将各种行为信息的权重值加和，确定为行为权重值。其中，每种行为信息的权重值的确定方法可以参照上述公式（2）。

在上述S102中，为了减少数据处理量、在确定两个节点对应的设备之间是否具有相同用户时，还可以针对所述两个节点的行为信息中的行为发生时间，以及预设的多个时间窗口，确定行为信息所在的时间窗口；

针对每一时间窗口，分别确定所述两个节点对应的设备之间是否具有相同用户。

例如，以1个月为一个时间窗口，则可以根据两个节点的用户行为信息中的行为发生时间，确定行为信息在哪个时间窗口内；在将用户行为信息分别归属到不同的时间窗口后，可以针对任一时间窗口，确定两个设备在该时间窗口内是否具有相同用户。判断某个时间窗口内，是否有相同用户在两台设备上均进行过交易行为。在任一个时间窗口内有相同用户，则可以确定两台设备存在关联关系。

例如，针对设备A和设备B，分别获取了第一季度的用户行为信息，即包括1、2、3三个月的用户行为信息。

针对设备A以及设备B，在确定是否具有关联关系时，可以得到如表1所示的结果：

即设备A和设备B在第一季度中，每个时间窗口年内，都存在相同用户，即可以确定设备A和设备B对应的两个节点之间存在关联关系。

在基于时间窗口确定两个节点之间存在关联关系时，可以采用下述方式确定两个节点之间的边的权重值。

在确定权重值时，由于已经将行为信息分为了多个时间窗口，因此，可以是针对每一个具有相同用户的时间窗口，分别确定所述边的单窗口行为权重值；并综合全部窗口对应的单窗口行为权重值，确定所述边的行为权重值。

在综合各个窗口的行为权重值时，可以通过以下方式进行综合：

针对任意两个节点

和

，通过以下公式计算该两个节点之间的行为权重值：

（5）

其中，

为第m个时间窗口对应的行为权重值，

为该第m个时间窗口最后一天距今的天数，N为时间窗口的数量。

的确定方式可以参照上述公式（2），其中，公式（2）中的

可以用于表示第k 条行为信息中记录的行为时间距该时间窗口最后一天之间的天数，K为获取的节点

和节点

的行为信息中，在第m个时间窗口内，两个节点

和

之间相同用户的行为信息总条数。

通过上述方式，可以利用两个节点之间的位置信息以及行为信息直接生成以多个设备为节点，以设备之间关联关系、以关联程度作为边权重的设备关联图。

另外，为了避免在生成设备关联图时，需要对大量的数据进行计算和处理，还可以是先针对多个节点以及位置信息生成一张图，然后基于行为信息生成一张图，最后将两张图进行融合。

例如，在基于位置信息生成图时，可以是确定任意两个节点对应的设备之间距离是否小于预设长度，如果是则建立两个节点之间的边，并基于上述公式（1）确定两个节点之间边的权重值，在针对全部节点之间进行上述处理后，生成基于位置的设备关联图。

在基于用户行为信息生成图时，可以是确定任意两个节点对应的设备之间是否具有相同用户，如果是则建立两个节点之间的边，并基于上述公式（2）确定两个节点之间边的权重值，在针对全部节点之间进行上述处理后，生成基于用户行为的设备关联图。

在构造两个图后，可以进一步将两个图进行融合。融合的方式可以是针对任意两个节点，若其中一个图中这两个节点之间存在边，则融合图中这两个节点之间存在边。如图5所示，为一种对位置关联图以及用户信息关联图进行融合的示意图，节点1和节点4之间不存在边，在基于用户行为的设备关联图，节点1和节点4之间存在边，则在融合后的设备关联图中，节点1和节点4之间存在边。节点之间的权重值的确定方式可以参数上述公式（3），即融合图中任意两个节点之间的权重值，由基于行为的权重值和基于位置的权重值加和得到，进而可以得到以设备为节点、以设备间关联关系为边、以关联程度为边权重值的融合图。

在上述S103中，即基于构建的设备关联图得到路径集时，如果是将该图中的部分不包含相同节点的路径，作为路径集中的路径，则可以根据权重值选取其中的部分路径。

一种方式为：以设备关联图中某一节点为起点，将与其相连的全部节点中，与其之间边的权重中最大的节点作为下一节点，然后以该下一节点为当前节点，继续确定该当前节点相连的多个节点中，与其之间边的权重值最大的节点作为下一节点，以此类推，其中，每次选取的节点不能是已经选取过的重复的节点，直到选取出预设数量的节点，例如30个，或没有下一节点可以选取为止，以选取出的多个节点以及节点之间的边，作为一条路径。

如图6所示，为一种标记有权重值的物联网设备关联图的示意图，用边上的数字表示该边的权重值，以节点1为起点，由于与其相连的节点只有节点2，因此选取节点2为当前节点；由于与节点2相连且不为重复节点的只有节点3，因此选取节点3为当前节点；与节点3相连且不为重复节点的为节点4和节点5，而节点3与节点5之间边的权重值大于节点3与节点4之间边的权重值，因此选取节点5为当前节点；由于与节点5相连且不为重复节点的只有节点6，因此选取节点6为当前节点；由于不存在与节点6相连且不为重复节点的节点，选取结束，生成一条1-2-3-5-6的路径。然后，可以依次以其他节点为起点，分别生成一条路径。

另一种根据权重值选取路径的方式可以是：在该图中以任一节点为起点，随机选取若干个连续节点与该起点组成路径，路径中不存在相同的节点，且除起点以外任一节点被选取的概率，与该节点和该路径中上一节点之间边的权重值成正相关关系。

如图7所示，为一种基于物联网设备关联图的路径获取方法的流程示意图。

具体流程为：

S701.以所述图中任一节点为起点；S702在与该节点相连的至少一个节点中根据概率随机确定一个节点为当前节点，以起点和当前节点之间的全部节点和边作为当前路径，循环执行以下操作，直到达到预设停止条件：

S703，判断是否达到预设停止条件；其中，预设停止条件可以是当前路径长度达到预设长度、或不存在与当前节点相连且不为当前路径中的节点；

若否，则执行S704，即在与当前节点相连的至少一个节点中根据概率随机确定一个节点作为当前节点；其中，所选取的节点不为当前路径中的任一节点；

若是，则停止循环，执行S705，确定当前路径为最终路径，即得到一条路径；其中，所述路径中，任一节点被选取为当前节点的概率，与该节点和上一节点之间边的权重值成正相关关系。

依次以设备关联图中每个节点为起点，执行预设次数例如10次上述步骤后，可以得到多条路径，组成路径集。

在一个具体实施方式中，每个节点被选取为当前节点的概率为：

（6）

其中，

为当前节点，节点

为与节点

相连的节点，K为与

的相连的节点的总数。

下面以一个具体的例子，对上述路径生成过程进行描述：

仍以上图6为例，对上述每条路径生成过程进行说明，例如以节点1为起点，由于节点1相连的节点只有节点2，因此选取节点2为当前节点；同理选取节点3为当前节点；在以节点3为当前节点进行选取时，可以采用上述公式（6），分别确定选取节点5的概率以及选取节点4的概率，根据概率随机选取下一节点，图中选取节点无的概率大于节点4 的概率，因此被选取为下一节点的概率较大，依次类推直到当前路径达到预设长度或无法确定下一节点为止，生成一条路径。以每个节点作为起点，依次执行预设次数的图7所述的处理，即可以得到若干条路径，例如以每个节点作为10次起点，分别生成10条路径，若设备关联图中共存在1000个节点，则可以得到10*1000条路径。

采用上述方式，由于每条路径中，路径中除起点以外，任一节点被确定为当前节点的概率，与该节点和上一节点的边的权重值成正相关关系，因此，最终得到的每条路径中，相邻节点或相近节点之间关联关系较强，即路径中相连或相近的节点之间的位置相似度和/或用户行为相似度较高。

为了更清楚的描述本方案，下面以一个具体的实施例，对本说明书提出的方案进行说明。

线下共存在5个物联网设备，获取这5个物联网设备的位置信息，以及用户行为信息，其中行为信息包括交易行为信息以及推送信息点击行为信息；

按照每个月为一个时间窗口，在每个时间窗口内，分别生成基于交易行为信息的设备关联图、以及基于点击行为信息的设备关联图；可以根据上述公式（2）确定两个图中每条边的权重值；对这两个行为信息图进行融合，即将两个图融合为一个图，该图为该月的行为信息图，可以根据上述公式（4）确定该图中每条边的权重值；对各月的行为信息图进行融合，得到最终的行为信息图，可以根据上述公式（5）确定该图中每条边的权重值。

基于位置信息生成基于位置的设备关联图，对行为信息图已经位置信息图进行融合，得到设备关联图，可以根据上述公式（3）确定该图中每条边的权重值。

基于图生成路径集，路径的选取方式为，基于权重值随机选取若干个连续节点与该起点组成路径，其中每个节点的选取概率可以基于上述公式（6）进行确定；基于生成的路径集生成深度学习模型的训练数据集，其中该模型为Skip-gram算法模型，利用该训练数据集对模型进行训练，利用训练后的模型得到该图中任一节点对应的设备的特征值。

与前述一种物联网设备特征获取方法相对应，本说明书还提供了一种物联网设备特征获取装置。

参见图8所示，该装置包括：

信息获取模块810，用于获取多台物联网设备的位置信息以及用户行为信息；

关联图生成模块820，用于根据获取的信息构建以设备为节点、以设备间关联关系为边的设备关联图；

路径生成模块830，用于基于所构建的设备关联图，得到路径集；所述路径集中任一路径为所述设备关联图中的任一无环路径；

模型训练模块840，用于利用所述路径集中任一路径生成若干条训练样本，以根据所述路径集得到训练样本集；其中，任一训练样本以任一路径中的节点为特征值，以该路径中该节点的相邻节点为标签值；基于所述训练样本集训练深度学习模型；

设备特征获取模块850，用于利用训练后的深度学习模型的隐藏层信息获取物联网设备特征。

在一个实施例中，所述深度学习模型为Skip-gram算法模型或CBOW算法模型；所述设备特征获取模块850，具体用于针对所述设备关联图中任一节点，将该节点作为输入，利用该深度学习模型的隐藏层输出作为该节点对应的设备的特征。

在一个实施例中，所述行为信息至少包括用户标识；

所述关联图生成模块820，具体用于以所述多台物联网设备为多个节点，针对任意两个节点，根据获取的位置信息，确定所述两个节点对应的设备之间的距离是否小于预设长度；

针对所述两个节点，根据获取的行为信息中的用户标识，确定所述两个节点对应的设备之间是否具有相同用户；

若确定所述距离小于预设长度、和/或所述两个节点对应的设备之间具有相同用户，则确定所述两个节点之间具有关联关系，并构建所述两个节点之间的边。

在一个实施例中，所述行为信息为多种行为信息；

所述关联图生成模块820，具体用于针对任一种行为信息，若确定所述两个节点对应的设备之间具有相同用户标识；则确定所述两个节点对应的设备之间具有相同用户。

在一个实施例中，所述行为信息还包括行为发生时间；

所述关联图生成模块820，具体用于根据所述两个节点的行为信息中的行为发生时间，以及预设的多个时间窗口，确定行为信息所在的时间窗口；

在一个实施例中，所述关联图生成模块820，还用于根据获取的位置信息以及用户行为信息，确定所述设备关联图中任一条边的权重值，所述权重值用于表征该边两端节点之间的关联程度。

在本实施例中，所述关联图生成模块820，具体用于针对所述设备关联图中任一条边，根据获取的位置信息确定该边两端节点对应的设备之间的距离，利用该距离确定该边的距离权重值；该距离权重值与该距离成负相关关系；

根据所述该边两端节点对应的设备之间的相同用户的行为信息，确定该边的行为权重值；该行为权重值，与该相同用户的行为信息数量成正相关关系；

综合该距离权重值以及该行为权重值，确定该边的权重值。

在本实施例中，所述路径生成模块830，具体用于在所述设备关联图中以任一节点为起点，根据概率随机选取若干个连续节点与该起点组成路径，该路径中不存在相同的节点，且任一节点被选取的概率，与该节点和该路径中上一节点之间边的权重值成正相关关系。

在本实施例中，所述路径生成模块830，具体用于以所述设备关联图中任一节点为起点，在与该节点相连的至少一个节点中随机确定一个节点为当前节点，以起点和当前节点之间的全部节点和边作为当前路径，循环执行以下操作，直到达到预设停止条件：

判断是否达到预设停止条件；

若否，则在与当前节点相连的至少一个节点中随机确定一个节点作为当前节点；其中，所选取的节点不为当前路径中的任一节点；

若是，则停止循环，确定当前路径为最终路径。

上述设备中各个部件的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程，在此不再赘述。

对于装置实施例而言，由于其基本对应于方法实施例，所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的。可以根据实际的需要选择其中的部分或者全部模块来实现本说明书方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

本说明书实施例还提供一种计算机设备，其至少包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，处理器执行所述程序时实现前述的方法。该方法至少包括图1所示的物联网设备特征获取方法。

图9示出了本说明书实施例所提供的一种更为具体的计算设备硬件结构示意图，该设备可以包括：处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。

处理器1010可以采用通用的CPU（Central Processing Unit，中央处理器）、微处理器、应用专用集成电路（Application Specific Integrated Circuit，ASIC）、或者一个或多个集成电路等方式实现，用于执行相关程序，以实现本说明书实施例所提供的技术方案。

存储器1020可以采用ROM（Read Only Memory，只读存储器）、RAM（Random AccessMemory，随机存取存储器）、静态存储设备，动态存储设备等形式实现。存储器1020可以存储操作***和其他应用程序，在通过软件或者固件来实现本说明书实施例所提供的技术方案时，相关的程序代码保存在存储器1020中，并由处理器1010来调用执行。

输入/输出接口1030用于连接输入/输出模块，以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中（图中未示出），也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等，输出设备可以包括显示器、扬声器、振动器、指示灯等。

通信接口1040用于连接通信模块（图中未示出），以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式（例如USB、网线等）实现通信，也可以通过无线方式（例如移动网络、WIFI、蓝牙等）实现通信。

总线1050包括一通路，在设备的各个组件（例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040）之间传输信息。

需要说明的是，尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050，但是在具体实施过程中，该设备还可以包括实现正常运行所必需的其他组件。此外，本领域的技术人员可以理解的是，上述设备中也可以仅包含实现本说明书实施例方案所必需的组件，而不必包含图中所示的全部组件。

本说明书实施例还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现前述的方法。该方法至少包括图1示出的物联网设备特征获取方法。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存（PRAM）、静态随机存取存储器（SRAM）、动态随机存取存储器（DRAM）、其他类型的随机存取存储器（RAM）、只读存储器（ROM）、电可擦除可编程只读存储器（EEPROM）、快闪记忆体或其他内存技术、只读光盘只读存储器（CD-ROM）、数字多功能光盘（DVD）或其他光学存储、磁盒式磁带，磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体（transitory media），如调制的数据信号和载波。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本说明书实施例可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本说明书实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本说明书实施例各个实施例或者实施例的某些部分所述的方法。

上述实施例阐明的***、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机，计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，在实施本说明书实施例方案时可以把各模块的功能在同一个或多个软件和/或硬件中实现。也可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上所述仅是本说明书实施例的具体实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本说明书实施例原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本说明书实施例的保护范围。

Claims

1.一种物联网设备特征获取方法，包括：

获取多台物联网设备的位置信息以及用户行为信息；所述行为信息至少包括用户标识；

以所述多台物联网设备为多个节点，针对任意两个节点，执行以下步骤：根据获取的位置信息，确定所述两个节点对应的设备之间的距离是否小于预设长度；针对所述两个节点，根据获取的行为信息中的用户标识，确定所述两个节点对应的设备之间是否具有相同用户；若确定所述距离小于预设长度、和/或所述两个节点对应的设备之间具有相同用户，则构建所述两个节点之间的边；在针对全部节点之间执行上述步骤，得到设备关联图；

2.根据权利要求1所述的方法，所述深度学习模型为Skip-gram算法模型或CBOW算法模型；

利用训练后的深度学习模型的隐藏层信息获取物联网设备的特征，包括：

针对所述设备关联图中任一节点，将该节点作为输入，利用该深度学习模型的隐藏层输出作为该节点对应的设备的特征。

3.根据权利要求1所述的方法，所述行为信息多种行为信息；

所述针对所述两个节点，根据获取的行为信息中的用户标识，确定所述两个节点对应的设备之间是否具有相同用户；包括：

针对任一种行为信息，若确定所述两个节点对应的设备之间具有相同用户标识，则确定所述两个节点对应的设备之间具有相同用户。

4.根据权利要求1所述的方法，所述行为信息还包括行为发生时间；

根据所述两个节点的行为信息中的行为发生时间，以及预设的多个时间窗口，确定行为信息所在的时间窗口；

5.根据权利要求1所述的方法，还包括：

根据获取的位置信息以及用户行为信息，确定所述设备关联图中任一条边的权重值，所述权重值用于表征该边两端节点之间的关联程度。

6.根据权利要求5所述的方法，所述根据获取的位置信息以及用户行为信息，确定所述设备关联图中任一条边的权重值；包括：

针对所述设备关联图中任一条边，根据获取的位置信息确定该边两端节点对应的设备之间的距离，利用该距离确定该边的距离权重值；该距离权重值与该距离成负相关关系；

根据该边两端节点对应的设备之间的相同用户的行为信息，确定该边的行为权重值；该行为权重值，与该相同用户的行为信息数量成正相关关系；

综合该距离权重值以及该行为权重值，确定该边的权重值。

7.根据权利要求5所述的方法，所述路径集中任一条路径的获取方法为：

在所述设备关联图中以任一节点为起点，根据概率随机选取若干个连续节点与该起点组成路径，该路径中不存在相同的节点，且任一节点被选取的概率，与所述任一节点和该路径中上一节点之间边的权重值成正相关关系。

8.根据权利要求7所述的方法，所述在所述设备关联图中以任一节点为起点，随机选取若干个连续节点与该起点组成路径，包括：

以所述设备关联图中任一节点为起点，在与该起点相连的至少一个节点中随机确定一个节点为当前节点，以起点和当前节点之间的全部节点和边作为当前路径，循环执行以下操作，直到达到预设停止条件：

判断是否达到预设停止条件；

若否，则在与当前节点相连的至少一个节点中根据概率随机确定一个节点作为当前节点；其中，所选取的节点不为当前路径中的任一节点；

若是，则停止循环，确定当前路径为最终路径。

9.一种物联网设备特征获取装置，包括：

信息获取模块，用于获取多台物联网设备的位置信息以及用户行为信息；所述行为信息至少包括用户标识；

关联图生成模块，用于以所述多台物联网设备为多个节点，针对任意两个节点，执行以下步骤：根据获取的位置信息，确定所述两个节点对应的设备之间的距离是否小于预设长度；针对所述两个节点，根据获取的行为信息中的用户标识，确定所述两个节点对应的设备之间是否具有相同用户；若确定所述距离小于预设长度、和/或所述两个节点对应的设备之间具有相同用户，则构建所述两个节点之间的边；在针对全部节点之间执行上述步骤，得到设备关联图；

10.根据权利要求9所述的装置，所述深度学习模型为Skip-gram算法模型或CBOW算法模型；所述设备特征获取模块，具体用于针对所述设备关联图中任一节点，将该节点作为输入，利用该深度学习模型的隐藏层输出作为该节点对应的设备的特征。

11.根据权利要求9所述的装置，所述行为信息为多种行为信息；

所述关联图生成模块，具体用于针对任一种行为信息，若确定所述两个节点对应的设备之间具有相同用户标识；则确定所述两个节点对应的设备之间具有相同用户。

12.根据权利要求9所述的装置，所述行为信息还包括行为发生时间；

所述关联图生成模块，具体用于根据所述两个节点的行为信息中的行为发生时间，以及预设的多个时间窗口，确定行为信息所在的时间窗口；

13.根据权利要求9所述的装置，

所述关联图生成模块，还用于根据获取的位置信息以及用户行为信息，确定所述设备关联图中任一条边的权重值，所述权重值用于表征该边两端节点之间的关联程度。

14.根据权利要求13所述的装置，

所述关联图生成模块，具体用于针对所述设备关联图中任一条边，根据获取的位置信息确定该边两端节点对应的设备之间的距离，利用该距离确定该边的距离权重值；该距离权重值与该距离成负相关关系；

综合该距离权重值以及该行为权重值，确定该边的权重值。

15.根据权利要求13所述的装置，

所述路径生成模块，用于在所述设备关联图中以任一节点为起点，根据概率随机选取若干个连续节点与该起点组成路径，该路径中不存在相同的节点，且任一节点被选取的概率，与所述任一节点和该路径中上一节点之间边的权重值成正相关关系。

16.根据权利要求15所述的装置，

所述路径生成模块，具体用于以所述设备关联图中任一节点为起点，在与该起点相连的至少一个节点中随机确定一个节点为当前节点，以起点和当前节点之间的全部节点和边作为当前路径，循环执行以下操作，直到达到预设停止条件：

判断是否达到预设停止条件；

若是，则停止循环，确定当前路径为最终路径。

17.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，所述处理器执行所述程序时实现如权利要求1至8任一项所述的方法。