CN113360788A - 一种地址推荐方法、装置、设备及存储介质 - Google Patents
一种地址推荐方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113360788A CN113360788A CN202110499280.5A CN202110499280A CN113360788A CN 113360788 A CN113360788 A CN 113360788A CN 202110499280 A CN202110499280 A CN 202110499280A CN 113360788 A CN113360788 A CN 113360788A
- Authority
- CN
- China
- Prior art keywords
- feature
- address
- scalar
- address information
- binary tree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000004364 calculation method Methods 0.000 claims abstract description 19
- 238000012549 training Methods 0.000 claims abstract description 15
- 238000012163 sequencing technique Methods 0.000 claims abstract description 7
- 230000006870 function Effects 0.000 claims description 23
- 230000008569 process Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 3
- 230000003213 activating effect Effects 0.000 claims description 2
- 238000002372 labelling Methods 0.000 claims description 2
- 238000012216 screening Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 11
- 230000008901 benefit Effects 0.000 abstract description 8
- 230000006399 behavior Effects 0.000 description 17
- 238000004422 calculation algorithm Methods 0.000 description 8
- 230000000875 corresponding effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000007667 floating Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000012407 engineering method Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000011112 process operation Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供一种地址推荐方法、装置、计算机设备及储存介质,该方法包括获取地址信息,提取所述地址信息的特征,并输出每一条地址信息的特征标量,通过预先训练好的训练模型利用二叉树的结构优势以及树模型的可解释性对输入的特征标量的不同特征综合评估,输出所述地址信息的置信度,根据所述置信度排序所述地址信息,并输出地址列表。本申请引入地址信息的多元特征,采用多元化的特征集合,综合参考所有特征,把收益群众扩大到整体,使得推荐效果可以服务于不同的行为模式的用户,计算结果更加全面,排序更智能灵活。
Description
技术领域
本申请涉及互联网技术领域,具体涉及电子商务技术领域,尤其涉及涉及一种地址推荐方法、装置、设备及存储介质。
背景技术
近年来,互联网的发展便利了人们的生活。随着科技的发展和人们生活水平的提高,电子商务得到了迅速发展,越来越多的人们都***台侧影响平台收益。目前,多数包含历史地址功能的媒介采用以下几种方案进行地址推荐:
1、按距离排序:根据用户所在位置将现有历史地址按照距离排序,距离越近的历史地址会排在列表的更上方:
优点:很多场景下用户行为有这样的潜在规律,即用户往往身处目的地为自己下单,这时候按距离排序就会产生一定效果;
缺点:这种方式考虑的场景比较单一,真正利好的场景数量也比较少,数据显示在货运场景下此方式发单成功率低于25%,因此该方式不能对多数用户起到很好推荐效果。
2、按时间:根据当前***时间,把历史地址的更新时间或创建时间倒排,近期使用过或近期创建的地址会被排在比较靠前的位置:
优点:部分场景下用户会用上次使用过或近期使用过的地址作为目标地址,对于这部分用户,按时间倒排的方式能达到不错的推荐效果;
缺点:同按距离排序类似,符合上述用户行为的用户只占据所有用户中很小的一部分,比如人们选用什么地址,更多的是参考各自的业务需求,历史地址越多,按时间排序的收益往往越不明显。
3、按照使用频次:根据不同历史地址的使用次数倒排,使用次数多的地址排列位置会比较靠前。
优点:符合概率论的结论,可类比为把从历史列表中选址当做从盒子里抽取某颜色的球,当某一地址被多次使用,等同于某一颜色的球数量较多这时再从盒子里抽球抽取到该颜色的几率也会比较大。
缺点:从历史地址选址并不完全符合随机性,选址是个人需求或业务场景决定的,受业务驱使成因复杂,不能保证随机性,因此概率模型应用到选址上会和真实结果产生很大偏差,数据显示货运场景下此方式推荐成功率低于35%,应用这一理论的地址推荐效果不理想。
上述传统的历史地址推荐方法都是依据单一的行为特征(如时间、距离、频次等),只能影响到有类似行为模式的少数用户群体。
发明内容
本申请实施例的目的在于提出一种地址推荐方法、装置、设备及存储介质,通过采用更加多元化的地址特征集合,把收益群众扩大到整体,使得推荐效果可以服务于不同的行为模式的用户,用于解决现有技术中只依据单一的行为特征推荐收货地址的技术问题。
为了解决上述技术问题,本申请实施例提供一种地址推荐方法,包括下述步骤:
获取地址信息;
提取所述地址信息的特征,并输出每一条地址信息的特征标量;
将所述特征标量输入训练模型,对所述特征标量综合评估,输出所述地址信息的置信度;
根据所述置信度排序所述地址信息,并输出地址列表。
进一步地,所述提取所述地址信息的特征,并输出每一条地址信息的特征标量的步骤包括:
分解拆分所述地址信息中的特征,筛选相关性强的特征作为特征集,并将所述特征集的每个特征及其特征值生成特征标量。
进一步地,所述训练模型为由多棵二叉树结构组成的集成树模型,所述将所述特征标量输入训练模型,对所述特征标量综合评估,输出所述地址信息的置信度包括以下步骤:
对所述输入的特征标量分类,并对分类好的特征标量打标签;
加入树模型,对划分好标签的所述特征标量计算每棵所述二叉树结构的输出值和残差,上一棵所述二叉树结构的残差迭代输入到下一棵所述二叉树结构计算输出值;
所有所述二叉树的结构的输出值之和通过激活函数sigmoid输出所述特征的置信度。
进一步地,所述对所述输入的特征标量分类,并对分类好的特征标量打标签,通过以下方式对输入第一棵二叉树结构的所述特征标量进行划分:
所述特征标量设有标签值,根据所述所述标签值,以均方差作为目标函数,计算每个所述特征值预设作为划分点的方差,将使得所述目标函数极小值的特征及特征值作为划分所述特征标量的最佳***点,根据所述最佳***点将所述特征标量划分在第一棵所述二叉树结构的左右两个子节点中并打标签。
进一步地,所述的集成树模型根据以下公式计算每棵二叉树的输出值:
Fm(X)=Fm-1(X)+ρmh(X;am) ⑤;
其中,公式①中FO(X)为根据所述特征标量计算的初始值,L为损失函数;yi为所述特征标量的标签值,公式②和公式③用于计算所在二叉树结构的残差;公式④用于优化所述损失函数,计算权重;公式⑤用于计算所述二叉树结构的的输出值,上述公式中公式②~⑤经过m次迭代计算,每经过一棵二叉树结构迭代计算一次,每次迭代后m数值增加1;ρ、a、β为计算过程中预设的参数,其中ρ和a随着二叉树每次迭代发生变化;N为所述特征标量的数量。
进一步地,所述所有所述二叉树的结构的输出值之和通过激活函数sigmoid输出所述特征的置信度的步骤包括:
进一步地,所述地址信息包括定位地址、日志中的历史使用地址及本地设置的本地地址。
为了解决上述技术问题,本申请实施例还提供一种地址推荐装置,包括:
获取模块,用于获取地址信息;
特征提取模块,用于提取所述地址信息的特征,并输出每一条地址信息的特征标量;
计算模块,用于将所述特征标量输入训练模型,对所述特征标量综合评估,并输出所述地址信息的置信度;
输出模块,用于根据所述置信度排序所述地址信息,并输出地址列表。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:
一种计算机设备,包括存储器、处理器和网络接口,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述所述的地址推荐方法的步骤。
为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:
一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述所述的地址推荐方法的步骤。
与现有技术相比,本申请实施例主要有以下有益效果:
本申请实施例提供一种地址推荐方法,包括获取地址信息,并提取所述地址信息的特征,并输出每一条地址信息的特征标量,通过预先训练好的训练模型利用二叉树的结构优势以及树模型的可解释性对输入的特征标量的不同特征综合评估,输出所述地址信息的置信度,根据所述置信度排序所述地址信息,并输出地址列表。本申请引入地址信息的多元特征,采用多元化的特征集合,综合参考所有特征,把收益群众扩大到整体,使得推荐效果可以服务于不同的行为模式的用户,计算结果更加全面,排序更智能灵活。
附图说明
为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例可以应用于其中的示例性***架构图;
图2为本申请的地址推荐方法的流程示意图;
图3为本申请的地址推荐方法的置信sigmoid的函数图像;
图4为申请的地址推荐方法的应用***的算法算法原理图;
图5为本申请的地址推荐装置的一个实施例的结构示意图;
图6是根据本申请的计算机设备的一个实施例的结构示意图。
附图标记:
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了使本技术领域的人员更好地理解本申请方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。
如图1所示,***架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等,操作地址推荐方法的业务及应用。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于用户设备、网络设备或用户设备与网络设备通过网络相集成所构成的设备。所述用户设备其包括但不限于任何一种可与用户通过触摸板进行人机交互的移动电子产品,例如智能手机、平板电脑等,所述移动电子产品可以采用任意操作***,如android操作***、iOS操作***等。其中,所述网络设备包括一种能够按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。所述网络设备其包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云;在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟超级计算机。所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad HOc网络)等。当然,本领域技术人员应能理解上述终端设备仅为举例,其他现有的或今后可能出现的终端设备如可适用于本申请,也应包含在本申请保护范围以内,并在此以引用方式包含于此。
服务器105可以是一台服务器,或者由若干台服务器组成的服务器集群,或者是一个云计算服务中心。其也可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的地址推荐方法一般由服务器执行,计算结果由终端设备输出,相应地,地址推荐装置一般设置于服务器中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
现有技术中,地址推荐模型一般是依据单一的行为特征(如时间、距离、频次等)方式对用户地址排序推荐用户地址的,该方式只能影响到有类似行为模式的少数用户群体,例如:群体A行为习惯符合特征a排序的结果,群体B行为习惯符合特征b排序的结果,传统的地址推荐方案由于按照特征a排序,只能影响到群体A,群体B不能享受到推荐的效果,并且群体B排序也被扰乱,甚至可能适得其反。传统地址推荐排序方法无法将收益群众扩大到整体,使得推荐效果可以服务于不同的行为模式的用户。本发明不再只面向部分群体,而是采用更加多元化的特征集合,把收益群众扩大到整体,使得推荐效果可以服务于不同的行为模式的用户,提升地址推荐的智能度,使其高效、合理、适用面广。
请参考图2,示出了根据本申请的一种地址推荐方法的一个实施例的流程图。所述的地址推荐方法,包括以下步骤:
201:获取地址信息。
在本发明实施例中,所述地址信息包括中蕴含大量显性的用户行为及操作习惯,很多行为习惯不容易被发现但却隐含在数据中,通过读取地址信息可获取生成不同维度的特征。
需要说明的是,所述地址信息包括但不限于用户终端的当前定位地址、日志中用户使用或查找或访问过的地址、以及用户终端设置的本地地址。
202:提取所述地址信息的特征,并输出每一条地址信息的特征标量。
在本发明实施例中,所述终端设备可以将步骤201收集的所述地址信息输入特征提取模型中提取地址特征,通过空值处理、异常值处理、缺失字段处理等手段对所述地址信息进行预处理,可通过对数据进行不同角度的拆解从而生成不同维度的特征,如时间、距离等等特征,这些特征部分在经验上有利于判断用户倾向于哪个地址,部分与用户的最终选择在相关性系数(如皮尔斯系数)上成立一定相关性。本发明通过分析候选所述地址信息中与预测输出地址相关的特征,筛选相关性强的特征作为特征集,并将所述特征集的每个特征及其特征值生成特征标量。
示例性地,网络购物中,空间距离是与推荐地址相关性较强的特征,可根据用户日志中某一单用户所在位置与该订单收货地经纬度之间球面距离生成关于距离特征方面的特征标量值。所述特征标量以用户作为单位,以该用户所有历史订单作为生成特征的基础数据,最终生成用户对于每一条地址的特征标量<uid,<address,feature>>。
需要说明的是,根据所述特征与地址推荐预测的相关性和相关程度,可对所述特征标量设置标签值,用于判断所述特征与预测地址推荐相关性,是否能够用作判定推荐结果的依据,所述相关性包括正相关、负相关和不相关,若特征相关性弱则将被过滤掉,反之相关性强的特征可以留在特征集中,最终生成包含多个高相关度特征的特征集,根据所述特征集生成特征标量。
203:将所述特征标量输入训练模型,对所述特征标量综合评估,输出所述地址信息的置信度。
在本实施例中,所述训练模型为集成树模型,由多棵二叉树结构组成,所述二叉树的节点至多包括左右两个叶子节点,父节点用于存放划分所述特征标量的阈值条件,左右子节点分别用于存放根据所述父节点划分的特征标量。
需要说明的是,所述集成树模型是预先经过训练的,当所述特征标量输入所述训练模型,所述集成树模型充分利用二叉树的结构优势以及树模型的可解释性,将不同特征综合评估,输出所述地址信息的置信度。
具体地,将所述特征标量输入到所述集成树模型后,需要对输入的所述集成树模型的特征标量进行分类,其中所述二叉树结构中父节点的划分阈值,将所述特征标量数据***划分到左右两个子节点中,并对分类好的特征标量打标签,如左边叶子节点的数据作为正例,标签为1,右边叶子节点的数据作为负例,标签为0。划分好标签的所述特征标量计算每棵所述二叉树结构的输出值和残差,上一棵所述二叉树结构的残差迭代输入到下一棵所述二叉树结构计算输出值,所述输出值结果为其中一特征的输出结果,是介于0-1之间的浮点数,用于表示可能性。所述输出值与所述特征标量的标签的差值作为残差又输入到下一棵二叉树结构中,用于计算下一棵二叉树结构父节点***点。所有所述二叉树的结构的输出值之和通过激活函数sigmoid输出所述特征的置信度。
具体地,所述集成树模型根据以下算法对所述特征标量进行计算分析,输出其对应的置信度。
Algorithm 1:Gradient_Boost
For m=1 to M do:
Fm(X)=Fm-1(X)+ρmh(X;am);
endFor
End Algorithm
在所述算法流程包括:
Step1.根据所有样本的标签值整理一个初始值F0,y为样本真实标签,ρ为预设参数;
Step2.循环遍历预先设定好的M棵二叉树;
Step3.每棵二叉树计算残差,L为损失函数,F(x)为二叉树的输出值;
Step4.计算使损失函数最小的对应参数,am和ρm都为计算过程中的参数;
Step5.下一棵树的输出为上一棵树的输出值和该输出值与am和ρm参数计算的乘积;
Step6.所述树模型的输出值为每一棵二叉树的输出值的和。
上述计算过程中,F0(X)为根据所述特征标量计算的初始值,L为损失函数;yi为所述特征标量的标签值,为每棵二叉树的残差,ρ、a、β为计算过程中预设的参数,其中ρ和a随着二叉树每次迭代发生变化;N为所述特征标量的数量。
在本发明实施例中,所述残差为上一棵二叉树与所述特征标量对应标签的差值。最终最后一棵二叉树的输出值根据公式计算得出所述特征标量的置信度,计算结果如图3所示,所述置信度介于输出都会映射到0-1的区间里,并且输出结果和输入结果是正相关的。
需要说明的是,对所述集成树模型中的第一棵二叉树对所述特征标量进行划分数据时,以均方差作为目标函数,计算每个所述特征值预设作为划分点的方差,将使得所述目标函数极小值的特征及特征值作为划分所述特征标量的最佳***点,根据所述最佳***点将所述特征标量划分在第一棵所述二叉树结构的左右两个子节点中并打标签。
204:根据所述置信度排序所述地址信息,并输出地址列表。
经过步骤203对所述地址信息计算置信度后,根据每个地址信息的置信度大小按照倒序排列所述地址信息。
本发明申请实施例所提供的所述地址推荐方法可用于对地址信息进行预测,对于一条真实数据(<用户ID,订单信息>),利用相同的特征工程方法将订单信息转化为特征标量,将生成的<uid,<address,feature>数据,输入到训练好的集成树模型中,集成树模型根据特征feature得出该数据真实的可能性(0-1之间的浮点数),即置信度,根据所述置信度倒排将对应的所述地址信息排列推荐到用户客户端。本申请引入地址信息的多元特征,采用多元化的特征集合,综合参考所有特征,把收益群众扩大到整体,使得推荐效果可以服务于不同的行为模式的用户,计算结果更加全面,排序更智能灵活。
请参阅图4,本申请所述地址推荐方法所应用***流程图,用户终端可从用户日志获取地址信息,根据POIID将读取的地址信息压缩,输入到特征提取模型中进行特征抽取,抽取的特征输入到集成树模型中进行模型打分,根据所述打分,将地址按照得分倒序排列输出地址列表并发送终端设备向终端用户推荐地址。
如表1所示,用户终端获取了两条历史地址记录,地址信息如表:
表1
根据表1获取的地址信息,在对地址1和地址2进行特征工程提取地址信息的特征后,可生成并输出每一条地址信息的特征标量,如地址1信息可生成一组16维特征标量,所述特征标量是根据已知的地址信息,根据预设的计算规则输出的数字或者字段,如利用算法模型,根据用户请求时的定位地址和目标地址的计算距离特征的标量,并将该标量转换成所述算法模型可以识别的形式。示例地,用户日志中某一条请求的经度:121.323,纬度:32.323,和该请求对应的某地址所在经度:123.2323,纬度:33.2323,可计算出球面距离特征距离为2390km,将其数值2390作为标量输入所述集成树模型中。
集成树模型中第一棵二叉树在对所述特征标量进行划分时,根据输入特征标量的标签值,以标签值的均方差计算目标函数,计算每个所述特征值预设作为划分点的方差,将使得所述目标函数极小值的特征及特征值作为划分所述特征标量的最佳***点。如根据表2所示特征标量,将其中所有特征的每个标量分别预设为***点,计算其样本总方差,计算结果如表3所示。
MSE=1/4*((-0.375)2+(-0.175)2+0.2252+0.3252)≈0.082。
以此类推,可计算出如表3中每个特征的标量作为划分点的样本总方差。
特征标量 | 时间(天) | 距离(km) | 标签值 |
1 | 5 | 20 | -0.375 |
2 | 7 | 30 | -0.175 |
3 | 21 | 70 | 0.225 |
4 | 30 | 60 | 0.325 |
表2
表3
根据表3,样本总方差最小为0.0125,满足这一条件的划分点有“时间21”和“距离60”,则随机选择一个特征作为划分点如“时间21”,所有样本“中时间天数小于21”的样本会流转到left节点,标签为1;所有样本中“时间天数大于等于21的样本”会流转到right节点,标签为0。当然,本实施例对于可能有多个总方差相同的划分点可以作为最佳***点的方案中,也可以通过其他方式筛选组最佳***点,如加权分析,本实施例对比不作限制。
划分后按照预设算法计算所述特征标量在第一棵二叉树的输出结果F1,该结果与标签的差值作为残差输入到第二棵二叉树中,以此类推,计算输出每棵二叉树的输出结果,所述集成树的最终输出结果为所有二叉树的输出值之和,将其通过sigmoid函数输出所述特征标量的置信度,如:
“海角1号”:0.6,
“上海申窑艺术中心”:0.25。
则根据打分将地址排好后即可输出推荐地址列表:
1.海角1号
2.上海申窑艺术中心。
为解决上述技术问题,如图5所示,本申请实施例还提供地址推荐装置5。地址推荐装置5,包括:
获取模块501,用于获取地址信息;
特征提取模块502,用于提取所述地址信息的特征,并输出每一条地址信息的特征标量;
计算模块503,用于将所述特征标量输入训练模型,对所述特征标量综合评估,并输出所述地址信息的置信度;
输出模块504,用于根据所述置信度排序所述地址信息,并输出地址列表。
获取模块501所获取的地址信息输入到所述特征提取模块502中提取所述地址信息的特征,并输出每一条地址信息的特征标量,所述计算模块503通过预先训练好的训练模型利用二叉树的结构优势以及树模型的可解释性对输入的特征标量的不同特征综合评估,输出所述地址信息的置信度。
所述地址推荐装置5还包括显示模块,所述显示模块与所述输出模块504相连,所述显示模块用于显示所述地址推荐装置的数据信息及操作页面,包括计算输出的推荐地址列表。
所述地址推荐装置5还可以包括输入模块,所述输入模块与所述显示模块相连,所述输入模块可包括按键,可用于输入用户id的账号、密码、名称等信息,所述地址推荐过程操作页面可以在所述地址推荐装置中的显示模块中显示,并且所述显示模块还可以显示所述用户的其他信息,并将此信息存储起来,方便用户随时进行查看。
需要说明的是,本实施例的装置,与方法实施例的属于同一构思,其具体实现过程详细见方法实施例,且方法实施例中的技术特征在本实施例中均对应适用,这里不再赘述。
为解决上述技术问题,本申请实施例还提供计算机设备6。具体请参阅图6,(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器61至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器61可以是所述计算机设备6的内部存储单元,例如该计算机设备6的硬盘或内存。在另一些实施例中,所述存储器61也可以是所述计算机设备6的外部存储设备,例如该计算机设备6上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(FlashCard)等。当然,所述存储器61还可以既包括所述计算机设备6的内部存储单元也包括其外部存储设备。本实施例中,所述存储器61通常用于存储安装于所述计算机设备6的操作基金***和各类应用软件,例如地址推荐方法的程序代码等。此外,所述存储器61还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器62在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器62通常用于控制所述计算机设备6的总体操作。本实施例中,所述处理器62用于运行所述存储器61中存储的程序代码或者处理数据,例如运行所述地址推荐方法的程序代码。
所述网络接口63可包括无线网络接口或有线网络接口,该网络接口63通常用于在所述计算机设备6与其他电子设备之间建立通信连接。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有地址推荐程序,所述地址推荐程序可被至少一个处理器执行,以使所述至少一个处理器执行如上述的地址推荐方法的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。
Claims (10)
1.一种地址推荐方法,其特征在于,包括下述步骤:
获取地址信息;
提取所述地址信息的特征,并输出每一条地址信息的特征标量;
将所述特征标量输入训练模型,对所述特征标量综合评估,输出所述地址信息的置信度;
根据所述置信度排序所述地址信息,并输出地址列表。
2.根据权利要求1所述的地址推荐方法,其特征在于,所述提取所述地址信息的特征,并输出每一条地址信息的特征标量的步骤包括:
分解拆分所述地址信息中的特征,筛选相关性强的特征作为特征集,并将所述特征集的每个特征及其特征值生成特征标量。
3.根据权利要求1所述的地址推荐方法,其特征在于,所述训练模型为由多棵二叉树结构组成的集成树模型,所述将所述特征标量输入训练模型,对所述特征标量综合评估,输出所述地址信息的置信度包括以下步骤:
对所述输入的特征标量分类,并对分类好的特征标量打标签;
加入树模型,对划分好标签的所述特征标量计算每棵所述二叉树结构的输出值和残差,上一棵所述二叉树结构的残差迭代输入到下一棵所述二叉树结构计算输出值;
所有所述二叉树的结构的输出值之和通过激活函数sigmoid输出所述特征的置信度。
4.根据权利要求3所述的地址推荐方法,其特征在于,所述对所述输入的特征标量分类,并对分类好的特征标量打标签,通过以下方式对输入第一棵二叉树结构的所述特征标量进行划分:
所述特征标量设有标签值,根据所述所述标签值,以均方差作为目标函数,计算每个所述特征值预设作为划分点的方差,将使得所述目标函数极小值的特征及特征值作为划分所述特征标量的最佳***点,根据所述最佳***点将所述特征标量划分在第一棵所述二叉树结构的左右两个子节点中并打标签。
7.所根据权利要求1所述的地址推荐方法,其特征在于,所述地址信息包括定位地址、日志中的历史使用地址及本地设置的本地地址。
8.一种地址推荐装置,其特征在于,包括:
获取模块,用于获取地址信息;
特征提取模块,用于提取所述地址信息的特征,并输出每一条地址信息的特征标量;
计算模块,用于将所述特征标量输入训练模型,对所述特征标量综合评估,并输出所述地址信息的置信度;
输出模块,用于根据所述置信度排序所述地址信息,并输出地址列表。
9.一种计算机设备,其特征在于,包括存储器、处理器和网络接口,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的地址推荐方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的地址推荐方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110499280.5A CN113360788A (zh) | 2021-05-07 | 2021-05-07 | 一种地址推荐方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110499280.5A CN113360788A (zh) | 2021-05-07 | 2021-05-07 | 一种地址推荐方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113360788A true CN113360788A (zh) | 2021-09-07 |
Family
ID=77526004
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110499280.5A Pending CN113360788A (zh) | 2021-05-07 | 2021-05-07 | 一种地址推荐方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113360788A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114003812A (zh) * | 2021-10-29 | 2022-02-01 | 深圳壹账通智能科技有限公司 | 地址匹配方法、***、设备及存储介质 |
CN114118631A (zh) * | 2022-01-24 | 2022-03-01 | 深圳依时货拉拉科技有限公司 | 基于图神经网络的装卸货点推荐方法和装置 |
CN114417457A (zh) * | 2021-12-22 | 2022-04-29 | 山东同圆数字科技有限公司 | 一种基于cim技术的规划项目在线多维协同选址*** |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009187077A (ja) * | 2008-02-04 | 2009-08-20 | Nec Corp | 推薦情報提供装置、推薦情報提供方法、推薦情報提供システムおよび推薦情報提供プログラム |
CN109284498A (zh) * | 2017-07-20 | 2019-01-29 | 菜鸟智能物流控股有限公司 | 自提柜推荐方法、自提柜推荐装置和电子装置 |
US20190197483A1 (en) * | 2017-12-22 | 2019-06-27 | Microsoft Technology Licensing, Llc | Large-scale aggregation and verification of location data |
CN111104614A (zh) * | 2019-12-11 | 2020-05-05 | 上海携旅信息技术有限公司 | 用于旅游目的地推荐***的召回信息的生成方法 |
CN111210158A (zh) * | 2020-01-14 | 2020-05-29 | 上海钧正网络科技有限公司 | 目标地址确定方法、装置、计算机设备和存储介质 |
CN112001305A (zh) * | 2020-08-21 | 2020-11-27 | 西安交通大学 | 基于梯度提升决策树的特征优化ssvep异步识别方法 |
CN112069275A (zh) * | 2020-08-26 | 2020-12-11 | 北京百度网讯科技有限公司 | 一种目的地预测方法、装置、电子设备及存储介质 |
CN112418445A (zh) * | 2020-11-09 | 2021-02-26 | 深圳市洪堡智慧餐饮科技有限公司 | 一种基于机器学习的智能选址融合方法 |
-
2021
- 2021-05-07 CN CN202110499280.5A patent/CN113360788A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009187077A (ja) * | 2008-02-04 | 2009-08-20 | Nec Corp | 推薦情報提供装置、推薦情報提供方法、推薦情報提供システムおよび推薦情報提供プログラム |
CN109284498A (zh) * | 2017-07-20 | 2019-01-29 | 菜鸟智能物流控股有限公司 | 自提柜推荐方法、自提柜推荐装置和电子装置 |
US20190197483A1 (en) * | 2017-12-22 | 2019-06-27 | Microsoft Technology Licensing, Llc | Large-scale aggregation and verification of location data |
CN111104614A (zh) * | 2019-12-11 | 2020-05-05 | 上海携旅信息技术有限公司 | 用于旅游目的地推荐***的召回信息的生成方法 |
CN111210158A (zh) * | 2020-01-14 | 2020-05-29 | 上海钧正网络科技有限公司 | 目标地址确定方法、装置、计算机设备和存储介质 |
CN112001305A (zh) * | 2020-08-21 | 2020-11-27 | 西安交通大学 | 基于梯度提升决策树的特征优化ssvep异步识别方法 |
CN112069275A (zh) * | 2020-08-26 | 2020-12-11 | 北京百度网讯科技有限公司 | 一种目的地预测方法、装置、电子设备及存储介质 |
CN112418445A (zh) * | 2020-11-09 | 2021-02-26 | 深圳市洪堡智慧餐饮科技有限公司 | 一种基于机器学习的智能选址融合方法 |
Non-Patent Citations (1)
Title |
---|
阿里集团 新零售技术事业群 CBU著: "阿里巴巴B2B电商算法实战", 机械工业出版社, pages: 137 - 142 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114003812A (zh) * | 2021-10-29 | 2022-02-01 | 深圳壹账通智能科技有限公司 | 地址匹配方法、***、设备及存储介质 |
CN114417457A (zh) * | 2021-12-22 | 2022-04-29 | 山东同圆数字科技有限公司 | 一种基于cim技术的规划项目在线多维协同选址*** |
CN114118631A (zh) * | 2022-01-24 | 2022-03-01 | 深圳依时货拉拉科技有限公司 | 基于图神经网络的装卸货点推荐方法和装置 |
CN114118631B (zh) * | 2022-01-24 | 2022-05-17 | 深圳依时货拉拉科技有限公司 | 基于图神经网络的装卸货点推荐方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112084383B (zh) | 基于知识图谱的信息推荐方法、装置、设备及存储介质 | |
CN110825957B (zh) | 基于深度学习的信息推荐方法、装置、设备及存储介质 | |
US20230102337A1 (en) | Method and apparatus for training recommendation model, computer device, and storage medium | |
CN113360788A (zh) | 一种地址推荐方法、装置、设备及存储介质 | |
CN112632385A (zh) | 课程推荐方法、装置、计算机设备及介质 | |
WO2021143267A1 (zh) | 基于图像检测的细粒度分类模型处理方法、及其相关设备 | |
CN109471978B (zh) | 一种电子资源推荐方法及装置 | |
CN112328909B (zh) | 信息推荐方法、装置、计算机设备及介质 | |
CN112395487B (zh) | 信息推荐方法、装置、计算机可读存储介质及电子设备 | |
CN109509048B (zh) | 恶意订单识别方法、装置、电子设备及存储介质 | |
CN112035549B (zh) | 数据挖掘方法、装置、计算机设备及存储介质 | |
CN112085565A (zh) | 基于深度学习的信息推荐方法、装置、设备及存储介质 | |
CN111429161B (zh) | 特征提取方法、特征提取装置、存储介质及电子设备 | |
CN110827112A (zh) | 深度学习的商品推荐方法、装置、计算机设备及存储介质 | |
CN112215658A (zh) | 基于大数据的选址方法、装置、计算机设备及存储介质 | |
CN114780746A (zh) | 基于知识图谱的文档检索方法及其相关设备 | |
CN115033801B (zh) | 物品推荐方法、模型训练方法及电子设备 | |
Concolato et al. | Data science: A new paradigm in the age of big-data science and analytics | |
CN112055038B (zh) | 生成点击率预估模型的方法及预测点击概率的方法 | |
CN116823410B (zh) | 数据处理方法、对象处理方法、推荐方法及计算设备 | |
CN118043802A (zh) | 一种推荐模型训练方法及装置 | |
CN113569118A (zh) | 自媒体推送方法、装置、计算机设备及存储介质 | |
CN115392361A (zh) | 一种智能排序方法、装置、计算机设备及存储介质 | |
CN114707068A (zh) | 一种智库知识推荐的方法、装置、设备及介质 | |
CN116484085A (zh) | 一种信息投放方法、装置、设备及存储介质、程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210907 |
|
RJ01 | Rejection of invention patent application after publication |