CN107203522B - 一种恶意订单地址的判定方法和装置 - Google Patents
一种恶意订单地址的判定方法和装置 Download PDFInfo
- Publication number
- CN107203522B CN107203522B CN201610149844.1A CN201610149844A CN107203522B CN 107203522 B CN107203522 B CN 107203522B CN 201610149844 A CN201610149844 A CN 201610149844A CN 107203522 B CN107203522 B CN 107203522B
- Authority
- CN
- China
- Prior art keywords
- address
- order
- similar
- library
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/018—Certifying business or products
- G06Q30/0185—Product, service or business identity fraud
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Remote Sensing (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种恶意订单地址的判定方法和装置,能够快速判定和查找出恶意订单用户,特别是能快速判定和查找出频繁抢单的恶意订单用户并将其进行拦截,保证了普通用户的利益,地址查询时间短且查询效率高。本发明的恶意订单地址的判定方法包括:接收订单地址,并按照预定层次顺序从地址库中查找出与订单地址相同部分最多的地址作为相似地址;计算相似地址与订单地址的相似度和查找时间差,并获取相似地址的累计查找次数,其中,查找时间差为订单地址的当前查找时间和相似地址的查找时间之差中的最小值;根据相似度、查找时间差和累计查找次数计算订单地址的得分;将得分大于预设的得分阈值的订单地址判定为恶意订单地址。
Description
技术领域
本发明涉及计算机及其软件技术领域,特别地涉及一种恶意订单地址的判定方法和装置。
背景技术
随着互联网的蓬勃发展,电子商务的规模成倍增长。特别是近几年,电子商务体系的不断完善和用户***台购物,电商营销发挥着重要作用。抢购作为一种重要的营销手段,能够十分有效地为购物平台吸引大量人气,帮助引来新的用户,增加访问量和点击量,提高电商网站的知名度和用户活跃度。
抢购商品通常具有实惠力度大、稀缺性明显的特点,所以在吸引大批正常用户的同时,也引来了大量的恶意订单用户(俗称黄牛)。抢购商品成为众多黄牛赚取利润差的理想目标。对于一个互联网购物平台,运营设计的抢购活动通常只包含至多上千件的商品,但是最终能产生上百万的下单请求,其中充斥着大量黄牛以及其它恶意订单,不仅给整个***增加了沉重负担也损害了普通消费者正常利益。
早期传统的人工审核在面对如此众多的订单,往往也是力不从心,人工审核不仅处理速度慢,而且容易出现错误,于是抢购***中针对恶意订单,特别是恶意抢单的自动判定***应运而生。
现有比较流行的处理***都是针对客户的订单请求分别采用了多个模型串行过滤的处理方式,方法流程如图1所示。图1示出了现有技术的实现订单请求过滤的方法流程示意图,如图1所示,用户的下单请求信息可以分为多个维度,如IP地址、UID、手机号、商品限购信息等。根据每个维度的信息,都可以设计对应的模型进行过滤判断。所有下单请求从第一个模型开始依次逐步过滤,凡是判定未通过模型的请求随即被打上恶意标识,为客服是否进一步审核订单提供重要的参考依据。这种技术方案从设计上思路比较清晰,一定程度上替代了人工审单的工作,降低了客服的工作量。
然而,上述现有模型都是针对每个维度信息采用单独的标准进行判断,并没有对各个模型的判断结果进行统一整合。以IP地址为例,通常的思路是对相同IP地址的请求采用频率限制,如一个时间段内,相同IP地址访问次数超过一定的阈值就会被打上标识,此时间段内同一IP地址的后续请求都会被认为是黄牛刷单请求,将被直接拒绝。但是现在的IP地址大多采用动态分配,黄牛刷单时也很有可能使用动态IP地址和代理IP地址的技术来不断变化下单请求的IP地址,从而规避了抢购***中对IP地址的监控。同样的,黄牛可以同时使用上千个不同的账号来轮流抢购。这样针对现在考虑到的这些维度信息采用模型串行过滤的方式并不能很好地实现对黄牛抢购下单请求的拦截。
综上所述,现有的方法不能很好地判定众多订单信息中的恶意订单,从而不能有效地对恶意订单进行过滤和拦截。
发明内容
有鉴于此,本发明提供一种恶意订单地址的判定方法和装置,能够快速判定和查找出恶意订单用户,特别是能快速判定和查找出频繁抢单的恶意订单用户并将其进行拦截,保证了普通用户的利益,地址查询时间短且查询效率高。
为实现上述目的,根据本发明的一个方面,提供了一种恶意订单地址的判定方法。
一种恶意订单地址的判定方法,包括:接收订单地址,并按照预定层次顺序从地址库中查找出与所述订单地址相同部分最多的地址作为相似地址;计算所述相似地址与所述订单地址的相似度和查找时间差,并获取所述相似地址的累计查找次数,其中,所述查找时间差为所述订单地址的当前查找时间和所述相似地址的查找时间之差中的最小值;根据所述相似度、所述查找时间差和所述累计查找次数计算所述订单地址的得分;将所述得分大于预设的得分阈值的订单地址判定为恶意订单地址。
可选地,所述地址库中存储的地址信息根据预定的地址层次顺序按词进行分层存储;并且,按照预定层次顺序从地址库中查找出与所述订单地址相同部分最多的地址作为相似地址的步骤,包括:将所述订单地址按词拆分,得到多个地址分词;按照所述地址库中词的存储层次,将所述地址分词与所述地址库中的词逐个匹配;将所述地址库中与所述地址分词匹配一致最多的地址作为相似地址。
可选地,所述地址库中存储的地址信息根据预定的地址层次顺序按字进行分层存储;并且,按照预定层次顺序从地址库中查找出与所述订单地址相同部分最多的地址作为相似地址的步骤,包括:将所述订单地址按字拆分,得到多个地址字符;按照所述地址库中字的存储层次,将所述地址字符与所述地址库中的字逐个匹配;将所述地址库中与所述地址字符匹配一致最多的地址作为相似地址。
可选地,计算所述相似地址与所述订单地址的相似度的步骤,包括:记录所述地址库中与所述地址分词匹配一致的词所对应的存储层次的最大值,作为相似地址的最大匹配层次;将所述相似地址的最大匹配层次与所述地址分词的个数的比值作为所述相似度。
可选地,计算所述相似地址与所述订单地址的相似度的步骤,包括:记录所述地址库中与所述地址字符匹配一致的字所对应的存储层次的最大值,作为相似地址的最大匹配层次;将所述相似地址的最大匹配层次与所述地址字符的个数的比值作为所述相似度。
可选地,按照预定顺序在地址库中查找出与所述订单地址相同部分最多的地址作为相似地址的步骤之后,还包括:根据所述订单地址更新所述地址库中的地址信息。
根据本发明的另一方面,提供了一种恶意订单地址的判定装置。
一种恶意订单地址的判定装置,包括:地址查找模块,用于接收订单地址,并按照预定层次顺序从地址库中查找出与所述订单地址相同部分最多的地址作为相似地址;第一计算模块,用于计算所述相似地址与所述订单地址的相似度和查找时间差,并获取所述相似地址的累计查找次数,其中,所述查找时间差为所述订单地址的当前查找时间和所述相似地址的查找时间之差中的最小值;第二计算模块,用于根据所述相似度、所述查找时间差和所述累计查找次数计算所述订单地址的得分;地址判定模块,用于将所述得分大于预设的得分阈值的订单地址判定为恶意订单地址。
可选地,所述地址库中存储的地址信息根据预定的地址层次顺序按词进行分层存储;并且,所述地址查找模块还用于:将所述订单地址按词拆分,得到多个地址分词;按照所述地址库中词的存储层次,将所述地址分词与所述地址库中的词逐个匹配;将所述地址库中与所述地址分词匹配一致最多的地址作为相似地址。
可选地,所述地址库中存储的地址信息根据预定的地址层次顺序按字进行分层存储;并且,所述地址查找模块还用于:将所述订单地址按字拆分,得到多个地址字符;按照所述地址库中字的存储层次,将所述地址字符与所述地址库中的字逐个匹配;将所述地址库中与所述地址字符匹配一致最多的地址作为相似地址。
可选地,所述第一计算模块还用于:记录所述地址库中与所述地址分词匹配一致的词所对应的存储层次的最大值,作为相似地址的最大匹配层次;将所述相似地址的最大匹配层次与所述地址分词的个数的比值作为所述相似度。
可选地,所述第一计算模块还用于:记录所述地址库中与所述地址字符匹配一致的字所对应的存储层次的最大值,作为相似地址的最大匹配层次;将所述相似地址的最大匹配层次与所述地址字符的个数的比值作为所述相似度。
可选地,还包括:地址更新模块,用于根据所述订单地址更新所述地址库中的地址信息。
根据本发明的又一方面,提供了一种电子设备。
一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现恶意订单地址的判定方法。
根据本发明的又一方面,提供了一种计算机可读介质。
一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现恶意订单地址的判定方法。
根据本发明的技术方案,接收到订单地址之后,按照预定的层次顺序从地址库中查找出相似地址,计算相似地址与订单地址的相似度和查找时间差,并获取相似地址的累计查找次数,根据相似度、查找时间差及累计查找次数计算地址得分,将地址得分大于得分阈值的订单地址判定为恶意订单地址,从而相应的订单为恶意订单。解决了目前对恶意订单判定困难的问题,最大限度地减少了无谓的信息比较,能够快速判定和查找出恶意订单用户,特别是能快速判定和查找出频繁抢单的恶意订单用户并将其进行拦截,保证了普通用户的利益,地址查询时间短且查询效率高。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是现有技术的实现订单请求过滤的方法流程示意图;
图2是根据本发明实施例的订单***与恶意订单地址的判定装置的交互关系示意图;
图3是根据本发明实施例的恶意订单地址的判定方法的主要步骤示意图;
图4是根据本发明实施例的字典树按字存储地址信息的示意图;
图5是根据本发明实施例的字典树按词存储地址信息的示意图;
图6是根据本发明实施例的恶意订单地址的判定装置的主要模块示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图2是根据本发明实施例的订单***与恶意订单地址的判定装置的交互关系示意图。
本发明实施例主要通过订单***与恶意订单地址的判定装置的交互来实现恶意订单地址的判定。如图2所示,恶意订单地址的判定装置接收订单***发送来的订单地址信息,然后,在恶意订单地址的判定装置内部对订单地址信息执行分析判定过程,最后,恶意订单地址的判定装置将判定的结果返回订单***。其中,恶意订单地址的判定装置用于对订单地址信息进行分析以判定出恶意订单地址,从而判定出恶意订单,恶意订单例如电子商务平台抢购***中的恶意频繁抢单。恶意订单地址的判定装置包含存有地址信息的地址库,地址库中存储的地址信息主要是经恶意订单地址的判定装置分析过的地址信息,这些分析过的地址信息为过去订单***发送来的用户订单地址信息,例如用户订单的收货地址信息。
图3是根据本发明实施例的恶意订单地址的判定方法的主要步骤示意图。
如图3所示,本发明实施例的恶意订单地址的判定方法主要包括如下的步骤S31至步骤S34。
步骤S31:接收订单地址,并按照预定层次顺序从地址库中查找出与订单地址相同部分最多的地址作为相似地址。
订单地址可以是收货地址,并且形式上为一个字符串,该字符串可拆分为字符或词等形式。地址库可以根据预定的地址层次顺序按词或按字分层存储地址信息。对于地址库根据预定的地址层次顺序按词分层存储地址信息的情况,预定的地址层次顺序即地址库中词的存储层次顺序,具体可以为地址信息中表示地名的词的自然排列顺序,在我国,通常是根据表示地名的各词的地理范围的大小由大到小来排序,例如:可按照国家、省份、城市或乡村、街道、门牌号码等来进行排序。地址库可以按照地址信息中表示地名的语义来划分词,然后按照各地名表示的地理范围大小来分层存储各个词。例如“上海市黄浦区九江路”,按词分为三个层次进行存储:“上海市”、“黄浦区”、“九江路”,每个词对应一个存储的层次,例如“九江路”的存储层次为3。对于地址库根据预定的地址层次顺序按字分层存储地址信息的情况,预定的地址层次顺序即地址库中字的存储层次顺序,具体可以为地址信息中字符的自然排列顺序,例如“上海市黄浦区九江路”,按字分为九个层次进行存储:“上”、“海”、“市”、“黄”、“浦”、“区”、“九”、“江”、“路”,每个字对应一个存储的层次,例如“路”的存储层次为9。
地址库中地址信息的分层存储结构具体为字典树结构。当地址库以字典树结构存储地址信息时,根据存储的情况(例如按词存储或按字存储),字典树的每个节点(除了根节点)的节点信息中保存有该节点对应的存储层次(又称节点深度值)、该节点被查找的时间、查找次数以及存储在该节点上的地址等信息。具体的存储结构如图4和图5所示,图4是根据本发明实施例的字典树按字存储地址信息的示意图,如图4所示,“上海市黄浦区汉口路”中“路”对应的节点深度值为9,即字的存储层次为9。图5是根据本发明实施例的字典树按词存储地址信息的示意图,如图5所示,“上海市徐汇区古美路1515号”中,“1515号”对应的节点的深度值为4,即词的存储层次为4。通过读取节点信息可以获取相应的存储层次(节点深度值),每一次查找完成后,都会更新节点信息中的内容。
对于地址库按词分层存储地址信息的情况,按照预定层次顺序从地址库中查找出与订单地址相同部分最多的地址作为相似地址的步骤,可以包括:将订单地址按词拆分,得到多个地址分词;按照地址库中词的存储层次,将地址分词与地址库中的词逐个匹配;将地址库中与地址分词匹配一致最多的地址作为相似地址。
对于地址库按字分层存储地址信息的情况,按照预定层次顺序从地址库中查找出与订单地址相同部分最多的地址作为相似地址的步骤,可以包括:将订单地址按字拆分,得到多个地址字符;按照地址库中字的存储层次,将地址字符与地址库中的字逐个匹配;将地址库中与地址字符匹配一致最多的地址作为相似地址。
其中,将订单地址按词拆分或按字拆分,取决于地址库中地址信息的存储形式为按词存储还是按字存储,订单地址的拆分形式需要与地址库中地址信息的存储形式保持一致。其中将订单地址拆分为多个地址分词可以通过分词算法实现,可以按照表示地名的语义来进行分词,以便能够与地址库中的词准确匹配。预定层次顺序为按照地址库中地址信息的存储层次的顺序,具体可以包括地址库中词的存储层次或字的存储层次,对于采用字典树结构存储地址信息的地址库,该预定层次顺序为字典树的节点顺序。以图4所示的字典树为例,订单地址为“上海市黄浦区汉口路23号”,字典树中地址信息按字分层存储,那么,按照字典树节点的顺序,依次将订单地址中的字符与字典树节点中的字符逐个匹配,得到字典树中与订单地址“上海市黄浦区汉口路23号”匹配一致最多的地址为“上海市黄浦区汉口路27号”和“上海市黄浦区汉口路9号”,将得到的该两个地址作为相似地址。按照字典树的节点顺序进行查找,可以减少查询时间,最大限度地减少无谓的字符串比较,查询效率高。
按照预定顺序在地址库中查找出与订单地址相同部分最多的地址作为相似地址的步骤之后,还可以根据订单地址更新地址库中的地址信息。更新地址库中的地址信息主要是将地址库中没有存储的订单地址信息添加到地址库中,以便之后能够更加准确地查找和匹配到恶意订单地址。可以通过***新的存储节点来更新地址库中的地址信息,该存储节点用于保存新添加到地址库中的字或词。
步骤S32:计算相似地址与订单地址的相似度和查找时间差,并获取相似地址的累计查找次数,其中,查找时间差为订单地址的当前查找时间和相似地址的查找时间之差中的最小值。
对于地址库按词分层存储地址信息的情况,计算相似地址与订单地址的相似度的步骤,可以包括:记录地址库中与地址分词匹配一致的词所对应的存储层次的最大值,作为相似地址的最大匹配层次;将该相似地址的最大匹配层次与地址分词的个数的比值作为相似度。
对于地址库按字分层存储地址信息的情况,计算相似地址与订单地址的相似度的步骤,包括:记录地址库中与地址字符匹配一致的字所对应的存储层次的最大值,作为相似地址的最大匹配层次;将该相似地址的最大匹配层次与地址字符的个数的比值作为相似度。
下面以地址库中按照字典树结构存储地址信息的情况为例,分别如图4和图5所示。图4的字典树中,根据订单地址“上海市黄浦区汉口路23号”查找到相似地址为“上海市黄浦区汉口路27号”和“上海市黄浦区汉口路9号”,其中该两个相似地址与订单地址匹配一致的部分为“上海市黄浦区汉口路”,则相似地址的最大匹配层次为“上海市黄浦区汉口路”中“路”的存储层次9,字符“路”对应的节点的深度值。订单地址“上海市黄浦区汉口路23号”含12个地址字符,那么,相似度为:9/12=75%。同理,图5所示的字典树中,如果订单地址为“上海市徐汇区古美路1515”,查找到相似地址为“上海市徐汇区古美路1515号”,该相似地址与订单地址匹配一致的部分为“上海市徐汇区古美路1515号”,则相似地址的最大匹配层次为4,订单地址为“上海市徐汇区古美路1515”包含4个地址分词,那么,相似度为4/4=100%。
通过读取相似地址的存储信息可以得到相似地址被查找的时间,例如通过读取字典树的节点信息可以得到保存该节点的词或字被查找的时间。由于相似地址可能为多个,每个相似地址都有各自的最后查找时间,计算查找时间差是为了得出最近一次相似地址被查找的时间(即最后查找时间)中距离当前查找时间间隔最短的时间差值,即订单地址的当前查找时间和相似地址的查找时间之差中的最小值,将该得出的最小值作为查找时间差。
相似地址的累计查找次数是所有相似地址的查找次数之和,由于查找出的相似地址可能为很多个,每个相似地址的查找次数是该相似地址自第一次被查找开始至当前查找为止总共被查找的次数,相似地址的查找次数可以通过读取相似地址的存储信息来获取,例如,地址信息存储在字典树节点中,那么通过读取保存相似地址的节点信息可以获取该相似地址的查找次数。如图4所示,例如,订单地址“上海市黄浦区汉口路23号”的相似地址为“上海市黄浦区汉口路27号”和“上海市黄浦区汉口路9号”,那么通过分别读取该两个相似地址中的字符“号”对应的节点信息,可以获取该两个相似地址各自的查找次数,累计查找次数可以通过读取该两个相似地址公共部分的最大深度值节点的节点信息来获取,如图4所示,通过读取字符“路”对应的节点信息可以获得该累计查找次数,该累计查找次数反映了“上海市黄浦区汉口路”这个地址信息片段被累计查找的次数,该地址信息片段被累计查找的次数越多,表示包含“上海市黄浦区汉口路”的订单地址出现的次数越频繁。
步骤S33:根据相似度、查找时间差和累计查找次数计算订单地址的得分。
具体可以通过如下的公式计算订单地址的地址得分:
地址得分=相似度×a–(查找时间差)2+b+c×累计查找次数,
其中,累计查找次数为所有相似地址的查找次数的加和;a、b和c为常量,可以自定义这些常量的数值,设置该三个常量的具体数值时,要使得相似度、查找时间差、累计查找次数与计算出的地址得分满足如下关系:相似度和累计查找次数越大,计算出的地址得分越大;查找时间差越小,计算出的地址得分越大。在实际情况中,有时需要人为调整对恶意订单地址判定的结果,通过改变a、b、c三个常量的具体数值,即可以达到人为调整判定结果的目的。a、b、c的具体数值可以影响对订单地址的判定结果,即影响订单地址的地址得分公式的计算结果。例如,设置a=50;b=64;c=3时,使得订单***发送过来的订单地址中,80%的订单地址都被判定为恶意订单地址,通过改变a、b、c的数值,可以使得更大比例(例如90%)或更小比例(例如60%)的订单地址被判定为恶意订单地址,从而可以人为地根据实际需要来修正地址得分公式的计算结果,以便得到更符合实际的判定结果。
步骤S34:将得分大于预设的得分阈值的订单地址判定为恶意订单地址。
根据本发明的实施例,相似度越高、查找时间差越小、累计查找次数越大,则计算出的订单地址的地址得分分数就越高,将该地址得分与预设的得分阈值相比较,如果大于得分阈值,则该订单地址为恶意订单地址,否则为正常订单地址,得分阈值可以设置为上述常量a的值或根据实际需要设置为其他数值。
图6是根据本发明实施例的恶意订单地址的判定装置的主要模块示意图。
本发明实施例的恶意订单地址的判定装置60,主要包括地址查找模块61、第一计算模块62、第二计算模块63、地址判定模块64,其中:地址查找模块61,用于接收订单地址,并按照预定层次顺序从地址库中查找出与订单地址相同部分最多的地址作为相似地址;第一计算模块62,用于计算相似地址与订单地址的相似度和查找时间差,并获取相似地址的累计查找次数,其中,查找时间差为订单地址的当前查找时间和相似地址的查找时间之差中的最小值;第二计算模块63,用于根据相似度、查找时间差和累计查找次数计算订单地址的得分;地址判定模块64,用于将得分大于预设的得分阈值的订单地址判定为恶意订单地址。
地址库中存储的地址信息可以根据预定的地址层次顺序按词进行分层存储,相应地,地址查找模块61还可以用于:将订单地址按词拆分,得到多个地址分词;按照地址库中词的存储层次,将地址分词与地址库中的词逐个匹配;将地址库中与地址分词匹配一致最多的地址作为相似地址。
地址库中存储的地址信息可以根据预定的地址层次顺序按字进行分层存储;相应地,地址查找模块61还可以用于:将订单地址按字拆分,得到多个地址字符;按照地址库中字的存储层次,将地址字符与地址库中的字逐个匹配;将地址库中与地址字符匹配一致最多的地址作为相似地址。
第一计算模块62还可以用于:记录地址库中与地址分词匹配一致的词所对应的存储层次的最大值,作为相似地址的最大匹配层次;将相似地址的最大匹配层次与地址分词的个数的比值作为相似度。
第一计算模块62还可以用于:记录地址库中与地址字符匹配一致的字所对应的存储层次的最大值,作为相似地址的最大匹配层次;将相似地址的最大匹配层次与地址字符的个数的比值作为相似度。
根据本发明实施例的技术方案,接收到订单地址之后,按照预定的层次顺序从地址库中查找出相似地址,计算相似地址与订单地址的相似度和查找时间差,并获取相似地址的累计查找次数,根据相似度、查找时间差及累计查找次数计算地址得分,将地址得分大于得分阈值的订单地址判定为恶意订单地址,从而相应的订单为恶意订单。解决了目前对恶意订单判定困难的问题,最大限度地减少了无谓的信息比较,能够快速判定和查找出恶意订单用户,特别是能快速判定和查找出频繁抢单的恶意订单用户并将其进行拦截,保证了普通用户的利益,地址查询时间短且查询效率高。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (14)
1.一种恶意订单地址的判定方法,其特征在于,包括:
接收订单地址,并按照预定层次顺序从地址库中查找出与所述订单地址相同部分最多的地址作为相似地址;
计算所述相似地址与所述订单地址的相似度和查找时间差,并获取所述相似地址的累计查找次数,其中,所述查找时间差为所述订单地址的当前查找时间和所述相似地址的查找时间之差中的最小值;
根据所述相似度、所述查找时间差和所述累计查找次数计算所述订单地址的得分,其中,所述订单地址的得分的计算公式按照如下规则构建:使得所述相似度和所述累计查找次数越大,计算出的所述订单地址的得分越大;所述查找时间差越小,计算出的所述订单地址的得分越大;
将所述得分大于预设的得分阈值的订单地址判定为恶意订单地址。
2.根据权利要求1所述的方法,其特征在于,所述地址库中存储的地址信息根据预定的地址层次顺序按词进行分层存储;
并且,按照预定层次顺序从地址库中查找出与所述订单地址相同部分最多的地址作为相似地址的步骤,包括:
将所述订单地址按词拆分,得到多个地址分词;
按照所述地址库中词的存储层次,将所述地址分词与所述地址库中的词逐个匹配;
将所述地址库中与所述地址分词匹配一致最多的地址作为相似地址。
3.根据权利要求1所述的方法,其特征在于,所述地址库中存储的地址信息根据预定的地址层次顺序按字进行分层存储;
并且,按照预定层次顺序从地址库中查找出与所述订单地址相同部分最多的地址作为相似地址的步骤,包括:
将所述订单地址按字拆分,得到多个地址字符;
按照所述地址库中字的存储层次,将所述地址字符与所述地址库中的字逐个匹配;
将所述地址库中与所述地址字符匹配一致最多的地址作为相似地址。
4.根据权利要求2所述的方法,其特征在于,计算所述相似地址与所述订单地址的相似度的步骤,包括:
记录所述地址库中与所述地址分词匹配一致的词所对应的存储层次的最大值,作为相似地址的最大匹配层次;
将所述相似地址的最大匹配层次与所述地址分词的个数的比值作为所述相似度。
5.根据权利要求3所述的方法,其特征在于,计算所述相似地址与所述订单地址的相似度的步骤,包括:
记录所述地址库中与所述地址字符匹配一致的字所对应的存储层次的最大值,作为相似地址的最大匹配层次;
将所述相似地址的最大匹配层次与所述地址字符的个数的比值作为所述相似度。
6.根据权利要求1所述的方法,其特征在于,按照预定顺序在地址库中查找出与所述订单地址相同部分最多的地址作为相似地址的步骤之后,还包括:
根据所述订单地址更新所述地址库中的地址信息。
7.一种恶意订单地址的判定装置,其特征在于,包括:
地址查找模块,用于接收订单地址,并按照预定层次顺序从地址库中查找出与所述订单地址相同部分最多的地址作为相似地址;
第一计算模块,用于计算所述相似地址与所述订单地址的相似度和查找时间差,并获取所述相似地址的累计查找次数,其中,所述查找时间差为所述订单地址的当前查找时间和所述相似地址的查找时间之差中的最小值;
第二计算模块,用于根据所述相似度、所述查找时间差和所述累计查找次数计算所述订单地址的得分,其中,所述订单地址的得分的计算公式按照如下规则构建:使得所述相似度和所述累计查找次数越大,计算出的所述订单地址的得分越大;所述查找时间差越小,计算出的所述订单地址的得分越大;
地址判定模块,用于将所述得分大于预设的得分阈值的订单地址判定为恶意订单地址。
8.根据权利要求7所述的装置,其特征在于,所述地址库中存储的地址信息根据预定的地址层次顺序按词进行分层存储;
并且,所述地址查找模块还用于:
将所述订单地址按词拆分,得到多个地址分词;
按照所述地址库中词的存储层次,将所述地址分词与所述地址库中的词逐个匹配;
将所述地址库中与所述地址分词匹配一致最多的地址作为相似地址。
9.根据权利要求7所述的装置,其特征在于,所述地址库中存储的地址信息根据预定的地址层次顺序按字进行分层存储;
并且,所述地址查找模块还用于:
将所述订单地址按字拆分,得到多个地址字符;
按照所述地址库中字的存储层次,将所述地址字符与所述地址库中的字逐个匹配;
将所述地址库中与所述地址字符匹配一致最多的地址作为相似地址。
10.根据权利要求8所述的装置,其特征在于,所述第一计算模块还用于:
记录所述地址库中与所述地址分词匹配一致的词所对应的存储层次的最大值,作为相似地址的最大匹配层次;
将所述相似地址的最大匹配层次与所述地址分词的个数的比值作为所述相似度。
11.根据权利要求9所述的装置,其特征在于,所述第一计算模块还用于:
记录所述地址库中与所述地址字符匹配一致的字所对应的存储层次的最大值,作为相似地址的最大匹配层次;
将所述相似地址的最大匹配层次与所述地址字符的个数的比值作为所述相似度。
12.根据权利要求7所述的装置,其特征在于,还包括:地址更新模块,用于根据所述订单地址更新所述地址库中的地址信息。
13.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-6中任一所述的方法。
14.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-6中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610149844.1A CN107203522B (zh) | 2016-03-16 | 2016-03-16 | 一种恶意订单地址的判定方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610149844.1A CN107203522B (zh) | 2016-03-16 | 2016-03-16 | 一种恶意订单地址的判定方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107203522A CN107203522A (zh) | 2017-09-26 |
CN107203522B true CN107203522B (zh) | 2020-02-07 |
Family
ID=59903556
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610149844.1A Active CN107203522B (zh) | 2016-03-16 | 2016-03-16 | 一种恶意订单地址的判定方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107203522B (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107967332A (zh) * | 2017-11-28 | 2018-04-27 | 厦门市美亚柏科信息股份有限公司 | 企业地址识别方法及识别*** |
CN109102303B (zh) * | 2018-06-28 | 2021-06-08 | 招联消费金融有限公司 | 风险检测方法和相关装置 |
CN108960645B (zh) * | 2018-07-10 | 2020-11-13 | 创新先进技术有限公司 | 一种风险防控方法、***及终端设备 |
CN110852080B (zh) * | 2018-08-01 | 2024-06-21 | 北京京东尚科信息技术有限公司 | 订单地址的识别方法、***、设备和存储介质 |
CN110874778B (zh) * | 2018-08-31 | 2023-04-25 | 阿里巴巴集团控股有限公司 | 异常订单检测方法及装置 |
CN110225207B (zh) * | 2019-04-29 | 2021-08-06 | 厦门快商通信息咨询有限公司 | 一种融合语义理解的防骚扰方法、***、终端及存储介质 |
CN110738506A (zh) * | 2019-10-22 | 2020-01-31 | 杭州蓝诗网络科技有限公司 | 购物平台恶意差评拦截*** |
CN110807685B (zh) * | 2019-10-22 | 2021-09-07 | 上海钧正网络科技有限公司 | 信息处理方法、装置、终端及可读存储介质 |
CN112632213A (zh) * | 2020-12-03 | 2021-04-09 | 大箴(杭州)科技有限公司 | 地址信息标准化方法及装置、电子设备、存储介质 |
CN112686732B (zh) * | 2021-01-06 | 2023-07-11 | 中国联合网络通信集团有限公司 | 异常地址数据识别方法、装置、设备、介质 |
CN112907263B (zh) * | 2021-03-22 | 2022-01-18 | 北京太火红鸟科技有限公司 | 异常订单量检测方法、装置、设备及存储介质 |
CN113837617A (zh) * | 2021-09-26 | 2021-12-24 | 广州新丝路信息科技有限公司 | 一种防刷单的风险管理方法及装置 |
CN114205165A (zh) * | 2021-12-17 | 2022-03-18 | 中国平安财产保险股份有限公司 | 虚假请求的识别方法、装置、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103442361A (zh) * | 2013-09-09 | 2013-12-11 | 北京网秦天下科技有限公司 | 移动应用的安全性检测方法及移动终端 |
CN103914544A (zh) * | 2014-04-03 | 2014-07-09 | 浙江大学 | 一种基于地址特征词的多层次快速中文地址匹配方法 |
CN104021223A (zh) * | 2014-06-25 | 2014-09-03 | 国家电网公司 | 一种集群数据库测点的访问方法及装置 |
CN105389722A (zh) * | 2015-11-20 | 2016-03-09 | 小米科技有限责任公司 | 恶意订单识别方法及装置 |
-
2016
- 2016-03-16 CN CN201610149844.1A patent/CN107203522B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103442361A (zh) * | 2013-09-09 | 2013-12-11 | 北京网秦天下科技有限公司 | 移动应用的安全性检测方法及移动终端 |
CN103914544A (zh) * | 2014-04-03 | 2014-07-09 | 浙江大学 | 一种基于地址特征词的多层次快速中文地址匹配方法 |
CN104021223A (zh) * | 2014-06-25 | 2014-09-03 | 国家电网公司 | 一种集群数据库测点的访问方法及装置 |
CN105389722A (zh) * | 2015-11-20 | 2016-03-09 | 小米科技有限责任公司 | 恶意订单识别方法及装置 |
Non-Patent Citations (2)
Title |
---|
基于哈希和双数组trie树的多层次地址匹配算法;徐聪 等;《浙江大学学报(理学版)》;20140315(第2014年02期);第217-222页 * |
支持通配符的多步长Trie树包分类方法;唐剑琪;《信息网络安全》;20131010(第2013年10期);第104-107页 * |
Also Published As
Publication number | Publication date |
---|---|
CN107203522A (zh) | 2017-09-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107203522B (zh) | 一种恶意订单地址的判定方法和装置 | |
US11704342B2 (en) | Similarity sharding | |
JP6211605B2 (ja) | クリックスルー率に基づく検索結果の順位付け | |
KR101231560B1 (ko) | 데이터 클러스터와 유의어의 탐색과 수정에 대한 방법 및 시스템 | |
JP4920023B2 (ja) | オブジェクト間競合指標計算方法およびシステム | |
CN108897842A (zh) | 计算机可读存储介质及计算机*** | |
CN105608113B (zh) | 判断文本中poi数据的方法及装置 | |
US20240070209A1 (en) | Method and system for providing alternative result for an online search previously with no result | |
WO2017063531A1 (zh) | 一种基于地址信息的账户映射方法及装置 | |
US9886711B2 (en) | Product recommendations over multiple stores | |
CN113254630B (zh) | 一种面向全球综合观测成果的领域知识图谱推荐方法 | |
US9047561B2 (en) | Contextual network access optimizer | |
KR20190128246A (ko) | 검색 방법 및 장치 및 비-일시적 컴퓨터-판독가능 저장 매체 | |
CN113032420A (zh) | 数据查询方法、装置和服务器 | |
KR20140058408A (ko) | 규칙속성으로부터의 운임 탐지 방법, 시스템, 및 컴퓨터 프로그램 | |
CN116348868A (zh) | 信息管理的元数据索引 | |
US10885468B2 (en) | Dynamic search system for real-time dynamic search and reporting | |
JP2012133694A (ja) | 需要予測方法 | |
US9842297B1 (en) | Establishing industry ground truth | |
EP2778982A1 (en) | Attribute detection | |
CN116861060A (zh) | 一种私域电商数据搜索方法、装置、设备及存储介质 | |
CN114036414A (zh) | 兴趣点的处理方法、装置、电子设备、介质及程序产品 | |
US11755633B2 (en) | Entity search system | |
CN113868373A (zh) | 一种词云生成方法、装置、电子设备及存储介质 | |
JP5890413B2 (ja) | 多数のデータレコードをサーチする方法及びサーチエンジン |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |