CN109829713B - 一种基于知识与数据共同驱动的移动支付方式识别方法 - Google Patents

一种基于知识与数据共同驱动的移动支付方式识别方法 Download PDF

Info

Publication number
CN109829713B
CN109829713B CN201910077711.1A CN201910077711A CN109829713B CN 109829713 B CN109829713 B CN 109829713B CN 201910077711 A CN201910077711 A CN 201910077711A CN 109829713 B CN109829713 B CN 109829713B
Authority
CN
China
Prior art keywords
mobile payment
data
frequency
event
knowledge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910077711.1A
Other languages
English (en)
Other versions
CN109829713A (zh
Inventor
王茜竹
杨晓雅
范兴容
韦青霞
许国良
雒江涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN201910077711.1A priority Critical patent/CN109829713B/zh
Publication of CN109829713A publication Critical patent/CN109829713A/zh
Application granted granted Critical
Publication of CN109829713B publication Critical patent/CN109829713B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于移动支付信息处理技术领域,公开了一种基于知识与数据共同驱动的移动支付方式识别方法,包括采集移动用户上网行为数据,填充缺失的时间序列,统计每秒上网行为频次,构建时间序列‑频次矩阵;将矩阵基于事件驱动的用户上网行为时间序列自动分割方法划分用户上网行为;按划分后的上网行为,提取支付事件相关特征,构建基于数据驱动的移动支付事件识别模型,从而识别移动支付事件;基于词频‑逆文档频率算法构建基于知识驱动的移动支付方式主题词提取模型,提取主题词;融合识别模型和提取模型,识别用户移动支付方式。本发明从海量上网行为数据中识别出支付事件,还能提取与移动支付方式相关的主题词,极大地提高了识别性能和识别效率。

Description

一种基于知识与数据共同驱动的移动支付方式识别方法
技术领域
本发明涉及移动支付信息处理以及计算机应用技术领域,特别是涉及一种基于知识与数据共同驱动的移动支付方式识别方法。
背景技术
移动支付(又称手机支付)是指用户使用移动手持设备,通过无线网络(包括移动通信网络和广域网)购买实体或虚拟物品以及各种服务的一种新型支付方式。它具有移动性、及时性、集成性等特点。
移动支付方式是理解用户移动支付行为的基本属性。用户的移动支付状态总是表现出一定的规律性,而对移动支付方式的识别能够体现出这种规律性,并且可以为用户提供特定的服务,比如用户常常在某段时间进行移动支付,可以在该时间段提供相应的业务推送。移动支付方式的识别还可以为个人的支付行为习惯提供丰富的信息,也能够及时地了解用户移动支付方式及其发展变化。此外,通过对移动支付方式的识别,还能够进行移动支付风险识别和异常检测,如特定时间里,用户在某陌生地域发生多次移动支付,就可以判断该支付事件可能发生了盗取支付。基于多个用户的移动支付方式识别,还能够检测城市里的热点支付区域和群体支付行为模式。因而对用户移动支付方式的识别对分析用户行为具有重要意义和价值。
当前,移动用户通过支付宝、微信支付、翼支付、云闪付、沃支付等客户端APP软件进行支付已成为我国主流的移动支付方式。而且,用户的移动支付过程会产生网上交易日志、资金消费提示短信、手机信令等与移动支付方式密切相关的行为数据。然而,由于移动支付牵涉加密算法、移动基站设备产生故障或异常等原因,导致在采集这些数据时常常存在不少无法解析却十分重要的数据,从而对高效、快速、准确地识别用户的移动支付方式提出了挑战。
目前移动支付方式识别方法可以分为两类:一类是基于知识规则匹配的移动支付方式识别方法;另一类是基于机器学习的移动支付方式识别方法。
基于知识规则匹配的移动支付方式识别方法是一种传统的利用移动支付领域知识针对一种或几种支付方式来设计的算法。该类识别方法的基本思想是基于移动支付领域知识人工提取移动支付方式特征,并利用人工设定的知识规则进行匹配来识别移动支付方式。这类识别方法只能识别出已解析数据,但是对于未解析数据无法设计相应的算法进行有效识别,而这些未解析数据中可能包含了重要的且被加密了的支付数据。同时,该类识别方法只能识别出部分移动支付方式,且识别性能与人工设定的知识规则呈现强相关性,缺乏良好的自适应性和泛化性,远远达不到目前行业的商业标准。
基于机器学习的移动支付方式识别方法是一种利用机器学习技术自动提取移动支付方式相关特征并进行支付识别的算法。该类识别方法的基本思想是提取移动支付相关特征构建特征矩阵,并添加标签,利用机器学习的模型进行模型训练,最后将测试数据送入训练好的模型中进行识别。这类识别方法具有灵活性和通用性高、自适应和泛化性能强、无需背景领域知识等优点。该类方法有效的利用了未解析的数据,并提高了模型的性能,但是该方法采用的数据模型是“黑箱”模型,数据构建完全依赖于数据,但是对移动支付方式不具有解释意思。
发明内容
针对上述各种方法的不足,本发明的目的在于提供一种基于知识与数据共同驱动的移动支付方式识别方法,通过该方法可以有效的识别用户移动支付方式,掌握用户的消费习惯,满足各类业务需求。
本发明针对现有的移动支付方式识别方法中存在的上述问题,提出了一种基于知识与数据共同驱动的移动支付方式识别方法。该方法充分利用了知识规则匹配和机器学习模型各自的优点,不仅能够将移动支付领域相关知识和数据模型特点进行有效的融合,最大化地利用未解析数据以提高其识别性能,而且还能够降低算法的复杂度以增加识别效率。
本发明解决上述问题的技术方案是提供了一种基于知识与数据共同驱动的移动支付方式识别方法,包括如下步骤:
步骤1),采集移动用户上网行为数据,填充缺失的时间序列(精确到秒级),统计用户每秒上网行为数据频次,并构建时间序列-频次矩阵;
步骤2),将时间序列-频次矩阵按照基于事件驱动的用户上网行为时间序列自动分割方法划分用户上网行为;
步骤3),利用划分的用户上网行为事件,提取支付事件相关特征,构建基于数据驱动的移动支付事件识别模型,从而识别移动支付事件;
步骤4),基于词频-逆文档频率算法构建基于知识驱动的移动支付方式主题词提取模型,从而提取移动支付方式主题词;
步骤5),融合基于数据驱动的移动支付事件识别模型和基于知识驱动的移动支付方式主题词提取模型,构建基于知识与数据共同驱动的移动支付方式识别方法,最终识别用户移动支付方式。
其中,步骤1)所述用户上网行为数据包括但不限于用户上网日志数据和用户短信话单数据。
其中,步骤2)所述基于事件驱动的用户上网行为时间序列自动分割方法具体是:首先利用上网日志数据频次的突变点确定事件发生的分割点,且相邻分割点必须满足最小事件的时间限制(经实验验证,最小事件时间限制为6分钟时移动支付事件模型识别性能最优)。如当前用户上网行为起点时间为20190121090000,终点时间为20190121100000,且每秒钟的时间序列对应一个上网数据频次,首先连接时间起点和终点构成一条直线,并选取距离该直线最大距离的点作为分割点,依次连接该分割点与时间起点和终点,若该分割点和时间起点或终点的时间间隔满足最小事件的时间限制(6分钟),则再选取距离连接时间起点或终点的直线距离最大的点作为分割点,并按照该原则继续进行分割,然后选取前top-k个距离值最大的分割点,最后利用用户短信话单数据进一步确定分割点,并依次连接分割点构成用户上网行为事件。
其中,步骤3)所述的支付事件相关特征包含但不限于事件中上网日志数据频次、未解析上网日志数据频次、短信话单数据频次以及单次上网日志数据最高频次。
其中,步骤3)所述构建基于数据驱动的移动支付事件识别模型具体是:首先从划分的用户上网行为事件中提取支付事件相关特征,其特征包含但不限于事件中上网日志数据频次、未解析上网日志数据频次、短信话单数据频次以及单次上网日志数据最高频次;然后将打上标签的支付事件特征数据集分为训练集和测试集,并将训练集送入机器学习模型(如支持向量机模型)进行训练;最后将测试集送入训练好的机器学习模型中进行测试,根据测试性能调整机器学习模型相关参数以达到性能标准,并最终识别移动支付事件。
其中,步骤5)所述基于数据驱动的移动支付事件识别模型和基于知识驱动的移动支付方式主题词提取模型的融合方式为:内函数为数据驱动的移动支付事件识别模型函数fd(x,θd),外函数为知识驱动的移动支付方式主题词提取模型函数fk(x,θk)的复合方式,即基于知识与数据共同驱动的移动支付方式识别方法函数为fk(fd(x,θd),θk)。其中,x表示输入的数据,包括上网日志数据等;fk和fd分别为知识驱动子模型和数据驱动子模型函数,θk和θd分别对应知识驱动子模型和数据驱动子模型参数,即θk表示为移动支付方式主题词模型中选取的k个关键字,即θd表示为移动支付事件识别模型中机器学习模型的训练参数。
本发明的有益效果如下:
本发明是一种基于知识与数据共同驱动的移动支付方式识别方法。该方法充分利用了知识规则匹配和机器学习模型各自的优点,不仅能够将移动支付领域相关知识和数据模型特点进行有效的融合,最大化地利用未解析数据以提高其识别性能,而且还能够降低算法的复杂度以增加识别效率。
附图说明
图1是本发明方法的原理框图;
图2是本发明方法的流程图;
图3是本发明的基于事件驱动的用户上网行为时间序列自动分割方法流程图;
图4是本发明的基于数据驱动的移动支付事件识别模型流程图;
图5是本发明的基于知识驱动的移动支付方式主题词提取模型流程图;
图6是本发明的基于知识与数据共同驱动的移动支付方式识别方法流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
实施例
如图1和图2所示,本发明提供了一种基于知识与数据共同驱动的移动支付方式识别方法,其步骤为:
步骤1),采集移动用户上网行为数据,填充缺失的时间序列(精确到秒级),统计用户每秒上网行为数据频次(即缺失的时间序列所对应的数据频次为零),并构建时间序列-频次矩阵;具体的时间序列-频次矩阵如表1所示:
表1上网行为时间序列-频次矩阵
时间序列 上网行为数据频次
20190121101718 5
20190121101719 0
20190121101720 3
20190121101721 6
其中,步骤1)所述用户上网行为数据包括但不限于用户上网日志数据和用户短信话单数据。
步骤2),将时间序列-频次矩阵按照基于事件驱动的用户上网行为时间序列自动分割方法划分用户上网行为,构成用户上网行为事件;
其中,如图3所示,步骤2)所述基于事件驱动的用户上网行为时间序列自动分割方法具体是:首先利用上网日志数据频次的突变点确定事件发生的分割点,且相邻分割点必须满足最小事件的时间限制,然后选取前top-k个距离值最大的分割点,最后利用用户短信话单数据进一步确定分割点,并依次连接分割点构成用户上网行为事件。
步骤3),利用划分的用户上网行为事件,提取支付事件相关特征,构建基于数据驱动的移动支付事件识别模型,从而识别移动支付事件;
其中,步骤3)所述的支付事件相关特征包含但不限于事件中上网日志数据频次、未解析上网日志数据频次、短信话单数据频次以及单次上网日志数据最高频次。
其中,如图4所示,步骤3)所述构建基于数据驱动的移动支付事件识别模型具体是:首先从划分的用户上网行为事件中提取支付事件相关特征,其特征包含但不限于事件中上网日志数据频次、未解析上网日志数据频次、短信话单数据频次以及单次上网日志数据最高频次;然后将打上标签的支付事件特征数据集分为训练集和测试集,并将训练集送入机器学习模型(如支持向量机模型)进行训练;最后将测试集送入训练好的机器学习模型中进行测试,根据测试性能调整机器学习模型相关参数以达到性能标准,并最终识别移动支付事件。
步骤4),基于词频-逆文档频率(Term Frequency-Inverse Document Frequency,TF-IDF)算法构建基于知识驱动的移动支付方式主题词提取模型,从而提取移动支付方式主题词;
其中,如图5所示,步骤4)所述构建基于知识驱动的移动支付方式主题词提取模型具体为:首先将上网日志数据进行规范化,去掉其冗余信息,提取关键字(上网日志数据为URL类型数据,关键字为其HOST值);然后对所提取的每个关键字计算其词频-逆文档频率值,并进行排序;最后取前top-k个词频-逆文档频率值最大的关键字构成移动支付方式主题词(k取5-10个左右最佳)。
步骤5),融合基于数据驱动的移动支付事件识别模型和基于知识驱动的移动支付方式主题词提取模型,构建基于知识与数据共同驱动的移动支付方式识别方法,最终识别用户移动支付方式。
其中,如图6所示,步骤5)所述基于数据驱动的移动支付事件识别模型和基于知识驱动的移动支付方式主题词提取模型的融合方式为:内函数为数据驱动的移动支付事件识别模型函数fd(x,θd),外函数为知识驱动的移动支付方式主题词提取模型函数fk(x,θk)的复合方式,即基于知识与数据共同驱动的移动支付方式识别方法函数为fk(fd(x,θd),θk)。其中,fk和fd分别为知识驱动子模型和数据驱动子模型函数,θk和θd分别对应知识驱动子模型和数据驱动子模型参数,即θk表示为移动支付方式主题词模型中选取的k个关键字,即θd表示为移动支付事件识别模型中机器学习模型的训练参数。
从技术角度看,本发明是一种基于知识与数据共同驱动的移动支付方式识别方法。与现有的知识规则匹配和机器学习模型方法相比,该方法充分利用了知识规则匹配和机器学习模型各自的优点,不仅能够将移动支付领域相关知识和数据模型特点进行有效的融合,最大化地利用未解析数据以提高其识别性能,而且还能够降低算法的复杂度以增加识别效率。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
以上所举实施例,对本发明的目的、技术方案和优点进行了进一步的详细说明,所应理解的是,以上所举实施例仅为本发明的优选实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内对本发明所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种基于知识与数据共同驱动的移动支付方式识别方法,其特征在于,包括如下步骤:
步骤1)采集移动用户上网行为数据,对时间序列进行填充,统计移动用户每秒的上网行为数据频次,并构建出时间序列与数据频次之间的时间-频次矩阵;
步骤2)将时间-频次矩阵按照基于事件驱动的用户上网行为时间序列自动分割方法,利用用户上网日志数据频次的突变点确定行为事件发生的分割点,且相邻分割点满足最小事件的时间限制,选取前k个距离值最大的分割点,利用用户短信话单数据进一步确定分割点,并依次连接分割点构成用户上网行为事件;划分出用户的各个上网行为事件;
步骤3)利用划分出的上网行为事件,提取移动支付事件的相关特征,构建基于数据驱动的移动支付事件识别模型,从划分的用户上网行为事件中提取支付事件相关特征;将打上标签的支付事件特征数据集分为训练集和测试集,并将训练集送入机器学习模型进行训练;将测试集送入训练好的机器学习模型中进行测试,根据测试性能调整机器学习模型相关参数以达到性能标准;从而识别出时间-频次矩阵中的移动支付事件;
步骤4)根据词频-逆文档频率算法构建基于知识驱动的移动支付方式主题词提取模型,将上网日志数据进行规范化,去掉其冗余信息,提取关键字;对所提取的每个关键字计算其词频-逆文档频率值,并进行排序;取前k个词频-逆文档频率值最大的关键字构成移动支付方式主题词;从所述时间-频次矩阵中提取出移动支付方式中的主题词;
步骤5)融合移动支付事件识别模型和移动支付方式主题词提取模型,构建基于知识与数据共同驱动的移动支付方式识别方法,设置融合函数,将内函数作为数据驱动的移动支付事件识别模型函数fd(x,θd),外函数作为知识驱动的移动支付方式主题词提取模型函数fk(x,θk)的复合方式,即基于知识与数据共同驱动的移动支付方式识别方法函数为fk(fd(x,θd),θk);从而在时间-频次矩阵中识别用户移动支付方式;
其中,x表示输入的数据;fk和fd分别为移动支付方式主题词提取模型和移动支付事件识别模型函数,θk表示为移动支付方式主题词提取模型中选取的k个关键字,θd表示为移动支付事件识别模型中机器学习模型的训练参数。
2.根据权利要求1所述的一种基于知识与数据共同驱动的移动支付方式识别方法,其特征在于,步骤1)所述用户上网行为数据包括用户上网日志数据和用户短信话单数据。
3.根据权利要求1所述的一种基于知识与数据共同驱动的移动支付方式识别方法,其特征在于,所述机器学习模型包括向量支持机、决策树模型、集成模型中任意一个或者多个。
4.根据权利要求1所述的一种基于知识与数据共同驱动的移动支付方式识别方法,其特征在于,所述的支付事件相关特征包括行为事件中上网日志数据频次、未解析上网日志数据频次、短信话单数据频次以及单次上网日志数据最高频次。
CN201910077711.1A 2019-01-28 2019-01-28 一种基于知识与数据共同驱动的移动支付方式识别方法 Active CN109829713B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910077711.1A CN109829713B (zh) 2019-01-28 2019-01-28 一种基于知识与数据共同驱动的移动支付方式识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910077711.1A CN109829713B (zh) 2019-01-28 2019-01-28 一种基于知识与数据共同驱动的移动支付方式识别方法

Publications (2)

Publication Number Publication Date
CN109829713A CN109829713A (zh) 2019-05-31
CN109829713B true CN109829713B (zh) 2020-09-15

Family

ID=66862591

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910077711.1A Active CN109829713B (zh) 2019-01-28 2019-01-28 一种基于知识与数据共同驱动的移动支付方式识别方法

Country Status (1)

Country Link
CN (1) CN109829713B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110495408B (zh) * 2019-09-20 2021-08-17 重庆工商大学 基于数据与知识共同驱动的鱼虾参养殖决策***及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103793484A (zh) * 2014-01-17 2014-05-14 五八同城信息技术有限公司 分类信息网站中的基于机器学习的欺诈行为识别***
US8850537B1 (en) * 2012-09-27 2014-09-30 Emc Corporation Self-tuning knowledge-based authentication
CN106250855A (zh) * 2016-08-02 2016-12-21 南京邮电大学 一种基于多核学习的多模态情感识别方法
CN108229963A (zh) * 2016-12-12 2018-06-29 阿里巴巴集团控股有限公司 用户操作行为的风险识别方法及装置
CN108280766A (zh) * 2017-01-06 2018-07-13 阿里巴巴集团控股有限公司 交易行为风险识别方法及装置
CN109165284A (zh) * 2018-08-22 2019-01-08 重庆邮电大学 一种基于大数据的金融领域人机对话意图识别方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8850537B1 (en) * 2012-09-27 2014-09-30 Emc Corporation Self-tuning knowledge-based authentication
CN103793484A (zh) * 2014-01-17 2014-05-14 五八同城信息技术有限公司 分类信息网站中的基于机器学习的欺诈行为识别***
CN106250855A (zh) * 2016-08-02 2016-12-21 南京邮电大学 一种基于多核学习的多模态情感识别方法
CN108229963A (zh) * 2016-12-12 2018-06-29 阿里巴巴集团控股有限公司 用户操作行为的风险识别方法及装置
CN108280766A (zh) * 2017-01-06 2018-07-13 阿里巴巴集团控股有限公司 交易行为风险识别方法及装置
CN109165284A (zh) * 2018-08-22 2019-01-08 重庆邮电大学 一种基于大数据的金融领域人机对话意图识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
数据驱动的信息行为研究的回顾与展望;李月琳 等;《信息资源管理学报》;20180630(第2期);第13-23页 *

Also Published As

Publication number Publication date
CN109829713A (zh) 2019-05-31

Similar Documents

Publication Publication Date Title
CN108322473B (zh) 用户行为分析方法与装置
WO2020073714A1 (zh) 训练样本获取方法,账户预测方法及对应装置
US20210035126A1 (en) Data processing method, system and computer device based on electronic payment behaviors
CN103336766A (zh) 短文本垃圾识别以及建模方法和装置
CN110442712B (zh) 风险的确定方法、装置、服务器和文本审理***
CN109858919B (zh) 异常账号的确定方法及装置、在线下单方法及装置
CN108304426B (zh) 标识的获取方法及装置
WO2020257991A1 (zh) 用户识别方法及相关产品
WO2021174812A1 (zh) 用于画像的数据的清洗方法、装置、介质及电子设备
CN109194689B (zh) 异常行为识别方法、装置、服务器及存储介质
CN110781381B (zh) 基于神经网络的数据验证方法、装置、设备及存储介质
CN109063433B (zh) 虚假用户的识别方法、装置及可读存储介质
CN111798241A (zh) 交易数据处理方法、装置、电子设备及可读存储介质
CN111949702B (zh) 异常交易数据的识别方法、装置及设备
CN104915399A (zh) 基于新闻标题的推荐数据处理方法及***
CN113449753B (zh) 业务风险预测方法、装置和***
US10706371B2 (en) Data processing techniques
WO2017143703A1 (zh) 线下资源的挖掘方法和装置
CN114841705B (zh) 一种基于场景识别的反欺诈监测方法
CN115577172A (zh) 物品推荐方法、装置、设备及介质
CN110807667B (zh) 一种激活沉睡客户的方法和装置
CN109829713B (zh) 一种基于知识与数据共同驱动的移动支付方式识别方法
CN109271495B (zh) 问答识别效果检测方法、装置、设备及可读存储介质
CN110728582B (zh) 信息处理的方法、装置、存储介质和处理器
CN115952211A (zh) 一种基于人工智能的数据处理方法及其***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant