CN113313160A - 一种基于消费数据和同态加密算法的消费人群分类方法 - Google Patents

一种基于消费数据和同态加密算法的消费人群分类方法 Download PDF

Info

Publication number
CN113313160A
CN113313160A CN202110564959.8A CN202110564959A CN113313160A CN 113313160 A CN113313160 A CN 113313160A CN 202110564959 A CN202110564959 A CN 202110564959A CN 113313160 A CN113313160 A CN 113313160A
Authority
CN
China
Prior art keywords
consumption data
ciphertext
user
matrix
homomorphic encryption
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110564959.8A
Other languages
English (en)
Other versions
CN113313160B (zh
Inventor
成卫青
刘婷婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN202110564959.8A priority Critical patent/CN113313160B/zh
Publication of CN113313160A publication Critical patent/CN113313160A/zh
Application granted granted Critical
Publication of CN113313160B publication Critical patent/CN113313160B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于消费数据和同态加密算法的消费人群分类方法,包括,通过数据所有者采集任意时间段的用户消费数据,基于VHE的整数向量同态加密策略将用户消费数据转换成向量矩阵进行加密,而后将加密完成获得的密文上传至数据库;广告运营商根据需求设置所需的用户分类个数k,并将用户分类个数k发送给第三方计算中心;通过第三方计算中心读取密文,并根据用户分类个数k密文进行聚类,完成消费人群的分类;本发明基于价值矩阵对k‑means聚类算法进行优化改进,提升聚类效果,对庞大而多维的消费人群进行更精确的细分;同时解决了往常同态加密下小数位的数据精度缺失的缺点,极大地降低了用户消费数据信息泄漏的风险。

Description

一种基于消费数据和同态加密算法的消费人群分类方法
技术领域
本发明涉及的技术领域,尤其涉及一种基于消费数据和同态加密算法的消费人群分类方法。
背景技术
在智慧商业浪潮下,实体消费经济已进入数字化驱动和智能化运营的时代,线下流量成为企业的战略关注点,线下大数据的价值也日趋凸显其重要性。根据相关调查显示,虽然线上消费越来越丰富,但总体消费占比比例仍不足20%,线下实体消费仍是消费主流。这意味着相比于线上消费市场,线下市场更加广阔。
但是目前线下消费仍存在一些问题,商户投放营销内容缺乏创新,导致在同一品类竞争激烈时本商城某一商户的营销效果较差。并且目前的营销方式在面对新消费者时无法充分发挥,需要精准迎合目标消费者的最新喜好,去制定有针对性的营销策略。
大数据技术在电子商务领域的应用使市场营销策略的制定更加科学化,利用大数据技术能够对用户的消费行为进行统计、分析,并根据用户的消费行为进行分类,从而实现定向性的营销内容推送。通过机器学习技术,可根据受众关注习惯及使用偏好自动聚合相关信息,从而深入定制个性化页面的门户网站、提交面向特定受众的需求信息、迅速提供聚合的有效解决方案和个性化顾问服务等。对于广告运营商来说,可以由网站免费收集用户信息,深入了解用户的行为和喜好,确认浏览产品信息的对象、用户对产品信息的关注程度、用户浏览产品信息的时间段,以及用户浏览产品信息的途径。
这些技术的问题在于都基于机器学习的广泛应用上,并且机器学习模型的训练需要大量数据,一些个人及组织在经济利益的驱使下,非法收集、存储、使用甚至贩卖消费者个人信息,不仅侵犯个人隐私,给消费者带来人身、财产安全的风险,还侵害了社会公共利益。
出于对这些消费者信息安全性的考虑,如何在数据收集方面,低成本且高效地保护和利用这些数据是一个重要的问题。此外,这些训练数据还面临着被攻击者窃取的可能,因此,对数据的隐私保护是机器学习防御的一个关键技术。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述现有存在的问题,提出了本发明。
因此,本发明提供了一种基于消费数据和同态加密算法的消费人群分类方法,能够解决数据分类标签模糊以及数据隐私保护的问题。
为解决上述技术问题,本发明提供如下技术方案:包括,通过数据所有者采集任意时间段的用户消费数据,基于VHE的整数向量同态加密策略将所述用户消费数据转换成向量矩阵进行加密,而后将加密完成获得的密文上传至数据库;广告运营商根据需求设置所需的用户分类个数k,并将所述用户分类个数k发送给第三方计算中心;通过所述第三方计算中心读取所述密文,并根据所述用户分类个数k对所述密文进行聚类,完成消费人群的分类。
作为本发明所述的基于消费数据和同态加密算法的消费人群分类方法的一种优选方案,其中:所述加密包括,记录用户消费数据的小数点位数n,通过将所述用户消费数据乘以10n的方式,将小数点右移n位,把用户消费数据的小数部分转化为整数;将转化后的整数部分进行同态加密;通过将原始的密钥S、密文c进行比特化处理,获得中间密钥密文{S*,c*};将中间密钥S*∈Zm×nl转换为目标密钥矩阵
Figure BDA0003080376310000021
并且引入噪声E和随机整数矩阵A;构造密钥转换矩阵M∈Zn′×nl,利用所述目标密钥矩阵S′以及密钥转换矩阵M对所述用户消费数据进行加密,保证新密文c′=Mc*;其中,c*为中间密钥。
作为本发明所述的基于消费数据和同态加密算法的消费人群分类方法的一种优选方案,其中:所述比特化处理包括,将密文c里面的每一个元素ci转化为长度为l的比特化形式bi
bi=[bi(l-1),…,bi1,bi0],且满足bik={-1,0,1},k=0,1,2……;
则中间密钥c*可表示为:
Figure BDA0003080376310000022
其中,T为转置符号,T←χm×(n-m),χ为高斯分布,m为明文的向量维度,n为密文的向量维度。
作为本发明所述的基于消费数据和同态加密算法的消费人群分类方法的一种优选方案,其中:还包括,将原始的密钥S中的所有元素Sij进行比特化的逆操作,转换为矩阵[Sij,Sij·2,…,Sij·2l-1],即S*∈Zm×nl;其中,i和j为元素维度。
作为本发明所述的基于消费数据和同态加密算法的消费人群分类方法的一种优选方案,其中:所述构造密钥转换矩阵M包括,将中间密钥S*∈Zm×nl转换为目标密钥矩阵
Figure BDA0003080376310000031
S′=[I,T];
构造密钥转换矩阵M∈Zn′×nl满足:
S′M=S*+E;
密钥转换矩阵M如下:
Figure BDA0003080376310000032
其中,A∈Z(n′-m)×nl是一个随机整数矩阵。
作为本发明所述的基于消费数据和同态加密算法的消费人群分类方法的一种优选方案,其中:所述同态加密包括,设置参数;生成密钥矩阵;根据所述密钥矩阵对转化后的整数部分进行加密,输出密文c;根据密文c进行解密处理,输出明文x。
作为本发明所述的基于消费数据和同态加密算法的消费人群分类方法的一种优选方案,其中:所述聚类包括,计算所有密文点的最大值(maxX,maxY)和最小值(minX,minY);基于所述最大值和最小值,初始化k个点作为聚类初始质心,将所述聚类初始质心平均地分布在整个最大值和最小值所包围的矩阵内;根据每个密文点与聚类初始质心的欧式距离将所述每个密文点分配到相应的聚类中;计算每个聚类中的平均值作为新的聚类质心,并判断新的聚类质心的位置是否发生改变,若不再改变则说明聚类已收敛,输出聚类结果,完成分类;否则继续将所述每个密文点分配到相应的聚类中。
作为本发明所述的基于消费数据和同态加密算法的消费人群分类方法的一种优选方案,其中:所述聚类初始质心包括,将用户聚成k类,设横坐标中有a类,纵坐标中有b类,一共有a×b=k类,即可得到所有聚类初始质心的横坐标:
Figure BDA0003080376310000033
所有聚类初始质心的纵坐标为:
Figure BDA0003080376310000041
聚类初始质心kij坐标为:
Figure BDA0003080376310000042
作为本发明所述的基于消费数据和同态加密算法的消费人群分类方法的一种优选方案,其中:还包括,所述广告运营商根据消费人群的分类结果以及数据使用者提供的特定营销短信,在可营销列表中设置对应的营销短信并发送。
本发明的有益效果:本发明基于价值矩阵对k-means聚类算法进行优化改进,使其在大整数类的密文域上进行聚类,提升聚类效果,对庞大而多维的消费人群进行更精确的细分;同时解决了往常同态加密下小数位的数据精度缺失的缺点,极大地降低了用户消费数据信息泄漏的风险,对于用户的数据隐私有极高的保护作用。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1为本发明第一个实施例所述的一种基于消费数据和同态加密算法的消费人群分类方法的客户价值矩阵示意图;
图2为本发明第一个实施例所述的一种基于消费数据和同态加密算法的消费人群分类方法的k-means聚类初始中心点含义示意图;
图3为本发明第一个实施例所述的一种基于消费数据和同态加密算法的消费人群分类方法的流程示意图;
图4为本发明第二个实施例所述的一种基于消费数据和同态加密算法的消费人群分类方法的1000个三位整数加密前聚类效果示意图;
图5为本发明第二个实施例所述的一种基于消费数据和同态加密算法的消费人群分类方法的1000个三位整数加密后聚类效果图示意图;
图6为本发明第二个实施例所述的一种基于消费数据和同态加密算法的消费人群分类方法的500个三位小数加密前聚类效果示意图;
图7为本发明第二个实施例所述的一种基于消费数据和同态加密算法的消费人群分类方法的500个三位小数加密后聚类效果示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
实施例1
为了用户消费数据能够被最大化分析利用,需要数据拥有者(商场)提供在他商场所有门店产生的消费数据,但是为了保证信息的隐私性,在***中要进行同态加密后再共享消费数据;为了数据使用者(需要发送营销短信的某一商户)能够根据自身产品特点对商场内所有的消费人群进行个性化营销,吸引特定用户或挖掘***,商户可在***中提出所需的用户分类数量和对应的营销短信;第三方计算中心根据提供的加密消费数据和所需的用户分类个数,对数据进行k-means聚类处理,处理结束后将分类结果返回给***数据库;广告运营商可查看用户消费数据的分类结果,根据用户手机号以及对应的营销短信,设置不同的短信模板最后进行短信批量发送。
具体的,参照图1~图3,为本发明的第一个实施例,该实施例提供了一种基于消费数据和同态加密算法的消费人群分类方法,包括:
S1:通过数据所有者采集任意时间段的用户消费数据,基于VHE(可验全同态加密)的整数向量同态加密策略将用户消费数据转换成向量矩阵进行加密,而后将加密完成获得的密文上传至数据库。
其中需要说明的是,用户消费数据的内容包括用户的名称、联系电话、消费次数和消费总额。
加密过程如下:
(1)记录用户消费数据的小数点位数n,通过将用户消费数据乘以10n的方式,将小数点右移n位,把用户消费数据的小数部分转化为整数;将转化后的整数部分进行同态加密。
其中需要说明的是,由于用户消费数据存在小数,同态加密本身只能对整数加密,若直接加密小数会造成精度缺失,所以解密数据时,通过左移n位小数点将“整数”转为“小数”,即可保证加密的正确性。
具体的,同态加密的步骤如下:
①设置参数;
设置安全级别参数λ,选择两个大素数q1和q2,使得大素数q=q1·q2
选择参数
Figure BDA0003080376310000061
满足m<n,p<<q,w(p-1)<q;
选择高斯分布
Figure BDA0003080376310000062
发布公共参数Param=(m,n,p,q,w,χ)。
②通过程序自动生成密钥矩阵;
生成两个矩阵
Figure BDA0003080376310000071
满足P1P2=I1;其中,I1为n×n的单位矩阵;
生成两个矩阵
Figure BDA0003080376310000072
Figure BDA0003080376310000073
且T←χm×(n-m)和A←χ(n-m×m);其中,I2为m×m的单位矩阵;
计算S=StP1和M=P2Mt
保证密钥S的隐私性,发布公钥M。
③根据密钥矩阵对转化后的整数部分进行加密,输出密文c;
选择合适噪声e←χn,输出密文
Figure BDA0003080376310000074
计算c=Mx+e,满足明文
Figure BDA0003080376310000075
为且密钥
Figure BDA0003080376310000076
④根据密文c进行解密处理,输出明文x;
输出明文
Figure BDA0003080376310000077
计算
Figure BDA0003080376310000078
满足明文
Figure BDA0003080376310000079
且密钥
Figure BDA00030803763100000710
保证解密的正确性,具体由以下公式保证:
Figure BDA00030803763100000711
其中,需要限制
Figure BDA00030803763100000712
符号|a|表示向量或矩阵a的元素的最大绝对值;
将上述限制条件进一步加强,展开得到:
Figure BDA00030803763100000713
限制噪声矩阵后:
Figure BDA00030803763100000714
在该限制条件下,满足Sc=wx+e,可以保证解密正确。
其中,ei为噪声。
在实际应用中,噪声往往会随着同态计算的进行而不断增大,而当噪声足够大时,就会造成解密失败;较佳的是,可以从上述公式给出的关系中,得到一个密文可以进行的同态计算深度,然后再应用中加以限制,以此来保证同态计算的结果可以顺利解密。
(2)通过将原始的密钥S、密文c进行比特化处理,获得中间密钥密文{S*,c*}。
将密文c里面的每一个元素ci转化为长度为l的比特化形式bi
bi=[bi(l-1),…,bi1,bi0],且满足bik={-1,0,1},k=0,1,2……;
则中间密钥c*可表示为:
Figure BDA0003080376310000081
其中,T为转置符号,T←χm×(n-m),χ为高斯分布,m为明文的向量维度,n为密文的向量维度。
(3)将中间密钥S*∈Zm×nl转换为目标密钥矩阵
Figure BDA0003080376310000082
并且引入噪声E和随机整数矩阵A。
将原始的密钥S中的所有元素Sij进行比特化的逆操作,转换为矩阵[Sij,Sij·2,…,Sij·2l-1],即S*∈Zm×nl
由于向量进行的是比特化操作,矩阵进行的是逆操作,因此可以得出结论:
Sc=S*c*
其中,i和j为元素维度。
(4)构造密钥转换矩阵M∈Zn′×nl,利用目标密钥矩阵S′以及密钥转换矩阵M对用户消费数据进行加密,保证新密文c′=Mc*
构造密钥转换矩阵M的步骤如下:
①将中间密钥S*∈Zm×nl转换为目标密钥矩阵
Figure BDA0003080376310000083
S′=[I,T];
②构造密钥转换矩阵M∈Zn′×nl满足:
S′M=S*+E;
③新密钥S′=[I,T],密钥转换矩阵M满足以下关系时,等式②成立:
Figure BDA0003080376310000084
其中,A∈Z(n′-m)×nl是一个随机整数矩阵,I为单位矩阵。
进而获得如下关系式:
c′=Mc*
即新密文等于密钥转换矩阵乘以中间密文,保证了加密的正确性。
S2:广告运营商根据需求设置所需的用户分类个数k,并将用户分类个数k发送给第三方计算中心。
S3:通过第三方计算中心读取密文,并根据用户分类个数k对密文进行聚类,完成消费人群的分类。
本方法为了商家能够依据不同的用户群体进行差异化营销,挖掘用户的潜在价值并实现利润最大化,使用k-means算法对现有的消费数据进行用户细分;用户细分通常以消费行为的间隔、频率和金额作为标准,但是在同一时间段内,消费次数与总消费额两个变量具有多重共线性,所以本方法将总消费金额变形为平均消费金额;且由于从间隔、频率和金额三个维度进行用户细分得到的用户群体较多,所以选用消费频率和平均消费金额两个维度,简化用户细分的结果,使所有用户分散在用户价值的二维矩阵中,
如图1所示,优质型用户是那些平均消费额高且购买频率高的,他们的消费水平最高;而消费型用户的平均消费金额高,但是购买频率低;与消费型用户相反的是经常型用户,他们的购买频率高,但是平均消费金额却很低;不确定型用户的消费频率和消费金额都很低;对于不同类型的用户,商家要采取不同的营销策略,对优质型用户要注重推送新品短信,引导他们积极消费;对消费型用户和经常型用户,商家要分别提高他们的购买频率和平均消费金额;商家还应增加在不确定型用户身上的投入,争取将其转化为消费型用户或经常性用户,甚至是优质型用户;本方法基于价值矩阵对k-means聚类算法进行优化改进,使其在大整数类的密文域上进行聚类,提升聚类效果,对庞大而多维的消费人群进行更精确的细分。
本方法提出在k-means聚类时更改初始中心点的方式,选用消费频率和平均消费金额两个维度,将不同类型的用户定位到价值矩阵中,用标记点的方式区分用户所属类别。
具体的,聚类的步骤如下:
(1)如图2所示,计算所有密文点的最大值(maxX,maxY)和最小值(minX,minY);
(2)基于最大值和最小值,根据下式初始化k个点作为聚类初始质心,将聚类初始质心平均地分布在整个最大值和最小值所包围的矩阵内;
初始化k个点的步骤如下:
将用户聚成k类,设横坐标中有a类,纵坐标中有b类,一共有a×b=k类,即可得到所有聚类初始质心的横坐标:
Figure BDA0003080376310000101
所有聚类初始质心的纵坐标为:
Figure BDA0003080376310000102
聚类初始质心kij坐标为:
Figure BDA0003080376310000103
由于消费数据存在不确定性,聚类结果可能不是均匀分布,但是根据数据的最大值和最小值范围可动态求出相对的用户类别,再由图2类比图1的价值矩阵,得出聚类初始质心为k11的用户类别相对为不确定型用户,k44相对k11来说是优质型用户,能达到聚类后区分用户类别的效果。
(3)根据每个密文点与聚类初始质心的欧式距离将每个密文点分配到相应的聚类中;
(4)计算每个聚类中的平均值作为新的聚类质心,重复步骤(2)
(5)判断新的聚类质心的位置是否发生改变,若不再改变则说明聚类已收敛,输出聚类结果,完成分类;否则进入步骤(3)。
进一步地,第三方计算中心会先根据k值划分一定数量的消费等级,再根据k值对每个消费等级设置特征中心点,之后通过本方法改进的k-means聚类算法将消费数据向量矩阵对所有消费者进行划分,然后再根据每个消费数据点距离最近的特征中心点判断出用户的消费等级,即分类结果。
S4:广告运营商根据消费人群的分类结果以及数据使用者提供的特定营销短信,在可营销列表中设置对应的营销短信并发送。
较佳的是,本实施例使用向量同态加密VHE方案,利用密钥转换技术实现对现有的消费数据进行加密,解决了同态加密下小数位的数据精度缺失的问题;并优化k-means算法,基于价值矩阵对现有的消费数据进行客户细分,使其在大整数类的密文域上进行聚类,提高了广告运营商对用户进行短信营销的精准性的同时,极大地降低了用户消费数据信息泄漏的风险,对于用户的数据隐私有极高的保护作用。
实施例2
为了对本方法中采用的技术效果加以验证说明,本实施例选择本方法加密前和采用本方法加密后进行对比测试,以科学论证的手段对比试验结果,以验证本方法所具有的真实效果。
本实施例中将采用本方法加密前和本方法加密后分别对某一时间段的用户消费数据进行聚类分析对比。
测试环境:将***部署在阿里云测试服务器并模拟客户分类场景,采用1000组三位整数以及500组带两位小数的测试样本,分别在原始数据和加密后的密文数据上进行客户分类测试并获得测试结果;采用本方法,自动在Java平台上实现本方法的测试,根据实验结果得到模拟数据分类,并在Python平台上绘制模拟客户数据分类图。
聚类结果如图4、图5、图6和图7所示;对比图4和图5的聚类效果,在处理1000个数据特征为(281,590)的二维整数时,加密前和加密后的聚类结果相同,证明本方法提出的优化k-means算法,能够在大整数类的密文域上进行准确聚类。
对比图6和图7的聚类效果,在处理500个数据特征为(737.05,654.10)的二维小数时,加密前和加密后的聚类结果相同,证明本方法提出的优化同态加密算法,解决了同态加密下小数位的数据精度缺失的问题,且k-means算法依旧能够在大整数类的密文域上进行准确聚类。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (9)

1.一种基于消费数据和同态加密算法的消费人群分类方法,其特征在于:包括,
通过数据所有者采集任意时间段的用户消费数据,基于VHE的整数向量同态加密策略将所述用户消费数据转换成向量矩阵进行加密,而后将加密完成获得的密文上传至数据库;
广告运营商根据需求设置所需的用户分类个数k,并将所述用户分类个数k发送给第三方计算中心;
通过所述第三方计算中心读取所述密文,并根据所述用户分类个数k对所述密文进行聚类,完成消费人群的分类。
2.如权利要求1所述的基于消费数据和同态加密算法的消费人群分类方法,其特征在于:所述加密包括,
记录用户消费数据的小数点位数n,通过将所述用户消费数据乘以10n的方式,将小数点右移n位,把用户消费数据的小数部分转化为整数;将转化后的整数部分进行同态加密;
通过将原始的密钥S、密文c进行比特化处理,获得中间密钥密文{S*,c*};
将中间密钥S*∈Zm×nl转换为目标密钥矩阵
Figure FDA0003080376300000011
并且引入噪声E和随机整数矩阵A;
构造密钥转换矩阵M∈Zn′×nl,利用所述目标密钥矩阵S′以及密钥转换矩阵M对所述用户消费数据进行加密,保证新密文c′=Mc*
其中,c*为中间密钥。
3.如权利要求2所述的基于消费数据和同态加密算法的消费人群分类方法,其特征在于:所述比特化处理包括,
将密文c里面的每一个元素ci转化为长度为l的比特化形式bi
bi=[bi(l-1),…,bi1,bi0],且满足bik={-1,0,1},k=0,1,2……;
则中间密钥c*可表示为:
Figure FDA0003080376300000012
其中,T为转置符号,T←χm×(n-m),χ为高斯分布,m为明文的向量维度,n为密文的向量维度。
4.如权利要求2或3所述的基于消费数据和同态加密算法的消费人群分类方法,其特征在于:还包括,
将原始的密钥S中的所有元素Sij进行比特化的逆操作,转换为矩阵[Sij,Sij·2,…,Sij·2l-1],即S*∈Zm×nl;其中,i和j为元素维度。
5.如权利要求4所述的基于消费数据和同态加密算法的消费人群分类方法,其特征在于:所述构造密钥转换矩阵M包括,
将中间密钥S*∈Zm×nl转换为目标密钥矩阵
Figure FDA0003080376300000021
S′=[I,T];
构造密钥转换矩阵M∈Zn′×nl满足:
S′M=S*+E;
密钥转换矩阵M如下:
Figure FDA0003080376300000022
其中,A∈Z(n′-m)×nl是一个随机整数矩阵。
6.如权利要求2所述的基于消费数据和同态加密算法的消费人群分类方法,其特征在于:所述同态加密包括,
设置参数;
生成密钥矩阵;
根据所述密钥矩阵对转化后的整数部分进行加密,输出密文c;
根据密文c进行解密处理,输出明文x。
7.如权利要求1、2、6任一所述的基于消费数据和同态加密算法的消费人群分类方法,其特征在于:所述聚类包括,
计算所有密文点的最大值(maxX,maxY)和最小值(minX,minY);
基于所述最大值和最小值,初始化k个点作为聚类初始质心,将所述聚类初始质心平均地分布在整个最大值和最小值所包围的矩阵内;
根据每个密文点与聚类初始质心的欧式距离将所述每个密文点分配到相应的聚类中;
计算每个聚类中的平均值作为新的聚类质心,并判断新的聚类质心的位置是否发生改变,若不再改变则说明聚类已收敛,输出聚类结果,完成分类;否则继续将所述每个密文点分配到相应的聚类中。
8.如权利要求7所述的基于消费数据和同态加密算法的消费人群分类方法,其特征在于:所述聚类初始质心包括,
将用户聚成k类,设横坐标中有a类,纵坐标中有b类,一共有a×b=k类,即可得到所有聚类初始质心的横坐标:
Figure FDA0003080376300000031
所有聚类初始质心的纵坐标为:
Figure FDA0003080376300000032
聚类初始质心kij坐标为:
Figure FDA0003080376300000033
9.如权利要求1所述的基于消费数据和同态加密算法的消费人群分类方法,其特征在于:还包括,
所述广告运营商根据消费人群的分类结果以及数据使用者提供的特定营销短信,在可营销列表中设置对应的营销短信并发送。
CN202110564959.8A 2021-05-24 2021-05-24 一种基于消费数据和同态加密算法的消费人群分类方法 Active CN113313160B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110564959.8A CN113313160B (zh) 2021-05-24 2021-05-24 一种基于消费数据和同态加密算法的消费人群分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110564959.8A CN113313160B (zh) 2021-05-24 2021-05-24 一种基于消费数据和同态加密算法的消费人群分类方法

Publications (2)

Publication Number Publication Date
CN113313160A true CN113313160A (zh) 2021-08-27
CN113313160B CN113313160B (zh) 2022-09-23

Family

ID=77374457

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110564959.8A Active CN113313160B (zh) 2021-05-24 2021-05-24 一种基于消费数据和同态加密算法的消费人群分类方法

Country Status (1)

Country Link
CN (1) CN113313160B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117235381A (zh) * 2023-10-10 2023-12-15 南京邮电大学 一种基于同态加密时空同位计算的朋友推荐方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107241182A (zh) * 2017-06-29 2017-10-10 电子科技大学 一种基于向量同态加密的隐私保护层次聚类方法
CN110163292A (zh) * 2019-05-28 2019-08-23 电子科技大学 基于向量同态加密的隐私保护k-means聚类方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107241182A (zh) * 2017-06-29 2017-10-10 电子科技大学 一种基于向量同态加密的隐私保护层次聚类方法
CN110163292A (zh) * 2019-05-28 2019-08-23 电子科技大学 基于向量同态加密的隐私保护k-means聚类方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117235381A (zh) * 2023-10-10 2023-12-15 南京邮电大学 一种基于同态加密时空同位计算的朋友推荐方法
CN117235381B (zh) * 2023-10-10 2024-05-10 南京邮电大学 一种基于同态加密时空同位计算的朋友推荐方法

Also Published As

Publication number Publication date
CN113313160B (zh) 2022-09-23

Similar Documents

Publication Publication Date Title
TW200849033A (en) Web page analysis using multiple graphs
CN111666460A (zh) 基于隐私保护的用户画像生成方法、装置及存储介质
Bartolucci et al. A model of the optimal selection of crypto assets
Svilar et al. User experience with security elements in internet and mobile banking
CN109615021A (zh) 一种基于k均值聚类的隐私信息保护方法
CN103345703A (zh) 基于图像验证的银行业务交易认证方法及***
CN113313160B (zh) 一种基于消费数据和同态加密算法的消费人群分类方法
Lee et al. Machine learning based bitcoin address classification
CN116738493B (zh) 一种基于分类类别的数据加密存储方法及装置
Yang et al. Service innovation of insurance data based on cloud computing in the era of big data
CN115292612B (zh) 基于隐私保护的信息和金融信息推荐方法及装置
Hamm Acceptance factors for cryptocurrencies as payment systems
CN110689412A (zh) 基于区块链的用于游戏虚拟物品交易的方法、装置、服务器和存储介质
Bounagui et al. Towards understanding intention to purchase online music downloads
CN116308655B (zh) 基于区块链的智慧社区商品大数据智能拼单和结算***
Saxena et al. Integration of back-propagation neural network to classify of cybercriminal entities in blockchain
CN113515716A (zh) 一种具有隐私保护的目标模式匹配***及方法
Wang E-satisfaction ratings on merchant reputation systems: An exploratory study
Yamamoto et al. Angels or demons? Classifying desirable heavy users and undesirable power sellers in online C2C marketplace
Dwimahendrawan et al. Effect of Company Resources and Capabilities to Product Innovation SMEs in East Java Batik
Hemantha et al. Factors Influencing Cryptocurrency Acceptance Among Individuals: A Systematic Literature Review
CN117094722B (zh) 一种线上支付的安全监理方法及***
CN116049680B (zh) 基于区块链的模型训练方法及***
Wang et al. Empirical research on online repurchase intention: an assessment of ease of use, security, private concern, trust, and e-satisfaction towards online shoppers in China
Mane et al. Using Private Information Retrieval protocol for an E-commerce application

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant