CN107368499A - 一种客户标签建模及推荐方法及装置 - Google Patents

一种客户标签建模及推荐方法及装置 Download PDF

Info

Publication number
CN107368499A
CN107368499A CN201610319254.9A CN201610319254A CN107368499A CN 107368499 A CN107368499 A CN 107368499A CN 201610319254 A CN201610319254 A CN 201610319254A CN 107368499 A CN107368499 A CN 107368499A
Authority
CN
China
Prior art keywords
client
matrix
trust degree
customer trust
factor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610319254.9A
Other languages
English (en)
Other versions
CN107368499B (zh
Inventor
***
刘忱
杨应宝
严关武
王建宏
刘钰柏
黄志豪
李少奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Group Guangdong Co Ltd
Original Assignee
China Mobile Group Guangdong Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Group Guangdong Co Ltd filed Critical China Mobile Group Guangdong Co Ltd
Priority to CN201610319254.9A priority Critical patent/CN107368499B/zh
Publication of CN107368499A publication Critical patent/CN107368499A/zh
Application granted granted Critical
Publication of CN107368499B publication Critical patent/CN107368499B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9562Bookmark management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种客户标签建模及推荐方法及装置,包括:构建客户信任度矩阵;基于所述客户信任度矩阵,计算客户影响力因子;获取客户标签特征矩阵;结合所述客户影响力因子、所述客户信任度矩阵以及所述客户标签特征矩阵,计算各个客户的特征信息;从所述各个客户的特征信息中选择出目标标签并推送至客户推荐***。

Description

一种客户标签建模及推荐方法及装置
技术领域
本发明涉及业务支撑领域中的客户标签技术,尤其涉及一种客户标签建模及推荐方法及装置。
背景技术
客户标签建模是运营商行业中一项非常重要的研究课题。客户标签是指客户的兴趣爱好标识,在运营商中即客户业务、行为偏好,如IPHONE、4G、游戏、旅游等。客户标签建模主要就是挖掘客户与各类业务或行为特征之间的关系,对客户进行全方位的画像,识别客户与各类标签之间的关系,从而可以对客户提供个性化的推荐服务,提高推荐的成功度。例如,客户4G标签识别,准确识别潜在的4G目标客户,针对4G标签明显的客户进行精准推荐,提高推荐客户的4G转化率。问题在于,我们能否根据客户社交圈中其他人的兴趣爱好信息挖掘客户与各标签的关联度评分,通过关联度评分识别每个客户具备的潜在标签特征。
目前客户标签建模使用最广泛的方法是关联规则挖掘方法,如果在已知标签A的客户中80%以上具有标签B,即可认为所有具有标签A的客户也可能具有潜在标签B特征,因此,可以给标签A的客户标记标签B。由于该方法依赖于频繁项挖掘,在实际研究中,同时满足最小支持度和最小置信度的频繁子项特别少,因此、客户标签识别具有一定局限性,识别标签较少,同时也忽略了客户社交圈的影响力因子。
此外,现有技术提出了利用客户之间的通信关系以及客户的业务特征进行客户标签识别。具体地,根据客户的通信记录,确定所述客户与所述客户的各个联系人的疏密度因子,所述疏密度因子用于表示所述客户与各联系人的通信频繁程度,也即客户之间的紧密性;获取所述各联系人的业务特征,业务特征用于表示客户的业务订购情况和/或业务使用情况;根据所述客户与所述各联系人的疏密度因子以及所述各联系的所述业务信息,识别每个客户特征信息。现有技术中,只利用客户之间的直接通信量计算疏密度因子,没有考虑客户间的共同好友情况以及客户使用家庭网、亲情网等具有家庭属性业务;另外,在客户标签特征计算时,每个客户的权重都一致,没有识别社交圈中高影响力因子客户,在实际中,有些客户具有意见领袖特性,对周围人具有较高的影响力因子,应该给予更多的权值,这些都会影响识别准确性。
发明内容
为解决上述技术问题,本发明实施例提供了一种客户标签建模及推荐方法及装置。
本发明实施例提供的客户标签建模及推荐方法,包括:
构建客户信任度矩阵;
基于所述客户信任度矩阵,计算客户影响力因子;
获取客户标签特征矩阵;
结合所述客户影响力因子、所述客户信任度矩阵以及所述客户标签特征矩阵,计算各个客户的特征信息;
从所述各个客户的特征信息中选择出目标标签并推送至客户推荐***。
本发明实施例中,所述构建客户信任度矩阵,包括:
对采集到的客户通信记录进行解析,得到客户通信社交参数,所述客户通信社交参数用于表征客户与各个联系人的联系程度;
基于各个客户通信社交参数,利用余弦算法计算客户相似度因子,所述客户相似度因子用于表征客户之间的通信社交参数的相似度;
从业务数据中提取出客户社交绑定关系;
对所述客户通信社交参数、所述客户相似度因子以及所述客户社交绑定关系进行加权处理,构建客户信任度矩阵,所述客户信任度矩阵用于表征客户之间的信任度。
本发明实施例中,所述方法还包括:
对采集到的客户通信记录进行解析时,删除所述客户通信记录中的无效数据。
本发明实施例中,所述获取客户标签特征矩阵,包括:
构建客户标签特征矩阵H={bij,1<=i<=n,1<=j<=k2};其中,bij表示客户vi和标签j之间的关系,n表示客户数量,k2表示标签数量。
本发明实施例中,所述基于所述客户信任度矩阵,计算客户影响力因子,包括:
基于所述客户信任度矩阵,利用网页排名(pagerank)算法计算所述客户影响力因子。
本发明实施例中,所述利用pagerank算法计算所述客户影响力因子,包括:
设置收敛阈值W;
根据公式进行迭代计算,其中d为阻尼因子。为客户vi对其他所有客户的信任度贡献值,aij为客户vi对客户vj的信任度评分。为客户vi在第m次迭代后的影响力,q0 i=1,客户信任度矩阵为
第m+1次代后计算||Qm+1-Qm||的差值,当||Qm+1-Qm||>=W时,继续利用公式进行迭代计算,直到||Qm+1-Qm||<W为止;
将最后迭代计算的Q=(q1,q2,....qn)作为每个客户的影响力。
本发明实施例中,所述从所述各个客户的特征信息中选择出目标标签并推送至客户推荐***,包括:
从计算得到的所述各个客户特征信息中,筛选出满足预设条件的特征信息,作为目标标签;
将所述目标标签推送至客户推荐***。
本发明实施例提供的客户标签建模及推荐装置,包括:
客户信任度矩阵模块,用于构建客户信任度矩阵;
客户影响力因子计算模块,用于基于所述客户信任度矩阵,计算客户影响力因子;
客户标签特征矩阵模块,用于获取客户标签特征矩阵;
客户标签识别模块,用于结合所述客户影响力因子、所述客户信任度矩阵以及所述客户标签特征矩阵,计算各个客户的特征信息;
个性化推荐模块,用于从所述各个客户的特征信息中选择出目标标签并推送至客户推荐***。
本发明实施例中,所述客户信任度矩阵模块,还用于对采集到的客户通信记录进行解析,得到客户通信社交参数,所述客户通信社交参数用于表征客户与各个联系人的联系程度;基于各个客户通信社交参数,利用余弦算法计算客户相似度因子,所述客户相似度因子用于表征客户之间的通信社交参数的相似度;从业务数据中提取出客户社交绑定关系;对所述客户通信社交参数、所述客户相似度因子以及所述客户社交绑定关系进行加权处理,构建客户信任度矩阵,所述客户信任度矩阵用于表征客户之间的信任度。
本发明实施例中,所述客户信任度矩阵模块,还用于对采集到的客户通信记录进行解析时,删除所述客户通信记录中的无效数据。
本发明实施例中,所述客户标签特征矩阵模块,还用于构建客户标签特征矩阵H={bij,1<=i<=n,1<=j<=k2};其中,bij表示客户vi和标签j之间的关系,n表示客户数量,k2表示标签数量。
本发明实施例中,所述客户影响力因子计算模块,还用于基于所述客户信任度矩阵,利用pagerank算法计算所述客户影响力因子。
本发明实施例中,所述客户影响力因子计算模块,还用于执行如下过程:
设置收敛阈值W;
根据公式进行迭代计算,其中d为阻尼因子。为客户vi对其他所有客户的信任度贡献值,aij为客户vi对客户vj的信任度评分。为客户vi在第m次迭代后的影响力,q0 i=1,客户信任度矩阵为
第m+1次代后计算||Qm+1-Qm||的差值,当||Qm+1-Qm||>=W时,继续利用公式进行迭代计算,直到||Qm+1-Qm||<W为止;
将最后迭代计算的Q=(q1,q2,....qn)作为每个客户的影响力。
本发明实施例中,所述个性化推荐模块,还用于从计算得到的所述各个客户特征信息中,筛选出满足预设条件的特征信息,作为目标标签;将所述目标标签推送至客户推荐***。
本发明实施例的技术方案中,构建客户信任度矩阵;基于所述客户信任度矩阵,计算客户影响力因子;获取客户标签特征矩阵;结合所述客户影响力因子、所述客户信任度矩阵以及所述客户标签特征矩阵,计算各个客户的特征信息;从所述各个客户的特征信息中选择出目标标签并推送至客户推荐***。通过对本发明实施例技术方案的实施,至少具有如下有益效果:在考虑客户间信任度的时候,结合了客户之间的通信量以及客户之间共同的好友通信情况,利用余弦相似度算法计算客户间的相似度因子,并在信任度中增加了客户相似度因子,因此结果更准确。此外,结合了客户业务订购特征,通过客户订购家庭网、亲情网、家庭统付等家庭属性业务对客户间的信任度进行加权,能够有效识别客户家庭关系,使客户信任度更合理。最后,基于信任度的pagerank算法,能够准确计算每个客户的影响力,识别意见领袖客户,客户影响力在社交圈具有非常重要的意义,根据客户影响力建立客户标签模型及推荐方法,标签识别率更准,推荐质量更高。
附图说明
图1为本发明实施例的客户标签建模及推荐装置的结构组成示意图一;
图2为本发明实施例的客户标签建模及推荐方法的流程示意图;
图3为本发明实施例的客户影响力因子计算流程图;
图4为本发明实施例的客户的特征信息计算及推荐流程图;
图5为本发明实施例的客户标签建模及推荐装置的结构组成示意图二。
具体实施方式
为了能够更加详尽地了解本发明实施例的特点与技术内容,下面结合附图对本发明实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本发明实施例。
本发明实施例的技术方案,根据客户通信交往圈以及家庭属性业务特征对pagerank算法进行改进,建立了基于客户信任度的pagerank算法,并在此基础上提出新的客户标签建模及推荐方法。通过经典的数据模型,摒弃以往经验主义所带来的片面性、偶然性等缺点,提高模型的科学性和准确性。
基于此、本发明实施例中,1、在运营商客户通信网络中应用pagerank算法,利用客户间的通话关系网和业务信息改进pagerank算法忽略客户间相似性以及客户相对重要性等缺陷,建立科学的客户影响力因子评价模型。2、结合客户信任度矩阵、客户标签特征矩阵以及客户影响力因子计算客户在每个标签上的关联度(也即特征信息),识别客户是否具有该类特征标签。
本发明实施例的客户标签建模及推荐方法通过客户标签建模及推荐装置实现,如图1所述,所述客户标签建模及推荐装置包括五个模块,分别为:客户信任度矩阵模块、客户影响力因子计算模块、客户标签特征矩阵模块、客户标签识别模块、个性化推荐模块。其中:
(1)客户信任度矩阵模块
首先、通过A口信令采集客户通信记录,所述客户通信记录包括但不限于:通话、短信、彩信。对客户通信记录进行解析,删除无效数据,汇总客户在一定时间内的客户通信社交参数,这里,所述客户通信社交参数也称为通信社交圈。其次、利用cos余弦算法计算客户之间的相似度,得到客户相似度因子;若客户之间的共同交往圈越多,则客户相似度越大。最后、从业务运营支撑***(BOSS,Business&Operation Support System)中获取业务数据,从业务数据中提取客户社交绑定关系,这里,客户社交绑定关系包括但不限于:客户家庭网、亲情网等社交关系。对所述客户通信社交参数、所述客户相似度因子以及所述客户社交绑定关系进行加权处理,构建客户信任度矩阵。客户间的信任度越高,则表示客户之间关系越紧密。
(2)客户影响力因子计算模块
在传统的通信业务指标中很难准确识别客户影响力,谷歌pagerank算法在网页影响力计算中得到很好的应用和验证,因此、可以利用pagerank算法计算通信网中客户的影响力。由于pagerank算法在客户通信网中忽略客户之间的通话相似性以及客户本身的特定属性,本发明实施例构建的客户信任度矩阵中结合了客户相似度因子以及客户社交绑定关系(也即客户家庭特征),可有效避免上述问题。同时对通信独立的客户进行过滤处理,保证算法的收敛性和结果的客观准确性。
(3)客户标签特征矩阵模块
客户标签特征矩阵用于描述客户的业务特征、基本属性特征(例如客户画像等);客户标签特征矩把基本属性特征和业务特征相结合,用于描述每个客户的特征标签信息。
(4)客户标签识别模块
结合客户影响力因子、客户信任度矩阵以及客户标签特征矩阵,计算每个客户的特征信息。若客户影响力越大、且与其他客户信任度越高,则客户的特征标签(也即特征信息)传递给其他客户相对也越多。
(5)个性化推荐模块
根据客户标签识别模块计算的结果,筛选客户满足阈值的目标特征标签,把目标特征标签推送到客户推荐***。
图2为本发明实施例的客户标签建模及推荐方法的流程示意图,如图2所示,所述客户标签建模及推荐方法包括以下步骤:
步骤201:构建客户信任度矩阵。
具体地,对采集到的客户通信记录进行解析,得到客户通信社交参数,所述客户通信社交参数用于表征客户与各个联系人的联系程度;
基于各个客户通信社交参数,利用余弦算法计算客户相似度因子,所述客户相似度因子用于表征客户之间的通信社交参数的相似度;
从业务数据中提取出客户社交绑定关系;
对所述客户通信社交参数、所述客户相似度因子以及所述客户社交绑定关系进行加权处理,构建客户信任度矩阵,所述客户信任度矩阵用于表征客户之间的信任度。
上述方案中,对采集到的客户通信记录进行解析时,删除所述客户通信记录中的无效数据。
步骤202:基于所述客户信任度矩阵,计算客户影响力因子。
本发明实施例中,基于所述客户信任度矩阵,利用pagerank算法计算所述客户影响力因子。
步骤203:获取客户标签特征矩阵。
步骤204:结合所述客户影响力因子、所述客户信任度矩阵以及所述客户标签特征矩阵,计算各个客户的特征信息。
步骤205:从所述各个客户的特征信息中选择出目标标签并推送至客户推荐***。
具体地,从计算得到的所述各个客户特征信息中,筛选出满足预设条件的特征信息,作为目标标签;将所述目标标签推送至客户推荐***。
下面结合具体应用场景对本发明实施例的上述客户标签建模及推荐方法做详细描述。
(1)构建客户信任度矩阵
从网分A口信令中采集通话、短彩信等通话信息,信令解析后短信、通话数据分别如表1、表2。其中,表1为A口信令客户短信记录,表2为A口信令客户通话记录。
表1
表2
汇总一定时间内的客户语音、短信的数据,把客户通话网络图转化为有向图结构,定义客户通话网络有向图:G=(V,E),其中G表示整个通话网络;V表示通话网络中的客户集,V={v1,v2,v3,......vn},vi表示第i个客户,总共有n个客户;E表示客户之间通信联系矩阵,E={eij,1<=i,j<=n},eij表示客户vi主动与客户vj通信量,计算如下;
若eij越大表示客户vi到客户vj之间联系越紧密,ACTij表示客户vi到客户vj主叫语音通话次数,SMSij表示客户vi到客户vj主动短信次数,两条短信当作一次通话。
若把客户看作网页,客户间通信量看作网页间的连接数,则eij表示网页vi有eij条连接到网页vj。由pagerank算法可得,设置客户的初始影响力Q0=(q0 1,q0 2,....q0 n),q0 i表示客户vi的影响力,初始每个客户的影响力为1,即q0 i=1。根据客户联系矩阵E={eij,1<=i,j<=n},客户vj在第m+1次迭代计算公式如(2):
其中d阻尼因子,可控制算法的收敛速度,0<=d<=1,通常d=0.85。公式(2)中的客户联系矩阵E忽略客户之间的通话相似性以及客户本身的特定属性,因在,在步骤(2)中对客户联系矩阵E进行修改完善,并在步骤(3)中对客户vj在第m+1次迭代计算公式进行优化。
在客户通话网中,客户A和客户B,C通信量同为e,但客户A和B之间没有共同的通信好友对象,而客户A和C之间存在共同的通信好友对象{D1,D2....},因此客户A与C之间联系更加紧密,客户A相对更信任客户C,若客户C向客户A推荐某项产品也更容易接受。针对该问题,在本提案中,添加了客户相似度因子β,客户vi与所有客户的通信量可用n维向量ui表示:ui=(fi1,fi2,.....fin),fij=eij+eji表示客户vi和客户vj的总通信量,利用cos余弦算法计算所有客户间的相似度矩阵B={βij,1<=i,j<=n}。
βij=cos(ui,uj) (3)
通过BOSS***获取客户家庭网、亲情网、家庭统付等具有社交数据的业务,结合客户相似度矩阵对客户通话联系矩阵eij进行加权。定义加权后的客户信任度矩阵:M={aij,1<=i,j<=n},aij表示加权后的客户vi和vj之间的信任度。aij越大表示关系越紧密,则客户vi越信任客户vj,aij为零表示客户间没联系。客户信任度模型计算如公式(5)。
aij=α(1+βij)*eij (5)
ξ为客户关系增强系数,若客户vi和vj之间具有家庭业务特征,可以通过ξ参数增加客户之间的联系紧密度。
(2)pagerank算法计算客户影响力因子
在客户信任度矩阵中结合了客户间的相似度以及客户家庭特征,避免了pagerank算法在客户通信网中忽略客户之间的通话相似性以及客户本身的特定属性。同时对通信独立客户进行过滤处理,保证算法的收敛性。
设置客户的初始影响力Q0=(q0 1,q0 2,....q0 n),初始每个客户影响力为1,即q0 i=1。根据客户信任度矩阵设计适合运营商客户的pagerank算法,客户vj在第m+1次迭代计算公式如(6):
其中d阻尼因子,可控制算法的收敛速度,0<=d<=1,通常d=0.85。为客户vi对其他所有客户的信任度贡献值,aij为客户vi对客户vj的信任度评分。为客户vi在第m次迭代后的影响力,q0 i=1,记客户归一化信任度矩阵由于矩阵中的每一列相加之和为1,具备马尔可夫概率转移矩阵特性,公式(6)具有收敛性。
客户影响力因子的计算主要流程参照图3所示,设置算法收敛阈值W(通常W取值:0<=W<=1),根据公式(6)迭代计算,第m+1次代后计算||Qm+1-Qm||的差值,若||Qm+1-Qm||>=W则继续利用公式(6)循环计算,由于算法具有收敛性,任何一次迭代后,所有客户影响力之和为n,即直到||Qm+1-Qm||<W为止。最后Q=(q1,q2,....qn)为每个客户的影响力,且客户影响力不在发现变化。
(3)获取客户标签特征矩阵
构建客户标签特征矩阵H={bij,1<=i<=n,1<=j<=k2},bij表示客户vi和标签j之间的关系,如bij=1表示客户vi已经具备标签j的特征,bij=0表示客户vi不具备标签j的特征。n表示客户数量,k2表示标签数量,如iPhone、4G网络、***、旅游、视频等标签。
(4)计算各个客户的特征信息及推荐目标标签
根据第(3)步计算的客户最终影响力向量Q,结合客户标签特征矩阵H以及客户归一化信任度矩阵计算每个客户与各标签的关联度评分矩阵计算公式如(7)。
QT是客户影响力结果向量Q的转置向量,H为客户标签特征矩阵,为步骤3中客户归一化信任度矩阵。表示客户vi和标签j的关联度评分,主要受以下几个因素影响:
1、客户vi的交往圈大小(即和客户vi有通信的客户对象数量)以及客户vi与其他客户之间的信任度,主要由公式(7)中矩阵表示;
2、客户vi的交往圈中其他客户的影响力,主要由公式(7)中向量QT表示;
3、客户vi的交往圈中其他客户具有标签j的数量,主要由公式(7)中矩阵H表示。
越大,则表示客户vi具备标签j特征的概率越大。
根据公式(7)计算的客户标签关联度评分矩阵H2构建客户推荐矩阵H3,客户推荐矩阵H3={hij,1<=i<=n,1<=j<=k2}由公式(8)计算:
设置阈值W2,根据客户推荐矩阵H3建立客户标签推荐模型,若hij=1,则结合标签特征向客户vi推荐标签j的业务,反之hij=0,则不推荐。根据客户推荐矩阵H3中元素hij的值进行个性化推荐。客户标签建模及推荐模块主要流程参照图4(其中,h(i,j)表示矩阵H3中元素hij)。
本发明实施例利用客户的通信、相似度以及业务特征建立客户间信任度矩阵,基于客户信任度矩阵改进了pagerank算法,并在此基础上建立客户标签模型及推荐方法,主要进行了以下创新:
1)、创造性的将pagerank算法应用到运营商通信网络中,将客户影响力计算问题转换成平稳马尔可夫过程上的概率转移形式。利用客户通信量、通话对象的相似性、客户家庭属性业务特征建立客户信用度模型,设计了基于信任度的pagerank客户影响力算法,避免了原算法不能识别客户之间相似性等缺陷,算法本身具有稳定性、收敛性,算法计算的客户影响力具有合理性和代表性。
2)、将客户信任度、客户标签特征以及pagerank算法计算的客户最响力相结合,建立了客户标签识别模型,模型中从社交关系角度挖掘客户标签影响,能够准确识别客户相关的标签特征,经过实验验证,利用客户标签进行推荐可有效提升推荐质量。
图5为本发明实施例的客户标签建模及推荐装置的结构组成示意图,如图5所示,所述客户标签建模及推荐装置包括:
客户信任度矩阵模块51,用于构建客户信任度矩阵;
客户影响力因子计算模块52,用于基于所述客户信任度矩阵,计算客户影响力因子;
客户标签特征矩阵模块53,用于获取客户标签特征矩阵;
客户标签识别模块54,用于结合所述客户影响力因子、所述客户信任度矩阵以及所述客户标签特征矩阵,计算各个客户的特征信息;
个性化推荐模块55,用于从所述各个客户的特征信息中选择出目标标签并推送至客户推荐***。
所述客户信任度矩阵模块51,还用于对采集到的客户通信记录进行解析,得到客户通信社交参数,所述客户通信社交参数用于表征客户与各个联系人的联系程度;基于各个客户通信社交参数,利用余弦算法计算客户相似度因子,所述客户相似度因子用于表征客户之间的通信社交参数的相似度;从业务数据中提取出客户社交绑定关系;对所述客户通信社交参数、所述客户相似度因子以及所述客户社交绑定关系进行加权处理,构建客户信任度矩阵,所述客户信任度矩阵用于表征客户之间的信任度。
所述客户信任度矩阵模块51,还用于对采集到的客户通信记录进行解析时,删除所述客户通信记录中的无效数据。
所述客户标签特征矩阵模块53,还用于构建客户标签特征矩阵H={bij,1<=i<=n,1<=j<=k2};其中,bij表示客户vi和标签j之间的关系,n表示客户数量,k2表示标签数量。
所述客户影响力因子计算模块52,还用于基于所述客户信任度矩阵,利用pagerank算法计算所述客户影响力因子。
所述客户影响力因子计算模块52,还用于执行如下过程:
设置收敛阈值W;
根据公式进行迭代计算,其中d为阻尼因子。为客户vi对其他所有客户的信任度贡献值,aij为客户vi对客户vj的信任度评分。为客户vi在第m次迭代后的影响力,q0 i=1,客户信任度矩阵为
第m+1次代后计算||Qm+1-Qm||的差值,当||Qm+1-Qm||>=W时,继续利用公式进行迭代计算,直到||Qm+1-Qm||<W为止;
将最后迭代计算的Q=(q1,q2,....qn)作为每个客户的影响力。
所述个性化推荐模块55,还用于从计算得到的所述各个客户特征信息中,筛选出满足预设条件的特征信息,作为目标标签;将所述目标标签推送至客户推荐***。
本领域技术人员应当理解,图5所示的客户标签建模及推荐装置中的各单元的实现功能可参照前述客户标签建模及推荐方法的相关描述而理解。图5所示的客户标签建模及推荐装置中的各单元的功能可通过运行于处理器上的程序而实现,也可通过具体的逻辑电路而实现。
为更充分理解本发明实施例的技术方案,下面对Pagerank算法和客户信任度做进一步解释说明。
1、Pagerank算法
Google PageRank算法主要思想:将一个网页级别/重要性的排序问题转化成了一个公共参与、以群体民主投票的方式求解的问题,网页之间的链接即被认为是投票行为。Google把从A页面到B页面的链接解释为A页面给B页面投票,Google根据投票来源和投票目标的等级来决定新的等级。一个高等级的页面可以使其他低等级页面的等级提升。一个页面的PageRank是由所有链向它的页面(“链入页面”)的重要性经过递归算法得到的。
假设一个由4个页面组成的小团体:A,B,C和D。如果所有页面都链向
A,那么A的PR(PageRank)值将是B,C及D的Pagerank总和。
PR(A)=PR(B)+PR(C)+PR(D)
继续假设B也有链接到C,并且D也有链接到包括A的3个页面。一个页面不能投票2次。所以B给每个页面半票。以同样的逻辑,D投出的票只有三分之一算到了A的PageRank上。
换句话说,根据链出总数平分一个页面的PR值。
最后,所有这些被换算为一个百分比再乘上一个系数。由于“没有向外链接的页面”传递出去的PageRank会是0,所以,Google通过数学***给了每个页面一个最小值:(1-d)/N
所以一个页面的PageRank是由其他页面的PageRank计算得到。Google不断的重复计算每个页面的PageRank。如果给每个页面一个随机PageRank值(非0),那么经过不断的重复计算,这些页面的PR值会趋向于稳定,也就是收敛的状态。
2、客户信任度
客户的信任度是描述客户之间相互熟悉、信任的指标。在基于信任度的pagerank算法中,客户A对客户B的信任度可以看作是客户A对客户B的投票。客户信任度以客户间的通信量为基础、结合共同好友的相似度以及客户家庭属性关系。如果A有两个朋友B、C,客户A、B之间信任度很高,而A、C信任度较低,客户A更容易接受客户B的影响,接受客户B的推荐。因此,信任度模型更能反应客户之间的关系、特别适应于pagerank算法的客户标签建模及推荐。
本发明实施例所记载的技术方案之间,在不冲突的情况下,可以任意组合。
在本发明所提供的几个实施例中,应该理解到,所揭露的方法和智能设备,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个***,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个第二处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。

Claims (14)

1.一种客户标签建模及推荐方法,其特征在于,所述方法包括:
构建客户信任度矩阵;
基于所述客户信任度矩阵,计算客户影响力因子;
获取客户标签特征矩阵;
结合所述客户影响力因子、所述客户信任度矩阵以及所述客户标签特征矩阵,计算各个客户的特征信息;
从所述各个客户的特征信息中选择出目标标签并推送至客户推荐***。
2.根据权利要求1所述的客户标签建模及推荐方法,其特征在于,所述构建客户信任度矩阵,包括:
对采集到的客户通信记录进行解析,得到客户通信社交参数,所述客户通信社交参数用于表征客户与各个联系人的联系程度;
基于各个客户通信社交参数,利用余弦算法计算客户相似度因子,所述客户相似度因子用于表征客户之间的通信社交参数的相似度;
从业务数据中提取出客户社交绑定关系;
对所述客户通信社交参数、所述客户相似度因子以及所述客户社交绑定关系进行加权处理,构建客户信任度矩阵,所述客户信任度矩阵用于表征客户之间的信任度。
3.根据权利要求2所述的客户标签建模及推荐方法,其特征在于,所述方法还包括:
对采集到的客户通信记录进行解析时,删除所述客户通信记录中的无效数据。
4.根据权利要求1所述的客户标签建模及推荐方法,其特征在于,所述获取客户标签特征矩阵,包括:
构建客户标签特征矩阵H={bij,1<=i<=n,1<=j<=k2};其中,bij表示客户vi和标签j之间的关系,n表示客户数量,k2表示标签数量。
5.根据权利要求1所述的客户标签建模及推荐方法,其特征在于,所述基于所述客户信任度矩阵,计算客户影响力因子,包括:
基于所述客户信任度矩阵,利用网页排名pagerank算法计算所述客户影响力因子。
6.根据权利要求5所述的客户标签建模及推荐方法,其特征在于,所述利用pagerank算法计算所述客户影响力因子,包括:
设置收敛阈值W;
根据公式进行迭代计算,其中d为阻尼因子;为客户vi对其他所有客户的信任度贡献值,aij为客户vi对客户vj的信任度评分;为客户vi在第m次迭代后的影响力,q0 i=1,客户信任度矩阵为
第m+1次代后计算||Qm+1-Qm||的差值,当||Qm+1-Qm||>=W时,继续利用公式进行迭代计算,直到||Qm+1-Qm||<W为止;
将最后迭代计算的Q=(q1,q2,....qn)作为每个客户的影响力。
7.根据权利要求1至6任一项所述的客户标签建模及推荐方法,其特征在于,所述从所述各个客户的特征信息中选择出目标标签并推送至客户推荐***,包括:
从计算得到的所述各个客户特征信息中,筛选出满足预设条件的特征信息,作为目标标签;
将所述目标标签推送至客户推荐***。
8.一种客户标签建模及推荐装置,其特征在于,所述装置包括:
客户信任度矩阵模块,用于构建客户信任度矩阵;
客户影响力因子计算模块,用于基于所述客户信任度矩阵,计算客户影响力因子;
客户标签特征矩阵模块,用于获取客户标签特征矩阵;
客户标签识别模块,用于结合所述客户影响力因子、所述客户信任度矩阵以及所述客户标签特征矩阵,计算各个客户的特征信息;
个性化推荐模块,用于从所述各个客户的特征信息中选择出目标标签并推送至客户推荐***。
9.根据权利要求8所述的客户标签建模及推荐装置,其特征在于,所述客户信任度矩阵模块,还用于对采集到的客户通信记录进行解析,得到客户通信社交参数,所述客户通信社交参数用于表征客户与各个联系人的联系程度;基于各个客户通信社交参数,利用余弦算法计算客户相似度因子,所述客户相似度因子用于表征客户之间的通信社交参数的相似度;从业务数据中提取出客户社交绑定关系;对所述客户通信社交参数、所述客户相似度因子以及所述客户社交绑定关系进行加权处理,构建客户信任度矩阵,所述客户信任度矩阵用于表征客户之间的信任度。
10.根据权利要求9所述的客户标签建模及推荐装置,其特征在于,所述客户信任度矩阵模块,还用于对采集到的客户通信记录进行解析时,删除所述客户通信记录中的无效数据。
11.根据权利要求8所述的客户标签建模及推荐装置,其特征在于,所述客户标签特征矩阵模块,还用于构建客户标签特征矩阵H={bij,1<=i<=n,1<=j<=k2};其中,bij表示客户vi和标签j之间的关系,n表示客户数量,k2表示标签数量。
12.根据权利要求8所述的客户标签建模及推荐装置,其特征在于,所述客户影响力因子计算模块,还用于基于所述客户信任度矩阵,利用pagerank算法计算所述客户影响力因子。
13.根据权利要求12所述的客户标签建模及推荐装置,其特征在于,所述客户影响力因子计算模块,还用于执行如下过程:
设置收敛阈值W;
根据公式进行迭代计算,其中d为阻尼因子;为客户vi对其他所有客户的信任度贡献值,aij为客户vi对客户vj的信任度评分;为客户vi在第m次迭代后的影响力,q0 i=1,客户信任度矩阵为
第m+1次代后计算||Qm+1-Qm||的差值,当||Qm+1-Qm||>=W时,继续利用公式进行迭代计算,直到||Qm+1-Qm||<W为止;
将最后迭代计算的Q=(q1,q2,....qn)作为每个客户的影响力。
14.根据权利要求8至13任一项所述的客户标签建模及推荐装置,其特征在于,所述个性化推荐模块,还用于从计算得到的所述各个客户特征信息中,筛选出满足预设条件的特征信息,作为目标标签;将所述目标标签推送至客户推荐***。
CN201610319254.9A 2016-05-12 2016-05-12 一种客户标签建模及推荐方法及装置 Active CN107368499B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610319254.9A CN107368499B (zh) 2016-05-12 2016-05-12 一种客户标签建模及推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610319254.9A CN107368499B (zh) 2016-05-12 2016-05-12 一种客户标签建模及推荐方法及装置

Publications (2)

Publication Number Publication Date
CN107368499A true CN107368499A (zh) 2017-11-21
CN107368499B CN107368499B (zh) 2020-12-01

Family

ID=60304680

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610319254.9A Active CN107368499B (zh) 2016-05-12 2016-05-12 一种客户标签建模及推荐方法及装置

Country Status (1)

Country Link
CN (1) CN107368499B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109067636A (zh) * 2018-06-05 2018-12-21 网易无尾熊(杭州)科技有限公司 一种基于社交网络的信息推送装置方法、装置、介质和计算设备
CN109741199A (zh) * 2018-12-29 2019-05-10 ***通信集团江苏有限公司 社交影响力确定方法、装置、设备及计算机存储介质
CN110162692A (zh) * 2018-12-10 2019-08-23 腾讯科技(深圳)有限公司 用户标签确定方法、装置、计算机设备和存储介质
CN110362738A (zh) * 2018-11-06 2019-10-22 杭州电子科技大学 一种基于深度学习的结合信任和影响力的个性化推荐方法
CN114143207A (zh) * 2020-08-14 2022-03-04 ***通信集团广东有限公司 一种家庭用户识别方法和电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102799671A (zh) * 2012-07-17 2012-11-28 西安电子科技大学 基于PageRank算法的网络个性化推荐方法
US8762394B1 (en) * 2006-01-17 2014-06-24 Google Inc. Method and apparatus for obtaining recommendations from trusted sources
CN103971190A (zh) * 2013-01-30 2014-08-06 北京米时科技股份有限公司 一种通过电子名片构建的社交网络服务的***及方法
CN103995823A (zh) * 2014-03-25 2014-08-20 南京邮电大学 一种基于社交网络的信息推荐方法
CN104008163A (zh) * 2014-05-29 2014-08-27 上海师范大学 基于信任的社会网络最大化影响节点的计算方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8762394B1 (en) * 2006-01-17 2014-06-24 Google Inc. Method and apparatus for obtaining recommendations from trusted sources
CN102799671A (zh) * 2012-07-17 2012-11-28 西安电子科技大学 基于PageRank算法的网络个性化推荐方法
CN103971190A (zh) * 2013-01-30 2014-08-06 北京米时科技股份有限公司 一种通过电子名片构建的社交网络服务的***及方法
CN103995823A (zh) * 2014-03-25 2014-08-20 南京邮电大学 一种基于社交网络的信息推荐方法
CN104008163A (zh) * 2014-05-29 2014-08-27 上海师范大学 基于信任的社会网络最大化影响节点的计算方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
曹嘉伦: "个性化推荐技术研究与***设计", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109067636A (zh) * 2018-06-05 2018-12-21 网易无尾熊(杭州)科技有限公司 一种基于社交网络的信息推送装置方法、装置、介质和计算设备
CN110362738A (zh) * 2018-11-06 2019-10-22 杭州电子科技大学 一种基于深度学习的结合信任和影响力的个性化推荐方法
CN110362738B (zh) * 2018-11-06 2021-12-21 杭州电子科技大学 一种基于深度学习的结合信任和影响力的个性化推荐方法
CN110162692A (zh) * 2018-12-10 2019-08-23 腾讯科技(深圳)有限公司 用户标签确定方法、装置、计算机设备和存储介质
CN110162692B (zh) * 2018-12-10 2021-05-25 腾讯科技(深圳)有限公司 用户标签确定方法、装置、计算机设备和存储介质
CN109741199A (zh) * 2018-12-29 2019-05-10 ***通信集团江苏有限公司 社交影响力确定方法、装置、设备及计算机存储介质
CN114143207A (zh) * 2020-08-14 2022-03-04 ***通信集团广东有限公司 一种家庭用户识别方法和电子设备

Also Published As

Publication number Publication date
CN107368499B (zh) 2020-12-01

Similar Documents

Publication Publication Date Title
CN107368499A (zh) 一种客户标签建模及推荐方法及装置
CN105824813B (zh) 一种挖掘核心用户的方法及装置
CN103024017B (zh) 一种社交网络重要目标及社区群体识别方法
CN109684478A (zh) 分类模型训练方法、分类方法及装置、设备和介质
CN111190939A (zh) 一种用户画像构建方法及装置
CN103605791B (zh) 信息推送***和信息推送方法
CN107609708A (zh) 一种基于***商店的用户流失预测方法及***
CN105281925B (zh) 网络业务用户群组划分的方法和装置
CN104573304A (zh) 一种基于信息熵和聚类分群的用户质态评估方法
CN102083010B (zh) 一种用户信息筛选方法和设备
CN103353920A (zh) 基于社交网络推荐游戏的方法和装置
CN107292390A (zh) 一种基于混沌理论的信息传播模型及其传播方法
CN112836139B (zh) 融合用户特征和嵌入学习的跨社交网络用户身份关联方法
CN109711746A (zh) 一种基于复杂网络的信用评估方法和***
CN108304853A (zh) 游戏相关度的获取方法、装置、存储介质和电子装置
CN107527240A (zh) 一种运营商行业产品口碑营销效果鉴定***及方法
CN105100353A (zh) 一种对移动终端的新增联系人进行通讯录分组的方法
CN106487642A (zh) 一种推送信息的方法和装置
CN115034305A (zh) 利用人在回路图神经网络在通话网络中识别诈骗用户的方法、***和存储介质
Kurasawa et al. Missing sensor value estimation method for participatory sensing environment
CN111475739A (zh) 一种基于元路径的异质社交网络用户锚链接识别方法
CN110457601A (zh) 社交账号的识别方法和装置、存储介质及电子装置
CN114239924A (zh) 基于天气参数的影响指数确定方法及装置
CN112699402A (zh) 基于联邦个性化随机森林的可穿戴设备活动预测方法
CN102750288B (zh) 一种互联网内容推荐方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant