CN108108451A - 群体的群体用户画像获取方法和装置 - Google Patents

群体的群体用户画像获取方法和装置 Download PDF

Info

Publication number
CN108108451A
CN108108451A CN201711450561.1A CN201711450561A CN108108451A CN 108108451 A CN108108451 A CN 108108451A CN 201711450561 A CN201711450561 A CN 201711450561A CN 108108451 A CN108108451 A CN 108108451A
Authority
CN
China
Prior art keywords
user
portrait
class cluster
group
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711450561.1A
Other languages
English (en)
Inventor
郭丹
郭浒生
黄玉胜
罗咏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Midea Intelligent Technologies Co Ltd
Original Assignee
Hefei Midea Intelligent Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei Midea Intelligent Technologies Co Ltd filed Critical Hefei Midea Intelligent Technologies Co Ltd
Priority to CN201711450561.1A priority Critical patent/CN108108451A/zh
Publication of CN108108451A publication Critical patent/CN108108451A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种群体的群体用户画像获取方法和装置,其中,方法包括:获取目标区域的每个用户的用户画像,其中,用户画像中包括用户的多个标签,根据用户画像之间的相似度,对目标区域内的用户进行聚类,得到目标区域的所有类簇,其中,一个类簇用于表征一个偏好相似的群体,识别每个类簇的中心用户,将中心用户的用户画像作为类簇的群体用户画像。该方法通过得到群体用户画像可以反映出部分群体用户的需求或者偏好,进一步基于群体用户画像挖掘时,能够提高挖掘效果的准确性,弥补了相关技术中缺乏群体用户画像获取方式的问题。

Description

群体的群体用户画像获取方法和装置
技术领域
本发明涉及数据处理技术领域,尤其涉及一种群体的群体用户画像获取方法和装置。
背景技术
随着大数据技术的深入研究与应用,企业的专注点日益聚焦于怎样利用大数据来为精准营销服务,进而深入挖掘潜在的商业价值。于是,用户画像的概念应运而生,用户画像可抽象出用户信息的全貌。
相关技术中大多是关于单个用户的用户画像的获取方式,单个用户的用户画像并不具有普遍性,无法体现出大众的偏好或者需求。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种群体的群体用户画像获取方法,根据户画像之间的相似度,对目标区域内的用户进行聚类,以得到类簇的群体用户画像,通过得到群体用户画像可以反映出部分群体用户的需求或者偏好,进一步基于群体用户画像挖掘时,能够提高挖掘效果的准确性。
本发明的第二个目的在于提出一种群体的群体用户画像获取装置。
本发明的第三个目的在于提出一种计算机设备。
本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
本发明的第五个目的在于提出一种计算机程序产品。
为达上述目的,本发明第一方面实施例提出了一种群体的群体用户画像获取方法,包括:
获取目标区域的每个用户的用户画像;其中,所述用户画像中包括所述用户的多个标签;
根据所述用户画像之间的相似度,对所述目标区域内的用户进行聚类,得到所述目标区域的所有类簇,其中,一个所述类簇用于表征一个偏好相似的群体;
识别每个类簇的中心用户,将所述中心用户的用户画像作为所述类簇的群体用户画像。
作为第一方面实施例一种可能的实现方式,所述识别每个类簇的中心用户,包括:
根据所述类簇中每个用户的用户画像,确定所述类簇的中心点;
选取与所述中心点相似度最大的所述用户作为所述中心用户。
作为第一方面实施例一种可能的实现方式,所述根据所述类簇中每个用户的用户画像,确定所述类簇的中心点,包括:
将所述类簇中每个用户画像中相同标签的第一数据相加求平均,得到每个标签的平均值;
根据每个标签的平均值,形成所述类簇的中心点。
作为第一方面实施例一种可能的实现方式,所述选取与所述中心点相似度最大的所述用户作为所述中心用户,包括:
针对所述类簇中的每个用户,根据所述用户的所述用户画像和所述中心点,计算所述用户与所述中心点的相似度;
对每个用户的所述相似度排序,从中确定所述相似度最大的所述用户作为所述中心用户。
作为第一方面实施例一种可能的实现方式,所述根据所述用户画像之间的相似度,对所述目标区域内的用户进行聚类,得到所述目标区域的所有类簇,包括:
从所有的用户中随机选取预设个数的第一用户;其中,所述预设个数为试图聚类出的类簇的个数;
分别将所述第一用户设定为一个类簇的中心点;
将剩余的用户根据所述用户画像,分别聚类到与所述用户画像相似度最接近的所述类簇中;
基于获取到所述类簇中的每个用户的所述用户画像对所述中心点进行更新;
基于更新后的所述中心点对所述剩余的用户重新进行聚类,直到更新出的所述类簇中包括的所述用户与前一次聚类后所述类簇包括的所述用户相同则停止重新聚类,得到所述目标区域的所有类簇。
作为第一方面实施例一种可能的实现方式,所述将剩余的用户根据所述用户画像,分别聚类到与所述用户画像相似度最接近的所述类簇中,包括:
针对剩余的每个用户,根据所述用户的用户画像和所述类簇的中心点,获取所述用户与每个类簇的所述中心点之间的相似度;
将所述用户聚类到与所述中心点的相似度最高的所述类簇中。
作为第一方面实施例一种可能的实现方式,所述根据所述用户的用户画像和所述类簇的中心点,获取所述用户与每个类簇的所述中心点的相似度,包括:
获取所述用户的所述用户画像中每个标签与所述中心点中对应的所述标签之间的相似度;
根据所述标签的相似度和所述标签对应的权重,对所有标签的所述相似度进行加权,得到所述用户与所述中心点之间的所述相似度。
作为第一方面实施例一种可能的实现方式,述相似度为欧式距离相似度、曼哈顿距离相似度或者余弦相似度。
作为第一方面实施例一种可能的实现方式,所述获取目标区域的每个用户的用户画像,包括:
针对所述目标区域内的每个用户,根据所述用户的身份信息,从数据库中采集所述用户的每个标签的标签数据;
利用所述标签数据生成所述用户画像。
作为第一方面实施例一种可能的实现方式,所述将所述中心用户的用户画像作为所述类簇的群体用户画像之后,包括:
获取每个类簇中所述用户的个数;
根据所述用户的个数为所述目标区域内的所有类簇进行排序;
按照所述类簇的顺序和所述类簇的群体用户画像,为所述目标区域生成配货信息;
根据所述配货信息为所述目标区域进行配货。
本发明实施例的群体的群体用户画像获取方法,通过获取目标区域的每个用户的用户画像,其中,用户画像中包括用户的多个标签,根据用户画像之间的相似度,对目标区域内的用户进行聚类,得到目标区域的所有类簇,其中,一个类簇用于表征一个偏好相似的群体,识别每个类簇的中心用户,将中心用户的用户画像作为类簇的群体用户画像。本实施例中,根据用户画像之间的相似度,对目标区域的用户进行聚类得到类簇,从而将目标区域中的用户划分为多个偏好相似的群体,并将类簇的中心用户的用户画像作为类簇的群体用户画像,以表征该类簇的用户偏好,通过得到群体用户画像可以反映出部分群体用户的需求或者偏好,进一步基于群体用户画像挖掘时,能够提高挖掘效果的准确性,弥补了相关技术中缺乏群体用户画像的获取方式的问题。
为达上述目的,本发明第二方面实施例提出了一种群体的群体用户画像获取装置,包括:
获取模块,用于获取目标区域的每个用户的用户画像;其中,所述用户画像中包括所述用户的多个标签;
聚类模块,用于根据所述用户画像之间的相似度,对所述目标区域内的用户进行聚类,得到所述目标区域的所有类簇,其中,一个所述类簇用于表征一个偏好相似的群体;
识别模块,用于识别每个类簇的中心用户,将所述中心用户的用户画像作为所述类簇的群体用户画像。
本发明实施例的群体的群体用户画像获取装置,通过获取目标区域的每个用户的用户画像,其中,用户画像中包括用户的多个标签,根据用户画像之间的相似度,对目标区域内的用户进行聚类,得到目标区域的所有类簇,其中,一个类簇用于表征一个偏好相似的群体,识别每个类簇的中心用户,将中心用户的用户画像作为类簇的群体用户画像。本实施例中,根据用户画像之间的相似度,对目标区域的用户进行聚类得到类簇,从而将目标区域中的用户划分为多个偏好相似的群体,并将类簇的中心用户的用户画像作为类簇的群体用户画像,以表征该类簇的用户偏好,通过得到群体用户画像可以反映出部分群体用户的需求或者偏好,进一步基于群体用户画像挖掘时,能够提高挖掘效果的准确性,弥补了相关技术中缺乏群体用户画像的获取方式的问题。
为达上述目的,本发明第三方面实施例提出了一种计算机设备,包括处理器和存储器;
其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如第一方面实施例所述的群体的群体用户画像获取方法。
为了实现上述目的,本发明第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面实施例所述的群体的群体用户画像获取方法。
为了实现上述目的,本发明第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时实现如第一方面实施例所述的群体的群体用户画像获取方法。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例提供的一种群体的群体用户画像获取方法的流程示意图;
图2为本发明实施例提供的一种聚类方法的流程示意图;
图3为本发明实施例提供的另一种群体的群体用户画像获取方法的流程示意图;
图4为本发明实施例提供的一种群体的群体用户画像获取装置的结构示意图;
图5为适于用来实现本申请实施方式的示例性计算机设备的框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的群体的群体用户画像获取方法和装置。
用户画像是大数据的根基,它抽象出一个用户的信息全貌,为进一步精准、快速地分析用户行为习惯、消费习惯等重要信息,提供了足够的数据基础,奠定了大数据时代的基石。
相关技术中提出了群体用户画像技术,但是并未提供具体的实现方法。
针对这一问题,本发明实施例提供一种群体的群体用户画像获取方法,根据用户画像之间的相似度,对目标区域内的用户进行聚类,以得到类簇的群体用户画像,解决了相关技术中未提供群体用户画像获取方法的问题。
图1为本发明实施例提供的一种群体的群体用户画像获取方法的流程示意图。
如图1所示,该群体的群体用户画像获取方法包括:
步骤101,获取目标区域的每个用户的用户画像;其中,用户画像中包括用户的多个标签。
用户画像是用户信息的标签化,而一个标签通常是高度精炼的特征标识,如年龄、性别、用户偏好等,最后将用户的所有标签综合来看,就可以勾勒出该用户的立体“画像”了。可见,用户画像中包括多个标签。
本实施例中,可根据实际需要设置标签类别和个数,通过问卷调查的方式统计目标区域中用户信息,如年龄、性别、口味等多个标签,并将每个用户的每个标签数据存储到数据库中。其中,目标区域可以是一个地理范围,如一个学校、几个集中的居民小区、一个城市等等,可根据实际需要确定。
由此,在获取群体用户画像时,可针对目标区域内的每个用户,根据用户身份信息,从数据库中采集用户的每个标签的标签数据。针对每个用户,其所有标签数据组成用户画像。
其中,用户身份信息可以是用户的身份证号,也可以是手机号,也可以是用户的编号等等,本实施例对此不作限定。
步骤102,根据用户画像之间的相似度,对目标区域内的用户进行聚类,得到目标区域的所有类簇,其中,一个类簇用于表征一个偏好相似的群体。
本实施例中,可利用聚类算法对目标区域内的用户进行聚类,其中,聚类算法包括但限于层次化聚类算法、划分式聚类算法等等。
层次化聚类算法又称树聚类算法,它使用数据的连接规则,通过一种层次架构方式,反复将数据进行***和聚合,以形成一个层次序列的聚类问题解。
划分式聚类算法需要预先指定聚类数目或聚类中心,通过反复迭代运算,逐步降低目标函数的误差值,当目标函数值收敛时,得到最终聚类结果。
本实施例中,根据用户画像之间的相似度,对目标区域内的用户进行聚类,可将目标区域内的用户划分到多个类簇中,同一个类簇中的用户偏好相似。由此,经过聚类后,可将偏好相似的用户划分到一起,得到多个偏好不同的群体。
步骤103,识别每个类簇的中心用户,将中心用户的用户画像作为类簇的群体用户画像。
群体用户画像描述的是一个群体的特征,也就意味着不是具体的一个用户,而是群体中用户的特征综合,它是一个虚拟的画像。因此,在聚类完成后,还需要抽象出每个类簇的群体用户画像。
本实施例中,针对每个类簇,将识别出的中心用户的用户画像作为类簇的群体用户画像,也就是说,以中心用户的每个标签的标签数据,代表类簇的群体的特征。
对于步骤102,在根据用户画像之间的相似度,对目标区域中的用户进行聚类,本发明实施例提供了一种聚类方法,下面结合图2进行解释说明。图2为本发明实施例提供一种聚类方法的流程示意图。
如图2所示,该聚类方法包括:
步骤201,从所有的用户中随机选取预设个数的第一用户;其中,预设个数为试图聚类出的类簇的个数。
例如,如果试图聚类出的类簇的个数为10个,则从目标区域的所有用户中随机选取10个第一用户。
步骤202,分别将第一用户设定为一个类簇的中心点。
本实施例中,分别将第一用户设定为一个类簇的中心点,从而可以得到预设个数的类簇的中心点。
步骤203,将剩余的用户根据用户画像,分别聚类到与用户画像相似度最接近的所述类簇中。
作为一种可能的实现方式,针对剩余的每个用户,根据用户的用户画像和类簇的中心点,获取用户与每个类簇的中心点之间的相似度,将用户聚类到与中心点的相似度最高的类簇中。
在获取用户与中心点之间的相似度时,可先获取用户的用户画像中每个标签与中心点中对应标签之间的相似度。具体地,可采用欧式距离、曼哈顿距离、余弦等计算标签与中心点中对应标签之间的相似度。
若利用欧式距离计算,可得到欧式距离相似度,如公式(1)所示。
其中,sim(Ui,Uj)表示用户Ui和Uj在第k个标签上的相似度。
若用曼哈顿距离计算,可得到曼哈顿距离相似度,如公式(2)所示。
其中,sim(Ui,Uj)表示用户Ui和Uj在第k个标签上的相似度。
若用向量的余弦夹角度量标签与中心点中对应标签之间的相似度,可计算得到余弦相似度,如公式(3)所示。
其中,sim(Ui,Uj)表示用户Ui和Uj在第k个标签上的相似度。
需要说明的是,上述计算标签相似度的方法仅是示例,其他可以计算标签相似度的也包含在本实施例中。
在获得用户画像中每个标签与中心点中对应的标签之间的相似度后,根据标签的相似度和标签对应的权重,对所有标签的相似度进行加权,得到用户与中心点之间的相似度。如公式(4)所示。
sim(Pi,Pj)=∑(λi×ti) (4)
其中,sim(Pi,Pj)表示用户画像Pi与Pj之间的相似度,λi表示第i个标签的权重因子,ti表示用户画像Pi中第i个标签相似度与用户画像Pj中第i个标签之间的相似度。
根据上述方法,针对除中心点外的每个用户,可计算出用户与每个类簇的中心点之间的相似度,将用户聚类到与中心点的相似度最高的类簇中。
步骤204,基于获取到类簇中的每个用户的用户画像对中心点进行更新。
在将剩余的用户聚类后,目标区域内的用户被划分到预设个数的类簇中。由于一次聚类,聚类结果准确度不高,可基于获取到类簇中的每个用户的用户画像对中心点进行更新。
作为一个示例,针对每个类簇,可将类簇中所有用户的相同标签的标签数据相加后求平均值,所有标签的标签数据的平均值更新为新的中心点。
步骤205,基于更新后的中心点对剩余的用户重新进行聚类,直到更新出的类簇中包括的用户与前一次聚类后类簇包括的用户相同则停止重新聚类,得到目标区域的所有类簇。
本实施例中,在更新完中心点后,可根据步骤203所述的方法重新进行聚类,之后更新中心点,直到更新出的类簇中包括的用户与前一次聚类后类簇包括的用户相同,也就是聚类收敛,则停止重新聚类,得到目标区域的所有类簇。
为了更清楚说明上述实施例,下面以给某目标区域进行配货为例,结合图3解释说明本发明实施例提出的群体的群体用户画像获取方法。图3为本发明实施例提供的另一种群体的群体用户画像获取方法的流程示意图。
如图3所示,该群体的群体用户画像获取方法包括:
步骤301,获取目标区域的每个用户的用户画像;其中,用户画像中包括用户的多个标签。
步骤302,根据用户画像之间的相似度,对目标区域内的用户进行聚类,得到目标区域的所有类簇,其中,一个类簇用于表征一个偏好相似的群体。
本发明实施例中,步骤301-步骤302与前述实施例中的步骤101-步骤102类似,故在此不再赘述。
步骤303,根据类簇中每个用户的用户画像,确定类簇的中心点。
在对目标区域内的用户进行聚类,得到目标区域的所有类簇后,可根据类簇中每个用户的用户画像,确定类簇的中心点。作为一个示例,将类簇中每个用户画像中相同标签的第一数据相加求平均,得到每个标签的平均值,根据每个标签的平均值,形成类簇的中心点。
步骤304,选取与中心点相似度最大的用户作为中心用户,将中心用户的用户画像作为类簇的群体用户画像。
在获得类簇的中心点后,针对类簇中的每个用户,根据用户的用户画像和中心点,计算用户与中心点的相似度,具体计算方法可参见前述实施例中,计算用户与中心点的相似度的方法,在此不再赘述。在计算出类簇中每个用户与中心点的相似度后,对每个用户的相似度从高到低进行排序,从中确定相似度最大的用户作为中心用户。
在确定出中心用户后,将中心用户的用户画像作为类簇的群体用户画像。从而,可以获取每个类簇的群体用户画像。
可选地,若采用预先指定聚类数目或聚类中心划分式聚类算法,进行聚类,由于聚类中心节点反映了其所在类簇的总体特征,因此,可将最后一次迭代中聚类的中心节点的数据作为该类簇的群体用户画像。
步骤305,根据类簇中用户的个数为目标区域内的所有类簇进行排序。
对目标地区的进行配货,如给无人超市、无人售货机、普通超市配货等,可以作为本实施例的一个应用场景。
具体地,在获取目标地区每个类簇的群体用户画像后,获取每个类簇中用户的个数,并可按照用户的个数从大到小为目标区域内的所有类簇进行排序。
步骤306,按照类簇的顺序和类簇的群体用户画像,为目标区域进行配货。
类簇中用户数目越多,说明该类簇的群体用户画像代表了目标区域中大多数用户的需求。
本实施例中,可按照类簇中用户个数从大到小的顺序,根据类簇的群体用户画像生成目标区域的配货信息,根据配货信息为目标区域进行配货。
举例来说,若目标区域中类簇A中用户个数最多,类簇B次之,在配货时可优先考虑用户人数最多的类簇A中用户的需求,并在不冲突的情况下尽量满足类簇B中用户需求。
本发明实施例的群体的群体用户画像获取方法,在获取类簇的群体用户画像之后,可根据类簇顺序和类簇的群体用户画像为目标区域进行配货。
在对目标区域进行配货的应用场景中,可以解决给不同区域无人智能零售终端进行配货的问题。并且,根据本发明实施例的群体的群体用户画像获取方法可以因地制宜,在不同地区根据当地人群喜好进行配货,不仅可以提高满足用户的需求,也可以提高售货量。
为了更清楚的说明上述实施例,下面结合具体例子进行解释说明。
表1是根据用户身份信息从数据库中提取的用户画像。其中,P1、P2等为用户的身份信息,用户画像中包括年龄、每月平均开销、每月购买休闲零食频率共3个标签。
表1
用户 年龄(岁) 平均开销(元/月) 购买休闲零食频率(次/月)
P1 20 2000 2
P2 27 8000 3
P3 22 3000 3
P4 47 6000 1
P5 33 7000 5
P6 27 6000 3
P7 38 10000 8
P8 41 12000 2
P9 18 2000 9
P10 26 9000 7
P11 31 7000 10
P12 23 5000 7
P13 35 9000 8
P14 29 11000 2
P15 37 12000 5
为了便于计算,可将标签数据归一化到区间[0,1]中,本实施例中,采用线性函数转换法,线性函数转换法公式,如公式(5)所示。
其中,X代表转换前的值,Y代表转换后的值,Xmax和Xmin分别代表转换前的最大值和最小值。
对表1中15个用户的每个标签的标签数据进行转换,转换后的数据,如表2所示。
表2
用户 年龄(岁) 平均开销(元/月) 购买休闲零食频率(次/月)
P1 0.067 0 0.111
P2 0.3 0.6 0.555
P3 0.467 0.1 0.222
P4 1 0.4 0
P5 0.5 0.5 0.444
P6 0.3 0.4 0.555
P7 0.667 0.8 0.777
P8 0.767 1 0.111
P9 0 0 0.555
P10 0.267 0.7 0.666
P11 0.433 0.5 1
P12 0.167 0.3 0.666
P13 0.567 0.7 0.777
P14 0.367 0.9 0.111
P15 0.633 1 0.444
之后,根据图2所示的聚类方法进行聚类。本实施例,设置试图聚类出的类簇的个数为3,即将15个用户分为3个群体。现随机抽取用户P1、用户P7和用户P10的用户画像作为三个类簇的中心点,即:
A:{0.067,0,0.111}
B:{0.667,0.8,0.777}
C:{0.267,0.7,0.666}
然后,计算除用户P1、用户P7和用户P10外剩余的每个用户与3个类簇的中心点的相似度,这里采用欧式距离进行计算,第一次聚类结果为:
类簇A:{P1,P3,P9}
类簇B:{P7,P4,P8,P13,P15}
类簇C:{P1O,P2,P5,P6,P11,P12,P14}
根据第一次聚类的结果,调整各个类簇的中心点。类簇A新的中心点为{(0.067+0.467+0)/3=0.178,(0+0.1+0)/3=0.033,(0.111+0.222+0.555)/3=0.296}。利用同样的方式,可计算得到类簇B和类簇C新的中心点,分别为{0.727,0.78,0.422}和{0.333,0.557,0.571}。
根据调整后的中心点再次聚类,依此类推,直到最终分类结果无变化,也就是分类已收敛时,就得到了最终的聚类结果:
类簇A:{P1,P9,P12}
类簇B:{P7,P4,P8,P13,P15}
类簇C:{P1O,P2,P3,P5,P6,P11,P14}
由于类簇C中用户个数最多,因此目标区域的主要用户群为类簇C,类簇C的中心用户是P10,将用户P10的用户画像作为类簇C的群体用户画像。用户个数处于第二位的是类簇B,类簇B的中心用户是P7,即将P7的用户画像作为B群体用户画像。
在进行配货时,可优先为类簇C进行配货,由于类簇的群体用户画像反映了类簇中用户的综合特征,因此可根据类簇C的群体用户画像生成配货信息,根据配货信息对目标区域进行配货。
本发明实施例的群体的群体用户画像获取方法,通过获取目标区域的每个用户的用户画像,其中,用户画像中包括用户的多个标签,根据用户画像之间的相似度,对目标区域内的用户进行聚类,得到目标区域的所有类簇,其中,一个类簇用于表征一个偏好相似的群体,识别每个类簇的中心用户,将中心用户的用户画像作为类簇的群体用户画像。本实施例中,根据用户画像之间的相似度,对目标区域的用户进行聚类得到类簇,从而将目标区域中的用户划分为多个偏好相似的群体,并将类簇的中心用户的用户画像作为类簇的群体用户画像,以表征该类簇的用户偏好,通过得到群体用户画像可以反映出部分群体用户的需求或者偏好,进一步基于群体用户画像挖掘时,能够提高挖掘效果的准确性,弥补了相关技术中缺乏群体用户画像的获取方式的问题。
为了实现上述实施例,本发明还提出一种群体的群体用户画像获取装置。如图4所示,该群体的群体用户画像获取装置包括:获取模块410、聚类模块420、识别模块430。
其中,获取模块410,用于获取目标区域的每个用户的用户画像;其中,用户画像中包括所述用户的多个标签。
聚类模块420,用于根据用户画像之间的相似度,对目标区域内的用户进行聚类,得到目标区域的所有类簇,其中,一个类簇用于表征一个偏好相似的群体。
识别模块430,用于识别每个类簇的中心用户,将中心用户的用户画像作为类簇的群体用户画像。
作为本实施例一种可能的实现方式,识别模块430包括:
确定单元,用于根据类簇中每个用户的用户画像,确定类簇的中心点;
第一选取单元,用于选取与中心点相似度最大的用户作为中心用户。
作为本实施例一种可能的实现方式,确定单元还用于:
将类簇中每个用户画像中相同标签的第一数据相加求平均,得到每个标签的平均值;
根据每个标签的平均值,形成类簇的中心点。
作为本实施例一种可能的实现方式,第一选取单元还用于:
针对类簇中的每个用户,根据用户的所述用户画像和中心点,计算用户与中心点的相似度;
对每个用户的相似度排序,从中确定相似度最大的用户作为中心用户。
作为本实施例一种可能的实现方式,聚类模块420包括:
第二选取单元,用于从所有的用户中随机选取预设个数的第一用户;其中,预设个数为试图聚类出的类簇的个数。
设定单元,用于分别将第一用户设定为一个类簇的中心点;
聚类单元,用于将剩余的用户根据用户画像,分别聚类到与用户画像相似度最接近的类簇中。
更新单元,用于基于获取到类簇中的每个用户的用户画像对中心点进行更新。
聚类单元,还用于基于更新后的中心点对剩余的用户重新进行聚类,直到更新出的类簇中包括的用户与前一次聚类后类簇包括的用户相同则停止重新聚类,得到目标区域的所有类簇。
作为本实施例一种可能的实现方式,聚类单元还用于:
针对剩余的每个用户,根据用户的用户画像和类簇的中心点,获取用户与每个类簇的中心点之间的相似度;
将用户聚类到与中心点的相似度最高的类簇中。
作为本实施例一种可能的实现方式,聚类单元还用于:
获取用户的用户画像中每个标签与中心点中对应的标签之间的相似度;
根据标签的相似度和标签对应的权重,对所有标签的相似度进行加权,得到用户与中心点之间的相似度。
作为本实施例一种可能的实现方式,相似度为欧式距离相似度、曼哈顿距离相似度或者余弦相似度。
作为本实施例一种可能的实现方式,获取模块410还用于:
针对目标区域内的每个用户,根据用户的身份信息,从数据库中采集用户的每个标签的标签数据;
利用标签数据生成用户画像。
作为本实施例一种可能的实现方式,该装置还包括:
第一获取模块,用于获取每个类簇中所述用户的个数;
排序单元,用于根据用户的个数为目标区域内的所有类簇进行排序;
生成单元,用于按照类簇的顺序和类簇的群体用户画像,为目标区域生成配货信息;
配货单元,用于根据配货信息为目标区域进行配货。
需要说明的是,前述对群体的群体用户画像获取方法实施例的解释说明,也适用于该实施例的群体的群体用户画像获取装置,故在此不再赘述。
本发明实施例的群体的群体用户画像获取装置,通过获取目标区域的每个用户的用户画像,其中,用户画像中包括用户的多个标签,根据用户画像之间的相似度,对目标区域内的用户进行聚类,得到目标区域的所有类簇,其中,一个类簇用于表征一个偏好相似的群体,识别每个类簇的中心用户,将中心用户的用户画像作为类簇的群体用户画像。本实施例中,根据用户画像之间的相似度,对目标区域的用户进行聚类得到类簇,从而将目标区域中的用户划分为多个偏好相似的群体,并将类簇的中心用户的用户画像作为类簇的群体用户画像,以表征该类簇的用户偏好,通过得到群体用户画像可以反映出部分群体用户的需求或者偏好,进一步基于群体用户画像挖掘时,能够提高挖掘效果的准确性,弥补了相关技术中缺乏群体用户画像的获取方式的问题。
为了实现上述实施例,本发明还提出一种计算机设备,包括处理器和存储器;其中,处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于实现如前述任一实施例所述的群体的群体用户画像获取方法。
为了实现上述实施例,本发明还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如前述任一实施例所述的群体的群体用户画像获取方法。
为了实现上述实施例,本发明还提出一种计算机程序产品,当计算机程序产品中的指令由处理器执行时实现如前述任一实施例所述的群体的群体用户画像获取方法。
图5示出了适于用来实现本申请实施方式的示例性计算机设备的框图。图5显示的计算机设备12仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图5所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,***存储器28,连接不同***组件(包括***存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,***总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及***组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。
计算机设备12典型地包括多种计算机***可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机***可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机***存储介质。仅作为举例,存储***34可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc Read OnlyMemory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read OnlyMemory;以下简称:DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本申请所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local Area Network;以下简称:LAN),广域网(Wide Area Network;以下简称:WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
处理单元16通过运行存储在***存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现前述实施例中提及的方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用,或结合这些指令执行***、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (14)

1.一种群体的群体用户画像获取方法,其特征在于,包括:
获取目标区域的每个用户的用户画像;其中,所述用户画像中包括所述用户的多个标签;
根据所述用户画像之间的相似度,对所述目标区域内的用户进行聚类,得到所述目标区域的所有类簇,其中,一个所述类簇用于表征一个偏好相似的群体;
识别每个类簇的中心用户,将所述中心用户的用户画像作为所述类簇的群体用户画像。
2.根据权利要求1所述的方法,其特征在在,所述识别每个类簇的中心用户,包括:
根据所述类簇中每个用户的用户画像,确定所述类簇的中心点;
选取与所述中心点相似度最大的所述用户作为所述中心用户。
3.根据权利要求2所述的方法,其特征在于,所述根据所述类簇中每个用户的用户画像,确定所述类簇的中心点,包括:
将所述类簇中每个用户画像中相同标签的第一数据相加求平均,得到每个标签的平均值;
根据每个标签的平均值,形成所述类簇的中心点。
4.根据权利要求3所述的方法,其特征在于,所述选取与所述中心点相似度最大的所述用户作为所述中心用户,包括:
针对所述类簇中的每个用户,根据所述用户的所述用户画像和所述中心点,计算所述用户与所述中心点的相似度;
对每个用户的所述相似度排序,从中确定所述相似度最大的所述用户作为所述中心用户。
5.根据权利要求1所述的方法,其特征在于,所述根据所述用户画像之间的相似度,对所述目标区域内的用户进行聚类,得到所述目标区域的所有类簇,包括:
从所有的用户中随机选取预设个数的第一用户;其中,所述预设个数为试图聚类出的类簇的个数;
分别将所述第一用户设定为一个类簇的中心点;
将剩余的用户根据所述用户画像,分别聚类到与所述用户画像相似度最接近的所述类簇中;
基于获取到所述类簇中的每个用户的所述用户画像对所述中心点进行更新;
基于更新后的所述中心点对所述剩余的用户重新进行聚类,直到更新出的所述类簇中包括的所述用户与前一次聚类后所述类簇包括的所述用户相同则停止重新聚类,得到所述目标区域的所有类簇。
6.根据权利要求5所述的方法,其特征在于,所述将剩余的用户根据所述用户画像,分别聚类到与所述用户画像相似度最接近的所述类簇中,包括:
针对剩余的每个用户,根据所述用户的用户画像和所述类簇的中心点,获取所述用户与每个类簇的所述中心点之间的相似度;
将所述用户聚类到与所述中心点的相似度最高的所述类簇中。
7.根据权利要求6所述的方法,其特征在于,所述根据所述用户的用户画像和所述类簇的中心点,获取所述用户与每个类簇的所述中心点的相似度,包括:
获取所述用户的所述用户画像中每个标签与所述中心点中对应的所述标签之间的相似度;
根据所述标签的相似度和所述标签对应的权重,对所有标签的所述相似度进行加权,得到所述用户与所述中心点之间的所述相似度。
8.根据权利要求5-7任一项所述的方法,其特征在于,所述相似度为欧式距离相似度、曼哈顿距离相似度或者余弦相似度。
9.根据权利要求1所述的方法,其特征在于,所述获取目标区域的每个用户的用户画像,包括:
针对所述目标区域内的每个用户,根据所述用户的身份信息,从数据库中采集所述用户的每个标签的标签数据;
利用所述标签数据生成所述用户画像。
10.根据权利要求1-7任一项所述的方法,其特征在于,所述将所述中心用户的用户画像作为所述类簇的群体用户画像之后,包括:
获取每个类簇中所述用户的个数;
根据所述用户的个数为所述目标区域内的所有类簇进行排序;
按照所述类簇的顺序和所述类簇的群体用户画像,为所述目标区域生成配货信息;
根据所述配货信息为所述目标区域进行配货。
11.一种群体的群体用户画像获取装置,其特征在于,包括:
获取模块,用于获取目标区域的每个用户的用户画像;其中,所述用户画像中包括所述用户的多个标签;
聚类模块,用于根据所述用户画像之间的相似度,对所述目标区域内的用户进行聚类,得到所述目标区域的所有类簇,其中,一个所述类簇用于表征一个偏好相似的群体;
识别模块,用于识别每个类簇的中心用户,将所述中心用户的用户画像作为所述类簇的群体用户画像。
12.一种计算机设备,其特征在于,包括处理器和存储器;
其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如权利要求1-10中任一所述的群体的群体用户画像获取方法。
13.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-10中任一所述的群体的群体用户画像获取方法。
14.一种计算机程序产品,其特征在于,当所述计算机程序产品中的指令由处理器执行时实现如权利要求1-10中任一所述的群体的群体用户画像获取方法。
CN201711450561.1A 2017-12-27 2017-12-27 群体的群体用户画像获取方法和装置 Pending CN108108451A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711450561.1A CN108108451A (zh) 2017-12-27 2017-12-27 群体的群体用户画像获取方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711450561.1A CN108108451A (zh) 2017-12-27 2017-12-27 群体的群体用户画像获取方法和装置

Publications (1)

Publication Number Publication Date
CN108108451A true CN108108451A (zh) 2018-06-01

Family

ID=62213560

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711450561.1A Pending CN108108451A (zh) 2017-12-27 2017-12-27 群体的群体用户画像获取方法和装置

Country Status (1)

Country Link
CN (1) CN108108451A (zh)

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109086787A (zh) * 2018-06-06 2018-12-25 平安科技(深圳)有限公司 用户画像获取方法、装置、计算机设备以及存储介质
CN109272009A (zh) * 2018-07-23 2019-01-25 武汉普利商用机器有限公司 一种基于大数据分析的人群画像提取方法及装置
CN109447674A (zh) * 2018-09-03 2019-03-08 中国平安人寿保险股份有限公司 电子装置、保险代理人目标服务区域确定方法及存储介质
CN109460440A (zh) * 2018-09-18 2019-03-12 平安科技(深圳)有限公司 一种基于权重值的画像处理方法、装置及设备
CN109509016A (zh) * 2018-09-25 2019-03-22 中国平安人寿保险股份有限公司 销售处理方法、装置及计算机可读存储介质
CN109753993A (zh) * 2018-12-11 2019-05-14 东软集团股份有限公司 用户画像方法、装置、计算机可读存储介质及电子设备
CN109753994A (zh) * 2018-12-11 2019-05-14 东软集团股份有限公司 用户画像方法、装置、计算机可读存储介质及电子设备
CN109766913A (zh) * 2018-12-11 2019-05-17 东软集团股份有限公司 用户分群方法、装置、计算机可读存储介质及电子设备
CN109816043A (zh) * 2019-02-02 2019-05-28 拉扎斯网络科技(上海)有限公司 用户识别模型的确定方法、装置、电子设备及存储介质
CN109903086A (zh) * 2019-02-14 2019-06-18 北京奇艺世纪科技有限公司 一种相似人群扩展方法、装置及电子设备
CN109977177A (zh) * 2019-03-27 2019-07-05 新奥数能科技有限公司 生成用户画像的方法及装置
CN110009438A (zh) * 2018-11-07 2019-07-12 爱保科技(横琴)有限公司 基于车主社群的信息处理方法及装置
CN110097287A (zh) * 2019-05-07 2019-08-06 宏图物流股份有限公司 一种物流司机的群体画像方法
CN110135893A (zh) * 2019-04-16 2019-08-16 深圳壹账通智能科技有限公司 ***的确定方法、装置、计算机设备及存储介质
CN110782289A (zh) * 2019-10-28 2020-02-11 方文珠 一种基于用户画像的业务推荐方法和***
CN110807152A (zh) * 2019-10-31 2020-02-18 武汉天喻教育科技有限公司 基于多业务的推荐引擎***的创建方法和存储介质
CN110858313A (zh) * 2018-08-24 2020-03-03 国信优易数据有限公司 一种人群分类方法以及人群分类***
CN110991392A (zh) * 2019-12-17 2020-04-10 Oppo广东移动通信有限公司 人群识别方法、装置、终端及存储介质
CN111046902A (zh) * 2019-10-30 2020-04-21 平安科技(深圳)有限公司 基于聚类算法的分类方法、装置、计算机设备及存储介质
CN111125506A (zh) * 2018-11-01 2020-05-08 百度在线网络技术(北京)有限公司 兴趣圈主题确定方法、装置、服务器和介质
CN111223235A (zh) * 2019-12-27 2020-06-02 合肥美的智能科技有限公司 无人柜机的商品投放方法、无人柜机及其控制装置
CN111683154A (zh) * 2020-06-17 2020-09-18 腾讯科技(深圳)有限公司 一种内容推送的方法、装置、介质及电子设备
CN112215658A (zh) * 2020-10-15 2021-01-12 平安国际智慧城市科技股份有限公司 基于大数据的选址方法、装置、计算机设备及存储介质
CN112905783A (zh) * 2021-02-19 2021-06-04 卓尔智联(武汉)研究院有限公司 一种群体用户画像获取方法、装置、电子设备及存储介质
CN112905872A (zh) * 2019-11-19 2021-06-04 百度在线网络技术(北京)有限公司 意图识别方法、装置、设备和可读存储介质
CN113298145A (zh) * 2021-05-24 2021-08-24 中国邮政储蓄银行股份有限公司 标签填充方法及装置
CN113366523A (zh) * 2019-06-20 2021-09-07 深圳市欢太科技有限公司 资源推送方法及相关产品
CN113792089A (zh) * 2021-09-16 2021-12-14 平安银行股份有限公司 基于人工智能的非法行为检测方法、装置、设备及介质
CN114662595A (zh) * 2022-03-25 2022-06-24 王登辉 大数据融合处理方法及***
CN116796076A (zh) * 2023-08-29 2023-09-22 中亿(深圳)信息科技有限公司 业务推荐方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5835087A (en) * 1994-11-29 1998-11-10 Herz; Frederick S. M. System for generation of object profiles for a system for customized electronic identification of desirable objects
CN104899229A (zh) * 2014-03-07 2015-09-09 上海市玻森数据科技有限公司 基于群体智能的行为聚类***
CN105373619A (zh) * 2015-12-03 2016-03-02 中国联合网络通信集团有限公司 一种基于用户大数据的用户群体分析方法和***
CN106355449A (zh) * 2016-08-31 2017-01-25 腾讯科技(深圳)有限公司 用户选取方法和装置
CN106709754A (zh) * 2016-11-25 2017-05-24 云南电网有限责任公司昆明供电局 一种用基于文本挖掘的电力用户分群方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5835087A (en) * 1994-11-29 1998-11-10 Herz; Frederick S. M. System for generation of object profiles for a system for customized electronic identification of desirable objects
CN104899229A (zh) * 2014-03-07 2015-09-09 上海市玻森数据科技有限公司 基于群体智能的行为聚类***
CN105373619A (zh) * 2015-12-03 2016-03-02 中国联合网络通信集团有限公司 一种基于用户大数据的用户群体分析方法和***
CN106355449A (zh) * 2016-08-31 2017-01-25 腾讯科技(深圳)有限公司 用户选取方法和装置
CN106709754A (zh) * 2016-11-25 2017-05-24 云南电网有限责任公司昆明供电局 一种用基于文本挖掘的电力用户分群方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
牛温佳等: "《用户网络行为画像》", 31 March 2016, 电子工业出版社 *

Cited By (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109086787A (zh) * 2018-06-06 2018-12-25 平安科技(深圳)有限公司 用户画像获取方法、装置、计算机设备以及存储介质
CN109272009A (zh) * 2018-07-23 2019-01-25 武汉普利商用机器有限公司 一种基于大数据分析的人群画像提取方法及装置
CN110858313B (zh) * 2018-08-24 2023-01-31 国信优易数据股份有限公司 一种人群分类方法以及人群分类***
CN110858313A (zh) * 2018-08-24 2020-03-03 国信优易数据有限公司 一种人群分类方法以及人群分类***
CN109447674A (zh) * 2018-09-03 2019-03-08 中国平安人寿保险股份有限公司 电子装置、保险代理人目标服务区域确定方法及存储介质
CN109460440B (zh) * 2018-09-18 2023-10-27 平安科技(深圳)有限公司 一种基于权重值的画像处理方法、装置及设备
CN109460440A (zh) * 2018-09-18 2019-03-12 平安科技(深圳)有限公司 一种基于权重值的画像处理方法、装置及设备
CN109509016A (zh) * 2018-09-25 2019-03-22 中国平安人寿保险股份有限公司 销售处理方法、装置及计算机可读存储介质
CN111125506A (zh) * 2018-11-01 2020-05-08 百度在线网络技术(北京)有限公司 兴趣圈主题确定方法、装置、服务器和介质
CN110009438A (zh) * 2018-11-07 2019-07-12 爱保科技(横琴)有限公司 基于车主社群的信息处理方法及装置
CN109753994A (zh) * 2018-12-11 2019-05-14 东软集团股份有限公司 用户画像方法、装置、计算机可读存储介质及电子设备
CN109766913A (zh) * 2018-12-11 2019-05-17 东软集团股份有限公司 用户分群方法、装置、计算机可读存储介质及电子设备
CN109753993A (zh) * 2018-12-11 2019-05-14 东软集团股份有限公司 用户画像方法、装置、计算机可读存储介质及电子设备
CN109753994B (zh) * 2018-12-11 2024-05-14 东软集团股份有限公司 用户画像方法、装置、计算机可读存储介质及电子设备
CN109816043A (zh) * 2019-02-02 2019-05-28 拉扎斯网络科技(上海)有限公司 用户识别模型的确定方法、装置、电子设备及存储介质
CN109816043B (zh) * 2019-02-02 2021-01-01 拉扎斯网络科技(上海)有限公司 用户识别模型的确定方法、装置、电子设备及存储介质
CN109903086A (zh) * 2019-02-14 2019-06-18 北京奇艺世纪科技有限公司 一种相似人群扩展方法、装置及电子设备
CN109903086B (zh) * 2019-02-14 2020-12-18 北京奇艺世纪科技有限公司 一种相似人群扩展方法、装置及电子设备
CN109977177A (zh) * 2019-03-27 2019-07-05 新奥数能科技有限公司 生成用户画像的方法及装置
CN110135893A (zh) * 2019-04-16 2019-08-16 深圳壹账通智能科技有限公司 ***的确定方法、装置、计算机设备及存储介质
CN110097287A (zh) * 2019-05-07 2019-08-06 宏图物流股份有限公司 一种物流司机的群体画像方法
CN110097287B (zh) * 2019-05-07 2021-06-22 宏图物流股份有限公司 一种物流司机的群体画像方法
CN113366523B (zh) * 2019-06-20 2024-05-07 深圳市欢太科技有限公司 资源推送方法及相关产品
CN113366523A (zh) * 2019-06-20 2021-09-07 深圳市欢太科技有限公司 资源推送方法及相关产品
CN110782289A (zh) * 2019-10-28 2020-02-11 方文珠 一种基于用户画像的业务推荐方法和***
CN111046902A (zh) * 2019-10-30 2020-04-21 平安科技(深圳)有限公司 基于聚类算法的分类方法、装置、计算机设备及存储介质
CN111046902B (zh) * 2019-10-30 2024-02-02 平安科技(深圳)有限公司 基于聚类算法的分类方法、装置、计算机设备及存储介质
CN110807152A (zh) * 2019-10-31 2020-02-18 武汉天喻教育科技有限公司 基于多业务的推荐引擎***的创建方法和存储介质
CN110807152B (zh) * 2019-10-31 2022-06-07 武汉天喻教育科技有限公司 基于多业务的推荐引擎***的创建方法和存储介质
CN112905872A (zh) * 2019-11-19 2021-06-04 百度在线网络技术(北京)有限公司 意图识别方法、装置、设备和可读存储介质
CN112905872B (zh) * 2019-11-19 2023-10-13 百度在线网络技术(北京)有限公司 意图识别方法、装置、设备和可读存储介质
CN110991392A (zh) * 2019-12-17 2020-04-10 Oppo广东移动通信有限公司 人群识别方法、装置、终端及存储介质
CN111223235A (zh) * 2019-12-27 2020-06-02 合肥美的智能科技有限公司 无人柜机的商品投放方法、无人柜机及其控制装置
CN111683154B (zh) * 2020-06-17 2023-11-14 腾讯科技(深圳)有限公司 一种内容推送的方法、装置、介质及电子设备
CN111683154A (zh) * 2020-06-17 2020-09-18 腾讯科技(深圳)有限公司 一种内容推送的方法、装置、介质及电子设备
CN112215658A (zh) * 2020-10-15 2021-01-12 平安国际智慧城市科技股份有限公司 基于大数据的选址方法、装置、计算机设备及存储介质
CN112905783A (zh) * 2021-02-19 2021-06-04 卓尔智联(武汉)研究院有限公司 一种群体用户画像获取方法、装置、电子设备及存储介质
CN113298145A (zh) * 2021-05-24 2021-08-24 中国邮政储蓄银行股份有限公司 标签填充方法及装置
CN113792089A (zh) * 2021-09-16 2021-12-14 平安银行股份有限公司 基于人工智能的非法行为检测方法、装置、设备及介质
CN113792089B (zh) * 2021-09-16 2024-03-22 平安银行股份有限公司 基于人工智能的非法行为检测方法、装置、设备及介质
CN114662595A (zh) * 2022-03-25 2022-06-24 王登辉 大数据融合处理方法及***
CN116796076A (zh) * 2023-08-29 2023-09-22 中亿(深圳)信息科技有限公司 业务推荐方法、装置、设备及存储介质
CN116796076B (zh) * 2023-08-29 2023-11-03 中亿(深圳)信息科技有限公司 业务推荐方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN108108451A (zh) 群体的群体用户画像获取方法和装置
Zhou et al. Non-local or local brands? A multi-level investigation into confidence in brand origin identification and its strategic implications
US11468471B2 (en) Audience expansion according to user behaviors
Sánchez High training set size reduction by space partitioning and prototype abstraction
US8688603B1 (en) System and method for identifying and correcting marginal false positives in machine learning models
CN106055710A (zh) 基于视频的商品推荐方法及装置
JP6261547B2 (ja) 判定装置、判定方法及び判定プログラム
EP2543014A1 (en) Computer-implemented method for enhancing product sales
CN111429163A (zh) 户外广告投放资源的推荐方法、装置及计算机设备
CN110246007A (zh) 一种商品推荐方法及装置
CN108491540A (zh) 文本信息推送方法、装置及智能终端
CN110163714A (zh) 一种基于相似度算法挖掘隐藏风险商户的方法和装置
US10909604B1 (en) Artificial intelligence system for automated selection and presentation of informational content
CN108090211A (zh) 热点新闻推送方法和装置
CN109903086A (zh) 一种相似人群扩展方法、装置及电子设备
CN108647273A (zh) 交友推荐方法及装置
Vincent et al. A self-adaptive k-means classifier for business incentive in a fashion design environment
US20190005540A1 (en) Purchase analytics derived from a consumer decision journey model
CN110070140A (zh) 基于多类别信息的用户相似性确定方法及装置
Flexer et al. Mutual proximity graphs for improved reachability in music recommendation
JP2017201535A (ja) 判定装置、学習装置、判定方法及び判定プログラム
CN108363086A (zh) 室内导航方法、装置、服务器及存储介质
CN114969566A (zh) 一种距离度量的政务服务事项协同过滤推荐方法
US11823217B2 (en) Advanced segmentation with superior conversion potential
Verma et al. Cluster analysis: For segmenting the population

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180601

RJ01 Rejection of invention patent application after publication