CN109241202A - 一种基于聚类的陌生人社交用户匹配方法和*** - Google Patents
一种基于聚类的陌生人社交用户匹配方法和*** Download PDFInfo
- Publication number
- CN109241202A CN109241202A CN201811056510.5A CN201811056510A CN109241202A CN 109241202 A CN109241202 A CN 109241202A CN 201811056510 A CN201811056510 A CN 201811056510A CN 109241202 A CN109241202 A CN 109241202A
- Authority
- CN
- China
- Prior art keywords
- user
- cluster
- historical
- movable
- activity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 239000013598 vector Substances 0.000 claims description 54
- 230000008569 process Effects 0.000 claims description 8
- 210000003813 thumb Anatomy 0.000 claims description 6
- 239000003550 marker Substances 0.000 claims description 5
- 230000003993 interaction Effects 0.000 claims description 3
- 230000009471 action Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000003997 social interaction Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例提供一种基于聚类的陌生人社交用户匹配方法,包括:基于历史用户的特征数据对历史用户进行聚类,将历史用户划分为多个用户簇;基于历史活动的特征数据对历史活动进行聚类,将历史活动划分为多个活动簇;将所述用户簇和所述活动簇进行匹配,确定所述用户簇和所述活动簇的对应关系;分别对当前用户和当前活动进行划分,确定所述当前用户和所述当前活动分别所属的用户簇和活动簇;基于所述对应关系,将与所述当前用户所属的用户簇对应的活动簇中的当前活动推送给所述当前用户。本申请实施例的基于聚类的陌生人社交用户匹配方法,能够自动为用户推送符合用户兴趣爱好的活动,节省了时间,提高了用户体验,有利于陌生人之间的社交的进行。
Description
技术领域
本申请涉及互联网应用技术领域,尤其涉及一种基于聚类的陌生人社交用户匹配方法和***。
背景技术
社交是指社会上人与人的交际往来,是人们运用一定的方式(工具)传递信息、交流思想的意识,以达到某种目的的社会各项活动。当今时代,经济和社会环境的变化使得人与人之间的交往显得更加重要。因为我们只有不断地与各类人员进行交往和信息沟通,才能不断地丰富自己、发展自己、扩充自己。
随着科学技术的发展和互联网资源在生活中的应用,人与人之间的交往开始借助互联网来实现,陌生人之间也可以通过互联网进行社交,实现进一步发展自己和扩充自己的目的。例如,现有技术中已经出现了一些主打陌生人社交服务的互联网平台和服务,例如搜索附近的人进行线上对话、传送网络漂流瓶等。
现有技术中最新出现的一种陌生人社交平台是由活动组织者在该平台上发布一个在预定时间和地点举办的社交活动(例如聚餐、郊游、做游戏等),并设定参与该社交活动需要符合的条件(例如性别、年龄等);其他用户可以在该平台上搜索自己感兴趣且自身符合条件的社交活动并进行线上报名,进而作为活动参与者按时赴预定地点参与该社交活动。
但是,由于整个平台上所发布的社交活动以及面向的用户群体都是海量级的,现有技术中,陌生人之间在实现社交的过程中,用户在智能终端的APP中查找符合个人的兴趣爱好的活动时,通常需要花费大量的时间,造成了时间浪费,而且现有技术中只支持用户利用简单的关键词进行搜索以及利用关于活动时间、地点范围、活动类型等程式化的限定条件进行筛选,这些手段无法使用户搜索与自身兴趣爱好、时间安排等最为适配的社交活动,影响了用户的体验,同时也使得某项社交活动不容易聚拢最为适宜的参与者,不利于陌生人之间的社交的正常进行。
发明内容
有鉴于此,本申请的目的在于提出一种基于区块链的加密数据共享方法及***,来解决现有技术中用户的账户隐私完全暴露在区块链的所有节点上的技术问题。
基于上述目的,在本申请的第一个方面,提出了一种基于聚类的陌生人社交用户匹配方法,包括:
基于历史用户的特征数据对历史用户进行聚类,将历史用户划分为多个用户簇;
基于历史活动的特征数据对历史活动进行聚类,将历史活动划分为多个活动簇;
将所述用户簇和所述活动簇进行匹配,确定所述用户簇和所述活动簇的对应关系;
分别对当前用户和当前活动进行划分,确定所述当前用户和所述当前活动分别所属的用户簇和活动簇;
基于所述用户簇和所述活动簇的对应关系,将与所述当前用户所属的用户簇对应的活动簇中的当前活动推送给所述当前用户。
在一些实施例中,所述基于历史用户的特征数据对历史用户进行聚类,将历史用户划分为多个用户簇,包括:
根据历史用户的特征数据生成n个k维的特征向量作为样本点 ,其中n为历史用户的总量,k为历史用户的特征向量的维度数;
给定s个中心点,分别计算每个样本点到s个中心点之间的距离,其中s小于或等于n;
将每个样本点标记为与其距离最近的中心点相对应的类别;
更新每个类别中的中心点为隶属该类别的所有样本点的均值;
重复上述标记样本点类别和更新中心点的过程,直到所有样本点到其隶属的中心点之间的距离和最小,生成多个用户簇。
在一些实施例中,所述历史用户的特征数据,包括:
用户的个人信息、用户的个人标签类别和用户的活动历史信息。
在一些实施例中,所述用户的活动历史信息,包括:
用户参与、点赞和关注活动的交互次数,以及用户参与的活动、用户点赞的活动和用户关注的活动的属性信息。
在一些实施例中,所述基于历史活动的特征数据对历史活动进行聚类,将历史活动划分为多个活动簇,包括:
根据历史活动的特征数据生成m个g维的特征向量作为样本点,其中m为历史活动的总量,g为历史活动的特征数据的维度数;
给定q个中心点,分别计算每个样本点到q个中心点之间的距离,其中q小于或等于m;
将每个样本点标记为与其距离最近的中心点相对应的类别;
更新每个类别中的中心点为隶属该类别的所有样本点的均值;
重复上述标记样本点类别和更新中心点的过程,直到所有样本点到其隶属的中心点之间的距离和最小,生成多个活动簇。
在一些实施例中,所述历史活动的特征数据,包括:
活动时间、活动地点、活动人员属性和活动类别。
在一些实施例中,还包括:
对所述历史用户的特征数据和所述历史活动的特征数据进行量化评分,将所述历史用户的特征数据和所述历史活动的特征数据转化为特征值的数值。
在一些实施例中,还包括:
利用权重向量(α1,α2,α3,……,αk)对历史用户的特征向量和/或历史活动的特征向量(x1,x2,x3,……,xk)进行修正,其中α1+α2+α3+……+αk=1,α1,α2,α3,……,αk的值可以根据用户与社交活动匹配的偏重因素而设定。
在一些实施例中,所述将所述用户簇和所述活动簇进行匹配,确定所述用户簇和所述活动簇的对应关系,具体包括:
将所述用户簇中的用户参与活动簇中的活动的占比最高的活动簇作为所述用户簇的匹配活动簇,确定所述用户簇和所述活动簇的对应关系。
基于上述目的,在本申请的另一个方面,还提出了一种基于聚类的陌生人社交用户匹配***,包括:
用户簇划分模块,用于基于历史用户的特征数据对历史用户进行聚类,将历史用户划分为多个用户簇;
活动簇划分模块,用于基于历史活动的特征数据对历史活动进行聚类,将历史活动划分为多个活动簇;
匹配模块,用于将所述用户簇和所述活动簇进行匹配,确定所述用户簇和所述活动簇的对应关系;
当前用户和活动划分模块,用于分别对当前用户和当前活动进行划分,确定所述当前用户和所述当前活动分别所属的用户簇和活动簇;
推送模块,用于基于所述对应关系,将与所述当前用户所属的用户簇对应的活动簇中的当前活动推送给所述当前用户。
本申请实施例提供一种基于聚类的陌生人社交用户匹配方法和***,能够自动为用户推送符合用户兴趣爱好的活动,节省了用户搜寻适合自己的社交活动的时间,增大了社交活动的满意度,提高了用户体验,有利于陌生人之间的社交的正常进行。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请实施例一的基于聚类的陌生人社交用户匹配方法的流程图;
图2是本申请实施例二的基于聚类的陌生人社交用户匹配方法的流程图;
图3是本申请实施例三的基于聚类的陌生人社交用户匹配***的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
作为本申请的一个实施例,如图1所示,图1是本申请实施例一的基于聚类的陌生人社交用户匹配方法的流程图。本发明全面采集用户各个方面表现出来的个人属性,整合为用户对应的特征向量;并且,根据社交活动本身及其关联的各方面因素,形成反映社交活动属性的特征向量;进而利用聚类结合历史数据匹配的方式,确定与用户个人属性契合的社交活动并进行推送。
从图1中可以看出,本实施的基于聚类的陌生人社交用户匹配方法,可以包括以下步骤:
S101:基于历史用户的特征数据对历史用户进行聚类,将历史用户划分为多个用户簇。
本申请实施例的基于聚类的陌生人社交用户匹配方法,用户可以利用智能手机等智能终端中安装的社交APP(应用软件),通过注册APP账户来实现陌生人社交。具体地,用户APP可以发起社交活动,并将活动信息在社交APP平台上予以发布,使其他用户能够获取所述活动信息,进而选择报名参与所述活动,来实现陌生人之间的社交。当然用户也可以报名参加由其他用户发起的社交活动。
利用现有技术中的大数据技术,可以为社交APP平台的每个注册用户建立一个用户画像,在用户画像当中保存每个用户的个人属性,其中包括用户注册时填写的性别、年龄等个人信息,以及用户标签。所述用户标签可以是用户为自己添加的,也可能是用户的社交好友为该用户添加的,用户标签反映用户兴趣及个性,例如一个用户可以关联到“体育”、“美食”、“艺术”等多个兴趣标签,和/或关联到“音乐发烧友”、“吃货”、“足球小将”等个性标签。并且,本发明将在注册用户当中曾经组织或者报名参与过社交APP平台的社交活动的用户称之为历史用户,对于历史用户在其用户画像当中还会留下其组织和参与过的历史社交活动的活动历史记录。进而,对于活动历史记录,还可以记录下用户虽然未参与、但是有过与该活动相关的互动行为—例如为活动点赞、对活动加为关注—的历史社交活动。
步骤S101中,对参与历史活动的历史用户进行聚类,将历史用户划分为多个用户簇。具体地,每个用户都可以对应一个多维度的特征向量,每个特征向量维度对应的用户特征数据可以包括:(1)用户画像中的个人信息—例如性别、年龄—转化的特征值。以0-100分作为特征值的取值区间,可以规定男性用户的性别特征值为100,而女性用户的性别特征值取值为0。还可以根据用户年龄在0-100岁区间的分布,将用户年龄转化为对应的特征值(大于等于100岁的用户的年龄特征值均为100)。(2)用户画像中的兴趣标签转化的对应类别—例如体育、美食、艺术等类别—的特征值。并且,可以利用预设的个性标签词库对个性标签对应的类别进行识别,将用户个性标签当中可识别的个性标签按照预设的规则转化为所对应类别的特征值,例如将“音乐发烧友”转化为与“艺术”类别所对应的特征值,将“吃货”转化为与“美食”类别对应的特征值,将“足球小将”转化为与“体育”对应的特征值。以0-100分作为特征值的取值区间,如果用户的兴趣标签或者个性标签对应某个类别,则将该类别的特征值加20分;例如某用户的兴趣标签为“体育”,个性标签为“吃货”,则该用户与“体育”、“美食”两个类别对应的特征值分别加上20分。(3)根据用户的活动历史记录中记录的历史社交活动,转化为对应的特征值。如前文所述,历史社交活动包括用户发起或者参与的活动、用户点赞的活动和用户关注的活动。首先,可以根据历史社交活动的类别以及用户参与和点赞、关注等交互的次数,转化为对应类别的特征值,例如根据用户参与和点赞、关注的聚餐类型的历史社交活动的次数,转化为“美食”类别对应的特征值;根据用户参与和点赞、关注的足球比赛、跑步等历史社交活动的次数,转化为“体育”类别对应的特征值;根据用户参与和点赞、关注的看电影、听音乐会等历史社交活动的次数,转化为“艺术”对应的特征值。假设某用户参与和点赞、关注体育类别历史社交活动的次数大于等于10次,则为该用户“体育”类别的特征值加20分。同时,还可以统计用户参与的历史社交活动的时间、地点、同伴性别等属性情况,例如统计这些历史社交活动的举办时间段以及活动同伴的性别情况(例如同性同伴占比),分别转化为与每种活动属性对应的特征值。例如,根据某用户参与的历史社交活动举办时间分布于上午、下午还是晚上,将对应的特征值分别设为0、50和100,假设该用户参与的历史社交活动大部分分布于晚上,则该项特征值为100;如果大部分分布于下午,则得分为50。根据统计某用户参与的历史社交活动的同性同伴比例在0%-100%之间的分布,将该比例转化为同性同伴占比的特征值。
基于上述特征数据,可以将每个历史用户与一个多维特征向量对应。举例来说,将每个历史用户与一个七维特征向量对应,七维特征向量包括“用户年龄”、“用户性别”、“体育”、“美食”、“艺术”、“历史活动时间”、“历史活动性别情况”等七个特征数据维度,每个特征向量维度可以对应有一个具体数值作为特征值,例如用户A的对应的特征向量可以为(x1,x2,x3,x4,x5,x6,x7),本实施例中的每个维度上量化值的取值范围可以为0~100。通过对全部历史用户对应的特征向量的大数据进行聚类,可以将历史用户划分为多个用户簇,使得同一用户簇中的用户对应的特征向量之间的距离最小,即同一用户簇中的用户的兴趣爱好比较类似。关于具体的聚类算法参见后续的实施例二,这里不再赘述。
S102:基于历史活动的特征数据对历史活动进行聚类,将历史活动划分为多个活动簇。在本实施例中,同样可以利用大数据对历史活动进行聚类,将历史活动划分为多个活动簇。具体地,每个历史活动都可以对应一个多维度的特征向量,活动的特征向量维度可以包括活动时间维度,以及一个或者多个表示活动人员属性的特征向量维度(包括活动发起者和活动参与者的人数、年龄属性、性别情况属性),以及与各个活动类别相应的特征向量维度(例如与体育、美食、艺术等类别对应的特征向量维度)。
举例来说,基于上述活动特征数据,可以将每个历史活动与一个八维特征向量对应,八维特征向量包括“活动时间”、“活动地点”、“活动人数”、“活动人员平均年龄”、“活动人员性别比例”、“体育”、“美食”、“艺术”等八个维度,每个特征向量维度可以对应有一个具体的特征值,例如活动B的对应的特征向量可以为(y1,y2,y3,y4,y5,y6,y7,y8),通过对历史活动对应的特征向量进行聚类,可以将历史活动划分为多个活动簇,使得同一活动簇中的活动对应的特征向量之间的距离最小,关于具体的聚类算法参见后续的实施例二,这里不再赘述。
S103:将所述用户簇和所述活动簇进行匹配,确定所述用户簇和所述活动簇的对应关系。
在本实施例中,当将历史用户和历史活动分别划分为多个用户簇和活动簇后,可以将所述用户簇和所述活动簇进行匹配,确定所述用户簇和所述活动簇的对应关系。
S104:分别对当前用户和当前活动进行划分,确定所述当前用户和所述当前活动分别所属的用户簇和活动簇。
当有用户需要获取活动信息时(该用户即为当前用户),获取当前的活动信息,本实施例中的当前活动信息是指正在处于招募阶段的活动,即将要进行的活动,将所述当前用户和所述当前活动分别与将上述步骤生成的用户簇和活动簇进行匹配,确定所述当前用户所属的用户簇,并确定当前活动所属的活动簇。
在本实施例中,可以计算所述当前用户对应的特征向量与各用户簇的聚类中心的距离,并将所述当前用户划分为与聚类中心距离最小的用户簇,同理,可以计算当前活动的特征向量与各活动簇的聚类中心的距离,并将所述当前活动划分为与聚类中心距离最小的活动簇。
S105:基于所述用户簇和所述活动簇的对应关系,将与所述当前用户所属的用户簇对应的活动簇中的当前活动推送给所述当前用户。
在对所述当前用户和当前活动进行划分后,可以根据步骤S103中所述用户簇和所述活动簇对应关系,将与当前用户所属的用户簇对应的活动簇中的当前活动推送给当前用户,推送方式包括由APP社交平台主动或者应当前用户请求而向当前用户发送关于当前活动的介绍信息和报名链接。当然,如果当前用户所属的用户簇对应的活动簇中的当前活动数量过多,可以再根据附件的筛选条件,例如时间、与用户的距离等,筛选适当数量的活动向当前用户进行推送。
本申请实施例的基于聚类的陌生人社交用户匹配方法,能够基于对用户和社交活动的历史数据的聚类分析,自动为用户推送符合用户兴趣爱好等多方面特征属性的社交活动,节省了用户搜寻适合自己的社交活动的时间,增大了社交活动的满意度,提高了用户体验,有利于陌生人之间的社交的正常进行。
如图2所示,是本申请实施例二的基于聚类的陌生人社交用户匹配方法的流程图。本实施例的方法同样包括S101-S105的各项步骤,在此不再赘述。图2示出了基于聚类的陌生人社交用户匹配方法过程中在步骤S101中的对历史用户进行聚类的流程,具体包括以下步骤:
S201:根据历史用户的特征数据生成n个k维的特征向量作为样本点,其中n为历史用户的总量,k为历史用户的特征向量的维度数。
由实施例一可知,每个历史用户都可以对应一个特征向量,例如实施例一中的七维特征向量,将每个历史用户对应的特征向量作为样本点。当基于大数据技术获取的历史用户的总量为n时,则样本点的容量为n,k为历史用户的特征数据的维度的总量,即为特征向量的维度。
例如,本实施例中用户A的特征向量的7个维度分别为(“用户年龄”、“用户性别”、“体育”、“美食”、“艺术”、“历史活动时间”、“历史活动性别情况”),其对应的特征数据的量化值分别为(20,100,60,40,75,50,50),本实施例中的量化值的取值范围可以为0~100。
S202:给定s个中心点,分别计算每个样本点到s个中心点之间的距离,其中s小于或等于n。
本实施例可以采用K-Means算法进行聚类,开始聚类时,需要给定中心点,中心点的数量与划分的用户簇的数量相同,本实施例以中心点为s为例对本申请的技术方案进行说明。中心点的维度与样本点的维度相同,并且初始中心点每个维度的取值可以任意给定,例如(50,50,50,50,50,50,50)等,这里不再一一列举。在给定中心点后,可以计算每个样本点到中心点之间的距离,仍以上述实例为例,则样本点(20,100,60,40,75,50,50)到中心点(50,0,50,50,50,0,50)之间的距离为d=((20-50)2+(100-0)2+(60-50)2+(40-50)2+(75-50)2+(50-0)2+(50-50)2)½。
S203:将每个样本点标记为与其距离最近的中心点相对应的类别。
在计算每个样本点到中心点的距离后,将每个样本点标记为与其距离最近的中心点相对应的类别。
S204:更新每个类别中的中心点为隶属该类别的所有样本的均值。
在对所有样本点进行一次归类后,将每个类别中的中心点各个维度的特征值更新为隶属于该类别的所有样本点的特征向量在各维度上特征值的均值。
S205:判断所有样本点到其隶属的中心点之间的距离和是否最小。
S206:当所有样本点到其隶属的中心点之间的距离和最小时,生成多个用户簇,即将此时的分类结果作为最终分类结果,每个分类结果作为一个用户簇。
若所有样本点到其隶属的中心点之间的距离和不为最小时,则重复上述步骤S203至步骤S205,直到所有样本点到其隶属的中心点之间的距离和最小。
本申请实施例的基于聚类的陌生人社交用户匹配方法,能够取得与上述实施例相类似的技术效果,这里不再赘述。
本申请实施例三给出了一种基于聚类的陌生人社交用户匹配方法的流程图。本实施例的方法同样包括S101-S105的各项步骤,在此不再赘述。在该基于聚类的陌生人社交用户匹配方法过程中,在步骤S102中基于历史活动的特征数据对历史活动进行聚类,将历史活动划分为多个活动簇,包括:
根据历史活动的特征数据生成m个g维的特征向量作为样本点,其中m为历史活动的总量,g为历史活动的特征向量的维度数;例如实施例一中为每个历史活动建立了八维特征向量。
给定q个中心点,分别计算每个样本点到q个中心点之间的距离,其中q小于或等于m;q与预计将历史活动划分的活动簇的数量一致。
将每个样本点标记为与其距离最近的中心点相对应的类别;
更新每个类别中的中心点的特征向量每个维度的特征值为隶属该类别的所有样本点的特征向量在该维度的特征值的均值;
重复上述标记样本点对应类别和更新中心点的过程,直到所有样本点到其隶属的中心点之间的距离和最小,生成多个活动簇。
本申请实施例的基于聚类的陌生人社交用户匹配方法,能够取得与上述实施例相类似的技术效果,这里不再赘述。
作为上述实施例1-3的另一种可选的实施方案,还包括:
对于历史用户的特征向量和/或历史活动的特征向量,利用权重向量(α1,α2,α3,……,αk)对所述特征向量(x1,x2,x3,……,xk)进行修正,其中α1+α2+α3+……+αk=1,修正后的特征向量为(α1x1,α2x2,α3x3,……,αkxk),用于后续的聚类分析。权重向量α1,α2,α3,……,αk的取值可以根据具体的用户具体设定,也可以由经验值确定,可以根据为用户匹配社交活动时对各方面属性因素的侧重来调节权重向量中α1,α2,α3,……,αk的取值;例如,如果偏重于根据兴趣一致的原则来匹配用户与社交活动,则可以为代表兴趣的“体育”、“美食”、“艺术”等维度设置相比其它维度更高的权重值;如果偏重于根据伙伴年龄与性别需求来匹配用户与社交活动,则可为代表年龄与性别比例的维度分配更高的权重值。
在上述实施例1-3中,所述步骤S103中将用户簇和所述活动簇进行匹配,确定所述用户簇和所述活动簇的对应关系,具体包括:
将所述用户簇中的用户参与活动簇中的活动的占比最高的活动簇作为所述用户簇的匹配活动簇,确定所述用户簇和所述活动簇的对应关系。例如,用户簇中的用户参与过的活动簇C中的活动占活动簇C中所有活动的比例为65%,用户簇中的用户参与过的活动簇D中的活动占活动簇D中所有活动的比例为70%,则与该用户簇匹配的活动簇为活动簇D。
如图3所示,是本申请实施例四的基于聚类的陌生人社交用户匹配***的结构示意图。本实施例的基于聚类的陌生人社交用户匹配***,包括:
用户簇划分模块301,用于基于历史用户的特征数据对历史用户进行聚类,将历史用户划分为多个用户簇;
活动簇划分模块302,用于基于历史活动的特征数据对历史活动进行聚类,将历史活动划分为多个活动簇;
匹配模块303,用于将所述用户簇和所述活动簇进行匹配,确定所述用户簇和所述活动簇的对应关系;
当前用户和活动划分模块304,用于分别对当前用户和当前活动进行划分,确定所述当前用户和所述当前活动分别所属的用户簇和活动簇;
推送模块305,用于基于所述对应关系,将与所述当前用户所属的用户簇对应的活动簇中的当前活动推送给所述当前用户。
可见,本申请实施例的基于聚类的陌生人社交用户匹配方法,能够基于对用户和社交活动的历史数据的聚类分析,自动为用户推送符合用户兴趣爱好等多方面特征属性的社交活动,节省了用户搜寻适合自己的社交活动的时间,增大了社交活动的满意度,提高了用户体验,有利于陌生人之间的社交的正常进行。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (10)
1.一种基于聚类的陌生人社交用户匹配方法,其特征在于,包括:
基于历史用户的特征数据对历史用户进行聚类,将历史用户划分为多个用户簇;
基于历史活动的特征数据对历史活动进行聚类,将历史活动划分为多个活动簇;
将所述用户簇和所述活动簇进行匹配,确定所述用户簇和所述活动簇的对应关系;
分别对当前用户和当前活动进行划分,确定所述当前用户和所述当前活动分别所属的用户簇和活动簇;
基于所述用户簇和所述活动簇的对应关系,将与所述当前用户所属的用户簇对应的活动簇中的当前活动推送给所述当前用户。
2.根据权利要求1所述的方法,其特征在于,所述基于历史用户的特征数据对历史用户进行聚类,将历史用户划分为多个用户簇,包括:
根据历史用户的特征数据生成n个k维的特征向量作为样本点,其中n为历史用户的总量,k为历史用户的特征向量的维度数;
给定s个中心点,分别计算每个样本点到s个中心点之间的距离,其中s小于或等于n;
将每个样本点标记为与其距离最近的中心点相对应的类别;
更新每个类别中的中心点为隶属该类别的所有样本点的均值;
重复上述标记样本点类别和更新中心点的过程,直到所有样本点到其隶属的中心点之间的距离和最小,生成多个用户簇。
3.根据权利要求2所述的方法,其特征在于,所述历史用户的特征数据,包括:
用户的个人信息、用户的个人标签类别和用户的活动历史信息。
4.根据权利要求3所述的方法,其特征在于,所述用户的活动历史信息,包括:
用户参与、点赞和关注活动的交互次数,以及用户参与的活动、用户点赞的活动和用户关注的活动的属性信息。
5.根据权利要求4所述的方法,其特征在于,所述基于历史活动的特征数据对历史活动进行聚类,将历史活动划分为多个活动簇,包括:
根据历史活动的特征数据生成m个g维的特征向量作为样本点,其中m为历史活动的总量,g为历史活动的特征数据的维度数;
给定q个中心点,分别计算每个样本点到q个中心点之间的距离,其中q小于或等于m;
将每个样本点标记为与其距离最近的中心点相对应的类别;
更新每个类别中的中心点为隶属该类别的所有样本的均值;
重复上述标记样本点类别和更新中心点的过程,直到所有样本点到其隶属的中心点之间的距离和最小,生成多个活动簇。
6.根据权利要求5所述的方法,其特征在于,所述历史活动的特征数据,包括:
活动时间、活动地点、活动人员属性和活动类别。
7.根据权利要求6所述的方法,其特征在于,还包括:
对所述历史用户的特征数据和所述历史活动的特征数据进行量化评分,将所述历史用户的特征数据和所述历史活动的特征数据转化为特征值的数值。
8.根据权利要求2所述的方法,其特征在于,还包括:
利用权重向量(α1,α2,α3,……,αk)对历史用户的特征向量和/或历史活动的特征向量(x1,x2,x3,……,xk)进行修正,其中α1+α2+α3+……+αk=1,α1,α2,α3,……,αk的值可以根据用户与社交活动匹配的偏重因素而设定。
9.根据权利要求1所述的方法,其特征在于,所述将所述用户簇和所述活动簇进行匹配,确定所述用户簇和所述活动簇的对应关系,具体包括:
将所述用户簇中的用户参与活动簇中的活动的占比最高的活动簇作为所述用户簇的匹配活动簇,确定所述用户簇和所述活动簇的对应关系。
10.一种基于聚类的陌生人社交用户匹配***,其特征在于,包括:
用户簇划分模块,用于基于历史用户的特征数据对历史用户进行聚类,将历史用户划分为多个用户簇;
活动簇划分模块,用于基于历史活动的特征数据对历史活动进行聚类,将历史活动划分为多个活动簇;
匹配模块,用于将所述用户簇和所述活动簇进行匹配,确定所述用户簇和所述活动簇的对应关系;
当前用户和活动划分模块,用于分别对当前用户和当前活动进行划分,确定所述当前用户和所述当前活动分别所属的用户簇和活动簇;
推送模块,用于基于所述对应关系,将与所述当前用户所属的用户簇对应的活动簇中的当前活动推送给所述当前用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811056510.5A CN109241202B (zh) | 2018-09-11 | 2018-09-11 | 一种基于聚类的陌生人社交用户匹配方法和*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811056510.5A CN109241202B (zh) | 2018-09-11 | 2018-09-11 | 一种基于聚类的陌生人社交用户匹配方法和*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109241202A true CN109241202A (zh) | 2019-01-18 |
CN109241202B CN109241202B (zh) | 2020-10-16 |
Family
ID=65060800
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811056510.5A Active CN109241202B (zh) | 2018-09-11 | 2018-09-11 | 一种基于聚类的陌生人社交用户匹配方法和*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109241202B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110472998A (zh) * | 2019-07-16 | 2019-11-19 | 第四范式(北京)技术有限公司 | 一种构建用户画像信息的方法、装置及电子设备 |
CN112085114A (zh) * | 2020-09-14 | 2020-12-15 | 杭州中奥科技有限公司 | 线上线下身份匹配方法、装置、设备及存储介质 |
CN112967781A (zh) * | 2021-02-01 | 2021-06-15 | 苏州工业职业技术学院 | 一种基于nfc的运动社交***及方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101082972A (zh) * | 2007-05-30 | 2007-12-05 | 华为技术有限公司 | 预测用户对商品的兴趣的方法、装置和广告发布方法 |
CN102750647A (zh) * | 2012-06-29 | 2012-10-24 | 南京大学 | 一种基于交易网络的商家推荐方法 |
CN106162348A (zh) * | 2015-04-13 | 2016-11-23 | 海信集团有限公司 | 一种个性化节目推荐方法及装置 |
CN107506480A (zh) * | 2017-09-13 | 2017-12-22 | 浙江工业大学 | 一种基于评论挖掘与密度聚类的双层图结构推荐方法 |
CN107885778A (zh) * | 2017-10-12 | 2018-04-06 | 浙江工业大学 | 一种基于动态临近点谱聚类的个性化推荐方法 |
CN108052639A (zh) * | 2017-12-21 | 2018-05-18 | 中国联合网络通信集团有限公司 | 基于运营商数据的行业用户推荐方法及装置 |
CN108197285A (zh) * | 2018-01-15 | 2018-06-22 | 腾讯科技(深圳)有限公司 | 一种数据推荐方法以及装置 |
US20180211270A1 (en) * | 2017-01-25 | 2018-07-26 | Business Objects Software Ltd. | Machine-trained adaptive content targeting |
-
2018
- 2018-09-11 CN CN201811056510.5A patent/CN109241202B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101082972A (zh) * | 2007-05-30 | 2007-12-05 | 华为技术有限公司 | 预测用户对商品的兴趣的方法、装置和广告发布方法 |
CN102750647A (zh) * | 2012-06-29 | 2012-10-24 | 南京大学 | 一种基于交易网络的商家推荐方法 |
CN106162348A (zh) * | 2015-04-13 | 2016-11-23 | 海信集团有限公司 | 一种个性化节目推荐方法及装置 |
US20180211270A1 (en) * | 2017-01-25 | 2018-07-26 | Business Objects Software Ltd. | Machine-trained adaptive content targeting |
CN107506480A (zh) * | 2017-09-13 | 2017-12-22 | 浙江工业大学 | 一种基于评论挖掘与密度聚类的双层图结构推荐方法 |
CN107885778A (zh) * | 2017-10-12 | 2018-04-06 | 浙江工业大学 | 一种基于动态临近点谱聚类的个性化推荐方法 |
CN108052639A (zh) * | 2017-12-21 | 2018-05-18 | 中国联合网络通信集团有限公司 | 基于运营商数据的行业用户推荐方法及装置 |
CN108197285A (zh) * | 2018-01-15 | 2018-06-22 | 腾讯科技(深圳)有限公司 | 一种数据推荐方法以及装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110472998A (zh) * | 2019-07-16 | 2019-11-19 | 第四范式(北京)技术有限公司 | 一种构建用户画像信息的方法、装置及电子设备 |
CN112085114A (zh) * | 2020-09-14 | 2020-12-15 | 杭州中奥科技有限公司 | 线上线下身份匹配方法、装置、设备及存储介质 |
CN112967781A (zh) * | 2021-02-01 | 2021-06-15 | 苏州工业职业技术学院 | 一种基于nfc的运动社交***及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109241202B (zh) | 2020-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Setiawan et al. | The profile and behaviour of ‘digital tourists’ when making decisions concerning travelling case study: Generation Z in South Jakarta | |
US20100131265A1 (en) | Method, Apparatus and Computer Program Product for Providing Context Aware Queries in a Network | |
CN109241202A (zh) | 一种基于聚类的陌生人社交用户匹配方法和*** | |
Spiro et al. | The persistence of division: Geography, institutions, and online friendship ties | |
Arthur et al. | The human geography of Twitter: Quantifying regional identity and inter-region communication in England and Wales | |
Boutsis et al. | Personalized event recommendations using social networks | |
Chin et al. | Who should I add as a" friend"? A study of friend recommendations using proximity and homophily | |
Lai | An integrated approach to untangling mediated connectedness with online and mobile media | |
Francis et al. | The pandemic and the feminisation of the Church? How male and female churchgoers experienced the Church of England’s response to Covid-19 | |
Wellman et al. | The networked question in the digital era: How do networked, bounded, and limited individuals connect at different stages in the life course? | |
Sims | 9 Beyond the Stereotype of the ‘Thai-Bride': Visibility, Invisibility and Community | |
Kuo et al. | Contextual restaurant recommendation utilizing implicit feedback | |
Xia et al. | Characterization of user online dating behavior and preference on a large online dating site | |
CN109670107A (zh) | 一种基于兴趣大数据的陌生人社交活动推荐方法和*** | |
KR20200044168A (ko) | 집단지성 기반의 가상 인격체 생성 장치 | |
Lizardy-Hajbi | Engaging young adults | |
Vishnevskaya et al. | Mobile technologies in implementation of programs of internal tourism development | |
Jenkin | The impact of social networking mediums on the decision making process of tourists: A case study of Stray Ltd and Spaceships New Zealand Ltd | |
US20210125195A1 (en) | Methods and systems for segmentation and activation in data management platform for contact center | |
US20210125233A1 (en) | Methods and systems for segmentation and activation in data management platform for contact center | |
Mesch | Social diversification: A perspective for the study of social networks of adolescents offline and online | |
CN112395323A (zh) | 一种基于用户体验数据的交互方法 | |
JP6267817B1 (ja) | 決定装置、決定方法、及び決定プログラム | |
Seturi | About the importance and benefits of event marketing | |
Kars-Unluoglu et al. | Migrants as “dissonant harmony-seekers” and migrant life in “foam” |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |