CN108920479A - 针对两微一端跨信源账号推荐方法 - Google Patents
针对两微一端跨信源账号推荐方法 Download PDFInfo
- Publication number
- CN108920479A CN108920479A CN201810337919.8A CN201810337919A CN108920479A CN 108920479 A CN108920479 A CN 108920479A CN 201810337919 A CN201810337919 A CN 201810337919A CN 108920479 A CN108920479 A CN 108920479A
- Authority
- CN
- China
- Prior art keywords
- index
- account
- association
- level index
- level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000005259 measurement Methods 0.000 claims abstract description 19
- 210000003813 thumb Anatomy 0.000 claims description 23
- 244000046052 Phaseolus vulgaris Species 0.000 claims description 21
- 235000010627 Phaseolus vulgaris Nutrition 0.000 claims description 21
- 230000000694 effects Effects 0.000 claims description 4
- 230000003542 behavioural effect Effects 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 230000006399 behavior Effects 0.000 claims 12
- 238000012544 monitoring process Methods 0.000 description 8
- 230000008901 benefit Effects 0.000 description 5
- 230000000366 juvenile effect Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 206010033799 Paralysis Diseases 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 210000001508 eye Anatomy 0.000 description 2
- 239000004744 fabric Substances 0.000 description 2
- 229910052500 inorganic mineral Inorganic materials 0.000 description 2
- 239000011707 mineral Substances 0.000 description 2
- 210000001747 pupil Anatomy 0.000 description 2
- 230000002269 spontaneous effect Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000005252 bulbus oculi Anatomy 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Theoretical Computer Science (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种针对两微一端跨信源账号推荐方法,包括:将两微一端跨信源账号关联度衡量指标分为三级,包括多个一级关联度衡量指标,各个一级指标下分多个二级指标,以及各二级指标对应的各维度数据字段为三级指标;确定种子账户和多个目标账户;采集三级指标下的各维度数据,量化各个维度数据的相似度;基于用户关注度需求确定一级指标权重和一级指标下各个二级指标的权重;将所得各类三级关联度衡量指标下各个维度数据相似度与各自权重加权求和,获得各目标账号关联度指数,并将这些目标账户关联度指数倒序推荐。本发明所述推荐方法可跨信源进行账号推荐,且推荐结果精确合理。
Description
技术领域
本发明涉及互联网应用技术领域。更具体地说,本发明涉及一种针对两微一端跨信源账号推荐方法。
背景技术
随着移动网络的普及,微博、微信、新闻客户端(以下简称:两微一端)覆盖人群日益增多,社交媒体正成为网络社会热点事件产生和发酵的源头,往往在形成传播影响力后带动新闻网站、传统媒体跟进报道。然而,为了吸引网民关注,两微一端中不乏存在低级趣味、极端思想、自由思潮等信息以及为博眼球的不实谣言。更有国内外势力团队利用自媒体进行网络渗透,恶意散布蛊惑人心、煽风点火的言论,为意识形态工作带来巨大挑战,甚至可能对社会稳定带来影响。因此,迫切需要建立面向移动互联网的信息监测预警和态势感知能力。
目前两微一端账号监测是针对两微一端信息监测预警工作中的重要组成部分,但是工作掌握的监测目标账号往往不能覆盖面向移动互联网的信息监测预警的需求。一些势力利用大量跨平台的小号、马甲账号不断躲避官方的监管,积极主动发现可能与已掌握账号有关联的两微一端账号,扩大业务重点关注范围,提前监测、提前预警成为了自媒体迅猛发展时代下移动互联网信息监测预警工作的新需求。
目前通过已知账号推荐相关账号方法主要针对微博单一信源,且推荐方法多采用关注关系信息进行推荐,或通过用户注册信息进行推荐,例如通讯录信息、注册账号时填写的学校、工作信息等。这些账号推荐方法存在推荐结果考虑因素单一的问题,一些用户关心的账号信息往往因为粉丝量少、发博量少等原因排于大V账号之后。
发明内容
本发明的一个目的是解决至少上述问题,并提供至少后面将说明的优点。
本发明还有一个目的是提供一种针对两微一端平台跨信源账号推荐方法,所述方法不止针对单一信源,跨信源基于多维关联度衡量指标,使账号推荐结果更加精确合理。
为了实现根据本发明的这些目的和其它优点,提供了一种针对两微一端跨信源账号推荐方法,包括:将两微一端跨信源账号关联度衡量指标分为三级,包括多个一级关联度衡量指标,各个一级指标下分多个二级指标,以及各二级指标对应的各维度数据字段为三级指标;
确定种子账户和多个目标账户;采集三级指标下的各维度数据,量化各个目标账号维度数据的相似度;
基于用户关注度需求确定一级指标权重和一级指标下各个二级指标的权重,各个同族一级指标的权重和为1,同一个一级指标下的各个同族二级指标的权重和为1;
将所得各类三级关联度衡量指标下各个维度数据相似度与各自权重加权求和,获得各目标账号关联度指数,并将这些目标账户关联度指数倒序推荐。
优选的是,所述一级关联度衡量指标包括:主体关联度、基础关联度、交互关联度、社交关联度以及内容关联度指标;所述主体关联度一级指标下包括认证主体关联二级指标,其对应的微博、微信以及APP三级指标分别为认证主体、账号主体以及应用开发商;所述基础关联度一级指标下包括账号名称关联、账号简介关联、联系方式关联、账号地域关联、账号标签关联二级指标,所述账号名称关联二级指标对应的微博、微信以及APP三级指标分别为用户昵称、用户昵称以及APP站点名称指标,所述账号简介关联二级指标对应的微博、微信以及APP三级指标分别为个人描述、功能简介以及软件介绍,所述联系方式关联二级指标对应的微博和微信三级指标分别为联系电话和客服电话指标,所述账号地域关联二级指标对应的微博三级指标为所在地,所述账号标签关联二级指标对应的微博和APP三级指标分别为标签和应用类别指标;所述交互关联度一级指标下包括评论行为关联、转发行为关联以及点赞行为关联二级指标,所述评论行为关联二级指标对应的微博三级指标为评论行为,所述转发行为关联二级指标对应的微博、微信以及APP三级指标分别为转发行为、文章转载源以及新闻转载源指标,所述点赞行为关联二级指标对应的微博三级指标为点赞行为指标;所述社交关联度一级指标下包括关注关系关联、粉丝关系关联、共同关注关联、共同粉丝关联、账号推荐关联二级指标,所述关注关系关联、粉丝关系关联、共同关注关联以及共同粉丝关联二级指标对应的微博三级指标分别为关注列表、粉丝列表、共同关注以及共同粉丝指标,所述账号推荐关联二级指标对应的微博和微信三级指标分别为友情链接指标和文章信息中推荐其他账号行为指标;所述内容关联度一级指标下包括信息标题关联、发布时间关联、信息内容关联以及链接地址关联二级指标,所述信息标题关联二级指标对应的微博、微信以及APP三级指标分别为长微博标题、文章标题以及新闻标题指标指标,所述发布时间关联二级指标对应的微博、微信以及APP三级指标都为发布时间指标,所述信息内容关联二级指标对应的微博、微信以及APP三级指标分别为博文内容、文章内容以及新闻内容,所述链接地址关联二级指标对应的微博、微信以及APP三级指标分别为博文包含链接、文章包含链接以及新闻包含链接指标。
优选的是,所述用户基于关注度需求确定一级指标权重和一级指标下各个二级指标的权重时,部分指标权重缺失时,将所述缺失指标的权重平均分给同族剩余权重。
优选的是,量化各个维度数据的相似度前还包括将种子账户和目标账户各个维度数据的字段数据对齐。
优选的是,所述各个维度数据相似度的量化计算中文本相似度通过word2vec方式先得到词的向量化表示,再计算得到文本相似度;发布时间相似度计算方式为:与种子账号发布时间相差1h以内的,相似度为1,1h以上6h以内的相似度为0.75,6h以上12h以内的相似度为0.5,12h以上24h以内的相似度为0.25,24h以上的相似度为0。
优选的是,所述采集三级指标下的各维度数据为最近一个月的相关数据。
优选的是,所述微博三级指标下的各维度数据可以通过网页采集和OpenAPI采集相结合的方式采集相关数据;微信三级指标下的各维度数据可以通过微信网页版采集微信公众号的相关数据;APP三级指标下的各维度数据可以通过安卓应用商店页面采集以及抓包工具采集新闻APP的相关数据。
优选的是,所述微博标签三级指标相似度等于种子账号与目标账号相同标签数/目标账号总标签数;所述微博评论行为、转发以及点赞三级指标相似度分别等于目标账号评论种子账号的信息数/目标账号总评论数、目标账号转发种子账号的信息数/目标账号总转发数以及目标账号点赞种子账号的信息数/目标账号总点赞数。
优选的是,所述微信文章转载源三级指标相似度等于目标账号文章转载自种子账号信息数/目标账号文章总数。
优选的是,所述APP应用类别三级指标相似度等于目标账号的应用类别与种子账号标签或者应用类别相同数/目标账号总应用类别数;所述APP新闻转载源三级指标的相似度等于目标APP转载自种子账号的信息数/目标APP总信息数。
本发明至少包括以下有益效果:其一,本发明所提供的账号推荐方法不止是针对单一信源的账号推荐方法,其可以做到跨信源进行账号推荐;其二,本发明所提供的账号推荐方法基于主体关联度、基础关联度、交互关联度、社交关联度、内容关联度等多维关联度衡量指标,使账号推荐结果更加精确合理,账号推荐结果一目了然。
本发明的其它优点、目标和特征将部分通过下面的说明体现,部分还将通过对本发明的研究和实践而为本领域的技术人员所理解。
附图说明
图1为本发明所述针对两微一端跨信源账号推荐方法的流程图。
具体实施方式
下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
应当理解,本文所使用的诸如“具有”、“包含”以及“包括”术语并不配出一个或多个其它元件或其组合的存在或添加。
为了实现根据本发明的这些目的和其它优点,提供了一种针对两微一端跨信源账号推荐方法,包括:将两微一端跨信源账号关联度衡量指标分为三级,包括多个一级关联度衡量指标,各个一级指标下分多个二级指标,以及各二级指标对应的各维度数据字段为三级指标;
确定种子账户和多个目标账户;采集三级指标下的各维度数据,量化各个维度数据的相似度;
基于用户关注度需求确定一级指标权重和一级指标下各个二级指标的权重,各个同族一级指标的权重和为1,同一个一级指标下的各个同族二级指标的权重和为1;用户可以根据自身需求的不同设置各个关联度的权重,进而方便用户可以根据自身需求得到账号推荐结果。如用户侧重于账号间互动的情况,就对交互关联度权重进行调整,侧重于账号间社交圈的情况,就对社交关联度权重进行调整。
将所得各类三级关联度衡量指标下各个维度数据相似度与各自权重加权求和,获得各目标账号关联度指数,并将这些目标账户关联度指数倒序推荐。
优选的是,所述一级关联度衡量指标包括:主体关联度、基础关联度、交互关联度、社交关联度以及内容关联度指标;所述主体关联度一级指标下包括认证主体关联二级指标,其对应的微博、微信以及APP三级指标分别为认证主体、账号主体以及应用开发商;所述基础关联度一级指标下包括账号名称关联、账号简介关联、联系方式关联、账号地域关联、账号标签关联二级指标,所述账号名称关联二级指标对应的微博、微信以及APP三级指标分别为用户昵称、用户昵称以及APP站点名称指标,所述账号简介关联二级指标对应的微博、微信以及APP三级指标分别为个人描述、功能简介以及软件介绍,所述联系方式关联二级指标对应的微博和微信三级指标分别为联系电话和客服电话指标,所述账号地域关联二级指标对应的微博三级指标为所在地,所述账号标签关联二级指标对应的微博和APP三级指标分别为标签和应用类别指标;所述交互关联度一级指标下包括评论行为关联、转发行为关联以及点赞行为关联二级指标,所述评论行为关联二级指标对应的微博三级指标为评论行为,所述转发行为关联二级指标对应的微博、微信以及APP三级指标分别为转发行为、文章转载源以及新闻转载源指标,所述点赞行为关联二级指标对应的微博三级指标为点赞行为指标;所述社交关联度一级指标下包括关注关系关联、粉丝关系关联、共同关注关联、共同粉丝关联、账号推荐关联二级指标,所述关注关系关联、粉丝关系关联、共同关注关联以及共同粉丝关联二级指标对应的微博三级指标分别为关注列表、粉丝列表、共同关注以及共同粉丝指标,所述账号推荐关联二级指标对应的微博和微信三级指标分别为友情链接指标和文章信息中推荐其他账号行为指标;所述内容关联度一级指标下包括信息标题关联、发布时间关联、信息内容关联以及链接地址关联二级指标,所述信息标题关联二级指标对应的微博、微信以及APP三级指标分别为长微博标题、文章标题以及新闻标题指标指标,所述发布时间关联二级指标对应的微博、微信以及APP三级指标都为发布时间指标,所述信息内容关联二级指标对应的微博、微信以及APP三级指标分别为博文内容、文章内容以及新闻内容,所述链接地址关联二级指标对应的微博、微信以及APP三级指标分别为博文包含链接、文章包含链接以及新闻包含链接指标。详细结果见表1。
表1各级关联度衡量指标
优选的是,所述用户基于关注度需求确定一级指标权重和一级指标下各个二级指标的权重时,部分指标权重缺失时,将所述缺失指标的权重平均分给同族剩余权重。
优选的是,量化各个维度数据的相似度前还包括将种子账户和目标账户各个维度数据的字段数据对齐。
优选的是,所述各个维度数据相似度的量化计算中文本相似度通过word2vec方式先得到词的向量化表示,再计算得到文本相似度;发布时间相似度计算方式为:与种子账号发布时间相差1h以内的,相似度为1,1h以上6h以内的相似度为0.75,6h以上12h以内的相似度为0.5,12h以上24h以内的相似度为0.25,24h以上的相似度为0。
优选的是,所述采集三级指标下的各维度数据为最近一个月的相关数据。
优选的是,所述微博三级指标下的各维度数据可以通过网页采集和OpenAPI采集相结合的方式采集相关数据;我们通过***模拟用户自动登录各微博网站,采用仿真的模拟采集技术采集微博网站的原始网页,并对下载的网页进行解析。或通过微博开放平台采集获取相关微主数据及博文信息,使得采集的数据可靠性高,采集方法简单易行。
微信三级指标下的各维度数据可以通过微信网页版采集微信公众号的相关数据;我们通过登录网页版微信,关注采集目标账号,利用在浏览器放入解析https的插件,把浏览器与服务器交互的消息,抓包发回采集服务器,实现对微信公众号进行数据采集,获取相关微信公众号信息及文章内容信息,使得数据结果采集准确、时效性强,且采集方法简单易行。
APP三级指标下的各维度数据可以通过安卓应用商店页面采集以及抓包工具采集新闻APP的相关数据;抓包工具是拦截查看网络数据包内容的软件,通过采用抓包工具对新闻APP的相关数据进行采集,可以先对新闻APP数据结构进行分析,然后依据分析结果进行模板配置方式,再对新闻APP进行数据采集,获取相关新闻信息及新闻评论信息,使得采集的数据可靠性高,且采集方法简单易行。
优选的是,所述微博标签三级指标相似度等于种子账号与目标账号相同标签数/目标账号总标签数;所述微博评论行为、转发以及点赞三级指标相似度分别等于目标账号评论种子账号的信息数/目标账号总评论数、目标账号转发种子账号的信息数/目标账号总转发数以及目标账号点赞种子账号的信息数/目标账号总点赞数。
微博账号关联度=认证主体文本相似度*A+(昵称相似度*a1+个人描述相似度*b1+联系电话是否相同*c1+所在地是否相同*d1+相同标签数*f1/总标签数)*B+((目标账号评论种子账号信息数/目标账号总评论数)*a2+(目标账号转发种子账号信息数/目标账号总转发数)*b2+(目标账号点赞种子账号信息数/目标账号总点赞数)*c2)*C+(目标账号是否是种子帐号粉丝*a3+目标账号是否是种子帐号关注对象*b3+目标帐号与种子帐号是否有共同关注对象*c3目标帐号与种子帐号是否有共同粉丝*d3+是否存在目标账号友情链接*e3) *D+(长微博标题相似度*a4+发布时间相似度*b4+博文内容相似度*c4+博文内链接是否相同*d4)*E。
其中,A、B、C、D、E为各一级指标权重,且A+B+C+D+E=1;同理an、bn、cn、dn……为各二级指标权重,且an+bn+cn+dn……=1。
优选的是,所述微信文章转载源三级指标相似度等于目标账号文章转载自种子账号信息数/目标账号文章总数。
微信公众号关联度=认证主体文本相似度*A+(公众号名称相似度*a5+公众号功能介绍相似度*b5+客服电话是否相同*c5)*B+(目标公众号文章转载自种子账号信息数/目标公众号文章总数)*C+(目标公众号文章中是否推荐是种子帐号)*D+(文章标题相似度*a4+ 文章发布时间相似度*b4+文章内容相似度*c4+文章内阅读原文链接是否相同*d4)*E。
其中,A、B、C、D、E为各一级指标权重,且A+B+C+D+E=1;同理an、bn、cn、dn……为各二级指标权重,a5=a1+(d1+f1)/3,b5=b1+(d1+f1)/3,c5=c1+(d1+f1)/3,且an+bn+cn+dn……=1。
优选的是,所述APP应用类别三级指标相似度等于目标账号的应用类别与种子账号标签或者应用类别相同数/目标账号总应用类别数;所述APP新闻转载源三级指标的相似度等于目标APP转载自种子账号的信息数/目标APP总信息数。
新闻客户端关联度=应用开发商文本相似度*A’+(APP站点名称相似度*a6+APP软件介绍相似度*b6+应用类别与标签相同数*f6/总应用类别与标签数)*B’+(目标APP转载自种子帐号信息数/目标APP总信息数)*C’+(新闻标题相似度*a4+新闻发布时间相似度 *b4+新闻内容相似度*c4+新闻内链接是否相同*d4)*E’。
其中,A’、B’、C’、E’为各一级指标权重,A’=A+D/4,B’=B+D/4,C’=C+D/4,E’=E+D/4 且A’+B’+C’+E’=1;同理an、bn、cn、dn……为各二级指标权重,a6=a1+(c1+d1)/3, b6=b1+(c1+d1)/3,f6=f1+(c1+d1)/3,且an+bn+cn+dn……=1。
实施例
实施例以微博账号“人民网”为种子账号、微博“***”、微信公众号“人民网”、新闻客户端“ZAKER”为目标账号,采集各账号2017-11-26 00:00至2017-12-27 00:00的数据如表2。
表2各账号采集的各维度数据
其他数据1
【五星红旗我为你骄傲!】在成都地铁三号线上,地铁电视正在播到“五星红旗红旗我为你骄傲”,这位小朋友就对着电视敬礼...小朋友,你真棒!@成都地铁
其他数据2
【地铁电视播放歌曲《红旗飘飘》,男孩见到国旗就敬礼,满脸严肃】近日,成都地铁电视正播放歌曲《红旗飘飘》,当唱到“五星红旗,你是我的骄傲”时,一名小男孩举手向国旗敬礼。拍摄者说,只要国旗出现,他就敬礼,特别可爱,也让人感动。
其他数据3
@成都地铁:电视播放“五星红旗我为你骄傲”,小朋友敬礼
近日,一张小朋友敬礼照在网上火了:
小朋友为什么敬礼?
据@成都地铁称,在成都地铁3号线上,地铁电视正在播到“五星红旗我为你骄傲”,这位小朋友就对着电视敬礼。
@成都地铁负责人陈士宇介绍,该条微博阅读量已达到4443万。该微博也已获近30万点赞,被多家媒体转载报道:
对于这条火了的微博,陈士宇表示“完全没想到”:“就是一件很小的事情,我们挺意外的。”他说,看到网友的转发和评论,挺开心的,心里很暖。
据了解,12月24日,成都轨道交通集团有限公司实习生、四川师范大学的研三学生夏昕从每天的二十多条网友投稿中选择了这张敬礼的照片,编辑后发布:“挺正能量的,当时也没多想”。
网友投稿截图
夏昕说:“再回过头去看看,真的挺触动的。”
敬礼照被嘲笑,网友不干了...
这张照片引发网友热议,却被嘲笑,网友纷纷表示看不下去了:
更多的网友还是为小朋友这一举动点赞!
越来越多的少年感动网友
你还记得这些小孩子吗?一个个满满正能量,一次次感动着网友:
小军娃送别爸爸:北部战区空军某部在火车站送别分流官兵,集合哨声响起后,一位军嫂让孩子给身穿迷彩服的爸爸敬个礼。听到敬礼口令,小军娃举起幼稚的小手,敬了一个不太标准的军礼。这个举动,让很多人动容。有人说,军嫂是万能的,连军娃都过早学会了自强自立,那是因为他们承担起比常人更多的重担。
在贵州遵义红花岗区老城小学一名小学生因为迟到,冒雨奔向教室。当他跑到操场,听到国歌响起时,他立刻面向国旗敬礼,直到国歌结束才匆匆跑进教室。网友表示,他现在做到的事情我没做到过。
一年级二班的学生吴睿博背着书包一路小跑赶到了学校门口。这时候,学校正在举行升旗仪式。当国歌响起时,吴睿博突然停下了脚步,原地立正,面向学校的方向敬队礼。当天早上,吴睿博身体有些不舒服,他的妈妈打电话给班主任请假,说会晚点到学校。
河北保定联盟西路小学发生的一幕:孩子们在走向班级的时候,国歌响起来了,于是他们全部自发停下脚步,笔直地站立着,向缓缓升起的国旗行注目礼,直到国歌奏完。
陕西省榆林市绥德县,发生特大洪水灾害后,一张小男孩累瘫在矿泉水“山”旁的“最小志愿者”照片走红网络。洪灾过后,留下了一片狼藉。当地随即征集志愿者,开展抢险救灾的后续工作,小男孩便是其中的志愿者。
一名小男孩跪在地铁上,用纸巾一遍遍擦拭着地上的污渍。当他看到前面还有块地方不太干净时,赶紧又到另一边擦,直到彻底擦拭干净,最后才把纸巾收拢到一起,将垃圾带走。网友把这个小乘客称为地铁里的“清流”。
监控里意外看到这样一幕,北京团结湖白家庄附近的水果店门口,一个孩子扶起倒地的共享单车。河南一条街道上,2岁幼童爬到3楼窗户喊妈妈,却突然从楼上坠落,路过的六年级女生立刻冲向前试图徒手追接。
少年虽小
但肩膀有担当、有力量
他们善良、真诚、勇敢、爱国
他们是国家未来的栋梁
一起点赞
其他数据4
@成都地铁:电视播放“五星红旗我为你骄傲”,小朋友敬礼
近日,一张小朋友敬礼照在网上火了:
小朋友为什么敬礼?
据@成都地铁称,在成都地铁3号线上,地铁电视正在播到“五星红旗我为你骄傲”,这位小朋友就对着电视敬礼。
@成都地铁负责人陈士宇介绍,该条微博阅读量已达到4443万。该微博也已获近30万点赞,被多家媒体转载报道:
对于这条火了的微博,陈士宇表示“完全没想到”:“就是一件很小的事情,我们挺意外的。”他说,看到网友的转发和评论,挺开心的,心里很暖。
据了解,12月24日,成都轨道交通集团有限公司实习生、四川师范大学的研三学生夏昕从每天的二十多条网友投稿中选择了这张敬礼的照片,编辑后发布:“挺正能量的,当时也没多想”。
网友投稿截图
夏昕说:“再回过头去看看,真的挺触动的。”
敬礼照被嘲笑,网友不干了...
这张照片引发网友热议,却被嘲笑,网友纷纷表示看不下去了:
更多的网友还是为小朋友这一举动点赞!
越来越多的少年感动网友
你还记得这些小孩子吗?一个个满满正能量,一次次感动着网友:
小军娃送别爸爸:北部战区空军某部在火车站送别分流官兵,集合哨声响起后,一位军嫂让孩子给身穿迷彩服的爸爸敬个礼。听到敬礼口令,小军娃举起幼稚的小手,敬了一个不太标准的军礼。这个举动,让很多人动容。有人说,军嫂是万能的,连军娃都过早学会了自强自立,那是因为他们承担起比常人更多的重担。
在贵州遵义红花岗区老城小学一名小学生因为迟到,冒雨奔向教室。当他跑到操场,听到国歌响起时,他立刻面向国旗敬礼,直到国歌结束才匆匆跑进教室。网友表示,他现在做到的事情我没做到过。
一年级二班的学生吴睿博背着书包一路小跑赶到了学校门口。这时候,学校正在举行升旗仪式。当国歌响起时,吴睿博突然停下了脚步,原地立正,面向学校的方向敬队礼。当天早上,吴睿博身体有些不舒服,他的妈妈打电话给班主任请假,说会晚点到学校。
河北保定联盟西路小学发生的一幕:孩子们在走向班级的时候,国歌响起来了,于是他们全部自发停下脚步,笔直地站立着,向缓缓升起的国旗行注目礼,直到国歌奏完。
陕西省榆林市绥德县,发生特大洪水灾害后,一张小男孩累瘫在矿泉水“山”旁的“最小志愿者”照片走红网络。洪灾过后,留下了一片狼藉。当地随即征集志愿者,开展抢险救灾的后续工作,小男孩便是其中的志愿者。
一名小男孩跪在地铁上,用纸巾一遍遍擦拭着地上的污渍。当他看到前面还有块地方不太干净时,赶紧又到另一边擦,直到彻底擦拭干净,最后才把纸巾收拢到一起,将垃圾带走。网友把这个小乘客称为地铁里的“清流”。
监控里意外看到这样一幕,北京团结湖白家庄附近的水果店门口,一个孩子扶起倒地的共享单车。河南一条街道上,2岁幼童爬到3楼窗户喊妈妈,却突然从楼上坠落,路过的六年级女生立刻冲向前试图徒手追接。
少年虽小
但肩膀有担当、有力量
他们善良、真诚、勇敢、爱国
他们是国家未来的栋梁
一起点赞
根据上述信息,分配各个指标权重,关联度计算结果:
R1(微博***)=0.869*20%+(0.607*50%+0*20%+0*10%+0*10%+0*10%)*20%+ (0*1/3+(1/185)*1/3+0*1/3)*20%+(1*30%+1*30%+0*10%+1*10%+1*20%)*20%+ (0.261*25%+0*25%+0.518*25%+0*25%) *20%=0.1738+0.0607+0.00036+0.16+0.03895=0.43381
R2(微信人民网)=0.33*20%+(1*60%+0.146*30%+0*10%)*20%+(13/229)*20%+(0) *20%+(0.17*25%+0.25*25%+0.259*25%+0*25%) *20%=0.066+0.1638+0.01135+0+0.03395=0.2751
R3(APPzaker新闻)=0*25%+(0*60%+0.143*30%+0*10%)*25%+(0)*25%+(0.176*25%+0*25%+0.259*25%+0*25%)*25%=0+0.010725+0+0.0271875=0.0379
综上,种子帐号人民网的关联账号推荐结果为:
1、微博***
2、微信人民网
3、新闻客户端zaker新闻
综上所述,本发明所提供的账号推荐方法不止是针对单一信源的账号推荐方法,其可以做到跨信源进行账号推荐;本发明所提供的账号推荐方法基于主体关联度、基础关联度、交互关联度、社交关联度、内容关联度等多维关联度衡量指标,使账号推荐结果更加精确合理,账号推荐结果一目了然。
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。
Claims (10)
1.一种针对两微一端跨信源账号推荐方法,其特征在于,包括:
将两微一端跨信源账号关联度衡量指标分为三级,包括多个一级关联度衡量指标,各个一级指标下分多个二级指标,以及各二级指标对应的各维度数据字段为三级指标;
确定种子账户和多个目标账户;采集三级指标下的各维度数据,量化各个目标账号维度数据的相似度;
基于用户关注度需求确定一级指标权重和一级指标下各个二级指标的权重,各个同族一级指标的权重和为1,同一个一级指标下的各个同族二级指标的权重和为1;
将所得各类三级关联度衡量指标下各个维度数据相似度与各自权重加权求和,获得各目标账号关联度指数,并将这些目标账户关联度指数倒序推荐。
2.如权利要求1所述的针对两微一端跨信源账号推荐方法,其特征在于,所述一级关联度衡量指标包括:主体关联度、基础关联度、交互关联度、社交关联度以及内容关联度指标;所述主体关联度一级指标下包括认证主体关联二级指标,其对应的微博、微信以及APP三级指标分别为认证主体、账号主体以及应用开发商;所述基础关联度一级指标下包括账号名称关联、账号简介关联、联系方式关联、账号地域关联、账号标签关联二级指标,所述账号名称关联二级指标对应的微博、微信以及APP三级指标分别为用户昵称、用户昵称以及APP站点名称指标,所述账号简介关联二级指标对应的微博、微信以及APP三级指标分别为个人描述、功能简介以及软件介绍,所述联系方式关联二级指标对应的微博和微信三级指标分别为联系电话和客服电话指标,所述账号地域关联二级指标对应的微博三级指标为所在地,所述账号标签关联二级指标对应的微博和APP三级指标分别为标签和应用类别指标;所述交互关联度一级指标下包括评论行为关联、转发行为关联以及点赞行为关联二级指标,所述评论行为关联二级指标对应的微博三级指标为评论行为,所述转发行为关联二级指标对应的微博、微信以及APP三级指标分别为转发行为、文章转载源以及新闻转载源指标,所述点赞行为关联二级指标对应的微博三级指标为点赞行为指标;所述社交关联度一级指标下包括关注关系关联、粉丝关系关联、共同关注关联、共同粉丝关联、账号推荐关联二级指标,所述关注关系关联、粉丝关系关联、共同关注关联以及共同粉丝关联二级指标对应的微博三级指标分别为关注列表、粉丝列表、共同关注以及共同粉丝指标,所述账号推荐关联二级指标对应的微博和微信三级指标分别为友情链接指标和文章信息中推荐其他账号行为指标;所述内容关联度一级指标下包括信息标题关联、发布时间关联、信息内容关联以及链接地址关联二级指标,所述信息标题关联二级指标对应的微博、微信以及APP三级指标分别为长微博标题、文章标题以及新闻标题指标指标,所述发布时间关联二级指标对应的微博、微信以及APP三级指标都为发布时间指标,所述信息内容关联二级指标对应的微博、微信以及APP三级指标分别为博文内容、文章内容以及新闻内容,所述链接地址关联二级指标对应的微博、微信以及APP三级指标分别为博文包含链接、文章包含链接以及新闻包含链接指标。
3.如权利要求2所述的针对两微一端跨信源账号推荐方法,其特征在于,所述用户基于关注度需求确定一级指标权重和一级指标下各个二级指标的权重时,部分指标权重缺失时,将所述缺失指标的权重平均分给剩余同族权重。
4.如权利要求3所述的针对两微一端跨信源账号推荐方法,其特征在于,量化各个维度数据的相似度前还包括将种子账户和目标账户各个维度数据字段对齐。
5.如权利要求4所述的针对两微一端跨信源账号推荐方法,其特征在于,所述各个维度数据相似度的量化计算中文本相似度通过word2vec方式先得到词的向量化表示,再计算得到文本相似度;发布时间相似度计算方式为:与种子账号发布时间相差1h以内的,相似度为1,1h以上6h以内的相似度为0.75,6h以上12h以内的相似度为0.5,12h以上24h以内的相似度为0.25,24h以上的相似度为0。
6.如权利要求5所述的针对两微一端跨信源账号推荐方法,其特征在于,所述采集三级指标下的各维度数据为最近一个月的相关数据。
7.如权利要求6所述的针对两微一端跨信源账号推荐方法,其特征在于,所述微博三级指标下的各维度数据可以通过网页采集和OpenAPI采集相结合的方式采集相关数据;微信三级指标下的各维度数据可以通过微信网页版采集微信公众号的相关数据;APP三级指标下的各维度数据可以通过安卓应用商店页面采集以及抓包工具采集新闻APP的相关数据。
8.如权利要求7所述的针对两微一端跨信源账号推荐方法,其特征在于,所述微博标签三级指标相似度等于种子账号与目标账号相同标签数/目标账号总标签数;所述微博评论行为、转发行为以及点赞行为三级指标相似度分别等于目标账号评论种子账号的信息数/目标账号总评论数、目标账号转发种子账号的信息数/目标账号总转发数以及目标账号点赞种子账号的信息数/目标账号总点赞数。
9.如权利要求8所述的针对两微一端跨信源账号推荐方法,其特征在于,所述微信文章转载源三级指标相似度等于目标账号文章转载自种子账号信息数/目标账号文章总数。
10.如权利要求9所述的针对两微一端跨信源账号推荐方法,其特征在于,所述APP应用类别三级指标相似度等于目标账号的应用类别与种子账号标签或者应用类别相同数/目标账号总应用类别数;所述APP新闻转载源三级指标的相似度等于目标APP转载自种子账号的信息数/目标APP总信息数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810337919.8A CN108920479B (zh) | 2018-04-16 | 2018-04-16 | 针对两微一端跨信源账号推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810337919.8A CN108920479B (zh) | 2018-04-16 | 2018-04-16 | 针对两微一端跨信源账号推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108920479A true CN108920479A (zh) | 2018-11-30 |
CN108920479B CN108920479B (zh) | 2022-06-17 |
Family
ID=64402979
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810337919.8A Active CN108920479B (zh) | 2018-04-16 | 2018-04-16 | 针对两微一端跨信源账号推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108920479B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110489664A (zh) * | 2019-08-07 | 2019-11-22 | 北京达佳互联信息技术有限公司 | 一种基于契合度的客户端推荐方法及装置 |
CN110545528A (zh) * | 2019-09-19 | 2019-12-06 | 白浩 | 融合多身份的社交方法、装置以及存储介质 |
CN110691026A (zh) * | 2019-08-16 | 2020-01-14 | 深圳市普特斯科技有限公司 | 一种与两微一端连接的图文视频编辑发布平台 |
CN111935259A (zh) * | 2020-07-30 | 2020-11-13 | 腾讯科技(深圳)有限公司 | 目标帐号集合的确定方法和装置、存储介质及电子设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102355664A (zh) * | 2011-08-09 | 2012-02-15 | 郑毅 | 一种基于用户的社交网络对用户身份进行识别与匹配的方法 |
CN104348871A (zh) * | 2013-08-05 | 2015-02-11 | 深圳市腾讯计算机***有限公司 | 一种同类账号扩展方法及装置 |
CN105045822A (zh) * | 2015-06-26 | 2015-11-11 | 淮海工学院 | 一种微博中特定用户的相似用户监控方法 |
US9288123B1 (en) * | 2012-08-31 | 2016-03-15 | Sprinklr, Inc. | Method and system for temporal correlation of social signals |
CN106600342A (zh) * | 2016-12-29 | 2017-04-26 | 北京奇艺世纪科技有限公司 | 一种广告投放的方法和装置 |
CN107346496A (zh) * | 2016-05-05 | 2017-11-14 | 腾讯科技(北京)有限公司 | 目标用户定向方法及装置 |
-
2018
- 2018-04-16 CN CN201810337919.8A patent/CN108920479B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102355664A (zh) * | 2011-08-09 | 2012-02-15 | 郑毅 | 一种基于用户的社交网络对用户身份进行识别与匹配的方法 |
US9288123B1 (en) * | 2012-08-31 | 2016-03-15 | Sprinklr, Inc. | Method and system for temporal correlation of social signals |
CN104348871A (zh) * | 2013-08-05 | 2015-02-11 | 深圳市腾讯计算机***有限公司 | 一种同类账号扩展方法及装置 |
CN105045822A (zh) * | 2015-06-26 | 2015-11-11 | 淮海工学院 | 一种微博中特定用户的相似用户监控方法 |
CN107346496A (zh) * | 2016-05-05 | 2017-11-14 | 腾讯科技(北京)有限公司 | 目标用户定向方法及装置 |
CN106600342A (zh) * | 2016-12-29 | 2017-04-26 | 北京奇艺世纪科技有限公司 | 一种广告投放的方法和装置 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110489664A (zh) * | 2019-08-07 | 2019-11-22 | 北京达佳互联信息技术有限公司 | 一种基于契合度的客户端推荐方法及装置 |
CN110691026A (zh) * | 2019-08-16 | 2020-01-14 | 深圳市普特斯科技有限公司 | 一种与两微一端连接的图文视频编辑发布平台 |
CN110545528A (zh) * | 2019-09-19 | 2019-12-06 | 白浩 | 融合多身份的社交方法、装置以及存储介质 |
CN110545528B (zh) * | 2019-09-19 | 2021-12-10 | 白浩 | 融合多身份的社交方法、装置以及存储介质 |
CN111935259A (zh) * | 2020-07-30 | 2020-11-13 | 腾讯科技(深圳)有限公司 | 目标帐号集合的确定方法和装置、存储介质及电子设备 |
CN111935259B (zh) * | 2020-07-30 | 2021-11-23 | 腾讯科技(深圳)有限公司 | 目标帐号集合的确定方法和装置、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN108920479B (zh) | 2022-06-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108920479A (zh) | 针对两微一端跨信源账号推荐方法 | |
Zhang et al. | Green politics in China: Environmental governance and state-society relations | |
Adi | Occupy PR: An analysis of online media communications of Occupy Wall Street and Occupy London | |
Bremer et al. | Portrait of a climate city: How climate change is emerging as a risk in Bergen, Norway | |
Filak | Dynamics of news reporting and writing: Foundational skills for a digital age | |
Roe | Feeling ‘secrety’: children’s views on involvement in landscape decisions | |
Alicheshmehalaee et al. | Effectiveness of social skills training on decreasing aloneness and increasing peer acceptance | |
CN108711321A (zh) | 一种基于多平台的网络学习*** | |
O'neil et al. | Two futures: Australia at a critical moment | |
Walter | Examining the relationship between environmental justice and the lack of diversity in environmental organizations | |
Jarosławska-Sobór et al. | Utilization of integrated marketing communication for the introduction of a new brand to the market. Case study of “Eko Patrol” of the Central Mining Institute | |
Davis et al. | Climbers for bat conservation: methods in forming a novel partnership | |
Rymarz | Its not just me out there: type a pilgrims at world youth day | |
Soenen | An anthropological account of ephemeral relationships on public transport. A contribution to the reflection on diversity | |
Band | CITiZAN 2015-2018 and 2019-2021, a community archaeology project past and future: successes, challenges, potential solutions | |
CN108494829A (zh) | 一种安全监控方法和*** | |
Li | The Impact of Auditory Based Immersive Virtual Travel Experience on Mental Health of the Visually Impaired | |
Petersen | The Atlantic Coast Pipeline: Power, Environmental Justice, and Artful Resistance | |
Audet et al. | Collaborative research with First Nations in northern Ontario: The process and methodology | |
Igonina | Navigating a communication paradox: how an Italian tourism organisation managed communication via Facebook during Covid-19 | |
Sinha et al. | Use of social networking sites by post-graduate students of Assam University, Silchar: A survey | |
Fossati | Chinese Student Associations' Wechat Communication and Contribution to Environmental Activism | |
KAMALI et al. | DINGA: DISCOVERY OF IMPORTANT NODES IN SOCIAL NETWORKS USING GENETIC ALGORITHMS | |
Kottamasu | Placelogging: Mobile spatial annotation and its potential use to urban planners and designers | |
Terhune | A Geospatial Analysis of Safety and Risk Perception in the Buffalo National River |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |